Underligt Google-sökresultat resp. Sökrum och relationer mellan koncept som definition av rummets utsträckning

2013-07-06

En kraftig syntax-förklaring finns också relativt sökresultatets sökoperatorer jag använde. Det är dels mer ett dåligt exempel jag bättre ger kompletterande exempel för (jag tog just här skärmdump av en mindre mängd begränsande operatorer samtidigt som vi har att Google tenderar allmänt och regelmässigt för url se ett koncept som avgränsat av tecken relaterade url:er p.g.a. av hela länk-historiken d.v.s. inurl kanske avgränsar vid punkterna följande denna princip (jag minns dock ej här och nu men kompletterar med det blir av att ge ett bättre exempel). Samtidigt önskar jag ha min diskussions-tanke sammanfattning publicerad. Ev. läsare bör dock vara medveten om exemplets problem och snarare se det som indikativ utgångspunkt att hitta varianter från som tydliggör vad som avses för. Jag tror att den större grupp som kanske inte direkt är ointresserade kring hela diskussionen oavsett om teoretiskt ganska tråkig - d.v.s. branscherna relaterat sökmotor-optimering och sökmotor-industrin - utan större problem identifierar ut exemplen med ex. som utgångspunkt.


Jag undrar om similar searches (bild 2) jag fick för sökkod vi ser i bild ett (från samma resultat-sida som bild två) beror på att:


  • Jag gjorde något fel med inurl.
  • inurl har ändrats och saker har börjat gå sönder i annat "relaterat".
  • inurl var korrekt gjord av mig och har ej ändrats men feltolkades i någon annan funktion påverkande sökresultatet också utanför similar searches.
  • Att presentationen av vad sökresultat i similar searches berör är felaktigt beskrivande faktiskt sökresultat.
  • similar searches hämtar en "mängd" / "view" av sökresultatet som ger alla sökord använda och behandlar alla p.s.s. oavsett om inkluderande eller exkluderande därför att Google här som i mycket kring sökresultat är väldigt "cosinus-similarity-konceptuellt-drivet" och mycket underliggande begriper troligt inte (och bör antagligen ej där göra det heller) definition av mängdernas utsträckning som ska beröras även om de självklart använda och initierade bäst ges eller appliceras på den mängd man avser snarare än samma mängd (indikerande att mängden ändrats som i exemplet) eller en helt annan mängd än begärd av användare och angiven av systemet.


Skrämdump ett: Sökord med sökoperatorerna.



Skärmdump två: Similarity searches Google gav inkl. varianter med samma exkludering applicerad via "-inurl".




Min gissning är det sista. Jag tror funktionen hämtar upp alla sökord utan hantering av söklogik alternativ får söklogik men att någon enkel-fix gjorts med diverse sträng-hantering för att ta ut det man tror är vad man kan och ska hantera lämnande sådant man ej bör eller kan hantera men missade vad lagret ovanför ej hanterade.


En till och inte otroligt är den förklaring Google skulle se (hur världen från ett alltid repeterat perspektiv skiljer sig från det andra det första perspektivet har till uppgift att optimera värdet för relativt kostnaden kan vara radikalt divergerad utan att divergensen tillför värde) eller rent strategiskt sökt att uppnå som förklaring är att allt här är helt korrekt. därför att det är just liknande sökningar vi får med varianter nu med exkluderande förutom inkluderande efter att jag introducerat det i logiken.


Problemet med det resonemanget är att överstrykning och exkludering annars uteslutande används som operator på den positiva mängd jag definierat och bör som alla användare naturligt ser utan särskild vetskap om Googles rymd av associationer mellan sökordsbegrepp ser det som helt redundant. Man är helt enkelt väldigt explicit ej intresserade att få in dessa sökord alls och tror jag normalt är det vid den punkten helt redundant att visa varianter omvänt skärande begränsningen för något så exakt som inurl eller intitle därför dessa bör vara väldigt indikativa på att man innan ex. sökande information om anpassning av WikiMedia plattformen fått flera sidor av sökresultat med sidor från Wikipedia om mjukvara och systemutveckling mer allmänt.


Konsekvensen av att Google's associationssystem ej hanterar i sin bild av världen att likhet mellan en mängd av koncept och sidor ej kan uttryckas som egenskap av, underrum m.m. (ex. "visuell anpassning" begränsande underrums-operator: applicerat på rörande Wikimedia för att särskilja när visuell anpassning snarare berör frågor diskuterade runt WikiMedias sajter eller specialistsidor i uppslagsboken) blir ju exkluderande mängder per direkt nyckelordsförekomst i väldigt indikativa delar av en sida på nätet som url och titel väldigt kritiska och gissar jag oerhört för mänskliga sökningar är inlärt för att hantera fallen när man får överdrivet omixade feltolkningar av något radikalt avsett.


Även är ju site vad man kan argumentera åtminstone relaterad till resonemanget kring inurl och intitle. Men just relaterad därför att Google från den sidan är oerhört styrd av vilken "site" d.v.s. domän som publicerat medan från andra sidan begränsningar eller snarare algoritm bias (och som sådant inte självklart sämre än andra alternativ: kanske snarare som genomsnittlig metod för genomsnittliga ej specialiserade sökningar i mängd-smalare områden bättre än andra möjligheter även om nu har similarity algoritmer för att skapa större eller mindre underrum för olika "förstoring" vilka jag ännu ej sett i min referenslitteratur men vad jag vet är tekniskt och teoretiskt möjligt eftersom jag har tre varianter av ett koncept för detta jag gjorde för Blue lights tidiga resp. senare användande applikationer implementerade och ofta använda - alla mycket snabba anropade men långsammare i för-generering även om knappast långsammare för genomsnittligt antal relationer per koncept jämfört med LSA eller cosinus-similarity).


För Google när site-sökning används exkluderar vi därför inte så mycket som vi säger att värderingen av övriga sajter ej räknas. För konceptens relationer hanteras dock dessa endast som mängder applicerade på värdet för målet och hur de där associerar med varandra. Att definiera en mindre mängd genom att säga att vi vill ha "Microsoft" + "system development" kommer endast ge funktionella träffar rörande systemutvekling på Microsoft rimligt ofta i sökresultaten därför (jag förutsätter att så är fallet) att denna association har hög kraft association från en mängd indikationer mot dem där också en relativt sökordens styrka som enskilda koncept större olikhet (närmare cosinus-similarity än mina similarity-operatorer) vilka tenderar att rimligt beräkningseffektivt clustra i godtyckliga huvudområden.


Det är ett fåtal "sökområden" (sökningar jag gör relaterat ett pågående kunskapsbehov inkluderande många varianter en tid) jag fått problem relaterat detta. Att identifiera seriösa tyngre kunskapsgenomgångar om anpassningar av Wikipedia-plattformen för affärs- och verksamhetssystem är ett sådant.


Associationen WikiMedia till Wikipedia är ju enormt stark. Medan de båda enskilda koncepten sig är abnormt starka. Samtidigt som Wikipedia om man söker relatera den till kunskapscluster utan similarity-operatorer mer liknande mina falerar och istället passar Wikipedia in på allt. Resultatet blir att Wikipedia-serp dominerar trots att vara 110% icke-relaterad.


Till och med serp-dominerande sig själv döljande de fåtal relevanta sidor som finns både i Wikipedia och meta.wikimedia.org därför att mer abstrakta koncept som uppslagssidor i Wikipedia är mycket potentare.


Det känns som konceptet borde gå att applicera värdeskapande kring annat jämfört ex. Google. Men det är just två eller tre faktiska fall när problem direkt gjort att man noterat att andra similarity-operatorer ovanpå eller parallellt hade löst det ganska enkelt utan prestanda-förlust. Medan jag egentligen inte vet om sökkoncept där det som standard adderande värde finns (vanligen tänker man ju på sådana behov bara när problem stör verktyg man använder medan ev. värde mer generellt är svårare att avgöra).


En alternativ och tror jag helt opraktiskt väg att hantera samma sak är att försöka skapa direkta regler för hur koncept passar samman med varandra. D.v.s. named relations och ontologier. De är utmärkta för presentation av data eller användar-nära kring en del liknande, motsvarande i juridiskt noggranna sammanhang för att öka tydlighet och reducera tolkningskostnad (och p.s.s. i andra standardiserings-sammanhang som kommunikationsprotokoll m.m. även om det rena ontologi-tänket nära mänsklig presentation vanligen blir där brutalt överdrivet därför att vi så lätt relaterar och tycker att det i sig självt är förklarande och gjort stort arbete medan dess verklighet i mjukvara m.m. lämnas mer vind för våg i en inte sällan ganska annorlunda värld), och är ej direkt ovanliga i mer tänkande sammanhang när en myckenhet av filosofer genom historien önskat sig ett system för att organisera sina förklaringar och systematiseringar av hela världen.


Vi har en exempel-illustration för just dessa systems förmåga i presentationslager att bli enkelt mycket tydliga jämfört med andra lösningar (i underrummet av grafer vi genererar med kod arbetande på oerhört stora datamängder och antal koncept: anställer du en konstnär eller illustratör eller liknande skulle de antagligen inte se samma relativa värde och troligt väldigt enkelt göra en mycket bättre enskild illustration oavsett att de säkert falerar att orka göra cirka en miljon under sin livstid som aktuellt för mitt presentationslager som ex. kommer från avseende ett draft-experiment).





Ett större närmare realistiskt exempel finns i Sverige-grafen.


Av samma anledning tror jag som dessa är presentations-trevliga och där väldigt tydliga blir de när vi applicerar på hela världen för begränsade. DBPedia är ett utmärkt exempel på detta. Trots relativt andra likartade lösningar mycket stor är den även när vi inkluderar broader, Wikipedia-kategorier m.m. liten i namngivna relationer mellan koncept jämfört med de vi har i mängden språk.


Viktigt är de ytterst hierarkiska i hur vi praktiskt skapar dem - trots att ofta tillåtande och införande även godtyckliga mång-dimensionella övergångar - där en sådan godtycklig relations möjlighet att agera operator på andra givet en kontextuell indikation ej alls finns. Därmed krävs ju att alla aktuella relationer med deras betydelse som kan vara aktuella faktiskt finns definierade med när och hur de är aktuella istället för att kunna räkna fram relationerna med deras inverkan på varandra som funktion av ett kontext ex. en grupp sökord med ev. meta-språk där (avseende ex. inurl och intitle med meta-språk).