Indexerade sökresultat: Microsoft i Google

2013-08-18

I en komplettering och fortsättning på Från Google till Microsoft - Information i domän sökresultat: Temasidor överliggande sökresultat attraherar mjukvaruagenten (2013-08-14) kan vi i skärmdumparna nedan se vad som ligger mycket närmare - praktiskt konkret - sökresultat indxerade:



Terminerande till sidor av denna sort:



Ett konkret exempel där jag från det indexerade sökresultatet dessutom reducerade bort ett par domäner för att söka reda ut vilken den totala verkande mängden url:er som avsetts kan tänkas vara (d.v.s. är det hela webben som jag utgick felaktigt från när jag började skriva eller är det ett subset ex. endast Microsoft sidor eller ett subset genom svag indexering eller kortare tidsrymd):



Att jämföra med den jag kom in på från Google's sökresultat:



För en liten man som jag mellan två gigantiska jättar fighting for world search domination är vad vi har ovan lika enkelt som nedan när det gäller att bibehålla perspektiv av en intresserad utomstående utan insats. Indexerade sökresultat (åtminstone om mer märkbara än vad jag tror dom är i Google) läcker information enligt föregående inlägg medan den faktiska indexeringen om gjord fet nog kan ge en del information till Google.


Nu ligger det lite utanför vidd och syfte på det här inlägget att ge någon guide till att extrahera statistiska data från sökresultat men jag upplever från åtminstone sidor enligt typen ovan att de är tämligen begränsade i läckage. Dessutom verkar det inte vara någon allmän sökfunktion (och av samma anledning tror jag inte att det är medvetet indexerat av Google jfr sidorna längre ner i hierarkin: mobilectp.microsoft.com/common/msearch.mspx).


En spekulativ gissning är att denna och ev. fler liknande indexerade sökresultat kanske tekniskt är besläktad med vad vi hade i föregående inlägg. Möjligen kan Microsoft har mer på att vinna att undvika att låta resultaten gå ut för att indexera.


Problemet - eller utmaningen - med den här sortens datakällor liggande så att säga ovanpå den webb vi tänker oss i sin tur göra sökresultat för är hur man för samman dem. Jämförbart tror jag är det ofta besvärligt nog att bara hantera differenterade skattningar av förekomster när okända faktorer finns. D.v.s. frågan väl illustrerat av mobilectp.microsoft.com ger ett index anpassat för ett särskilt ändåmål snarare än hela webben behöver man ju bäst känna det också.

Relativt innehåll av kalorier

Ett exempel motsvarande diskussionen i Krigshunden vs Bo: Avslappnad glad kreativitet vs Vaksamt motiverat sökande (2013-08-15) kanske enklare ges i:



Sedan jfr studien från Plos One gäller ju för fall III att det är en konkretisering vid en tidpunkt där vi över alla sådana exempel använda över en längre tid åtminstone för många områden (även om jag aldrig just prövat något relaterat just skattat kalori-innehåll för en kombination av måltidskomponenter) se en konvergens till motsvarande utan vid någon del hänsyn till referenser genom att i mellansteg för beräkningen hantera komponenter viktade mot relativ förekomst i det kontext vid är intresserade av (eller för alla tänkbara kontext om man nu har en funktionell similarity-operator för det).


Det mer intressanta rörande det och helt utanför studien i Plos One är hur motsvarande påverkan på hur vi skattar kalori-innehåll av ett givet livmedel påverkas av vilka kontext det livsmedlet förekommer i. D.v.s. om livsmedel z börjar förekomma mycket mer i väsentligt mer hälsosamma sammanhang vilken generisk inverkan kommer det då få i godtyckliga sammanhang längre fram? Och utanför just komposition av tilltalande måltider givetvis över fler funktionella dimensioner eller egenskaper (d.v.s. egendimensioner) som är funktionella för att göra den transformation där vi kan skatta en association bunden till dem.