Visar inlägg med etikett Google. Visa alla inlägg
Visar inlägg med etikett Google. Visa alla inlägg

Search-suggestions kan såväl störa Youtube-reklam och få Chrome att tro att nätet är borta

2016-09-30


  • Krönikör Hans tar igen modigt ställning mot rovdriften på internet-användare: "Det kan verka att de aldrig tar slut men snart nog om det här fortsätter försvinner de bort.".



  • Dessutom demonstrerar Hans hur välbalanserad han är i sin kritik. Precis som han är mer allmänt människofientlig än rasist kritiserar han kvalitetsmedveten (snarare än skadeglatt road utanför vad normalt för hans människofientlighet - ett tänkbart funktionshinder fordrande respekt och tid i teve att berätta om). Som grädde på moset får läsaren nöjet av att se hur Hans jakt efter allt högre höjder krävt av honom att ta på sig på nya roller: Krönikor resp. Redaktör.



  • Tidigare styckning av Microsoft följs här av en nödslakt (kan det vara fågelinfluensa?) av Google. "Årets bästa läsning. / Hans"



  • Sådana här människo-distanserade IT-företag som Microsoft och Google ger jag inte mycket för. Rätt användar-centrerade ekonomiska modell har vi bland teve- och filmföretag. Det är så rätt och i tiden att dela sitt material så jag utan att behöver följa teve-tablåerna får det senaste visade tillgängligt via nätet.


    Sedan kan man tycka att det är lite bökigt att ibland flera sajter med sådant kan behöva användas för att hitta vad man söker. Tittar vi på en sådan (ej alltid vad som räcker till: faktiskt numera sällan så med mindre och mindre material - jag använder den idag uteslutande för musik) kan vi se hur IT-sidan i lösningen förstör själva innehållet via search suggestions:



    Ovan hänger förslagen kvar och jag får det hela ej dit att jag kan nöja mig vid förslaget önskat. Reklamen under förslagen är ej synlig.


    Emedan Youtube skilt ut sig genom åren av om inte vara riktigt i kvalitetsbotten av Google där Blogger dominerar fullständigt så åtminstone ej i toppen. Chrome i kontrast har jag alltid upplevt haft mycket god kvalitet jämfört med Mozilla och Opera (många år använde jag Opera därför att de några år bakåt var mycket bättre när man behövde ha ett mycket stort antal flikar öppna vilket var det normala åren jag skrev åt IDG - därefter har jag typiskt använt Chrome med kortare avbrott varje år för Mozilla).


    Search suggestions tycks dock vara vad som av och till ger problem för mig lite varstans sista månaden eller månaderna avseende Chrome utanför själva kvaliteten på vad som föreslås. Chrome har hängt sig två gånger på dem. Säg tre gånger också att Chrome felaktigt kommit där den föreslår att nätet är borta och där jag tolkar (sista gången adderande egentligen fyra eller fem gånger återskapade jag just detta igen via samma search suggestion inducerad). Och ibland skymmer det för mig utan att jag upplever att jag kan få bort dem: Jag är ej säker på att de ej går att få att gå bort här men jag gångerna det inträffat ej fått bort dem.


    Kanske inkapslingen av "exekveringen" som påverkar här med ev. begränsade möjligheter att ta gui samverkande. Jag är här ej 100% på om problematiken ligger just i förslag med Google's ursprung via ev. särskilt eller om det kanske handlar om själva leveransen som sådan rent allmänt oavsett om de levereras via sajten som sådan via generell funktionalitet. Det senare verkar väl kanske troligare egentligen. Även om jag gjorde "mining" på search suggestions från diverse bibliotek m.m. har jag ej gjort det igen på ett par år eller då gjort det just för Google om än ett mindre antal (cirka 20 - 25) kvalitetskällor i sig (ej mer än kanske 700 000 troligare än över 1 miljon flergrams koncept-termer där större delen knappast är aktuella för mer än ordentligt mindre inkl. ex. Wikipedia vid den tiden även om jag tänker mig att om man tar ner det från dem nu att det är väsentligt större).


    Men man måste verkligen säga att givet bilden är detta ett område som innehållsleverantörer hanterande reklam-modellen behöver vara observanta på. Det känns problematiskt med det där komma ner över reklamen. Verkligen tråkigt att en hederlig och kul företagare som Disney som suttit och delat ut en massa trevligt på Youtube ska drabbas så här. Och det säger jag som ägare till två Disney-signerade Musse & Mimmi glada vid piano, resp. Pluto glatt prospekterande ett ben tryck från film (inhandlande för 25 kr styck - om än ej köpta direkt från Disney-själv - föreställer jag mig att han ivrigt satt timmar i sträck och delade sin signatur för att de om än många år senare ska kunna gå att finna för dessa priser: Dock ska sägas att numera när jag ej dagligen vid promenaden går över såväl Myrorna m.m. som antikvariaten hittar jag inte längre något värt att handla längre).

    Och Google dubbel-postar på korrigeringar

    2016-08-09

    Händer ibland numera. Relaterat någon förändring som gör att jag får tidigare versioner efter korrigeringar sparade. Tidigare har jag tagit bort dem men låter de kvarstå nu. Jag gillar att lite av mitt kulturintresse och hur jag särskilt för att det ej bara skulle bli tråkig teknik prioriterade en komplettering för att addera on-going erfarenhet just nu från den världen. Jag hoppas att det kan bli en brandflacka som tänder en världsrevolution. Det har hänt mig förr när man ser till att man prioriterar regelbundet ibland så det inte bara blir en gång (mode mer retro kan jag ha tur med: Bringing något tillbaka eller mer nytt som raka av skägget när ev. vid behov behövande resa in i viss diktatur gående turbulent - vilket knappast är aktuellt numera men eftersom jag berört det här tidigare när gående över området och när nu ej troligt aktuellt med behov längre lika bra noterande då ganska effektivt även om det kräver ett antal års föregripande: Dessutom rensar jag just nu ut en del jag tycker att jag borde ha noterat eller publicerat på annat sätt för att ha dom gjorda jfr bl.a. lögndetektorer nyligen. Men för principens skull förr även om ej ändrat än - så ändrar vi utseendet bäst om föregripande visuell dokumentation av dig - ej genom skägg anlagt eller lösskägg utan via friskt stort skägg vi rakar av den gången vi vill vandra enklare säkerställa utan uppmärksamhet).


    Två föregående inlägg. Första är dubbel-postningen d.v.s. föregående version som ändrades och därefter sparades. Sista är versionen som sist sparad. Dessutom dumpar Blogger.com mig också nytt ej till listan publicerade inlägg utan till skärm för ett helt nytt inlägg men utan texten (nytt id utfärdat?).
    z/p>





    Husman Jordar Google: "NSA gör att mitt renommé ställs i fråga om jag ej agerar på hagelgevärs-hotet

    Alla år nu sedan jag någon gång senare halva 1999 tror jag övergav Altavista har Google egentligen bara en gång innan betett sig riktigt "oväntat underligt" (därmed inte sagt att jag inte uppmärksammat ett antal säkerhetsdefekter genom åren eller tillfällig "dynamik" sökresultat, eller ibland mer varaktiga problem- eller värde-dimensioner mer eller mindre normalt förväntade alla. Tidigare var mitt ej internetkopplade nät vars senare satta referens system lyckades gå in i Chrome-defaulten startsida utan kännedom (finns med skärmdumpar m.m. tidigare - Och i all rimlighet givet att jag mer roades av det som inträffat: Understrykande för internets rika och mäktiga att jag som konsument såväl som välkänd trouble maker är internets verkliga Big Dog).


    Query suggestions viktiga värde är att optimera the data collectors kanaler till halvfabrikat data. Även om jag aldrig gjort mining på Google då de åtminstone fem år sedan cirka när jag tittade över det hade någon 10 - 12 k gräns request förutom diverse villkor (och också använde deras tjänster). Praktiskt är goda mänskligt sunda villkor mini-krav tillsammans med att man åtminstone kan lägga något 100 000 request på ej överdrivet med tid utan kostnad (för mig att gå några hundra tusen över flera veckor är vad jag sista åren tog en gång för en bibliotekstjänst jag ansåg hade starkt värde unikt i det segmentet och som ej gick att få upp mer: Tror jag när lärt den väl efter flera månader irriterad slöhet och döda dagar till cirka 400 - 600 k request några fåtal veckor).


    Dessutom nära besläktat har vi det som bl.a. Google skriver ut när vi söker. Jag räknar och kallar det för samma sak. Emellertid är en praktisk skillnad rörande data vi får att detta tenderar att oftare (dock ej perfekt så alltid jfr när jag sökte på guardian d.v.s. ej the guardian motsvarande känd tidnings - en av de tre största på internet - url och fick förslag relaterade filmer möjligen besläktat trots avstängd konfig. Chrome så vitt jag förstår datapropagering sökt relaterat film några gånger för att få Wikipedia summery betyg men ej varit in på The Guardian den vägen - ngram-modellen vi kan anta här eller att lösning konvergerar till jämförbart en ngram-modell värderande ordningen tränad med hänsyn kanske mer URL och ev. företagsnamn i formell-registrering än ex. varumärket visuellt över hemsidan m.m. - ej otroligt heller inlänkar eller varför inte ett tänkbart men kreativt tänkt varumärke visualiserat theGUARDIAN med ett enormt litet mellanslag emellan mindre än människa kan se).


    I kontrast gäller att sökförslag som snarare ges givet att vi gjort en sökning normalt presenterat samma sida som sökförslag har mer av kategorier, ämne, någon het topic aktuell just nu, vanliga system-egenheter som rättstavning (vilket i kontrast övrigt här för alla sökmotorer jag använder är baserad genomsnittligt vanligt språk utan någon märkbar förståelse eller hantering expertis-termer relaterade sökningen: D.v.s. söker vi på fyra termer ytterst typiska ett expert-område mycket ovanliga var för sig så kan sökmotorerna inkl. Google gärna ge sig på att försöka rättstava vilket som helst av orden till något alldagligt ej relaterat övriga ord). Förslagen kan vara baserade sökresultaten såväl som vad folk söker efter generellt före och efter (och i urvalet också vad personer som nu söker sökt på innan).


    Googles implementation kanske har ändrats rörande något nyligen sökförslagen den ger när man skriver. Jag kan ta fel eftersom jag inte använt internet ofta sista halvåret fram till nyligen. Emellertid för att skämta lite relaterat (jag hade väl tänkt mig någon skärmdump runt cert:en och SSL också) med aktörerna web cache (jag berört denna tappnings-primitiv tidigare ett par gånger sista sju åren), och ev. innehållsleverantörer, eller varför inte nätverks-punkter ungeför enligt upphandlingen NSA gjorde någon gång närmare 2000 jag tror jag minnas att jag efter noterat det skrev något om i Säkerhet & Sekretess eller ev. upptäckte senare och skrev om här eller (d.v.s. som varje rationellt tänkande person tagande viss kontroll oavsett avlyssning eller annat skydd kan tänka sig för resursstark aktör nationellt fokuserat ingångspunkter USA som är väldigt stora). Sökte jag på efter ändrat från något relaterat "smuggling guld och diamanter" men med "trabatten för ej planerad smuggling narkotika" till ungefär:


    silja kryssning bildäck pansarvagn container kostnad

    När gående för att ändra bildäck får jag förslag som inkluderar frågor om något relaterat. Vilket ej är förväntat. En hel publicerat såväl mätningar universitet, standard-data för att jämföra med m.m. har ju kommit sista åren runt frågor och svar. Så ev. inspirerat där. Jag klarade dock ej att få tillbaka det och får hålla för ej uteslutet feltolkande den korta stund seende det (dock frågetecken och med bildäck och kostnad översta) - Om nu inte något väldigt prospekterande annonser (där lämnar jag Google även om jag kan stänga av förslagen - Är ej avgränsningen annonser vad jag från förväntat vet har en avgränsningen ej överraskande krävs produktioner på hundra tals miljoner dollar likt filmer för att jag ska se det som naturligt såväl sitta och fundera ett par år här rörande moralen i att bara exkludera ej förväntade webbsajter i utseende m.m. från associerat big-corp-Hollywood-movie-makers kontra att troligen är nog anar jag kanske några i alla fall genom åren ej finansierade nog via dessa så märkbara annonser - först hitta hint-var klicka rätt medan strunta i annonser som säger att dom stänger av annonser, titta efter nya fönster smyg-ppnade, offra till anti-ad-Guden, låta ladda hela för svåra sajter och bryta anslutningen om jag vill kunna minimera igen o.s.v. - nog för att få köpa rättigheter till alla filmer och alla tv-serier att visa kostnadsfritt inte ovanligt några minuter - sällan för bra mer än 30 min - 60 min efter visat första gången tv).


    Men no biggy. Emellertid så precis innan nu sökande efter någon studie eller sammanfattning vetande relaterat vad jag tror är given information att i akut-hot eller liknande kommer förutom att blodtryck gå upp vår upplevelse av att det är högt reduceras (d.v.s. ej kännande det man efter 40 år ibland känner till vardags - men samtidigt minns jag något om folk som förutom humör-boosten och intensitet-kropp refererar till att känna puls m.m.):



    Det är möjligt att översta sökresultatet är naturligt sökningen.


    Emellertid görande ctrl-z för sökfönstret ser vi vad jag skrev tidigare. Men jag tröck aldrig return så någon post-leverans av innehåll input skedde aldrig. Verifierat nätverks-tappning lokalt. Tre post sedan restart-wlan.



    Jag tänker gärna som att jag oftast är acceptabelt nöjd med Google. Känns ej värt besväret att leta ny e-post m.m. Så hade det inte varit för att de börjat propagera för vapen i sina bilder hade jag inte publicerat det här. Men nyligen till min förskräckelse såg jag att deras logo de ibland manipulerar för att försöka vara roliga eller förgulliga sökning som koncept för barnen (vi som minns ännu något av internet när det var kursinformation, diverse ganska tråkiga api-enkla tjänster som Gopher-protokollet levererande något idag trivial-fakta, lite stilistiskt enkel och ofta ej aktuell samhällsinformation, kan nog bättre än andra förstå hur farligt och moraliskt förledande internet kan vara fullt av alkohol-sajter säljande förbi systemet, narkotika, pornografi (fast det hade vi massor av 99 i Altavista) - nya medier som Twitter destruerande fina gamla överklass medier som DN och Sveriges Radio (som något kan få mig att sluta uppdatera mig i P1 - närhelst jag tror något jämt slår jag direkt på P1 pch springer därefter för att leta upp min DN så jag vet i krönika om nu nyheten saknas vad jag korrekt ska tycka ungefär). En riktigt otäckt gullig figur står och hotar mig med ett hagelgevär. Förstå hur jobbigt med min uppväxt det känns att se piporna från andra hållet - som att någon gammal f.d. vän man trodde var död och begraven kommer och spökar för en. Jätte jobbigt. Hence att jag beslutade att jorda Google med min finding här. Hotande the Big Dog på nätet idag givet NSA avlyssningen riskeras ju ens renommé om man ej tar tag i det.


    Se förbi den troligt rent fiktiva figuren (kanske logotyp något milj-relaterat parti eller ganja-säljare) och se vänstra översta hörnet). Där har vi figuren med piporna riktade mot migHur kan vi Big Men fortsätta vara stora och acceptera sådant små-fjollande om än kanske uttryck från någon kultur-avart konstnärer, hippies och ungdomar - yngre vuxna tycker är kul (likt anime-scammen fulm- och tv-leverantörer tröck ut via Washington Post m.m. för en tre - fyra år sedan - Påstår man att något är populärt räcker det kanske för ungdomar att gå till biografen och se en tecknadfilm från Japan och om några år är det peruanska animeringar eller vilken som helst annan Made in som ska verka coolt - Vi äldre vet bättre och än vanligt så när man kultur-hotas med vapen får man dra gränsen och ta det hela bort från levande verklighet ner i modern-naturs kompost). Notera - vilket är gravverande - hur figuren lätt liknar ett av de sista stora våldsspelen som gjordes - Duke3D. Senare spel må vara att b edöma bilder Wikipedia vara mer människolika men är troligt lika försåtligt spännande jag minns Duke3D var. Detta är troligen utnyttjande kraften i de grisar som åkte små flygande tefat med raketmotorer bak. Att göra sig besvär att leta bak i kulturhistorien efter det kanske värsta vålds-hotet man kan uppleva visar på att man haft kraftigt - kriminellt onaturligt - förstärkt motivation i sitt motiv att hota mig. Skrämmande. Om ej för barnen världen runt hade jag slutat surfa Google.


    Husman Jordar Google: "NSA gör att mitt renommé ställs i fråga om jag ej agerar på hagelgevärs-hotet

    Alla år nu sedan jag någon gång senare halva 1999 tror jag övergav Altavista har Google egentligen bara en gång innan betett sig riktigt "oväntat underligt" (därmed inte sagt att jag inte uppmärksammat ett antal säkerhetsdefekter genom åren eller tillfällig "dynamik" sökresultat, eller ibland mer varaktiga problem- eller värde-dimensioner mer eller mindre normalt förväntade alla. Tidigare var mitt ej internetkopplade nät vars senare satta referens system lyckades gå in i Chrome-defaulten startsida utan kännedom (finns med skärmdumpar m.m. tidigare - Och i all rimlighet givet att jag mer roades av det som inträffat: Understrykande för internets rika och mäktiga att jag som konsument såväl som välkänd trouble maker är internets verkliga Big Dog).


    Query suggestions viktiga värde är att optimera the data collectors kanaler till halvfabrikat data. Även om jag aldrig gjort mining på Google då de åtminstone fem år sedan cirka när jag tittade över det hade någon 10 - 12 k gräns request förutom diverse villkor (och också använde deras tjänster). Praktiskt är goda mänskligt sunda villkor mini-krav tillsammans med att man åtminstone kan lägga något 100 000 request på ej överdrivet med tid utan kostnad (för mig att gå några hundra tusen över flera veckor är vad jag sista åren tog en gång för en bibliotekstjänst jag ansåg hade starkt värde unikt i det segmentet och som ej gick att få upp mer: Tror jag när lärt den väl efter flera månader irriterad slöhet och döda dagar till cirka 400 - 600 k request några fåtal veckor).


    Dessutom nära besläktat har vi det som bl.a. Google skriver ut när vi söker. Jag räknar och kallar det för samma sak. Emellertid är en praktisk skillnad rörande data vi får att detta tenderar att oftare (dock ej perfekt så alltid jfr när jag sökte på guardian d.v.s. ej the guardian motsvarande känd tidnings - en av de tre största på internet - url och fick förslag relaterade filmer möjligen besläktat trots avstängd konfig. Chrome så vitt jag förstår datapropagering sökt relaterat film några gånger för att få Wikipedia summery betyg men ej varit in på The Guardian den vägen - ngram-modellen vi kan anta här eller att lösning konvergerar till jämförbart en ngram-modell värderande ordningen tränad med hänsyn kanske mer URL och ev. företagsnamn i formell-registrering än ex. varumärket visuellt över hemsidan m.m. - ej otroligt heller inlänkar eller varför inte ett tänkbart men kreativt tänkt varumärke visualiserat theGUARDIAN med ett enormt litet mellanslag emellan mindre än människa kan se).


    I kontrast gäller att sökförslag som snarare ges givet att vi gjort en sökning normalt presenterat samma sida som sökförslag har mer av kategorier, ämne, någon het topic aktuell just nu, vanliga system-egenheter som rättstavning (vilket i kontrast övrigt här för alla sökmotorer jag använder är baserad genomsnittligt vanligt språk utan någon märkbar förståelse eller hantering expertis-termer relaterade sökningen: D.v.s. söker vi på fyra termer ytterst typiska ett expert-område mycket ovanliga var för sig så kan sökmotorerna inkl. Google gärna ge sig på att försöka rättstava vilket som helst av orden till något alldagligt ej relaterat övriga ord). Förslagen kan vara baserade sökresultaten såväl som vad folk söker efter generellt före och efter (och i urvalet också vad personer som nu söker sökt på innan).


    Googles implementation kanske har ändrats rörande något nyligen sökförslagen den ger när man skriver. Jag kan ta fel eftersom jag inte använt internet ofta sista halvåret fram till nyligen. Emellertid för att skämta lite relaterat (jag hade väl tänkt mig någon skärmdump runt cert:en och SSL också) med aktörerna web cache (jag berört denna tappnings-primitiv tidigare ett par gånger sista sju åren), och ev. innehållsleverantörer, eller varför inte nätverks-punkter ungeför enligt upphandlingen NSA gjorde någon gång närmare 2000 jag tror jag minnas att jag efter noterat det skrev något om i Säkerhet & Sekretess eller ev. upptäckte senare och skrev om här eller (d.v.s. som varje rationellt tänkande person tagande viss kontroll oavsett avlyssning eller annat skydd kan tänka sig för resursstark aktör nationellt fokuserat ingångspunkter USA som är väldigt stora). Sökte jag på efter ändrat från något relaterat "smuggling guld och diamanter" men med "trabatten för ej planerad smuggling narkotika" till ungefär:


    silja kryssning bildäck pansarvagn container kostnad

    När gående för att ändra bildäck får jag förslag som inkluderar frågor om något relaterat. Vilket ej är förväntat. En hel publicerat såväl mätningar universitet, standard-data för att jämföra med m.m. har ju kommit sista åren runt frågor och svar. Så ev. inspirerat där. Jag klarade dock ej att få tillbaka det och får hålla för ej uteslutet feltolkande den korta stund seende det (dock frågetecken och med bildäck och kostnad översta) - Om nu inte något väldigt prospekterande annonser (där lämnar jag Google även om jag kan stänga av förslagen - Är ej avgränsningen annonser vad jag från förväntat vet har en avgränsningen ej överraskande krävs produktioner på hundra tals miljoner dollar likt filmer för att jag ska se det som naturligt såväl sitta och fundera ett par år här rörande moralen i att bara exkludera ej förväntade webbsajter i utseende m.m. från associerat big-corp-Hollywood-movie-makers kontra att troligen är nog anar jag kanske några i alla fall genom åren ej finansierade nog via dessa så märkbara annonser - först hitta hint-var klicka rätt medan strunta i annonser som säger att dom stänger av annonser, titta efter nya fönster smyg-ppnade, offra till anti-ad-Guden, låta ladda hela för svåra sajter och bryta anslutningen om jag vill kunna minimera igen o.s.v. - nog för att få köpa rättigheter till alla filmer och alla tv-serier att visa kostnadsfritt inte ovanligt några minuter - sällan för bra mer än 30 min - 60 min efter visat första gången tv).


    Men no biggy. Emellertid så precis innan nu sökande efter någon studie eller sammanfattning vetande relaterat vad jag tror är given information att i akut-hot eller liknande kommer förutom att blodtryck gå upp vår upplevelse av att det är högt reduceras (d.v.s. ej kännande det man efter 40 år ibland känner till vardags - men samtidigt minns jag något om folk som förutom humör-boosten och intensitet-kropp refererar till att känna puls m.m.):



    Det är möjligt att översta sökresultatet är naturligt sökningen.


    Emellertid görande ctrl-z för sökfönstret ser vi vad jag skrev tidigare. Men jag tröck aldrig return så någon post-leverans av innehåll input skedde aldrig. Verifierat nätverks-tappning lokalt. Tre post sedan restart-wlan.



    Jag tänker gärna som att jag oftast är acceptabelt nöjd med Google. Känns ej värt besväret att leta ny e-post m.m. Så hade det inte varit för att de börjat propagera för vapen i sina bilder hade jag inte publicerat det här. Men nyligen till min förskräckelse såg jag att deras logo de ibland manipulerar för att försöka vara roliga eller förgulliga sökning som koncept för barnen (vi som minns ännu något av internet när det var kursinformation, diverse ganska tråkiga api-enkla tjänster som Gopher-protokollet levererande något idag trivial-fakta, lite stilistiskt enkel och ofta ej aktuell samhällsinformation, kan nog bättre än andra förstå hur farligt och moraliskt förledande internet kan vara fullt av alkohol-sajter säljande förbi systemet, narkotika, pornografi (fast det hade vi massor av 99 i Altavista) - nya medier som Twitter destruerande fina gamla överklass medier som DN och Sveriges Radio (som något kan få mig att sluta uppdatera mig i P1 - närhelst jag tror något jämt slår jag direkt på P1 pch springer därefter för att leta upp min DN så jag vet i krönika om nu nyheten saknas vad jag korrekt ska tycka ungefär). En riktigt otäckt gullig figur står och hotar mig med ett hagelgevär. Förstå hur jobbigt med min uppväxt det känns att se piporna från andra hållet - som att någon gammal f.d. vän man trodde var död och begraven kommer och spökar för en. Jätte jobbigt. Hence att jag beslutade att jorda Google med min finding här. Hotande the Big Dog på nätet idag givet NSA avlyssningen riskeras ju ens renommé om man ej tar tag i det.











    Microsofts köp av Nokia

    2016-07-19

    Jag var vid tiden för köpet föga imponerad av att ett ej litet antal skribenter bland tidningar såväl om jag minns rätt teve tror sig veta att Microsoft ej varit i denna produktutveckling tidigare. Microsoft var bland de tidiga i utveckling OS-plattformar för mobiler med tror jag först (och lägger här ej den faktakontroll man ska kunna kräva i andra kanaler) Windows CE som utgångspunkt.


    Summan för köpet noterade jag ansågs mycket hög. Jag har inte reflekterat summan själv (genom ex. jämföra med andra köp så att man kvantifiera kognitivt begripligt) och den påverkade troligen mig inte i min tolkning (och kanske skulle jag tro mig haft fel om jag betraktat den nu eller då) men tog för troligt att Microsoft antagligen skulle komma göra sig av med större delen av Nokia utanför research resp. administration relaterat patent och information om produktutveckling, gamla kontrakt och allmän information management.


    Min tanke var att vad en aktör som likt Microsoft ser "the cloud" och varierade klient-plattformar som nutid och framtid kanske kan behöva och finna mest värde i från "ett Nokia" är den kulturhistoria gamla telekom-leverantörer har i diverse patent, diverse kontrakt rörande användning av andras patent (inkl. använd våra gratis så använder vi era gratis). Förutom att USA har en kulturhistoria av att uttrycka kostnad för andra via rättegångar i dessa segment har telekom-branschen något av samma kulturhistoria.


    En del andra företag i mer inne i Microsofts segment kanske är mindre etablerade i att hantera hela det här området. Jag tror Microsoft kanske som äldre företag i det som nu ofta kallas IT har en massa administration i detta område. Förvisso kan en del andra större konkurrenter Microsoft upplevas minst aggressiva försvarande sig i domstol men upplever jag ibland kanske mindre djupt-prioriterande andra delar här.


    Och den andra sidan av att äga en massa fina gamla telekom-patent med "inter-telekom-kontrakt" (jag hittar på begreppet) är ju "doability" stämmande andra.


    Vi kan sätta köpet Nokia i jämförelse med Googles köp av Motorola Mobility och Google när de kort därefter sålde kanske vanligare för unga företag utan den artighet och finess gamla företag har skröt genom att låta göra känt att de behöll ägandet av patenten. Oavsett hur vulgär Microsoft OS jag fick på min nyköpta bärbara dator är med pop-up-reklam för Microsoft Office integrerat i OS förväntar mig att inget likartat skryt gjorts av dem.


    Motorola i sin helhet gående in i telekom-krisen är mindre utsträckning, köp och möjlighet att manipulera värden i den samlade mängden patent jämfört med Nokia eller för den delen tillochmed Alcatel, och Nokia i sin tur vid ungefär samma tid mindre så än Ericsson (hur det ser ut senare och vilken mängd doability Google fick med Motorola Mobility vet jag föga om något om).


    Jag kan tänka mig Nokia har en hel del etablerat mer i nät med quality of service kvantifierad leverans och tjänster på och i dessa. Kanske rent av sådana som kom när man började tänka IP-tjänster ovanpå ATM-nät och äldre abstraktioner som OSI-stack, ASN, diverse telekom-standarder med tillhörande produkter etablerade ute hos telekom-kunder bland teleoperatörerna m.m. Kanske relevanta - eller av och till potentiellt potenta - för en cloud-leverantör?

    En namngiven tibetansk entitet i eller utanför nyhetsindexering

    2016-01-09

    Det är väl inte att förvänta (men åt det hållet mer och mer givetvis) att nyhets-index riktigt hunnit analysera nyheterna man ser i ex. i Google's nyhetssökning lika komplett som för sidor indexerade webbsökning. Att se nyheterna snabbt (vilket är en helt annan fråga man kan ifrågasätta om Google alltid presterar bra i för nyhetssökning) synliga för huvudsakliga / självklara ämnen och/eller sökkoncept likt kanske ofta viktigast entiteter likt personer, företag, länder, produkter m.m. (dagarna när min generation var centralitet i användandet och vi alla sökte seriösa ämnen är förbi: Nu handlar internet om den senaste PhonePodasten från Apple).


    Jag vet inte riktigt hur Google gör sådant. En del om själva grund-algoritmerna tror jag i och försig finns att hitta men intresserade mig när jag noterade det för ett par år sedan eller mer inte just varande ganska just named entity och koncept relaterat kring ämnen (medan jag mer sökte då andra som tittat på kontinuerliga värde-indikationer i känslo-aspekter som motivation, risk, anger m.m. vid tillfället). Men mycket ligger i ju oavsett om man ev. har grundkoncept jämförbara i "detaljer" hanterande särskilda utmaningar: Görande saker fungerande och helst bra ligger nog i största delen i sådant.


    Följande fick jag när jag sökte på en entitet (person):



    Antagligen har jag fått en sådan sida som svar förr utan jag minns det (eller kanske att det är en ny respons på något man fått förr när koncept saknas i nyhetsindex).


    Emellertid är entiteten jag sökte från inkopierad till Google sökningen från just ett sökresultat från Google. Indexerad både webbsökning och nyhetssökningen liksom i webcache.googleusercontent.com:



    Och sidan jag citerar en bit html-kod från visande första stycket efter titel (med visuellt emellan) för denna:



    Google webbsökning säger sig ha cirka 6500 - 7000 träffar (skattande eller faktiskt antal index?) för Achok Rinpoche.


    Jag vet inte om en person eller företag som förekommer i nyhetssökning är samma sak som förekommande i en indexerad webbsida. Eller om det kan vara samma sak att det också kan vara mer som indexerad webbsökning.


    En ev. detekterad trolig roll / named entity agerande, refererande eller talande i nyhet kanske hanteras speciellt? Medan det i webbsökning i den mån den ej är förstådd (ev. bara i meningen ej expanderande antalet named entiteter oändligt i nyhetssökning även om kanske andra sökord tillåter i princip detta för aktuell tid hanterad för sökning). D.v.s. kanske inträffar att man kastar eller missar vad man vet är named entity om man ej känner den som konkurrent aktiv för en tidsperiod eller hanterad i övrigt.


    Tilltalande rent konceptuellt är ju att ta in dessa entiteter när man vet att de finns som en varaktig representation och försöka lära stabil kunskap om dom man adderar på för att underlätta ex. fortlöpande indexering nyheter. Det är ett område en försvarlig andel publicerat från flera av befintliga aktörer i segmentet finns inkl. Google (även om jag inte exakt minns i vilket område publicerat här) samt även en del projekt de handlat in eller engagerat sig i av och till inte alltid varkatigt. Ex:


    • Plattform publikation likt Blogger, deras sociala media m.m. är ju också vad som har med denna domän att göra om man så önskar. Skribenten som entitet som ju kan ses i World of Facebook grundad med kontot där eller i World of Google (som ser sig som en öppen värld förr i alla fall debatternade runt kring Facebook) grundad kontot där (eller det här öpen-login eller vad det heter som jag tror någon koppling finns hos dom också kanske).
    • En av de åtminstone för mig minst värdeskapande datakällorna för att få halv-förädlade vetskap om vad koncept, ord, ämnen, innebär i relationer till andra koncept (jämfört ex. med riktigt värdefulla likt Wikipedia, Flickr förr, mina sensorer kinesiska kommunistpartiets webcams m.m. i hemmen, diverse större ontologier som underhållits aktivt åtminstone flera år, eller Library of Congress titel headings) är Freebase som Google köpte för några år sedan. Jag spekulerade då att de köpte den kanske för en ev. bra plattform hanterande koncept och koncept-relatioenr (länken går till dokumentation hos Google beskrivande en del av strukturering synlig för användare) snarare än innehållet på den nivå med då (men inte alls då åtminstone bara en massa små "kategorier" och kunskapsrelationer relaterade high-value search words utan en del faktiskt värde om än inte direkt ej fodrande filtrering på varierad nivå).

    Och utan tvivel finns ett ofantligt värde i att utnyttja samspelet sökord kommande tillsammans, förslag andra sökning och beteende runt detta när det arbetas upp under längre tid. Det är en datatyp som fint kan komplettera och bygga vidare på viss mängd stabila tillförlitliga relationer med bara själva företeelsen av samtidighet aktualitet index och där uttryckt utan övrigt data: Jfr produktlansering i ett generellt koncept som (kallas det notebook nu de här platta större bärbara telefonerna eller är de fortfarande mobiler? Apple-Phone? Flat-phone? Flat-rate kommer till mig? Kan det vara flat-rat när man surfar mobilt med UMTS? Det var ju vad alla operatörerna och telekom-operatörerna arbetade nitiskt med kund-glädjen inför framtiden 2000 år när UMTS standarderna gjordes klara.) de mobila flat-rate telefonerna som både kan telefonera, visa film, spela musik från nätet utan behov av att lagra mp3-filerna själv och surfa nätet - i koppling samtidigheten avgränsat tidsmässigt produktområdet (Fllat rate), leverantören hårdvaran (som ju vi lärt från hem-pc:en blir alltid mindre viktig år från år: Man köper bästa hårdvaran till bästa pris så kanske någon mediator till diverse lego-tillverkare i Kina, Pakistan m.m. som Amazon) "Flat-Rate Lego", och så den faktiska produkten med ett namn såväl som vad som presenterar produkten i återförsäljningen liksom mer konkret events (flygresa ner till legotillverkaren kanske skapande nytta i övrigt för ett utvecklingsland likt Pakistan: Ej som förr när det var IBM, Microsoft eller annat i någon del av USA uppenbart mycket mer välbeställt bedömt storlek kontor, luftkonditionering m.m. än här i Sverige).


    Vetskap delvis lättare därför tidsbegränsad: Enklae att se vad det har att göra med särskilt och ännu lättare om du redan har en befintlig sökning där folk hjälper till sökande det du vill lära att indexera bättre över tiden. Som vi insåg från hur jag okunnig i Flat-Rate telefonerna är en människans högre förmåga att resonera och bredare vetskap kulturellt och kunskapsmässigt förankrad i en hel livserfarenhet svårslagen. Likt evolutionen strävar ju också allt till det bättre: Bättre vetande, Bättre flat rate och bättre hårdvara / mjukvara billigare.


    Så frågan är vad som hänt med Achok Rinpoche? Tappades det hantering nyheten medan få eller inga andra fanns? Eller hanteras inte entiteten därför att den är udda i språk-kultur och/eller ovanlig förekomst? Och om så varför inte skapa den när förekommande om den bekräftas av statistik webbindexing om än bara via diskreta kontroller av och till. Nyheten är ju ändå från november 2015.


    Det kan vara så (jag vet ej) att nyhetssökning kanske inte är så intressant rörande annonsintäkter eller de andra typer av intäkter man försökt få ut av dem (analysstöd är ju det kanske egentligen intressantare området om man lämnar tänket med massor av användare) och därför av Google, Yahoo, Microsoft m.fl. prioriteras föga. Situationen att en entitet från en / ev. tidigare i en större politisk entitet i en politiskt extremt infekterad och explosiv fråga i relation näraliggande några av de internationellt störst inte fångas upp. Förvisso rör nyheten i sig inte sådant omedelbart men det är given vetskap utan utmaning bara ej implementerat. Förutom själva sökning som sådan kan man ju tänka sig att tjänster likt dessa kunde utnyttja indikationer för riktad indexering mer eller mindre (kanske helt) automatiserat för att göra troligare att man tar upp alla nyhetskanaler (eller jämförbart webbsökning).


    Ett problem finns kanske också i att nyheter har en aspekt av förtroende - mer så tror jag i Europa - så det bör ligga en motivation där också att prioritera det bättre hos alla stora. Att nyhetspublicisterna knappast alltid själva gör en engagerad insats att prestera (tycker jag i allt egentligen från egen nyhetsbevakning till plattformar och kanaler mot läsare oavsett hur skickliga en del av skribenterna är att uttrycka sig där jag idag ex. imponerades av hur jag hela vägen i artikel Expressen - tryckta versionen hörande deras rop på hjälp med nya raden förklarande att dom är billiga: Jag kom och jag handlade! Nästa gång får ni göra en tjänst åt mig - fram tills offret med far gick ut ur restaurangen utan att det egentligen sas rätt ut tog för givet att personen hade mer eller mindre halspulsådern avskuren) är inte jämförbart oavsett om de går bra eller ej. Något likt Yahoo och Google är ju fler produkter så det kanske kan ge lätt men kontinuerlig negativ-känsla påverkande allmänt utan att det lätt märks.


    Men ev. får jag kanske ta att låta spindling kontinuerligt små-störa bredband i övrigt. Det ger en del i övrigt att kunna göra analys-lokalt även om ett separat nät hade varit bättre.

    * i Google Search

    2015-10-28

    Av och till när jag ej riktigt minns ex. rätt namn har jag börjat använda * i Google för att komma rätt. Jag är nu inte direkt (alls egentligen) säker på att * fungerar helt som i andra mer på egna datorn lokala söktjänster där man själv "äger" kostnaden för att söka rätt oavsett ej färdiga index. Ev. kanske det endast är hur avsaknaden av något hanteras?


    Jag önskade som ett exempel hitta ett exempel på hur samma funktionella form som Zipf-Mandelbrot (rörande "förklaring" till beteende tror jag att om man samplar exponentiellt avtagande processer får man dessa fenomen men jag tycker inte att man ska tro mig bara av här: Jag finnder power laws "utmanade") också används för forgetting curve ta fram en artikel jag tidigare läst som föredömligt passande här kortfattat beskrev det. Emellertid mindes jag endast delar av namnet på en person refererad: *gren. Så jag gjorde sökningen:


    Notera att sökresultatet ej markerar exkluderade termer i toppen. Jag gick nu ej in och kontrollerade på de översta om "*gren" fanns på dem men gissar att de för översta saknas.

    Och artikeln jag sökte fanns mycket riktigt med:

    D.v.s. namnet är Wickelgren och funktionen kopierad från artikeln ovan:

    Lerigt Google-vatten gör att massor av manuellt surfande krävs

    2015-06-16

    Komplettering: Jag ser att Northwestern rent av länkat till Plos one artikeln. Kanske var det rent av till nackdel? Ibland är det ej så men andra gånger tycks det för djupa-sidor ex. universitet vara till nackdel därför att de ej propageras färskt.


    Här finns Clearpond: clearpond.northwestern.edu. Data relaterat likhet i "ljud" (och tycks det gående in morfologiskt i mening av att jag anar att man kanske härledde relaterat morfologiskt - kanske) och hur tätt andra ord med i "ljud-mening" hög likhet (similarity) ligger runt resp. ord. Men hur hittar vi information om formatet deras datafil har när man upptäcker att gammal nedladdning av artiklar publicerade om datat, hemsidan datafilerna låg på, resp. datafilerna saknade denna information? Hur kan detta problem lösas med Google? Går det alls att lösa om mer än att hitta universitets-sida med filerna krävs? Eller klarar sökmotorn rent av att peka ut en sida där informationen jag behöver finns?


    Söker vi information om en samling data om ljud i engelskan (och holländska resp. något mer om jag minns rätt) gäller det att lägga till database i sökningen snarare än något relaterat språkljud om man ska komma rätt. I exemplen nedan är jag mest fascinerad av att den ej förstår sambandet mellan databasens centralitet i form av närmare officiell plats filerna finns på och artikeln publicerad i Plos One. Självklart kanske man ej ser värdet att riktat utnyttja deras publicering i XML (som jag själv absolut inte skulle föreslå är enklare än att parsa ut samma information från deras HTML-sidor: Tvärtom håller jag för Plos XML representationen som bökigare p.g.a. av implicita rekursiva konstruktioner svåra att se enkelt slut på medan givetvis slöare parsning som XML troligt för de flesta är för dyrt om man vill extrahera data från "alla" journaler man når via nätet) men det är ju väldigt svårt att undvika nära nog standardformat för hur skribenter anges bland journalerna (även om jag tycker mig minnas någon med något underligt krävande en aktivitet för att såväl se författarnas hemvinst som att få den i sidan som ej inkluderade en ganska uppenbar länk att begripa).


    Hur kan detta ej vara en jämförbar relation (enklast att förstå vad som gör det underligt från att ofta nog anges rent av e-post-adresserna explicit till författarna) med de kanske överanvända länk-konstruktionerna för att härleda samband och distribuera flow i trust-modeller?


    En effekt av att förstått samband om vi antar en tolknings-begriplighet av Plos artikeln är att oavsett relevant information hos Norwestern University om Clearpond hade man begripigt att kanske koncept relaterade språkets ord och deras "ljud" varit mer relevanta söktermer än just databas (databas står på sidan därför att datarepresentationen finns där). Istället för databas hade en mängd koncept varit jämförbara och hade jag ej vetat att det hela hette Clearpond hade jag kanske försökt kombinera en mängd av dessa med relevanta ord rörande vad jag vill ha i datat.


    Att istället träffa på journalartikeln är inte alls bra. För automatiserad analys är det enormt enklare att reda ut vad för datarepresentation de pekar på (jag gör det själv ibland off-line från arbetsdator som kan sådant när givit upp för hand på internet-datorerna) heter och var de finns åtminstone när färska. Senare över tiden flyttas de runt. Ofta pekas de heller inte någonsin ut explicit i själva artikeln utan ligger i bilagorna i form av noteringar eller att hitta via mer allmänna url. Dessa bilagor kan ha nästan vilket dokument-format som helst och underligt gäller att även om artiklarna ofta finns att få (normalt så) som PDF är det hos flera vanligt med DOC-format (orsaken bör vara att journalerna prioriterade utseende gör artiklarna estetiskt från förenklade dokument-representationer på ett standardformat medan författarna sitter med Linux ofta inom vissa ämnesområden och annars med Windows vilka båda ger enkla möjligheter som typiskt i kontorsmiljö till de vanligaste Microsoft DOC besläktade formatet vilka journalhusen klarar att läsa). Så ett sökresultat där jag hamnar på journal-artikel kan vara bara frustrerande: Jag vet att det jag behöver finns men ser inte ens om det är data författarna i dumhet sitter och okynneshåller på för sig själva, är data som en gång funnits på webben men försvunnit, finns fortfarande men ej är angivet var o.s.v.


    Att såväl Google som Bing ej spindlar dom stora universiteten djupt längre (en hel del av äldre material kommer ej längre synligt och med början kanske någon gång 2014 tidigt för Google märker de ej eller hanterar ej sidor som flyttats runt hos dem när djupt ner: Omflyttning har hos dessa varit vanliga eftersom de allt mer prioriterat upp branding där hemsidorna allt mer fått som primära motivation att hantera potentiella studenter medan material för befintliga studenter, kontaktytor för forskare m.m. tryckts bakåt ibland via särskilda kanaler med skilda domän-namn).


    Så får att uppmuntra Google såväl som Bing ska sådana begränsningar vi ser exempel på här korrekt ses och uttryckas hånfullt. Någon som gör så här kan inte mycket. Vidare för att skapa ett ekonomiskt incitament gör vi slutsatsen att detta knappast bådar gott för medarbetarnas optionsprogram. Mer balanserat tror jag dock vi ser ett allmänt problem där man allt mer ger upp inför mycket data genom att skära analystid snarare än att förbättra grundläggande algoritmer. Relationer från ex. journalartiklar ej överdrivet många år bakåt i tiden går för att tydliggöra detta göra ut från en ensam dator på någon vecka utan att ex. behöva bygga kontinuerliga BDB-prepresentation istället endast använda RAM-minne och hash-tabeller: Det tar lite tid men även på begränsad dator enormt snabbare än takten journalartiklar publiceras i. Har man som "regel" att alltid spindla allt sida per sida istället för att bulka ner data och hantera snabb access på samma dator (eller jämförbart) så blir det så klart ibland väldigt dyrt att göra analys av sådant som dåligt klaras genom vad man direkt kan propagera vidare där sett (som länkar m.m. av 1-stegs-natur ej krävande slutsatser).


    I den ordning jag sökte. Första två - tre är som jag valde att söka själv testande medan övriga mer var vad jag gjorde för att skärmdumparna skulle visa det jag önskade. Notera att förståelse av konceptet Clearpond saknas vilket annars (och jämförbart för massor av skapelser) hade kunnat givit relevanta sökresultat ersättande konstigheterna nu givna med sidor som förklarar vad CSV är. Ingen koncept-förståelse som hade kunnat gjort gissningar på att vilken ZIP-fil som helst med Clearpond data fungerat verkar finnas. Så det gäller om man tror sig minnas att när man en gång själv laddade ner dem förra gången (men saknade information om formatet på CSV-filen d.v.s. vad varje fält innehåller för data vilket inte riktigt är samma sak som att jag inte förstår att CSV "officlet" normalt är "," separerad ibland med fältet inneslutna av fnuttar men praktiskt oftast i vad som kallas för CSV-filer gjorda av aktörer bland universiteten när genererade av särskilda program snarare än Excell-applikationer istället är tab-separerade - ibland namngivna TSV istället för CSV men oftast CSV). Kanske är det många som laddar ner data likt det i Clearpond och begriper vad varje fält betyder men ej att det är komma separerat? Eller fastnar på att ej begripa att det är komma-separerat? Är det så folk söker då? Eller söker de på CSV + Wikipedia oftast kanske?

    clearpond + format csv file Inget relevant resultat alls. Clearpond ej med överhuvudtaget d.v.s. ingen förståelse av vad Clearpond är i mening av sådant som att tillhörande något som kallas Clearpond finns data och datat är publicerat och i CSV-format. Detta förvånar mig som företeelse allmänt därför att som diskuterat tidigare är det enkelt att bygga kunnande om.

    clearpond + tsv + site:edu Vi verifierar att den heller - i ev. brist på förståelse likhet csv och tsv - ej heller klarar denna sökning. Inget resultat alls.

    clearpond + zip + site:edu Här får vi nu Clearpond på position ett. Zip är angivet på sidan som länkar till zip-filer. D.v.s. just data som ges direkt spindlande sidan utan behov av någon egentlig analys.

    Förstår den vad Clearpond är? Inget av dessa resultat pekar på det. I några fall får vi träffar på Plos one artikeln men ej datarepresentationen på hemsidan hos universitet som skapat det hela och gjort huvuddelen av arbetet med den representationen.

    clearpond + sound
    clearpond + speech
    clearpond + speech sounds
    clearpond + similarity

    Medan clearpond + database går bra precis som zip gjorde.

    Av detta lär vi oss att det är bättre att söka på diverse olika filformat, förkortningar för databas-format från export m.m. hellre än information som beskriver vad datat är och gör. Därför står det ej på exakt samma sida som filerna finns att ladda ner alternativt att sidan ligger med mycket meningsfull url-struktur ej djupt hos universitet (ex. ej djupt är en ej gammal subdomän - gamla universitets-subdomäner hos de stora fungerar dock jämförbart eller ibland bättre än deras www-subdomän).


    Dock för att jämföra med webcam diplomati presterar Google bättre än Bing gjorde (se Hans förklarar världen: Vad är ""microphone" resp. "webcam" diplomati? - Även om jag i detta inlägg såväl som detta försökte vara komiskt är sökresultatet Bing direkt från den förråade verklighet som förutom att skrämma slag på känsliga personer som jag helt säkert inte är alltid helt stabilt i nivå kunskap nödvändig för att tolka vettigt kontra vad barn har - Dessutom även om barn eller ungdomar klarar att tolka översta sökresultatet kanske det distraherar från ex. ett skolarbete relaterat diplomati man sökte information till). Vi förstår från resp. exempel (de ovan resp. det med Bing) att flexibel tolkning av vad begrepp avser går att få till lika dåligt som att ha låtit bli.



    Även om Bing har inställningar relaterade risk för pornografiskt-material vill jag nog mena att när barn ska rekommenderas sökmotor är i allmänhet Google fortfarande "säkrare": Dessutom även om Bing numera inte alls avviker lika mycket i defekter är Google's defekter ofta som här när jag möter dem mer relaterade "kunskaps-djupa tråkig användning" medan Bing kan bli underlig på sätt som barn kanske inte alltid rätt begriper att tolka.


    Skärmdumpar av sökresultaten

    Vilka jag vill ta till vana att alltid ta med eftersom jag så smått börjat samla till ett bild-corpus för den här typen bildfiler med text i. Det finns en hel del data jag hittat i oftast PDF-filer där bild-dumpar ligger inkluderade snarare än direkt tolkningsbart data att ta ut till text-format. Oavsett om jag tvingas skriva något själv för sådant eller behöver testa något färdigt (det senare känns väldigt mycket mer motiverat än göra kod bildanalys själv) vill ha jag några hundra med data lika tydligt avgränsat som söktermer och är riktiga ord men som typiskt inte är just meningar eftersom jag inte vill råka på ett program som verkar bättre än det är så länge saker är vanligt språk men underpresterar senare när man använder det på riktigt på stora tabeller med ex. en massa ord med tillhörande mätvärden.



















    Google News: detect_metro_area

    2015-04-18

    Innan att ha kontrollerat hade jag tänkt mig börja med "slutsatsen" att efter cirka sju - tio år utan att styrande paradigm läcker ut har vi ett tänkbart exempel. Följande jag upptäckte är emellertid uppenbar av informationen länkad därefter tänkt att vara publik.



    Information med ett användningsområde:


    Bing vs Google: Högvärdes (sökmotor) sökningar III: Gaming

    2015-04-04

    Inledande diskussion en särskild sökning betraktar vi några områden intressanta när Google och Bing jämförs relaterat några av de idag mindre använda men värdefulla tekniker analys sidor och tolkning sökkoncept vi kan önska se när resp. börjar använda märkbart såväl som andra faktorer som kan tänkas ta upp Bing's marknadsandelar till nära Google.


    Vi använder exempel-sökningen för att etablera några av de abstrakta resp. konkreta faktorer intressanta att följa upp via fler sökningar, statistik från andra källor resp. data mining av artiklar, konferenser m.m. resp. aktörs medarbetare uttrycks sig i.


    Tidigare publicerat

    Relaterat flera av diskussionerna ej länkat direkt där jag refererade fenomen (jämför också diskussion påverkan från språkmodell N-gram i skattningar Google index medan nedan diskuterades N-gram modeller närmare hantering av sökorden):


    Bing kvalitativt bättre än Google för vissa former sökningar (inkl. bland de mest ekonomiskt värdefulla) RESP. Funktioner för sökning grafer jag vill se hos Google och/eller Bing

    Information i SERP: Tillståndsinformation sökmotor resp. läsare / sökare

    Översätta sökord: Se och särskilja kultur, grupper av personer och upparbetat representera människor

    Google googlar med Google-NGRAM: Antalet indexerade sidor fel (2013-02-10)

    Sökmotorer: Bedömning relevans och likhet mellan koncept och människor

    Vad har Google, Microsoft m.fl. egentligen för beräkningsutrymme per användare? För kontext-hantering och prediktion av sökningar

    ......
    Tänkbart är Microsoft Bing! på väg att bli stark (2014-02-07)

    Bing! i Kina: Att approximera effekt med antal länkar (2014-02-17)


    Video Gaming: Mycket värdefull bransch för sökmotorer

    Förr i alla fall var gaming industri omsättande pengar - direktförsäljning av utbyggnader m.m. ekonomi lurande av ungdomarna såväl pengar som mer problematiskt läxtid (föräldrarnas fel: Ungdomar skriker efter struktur där spel och dobbel hör till någon vecka på sommarlovet) - såväl med en mycket internetanvändande publik.


    Bättre perception av förändring intresse och preferenser är dessutom vad som kan ge sökmotorer möjlighet att kapitalisera bättre på de som söker i ämnet än andra aktörer kanske klarar lika troligt lika snabbt. Det är en fråga vi kanske återvänder till i ev. uppföljande inlägg när jag kontrollerat statistik för relevanta sökkoncept om jag har tillräckligt relevanta i min samling (jag tror men lär kontrollera mer att dom publika kanaler för indikationer Google har såväl som mindre aktörer jag prövat ej här tillför värde nog för att om jag saknar uppgifter sökkoncept ej bättre använder andra former av statistik som förändring uttryck nyheter, bloggar m.m. Dessa källor är ofta normaliserade i relativ mening och utsträckning i tid resp. sökord till begränsat värde för att se ev. förändrings-predikterande värde eller är mycket värre bygger på väldigt lite statistik utan att det framgår bra alls).


    Låt oss därför göra en mini-test utan seriös bredd prövande Google resp. Bing i just denna bransch samtidigt som vi försöker få lite känsla av om någon av dem börjat "små-resonera" (den uppmärksammade kan ha noterat att jag av och till prövar dem vilket ibland givit någon postning här kring något noterat: Men ännu ej vad jag är intresserad av att om så märka).


    Vi väljer en kundgrupp jag kan föreställa mig finns (Varför skulle jag vara unik?) såväl som jämfört med ungdomar och yngre vuxna med jämförbar eller bättre betalningsförmåga såväl som oftare havande barn man kanske söker presenter till. Sökningen:


    generation later doom suitable 40 years old fully inexperienced games later than doom

    Jag märkte säg ett eller två år sedan att Google gick närmare att (som jag upplevde det) utnyttja n-gram modeller på sökorden man skriver in i en språkmodell. Detta följde en tid (ej omedelbart) efter att Google N-gram publicerades:


    I exemplet Doom Doom Doom har smoothing satts till 50. Som vi förstår från resultatet används smoothing ej för att hanterade saknande frekvenser när någon söker på orden utan tänker jag snarare bara för att ändra frekvenserna på n-gram man redan har riktiga mätvärden för. Frågan är vad man tänker sig att förändringarna särskilt om antalet reduceras från höga frekvenser som i flera ofta använda algoritmer "sparande" för koncept man ej hade i corpus tog vägen? Läsande ngrams/info inser jag att smoothing nog avsåg ritande av grafen och ej frekvenserna: Tyckte väl att det var funktion lite väl långsam om gjord bra att ha så här.


    Första resultatet jag gjorde för att testa vad jag trodde var N-gram-smoothing ej alls intressant:



    Intressantare sökning där Doom 1 fick ersätta Doom: Det senare ordet har så hög frekvens att det ej går att jämföra med Doom 3. Doom 1 lär ju vara samma sak som Doom oftast så det blir lite samma sak när vi tolkar orden i alla fall även om nu frekvensen är helt annorlunda. Se även att RA2 och Yuris tycks konvergera.




    Det ger en till väg att tolka sökorden kompletterande vektormodeller av dokument: D.v.s. ordens ordning relativt varandra i statistik mening kan utnyttjas. Ett bra värde Google har som kan vara nära relaterat detta är identifikation av dokument (ex. journalartiklar, böcker m.m. med generisk titel) genom att förstå att sökningen just avser ett dokument med en viss titel eller med en viss under-titel (eller liknande) man kommer ihåg oavsett vilken sajt som publicerat dokumentet (journaler kan ex. ta betalt för att läsa artiklar samtidigt som universiteten har rättigheter utnyttjade att publicera en kopia av artikeln på sin hemsida).


    I den mån detta fortfarande gäller är sökningar likt mitt exempel mycket svårare att bedöma utefter just detta jämfört med titlar. Titlarna med grundstatistik språkmodell dominerar över en udda lite slarvigt skriven mening. De många åren gör att den relativa skillnaden i statistik-meningen motsvarande ex. normaliserad frekvens och variation (entropin) gör skillnaden ännu värre: En titel för ex. en forsknings- eller nyhetsartikel kan uttryckas som titel på en mängd dokument medan min sökning kan vara vad Google innan aldrig sett med inte otroligt ej perfekt vanliga övergångar mellan delar av meningen till nästa ord.


    Dessutom adderar språkmodellen i sig i mening av ngram-statistiken (sannolikheten för hela mitt menings-chunks) inte något särskilt värde för tolkning av vad jag avser för specifika meningar med mindre än att lite dyrare parsning och statistik tolkning görs. Ingenting jag märkt pekar på att Google gör särskilt mycket alls relaterad sådan tolkning jämförbart med en mer krävande modell av språk och mening.


    Hur är det med domän och url när det gäller ranking?

    Alternativ datakälla och informations-resurs till Google ngrams och Microsoft Ngram är bl.a. ngrams.info med COCA som är en av de lite mer kända resurserna även om jag här valde ut den endast p.g.a. likheten i domän med Google's URL resp. påverkar ranking såväl som resp. kraftiga länkning från betrodda resurser. Jag tycker att det är lite bra att Google ligger före COCA: Google Ngrams (books.google.com/ngrams/info) är kostnadsfritt (korrekt beteende) medan COCA's prismodell (skulle kosta migpengar) alltid känts fealtig för mig och då ska man inte ranka alls (jag betalar ej för statistik och vill därför ej heller hitta detta).

    I övrigt har jag inte försökt följa ev. påverkan. Traditionellt har ju Google värderat detta. Propagerar man index framåt i tiden delvis åtminstone förstörande kan jag tänka mig att det är en sak som kan medverka till att man föredrar att behålla en ungefärligt (hög värdering men kanske mer eller mindre hög) jämförbar värdering fortsatt alltid framåt i tiden fortsatt så länge det känns som onödigt arbete att röra runt med datapunkter man ser ett värde i som de fördes över till nästa tidpunkt.


    Har Microsoft common sense? Begriper de egentligen något alls?

    Möjligt har Bing också en utmaning här: Men jag har ännu inte Bing-känsla nog för att våga mig på att spekulera även om jag åtminstone har viss koll på vilka common sense (ett av dem tror jag att jag diskuterade också just noterande att Microsoft prövat den lite förutom övrig diskussion här längre bak: Concept net) , teknikområden inom information retrieval, och intressen deras medarbetare runt Bing av och till visat intresse för relaterat konferenser m.fl. nörd-ansamlingar från olika företag och universitet för att lära av varandra och hoppas jag motivera upp varandra sunt söka visa vem som är den brutalare programmeraren och algoritm-tänkaren.

    Google köpte upp en aktör för några år sedan relaterad common sense. Jag spekulerar att implementationen av datasystemet för graf-representation av koncepten med deras mening var hela värdet de sökte. Själva datavärdet av Freebase var när jag sist tittade på det ej på nivå där det är värt besväret att utnyttja om man kombinerar med några till stora databaser med enkelt vetande. Och jag tror ju inte riktigt på att det kommer bli Facebook-Coolt eller trendigt att sitta och sortera in föremål m.m. i olika ämneskategorier: Inte på nivå med att addera något ens för koncept annars ej i annat common sense (d.v.s. jag ser ungefär jämförbart värde användning av det med att automatiskt identifiera mening via statistisk- och lingvistisk-analys - Är det manuellt vill jag nog och tror att kanske Google tänker liknande ha mycket bra sample man kan börja algoritmer för att sedan ta ut automatiserat allmänt från språk från ex. som test- och träningsdata).


    Stark och lätt lösning på mitt sökproblem: "Strategy of the Third Line of Warriors"

    Problem: Lämpligt spel ej osunt i krav på joysticks eller tangentbords-kombination eller överdrivet "grafiskt" mer som Doom men lite senare. Här finns därför en enkel lösning när uppföljning på Doom namngiven ex. Doom 2. Emellertid spelar där nu sannolikheten in för om jag kanske avser också Doom 2 men efter alla år skriver dem på samma sätt. Missar sökmotorerna här kan jag förtydliga sökningen men det är intelligens där förståelse av vad jag önskar såväl som vetskap nog att väga in sådant vi är intresserade av i diverse sökningar jag lär göra av och till nu även om jag inte säkert diskuterar alla eller ens någon här (Doom varande kanske världens mest firade dataspel - vad tillochmed jag efter så många år minns - måste ju vara gigantisk big business idag med mängder av Doom-spel, Doom-filmer, Doom-prylar så jag vill inte lova bort någon insikt jag kan få istället för att låta den göra mig rik).


    Strategy of the Third Line of Warriors är möjligt när entitet vi betraktar (ex. fienden som ställt upp sig fullt synligt i rader efter varandra på ett fält inför slaget) visar sin inbördes-ordning som en öppen label. Vi kan också jämföra med polis och brandkår på samma plats vid samma tidpunkt. Dataspel och film är två områden som i titlar kan uppvisa detta: Ghost Busters, Ghost Busters II m.m. Det går att utnyttja detta rent regelstyrt så väl med statistiska modeller (Bayesian probability är det enkla och välfungerande alternativet att utgå från här).


    Google ger också förslag på Doom III redan på position två. Det bör tror jag säkert - men utan att följa upp emellertid väldigt trygg från allmän Google känsla i det - att Doom III är det sista eller i ord-gram mening det sista nära refererat som Doom (ex. just "Doom III") liggande senare i tiden med en försvarlig mängd referenser i datatidningar, bloggar m.m. Det är om så nästan helt säkert detta snarare än att Google klarar att fundera ut att jag nog spelade Doom II men ändå skrev Doom (det lär visa sig framöver när jag prövat mer: Just den förmågan är dock mycket intressant särskilt när vi antar ingen kunskap i form av sparat kontext om mig - Klarar man denna typ av resonemang bra är det generellt tungt i värde samtidigt som det är svårt med troligt stor distans till konkurrenter).


    Strategy of the Third Line of Warriors är här vad som kan ha gjort all analys såväl som inlärning statistiska modeller mycket enkelt för särskilt Wikipedia. Och med besläktade enkla principer för regelnära analys vad som kan maskera sig som sofistikerade mycket mer generella algoritmer. Vi ska därför varken för Google eller Bing tolka in för mycket i förslaget Doom III.



    Microsoft Bing röstar med sin sökresultats-länk också på lösningsförslag Doom III men redan på på plats ett:



    Att Bing väljer Doom III före Doom gällande ett Wikipedia resultat stämmer bra för hur jag typiskt föredrar sökresultat om jag sökt på långa meningar ej överrensstämmande med en titel på ett dokument jag vet existerar och vill hitta i sin helhet att läsa kostnadsfritt (generellt som delvis diskuterat i Bing kvalitativt bättre än Google för vissa former sökningar (inkl. bland de mest ekonomiskt värdefulla) RESP. Funktioner för sökning grafer jag vill se hos Google och/eller Bing
    också high value område för sökmotorer).


    Jag vill här ofta gärna att ett koncept likt Doom ska tolkas närmare en ämneskategori och att resultaten ska gå mer exakt från övrigt jag skrivit: Och om jag ännu över-optimistiskt vill testa om de börjar begripa mer som vanligt nu "komplex" mening med koppling till statistik människa (ex. det senare här åldern resp. "generationer" implicit på dataspel) kan jag pröva en sökning som dena.


    Åtminstone periodvis har jag upplevt Google ger problematiska sökningar för jämförbara sökningar. Problemet har varit Wikipedia: Vissa perioder (och kanske är detta problem inte längre aktuellt) var det för en del sökningar nära nog omöjligt att med normalt besvär få bort träffar till stora delar irrelevanta som jag vill minnas (postningar bakåt med exempel finns som jag vill minnas det).


    Vad är ett Doom 3? Trendig retro att felsortera med musik- och film-CD samlingen eller konvenansisk defekt från dålig uppfostran och för lite matematik och klassisk litteratur i skolan?

    Vi går nu in och tar reda på vad en Doom 3 är (en indikerar väl kanske CD-skivan med spelet och tillhörande instruktionsbok: "Det ligger en Doom 3 bland mina musik-CD / Blueray-filmer", Erik tog med ett Doom III för att visa skolkamraterna hur cool han är med den senaste inne-prylen.).


    Även om jag ej försöker besvara frågan är det ibland värt att fundera lite över vad koncept också när en självklar named entity likt ett dataspel eller person är mer än det. Uttrycker de implicita ämnen? Är det givet att den som begriper Doom 3 även lägger något av vetande man i Wikipedia snarare hittar på sidan för Doom via aktivering av hjärnans nätverk när begreppet ska förklaras för någon som ej prövat detta dataspel någon gång? Och sker kanske liknande effekter redan från att läsa en titel eller vad vi vill ha sagt skrivande sökordet Doom 3? Ej frågor 100% lätta att leda rätt till mål (Och jag skulle verkligen önska att någon av dessa två sökmotorer rekommenderat ett spelbart alternativ: Gratis och kanske mer en generation mellan Doom 3 och Doom 2 så det är begripligt hur det fungerar men ej så faktiskt: Man ska tvingat ha tiotals år av dataspelande för att alls få det nöje yngre generationer tycks kunna ta för givet) men vad vi framöver kanske återvänder till.


    Doom mer topp än Doom 3

    För hur jag kan tänka mig att jag skulle försöka implementera en princip själv med om kodande en sökmotor likt dessa när befintlig statistik sökningar saknas är att förstå Doom som såväl ett dataspel (named entity) och ett abstrakt ämne sträckande sig över fler Doom-dataspel, Doom-kloner, och kanske en bit in eller som fuzzy-"undrrums-liknande-koncept" till FPS (first-person-shooter: Dataspel jämförbara med soldier on battlefield där flera krigar ex. lag tränande samarbete och annat nyttigt kanske som en belöning efter att gjort läxorna i en studiegrupp eller arbetat över).


    Wikipedia sida för äldsta dataspelet är det mest ämnestunga Doom-konceptet: Det är högre upp än Doom 3. Värde detta ger är oftare fler länkar till allmänt material, enkla vägar att hitta till mer specialiserade sidor (ex. Wikipedia sida för Doom 3 eller en extern resurs), abstrakta historiska diskussioner och jämförbart i och runt ämnet med inte sällan idag ett stort antal referenser om man behöver djupare vetande.


    Bing saknar äldsta Doom-dataspelet topp tio: Bra eller dåligt?

    Att Bing saknar Wikipedia sida för första Doom dataspelet som är det mest övergripande ämneskoncept tunga sidan kan möjligen peka på en svaghet om en generell egenhet.


    Att Bing ej hade med Doom sidan i Wikipedia topp-tio kan emellertid tänkbart vara sund strategi. De tycks ha större variation mot smalare representationer oavsett som senare diskuterat säkrande upp med för mig felaktiga ämnen eller som för Doom-ämnet en smalare färskare spel-release resp. något skandal-relaterat. Det kanske fungerar bra för dom att växa via? Att bedöma ett sådant värde har jag ingen statistik som jag kan tänka mig säger något alls om annat än när återigen kör mitt Symbol Mind dagligen igen och kopplingar till förändring av koncept uttryckta i nyheter och bloggar kan ge indikationer om någon bas-förståelse av "personligheter" mer rörliga i preferens sökmotor kan etableras.


    Statistik sökning (antal som söker efter något och tids-relaterade sökningar) är ytterst scarce och svårt att få tag i: Men kompletterar potentiellt potent när sökmotorer ska förstås

    Rörande statistik sökningar har jag ej hämtat upp min råstatistik med statistik över sökningar på sökmotorer (aktuellt i databaser ligger det kombinerat till en gemensam representation med andra källor) från arkiv på USB-diskar. Men lär ta upp det till efterföljande diskussioner i kommande inlägg för där aktuella sökningar (och denna om jag har statistik för sökkoncepten).


    Statistik faktiska sökningar och än mer hur en sökning predikteras eller predikterar en annan sökning är emellertid ytterst scarce. Mycket tidsödande att få tag i såväl som mer begränsat i antal sökkoncept såväl som storleken totalt med den tillgång och förmåga att övertyga (jag betalar aldrig för statistik: Så ska något alls ges tillbaka är det primärt statistik jag har eller någon annan information). Även data som säljs har ett mer begränsat värde än vi kan ha vant oss vid att förvänta från annan statistik koncept. Flera riktade aktörer säljer dessutom statistik som ej är vad vi här önskar eller för den delen tillför (som jag bedömde det för de tre ungefär största för bl.a. "toolbar-statistik") med en kvalitet och trovärdighet som gjorde data värt att inkludera till gemensam representation för "statistik sökord" över alla kanaler.


    Om [Försöker skriva meningen kul vilket bör förklaras för alla läsare som har problem med tråkighet så att man inte ödslar tid på tolkningen.] någon release (ny version av videospelet) eller Washington Power-Pack (en utbyggnad ibland kostande massor med som kan ge ett gammalt trött dataspel nya förmågor att roa publiken drama ganska ofta samman tryckt till intensiv intensitet på några minuter på teven antenn-sladds-ingång videospelet kopplats till) varit aktuell för perioder jag har data (minns ej och vet ej säkert att jag har ens år för allt data: En del sämre gammalt data idag knappt vad man om inte ganska begränsat i mängd jämfört med andra datakällor jag använt totalt skulle våga värdera för de viktsystem jag byggt från dessa samples för användning närmare aktuell för analys händelser just nu fullt ut så att säga: Mycket Buzz-words folk hört på jobbet eller uttrycker någon ganska snuskig perversation de har som kan vara ganska års-beroende eller ännu smalare: Musiker NN naken kanske inte är lika hett 15 år senare när hennes karriär är över och hon hunnit slitits ner av droger, festande och trafikolyckor m.m. karma-balanserat kända personer ibland drabbas av).


    Förutom sådant gammalt sökmotor-data har toolbar-statistik från också de största aktörerna problem stora utmaningar här. Frekvenser, ålder m.m. är inte trovärdigt och var problematiken ligger även om kanske tydligt relaterat åldern behöver inte ha bara en gemensam förklaring som att man stoppar in antal från andra former av mätningar an gör för att fylla på data av en typ där man är inarbetad och känd. Andra orsaker kan också vara fallet men är svårt att bedöma. Även om bl.a. auto-surfande inte är vad som direkt är den större risken just här för mig i alla fall: Sådant är ju en form av skattning av värde indirekt mot sökord (men man måste så klart på vettig nivå klara att separera det från andra former av data för att inte bara bli underligt fel). För en mindre aktör bl.a. förutom möjligt eget data (uttryckt så) upplevde jag att man för några sökord stoppat in egna siffror utan någon trolig mätning: Kanske att man fått betalt för att ta upp statistik för något mot kund man välkänt har eller övertygat någon om sådant skulle ha ett värde och fått betalt för att göra det (eller att aktören startades upp specifikt för att göra just detta.kanske bara för ett fåtal sökord med ett särskilt syfte relaterat någon och något). Jag såg inga politiska exempel jag tyckte var troligt aktuella exempel på den typen av manipulation.


    Min statistik har totalt för sökord inte ett antal typer eller token-frekvenser i närheten av jämförbarhet med vad jag har för språk generellt. Men lite har jag (jag vågar inte säga fler än 100 000 här för fler-grams sökningar: Det var ett tag sedan jag tittade bland sample-området som denna statistik hör till för mig och som jag använder det faktiskt är det kombinerat en mängd källor i databaserna jag använder och finns istället som rådata externa usb-diskar att återkomma till kanske om några dagar rörande statistik Doom m.m. när jag ska ta upp en del annat data ) :-D


    Är Bing svag för skandaler, romantik och trender? Är det smart eller bara vulgärt?

    Amerikanen vet vi från stereotyper nog starkare några årtioenden bakåt allra minst kan vara såväl som lite övermotiverad / smart i affärer resp. vulgär i och runt allt i kultur som fodrar en traditionell värde-transferering av en korrekt centralitet och/eller att man investerar några år på en särskild lite dyrare skola där man prioriterar ex. klassisk musik eller litteratur djupare för att etablera möjlighet att diskriminera det vulgära från det intressanta.


    Och kanske är Bing smart. Eller om de bara är en vulgära amerikanen som kommer och försöker prångla ut information vi från äldre länder ogärna läser medan de försöker rättstava sönder författare och konstnärer välkända sedan många hundra år (att söka på konst eller en författare - annat än de givet vulgära i vilket fall likt de flesta moderna romanförfattare - är självklart ej del av konvenans möjlig att visa eller tala om i ett socialt sammanhang: Jag kan inte förstå hur någon ens kan tänka sig att göra sådant - Så lätt illamående man blir bara av att tänka sig en vulgär amerikan som sitter och söker på en fin engelsk författare som John Updike eller defekt i varje sammanhang privat eller oartigt i allt socialt surfande "fakta" om Updike i strunt som Wikipedia istället för att vi från gamla fina kulturer läsa honom, förstå honom än mer med en biografi betryggande skriven av den som kan uttrycka djupet det ytliga inte hinner se upptagna med att förstöra och felförstå ytan: För updike såklart en Britt från England med samma fina engelska bakgrund som Updike hade).


    Är nu Bing den smarta eller vulgära amerikanen - eller kanske rent av den fin-kulturella Updike-britten när de prioriterar trendigare innehåll? Kanske uttrycker de något av Updikes Haren (talande kultur så att ev. läsande amerikan ej förstår vad vi säger)? Min känsla är att det kanske en aning mindre tråkiga innehållet med distans lite kortare till "nöjen", det ibland upplevt trendigare med kortare temporal reward discounting skala framåt m.m. (jag vill inte skriva vulgärt här eftersom jag haft nytta av detta själv när jag sökt teveserier) Ett upplever jag resultat för exempel-sökningen jag kan tänka mig kan visa sig vara relaterad en sådan ev. värdering är:


    Video game controversies - Wikipedia, …Översätt den här sidan
    en.wikipedia.org/wiki/Video_game_controversies
    ... playing of violent video games than ... 40 in Tennessee, killing a 45-year-old man and ... a link to video games, which was later ...
    Background · Theories of negative ... · Censorship and regulation

    Controversies är koncept inte särskilt svårt att följa indikationer relaterad emotionell kraft tänkbart - intressant att ranka upp om så - predikterande intresse gärna såväl publicering som sökning (även publicering viktigare därför att färskt innehåll när emotionellt intensivt är kraftigare gemensamt: Kändisar nakna tillsammans med droger, politiker som uttryckt sig anti-gay eller rasistiskt eller verkar indikerad i myt-skandal o.s.v. Saker folk bryr sig i men inte sällan just när det inträffar). Också vad som kan visa sig ha stabila grundvikter som håller över tiden där kontextuellt eller tidsberoende mer är att controversies i datakvalitet runt studier människans DNA fortfarande är feta-skandaler men som ingen mer än folk som lärt sig att de måste förklara för maskin såväl som människa vad de egentligen pratar ens hört talas om.


    Om Bing gör emotionell värdering intresserar det mig. Området har jag utmärkt viktstöd för själv och när inarbetat som där roar det mig när jag har behov att hantera självbild och självförtroende att jämföra med någon som närmare i tiden börjat med det (det är en av de kanske två mest stabila viktsystem jag har lösningar för oavsett om det gäller endast intensitet med förståelse av att fler dimensioner ej ska fodras för att dra snabba slutsatser eller om polaritet över ett mindre antal basdimensioner krävs eller upp till många fler indikationer om än då av mycket mer varierad kvalitet: Danger, Hate, Positive, Unknown m.fl. är några exempel på självförklarande ämnen medan ett ex. på mer abstrakt inkluderande mer manuellt arbete data såväl som egen-logik är Marching Up avsett för att ta indikationer på den intensitet som föregår uttryck av mänsklig aktivitet i grupp av typ krig, invasion, allmänna kravaller m.m. i kontrast till Gracefull Cute för allt internets och nyheternas gulliga läsar-fiskande).


    Fler exempel som teveserier, film (innehåll möjligen ibland oftare otillåtet publicerat indexerat) och erotik gavs i Bing kvalitativt bättre än Google för vissa former sökningar (inkl. bland de mest ekonomiskt värdefulla) RESP. Funktioner för sökning grafer jag vill se hos Google och/eller Bing
    . Och som sagt tror jag inte Microsoft tar marknadsandelar av Google genom att vara finkulturell: Innehåll med högre upplevt värde där "hål" kontra efterfrågat finns hos Google är kraftfullt oavsett om det nu är långfilmer, teveserier, böcker eller vad helst nästan.


    Google har här (tråkigt istället för ytligt ämne men varken bättre eller sämre för det: Solid besparing per access artikel) värde i åtminstone ett område jämfört med Bing: Det är mycket lättare att med Google's koncept (Scholar och WWW) hitta hela artiklar publicerade i journaler. Länkar till sådana hos Microsoft Academic går för ofta bara till förlagets sida när access kostar pengar samtidigt som länkar till hela artikeln hos universitet när de finns ofta inte lägre fungerar.


    Doom i Wikipedia har fyra stycken ord

    Besläktat redan diskuterade möjligheter att utnyttja språkmodeller för att förstå att identifiera titlar (och uttryck nära existerande titlar vilket n-gram modeller oavsett om bara ord på slutet eller enstaka eller felskrivna ord skiljer oss från hela titeln fungerar mycket bra för: Ett av få områden n-gram modeller verkligt dominerar med endast ord utan hänsyn fonetiskt, grammatik, eller något alls i övrigt - förutom ev. lite kring ord om felstavningar ska tas men jag tror det normalt enklare görs separerat) är hur vi värderar koncept explicit eller som här när analyserat kanske närmare optimalt "lite" indirekt eller implicit givet från en mening snarare än mer explicit som i exemplet:


    Doom AND "over aged player" AND "Fairtraid certified" AND "unskilled gamer" AND game with doom likeness AND amusing

    Rörande Wikipedia-sidan Doom (1993 video game) noterar vi den längre titeln än den Doom 3 / Doom III (se att Wikipedia ger kandidater på möjliga "synonymer" / "rättstavningar" m.m. via sina redirects) har. Vi vet att Google har statistik och algoritmer för att aktivt utnyttja detta för att identifiera mellan titlar och sökningar. Det kanske gör dem mer benägna att korrekt värdera Doom som sökkoncept i titel med förståelse av att det bör ha approximativt (tänkt enklast för tomma sidor d.v.s. ingen hänsyn i övrigt till innehållet) samma vikt som om i en trovärdig representation likt Wikipedia skriven med bara Doom.


    Just för Wikipedia är detta trivialt: Dominant källa till rankningsbart innehåll och excellent källa för att bygga vetskap om världen. Parenteser i titlar är en av flera enkla regler för hur Wikipedia-titlar tolkas effektivt.


    Tråkigt nog som det lär visa sig i kommande jämförelser för andra ämnen har resp. Google och Bing det från samma teknikområde lätt omvända problemet: När stor andel av många givna koncept är relevanta utnyttjas de sämre. Svårighet att förstå hur de förehåller sig till varandra är fallet för resp. Det fungerar säkert ändå acceptabelt för de flesta därför man vänjer sig med att hur man tror att det behöver fungera utan att tänka på vilken enorm begränsning det är. Emellertid är relaterat detta en utmaning vid sidan om teknik för att klara det frågan hur man kan få gränssnitt att ta emot data effektivt här utan att det blir komplext: Ev. är det svårt när folk lärt sig söka förutsättande detta att ändra medan annat än antagligen ej lär sig att använda särskilda funktioner. För dyrare sökningar som tar lång tid prospekterande djupt är det emellertid värdefull parametrisering. Trivialt från koncepten här kan det tänkbart vara bra att veta om vi avser dataspelet Doom resp. ämnet Doom om vi skriver Doom + Doom.


    Doom + Doom o.s.v. vet jag Google förr i alla fall tveklöst gjorde något med. Men vars ev. värde ej framgick för mig. Jag minns att jag tyckte mig se vad det var som gav effekten men kommer ej alls ihåg vad (och inget tänkbart presenterar sig från allmän kunskap). Tveklöst icke att man klarade tillsammans med ev. föregående sökning (kanske Doom AND Doom AND Doom efter Doom AND Doom) genom att om rimligt bedöma förhållanden och möjliga alternativa distanser mellan koncepten utanför motsvarande vektor- eller språkmodeller av dokument och sökord.


    Bing har tror jag mindre preferens för den enklare sekventiella parser-relaterade tolkning Google gillar (men Microsofts intresse för n-gram statistik var ju från publicering data känd föregripande Google Ngram) och utnyttjar som diskuterat identifierande titlar. Jag vill (men har ännu inte riktigt Bing vana nog att vara kategorisk) tolka några resultat mot slutet av topp tio säkrande upp med med flera alternativa tolkningar av ämnet jag avser att de säkrar upp sig lite väl mycket för att förutom identifikation av motsvarande koncept vi kan se i en vektor-modell av dokument också använda en språkmodell med annat än låga n i n-gram (ty min sökning tappar när vi ej klarar att tolka ut i övrigt mycket densitet och total mening om den ska ses som ord i en vektor-modell: 40 år öppnar ju ex. för att jag kanske känner the doom närmande sig och behöver börja titta över alternativ sjukhusvård så man är redo när kroppen börjar falla sönder):


    Pension Pulse: Will Longevity Risk Doom …Översätt den här sidan
    pensionpulse.blogspot.com/2015/02/will-longevity-risk-doom...
    2015-02-18 · ... who can now expect to live an additional 21.6 years, two years longer than in the old ... than anyone in the past 40 years ... than at any later ...
    [...]
    Health - The Telegraph - Telegraph …Översätt den här sidan
    www.telegraph.co.uk › News
    Get the latest health news and wellbeing advice from the Telegraph, ... A dialysis patient who received a kidney transplant 25 years ago is ... rather than referred ...

    Är Blogspot.com affärskritisk plattform för Bing's affärsmodell? Kanske

    Förra året menade jag att prioritera bloggar m.fl. innehållsleverantörer (ex. sajter för att spara och publicera filmklipp där värdet Bing tagit som diskuterat i också kanske kan ge värden här) i sökresultat är en väg för Bing att etablera i den om alls troligare lugna förändringen sig som en jämförbart med Google stor sökmotor.


    Personer som endast söker antar vi vara mindre rörliga medan innehållsleverantören prioriterande trafik intresserar sig för hur de rankar på sökmotorerna. Bättre stöd för sökning på sajt m.m. är vägar Bing kan fånga upp dessa med när de följer upp trafik Bing kan ha levererat. Därmed får man stabila kopplingar till fler personer såväl som en större synlighet mot innehållsleverantörernas läsare (ex. via sökning på sajten).


    Möjligen (går ej att bedöma nu från endast en av de första två test-sökningarna) kanske vi ser något av detta. Relaterat är ju också att större variation kan ge Bing värde genom att visa var innehålls-typer värda pengar och trafik finns ännu dåligt fångande av dom såväl som ännu större aktörer i mängd statistik: Trots alla tjänster tror jag nog Google som ett ex. kan missa mycket nytt med trafik under i alla fall ibland långa tidsperioder. Men för dem redan dominerande betyder det mycket mindre. För Bing är det möjlighet att följa nytt för att ta marknadsandelar.