Bing vs Google: Högvärdes (sökmotor) sökningar III: Gaming

2015-04-04

Inledande diskussion en särskild sökning betraktar vi några områden intressanta när Google och Bing jämförs relaterat några av de idag mindre använda men värdefulla tekniker analys sidor och tolkning sökkoncept vi kan önska se när resp. börjar använda märkbart såväl som andra faktorer som kan tänkas ta upp Bing's marknadsandelar till nära Google.


Vi använder exempel-sökningen för att etablera några av de abstrakta resp. konkreta faktorer intressanta att följa upp via fler sökningar, statistik från andra källor resp. data mining av artiklar, konferenser m.m. resp. aktörs medarbetare uttrycks sig i.


Tidigare publicerat

Relaterat flera av diskussionerna ej länkat direkt där jag refererade fenomen (jämför också diskussion påverkan från språkmodell N-gram i skattningar Google index medan nedan diskuterades N-gram modeller närmare hantering av sökorden):


Bing kvalitativt bättre än Google för vissa former sökningar (inkl. bland de mest ekonomiskt värdefulla) RESP. Funktioner för sökning grafer jag vill se hos Google och/eller Bing

Information i SERP: Tillståndsinformation sökmotor resp. läsare / sökare

Översätta sökord: Se och särskilja kultur, grupper av personer och upparbetat representera människor

Google googlar med Google-NGRAM: Antalet indexerade sidor fel (2013-02-10)

Sökmotorer: Bedömning relevans och likhet mellan koncept och människor

Vad har Google, Microsoft m.fl. egentligen för beräkningsutrymme per användare? För kontext-hantering och prediktion av sökningar

......
Tänkbart är Microsoft Bing! på väg att bli stark (2014-02-07)

Bing! i Kina: Att approximera effekt med antal länkar (2014-02-17)


Video Gaming: Mycket värdefull bransch för sökmotorer

Förr i alla fall var gaming industri omsättande pengar - direktförsäljning av utbyggnader m.m. ekonomi lurande av ungdomarna såväl pengar som mer problematiskt läxtid (föräldrarnas fel: Ungdomar skriker efter struktur där spel och dobbel hör till någon vecka på sommarlovet) - såväl med en mycket internetanvändande publik.


Bättre perception av förändring intresse och preferenser är dessutom vad som kan ge sökmotorer möjlighet att kapitalisera bättre på de som söker i ämnet än andra aktörer kanske klarar lika troligt lika snabbt. Det är en fråga vi kanske återvänder till i ev. uppföljande inlägg när jag kontrollerat statistik för relevanta sökkoncept om jag har tillräckligt relevanta i min samling (jag tror men lär kontrollera mer att dom publika kanaler för indikationer Google har såväl som mindre aktörer jag prövat ej här tillför värde nog för att om jag saknar uppgifter sökkoncept ej bättre använder andra former av statistik som förändring uttryck nyheter, bloggar m.m. Dessa källor är ofta normaliserade i relativ mening och utsträckning i tid resp. sökord till begränsat värde för att se ev. förändrings-predikterande värde eller är mycket värre bygger på väldigt lite statistik utan att det framgår bra alls).


Låt oss därför göra en mini-test utan seriös bredd prövande Google resp. Bing i just denna bransch samtidigt som vi försöker få lite känsla av om någon av dem börjat "små-resonera" (den uppmärksammade kan ha noterat att jag av och till prövar dem vilket ibland givit någon postning här kring något noterat: Men ännu ej vad jag är intresserad av att om så märka).


Vi väljer en kundgrupp jag kan föreställa mig finns (Varför skulle jag vara unik?) såväl som jämfört med ungdomar och yngre vuxna med jämförbar eller bättre betalningsförmåga såväl som oftare havande barn man kanske söker presenter till. Sökningen:


generation later doom suitable 40 years old fully inexperienced games later than doom

Jag märkte säg ett eller två år sedan att Google gick närmare att (som jag upplevde det) utnyttja n-gram modeller på sökorden man skriver in i en språkmodell. Detta följde en tid (ej omedelbart) efter att Google N-gram publicerades:


I exemplet Doom Doom Doom har smoothing satts till 50. Som vi förstår från resultatet används smoothing ej för att hanterade saknande frekvenser när någon söker på orden utan tänker jag snarare bara för att ändra frekvenserna på n-gram man redan har riktiga mätvärden för. Frågan är vad man tänker sig att förändringarna särskilt om antalet reduceras från höga frekvenser som i flera ofta använda algoritmer "sparande" för koncept man ej hade i corpus tog vägen? Läsande ngrams/info inser jag att smoothing nog avsåg ritande av grafen och ej frekvenserna: Tyckte väl att det var funktion lite väl långsam om gjord bra att ha så här.


Första resultatet jag gjorde för att testa vad jag trodde var N-gram-smoothing ej alls intressant:



Intressantare sökning där Doom 1 fick ersätta Doom: Det senare ordet har så hög frekvens att det ej går att jämföra med Doom 3. Doom 1 lär ju vara samma sak som Doom oftast så det blir lite samma sak när vi tolkar orden i alla fall även om nu frekvensen är helt annorlunda. Se även att RA2 och Yuris tycks konvergera.




Det ger en till väg att tolka sökorden kompletterande vektormodeller av dokument: D.v.s. ordens ordning relativt varandra i statistik mening kan utnyttjas. Ett bra värde Google har som kan vara nära relaterat detta är identifikation av dokument (ex. journalartiklar, böcker m.m. med generisk titel) genom att förstå att sökningen just avser ett dokument med en viss titel eller med en viss under-titel (eller liknande) man kommer ihåg oavsett vilken sajt som publicerat dokumentet (journaler kan ex. ta betalt för att läsa artiklar samtidigt som universiteten har rättigheter utnyttjade att publicera en kopia av artikeln på sin hemsida).


I den mån detta fortfarande gäller är sökningar likt mitt exempel mycket svårare att bedöma utefter just detta jämfört med titlar. Titlarna med grundstatistik språkmodell dominerar över en udda lite slarvigt skriven mening. De många åren gör att den relativa skillnaden i statistik-meningen motsvarande ex. normaliserad frekvens och variation (entropin) gör skillnaden ännu värre: En titel för ex. en forsknings- eller nyhetsartikel kan uttryckas som titel på en mängd dokument medan min sökning kan vara vad Google innan aldrig sett med inte otroligt ej perfekt vanliga övergångar mellan delar av meningen till nästa ord.


Dessutom adderar språkmodellen i sig i mening av ngram-statistiken (sannolikheten för hela mitt menings-chunks) inte något särskilt värde för tolkning av vad jag avser för specifika meningar med mindre än att lite dyrare parsning och statistik tolkning görs. Ingenting jag märkt pekar på att Google gör särskilt mycket alls relaterad sådan tolkning jämförbart med en mer krävande modell av språk och mening.


Hur är det med domän och url när det gäller ranking?

Alternativ datakälla och informations-resurs till Google ngrams och Microsoft Ngram är bl.a. ngrams.info med COCA som är en av de lite mer kända resurserna även om jag här valde ut den endast p.g.a. likheten i domän med Google's URL resp. påverkar ranking såväl som resp. kraftiga länkning från betrodda resurser. Jag tycker att det är lite bra att Google ligger före COCA: Google Ngrams (books.google.com/ngrams/info) är kostnadsfritt (korrekt beteende) medan COCA's prismodell (skulle kosta migpengar) alltid känts fealtig för mig och då ska man inte ranka alls (jag betalar ej för statistik och vill därför ej heller hitta detta).

I övrigt har jag inte försökt följa ev. påverkan. Traditionellt har ju Google värderat detta. Propagerar man index framåt i tiden delvis åtminstone förstörande kan jag tänka mig att det är en sak som kan medverka till att man föredrar att behålla en ungefärligt (hög värdering men kanske mer eller mindre hög) jämförbar värdering fortsatt alltid framåt i tiden fortsatt så länge det känns som onödigt arbete att röra runt med datapunkter man ser ett värde i som de fördes över till nästa tidpunkt.


Har Microsoft common sense? Begriper de egentligen något alls?

Möjligt har Bing också en utmaning här: Men jag har ännu inte Bing-känsla nog för att våga mig på att spekulera även om jag åtminstone har viss koll på vilka common sense (ett av dem tror jag att jag diskuterade också just noterande att Microsoft prövat den lite förutom övrig diskussion här längre bak: Concept net) , teknikområden inom information retrieval, och intressen deras medarbetare runt Bing av och till visat intresse för relaterat konferenser m.fl. nörd-ansamlingar från olika företag och universitet för att lära av varandra och hoppas jag motivera upp varandra sunt söka visa vem som är den brutalare programmeraren och algoritm-tänkaren.

Google köpte upp en aktör för några år sedan relaterad common sense. Jag spekulerar att implementationen av datasystemet för graf-representation av koncepten med deras mening var hela värdet de sökte. Själva datavärdet av Freebase var när jag sist tittade på det ej på nivå där det är värt besväret att utnyttja om man kombinerar med några till stora databaser med enkelt vetande. Och jag tror ju inte riktigt på att det kommer bli Facebook-Coolt eller trendigt att sitta och sortera in föremål m.m. i olika ämneskategorier: Inte på nivå med att addera något ens för koncept annars ej i annat common sense (d.v.s. jag ser ungefär jämförbart värde användning av det med att automatiskt identifiera mening via statistisk- och lingvistisk-analys - Är det manuellt vill jag nog och tror att kanske Google tänker liknande ha mycket bra sample man kan börja algoritmer för att sedan ta ut automatiserat allmänt från språk från ex. som test- och träningsdata).


Stark och lätt lösning på mitt sökproblem: "Strategy of the Third Line of Warriors"

Problem: Lämpligt spel ej osunt i krav på joysticks eller tangentbords-kombination eller överdrivet "grafiskt" mer som Doom men lite senare. Här finns därför en enkel lösning när uppföljning på Doom namngiven ex. Doom 2. Emellertid spelar där nu sannolikheten in för om jag kanske avser också Doom 2 men efter alla år skriver dem på samma sätt. Missar sökmotorerna här kan jag förtydliga sökningen men det är intelligens där förståelse av vad jag önskar såväl som vetskap nog att väga in sådant vi är intresserade av i diverse sökningar jag lär göra av och till nu även om jag inte säkert diskuterar alla eller ens någon här (Doom varande kanske världens mest firade dataspel - vad tillochmed jag efter så många år minns - måste ju vara gigantisk big business idag med mängder av Doom-spel, Doom-filmer, Doom-prylar så jag vill inte lova bort någon insikt jag kan få istället för att låta den göra mig rik).


Strategy of the Third Line of Warriors är möjligt när entitet vi betraktar (ex. fienden som ställt upp sig fullt synligt i rader efter varandra på ett fält inför slaget) visar sin inbördes-ordning som en öppen label. Vi kan också jämföra med polis och brandkår på samma plats vid samma tidpunkt. Dataspel och film är två områden som i titlar kan uppvisa detta: Ghost Busters, Ghost Busters II m.m. Det går att utnyttja detta rent regelstyrt så väl med statistiska modeller (Bayesian probability är det enkla och välfungerande alternativet att utgå från här).


Google ger också förslag på Doom III redan på position två. Det bör tror jag säkert - men utan att följa upp emellertid väldigt trygg från allmän Google känsla i det - att Doom III är det sista eller i ord-gram mening det sista nära refererat som Doom (ex. just "Doom III") liggande senare i tiden med en försvarlig mängd referenser i datatidningar, bloggar m.m. Det är om så nästan helt säkert detta snarare än att Google klarar att fundera ut att jag nog spelade Doom II men ändå skrev Doom (det lär visa sig framöver när jag prövat mer: Just den förmågan är dock mycket intressant särskilt när vi antar ingen kunskap i form av sparat kontext om mig - Klarar man denna typ av resonemang bra är det generellt tungt i värde samtidigt som det är svårt med troligt stor distans till konkurrenter).


Strategy of the Third Line of Warriors är här vad som kan ha gjort all analys såväl som inlärning statistiska modeller mycket enkelt för särskilt Wikipedia. Och med besläktade enkla principer för regelnära analys vad som kan maskera sig som sofistikerade mycket mer generella algoritmer. Vi ska därför varken för Google eller Bing tolka in för mycket i förslaget Doom III.



Microsoft Bing röstar med sin sökresultats-länk också på lösningsförslag Doom III men redan på på plats ett:



Att Bing väljer Doom III före Doom gällande ett Wikipedia resultat stämmer bra för hur jag typiskt föredrar sökresultat om jag sökt på långa meningar ej överrensstämmande med en titel på ett dokument jag vet existerar och vill hitta i sin helhet att läsa kostnadsfritt (generellt som delvis diskuterat i Bing kvalitativt bättre än Google för vissa former sökningar (inkl. bland de mest ekonomiskt värdefulla) RESP. Funktioner för sökning grafer jag vill se hos Google och/eller Bing
också high value område för sökmotorer).


Jag vill här ofta gärna att ett koncept likt Doom ska tolkas närmare en ämneskategori och att resultaten ska gå mer exakt från övrigt jag skrivit: Och om jag ännu över-optimistiskt vill testa om de börjar begripa mer som vanligt nu "komplex" mening med koppling till statistik människa (ex. det senare här åldern resp. "generationer" implicit på dataspel) kan jag pröva en sökning som dena.


Åtminstone periodvis har jag upplevt Google ger problematiska sökningar för jämförbara sökningar. Problemet har varit Wikipedia: Vissa perioder (och kanske är detta problem inte längre aktuellt) var det för en del sökningar nära nog omöjligt att med normalt besvär få bort träffar till stora delar irrelevanta som jag vill minnas (postningar bakåt med exempel finns som jag vill minnas det).


Vad är ett Doom 3? Trendig retro att felsortera med musik- och film-CD samlingen eller konvenansisk defekt från dålig uppfostran och för lite matematik och klassisk litteratur i skolan?

Vi går nu in och tar reda på vad en Doom 3 är (en indikerar väl kanske CD-skivan med spelet och tillhörande instruktionsbok: "Det ligger en Doom 3 bland mina musik-CD / Blueray-filmer", Erik tog med ett Doom III för att visa skolkamraterna hur cool han är med den senaste inne-prylen.).


Även om jag ej försöker besvara frågan är det ibland värt att fundera lite över vad koncept också när en självklar named entity likt ett dataspel eller person är mer än det. Uttrycker de implicita ämnen? Är det givet att den som begriper Doom 3 även lägger något av vetande man i Wikipedia snarare hittar på sidan för Doom via aktivering av hjärnans nätverk när begreppet ska förklaras för någon som ej prövat detta dataspel någon gång? Och sker kanske liknande effekter redan från att läsa en titel eller vad vi vill ha sagt skrivande sökordet Doom 3? Ej frågor 100% lätta att leda rätt till mål (Och jag skulle verkligen önska att någon av dessa två sökmotorer rekommenderat ett spelbart alternativ: Gratis och kanske mer en generation mellan Doom 3 och Doom 2 så det är begripligt hur det fungerar men ej så faktiskt: Man ska tvingat ha tiotals år av dataspelande för att alls få det nöje yngre generationer tycks kunna ta för givet) men vad vi framöver kanske återvänder till.


Doom mer topp än Doom 3

För hur jag kan tänka mig att jag skulle försöka implementera en princip själv med om kodande en sökmotor likt dessa när befintlig statistik sökningar saknas är att förstå Doom som såväl ett dataspel (named entity) och ett abstrakt ämne sträckande sig över fler Doom-dataspel, Doom-kloner, och kanske en bit in eller som fuzzy-"undrrums-liknande-koncept" till FPS (first-person-shooter: Dataspel jämförbara med soldier on battlefield där flera krigar ex. lag tränande samarbete och annat nyttigt kanske som en belöning efter att gjort läxorna i en studiegrupp eller arbetat över).


Wikipedia sida för äldsta dataspelet är det mest ämnestunga Doom-konceptet: Det är högre upp än Doom 3. Värde detta ger är oftare fler länkar till allmänt material, enkla vägar att hitta till mer specialiserade sidor (ex. Wikipedia sida för Doom 3 eller en extern resurs), abstrakta historiska diskussioner och jämförbart i och runt ämnet med inte sällan idag ett stort antal referenser om man behöver djupare vetande.


Bing saknar äldsta Doom-dataspelet topp tio: Bra eller dåligt?

Att Bing saknar Wikipedia sida för första Doom dataspelet som är det mest övergripande ämneskoncept tunga sidan kan möjligen peka på en svaghet om en generell egenhet.


Att Bing ej hade med Doom sidan i Wikipedia topp-tio kan emellertid tänkbart vara sund strategi. De tycks ha större variation mot smalare representationer oavsett som senare diskuterat säkrande upp med för mig felaktiga ämnen eller som för Doom-ämnet en smalare färskare spel-release resp. något skandal-relaterat. Det kanske fungerar bra för dom att växa via? Att bedöma ett sådant värde har jag ingen statistik som jag kan tänka mig säger något alls om annat än när återigen kör mitt Symbol Mind dagligen igen och kopplingar till förändring av koncept uttryckta i nyheter och bloggar kan ge indikationer om någon bas-förståelse av "personligheter" mer rörliga i preferens sökmotor kan etableras.


Statistik sökning (antal som söker efter något och tids-relaterade sökningar) är ytterst scarce och svårt att få tag i: Men kompletterar potentiellt potent när sökmotorer ska förstås

Rörande statistik sökningar har jag ej hämtat upp min råstatistik med statistik över sökningar på sökmotorer (aktuellt i databaser ligger det kombinerat till en gemensam representation med andra källor) från arkiv på USB-diskar. Men lär ta upp det till efterföljande diskussioner i kommande inlägg för där aktuella sökningar (och denna om jag har statistik för sökkoncepten).


Statistik faktiska sökningar och än mer hur en sökning predikteras eller predikterar en annan sökning är emellertid ytterst scarce. Mycket tidsödande att få tag i såväl som mer begränsat i antal sökkoncept såväl som storleken totalt med den tillgång och förmåga att övertyga (jag betalar aldrig för statistik: Så ska något alls ges tillbaka är det primärt statistik jag har eller någon annan information). Även data som säljs har ett mer begränsat värde än vi kan ha vant oss vid att förvänta från annan statistik koncept. Flera riktade aktörer säljer dessutom statistik som ej är vad vi här önskar eller för den delen tillför (som jag bedömde det för de tre ungefär största för bl.a. "toolbar-statistik") med en kvalitet och trovärdighet som gjorde data värt att inkludera till gemensam representation för "statistik sökord" över alla kanaler.


Om [Försöker skriva meningen kul vilket bör förklaras för alla läsare som har problem med tråkighet så att man inte ödslar tid på tolkningen.] någon release (ny version av videospelet) eller Washington Power-Pack (en utbyggnad ibland kostande massor med som kan ge ett gammalt trött dataspel nya förmågor att roa publiken drama ganska ofta samman tryckt till intensiv intensitet på några minuter på teven antenn-sladds-ingång videospelet kopplats till) varit aktuell för perioder jag har data (minns ej och vet ej säkert att jag har ens år för allt data: En del sämre gammalt data idag knappt vad man om inte ganska begränsat i mängd jämfört med andra datakällor jag använt totalt skulle våga värdera för de viktsystem jag byggt från dessa samples för användning närmare aktuell för analys händelser just nu fullt ut så att säga: Mycket Buzz-words folk hört på jobbet eller uttrycker någon ganska snuskig perversation de har som kan vara ganska års-beroende eller ännu smalare: Musiker NN naken kanske inte är lika hett 15 år senare när hennes karriär är över och hon hunnit slitits ner av droger, festande och trafikolyckor m.m. karma-balanserat kända personer ibland drabbas av).


Förutom sådant gammalt sökmotor-data har toolbar-statistik från också de största aktörerna problem stora utmaningar här. Frekvenser, ålder m.m. är inte trovärdigt och var problematiken ligger även om kanske tydligt relaterat åldern behöver inte ha bara en gemensam förklaring som att man stoppar in antal från andra former av mätningar an gör för att fylla på data av en typ där man är inarbetad och känd. Andra orsaker kan också vara fallet men är svårt att bedöma. Även om bl.a. auto-surfande inte är vad som direkt är den större risken just här för mig i alla fall: Sådant är ju en form av skattning av värde indirekt mot sökord (men man måste så klart på vettig nivå klara att separera det från andra former av data för att inte bara bli underligt fel). För en mindre aktör bl.a. förutom möjligt eget data (uttryckt så) upplevde jag att man för några sökord stoppat in egna siffror utan någon trolig mätning: Kanske att man fått betalt för att ta upp statistik för något mot kund man välkänt har eller övertygat någon om sådant skulle ha ett värde och fått betalt för att göra det (eller att aktören startades upp specifikt för att göra just detta.kanske bara för ett fåtal sökord med ett särskilt syfte relaterat någon och något). Jag såg inga politiska exempel jag tyckte var troligt aktuella exempel på den typen av manipulation.


Min statistik har totalt för sökord inte ett antal typer eller token-frekvenser i närheten av jämförbarhet med vad jag har för språk generellt. Men lite har jag (jag vågar inte säga fler än 100 000 här för fler-grams sökningar: Det var ett tag sedan jag tittade bland sample-området som denna statistik hör till för mig och som jag använder det faktiskt är det kombinerat en mängd källor i databaserna jag använder och finns istället som rådata externa usb-diskar att återkomma till kanske om några dagar rörande statistik Doom m.m. när jag ska ta upp en del annat data ) :-D


Är Bing svag för skandaler, romantik och trender? Är det smart eller bara vulgärt?

Amerikanen vet vi från stereotyper nog starkare några årtioenden bakåt allra minst kan vara såväl som lite övermotiverad / smart i affärer resp. vulgär i och runt allt i kultur som fodrar en traditionell värde-transferering av en korrekt centralitet och/eller att man investerar några år på en särskild lite dyrare skola där man prioriterar ex. klassisk musik eller litteratur djupare för att etablera möjlighet att diskriminera det vulgära från det intressanta.


Och kanske är Bing smart. Eller om de bara är en vulgära amerikanen som kommer och försöker prångla ut information vi från äldre länder ogärna läser medan de försöker rättstava sönder författare och konstnärer välkända sedan många hundra år (att söka på konst eller en författare - annat än de givet vulgära i vilket fall likt de flesta moderna romanförfattare - är självklart ej del av konvenans möjlig att visa eller tala om i ett socialt sammanhang: Jag kan inte förstå hur någon ens kan tänka sig att göra sådant - Så lätt illamående man blir bara av att tänka sig en vulgär amerikan som sitter och söker på en fin engelsk författare som John Updike eller defekt i varje sammanhang privat eller oartigt i allt socialt surfande "fakta" om Updike i strunt som Wikipedia istället för att vi från gamla fina kulturer läsa honom, förstå honom än mer med en biografi betryggande skriven av den som kan uttrycka djupet det ytliga inte hinner se upptagna med att förstöra och felförstå ytan: För updike såklart en Britt från England med samma fina engelska bakgrund som Updike hade).


Är nu Bing den smarta eller vulgära amerikanen - eller kanske rent av den fin-kulturella Updike-britten när de prioriterar trendigare innehåll? Kanske uttrycker de något av Updikes Haren (talande kultur så att ev. läsande amerikan ej förstår vad vi säger)? Min känsla är att det kanske en aning mindre tråkiga innehållet med distans lite kortare till "nöjen", det ibland upplevt trendigare med kortare temporal reward discounting skala framåt m.m. (jag vill inte skriva vulgärt här eftersom jag haft nytta av detta själv när jag sökt teveserier) Ett upplever jag resultat för exempel-sökningen jag kan tänka mig kan visa sig vara relaterad en sådan ev. värdering är:


Video game controversies - Wikipedia, …Översätt den här sidan
en.wikipedia.org/wiki/Video_game_controversies
... playing of violent video games than ... 40 in Tennessee, killing a 45-year-old man and ... a link to video games, which was later ...
Background · Theories of negative ... · Censorship and regulation

Controversies är koncept inte särskilt svårt att följa indikationer relaterad emotionell kraft tänkbart - intressant att ranka upp om så - predikterande intresse gärna såväl publicering som sökning (även publicering viktigare därför att färskt innehåll när emotionellt intensivt är kraftigare gemensamt: Kändisar nakna tillsammans med droger, politiker som uttryckt sig anti-gay eller rasistiskt eller verkar indikerad i myt-skandal o.s.v. Saker folk bryr sig i men inte sällan just när det inträffar). Också vad som kan visa sig ha stabila grundvikter som håller över tiden där kontextuellt eller tidsberoende mer är att controversies i datakvalitet runt studier människans DNA fortfarande är feta-skandaler men som ingen mer än folk som lärt sig att de måste förklara för maskin såväl som människa vad de egentligen pratar ens hört talas om.


Om Bing gör emotionell värdering intresserar det mig. Området har jag utmärkt viktstöd för själv och när inarbetat som där roar det mig när jag har behov att hantera självbild och självförtroende att jämföra med någon som närmare i tiden börjat med det (det är en av de kanske två mest stabila viktsystem jag har lösningar för oavsett om det gäller endast intensitet med förståelse av att fler dimensioner ej ska fodras för att dra snabba slutsatser eller om polaritet över ett mindre antal basdimensioner krävs eller upp till många fler indikationer om än då av mycket mer varierad kvalitet: Danger, Hate, Positive, Unknown m.fl. är några exempel på självförklarande ämnen medan ett ex. på mer abstrakt inkluderande mer manuellt arbete data såväl som egen-logik är Marching Up avsett för att ta indikationer på den intensitet som föregår uttryck av mänsklig aktivitet i grupp av typ krig, invasion, allmänna kravaller m.m. i kontrast till Gracefull Cute för allt internets och nyheternas gulliga läsar-fiskande).


Fler exempel som teveserier, film (innehåll möjligen ibland oftare otillåtet publicerat indexerat) och erotik gavs i Bing kvalitativt bättre än Google för vissa former sökningar (inkl. bland de mest ekonomiskt värdefulla) RESP. Funktioner för sökning grafer jag vill se hos Google och/eller Bing
. Och som sagt tror jag inte Microsoft tar marknadsandelar av Google genom att vara finkulturell: Innehåll med högre upplevt värde där "hål" kontra efterfrågat finns hos Google är kraftfullt oavsett om det nu är långfilmer, teveserier, böcker eller vad helst nästan.


Google har här (tråkigt istället för ytligt ämne men varken bättre eller sämre för det: Solid besparing per access artikel) värde i åtminstone ett område jämfört med Bing: Det är mycket lättare att med Google's koncept (Scholar och WWW) hitta hela artiklar publicerade i journaler. Länkar till sådana hos Microsoft Academic går för ofta bara till förlagets sida när access kostar pengar samtidigt som länkar till hela artikeln hos universitet när de finns ofta inte lägre fungerar.


Doom i Wikipedia har fyra stycken ord

Besläktat redan diskuterade möjligheter att utnyttja språkmodeller för att förstå att identifiera titlar (och uttryck nära existerande titlar vilket n-gram modeller oavsett om bara ord på slutet eller enstaka eller felskrivna ord skiljer oss från hela titeln fungerar mycket bra för: Ett av få områden n-gram modeller verkligt dominerar med endast ord utan hänsyn fonetiskt, grammatik, eller något alls i övrigt - förutom ev. lite kring ord om felstavningar ska tas men jag tror det normalt enklare görs separerat) är hur vi värderar koncept explicit eller som här när analyserat kanske närmare optimalt "lite" indirekt eller implicit givet från en mening snarare än mer explicit som i exemplet:


Doom AND "over aged player" AND "Fairtraid certified" AND "unskilled gamer" AND game with doom likeness AND amusing

Rörande Wikipedia-sidan Doom (1993 video game) noterar vi den längre titeln än den Doom 3 / Doom III (se att Wikipedia ger kandidater på möjliga "synonymer" / "rättstavningar" m.m. via sina redirects) har. Vi vet att Google har statistik och algoritmer för att aktivt utnyttja detta för att identifiera mellan titlar och sökningar. Det kanske gör dem mer benägna att korrekt värdera Doom som sökkoncept i titel med förståelse av att det bör ha approximativt (tänkt enklast för tomma sidor d.v.s. ingen hänsyn i övrigt till innehållet) samma vikt som om i en trovärdig representation likt Wikipedia skriven med bara Doom.


Just för Wikipedia är detta trivialt: Dominant källa till rankningsbart innehåll och excellent källa för att bygga vetskap om världen. Parenteser i titlar är en av flera enkla regler för hur Wikipedia-titlar tolkas effektivt.


Tråkigt nog som det lär visa sig i kommande jämförelser för andra ämnen har resp. Google och Bing det från samma teknikområde lätt omvända problemet: När stor andel av många givna koncept är relevanta utnyttjas de sämre. Svårighet att förstå hur de förehåller sig till varandra är fallet för resp. Det fungerar säkert ändå acceptabelt för de flesta därför man vänjer sig med att hur man tror att det behöver fungera utan att tänka på vilken enorm begränsning det är. Emellertid är relaterat detta en utmaning vid sidan om teknik för att klara det frågan hur man kan få gränssnitt att ta emot data effektivt här utan att det blir komplext: Ev. är det svårt när folk lärt sig söka förutsättande detta att ändra medan annat än antagligen ej lär sig att använda särskilda funktioner. För dyrare sökningar som tar lång tid prospekterande djupt är det emellertid värdefull parametrisering. Trivialt från koncepten här kan det tänkbart vara bra att veta om vi avser dataspelet Doom resp. ämnet Doom om vi skriver Doom + Doom.


Doom + Doom o.s.v. vet jag Google förr i alla fall tveklöst gjorde något med. Men vars ev. värde ej framgick för mig. Jag minns att jag tyckte mig se vad det var som gav effekten men kommer ej alls ihåg vad (och inget tänkbart presenterar sig från allmän kunskap). Tveklöst icke att man klarade tillsammans med ev. föregående sökning (kanske Doom AND Doom AND Doom efter Doom AND Doom) genom att om rimligt bedöma förhållanden och möjliga alternativa distanser mellan koncepten utanför motsvarande vektor- eller språkmodeller av dokument och sökord.


Bing har tror jag mindre preferens för den enklare sekventiella parser-relaterade tolkning Google gillar (men Microsofts intresse för n-gram statistik var ju från publicering data känd föregripande Google Ngram) och utnyttjar som diskuterat identifierande titlar. Jag vill (men har ännu inte riktigt Bing vana nog att vara kategorisk) tolka några resultat mot slutet av topp tio säkrande upp med med flera alternativa tolkningar av ämnet jag avser att de säkrar upp sig lite väl mycket för att förutom identifikation av motsvarande koncept vi kan se i en vektor-modell av dokument också använda en språkmodell med annat än låga n i n-gram (ty min sökning tappar när vi ej klarar att tolka ut i övrigt mycket densitet och total mening om den ska ses som ord i en vektor-modell: 40 år öppnar ju ex. för att jag kanske känner the doom närmande sig och behöver börja titta över alternativ sjukhusvård så man är redo när kroppen börjar falla sönder):


Pension Pulse: Will Longevity Risk Doom …Översätt den här sidan
pensionpulse.blogspot.com/2015/02/will-longevity-risk-doom...
2015-02-18 · ... who can now expect to live an additional 21.6 years, two years longer than in the old ... than anyone in the past 40 years ... than at any later ...
[...]
Health - The Telegraph - Telegraph …Översätt den här sidan
www.telegraph.co.uk › News
Get the latest health news and wellbeing advice from the Telegraph, ... A dialysis patient who received a kidney transplant 25 years ago is ... rather than referred ...

Är Blogspot.com affärskritisk plattform för Bing's affärsmodell? Kanske

Förra året menade jag att prioritera bloggar m.fl. innehållsleverantörer (ex. sajter för att spara och publicera filmklipp där värdet Bing tagit som diskuterat i också kanske kan ge värden här) i sökresultat är en väg för Bing att etablera i den om alls troligare lugna förändringen sig som en jämförbart med Google stor sökmotor.


Personer som endast söker antar vi vara mindre rörliga medan innehållsleverantören prioriterande trafik intresserar sig för hur de rankar på sökmotorerna. Bättre stöd för sökning på sajt m.m. är vägar Bing kan fånga upp dessa med när de följer upp trafik Bing kan ha levererat. Därmed får man stabila kopplingar till fler personer såväl som en större synlighet mot innehållsleverantörernas läsare (ex. via sökning på sajten).


Möjligen (går ej att bedöma nu från endast en av de första två test-sökningarna) kanske vi ser något av detta. Relaterat är ju också att större variation kan ge Bing värde genom att visa var innehålls-typer värda pengar och trafik finns ännu dåligt fångande av dom såväl som ännu större aktörer i mängd statistik: Trots alla tjänster tror jag nog Google som ett ex. kan missa mycket nytt med trafik under i alla fall ibland långa tidsperioder. Men för dem redan dominerande betyder det mycket mindre. För Bing är det möjlighet att följa nytt för att ta marknadsandelar.