Googles erfarenheter från att ha byggt en AI

2010-04-08

Det är kanske inte uppenbart hur området AI berör Nyhetsbloggen men för ett fåtal områden använder jag den även för anteckningar rörande sådant intressant för Hedonimeter (läs här i ninja-postningen om stereotyper rörande Hedonimeter). Ett sådant är business intelligence som är mycket relevant för media.

Långsiktigt är AI potentiellt intressant hur business intelligence skär med vissa områden i Hedonimeter där finns också likheter mellan mina modeller och neuronnät vilket är naturligt med min utbildningsbakgrund och projekt inom datasäkerhet. Forskning indikerar dessutom allt mer att de gamla idéerna om att betrakta hjärnan som ett neuronnät är korrekta. Inlägget där jag diskuterade Aftonbladets reportage med en mer än vanligt intelligent person visar ungefär men ytligt hur min modell ser ut:

Problemet med överdriven aktivitet i hjärnan vid hög IQ

En sak jag önskar kunna göra med en AI är att automatiskt träna ett tillhörande neuronnät för att uttrycka känsloläge hos en större population via vad de skriver, fotograferar m.m. för att approximera det som en person och emulera hur denna skulle fatta olika beslut m.m.

Förutom egentligen tråkigare applikationer rörande business intelligence och prediktion finns här en betydligt mer spännande möjlighet. Detta tror jag nämligen är en görlig väg att lägga grunden till en AI med verklig intelligens jämförbar med människans i funktion och uttryck men mer kraftfull. Särskilt gäller det om man kan lägga kontrollerade populationer av människor till den som besvarar frågor den vill ställa under kontinuerlig träning.

Att Google postade deras erfarenheter sammanfattade av den AI de byggt var därför givande. Den är ju trots allt utmärkt fungerande:

Lessons learned developing a practical large scale machine learning system | Google Research blog

AI för översättning mellan massor av språk

En användning de pekat ut är för översättningar mellan språk vilket är ett problem Google löst ganska unikt (jag känner inte till någon som gör det på samma sätt) där de snarast utnyttjar vad de har indexerat kombinerat med viss feedback från surfare rörande översättningar för att kontinuerligt bygga större språkförståelse. Det är ett område jag kan ytterst lite om och intresserade bör bäst läsa en kompetent diskussion om det. Wikipedias uppslagssida tror jag i alla fall är en bra start varifrån referenser kan hittas:

Statistical machine translation | Wikipedia

Följande inlägg på Google-bloggar har också en del att berätta:

Helping computers understand language | The Official Google blog
Statistical machine translation live | Google Research blog

Intressant här är att man faktiskt har samspel med en population man kontrollerar när de väljer att integrera. Det sker när Google ber dig om en bättre översättning där du kan föreslå en sådan.

En större Google AI? Sociala media för att hitta frågor

Förutom detta tror jag Google använder AI och neuronnät inom andra område (t.ex. sökresultat) även om det är svårt att säkert veta. Det är dock ett intryck jag fått från forskning de stödjer men jag har inte sett över vad de har publicerat om sådan användning.

Även där kan man se att samma typ av samspel kan vara möjligt t.ex. med personal som anti-spam-medarbetare, personer som gör kvalitetsbedömningar m.m. Vidare självklart via olika datakällor som bloggar, universitetssidor o.s.v. men där ställs inte aktiva frågor styrda av AI. Dock givet storleken på sociala media kanske det där nästan alltid går att hitta den fråga man vill ställa och få svaret via uppföljning på respons i sociala media eller på andra sajter.

Googles erfarenheter

Följande tror jag är helt riktigt:

"It is perhaps less academically interesting to design an algorithm that is slightly worse in accuracy, but that has greater ease of use and system reliability. However, in our experience, it is very valuable in practice."

Rent av tror jag för varje applikation som är "stor" krävs för att man ska kunna bygga något faktiskt fungerande att man accepterar fel. Däremot bör man givetvis inte bygga in grundläggande fel som är svåra att förändra utan att behöva bygga om allt. Det har Google uppenbart lyckats givet att översättningarna blir allt bättre.

Deras andra erfarenhet att börja med ett fåtal applikationer tycks också klokt. Här skulle det vara:

  • En entitet som kan lösa godtyckliga problem via överlägsen intelligens.

Eller initialt mer realistiskt:

  • En AI baserad på regler och neuronnät som kan uppskatta känsloläge i en population utifrån vad de uttrycker i text och bild.

Det hade varit ett enormt projekt för några år sedan men givet att allt mer teknik som krävs för analys finns klart och i öppna API:er kommer det troligen huvudsakligen ner till själva intelligensen. På samma sätt allt eftersom andra entiteter allt mer exporterar ut data från sig själva kan man se dem som underliggande intelligenser. Det gäller inte minst sök- och statistik funktioner hos olika sociala media, nyhets- och webbsökning m.m. Vidare när det gäller faktiska grundläggande algoritmer för AI och neuronnät räknar jag ganska kallt med att relevant forskning finns och att det mer handlar om att tillämpa det effektivt utifrån andra övergripande modeller (om inte är projektet kört).

Följande uttrycker på sätt och vis min grundläggande idé:

"In reality, simpler techniques are sometimes good enough for the task at hand. And in the long run, the extra effort that would have been spent integrating, maintaining and diagnosing issues with a live machine learning system could be spent on other way of improving the system instead."

Vad som begränsat tidigare idéer i detta område är att man försöker hitta en lösning som fungerar ensam. Det är dock tror jag enklast att se den som något som kan samordna mänsklig intelligens för att skapa ett större mervärde. Förövrigt är det en idé jag upplever är gammal och föreslagits på många sätt tidigare även om jag inte kan dra mig till minnes något enskilt fall.

Mer intressant för att skapa en AI

Det här programmeringsspråket hoppas jag (men har inte tittat på det än) åtminstone kan peka ut en görlig väg eftersom underliggande koncept motsvarar hur jag tänkt:

Grand Unified Theory of AI: New Approach Unites Two Prevailing but Often Opposed Strains in Artificial-Intelligence Research | Sciencedaily

"Tid" och hur man betraktar det menar jag är kritiskt om man ska klara att nå vad som korrekt kan betrakta känslor (vår upplevelse av tid är ju relativ känslorna):

Business intelligence - 6. Att mäta nuhet | Nyhetsbloggen

Ett möjligt avgränsat och enklare område att börja med kan vara forskning:

Forskning hos "viktiga" entiteter berättar om branschen | Nyhetsbloggen
Prediktera betydelse och trender för forskning från pressmeddelanden | Nyhetsbloggen