HANS HUSMAN OM MEDIA

Mitt Romney: Lär från Thorbjörn Fälldin

2012-09-20

President Obama kan ryktesvägen vara en riktigt överpåläst liten besserwisser inte bara när han förklarar saker för kongressen och väljarna utan också i möten. Det kan nog skapa konkreta värden men andra ingångar till ledarskap och personlighet kan säkert fungera lika bra.

Kampanjerna och upp-intensiteten från Obama-lägret har på samma tema varit lika ramming speed trummande som förra valet. Han hugger snabbt också i det personliga med begränsad tid och utnyttjar sin förmåga att snabbt flytta perspektiv ner till detaljer för att vid behov flytta det ändå ut till abstrakta värden och förhoppningar om framtiden, och med folket ibland bitterhet över allt mer arbete istället för att snabbare marschera dit han tvingas till för att reda på alla ekonomiska problem situationerna så ofta ger möjlighet att ofta med detaljer peka ut tidigare politiker respektive republikanerna i kongressen som ansvariga för.

Jag har dock inte detalj studerat President Obama exakt för detta nu i denna situation men har "hälsat" på honom ganska regelbundet under presidentperioden och gjort ibland också noggrannare uppföljning av vad han skriver, säger, uttrycker med kroppsspråk, hur hans försök i en situation att visa ett sätt att se på världen klarar sig i det större havet av människans kollektiva språk. Jag tror jag ligger ganska nära indikerade möjligheter.

Mitt Romney har en viktig styrka och det är ekonomin. Han har en framgångsrik historik. Att han angripits i de moraliska dimensioner ex. rörande deklarationer ej publicerade behöver inte vara ett problem hos dom väljare han kan vinna. USA:as ekonomi går dåligt, lånen till Kina m.fl. är stora. En inte bara kunnig utan slug kanske lite ekonomiskt hal president kan så länge inte något konkret moraliskt tvivelaktigt visas upp av Obama-lägret vara styrka.

Nu sedan sista dagarnas rent rörligt visuella Youtube-angrepp av Obamas har det som om inte kronan på verket vad vi närmar oss givit Mitt Romney en till styrka han tidigt under presidentvalskampanjen saknade.

Folk vet att olika sätt att leda och tänka kan fungera lika bra. Rent av vet de att i mycket är det mer abstrakta övergripande ledarskapet bättre. De kan bedöma respektive person rörande det endast från deras beteende. Obama är en konkret detalj-människa.

Mitt Romney ligger i grov-jämförelse närmare Reagan i perception av det även om jag lätt misstänker att han egentligen är en siffer-pedant på sätt tror jag väldigt främmande för Reagan (och mig också).

Men sådant är ju knappt mer än en smakfråga vad folk föredrar. De flesta tänker nog bara att båda strategierna kan fungera utan att uppleva att de föredrar den ena eller den andra. Men det är här Obama-lägrets ivriga små-pedanteri rörande allt på Romney-sidan i intensiv upp där de knappt hinner med att svara eftersom dom är ute och talar idéer och värdering med rätt leverage bygger värde för Romney genom Thorbjörn Fälldin-effekten.

Ärligt talat vem gillar någon som blixtsnabbt dyker ner i detaljer bara för att få dig att verka inkompetent och sedan springer iväg när de börjar redovisa svaren? Många har mött dom själva och inte gillat dem. Inte sällan uppfattas de av många i organisationer som lite destruktivt engagerande genom att ockupera tid utan egentligen göra något av det riktiga arbetet.

Så med den utgångspunkten föreslår jag Romney & Co att dyka ner i den svenska politiska kulturhistorien att lära av Palme hur man förlorar ett val genom att få motståndaren att verka lantligt sävlig förstående naturen, balansen och varifrån maten kommer nära till vanliga människor snarare än trög och inkompetent när Palme tar rollen av varje dryg irriterande pedant folk irriterat sig på:

Förutom den visuella glädjen av att se det hela illustrerat också av Fälldins kroppsspråk och konkret svett notera gärna hur Palme flyttar perspektiv från höga detaljer i avgränsat område till höga breda frågor och så in i ett nytt område där detaljer i hög upplösning ges. Många personlighetstyper har svårt att argumentera mot den strategin. Den emotionella engagemangs-dimensionen är också potentiell strategisk-utgångspunkt rörande Obama. Palme är ju tydligare givet den svenska kulturen vid tiden mycket tydligare i sådant med färre något svagare symboler men uttrycker en del av vad Obama skapar värde från.

Konkret på valdagen kommer det ju sedan ner till hur många sista minuten röster en dera sidan behöver. Representerar man något eller har vägar till lämpligt stor intressegrupp värd kanske 20 - 30 000 röster i respektive diverse städer kanske man kan förhandla till sig något för dem. Rörande sådant tror jag Obama kan ha det lättare än Romney men om den senare tänker längre än de vanliga löftena sådant handlar om (respektive kontra sådana där man föregriper den andres löften lite bättre) kan jag tänka mig att utrikespolitiken bär värde. Israel ja visst men jag är mindre säker på att Obama verkligen har så lågt förtroende här eller att det är värt avgörande röster. Kalifornien vore däremot något för dig Romney... Ta dig en funderare på vilka som är de stora rörliga rösterna där och som kan vara särgrupper. Det är inte bara skådespelare, latinos och IT-arbetare.

Jag tror verkligen att oavsett senaste dagarnas angrepp har Romney fortfarande alla förutsättningar i världen att vinna. Men det börjar bli dags att få ordning på verksamheten. Saker har nog skötts acceptabelt men det räcker inte långt mot Obamas krigsmaskineri. Gå till vad du kan och vet, också i organisationens marketing men på det gäller för den senare att man lyfter blicken till oerhört uppmärksamt nu inte bara direkt i kampanjen utan bleeding-edge i forskning och kunskap om teknikerna för Obama-lägret är ganska snabba där. Ibland får jag en känsla av att man visst saknar funktionell samlad modell inte minst i maskin-intelligens men ändå klarat att ta in mycket av den ganska potenta vetskap som finns att lära från förra årets och årets forskning där en hel del övergripande mer enkelt dokumenterade koncept från 1950- och 1960-talets forskning om propagande, attityder o.s.v. nu fått möta modern brain imaging och nätverksanalys av sociala media.

Ev. kanske när jag borrat valet mer att jag följer upp med mätstatistik för en del dimensioner rörande koncept och relationerna runt dem. Det finns en hel del där Obama-lägret identifierar och korrekt använder men som Romney-folk inte ens tycks se med annan förståelse än vad själva orden säger. Möjligen rent av sent idag.

Förvisso tror jag nog att båda kan bli bra presidenter. Men ett spännande jämt val kan ha sina poänger. Dessutom stödjer jag starkt Romney's ställningstagande rörande Kinas valuta-politik. Önskvärt vore dock att han tydliggör bredare rörande aktuellt utrikespolitiskt segment. Det tror jag kan vara värt bra med röster.

Dags för positivt-upp i ekonomin

Det har ju alla av åren här sedan inte minst 2009 varit en frågeställning hur aspekten amerikanska "valuta-bristen" och lånen från Kina ev. inverkar på relationerna mellan länderna. Frågan har inte på allvarligt direkt oroat mig särskilt som att en jämförelse med tänkbar praktiskt förändring relativt innan inte är sådan att referensen ska överskattas.

I ett större perspektiv har lite lugnar världsekonomi några har haft en hel del fördelar rörande demokratiutveckling och säkerhetspolitik i det långsiktiga perspektivet (snarare än övernervositet inför varje förändring även när den går mot ökad demokrati).

Tänkbart är värdet att få i det segmentet nu inkasserat eller ej utnyttjade inte längre p.s.s. omedelbara fördelar att realisera där ett annat mer "upp-hedonistiskt" perspektiv kan tillföra särskilt det långsiktiga lugn där man förvaltar ex. familjen in i framtiden och vad man har snarare än att prioritera att förvandla dom strukturer som hindrar att man har det rimliga att förvalta (som rimligt med mat, frihet, färgskrivare o.s.v.). Och tittar vi på frågor där förändring denna gång inte var mer aktivt men givetvis lär bli någon gång i framtiden är det kanske inte otänktbart att det är gynnsamt med lite mer bombastisk ekonomisk-tillväxt och tro på den egna förmåga i USA apropå Panettas över-diplomatiska pratande med den kinesiska diktaturen rörande bl.a. Japan.

Mer upp-intensitet känns strategiskt rätt.

Säg att vi nu beräknar en distans mellan ett känt maximum i tiden [nu - t, nu] och bedömer sträckan från det till ett okänt minimum som antal s.t. varians-beroende paradigm där jag inte skulle gå så långt att addera energi på autkorrelation är vi kanske om det nu känns rimligt enligt tidigare motivations-områden att vi kan ha det indikerat här mot vad som kan vara en så fall realiserad minimum-punkten passerad. Finns fortfarande värden i tidigare diskuterade motivationsområden som fortsatt realiseras aktivt är det mycket svårare att bedöma det eftersom sådana händelser både är väldigt emotionella per individ och inte sällan inkluderar väldigt många. Rörande ex. Nordkorea som kanske också kan vara aktuellt är det väl åtminstone inte orimligt att visst "hopp" inför den nya diktatorn ev. gör att folk står ut med ett års svält och djävulskap till.

För svensk del vet jag förövrigt inte om vi någonsin just hade någon riktig lågkonjunktur annat än som buzz-word inlånat från USA och kontinenten. Men givet att Riksbanken höjde räntan för nu ett par år sedan när jag tyckte de skulle sänka den med en procent och nu sänkte den när jag tror att det är dags för kanske rent av en liten höjning om inte nu så snart är det kanske att vi nu kommer börja se lite mer positiva förändringar. Men det är så klart lätt att ta fel.

Att vinna i presidentvalet

2012-09-15

Av och till har jag fått en allmän känsla av att Vita huset varit veka mot Kina. Samtidigt har flera konkreta situationer indikerat den motsatta riktningen. För de senare har kanske Kina inte alltid reagerat tydligt tillbaka och har möjligen inte rört någon fullt lika stor fråga som valuta-manipuleringen.

Rörande valuta-manipuleringen har President Obama haft viss framgång men korrigeringen av rörelserna motsvarar mycket sannolikt inte en korrekt värdering. Samma fråga är missgynnsam även för Sverige (och också t.ex. Tyskland) - och sannolikt tydligare så - eftersom de produkter vi säljer aktuella för Kina närmare ligger sådana de själva fortfarande är mindre inriktade mot. Valutan för en så pass stor ekonomi bör flyta fritt för att ge långsiktig stabilitet.

Att President-kandidat Mitt Romney markerar frågan väckte tydlig irritation hos Kina och kan p.g.a. det förtjäna en belöning.

Hur kan Mitt Romney vinna presidentvalet? Här presenterar vi ingen fullständig lösning men indikerar ett "koncept-område" ännu dåligt utnyttjat generellt inom marknadsföring såväl som matematik.

En gammal fråga med ganska skilda perspektiv inom forskningen genom åren och där man spontant lätt gör antaganden om verkligheten som ej stämmer med hur människan fungerar rör hur vårt språk påverkar våra värderingar.

Många antar jag vill gärna tro att våra värderingar är ett grundläggande tillstånd hos oss medan språket är mindre styrande och påverkande på det mer uttryckande våra värderingar. Om så är fallet ska hur vi ställer oss till konkreta frågor där ställsningstagandena är beroende av värderingar påverkas av om vi växlar språk. Emellertid är det precis vad dom gör.

Även om situationen att man byter språk man läser och talar i ett test (ex. mellan engelska och arabiska eller engelska och spanska från forskningen) är svårare att direkt mappa till presidentvalet understryker den vikten av att direkt verbalt uttrycka likhet och få väljarna att uttrycka likhet.

Det första d.v.s. att utttrycka likhet är värderat uppmärksammat av sedan många år inom det mesta relaterat marknadsföring och mycket utnyttjat. Att få kunder eller väljare att uttrycka likhet är ej utnyttjat. Vi tenderar genom hur vi trott oss förstå hur värderingar fungerar att underskatta värdet av relativt begränsad förändring mot ökad likhet.

För Mitt Romney är en "enkel" väg för att utnyttja detta som väl stämmer med temat för dennes presidentkampanj området ekonomi. Mitt Romney bör introducera ett språk som inkluderar ekonomiska termer vars komplexitet inte är hög eller svårbegripliga men som väl uttrycker en skillnad i discrimination area mening mot President Obama samtidigt som goda möjligheter finns för att media både orienterade mer för Romney och viktare mer för Obama tar upp och utnyttjar dessa termer i samband med att frågorna diskuteras.

En praktisk möjlighet är att utnyttja sådana termer i samband med att större ekonomiska frågor diskuteras. Begrepp associerade direkt på större ekonomiska frågor är troligare vad som redan används i det politiska språket medan det för konkreta lösningar finns stort utrymme utan att öka komplexiteten för att ta in budskapet.

Mitt Romney genom att han har en framgångsrik karriär bakom sig relaterat ekonomisk utveckling - eller varför inte att skapa ekonomisk tillväxt - kommer dessutom med potentiell trovärdighet via vad vi kan kalla uppfattad category / stereotypic co-occurance. Varande en person associerad ekonomi är det inte ett mer naturligt språk i gradvis mening än kanske andra frågor. Dessutom är dennes reward association framgången inom ekonomisk företagstillväxt medan det för President Obama är USA:s misslyckande att få ordningen på landets ekonomi och statsfinanserna. Varje ekonomiskt begrepp tydligt Mitt Romney's språk som tas upp i den debatten är många fler röster för denne på valdagen.

Argumentera: Åsikternas Motiv (Ex. SVT-arbetsmarknad attraherar DN-skribenter)

2012-09-13

Varande väldigt öppen för möjligheten att varför svenska romaner mycket oftare sålt väldigt bra utomlands efter att litteratur-stipendie-subkulturen minskat sista åren är en jämförbar förklaring till varför svenska medier, filmproduktion m.m. både säljer dåligt utomlands och är relativt mindre efterfrågat i Sverige kan det vara spännande att spekulera varför DN:s krönikörer är så attraherade av att juridiskt tydliggöra tvångsbeskattningen för att finansiera ett monopol.

Jag har ingen vetskap av vilka faktorer som spelar in generellt och har överhuvudtaget inte läst någon attityd-undersökning eller liknande studie rörande svenska medier från någon aspekt yngre än från slutet av 1990-talet. Inte heller har jag försökt borra skribenterna bakåt i tiden eller brytt mig om att fråga dem. Egentligen tror jag föga på förklaringarna vi ger här men de kan vara intressanta som exempel på ett sätt att argumentera.

En krönikör har stor frihet i hur de kan uttrycka sig. Behovet av att motivera eller stödja är ju naturligt reducerat genom att det så tydligt framgår och vad som är efterfrågat ett personligt perspektiv. Generellt för medier är krönikor troligt mer framgångsrika när skribenterna uppvisar god likhet med läsarna vilket givetvis för Dagens Nyheter med sin åldrade läsekrets kan riskera att skapa en ondcirkel.

Friheten skapar samtidigt goda möjligheter att angripa skribenten. Förutom likhet med det uppfattade egna perspektivet där skribentens åsikter kan komplettera idéer och peka ut nya företeelser gäller bl.a. att folk inte gillar att bli lurade och följdaktligen gärna ser dolda hemskheter eller ekonomiska-motiv som drivkrafter. Vidare ser vi stora pengar associerade till en fråga drar vi villigare generella åsikter i samma domän senast illustrerat (men känt och kvantifierat - och bättre bakåt i tiden - sedan åtminstone 1960-talet där forskning rörande konsumtion och ekonomiskt-beteende allmänt tenderar att ofta upprepa det redan välkända från andra forskningsområden som psykologi) från ett näraliggande område av :

Under the Influence: Reminders of Money Impact Consumer Decision-Making

I domänen pengar har vi en självklar förklaring till DN-krönikörernas SVT-kärlek:

Dagens Nyheter tappar läsare.
För inte länge sedan gick tidningen med förlust.
Deras skribenter är rädda och oroliga inför framtiden. Twitter och internet känns otäckt.
SVT med dess enorma tvångsbeskattning där vi alla ska betala många tusen blir en attraktiv-arbetsmarknad för medier inriktade på en krympande allt äldre befolkningsgrupp.
Genom att uttrycka likhet med åsikter och idéer hos SVT gäller att från välkända generella mänskliga egenheter ökar möjligheten att faktisk distans ex. utifrån var man arbetar reduceras.
DN-krönikörerna har börjat säkra upp en reträtt-post.

En annan grupp av förklaringar ligger närmare jämförbar argumentation omvänt från DN-krönikörerna. Ett ofta återkommande tema mer elegant nu än ex. 2009 är faran och skillnaden i kvalitet mellan ex. DN och nya medier som Twitter m.m. Jag tvivlar verkligen på att sådant tillför värde genom att göra ex. DN mer attraktiv. Vi kan emellertid tänka oss ett systematiskt konspiratoriskt motiv där DN och andra tidningsfolk varit ute och druckit öl på inhyrd lokal och lagt upp en elegantare diskretare mer långsiktig strategi där gynnandet av ett explicit medie-monopol som nödvändigt för att balansera faran med falska Britney Spears konton på Twitter också ska gynna Sveriges större dagstidningar. Kontakterna som i så fall knyts med nyckelpersoner i ex. den hemliga politiska säkerhetstjänsten - numera kanske bolagiserade i några marknadsförings- och PR-konsultbolag snarare än att drivas motsvarande Informationsbyrån - ansvarig för att hålla Sverige i beredskap mot farlig utländsk propaganda via SVT bör som bonus öka chanserna till ett bra jobb på SVT i framtiden.

Givetvis kan vi generellt heller inte utesluta betald propaganda. Ett spännande projekt är att beräkna korrelationen mellan uttryck hos våra svenska tidningar positiva till spelmonopolet och därefter ökad reklam av Svenska spel i de samma. Vem vet hur korrelationen ser ut kring dessa frågor om man tittar bredare än reklam direkt från SVT?

Den troligaste orsaken - kanske den jag tror ligger lite närmare sanningen - har värdet av att reducera "människovärdet" via relativ makt särskilt för just dom grupper där DN som entitet har störst problem d.v.s. där det lönar sig att angripa:

När krönikörerna blir rädda och lite oroliga för Twitter är det just rädslan för det nya alternativt gubb-gnäll.
SVT-kärleken handlar jämförbart om det trygga invanda där uppväxten under en enklare värld tillsammans med ökad ålder gör det svårt att hänga med och själv hämta nyheter ex. från flera utländska tidningar eller välja samman en egen TV-tablå.
P.s.s. en pensionär behöver gå till läkare och få hjälp med att välja rätt läkemedel behöver många äldre hjälp av SVT att välja ut några nöjesprogram, lite nyheter och ibland en gediget tilltagen förenkling av något vetenskapsliknande för en trygg-känsla av att lärt sig något utan att faktiskt behöva anstränga hjärnan.

När det gäller allt sådant här är det kritiska för argumentens kraft de konkreta förekomsterna. Dessa behöver inte vara samma sak vi argumenterar om men de behöver uttrycka vettig likhet. Exemplet med Svenska Spel fungerar utmärkt bättre exemplifierat. Det är ett öppet exempel målgrupp själva kan undersöka vilket gör dem mindre skeptiska. Givetvis kan vi också - även lögnaktigt även om jag inte rekommenderar det - påstå oss suttit ex. fläkten och lyssnat av ett hemligt strategi-möte men varande tämligen ovanligt att någon gör det samtidigt som det hemliga strategi-mötet i sig är uppfattat ovanligt reducerar det troligt argumentens trovärdighet utan bra dokumentation (där halvtaskiga bilder jfr de "av kungen" nyligen inte lurar någon annan än redaktörer hos Aftonbladet m.fl. tidningar som vill sälja lösnummer).

Hur effektiv är tekniken vi gav exempel på här? Hygglig. Den ger effekt huvudsakligt på målgrupper och personer som redan har ett negativt bias. Generellt mer allmänt värde kan uppnås når argumenten om de håller god kvalitet upprepas och återanvänds av andra. Söker vi effekt är det självklart positivt även om det presenteras som egna insikter. Det kan i sin tur givet större upprepning med också större "kreativ-bredd" där argumenten associeras med fler kringliggande frågor, händelser, exempel o.s.v. ge påtaglig effekt över en lite längre tid.

Strategin att skapa bra argument med målsättning att de ska tas upp upplever jag som mer sällan använt. Det fodrar också en långsiktighet i strategi och inte minst mycket goda kunskaper inom många områden. Strategin är dock oerhört effektiv i de längre tidsperspektiven och är när vi lämnar marketing av idéer och riktad information från perspektivet här grundprincip i den långsiktiga politisk argumentation (jfr blockpolitiken) där Moderaterna sedan några år presterar bra medan Socialdemokraterna är "mindre" bra inte minst i kontrast under Statsminister Palmes tid.

Sökmotorer: Bedömning relevans och likhet mellan koncept och människor II

2012-09-07

Denna presentation är utdrag av minnesanteckningar inför större artikelserie Nyfikenvital.org rörande metod och verktyg för att bedömma effekten av reklam.

Här publicerade förkortat utan djupare diskussion för att givet att man läst blogg-inlägg få en förenklad kompletterande illustration av vad likhet är:

Sökmotorer: Bedömning relevans och likhet mellan koncept och människor

Presentationen som PDF via Google Docs:

Likhet: Tid, Rum, Sannolikhet och Kunskap

Nedan från och med slide tre som bilder. Klicka på en av bilderna för att se den förstorat och enkelt bläddra till övriga.

Sökmotorer: Bedömning relevans och likhet mellan koncept och människor

2012-09-06

För att fortsätta Sökmotorer: Att idag bygga ranking och index via länkar kan det vara intressant att kort diskutera relevans och similarity (likhet) utifrån relation mellan koncept (ex. uttryckt via länkar).

En utmaning delvis diskuterad i förra inlägget är att detektera manipulerade relationer. Kan vi uttrycka förväntad likhet givet ett sammanhang och kontext försvinner självklart problemet. Begränsningen av den lösningen är att det inte är rimligt att anta att relationer i ett givet kontext är oföränderliga över tiden men möjligheter finns ändå.

Vi kan först konstatera att för den större grupp av grafer detta handlar om kommer relationer tendera att:

Att vara fler relativt antal koncept när likheten är större.
I ett sådant kluster kommer en del koncept också ha relationer som går längre bort.
Ett ex. kan vara ett ganska avgränsat kunskapsområde t.ex. nationalekonomi, kemi eller lingivistik.
Koncept i dessa områden kommer tendera att ha fler relationer till andra koncept som räknas till dessa.
En del koncept ligger dock i flera kunskapsområden och har länkar längre ut.

Denna ofta relaterat människans organisation av världen (och hur våra biologiska neuronnät tenderar att självorganisera sig) liksom några av utmaningarna finns bredare sammanfattat i Understanding complexity in the human brain (UCSD men från Philosophical Transaction of The Royal Society A 2011: doi: 10.1098/rsta.2011.0121).

Det potentiella värdet trots risken med att anta statiskt uttryck är att vi kan skatta sannolikheten under oföränderligt antagande för att något som uttrycker en viss likhet med ett eller flera koncept ska uttrycka relationer med ett annat (ex. via en länk).

Vi kan vidare genom att analysera historik skatta sannolikheten för att mer ovanliga relationer givet ett kontext (d.v.s. kunskaps-segment vi uttrycker likhet med, publicist, typ av publicering o.s.v.) är av värde att ta upp mer permanent som värdering. En journal inriktad ex. kemi som uttrycker några nya relationer mellan områden inom kemi och ett annat teknikområde kan tveklöst utan risk värderas relativt hela populationen rörande det. Andra publiceringstyper har troligt mycket mindre varaktigt värde när relationstyperna är mer ovanliga.

Praktiskt från perspektiv från den som söker information på sökmotor är värdet vi söker att sökresultatet givet sökord som med skattad sannolikhet från dessas relationer och kontextuell kunskap om informationssökaren uttrycker det efterfrågade ämnet. Är antagandet att helt eller väsentligt styra det från länkar där fler kommer tendera att öka ranking behöver vi relevansfaktorn när vi värderar dessa.

Från skattning av vad informationssökaren avser inses också att vi har ett till (lika grovt uppdelat) similarity koncept att ta hänsyn till. Denne kommer vara givet realiserat kontext vara mer eller mindre benägen att önska nytt eller bekräftande relativt sig själv. För det senare fallet gäller att identifiera similarity mellan rekommenderande relationer och denne där det kanske väger högre än faktisk trolighet i kunskapsdomänen. D.v.s. relationen mellan grönt morgonljus och sjukhusbyggnad kan givet informationssökare av tänkt typ "fotograf - konstnär" vara högst relevant som väldigt ovanligt eller vanligt i kontext av bilder som uttrycker något.

Vi inser att detta kommer ner till egentligen samma problemområde som i det första fallet genom att det enda informationssökaren uttrycker (givet endast sökord) är en grupp koncept ev. tillsammans med ord som rangordnar, indikerar deras relativa påverkan, tilldelar känslomässig karaktär o.s.v. D.v.s. söker jag på Företag i Uganda som förhatligt avverkar regnskog. Har vi en typ av entitet i resp. "ansluten" mängden företag och Uganda som avverkar regnskog där avverkar regnskog i sig är vad vi identifierar o.s.v.

Den känslomässiga karaktären "förhatligt" kan självklart ofta vara "underförstådd" eller vad som för bättre sökresultat behöver skattas från kunskap byggd under längre tid (ex. signal-respons på tidigare sökresultat). Detta är också vad likhet med (givet något antagande rörande bekräftande relativt nytt d.v.s. lämpligt entropi-uttryckt) den eller det som faktiskt "rekommenderat" utanför uppenbart "kunskapsområde" får större betydelse.

Emellertid har människor många intressen, åsikter, värderingar och idéer. Även om en del generella tendenser till grupper av dessa finns både kulturellt och ärftligt relaterade gäller att antalet kombinationer är tämligen stora. Vi kan därför uppleva större tillfredsställelse av att följa rekommendationer av något i ett område medan vi inom ett annat område blir surfa, missnöjda och just här kanske upplever kvalitetsproblem med sökresultaten om vi följer rekommendationer av den samma. Ex. skulle jag vara mindre benägen att bli nöjd med religiösa texter högt på sökresultaten rörande medicinska sjukdomar eller funktionshinder. Ganska stora grupper andra gillar det dock.

Därav att det ungefär kommer ner till samma problem: identifiera ämnesområde, dess relationer och hur "troligt" de känns riktiga och under vilken tidsperiod avseende vilka.

Det här är ett svårt område. Och åtminstone för Google och Bing har man ännu stora svårigheter att ta ut dessa världen. För Google har jag t.ex. konstant under många år aldrig efterfrågat vissa undergrupper av sökresultat men tenderar ändå att få dem trots att de är tämligen enkla att avgränsa kunskapsmässigt via similarity.

Svårigheten att dra nytta handlar praktiskt inte om den teoretiskt primära utmaningen i att särskilja statiskt mot nytt i vår kultur utan om beräkningskapacitet. Jag har en längre artikel planerad som ger en del praktiska metoder tillsammans med förenklade verktyg för att skatta påverkan från huvudsakligen reklam byggd från en förenkling av algoritmerna jag använder för nyhetsanalys. I den gäller att jag mycket mer exakt gör similarity operationer därför att användningen är praktiskt för en person och mängden operationer blir därför tämligen få (medan det för nyhetsanalysen måste vara många magnituder mindre exakt). Det kan ändå på min tämligen nya kontorsdator ta väldigt lång tid för varje jämförelse ej tidigare gjord existerande i cache.

Att jämföra ett koncept med ett annat också utan hänsyn till vad jag kallar egendimensioner i min modell vilka ex. är känslomässig orientering utan endast relationerna mellan koncept gäller mycket förenklat att följande operationer görs:

Identifiera omedelbara relationer för respektive koncept.
Dessa definierar de dimensioner som uttrycker koncepten.
För varje relation gör similarity-1 jämförelse med varje dimension som uttrycker det andra konceptet.
För similarity-1 jämför likhet i omedelbara dimensioner ex. cosinus similarity, jaccard eller jämförbart. Fler dimensioner lika ökar likhet medan fler dimensioner olika indikerar att de är mer olika.
Värdera samman respektive similarity-1 resultat ex. via association till dimensionen via t-test.

Tänker vi oss nu på det att vi inte gör detta som en generell skattning för en större population utan riktat mot en mindre grupp människor skulle vi typiskt manipulera associationen till dimensionerna avseende hur mycket vi värderar dem. Redan operationen ovan är dock mycket krävande därför att:

På de cirka 170 000 koncept en mycket komprimerad version arbetar med.
Finns i genomsnitt ca 65 relationer för varje koncept.
Koncept mer sannolika i språk och mycket troligt mer sannolika sökord tenderar att ha kraftig association till många fler relationer än genomsnitt.
Alla vanliga kunskapsområden, geografiska punkter, länder, kulturområden o.s.v. ligger sällan under 1500-relationer.

Säg att vi jämför två koncept med 2000 relationer där varje omedelbar dimension också har 2000 relationer. För varje similarity-1 gör 2000 * 2000 jämförelser och för ett koncept gör vi 2000 similarity-1. Beroende på algoritm (där vi ovan egentligen gör det från perspektiv av respektive därför respektive koncepts syn på världen styr) behöver vi dessutom göra det två eller fler gånger. Vi har nu 2 * 2000 * 2000 * 2000 jämförelser.

Det vanliga sättet att minska detta problem är genom dimensionsreduktion (för tillämpning diskuterad är det dock ej aktuellt därför att det mer är den generella utgångspunkten att dra nytta av för riktade dimensionsreduktioner applicerat mot ämnesgrupper, nyheter eller annat data relativt olika perspektiv) där LSA är vanlig och troligen ganska väl-använd bland just sökmotorer. Emellertid är den just mindre bra rörande annat än att få ner antalet dimensioner med viss godtagbar rimlighet i underrummet vi projiserar ner mot. Detta därför att projektionen i sig bygger på stickprov som ju uttrycker just en population och därmed om vi i mer avancerade varianter än här normalt använt vill stora mot särskilda individer och givet antagande om värdering av rekommendationer krävs att det sker flera gånger med olika stickprov på data där varje sådan dimensionsreduktion är extremt tidsödande.

LSA liksom cosinus similarity överdrivs väldigt ofta rörande faktiskt värde. Båda algoritmerna tenderar att göra användare överdrivet nöjda därför att de är mycket praktiskt enkla lösningar på problem vi allmänt har oerhört svårt att resonera runt (mång-dimensionella rum). Något som fungerar tenderar därför att bli använt och får snabbt ett bias relativt nytt. Båda har nu funnits ganska länge och för båda gäller att forskning som seriösare (motsvarande doktorsavhandling) jämfört dem annat noterat att vi får större värden av andra algoritmer. Bias till båda är dock också stort i forskningsvärlden.

Jag upptäckte dock nyligen på en dimensionsreducerande algoritm som jag till min förvåning inte träffat på tidigare trots att jag gjorde en ganska stor översikt 2010 (och fastnade för Kohonens självorganiserande kartor för användning som del av en modell) som mycket troligt för samma träningsdata ger sämre resultat än LSA men samtidigt mycket troligt regelmässigt är väldigt mycket snabbare:

An Introduction to Random Indexing (PDF) | Sics.se

Intressant med den just här är att den faktiskt går att tillämpa tämligen enkelt direkt på informationssökare för att över tiden bygga upp deras preferenser och samtidigt bygga kunskap exporterande till mer generella "grupper" av användare eller mellan kunskapsområden. Med modifiering torde knappast heller diskret kraftigare beräkning behövas på data utan kontinuerligt uppdaterade tillstånd också med olika tidsperspektiv blir möjliga.

Vårt diskuterade problem kan i detta fall kanske vara möjligt att reducera med en god approximation till att identifiera likhet till en kombination av olika "typer" av mer intensiva sökmotoranvändare vilka adderat mer data.

Möjligen beroende på vilken kvalitet det ger vad som kan förändra skillnaden i upplevd kvalitet mellan sökmotorerna. Det är upplever jag färre sökmotorer förutom Google som använder den typen av data (åtminstone där det meningsfullt förbättrar sökresultaten).

Relaterat nyligen om sökmotorer

Sökmotorer: Att idag bygga ranking och index via länkar
Microsoft navigerar stabilt på stormande datahav (tack för datat).
Bing! och Microsoft börjar kännas som ett seriöst sök-alternativ data nära

Sökmotorer: Att idag bygga ranking och index via länkar

2012-09-03

Efter Google:s framgång med att använda länkar för index och ranking märkbar för mig sommaren 2009 har genom åren givit oss ett minst sagt stort antal sökmotorer av varierade slag som använder länkar. Mer fascinerande är dom som indexerar länkar som stödföretag till sökmotor-marketing av varierade slag (inte minst SEO) och ett exempel är SEOMoz (jag har inte prövat den själv men troligen ungefär jämförbart med andra med jämförbart antal indexerade sidor).

När det gäller nästan alla jag sett genom åren inriktade på att ranka innehåll för "slutanvändare" har kvaliteten vanligen varit direkt dålig. Det normala tycks dessutom vara att någon "gigantisk" enstaka eller en jämn kontinuerlig kvalitetsförbättring inte kommer på nivå där det i värde rör sig närmare Google.

Orsaken till det kan man diskutera där komplettering med annan statistik förutom länkar inte ska underskattas. Emellertid tror jag vanligen inte att huvudproblemet ligger just där eller bättre uttryckt att lösningarna nått där det är faktorer att börja försöka få ut värde ifrån.

Det finns tror jag en enklare åtgärd att pröva som jag tror kan lösa alla möjliga systematiska problem jag ser (också förekommande hos Bing av och till noterat i samband med Microsoft navigerar stabilt på stormande datahav och Bing! och Microsoft börjar kännas som ett seriöst sök-alternativ data nära). Gissningsvis är åtgärden kanske inte helt lätt för mindre lösningar som behöver prioritera spindlingstid eller har mer begränsad storlek på index men för större långsiktiga lösningar kanske värt att fundera över om inte redan utnyttjat.

När Google började styra index och ranking från Google gav det dem konkurrensfördel därför att särskilt Altavista missbrukades brutalt för porr-spam genom on-site-faktorer.

Länkar missbrukades ännu i väldigt liten utsträckning. "Verksamhetskunskap", "rutiner", "nätverk", investeringar i infrastruktur (gamla hemsidor o.s.v.), auktionstjänster för att handla med länkar o.s.v. var knappt utvecklat.

För den tidiga perioden ges därför en statistik utgångspunkt för att bygga upp features för vad som tycks vara en vettigt normal "länk" i form av kontext på sidan o.s.v. T-test (generellt vad jag själv föredrar tillsammans med en variant av jackard, se också t.ex. From Distributional to Semantic Similarity , mutual information, cosine similarity och andra välkända utgångspunkter för att bygga association runt features får en rimligt ren utgångspunkt att steg för steg definiera onormalt från.

Nya typer av problem som uppstår, möjlighet att lösa befintliga kvalitetsproblem ej beaktade o.s.v. blir dessutom i varje steg enklare vid en tidpunkt efter vår utgångspunkt. När de i rimlig utsträckning "eliminerats" från algoritmer som sprider påverkan vidare är det relativt utgångspunkten en ändå ganska begränsad förändring.

Ska man göra samma sak med början redan för många år sedan nu blir problemet mycket mer komplext.

En "enkel" typ-lösning kanske är möjlig:

Identifiera väsentlig publicerings-typ ex. blogg.
Identifiera de väsentliga övergripande plattformarna.
Värdera tids-förtroende.
För möjlighet att enklare kunna borra djupare och få ett särskilt prioriterat centralt corpus överväg att köpa en sådan väsentlig publiceringstjänst om prisvärd vilket de nog inte sällan är just nu för en aktör motsvarande Bing.
Det "kritiska" för ett sådant djup kanske inte just är att det som datakälla ska ge all information utan tillhanda-hålla trust-värdering t.ex. av tidsstämplar och IP-adresser och från därifrån identifierade vikter och association för features värdera andra liknande tjänster (det skulle inte förvåna mig om den här typen av köp gör mer än köp av konkurrerande sökmotorer).

Givet det går vi bakåt i tiden och skapar år för väldigt länge sedan. där köp inte självklart behöver vara nödvändigt men notera att det inte säkert går så himla snabbt att spindla ner ett par tre år av ex. Wordpress.com.

Värt att peka på är att om man implementerar denna lösning och kontrollerar tillförlitlighetsfaktorer rörande ex. tidsstämplar krävs viss försiktighet. Ex. Blogger.com gick bra att ändra runt förr men det är tror jag nu ändrat för att hindra det.

Om vi avslutningsvis skulle bli lite mer spekulativa och samtidigt mer exakta kan vi se en möjlig grupp av lösningen bestående av:

Similarity mellan koncepts som uttrycks.
Vikter givet association lokalt, globalt o.s.v. enligt vad som tros meningsfullt (ex. en särskild vikt för bloggar på plattformar där datumstämpel ej kan ändras).
Sannolikheten att länken inte följer kvalitetsriktlinjer alt. skadar index givet att den verkar följa en "konceptgrupp" som är normal.

Att uteslutande betrakta osäkerheten är problematiskt genom att emergens måste vara möjligt om index inte ska bli statistiskt alt. alltid försiktigt stegvis föränderligt.
Jag föreställer mig att det ofta för en ambitiös tjänst kommer ner till att i breda gränszoner öka upplösningen och exaktheten i den information vi ser där ett inlärningsförfarande inkluderar människor inte sällan är fallet. Också i allt runt det tror jag att det är mycket svårare att börja från idag snarare än att helt enkelt börja med en försvarlig stor mängd publicerade sidor från 1997 - 2001 för initiala vikter och från det eliminera bort problem samtidigt som man går framåt i tiden.