Culturomics försöker skingra dimman med riktigt mycket data och massor av datorer

2011-09-06
Vad kul att de börjar lossna lite för en del andra i detta spännande område:


Det är vad som bör komma att stimulera insatser och studier i dessa områden jag kan ha konkret användning av. Sedan ett par månader mycket märkbart men redan egentligen tydligt cirka sex till 12 månader nu har värdet jag får från färsk forskning i kognition minskat (fortfarande kom flera av de viktigaste nya studierna sista 12 månaderna). Det ska också bli riktigt kul att läsa mer om Culturomics. Någon annans perspektiv på ett problemområde ger mig alltid mycket och det är en generell möjlighet vi alla har om vi klarar att inte låta personlig-prestige störa våra möjligheter att se värde hos andra kulturer, vetenskaper, branscher eller precis vad som helst i övrigt som kan vara aktuellt i en fråga!

Sedan är jag lätt baffled i analysmängden de behöver göra enligt angivet. Det indikerar om jag spekulerar en aning utan att borrat ner vad de publicerat att modell och metoder är en kombinationa av de mer välkända.

D.v.s. för att ta bin Laden som exempel på en av flera i min modell nytt att man exempelvis också kan sätta sådant som detta och annat välkänt använder relativt i dess utsträckning som koncept i skärningen valence o.s.v. relativt var DoD och DHS ligger i sin bild, hur "kreativa" respektive konservativa, om de drivs kognitivt mycket av risk / danger eller abstract insight (termer ingen exakt definition) som funktion av den transformation mellan information och energi man gör ex. per $.

Sådant kan ju av tämligen gott praktiskt värde leverera även när modell inte klarar att ge en prediktion av vår någon skulle befinna sig i GEO (där man ju kan föreställa sig att om så leder det till insight learning hos diverse att man behöver förändra uttryck som fångas) genom att indikera perspektiv på omvärlden och koncept / metoder att arbeta som kompletterar hur man ser på världen för att upptäcka en mer effektiv väg framåt.

Nu tas ju viktiga grundläggande delar av modellen upp för komplettering där det behövs vilket ej skett med detta än. Det finns emellertid då detta är tämligen grundläggande koncept redan införda under 2009 och 2010 utmärkta lite äldre artiklar som bl.a. rör detta. Den färskaste av dessa är:


Ett tämligen självklart - och menar jag mer sällan än annat för en inarbetad organisation den första självklara vägen - men ändå bra som exempel i hur man kan växla (om så tillsammans med annat) är mellan energieffektivt som kräver nytänkande och nya metoder relativt stora resurskrävande lösningar som arbetar med inarbetade lösningar. Det senare är ju väldigt mycket USA då man är van att röra sig med väldigt stor budget och kanske därför vad som ibland kan tänkas leverera nya idéer att växla. Här ser vi det i big data forskningen där manligt stor energiåtgång driver på stora CPU-nätverk där "minsta fel" i kylningen riskerar att koka personalen levande.


"Using the large shared-memory supercomputer Nautilus, Kalev Leetaru of the University of Illinois in Urbana-Champaign combined three massive news archives totaling more than 100 million articles worldwide to explore the global consciousness of the news media. The complete New York Times from 1945 to 2005, the unclassified edition of Summary of World Broadcasts from 1979 to 2010, and an archive of English-language Google News articles spanning 2006 to 2011 were used to capture a cross-section of the U.S. media spanning half a century and the global media over a quarter-century."

Samtidigt är big data också vad som i analys kan ge stort värde genom att mer exakt i tätare förgreningar kunna vandra olika möjliga vägar vad jag tror är relevant just här framför allt händelser relativt tid, geografi, organisationer m.m. som kan vara korrelerade som funktioner av exempelvis känslor.

Ofta annars men troligt inte här givet vad man redan pekar på i pressmeddelandet är det inte ovanligt att big data egentligen aldrig trots imponerande artiklar i journaler och pressmeddelanden egentligen levererar mer "ny kunskap" än några härligt påkostade diagram med streck mellan koncept, idéer, personer eller dyligt. Sådan Big data forskning blir dock väldigt bra nyheter. Folk gillar dom här "konceptuella" graferna som visar hur saker hör hemma. Man känner att man förstår något man har svårt att uttrycka. Visuell perceptionens konvergens versus vårt språk i text och tal kanske :-)

Två exempel som förklarar de två perspektiven på energiomvandling är också:

  • Att Pensionsmyndigheten höll ett parallell-projekt med två personer som byggde en "backup-lösning" för deras affärssystem inför starten. Det systemet gick live istället för det fullständigt enorma flera hundra konsulter byggde.
  • För att anknyta till USA i big data konceptet jämfört med det energieffektiva: CIA och Säpo.

Själv har jag en dator och givet säkerhetsproblem där jag nu måste ha WARRIOR på en dator separerad från internet år jag använda publika terminaler för surfande. Även om jag har riktigt stora datalager är inte den lösningsrymd man hamnade i direkt något där det minsta ineffektiva i programmering eller från modell till realisering fanns kvar. Från TigerAnt, Tänkande Valpar (ej påbörjad i IT utan mellan modell och IT) och NetRunner som föregående inflygningar mot det verkliga målet i en praktiskt användbar modell skedde finns nada av det ineffektiva kvar. Exempel: XML visst det blev väldigt elegant i hur man uttryckte datastrukturer i TigerAnt. Väldigt trevligt. Men WARRIOR kör CSV-filer som bootstrappas in i minne vid första förfrågan av en data-dimension: Bara relationer mellan väldigt komprimerande koncept är cirka 90 MB. Betraktar man på det social concepts totalt handlar det om många GIG CSV filer :-)

En liknande dimension mycket senare i tiden är det komiska. Där jag just idag promenerande hit - där jag har en liten idellt arbetande fokusgrupp också road av skämt att tacka för ett nytt perspektiv jag missat - fick en insight i hur det kan tänkas gå att använda för denna applikation planerad för application layer ovanpå WARRIOR annars studerad för modell generellt för att förstå vad vi reagerar på i transformation mellan information och energi:


I väntan på att det komiska gås igenom i en artikel kanske denna teckning från en tidigare artikel ger en diskret antydan om möjligheten...


Vad är roligt? Vad är spännande i magi? Vad är omvandligen mellan energi och information i skärningen i det uppfattat verkliga respektive imaginära?