Geografiskt lokaliserad information för insamling

2010-03-06

När vi diskuterar informations- och underrättelseanalys i mediebranschen via verksamhetssystem är det lätt att se att dokumentation av tidpunkter och position fått och får nya möjligheter via nätet. Det går både lättare att få information om en specifik händelse och upptäcka okända informationsområden associerat till något man i mer grävande journalistik utreder. Vi kan se detta som en fortsättning till tidigare guider i området:

Hur mediekoncerner i underrättelseanalys kan visualisera och navigera geografiska data
Ontologi låter mediekoncerner följa entiteter och deras relationer
Business intelligence

Dagens debatt är väldigt präglad av oro att just aktivitet på nätet ska dokumenteras men inga nya möjligheter förändrar detta oavsett de API:er som nu dyker upp eller ev. stöd tjänsterna i sig har. Det är istället just i kopplingen till den fysiska världen som nya möjligheter kommer och nu för alla. Genom det ges i någon mening också möjlighet för dom som önskar att filtrera vilken information de ger ut genom att "problematiken" framgår.

Foto: Maria Azzurra Mugnai Licens: CC by-sa 3.0
Staty av Prometheus vid Rockefeller Center i USA.

Givetvis blir detta mest använt för kommersiella applikationer där sociala media sajter mer riktat kommer presentera annonser och tjänster mot användarnas behov i ögonblicket. Nya typer av applikationer kommer redan och den utvecklingen ser vi bara början på.

Detta ger dock också intressanta möjligheter för media (och givetvis olika typer av underrättelsetjänster både i demokratiska och icke-demokratiska länder). Någon anledning för media att inte skapa nytta från det finns inte och några möjligheter är:

1. Att skapa en översiktsbild av en plats och tidpunkt utifrån flera datakällor: inköpt satellitbild om lämplig fanns på plats, ev. foton och filmklipp tagna lokalt, vad folk skrivit om platsen för ungefärlig tidpunkt o.s.v.

2. Identifiera personer som befann sig i närheten av en plats vid en viss tid för att ta kontakt med för mer information om vad de kan ha sett.

3. Få okända samband mellan entiteter, platser o.s.v. att framgå. Har t.ex. chefen för vapentillverkare A rest till person B hos myndigheten C i hemmet i samband med pågående upphandling? I så fall kan han givetvis ha fastnat på satellitbild eller blivit fotograferad och upplagd av någon på Flickr. För journalister som bevakar sådant är det alltid värt att söka runt och se vad som dyker upp.

Innehåll

1. Vad andra dokumenterat om en plats
2. Flickr indexerar geografisk position för bilderna
3. Hitta Flickr-bilder via taggar
4. Sök Flickr-bilder utifrån både tid och plats
5. Google går att använda
6. Positioner i Wikipedia och Commons
7. Geotagging i Twitter
8. Geotagging i Google Buzz
9. Dokumentation av aktiviteter mot publiceringsplattformar
10. Opensocial ger standardiserade möjligheter
11. GeoRSS är en enkel och vanlig standard
Appendix A: Resurser för utveckling
Appendix B: Relaterat om informationsanalys

1. Vad andra dokumenterat om en plats

I den takt bilder produceras publikt tillgängliga ökar hela tiden möjligheten att foton finns publicerade för en viss position du är intresserad av. Möjligheter det ger är bland annat:

1. Att hitta illustration för en plats man skriver om.

2. Att hitta redaktionella fakta till ett reportage eller annat. Saker kan särskilt i fotografier dokumentera saker som inte uppenbart är intressant för den som tagit i fotot.

3. Få redaktionella bilder av större händelser där mängder av personer tar bilder av samma välkända fenomen eller händelser t.ex. ett vulkanutbrott eller en byggnad som rasat.

Värden ges idag lättast när behov av åtminstone exakt tidpunkt saknas. Sådant kan ändå vara möjligt att få även om indexering och sökfunktioner både för lokalisering och tid ännu tycks mer begränsade eftersom det kan finnas stämplat eller fås av fotografen.

2. Flickr indexerar geografisk position för bilderna

En webbsajt med möjlighet att identifiera foton från en viss plats är Flickr. Enskilda användare har möjlighet att ställa in om lokalisering ska vara publikt. Om publik går åtminstone urval av bilderna hittas via:

www.flickr.com/map/

Deras egen sökfunktion har idag inget uppenbart stöd för lokalisering men däremot tidpunkt för bilden. En extern söktjänst som troligt använder de funktioner för geografisk sökning Flickrs API:er har är den nedan (saknar egen erfarenhet av den):

flyr.whatfettle.com

3. Hitta Flickr-bilder via taggar

Taggar är de ord användaren kan ange för bilden när de laddas upp. Det är inte alls alla som använder dessa vilket gör att av kameran automatiskt tillagd position ger stort värde förutom högre upplösning. Taggarna hittas via:

www.flickr.com/photos/tags/

De kan också sökas direkt med följande anpassade sökmotor jag gjorde med Google Custom Search Engine:

Loading

4. Sök Flickr-bilder utifrån både tid och plats

Sökfunktionen Flickr har ger möjlighet att ställa in tidpunkter för att begränsa sökningen. Även om den direkt saknar möjlighet att separat ange en exakt geografisk position bör det ofta lika bra gå att hitta bilder för en plats via de vanliga sökorden.

Om platsen är sådan folk mer troligt anger som tagg är chansen god att den hittas. Till exempel är det mycket troligare att Sverige och Uppsala är taggar än en gatuadress. Ändå behöver för många platser mängden av bilder bli enorm när en begränsad tidsrymd söks (snarast är nog chansen ganska låg). Dessutom är det givetvis möjligt att sökfunktionen använder geotagging från bilderna även om det inte framgår.

5. Google går att använda

Trots att det går att hitta mängder med sajter med någon form av stöd för olika standarder där lokalisering angivits känns allt ännu omoget. Jag tror också att allmän webb- och bildsökning med Google fortfarande är vad som ofta ger de bästa resultaten när annat än väldigt specifik information söks (i vilket fall en mängd datakällor och sökfunktioner lär krävas). Det är dessutom inte direkt otroligt att Google bildsökning redan använder information i bilderna om lokalisering. Trots allt kan vi se att bildsökningen redan börjat arbeta med annan bildanalys som är betydligt mer krävande i servertid.

Google ger dessutom möjlighet att explicit ange plats och tid i webbsökningen:

Det är mest intressant genom att det visar att ett pågående utvecklingsarbete sker där området är prioriterat.

www.google.com
images.google.com

Vilka datakällor Google använder eller planerar att införa stöd för är antagligen inte publikt dokumenterat men det verkar sannolikt att alla meta-information kan finnas förr eller senare kommer stödjas för bilder om så inte redan är fallet.

För hemsidor är mikroformat en standard jag bedömer som mer troligt är vad Google allmänt kommer stödja givet att det är den de redan börjat införa stöd för bl.a. för anpassade sökfunktioner, att ange adress associerat till ett namn m.m. En bra gissning är därför att den nuvarande funktionen bygger just på mikroformat:

microformats.org/wiki/geo

6. Positioner i Wikipedia och Commons

Wikipedia har projekt runt geotagging. Även om jag inte försökt följa upp kvaliteten på dessa är geografisk position något jag kan tro många som lägger tid i projekten inte sällan upplever som viktigt.

Geotagging - Wikipedia
Commons Gecoding

7. Geotagging i Twitter

Twitter har ett enormt stort antal användare. Oavsett antalet läsare en ström har är faktiskt antal tweets någon egentligen läser mycket lägre än vad som produceras. För att söka information om en särskild plats i tiden kan de dock ha även långsiktigt värde. Twitter stödjer numera också geotagging:

"Your exact location will be stored with your Tweets, and your exact location or place information may be publicly displayed based on your application settings.

Once you post your location, it’s public. Even if you delete it later, it can remain in third-party applications or other external sources, like search results.

Turning off the Tweet With Your Location feature will opt-out your account from future location sharing, but doesn't remove historical data. You can remove all your location data from your Tweets in your account settings (the How to Tweet With Your Location help page has instructions to do this)."

Från: About Tweet With Your Location

Bättre information om Twitters möjligheter till geotagging finns i dokumentationen till deras API:

Geotagging API Best Practices

En funktion det är lätt att se kommer (eller troligen har) skapa ett antal applikationer och widgets är denna:

"geocode: Optional. Returns tweets by users located within a given radius of the given latitude/longitude. The location is preferentially taking from the Geotagging [ remove highlighting ] API, but will fall back to their Twitter profile. The parameter value is specified by 'latitide,longitude,radius', where radius units must be specified as either "mi" (miles) or "km" (kilometers). Note that you cannot use the near operator via the API to geocode arbitrary locations; however you can use this geocode parameter to search near geocodes directly. Example: http://search.twitter.com/search.atom?geocode=40.757929%2C-73.985506%2C25km"

Twitter Search API Method: search

Foto: Tetsumo Licens: CC by 2.0

Jag ser t.ex. möjlighet till dating funktioner vilket tveklöst är ett område där sociala media har outnyttjat för intäkter. Jämför med vad jag föreslog i:

Google borde ha funktioner för dating

8. Geotagging i Google Buzz

Även Google Buzz stödjer automatisk geotagging:

"When you post a buzz from your phone, your location is attached by default. Your current location is the best available street address that we have for you."

Från: Google Mobile - Tag or hide your location

Det stödet finns och säkert införas rörande andra tjänster och produkter som integrerar med mobilen.

9. Dokumentation av aktiviteter mot publiceringsplattformar

Samlat kan vi se att foto och filmklipp skapar en mer oberoende dokumentation av en plats vid en viss tidpunkt. Vad som skrivs i bloggar, tweets, buzz m.m. är en tolkning av det i text. Idéer om mer standardiserad dokumentation av aktiviteter finns också och stöds av de större aktörerna inom sociala media. Till exempel om jag gör ett visst filmklipp på Youtube till en favorit publiceras det som en Buzz och det är resultatet av denna möjlighet.

Även om det rör aktivitet i användandet och integrationen mot socialt media ger det en till dimension att betrakta den dokumentation som förs upp på sajten. Det dokumenterar själva användandet av mediet där publicering sker. Det inkluderar exempelvis tidpunkt:

"The time at which an activity occurred is represented in the atom:published element within each activity entry. An activity entry MUST have exactly one atom:published element.

The time stored herein is the time that the activity occurred, not the time that the associated activity object was published. Feed processors MAY use this element to sort a list of activity entries into chronological order."

Från: Atom Activity Extensions (Draft) - 4.2. Time of the Activity

Därigenom ges implicit bl.a. kompletterande information till dokumentation i form av bilder m.m. som förs upp. Det finns också åtminstone i en del av plattformarna redan stöd för att direkt associera det till lokalisering t.ex. Myspace:

"Include the flag geo to get the geo coordinates for the actor or the activity using http://www.georss.org/georss"

Från: ActivityStreams Public - Geo

Läs mer om möjligheterna i:

YouTube and 18 more new partners make it easy to share with friends on Windows Live (Windows Live blog)

10. Opensocial ger standardiserade möjligheter

Arbetet med Opensocial inleddes av Myspace och Google och är ett elegant exempel på hur en gemensam insats där standardiserade funktioner skapar kostnadseffektiva möjligheter till applikationer både för större aktörer som dessa och därifrån ett otal andra. Idag används och stöds Opensocial av mängder av tjänster. Några av de sociala medier som stödjer Opensocial inkluderar (Opensocial.org):

IGoogle
Myspace
Friendster
Netlog
LinkedIn
Orkut
Yahoo!
Friendster
GoogleFriendConnect

Ännu fler hittas via:

Containers (opensocial.org)

I någon mening kan vi idag se webben som ha två väsentliga delar. Den engelskspråkiga respektive den kinesiska. Förvisso är en del andra språkområden inte helt små men ändå är dessa de två karakteristiska delarna i storlek, språk och representation av språk och faktiskt även viss "fysisk separering". Opensocial.org stöds emellertid även tycks det av en del kinesiska sociala medier:

Resources for migration to Chinese containers (Opensocial.org)

Intressanta resurser för detta på Opensocial.org:

Writing Social Web Apps for Mobile - Where You At? and Geo-encoded Status Updates
Opensocial.Person
Opensocial.Album

Det verkar troligt att standarden med tiden bör utvecklas och ge bättre möjligheter liksom bli mer tydliggjord.

11. GeoRSS är en enkel och vanlig standard

Allmänt verkar GeoRSS var en standard för att ange lokalisering i strömmar som blir vanligast:

Georss.org

Några av alla som använder den standarden framgår av bloggen (och inkluderar självklart flera av föregående diskuterade):

georss.org/blog/

Appendix A: Resurser för utveckling

Den intresserad av att bygga applikationer i området kan t.ex. starta med följande sidor.

API för Flickr finns dokumenterad här:

www.flickr.com/services/api/

Möjligheterna i Twitters API är dokumenterad i:

apiwiki.twitter.com

Den ännu väldigt begränsade dokumentationen av Google Buzz API:

code.google.com/apis/buzz/documentation/

Myspace developer platform:

wiki.developer.myspace.com

Appendix B: Relaterat om informationsanalys

Nu skrivs det väldigt lite med mer praktisk information i det här området som inte är väldigt teoretisk eller komplicerad. Jag nöjde mig därför vad jag själv skrivit i urval:

Att se olämpligt rapporterande i nutid inringade av historien
Tidsanalys i grävande journalistik
Att mäta nuhet via Google
Illustrera med foto, filmklipp, kartor, teckningar m.m.
Perceptio - Hedonimeter
Datacentrisk säkerhetsarkitektur och Keynote
Följ satelliter på en karta