God Thesaurus för Media

2011-03-30

Thesaurus kan ju översättas med synonymordbok men jag tycker inte att det riktigt uttrycker vad som avses i engelskan- Synonym är dessutom ett för smalt ord där fler likheter används nästan regelmässigt.

För media-entiteter är strukturering av information med en thesaurus vad som åtminstone lika mycket som mer flexibelt satta nyckelord kan ha värde i långsiktig strategi. Vi kan illustrera det med värdet EU:s thesaurus EUROVoc kan skapa:

1. EU är i sig nyhets-skapande både direkt som nyhet och påverkande nästan alla andra internationella frågor i världen och lokalt i Europa för det mesta i övrigt. Deras thesaurus är hur de ser på samlat och är målsättningen att den egna information ska struktureras. Det gäller nu både arbete, databaser m.m. Därmed är den också för media en förenkling i bevakningen av EU.

2. Storleken och bredden på EU gör att den är komplett, resurser med långsiktighet är prioriterat och den känns väldigt kvalitativ. Den kan ge en idé eller i vissa frågor direkt vara utgångspunkten för hur man strukturerar områden för nyheter, fakta m.m. kostnadseffektivt.

Hela strukturen stämmer excellent med särskilt morgon-tidningarna men bör fungera bra även som utgångspunkt för övriga nyhetstidningar. I en del (några är den dock stor i som ekonomiska frågor) mer specialiserade områden är den fortfarande bra att titta på men mer komplettering krävs helt säkert.

3. Vidare harmoniserar ju Europa mer och mer. Det verkar inte otroligt att den åtminstone är en utgångspunkt över tiden för de flesta eller alla EU-länder (vad som är beslutat eller hur det ser ut idag har jag inte tittat på).

För media finns mycket mer man kan göra med dimensioner likt dessa över vad som händer över tiden, i olika ämnen och platser i världen. Det kan indikera samband förenklat mer automatiskt som med vad jag brukar kalla nuhetsnät där samband nu indikeras.

Även ger det en indikation om språk och därmed även vad det är för typ av information. EU motsvarar ju väl en kraftigt samarbetande organisation där de kan följas upp utefter strukturen med god motsvarighet men samma sak går så klart att göra med andra informationskällor som Twitter m.m.

I allmänhet utanför nyhets-media och politik tror jag dock att andra strukturer i allmänhet är mycket bättre. Wikipedias kategorier är ett självklart val givet bredd.

En äldre och mycket smalare är ju Roget's Thesaurus från 1852. Även om strukturen inte är intressant för media är den ett bra exempel på några saker man kan fundera över när man skapar träd över kunskap.

Roget's uttrycker vad jag brukar kalla abstrakta koncept och just här efter den tyska filosofen Leibniz logik. Även om den är gammal är det ett oerhört imponerande verk än idag. Ett sätt att indikera det utanför själva verket är ju att logiken (monader, substanser, relationer o.s.v. även sätt som matematiskt uttryck där det ju kräver viss exakthet som just den tiden var viktig då det ju var då som den moderna vetenskapen föddes där han och Newton är två typiska exempel som står med ett ben i vardera tidsåldern). Leibniz skissade inte var vad han särskilt uppmärksammades förrän säg runt 1900 sett som viktiga tankar.

Nu säljs mycket som kallas Roget's Thesaurus som inte är det. Den igenkänns tryckt på den unika indelningen i koncept med underdelar.

Vi ser huvddelarna nedan (ev. lite olika för en):

Och delarna direkt under:

Dessa kan ha fler underdelar beroende på var vi är upp till två delar ner. Och sedan kommer orden:

Intressant med den är att den illustrerar både risk och möjlighet med enhetliga struktureringar. Denna är skapad väldigt annorlunda från hur en thesaurus, ord eller ordlista vanligen görs. Än idag är den mycket använd.

Att göra ordböcker, ordlistor på samma sätt som normalt idag har visst värde men när det går för långt finns föga värde att ha mer än en därför att de förutom detaljer kring enskilda ord m.m. i princip är det samma. De organiserar informationen likartat och ger därmed var för sig inget utökat värde än att förklara orden. Roget's med en annan struktur ger en alternativ bild av vetande både i språk, filosofi och vetenskap.

När vi organiserar världen med en thesaurus får man inte glömma att vi försöker spegla världen. Oavsett hur eleganta de är blir de inte mer än ett perspektiv.

Det samma gäller statistiskt skapade som Never Ending Language då vi har olika språk i olika situationer där områden vi kan mindre i är vi mindre exakta rörande "nymer" av olika slag i och de flesta av oss kan mindre om de flesta vilket smetar ut språket en aning ungefär som ett medelvärdes-filter på en bild. Båda typerna är viktiga.