Vi fortsätter Metaforer med Wordnet? Nja med ett besläktat problem med exempel på en igår eller idag publicerad artikel med ett "nytt" mått på similarity där vi har ett bra exempel på just hur lätt det är att skapa om världen när vi försöker definiera den i ontologier:
Från: SIMILARITY MEASURE AND SIMULATION OF CONCEPUAL SIMILARITY
Att vi kan definiera avstånd och likhet i typ av relationer bygger på att ontologin med ett givet perspektiv på världen existerar. Vi förstår begränsningen från följande samhällsviktiga perspektiv vi kan ta just på organisationen av ett universitet:
- Perspektivet från statliga aktörer som finansierar undervisning och forskning. I Sverige är dessa verksamhetsystem ej oväntat mycket styrt av värde per "head-count" (särskilt för studenter) resp. i vissa forskningsområden också verktyg som ibland kan vara detekterbara i budget (ex. medicinsk-forskning).
- Från perspektiv studenter handlar mycket om undervisningen och personerna man möter där resp. stöd kring finansiering, studievägledare m.m. D.v.s. är vi intresserade av att studera effektiviteten undervisningen eller skatta påverkan av kulturella informationsutbyten mellan studenter resp. studenter med personal är andra perspektiv intressantare. o.s.v.
När vi sätter oss och försöker rationalisera ett område organisatoriskt generiskt har vi människor oerhört lätt för att skapa något vi just då tycker känns mycket rationellt. Och det är faktiskt en fungerande strategi under förutsättning att tillämpningen ligger nära vad som är naturlig för oss (eller som vi gjort noggranna kravspecifikationer för).
Den större utmaningen idag för organisation av data och verksamheter är dock snarast att klara att uttrycka flexibilitet i hur olika områden samverkar flexibelt utan att definiera fast sig i en lösning som kostar onödigt att förändra när forskning, kunder, leverantörer o.s.v. visar att världen ändrats och att verksamheten med den behöver följa med.
Faktiskt gäller upplever jag starkt från flera organisationer jag tror är ganska vanliga att hårt definierade verksamhetssystem, ontologier, taxonomier, standarder m.m. som ej medvetet skapades med prioritet på att klara förändring att man förutom problem med världens utveckling kan helt missa att se förändringen i tid för att klara vettigt energieffektiv anpassning. Det kan kosta många medarbetare arbetet och reducera ägarnas förmögenhet.
Särskilt stor är den risken om vad man uttrycker faktiskt varit framgångsrikt oavsett om orsaken trovärdigt har något att göra med vad ontologin uttrycker och än mindre med hänsyn av beroenden förändrade faktorer. Nokias snabba fall är ett exempel. Nokia var signifikant framgångsrikt och kom allt mer att försöka definiera vad världen var snarare än att världen upplevde att Nokia definierade världen. Utan att varken uttrycka något nytt man övertygade kunderna de behövde eller uttryckte nytt kunderna började använda tycks de första motåtgärderna när väl förändringen insågs ha varit intensivare definierade och inte bara relaterat produkter, standarder m.m. direkt utan också i företagsaffärer definierande värdereduktion, antal m.m. lite som att försöka förklara något man tror att kunderna inte sett (eller så hade dom handlat korrekt). Ungefär som Katolska kyrkan under medeltiden som sökte definiera och sedan frysa världens kunskap i ett tillstånd man menade var det riktiga.
Illustration "lånad" från: The furrow illusion: Peripheral motion becomes aligned with stationary contours.
I illustrationen får den i form konstanta cirkeln en falsk riktning skapad av den konstanta bakgrunden.
Vår visuella perception ger oss många tydliga exempel på hur inlärt dagligen repeterade fenomen i illusioner ofta vägrar att släppa när något bryter mot annars fungerande "komprimeringar" och effektiviseringar. Journal of Vision hör överhuvudtaget till den mest läsvärda i detta område åtminstone när man följer området från mitt perspektiv där det intressanta är att få nya perspektiv på särskilt textanalys (och alltid fascinerande rörliga små illustrationer till varje artikel från första sidan och pagination).
Egentligen vad som gjorde det föreslagna similarity nytt såg jag inte utan jag tyckte det ungefär jämförligt (eller samma) med ganska mycket befintligt. Det i sig är dock ointressant här. Vad som är intressant som fortsättning av Metaforer med Wordnet? Nja är vad det ej klarar av: Att uttrycka likhet och distans mellan koncept vars relationer relativa varandra är vad vi ej har ett givet perspektiv att utgå från. Enklaste två tänkbara exempel på det är:
- Om en sub-graf eller helt ontologi ej är ansluten till den andra är det odefinierat att jämföra koncept i dem.
- När relationerna mellan koncept i grafen ej är del av samma perspektiv / värld /enheter är de heller inte jämförbara.
Vill vi beräkna similarity för givna ontologier med fast-perspektiv kan dock måttet möjligen ha värde (bäst prövar man några stycken och ser vad som fungerar med aktuellt data praktiskt mer utmanande oftast relaterat data som förändrs) liksom de två måtten i första postningen refererade: Semantic Similarity in a Taxonomy: An Information-Based Measure and its Application to Problems of Ambiguity in Natural Language (Resnik) och An Information-Theoretic Definition of Similarity (Lin). Särskilt den senare (Lin) upplever jag har värde: fungerar relativt bra även i den enklare föreslagna direkt formen samtidigt vad som relativt enkelt kan byggas vidare och anpassas utefter samma koncept (inte minst med djupare statistiska relationer för att uttrycka avstånden mellan resp. koncept i identifikationen av vad som ligger på närmaste konceptuella nivå inkluderande som Lin uttrycker algoritmer två koncept relativt hur data från den verkliga världen ser ut just vid tidpunkten ex. kanske en teknisk-lösning bör vara den närmaste övergripande när vissa komponent-priser reduceras). Överhuvudtaget i det här området hör vad publicerat av både Resnik och Lin - och särskilt Lin till det mer läsvärda. Lin rör sig i gränslandet mellan de två sidor vi har diskuterar stabilt i den "thesauriska-världen" men väldigt nära gränszonen relativt de aktuella åren.
För de flesta applikationer av similarity där större praktiska utmaningar finns (och större skillnad i värde av olika algoritmer rörande korrekthet, exakthet och inte minst prestanda också är fallet) handlar det dock om de flexibla perspektiven. D.v.s. vad jag normalt alltid avser när jag använder similarity som begrepp. Ev. tittar vi lite mer på det framöver (eftersom jag just nu nyligen byggt om cache som ska testas igenom för en av de mer viktiga similarity-komponenter jag använder i aktuell plattform).
I väntan på den fortsättningen kan vi reflektera över att oavsett om det handlar om religion, produktval, syn på dödsstraff, klädstil m.m. tenderar vi att ha en preferens mer värdestyrd utan i ögonblicket mycket tankar. Men oavsett det har få personer något problem med att rationalisera sina val med stor noggranhet och om så krävs argumentera för sitt perspektiv (ibland komma tillbaka senare med bättre argument illustrerande fenomenet).
Vi ska dock akta oss för att tro på sådan rationalisering som stabil sanning när vi ger oss på att göra det för populationer av människor från det egna perspektivet. Kommer någon apropå sådana felstrategier ens ihåg vad de "traditionella" telekomföretagens alla standardiserings-projekt runt operativsystem för PDA:er hette (heter)? Symbian minns jag namnet på men det var som mest ganska många fler. Väldigt drivet av att definiera och standardisera några koncept på marknaden som sålde bra snarare än att försöka uttrycka vad köparna egentligen sökte som funktion av vad marknaden erbjöd dem, och möjlighet att flexibelt klara att uttrycka förändring i dom preferenserna.