Similarity: GEO, finans och politiska system

2013-08-12

Similarity har vi diskuterat av och till ett otal gånger och också sedan jag var nöjd med min similarity operation några gånger. Wikipedias Semantic similarity tyckte jag vid en ytlig titt tog upp de algoritmer hierarkiskt beroende refererade här (ex. Lin).


Ett inte helt annorlunda område är hur vi organiserar referensinformation, "hårda-typer" vi säger är entydiga snarare än som generellt sundare statistiskt associerade (ex. en plats med ett Geonames id) m.m. och kopplar det till den statistiska världen är ett inte enormt svårt men inte heller direkt trivialt område. Särskilt när misstag tar ganska substansiell tid att korrigera jfr plattform med Wikimedia och Semantic-Wikimedia rörande särskilt properties men också allmänt är föga gjort för att ta in stora mängder data direkt (mer anpassat många personer som gör olika data-inlägg kontinuerligt: och jag vill ogärna börja skriva direkt till databasen själv eller skapa den till eget databas-mellanlager då ett värde jag vill få med ett tjockt-presentationslager är att reducera antal kod-moduler jag själv behöver underhålla).


Ett område rörande hårda-typer är att ett värde av att representera dem unika i en subrymd jfr i ett allmänt typ-system som jag givetvis också gör vilka instansierade entiteter som helst genom utnyttjande ontologier är att vi kan särskilja rum där vi har mycket högre kvalitet på vad som refererar något unikt resp. där motivationen att prioritera datakvalitet är givet mycket högt. Ex. personer, organisationer, geografiska platser, instansierade fordon (ex. ett givet flygplan eller bil), mikroorganismer refererat snarare än enstaka instansierade ex. bakterier av viss typ o.s.v.


Frågeställningarna här i problemområdet ger relaterat similarity en utmärkt liknelse till varför så många av de befintliga similarity operatorerna aldrig orkade i det problemområde som var och är aktuellt här.


Jämför hur vi organiserar världen politiskt. Koncepten med ex. kommuner, landsting, stat, mellan-statligt o.s.v. ger oss vad vi kan skapa enkla hierarkiska typ-system av. Dessa är excellent funktionella t.ex. med Lin's mått för similarity (jag upplevt är lika funktionella praktiska som några andra i segmentet när använt för domäner där de är funktionella).


Men söker vi verklig likhet mellan två saker med ganska olika tilldelade typer falerar de snabbt. Enorma mängder kopplingar mellan dessa i verkligheten finns systemet ej beskriver bl.a. etablerade och bättre beskrivna i domäner som geografi och ekonomiska händelser (ex. handel).


Vill vi följa eller implementera politiskt förändring blir vi helt säkert väldigt stuck om vi endast tittar på den politiska hierakrin. Antagligen behöva t.ex. engagera oss politiskt en väldig massa år eller vid en riktad operation arbeta oss upp steg för steg mellan politiska entiteter del av "samarbets-ontologier" som FN.


Söker vi däremot sambanden mellan entiteterna vi har där så att vi kan utnyttja möjligheter att skapa resonans mellan dem genom gemensamma intressen får vi större möjligheter att agera energieffektivt.


Triviala sanningar ofta repeterade men kanske spontant svårare att organisera ut för att skapa möjligheter som skalar upp i mängd ej bundet kraften hos enskilda personer ex. att personliga kontakter kan skapa affärsmöjligheter vi annars svårare tar upp via marketing och riktad försäljning motsvarar åtminstone delvis möjlighet att kunna se dessa möjligheter utan att behöva logik och system för att analysera och förstå dem i den större domänen (ex. branschen).


Jag tyckte jämförelsen var intressant primärt därför att jag tror det är den i särklass mest konkreta och närmast ett vardagligt språk jag sett för att förklara varför skillnaden praktiskt är så enorm och hur vi så mycket bättre kan ex. uttrycka likheter beskrivande något som komma skall med viss sannolikhet.


Slutligen när jag av och till refererar till kontext motsvarar det här ett vektor-rum beskrivande de domäner (ex. finans) och vilka delar av dessa relevanta för vår situation avseende similarity. Är domänen sten-arter uteslutande är ex. domänen djurarter troligt mindre intressant rent allmänt.


P.s.s. blir motsvarande riktad emergence utan innovation av något nytt vad som till delar är att göra ett system eller oftare kombination av system tagna för givet reducerat i betydelse genom att identifiera samband med kraft vi innan ej ser och realiserar till värde.