Tvetydigt språk när Obamacare, Specialist lexicon och Ontology möts

2013-02-03

Ibland är språket lite tvetydigt och inte helt lätt att avgöra vad som avses. En populär metod för att hantera det är att från träningsdata uttrycka associationer och indirekta associationer till ord och sedan jämföra med aktuellt kontext. Ord med olika betydelsen kan man sedan ha med separata interna-beteckningar. Ett väldigt annorlunda koncept är att titta lite på hur hjärnan gör ex. illustrerat i att också irrelevanta relationer och möjliga meningar aktiveras en kort stund för att konvergera. Om sambandet i sig uttrycker meningen kan vi i bästa fall slippa hela böket med olika meningar associerade. Stor fördelen med det är att mycket annat här och bredare tenderar att inte alltid fungera perfekt. Ett problem område är humor liksom kunskapstunga områden.


Problemet vi kan uppleva i bilden med Google-rankingen av föregående inlägg - Obamacare stärker upp engelskan: Standardiserad i engelska grammatiken och Substantiv har fått en semantisk dimension för sång - med den snarlika meningen och mycket lika stavningen är verkligen mycket mindre än man kan tro. Dels föreligger en språkseparering mot engelskan och vidare uteslutande engelska sökresultat behövde jag dessutom begränsa ner till publicerat sista timmen (eller motsvarande kortare tid). Relaterat medicin brukar Google åtminstone högre upp webb-sökning och Scholar inte ha problem åtminstone för engelska-indexeringen.


Sökresultaten för Obamacare + specialist + ontology (jämför oncology).


Substantiv har fått en semantisk dimension för sång

Här i fortsättning p Obamacare stärker upp engelskan: Standardiserad i engelska grammatiken har vi ett till fint ex. på hur enkelt och tydligt det blir med vanliga engelska namn för det grammatiska istället för lånat från föråldrade språk. Uppenbart en trevlig substantiv-dimension relaterad sång. Någon kognitiv insikt från zebrafinkarna (Musik beväpnar sångfåglar och musiken utvecklas över tiden) kanske.



Utskriften från delar av The Specialist lexikon i en liten påbyggnad med ett antal extra dimensioner förutom mer än substantiv och verb ganska många fler (has money är en kul dimension liksom has publication som jag gillar bättre än has weapon när vi rör oss längre ifrån språket mer direkt liksom fysikens SI-enheter). Saknade dock för plural, singular och en del liknande som jag var nöjd med.


Sverige har pengar som vi kan se. BLUE DIMENSION är förövrigt inte för ontologiska eller andra resonemang relaterat mening utan för att bedöma ungefär vad som är praktiskt görligt relaterat större än ett enskilt verb händelse vilket vid behov är vad man kan titta efter i annat (om vi nu ex. vill veta hur mycket pengar Sverige har men att det har pengar är i sig ofta en bra nog bedömning där ex. inte förluster nödvändigt hindrar vad en entitet kan göra men däremot om de saknar pengar, publikation o.s.v. är det begränsande).



Och dessutom vapen åtminstone i Swedish Air force, och Swedish army. Så vill vi köpa något eller skjuta något så kan vi det. Och åtminstone försvaret kan tänkas göra något varumärkesbyggande med sin maskot.


Obamacare stärker upp engelskan: Standardiserad i engelska grammatiken

Det känns så hemtrevligt svenskt att upptäcka att U.S. National Library of Medicine, National Institutes of Health, inte bara rusar in i Obamacare utan att först grundligt etablerat vad det är och vad det betyder. Här ser vi att men nordisk exakthet börjat i själva den engelska grammatiken redan avspeglat i The Specialist Lexicon (del av Unified Medical Language System® (UMLS®)):



Jag tror nog också de flesta kan hålla med om att det är för det bästa att försöka komma ifrån alla gamla latinska termer. Och åtminstone som här när man för in regeringen i grammatiken finns ju ingen anledning att välja något annat än ett engelskt namn.


Biomedicin och medicin har ju också varit kanske lite före i analys, tolkning och förståelse av språk. Bara för Plosone får vi något över 800 träffar indexerade Google på site:plosone.org+ontology+semantic (just relaterat The Specialist Lexicon finns bl.a. Enhancing Biomedical Text Summarization Using Semantic Relation Extraction från 2011) och i PLOS Computational Biology ca 350 (ex. Assessing Drug Target Association Using Semantic Linked Data).


Delvis givetvis därför att det är ett område som har budget för den typen av forskning och det har snabbt blivit ett redan ganska viktigt närmare den kommersiella forskningen och av allt att döma i snabb tillväxt relaterat organisation och hantering av dom gigantiska informationsmängderna där ständigt ny kunskap publiceras allt snabbare. Problematik att organisera och dra nytta av informationen bromsar i fenomen vi känner igen från alla större organisationer takten relativt investeringarna värde skapas med (inkl. med absolut inte uteslutande allt mer redundant forskning som ej ens behöver vara medvetna om varandra). Illustrerande för det har vi på samma sökord endast en träff i PLOS Medicine (A Research Agenda for Malaria Eradication: Modeling) som ju i publicerad forskning ligger närmare kliniskt medicin än det mer grundläggande och som ligger den kommersiellt gigantiska läkemedelsforskningen.


Emellertid är jag ganska säker på att det befintliga arbete som fanns inte minst i The Specialist Lexicon var viktigare. Vi har ju flera andra områden med högt värde i detta segment utan särskilda tecken på att man dels lättare uppmärksammat värdet genom ett etablerat arbete som runt UMLS, och på det har något trevligt bra organiserat och noggrant att börja med för det grundläggande. Åtminstone i segment kan man också fortfarande se att man nog är lite före också branscher som starkt prioritet området (och närmare sådana segment särskilt sista två åren) som indexering och sökning av internet.


Mycket möjligt kan kunskapen som etableras i dom här segmenten och var ge oss en indikation om var kommersiell tillväxt inom medicin och läkemedel kommer ta större utrymme åren som kommer. Både USA och Tyskland har goda möjligheter genom att ha prioriterat det både bland företag (och i lite olika branscher viket alltid kan tillföra lite extra värde) och universitet såväl som entiteter associerat stat (för Tyskland åtminstone näraliggande det militära).


Ett par (av fler att hitta bakåt i bloggen) skämtteckningar på temat ontologier och information från myndigheter.


Från Att besegra Tyskland: Kunskapsdriven militär-innovation (2012-12-30).



Skatteverket är viktigt för demokrati och ekonomi (2012-08-17) men publicerad tidigare längre tillbaka.


Skämtteckning jag gjorde i samband med att jag skrev om Sveriges och United Kingdsoms samarbete runt open data vilket var samma dag som tågtrafiken stod still p.g.a. snö.


Och Konkret lösning på "the frame problem" öppnar dörren till den rationella världen (2012-12-30).