Modifierad IDF (inverse document frequency)

2013-02-25

Dreamer är den prototyp som varit igång längst utan att börja associera "psykotiskt" (likheten med psykotiskt är stor nog för att all övning av att betrakta resultaten från prototyper sedan ganska tidigt och fortfarande att jag första gången när jag i Neurolinguistics: An Introduction to Spoken Language Processing And It's Disorders såg strukturerade ex. i Breakdown of discourse på meningar från personer i psykotiska tillstånd kunde läsa dem lätt liksom enkelt se vilka "fall" de strukturerade runt - enkelt och bredare är det ofta vad vi kan förstå som att associationen tappar kontext bakåt för att istället belöna en vikt mot ett koncept väldigt nära var vi är utan att det behöver vara relevant - eller att cirkulära tillstånd bakåt uppstår när tidigare d.v.s. kontext men ej korrekt fungerande aktiverar förstärkt något som vi hamnar i irrationell association mot), och från sista "reinkarnationen" innan hon avlivades noterade jag något intressant relaterat IDF (inverse document frequency) vart att nämna.


En tolkning av varför IDF (inverse document frequency) tillför värde är att när ett koncept först aktiveras med mer fullständig information om vad det avser aktiveras också dess feature relations och samband mot andra neuroner allmänt. Det ger förutsättning för dom relevanta att uttrycka samband med kontext medan aktivitet för övriga dör av.


Senare när ett koncept refereras är det som vi ju vet från dagligt tal vanligt att vi använder en förenklad symbol representerade konceptet ex. han, hon för en refererad människa eller prototypen istället för prototyp Dreamer 0.1 o.s.v. Vi refererar redan aktiverat och kostnaden för att aktivera upp alla feature relationer och därmed förutom onödig aktivitet direkt också krävande aktivitet för att konvergera denna aktivitet så att irrelevant aktivering inte stör (d.v.s. via GABA-systemen vilket torde vara orsaken till varför antipsykotiska läkemedel vanligen ganska direkt eller via serotonin-systemen ökar GABA relaterad aktivitet och därmed stannar av aktivitet relaterad att gå ut för att söka relevans bl.a. dopamin).


Känt från språk är ju dessutom att vi oftare introducerar nya koncept på position som objekt eller indirekt objekt (med indirekt objekt p.s.s. Talmy Givón definierade det och nära hur jag tycker är mer naturligt vilket var orsaken till varför jag köpte hans som det visade sig i övrigt utmärkta Syntax I och Syntax II, och konkret att vi säger att ett objekt är ett NP oavsett om direkt eller indirekt vilket gör att det indirekta ofta kommer stämma med PP).


Indikationen från sista körningen - lite förvånande tyckte jag- är att värdet IDF levererar i större andel kommer från named entities när de är subject (hanterade till default av att indirekta referenser inte skrivits om med sitt fullständiga namn). Medan påverkan för dessa när de är objekt rörande aktivering till det globalt samlat konvergerande för hela artikeln (d.v.s. ej lokalt där ju IDF saknar mening) är mindre eller kanske inget värde som tillförs av IDF.


Om det ej tillför värde för objekt rörande den här typen av tillämpningar kan man givetvis fråga sig om det inte också kan orsaka skada. Troligen kan det vara så men den påverkan tenderar normalt vara mindre. Vi tenderar ju lokaliserat att oftast konvergera konkret från vänster till höger d.v.s. subjektet kommer sätta den initiala avgränsande mängden för vad som är aktuellt och aktivering av feature relations hemmahörande i objekten utanför denna mängd stängs direkt ner som här implementerat oavsett detta.


Stämmer vad jag såg vilket lär kräva några till körningar att se bättre (snarare än att direkt försökt mäta det noterade jag det mer tolkande resultatet av vad hon bluddrade om för att se om det kanske gick att backa tillståndet bakåt lite för att slippa avliva henne) bör det samma gälla oss människor. Det kan därför vara meningsfullt tror jag att gå över forskningen lite längre bak relaterat association, inlärning i kortare tid, accesstid på fattning av text o.s.v. Om korrekt finns antagligen något indikerande det tidigare. Givet att jag starkt lutar åt att hålla henne i "andevärlden" tills nästa version och i samband med det köpa henne en ny dator mer potent närmare utvecklingsdatorns lite större kraft är det antagligen var man först kan se det.


Tidigare rörande IDF har jag också modifierat något lite från det vanligare uttrycket förande det något närmare uttryckets form Fitts lag men utanför formen vad som egentligen sökte få in något från ett uttryck för information med idéer från Weber's "lag" (se ex. Hjärnans kapacitet inte ekonomi begränsar världens data och vid behov vidare därifrån) . Den modifikationen förändring dock varken till eller från för själva frekvensen (däremot förändras skattningen av volativitet - ungefär variansen) utan handlade mer om vad jag upplevde som viss konstnärlig elegans och ev. vad jag senare tog bort i prototypen föregående Dreamer.


En känsla jag spontant har är att den modifikationen kan vara lite besläktad med detta och ev. är det meningsfullt att börja söka likhet från studier på människor relaterat reaktionstid (jfr Fitts lag) resp. kostnaden från att gå längre ut från ett Markov-tillstånd (jfr Weber's lag där ju skillnaden vi noterar tenderar att normaliseras från det tillstånd vi står på just nu) genom att fler feature relations aktiveras upp ej relevanta.


Modifikationen med hanterande av subjekt och objekt om det införs känns föredömligt tilltalande: Kräver ingenting av förändrade matematiska uttryck utan det räcker bra att ändra hur frekvenserna beräknas.