Att räkna numeriskt med adverb intensifiers i NP-fraser

2015-03-20

Är praktiskt inte fullt så enkelt man kan förutsätta. Viss utmaning finns först från att det ej finns (jag har ej hittat) relevanta studier på människor. Vidare genom att vi kan se att potential finns från att utnyttja faktiska egenskaper utanför resp. adverb's vikt vilka dock tänkbart har "rest- / implicita- / flummiga- sidoeffekter" (jag kom att ofta kalla det "lingering" som också ska förstås havande en avtagande egenskap som funktion vad vi enklare här kan kalla tid) utanför själva principen.


Vi tänker oss att vi har en vikt existerande per ord med mycket hög kvalitet och för flergram med också god kvalitet med tråkigt nog ej riktigt jämförbara med 1-gram (p.g.a. hur generering skedde där 1-gram fick vikta in extra ursprungliga feedback vikter vilket som sidoverkan gav två skalor utan att jag då insåg det). För adverb räcker dock alltid 1-gram utanför specialistområden som medicin.


Antar vi först att vi ej bestraffar konstruktioner likt:


very very

Är det kanske ett bra första exempel ty meningen är förväntat exakt den samma för resp. very såväl som vikt.


Tar vi nu istället:


very decreasingly

Har vi istället att very har dimension UP indikerande att det pekar på förhöjd aktivitet medan decreasingly istället har dimension DOWN indikerande minskad aktivitet.


Hur konvergerar aktiviteten och till vad? Säg att konvergens först sker per ord vilket ger oss ordets aktivitet.


Är efterföljande ord identiskt för de förenklade menings-dimensioner (UP-DOWN, POSITIVE-NEGATIVE, KNOWN-UNKNOWN) vi nöjer oss att utnyttja kan vi se dem göra en särskild konvergens tillsammans i mening av att de endast viktas samman.


Skiljer sig efterföljande åt tycks vi normalt alltid ha motsvarande ett 2-gram (när betraktade ensamma) motsvarande sista exemplet. Konvergens kommer här (föreslår jag) ske på sista adverb's mening. Förstärkande aktivitet UP verkar vid konvergens på DOWN hos decreasingly.


Vi kan när adjective införs laborera med samma lösning med en slutgiltig konvergens för dessa. Emellertid precis som gränsdragning mellan adjective och noun är tämligen flytande får vi för adjektiv förutsätta att vi inte självklart kan propagera konvergensen framåt till ev. efterföljande adjektiv (lika lite som ev. via mellan-liggande adjektiv). Vad som avses i "känslokall egenskap" (de bruna löven) eller "känslo-nära bias evaluation" (den inkompetenta, flummiga och tråkiga Maria) och emellan det blandas inte perfekt med varandra.


Och vad som avsågs när implicita- och flummiga-utmaningar föreslogs eventuellt existerande är när intensifiers även har kända dimensioner rörande evaluation som positiv och negativ resp. implicit påverkan av ex. UP från very till DOWN i decreasingly. Vi exemplifierar med det sista:


  • Förstärkning av emotionell intensitet från very verkar i princip och huvudsakligen på DOWN för decreasingly.
  • Likväl har en UP egenskap aktiverats och kommer tänkbart ha efterverkande aktivitet från sitt första uttryck därför att nedbrytning ej behöver vara så snabb som färdig när konvergens nästa ord sker (mycket från hur vi tolkar ord i tal visar att så inte är fallet genom att möjlighet att tolka för ord i dess mening från såväl bakomliggande ord som framförvarande ord).
  • Vidare kanske bakomliggande ord avfyrar igen med den lägre toppen - eller igen med först stor topp - för att möjliggöra ev. konvergenser över större avstånd. Det krävs ju för att möjliggöra flera grammatiska mönster föga (om alls) aktuella för NP-fraser men för diverse verb-konstruktioner.

Så inte orimligt får vi dessutom en parallell UP som verkar på lägre nivå. Så har vi nu säg ett adjektiv efterföljande adverb två som innebär en fullständig slut-konvergens innan noun-delarna kommer möjligen båda dessa verka eventuellt praktiskt begränsat av tröskelvärden. Samtidigt anar jag att tröskelvärden huvudsakligen berör om vi alls kan konvergera för adjektiv medan eventuellt verkande såväl svag UP tillsammans med stark DOWN tillsammans nästan oavsett aktivitet kan påverka konvergensen för adjektivet därför att både verkar och når neurongrupper aktuella för konceptet och kan styra vinklarna får vägen till konvergens.


Samma sak (och här kan det börja bli lätt komplicerat) gäller allt vi har i frasen (såväl som generellt även om nu tror jag "rekursiva" steg ex. från en fras motsvarar ett ganska duktigt avstånd reducerande ner lingering svaga aktiviteter som mycket små jämfört med samlad konvergens / samlade konvergenser).


Närheten mellan adjektiv och noun är ej oviktig och faktiskt möjliggörande förenklingar. Epitet som tenderar att få part of speech som noun behandlas (åtminstone för mig för detta) enklast utan nackdel p.s.s. som adjektiv inkluderande exempelvis:


1. Följande ex. där jag normalt (men mer sällan för väldigt långa och varierade komplexa NP-fraser direkt otroliga utanför tester ibland adjektiv) får NNP för Spanish.


[... diverse adverb och adjektiv ...] Spanish woman.

Spanish är en egenskap stabilt associerad med kvinnan vi bredare för epitet allmänt kan ha positiva eller negativa egenskaper associerade till såväl som indikationer om aktivitet upp eller ner. Vet vi ex. att en yrkesroll kommer med regelbundet obligatorisk träning kan vi tänka oss högre UP indikation för en beskriven situation där man springer runt och gör krävande saker (ex. en hinderbana för en soldat).


2. Roller såväl som titlar är ett till exempel på epitet. De skiljer sig inte särskilt i användning från föregående. Exempel kan vara statsminister eller President. Vi inser att viss utmaning finns bl.a. för King eftersom det också är ett namn. Dessbättre (vilket jag inte är säker på att man ska räkna med för alla roll-titlar även om jag ännu inte känner till något undantag):


"The title of a king.

An English and Scottish surname​, originally a nickname for someone who either acted as if he were a king or had worked in the king's household.

(UK, rail transport) King class, a class of steam locomotives used on the GWR.

Även om nickname användningen tänkbart kan ställa till med problem varierat med hur det med kontext kan avvika från antaganden om positiv och negativ.


Komplexitet och Kostnad

Att läsa långa fraser är mer komplext. Att tolka ovanliga udda ord är mer komplext. Sådant kommer med aktivitet i hjärnan men det är ej motsvarande aktivitet som vi laborerat med tidigare.


Görande tolkning av det komplexa kommer med aktivitet divergerande mer när tolkningar söks och alternativa vägar för ett ögonblick öppnas.


Detta expanderar motsvarande tidigare egenskap lingering / flummig / implicit och gör fortsatta tolkningar lite svårare i varje steg därför att det hela tiden är lite mindre tydligt hur konvergensen sker.


Låt oss anta att lingering från allt sådant ej är vad vi låter verka på dimensioner i mening av att vi räknar upp på dimensioner. Jag tror det är rimligt antagande att vi om inte rena skyddsmekanismer från det lär oss att kasta allt som ej konvergerat minst en gång i mening av en efterföljande konvergens.


Kvarstår är att skatta kostnaden för detta och beroende på om vi antar att det trycker ner faktiskt aktivitet (tråkar ner den) hur vi beräknar det.


Säg att om vi konvergerar very bad har endast en eller ett par mycket tydliga toppar att välja mellan. Övriga ev. toppar är små och mycket mindre. Komplexiteten är låg.


Säg nu att vi gått igenom en mycket komplex NP-fras med alla möjliga ovanliga ord och underliga ordningar på adverb och adjektiv. När vi når en slutkonvergens för ett adjektiv eller noun har vi nu en mängd toppar förvisso kanske mindre än den korrekta konvergensen men ej tydligt mindre. Vi behöver kanske rent av stanna upp och "tänka efter" (vad vi kan kanske kan förstå som att lingering aktivitet som givit mindre men ej brutalt mindre toppar hinner minska ner något görande toppar från det tydligare lättare att diskriminera).


Egenskaper hos respektive ord vi kan tänka oss ökar komplexitet är:


  • Antalet dimensioner av sådana typer som är nära besläktade till aktivitet. Kanske just dom tidigare diskuterade.
  • Statistiska egenskaper hos ordet indikerande om det är ovanligt.

Egenskaper gemensamt över föregående ord vi kan tänka oss påverkar komplexitet är:


  • Upparbetat antal dimensioner aktiverade lingering orsakande dispergenser vi kan jämföra med "Festinger-egenskaper" (dissonanser): D.v.s. precis innan vi når vår närmaste slutkonvergens har vi resp. UP och DOWN båda med tämligen stark lingering activity kanske ej särskilt skilda i nivå heller (eller jämförbart för POSITIVE och NEGATIVE, eller KNOWN och UNKNOWN).
  • Att ordningen på orden och valda ord givet övriga valda ord är sådana att de är ovanliga eller mer eller mindre underliga. D.v.s. vad som normalt skattas via NGRAM-modeller. Här kanske - eftersom vi nu redan antaget att vi har en första konvergens för resp. ord snarare än för kombinationer av flera ord vilket givetvis blir mer aktuellt längre fram i frasen för noun ex. för en kombination av förnamn och efternamn - lösningar tagande för varje ord hänsyn till endast det föregående ordet.

Jag vet ej att den indikerande enkla NGRAM-modellen tillför värde om man har bra viktvärden för orden. Är man dock begränsad till sannolikhet för ett kontext tror jag nog att statistik på samförekomsten ordnings-känslig tillför värde. Annars kanske det egentligen inte adderar särskilt mycket därför att den typ av realisering av komplexitet vi normalt kan förvänta annat än åtminstone tämligen (kanske mycket) sällan har mindre att göra med ordningen så mycket som med enskilda ord ovanliga som en väsentlig andel läsare ej kan förväntas direkt rätt ta ut mening av utan en extra kostnad (fallet när de är obegripliga utan att slå-upp orden vet jag inte hur man skattar in kostnaden för).


En lösning för komplexitet (ev. även om den fortsatt visar sig fungerande / lovande kanske inte tillräcklig ensam) är att för varje ord beräkna:


KOSTNAD = ( 1 - WE )

WE är ett mått som i skala och magnituder är ungefär jämförbart med EMI men som ej beräknats från projektioner av emotionella vikter till koncept från kontext de befinner sig i. WE har beräknats av hur vanligt konceptet är i kontext av innehåll av typen titlar, taggar och för forskning eller jämförbart seriösare innehåll än nyheter även abstract samt för nyheter istället för abstract innehåll vi kan jämföra med snippets. Likheten mellan abstract och "snippets" är att de båda är kontextuellt beroende från ett givet övergripande koncept eller en kombination av koncept. För artiklar presenterande forskning övergripande ämne för artikel resp. journalen, medan för snippets de koncept man matade för att extrahera sammanfattningen utifrån (d.v.s. tagande ut och förande samman innehåll relevanta runt dessa koncept). Och från innehåll publicerat med början någon gång under 1500-talet (för artiklar från JSTORE vilket faktiskt går fint att ta ut via deras utpekade lösningar utan behov av särskild access eller att det slutar med - som för ett omtalat fall - att man tar livet av sig efter att JSTORE börjat förfölja en juridiskt och kanske också utanför det). WE är därför i formen för beräkningen lik annan sannolikhetsberoende beräkning men skiljer sig tydligare i kontext och sammanhanget på datat: Och slutberäkning görs genom att skalningen i hur beräkning sker jämförbar med hur entropi beräknas.


För en grupp av adverb intensifiers summerar vi resp. (1 - WE) för att få den samlade komplexiteten. Vi betraktar först en serie bestående av endast ett adverb.


(1 - WE) kommer för detta fall vara mindre än ett. Vi därför om man som jag gör dividerar med summan av komplexiteten för att skala värdet här få en förstärkning istället för reduktion.


Låter vi summan påverka fortlöpande från vad den står på kan man tillåta sig (tänka sig / argumentera) att vi ser något som talar för att detta ej är orimligt:


  • Första och sista ordet i vilken som helst serie av ord eller flergram vi lär oss utantill minns vi lättast.
  • Funktionalitet för att hantera upparbetad "lingering" / störande aktivitet finns troligen.
  • Samtidigt gäller ju att aktivitet spenderad på resp. ord lär påverka den faktiska konvergensen för det. Kanske (mycket troligt tänker jag mig men svårt att veta säkert) del av våra mekanismer för att lära oss resp. förstärka närhet till ord vi innan ej kunde eller som var nästan "borta" från vårt minne.
  • Så för ett ord kan vi gynnas av att ordet är ovanligt. Samtidigt som jag också vill argumentera att vi också har en aktivitets-förstärkning när vi laborerar med emotionell intensitet där ord vanligare gynnas något mot EMI: Emellertid kan det för mig vara delvis hanterat i genereringen av EMI (men jag behöver följa upp hela det området bättre).
  • Medan vi störs av upparbetat ovanligt hos föregående ord.

Önskar man göra detta ännu bättre kan man börja laborera med fler vikter vilka kan indikera andra egenskaper som resulterar i större eller mindre aktivitet föregripande och därför påverkande hur mycket lingering acitivity vi får som stör konvergenserna framför. Här börjar det emellertid bli minst sagt väldigt komplicerat även om det kanske från hur jag beskrivit kanske inte framgår bra.


Resp. kan man försöka förbättra skattning av lingering utifrån risk för spreading activity d.v.s. mer eller mindre att upparbetad lingering orkar tända upp samband och kontext runt omkring sig. Detta är ett koncept när man gör det över stora dimensionsrymder - d.v.s. känner och förstår ett stort antal relationer runt resp. koncept - närmast anmärkningsvärt kraftfullt för att ta ut associativ förståelse av relaterade frågeställningar, möjliga lösningar på problem som man annars svårligen ser (som lösningar inom problemområde A från ett helt annat problemområde), tolkning av upparbetat kontext m.m. Men här ser jag dessa lösningar som riktigt ordentligt dyra jämfört med värdet även när fungerande perfekt. En förenklad föga dyr lösning tänkbar är att utnyttja min BLI-vikt (bluelight intensity) förr diskuterad i andra inlägg. Emellertid är den välfungerande huvudsakligen för koncept som har att göra med kunskapsområden, kultur-områden, geografiska regioner, personer, forskning m.m. medan adjektiv och adverb inte hör till vad som ska förväntas ge stabila BLI värden jämförbara med substantiv eller flergram pekande ut koncept (men har ej tagits bort från Bluelight kuben därför att vissa algoritmer för beräkning av BLI tillåter dem för tänkbart värde som kopplingar mellan koncept besläktade med varandra därför att de delar likhet i adjektiv-rymd: Troligen vad som skärs bort förr eller senare men det är ännu inte klart för mig om de tillför värde därför att det är mycket tidsödande att jämföra resultaten med kostnad av även för reducerad kub i värsta fall många veckor för resp. genering - Att konvergens till BLI värden är entydig med resp. utan dessa kanske pekar på att de gör något ej bara underligt men det är kanske inte en tolkning helt lätt att känna bygger på att man verkligen förstår hur sådan här multidimensionell mång-epok implementerad algoritm egentligen fungerar i detaljer).


Dessbättre finns här faktiskt en hel del forskning på människor som tycks peka på att vi för tolkning av meningar - d.v.s. ännu i snabbt-arbetsminne - ej behöver ta hänsyn till tänkbar lingering activity som ökar upp sin komplexitet via fortsatt över orden spreading activity. Vid resp. ord kan koncept aktiveras upp kort men det är ej att förvänta att dessa aktivering ger tillräcklig lingering för att väsentligt tillsammans med annan lingering av sig själva väcka upp andra koncept. Utnyttjande BLI är därför ej aktuell för mig (vilket tilltalar mig förövrigt därför att BLI ej är på samma skala för adjektiv och adverb med WE och EMI).


Slutligen (här i alla fall) kan man även införa multi-dimensionella paradigm påverkande aktivitet lingering såväl som för resp. konvergens utifrån hur multi-modal konceptet är. Exempelvis om det är tydligt visuellt såväl som ett normalt ord. Eller om det är vad vi nästan helt bara hör och aldrig ser, såväl som knappast läser som ett "vanligt" ord, eller om det som vanligt ord beskriver vad som låter (katten i trädet fräser åt fåglarna medan hunden skäller nere på marken). Det finns resultat i forskning talande för eller mot för ev. effekt. Huvudsakligen som jag vill minnas det (utan att kontrollerat det relaterat detta eller överhuvudtaget näraliggande i tiden) gäller att vad som talar för är föga aktuellt för vad vi här gör algoritmer för att efterlikna. Ej heller jämförbart om det handlar om "motoriska" ord.


Dock som tidigare åtminstone kort indikerat gäller att grova övergripande grupper av typer för adjektiv (och "noun-epitet jag anar normalt alltid är en slutkonvergens som dessa normalt används när också 1-gram) ungefär (jag tror man kan dra ner antalet till ännu grövre grupper) motsvarande de som går att se har preferenser för positionering i frasen är vad som kommer påverka. De ger avslutande konvergenser åtminstone när de växlar från en till en annan resp. går från adjektiv till adverb (medan om vi har två eller flera efter varandra är det eventuellt inte så: Jag har ej experimenterat dessa klara bra men det tycks troligt att vi ej växlar men ändå för att kunna förstå det gör någon form av konvergens p.s.s. som tidigare men ev. med något särskilt för den ändå).


När dessa slutligen propageras till vad frasen pratar om (exempelvis en person eller kanske en djurart) gäller att fler kostnader för komplexitet i all rimlighet är nödvändiga. Om dissonanser uttrycks där en propagering uttrycker något med viss preferens övergripande positivt såväl som negativt (för att ta ett ej gender-politiskt perfekt exempel: Kanske vi ser positivt värde med en kvinna från att hon är vacker men tycker att hon klagar en massa om att behöva laga mat och göra andra "traditionellt kvinnliga" arbetsuppgifter). Om vi nu hade samlat egenskaper uttryckta med tillhörande indikationer som ex. positivt och negativt är det argumenterat ej ett problem men om vi som här propagerar intensitet som indirekt kommer från adverb intensifiers är det när vi också samlat endast vill ha ett mått på intensitet ej självklart att resp. dimension ska adderas eller ens komma utan kostnad på det slutliga uttrycket. Detta är dock en minst sagt komplex fråga som jag tror normalt mycket styrs av hur vi tänker oss använda måttet. Och önskar vi bara efterlikna hjärnan krävs en del mindre säkra antaganden om hur detta fungerar vilka åtminstone till stora delar också tror jag styrs av hur vi antar att aktiviteten ska användas d.v.s. propagerar vidare "uppåt" i hierarki till sammanhang (det kanske ej är aktivitet relevanta att hon lagar mat därför att mannen i exemplet ej antar att hon kommer stanna kvar och laga mat eller ens kommer medverka till att det är möjligt därför att han "vet" att vackra kvinnor aldrig är bra på att laga mat annat än på teve där han tror att fula kvinnor eller manliga kokar hjälper till när kameran inte är på).


Fotnot: Varför är Hans inte alltid lika föredömligt gender-politiskt korrekt numera när han gör exempel?

Svaret är inte så enkelt att jag inte upplevt mig få tillräcklig positiv feedback tillbaka från det ex. via trevliga möten med kvinnor som attraheras av det. Utan faktiskt har det mer med annat att göra (också). Även om nu annan påverkan säkert mer än väl kan kompenseras via reward learning belönande mig när jag är gender-politiskt korrekt.


Jag har börjat så smått förbereda för QA-arbeta och komplettera diverse relaterat stereotyper kring könen vilket möjligen förklarar varför jag nu av och till börjat gå ifrån gender-politiskt korrekta exempel till mer av relaterat kvinnoförtryck eller vad man ska kalla det. Att sådant arbete när det görs mer intensivt för större frågor än dessa (större i mening att de kan vara mer främmande för en: Kvinnligt och manligt har vi ju alla viss erfarenhet av medan andra stereotyp-områden kan vara helt främmande för ens egna kultur) kan tydligt märkas på en och jag tror det samma gäller men mindre märkbart områden mer hemmavana för en. Det demonstrerar indirekt tror jag också hur övergripande kontext i en kultur konkret fortsatt påverkar resp. individ.


Jag märker ex. fortfarande viss påverkan av ett par områden jag gick över noggrant under ett par månader med några timmar per vecka. Propaganda, fördomar m.m. påverkar när man väljer att ta perspektiv från dem och fodrar bäst att vi är medvetna om det. Och det är i särklass det mest osmakliga i allt relaterat detta analyssystem relaterat manuellt arbete runt dess vetande. Även i allt väsentligt perfekt moraliskt såväl som i vetande preferenser man haft får viss störning ibland efter det gjorts: Jag förväntar mig att det ska reduceras helt bort med tiden men det irriterar mig. Också testbart efter att man själv ej märker det för att senare kontrollera för "lingering" påverkan ändå via implicita tester av attityder vilka jag har tror jag tillräcklig generell statistik från studier människor samlat såväl kunskap om för att ta fram (om jag ids). P.s.s. påverkas vi självklart av det urval nyheter vi ser dagligen. Är en mindre grupp problematisk dominerande ex. alla nyheter från de arabiskt dominerande kulturområdena påverkar de oss generellt med bias för hela kulturerna oavsett ev. andra sidor vi ej ser eller märker och det oavsett om vi själva märker det eller inte (att "enkelt" om man kan det visa med samma implicita tester av attityder).