Att skatta emotionell intensitet för adverb och/eller adjektiv från morfologiskt nära relaterat adjektiv och/eller adverb 2

2015-06-08

I en fortsättning (eller möjligen mer början till en) till:



Kan jag konstaterat efter att härlett via olika metoder förslag på om ett adverb antingen följer UP (mer av indikerande ökad intensitet) resp. DOWN (mer av indikerande ökad intensitet) när jag saknar uppgift om det, och därefter gått igenom ett par tusen manuellt för att korrigera eller (undantaget ett särskilt ganska stort typ-fall vi återkommer till) oftare ta bort tveksamma fall att tänkbart kanske bättre skattningsmetod är åtminstone möjlig att föreställa sig för lågfrekventa adverb.


För adverb så lågfrekventa att faktiska mätvärden för mig i mening av emotionell intensitet (eller vilken som helst dimension som jag ej beräkningar pågående för värden tänkta att vara stabila över ej korta tidsperioder) men där ex. (för troligen enklast tänkbara att räkna från) adjektiv morfologiskt och semantiskt relaterat till lågfrekvent adverb existerar med tydliga mätvärden kan man uppleva det som mycket rimligt att vi från det ska kunna beräkna intensiteten för adverb givet att det tycks troligt att människa gör det kognitivt (utanför påverkan från corpus människan möter som barn i hem och skola sämre samplat av mig vilket jag är trygg i faktiskt påverkan för en del fall men långt ifrån - inte ens 10% i all rimlighet från ämne och "komplexitet" - alla).


För NP gäller att adverb ej funktionellt speglar adjektiv direkt i UP / DOWN. Adverb ligger istället med en större andel i UP där den större andelen "kommer från" jämförande med adjektiv-motsvarigheterna:


  • Adjektiv som är uteslutande (inkl. vid manuell kontroll av säg minst 100 st och troligen färre än 400 st korrekt uteslutande) POSITIVE d.v.s. ej dessutom UP eller DOWN.
  • Adjektiv som är DOWN (och korrekt så för samma manuella kontroll i antal resp. adjektiv) och ej UP (ett fåtal - kanske 50 - 200 st adjektiv är resp. UP och DOWN: Förutom uppenbara också hanterande effektivitets-indikationer som "kompakt", "wastefull" vilka kan gå resp. riktning UP och DOWN beroende på hur använda och/eller hur vi analyserande vill se på vad som sägs utifrån behoven).

I sig är ingenting här egentligen förvånande. Adverbens natur i NP har huvudsakligen att göra med att förändra intensitets uttryck för adjektiv utefter vanligen vad som kan hanteras via sammanfattande dimensioner som UP och DOWN eller ibland icke-så resp. för ett försvarligt stort antal som jag har ej vad jag ännu vet om de kan hanteras så eller ska ses ytterst specifika funktionellt (huvudsakligen adverb som har att göra med medicinska ingrepp, sjukdomar, tillstånd i kroppen m.m. även om numera diverse grupper hanteras exempelvis betraktande laterala funktioner i hjärnan som generellt mer UP).


Samtidigt är det uppenbart för mig att jag underskattat mängden adverb som är POSITIVE i adjektiv-form och som specifikt saknats (d.v.s. under körning härletts härifrån vid behov till POSITIVE snarare än UP). Det är också verkligen lätt att förstå deras funktionalitet som använda i faktiskt språk felaktigt om man endast ser dem som ord.


Jag noterade under första försöket att adverb gärna tenderade att (när en IDF-liknande vikt ej multiplicerat med emotionell intensitet) att när trovärdiga mätvärden (i mening att ej få mätvärden från faktiskt språk finns) finns ligga oftare än kanske spontant förväntat högre än för deras adjektiv-motsvarighet. Ännu har jag inte försökt räkna fram värdena igen men det verkar i alla fall inte otroligt att den större mängd adverb i UP som beskrivet här kanske förklarar detta och åtminstone gör det lättare att försöka beräkna värdena rätt. Vi kan tänka oss att kanske indikationen av adverb UP medan adjektiv ej är UP (lämnande dock tillsvidare fallet när adjektiv är DOWN vilka jag verkligen behöver se värdena för innan jag spekulerar om d.v.s. typiskt istället att adjektiv är POSITIVE) indikerar trovärdigt om emotionell intensitet adverb kommer visa sig ligga högre än för adjektiv.


Möjligheten / Begränsningen sådan här beräkning representerar är inte direkt helt avgörande givet den försvarliga mängd koncept en god mängd mätvärden finns för. Samtidigt gäller att antalet (tänkbara) ord mätvärden saknas på i tillräcklig mängd i princip oavsett storlek på corpus använt i antal unika ord (typer om än inte samlad frekvens jämfört med de vi har mätvärden för) är enormt. D.v.s. samlad frekvens för ord mätvärden finns för i tillräcklig mängd dominerar frekvensen samlad för övriga medan antalet ord (i typ-mening d.v.s. räknande "samlad samlad" som ett ord "samlad") tänkbara mätvärden saknas i tillräckligt antal för är enormt stort. Det är därför också tillfredsställande om man precis som människan när hon möter ett ord vi kanske aldrig förr sett men där vi kan förstå dess mening genom att betrakta hur ordet skapats. Exempelvis:


uni - lateral - ly | Kontext = Hjärnan

uni - lateral: Vi betraktar eller opererar på en del av hjärnan del av en lateral struktur där vad betraktat eller som vi opererar på endast är del av den laterala strukturen i mening av att den "andra sidan" som gör det hela lateralt ej betraktas eller opereras på.

Lägger vi nu till en metod-beskrivning (enklast här i form av ett adjektiv) för att operera på hjärnan (jag kommer ej på något så vi kallar det NN) som kan tillämpas effektuellt lateral såväl som icke-lateralt vet vi att det senare gäller begränsande och tydliggörande vad som egentligen menas med metod-beskrivningen.

I exemplet gör jag just detta kognitivt som om jag mött begreppet jag ej är säkert på att jag sett någonsin tidigare. D.v.s. exemplet ovan ska inte alls förstås som en trovärdig beskrivning av vad begreppet avser eller typiskt används för (det kanske typiskt avser något helt annat).


Rörande uni med flera liknande konstruktioner har jag bara använt dem för att ta fram förslag och oavsett dem manuellt satt UP / DOWN m.fl. dimensioner. Min erfarenhet är att för den här typen av kategorisering underliggande mycket man använder många år är de flesta (kanske alla) metoder ganska dåliga introducerande en massa fel som stör på nivåer att man ändå senare får gå in och manuellt hantera fel-klassificeringar så bäst sätter man sig tidigare och kontrollerar dem manuellt innan inkludering från ganska trovärdiga automatiserade klassificeringar.


Kommer jag ihåg är det inte otroligt att jag följer upp när jag igen kontrollerat möjligheterna att räkna fram den emotionella intensiteten för adverb där den mätt saknas.