Intensitet: Positivt och Negativt i engelskan

2015-05-19

Är vi motiverade tenderar de flesta oftast att också hantera mer problematiska eller tråkiga uppgifter såväl som information. P.s.s. när vi läser eller uttrycker information i språket reducerar bias åt snabbare process av positiva uttryck jämfört med för negativ information när initial motivation (eller om vi så vill "riktad intensitet").


Generellt för de flesta språks information samplingsbar så att säga (jag kan tänka mig att om man tar syriska barns skoluppsatser som corpus ser bias annorlunda ut) har vi därför att vardag som vi definierar vår normalitet (kanske besläktat med hur också svåra handikapp från olyckor m.m. ofta efter en tids anpassning svänger in i psyket till ungefär samma tillfredsställelse i vardagens flesta tidsintervall) ett bias mot positiva uttryck.


En alternativ förklaring till fenomenet (i citatet inte mer eller mindre bred eller djup än den korta intuitiva jag gav för hur fenomenet från ett praktiskt mätperspektiv av språk räcker som funktionell förklaring) mycket tidstypiskt för året det kommer ifrån är:


"For both languages, positive words had much faster processing times than negative words, when these included both peripheral and central (meaning) processing (t = 3.84, p < .001, for English; t=5.94, p < .001, for Chinese). This is consistent with the assumption that meanings of positive and negative words are derived via their associations with "approach" and "avoidance" behaviors, respectively (cf. Hoosain, 1977; Osgood, 1971). When response times for all 60 translation equivalents were compared, Chinese yielded faster times by an average of 140 msec (t =9.74, p < .00(1). That this was due to differences in central meaning processes is evident from the fact that the peripheral times were about the same for the two languages. This pattern of results also suggests that factors such as the motivation of the two groups of subjects or the speeds of pronunciation of the English versus Chinese responses were probably not material."



Från: Processing times for English and Chinese words
Rumjahn Hoosain, Charles E. Osgood.
Perception & Psychophysics, November 1983, Volume 34, Issue 6, pp 573-577

När nu skrämdumparna av emotionella värden var just för adjektiv kan man knappast kultur-historiskt ansvarsfullt citera någon annan: Tråkigt nog försöker mindre seriösa aktörer ta betalt från några hundra upp till ca 1000 kr för ett par upp till fyra sidor som minst - samma pris - för rena sido-publicering. Springer en av våra seriösare journalhus har mycket korrekt för en åldrad forsknings-artikel som denna gjort den fritt tillgänglig. För att uppmuntra alla moraliskt förvirrade publicister som försöker lura på folk sådant rent historisk kuriosa (Taylor & Francis Online - Ex. på det dum-giriga problem-gänget bland journalhusen med typiskt ofog) resp. artiklar fri-köpta av universiteten ger vi Springer ett betyg av 3.75 av 5 [Red. Redan ökad från 3.5 ursprungligen hittande mer bra äldre. /Hans] (mycket högt och högst på många år för denna bransch: 5 är bra och 3 är kvalitetsnivå vi borde kunna kräva: Tycks detta vara vana och ej undantag kan det bli bättre betyg senare för Springer).


D.v.s. man ser det (ganska jämförbart om man mät-praktiskt går från) omvänt: Ett generellt avoidance av det svåra annat än särskilt motiverad gör att vi förutom det praktiska undvikande otrevligt om ej nödvändigt också ogärna använder negativa ord. Dock om faran och risken ej är omedelbar för oss tänker jag att positivt effekt av positiva ord mer konkret relevanta för oss är en förklaring jag tror passar bättre in på mig när jag läser nyheter eller för åren när jag skrev åt media kommersiellt (i dom tekniska tidskrifterna föga emotionella så där uppenbart kanske: Säkerhetsrisker är utmärkta för stort läsarintresse om de är konkreta och verkliga för många motiverande medan mer positiva möjliggörande saker eller intressanta personer delande positiv-erfarenhet annars gav fler e-post).


Praktiskt kan jag dock från mig själv se avoidance när konkret för mig (ordna internet-datorn bättre-fungerande och ej ovettigt öppen som jag lät den vara givet att den satt separerad från alla viktiga datorer) när det är en massa bök. Än lägre tog det någon månad eller två innan det blev av att byta fönsterhanteraren till effektivare såväl som i gränssnitt bättre fungerande för mig LX. En massa Ubuntu och Linux bök läsande på nätet ett antal - tre - fyra kanske - timmar irriterande mig över att det inte bara fungerar.


Så hur skalar vi om från resp. perspektiv under antagande att vi har den första typen? I praktiskt kod använder jag en IDF-besläktad vikt (men ej beräknad från dokument utan snarare gränsskapen runt orden och med viss viktning från sannolikhet i ett delsteg). Emellertid i ett försök att ta ut en särskild vikt för att beskriva hur "konkreta" adjektiv är (ex. bör blue som färg vara mycket konkret medan unfair bör vara föga konkret) prövade jag också att istället använda en Zipf-liknande vikt.


Och som mycket förväntat är den i rank-mening (värden här är ej testade mot balans vilket oavsett IDF eller denna behöver göras när man tar olika vikter som kombineras men så här i toppen är det troligen ungefär som det skulle blivit) helt jämförbarbart. Zipf visar ju också kanske lättare att se likheten mot IDF i granskap runt orden visar även på ett rankförhållande mellan mening och rank: Och se gärna hur man betraktar mening i SUBTLEX (just problemet diskuterat i inlägget jag trodde mig slippa behöva lösa själv fick jag dock lösa själv: Likväl ovanligt gediget arbete när det kommer till lingvistiska vikter och kategoriseringar m.m. på en nivå av insats och motivation ej som sunt förväntat från många andra ämnesområden eller några år bakåt i detta ämne vanligt alls).


Först toppen när sorterad för EMI. Vi ser särskilt tydligt negativa men som vi här tittande med motivation just för det mycket begripligt kraftfulla - några är kanske lite otäcka - koncept.



Kolumn i mitten har i det Zipf-relaterade värdet vilket jag använde halv-fabrikats-värden från SUBTLEX-UK (ett riktat "USA-engelska"). Mycket rekommenderat för enkel ord-statistik: 1-gram.


Sista kolumnen är kombinationen mellan EMI till vänster och det Zipf-relateade måttet. Här eftersom jag endast beräknande prospekterande snarare än för drift-kod multiplicerar jag. Gör vi det närmare skarpare kod eller för återkommande vikter krävs gärna några fler operationer samtidigt som multiplikationen med så decimala värden gärna undviks av prestanda såväl för att reducera minne när vi laddar färdiga vikter (för adjektiv en icke-fråga givet endast beräkning av några tiotusen med för fler-grams-koncept där några miljoner eller fler ligger kostar det redan när databaserna ska byggas i tid det tar såväl som kostande på RAM när man håller troligt efterfrågande värden i minnet).


Nedan sortering vi nu efter sista kolumnen. D.v.s. vi sorterar fallande för värden som nu är funktion både av den genuina emotionella intensiteten såväl som det statistiska uttryck som ger en skattning av samma natur hos oss som ger positivt bias i engelskan (såväl som kinesiskan och sägs det många fler språk).



När jag som normalt istället använder min IDF som har mer av ursprung från ett corpus starkt i forskning är vi fortfarande tydligt i positivt men med den märkbara skillnaden att just positiva adjektiv man kanske kan uppleva som lite "gulliga" åker ner för märkbart fler "seriöst positiva" termer. Men alla positiva ord vi naturligt upplever som vanliga hamnar högt: Bias för dem finns där såväl som i det "berättande corpus" prioriterat (subscript från film var idén de byggde från vilket är tror jag ordentligt praktiskt enklare såväl lika sunt när vi önskar bedöma alla normala nyhetshändelser om än inte mer kunskapstungt språk).


Rörande EMI och vad den uttrycker kan sägas att den är ytterst indirekt beskrivande av inte minst nyhetshändelser som beskrivna i media. Vad vi kan kalla en projektion görs från resp. nyhets indikativa innehåll uttryckande polaritet och förs till centrala termer via dimensions-reduktioner individuella för resp. stycke (från det jag kallar DESCRIBE till vad jag kallar DO).


Att ex. bomb och war (och tror jag att bloody kom högt kanske med som jag tog skärmdumpar) kommer högt är därför ett uttryckt för intensiteten de uttrycks med.


Värdet av denna metod är att man kan följa förändring för koncepten (de vi gör projektion till). Vidare räkna framåt med dessa värden prospekterande framtiden antagande från olika perspektiv att värdena nu gäller och se vilken effekt det har (och mycket tillförlitligt ej längre in i tiden) att använda dessa värden som vedertagen verklighet för en tänkt framtida tidsenhet (ex. nästa dag eller om man samplar hårdare kommande halvdag: En dag är dock ganska lagom med medias rapport-hastighet) antagande att intensiteten d.v.s. hur uttryckta koncepten sedan är följer den förändring vi sett under den närastående pågående nyhetshändelsen (eller för något nytt som ej ännu enkelt särskiljs tydligt istället mer kostsamt skattande ut alla koncept vidare från enkel vinkel när nyhetshändelser bättre förstådda ej finns eller dom när existerande: Vilket för ett par miljoner koncept tar många timmar på en ej överdrivet kraftfull dator - På min äldsta levande dator jag har för internet nu kanske sju år gammal tog det med snabbare algoritm än nu och endast 100 - 120 000 koncept cirka längre tid än det tog innan nästa dags nyheter fanns att sampla och mäta men en tre år gammal dator tar det på fyra fem timmar). För kända nyhetshändelser om ej enorm komplexitet i vetande och associationer på stora avstånd efterfrågas tar det upp till 20 - 60 minuter.


För en ny skattad ex. dag tar vi nu de nya skattade värdena och räknar fritt vidare med för en ny dag. Ju längre tid vi gör det desto instabilare blir prediktionen av framtiden. En del särskilda underligheter kan förutom att man börjar avvika växande från framtiden som den visar sig vara kan också uppstå när nätet av koncept får associera mer kreativt för att försöka ta fram mer konkreta nyhetshändelser snarare än följa förändringar av befintliga: D.v.s ex- entiteter (kanske ett land eller organisation eller ett verktyg eller metod) som lite oväntat ej tidigare uttryckta i nyhetshändelsen engagerar sig eller engageras. Ett problematisk uttryck här var särskilt för att nätet kunde börja bli psykotiskt d.v.s. tänkande ej sunt kreativt utan just psykotiskt. Adderande man på emotionella preferenser för att roa sig och söka lösning på det kunde det ytterst talande bli exempelvis uppvisa irrationell paranoia när sökande risk och problem runt händelser. Det är mer eller mindre löst sedan något år: Emellertid finns alltid en avvägning mellan hur kreativt upptäckande intelligensen kan krävas att vara kontra risk för att det hamnar i psykotiska tillstånd.


Finns god tillgång hårddisk och beräkningskraft kan man helt enkelt behålla resp. tidigare delsteg (istället för som jag alltid gör kastande mer än något eller upp till tio om testkörande nya komponenter dem då de är väldigt stora) och backa tillståndet när psykotiskt automatiskt (säg att vi gör 1000 kreativt tänkande förändringar över hela nätet - också för koncept sista tiden ej uttryckta i media som vetskap teknik, vapensystem, forskning m.m. - innebär det att vi har cirka 10 - 20 miljoner koncept med minimum vikter beräknade cirka 20 st samt associationer till koncept de förekommit med i vetande bedömt relevant från nyheter resp. konkret i nyheter: Säg värst för länder som USA, Kina och liknande där det handlar endast i vetande om säg 10 000 associationer andra koncept vilket ger cirka om man skär så att endast topp 50 000 från något enkelt sparas i stegen cirka 500 MB eller om man sparar allt mer än 2 T per steg). Normalt krävs dock ej för något normalt ändamål att hela nätet troligt ska bli engagerad. Det är huvudsakligen när jag längre bak tittade på stora länder sökande möjliga vägar förändring de kanske kommer vandra som det varit aktuellt. Betraktar vi varje normalt företag och söker associationer rörande attityd-förändring, koncept de är känsliga för negativt, eller vad som tycks göra dem intressanta krävs mindre (också när vi tittar på internet-stora som Google djupare än "troende", resp. återkommande halv-professionellt följande utan grupper som kräver mer association därför att de ligger "lite under allt Google-vanligt" även om de kanske är mer talande om förändring än något som skrivit och följt dem fem år eller längre jämförbart).


En "fördjupning" in i det mer esoteriska runt emotionell intensitet och polaritet mellan exempelvis som här positive and negative: