Visar inlägg med etikett Mening. Visa alla inlägg
Visar inlägg med etikett Mening. Visa alla inlägg

Verbens roller: Advice, Advise och Upplevelse / Uttryck - For / Against

2015-02-25

Betydelsen Wiktionary markerat föråldrad kan vi likväl visar något djupare i mening för advice:


"(obsolete) Deliberate consideration; knowledge.
How shall I dote on her with more advice, That thus without advice begin to love her? — Shakespeare."

Från: Advice ł Wiktionary

Ett råd är ett stycke avgränsad information. Informationen har normalt alltid (även om relativt mycket färre väldigt generella råd ytterst för instanserna repeterade finns) tydlig mottagare antingen individ, grupp av personer, eller en kategori av tänkta individer.


Råd har syfte d.v.s. vi rör oss här med riktad information: Avståndet mellan intresse av att åstadkomma effekt och någon till vem vi transfererar information är kortare i resonemang och intresse (att i kontrast jämföra med att skriva - eller för den delen pågående läsa - en bok med syftet läsa: Kanske väljer vi att skriva / läsa en efterföljande bok efter denna).


Advise (ej advice) Against

Vi kan ge råd mot något: Vanligt genom att använda PP-operatorn against. Vi kan ge råd stående mot en vägg och vi kan slå mot väggen. Men här avser vi råd som rekommenderar mot något: Att rekommendera är ett råd (mycket konkret så) medan om vi taggar karakteriserar (kategoriserar) något. Vi skiljer ut råd från vad som övervägande kategoriserar genom att:


  • Verb vilka uttrycker råd ger gärna möjlighet till flerdimensionella uttryck vilka ej trivialt tillåter förenkling ner till to (som PP-operator).
  • Medan övervägande kategoriserande verb kan ha färre möjligheter i breda valmöjligheter rörande argumenten.

Exempelvis kan vi ofta behöva förklara vårt råd med att något görs som är bra eller dåligt:


För:
A recommends B to leave food on the table for the elderly.

Emot:
A recommends against running outside the building.

Det är inte alltid recommend beskrivits närmare advise som kategori. Ibland har det beskrivits hellre varande kategorisering. Det finns emellertid fler fördelar egenskaper som stämmer väl för indelningen här:


  • Ett stycke information vi ger någon - talar, skickar o.s.v. - med ett syfte består dels av den konkreta informationen skriven resp. informationen implicit.
  • Implicit information inkl. sådant som ex. bransch-termonologi, subkulturella värderingar och vad helst gemensamt för en stabilt existerande grupp av personer relevant för språk mellan dem.

Ibland argumenteras för att egenskaper hos kulturgrupper relaterade kollektiv (vilket vi framöver tänkbart återvänder kring rörande arabiska och kinesiska kulturer vilka ibland - kanske ibland över- / feltolkande det) kan komma med en större andel implicit information. Nära relaterat är när sändande person är välkänd för oss i vilket fall vi kan förenkla kontroll av den konkreta informationen rörande oavsett hur explicit en domän är:


  • Medicinsk forskning är argumenterat väldigt explicit men råden i sig om informationen översätter till sådana kan vara helt implicita rörande allt i övrigt.
  • Alla resultat från forskning går att abstrahera bort från information vi skickar. Och om skickad kan mottagaren strunta i den.

Optimeringen är mer rationell / fungerande när mottagaren har förtroende för avsändaren.


Att kategorisera tenderar att för språk verb-argument är analysfråga för ha tämligen allmän-mänskliga styrande faktorer (här ofta den implicita informationen) och också väldigt ofta att vi snabbt kan bekräfta nästan automatiserat när kategoriseringen är oviktig eller inte tycks felaktig: Vi reagerar snarare på att något inte stämmer och stannar upp om indelningen känns fel alt. blir agiterade och önskar uttrycka avvikande mening om kategorisering följer värdering vi ej stödjer (Ex. djäv*a nedvärderande-kategori-av-personer som kallar oss hederliga fin-kategori-av-personer för något dåligt).


Men för recommend är kategoriseringen (där nu kategorisering mellan för och emot är det aktiva för råden hos mottagaren) behöver hur sändaren vägde samman säg en mängd kategoriseringen rörande bra eller dåligt inte alls vara en fråga oavsett explicit eller implicit information.


Värde för mottagaren

I perspektiv från den som ger information vill man gärna att mottagaren ser ett värde med råd vi ger. D.v.s. det är de flesta av oss alltid vill se på råd i alla de situationer vi ev. mer genomtänkt uttrycker information. Detta avspeglar sig också hur engelskan utvecklat sig och vi finner det naturligt att se att vi kan ge råd till vad som får ett värde av det.


I engelskan gör vi det ofta med for som PP-operator:


Hans fights for the whole world and we don't do enough for him

[Red. I sanning så: Vi kan alla göra mer här - Kanske mest andra eftersom jag redan ligger före naturligt här men annars i ev. brist på det får man väl anstränga sig ännu mer...]

Koppling mellan värde och att göra modellerar vi med reinforced learning. Även om belöningen där efterföljer görande under inträning gäller att när en motiverande faktor därefter åstadkommande beteende föregår (before) det handlande: Varande orsaken (be the cause ~ because) vilket möjligen är relaterat ordets historia Wiktionary ger:


From Middle English for, from Old English for (“for, on account of, for the sake of, through, because of, owing to, from, by reason of, as to, in order to”)

Against

Negativt värde generaliserar likartat i språkmönster:


Hans fights back

Hans fights against the enemy

Hans fights back against all odds

Men ändå upplever jag också annorlunda (som vi vill se det men kanske just egentligen samma sak här också). Värdet är vad vi antar / ofta har motiverande ex. som ovan fienden och den motivation är vad som tvingar / motiverar mig att agera against flodvågen av ytligt värde-motiverad omoral / samhällsdestruktion / beskattning av mig eller vad helst i övrigt.


Ändå kan vi lätt hitta "fight" against där det negativa värdet för oss om vi ej gör något är tydligt samtidigt som "fienden" ej är mänsklig. Väder och vind är en kategori av verb vi lätt ser detta för: Hans fights against the ice storm to save all the children still inside the city walls.


Möjligen gäller för de sista att det är samma fenomen vi gärna - trots ej mänskliga - ger mänskliga namn: Stormen Gudrun. Eller kanske The Bigger Storm Hans där vi görande det hela mer komplext att om för står kan det få något av Varelse och avhumaniseras till vad det gör men med en manner eller goal / "negativ-värde" komponent: The World Ender.


Tänkbart kan myter inom religion ge oss exempel här i skillnad mellan Skaparen och Förstöraren. Dock är jag inte säker på att jag har rätt här. Jag har ännu inte tittat på hur detta fördelas i stort corpus utan endast hanterat en del "särskilda" fall rörande sättande av roll-nära funktioner argument har under "parsning" av lexical decomposition semantics ty det är nu så att:


  • Against hanteras väldigt dåligt (tycker jag) i alla större verb-common-sense jämfört med hur vanligt det är just för riktad information nära eller just råd.
  • Och när vi har just eller nära "konflikt-liknande" konstraster mellan mänskligt som proto-agent resp. proto-patient.

Kanske har against blivit vanligare för ett antal konstruktioner än det förr varit? Common sense för verb är ju för alla av de få stora mycket besläktade med varandra byggande på gemensamma kulturbärare med arbeten (och så känner de och arbetar och publicerar tillsammans också av och till). En konstruktion jag tycker översatte till en regel jag gjorde i kod snarare än att ännu förändra min representation av verb-subkategorisering-med-roller är för recommend ger ett vanligt och tydligt exempel för:


The Medical board recommends against feeding pets to children if the moon is visible during lent.

Rekommenderar är ju ett naturligt positivt ord (medan forget är exempel på ett naturligt negativt ord) tror jag ännu oftare. Så against löser ett problem för alla fall där tappande naturligt positivt.


Vi skriver emellertid ogärna Hans forgets against coming in time. Men vi skriver utan mer problem än normalt: Hans forgets against all odds to reach the city in the time.


Den mänskliga motiverande drivkraften tycks också för många andra verb vara vad som styr här. Detta är tror jag säkert besläktat med samma bakomliggande dynamik vi har för dative alternation där vi mycket oftare än annars gör det endast för mänskliga mottagare:


Alternation möjlig och vanlig:


Hans transfers the package to Bill.
Hans transfers Bill the package

Alternation ej vanlig men tror jag säkert begriplig. Hus är av och för mänskligt där det rent av kan vara en människa som skriver på för paketet medan själva objektet är vad vi naturligt ser är vad vi går runt med:


Hans transfers the package to the house.

Hans transfers the house the package

Ej vanligt och känns konkret underligt (men fortfarande lär vi säkert ha preferens till en tolkning: Kanske något kring Bamse skickande något till den kolsvarta skogen dit de antar jag innan serierna började hade fördrivit dom färgade djuren som primärt den svarta vargen):


Hans transfers the forrest the package

Och:


Hans transfers the forrest, the package.

Reference i Verbnet ger en indikation om hur upplever jag sämre samlad. Emellertid ska jag ta och följa upp med min lista av verb jag tog ut kompletterande genom att se över i The Specialist vilka som tog against och titta igenom dem manuellt efter just people against people filtrerande port de spatiellt.


Hans advises on how to pet him with rewards

On har mer förstärkning av priming av vad som är relaterat underlaget än var vi är väg (om det senare alls är relevant): Vi förväntar oss oftare och har oftare relevans av underlaget i sig än vad vi gör stående eller gående på underlaget.


Rör vi oss till något eller om vi agerar mot nog är motivationen vad vi uppfattar relevant oftare. För advise och to gäller (om jag inte förleder mig fel nu när jag inte direkt kontrollerat: Ibland resonerande kring PP kommer jag fel oavsett hur mer typiskt rätt jag använder dem) att vi har mycket stark preferens mot agentens motivation för att ge råden snarare än rådens värde eller motivation för att realisera:


Hans advises to earn money. The role is consultant.

Men när vi har målet för rådet föregående gäller att vi nu har samma starka preferens att avse deras mål:


Hans advises adults to have fun instead of wasting money on gifts to themself.

Konkret tydligt mål nära just vad som avses: Ett "ord-steg" mellan där vi är och dit vi ska (när vi kan gömma hela vägen mellan from och to).


Och för advises och många andra verb har vi ofta det ämne vi kan kategori råden med indikerade via on som PP-operator:


Hans advises women on rewards.

Säg nu att jag istället för att uttrycka från hjärnan tar indata via perception:


Hans feels on the thing.

Hans feels heat on the thing.

Hans feels heat to the end of the day

Hans feels heat for satisfaction.

Så framgår kanske tydligare antagandet om ämnet: För advises var Hans ursprunget till råden vi kan se som en kognitiv (och nyttig) stimulans för den läser eller hör på. Men varifrån kommer råden "on Hans": Från ämnet rewards i mängden råd han ger. Förutom den normala rimligheten allmänt för PP att vanligen översätter topologiska PP och därefter fordrande att vi kan särskilja om de är konkret topologiska (ex. on Hans foot) eller avser något annat.


För against, on m.fl. för "råd", kategorisering och några fler grupper verkade dock stora verb-grupper komma ut där riktat mer specialisering för särskiljande från spatiell mening var möjlig. Grupper vilka tillsammans formar verb där det är meningsfullt att:


  • Vid första steg i analys av mening i LCS tänka oss en BE_AG operation.
  • Där BE_AG fångar in diverse grupper av implicit information.
  • Alla grupper avsedda här varande vad de säger om agenten nära direkt varande sådant vi normalt antar (eller antar att agenten är "korrupt" eller jämförbart defunct om det inte riktigt stämmer).

Ex. att om någon endorses, recommends, o.s.v. en produkt, person eller liknande föredrar dom det samma själva åtminstone för det explicita kontext indikerat (explicit kontext: Ex. gruppen vi rekommenderar det till och on topic). Eller om någon tvingat eller köpt dig att rekommendera är du defunct men inte självklart rådet som vi alltid antar det: Propaganda effekt resp. värde-association kan fortfarande göra att vi värderar rådet också medvetna om det (det senare särskilt just när vi söker saker som höjer upp vår upplevelse av hur andra upplever vårt värde som med dyra smycken m.m.).


Har vi nu kanske några naturligt negativa verb jämförbara med råd? I så fall finns typiskt om jag tänker rätt inte ett positivt värde om man gör som du säger man annars har: threat med besläktade verb är kanske ett exempel.

Meningsfull parsning: Parser man har nytta av

2014-11-13

Eftersom jag inte skrivit något på ett tag tänkte jag skriva något kanske större utspritt över några inlägg rörande hur egentligen för tänker jag de flesta normala användningsområden meningslösa vanliga parsers är. Vad har man egentligen för nytta t.ex. av "träden" som skapas?

De är ju absolut inte meningsfulla direkt för att ta ut mening, tolka och förstå vad som sägs, utan det är ju arbete som helt kvarstår. Praktiskt är det bara att börja parsa resultatet man får. Vilket jag tidigare gjort och har en tämligen kompetent parser för (med viss chunking). Emellertid är det ju en massa arbete som görs tycks det i onödan om vi nu mer är intresserade av att tolka och förstå ungefär som en människa (tänk någon som surfar nyhetstitlar på en tidnings startsida eller i sökresultat) där beräkningskostnad (för att inte tala om minnesåtgången) prioriteras i mycket där det inte behövs.


Nedan har vi som jag börjar med att publicera för att ha att referera dump av en datastruktur uttryckande "arbetsminne" för analysen av en nyhetstitel. Den är av och till (en hel del) kommenterad lokal.


I "parser-familj" vet jag inte riktigt var den hör samman. NP och verb-grupper detekteras och tas ut via chunking och den processen är i huvudsak regelstyrd vilket tycks prestera bättre än befintliga chunking-system åtminstone för nyhetstitlar (helt säkert delvis just därför att det är nyhetstitlar) utifrån part of speech där jag bl.a. använt brill resp. en statistisk. Ingendera är egentligen perfekt men jag har verkligen ingen lust att skriva en egen.


Likt dom dependency parsers ex. Speech and Language Processing (Jurafsky) diskuterar uttrycks beroenden emellertid inte som i exemplen där mellan orden utan fraserna. Dessa finns när de uttrycker samband som ligger lite utanför vad chunkingen direkt får fram när de är praktiskt användbara.


I dumpen arbetsminne noterar vi att riktad parsning mot mening skett. Här från att titlar uttrycker en världsbild Bill heard that the tank destroyer was attacking Hillary (test-titarna kan tyckas underliga men här får man ju förutom själva claus-konstruktionen och mening kring den sådant som weapon effect, ett koncept - tank destroyer ngram-detektion kan ta ut flera typer av, vi har personer indikerade med förnamn - imperfective o.s.v. Där testmeningarna mer skapas bit-for-bit utan att egentligen vara alltid särskilt troliga nyhetstitlar).


Jag ids inte sitta och konvertera dumpen som kommit via något xterm-liknande på utvecklingsdatorn. Bäst kopieras det säkert in till Emacs eller liknande än att läsa direkt.


Notera gärna också kommentaren i sista stycket rörande gun boat och tank destroyer :-D




$VAR1 = 'PH';
$VAR2 = {
          '6' => {
                   'end_position' => 8,
                   'PH' => 'NP',
                   'start_position' => 8,
                   'phrase_true' => 'Hillary',
                   'HEAD' => {
                               'ARGUMENT' => {
                                               'DIRECT_OBJECT' => {
                                                           'PH' => '5',
                                                           'RIGHT' => 1,
                                                           'RAW' => 'DIRECT_OBJECT(attacking, Hillary)'
                                                         }
                                             }
                             },
                   'CH' => {
  
                             '0' => {
                                      'WORD_GIVEN' => 'Hillary',
                                      'CHUNK' => 'B_NP',
                                      'pos' => 8,
                                      'WORD_BASE' => 'hillary',
                                      'POS' => 'NNP'
                                    }
                           },
                   'CH_NUM' => 6,
                   'ngram' => {
                                'hillary' => {
                                               'ME' => {
                                                         '8' => 1
                                                       },
                                               'CONCEPT_AS_GIVEN' => 'Hillary',
                                               'CONCEPT_BASE' => 'hillary',
                                               'TYPES' => {
                                                            'type_marker' => {
                                                                               'NGRAM' => 1
                                                                             },
                                                            'human_nature' => {
                                                                                'PERSON' => 1
                                                                              }
                                                          },
                                               'VALENCE_HH' => {
                                                                 'LAMBDA' => '29.3707558220325',
                                                                 'BLI' => '1.85637293777104e-05',
                                                                 'WP' => '1.10809794620763e-10',
                                                                 'HH' => '0.000174095460703142',
                                                                 'WE' => '1.01241183202824e-07',
                                                                 'EMI' => '0.000174095460703142',
                                                                 'IDF' => '24.4047821320418',
                                                                 'SCALED_COUNT' => '1.4142135623731'
                                                               },
                                               'POS' => 'NNP'
                                             }
                              },
                   'phrase' => 'hillary',
                   'phrase_pos' => 'NNP'
                 },
          '4' => {
     # AUX-operator som stoppats in i VP bildande en verb-grupp. Kvarstår p.g.a. av programlogiken.

                   'PH' => '_STOP',
                   'HEAD' => {

                             }
                 },
          '1' => {
                   'end_position' => 1,
                   'PH' => 'VP',
                   'start_position' => 1,
                   'phrase_true' => 'heard',
                   'HEAD' => {
                               'WORD_GIVEN' => 'heard',
                               'HH_TYPES' => {
                                               'PROTO_VERB' => {
                                                                 '_MODAL_INFORMATION' => 1,
                                                                 '_STATE_VERB' => 1,
                                                                 '_MODAL_PCU' => 2
                                                               },

                                               'TRANS' => {
# Typerna är egentligen ner-informerade från data The Specialist Lexicon (National Institute of Health) ger i tense information och fungerar som indikationer om vad som kan hämtas där rörande verb-argumenten (gör ganska lite - ingenting egentligen  mer än grund-kategorier adverb m.m., tense och sub- men alltid rätt och vad jag nog oftast i området mer regelbundet över åren återvänder till: Bra funktionell datastruktur dessutom: CSV).

                                                            'CPLXTRAN' => 1, # Realiserad CLAUSE_VERB_COMP
                                                            'ARG_COUNT' => 2, # Subjekt och complex transitivity med verb.
                                                            'INTRAN' => 0, # Ej realiserad som definierad.
                                                            'TRAN' => 0  # Ej realiserad som definierad.
                                                          },
                                               'CL' => {
        # Högnivå typ härledd från gramamtik och allmän vetskap verb m.m. Uttrycker en världsbild från subjekt till
        # _PCU_HEAD d.v.s. heard i den mening att "Bill heard". Där "verb 2" ger oss själva världsbilden tillsammans
        # med dess argument. PCU = Perception (heard) - Cognition ( "Bill beliefs that Hillary will run for president" ),
        # Utterancy ( "Bill heard that Hillary might come to run against Jeb Bush in the election." ). 

                                                         '_HAS_VERB_2' => '5',
                                                         '_PCU_HEAD' => 1,
                                                         '_PCU_MIDDLE' => 'that',
                                                         '_PCU_HEAD__HAS_VERB_2' => '5'
                                                       },
                                               'V' => {
                                                        '_TRAN' => 8,  # Viktning för typ av "transitivity" (eller vad det vanligen kallas). Inkl. 
          # viss hantering av verb som för mig tycks ha fler argument än annars diskuterat 
          # (en definitions fråga kanske): Penning-transferering och handel ev. endast (de jag 
          # sett): "Boy-toy Hans "mistress" bought *him* *the house in Stockholm *for 100 million*."
          # Mannerative i någon mening även om det känns en aning annorlunda med "for cash": 
          # Jfr beneciary vilket vi ju också kan se som en mannerative dimension relaterad dimension
          # och värde-spridning. Ej riktigt (inte alltid i alla fall) manner i hur vi gör det
          # fysiskt kanske men väl betydelsefullt praktiskt för vad verb:et innebär. 

                                                        '_PAST' => 1  # Saknas lokala "aux" och "md" operatorer är detta härlett *endast* från heard medan
          # samspel efterföljande verb rörande ex. imperfective, perfective m.m. hanteras ovanpå
          # beroende av frihet vid punkten där vi "imploderar" världsbild av talande jfr händelsen
          # för att ta ut vikter och dimensioner. 
                                                      }
                                             },
                               'VALENCE_HH' => {
       # Diverse vikter som sätts tidigt men egentligen inte längre används. Praktiska att ha kvar för manuella kontroller.
       # Även om IDF vikter nu använda är framtagna riktat för nyhetstitlar från endast nyhetstitlar som indata (cirka i 
       # en mindre pre-körning 50 GB men just nyhetstitlar såväl som titlar forskning och government data finns *försvarliga*
       # mängder av - för att inte tala om titlar websidor vilka dock kan ge lite oförutsedda "Wikipedia IDF-effekter" om man
       # inte är oförsiktig i filtrering). 

                                                 'WP' => '0.000375847068042446',
                                                 'BLI' => '0.0593952801874406',
                                                 'HH' => '0.511927612425699',
                                                 'EMI' => '0.511927612425699',
                                                 'WE' => '0.11813802909792',
                                                 'IDF' => '6.0609820328783'
                                               },
                               'ARGUMENT' => {
                                               'NP_SUBJECT' => {
                                                            'PH' => '0',
                                                            'LEFT' => 1,
                                                            'RAW' => 'NP_SUBJECT(heard, Bill)'
                                                          },
                                               'CLAUSE_VERB_COMP' => {
                                                            'PH' => '5',
                                                            'LEFT' => 1,
                                                            'RAW' => 'CLAUSE_VERB_COMP(heard, attacking)'
                                                          }
                                             },
                               'WORD_BASE' => 'hear',
                               'POS' => 'VBD'
                             },
                   'CH' => {
                             '0' => {
                                      'WORD_GIVEN' => 'heard',
                                      'CHUNK' => 'B_VP',
                                      'pos' => 1,
                                      'WORD_BASE' => 'hear',
                                      'POS' => 'VBD'
                                    }
                           },
                   'CH_NUM' => 1,
                   'ngram' => {
                                'heard' => {
                                             'ME' => {
                                                       '1' => 1
                                                     },
                                             'CONCEPT_AS_GIVEN' => 'heard',
                                             'CONCEPT_BASE' => 'hear',
                                             'TYPES' => {
                                                          'type_marker' => {
                                                                             'NGRAM' => 1
                                                                           },
                                                          'human_nature' => {
                                                                              'ACTIVE' => 1,
                                                                              'POWER' => 1
                                                                            },
                                                          'noun_properties' => {
                                                                                 'PROM_ALBUM' => 1
                                                                               }
                                                        },
                                             'HH_TYPE' => {
                                                            'VERB' => 1
                                                          },
                                             'VALENCE_HH' => {
                                                               'BLI' => '0.0593952801874406',
                                                               'WP' => '0.000375847068042446',
                                                               'HH' => '0.511927612425699',
                                                               'WE' => '0.11813802909792',
                                                               'EMI' => '0.511927612425699',
                                                               'IDF' => '6.0609820328783'
                                                             },
                                             'POS' => 'VBD'
                                           }
                              },
                   'phrase' => 'hear',
                   'phrase_pos' => 'VBD'
                 },

          '3' => {
                   'end_position' => 5,
                   'PH' => 'NP',
                   'start_position' => 3,
                   'phrase_true' => 'the tank destroyer',
                   'HEAD' => {
                               'HH_OPERATORS' => {
                                                   'DT' => 'THE'
                                                 },
                               'ARGUMENT' => {
                                               'NP_SUBJECT' => {
                                                            'PH' => '5',
                                                            'RIGHT' => 1,
                                                            'RAW' => 'NP_SUBJECT(attacking, destroyer)'
                                                          },

                                               'NN' => {
                                                         'PH' => '3',
                                                         'LEFT' => 1,
                                                         'RAW' => 'NN(destroyer, tank)'
                                                       },

            # Operator determiner. I den mån DT ej ingår i ett ngram detekterat "större" än sig själv raderas DT från de 
            # identifierade möjliga ngram:en. Och placeras istället i HH_OPERATORS. 

                                               'DT' => {
                                                          'PH' => '3',
                                                          'LEFT' => 1,
                                                          'RAW' => 'DT(destroyer, the)'
                                                        }
                                             }
                             },

                   'CH' => {
        # Respektive ord i "frasen" / "verb-gruppen" / "chunk". WORD_BASE kan vara modifierat (ex. till lower cause bl.a. därför att delar
        # av viktsystemen förväntar eller bättre uttryckt vinner på mer "core-typer" medan andra som IDF ibland ej gör det).

                             '1' => {
                                      'WORD_GIVEN' => 'tank',
                                      'CHUNK' => 'I_NP',
                                      'pos' => 4,
                                      'WORD_BASE' => 'tank',
                                      'POS' => 'NN'
                                    },
                             '0' => {
                                      'WORD_GIVEN' => 'the',
                                      'CHUNK' => 'B_NP',
                                      'pos' => 3,
                                      'WORD_BASE' => 'the',
                                      'POS' => 'DT'
                                    },
                             '2' => {
                                      'WORD_GIVEN' => 'destroyer',
                                      'CHUNK' => 'I_NP',
                                      'pos' => 5,
                                      'WORD_BASE' => 'destroyer',
                                      'POS' => 'NN'
                                    }
                           },
                   'CH_NUM' => 3,
                   'ngram' => {
    # Samtliga detekterade ngram. För många beräkningar väljs det koncept som har mest tilltalande entropi och / eller IDF-vikt 
    # (det senare är praktiskt snabbare när man nu har IDF-vikter för ca 20 miljoner flergram och tycks ge samma resultat). 
    # Att kasta övriga detekterade ngram om de är koncept tycks dumt. Tänker vi oss ex. kanske tydligast sökning gäller ju att 
    # "destroyer" mycket väl kan vara en sökning med föga annat för aktuell tid, plats o.s.v. och givet att vi nu hanterar flergram
    # (tank destroyer) snarare än bara ord är de praktiskt snabbare att spara och beräkna ut vikter för. Söker man inte på "tank destroyer" 
    # så stör den ju inte. 

                                'destroyer' => {
                                                 'CONCEPT_AS_GIVEN' => 'destroyer',
                                                 'CONCEPT_BASE' => 'destroyer',
                                                 'HH_TYPE' => {
                                                                'NOUN' => 1
                                                              },
                                                 'ME' => {
                                                           '5' => 1
                                                         },
                                                 'TYPES' => {
                                                              'type_marker' => {
                                                                                 'NGRAM' => 1
                                                                               },
                                                              'human_nature' => {
                                                                                  'POWER_NEWS' => 1,   # Weapon effect m.m. via "dum-kategorier" som 
               # vikter när körande beräknas till (nuvarande är
               # slutar med nyheter 2012 så jag sätter allt till 1 istället).
                                                                                  'HUMAN_NATURE_TOOLS' => 1,  # Båt är ett verktyg, synål också, en algoritm är ett verktyg o.s.v. 
                                                                                  'DANGER' => 1,   # Farligt.
                                                                                  'ACTIVE' => 1,   # Det händer saker när en destroyer kommer även om den inte skjuter.
                                                                                  'POWER' => 1,    # Projiserar makt i situationen.
                                                                                  'TOOLS' => 1 
                                                                                },
                                                              'noun_properties' => {
                      # Samma som föregående men från ett annat system (ovanpå Wordnet m.m. för jämförelse och pröva). Används ej.

                                                                                     'N_AGENTATIVE_CAUSAL_AGENT' => 1,
                                                                                     'N_TOOL' => 1,
                                                                                     'C_ARTIFACT' => 1,
                                                                                     'C_MILITARY' => 1,
                                                                                     'N_PHYSICAL_ENTITY' => 1,
                                                                                     'C_NAUTICAL' => 1,
                                                                                     'N_ARTIFACT' => 1,
                                                                                     'N_ANIMATE' => 1,
                                                                                     'N_CONCRETE' => 1,
                                                                                     'N_COUNT' => 1,
                                                                                     'C_PERSON' => 1
                                                                                   }
                                                            },
                                                 'NOT_ME' => {
        # Ord som ej ingår i ngram. Praktiskt när vi ex. projiserar påverkar emotionell intensitet m.m. från adjektiv m.m. till ngram omv i ej önskar projisera
        # sådan effekt om dessa faktiskt ingår i ngram. Ex. en entitet som heter "green Mama". 
                                                               '4' => 1,
                                                               '3' => 1
                                                             },
                                                 'VALENCE_HH' => {
            # Diverse av de vikttyper som används. Just som satta här endast för att läsa och av och till (som idf några generationer efter). 
                                                                   'BLI' => '0.010770903762987', # Bluelight intensity. Ganska högt för en icke-politisk enhet, eller mer i varianter kategori-artat koncept.
                                                                   'WP' => '2.32257322056041e-06', # Viktat probability (jfr cirka 20 miljoner flergram). 
                                                                   'HH' => '0.000167973616381427', # Funktion av WP, WE och EMI.
                                                                   'WE' => '0.00120090321990928', # Viktad entropi-mått. 
                                                                   'EMI' => '0.000167973616381427', # Emotionell intensitet. Används endast egentligen för verb, adjektiv och adverb i "enkel mening" motsvarande HH.
                                                                   'IDF' => '12.1816504899042',  # Gammal IDF från mycket större corpus än nyhetstitlar (och mycket sämre än IDF härledd endast från nyhetstitlar). 
                                                                 },
                                                 'POS' => 'NN'
                                               },
                                'tank' => {
                                            'CONCEPT_AS_GIVEN' => 'tank',
                                            'CONCEPT_BASE' => 'tank',
                                            'HH_TYPE' => {
                                                           'NOUN' => 1,
                                                           'VERB' => 1
                                                         },
                                            'ME' => {
                                                      '4' => 1
                                                    },
                                            'TYPES' => {
                                                         'type_marker' => {
                                                                            'NGRAM' => 1
                                                                          },
                                                         'human_nature' => {
                                                                             'WEAPONS' => 1,
                                                                             'HUMAN_NATURE_TXOOLS' => 1, # TXOOLS indikerar antagligen något system jag prövat och givet en gen indikation jag tycks ha glömt bort (jag såg den någonstans i övrigt också men editerade det rätt där). 
                                                                             'DANGER' => 1,
                                                                             'ACTIVE' => 1,
                                                                             'TOOLS' => 1
                                                                           },
                                                         'noun_properties' => {
                                                                                'N_TOOL' => 1,
                                                                                'N_ABSTRACT' => 1,
                                                                                'C_FACTOTUM' => 1,
                                                                                'C_MILITARY' => 1,
                                                                                'N_PHYSICAL_ENTITY' => 1,
                                                                                'C_TRANSPORT' => 1,
                                                                                'N_ARTIFACT' => 1,
                                                                                'N_CONCRETE' => 1,
                                                                                'N_COUNT' => 1
                                                                              }
                                                       },
                                            'NOT_ME' => {
                                                          '3' => 1,
                                                          '5' => 1
                                                        },
                                            'VALENCE_HH' => {
                                                              'LAMBDA' => '10.121083523761',
                                                              'BLI' => '0.0346619332458489',
                                                              'WP' => '6.41390074653817e-05',
                                                              'HH' => '0.503579521068032',
                                                              'WE' => '0.0246804930395017',
                                                              'EMI' => '0.503579521068032',
                                                              'IDF' => '7.6256833901337',
                                                              'SCALED_COUNT' => '1.4142135623731'
                                                            },
                                            'POS' => 'NN'
                                          },
                                'tank destroyer' => {
                                                      'ME' => {
                                                                '4' => 1,
                                                                '5' => 1
                                                              },
                                                      'CONCEPT_AS_GIVEN' => 'tank destroyer',
                                                      'CONCEPT_BASE' => 'tank destroyer',
                                                      'TYPES' => {
                                                                   'type_marker' => {
                                                                                      'NGRAM' => 1
                                                                                    },
                                                                   'human_nature' => {
                                                                                       'WEAPONS' => 1,
                                                                                       'DANGER' => 1
                                                                                     },
                                                                   'noun_properties' => {
                                                                                          'C_TRANSPORT' => 1
                                                                                        }
                                                                 },
                                                      'NOT_ME' => {
                                                                    '3' => 1
                                                                  },
                                                      'VALENCE_HH' => {
                                                                        'LAMBDA' => '22.6285737033206',
                                                                        'BLI' => '0.000503088001004535',
                                                                        'WP' => '1.10152033886457e-08',
                                                                        'HH' => '0.00579202765547812',
                                                                        'WE' => '8.04481864441989e-06',
                                                                        'EMI' => '1.54456392015009e-05',
                                                                        'IDF' => '19.2047355153611',
                                                                        'SCALED_COUNT' => '1.4142135623731'
                                                                      },
                                                      'POS' => 'NN VBD'
                                                    }
                              },
                   'phrase' => 'the tank destroyer',
                   'phrase_pos' => 'DT NN NN'
                 },

          '0' => {
                   'end_position' => 0,
                   'PH' => 'NP',
                   'start_position' => 0,
                   'phrase_true' => 'Bill',
                   'HEAD' => {
                               'ARGUMENT' => {
                                               'NP_SUBJECT' => {
                                                            'PH' => '1',
                                                            'RIGHT' => 1,
                                                            'RAW' => 'NP_SUBJECT(heard, Bill)'
                                                          },
                                             }
                             },
                   'CH' => {
                             '0' => {
                                      'WORD_GIVEN' => 'Bill',
                                      'CHUNK' => 'B_NP',
                                      'pos' => 0,
                                      'WORD_BASE' => 'bill',
                                      'POS' => 'NNP'
                                    }
                           },
                   'CH_NUM' => 0,
                   'ngram' => {
                                'bill' => {
                                            'ME' => {
                                                      '0' => 1
                                                    },
                                            'CONCEPT_AS_GIVEN' => 'Bill',
                                            'CONCEPT_BASE' => 'bill',
                                            'TYPES' => {
                                                         'type_marker' => {
                                                                            'NGRAM' => 1
                                                                          },
                                                         'human_nature' => {
                                                                             'HUMAN' => 1,
                                                                             'DANGER' => 1,
                                                                             'ACTIVE' => 1,
                                                                             'POWER' => 1,
                                                                             'TOOLS' => 1
                                                                           },
                                                         'noun_properties' => {
                  [BORT-TAGET]
                                                                              }
                                                       },
                                            'HH_TYPE' => {
                                                           'NOUN' => 1,
                                                           'VERB' => 1
                                                         },
                                            'VALENCE_HH' => {
                                                              'LAMBDA' => '20.8820662336034',
                                                              'BLI' => '0.0439001009558573',
                                                              'WP' => '2.38824892163046e-07',
                                                              'HH' => '0.514465422090061',
                                                              'WE' => '0.000145138603998346',
                                                              'EMI' => '0.514465422090061',
                                                              'IDF' => '5.8013756873731',
                                                              'SCALED_COUNT' => '3.46410161513775'
                                                            },
                                            'POS' => 'NNP'
                                          }
                              },
                   'phrase' => 'bill',
                   'phrase_pos' => 'NNP'
                 },
          '2' => {
                   'end_position' => 2,
                   'PH' => 'PP',
                   'start_position' => 2,
                   'phrase_true' => 'that',
                   'HEAD' => {
                               'ARGUMENT' => {

                                               'CLAUSE_THAT_HOW_DISTANCE_MARKER_COMP' => {
                                                             'PH' => '5',
                                                             'RIGHT' => 1,
                                                             'RAW' => 'CLAUSE_THAT_HOW_DISTANCE_MARKER_COMP(attacking, that)'
                                                           }
                                             }
                             },
                   'CH' => {
                             '0' => {
                                      'WORD_GIVEN' => 'that',
                                      'CHUNK' => 'B_PP',
                                      'pos' => 2,
                                      'WORD_BASE' => 'that',
                                      'POS' => 'IN'
                                    }
                           },
                   'CH_NUM' => 2,
                   'ngram' => {
                                'that' => {
                                            'ME' => {
                                                      '2' => 1
                                                    },
                                            'CONCEPT_AS_GIVEN' => 'that',
                                            'CONCEPT_BASE' => 'that',
                                            'TYPES' => {
                                                         'type_marker' => {
                                                                            'NGRAM' => 1
                                                                          },
                                                         'human_nature' => {
          [Borttaget]
                                                                           },
                                                         'noun_properties' => {
          [Borttaget]
                                                                              }
                                                       },
                                            'VALENCE_HH' => {
                                                              'LAMBDA' => '16.2840339446254',
                                                              'BLI' => '5.29978934473552e-05',
                                                              'WP' => '9.63993221190068e-07',
                                                              'HH' => 0,
                                                              'WE' => '0.000532225724160357',
                                                              'EMI' => 0,
                                                              'IDF' => '9.6845518262135',
                                                              'SCALED_COUNT' => '1.4142135623731'
                                                            },
                                            'POS' => 'IN'
                                          }
                              },
                   'phrase' => 'that',
                   'phrase_pos' => 'IN'
                 },
          '5' => {
                   'end_position' => 7,
                   'PH' => 'VP',
                   'start_position' => 7,
                   'phrase_true' => 'attacking',
                   'HEAD' => {
                               'HH_TYPES' => {
                                               'PROTO_VERB' => {
                                                                 '_VERB_PROPERTY__HUMAN_VIOLENCE' => 2,
                                                                 '_MANIPULATION' => 1
                                                               },

                                               'TRANS' => {
                                                            'ARG_COUNT' => 3,
                                                            'INTRAN' => 0, # Ej realiserad *som definierad*..
                                                            'TRAN' => 0         # Ej realiserad som definierad.
                                                          },
                                               'CL' => {
                                                         '_PCU_VERB_2' => 1
                                                       },
                                               'V' => {
       # Progressive avser när verb betraktas UTAN HÄNSYN HH_OPERATORS.
       # _PAST_PROGRESSIVE när operatorerna använts "was attacking". 
       # Och imperfective är definierad till en kategori bl.a. inkluderande past progressive. 

                                                        '_PAST_PROGESSIVE' => 1,
                                                        '_PROGESSIVE' => 1,
                                                        '_IMPERFECTIVE' => 1,
                                                      }
                                             },
                               'WORD_GIVEN' => 'attacking',
                               'HH_OPERATORS' => {
                                                   'AUX' => {
                                                              'was' => {
                                                                         '_ACTIVE' => 1, # Ej passiv. 
                                                                         'end_position' => 6,
                                                                         'start_position' => 6,
                                                                         'ARGUMENT' => {
                                                                                         'AUX' => {
                                                                                                    'PH' => '5',
                                                                                                    'RIGHT' => 1,
                                                                                                    'RAW' => 'AUX(attacking, was)'
                                                                                                  }
                                                                                       },
                                                                         'phrase_pos' => 'VBD'
                                                                       }
                                                            }
                                                 },
                               'VALENCE_HH' => {
                                                 'WP' => '0.000298256136957894',
                                                 'BLI' => '0.0413263690641225',
                                                 'HH' => '0.765989109703756',
                                                 'EMI' => '0.765989109703756',
                                                 'WE' => '0.0964980396099565',
                                                 'IDF' => '6.1371324495446'
                                               },
                               'ARGUMENT' => {
                                               'NP_SUBJECT' => {
                                                            'PH' => '3',
                                                            'LEFT' => 1,
                                                            'RAW' => 'NP_SUBJECT(attacking, boat)'
                                                          },
                                               'AUX' => {
                                                          'PH' => '4',
                                                          'LEFT' => 1,
                                                          'RAW' => 'AUX(attacking, was)'
                                                        },
                                               'CLAUSE_THAT_HOW_DISTANCE_MARKER_COMP' => {
                                                             'PH' => '2',
                                                             'LEFT' => 1,
                                                             'RAW' => 'CLAUSE_THAT_HOW_DISTANCE_MARKER_COMP(attacking, that)'
                                                           },
                                               'DIRECT_OBJECT' => {
                                                           'PH' => '6',
                                                           'LEFT' => 1,
                                                           'RAW' => 'DIRECT_OBJECT(attacking, Hillary)'
                                                         },
                                               'CLAUSE_VERB_COMP' => {
                                                            'PH' => '1',
                                                            'RIGHT' => 1,
                                                            'RAW' => 'CLAUSE_VERB_COMP(heard, attacking)'
                                                          }
                                             },
                               'WORD_BASE' => 'attack',
                               'POS' => 'VBG'
                             },
                   'CH' => {
                             '0' => {
                                      'WORD_GIVEN' => 'attacking',
                                      'CHUNK' => 'B_VP',
                                      'pos' => 7,
                                      'WORD_BASE' => 'attack',
                                      'POS' => 'VBG'
                                    }
                           },
                   'CH_NUM' => 5,
                   'ngram' => {
                                'attacking' => {
                                                 'ME' => {
                                                           '7' => 1
                                                         },
                                                 'CONCEPT_AS_GIVEN' => 'attacking',
                                                 'CONCEPT_BASE' => 'attack',
                                                 'TYPES' => {
                                                              'packs' => {
                                                                           '__ATTACK' => 0,
                                                                           '__HOSTILE_EVENT' => 0
                                                                         },
                                                              'type_marker' => {
                                                                                 'NGRAM' => 1
                                                                               },
                                                              'human_nature' => {
                                                                                  'DANGER' => 1,
                                                                                  'UP' => 1,
                                                                                  'ACTIVE' => 1,
                                                                                  'POWER' => 1,
                                                                                  'NEGATIV' => 1
                                                                                },
                                                              'noun_properties' => {
                                                                                     'N_MASS' => 1,  # Har att göra med hur man "räknar" attacking om det är en "noun-event": 
                                                                                     'C_ACT' => 1,
                                                                                     'N_ABSTRACT' => 1,
                                                                                     'C_FACTOTUM' => 1,
                                                                                     'N_CONCRETE' => 1,
                                                                                   }
                                                            },
                                                 'HH_TYPE' => {
                                                                'VERB' => 1
                                                              },
                                                 'VALENCE_HH' => {
                                                                   'BLI' => '0.0413263690641225',
                                                                   'WP' => '0.000298256136957894',
                                                                   'HH' => '0.765989109703756',
                                                                   'WE' => '0.0964980396099565',
                                                                   'EMI' => '0.765989109703756',
                                                                   'IDF' => '6.1371324495446'
                                                                 },
                                                 'POS' => 'VBG'
                                               }
                              },
                   'phrase' => 'attack',
                   'phrase_pos' => 'VBG'
                 }
        };
$VAR3 = 'SENTENSE';
$VAR4 = {
          'CH' => {
                    '6' => {
                             'IN_PHRASE' => {
                                              '4' => {
                                                       '_WITH_WORD' => 'was',
                                                       'ngram' => {
                                                                    'was' => 1
                                                                  }
                                                     }
                                            }
                           },
                    '3' => {
                             'IN_PHRASE' => {
                                              '3' => {
                                                       '_WITH_WORD' => 'the',
                                                       'ngram' => {
                                                                    'the' => 1
                                                                  }
                                                     }
                                            }
                           },
                    '7' => {
                             'IN_PHRASE' => {
                                              '5' => {
                                                       '_WITH_WORD' => 'attacking',
                                                       'ngram' => {
                                                                    'attacking' => 1
                                                                  }
                                                     }
                                            }
                           },
                    '2' => {
                             'IN_PHRASE' => {
                                              '2' => {
                                                       '_WITH_WORD' => 'that',
                                                       'ngram' => {
                                                                    'that' => 1
                                                                  }
                                                     }
                                            }
                           },
                    '8' => {
                             'IN_PHRASE' => {
                                              '6' => {
                                                       '_WITH_WORD' => 'Hillary',
                                                       'ngram' => {
                                                                    'hillary' => 1
                                                                  }
                                                     }
                                            }
                           },
                    '1' => {
                             'IN_PHRASE' => {
                                              '1' => {
                                                       '_WITH_WORD' => 'heard',
                                                       'ngram' => {
                                                                    'heard' => 1
                                                                  }
                                                     }
                                            }
                           },
                    '4' => {
                             'IN_PHRASE' => {
                                              '3' => {
                                                       '_WITH_WORD' => 'gun',
                                                       'ngram' => {
                                                                    'gun' => 1
                                                                  }
                                                     }
                                            }
                           },
                    '0' => {
                             'IN_PHRASE' => {
                                              '0' => {
                                                       '_WITH_WORD' => 'Bill',
                                                       'ngram' => {
                                                                    'bill' => 1
                                                                  }
                                                     }
                                            }
                           },
                    '-1' => {
                              'IN_PHRASE' => {}  # Defekt gissar vi. Auto-skapat när något icke-existerat refererats. 
                            },
                    '5' => {
                             'IN_PHRASE' => {
                                              '3' => {
                                                       '_WITH_WORD' => 'boat',
                                                       'ngram' => {
                                                                    'boat' => 1
                                                                  }
                                                     }
                                            }
                           }
                  }
        };
$VAR5 = 'META';
$VAR6 = {
          'ID' => 'ID',
          'TITLE_TOKENIZED' => 'Bill heard that the [Korrigerar till tank destroyer: Körde en variant med tank destroyer men hade tagit in delar från gun boat redan]. gun boat was attacking Hillary',
     'NEWS_PRODUCER' => 'HANS',
          'TRUST_LEVEL' => '1',
          'TAGS' => {
                      'Nothing here' => 1
                    },
          'TIMESTAMP' => '_UNDEF',
          'IMPORT_METHOD' => 'news_import',

   # Avser PP-operatorer vi kan sätta utanför själva informationen (d.v.s. nyheten). Ex. om vi från andra nyheter om pågående nyhetshändelser vet bättre var det hela 
   # geografiskt pågår. 

          'PP_META' => ''

   [Diverse borttaget här och lite varstans från META]



Språkets mening grundad i bild: I nyhetsvärlden II

2013-05-18

I en liten fortsättning på Att grunda mening... avseende särskilt i bild i kontext av nyhetsanalys där vi här har ett till vanligt steg precis som bild och bildtext från den visuella scenen till text: grafer för att visualisera samband.


En föga elegant i sig själv men utmärkt illustrerande är denna jag använde för att uttrycka tankar. När strukturer som dessa uttrycker färdiga tankar gäller att de när en noggrann person gör dem kan ha en mycket tydlig struktur. Här där tankarna ej är klara kan vi jämföra flexibiliteten och hur koncept adderats med den kreativa associationen och informationsinhämtningen.




Komplettering:


Citatet nere till vänster ej i skissen refererat är från:



D.v.s. citatet:


"The authors show that verb aspect influences the activation of event knowledge with 4 novel results. First, common locations of events (e.g., arena) are primed following verbs with imperfective aspect (e.g., was skating) but not verbs with perfect aspect (e.g., had skated). Second, people generate more locative prepositional phrases as completions to sentence fragments with imperfective than those with perfect aspect. Third, the amplitude of the N400 component to location nouns varies as a function of aspect and typicality, being smallest for imperfective sentences with highly expected locations and largest for imperfective sentences with less expected locations. Fourth, the amplitude of a sustained frontal negativity spanning prepositional phrases is larger following perfect than following imperfective aspect. Taken together, these findings suggest a dynamic interplay between event knowledge and the linguistic stream."




När vi jämför för att se likhet med text kan vi se vår parsning av en mening från vänster till höger motsvarande den väg vi går mellan områden där en mening samlat uttrycks som i sig själv kan konvergera till mening - ofta vad som kan ha en rektangel eller cirkel för att avgränsa undermängden mot hela infografen - och i exemplet från min kreativa tanke också hur jag valde att använda punktlistor. Dessa kan vi ex. se som logiskt undergripande ett områdes konvergens oavsett om händelser, eller delar av en mening, eller något annat.


Resp. sådan del oavsett om uttryckande mer än ett begrepp har ju just normalt en symbol vi infört som representerar den i ord. I grafen har vi ej ARBETSMINNETS REPRESENTATION men jag lade till det som det korrekt är precis även om jag lär ändra det till systemets beteckning när de fått ett klart namn på datastrukturen och dess logik.


Vi kan ju också precis som vi kan flytta ut vårt perspektiv ex. betraktande en längre tidsperiod se fler mer övergripande händelsesituationer men med färre detaljer. Med infografer kan vi göra samma sak på en mängd sätt. En metod jag själv ganska ofta använder för det lite komplexare just när jag skissar upp det är att kombinera infografer som ovan med med presentationer. Det gör det tycker jag både enkelt att skissa och när man betraktar en detalj få vettig (men ändå praktiskt för mig utrymmes begränsad i vad vi kan uttrycka) och vi får en enkel linjär "händelse- / situations-kedja" att följa. Ett exempel lika ännu begränsat uttryckt nås via:



(Egentligen lite väl just startat för att vara ett bra ex. men jag lär väl addera på lite i morgon varpå jag kan frysa denna version vid en lagom punkt. Det lär mindre troligt vara en spännande mycket värdeskapande och intressant process att följa för alla läsare men jag kan i alla kompenserande ex. begränsning nu indikera det som möjligt.)


Komplettering: Jag fryser exempel-presentationen nu eftersom jag upplever att jag börjar komma för nära konkreta algoritmer för att ha säkerhetsmarginal till sådant jag har föga lust att dela.