Verbens mening - Att representera från resp. nyhet mening förstådd och propagera till globala tillstånd

Sista på ett tag gissar jag i den lilla serien om verbens mening. Tidigare:

Sista inlägget ovan återkommer vi lätt relaterat till när det gäller give i slutet. Det finns verkligen mer att säga om give här (bl.a. att vi inte är ett lika enkelt take i passiv: istället har vi bara be resp. give - egentligen kan man argumentera att engelskan har ett fåtal till passiva kort och knappt berört i Utan passiv: Proto-patient första NP och agent subjekt (2015-01-28) -- konstruktioner men det är utanför vad diskuterat för rörande give) men det lär räcka så här ändå.

Är inte helt trivialt eftersom tillstånd (och annan mening) förstått ska propageras ex. till tillstånden för de entiteter hittade i resp. nyhet där vi inte kan låta det expandera fritt och inte heller ens för tidiga bastilsltånd vill man hamna att man bygger om på stora närmare skarpa tillståndsmaskiner därför man missade problem i mindre maskiner. Emellertid lämnar vi det här och reflekterar istället hur vi uttrycker förståelse för en stycke text vi analyserar djupt.

Jag har prövat alternativ av olika sorter men känner allt mer att vad jag upplever mer naturligt är att uttrycka mening i ett urval av de mest grundläggande mönster (i eleganta versioner man mer sällan träffar på i verkliga texter) utnyttjande för själva extraktionen och tolkningen innan.

Vi kan ta ett exempel där vi säger att Tidning A med skribent B publicerar en nyhet bl.a. med ett talstreck / citat av en mönster man fått ett talstreck från X rörande något:

[...]
- I believes A regarding B would be a problem if C which everyone should care about.

Vilket vi kan förenkla ner till ganska lätt standardiserade för det mesta en entitet sett, tror, hör, tycker m.m.

X believes that if C then B would be [även om vi inte behöver spara could, might m.fl. är de ganska få] for everyone

Och vidare till publicst:

A "hears" that X believes that if C then B would be [även om vi inte behöver spara could, might m.fl. är de ganska få] for everyone

Och på det ganska vi göra skattningar av hur långt vi är beredda att investera CPU för att bedöma informationen djupare för ev. från det kanske större effekt eller rent av manuell tid efter signalering om något intressant. Gör vi det här enkelt för oss och antar att X och A är oberoende (vilket inte alls gäller även om det bland större publicister är ett relativt mindre antal som skiljer ut sig mycket mer rörande bl.a. politiskt bias större än normalt förväntat) och vi har en 1-dimensionell vikt för resp. Trust = Trust ( X ) * Trust ( A ).

Oavsett hur enkelt vi antar trust här och ev. ibland kan göra det är effekt-storleken rörande vad det handlar om viktigare. Är tidningen ganska stor och personen är en rimligt känd politiker är det inte mycket att räkna på: D.v.s. värderingen av övrigt är intressantare. Just det är ingenting jag förändringar något i utan sådant är vad jag har sedan länge tämligen välfungerande lösningar för (den som letar torde finna en del inte minst ganska långt bak när det fanns större utmaningar med det) där för grova snabba mått brukar jag använda affekt-spridning (bluelight intensity), emotionell intensitet tillsammans med sannolikheten för konceptet kombinerat med funktioner av sannolikheten givet kontext, och för allt i snabb-approximation i viktsystem som är långsamt föränderliga byggande på väldigt mycket data men som jag räknar om väldigt sällan (oavsett hur enkla sådana generationer i princip är blir de alltid när data expanderas ett fullständigt helvete även för så enkla saker som P ( ngram X givet ngram y) där vi anser samtidig existens i titel + abstract / ingress för något publicerat med viss större vikt på titel - problemet är inte minst antal operationer till hårddisk kontra mängden ram-minne tillgängligt där ju fler hårddisk-operationer desto troligare tar det orimligt lång tid - sist efter rent ut sagt ordentligt större problem än jag hade gången innan accepterade ca 20 000 000 olika ngram istället för cirka 100 - 150 000 tog det flera månader - så frågan om hur man adderar mängden accepterade ngram utan att behöva räkna om allt istället för att addera in bara sista året eller så känns ganska intressant). Vi kan hur som helst förstå de tre dimensionerna (ex. för resp. såväl som tillsammans finns genom åren från ganska tidiga versioner till tror jag säkert de sista):

Entitet A har hög blue light intensity. Säg att det är en nation rent av. Dess effekt på andra koncept och/eller påverkan av andra tenderar att vara hög. Samarbeten, forskning man finansierar, verksamhet m.m. ökar kanaler i mening av koncept och ämnen man finns i (nationer eller ämne i forskning kan ligga mycket högt i antal relationer som är utgångspunkten innan "flödes-påverkan" i epoker görs: tio tusentals även om säg 5 - tio inom geografiska "kategori-liknande" ämnen kastades eftersom de aldrig gick klart i sista generationen).
Säg att A bedriver verksamhet B. A har hög emotionell intensitet generellt. B är antingen ganska tråkigt eller mer intensivt. Vi skattar sameffekten via resp. tillsammans med similarity mellan dem (ej sannolikhets-driven similarity här utan utnyttjande BLI i föregående per feature).
Antag nu att A ofta uttrycks i friskt discourse av vår moderna historia d.v.s. senare hälften av 1900-talet från vilket mängden data tillgänglig för corpus expanderar snabbt till det enorma jämfört med föregripande 1960 cirka för mig (1960 kommer ganska mycket forskning post-WII jag importerade in riktat).
Vi ser från föregående en förklaring man kan ge tillvarför sannolikheten givet kontext ytterst konkret adderar värde i skattningen (jag har i all ärlighet riktigt gillat att använda sannolikheten grovt som beskrivet här men det fungerar ytterst väl så länge vi har åtminstone bluelight intensity med)..
Ett enklare exempel än att försöka med något från förändring inom forskning (där det inte är lika rakt på sak att tycka sig se en förklaring direkt möjlig oavsett inte mindre svårighet att egentligen bedöma dess trovärdighet) är när fortsatt antar att entiteten är ett land. Verksamheten bredare är krigföring. Och kontext specifikt är nu krigföring.
Land med högre BLI d.v.s. påverkande mer, upparbetad högre emotionell intensitet (mer engagerande: EMI i sig är dock riktningslös - utan mening av positivt eller negativt eller liknande - som den används här) och fler krig gjorda är ett bra värde för att indikera om man ska investera dyrare beräkningar (och de kan snabbt stiga upp ordentligt om eller när man börjar expandera ut rymden för vad man söker samband till eller borrar ner djupare hur koncept samspelar ex. via similarity vilket så fort värden ej finns redan färdigt beräknande potentiellt beroende på storlek av entiteterna i samband upparbetade till andra koncept kan ta ibland rent av väldigt lång tid).

Rörande krig kan vi göra en liknande primitiv motsvarande "believes" och "hear" varianten. Händelse:

A moves a military vehicle from Oslo to Stockholm during lent.

Rapporterat i någon tidning B:

B reports that A moves a military vehicle from Oslo to Stockholm during lent.

Och vi kan stoppa in ev. värdering av informationen vi har extrakterat:

B reports without explicit source that A moves a military vehicle from Oslo to Stockholm during lent.

Och kanske handlade det egentligen om att:

Denmark attempts to block [A moves .... ]

Eller:

Denmark makes A driving a military vechicle into the underground vacility celebrating len [antagande att vi inte vill addera ev. kontextuell information som kan ha tydliggjort om det är Danmark som firar fasta eller om det firades i bunkern.]

Skillnaden mellan irrealis och realitet inte ointressant. Men tråkigt nog gäller att man för allt intressant behöver propagera allt. Effekten av en nyhet även om spekulativ kan vara verklig i sig såväl som att spekulativa händelser som sådana återspeglar tillstånd bredare i samhället. Risker ej längre otroliga med ganska stor kostnad när realiserade gör dem rörande mer spekulativa realiseringen även ganska långt från trolig verklighet vanligare återspeglande människans känslor och tillstånd där vi står. Vi inser emellertid att vi kan använda i princip samma system för att ta ut irrealis. Indikerar person A man fått talstreck från att han vet något men publicist tvivlar kanske citerande faktorer som pekar på alterntiv kan vi värdera samlat genom att vi adderar säg "paper thinks that" att händelsen innanför och därmed hela konstruktionen är spekulativ.

Sedan gäller för hela frågan om irealis här att med mindre än att den som "talar" direkt upplevt något är det när vi propagerar upp information från en mängd nyheter inte längre vad en nyhet längre kan påverka särskilt mycket runt. Och går man ner och tittar över något där A vet något B som han inte direkt upplevt utan har "stora kunskaper kring", "upplever sig förstå" eller vad helst i övrigt hittar man snart nog allt möjligt annat ungefär det samma med lite olika, diverse annat rörande samma sak ganska annorlunda rörande detaljer eller delar, såväl självklart i allt som ligger närmare ideologi, trosföreställningar i religion m.m. där mer "färdiga ramverk" för hur man ska tycka finns utan att man alltid behöver lära om kring varje ny mer konkretiserad fråga varierar det storliken utan att alltid det mest uttrycka i konkretiserade delar är mer trovärdigt än något annat (om sifferuppgifter rörande kostnader och intäkter i statsbudget citerat från en specifik källa kommer rätt med rimlig avrundning ej säg adderande en magnitud 1000 är det en ganska bra basnivå - även om nu konkreta sifferfel verkligen inte är slutet på det problemet som i effekt och tolkning kan komma ordentligt "fult bias riktat" nästan lättare utan felaktiga konkreta siffror).

Om det här representationssystemet är bättre än andra jag sett och tittat över ska jag låta osagt. En förhoppning är att en viss stabil insikt från att ha experimenterat en del av och till pågående medan den semantiska parsningen utvecklats vidare etablerat en bild av hur det bra görs. Medan jag tänker att preferens mot systemet beskrivet här mer är relaterat att det är för mig välkända grammatiska konstruktioner jag haft med länge i parsningen.

Vi kan förövrigt se likhet med LCS diskuterat nyligen där vi ju har CAUSE operationen. Ex. CAUSE A GO FROM B TO C vilket ungefär bl..a kan motsvara ex. tidigare där Danmark fick stridsvagnen att förflytta sig in i bunkerna. Denmark makes the military vehicle to move from A to B (där vi säkert propagerande mening uttrycker tense separerat från orden).

Åkande in i en bunker sådär undrar jag om stridsvagnen inte riskerar att get attacked. Ett tillstånd etablerat av vad ett verb-genomfört kan av och till representeras av värden lättare att tänka sig en närmare numerisk representation av: Ex. en plats på kartan. I andra fall behandlar vi dem verkligen mer som vi läser hoppande in i mening och vid behov tolka ut djupare vad tillstånden tycks visa (vi kan lätt nog rationalisera varför vi ogillar en rollkaraktär men det är ofta en preferens etablerad långsammare oavsett enstaka grovare omoral). D.v.s. tillstånden kan ses som den upparbetade operationen av händelsen för en entitets tillstånd.

Att engelskan tillåter oss att uttrycka passiv form med förutom om be också get är därför inte ointressant: You get fired / sick / fat if you do B. Tråkigt nog är nu give så tydligt mer agentativ för varje subjekt i sig: Vi sitter inte "passivt" och gert saker. Så vi har verkligen bara "get" här förutom mer tillståndsupparbetade be.

Emellertid kan man välja att se propagering till stånd enligt primitiver likt de i ex. att vi propagerar resp. som en get händelse. Av och till passande dessutom ganska bra med hur möjliga problematiska tillstånd uttrycks. I kontrast är ett tillstånd motsvarande be den beräkning vid tidpunkten vi tar ut vilket kanske för samma tidpunkt senare kan beräknas bättre när vi kan bedöma hur olika entiteter talande predikterar händelser framöver eller ev. korrigerat vikter för förtroende (eller mer konkret kastat ut någon entitet publicerande mycket som visar sig "problematiskt").

Så jag antar att i någon mening vad pansarvagnen fick av Danmark var instruktioner om att köra in i bunkern. Eller vad den fick av föraren: en förflyttning eller "drive event". The military vehicle [mindre aktuellt i nyheter men vi antar likväl ett ID här] number 1423 gets movement into underground facility eller något liknande.

Jämförelsen med get kändes meningsfull för mig när jag funderande över propageringen. Men det finns andra liknande jämförelser man kan göra också i konkretiserat längre från praktisk implementation men kanske intressanta ändå:

Military vehicle number 1423 was Mover at_time_unit moving_path

Inducerande vad som kanske egentligen uttrycker eller "gör" samma sak: Hur resp. händelse påverkar tillståndet från en punkt till en annan. Här genom att göra om den till en roll för aktuellt verb: Mover istället för att get händelse. I en annan händelse kanske pansarvagnen står still och tar en annan roll [ångrande att jag valde ett fordon som exempel här som var mover innan] som Container för blommor eller liknande. Eller sönderskjuten potentiellt ej ofarlig lekplats för barn.