War bias skrämmer med U-hjälp bort engelskans positiva bias

2015-03-27

Komplettering: Rörande öarna Kina bygger går det att göra en annan - tänkbart mindre trolig och i praktiskt ev. inte skild såväl som jämförbart problematiskt - tolkning. Att man passar på sista åren som vedertaget instabil aktör som tänkbart kanske kan göra lite hur som helst fortfarande mer distansierad till vedertagna system. Jag säger ej att jag håller det som troligare än att man - diktaturen - bara gillar att plocka åt sig utan plan på att hamna i en verklighet där något i egna politiska system eller internationella samarbeten hindrar än. Men därmed inte sagt att det behöver vara fel oavsett det. Själv har jag som sagt ingen åsikt om vems territorium det är även om det hela lämnar en del att önska i regionens säkerhetspolitik. Ex. vet jag inte ens var dom omstridda gränserna ungefär kan tänkas finnas. Och nationell säkerhet relativt världen utanför det egna landet är ju rent allmänt den korrekta domänen för ett försvar medan självklart ev. civilt-missbruk av den är fel såväl som säkert kostsamt. Jag känner mig lätt - lite initialt - försiktigt positivt: Att skapa och bygga är ju bra - Utveckla något kommande generationer kan ha nytta av. Kanske kommer det marinforskning också kring miljö eller annat viktigt? En bra sak här kanske kan vara att göra ett FN-vapenembargo så att övriga asiatiska länder inte riskerar att slarva bort sina vapen om Kina eller någon annan kommer och krigar runt i deras länder. Det verkar ju vara en lösning man tror på för Libyen: UN Draft Resolution Would Keep in Place Libya Arms Embargo.


Kompletterande Ej säkert att engelskan har ett positivt bias såväl som "hela EU's", "hela USA's", "hela världens" ekonomi går snart - mycket snart kanske - helt sönder - bias jag förr här av och till genom åren berört har vi såklart risk- och high-intensity bias i generell mening för kontext snabbt intresse ska fångas (ex. film-reklam eller nyhetstitlar). Ett bra såväl som fyndigt exempel fångande något av dynamiken kring relativt inflytande rent allmänt just nu i regionen:


"Wall Street Journal
Vietnam Plays Key Role in China-Japan Aid Battle
Wall Street Journal - ‎14 hours ago‎
HANOI, Vietnam—In the battle between China and Japan for economic pre-eminence in Asia, Vietnam is center stage. Beijing and Tokyo have plied the country with investment and aid, with an eye to building up low-cost manufacturing bases there."

Artikel refererad: Vietnam Plays Key Role in China-Japan Aid Battle
Men citerat från Google News.

Också om så klart när det gäller krig mer realistiskt är nyheterna om att Kina etablerar baser långt in i grannländernas territorium - eller artigt påbörjande välkomnandet av snart nog hela Asiens och kanske om ett par år Europas härskare vad vi nog bättre kallar för åtminstone omstritt territorium - vad som det närmaste året kan föranleda väpnad-konflikt ("krig") snarare än att strida med ekonomiskt stöd till gediget korrupta såväl som praktiskt cyniska - på alla nivåer - Vietnam som utan tvivel tar vad de får utan preferens till något av dem.


Lite kul att Kina plötsligt börjat intressera sig i Vietnam. Väldig kontrast mot hur det normalt brukar fungera i deras relationer sedan så många år nu: Flytta på er och håll käften annars skjuter vi igen. Kina utanför något enstaka minimalistiskt ordentligt utanför vad som intresserar dem för egen del (Peru exempelvis) har aldrig haft någon preferens till den här mer romantiska drömmer om en pan-global kommunistisk-wave. Åtminstone en del stöd näraliggande under 1960-talet (Korea och Vietnam under "inbördeskrigen"). Numera har det inte varit vänskapligt sedan många år. Förändring är vad som ska förstås ganska intressant. Ty kanske bryr man sig inte överdrivet om ekonomiskt expansion trots att jag tycker mig minnas att man borrar en bit in på Vietnams vatten. Utan om att etablera området som sitt. Jag kan dock så lite som hela konceptet naval warfar att jag ofta upplever det som lite svårtolkat hur man tänker sig saker och ting. Ex. tror jag ju inte att man bygger baserna på det ny-skapade landen för att de behövs där utan för att man bygger något och då vill man kunna försvara det. D.v.s. jag tror baserna är till för att försvara baserna. Etablera givet att man där existerar för att få större kontroll över vilka som kan gå i närheten genom att när så sker hävda att det är ens territorium. Men jag kan missa en massa grova mer än fina poänger svåra att skilja ut med dom här baserna därför att jag inte är särskilt intresserad av båt-krigföring.

RT: "Frekvens" vs "emotionell intensitet" för adverb och adjektiv i NP modifierande intensitet

Jag såg tittade snabbt över diverse publicerade studier inför att göra algoritm-förbättringar antydda i:


  1. Att skatta komplexitet för NP är svårare än ofta föreslaget
  2. Är "man" verkligen större än "woman"?
  3. Ej säkert att engelskan har ett positivt bias

Jag såg i en artikel jag lästa ganska ytligt och ej hela sökande efter särskild information jag upplevde mig behöva eller föredra att ha om den fanns att vi:


  • För koncept med hög emotionell intensitet såväl som hög "frekvens" när de också är associerade negativ mening tenderar att bottna ut den senare aktivitet därför att den första verkar så ensamt nog.
  • Vidare kan vi närmast överstiga något när mycket högt på båda för värdet "frekvens" bidrar med. Eller så vill jag förstå det indikerande att ett samband finns där EMI delvis men ej uteslutande drivs av aktivitet från frekvens vilket alltid har viss kostnad i all rimlighet hamnade på ett maximum jag tänker mig något lite under den andra.

Jag förstod diskussionen på slutet resp. bilderna och bildtext av man tog ut resultaten genom att avbilda aktivitet. Och i delar sådan aktivitet jag brukar förstå och tolka som motsvara när högre vad som ger snabbare responstid om man ska besvara något resp. med (om jag inte minns fel) lite sämre tydliga samband bättre priming (att relaterade koncept gynnas nära i tiden). Tänkbart har jag fel rörande detta med responstid: Kanske kontrollerar jag bättre och följer upp - artikeln är på arbetsdatorn i andra rummet. Men det är ett bra sätt att förstå den sorts aktivitet vi diskuterar när den verkar omedelbart.


Jag får implementerande ny algoritm avseende adverb i NP inklusive ev. terminering på adjektiv funktionellt som adverb i mening av intensitet samma - nära nog - undantaget att jag ej prövat med just negativa koncept vilket om jag förstod det rätt var vad man gjort i studien (när jag besökt arbetsdatorn igen i morgon får jag se till att hämta över studien och referera så får vi se andelen fel jag har här om den). Här är det inte aktuellt för mig att kontrollera ev. positivt - negativt bias utan det är aktivitet upp eller ner som är aktuellt. Om något är emellertid upp-aktivitets-ord positiva (ex. på ett adverb vanlig i noun-fraser är very).


Och det är i algoritm för mig inte riktigt en inlärd frekvens så mycket som frekvensen modifierad via roten-ur (frekvens^0.5 om jag tar fel på svenska ordet) och från summan av dessa för alla ord (som mätta utan utnyttjande bas, prefix m.m. eller än mindre stemming). Och vidare den sannolikheten WP (normaliserad p.s.s. att den troligare är smidigare jämförbar med emotionell intensitet) för att beräkna ett WE = WP log (WP) / log (2). Annan log-skalning för WE tycks troligt likaväl funktionell men jag har sedan evigheter alltid först prövat att göra den så här eftersom den normalt fungerar bra för språk (men bör inte riktigt inte tolkas som entropi eftersom den är konkreta värden vi utnyttjar: Snarare en skalning för att uttrycka något av aktivitets-reduktionen vid normalt alltid får växande på avstånd mellan neuroner, mellan ord vi ska minnas o.s.v.).


Och det är här WE som uttrycker ungefär stapeln för frekvens-sambandet jag såg i en av studierna för negativa ord jämfört med EMI.


Respektive WE och EMI har emellertid innan resp. båda multiplicerats med samma ord-beroende vikt inspirerad av hur vi uttalar ord något tydligare resp. dispersity. Det senare fångar troligen delvis (eller kanske större delen) av vad jag diskuterade rörande negativa koncept i . D.v.s. tänkbart finns något här som förklarar det även om jag inte riktigt ser varför (eller för den delen kontrollerat att inte motsvarande samband inte gäller positiva koncept vilket jag egentligen håller för ganska troligt och kanske normalt alltid så om meningen vi läser ut känns viktig för oss vilket jag kommit att se sådan länge här såväl som i annat generellt är lättare att uppnå via negativa gärna farliga koncept: Du är mindre benägen att chansa på att reklamen för ett nätcasino är korrekt snarare än hanterande bonus via särskilda algoritmer men för information indikerande en konkret risk chansar du gärna mer så länge det inte ökar risken även om det säkert inte minskar den).


Sambandet i storlek gäller emellertid för mig endast så länge jag behandlar resp. term WE och EMI var för sig. Jag värderar dem normalt alltid tillsammans och normalt förr tillsammans med en till vikt (bluelight intensity som dock tråkigt nog nu är någon generation efter de andra och svårligen - om alls - går att få i jämförbar skala så att den går att ta in: Men för ord snarare än bakomliggande koncept är det sak samma). Ty åtminstone adderar jag helt enkelt samman.


Att vi får denna verkan förutsätter (men värderar ej i mängd-påverkan d.v.s. positivt bias är fortfarande möjligt såväl som troligt) markedness effekten diskuterad i Ej säkert att engelskan har ett positivt bias. Att mindre troliga men negativa termer aktiverar bra när de väl kommer. Samma funktion som kan ge viss boost åt dem i EMI ger ett starkare uttryck i WE när modifierad via påverkan av funktion av kontext och dispersity.


Och jag tror egentligen att det är vad som är korrekt. Effektiv processande - här motsvarande högre WE - ger om vi betraktar från perspektiv av att utnyttja risk och möjlighet bredare en väg att prioritera snabbare hantering av information. Stressad-tid och vi tenderar att "medvetet" (ofta inte särskilt medvetet) välja snabb information. Bias mot risk och värde upparbetas dock tydligare separerat till kontext och ligger kvar gärna oberoende av vad nu direkt möter för information medan kontextuell aktivering motsvarande WE kan fall ifrån snabbare när det i sig ej är mål-relaterat lika mycket som vägen.


I all rimlighet bör man få något senare toppande för det emotionella när interferens till ev. pågående kontext bekräftat kommer. Det är möjligt att man såg något sådant. Jag läste detta ytligt d.v.s. sökande på frequency och sedan när till avslutande diskussion. Det tycks för mig att jag inte lagt märkte till det förr men för annat än N400 (med risk att jag namnger fel) brukar jag inte ens känna igen dom här begreppen för vad dom här.


Hur som helst och nu rörande vad jag känner kanske får en vikt på resp. term (d.v.s. mer av otestat resonerande) att vi summerar trots att jag just skrev att EMI rimligen kommer att tendera upparbetas tydligare är att för resp. sådan indikation just nu gäller att dess vanlighet när hanterat för dispersity som funktion av kontext är en indikation för hur vi efterföljande kommer möta risken eller möjligheten. Det ger en bättre bild av den. Hög relevans just, vanligt förekommande tillsammans med högt värde eller hög risk är inverkande faktorer.


Taggarna sist för weapon effect, primacy effect, propaganda-effekten (som jag för den senare approximerar in diverse relaterat oavsett tidsperspektiv inkl. vad som ibland kallas frequency effect).


Att modifiera upp EMI via något exponentiellt eller multiplikation känns spontant elegantare och mer riktigt. Men jag har allmänt redan en ganska beräknings dyr preferens för att dividera och multiplicera när det motsvarar hur jag tänker och ett av få områden jag bättre brukar undvika det är mina normalisera vikter i sista steget beräknande som WE ovan. Så tills de eventuellt visar sig mindre funktionella adderar jag dem.


Här får det den mindre pedagogiska bieffekten att lågt värde eller låg risk men trolig i kontext kan propageras ganska högt som EMI. Dock är nu inte vad jag propagerar vad jag kommer använda just för detta och heller inte exakt vad som kommer propageras ut till den globala värden utan nu adverb resp. en särskild undergrupp av adjektiv i noun-fraser för att få ett värde som därefter ska påverka själva substantiven (noun om jag tar fel på begrepp: Jag var aldrig intresserad av grammatik i skolan och egentligen inte nu heller annat än att slå upp resp. vid behov räkna associationerna för depency-projektioner - men trots dyslexin fick jag fyror ändå).


Rörande när ett adverb modifierar ett annat avseende en riktning eller den andra såg jag i en annan artikel att en vikt-faktor utnyttjades efter utvärdering bland några fler alternativ. Vikten hamnade på cirka 0.35 vilket ungefär motsvarar dispersity för very, much (som förövrigt ligger på ungefär samma EMI båda resp. ]0,1] för kända ord). Och om det egentligen är samma sak (vilket jag fick för mig men det var inte helt lätt att säkert se i artikeln) men att vi här utnyttjar ett värde per ord (att man kan få en vikt hygglig för alla ord torde bero på att diverse ord som bl.a. very är väldigt vanliga) kan man spekulera att en alternativ beräkning än den jag gör kanske är rimligare.


Att oavsett om resp. av två ord båda verkande ex. upp i aktivitet värdera den sista mer och betraktande den första som en indikation om att den ska gå upp från sitt kontext. Det är inte alls orimligt. Samtidigt är närhet till adjektiv resp. noun kort. Och när nu flera adverb uttrycks tillsammans finns ett samband till det. De är meningsfulla för den som skriver och mer att läsa. Vidare tänker vi oss konceptet very much (som självklart är ett koncept i sig själv oavsett orden) håller jag det som lite löjligt att tänka sig att man mer logiskt resonerar om hur very påverkar much. För "verb" av typer som can, could m.m. har vi liknande man kan pröva och många gör vilka emellertid för en jämförbar vikt som funktion av WE, EMI (och BLI) rangordnar dem väl utifrån omedelbart troligare aktuell nu (med ett par från dessa tillsammans med ungefär lika många liknande ord som avviker besvärligt oförklarligt samt två som avviker p.g.a. att de samplades på väsentligt mindre data eftersom de lades till i erkänt inom ngram-recognition väldigt sent). Emellertid i snabbt-arbetsminne är upparbetat kontext med interferens mellan koncept vad som etableras fortlöpande och med viss fördröjning. Det kommer mindre mellan resp. ord oavsett adverb-adverb eller adverb-adjektiv och deras närhet motsvarande rent topologiskt mellan våra neuroner bör därför också motsvara just som de står i meningen - väldigt nära varandra - och givet det har vi heller inte just här och nu för orden möjlighet att direkt utan att bryta och fundera att ta ut deras kontextuella avstånd eller ens likhet och likhet och distans mellan dem som koncept i stabilt långtidsminne.


När vi lämnar frasen - här NP - bryts emellertid möjlighet till vissa grupper av priming effect innan verkande. Och en konvergens samlande upp aktivitets riktning gående mot koncepten slutförs. Nu är mer av tydligare arbetare prioritet som normalt. Jag menar därför att när vi för samma ord till "begrepp" likt väldigt mycket eller litet mycket handlar det mer om att de jämförs och kan påverka någon form av konvergens dimension som propageras framåt (ex. aktivitet uppåt som kan öka på efterföljande adjektiv eller kanske ett substantiv).


Dock kändes det mer osäkert - även om värdena verkande för mig för några fåtal jag testade bra så tillsvidare nöjde jag mig med lösningen trots att jag räknat med något jobbigare - hur vi bäst hanterar DOWN adverb föregripande UP adverb eller adjektiv. Den emotionella intensitet i lösningen jag valde propageras vidare: D.v.s. uttrycker jag neråt aktivitet med ett väldigt emotionellt potent-ord (tyska-ner standardiserings-arbetet till detalj-fixering, svenska-sönder) så reducerar det inte emotionell intensitet framåt utan propageras via addition som vanligt.


Medan däremot WE är vad som faktiskt kan jämföras direkt i snabbt-arbetsminne: Vi vet att det påverkar aktivitet omgående och effekt finns icke-diskriminerande oavsett annan effekt (om jag förstod artiklarna jag refererade tidigt rätt såväl som diverse annat man läst genom åren). Och om det är ner-aktivitet som förringar ditt folk eller din prestige riskerar du inte att ta medvetenhet om det utan kan ge korrekt respons tillbaka.


Variant för att reducera gjorde jag ej via negativ addition. Jag är inte säker på att det går att göra det heller. Gör vi positiv addition är det ju toppen för centraliteten för vad som motsvarande hos våra neuroner ger en fler-dimensionell form inte helt olikt normalfördelningen. Så toppen via fasta korta avstånd i snabbt arbetsminne kan för ord till ord tas upp direkt.


För less much med less pos-taggad adverb och much som adjektiv (vilket ej är den vanligaste pos-taggningen när de förekommer i noun-fraser men jag föregrep mig på det hela eftersom jag inte kom på mer "vanliga" test meningar: Så King Duncan got less much irresponsible green horses vilket gav lite udda pos-taggning) ger upparbetning additivt cirka 0.75 medan när less får reducera via WE och upparbeta EMI får vi cirka 0.5.


Men samma interferens har inte samma enkla optimerande möjligheter att reducera ord per ord (är jag något så när trygg i: Det här är ju snabbt processande). Så istället behöver vi göra något (jag tror är möjligt och kan ske i snabbt arbetsminne men som kan bygga på en mycket mer generell brutal missuppfattning om hur biologiska neuroner fungerar rörande matad aktivitet) liknande att propagera aktivitet och utlösa aktivitet p.s.s. egentligen (även om vi räknande inte behöver bry oss om det) men nu som ej ger interferens. Dock får vi också den andra mindre toppen från interferens på föregående neuron som nu kan ge interferens på den andra neuronen. Och cirka att jag tror (för att välja något som visade sig ge rimliga värden inför att senare mäta ut ev. behov av konstanter ev. som funktioner av något för att vikta in för den användningen det ska till) skattas via (1 - WE(föregående DOWN)) * WE(nuvarande UP). Första toppen motsvarar ju dess centralitet och topp precis som när de är i samma riktning. Medan den andra toppen är något så när längre som typiskt åtminstone för neuroner associerade visuell detektion vilket för vanliga ord ger ungefär samma samband (medan de för väldigt ovanliga ord ej skulle vara rimliga: Dock har vi ju ingen upparbetad WE värt namnet för dem då från första början).


Jag tror man bättre ser sådant här bättre förklarat betraktande resonerande kring aktivitet mellan neuroner framåt till interferens med olika topologiska polaritets-riktningar. Men görande den förklaringen blev det tydligt för mig att jag gärna önskade ta med de booleanska operatorer jag tror det var Max Planck som visade fanns kanske 2011 men som jag just nu inte minns har vad vi vill använda och jag inte ids slå upp. Man kan resonerande likartat utnyttjande wave-activity men jag gör aldrig det: Jag ogillar verkligen vågrörelselära. Min förklaringen i föregående stycke känns inte helt bra men den får stå som den gör så får vi se om jag kanske återvänder till. Ovanligt mycket osäkerhet rörande "refererat men icke-refererat och med tveksamt minne" gäller ju redan så...

Att skatta komplexitet för NP är svårare än ofta föreslaget

Jag skulle behöva en bättre complexity gör godtyckliga noun phrases för att balansera upparbetning av ex. emotionell intensitet mot named entity eller andra noun compounds mot slutet. Detta förslag med en mängd liknande går dock inte att använda:


"Noun Phrase Complexity (Ravid & Berman, 2010)
1. Mean length of NP in words
2. Mean number of modifier tokens
3. Mean number of modifier types
4. Mean number of subordinated lexical nouns
5. Head noun concreteness (Coltheart, 1981; Nippold, et al. 1999)"

Från: Language Proficiency and Linguistic Complexity Craig Lambert, Ph.D. December 19th 2014 Vrije Universiteit, Brussel

Feltänket är antagandet att fler av resp. ökar komplexitet men det stämmer inte. Har vi en modifier av adjektiv-typ modifierande noun och till den lägger en modifier varande adverb modifierande adjektiv gäller att vi nu har en mening lättare att processa. Går vi ner i åldrarna hos barn (men inte uteslutande bedömt från vad känt från studier där) kan rent av adverb föregripande adjektiv modifierande den varan förutsättning för att förstå och klara ut adjektivet.


Av samma anledning är längden av NP i ord ej tillförlitlig att använda. Fler ord kan öka komplexitet men kan också minska ord för såväl tillägg av adverb, adjektiv och noun (noun berördes lite längre fram medan jag utelämnande adjektiv vara tämligen självklart: Direkt nära adjektiv kan vara förutsättning för att efterföljande noun compound alls kan tolkas medan tidigt evaluativt-adjektiv kan vara motivationen som gör att vi överhuvudtaget läser resten av meningen).


Vidare finns chunks intränade till välkända ofta sedda koncept i sig själv som ex. Carl Bildt eller Hans Husman är identifikationen av detta som chunk effektivt och kommer med lägre komplexitet för åtminstone vissa former av adjektiv och föregripande noun ej del av named entity helt enkelt därför att det inte blir förvirrat eller meningslöst hur de påverkar jämfört med om vi istället anger med säg efternamn och läsaren p.g.a. annan person nyligen förekommande i nyheter med samma namn behöver hålla divergent representation uppe för båda när han går framåt.


Av samma anledning är längden på orden - om än ibland - inte alltid heller bra för att skatta komplexitet. Förutom en del rent visuella egenskaper jag känner är korrekt att utelämna (men är heller inte vad jag någonsin betraktat i detalj utanför titlar, abstract, och taggar för journal-artiklar, news-artiklar och blog-postningar) eftersom vi nu ändå måste flytta ögonen eller huvudet förr eller senare (och idag med html-innehåll känns det inte alltid självklart att man kan skatta bra här under förutsättning att man endast ska ta hänsyn till text utan formatering).


Och tämligen spekulativt om propagerar vikt från adjektiv med indikerad kanske högre komplexitet från sannolikhet, idf, diskriminerbarhet m.fl. mer eller mindre jämförbara mått som kan kombineras samman för att uttrycka hur vana vid är vid en term resp. hur sannolikt den i sig själv är marked förekommande i ett dokument (very förekommande i många kontext, dokument, meningar är föga marked och kan ha viss inflation medan en udda term kan märkas ut mer men vara dyrare att processa) är det tänkbart att den kostnaden givet emotionell intensitet hos termen gör ett längre noun-compound lättare att processa därför att det blir emotionellt intensivt och spännande istället för väldigt tråkigt.


Vidare anknytande till vad jag skrev i Ej säkert att engelskan har ett positivt bias såg jag för ett par timmar sedan gående igenom vad publicerat i hopp om att slippa få ett överdrivet antal lingvistiska studier gjorda av lingvistiker mer önskande från andra områden faktiskt men också att jag hitta en del bra från dom också jag inte redan sett samma studie gjord förr av tio andra (lingvistik är låg-budget i forskning jämfört med ex. medicinsk grundforskning så när man rör sig mer i lingvistik i deras område är i min erfarenhet kvaliteten såväl som unikheten riktigt bra mycket bättre) en artikel intressant åtminstone i problemformuleringen där man bl.a. pekade på att recall av vissa former av koncept gynnas av konceptet är välkänt för oss (uppbearbetning till ungefär som frequency effect m.fl. likartade företeelser) medan diskriminerbarhet och att addera tid på konceptet kan gynnas av oväntade slumpmässiga kombinationer av bokstäver (minns jag rätt meningsfulla ljud). Det kändes tilltalande att någon mer noterat problematiken även om jag inte såg någon lösning där.


Och om vi har två adverb efter varandra fyllande samma funktioner gäller ibland att de mer än ska tolkas tillsammans också är en ofta förekommande kombination vi bäst ser som ett koncept i sig. Dels därför att vi kanske kan få korrektare värden genom att erkänna den som en gemensam koncept (jämför med Hans Husman istället för Hans + Husman) vidare relevant för komplexitet därför att det är möjligt att dessa är snabbare att processa än resp. ord var för sig om de ej konvergerar till ett gemensamt koncept.


Rörande ord med prefix gäller trots många studier demonstrerande korrelation rörande olika frekvenser för prefix, själva bas-konceptet, resp. ev. form på slutet (ex. ir + responsib + able eller som jag föredrar att skriva dem ir + responsible + able om nu responsible är begreppet närmast centralitet för besläktade koncept och om inte vad som nu visar sig vara det) i och för sig demonstrerande argument för eller emot olika idéer om hur hjärnan hanterar dessa koncept (ex. skattande vikter för ord vi aldrig tidigare sett men ändå förstår därför att vi ex. mått responsible tidigare om än irresponsible) att samband rörande frekvens ej på vettig nivå (med något jag prövade) approximerar frekvensen för hela ordet från base (när dessa faktiskt ej är ovanliga och trovärdiga värden finns). Approximationerna går att få mycket bättre inte överdrivet svårt men just frekvensen räcker inte: Men inte ens mycket bättre känns dom i all ärlighet bra i annan mening än jämfört med när beräknande endast från frekvenserna. Detta endast jämförande prefix + base d.v.s. utan att blanda in koncept som också varierade på slutet. Text längd gav heller inte särskilt bra approximationer.


Givetvis kan man införa en super-operator inkluderande bl.a. not såväl som alla prefix som praktiskt för en tillräckligt andel av ord de används för (och där antonym finns resp. om inte har kontrollerats förhand) vilket möjligen gör det enklare att approximera hur vikter för base ska modifieras (eller alternativt tvärtom gör det mycket svårare: Jag vet inte säkert).


Praktiskt tror jag emellertid att det tänkbart kommer ner till att dom den relevanta motivations-drivande vikten för base är tillräckligt hög kommer komplexitet som skattat för hela ordet skapa praktiskt större intensitet än endast base har: D.v.s. i någon mening att ordet har lägre komplexitet därför att det känns viktigare, intressantare, roligare o.s.v. att läsa. Det är fel att kalla sådana lösningar själv-plågande men jag ger visst erkännande till att det kanske felaktigt kan upplevas så att implementera dem och väntar med att göra dem innan en hel del annat prövats ty för att detta praktiskt ska gå är man direkt i en multidimensionell värd där man i värsta fall också kan behöva ta hänsyn till similarity (ex. har vi läst så långt som till koncept i tycks det troligt att om det har viss rimlig likhet med andra tidigare koncept i allmänhet krångliga och tråkiga om än mindre så i vissa ämnen att sådan kostnad ej avgör negativt: Men jag väldigt mycket så hoppas att det visar sig korrekt när jag skriver att jag absolut inte räknar med att behöva göra en sådan lösning).


Det låter som jag lärt mig en massa här och delvis stämmer det. Men det finns också alltid en viss risk att tänka för komplext. Samtidigt har jag åtminstone några stabila indikationer på att det svårt att komma undan med de typer av enklare lösningar man hellre skulle önska använda.


Energi att lägga på att skatta komplexitet över frasen resp. per ord är dock när rationellt driven vad anpassas från vad man tänker sig göra. Jag har mycket bra viktsystem potenta i projektioner från bag-of-word och nätverk av koncept, resp. redan för vissa kombinationer under parsning mellan olika delar av meningen som jag önskar ta längre. Det är tråkigt att förstöra ner dom värdena när många fler olika koncept av varierade sorter (olika adverb-typer, adjektiv-typer och "för-noun") ska kombineras innan de får verka på sista NN-konvergensen eller konvergenserna. Ofta när jag nu läst studier från den lingvistiska kulturen saknas en bra praktisk uppgift att verifiera teorin mot istället räknar man lite fram och tillbaka ofta på hand-markerat data eller tittar om man får liknande resultat på annat data som man fick på hand-pos-markerat data vilket inte direkt är trovärdigt får någon bredare mer krävande användning än kanske just träna en algoritm av deras typ på en begränsad mängd pos-lablat data. Jag såg ex. en studie som argumenterade för att modifiera intensitet av ett adverb verkande på ett adjektiv (av en särskild grupp de också infört: ev. kallad strong) med en multiplikativ faktor av 0.30. Och visst jag kan förstå att de fick 0.30 när de gick över adverben därför runt cirka 0.30 ligger för mig very såväl som most med flera vanliga när de viktats upp från bl.a. frekvens, IDF, och något till välkänt trivial mått (jag använder nu mest för att se hur andra kombinationer fungerar) och sedan normaliserats men jag tvivlar ju starkt på att 0.30 ens är i närheten av ex. ovanliga adverb förekommande i få chunk med anormal association till adjektivet. Med en praktisk domän att tillämpa det på hade man säkert uppmärksammat problematiken eftersom det där inte räcker med att hantera ett mindre antal adverb man sorterat upp i kategorierna utan att alla adverb ska hanteras.