Olika former av osäkerhet: Att vinna det amerikanska presidentvalet via clustering och en mer praktiskt definition predikterbarhet

2015-12-31

Visual Analytics and Uncertainty: It's Not About the Data, MacEachren1, 1The Pennsylvania State UniversityI upplevde jag kan vara en god översikt av ämnet information och osäkerhet mindre ifrån matematiska definitioner och algoritmer som mer ontologisk-indelning av ex. typerna av osäkerhet citerade nedan (de är givna som faktorer men själva indelningen och citerad författare tror jag kanske är vad jag ej läst) och en artikel jag lägger undan att läsa annat än som nu ytligt:


"2.2 Levels of uncertainty
Courtney [Cou03] identified four levels of uncertainty,
[...]

(a) clear enough future: where point forecasts exist that are ‘close enough’ for the decision at hand (e.g., location decision certainty: will a Segafredo Café opened at Kärntner
Str and Philharmoniker Str in Vienna make a profit?);

(b) choice among alternate futures: with a limited set of possible outcomes defined, one of which will occur (e.g., given a choice of two intersections vs. a location inside the train sta-
tion for a Segafredo Café, which will be the most successful?);

(c) range of futures: with a possible range definable within some bounds (e.g., given an estimate that 35-55% of Starbucks patrons will switch allegiance, will a Segafredo Café be successful across the street?) and

(d) true ambiguity: given which it is impossible to even define the range of possible outcomes uncertainties may be both unknown and unknowable (e.g., how will Star Trek like food replicators that bring a cup of ‘real’ Segafredo espresso and pastry to you impact the success of physical Segafredo Café locations?)."

Förutom en bit skuren markerad av [...] adderades nya stycken för resp. typ.


En till typ av osäkerhet vill jag gärna addera utan närmare funderande om den hör bäst hemma i denna grupp eller någon av de andra:


  • Grad av möjlighet att konkret göra en verklig "förändring" / "manipulation" / "test" / "påverkan" av en faktor eller uttryck av tillståndet varande känd eller som tros påverka hur "världen" / "tillståndet" vi betraktar kan utvecklas till vid en kommande tidpunkt / tidsperiod.

Att faktiskt utifrån från predikterande scenarier göra ett eller flera mer eller mindre troliga än innan med hjälp av manipulation av vad som ligger under dom faktorer vi mäter och skattar ifrån är mer eller mindre min definition av riktad information.


Sådana operationer är vad som genomgående utelämnas hur diskussioner, referensböcker, universitetskurser statistik och mätanalys, för att istället se ex. sådant som att mäta attityder i en större population ses som en separerad operation jämfört med att exempelvis förändra ett politiskt budskap inför ett val bedömt utifrån åtminstone sagda studie.


Dock är sådana attityd-studier såväl som en mängd andra mätningar av verkligheten nu vilka naturligt och självklart för att vara effektiva behöver inkludera modeller rörande predikterbarhet (mätmetoder saknande detta är välkänt abnormt närmast pinsamt dåliga på att ge vettiga indikationer om vad man kan uppleva att de borde berätta något om (ex. resultatet i ett val utifrån vad folk menade nyligen inpå det att de tänkte rösta på). De grundläggande statistiska metoderna utan modeller predikterbarhet framtiden är helt enkelt undermåliga.


Emellertid är vanliga metoder för att prediktera framtiden utifrån modeller heller inte självklart nödvändigtvis väldigt bra. Inte sällan kan de vara lika dåliga dom.


Men för många problem går det att faktiskt pröva modellerna genom att dra slutsats om något man kan göra för att utnyttja informationen. Och därefter bedöma om metoden indikerad för att förändra en indikerad framtid eller situation just nu fungerade. Fungerar de flera gånger ger de tilltro till modellerna. Ibland kan de gå att göra avgränsat.


Andra gånger kanske det ej enkelt går att bedöma effekten av metoderna man upplever indikerade förrän senare: Exempelvis efter att det politiska valet i tidigare exempel gjorts klart. Denna osäkerhet handlar mer om (menar jag är ett mer rationellt tänkande för att komma närmare praktiska värden realistiska såväl som ej tappa värde av vad som mäts på vägen till metod därför att det går åt tid, sämre koppling till mätning finns m.m.) osäkerhet om hur man kontrollerar att indikerade metoder för att hindra eller förändra predikterad troligare framtid fungerar / kvalitetskontrolleras i tid för att det ska gå att förändra för korrigering till "rätt" framtid: Än om osäkerhet för:


  1. Hur vi mäter och skattar tillståndet just nu i världen.
  2. Hur vi matematiskt mäter och beräknar fram för tidsperioder, "tillståndsövergångar" (jfr transfer entropy m.fl. algoritmer) information, redundans, diversity och övriga besläktade "mått" / abstrakta koncept relaterade mängden information (eller osäkerheten).

Låt oss konkretisera med en algoritm som ej relaterat detta är aktuell för mig men väl aktuell praktiskt i övrigt: Ord-vektorer (här cirka 20 000 - 40 000 stycken ord i varje vektor för varje resp. byggda från text-data i och runt ordet. De indikerar om datat är aktuellt och pågående just nu ex. ämnes-relationer aktuella för ordet och deras förmåga att diskriminera det mot andra ord. De kan - beroende på hur dimensionerna byggs upp krävande bäst lite extra utanför bag-of-world - indikera attityder florerande i grännskapet möjliga att bygga vidare från (men ej den optimala metodvägen för det alls). Emellertid oavsett alla frågor relaterat information och osäkerhet för detta har vi också en osäkerhet relaterad mängden typer och mängden token vi har fått in samlade för resp. ord d.v.s. datamängden vi bygger ifrån. Ofta hanterat via normalisering över korrelation (för ordvektorer normalt kallat cosinus similarity - men uttrycker vikterna sannolikheter är det vettigare att se på det andra sättet upplever jag kanske därför att jag lärde det första redan i statistikkurserna - kanske stokastiska processer).


Vetskap om mängden diskriminerande typer och data vi kan förvänta för ett ord är en indikation om stabilitet. Är det känt att vi vanligen får en ganska normal för orden mängd data över ett antal dagar kanske vi rent av konkret emotionellt upplever osäkerhet om vi verkligen fått ett korrekt sample för ordet för tidsperioden. Vi kan dock reducera osäkerheten genom att gå ut och mäta riktat för att kontrollera om vi haft otur samplande (eller kanske troligare oftare haft en datakälla död eller med problematisk anslutning för oss vi normalt kan sampla men som fallet bort eller givet havhugget data - eller som istället givit små hotfulla amoraliska ner till upplever jag ofta omoraliska angrepp på vår moral - vår spindla-webbsajt-moral pratande om straff-sidor likt de kriminella gäng som lynchar andra oskyldiga samhällskritiska medborgare som kämpat för en bättre värld ex. genom att protestera mot diskriminering i the Deep South under 1960-talet (jfr ) vilket jag en gång råkade ut för samplande membran-proteiner aktuella för signalsubstanser i vår hjärna viktiga för emotionell upplevelse del av mitt idealla projekt: Bekämpa den irrationella fienden humor som läsarna här mer känner från perioden jag var tvungen att göra humor själv för att försöka förstå dess bedrägliga natur). Vi kan reducera bort denna osäkerhet.


Men saknar vi historik för vad som är normalt är det ej säkert att vi i tid kan bedöma detta. Osäkerhet råder om vi faktiskt detekterat ev. under-samplade koncept, om vi vid misstänkt under-samplade koncept men där vi ej riktigt vet givet en begränsad tid (sampla data kostar verkligen upp till brutalt med tid även om riktad sampling mot särskilda ord m.m. via vissa idag "arketypiska internettjänster" ibland går att snabba upp även om de introducerar andra för resp. sådan "tjänst" systematiska osäkerheten vilka inte alltid bara är att söka sig bort från) valde rätt koncept att försöka hinna komplettera.


Breddade vi ut oss rätt i fördjupningen runt ämnen när vi söker förstärka säg vår möjlighet att bedöma vilka nästa "chunk" av diskriminerbara (i mening att de tydligt kan avskiljas rörande ett antal egenskaper möjliga att resonera till politiska frågor eller via algoritmer automatiserat ta ut dessa frågor för och vilka förändringar budskap vi kan göra för att uppnå förändring) Donald Trump tänker att rikta in sig mot. Ty som jag tror att jag kan ha diskuterat tidigt som vad jag upplevde att han gjorde under starten för att försöka få resultat är att:


  • Identifiera små till tämligen små men ej helt små väljargrupper.
  • Vilka diskrimineras av ett antal tydliga avgränsade frågor där man ganska enkelt kan tillmötesgå deras intresse via ett budskap som ej är komplicerat att kommunicera.
  • Och där budskapet man gör ej med icke-acceptabel osäkerhet alienerar andra väljare skapande en förlust i stöd.

Givet som jag vill se det här och nu en pågående process där upparbetning av värde existerar utifrån denna övergripande strategi. D.v.s. att får vissa möjligheten annars begränsade från risken att alienera andra väljar grupper vilket annars är menar jag allmänt i politisk-verklighet en risk som konkret är vad man har respekt för (medan jag verkligen ej tror mig kunna kategoriskt mena att man alltid tänker rätt här):


  • Med sådant stöd d.v.s. möjlighet att prediktera effekten över olika grupper efter identifikation av kanske initialt innan vidare analys ett hundra tusental möjliga cluster av väljare eller mycket möjligt för kunniga vana vid domänen rent intellektuellt göra detta utiliserande biologiska neuronnät hos sig själva och medarbetare resonera sig fram om värden man arbetar upp och risken såväl som möjligheten till värde från att ta kostnader från andra kanske större väljargrupper för resp. enskild fråga.
  • Värde givet att man kan föregripa och gå före i frågor ledande "politiken framåt" (jag önskade här uttrycka något av hur det kan upplevas som en emotionell egenskap tillskriven av väljare varande positiv - Ska inte presidenten LEDA landet GÅ FÖRE och VÅGA DÄR ANDRA EJ HAR BETALT ELLER IDS MED NOG TV FÖR ATT VÅGA? Jo så det är ej självklart binärt negativt värde även om det ej behöver vara trivialt att försvara detta värde.
  • Mer "konservativa" politiker kan uppleva det lugnare och säkrare - kanske nödvändigt givet satt situation - att följa efter. Riskerna har ju då kan tyckas redan realiserats allmänt för kandidaterna och att detta därmed ska vara "säkert" vilket dock är falskt p.g.a. av "inkompatibla modeller" (givet den ena blir den andra sämre):
    • Det blir möjligt för den som leder framåt - etablerar situationen pågående - att snarare för rätt frågor (med tur eller bra system) "lura" övriga kandidater att ta dessa kostnader utan att de någonsin får det värde metoden allmänt ger ex. Trump.
    • De saknar upparbetad effekt av alla frågor Trump prospekterat. Men de tar förlusten.
    • Emellertid för de typiska undersökningarna de "platta" modellerna ännu vanligare använder (samma junk SIFO m.fl. fortfarande gör föregripande vår val) går det ej trivialt att bedöma varifrån värdet för en "så bred" prospektör som Trump etablerat sina väljare i (tänk tillbaka på de cirka 100 000 cluster vi började görande det praktiskt bedömer jag ogörligt att följa förändring eller ens få en bild av var de kom ifrån och här länge de varit hos honom därför att mätning helt enkelt tar för lång tid för att fungera vid en "platt-tid" utan en modell verkande över utsträckt tid bakåt såväl som korrigernade sig själv via ex. metoder som riktad sampling verifierande sin korrekthet via predikterbarhet).

PC Principals förenings-metod i skoltidningen påstådda metodik för att sammanträffa intimt med kvinnor kan löst jämföras med detta. De väljer en fråga och ett antal cluster av kvinnor som kan tänkas vara engagerade realiserade i ögonblicket starkare engagement tillsammans med en annan intresserad. Frågan är nu ej kvinnors rätt i samhället utan snarare vilken fråga som helst där en "säker" / "enkel" politiskt-korrekt ståndpunkt stödjande en antaget / upplevt / och/eller verkligt svagare entitet finns (tagande en enkel återkommande roll: Hjälten) ex. vietnamesiska kvinnor i USA, kvinnor arbetande inom gruvindustrin, kvinnor arbetande i livsmedelsbutiker, homosexuella män fångade i en kvinnlig grupp de fötts med o.s.v. Metoden kan fungera både för spontant engagemang såväl som göra det möjligt att skapa ett gemensamt värde genom samarbete (clustrande kvinnor till bra grupper av kvinnor runt olika frågor och kanske inkluderande löst relaterade kulturella faktorer så som ev. religiös-association till "no-sex-before-marriage" tankarna). De kan i metodiken förlora stöd från lokala kvinnor som upplever resp. man "osäker" / "promiskiös" / "allmänt föga tillförlitlig födo-skydds-mekanism inför den tidsmässigt långa investering barn innebär" men metodiken kan betala sig genom ett pågående upparbetat värde mer än väl kompenserande för det.


Så hur besegrar man Trump? Vetskap och etablerade lösning ger valfrihet att välja vad man vill dela: Man kan göra ett mer effektivt val av åsikt som betyder mer än det gör antagligen åtminstone för tiden innan valet de flesta amerikaner har. Är om vi köper Trump som republikansk kandidat han bättre eller sämre än Hillary.


Hillary har jag ju redan uttryckt stöd för. Jag gillar kvinnor. Och kanske kommer hon på statsbesök här och vi ringar mötas på McDonalds eller var nu vår statsminister korrekt i diplomatisk kutym tar henne för att äta på hans favorit "restaurang" - Relationerna med hennes man minns jag från min barndom var "problematiska". En perfekt hustru för mig: Välbeställd, bossig så man kan ha henne att agga ut på en massa skit man irriterat sig över alla år (Nordkorea, Kina, Ryssland mer nyligen, Egypten, Saudiarabien, delar av Syrien, danskar m.fl. divergenser från sund mänsklighet). Säkert goda resurser att tillgå i hemmet också: Bra datorer, ev. möjlighet att allokera resurser för viktiga saker från departmenten o.s.v.


Samtidigt hur villig är hon egentligen när det kommer till att hantera viktiga politiska frågor? När det kommer till syriska flyktingar till USA är jag föga engagerad - i all verklighet hanterar de i organisatorisk-förmåga och ekonomisk-stabilitetständigt utmärkande starkare länderna i Europa - vi och Tyskland - (god generell politiskt do-ability över många frågor emellertid exkluderade alla som kräver projektion till geo-områden utanför de egna länderna där ex. vi bottnar ut redan på antal flygplan eller som vi pinsamt upptäckte under Libyen-insatsen möjligheten för försvaret att köpa in diesel till JAS utan att finansministerns godkänande i person vilket fodrade medias uppmärksamhet innan det blev gjort) och kanske gör skillnaden mellan Trumps resp. Hillarys åsikter realiserade föga till eller från jämfört med via som har realiserad do-ability i problemets "geo-närhet" (i mening av vandrings-buss-avstånd till flyktingskrisen) redan från vad vi tog emot innan vi utiliserade värdet bro såväl fartyg har för gränskontroll.


Hur är det med internationellt viktiga frågor? Är kanske Trump modigare än Hillary när det kommer till Kina? Verkar i all ärlighet Hillary inte lite otydlig jämfört med Trump här?


För mig känns det tidigt att som en intresserad utomstående med det större geo-avståndet lokaliserad i den europeiska kulturens äldre civilisation att skilja ut någon ännu.


Jag upplever att vad som är rätt för mig ännu i alla fall är att stödja både Trump och Hillary. Båda verkar kunna ha potentiellt värde för dom frågor jag tror är viktiga för världen, är mer intressanta och "roligare" att följa än typiskt för andra kandidater, är prövade och välpresternade i olika arbetsuppgifter från sina karriärer (brand-building i arena television - nog så viktigt för en president - resp. tror jag unikt för Trump hotell, fastigheter och sportartiklar - medan Hillary unikt har erfarenhet och värde som positiv-stereotyp för kvinnor - jag vill här begränsa mig lite som diskuterat några gånger sista tre åren att jag annorlunda från PC Principal faktiskt kan ha formats av att jag trodde mig kunna få som fler meningsfulla relationer med kvinnor genom att träda ner i feminist-frågorna och få lite varaktig ordening och effekt realiserad relaterat kvinnoförtrycket och fortfarande känner jag mig lite förvirrad här: Jag menar för en sak kan Hillary tänkas lämna Bill om än bara inofficiellt när valet är avklarat? - resp. faktiskt arbetat med utrikespolitik i mening av uppgifter involverande att officiellt representera USA såväl som politiskt övergripande ledande arbeta inkluderande möten och interaktion med representanter från andra länder vilket jag tror kan särskilt när några men ej överdrivet många år hunnit gå kan ge en förståelse av hur saker görs grundad i en reflekterad erfarenhet som kanske kan minska risken för bortkastad tid eller misstag).


I domänen av war face / war dancing (jfr Hillarys Krigsansikte) har ju som vi vet Hillary av och till kritiserats för att bossa runt med flygplatspersonal. Och likartat imponerat på mig när hon verbalt-misshandlat journalister. Sådant är trygga indikationer om att hon bra ska klara av saker och har jag fått för mig kanske ha bättre naturliga förutsätter än Obama haft (Obama är ju som jag ibland är lite undervisande - Kanske en konsekvens på att vi båda upplever sig - ofta för mig i alla fall korrekt så - veta mycket mer än folk vi föranleds att kommunicera med - ex. dig och andra läsare - men att klara att effektivt från de kortare personernas kanske inbillat ofta högre intensitet trovärdigt klara att be folk att dra åt helvete är en annan sorts värde). Trump tvivlar jag mindre på här: Han gillar situationer med intensitet runt honom (detta kan kanske upplevas som diffust dåligt men det tycks för mig etablerat som välfungerande personer under kris där de får fram energi och fungerar praktiskt väldigt bra medan i kontrast många andra situationer till vardags där samma personlighet kanske presterar lite sämre egentligen ej är särskilt krävande utan vad etablerade funktioner klarar av med eller utan - kanske ibland bättre utan - presidentens intresse).


Båda känns coola och jag vill ännu inte - om någonsin - ta mitt stöd från någon av dem. Jag stödjer tillsvidare båda. Rent av att jag kanske donerar en liten symbolisk summa till resp. av dom. För att om jag känner mig tvingad att smalna av mitt stöd göra det igen till den som kvarstår.


Välj Hillary för en gladare ekonomi i en vackrare lugnare värld där politiker förstår varandra med hjälp av Hillarys större än närmaste tre - fyra manliga presidenter språkliga potens..
Skapad av Konstnär HH till Slanta Upp Hillary för ordning och reda i USA

Om resp. kan förbättra sig i något är det att bli tydligare - vara väldigt konkreta - i frågor kritiska för hela mänkligheten: Försvara och Etablera USA's roll som den som löser problem vi gamla förslöade kulturer i Europa med flera regioner i världen ej längre vill klara av att göra själva. Exempelvis hantera Nordkorea och Kina medan jag tror att Obama's nuvarande strategi för bl.a. Vietnam är sund.


Medan jag för Nordkorea egentligen ej kan bedöma samma sak trovärdigt medan jag upplever honom vek och undanfallande mot Kina även om jag också finner mycket sunt - motsvarande sådant jag pekat på - föregripande honom så ni läsare ej förvirras i vem som är The Big Dog när det kommer till att undervisa upp er om komplexa frågor - som att påbörja etablerandet av Japan som militärt balanserande faktor i centrum av samarbete flera geo-nära länder som en fall-back-lösning om kineserna ej klarar att nå upp till de fulla kognitiva och emotionella kraven införande av demokrati fordrar kanske behövande i värsta fall flera hundra år till ovanpå tusentals år av "civilisation" innan de hunnit blivit civilisations-vuxna. D.v.s. i sammanfattning:


  • Lär av Obama där han gör rätt: Läs in är här på dom stora frågorna (ni får plagiera mina idéer även om det självklart är ni med eer större organisation som bär ansvaret för att införa med vettig quality assurance - De bästa idéer kan bli katastrof om man slarvar).
  • Utnyttja er personal och kunskap till att konkretisera trovärdiga lösningar på dessa frågor.
  • Kommunicera dessa ex. i New York Times, Washington Post, The Guardian, som jag av och till läser.
  • Framgår en av er som starkare exkluderar jag bort den vekare - kanske defekta - kandidaten och ger segraren en extra donation: Säg $10 US (* en okänd hemlig konstant jag ej vill skriva ut eftersom nu det större värdet nu är att vinna över en krävande mycket kvalitetsmedveten bedömare av er: Även om ni senare förlorar valet vet ni efter det ändå att ni var bäst).

Känner ni er osäkra behöver detta ej ses som svaghet hos er. Er osäkerhet är Vårt värde! Det kan vara ert omedvetna som försöker berätta något viktigt: Ni kan behöva en stark resurs nära er för att hjälpa till när det behövs.


Att skapa värde från sådant är nu presidentens-kanske viktigaste uppgift. Då tar ni kontakt och jag hjälper er konkretisera rätt lösningar på rätt frågor för att världen ska bli säkerhetställd som den redan borde vara idag. Först gör vi Asien - säg halva närmare heltid första president-perioden och därefter strö-timmar - och skapar upp en mognads-inrättning för att stabilt under en avgränsad period föra dem gemensamt in i demokrati (lite som en koloni men med ett moraliskt korrekt epitet representerande riktiga åtgärder som betyder något som undervisning i demokrati m.m.) och sedan danskdjävlarna som jag alltid stört mig på och tror håller på med en massa djävulsskap (korrekt term bland väljare är i fri-svensk översättning Anti-amerikansk pro-ISIS terrorism - Och danskarna kommer ju utan problem rätt in i USA när helst de vill - De kan tilloched utnyttja militära flygfält del av NATO... Rätt förklarat massor av stöd hos väljarna som kommer visa sig) hemlighet (bara en sådan sak som att de smilar upp sig med en vacker men föga funktionell tågstation i Köpenhamn medan den naturligt ärligare svensken år efter år ej flyr från att skämma ut sig med Europas kanske fulaste största-tågstation-i-huvudstaden men som likväl antar jag - annars förstår jag ingenting alls - är oerhört effektiv och välfungerande jämfört med danskarnas såväl som alla andra liknande skapelser som prioriterat mer normal skönhet.


Riktiga otäcka små gynnare som mina modeller lär indikera och visa när jag satt dem rätt färdigt genom att skriva upp mer av total mängd corpus med rätt dansk-åsikter här och runt om på internet.

X: Hus-gulingen

2015-12-29

För oss födda under 1970-talet - det är min födelsedag - började en särskild prövning och härdning från dagis till grunskola i en mycket särskild kulture egentligen aldrig på sådana nivåer levda ut någon annanstans än i skola och kommunala fritidsverksamheter: Barafota hippies kunde ibland komma till dagiset från kommunen för att spela infödings-instrument, en ej otroligt kommunistisk-infiltrations-operation för att försvaga västs försvarskraft kallad Fredsboken ansågs allmänt "bra för oss barn" oavsett allmänvärnplikt trots att jag tvivlar på att annat än få egentligen hade läst den med ett kritiskt sinne. Dessa två exempel säger egentligen allt (och jag talar här som till 50% hippi vid sidan om min andra sida så något olämpligt bias har jag verkligen inte).


Lugnande nog tycks vi inte behöva ifrågasätta argumentationen - eller den utlärda vetskapen - rörande de racistiska paradigmet. Av allt att döma är gulingarna nere i Kina lika benägna till att göra sig hus-neger som Sydstaternas fråb afrikan släktande slavar. Riktigt veka husnegrar oavsett grupp, land och år för åtminstone dessa två. Annat är det med Malcolm X som vi verkligen kan beundra: Tveklöst är han Engelsk - Engelskmannen med maximal-topp med Winston Churchill har alltid klarat att stå för sin rätt. Inget kinesiskt eller afrikanskt över Malcolm X. Eller om han kan vara skotskt också: Det fodrar personlig styrka och dignitet för att återkommande regelbundet genom historen gå ut och förlora mot engelskmännen utan att ge upp. I år förlorade de igen precis som de alltid gör av och till genom historien. Beror nu på om man tänker sig att Obama i Vitahuset är mer av en seger eller om man upplever att Obama är mer av husneger givet att nu enorma rättsövergrepp mot färgade i USA tycks fortgå utan överdrivet motstånd.


Faktiskt - Emellertid självklart självklart verkligen inte en nyhet för någon - har vi förutom kust-kineserna med sina hus-gulingar (inte minst har vi dem i delar av PLA ofta med rent biologiskt såväl som modernt historiskt släktskap på individnivå in i partiet) fullt med hus-gulingar i Tibet. Mer husneger än Laman - ständigt som sådan uppmuntrad som ledare av kommunistpartiet med väldigt tydligt nästan lite provokativt överdrivet paranoia - kan vi inte hitta. De är sådana hus-gulingar att om de mot all förmåga gör något annat än att promonera till fiendens soldater och hålla upp en flagga framför dem så att de smidigt enkelt kan arresteras och tas ur konflikten som värde utan kostnad tänder de eld på sig själva (och gör det inte ens bra: Typ om alls görande sådant mer samlat för en boost väckande upp revolutionen).



"To understand this, you have to go back to what the young brother here referred to as the house Negro and the field Negro back during slavery. There were two kinds of slaves, the house Negro and the field Negro. The house Negroes--they lived in the house with master, they dressed pretty good, they ate good because they ate his food--what he left. They lived in the attic or the basement, but still they lived near their master; and they loved their master more than their master loved himself. They would give their life to save their master's house--quicker than the master would. If the master said, "We got a good house here," the house Negro would say, "Yeah, we got a good house here." Whenever the master said "we," he said "we." That's how you can tell a house Negro.

If the master's house caught on fire, the house Negro would fight harder to put the blaze out than the master would. If the master go sick, the house Negro would say, "What's the matter, boss, we sick?" We sick! He identified himself with his master, more than his master identified with himself. [Red. 100% som Hus-gulingen när han leker nationalistisk för att slippa tänka på att han är slav. Red. /Hans] And if you came to the house Negro and said, "Let's run away, let's escape, let's separate." The house Negro would look at you and say, "Man, you crazy. What you mean, separate? Where is there a better house than this? Where can I wear better clothes than this? Where can I eat better food than this?" That was that house Negro. In those days he was called a "house nigger." And that's what we call them today, because we've still got some house niggers running around here.

This modern house Negro loves his master. He wants to live near him. He'll pay three times as much as the house is worth just to live near his master, and then brag about "I'm the only Negro out here." "I'm the only one on my job." "I'm the only one in this school." You're nothing but a house Negro. And if someone comes to you right now and says, "Let's separate," you say the same thing that the house Negro said on the plantation. "What you mean, separate? From America, this good white man? Where you going to get a better job than you get here?" I mean, this is what you say. "I ain't left nothing in Africa," that's what you say. Why, you left your mind in Africa.

[...]

"But then you had another Negro out in the field. The house Negro was in the minority. The masses - the field Negroes were the masses. They were in the majority. When the master got sick, they prayed that he'd die. If his house caught on fire, they'd pray for a wind to come along and fan the breeze." [Red. Friskt tänkande. /Hans]


Sådant imponerar verkligen inte. Vad jag ser ner på. Någon som ej nått längre än till husslav skulle jag ha föga invändning mot att ha att raka mig var dag. Uppenbart någon som kan ha nytta av mitt föredöme för att bygga sin mänskliga ryggrad. Ett ansvar man tar. Ett ansvar som kommer med den mänskliga naturen.


Sedan vad är procenten hus-gulingar i de största städerna? Och rent allmänt? Är de 5%, 15% eller kanske rent av närmare 75%? Säg att de är 98%: Fortfarande är de utbottnade i storstäderna efter en andel mycket lägre än så av rent "tekniska-arkitektiska" orsaker i dom största städerna (besläktat med varför konflikt i städer gärna tenderar att fortsätta tills städerna är mer eller mindre helt raserade innan de tar slut).


Avsaknad av rättssäkerhet fodrar att varje medborgare är beredd att skapa och försvara sin egen mänskliga rätt till existens

2015-12-28

En titel vars mening och sanning torde vara självklar för vem som helst...



Inget är mer basalt / grundläggande i vår förståelse av hur samarbete och byggande av stat växer fram.


P.s.s. saknade det grundläggande i domänen men av fientliga kriminella - ex. för att understryka vad vi ej ska utesluta staten som just i Kina - kan en förstärkt ansträngning krävas för att etablera att ett sundare försvar av grundläggande rättigheter för en själv och andra finns.


Jag vill mena att där just Kina står idag kan det behöva ske väpnat och att man därför bör etablera motsvarande en väpnad milis. En sund storlek skulle jag spekulera bör inkludera cirka 11 000 000 personer med automatvapen.


Säkert lättare skrivet än gjort. Och något fullständig strategisk eller riskanalys har knappast gjorts av mig i alla fall vilket emellertid inte tycker jag ska ses som jag har fel här. Möjligen krävs mer i antal men jag tvivlar egentligen på det. Snarare skulle jag gissa att väsentligt färre är nödvändigt. Givet alla år av industraliserad nation kombinerat diktatur spekulerar jag att trots föreställningen om ett tämligen vapenfritt Kina att det finns lager etablerade lite varstans.


Det mest civiliserade - självklart omöjligt upplever jag - vore att bestämma en tidpunkt och övergripande area (kanske huvudstaden sensommaren) och sedan att alla som upplever sig engagerade i frågan träffas - resp. försvarande resp. rätt till att göra detta på den nivå som ev. visar sig nödvändigt - och gör upp om framtiden.


Komplettering: Pansarbrytande ammunition möjlig att skjuta med mer eller mindre "standardiserat-vanlig" automatkarbinat underlättar självklart görande det taktiska värdet av pansar i stadsmiljö void. Värdet av "riktigt-tunga" atomer frigörande energi i genombrytning såväl som dödande av förgiftningen alla i fordonet.

Red Star OS: Ingenting nytt men heller inget nytt rekord i svält

Som rapporerat av nyhets-producenter tror jag ej något nytt gjordes känt:



D.v.s. jag delar egentligen inte uppfattningen som uttryckts i andra nyheter (än ev. just BBC) att mer blivit känt i vad som nu presenterats jämförts med tidigare).


Jag tror men vet ej säkert att det möjligen ibland - men kanske inte alltid - finns en funktion som i skapelse av ett numeriskt uttryck binder hårdvara och ett uttryck av information (fil + OS) som fil tillsammans med ett resulterande gemensamt mycket sannolikt unikt uttryck (d.v.s. byte array - signatur om vi så vill). Emellertid är detta ej vetskap som bygger på något jag betraktat själv.


Kanske är det också det gemensamma mellan mjuk- och hårdvara som potentiellt över tiden är intressantare eller viktigare. D.v.s. vilken ansträngning / kunskap som krävs givet att en dator med något så när "typisk" hårdvara som tidigare boot:ats med detta OS eller annat att regelmässigt eller av och till boot:as med ett annat OS (d.v.s. ett typiskt normalt Linux utanför statlig kontroll) utan att det detekteras. Jag vet föga om något rörande det lika lite som allmänt just något om detta OS förutom vad jag vid några tidpunkter läst igenom samlat av vad som rapporterats. Det finns från första gången (sedan denna "version" gjordes känd) jag gjorde det en del diskuterat och länkat här:



Relaterat Nordkorea och El Nino tycks - men risk att jag tar fel - den senare blivit riktigt djävlig men kanske mindre problematisk kombinerat andra väderfenomen i Nordkorea än man kunde fruktat. Sedan tycker jag självklart idag: Rörande föda och Nordkorea är som vi lärt oss i omvärlden framförhållningen såväl som rapportering av nuläge tämligen rundimentär och antagligen vad man korrekt snarare än att felbedömande från bias ska ta som kroniskt tveksam rörande acceptabel nivå värde för befolkningen. Det fungerar alldeles för ofta dåligt i vad som är normalt.


Men vi har dock ännu att se om vi ev. ännu får se en ny rekord svält i regionen.


Sovjetunionen var bättre än Storbritannien

2015-12-27

Det är som jag skrev så här man praktiskt funktionellt såväl som enkelt och värde-optimerande den egna upplevelsen inte bara i krig utan också i fred kan avgöra vilken krigsmakt som är bäst:



Och jag har då inte sett varken UK eller USA kommande muscierande och dansande för mig i Uppsala och då vet jag att nu och bakåt tills den ryska armén kom och gjorde sin musikal-föreställning att de är bättre än dom andra.


"Sist har vi exempel på kultiverad manlig musik (vilka storligen imponerade på mig när de för ett par år sedan var och hälsade på i Uppsala: Det är när en militärkör är stark nog att nå ändå till Uppsala som jag vet och förstår att de kommer från och i kraft - En riktig stridsmakt så att säga och åtminstone jag som förstår sådant här vill se fler exempel - alla NATO länder minst då det just nu och troligen flera år är vi som har mer att erbjuda dem och då är det viktigt att du visar sin kraft för oss i en annat än i katastrof-situationer konkret verklig mening - här i Uppsala innan jag tycker vi ska hasta iväg och ex. gå med i NATO)."

Från: Hans av nästa jul: Krigaren och Horan - Dansa för mig


Kraften i Storbritannien känns idag väldigt åldrad...



Medan kraften av den här framställningen än idag imponerar... Men närhet i ren geo-mening betyder än mer. Kan jag se dem sjunga och dansa framför mig är det oerhört starkt. Språket behöver ej (men kan vara det oberoende) för det optimala vara i personen som du talar med eller litar på - Snarare är det geo-närheten som är det som tar optimeringen längst oberoende i upplevd kraft / makt / slagkraft såväl som romantik eller komik.



Det är kanske lätt att glömma det här men det gör det ej mindre riktigt. Varför det fanns en anledning att notera det här samma dag som de nådde till en ändå ganska liten stad. Ett exempel på något vi kan se och notera bland mycket annat att man valde att prioritera investering i sin utrikespolitik och försvar i förändringens (så vitt jag kan se d.v.s. medan kanske andra som bedömer sådant från annan information kan ha föregripit det men jag spekulerar att vi då var i förändringens tidiga huvudsakliga indikativa kulturella fas).


Därav också att jag år efter år - säkert mer än fem - sex år - av och till här såväl som via annat föreslagit att Sverige (också därför att vi är ett export-beroendeland) borde införskaffa ett par fregatter och använda för att representera i andra länder.


Hur som helst kommer nog alltid UK och US verka lite svaga för mig tills jag sett dem komma hit och göra en musikalisk föreställning som jag konkret priseffektivt kan gå och titta på. Och gärna i pausen kunna inhandla någon kulturellt typisk artifakt till min samling (likt ikonmålningen jag köpte till ett korrekt-kultur-exporterande pris när Ryssland var här - En donaut och Beuwulf-översättning kanske för bättre lokal-anknytning). När jag sett dem dansa och värderat artifaktens upplevelse i samling relativt vad den kastade vet jag om jag ska ändra mening i om vi ska gå med i NATO.


Mer nedan - och kanske inte överdrivet mer heller - och valet hade kunnat sluta annorlunda...



Och något GEO-lokalt - havs-germanerna av idag - kulturellt förvirrade mellan sin vikinga-historia, amerikansk-film och en massa år utan krig:


Musikens mening

Musikens är nu krig - om inte romantik (och komik mer sällan). Om några andra grund-centraliteter finns känner jag dem inte. Högre intensitet än normaliteten av övrig tid. P.s.s. som språket när uttryckt i ord och uttryckt över många personer samtidigt men optimerande nivån lokalt.



Vill du ha ett bra försvar eller angrepp gäller det sett från det här perspektivet (snarare än endast se det som optimerare av syftets styrka) att ha bra musik och bra ord.


Att sitta och musiciera eller orda utan att syfta till att kriga eller romantisera är bara oseriös mental tungrullning (tungrullning är vad kor gör när de saknar möjlighet att uttrycka en för dem sannare mening).















(Commotion antar jag rent termonologiskt alltid ligger associerad konflikt i en mer konkret mening för mig men vi kan för den en bit upp liksom här se uttrycket för mötet konflikt och romantik.

Och slutligen den ultimata belönings-dimensionen vi kan optimera mot realisering av.




Emellertid optimerat mot maximum i mening intensitet - upplevelse / uttryck per tidsenhet - är makt just konflikt.


Förutom ev. om vi skulle försöka oss på att införa religion som en egen dimensions-realisering - hela kyrko-musik kulturen om vi skulle begränsa oss till Sverige vilket vi avstår för något helt annat:



Och med lite tur och kanske viss hjälp av SEO givande Obama en sund ingivelse i samband med att han söker runt på nätet efter något att lyssna på medan de växande allt tråkigare - pratande allt mindre om honom och allt mer om den som kommer - nyhetsprogrammen får passera bakåt.


Jag skulle nog avstå det och snarare se ev. association endast som uttryck av samtidighet mellan särskilda relasieringar och religionen / kyrkan. Har du inte bra musik tror jag mindre på ditt religiösa budskap.

Sådan är nu musiken - Intensitet




"Just because we're dancing
Doesn't mean that we're romancing too
Boy I hardly know you so I have to show you

That it's not as easy as it seems to be
To get all what you want from me
It takes more than one night, wait till the time is right
And right now I wanna pump it, pump it, pump it"

Att skatta storleken (?) av kulturen i skärning min generation, Sverige, och amerikansk musik-kultur... Så sällan nu på många år jag faktiskt ser den behöva konvertera något d.v.s. tagande ner den för första gången.



Hans av nästa jul: Krigaren och Horan - Dansa för mig

Sexton i magasinet och en i loppet? Jag vet inte. När jag lyssnar kreativt på Madonnas lyrik kommer det till mig en menings-tolkning som oavsett vad det hela "ytligt" tycks handla om ändå mer har ett djup i Madonna tryckande upp det värde som översätter till reda pengar i romantiken.


En provoserande - svårt utmanande - tanke är att medan det kanske faller kvinnan naturligt att tjäna pengar på musik och musik lyrik på det temat är det mer naturligt för mannen - samhället försvarare och ryggrad snarare än hora - att göra det med vapen i hand.



Även i exemplet nedan när jag läsande texten inte annat kan tycka att temat är manligt och kraftfullt: Hon tycks säga att hon ibland går ut och skjuter lite folk. Känns det ändå som om egentligen sjunger om något sexuellt:



Sist har vi exempel på kultiverad manlig musik (vilka storligen imponerade på mig när de för ett par år sedan var och hälsade på i Uppsala: Det är när en militärkör är stark nog att nå ändå till Uppsala som jag vet och förstår att de kommer från och i kraft - En riktig stridsmakt så att säga och åtminstone jag som förstår sådant här vill se fler exempel - alla NATO länder minst då det just nu och troligen flera år är vi som har mer att erbjuda dem och då är det viktigt att du visar sin kraft för oss i en annat än i katastrof-situationer konkret verklig mening - här i Uppsala innan jag tycker vi ska hasta iväg och ex. gå med i NATO).



Sådan är nu The Human Nature i delar av vad jag kan kvantifiera rent numeriskt i analysen till något mätbart. Samtidigt gäller självklart att vill man visa sin verkliga styrka är det ej korrekt att sätta det omedelbara priset man begär för högt. I någon mening är det optimala priset det lägsta som ej förnedrar publiken genom att få dem att känna att de reduceras i värdering av dom själva och den nivån avgörs delvis i vilken utsträckning de förstår att de räknas och man försöker imponera dem.

The Hans of Last Kwanzmas


Zipf law, Heaps law, skalfria neuroner, Stevens power law m.m. Dimensioner i scenen, vad som sker och inlärningen

2015-11-08

Jag har så väldiga (i "normaliserad" mening till något ändå avgränsat) problem relaterat området av kurvor för frekvens-rank, glömska, inlärning m.m. så egentligen kan jag uppleva att jag borde avstå från att skriva det här. Men det är ett fungerande sätt för mig att efter-tänka lite och ha saker kvar (och om så existerar har jag också mindre behov av det: D.v.s. minns bättre).


1. Kostnad


1.1. Perspektivet åtminstone som diskuterat runt kostnad för att förklara Zipf-lag m.m. har jag lite svårt för. Det känns för praktiska lösningar ganska distansierat från det hela. Emellertid kanske vi förenklat kan se det besläktat med en "optimering" / "förenkling" hjärnan kan (antagligen lite samma sak men med en visuell bild vi kan göra här):


  • För känt koncept eller för något representerat konvergerar hjärnan till en neuron eller en neuron-grupp.
  • Dendrit-trädens komplexitet och därigenom mängden information de kan uttrycka är minst omfångsrik.

Antag, nu att vi vill ha kvar en neuron för en sådan konvergens men hålla öppet för olika skalor på vad som konvergerar. Enklast att se som ex. en stol vi ser på olika avstånd men ändå kanske rent av samma stol.


När jag gjorde detta förhand med papper ritande upp "ett perfekt dendrit-träd" (helt olikt något verkligt) gjorde jag det för att passa 2 som en faktor. Mest självklara skala varande träffande perfekt i mitten av trädet (som sträckt sig där mot dig i inlärningen) säger vi är ett. Träffande förgrening en nivå tidigare och ett steg åt sidan blir en halv. o.s.v. Struntar vi i normalt avdrift i vad vi signalerar och säger att allt sändande kommer perfekt rakt hamnar vi på resp. nästa steg med en "neuron" åt sidan (eller egentligen tror jag ofta del av neuron så här nära sista konvergensen men jag är för visuell perception inte säker).


1.2. Det här med kostnad som skulle besparas av rank i sig relaterat värdena - sparade mer effektivt - tvivlar jag lite på. Vill hjärnan göra en approximation av en double istället för integer växer dendrit-träden närmare lite mot vad som nu uttrycker det. Medan heltal eller som ovan sido neuroner sändande lika gärna är en mer funktionell / strukturell kostnad (man vet att dendrit-träden gör en mängd saker men osäkerhet råder kring stora delar av det emellertid vet vi dock att de gör bl.a. just booleanska operationer).


Det skulle här snarast vara formed som motiverar och motsvarar men där tycker jag hela kostnadsperspektivet falerar i varför vi just skulle se en poäng med rankdistributionen?


2. Här kommer vi nu in på det jag nog bättre skulle låta bli att skriva något om. Särskilt som nog inte bra klarar att motivera eller förklara det.


2.1 Likväl:


  • Säg att du slår på samma punkt med jämn takt mot huden.
  • Detta är nu en rate av en typ händelse.
  • Händelsen inträffar i en "rymd" hjärnan har en default approximation av inklusive dess dimensioner: Din hud och dina kroppsdelar. Du kan bl.a. lokalisera var det sker.

2.2. Emellertid kan du också dofta något. Du kan höra ett utsträckande ljud. Detta är sådant som har stor frihet i hur de förehåller sig till befintliga rum. Rummet kan definieras om efter dem. Medan om vi luktar på maten rör vi oss i en känd rymd: Vi förväntar oss vissa dofter och har vissa varningar. Doftens källa är förstådd och tydlig för oss.


2.3. Vidare och kanske ofta när det kommer till språk intressantare har vi också vad som närmast från hur väldefinierat det är uttrycker nära approximationer av dimensioner som för den typ av data som här avses uttrycker föga förändring.


2.2.ii. Detta kan vi se som "inlärning". Inlärning kan vara kort i tiden. Fortfarande kan dendriterna förändra sitt relativa avstånd men det förfaller i dessa fall snabbt. Ett till i tid kort exempel är när vi fölljer ett föremål över himlen. Om föremålet plötsligt dyker ner - vi kanske trodde det var en bit stjärna som föll långt borta vilken vi romantiskt kunde önska något om med alla dimensioner det kan föranleda - ljutande för att sprida explosioner runt om kring har vi det samma - samtidigt som det bör vara uppenbart att dimensions-rummet tidigare i mycket är brutet. Parabel-rörelsen (om vi antar sådan innan) har fallit, romantiska-dimensioner är borta, flykt kanske är aktiverat, eller kanske hämta vår "long-range-Tesla-charger"-beteende-aktiveras.


2.4 Nu blir det tydligare otydligt. Innan kan man nog se det mesta som möjligt här i två i alla fall även om det är svårt att veta egentligen. Ty jag säger att vi har exponenter i distributionerna som för 2.3 motsvarar i världen av Steven's powerlaw (och vi ska se det som uttryck där vi kan gå ner och få ut Feschner-laws utnyttjande Webber's konstant) av 1/2. Och för 2.1. 1, medan vi för inlärningen klättrar upp. Vi har högre världen.


All inlärning är i något steg synkronicitet. Det bästa sådana för inlärning snabbt är - menar jag - när motor cortex och prefrontal cortex kan ligga y synkronicitet utnyttjande resp. pathway för dopamin. Dimensionen är icke-trivial: Den är föränderlig. Men vi har en jordnära bild av nu och kan resonera (om än ofta nog tror jag bortom intellektuellt riktigt medvetna tankar när tiden är snabb) via motor cortex: Prefrontal cortex har en mängd spännande funktioner som ger möjlighet att jämföra över tiden, värdera risk såväl som värde (d.v.s. möjlighet att acceptera kanske rent av ganska medvetet förstådda osannolika modeller av världen för att undvika en stor eller vinna en stor vinst: Vi spelar ju också alla rationellt i black jack: Vi visar pengar, spelar lite, går iväg som vi har något att göra, ölar i baren så det syns mot bordet, och kommer tillbaka och får en god vinst och går därifrån: Finlands-färje spelande som jag kallar det - Ger alltid 600 kr om man inte gör som förväntat och återvänder / fortsätter spela).


Så låt oss ta några värden som exempel. Rörande denna typ av värden ska man i all ärlighet säga att som de normalt beskrivs i sammanfattande böcker, Wikipedia m.m. kan det mer eller mindre vara vad som helst (om man inte nå går in och verkligen smärtsamt detalj-studerar varenda bakomliggande studie till dem vilket jag heller inte gjort för annat än enstaka mer kända typer). Jag hoppas här att Wikipedia har några bra så jag slipper hämta mina Perception Psychology böcker


Följande två nära toppen i Wikipedia är så perfekta exempel på 2.1 vi kan räkna med (bättre än jag hade innan). Inträffar i en spatiell rymd modell (skal-fri) existerar för.


Brightness 0.5 Point source
Brightness 0.5 Brief flash

Fler närmare 0.5:


Vibrationer är ev. kanske likt exemplet jag gjorde (men det går att göra vibrations-försök som bör gå upp till att mer rate i rörelse över rymden):


[Red. Jag förstår ej försöket] Loudness 0.67 Sound pressure of 3000 Hz tone
Vibration 0.6 Amplitude of 250 Hz on finger

Bör i all rimlighet som uttryckt vara väldigt entydigt (man smakar på en sockerart - man luktar på heptan (klor-väte)) d.v.s. dimensionsrymd given med rent av associerade händelser för åtminstone heptan (man ryggar tillbaka).


Taste 0.8 Saccharin
Smell 0.6 Heptane


Ev. detta (men jag vet verkligen inte för beskrivningarna är så kort: Lika gärna att det är två exempel ej visande principen utan tvärtom):


Endast befintliga dimensioner kan användas för att bedöma ljus-källan (därav diverse välkända fenomen i perception psychology):


Brightness 1 Point source briefly flashed


Dubbel-socker-molekyler resp. salt. Båda ger oss något av inlärningen (de är dopamin-pådrivande redan i smaken): Därav att framgångsrika restauranger bäst maximerar reward learning genom att utnyttja dessa så högt man kan utan att annan smak blir "fel" eller att risk för hälsoproblem blir för uppenbara.


Taste 1.3 Sucrose
Taste 1.4 Salt

Bättre än ovna passande här. Lite av båda sidorna. Vad vi kan se komma in är vad som definierar rymden. Men vi behöver reflektionen för att få en bild av den i sin tur. Troligen vad vi normalt automatiserat höftar till med något som brukar fungera på vettig nivå (det är ju sällan rent av stora fel här betyder något).


Lightness 1.2 Reflectance of gray papers

Bryter befintlig världsbild. Stor förändring radikalt annorlunda. Inlärning.


Warmth 1.6 Metal contact on arm
Warmth 1.3 Irradiation of skin, small area
Discomfort, cold 1.7 Whole body irradiation


Men hur kan vi bedöma om något är annorlunda nedan:


Warmth 0.7 Irradiation of skin, large area

I en skalfri värld? Kommer det "kallt regn" välkomnar jag det med båda armarna omfamnande det. 10 s senare fryser man inte av det.



Och så motor cortex och mer synkronisring än så stabilt utan något särskilt får vi troligen inte. Både i prefrontal cortex göra något av en bedömning och så göra med motor cortex ofta i studier med dynamometer (så efterfrågat eller inte kommer bedömningen naturligt av hur mycket vi orkar när ombedd att ta i).


Muscle force 1.7 Static contractions
Heaviness 1.45 Lifted weights


Acceleeration: Själva rörelsen förändras. Potentiellt avvikande ut från själva modellen av scenen vi bedömer den ifrån. Oavsett hur elegant passande in med hemvanda domäner för vem som helst som läst fysik: Återigen dessa världen utan att tittat på vad dom egentligen gjort säger så lite.


Angular acceleration 1.4 5 s rotation


2.3 neuronal avalanches. I min handritade skiss över dendrit-träden med föregående neuroner och från det direkt 1-1 skattat till neuronal avalanches blir skal-parameter: roten-ur 2 d.v.s. 1.41421356237 (ev. kan man argumentera att en livärdig eller ev. mer korrekt lösning hade varit den harmoniska serien upp till 2 d.v.s. ((1 + 1/2) = 1.5 (1 är här den perfekta träffen neuronen precis framför antas göra alltid givet antagande avdrift 0) medan summan upp till tre skulle indikera en till sido gren mer distansierad både i djup och i bredd relativt den sändare som är perfekt i mitten mot själva toppen av dendrit träden. Dock under antagande att själva motsvarigheten vidare över flera neuroner beter sig egentligen bara som en neuron med ett ännu större dendrit-träd - hierarkiskt så att säga...


Medan jag nyligen läste att man fått 1.5 skattat (tycks för mig ett ganska gediget arbete sammanfattande och jämförande med referenser till tidigare arbeten här: Fler ganska nyligen föregripande finns också att hitta). Notera också vad man pekar på rörande korrelation krävande ett större "steg" i tid och rum (jag argumenterar hjärna att tid och rum är samma sak: avstånd i aktivitet mellan neuroner uttryckande just dessa egenskaper i skala - Vi kan rent av från RT-data roa oss med att försöka givet en noll-punkt resonera om hur mycket mer tid ett objekt är relativt ett annat eller hur mycket distans visualiserad som en tid vi tänker oss motsvarar):


Klaus A, Yu S, Plenz D (2011) Statistical Analyses Support Power Law Distributions Found in Neuronal Avalanches. PLoS ONE 6(5): e19779. doi:10.1371/journal.pone.0019779

När vi är i höga värden (enligt min tidigare diskussion: ej särskilt anknytande artikel citerad ovan) kan vi som en likhet att se mellan objektet som förändras över scenen (snarare än ex. trumma punkt formigt) till ny inlärning se fallet när den är på väg eller just bryter mot kända dimensioner (ex. med den fallande stjärnan som transformerades till en tysk stört-bombare).


Emedan 1.5 medan den harmoniska serien kan tyckas bättre ska man ej förakta vilken som helst lösning som innebär att man har 1/2 * något som grund-operation. Ex. (upparbetat värde + nytt värde) / 2 istället för att behålla hålla hela historien av tal lagrade för att få resp. nya medelvärde eller dyligt.



Hur blir det för språket?

Har vi någon power-law där språket typiskt ligger på exponent 1/2? Och hur mycket har den lagen med antagande om grundläggande upparbetad vetskap om "språkets bas-dimensioner" att göra?


Antal_typer / ( Antal_token )1/2 ) = K

Och är språket oföränderligt är antalet typer konstanta (ex. konstanta i meningen alla typer: ord exempelvis - vi förstår betydelsen av och inte bara hoppar över) medan antalet token d.v.s. ord som kommer oavsett typ är föränderligt så:

1 / antal_token1/2 = K'

Heap's law håller sig bättre än någon annan "språk-lag".


Det är trivialt att inse att ju fler typer vi behärskar desto lättare och mer korrekt kan vi identifiera en för oss okänd typ som mer eller mindre troligt en typ också ny för många fler (ex. ett nytt begrepp). Resp. från sammanhanget den förekommer resonera oss fram till automatiserat eller i hjärna via statistik och förståelse av grammatik, syntax m.fl. andra "funktions-dimensioner" vi kan hålla konstant om vad begreppet kan betyda. Kunskap är om vi så vill grund-dimensionen underliggande varje seriöst försök till att görligt kunna detektera emergence (likväl i ett QA-projekt inför en krävande generering snart skar jag ner cirka 75 000 koncept från min representation jag bedömde som föga inverkande för den och från diverse "samples" bland dem av och till defekta ner till cirka 29 000 000).


Medan vi för Zipf-law utnyttjar och använder dimensioner uttryckande något lokalt med en "skala" ovanpå denna. Där exponenten d.v.s. skalan så att säga är 1.


Mycket i övrigt bland allt vi jämfört här för uttrycken är ju tämligen varierande i konstanter o.s.v. Men jag tror de genomgående håller likhet i att de uttrycker en skal-fri egenskap där exponenten är den vi här höll oss till (jag tror sådant resonemang som här och normalt skrivet förutsätter att andra är konstanta men är inte säker: Jag har haft sådana rent numeriska små-problem i den här domänen att jag verkligen är väldigt osäker på vad i "vetande" som är ej i emergence: Jag tog rent av fram Scientific Computing and Differential Equations, Golub, Ortega, för första gången efter TDB: Precis som väntat ej ett bra praktiskt verktyg uppenbart tillgängligt för mig trots att jag minns konceptet av att göra ett Euler-steg först):


Hur som helst:


Neuron rakt framför skjuter ej alls. Vi har två på vardera sida omedelbart närmast lite bekåt och åt sidan. De kan ge ett om båda träffas av andra (eller den rakt framför om vi tillåter avdrift efter någon fördelning):


2 *1/2

Alt denna och den som är en 1/3...


1/2 + 1/3
0.83333333333

Och vi har fler exempel nedan som kommer på ett och går förbi. Men poängen är ju kanske inte alls för vad vi diskuterat här just att "nå över något form av sigmoid-värde" som får neuronen att avrfyra. Vi diskuterar ju och gör antagande och logik i dendrit-trädet. Så poängen är som jag ville se det här istället för att resonera om kostnads-effektioner och rank-frekvens-förhållanden att vi kan uttrycka olika skala för samma objekt. Objektet vara neuronen vi går in i konvergens till (och om ej ett objekt vad vi synkroniserar oss vidare med ex. pyramid-neuron för kontextuellt byte).


1/2 + 1/3 + 1/4
1.08333333333

1/2 + 1/3 + 1/4 + 1/5
1.28333333333

1/2 + 1/3 + 1/4 + 1/5 + 1/6
1.45

1/2 + 1/3 + 1/4 + 1/5 + 1/6 + 1/7
1.59285714286

Det vore ju ytterst elegant att ta dom harmoniska små serierna ovan (eller för den delen trädstrukturerna med sannolikheter jag också gjorde) enkelt direkt till något som ger oss 1.5 som en skalfaktor för neuronal avalanches. Emellertid avstår jag från det inte minst därför att jag tycker man har tillräckligt värde att ta över resonemang population av individer om man ska gå i detalj-data för hjärnan redan i en neuron. Jag tycker de kan säga mer än kabelekvationer, speak-trains o.s.v. som jag aldrig fullt greppat vad de egentligen rent generellt kan berätta för oss. Samma sak med lateral inhibition: Kraftfullt koncept och ytterst lokalt. Går saker mer övergripande i hjärnan finns ju vanligen data från tester på personer från mitt perspektiv bra mycket mer rakt på sak att använda (RT-data, reaktioner av rädsla associerat bildkoncept som kan översättas till ord o.s.v.). Därmed inte sagt att jag är säker på att det för den delen går att göra argumneterat vettigt eller om så att jag skulle göra det vettigt.


Här tycker jag också allmänt rörande dendrit-träden att man gärna ska välkomna om man ska gå "statistisk" istället för att göra talserier och enkla sannolikhetsträd att tänka sig ett idealt dendrit-träd i tre-dimensioner följande formen av normalfördelningen i tre dimensioner. Toppen i mitten för medelvärde är själva mitten mot en neuron rakt framför.

Komplexitet för koncept: Frekvens koncept tillsammans med sekventiella ord-modeller

2015-10-30

En till lite annorlunda komplexitet har vi för koncept av godtyckligt antal ord: Ex. en stad likt New York bestående av New + York.


Att ha frekvens för faktiskt förekomst av New York är praktiskt ytterst kraftfullt för mycket praktiskt. Emellertid för en människa gäller nu att för koncept vi har mindre erfarenhet kan vi ha föga representation av det tidigare eller aldrig förr mött. Och om konceptet representeras av ej få ord går efter "några tänkta steg" (säg för enkelheten några ord i konceptet) värdet av erfarenheten av själva konceptet som representerats av dess ord ner och vi får ut tidigare mer av att läsa ord för ord med mindre prediktion direkt till konceptet.


Ett trivialt exempel även om det kanske avviker något från vad man alltid vill se som koncept i den här meningen är om vi tillåter operatorer likt in, from m.m. i vad vi representerar (kanske därför att vi parsar ut dem och sitter och läser Wikipedia så mycket att de får lite egen mening så de kommer in våra biologiska nätverk). Exempelvis Persons of some type born in something who have visited New York.


Fortfarande tycks för mig övergripande frekvens (som parameter till något) vara i sig indikerande nog om ej låg (men förvisso om låg också sägande något). Här kommer likväl själva orden eller sub-ngram-av-hela konceptet i all rimlighet börja spela in och påverka övergripande komplexitet för hur enkelt vi läser såväl som tolkar ut exakt vad som avses (frågar någon dig senare om ett koncept som ovan minns vi det sämre än New York - Om du nu inte många gånger genom åren läst konceptet i vilket fall du säkert kan repetera det exakt).


Att väga resp. väg här mot varandra kan man uppleva är enkelt (vilket det egentligen också är även om det givet mängden koncept kan ta tid om man fel-tolkar sin förmåga att se programmerings-fel, logiska fel m.m. och sitter och genererar ut 500 MG tio gånger innan man börjar se värdet ännu en gång av att generera ut tidiga värden innan man låter saker generera ut dimensioner storleks-sorterade efter en mängd tid beräkning).


Önskvärt om än inte ända sättet eller för den delen det från alla tänkbara praktiska värden bästa sättet är att betrakta det enkelt så tillvida att vi endast väljer att använda frekvenserna för koncepten. Är dessa sämre kanske man dock väljer att komplettera med något extra för orden men jag såg ingen poäng med det (bl.a. därför att jag önskade dessa värden genererade ut från koncept-sannolikheterna: Att beräkna RT utifrån vikter "ungefär" av typen IDF och frekvens). Annars kan ljud-mönster eller kanske också mer esoteriska idéer om vad som påverkar något (troligen för de flesta föga praktiskt påverkande) som själva formen på orden, hur gamka små sample grupper av personer tycks vara när de lär sig ord m.m.


Så vi bildar sannolikheterna för ord på resp. position utnyttjande sannolikheten för resp. koncept. P ( Ord X på position Y | Konceptet det är del av ) o.s.v. över alla koncept.


Om vi som människa ska "välja" (implicit) att hellre utnyttja sannolikheterna för orden så att någon indikation av arbetet kan ges av lämplig vidare beräkning från P (första ordet på position 1 ) * ... * P ( sista ordet på position sist om inte när vi väljer att förenkla nöjer oss med första sannolikheten om konceptet endast består av ett ord) måste:


  • En skillnad som gör det meningsfullt finnas.

Märker vi ingen skillnad finns heller inte någon skillnad. Men det behöver ej innebära att ingen skillnad finns mellan resp. värde vi ska välja hur vi utnyttjar tillsammans. Primärt gäller att om en kontextuell påverkan finns upparbetad kan hela konceptet eller delar få större påverkan: Vi lägger märke till dem bättre - Kanske direkt ser ett del koncept - sub-sträng - av det större konceptet.


En myckenhet tämligen komplexa möjligheter rörande sådant finns närmare att text parsas men för ganska generella vikter vill man (eller jag) helst undvika det eftersom nu just inget kontext är känt.


Likväl bör en skillnad vi kan detektera och märka finnas. Annars varför skulle någon skillnad att beräkna finnas om meningsfull?


Jag föredrar verkligen den normalt betraktad som lite "sämre" äldre formen för hur sådant kan skattas: Weber's law. En orsak är att när ii som här (även om ej utnyttjat just här) har nätverk med sannolikhets-, similarity-relationer m.m. i sig uttryckande distanser, resp. distanser framåt i tid predikterad såväl som tid bakåt formas mycket av logaritiska och power-relationer i sig. Även om det ej egentligen ska hindra användning vidare tenderar jag att förutom exp för decay ofta virra till det och om kostnad beräkning eller under- / over-flow ej verkar troligt föredrar jag att undvika det därför. Vidare när man skattar framåt i tiden och försöker utnyttja samma relationer är den korrektare tycks det för mig rent praktiskt än man åtminstone enkelt för diverse andra former (inte otroligt relaterat risk att virra till det) medan där vi får "avvikelser" jämfört med bättre funktionsformer ligger vi ändå i domäner där mer kostsamma investeringar i beräkning krävs (lite som att vi löpande tidigt och sent behöver skatta exponent för power-laws även för något trivialt som frekvens - resp. kontinuerligt kontrollera om man går in i en ny domän från kontext eller bara förändring globalt över allt i alla sammanhang).


Så därav delta (eller om vi vill derivatan för den som från resultaten önskar integrera från övriga jämförbara "lagar" - skattningar hellre så undviker man onödig komplexitet utan praktiskt värde) av den effekt frekvenserna skattade från resp. typ har (via lämplig funktion utnyttjande dem). I relation till en normalitet vi bedömer det från.


Normalitet att bedöma det från är upp till potentiellt ganska svårt. Är det ett långt koncept och vi sitter med ett papper skymmande alla ord tre ord framåt är kanske dessa en god indikation. Lägger vi istället märke till något i mitten är det kanske indikationen? Men för enkelheten skillnaden mellan den totala skattningen över resp. ord relativt för konceptet som sådant.


Är skillnaden stor säger det oss (typiskt men jag vågar inte säga alltid här) att koncept-sannolikheten är ovanligt låg görande det "billigare" att tolka samman orden var för sig.


Är koncept-sannolikheten hög är komplexiteten lägre. Är ord-sannolikheten samlat hög är komplexiteten låg. Om koncept sannolikheten är hög är troligen ord-sannolikheten försvinnande liten jämfört med den. Så:


abs ( f ( koncept-sannolikhet ) - g ( ord-sannolikheten ) ) / f ( koncept-sannolikhet ) + g ( ord-sannolikheten ) )

Det roliga med mycket diskuterat i en mängd publicerade teser om hur vi tolkar ord och koncept genom åren. Med väldigt utna tvekan riktigt arbetsamma lösningar för att väga samman alla möjliga faktorer är att om man har riktigt mycket data av ett fåtal typer som just bara förekomsten av koncepten tenderar det i sig att göra bra mycket annat ofta försumbart. Det är lite skillnad praktiskt om man börjar för udda latinska beteckningar på något långt ner på några frekvenser mot när knappt bigram frekvenser håller värde. Värdet av det som dimension ökar. Mängden ord och koncept vi som människa möter är inser vi av det riktigt ordentligt.


Språk i hemmen för barn räcker knappast. Adderar vi tv och film skattande inlärningen tidigt räcker det ej heller. Skolan tar ju en försvarlig del av dagen. O.s.v. upp genom åldrarna.


Man behöver allt. Allt. Verkligen att många aktörer har ett ansvar de föga lever upp till här. Journal-huis m.fl. bör självklart i den mån ej mer än abstract, titel m.m. görs tillgängligt sammanfatta ner sin statistik regelbundet så man kan hämta ner den.


Nå mycket data är bra. Så är det.


Huruvida denna enkla skattningen jag gjorde återstår emellertid att se då jag ej försökt stämma av den mot andra typer av skattningar som kan tänkas vara relevanta. Mitt primära intresse är att tillföra bättre skattningar för en del koncept man kan misstänka ligger en aning lågt. Det är i all rimlighet bättre att göra det med någon metod som har motsvarighet för den jämförbara situationen hos människa: Om min skattningen av ett ovanligt koncept är ovanligt p.g.a. dålig sampling medan personer känner det bättre falerar de flesta modeller på många koncept när vi för samman det med koncept-sannolikheter. Emellertid om det ej är troligt gäller p.s.s. att man bör motsvara hur koncepten tolkas och förstås när de möts av människa (som default utan preferens till någon särskild praktisk användning utan flera olika med varierad kvalitetskrav ibland lägre än så här).


Måttet ovan tivlar jag på ger just något i sådan avstämning men ger hoppas jag en vettig indikation om åtminstone magnituden mellan dem. Och jag blir ej förvånad om det stämmer ganska väl med hur vi tolkar och förstår koncept i mening av arbetsinsats att läsa resp. minnas dem (troligen mer det sista särskilt för "ord-långa" koncept).


Dessutom sorterade det elegant upp några hundra defekta koncept där tab som separering någon gång har fallit bort för blanksteg. Vilka blir enormt komplexa. Både oerhört osannolika från 35 - 50 ord såväl som helt otroliga att hitta i någon verklig text. Hade man nu ej tagit hänsyn till positionen vid beräkningen av ord-sannolikheten hade det blivit en annan sak eftersom en del (men ej överdrivet många) väldigt långa koncept faktiskt existerar naturligt (med också verkliga förekomster: Och ej bara inom kemi, biologi m.m. utan en hel del andra särskilda delar av den samlade mängden språk man finner i text). Eftersom de nu består av koncept - ofta nog också per ord - i sig förekommande i gedigen mängd.


Att dela data är ett politiskt och kommersiellt ansvar vi förvaltar för våra barn: Det kan bota sjukdomar, hindra krig och lära oss om språk

Nu har jag gjort mitt i alla fall och delat något med affärskritiskt värde för inte minst journalhusen ej open rörande deras långsiktiga överlevnad. Ingenting är så viktigt som att kapitalisera på data de kontrollerar. Men kontaktyta mot deras kärnverksamhet med författarna till allt som publiceras får ej underskattas. Därmed gäller det att dela rå-data som ex. koncept m.m. som förekommer medan man samtidigt drar djupare slutsatser själv. Så är det bara att vänta på att man tar sitt moraliska ansvar här och förenklar för världen att skapa en djupare förståelse om våra problem och hur de kan lösas. Dela data bra - Gömma data är dåligt och lite misstänkt (jag menar vad gör de egentligen med allt sitt data om allt från fysik till biologi jag ej kostnadseffektivt når? Kanske tillverkar de nya värre massförstörelsevapen än vi ännu sett? Jag kan tänka mig att de är mindre troligt än inte men kostnaden för realiserad risk är ju enorm: Kanske krävs lagstiftning globalt? Något FN borde engagera sig tycker jag - Eller kanske EFTA, GATT, Läkare utan gränser, Skandinavien m.m. ersatt av nyare koncept som EU o.s.v. och verkar helt dött men spekulerar jag ändå har en massa overksamma medarbetare - Från Frihandel till Fritt Data det skulle visa EU vem som är störst... Data utan gränser: För att bota sjukdomar i tid...).


En stor aktör bör självklart inte förfalla till sådana kvalitetsmässiga vkea och helt undermåliga lösningar för att dela data som bilder (d.v.s. ej som jag gjorde just i Att beräkna RT utifrån vikter "ungefär" av typen IDF och frekvens utan mer som när jag delar CSV-filer tab-separerade gärna komprimerade ej krävande något bökigt och slött API) m.m. Sådant är verkligen bara pinsamt att behöva se hos stora aktörer oavsett delar av artiklar eller något annat. Det genererar vi läsare på internet. Man tycker lite sund om sådana aktörer. Är dom så tekniskt efterblivna att de inte kan bättre tänker man när ma ej hittar allt relevant data till studien bra presenterat tillsammans med ord-förekomster m.m. i artikeln sammanfattat tillsammans med statistik för besökare via navigering, intern-sökning m.m. Vem vill egentligen läsa så här?


Bra fördömen är i kontrast:



Gäng har börjat missbruka data på nya otäcka sätt

En otrevlighet som blivit coolt tycks det i flera gäng-bildningar bland journal-publisiter sista halvåret är att kasta kategorisering och keywords i presentation av abstrakt och titlar. Ingen gillar sådant och tråkigt nog drabbar det också helt oskyldiga läsare och data-läsare. Det är verkligen inte sunt för dom själva heller. Ingen tycker det är tufft att dom tror att dom klarar att representera sitt material utan ämneskategorisering. Bara barnsligt.


Det får inte bli att man börjar se data som vad man bedriver rovdrift på. Data är något vi ärver från världens alla människor och förvaltar inför framtiden. Se Hillary's e-post som ett fint exempel: Det är data som framtidens människor - Våra barn - kan läsa och räkna ord i. Vilken skillnad det blir om hon blir president jämfört med den här små-snåla Obama och Bush vi har nu resp. tidigare. Förutom enstaka e-post jag misstänker är auto-skickade från Whitehouse.gov har jag likt de flesta inte fått läsa många av deras e-post. Två per år kanske och med bilder, udda fonter m.m. Jag vill ha e-post antingen som text eller ex. json, och i en stor zip-fil med alla e-post skickade, och inte just till en enstaka person. Det är ju vad data handlar om... En demokrat som Obama borde ju tänka tycker man på de beräknings-fattiga som ej kan prioritera att ta ut mening av bilder effektivt i sin parsning av datat.


Egentligen är det surt att man inte kan implementera någon kortsiktig kostnad för data-rovdrifts-aktörer. Lite som terror åren under Franska revolutionen men utan våldet riktat människor. Mer som under Kulturrevolutionen kanske utelämnande våldet och svälten med efterföljd tvångsförvaltning eller ett medborgar-garde som tar hand om aktuella politikers e-post. Facebook är ju dock ganska enkel att hämta data från så eventuellt borde man ta ut något aktuellt där igen: Kanske är det här redan på väg? Jag kan tänka mig det så en klok publicist såväl som coola politiker väljarna gillar tänker bäst efter hur de gör med sina artiklar, ämnes-kategorier och e-post (publicera enkelt på nätet).


När det gäller ditt data behöver du höra upp på dina verkliga vänner: Dom som tar sig tid att förklara världen för dig

Det går inte att räkna med att alla är snälla och tar sig tid och förklarar sådant här heller för de teknik-fördröjda aktörerna som ännu inte riktigt förstått vad internet handlar om. Så ta chansen här och dela världen ditt data (coolt för den som förstår internet: zip-filer, csv, och med vettig ej överdriven meta-information).


Skiss komiskt segment:

1. Understryka värdet av dela data.

2. Men göra det indikerande värdet samtidigt som små irritera under komiskt effekt-påverkan. 

3. Görande data jag redan har mer värdefullt genom att förslöa utvecklingen mot open-data. 

4. Bör också hantera ev. misstankar. Understrykande min människo-vänliga sida. Hans din vän. Härskaren du älskar. 

Kategorisering: World Domination, The Global Hans State.

One data to rule it all. My data. It's all mine or should be. Mitt eller borde vara. Kommer bli. 
Redundans är risk i reduktion scarce. Unikhet är värde. Ett stycke data i en instans kontrollerad av The Global Hans State. 
Så känslosamt jobbigt när törsten efter den fullständiga makten plågar mig. 
Må när världen är samplad och klar bör den fullständiga strategin realisera sig själv som självklar. 

Notering: Addera något sist för att reducera risken att någon börjar snoka runt Hans World State. Något lite kul men inte för bra. Sådant gillar folk.

Att beräkna RT utifrån vikter "ungefär" av typen IDF och frekvens

2015-10-29

Är upplevde jag inte lätt men görligt. Värdet är för mig i alla fall inte alls att beräkna värden för fallet när sunda (vilket jag tvingas återkomma till tvivlande för sekvenser av RT-värden ovanför cirka 800 ms) RT-värden finns utan när inga värden existerar mätta på människor. D.v.s. komplettera dessa med vettiga (om än oftare sämre skattningar).


Återkopplar vi till RT från vilken (eller vilka) frekvens / sannolikhet för ordet? fick jag göra följande lilla förändring varefter det hela löste sig på en timme efter en tråkig mängd tid:


  • SUBTLEX mått CD var ej funktionellt för mig på det sätt jag önskade använda det. Förövrigt noterade jag efter ett par timmars förvirring att det är viktigt att läsa publicerade artiklar om SUBTLEX (och kanske andra databaser i domänen) innan man tar något namngivet Zipf för någon form av funktion av rank-beroende (det är bara frekvensen normaliserad per X token och så log-10)
  • Istället använde jag ett större IDF-liknande mått jag beräknande från ett mycket bredare och större corpus (och som dessutom till cirka 5% i mening av samplingar - där vi kan se sampling som ex. titel + abstract + keywords för forskning eller snippet i sökmotor-resultat - från cirka 100 av internets större sökmotorer om än i toppen ej just Google som är minst sagt "försiktig" i sin hantering).
  • Egentligen hade jag för värden svårt att riktigt se var den avgörande skillnaden låg.
  • Emellertid kanske mindre optimalt (men gissningsvis för ord snarare än godtyckliga ngram tror jag tvärtom) använde jag SUBTLEX frekvens-mått.

Rörande RT-värden hittade jag dem också just på crr.ugent.be och kompletterade dem ej med RT från flera andra studier utnyttjande ex. Amazon (vilket jag relaktigt trodde ett tag medan jag mer skadade medelvärdet eftersom jag insåg dem redan ingående i det första - Och ännu mer "variansen" / informationen).


För RT-värden upplevde jag mig slutligen efter bytet av "spreadability" till mitt befintliga från CD få acceptabla värden (även om jag också ser tydligare jfr för kortare ord vinner man på att använda sannolikheter relaterade ljud där utan tvivel bättre alternativ bör finnas än måttet jag använde tidigare: Dock tvivlar jag på att just några väsentliga ord utan RT-värden saknas) när jag vid beräkningen för jämförelse med dom faktiska RT-värdena också krävde:


  • Ej större än 800 ms.
  • Givet det kan jag bara multiplicera 800 ms med måttet från spreadability och frekvens.

Att jag använder termen spreadability som lokalt i min databas istället för "IDF-komplexitet-liknande" (vilket jag annars inte gör) beror av följande:


  • Manipulerar man värdena för RT för att skatta ut ett informations-liknande mått (d.v.s. för att få formen av något-p-liknande-mellan-0-1 * log (något-p-liknande-mellan-0-1)).
  • Får man liknande form på kurvan som jag längre tillbaka (och hoppas gå ifrån en del av ej relaterade skäl) som jag tenderar att få för generering av blue light intensity (BLI).
  • För BLI finns därför att det är ett enormt nätverk av koncept med relationer ett gigantiskt nästan helt styrande samband med just närliggande nätverk av andra koncept.

D.v.s. det finns tror jag säkert ett stort beroende av något form av nätverk runt orden för RT även om jag inte valde att försöka experimentera med det (värdena jag får ut givet nu över 55 000 RT-värden redan mätta på människa duger tyckte jag). Och det torde vara att en del av detta beroende finns med på köptet med spreadability.


Varför värden över 800 ms ej är tillförlitliga vill jag egentligen inte våga spekulera bra om här då jag egentligen borde läsa upp mig på RT av aktuella typer. Emellertid:


  • Laborerar jag med två potenser. Och vi har ju 400 ms som jag tror ligger på minsta görliga att tillförlitligt mäta på de typer av studier man gör på RT p.g.a. N400.
  • Det är därför inte sunt att försöka passa in något mindre.
  • P.s.s. om vi börjar gå upp ovanför kan man få in annat liggande på minsta gemensamma upprepning inkluderande 400 ms.
  • Vidare jämförbart börjar det kanske här bli mer varierat rörande orsakerna till varför det tar mer tid. Typiska försökspersoner tenderade förr innan Amazon's Mechanical Turk vara en ganska väldefinierad grupp: studenter.

Så alla RT-värden ovanför 800 ms kastade jag som värdelösa för jämförelse. Det ger tillsammans med att jag också önskar "mitt vanligaste ord" vara "RT-snabbast" i skattning (även om RT-data har snabbare ord) följande effekt tidigt (som någon mer matematiskt motiverad troligen hade kunnat korrigera bort utan att störa utvecklingen längre bort):



D.v.s. för the börjar vi på N400. Vill vi rationalisera det kan vi kanske "(bort-)förklara" det med att the helt saknar mening i sig utan efterföljande ord och därför direkt ger en respons utan att behöva behandla nätverket runt det: Bara att vänta på nästa ord.


Vi kan också rationalisera det med att jag ej önskade peta runt med det hela när nu värdena efter små-orden faller in ganska snabbt till ej att ej problematiskt avvika (särskilt som att ord som RT-värden saknas för är vad jag räknar naturligt ska ligga långt upp):



Jämför vi värden längst till höger ("riktiga") med skattade i kolumnen direkt till vänster kan vi också se ett par kraftiga avvikelser. Dessa ser vi emellertid är orsakade av SUBTLEX frekvens-värden snarare än spreadability som där troligen ensamt hade givit närmare korrekt värden. Jag såg det ej tidigare och det pekar kanske på att man bör ersätta det eller troligare kombinera med mina vanliga frekvens mått (då jag är ganska säker på att SUBTLEX för just ord adderar värde många fall: För ord använder jag det normalt). darkrooms är ett exempel.


Hur tänkte jag då när resp. vikt användes?


  • Vi har ett motsvarande nätverk runt orden i det biologiska neuronnätet.
  • Det är resultat av inlärning såväl glömska vilka båda följer learning curve (eller omvänt i decay).
  • Resp. spreadability och frekvens skattar nätverket i mening av deras information.
  • Så de är bara att kombinera så att deras varians d.v.s. en grov tillräcklig om än sämre än alternativ skattning av inlärningen.
  • Hur gjort mer exakt framgår säkert direkt från kolumnerna i bilden.
  • Jag gör kanske en elegantare lösning om några dagar när jag nu såg att det fungerande (vilket jag slösade tid på att försöka normalisera innan jag insåg att det här CD-måttet inte var vad jag trodde).

Nedan en bunt värden mer i mitten eller i alla fall för någon av dem en bit in efter små-orden i toppen. Vi noterar hur vikt härledd från SUBTLEX för bl.a. don ej känns sunt p.s.s. som indikerat tidigare: don är mycket stort precis som la, los, le, san m.m. ty allt som förekommer i ortsnamn som ej är Myggträsk, Skåne (för att börja jämna ut olämpliga uttryck för negativa stereotyper om Norrland jag kan ha uttryckt tidigare genom åren utan att uppdaterat mitt intryck av Norrland på mer än 20 år) utan städer med många miljoner innevånare är stora oavsett typisk vanlig användning i övrigt. Spanska är förövrigt väldigt stort även om man inte kommer i närheten av att "medvetet" sampla det (i mening av väldigt lite "spansk-text" som kanske någon gång flytit in via datasamlingar GOV, research vid spanska universitet o.s.v. OAI fick jag in en hel del på spanska men tror ej det skadade relativt hela mängden data via den kanalen: Kanske 100 - 200 datakällor som ej detekterades spanska).



Troligen kan man få värdena också bättre genom att se till att resp. vikt från spreadability och frekvens bättre följer samma magnitud och skala. Jag känner dock att det kanske inte just behöver gör någon skillnad för dom ord d.v.s. dom som riktiga RT-värden saknas för. Dessutom var hela RT-vikt-området inte trevligt: Jag ger det bara 1.5 plus av fem. Inget jag rekommenderar. För att kunna garantera samma upplevelse fullt ut stoppade jag in några taggar för sådant jag hade tänkt använda men skar mot slutet. Så man utgår från rätt ambition för att riktigt få samma upplevelse (innan man mer korrekt ej nöjer sig med en mer praktisk än egentligen riktigt bra nivå: Snarare än att förvirra så att man inte gör något bättre än här vilket jag när görligt brukar försöka undvika - Jag tycker det är en god målsättning som skribent).


På plus-sidan hoppas jag att detta är åtminstone hälften till att avsluta en flera år lång process av att försöka hitta en lösning man kan generera ut komplexitet för några hundra tusen ord skalbara därifrån enkelt fler flergram utan att behöva göra det själv. För mycket forskning tycks det handla om att beskriva sitt data snarare än att beskriva hur jag gör något med det. Jag har dessutom lite svårt för hela området power laws och allt besläktat (här är vi mer i besläktat) då jag är van med att sådana relationer kommer ut naturligt från nätverken runt orden utan att man behöva sitta och peta runt med rank och skatta parametrar från indirekta värden. Jag vill verkligen rekommendera allmänt att man tar som god inspiration om vad man bör fokusera praktiska diskussioner i det väldigt konkreta runt rörande forskning rörande såväl språk och hjärna utifrån områden jag diskuterar: Det är nog en bra indikation om precis vad många fler är intresserade av såväl när det kommer till finansiering forskning, media (glöm ej student-intagningen: det är indirekt viktigt för din finansiering av forskning - Det gäller att märkas bra), referenser m.m. Ta chansen att se mina problem och gör dem till dina och det finns guld att hämta. Lös ett riktigt djävligt problem och behövs det ser jag fan själv till att du får publicera i Nature eller vad som nu känns rätt för dig.

RT från vilken (eller vilka) frekvens / sannolikhet för ordet?

Det finns en lång rad fenomen relaterade hur vi upplever och använder (åtminstone) ord som vi kan beskriva på formen:


a / ( b + c * n (rank ) )K

Jag fick för mig kanske mest praktiskt nära relaterat "komplexitet" för att läsa eller skriva ett ord att försöka ta samman dem på formen ovan (d.v.s. om nödvändigt som förväntat tillåta varierade konstanter).


Det var varken min tro eller icke-tro att jag utan att behöva känna till någon algoritm skulle kunna utan svårighet skatta parametrarna men kunde konstatera att jag inte kom riktigt fram till något (eller egentligen ens så långt här).


Emellertid under processen av att försöka få klart för mig hur man gör sådant bra använda jag data för RT (cirka 55 000 ord) och beräknade hur mycket rank i genomsnitt avvek mot denna rank för bl.a. frekvens ord som i SUBTlEX (korrekt var det US snarare än UK men det har knappast betydelse här och kan enkelt hittas), min frekvens från mycket större corpus (men tycks det saknande ord jfr vad jag hade RT värden för: Ev. någon defekt byggande databas-filerna senast), och intressantare en sannolikhet beräknad från sphinx representationen som kommer med CMU dict. Sphinx har färre symboler än den normala representationen i CMU dict (d.v.s. ljudsymboler för orden).


Sannolikheten för ljud-symbolerna skattade jag ej från något relaterat förekomst av själva ordet utan resp. ljudsymbol givet positionen i ordet utan hänsyn till föregående eller framförvarande ljudsymbol (vilket man ev. kanske vinner på givet att de åtminstone i tal flyter samman något). En egentligen inte alls spännande fråga är hur storleken på alfabetet för ljuden inverkar här: Jag har ej ett bra svar här.


Rörande SUBTlEX CD mått en relativt trolig användning myckenhet finns publicerad om har jag en använt den för komplexitet tidigare men sett relevant likhet för hur inverse document frequency används för att bygga index i sökmotorn och skapade ett mått ej riktigt CD eller IDF men funktionellt bättre anpassad för mitt behov. Därav bildade jag dessutom:


  • f ( CD ) * log ( freq ) / log ( 2 )
  • f ( CD ) * sqrt ( 1 + freq )

Jag prövade f ( CD ) enligt uppenbara: log ( frekvens av the som har störst CD / CD för aktuellt ord ) / log ( 2 ). Men kom troligen av någon anledning att använda log ( CD för aktuellt ord ) / log ( 2 ).


Linjär kombination av log ljud-sannolikhet tillsammans med f ( CD ) * log ( freq ) / log ( 2 ) var något lite bättre än f ( CD ) * sqrt ( freq ) / log ( 2 ) (men minskande så om man skär höga värden vilket eventuellt också för den första gav något bättre resultat). D.v.s. bättre i mening genomsnittligt rank-fel. Och ordentligt mycket bättre än alla kombinationer av CD och frekvens.


Jag trodde fenomenet kanske hade något att göra med att frekvens och/eller CD kommer fel för korta ord där ljud-sannolikheten kanske tänkte jag mig kompenserande det hela på något sätt. Men jag klarade ej ut att se var effekten kommer sig av.


Inte heller klarade jag att kombinera det hela på sådant sätt att jag faktiskt fick konkreta värden som är meningsfulla att använda. Bara själva rank-felet som hamnade neråt 4000 för totalt cirka 55 000 ord. Huruvida rank-felet är lågt eller högt jämfört med en vettigt skattad funktion som Zipf-Mandelbrot kan jag ej heller säga men det tycks troligt för mig att om man kastar största och minsta värden för RT (kanske 50 på vardera sidan eller ev. fler) går det nog att för resp. eller tillsammans frekvens och CD komma bättre också i rank-position fel (men å andra sidan kanske det också gäller ljud-sannolikheten).


Jag undrar egentligen mest vad effekten kom sig av. Själva kombinationen med f ( CD )... var inte mer avancerad än addition efter viss normalisering. Därav att jag funderade om det var korta ord som var förklaringen.


Det tråkiga med RT-värden är att...

Om vi söker beräkna förändringen av dem som funktion av föregående värde d.v.s. enkelt försöka skatta exponten i funktionen tidigt ligger de högt för de lägsta resp. högsta RT med ett minimum "mot mitten" (i väldigt grov mening).


Det kanske har att göra med hur jag laborerade med beräkningen. Men kändes kanske också som något man även kände igen från en del annat.


Jag vill egentligen inte säga för mycket om det här åtminstone innan jag skaffat fram varifrån jag fick RT värdena från början och ladda ner dem igen med all meta-information om dem.