Dumt man lärde sig i skolan: Att icke-kausala lösningar är fel

2011-03-10

Av allt dumt jag lärt mig i skolan hör att icke-kausala lösningar är fel och inte fungerar till det värsta. Vad innebär att en lösning är icke-kausal? Att lösningen vid tiden t beror av vad vi har vid en tid större än t.

Det är fullt begripligt att de ofta uppfattas som felaktiga. Och det är föreställer jag mig många tentor där man fått noll poäng på en lösning där man blandat in ett mätvärde från framtiden. Troligt signalbehandling där man fick dem hela tiden.

Men här har jag nu ett icke-kausalt koncept som är elegant och väldigt fungerande (menar jag men det är en definitions fråga där det för ex. kärnkraft är olämpligt). Hur kan det vara möjligt? Därför att i vissa tillämpningar växlar vi mellan analoga och digitala representationer där vi i den analoga representationen "efterverkar" och dessa går omlott relativt den digitala.

Jag tänker givetvis på språket där när vi skriver det som bokstäver har symboler som tolkas och små eleganta mellanslag mellan orden medan vi talat optimerar bort många ljud och egentligen inte har några mellanrum alls mellan orden (även om vi uppfattar det så).

Hur ska man hantera det? Och varför skulle man när man hanterar det önska ett icke-kausalt samband (egentligen är det inte strikt icke-kausalt men representerat bara digitalt verkar det givetvis så)? Därför hur vi tolkar vad som skedde vid tiden t kan då påverkas både av vad som hände innan och efter och därmed kan också en förändrad uppfattning från tiden innan propageras till tiden efteråt.

Beakta först 3.8 Modell av neuron med bayesiansk klassificering och konvergens när vi nedan utgår från en förenklad skiss av ett träd med dendriter eller om man hellre vill se det som en serie av neuroner eller vad som känns enkelt för dig (hundvalpar med semaforer går t.ex. också bra).

Längst upp har vi dendriter riktade mot en miljö av hundvalpar med flaggor som signalerar den information som är ny för tiden t (vi kan här se det som det senaste ljudet vi hört eller senaste bokstav men det kan lika gärna praktiskt vara vad som är nytt relativt allt gammalt i och utanför vad som sägs) d.v.s. pre-synaps.

Vi tänker oss där klassificering mellan svart och vitt. Klarar vi det kan vi uttrycka alla binära relationer och allt som mer eller mindre d.v.s. allt kan representeras med ett visst antal neuroner.

Ju längre till vänster vi är ju troligare är X och ju längre till höger desto troligare är Y. Vid en viss gräns är vi istället osäkra.

I nästa "steg" beaktar vi information som kommer från vänster och höger sida. Informationen från vänster är vad vi här ser som vad som inträffade innan. Ju "längre ner" bland dessa dendriter ju troligare bedömde vi att det var att vi fick X vid tiden innan och det är exponentiellt ökande mycket snabbare än nedan därför att det relativa avståndet är större och signalsubstanserna bryts ner exponentiellt för någon tid.

På den andra sidan har vi hur troligt vi kommer ha skulle bedöma att det är Y vi kommer få fick vid tidpunkten efter oss i tiden. Vid den faktiska tiden t kommer denna i de flesta fall vara 0 men kommer konkret inte alltid vara det då vi här rör oss i sannolikheter där lite av varje bara kan inträffa.

Därmed kan vi väga in både bedömningen givet informationen innan och information vi får efteråt. Det ger praktiskt värde därför att signalen vi skickar är kontinuerlig över en viss tid.

Sannolikheterna vi bygger åt sidorna kan vi också se som korrelation och hur vi knyter samman delar i en sekvens. Hur kan nu båda dessa saker vara möjliga? Därför det har för en punkt som den i bilden betydelselöst exakt vad vi har efter oss där det egentligen bättre ses som funktionen av två exponentiellt avtagande saker. Dels visshet som storlek där hög visshet som uttrycks hos något ger ett troligare påslag och dels visshet över tiden där även något längre fram i framtiden kan påverka men bara mindre troligt.

Om något kommer uttrycka hög visshet och vi uttryckte hög visshet är det mer troligt att vår visshet hade viss påverkan efter och det i sig gör det mer troligt att vi hade rätt om vi nu inte uttryckte X eller visa versa.

Gör vi detta bara en gång fungerar det ju inte bra alls. Men vi lär oss egentligen ingenting direkt. Det kräver upprepning ett antal gånger. Därefter kan vi göra det mer automatiskt.

Gör vi det med bara en neuron fungerar det heller inte bra. Men gör vi det med många fungerar det snabbare bra. De som oftare har rätt kommer minska ner aktivitet hos dem som gör fel och över tiden växer sig dom som har rätt mer inriktade på detta.

Med livserfarenhet kanske vi tillämpar samma koncept på nya saker. Tja då kan vi uttrycka den skillnaden med detta också. Däremot är det utan att addera något annat att göra mer radikala förändringar för något extremt tränat. Är det ex. inte självklart för dig att världen i vissa små aspekter kanske för att bara ta en möjlighet ur luften är platt därför att vad som överför den långa gravitationen har sämre exakthet än någon annan partikel snarare än tredimensionell eller mång-dimensionell skulle det ta evigheter innan det insågs och än längre att inse hur sannolikhetslära om orsak och verkan påverkas av att man projiserar från två till tre-dimensioner.

Ser man ex. något som har två möjligheter och man betraktar två saker som är mindre än tre dimensioner. Skulle vi i vår värld om vi antar att varje möjlighet är lika sannolikhet få fyra fall vardera med sannolikheten 1/4. I den platta världen får vi dock bara två möjligheter som vardera är på 1/2.

Är konceptet ovant men man i alla fall betraktar det oerhört kreativt kanske man förvisso tar fel en period och kommer till lösningen att vi har ett parallellt universum vi kan se som en dimension av information lite som man kanske skulle se Shannons entropi relativt fysikens entropi. Men det skulle givet lite tänkande av och till något år bli klart att det inte är så och kanske heller inte ett antal andra saker man tagit för givet rörande krökning och allt möjligt. Utan att bara att när saker är mindre än en viss sak är de platta och vi klarar inte riktigt att relatera till det när den platta representationen projiseras ut till tre dimensioner.

I den platta världen finns inte fyra tillstånd utan två tillstånd om man ser det från den tre-dimensionella världen.

Hur ska vi enklare visualisera detta? Något enkelt svar finns inte men vi kan jämföra det med (och i någon mening är jag väldigt säker på att det inte kan uteslutas vara fallet givet att energi kan uppstå ur "ingenting") att vi i vissa situationer när vi komprimerar data i ett bara långsamt fysiskt förändrande nätverk av neuroner når en effektivare kodning inte genom att representera alla segment på en cirkel med den upplösning som uttryckt med trianglar (andra figurer kan vara strikt effektivare men träningen i sig är en enorm kostnad där att gå tillbaka egentligen aldrig lönar sig och vore som att fördummas ner till hur livet var första levnadsåret) från Vad ger oss nu Bayes regel för kvantmekanikens otäcka "spinn " och Fungerande bredband & Återbesök i linjernas underliga värld med pitch.

Där jag från den senare citerar:

"En pedantisk symmetrisk gillande person som inte tänkt efter kanske tycker att det är en triangel för litet och det är ett stort hål i cirkeln. I någon mening är det ju hål överallt givetvis men hålet på den sida ett hörn saknas är inte större än någon annanstans därför den effektiva kodningen är inte neuroner som uttrycker trianglar utan skillnad. Givet att vi redan uttryckt den skillnad mot ingenting som räcker för den enklaste approximationen av en cirkel oberoende av en sida kan vi hoppa över det eftersom övriga sidor predikterar den entydigt. Att vi har en triangel som i bästa fall hålls upp för oss men mer troligt bara är hur vi uppfattar ögonlocket med den begränsade syn vi då har får vi ju ett starkt bias här också."

Och för att besvara frågan jag ställde i det senare inlägget:

"Slutligen rörande världens mer underliga sidor. Har de inte ändrats kan de inte vara korrelerade oavsett hur många gånger de är lika. Inte om bara två dimensioner finns. Mängden. Vad är mängden här?"

Så vad är mängden?

Och liksom allt här i livet gäller att om du stänger en dörr har du förändrat saker och ting. Du uttrycker högre visshet om världen och i någon mening har du komprimerat den och är antalet dörrar som kvarstår färre och du vet att en av dem innehåller det du söker har sannolikheten för att du har rätt ökat men bara om du väljer det spelet. Står du kvar i det gamla spelet gäller sannolikheten från den: Monty hall problemet.

Hur blir Monty hall problemet i den två dimensionella världen? Vem vet? Kanske behöver man bygga en gigantisk partikelaccelerator för att reda ut det? Eller så räcker det att faktiskt tänka efter innan man rusar iväg och gör en massa helt onödiga mätningar som bara förvirrar saker för dig ännu mer.

Vill du ha tillbaka dom fyra möjligheterna där ju det i tre dimensioner kommer verka som fyra möjligheter. Tja då får du låta bli att tänka det som att fotonerna som avges från en "källa" (vad är den underförstådda mängden här?) vid en tidpunkt kommer påverka varandra i den mening att om du tittar på en påverkar det den andra. Det är ju inte riktigt vad som sker. Tänker du så har du utgått från att en dörr finns öppen som är stängd här.

Och hur blir det givet det med orsakssamband du bygger upp för att detektera i begrepp från 3D med 3D tänkande? För att reda ut det måste man säkert vara en väldigt högt begåvad teoretiskt fysik. Klart för enkla och prestigelösa människor som jag med höga moraliska grundsatser som använder vardaglig praktisk matematik som plus, minus, bayesisk statistik och undviker att fantasier om stora gigantiska hål som kan flytta oss runt universum oavsett faktisk storlek är att det åtminstone inte har någon betydelse att applicera begrepp från den tre-dimensionella världen som att det ex. har någon betydelse om man på en krökt massivt tung kropp försöker mäta de fyra tillstånd man skattat kan existera om man gör det i rummet bredvid eller för den delen på två olika platser i världen. Inte storlekssambandet inte applicerar på dem. Det enda det skulle orsaka är en helt onödigt kostnad som inte ens har sysselsatt särskilt många personer. Dessbättre tror jag säkert att viss rimlighetskontroll på vilka fysiska försök som finansieras finns.

Kanske är det enklare för de flesta att se det som predikterande kodning? Enda skillnaden här är att "vi" vill uttrycka oss energieffektivt.

Vad som är tilltalande att tänka så här är att d.v.s. esoteriska koncept ingenting praktiskt någonsin indikerat inte behövs. Sedan är det visst att det för människan alltid kommer kännas mest naturligt att något vi inte begriper i tre dimensioner och tid har sin lösning i dimensioner vi inte känner till. Det är ju så hjärnan löser problem. Men erkänner man vissa dimensioner måste man ju också erkänna att de kan verka via en mekanism och gör man det och givet att man redan resonerat att fler dimensioner finns där verkningsgraden är olika kan man lika gärna erkänna att det kan räcka med fyra dimensioner men att vad de verkar på är olika stora och för vissa av dem existerar inte alla dimensioner därför att de är för små.