Komplexitet och Grammatik: Fruktflugans romantiska språk vs Människans språk

Den här studien jag drog mig till minnes från några år tillbaka är ett elegant exempel på hur ett trevligt lite intressantare objekt att testa hypotesen på ibland är vad man träffar på:

Studier på sällskapsdjur som hundar och romantiken hos människor är ju ofta också vad som ofta når lite bredare än annars för ämnet. Konceptet demonstrerat ovan och säkert varför det dök upp i minnet är en elegant illustration vad som gör den form av snabba men helt funktionella skalning av andra viktmått samverkande (tillåtande där optimerad beräkning):

"[Language] exhibited by common fruit flies Drosophila (‘D.’) during courtship is as grammatically complex as the most complex human-spoken modern languages. This finding emerges from the study of fifty high-speed courtship videos (generally of several minutes duration) that were visually frame-by-frame dissected into 37 fundamental behavioral elements. [...] The languages categorization in terms of position in Chomsky’s hierarchical language classification allows to compare Drosophila’s body language not only with computer’s compiler languages, but also with human-spoken languages. Drosophila’s body language emerges to be at least as powerful as the languages spoken by humans."

At Grammatical Faculty of Language, Flies Outsmart Men
Ruedi Stoop, Patrick Nüesch, Ralph Lukas Stoop och Leonid A. Bunimovich,
PLoS One. 2013; 8(8): e70284.
2013 Aug 23. doi: 10.1371/journal.pone.0070284

Och något kompletterat inne i ett annat inlägg i brist på något romantiskt hos djur eller människor att referera (som inte skulle generera de flesta mer än vad som är accepterat utanför kommersiellt kraftfulla koncept som Game of Thrones där det ej är förväntat och tidsmässigt separerat när ungdomar under 25 gått och lagt sig - Med emotionella viktsystem och mer kan det nog gå att göra språk-uttryck åtminstone romantiskt mer upprörade än fruktflugornas språk):

Rörande diskussionen i övrigt i inlägget har jag för ena sidan av algoritmen - POS-sannolikheterna också gjort en till anpassning där resp. sannolikhet även normaliseras med ordets längd fångande något av en till sida av informationen men fortfarande tillåtande snabb hantering ej krävande att alla databaser är uppmonterade:

Jämför med Word lengths are optimized for efficient communication (PNAS) även om jag just nu i alla fall utnyttjar ord-längden i antal bokstäver resp. (hanterande korta ord 3 - där börjar vi räkna) eller färre särskilt) och positionering av vokaler inkl. på-räkning med 1 för ord med färre än två vokaler som ej slutar på vokal då formen av konsonanter och vokaler är jämförbart relaterat med informationen påverkar kodning i mänsklig kognition vilket jag tyckte gav viss "elegans" även om det egentligen inte gör skillnad med den exakthet aktuell oavsett om bättre eller sämre.

Konstant^L får skala ner resp. POS-sannolikhet. Enkelt och snabbt ej fordrande att alla databas-partioner är igång.En enkel effekt att se är att korta determiners likt the ger mindre skattning komplexitet jämfört med de längre mer ovanliga.

Och ett mer relevant exempel för mig att när delar av NP som exempelvis orden Winston + Churchill med taggar NN + NN förvandlas till Winston Churchill och NN skalas det om enkelt och för denna användning tillräckligt väl i vad som kommer ut) i någon ännu ej noggrant kontrollerad spontant känsla.

Från: Åsikter i recensioner: Varför först dyrt parsa meningarna för att kasta bort den bästa informationen?

Och ovan räknar jag på NP-frasen: D.v.s. en i allt normalt direkt linjär struktur utan fraser instoppade i den. I traditionell mening: Även om jag nog tror att delar som adverb verkande på adjektiv såväl som Winston + Churchill går till färdig mening som delsegment när det är effektivt och möjligt utan den övriga informationen (att vi förstår Winston Churchill direkt i sig utan att behöva information exempelvis i form av en roll eller titel indikerad innan).

Och för det linjära ord-fallen finns en korrekt uppgillande mina läsares intryck av mig långsam lite i korrekturläsning och strukturering direkt slö skrivelse av hur vi skattar mer än med ordlängden (precis som The Guardian lär oss: Röst och Känsla: Rätt röst för att tydliggöra de lugna och trygga kvaliteter folk gillar - Mycket slött språk som precis som refererade tester säkert kan få barn att somna om man läser upp det det):

Fraserna i mening: Probabilistisk grammatik och sannolikheter för ord - Direkt jämförbara utan träning konstanter (via typ-antal och sannolikheterna för resp. ord och POS-tecken 700 k resp. ca 40 typer) antalen (ofattbart förvånande)

Effektivitet är viktigt värde och vad man ska prioritera när möjligt. Även om jag får erkänna att enkelheten ger en lätt känsla av att utnyttjande diverse sannolikheter o.s.v. korrektare uttrycker den faktiska komplexiteten i skapelsen ovasett hur snabb resp. kort i kod. För koncept med fritt antal ord likt Winston Churchill hade antal typer om fortfarande använd även för vad jag utnyttjar varianten utnyttjande också ordlängden börja beroende på vad accepterar som hanterat på cirka 2 000 000 st.

Ex. namn på orter och personer med ovanligt många ord är föga tillförlitliga och har troligt skrivits i text man analyserar med en längre variant än normalt använd exempelvis klumpande samman en plats på en ort eller skrivande ut ett mellannamn eller jämförbart vilket man gärna vill undvika att reda ut på ej få ord därför att det skalar ej linjärt i beräkningskostnad med ord-längden: Vanligen brukar jag inte långt innan i detektionen av koncept ta ut de som har längre än tre ord för alla användningsområden där prestanda värderas. Jag tror det är en mycket god gissning att vår hjärna arbetar jämförbart optimerande. Vi kan trots allt läsa godtyckligt lång text utan att det behöver kosta mer för resp. mening och så länge meningarna inte är mer krävande än normalt jämfört med genomsnittet upplevt normalt är de inte brutalt annorlunda i beräkningskostnad för att vi väljer att uttrycka något med två adjektiv istället för ett eller förstärkande med ett adverb. Och skriver vi Premiärminister Churchill resp. Premiärminister Winston Churchill kan det senare kännas kanske lite omständlig beroende på övergripande kontext men skillnaden växer inte exponentiellt (så länge vi inte behöver bryta tolkningen: Flow i läsande för att tänka efter ty om så växer tiden spenderad abnormt men för sådana fall är det inte längre samma funktioner som används längre utan fler är involverande kanske rent av funderande över gamla minne av vad Hans skrivit om förr för att reda ut vem den här Churchill är: Något med pund-sedlar kanske?).

I all praktikalitet har man mer sällan om alls noterat i övrigt en funktionell väg att styra över texter vilka läsare man vill ha för olika ämnen. Vill man ta upp ämnes-motivation filtrerande något i ett ämne kan man uttrycka sig med lite längre meningar görande det hela mer bökigt och tröttsamt för den som egentligen inte är intresserad (eller helt jämförbart görande sådant som manuell översättning på helt andra nivåer nödvändig än annars funktionella metoder börjande på automatiserad och sedan lite handpåläggning på slutet av människa). Eller så sägs det i alla fall från dom som kan mer om översättningar än jag gör.