Jag upplever det bortom all rimlig tid att försöka kommentera det här:
"We study rank-frequency relations for phonemes in texts written by different authors. We show that they can be described by generating phonemes via random probabilities governed by the (one-parameter) Dirichlet density, the simplest density for random probabilities. This description allows us to demonstrate that the rank-frequency relations for phonemes of a text do depend on the author.
The author-dependency effect is not caused by common words used in different texts.
This suggests that it is directly related to phonemes or/and syllables. These features contrast to rank-frequency relations for words, which are both author and text independent and are governed by the Zipf’s law."
Från: Rank-frequency relations of phonemes uncover an author-dependency of their usage, Weibing Deng 1) and Armen E. Allahverdyan 2),∗1) Murray Gell-Mann Institute of Complexity Science, Central China Normal University, Wuhan 430079, China 2) Yerevan Physics Institute, Alikhanian Brothers Street 2, Yerevan 375036, Armenia, via Arxiv.
Men för att alls säga något hade man behöft börja med att betrakta vilka graf-liknande strukturer ej helt i form relevant annorlunda från språk som faktiskt uppvisar "Zipf:iska" egenskaper. Det är absolut inte undantaget att vi ser det i allt från språk till diverse sett i rymden och till kemiska egenskaper. Det är vanligt. Självklart är det emellertid också beroende av hur man väljer att representera - kanske "normalisera" - data (för en komplettering i domän av entropi: Calculating entropy at different scales among diverse communication systems men den som söker för att finna en mängd exempel mer direkt i Zipf's världens statistiska egenskaper bör lätt hitta dem i stort antal i det mesta utanför språk).
Vidare kan vi så klart se ett koncept representerat av ett ord som sista gemensamma representationen konvergens i förståelse kan gå till. Medan vägen dit kanske är mer naturligt varierad med den särskilda situationen inklusive olika enskilda personers beskrivning av den.
Slutligen vill jag säga att jag särskiljer författare via rankfrekvens (bättre kombinationer av alternativ finns). Frågan är naturligtvis där vad man exakt menar med rankfrekvens. Skriver man ej mer än rankfrekvens inkluderar man bra mycket avsett oavsett om nu ev. Zipf:iansk-natur avses eller inte. Framför allt kanske hur många dimensioner rankfrekvensen har... Och om den räknas alltid med 1 eller om viktsystem används.
Dock även om vi avser rankfrekvens som normalt skapad när Zipf diskuteras behöver det absolut inte vara svårt att se författar-specifika egenskaper via bara förekomsten på orden. Jag föreslår dock gärna att man kan binda vissa egenskaper hörande till väldigt stora människo-gemensamma egenskaper i personlighet går att få från likartat enkla samband och är en naturlig del av att klara att göra föregående: Bl.a. för två triviala egenskaper benägheten till att använda genomsnittlig ordlängd högre än genomsnitt resp. benägenhet att skriva meningar längre i antal ord och/eller antal tecken (och självklart är kanske ev. när så kanske är fallet skillnaden mellan antal ord och antal tecken vad jag inte kan utesluta har samband med resultaten man såg i länkad artikel även om jag inte vet säkert att så är fallet).
Hur som helst ett mycket passande ämne att studera för kinesiska vetenskapare. Med våra teckensystem känner jag ibland att vi är lite för nära ljuden för att inte bli hemma-blinda.