HANS HUSMAN OM MEDIA

Såren efter norska atrocities i UK ännu "språk-streptokockinfekterade"

2016-12-27

Lätt på samma tema som:

Continuous multilinguality with language vectors

Prövade jag ett fåtal kreativa dagar byggande på ett fåtal kreativa dagar något halvår senare att bygga representation av namn på människor från globala Wordnet över många språk utnyttjande generellt corpus engelska i brett över en mängd längder (etablerat från bl.a. som stora andelar några tusen nyhets-providers, diverse Wikipedia, och en mängd thesaurus), och färdiga vektor-representationer (The 400 och ej senare och starkare The 300: 400 via LSA variant från ungefär samma corpus, och 300 via Kohonen-variant dimensions-reducerande 400 på sådant sätt att 300 mänskligt läsbara och mer smooth dimensioner ges).

Representationerna ej sådana eller bättre uttryckt syftande till att representera just namnen i sig och att representera de sammanhang de förekommer i. Via spreading activation mellan detta som mellansteg gavs bättre uttryck direkt i resp. representation av dess kulturella kontext mot historisk tid (mitten av 1500-talet börjar mitt corpus: Och jag kan med stolthet säga att jag ej likt andra som samplat det ända arkiv forskning som jag känner till som brett över många journaler börjar på 1500-talet överlevde det vilket inte gäller alla om än är jag på det klara med ej heller direkt unikt). [Helt icke relevant för inlägget tror jag men konceptet JXXnullXre dyker plötsligt upp i huvudet på mig: Är det ett riktigt ord och vad är det i så fall? Någon GNU-mjukvara kanske?]. Nå vissa saker ska man alls göra dem alls så kostar det dig såväl som man får vara beredd att ge skapelsen vad skapelsen kräver för att vara möjlig: Behöver du sampla alla år tillräckligt kostar det men utan det ej möjligt. Ett enkelt val. Ibland rent av även om det nu inte gäller min modellering av mänskligt tänkande får man vara beredd att gå över lik (någon form av moralisk avvägning tycks lämplig oberoende av faktorer relaterade prestige, hunger efter, värde av o.s.v. skapelsen man gör: En tanke som kommit till nu när i alla fall stora delar av mitt är avklarat och något jag gärna delar med yngre vuxna jobbande på sina skapelser. Förvisso argumenterat att man utan det som klar insedd princip kanske gjort en del annorlunda men på plussidan lägger jag nu tid på för mänskligheten viktiga projekt så som lösningar för att hantera Matematikern och Fysikern. Mer moralisk seger än att ta dem antingen till slaveri eller utrotning finns knappast att finna. Så känn trygghet i att jag är The [archetypical / best of practise] Good Guy):

Nå så vi kan ta dem som arketyper eller en mjuk kategorisering tillåtande nivå tillhörande i samtliga att representera godtyckling engelsk text som. Så vad kommer ut av det? Jag hade räknat med samband relaterat hype namnge bebisar (se här att jag tar mina sannolikheter för ord ett givet ord två som bl.a. bygger på omfattande också historiskt data före 1900-talet men att detta är mitt standard-anrop för sådan sannolikhet långt ner i TigerAnt OS's generella API för återanvändbara komponenter). Men vad som kommer ut är association mellan uttryck för namn (i toppen d.v.s. de mest tilldelade namnen i magnitud resp. såväl likhet efter normalisering via magnituden d.v.s. L2-normalisering inför similarity beräkning) till geografiska områden avspeglande historiska folkvandringar (eller anar jag korrektare uttryckt de väsentliga historiska "externa geo-komponenterna" som inverkat på engelskan som uttryckt området under tid där det fortfarande märks).

För engelska publicerat internet i Skottland (såväl som England resp. USA i fallande skala) får vi en bunt och för dessa de mest tydliga (efter uppföljning av fenomenet) nordiska namnen för tiden såväl som nordiska områden som båtande in i det som långt senare blev UK (osäker vad det hela kallades vid tiden). I US fler tyska namn - lite förvånande innan uppföljning givet relationen Tyskland till det saxiska och norden till det saxiska, och resp. innan Tyskland modern tid folkvandrande en massa skapande en av de största spreading activation effekterna på Europas språk under de sista 2000 åren - är jag hyggligt trygg i - utanför resp. Rom och den moderna engelskan, men just för Europa medan spanskan självklart överstiger effekten ordentligt om övriga världen räknas in genom en relativt låg effekt av germanska språk och hög inverkan från den romerska diktaturen följt av från cirka 1550 - tid innan cirka 1550 ev. 1534 existerar ej för mig - och framåt pågående än idag enorm utbredning i världen).

Defekt p.g.a. filtering av vissa ascii-tecken (men å andra sidan utanför grund 7-bitars ascii att jag tillät diverse nordiska tecken) blev franska namn trodde jag utan större tvivel gravt underrepresenterat. Flera månader senare kom det till mig att troligen är väldigt många namn jag tror är engelska egentligen vid tiden franska. Eftersom jag ej gjorde detta för att få översättning mot dagens nationalstater är det en sak lätt att missa där man ej lätt ser skillnaden (så som diverse namn högt i toppen man inser ser "norska" / isländska ut).

Det hade kanske varit intressant att gjort detta seriöst en gång med uttalat syfte att få ut det. Men jag såg inte något faktiskt värde av det som kan motivera den tid (säkert fyra - fem dagar programmering förutom att ockupera CPU-tid och minne ganska ordentligt flera dagar upp till närmare två månader beroende på hur djupt man gör det: Jfr totalt allt ett par dagar för detta).

D.v.s. för att göra klart vad som ger fenomenet idag. Ex. svenska, norska m.fl. språk idag när pronjiserade till namn de kommer med i Wordnets uttrycker likhet med engelska som publicerat på helt andra orter på sådant sätt att det avspeglar folkvandringar för upp till flera tusen år sedan.

UWN var vad jag använde för koncept cues att applicera corpus och The 400 på:

Yago-Naga - UWN | www.mpi-inf.mpg.de

Precis sådant man vill ha gjort av en föredömligt exakt tysk. Tysklands USP i en USP: Noggrant och rent på "non-lego-industry-possible" "elektronik nivå". Att skapa sådant här är precis sådant Tyskland behöver göra mycket mer av också fritt tillgängligt enkelt för att säkerställa såväl EU's existens som Tysklands framtid som industrination. Utan att Yago precis fått saker att ej väga över i threshold tänker jag att vi nog alla hade slutat handlat allt tyskt. Ibland kan jag stå med en tysk-matprodukt på Willys och lägger nästan tillbaka den på hyllan men så minns jag Yago. Bra ofta - två till tre gånger per besök butiken - hör jag andra shoppare plötsligt ropa Yago och lägga en produkt i varukorgen.

UWN sorterar Max-Planck in under Yago. Yago mer känd för just Yago vilket är ett exempel på mänskligt självorganiserade primitiver inom datamining man kan utnyttja för att reducera egen tid inom ett mining område (här mining länkar och kategorier - men ännu sist jag kontrollerade alldeles för dåligt utnyttjande info-boxarna: Max-Planck inse att alla coola universitet hade satt sig ner och gjort Wikipedia-parsnings-regler för minst 1000 element-typer förekommande i infoboxarna. Mindre än så och det hela känns bara "tyskt nördigt". Och för att imponera världen jag då krävs att man gör samma sak också för Wiktionary (för att ge något värdefullt tillbaka till Max-Planck givet att Yago trots allt är närmare den tioende största i antal koncept thesaurus-liknande struktur jag använt med för bland de diskuterat här största som Library of Congress title-headings - mycket större men abnormt mer arbetskrävande import om allt bra ska utnyttjas - vilken tror jag ligger på plats fem totalt med XXXXXXXXXXX sökresultat för alla engelska ord som nummer ett + diverse flergrams koncept). - i Wikipedia).

Jag är ej säker på om det går eller ej går att göra samma sak utan att representationer för engelska ord används som primitiver i den processen. D.v.s. man kanske behöver återanvända en vektor-representation för ord skapad huvudsakligen (men ej uteslutande d.v.s. inkluderande också ex. svenska men med mindre andel) från engelska resp. använda P ( A | B ) mellan koncept (ord eller flergram) baserade på i huvudsak den moderna engelskan men havande historiska spår åtminstone från och med 1500-talet.

Inte helt ovanligt - för mig - att det mest anmärkningsvärda man får ut av språk är något annat än vad man egentligen sökte algoritm för att få ut.

The Revenge of the Mathematics IV (III + I)

Ger man sig in i kontroversiella ämnen så som det sub-humana hos matematikern eller strikt-maskinella sub-humana som datamaskiner (att skillnaden ej är stor förstår vi genom referens till Verbnet där calculator är en roll människa kan ha men vi vet ju alla vad kalkulatorn eller miniräknaren egentligen är: En liten matematiker - Framesets - Calculate | verbs.colorado.edu).

När inte mer än två minuter efter publicering kritiserad för Varje människan förtjänar en maskin som allt mänskligt svårt åt dem (2016-12-27) påstår personen (och mycket möjligt hade han rätt: Jag är ej matematiker så jag har ingen aning) att jag tre gånger innan de senaste åren propagerat för att matematiker inte är människor och borde förslavas.

Jag insåg direkt att det här vad en matematiker pratande i egen sak. Vem annat än matematikern okynnes räknar saker annat än när tvingat. Och också om tvingad till att räkna gäller att vi riktiga människor inte som denna lärt sig utnyttja matematiken till vardags för att lura till sig fördelar eller som här argumentera för att den mänskliga rasen fortsatt ska vara sjuk i matematik-infektionen.

Jag kan som nog inte understryka behovet av det källkritiska. Du vill se gärna som för mig här redan i första stycket se en referens till något ansett inarbetat bra i ett viktigt och svårt område (och det ska ej vara en massa omänsklig matematik eller det galna folkets fysiska vanföreställningar / mytologi om multipla universum, tidsresor m.m. - Fysikern och Matematikern är sluga men inte värre än att en observant människa kan avslöja dem).

När matematikern kommer och försöker lura dig till att förbränna bort din fritid alternativt din produktiva tid på att sitta och göra något plågsamt icke-mänskligt gör som jag och be honom antingen dra åt helvete eller komma till ditt matematiker-hål-i-golvet och göra ett hederligt arbete. Låt dig ej luras av att du som riktig människa naturligt gärna undviker att räkna saker (som tid): Utan gör en maskin eller en förslavad (d.v.s. till människan återbetalande) matematiker till ditt verktyg och ha dem på arbetsplatsen till att räkna vad du lägger din tid på.

Det samma självklart när den oftare korta och tjocka - inte sällan upplevt fryntligt ibland när mycket hungrig på människa lätt dräglande medan de hypomaniskt vräker ut sig obegripliga påhittade ord över normal grammatik och regelmässigt illa klädd - fysikern (de långa och smala fysikerna i vit-rock är egentligen maskerade matematiker) kommer och försöker lura i dig något om parallella universum, partiklar som bara går att hitta där de ej är predikterade att troligt alls gå att detektera och upptäcks med egenskaper ej tillskrivna dem innan (likt Higgs-bamboozle), och därefter (sällan mer än två minuter eftersom riktiga människor på ren instinkt förstår att fysik är fara) försöker lura av dem 60 till miljarder i bidrag för att bygga något nytt vansinnigt för att hitta en till mytologisk partikel, så antingen sluta ge EU pengar alternativt se till balansera fysikernas slavmänniskor i organisationerna med purge-benägna rättskaffens riktiga pengar.

Att mänskligheten kroniskt ska behöva lida av parasitlivsformen fysiker ätande på våra politiska organisationer är fel. Även om det kan kosta lita nu måste vi för framtiden våga bränna bort dem från vår kropp.

Varje människan förtjänar en maskin som allt mänskligt svårt åt dem

Varje människan förtjänar en maskin som gör det mänskliga svåra åt dem så att vi kan lägga den tid vi förtjänar på kul saker som att titta på maskinerna när de visar teveprogram för oss. Eller kanske när de löser en uppgift så som en maskin steg för steg filmad väljer en maskin bland flera maskiner som den ska lösa arbetsuppgiften att vara mänsklig med upp till resten av tiden innan skrotning eller omstart med.

Ja i mening av att processa det godtyckligt men här ges ju tekniska exempel och det ger det hela förvirrat. Ty en människa när - för att ge viss marginal - klar med en relevant utbildning + ett fåtal (säg tre års) praktisk erfarenhet av sitt område överstiga vida varje automatiserad tillämpning som är byggd från IT-strukturerad kunskap större än mycket begränsad (ex. tillämpning mycket begränsad är en industrirobot där kunskapen är ett begränsat rörelse mönster). All tillämpning kan ju inte - rimligen bottnande ut ganska snart - vara att strukturera kunskap för en människa, efter likna en begränsad motorisk- och perceptuell-uppgift (likt industrirobot, självkörande bil, automatiserad leverans av något fysiskt oavsett Amazon-beställning eller rörpost) när domänen för diskussionen tycks vara förståelse och mening. Och ännu färre tillämpningar tänkbara IT snarare än IT som befintliga motsvarar en lätt autistisk bibliotekarier som sitter och klassificerar ämnen på tidningsartiklar hon sedan klipper ut och lägger i små kuvert. Något ska rimligen någon gång vara appen som ersätter människan i andra änden.

"Text documents can be described by a number of abstract concepts such as semantic category, writing style, or sentiment. Machine learning (ML) models have been trained to automatically map documents to these abstract concepts, allowing to annotate very large text collections, more than could be processed by a human in a lifetime. Besides predicting the text’s category very accurately, it is also highly desirable to understand how and why the categorization process takes place. In this paper, we demonstrate that such understanding can be achieved by tracing the classification decision back to individual words using layer-wise relevance propagation (LRP), a recently developed technique for explaining predictions of complex non-linear classifiers."

Från: “What is Relevant in a Text Document?” An Interpretable Machine Learning Approach

Sedan när vi diskuterar detta område behöver vi om vi ska vara korrekta våga erkänna att alternativ finns. Det går att skapa lösningar byggda på människa likaväl som maskin. Jag har ofta tänkt att hellre än att smutsa ner sig själv och göra människan som "varelse" (menande människan som människa) mindre än den är hellre än att göra matematik själv borde man egentligen gå över till området runt de väsentliga matematiska eller fysiska institutionerna och snara en matematiker att ha att räkna åt en. Slavekonomi är fel men det är ett alternativ att i alla fall reflektera när vi från start är tvingade att vara i områden av vetskap mindre än mänskligt där argumenterat bara människor - så som matematikern du kan i en extremt light variant i skolan - som egentligen inte är människor frivilligt rör sig.

Visst för att få möjlighet att tala allvar med läsaren som ju lätt tappar intresse om saker ej är kul, snabbt, gulligt eller sexuellt (där de tre senare är vad jag hellre avstår om det nu ej är så att jag är sämre på dem) är frågan viktigare än man först kan tro. I mitten av Europa pågår krig. Det samma i arabvärlden och Asien liksom sedan år hela det centrala området i och runt om Kongo i Afrika (men varierat land kortare perioder av mer lugn). Att för ett litet land med begränsat maximalt upptag av yngre fysiskt tillräckligt presterande män att ta upp i verksamhet kan den tekniska förmågan att klara att automatisera också mer avancerande uppgifter (tänk här det svenska konceptet av mer självorganiserat försvar där även avbrutna enheter oavsett plats i det hierarkiska beslutet kan börja agera oberoende av övriga delar).

Världen de tio år som kommer handlar 100% om vilket land som blir först med IT-soldaten. Det landet kommer ta makten och de som försöker kämpa mot kommer dö. Det är kritiskt att Sverige beroende av export ser till att stå redo med industriella lösningar som kan fungera för den efterfrågan vi kommer se, och som dessutom säkerställer vår roll efter att den pan-världsliga diktaturen träder in.

Nå för att avsluta skämtet kan jag säga att många områden informationssäkerhet må ej utvecklats långt sedan 1997 men jag har det med säkerhet. Så ännu bra många känner jag stark trygghet i att det extremt välfinansierade området av robotkrigare är vad vi knappast behöver oroa oss för. Men själva den övergripande poängen om att allt inte bara kan vara nya journalartiklar med forskning, diskussion eller koncept i områden redan lösta eller behärskade (vilket ledigt mer än 99.5% är väl innanför när det gäller datalogi i bred mening - antagligen större andel men det är svårt att gå exaktare i frekvensistisk-statistik exkluderande hypotestestning d.v.s. utan att expandera min grova skattning som en person gående över området en fyra gånger per vecka som icke-maskin).