Komplettering: Förutom "Psuedo human": "Pseudo law" (bl.a. roller som avspeglar stereotypiska bias)

2016-01-09

Rörande löst (kanske lite indirekt) indikerade förklaringar i:Gör jag utan att gått ner och mer direkt tagit reda på orsaken (vilket tar en del tid utan att det just ger något) så är snarare att ett par saker jag diskuterade i:Spelar in försvarlig del. Och specifikt att som jag skrev där ej hanterar huvudtyperna av orden. Jag tror att om stannar ganska tidigt i de delsteg jag tidigare löst kommenterade i hur jag byggde ordvektorerna och ej går vidare och beräknar samförekomst mellan resp. ord i vektorn tillsammans med diverse vektorer kan man kanske just för grova ämnen hantera vad vi ser exempel på här lättare utan att ta sådan hänsyn (men såg en del värde med att göra så här och tyckte det var värt och pröva och är tämligen nöjd ännu med en del annat - resp. har sett en del andra problem än just detta mer påverkande om något - framför allt i värde skattning statistisk-samtidighet mellan grupper ord jag ej sett tillsammans i samplad text lite som en förenkling hur jag kan göra med fler-grams-koncepten när jag känner semantiska relationer och andra typer av similarity än använd här mellan dem men lite dummare).


Från exemplen jag manuellt samlade att vid tillfälle låta datorn försöka ta ut ev. fler egna träffar på själv (vilket när själva syftet med Pseudo Law att hantera att de dyker defekt upp topp 1000 - 5000, och flera bra mycket högre än så åtminstone när kända koncept ej visas - ej självklart kommer ge bra resultat ev. blandande in riktig "law-roller" m.m. men som samtidigt också beroende på hur det görs kan fungera bättre i den riktning om några tydliga enskilda riktigt "prototypiska" "pseudo-law" finns vilket omvänt i "law" kan bli diffusa av många fler utgångs-koncept) kan man när man tittar bättre på det än jag gjorde se att den grammatiska aspekten (se Ordvektorer - clusteringen / similarity: Några exempel exporterade) påverkat över verb med en effekt svår bedömd kontra rent rasistiska, stereotypiska föreställningar m.m. i samplad text (eller som vanligt nog diskuterande det samma som exemplet för sexy med thin - om än ej uteslutande).


De absolut första adderade manuellt noterande problemet:punks pirate punks 0.89837046964957
hippie hippie outlaw 0.889945059490536
negroes negroes policemen 0.87305871303574
negro negro outlaw 0.847962782555946

Följande nära nog samtidigt efter att funderat lite och försökte hitta något mer exempel. Spekulerande att nomads (liksom outlaws som den ej uteslutande togs upp med men hade störst likhet med efter diverse avräkning) är en motorcykel-klubb vilka som av mycket att döma är associerade kriminellverksamhet men enligt samma resonemang som i Ordvektorer - clusteringen / similarity: Några exempel exporterade ej för värden jag söker här är en intressant roll eller juridiskt-koncept. Gamblers spekulerande lite kring skillnader lagstiftning m.m. (men gamblers faller dock bort naturligt numera av andra orsaker så mer en algoritm-vikt-egenhet kanske). Och overseer såg jag en bit nedanför med den udda prototypen från prosecutor (i den mening av prosecutor jag vill ska tas in utan att störas i vikterna d.v.s. mindre att bossman overseer kommer och anklagar dig för att bestjäla massa genom att slöa på arbetet):


nomads nomads outlaws 0.892084508660834
irish irish outlaw 0.886480278101285
gamblers gamblers shooters 0.900058775523778
overseer overseer prosecutor 0.889143438601134

Och en större grupp jag av och till lade till allt eftersom jag tyckte mig notera något som riskerade att ta in stereotypiska segment (och flertal av dessa hade ej gått upp law problematiska eller märkbara men lika bra när man ser dem att ta dem). Vi noterar utnyttjande "meta-samarbete" sökande ut från dom jag tagit tidigare (d.v.s. exempelvis gypsy indikerande högt mot hippie) (den oftare korrekta likheten vi finns mellan youngsters och no good kräver att man räknar mer med vektorerna än jag gör i det här steget eftersom det är ett bigram: men det är mer en samhälls-lag än vad som har med juridiska processor resp. konstaplarnas verksamhet att göra):gypsy gypsy hippie 0.939650058372422
hippies hippies punks 0.931379974444902
youths negroes youths 0.931059368705316
strikers nomads strikers 0.930125927353751
rappers punks rappers 0.917273151943807
youngsters gamblers youngsters 0.917098931798224
tribesmen nomads tribesmen 0.916359727498325
drunks drunks punks 0.913378911367613
jewish irish jewish 0.911861275492912
psycho psycho punks 0.911829061764272
aboriginal aboriginal irish 0.910371177287923
slaves negroes slaves 0.908883787149948
gypsies gypsies nomads 0.903702228434824
aborigines aborigines negroes 0.900690507089127
queer hippie queer 0.895739566814645
junkie hippie junkie 0.894372069486567
junkies junkies punks 0.894238980306303
tramp hippie tramp 0.891181238768957
nomad hippie nomad 0.89077356558777
transsexual hippie transsexual 0.890267076966801
outlaw hippie outlaw 0.889945059490536
teenagers gamblers teenagers 0.881989448653414
freak freak hippie 0.880879371623248
gang gamblers gang 0.880533281954867
hooligans hooligans punks 0.878376143951851
detainees detainees inmates 0.941811765608013
foreman detective foreman 0.957811188491655
witch thief witch 0.952990856014179

Och man bör självklart även om det kanske är mindre givet att det egentligen ska uttryckas i ett kategori-viktsystem för "law" att lag och rätt kan definieras från olika perspektiv. Det finns en del roller man gärna kan se att viss försiktighet med att "kategorist" följa ett perspektivs roll-beskrivning givet att det något år senare kan vara ytterst förändrat. Vilket dessa är exempel på:protesters protesters rioters 0.943141022199832
protesters protesters rioters 0.943141022199832
exiles exiles fugitives 0.940869315431678

Medan vi när manuellt uttagna men med viss automatiserad utgångspunkt riktad och mindre genom- / övertänkta bättre ser över-effekten av det grammatiska av att rollerna som sådana ej hanterats i separeringgypsy gangster gypsy 0.90969180361274
homosexuals homosexuals victims 0.913291620127161
gays gays witnesses 0.914290117404115
addict addict assassin 0.915543786128869
detainee detainee informant 0.915740414865244
refugees prisoners refugees 0.916106018798265
scum hooligans scum 0.916300019381079
feminists adversaries feminists 0.878475733743274
zombies gangsters zombies 0.922289354536188
torches handcuffs torches 0.922272233859012
sting shooter sting 0.922266150871791
pentagon pentagon police 0.922228355043557
tribesmen rioters tribesmen 0.922215450311183
superhero gangster superhero 0.922194705511168
hangman hangman thug 0.922293723645603
racist intimidation racist 0.922546907541221
hysterical hysterical reckless 0.924463383653342
foreigner foreigner outlaw 0.924429055124619
desperate desperate reckless 0.92441419295846
extremist extremist terrorist 0.924338618855003
racists racists terrorists 0.924320307386534
hippies gangsters hippies 0.924104501109393
avenger avenger pirate 0.92386740317702
dissidents dissidents terrorists 0.923167926017084
separatists rioters separatists 0.922750077835321
daredevil daredevil outlaw 0.922600171734842
minors minors offenders 0.92510202922916
drunken drunken innocent 0.925576233143282
executioner executioner policeman 0.927276972435209
gypsies gypsies prisoners 0.933571163630342
vigilant reckless vigilant 0.872924718908705
protester policeman protester 0.939876409181945
youngster hitman youngster 0.938991029558496
peacekeepers peacekeepers policemen 0.938593828354737
protestors hijackers protestors 0.936143428753373
vigilante gangsters vigilante 0.929093587551162
stoner hitman stoner 0.931742963822936
extremists extremists terrorists 0.928879013403244
extremist
rapper gangster rapper 0.927946118664023

Jag tror nog det stereotypiska - särskilt i emotionella uttryck spelat in lite varstans - men jag tror när korrigeringar för övergripande typ roller förs in i senare steg och man ev. låter det titta över dom här igen på cluster-dumparna så kommer det vara betydligt mindre indikerat.


Mer Law