Robotar på Twitter vs Kinesiska diktaturen i Washington Post

2014-06-09

Att robotar är så pass effektiva - i någon mening beroende på definition likvärdig med människa - för att simulera människor på Twitter är för mig varken nytt (sedan ett antal år) eller det som är mest intressant i fråga om utmaning relaterat analys av Twitter:



Detta därför att utmaningen av att separera dessa och människor ej för de fall det är intressant självklart löser dom problem robotar är del av att skapa. Problematiken har snarare att göra med vilka förstådda eller underförstådda definitioner vi ställer upp för en Twitter-användare (eller användare i vilket socialt media som helst) vi önskar analysera.



Skämtbild med tillhörande komiska ord såväl som en introduktion till the noble art of sockpuppets finns i Sockpuppets: Barnpsykolog möter Internets belöningsinriktade barn framtagen av Staff Clown Husman.

Säger vi att tillräcklig definition är att användaren är mänsklig kvarstår problem relaterade åtminstone följande:


  • En person har inte en Twitter-användare utan fler användare.
  • Där det inte är självklart (kanske inte ens vanligast eller normalt) att resp. användare uttrycker en aspekt av personen själv.
  • Utan istället kan vara simulering av olika mer eller mindre trovärdiga typiska Twitter-användare utifrån olika kommersiella inriktningar.

D.v.s. situationen vi har när för att expandera upp räckvidd för att introducera marknadsföring en person upprätthåller många konton inriktade olika subkulturer och intressen. Separeringen emulerande subkulturer ger både (normalt generellt) bättre räckvidd i resp. och möjlighet att rikta marknadsföring mot dessa utan att det kan störa kanaler in i andra subkulturer (ex. tydligast när vi önskar tala i två motsatta riktningar relativt två subkulturer).


Snarare för mig tycks istället definitionen av en optimal Twitter-användare vara en användare med exakt ett Twitter-konto. Frågan om den personen får betalt eller inte för en del inlägg upplever jag väsentligt mindre (om alls egentligen) problematisk att korrigera för automatiserat (i tycker jag likartade miljöer ej problematiskt för korrigering men ej prövat specifikt Twitter). Om dispergans från detta skapas med robotar eller inte är sekundärt och gör problemet större i den mån det blir relativt vanligare resp. mindre problematiskt i den mån det gör filtrering enklare.


Är dispergens från optimum en användare ett konto (där jag gärna räknar användare med flera konton uttryckande dem själva oavsett sorterande delar av livet eller inte som sannolikt ett icke-problem under förutsättning att redundans ej om vi tänkt för samman innehållet är större än normalt för ett konto utan snarare avser när något uttrycker samlat av som försöker emulera flera personer men ej motsvarar detta oavsett om ursprung är mänskligt eller inte).


Uttrycket av att beskriva vad som ej är ett problem utifrån normal nivå av redundans ger oss en indikation om vad som annars är det faktiska problemet:


  • Analyserande datat kan vi ev. säga något om människor allmänt ex. vad de tycker rent allmänt rörande något.
  • Men om resp. användare i en grupp skapar större redundans rörande frågan än motsvarande antal individer får de större påverkan när vi gör beräkningarna.
  • Och praktiskt får vi en felaktig skattning av vad alla i "genomsnitt" tycker därför att ett antal bakomliggande implicita verkliga personer (om vi utesluter rena "virus-organismer" ej styrda mänskligt om vad de tycker) "röstar" fler gånger per falsk uppfattad "Twitter-individ".

Risken att värdera ner starkt övertygande till mindre än en människa per individ

Jag kan förövrigt notera att motsatt effekt också är möjligt. Starkt mer sekteristiskt troende personer vet jag av erfarenhet gärna surfar runt webben efter frågor de känner för som de kan reagera på. Detta gäller bl.a. Scientologer. Och långt ifrån sällan har de ens läst vad de reagerar på utan reagerar i default mot ett antagande.


Vi har ett något jämförbart fenomen för frågor relaterade resursstarka organisationer bevakande vad som uttrycks för dem. Ett excellent exempel är Kina när nyheter publicerade av The Washington Post berör dem där vi normalt får första kommentar av någon uttryckande en alltid starkt försvarande position från perspektiv av kommunistpartiet. Ett potentiellt värde Washington Post har (och varför man egentligen borde spindla ner det innan de ev. tar bort kommentarer binärt) är just möjligt corpus som respons till nyheten som signal. Ett färskt exempel (från mängden approximativt alla nyheter runt Kina):


"Rising China
6/5/2014 8:24 PM GMT+0200
What a stupid statement! Hong Kong is China.
A more pertinent question for the Washington Post to ask would be: is the US breaking apart into two countries? Last I checked, it was the US whose Congress is totally dysfunctional. China's government, on the other hand, is doing quite well minding its own business, and improving the standard of living for all of its people."

Från: 25 years after Tiananmen, is China losing Hong Kong? - Kommentar Ett

Det ska självklart påpekas att sådant vi ser exempel på ovan inte självklart har riktning motsvarande innehåll i effekt. Tänkbart uppfattas det åtminstone bland regelbundna läsare av aktuell tidning som uttryckande en latent gemensam problematik relaterat diktaturen (från mitt paradigm läsaren är när önskvärt ej så stor idiot man hoppas utan är idiot troligast när det är till nackdel publicist). Men jag har aldrig försökt skatta det. Möjligen ger det en effekt närmare vad som sökt.


Komplettering: Ett avbrott noterade jag i en av de färska nyheter Kina jag öppnade upp (jag tog första ovan som ex.) i Despite China’s economic growth, its people’s discontent can’t be stifled. Vad jag minns från när jag tänkt på att notera "fenomenet" är denna unik. Givetvis tycks det inte otroligt att fenomenet i sig över tiden uppmuntrar och skapar jämfört med normalt annars kraftig motivation hos andra att göra ungefär samma sak men just i motsatt riktning vilket vi kanske nu börjar se uttryck för.




Sådant uttrycker mönster och natur inte överdrivet svårt jämfört med andra utmaningar relaterat dessa frågor att detektera automatiskt (därmed inte sagt nödvändigtvis trivialt). Men möjligen har vi samma mönster också när resp. individ uttryckande det ej motsvarar många personer eller ens när vi kräver att mängden uttryckt ska falla innanför normalt för en normal person. Det är möjligt att konkurrerande kostnad av att reagera på massor för att reducera förmåga att skapa en "frisk normal" reaktion i det rationella ej krävs om tron är stark nog.


Vi ser vidare ej avvikande från vad jag försökte uttrycka generiskt att vi tänkbart ganska ofta har individer - ett konto som uttrycker kring vad de annars ej uttryckt kring (kanske inte ens varit aktiva i vad vi tar stickprov från) som latent uttrycker motsvarande en gemensam individ som via dem röstar många gånger medan resp. skrivande person i sig egentligen inte röstar. Det är mer allmänt symptomatiskt för diktaturer där entitet som är makt diktatur gäller för bestämmer vad övriga ska tycka, säga o.s.v. Ej ovanligt är förövrigt att diktatur kan uttrycka formen av motsvarande en omröstning men där resp. individ deltagande ej är fri eller upplevel sig fri att rösta som de själva tycker.


I detta fall kan vi riskera att över-filtrera personer som är starkt troende kring en fråga därför att de tycks uttrycka repetitiva mönster indikerande det maskinellt skapade eller att man egentligen inte läser vad man reagerar på utan tar det endast som möjlighet att säga något förberett. Detta är självklart oerhört problematiskt och ett mycket värre problem när det kommer till hantering av robotar resp. en person - många användare när vi just söker mäta relaterat fundamentalism eller likartade områden där stark tro påverkar hur vi skriver om samma område.