Mining Weibo-sökningar

2016-12-29

I reflektion citatet nedan var jag nära att posta ett inlägg refererande att åtminstone för en fem - åtta år sedan kunde man söka fritt genom att manipulera variabler satta via URL (ev. inkluderande någon ej med som default). Men jag insåg att detta ej var Weibo (vilken när saker antar jag uppdaterades upp något i cognitiv-refresh av långtidsminnen är den av de större med något av tydligt community oavsett om socialt media eller ex. produktförsäljning med någon form av kommentering endera part och person till person kontakt mellan typ part såsom för Alibaba vilken liksom Amazon är mycket tilltalande för all form av mining önskande detta med dessutom en koppling till en summa pengar).


"Discussions of Mr. Lei’s case have been censored on Weibo, where searches for his name have been blocked and users have been barred from writing comments on police statements and state-media reports on the matter. Weibo Corp. didn’t immediately respond to a request for comment."

Från: Beijing Police Fire Four Officers Following Death of Researcher in Custody | The Wall Street Journal

Men som sagt inte just Weibo i alla fall. Blir det av ska jag gå över arkiv över gammal mining-kod och prov-posta en del. Går det ej dött i ev. möjligheter av typen här avsett kan man kanske tänka sig att dela en hel del. Det finns långt (långt långt) ifrån få möjligheter utökat relaterat mining genom att flexibelt forma sin förfrågan information till såväl plattformar byggda över välkända standardkomponenter som sådana där det är mer osäkert vad som egentligen finns under (om nu alls något mer generiskt vilket emellertid idag snart 2017 snarare än igår år 2000 är att räkna med). Därmed inte sagt att vi i allmänt ska utgå från att vi kan göra icke-diskriminerade sökningar genom att sätta sessions-variabler (tvärtom snarast förvånande det mig på tekniska detaljer vid tillfället men verifierade manuellt också för icke-engelska och icke-namn såväl som produkter saknande namnlikhet mot känt filtrerat på plattformen för resp. kanal).


Undrar om det inte var Weibo ändå. Jag blir osäker nu. Jag tvivlar på att det kan vara sammanblandat med något annat land i alla fall. På sätt och viss en icke-fråga. Förekomst som sådan filtrering kan ju enkelt verifieras. Och sökningarna i sig annat än som verktyg för diktatur att reducera exponering av sig själva känns tämligen obefintligt i ämnes-kontext här vilket sådant här har föga påverkan på emedan jag tänker att ev. generisk-punkt för icke-censurerade sökningar liksom förr i sig total-filtreras. Förvisso finns nu upp- och ner-sida här. Nersidan är begränsning - vilket bedömer jag är primärt vad man söker i effekt - av intensiva reaktioner under tid nära framåt från händelse. Medan upp-sida är kontinuerlig tillväxt av vardags-nötande-irritation när saker och ting går över och stör uppgifter du vill lösa just nu. Upp-sidan tycker jag är intressant att reflektera särskilt avseende effekt på partimedlemmar men vet sedan varaktig verklighet sedan länge att sådan effekt rörande forskning political science missats samtidigt som utmaning att få en respons-komponent till signal-komponent mining själv är på alla sätt mycket utmanande.


Jag kan ev. tänka mig att dela mitt corpus produkter i Kina avseende termer där "störningar" tycks trätt in. Men jag vill inte lova något då jag ogärna delar corpus rörande associationer värde-koncept (typ produkter eller motsvarande koncept i mening flergram representerande värde som mest trivialt att se resp. havande befintligt affärsverksamhet sökord). Men jag blev som aldrig på det klara här med vad det egentligen var, och möjligen att det är någon form av verksamhet relaterat diktaturens tankekontroll som ej är okänd, och givet nu flera år sedan jag sist gick över mängder av koncept (cirka 300 - 400 k engelska mot de större plattformarna där association antingen marketing av produkter eller att plattformen i sig är till för att sälja produkter).


Rörande såväl sista stycken som allt föregående är en övergripande poäng jag avslutande känner är väldigt relevant att göra att man ej ska överskatta svårigheten att göra mining av såväl tankekontroll eller system under system för tankekontroll. Vad jag kan minnas har aldrig något särskilt mer än vad som jag uttryckas i url krävts i Kina för att kunna göra mycket omfattande mining. Det är förövrigt ganska normalt runt om i världen (även om vissa trivala saker gäller - dock ej växlande ip, tid mellan requests eller annat emulerande surfning mellan ex. sök-request istället för att bara sitta och "söka" igenom hundratusentals koncept m.m. - så som att ip-adresser liggande i poolade för adsl eller motsvarande som säljs i rymder som ligger mot hemanvändare är något bättre än andra: Även om enstaka bland större aktörer enforce uppgivna högre gränser requests per dygn så som allmänt i domänen ovanligt över-känsliga Google vilken jag förövrigt aldrig gjort mining mot annat än indirekt i kontext av COOP på sajter och som där jag saker slumpat sig faktiskt att jag tror att jag haft uttalat tillstånd för varje fall - ex. som för DTIC. - men ändå märker av vilket oavsett hur sunt jag tror det är för Google att prioritera ungefär på nivå som de gör det också samtidigt är stor affärsmöjlighet för aktörer likt Bing! för att komma närmare andra segment av potentiella framtida kunder som Google därmed utesltuer och som association till index som datakälla kan innebära eller grovare för en aktör likt Bing! där affären övergripande är plattformen Microsoft och man ligger väsentligt efter Google är all användning av Bing! bra användning och ju mer användningen antingen liknar datakälla i cloud eller för individ användning via applikation ej Microsoft desto mer värdefull är användningen därför att det representerar någon form av association eller verksamhetsberoende till Microsoft i bredare mening som något annat kan byggas från som ex. konkurrerande manuellt arbete kod sådana operationer kontra kanske api:er gratis som i sin tur i något steg ev. existerande först framtiden kan gå att få bättre gjorda mot betalning - eftersom nu affären så som om tagen 1-1 från Google är riktigt motig om du är naturligt upplevd stor och bred som Bing! - därmed inget sagt i övrigt rörande mining än explicit sagt: Själv introducerar jag inget data varaktigt som går att ställa ifråga "ägandet" till).


Kan man se något värde av även aggressiv mining Kina oavsett nu demokrati eller affär är det troligt fortfarande mer eller mindre bara att göra det. Samtidigt om nu värdet ses existerande kan jag mena att det troligt är klokare och mer försiktigt att aggressivt ta ut det kortare mer omedelbar tid än att vänta. Tankekontroll är en verksamhet - och statlig sådan - som andra vilken kan förbättras över åren och ibland hoppa upp i "kvalitet" ett stycke snabbare än annars. Jag kan tänka mig att jag ev. om tid visar sig finnas går över dem själv brett över alla flergram första kvartalet om inte för mer än att jag kan tänka mig att man någon gång 2017 - 2018 kan se förändringar IT-struktur inducerande mer av "avgränsning mot omvärlden".