Visar inlägg med etikett Amazon. Visa alla inlägg
Visar inlägg med etikett Amazon. Visa alla inlägg

Mining Weibo-sökningar

2016-12-29

I reflektion citatet nedan var jag nära att posta ett inlägg refererande att åtminstone för en fem - åtta år sedan kunde man söka fritt genom att manipulera variabler satta via URL (ev. inkluderande någon ej med som default). Men jag insåg att detta ej var Weibo (vilken när saker antar jag uppdaterades upp något i cognitiv-refresh av långtidsminnen är den av de större med något av tydligt community oavsett om socialt media eller ex. produktförsäljning med någon form av kommentering endera part och person till person kontakt mellan typ part såsom för Alibaba vilken liksom Amazon är mycket tilltalande för all form av mining önskande detta med dessutom en koppling till en summa pengar).


"Discussions of Mr. Lei’s case have been censored on Weibo, where searches for his name have been blocked and users have been barred from writing comments on police statements and state-media reports on the matter. Weibo Corp. didn’t immediately respond to a request for comment."

Från: Beijing Police Fire Four Officers Following Death of Researcher in Custody | The Wall Street Journal

Men som sagt inte just Weibo i alla fall. Blir det av ska jag gå över arkiv över gammal mining-kod och prov-posta en del. Går det ej dött i ev. möjligheter av typen här avsett kan man kanske tänka sig att dela en hel del. Det finns långt (långt långt) ifrån få möjligheter utökat relaterat mining genom att flexibelt forma sin förfrågan information till såväl plattformar byggda över välkända standardkomponenter som sådana där det är mer osäkert vad som egentligen finns under (om nu alls något mer generiskt vilket emellertid idag snart 2017 snarare än igår år 2000 är att räkna med). Därmed inte sagt att vi i allmänt ska utgå från att vi kan göra icke-diskriminerade sökningar genom att sätta sessions-variabler (tvärtom snarast förvånande det mig på tekniska detaljer vid tillfället men verifierade manuellt också för icke-engelska och icke-namn såväl som produkter saknande namnlikhet mot känt filtrerat på plattformen för resp. kanal).


Undrar om det inte var Weibo ändå. Jag blir osäker nu. Jag tvivlar på att det kan vara sammanblandat med något annat land i alla fall. På sätt och viss en icke-fråga. Förekomst som sådan filtrering kan ju enkelt verifieras. Och sökningarna i sig annat än som verktyg för diktatur att reducera exponering av sig själva känns tämligen obefintligt i ämnes-kontext här vilket sådant här har föga påverkan på emedan jag tänker att ev. generisk-punkt för icke-censurerade sökningar liksom förr i sig total-filtreras. Förvisso finns nu upp- och ner-sida här. Nersidan är begränsning - vilket bedömer jag är primärt vad man söker i effekt - av intensiva reaktioner under tid nära framåt från händelse. Medan upp-sida är kontinuerlig tillväxt av vardags-nötande-irritation när saker och ting går över och stör uppgifter du vill lösa just nu. Upp-sidan tycker jag är intressant att reflektera särskilt avseende effekt på partimedlemmar men vet sedan varaktig verklighet sedan länge att sådan effekt rörande forskning political science missats samtidigt som utmaning att få en respons-komponent till signal-komponent mining själv är på alla sätt mycket utmanande.


Jag kan ev. tänka mig att dela mitt corpus produkter i Kina avseende termer där "störningar" tycks trätt in. Men jag vill inte lova något då jag ogärna delar corpus rörande associationer värde-koncept (typ produkter eller motsvarande koncept i mening flergram representerande värde som mest trivialt att se resp. havande befintligt affärsverksamhet sökord). Men jag blev som aldrig på det klara här med vad det egentligen var, och möjligen att det är någon form av verksamhet relaterat diktaturens tankekontroll som ej är okänd, och givet nu flera år sedan jag sist gick över mängder av koncept (cirka 300 - 400 k engelska mot de större plattformarna där association antingen marketing av produkter eller att plattformen i sig är till för att sälja produkter).


Rörande såväl sista stycken som allt föregående är en övergripande poäng jag avslutande känner är väldigt relevant att göra att man ej ska överskatta svårigheten att göra mining av såväl tankekontroll eller system under system för tankekontroll. Vad jag kan minnas har aldrig något särskilt mer än vad som jag uttryckas i url krävts i Kina för att kunna göra mycket omfattande mining. Det är förövrigt ganska normalt runt om i världen (även om vissa trivala saker gäller - dock ej växlande ip, tid mellan requests eller annat emulerande surfning mellan ex. sök-request istället för att bara sitta och "söka" igenom hundratusentals koncept m.m. - så som att ip-adresser liggande i poolade för adsl eller motsvarande som säljs i rymder som ligger mot hemanvändare är något bättre än andra: Även om enstaka bland större aktörer enforce uppgivna högre gränser requests per dygn så som allmänt i domänen ovanligt över-känsliga Google vilken jag förövrigt aldrig gjort mining mot annat än indirekt i kontext av COOP på sajter och som där jag saker slumpat sig faktiskt att jag tror att jag haft uttalat tillstånd för varje fall - ex. som för DTIC. - men ändå märker av vilket oavsett hur sunt jag tror det är för Google att prioritera ungefär på nivå som de gör det också samtidigt är stor affärsmöjlighet för aktörer likt Bing! för att komma närmare andra segment av potentiella framtida kunder som Google därmed utesltuer och som association till index som datakälla kan innebära eller grovare för en aktör likt Bing! där affären övergripande är plattformen Microsoft och man ligger väsentligt efter Google är all användning av Bing! bra användning och ju mer användningen antingen liknar datakälla i cloud eller för individ användning via applikation ej Microsoft desto mer värdefull är användningen därför att det representerar någon form av association eller verksamhetsberoende till Microsoft i bredare mening som något annat kan byggas från som ex. konkurrerande manuellt arbete kod sådana operationer kontra kanske api:er gratis som i sin tur i något steg ev. existerande först framtiden kan gå att få bättre gjorda mot betalning - eftersom nu affären så som om tagen 1-1 från Google är riktigt motig om du är naturligt upplevd stor och bred som Bing! - därmed inget sagt i övrigt rörande mining än explicit sagt: Själv introducerar jag inget data varaktigt som går att ställa ifråga "ägandet" till).


Kan man se något värde av även aggressiv mining Kina oavsett nu demokrati eller affär är det troligt fortfarande mer eller mindre bara att göra det. Samtidigt om nu värdet ses existerande kan jag mena att det troligt är klokare och mer försiktigt att aggressivt ta ut det kortare mer omedelbar tid än att vänta. Tankekontroll är en verksamhet - och statlig sådan - som andra vilken kan förbättras över åren och ibland hoppa upp i "kvalitet" ett stycke snabbare än annars. Jag kan tänka mig att jag ev. om tid visar sig finnas går över dem själv brett över alla flergram första kvartalet om inte för mer än att jag kan tänka mig att man någon gång 2017 - 2018 kan se förändringar IT-struktur inducerande mer av "avgränsning mot omvärlden".

Avsnitt II: Spindlande Ericsson konkurrerande konkurrenter: Att indirekt indikera nätets "riktigare" kunskap och kultur istället för att upplevas död

2014-05-05

Medan den i antal länkar som hålls i minnet cirka (tror och skattar jag ganska ungefärligt) hundra gånger (eller mer) fortgår utan problem har spindlingen riktad med start från några teknik aktörer dött p.g.a. indikerat brist på minne. Ev. en slump när några andra trådar tog upp ordentligt vid uppstart (om den allkerar samtidigt har jag fått för mig att de för åtminstne Perl-pgorammen troligare dödas) eller som jag gissar här därför att de laddat ner exe-filer som petat runt med mängden data ej skrivet till filen i för snabb takt i samband med annars minnesbrist vid uppstart konkurrerande trådar.


Eftersom diskuterat i Spindlande Ericsson konkurrerande konkurrenter: Att indirekt indikera nätets "riktigare" kunskap och kultur istället för att upplevas död komprimerade jag samman de första två filerna (ev. saknas den för tredje-epoken men ids inte titta exakt när filehandles skapas om för ny fil: om saknad ändrar jag troligen det hela något för att minska risken för att tappa tydligt: erfarenheten allmänt från hur Perl fungerar på min konfiguration Ubuntu är att mindre data än aktuellt här sparas mellan samtidigt är jag riktigt nöjd med hur hela domänen av minne vs. disk fungerat här på Windows 7 just för spindlingen så jag klagar absolut inte: verkligen över allt jag hade förväntat mig):



Relaterat Ericsson var illustrerande vad diskuterat (men mer illustrerande än jag förväntat mig egentligen givet stort företag och ändå ett ganska försvarligt stort antal publicister relaterat teknik spindlade) fanns ytterst få länkar till Ericsson. Ex. från de tre entiteter jag såg vid manuell sökning i Emacs var:


http://pinterest.com/ericssonpins/a-history-of-communication/

www.lightreading.com/
http://www.lightreading.com/mobile/ericsson-appoints-chief-strategy-officer/d/d-id/708861

t.co/
http://www.ericsson.com

lemonodor.com/
http://the.taoofmac.com/space/SonyEricsson/T610

Oavsett i mening av närmare externa redaktionella avtryck resp. engagemang att se till att man finns med i kanaler där företag själva talar, berättar och visualiserar sig är det relativt vad jag uppfattar som normalt dåligt avvikande. Oavsett innehållet eller kanalen i sig kan det dessutom ge en känsla av att internet känns lite nytt för Ericsson och man inte riktigt märkt mycket av det vilket knappast är riktigt utan att det just blir bättre av det. Kompletterande följande korta reflektion:


"Föreställning att det ej spelar roll tror jag är felaktigt. Jag kan tänka mig att en del äldre koncept hade kunnat kvarstå framgångsrika om områden som dessa fungerar bättre. Vidare även om man riktar in sig på större affärskunder i långsamma affärer kännetecknas ju dessa just av att vara mycket kompetens-drivna rörande allt relaterat att passa in tekniska koncept i dom egna lösningarna. Att etablera synlighet för hela området för tekniska standarder, inriktningar m.m. närmare det egna tänket bör tror jag sett över en längre tid löna sig oerhört. P.s.s. för färskare konkurrerande företag kan samma synlighet löna sig ordentligt mycket mer därför att för dem finns mindre av upparbetad befintlig kunskap om de egna lösningar hos potentiella kunder. Däremed gäller eftersom mängden uppmärksamhet en befintlig kund eller prospektiv kund är begränsad att det är viktigt oavsett välkänd aktör eller ny aktör att etablera synlighet också för att inte lämna det itll andra att ockupera. Dessutom är det i kostnad så billigt att det bara är löjligt att inte göra det ordentligt. "

Från: Spindlande Ericsson konkurrerande konkurrenter: Att indirekt indikera nätets "riktigare" kunskap och kultur istället för att upplevas död


Kan vi tänka på något längre sikt än så och som av och till noterat här (bl.a. Är GSM värt mycket mer i framtid än vi kanske tror? Och krigiskt? (2014-01-30) och Mobila WLAN för frihet & Europeisk impotens från självstympning (2012-02-16)) uppmärksamma att priserna relaterat att etablera nätverk oavsett typ reduceras och att det inte är självklart oavsett hur stabil affär mobil- och fast-telefoni-operatörer resp. deras leverantörer har att affärer närmare konsumenterna (ex. mindre aktörer) kanske blir fortsatt vanligare och i fler teknik-domäner.


T.co har förövrigt varit ytterst vanlig allmänt. Och precis som jag gissade (jag tar ingen olämplig stolthet i att jag inte behöver följa nyheter om sociala media tjänster för att känna igenom url-förkortning även om jag inte riktigt begriper varför det ska förkortas istället för att sätta en ankar-text på länken ex. men med samma "egenhet" kvar förkortad url som ankar-text och riktig url som länk så att man kan se var man kommer genom att hålla muspekaren över länken eller kopiera ut den) var det tjänst för att korta ner URL. Och det förenklar kanske med en dominerande tjänst associerad en av de största aktörer där förkortade url:er praktiskt regelmässigt används: Twitter.


Referensen o Spindlande Ericsson konkurrerande konkurrenter: Att indirekt indikera nätets "riktigare" kunskap och kultur istället för att upplevas död till ett konto sociala media som togs upp för Ericsson var korrekt Twitter:


www.ericsson.com/
http://www.ericsson.com/news?tagsFilter=ICT+industry

www.ericsson.com/
http://www.ericsson.com/news?tagsFilter=consumers

twitter.com/
http://twitter.com/EricssonTV/status/461988780707438592

Givetvis är det inget fel på Twitter. Men en erfarenhet från spindlingen senaste veckor är att Tumblr uttrycker något av den betydande smyg-etablering Flickr gjorde under flera år tills man någon gång 2007 - 2009 kanske började inse att det hela var på väg att bli riktigt stort. En viss elegant existens utan den annars ibland lite överuttryckande behovet av att berätta om betydelsen av existensen och hur riktigt stor man blivit (det elegantare är självklart enklare för en entitet likt Yahoo som ej har ett socialt media som Tumblr mer singulärt: men det kan också vara relaterat mer allmänna tankar om varumärken relativt tid).


För loggar (likt filerna ovan) från idag och igår och totalt 14 325 991 (plus några stycken till eftersom totala antalet efter sista filen ej skrevs ut - jag programmerade fel - men ungefär säg 15 miljoner) länkar fördelades länkar till tre stycken sociala media jag fått för mig liknar varandra i tänk (kortare text och möjlighet att uttrycka relation till entiteter man vill läsa eller mer social länkning / följande / gillande) resp. Stumbleupon:


Twitter 91 576
Facebook 61 087
Tumblr 56 112
Stumbleupon 1453
Resp. sorts motsvarighet i det rent länk-spam-funktionella tog jag ej ut något av men också där skiljer motsvarighet till Stumbleupon ut sig något med auto-surfande funktioner eller nätverk där besök delas (eller att besöks köps rätt av för att försöka öka annonsvisning). Jag sökte här eftersom RSS-strömmar egentligen endast söktes ej filtrera bort dem och såg det ev. som användbart att ha en dump för enklaste tänkbara mönster oavsett spam, reklam eller affility-relationer. I någon mening är en refererad bok representerade värde därför att den uppskattades (kanske länkande Wikipedia eller lika gärna Amazon) eller en bok länkad via affility-länk intressant från ett värde-perspektiv även om "valutan" inte är den samma (dock är det önskvärt att förstå vilken valuta som värde indikeras via eller nära relaterat).

En tolkning är att entiteter utanför individer - företag, organisatioer m.m. - fortsatt så länge resp. är aktiv för de tre första med jämförbar funktion kommer konvergera antalen. När använda bland individer d.v.s. läsare, personer man vill ha kanaler mot o.s.v. är det vettigare att existera i resp. Det kommer ju inte med någon merkostnad. Jämför med Minimalistiskt sido-algoritm-skiss beräknande läsare nyhetsmedier II: Algoritm omvandlande tidskostnad referera nyhet till förtroende publicist för Vita husets utlokaliseringar:


"Vidare för att ge ett exempel motsvarande vad som noterades särskilt relaterat SEO föregående motsvarar mitt gamla koncept (från säg 2006) om ambassader i sociala media eller vilka som helst samhällen på nätet bundna till en nod vi enkelt kan särskilja (d.v.s. typiskt minst ett domännamn och ibland pået mindre grupper). Vi kan ex. se hur Vita huset (kanske också för rättvisa mot olika ofta amerikanska företag) lokaliserar sig i ganska många motsvarigheter samhällen.

Motsvarande företag p.s.s. ger det möjlighet att möta samhället där de oftast här och ofta nog viktigare praktiskt finns relaterat innehåll när samhället söker det lokalt eller reagerar och uttrycker om företaget, organisation o.s.v. En inarbetad väg att tala lokalt vid behöv. Skillnaden relevant här som ex. finns där mellan default-publiceringen t.ex. samma filmklipp på resp. video-social-media-sajt (Youtube, Vimeo och jämförbart) resp. när reaktionen är riktad eller en meningsfull reaktion lokalt. Och för default-publicering om denna är direkt associerad till samma entitet eller uttrycks för ett antal olika entiteter där det senare kan indikera bl.a. "spam", behov av anonym publicering andra orsaker, eller något viralt."


I kontrast tycks åtminstone Nokia, BBC och Unesco ockupera internet-area österut (Ukraina m.fl. länder...):


www.nokia.com/
http://vk.com/nokiaukraina

www.unesco.org/
http://vk.com/unesco

Respektive finns bredare än så inkl. för Unesco följade (för att ge ytterligare några exempel):


www.unesco.org/
http://itunes.apple.com/us/institution/unesco-united-nations-educational/id435087097

www.unesco.org/
http://www.youtube.com/unesco

www.unesco.org/
http://www.weibo.com/unesco

www.unesco.org/
http://www.linkedin.com/company/unesco

Kanske hemvant för Nokia, Ericsson och Siemens m.fl. är att se kanalen sociala media. Men kanske mer funktionellt för innehållet kan vara att inte göra det svårare än att tänka telefonbok med skillnaden att man betalar för större annons genom att själv medverka till att folk hittar fram på resp. sajt (d.v.s. som normalt numera länka till dem från egen sida m.fl. uttrycksformer på nätet).


Jag hade hur som helst innan knappt märkt Tumblr (men har inte följt nyheter kring upplevt nytt i ämnet på ett tag): Men det är riktigt stort och det är stort hos entiteter som gärna vill finnas men är lite mer försiktiga vilka kanaler man väljer. De märks mycket bland medier, universitet, politiska entiteter m.m. (där givetvis kanske mer välkända Facebook, Twitter m.fl. också existerar inte sällan samtidigt) samtidigt såg att Wikipedia refererade källor som menade att kanske inte det gedigna kompetens-drivna eller ordnat vardags-relaterade innehåll vi lärt oss att förvänta på Twitter alltid är fallet (en grov gissning betraktande ungefär vad jag sett från perspektivet spindlande är det antagligen inte sämre än Twitter och mycket möjligt kanske lite seriösara även om jag knaske har tolknings-bias från att faktiskt använt Twitter mycket mer).