Avsnitt II: Spindlande Ericsson konkurrerande konkurrenter: Att indirekt indikera nätets "riktigare" kunskap och kultur istället för att upplevas död

2014-05-05

Medan den i antal länkar som hålls i minnet cirka (tror och skattar jag ganska ungefärligt) hundra gånger (eller mer) fortgår utan problem har spindlingen riktad med start från några teknik aktörer dött p.g.a. indikerat brist på minne. Ev. en slump när några andra trådar tog upp ordentligt vid uppstart (om den allkerar samtidigt har jag fått för mig att de för åtminstne Perl-pgorammen troligare dödas) eller som jag gissar här därför att de laddat ner exe-filer som petat runt med mängden data ej skrivet till filen i för snabb takt i samband med annars minnesbrist vid uppstart konkurrerande trådar.


Eftersom diskuterat i Spindlande Ericsson konkurrerande konkurrenter: Att indirekt indikera nätets "riktigare" kunskap och kultur istället för att upplevas död komprimerade jag samman de första två filerna (ev. saknas den för tredje-epoken men ids inte titta exakt när filehandles skapas om för ny fil: om saknad ändrar jag troligen det hela något för att minska risken för att tappa tydligt: erfarenheten allmänt från hur Perl fungerar på min konfiguration Ubuntu är att mindre data än aktuellt här sparas mellan samtidigt är jag riktigt nöjd med hur hela domänen av minne vs. disk fungerat här på Windows 7 just för spindlingen så jag klagar absolut inte: verkligen över allt jag hade förväntat mig):



Relaterat Ericsson var illustrerande vad diskuterat (men mer illustrerande än jag förväntat mig egentligen givet stort företag och ändå ett ganska försvarligt stort antal publicister relaterat teknik spindlade) fanns ytterst få länkar till Ericsson. Ex. från de tre entiteter jag såg vid manuell sökning i Emacs var:


http://pinterest.com/ericssonpins/a-history-of-communication/

www.lightreading.com/
http://www.lightreading.com/mobile/ericsson-appoints-chief-strategy-officer/d/d-id/708861

t.co/
http://www.ericsson.com

lemonodor.com/
http://the.taoofmac.com/space/SonyEricsson/T610

Oavsett i mening av närmare externa redaktionella avtryck resp. engagemang att se till att man finns med i kanaler där företag själva talar, berättar och visualiserar sig är det relativt vad jag uppfattar som normalt dåligt avvikande. Oavsett innehållet eller kanalen i sig kan det dessutom ge en känsla av att internet känns lite nytt för Ericsson och man inte riktigt märkt mycket av det vilket knappast är riktigt utan att det just blir bättre av det. Kompletterande följande korta reflektion:


"Föreställning att det ej spelar roll tror jag är felaktigt. Jag kan tänka mig att en del äldre koncept hade kunnat kvarstå framgångsrika om områden som dessa fungerar bättre. Vidare även om man riktar in sig på större affärskunder i långsamma affärer kännetecknas ju dessa just av att vara mycket kompetens-drivna rörande allt relaterat att passa in tekniska koncept i dom egna lösningarna. Att etablera synlighet för hela området för tekniska standarder, inriktningar m.m. närmare det egna tänket bör tror jag sett över en längre tid löna sig oerhört. P.s.s. för färskare konkurrerande företag kan samma synlighet löna sig ordentligt mycket mer därför att för dem finns mindre av upparbetad befintlig kunskap om de egna lösningar hos potentiella kunder. Däremed gäller eftersom mängden uppmärksamhet en befintlig kund eller prospektiv kund är begränsad att det är viktigt oavsett välkänd aktör eller ny aktör att etablera synlighet också för att inte lämna det itll andra att ockupera. Dessutom är det i kostnad så billigt att det bara är löjligt att inte göra det ordentligt. "

Från: Spindlande Ericsson konkurrerande konkurrenter: Att indirekt indikera nätets "riktigare" kunskap och kultur istället för att upplevas död


Kan vi tänka på något längre sikt än så och som av och till noterat här (bl.a. Är GSM värt mycket mer i framtid än vi kanske tror? Och krigiskt? (2014-01-30) och Mobila WLAN för frihet & Europeisk impotens från självstympning (2012-02-16)) uppmärksamma att priserna relaterat att etablera nätverk oavsett typ reduceras och att det inte är självklart oavsett hur stabil affär mobil- och fast-telefoni-operatörer resp. deras leverantörer har att affärer närmare konsumenterna (ex. mindre aktörer) kanske blir fortsatt vanligare och i fler teknik-domäner.


T.co har förövrigt varit ytterst vanlig allmänt. Och precis som jag gissade (jag tar ingen olämplig stolthet i att jag inte behöver följa nyheter om sociala media tjänster för att känna igenom url-förkortning även om jag inte riktigt begriper varför det ska förkortas istället för att sätta en ankar-text på länken ex. men med samma "egenhet" kvar förkortad url som ankar-text och riktig url som länk så att man kan se var man kommer genom att hålla muspekaren över länken eller kopiera ut den) var det tjänst för att korta ner URL. Och det förenklar kanske med en dominerande tjänst associerad en av de största aktörer där förkortade url:er praktiskt regelmässigt används: Twitter.


Referensen o Spindlande Ericsson konkurrerande konkurrenter: Att indirekt indikera nätets "riktigare" kunskap och kultur istället för att upplevas död till ett konto sociala media som togs upp för Ericsson var korrekt Twitter:


www.ericsson.com/
http://www.ericsson.com/news?tagsFilter=ICT+industry

www.ericsson.com/
http://www.ericsson.com/news?tagsFilter=consumers

twitter.com/
http://twitter.com/EricssonTV/status/461988780707438592

Givetvis är det inget fel på Twitter. Men en erfarenhet från spindlingen senaste veckor är att Tumblr uttrycker något av den betydande smyg-etablering Flickr gjorde under flera år tills man någon gång 2007 - 2009 kanske började inse att det hela var på väg att bli riktigt stort. En viss elegant existens utan den annars ibland lite överuttryckande behovet av att berätta om betydelsen av existensen och hur riktigt stor man blivit (det elegantare är självklart enklare för en entitet likt Yahoo som ej har ett socialt media som Tumblr mer singulärt: men det kan också vara relaterat mer allmänna tankar om varumärken relativt tid).


För loggar (likt filerna ovan) från idag och igår och totalt 14 325 991 (plus några stycken till eftersom totala antalet efter sista filen ej skrevs ut - jag programmerade fel - men ungefär säg 15 miljoner) länkar fördelades länkar till tre stycken sociala media jag fått för mig liknar varandra i tänk (kortare text och möjlighet att uttrycka relation till entiteter man vill läsa eller mer social länkning / följande / gillande) resp. Stumbleupon:


Twitter 91 576
Facebook 61 087
Tumblr 56 112
Stumbleupon 1453
Resp. sorts motsvarighet i det rent länk-spam-funktionella tog jag ej ut något av men också där skiljer motsvarighet till Stumbleupon ut sig något med auto-surfande funktioner eller nätverk där besök delas (eller att besöks köps rätt av för att försöka öka annonsvisning). Jag sökte här eftersom RSS-strömmar egentligen endast söktes ej filtrera bort dem och såg det ev. som användbart att ha en dump för enklaste tänkbara mönster oavsett spam, reklam eller affility-relationer. I någon mening är en refererad bok representerade värde därför att den uppskattades (kanske länkande Wikipedia eller lika gärna Amazon) eller en bok länkad via affility-länk intressant från ett värde-perspektiv även om "valutan" inte är den samma (dock är det önskvärt att förstå vilken valuta som värde indikeras via eller nära relaterat).

En tolkning är att entiteter utanför individer - företag, organisatioer m.m. - fortsatt så länge resp. är aktiv för de tre första med jämförbar funktion kommer konvergera antalen. När använda bland individer d.v.s. läsare, personer man vill ha kanaler mot o.s.v. är det vettigare att existera i resp. Det kommer ju inte med någon merkostnad. Jämför med Minimalistiskt sido-algoritm-skiss beräknande läsare nyhetsmedier II: Algoritm omvandlande tidskostnad referera nyhet till förtroende publicist för Vita husets utlokaliseringar:


"Vidare för att ge ett exempel motsvarande vad som noterades särskilt relaterat SEO föregående motsvarar mitt gamla koncept (från säg 2006) om ambassader i sociala media eller vilka som helst samhällen på nätet bundna till en nod vi enkelt kan särskilja (d.v.s. typiskt minst ett domännamn och ibland pået mindre grupper). Vi kan ex. se hur Vita huset (kanske också för rättvisa mot olika ofta amerikanska företag) lokaliserar sig i ganska många motsvarigheter samhällen.

Motsvarande företag p.s.s. ger det möjlighet att möta samhället där de oftast här och ofta nog viktigare praktiskt finns relaterat innehåll när samhället söker det lokalt eller reagerar och uttrycker om företaget, organisation o.s.v. En inarbetad väg att tala lokalt vid behöv. Skillnaden relevant här som ex. finns där mellan default-publiceringen t.ex. samma filmklipp på resp. video-social-media-sajt (Youtube, Vimeo och jämförbart) resp. när reaktionen är riktad eller en meningsfull reaktion lokalt. Och för default-publicering om denna är direkt associerad till samma entitet eller uttrycks för ett antal olika entiteter där det senare kan indikera bl.a. "spam", behov av anonym publicering andra orsaker, eller något viralt."


I kontrast tycks åtminstone Nokia, BBC och Unesco ockupera internet-area österut (Ukraina m.fl. länder...):


www.nokia.com/
http://vk.com/nokiaukraina

www.unesco.org/
http://vk.com/unesco

Respektive finns bredare än så inkl. för Unesco följade (för att ge ytterligare några exempel):


www.unesco.org/
http://itunes.apple.com/us/institution/unesco-united-nations-educational/id435087097

www.unesco.org/
http://www.youtube.com/unesco

www.unesco.org/
http://www.weibo.com/unesco

www.unesco.org/
http://www.linkedin.com/company/unesco

Kanske hemvant för Nokia, Ericsson och Siemens m.fl. är att se kanalen sociala media. Men kanske mer funktionellt för innehållet kan vara att inte göra det svårare än att tänka telefonbok med skillnaden att man betalar för större annons genom att själv medverka till att folk hittar fram på resp. sajt (d.v.s. som normalt numera länka till dem från egen sida m.fl. uttrycksformer på nätet).


Jag hade hur som helst innan knappt märkt Tumblr (men har inte följt nyheter kring upplevt nytt i ämnet på ett tag): Men det är riktigt stort och det är stort hos entiteter som gärna vill finnas men är lite mer försiktiga vilka kanaler man väljer. De märks mycket bland medier, universitet, politiska entiteter m.m. (där givetvis kanske mer välkända Facebook, Twitter m.fl. också existerar inte sällan samtidigt) samtidigt såg att Wikipedia refererade källor som menade att kanske inte det gedigna kompetens-drivna eller ordnat vardags-relaterade innehåll vi lärt oss att förvänta på Twitter alltid är fallet (en grov gissning betraktande ungefär vad jag sett från perspektivet spindlande är det antagligen inte sämre än Twitter och mycket möjligt kanske lite seriösara även om jag knaske har tolknings-bias från att faktiskt använt Twitter mycket mer).

"Volymen" information i biografier: Att förhöra biografier

Jag drog mig igår minnes - av en slump egentligen - Att förhöra biografier jag skrev troligt 2011 med utgångspunkt från ett par jag läste manuellt och ett mindre antal riktade försök med besläktat elektroniskt material (ej då i natural language processing utan färdigt i en graf-representation händelser, personer och omliggande brett uttryckt "beskrivande" koncept).


Vad man kan fundera på är vad egentligen volymen är på detta data i en bred "kreativ" mening. Oavsett antal publicerade böcker gäller fortfarande att formen de är publicerade i (format inte minst men därefter ganska omfattande löptext relativt tung i natural language processing när vi betraktar mer än en bok) resp. känner jag är fallet att möjligheter tekniskt kan ligga längre fram än vad vi riktigt vant oss vid att se för ett område där vi fortfarande är vana att se det som böcker vi läser.


Vad för interferens över en mängd böcker kan finnas som indikerar vad som är svårt att se i resp.?


Också i systematiserad mening över källor av mer varierad sort d.v.s. tagande in som trivialt uppenbart ex. folkbokföringen (DAFA-Spar) m.fl. register vilken information är mer manifest uppenbar i tillgänglighet och vad är oftare mer latent i att den kan inverka men vi kanske oftast inte ser den. Det senare kan ju tänkas komma av att vi vanligen ej investerar tid att "titta efter", att funktionell tillgänglighet till datakällorna vanligen ej är vad vi väljer att etablera för smalare enskilda behov resp.. att latent data kan vara latent i den mening att sammanfattade slutsatser kan dras från det medan själva datat i sig ibland inkl. källan som sådan är skyddad från publicering.


Vi kan i alla fall oavsett spekulerat exempel i allt föregående att en distans mellan information vi förväntar oss kan finnas och vad som faktiskt finns kan existera. Dels genom att mer finns än man trivialt först kanske tänker oss (och jag är minst sagt osäker för denna tekniska såväl som datalgrande domän utanför interferens över en mängd biografier jag är ganska trygg är kan vara betydande egentligen är).


Praktiskt realitet uppenbar när vi betraktar tänkbar interferens som framgår analyserande en större mängd - säg alla - biografier relaterade personer deltagande i en viss händelse, boende på orter relaterade händelsen ungefär lokaliserat i tiden o.s.v. är att antalet entieter (indikerat i konceptet biografier personer men självklart inkluderar vi lika gärna orter, tidpunkter m.fl. entiteter vi meningsfullt effektivt kan söka interferens effektivt med soml lokaliserande / avgränsande dimensioner med). Och därmed antalet personer, effektivtet generaliserade kunskap och tekniska metoder att söka många personer med liksom allt annat ej uppenbart för mig just nu som möjliggör tagande ett större anta personer in i analysen.


Asymmetriska obalanser mellan analyserande entiteter kan finnas svåra att inse existerande om man befinner sig närmare den magrare sidan. Jag kan se det existera när min tillgod relativt vanligt är mycket god men hur vet jag för en domän jag ej riktat betraktat tillgänglighet data för (eller bedömer särskilt generellt intressant just för mig) om divergensen är större än man först vill tro? Och när vi kort betraktar nedanför perspektiv kan vi också här peka på att värde av latent information krävande viss insats att få ut (jfr sökande interferens över flera biografier) varierar med perspektiv. Det är värderas olika mycket beroende av personligt intresse, tillämpning, ev: egen vetskap (t:ex: övertygelse att guld ligger nedgrävt någonstans i dalarna som wasa skulle haft med sig skidande dit) o.S.V.


Samtidigt även om det kan tyckas (och tror jag korrekt) som man utanför detta kanske ofta lätt underskattar information närmare grundskolans historia är självklart utmaningen rörande många filtrerade sammanfattade källor här den samma som gjorde det till ett (upplevde jag men sådant varierar nu ordentligt med person) av grundskolans och gymnasiets enklaste ämnen. Det har till sin natur mycket både från konkret och abstrakt natur där det abstrakta betraktas från ett givet perspektiv vanligen argumenterat inte sällan via mycket elaboraterade teser (ibland ideologiska som diverse av dom äldre "klassiska" ekonomiska idé-systemen eller pseudovetenskapliga snarare än betraktat med statistiskt evidens eller matematiska modeller bedömda ex. från deras förmåga att prediktera framtiden från lärd historia).


Medan den konkretare är enklare i att den är tydlig i vad vi önskar - tidpunkter, personer, platser, indikerade händelser, vad någon minns sas m.m. - och att det idag är ett ganska beprövat och välpublicerat område rörde automatiskt extraktion från text (jämför ex. med något besläktat kort i relaterat analys talstreck, citat och jämförbart avgränsat en entitet säger i nyhet.


Åtminstone en del av riskerna med den abstrakta domänen kan emellertid tänkbart reduceras i den automatiserade analysen jämfört med när vi läser manuellt. Kan vi kvantisera och se perspektivet och där inkl. latenta tillstånd och bias inverkande den skapade informationen kan vi när vi som här föreslagit möjligt analyserar en mängd biografer förstå det även i relativ mening till de övriga och om tillräckligt tätt kanske försöka "vrida" det eller närmare praktiskt tillhands växla mellan dem eller se dem uttryckta tillsammans för den mänskliga "efter-filtreringen" hjälpande upp datorn lite på slutet )för ett till perspektiv kanske).


Perspektiv ser jag här motsvara mina similarity funktioner där likhet bedöms i perspektiv från en entitet relativt något annat. Söker A likhet mot B kan A ej bedöma eller värdera likhet i B rörande egenskaper okända för A existerande hos A eller som A förstår finns överhuvudtaget, eller som A ej känner till att B har. Tillämpningen ovan är dock annorlunda för vad jag använder dem till vilket ligger närmare att skatta påverkan publicerad information har.



Enklare biografiska data finns filtrerat bl.a. i (och bland de största åtminstone kostnadsfria och publicerade) följande common sense och förutom att alla inkluderar data ursprungligen från Wikipedia ligger det nära tillhands att riktat vid särskilda behov betrakta möjligheten att Wikipedia har datat för tillräckligt många entiteter och vettigt uttryckt för att effektivt gå att seoarera ut automatiserat (infoboxarna finns mycket skrivet om och tycks vara ett koncept Wikipedia fortsatt arbetar på att förbättra och utveckla) men även andra möjligheter är ibland intressanta (förutom de än mer uppenbara kategorierna exemelvis länkning till andra Wikipedia-sidor i meningar involverande entitet:



Samtliga finns diskuterade i fler inlägg. Och fler datakällor har diskuterats. Se exempelvis:


Spindlande Ericsson konkurrerande konkurrenter: Att indirekt indikera nätets "riktigare" kunskap och kultur istället för att upplevas död

Jag råkade på en värre problem-sajt än ex. med Uppsala Universitet (magnituder värre) diskuterat i Några bias från en enkel web spindel. Problemet för den "nya" problem-entiten visade på en intressant domän av värde jag tidigare inte reflekterat exakt som reflekterat här.


Problem-sajt var www.ericsson.com. Det förvånar troligen få som betraktat dem över åren i domän av sökmotorer. Längre tillbaka när de fortfarande tillverkande konsumentprodukter var det både mycket mer anmärkningsvärt som problem resp. som jag upplever jämförande vad jag såg nu med som jag minns det värre. Värre i mening större rena tekniska problem hur man skapade navigering, länkar m.m. för olika typer av riktade sajter för att marknadsföra produkter. För Xperia gjorde SonyERicsson ett tämligen seriöst marknadsföringsförsök och i domän av koncept i marknadsföring som jag upplevde det mycket välgjort såväl som hyggligt i alla fall hur man realiserade det samma bl.a. i grafik på nätet. Men i det rent tekniska kring interna länkar, att fora ut innehåll praktiskt m.m. fungerade det inte alls bra och sajterna märktes knappt alls på nätet.


I exemplet här gjorde jag en riktat spindling av ett fåtal tekniska sajter. Ingen länk besökt besöks mer en engång men körningen startas utan historik bakåt. Det inleddes första gången med följande (söka viss balans mellan några stora samt för att få av annat intresse en kontrast mot försäljning inriktat dominerande större företag i färre stora affärer resp. närmare mot konsument eller kontinuerliga men vid återkommande diskreta tidpunkter avgjorda affärer jfr licenser for programvara mot företag):


$ldb{"http://librariancentral.blogspot.se/"}++;

$ldb{"http://googlescholar.blogspot.se/"}++;

$ldb{"http://marissamayr.tumblr.com/"}++;

$ldb{"http://www.ericsson.com/"}++;

$ldb{"http://www.idg.co.uk/"}++;

$ldb{"http://conversations.nokia.com/category/news/"}++;

$ldb{"http://blog.aol.com/"}++;

$ldb{"http://blogs.technet.com/"}++;

$ldb{"https://blogs.siemens.com/"}++;


För att hitta sajterna prövade jag att söka Google på företag CEO blog. Det fungerande inte perfekt för någon (Microsoft gav tror jag det i bästa resultatet) och tycker jag sämst för Ericsson eftersom negativt bias ligger i titlarna:



Givetvis genom att uttrycka idag normal-standard av typiska kanaler som att man finns sociala media, har en blogg o.s.v. fungerar vad som gick fel ovan väldigt lätt bra med åtminstone Google.


Det fungerade sämre för Siemens och Ericsson än jag såg som praktiskt bra. Deras uttryck expansion att spindla kom mycket nära från start till nära nog ingenting jämfört med övriga. Därav att jag hjälpte upp resp. något:



$ldb{"https://blogs.siemens.com/tagcloud"}++;
$ldb{"http://www.ericsson.com/yourbusiness/telecom_operators"}++;
$ldb{"http://www.ericsson.com/news"}++;
$ldb{"http://www.ericsson.com/news?query=ericsson"}++;
$ldb{"http://www.ericsson.com/thecompany/press/releases"}++;


D.v.s. för expansion länkar som över epoker tidigt växer exponentiellt startar de direkt som om de vore flera.


Oavsett insatsen föll de ganska snart bort. Tröskelvärde för när en domän (hanterande subdomäner som egna domäner) ej fortsatt besöktes var satt till 111. Vad jag här menar med föll bort är emellertid varken just att dom initiala domänerna är borta eller att andra subdomäner från samma entitet ej heller är med utan att:


  • Där spindeln står just nu och sedan minst sagt länge.
  • Gäller att alla övriga aktörer (inkl. Nokia om än inte riktigt på nivå med Microsoft: Men ej heller förväntat) uttryckt och visat upp vad som bibehållits och expanderat till en både ämnesmässig och implicit i domäm av markandsföring relevant internet-kultur i de sajter som spindlats ut.

Betraktar vi Google's bloggar här såväl som generellt är en funktion de tycks uppfylla att vara kontakt yta mot för dem viktiga subkulturer (ex. entiteter intresserade av att köpa annonsering, bibliotekarier m.fl. potentiellt intresserade av Google Book Search, trevliga värderings-relaterade projekt som ser bra ut såväl som för ett större företag kan vara del av att medverka till ett samhälle också fortsatt funktionellt att verka i - ex. tänkbart demokratifrågor - eller nog så viktigt för ett företag som rekryterat snabbt diverse student-relateradee projekt såväl som kontaktytor rent allmänt mot universitet). Från Google's biblioteksblogg (ej uppdaterad sedan om jag minns rätt 2008 eller 2009 och totalt med få inlägg) gavs ändå märkbart länge ett uttryck för subkulturen runt bibliotek, indexering böcker, bibliotekarier o.s.v. (ett av internets mer intressanta om än inte alltid mycket märkta verksamhets- såväl som tekniska domäner).


Utgångspunkt för Microsoft såväl som AOL (svårare för mig att bedöma för Google därför att jag tillåter ej spindling mot sajter med Google i namnet utanför blogspot eftersom jag använder diverse Google-tjänster själv och inte vill riskera någon låsning eller liknande p.g.a. relaterad IP-adress) expanderade båda snabbt och varaktigt upp i en mängd egna sajter (inkl. subdomäner) såväl som en försvarlig mängd mer läsar-konsumtions-nära publikationer (av typen kortare ytligare nyheter relaterat ex. nya versioner av produkter eller mer nyhets-potenta tekniska nyheter resp. nyhets-domäner där läger av anhängare ställs mot varandra).


För Yahoo kom en hel del men för flera sajter är det inte helt enkelt utan att titta mycket exaktare vägen de kom att uttryckas via. Särskilt Flickr där det framgår enkelt att en hel del är från Meyers blogg men andra kommer inte otroligt från annat. Utanför det av någon anledning bl.a. något sport-relaterat jag ej besökt (och som jag trodde filtrerades bort från spindling av orsaker besläktade dom för Google).


IDG trots trögstartad kom dock att växa bra över tiden.


Men för Ericsson är endast ett Twitter-konto (eller om det ev. var Tumblebr) vad som märktes en tid. Ett arkiv visade sig också några gånger men verkade aldrig leverera några länkar för fortsatt spindling (det kan vara relaterat hur jag detekterar och extraherar länkar som är mycket närmare HTML 1.0 än att tänka bredd i vad vi försöker ta ut).


Föreställning att det ej spelar roll tror jag är felaktigt. Jag kan tänka mig att en del äldre koncept hade kunnat kvarstå framgångsrika om områden som dessa fungerar bättre. Vidare även om man riktar in sig på större affärskunder i långsamma affärer kännetecknas ju dessa just av att vara mycket kompetens-drivna rörande allt relaterat att passa in tekniska koncept i dom egna lösningarna. Att etablera synlighet för hela området för tekniska standarder, inriktningar m.m. närmare det egna tänket bör tror jag sett över en längre tid löna sig oerhört. P.s.s. för färskare konkurrerande företag kan samma synlighet löna sig ordentligt mycket mer därför att för dem finns mindre av upparbetad befintlig kunskap om de egna lösningar hos potentiella kunder. Däremed gäller eftersom mängden uppmärksamhet en befintlig kund eller prospektiv kund är begränsad att det är viktigt oavsett välkänd aktör eller ny aktör att etablera synlighet också för att inte lämna det itll andra att ockupera. Dessutom är det i kostnad så billigt att det bara är löjligt att inte göra det ordentligt.


NNedan hur det hela såg ut just nu. Finns intresse (och filen inte är abnormt stor) kan jag lägga upp loggen över sidor spindlade och vad de resp. länkar (för identifierade länkar). Jag vet här egentligen inte riktigt hur länge denna och tidigare diskuterade går innan de själv-avslutar sig via minnes-brist. Ingen av dem även om de sparar ner till disk utnyttjar disk för sina tillstånd utan behåller allt i minne och kommer jag ihåg rätt görs igenom garabage-hantering relaterat besökta sajter. Jag är om något här för första gången på väldigt länge imponerad av Microsoft 7. Rimligen finns viss gömd hantering av vad i minne och på disk utan att pgorammen har behövt bry sig (åtminstone för den äldre tråden tror jag givet cirka 500 - 900 000 länkar besökta, att besöka samma epok, resp. samlade för nästa epok).


Länkar med information som ej följs av en rad skapad med = besöks ej. D.v.s. oavsett antal indikerade besök stannar dessa på tröskelvärdet och här 111. Information som ges tillsammans med resp. utskriven länk är den samma som förklarad i Några bias från en enkel web spindel.

Jag känner verkligen att värdet bäst här sammafattas med det mer abstrakta i att långsiktigt stödja rent kultur runt om sig i internet-världen. Såväl tekniskt som i det kanske mer "lätt propaganda relaterade". Jag tog emellertid ut några stereotypiska händelse-kategorier från ett system (Pack Nature) av sådana jag tog fram manuellt beskrivande mer abstrakta (och mindre manifesta) uttryck samtidigt som jag utvecklade natural language processing för att ta ut händelser från nyheter (med fokus på citat och talstreck relaterat den som uttalar sig) jag tyckte passande in på några aspekter av det kan handla om:


__RELY_ON count depend rely

__ADMIRE admire adore appreciate cherish enjoy esteem exalt
fancy favor idolize like love prize treasure trust worship

__ACCOMPANY accompany conduct escort guide lead shepherd

__APPOINT appoint commission crown denote designate
elect mark nominate ordain promote appoint crown designate elect mark nominate
ordain

__MOTIVATE encourage empower tempt bribe tempt motivate
encourage empower flatter

__NOTIFY instruct notify remind alert brief

__EDUCATE educate instruct lecture train tutor teach

__INVITE invite summon

__WELCOME welcome greet

Närmare det tekniskt praktiska och representerande en försvarlig andel av Microsofts sajter:


__SUPPORT assist help support back fund backing endorse aid
help out endorse donate

__FRIENDLY_ALERT alert of danger caution warn

Och vad Google ger ett av för dem många och återkommande exempel på i Google Code-in Grand Prize Winners visit Google:


__REWARD_LOYAL reward commend honor badge

__COMPLIMENT compliment

__ORGANISE co-ordinate regularise formalise phase sequence
plan organise sort order rank prioritise classify
group match select compare resemble detect

Medan det givetivs för något så brett och djupt etablerande för allt när det gäller information viktigt är sämre att göra:


__SURRENDER surrender capitulate succumbe white flag yield surrender
pay tribute bow to

Om man vill reducera risk för konkurrenternas imperativa försök ute hos kunderna:


__IMPERATIVE_ATTEMPT pressure urge summon order charge command compel encourage instruct
tempt urge ask request invite order command motivate order press remind request ask allure
call on prompt dictate challenge bribe empower encourage admonish beg cajole lobby press
ask beg dare help trouble bother

__LEARNING_BY_SHAMING

Också för att hjälpa motivera Ericsson med learning by shaming en QA jag satt bredvid 1999 på Ericsson (Nackstrand i IP@Service) kallade en metodik han berätta för mig om när vi brukade äta lunch tar jag med skärmdump. Skärmdumpen är från när jag initialt försökte hitta några bra undersidor för att hjälpa upp dom med och öppnade upp några av länkarna som fanns längst ner på startsidan.



Dessutom var exemplet lite intressant genom att jag inte tror (jag tittade emellertid inte på html-koden) primärt ett tekniskt problem med hur man "kodat" länken. Problemet är ju dessutom primärt för riktiga användare resp. reducerande mängden bättre sidor att ta upp för vidare besökt konkurrerande andra sajter på given budget tid och bandbredd.


Och __LEARNING_BY_SHAMING sorterar hos mig in i ridicule (jag försökt mig på några gågner av och till på bloggen i form av skämtteckningar):


__RIDICULE reduce pack status have lesser men, women and children laugh at the man mockery contempt contempt inducing sneers taunts taunts without accepting reality of payback risk: reduction of pack value for target

Även om området här är lite för tråkigt och dessutom för snällt skrivet vilket ibland tycker jag är lättare för stora företag som Google, Ericsson, Microsoft m.m. Det omvända mot:


__POLITE__WITH_THE_LESSER polite respect of a lesser but skillfull enemy

Vilket man ofta nog ska ta som förvarningssignal (jämför det Brittiska imperiet vs Mahatma Gandhi). De mindre har en förmåga att växa sig stora medan man artigt erkänner vissa värden i det lilla.


Spindlingen startad på The Guardian - Några bias från en enkel web spindel - arbetar på utan att överhuvudtaget störa datorn i övrigt.