Riktad sampling Blogger för ökad tillförlitlighet (och pågående unikt problematiskt internet från min accesspunkt)

2014-04-21

Jag har just nu - och begående ovanligt många timmar - stora problem med många webbplatser åtminstone i USA (men har ej prövat något större antal svenska) med återkommande time-out:s. Också inkluderande Blogger om än mindre. I särklass de värsta problem jag någonsin haft med en bredbanstjänst från TeliaSonera såväl som f.d. Telia-företag eller tjänste-leverantörer åtminstone förr förekommande som i princip utnyttjade Telias nät. Vidare har jag haft problem med Google Chrome kraschat (vilket aldrig hänt tidigare). D.v.s. möjligen (även om jag lutar åt att det nog är det normala helg) är det inte para "Påsk-problem": fler surfande film, färre som startar om nätverksutrustning ytab rujtat abgreoo manipulerande datatrafik in.


Sampling feeds från Blogger är dock kanon-snabbt just nu i alla fall och bättre än vad normalt förväntat från strömmar i allmänhet:



Timmar, minut och sekund för resp. feed hämtad ovanför övrig utskrift. Och givetvis: Uppenbar spider-optimering framgående i bilden genom att sampla strömmen snarare än inlägg placerades där uteslutande för att ge läsarna ett undervisande exempel för att anknytna prestanda rent allmänt. I icke-kausal mening finns logik för att hantera det resp. i kausal-mening lär det tillkomma någon gång framöver.

Och för att komplettera:


"Praktiskt gäller tveklöst att ju fler strömmar hos dessa desto snabbare att polla igenom allt. Konkret märkbart - tydligt - snabbare än vad jag märkt allt förekommande nog i antal för att man ska märka det. Från denna aspekt är ex. blogg på Blogger trevligare än Wordpress (men säger givetvis inget om värde indexering eller som statistiskt mätpunkt varför de lika självklart pollas precis som Blogger)."

Från: Google: Feedburner, Youtube och Feedproxy (2014-04-21)


Åtminstone reflekterar jag ev. värde att ge i den mån det i omfång gör skillnad (där jag sökt strömmar bloggar via spider för närvarande har jag antingen sökt bloggar på edu-domäner underliggande alt. med utgångspunkt från sajter motsvarande d.v.s. mängd är inte sådan att man rimligen prioriterar annat än att inkludera allt) prioritera Blogger. Vi kan när just indexering och adresserbarhet i datalager se ett värde av att ha en data-punkt med hög tillförlitlighet prioriterat istället skattning av dimensioner associerade koncept oavsett om själva inläggen behålls eller inte.


Det har för denna paketering av data värde att för punkter mer intensivt publicerande per tidsenhet (och vi önskar dessa såväl som övriga samplade något så när jämförbart relativt övriga dag för dag utan väsentligt mer eller mindre eftersom det kan snedvrida sammantaget ganska tydligt för mer över all tid mer ovanliga kocnept och enklast hanteras det direkt sampling snarare än filtrering import) försöka sampla konntinuerligt eftersom feeds tenderar att ofta vara begränsade i antal inlägg.


Exakt varför Blogger rörande strömmarna tycks visa hög tillförlighet vet jag inte men jag håller det för troligt att det har att göra med en kombination av:


  • Content delivery network: data levererat via snabba vägar och cache av data lokalt hos operatörer (TeliaSonera är dock upplever jag mycket välfungerande i sig här och tror mig minnas att man använder Squid.
  • Datacenter geografiskt nära både "prestanda-distans" internet och geografiskt (d.v.s. tänkbart Sverige förutom tidigare uppmärksamade investeringar av Google i server-hallar Finland - Sveriges friska natur hoppade för att rädda finska energiindustrin från internationellt sammanbrott (2013-07-19) och längre bak kanske 2009 - 2010 - skapande energibesparing av naturlig vinterkyla.

Och en domän för alla att översätta till IP över route. D.v.s. om det nu är DNS som har problem (ganska vanligt rent naturligt och ibland nedskjutna för att möjliggöra DNS-spoofing) räcker färre korrekta försök (eller spoofade översättningar ex. för att försöka ta inloggnings-information till Google's samlade inloggning) för att IP översättning ska hålla refresh i bl.a. Telias lokala "tabeller" och fortsatt så över vägen.