Visar inlägg med etikett Feeds. Visa alla inlägg
Visar inlägg med etikett Feeds. Visa alla inlägg

Riktad sampling Blogger för ökad tillförlitlighet (och pågående unikt problematiskt internet från min accesspunkt)

2014-04-21

Jag har just nu - och begående ovanligt många timmar - stora problem med många webbplatser åtminstone i USA (men har ej prövat något större antal svenska) med återkommande time-out:s. Också inkluderande Blogger om än mindre. I särklass de värsta problem jag någonsin haft med en bredbanstjänst från TeliaSonera såväl som f.d. Telia-företag eller tjänste-leverantörer åtminstone förr förekommande som i princip utnyttjade Telias nät. Vidare har jag haft problem med Google Chrome kraschat (vilket aldrig hänt tidigare). D.v.s. möjligen (även om jag lutar åt att det nog är det normala helg) är det inte para "Påsk-problem": fler surfande film, färre som startar om nätverksutrustning ytab rujtat abgreoo manipulerande datatrafik in.


Sampling feeds från Blogger är dock kanon-snabbt just nu i alla fall och bättre än vad normalt förväntat från strömmar i allmänhet:



Timmar, minut och sekund för resp. feed hämtad ovanför övrig utskrift. Och givetvis: Uppenbar spider-optimering framgående i bilden genom att sampla strömmen snarare än inlägg placerades där uteslutande för att ge läsarna ett undervisande exempel för att anknytna prestanda rent allmänt. I icke-kausal mening finns logik för att hantera det resp. i kausal-mening lär det tillkomma någon gång framöver.

Och för att komplettera:


"Praktiskt gäller tveklöst att ju fler strömmar hos dessa desto snabbare att polla igenom allt. Konkret märkbart - tydligt - snabbare än vad jag märkt allt förekommande nog i antal för att man ska märka det. Från denna aspekt är ex. blogg på Blogger trevligare än Wordpress (men säger givetvis inget om värde indexering eller som statistiskt mätpunkt varför de lika självklart pollas precis som Blogger)."

Från: Google: Feedburner, Youtube och Feedproxy (2014-04-21)


Åtminstone reflekterar jag ev. värde att ge i den mån det i omfång gör skillnad (där jag sökt strömmar bloggar via spider för närvarande har jag antingen sökt bloggar på edu-domäner underliggande alt. med utgångspunkt från sajter motsvarande d.v.s. mängd är inte sådan att man rimligen prioriterar annat än att inkludera allt) prioritera Blogger. Vi kan när just indexering och adresserbarhet i datalager se ett värde av att ha en data-punkt med hög tillförlitlighet prioriterat istället skattning av dimensioner associerade koncept oavsett om själva inläggen behålls eller inte.


Det har för denna paketering av data värde att för punkter mer intensivt publicerande per tidsenhet (och vi önskar dessa såväl som övriga samplade något så när jämförbart relativt övriga dag för dag utan väsentligt mer eller mindre eftersom det kan snedvrida sammantaget ganska tydligt för mer över all tid mer ovanliga kocnept och enklast hanteras det direkt sampling snarare än filtrering import) försöka sampla konntinuerligt eftersom feeds tenderar att ofta vara begränsade i antal inlägg.


Exakt varför Blogger rörande strömmarna tycks visa hög tillförlighet vet jag inte men jag håller det för troligt att det har att göra med en kombination av:


  • Content delivery network: data levererat via snabba vägar och cache av data lokalt hos operatörer (TeliaSonera är dock upplever jag mycket välfungerande i sig här och tror mig minnas att man använder Squid.
  • Datacenter geografiskt nära både "prestanda-distans" internet och geografiskt (d.v.s. tänkbart Sverige förutom tidigare uppmärksamade investeringar av Google i server-hallar Finland - Sveriges friska natur hoppade för att rädda finska energiindustrin från internationellt sammanbrott (2013-07-19) och längre bak kanske 2009 - 2010 - skapande energibesparing av naturlig vinterkyla.

Och en domän för alla att översätta till IP över route. D.v.s. om det nu är DNS som har problem (ganska vanligt rent naturligt och ibland nedskjutna för att möjliggöra DNS-spoofing) räcker färre korrekta försök (eller spoofade översättningar ex. för att försöka ta inloggnings-information till Google's samlade inloggning) för att IP översättning ska hålla refresh i bl.a. Telias lokala "tabeller" och fortsatt så över vägen.

Google: Feedburner, Youtube och Feedproxy

Spidering sökande riktat feeds nära entiteter forskning med utgångspunkt pressmeddelanden publicerade via EurekAlert, AAAS gav ett antal strömmar identifierade för Youtube-sidor. Där kunde konstateras att dessa precis som FeedBurner (Feedburner trevligt snabb) var mycket snabba.



Vidare noterades att även feedproxy.google.com märkte ut sig som mycket snabb. När jag testar feedproxy.google.com i webbläsaren hamnar jag på FeedBurner. Förklaring tycks vara att Bloggers egna feedsystem nu är FeedBurner direkt (förändring ska nog tas som trolig skett för flera år sedan utan att jag märkt något förrän nu).


Praktiskt gäller tveklöst att ju fler strömmar hos dessa desto snabbare att polla igenom allt. Konkret märkbart - tydligt - snabbare än vad jag märkt allt förekommande nog i antal för att man ska märka det. Från denna aspekt är ex. blogg på Blogger trevligare än Wordpress (men säger givetvis inget om värde indexering eller som statistiskt mätpunkt varför de lika självklart pollas precis som Blogger).


RSS vs ATOM: FeedBurner

Spännande eller bättre sagt udda / fascinerande nog fick Google ett antal år sedan för sig att blåsa liv i nära nog döda Atom kanske för att inspirera nätets publicister och utvecklare med en till standard att hantera. FeedBurner är här ganska trevlig och vilken standard önskan kan konfigureras till önskan från (om jag inte missat någon ev. konfigurerarbar begränsning feed-ägaren kan ställa) vilken som helst feed-indikerad.


D.v.s. som i exemplet nedan för att säkerställa RSS (Perl och låt oss tänka - oss utan risk att någon oväntat hoppar fram och erbjuder mig en stor summa pengar för att direkt binärt sälja det just då - att jag egentligen gjorde det hela mycket mer avancerat riktigt pressande allt vad standarden och Feedburner har att erbjuda i möjlighet men för läsarens enkelhet valde att skriva något kortfattat):


if ( index($cline,"feedburner.com") != -1 )
    {
 if ( index($cline,'?') != -1 )
 {
     # Tar bort givna parametrar...
     $cline = substr($cline,0,index($cline,'?'));
 }

 $cline = 
     $cline . "?alt=rss"; 
    }

Jag såg förövrigt på Stackoverflow.com (Feedburner RSS url variable for number of items in feed? - mer FeedBurner Stackoverflow) att det ej går att styra FeedBurner till att visa fler inlägg än vad som ges. Om det stämmer är jag inte säker på (har överhuvudtaget inte läst manualerna men funderar på att se över möjligheterna där såväl som från andra källor eftersom FeedBurner tycks riktigt stor).