Spindlar RSS för företag, personer, myndigheter m.m.

2012-02-18
Jag är en enkel man. Jag lever när internet precis som människan alltid gjort. Min dators OS har lite likheter med Sun OS även om det heter Linux Ubuntu. Jag bruks-programmerar i Perl precis som jag alltid gjort sedan 1999. Min webbläsare heter Chrome och liksom Mosaic är namnet after-waving efter tidigare längre perioders av buzz-words skapat från olika samhällsdelars generations-bilder. I relativ skillnad funktionalitet gör de ungefär samma sak och både gör i den relativa meningen mer än Netscape gjorde (denna var dock lättare och bättre konkret än Mozilla där det räknades www även om nu gopher m.m. försvann från den efter det ett tag).

När jag surfar webben efter företags RSS-adresser gör jag vad människan alltid gjort. Precis som allemansrätten ger oss svenskar rätt att gå ut och "säcka" (bröd i en säck) några änder från ankdammen i Uppsala kan vi alltid söka information på webben the hard way med robot för att senare kunna möjliggöra mer genom att kontrollera data. Här har named entities först extraheras från Wikipedia relaterat WWW-adress och därefter besöks dessa av roboten för att extrahera RSS. RSS-adresserna skickas vidare till Octopus (vars namn är inspirerad av bläckfiskarnas sanslösa sensuella och perceptuella intellektuella färdigheter liksom det tidiga 1900-talets nidbilder av kommunister respektive stor-kapitalet - respektive bilder av dom andra var relativt lika varandra) som besöker dem regelbundet för att importera data.


RSS-listan funderar jag på att publicera. Det beror lite på om man kan verifiera att inget data någon trott varit privat ex. i form av kommentarer på html-sidan kan via data- eller programmeringsfel hamnat i listan.