Publicering av Sveriges associationsnät

2013-10-06

Rörande:



Är väsentligt större än vid tidpunkt inlägg ovan föreställt även om jag just nu inte har data representerat så att jag kan ta ut termer räknade enkelt (utan skattande mer från storlek hårddisk). Jag tänker om görligt publicera det ändå men jag är inte trygg i att något jag just nu använder är funktionellt (ex. Google Docs) om det inte ska reduceras ner. Sverige dyker upp lite varstans och det samlar på sig i antal.


Möjligen kanske ganska snart nästa vecka eller om inte otroligt krävande någon särskild relaterat storlek initiering av ny väg för publicering obestämt senare om ev. inte reducerat ner i storlek. Avseende tagande topp kombinationer ex. topp 200 000 eller så ska man ha klart för sig att det fortfarande är ganska mycket data i storlek (grovt skattat kanske mellan 60 - 140 MB). Här kanske man kan tänka sig att vid problem beroende av exakt hur stort det är i kombinationer att först publicera säg översta tio till 20 tusen av kombinationer. Samtidigt givet att associationen i sig inte är klustrad i ämnen d.v.s. krävande adderande av sekundär statistik för att vid intresse ta ut ex. topp resultat inom politik eller godtycklig koncept-kombination är sådan begränsning mindre intressant rörande mer specialiserade underområden (ex. något särskilt ämnesliknande man t.ex. kanske kan välja att se som inom politik men mindre men samtidigt tydligare som funktion av "kontrast" och antal termer).


Ganska tydlig preferens mot forskning via journaler, patent o.s.v., reward-associerade områden (oavsett rekrytering i företag eller musik), vad vi grovt kan halla uppslagsböcker och ordlistor, politik och politiska organisationer som största områden ger inte oväsentligt här ganska signifikant "bättre" täthet särskilt forskning, teknik och politik medan jag som kanske mest "extremt" geografiska relationer närmare sett det som vad kanske uttrycker association lika funktionellt (ev. av och till bättre) via antaganden av uniforma fördelningsfunktion (tilldelande dem ett i den mån och från det normaliserat om så ej uttryckta via datakällor som samplas medan datakällor särskilt riktade mot expertkunskap eller intresse bland populationer relaterat geografi ex. ortsnamn inte alls existerar - oavsett om spekulativt betraktat lokalt i svenska språket t.ex. på bloggar vilket för svenska geografiska relationer inte vore en orimlig datakälla det tycks troligt att Stockholm och Uppsala överutrycker med större närhet än Stockholm och Borås lär det knappast avspeglas annat än reducerat).


Jag föreställer mig att det finns andra sådana relationer som ges tilldelningar från känd vetskap nära besläktat vad man egentligen hade behövt samplat svenska språket snarare än som aktuellt för mig här engelskt data uteslutande vilka jag inte tänkt på också utanför geografiska relationer (vilka praktiskt är ganska många).


Forskning, teknik och politik såväl som samhällssystem och samarbeten eller uttryck internationellt från företag, organisationer, stat eller mer sällan personer kan förvisso tyckas tråkigare. Men är av och till väldigt intressant också av och till överraskande så. Vidare är det stabilare association relativt dataförändring och användning medan geografiska relationer till huvudstäder förvisso om vi räknar bort toppar är ganska eller jämförbart stabilt men mindre så i kontext av användning. Det är helt enkelt mindre ofta de just adderar värde relativt egentligen all användning likartat med mer komplext anslutna koncept inom ex. forskning och specialistområde utan snarare att man vanligen får det mesta värdet av någon karttjnst med avstånd, befolkning, uppgifter om resor mellan orterna o.s.v. lika bra eller mycket bättre än från association i uttryck språk mellan orterna.