Internet-spam: Uppsala Universitets media-farmar resp. Google Font Search utsatt för pågående omfattande manipulation

2014-05-09

Konceptet länkar i sökning har en del värden så väl som begränsningar. En tanke som kom till mig betraktande "läsar-reaktioner" var att problemen jag hade åtminstone en period med att klara att söka på konceptet Wikipedia (ex. tekniska analyser eller studier beteende) kanske (andra förklaringar tidigare föreslagna är nog nästan mer troliga) är att jag själv tenderar att addera Wikipedia i ankarteext:


  • Vilket sker för att tydliggöra för läsare var de hamnar.
  • Medan det inte direkt är en liten minnesanteckning för vad jag vill söka relaterat titeln på ankartexten tillsammans med Wikipedia som sökord förstärkt.
  • Vad jag referenslänkar i inlägg är ju långt innanför zonen av material jag hittat till och har metoder att söka (ex. för Wikipedia ofta direkt i den eller via URL).

Vad Google Font Search värderar och påverkan ranking vidare till webb- och nyhetssökning

Ett till problem kan vi se för Google Font Search. Eftersom kultur att länka med meta-information om inlägg och sajter rörande sådant är de antingen inte alls del av algoritm eller ej tillämpade så att det märks. Indikerar du t.ex. att visning kan ha värde via arial är Google robot:en benägen att ofta tro på det. Problematiken liknar den som förr (åtminstone ett mycket mindre problem idag) fanns med för surfaren osynliga länkar.


Kanske är Google Font Search och dess sekundära inverkan en del andra index förklaringen till en del länkar likt dessa jag uppmärksammade kontrollerade att exporten gick som den skulle (länkar extraherade från RSS-strömmar etablerade testdata inför skapandet Minimalistiskt sido-algoritm-skiss beräknande läsare nyhetsmedier):



Eller gissningvis något tekniskt problem. Jag tittade inte så noga. Det märkte dock ut sig med precis över en sida med Emacs satt till font sex bland de kanske 500 000 till 1 000 000 första "länk-händelserna" exporterade. Jag tror förövrigt inte så mycket krävande en massa utökad parsning i annan mening än att ta bort inverkan mer än tvingat. Allt kostar både i beräkning, utveckling och defekter som av och till slår till. Och om någon sökmotor fonter finns (och det kanske det gör) har jag inte hört om den.


Utökad information: Egentligen trodde jag inte något ev. liknande Google Font Search fanns även om sjlva konceptet inte var vad jag uteslöt.

Dock finns Google Fonts vilket kanske är ett ex. för den hos större internet-företag när de åldrats några år och går bra ibland återkommande fascinationen för information föregripande internet likt tryckta magasin, böcker, fonter m.m. Hos AOL havande mer tidigt i det konkretiserade - varorna - kan vi omvänt se sista åren allt mer intresse data man kan hitta på nätet (inklusive köp Alexa, diverse tjänster, en (medium sized) big data katalog. Jag tror hur som helst inte dessa fonter påverkan ranking och betvivlar mycket effekt utanför frågor relaterat språk-detektion, och grov skattning vilka som egentligen kan läsa det.


Uppsala Universitet: Fortsatta pågående angrepp mot yngre över nätet

Yngre vuxna kan bli ekonomiskt utnyttjade.

Bland de första exporterade jag tittade på manuellt fanns få sajter med .se domän länkade. Det är mycket förväntat eftersom det nu knappast var mer än en miljon i filken (och kanske neråt 400 - 500 tusen) och det är primärt engelskt material samplat. Emellertid märker internets-hungrigt länksökande ut sig. Och vi har nedan exempel med en på ytan seriös aktör som tycks ha byggt någon form av "media-farm" (jag antar att det är en avancerad form av länkfarm).


Fear and self-loathing in Uppsala.

Tråkigt nog känner jag inte att det är ovanligt. Så fort det är valtider eller debatt om anslag till forskning resp. betalning för studenter dyker det upp en massa media farmar hos Uppsala Universitet. Surfar man på en av deras många sajter utspridda länkande varandra (vilket jag gjorde i Några bias från en enkel web spindel) kan vi konstatera att yngre-vuxna utan ex. min längre gedigna erfarenhet av internets problemområden utsätts för omoraliskt överdriven marknadsföring (och kanske sammanblandad med någon sjuk självhats-sekt):


"UKÄ presenterar idag sin utvärdering av biomedicinutbildningar. I Uppsala fick masterutbildningarna i forensisk vetenskap och molekylär medicin toppbetyg medan fyra utbildningar i infektionsbiologi och biomedicin kritiseras.

21 utbildningar i landet inom biomedicin har granskats av Universitetskanslersämbetet, UKÄ. Kvaliteten bedöms som vanligt efter en tregradig skala: mycket hög kvalitet, hög kvalitet eller bristande kvalitet. Nio av utbildningarna får högsta betyg medan tolv får omdömet bristande kvalitet och blir därmed ifrågasatta."

Från: Utbildningar inom biomedicin får ris och ros | Uppsala Universitet


Jag kan bara föreställa mig hur mycket media-synlighet de lurat till sig i Kina, Tyskland m.fl. länder.


Och vi kan konstatera hur deras övergripande boss - den s.k. "rektorn" - inte tvekar att kapitalisera på ungdomsfylla för att gömma undan de annars tråkigare aspekter man tråkigt nog riktigt för de flesta yngre bedömt att utländska studenter kan värdera:



Och det var inte ett besök på restaurang planerat utan "Idag, första maj, deltar vi i majmiddagar på olika nationer.". Riktigt otäckt.

Även om man kan förstå att en liten aktör är desperat gör Uppsala Universitet titta hur världens större aktörer inom business area: sell customer student the college / universty. Jag ser då ingenting likt Uppsala Universitets media-farmar där - och när alls försvarliga steg från kunderna - eller något alls liknande deras länkning krävande viss manuell-insats så att saker kommer igång lite snabbare.


Det är varje publicist ansvar att minnas vem som är eller kan vara läsaren. Är det mycket troligt fler i antal prospekterande studenter - d.v.s. yngre vuxna - gäller ett större ansvar och man kan inte uttrycka sig som blivit kultur i mötet de politiska systemen där sådant här gillas lite.

Medvetandets redundanta komponent

Samtidigt kommer jag ihåg att jag för ett fåtal år sedan (kanske tre till sex) läste en studie (eller pressmeddelandet från universitetet om studien) som indikerade att hjärnan har sekvens-liknande taggning också av allt som sker fortlöpande tidsmässigt. D.v.s. vi har en diskret-tid där varje minne finns taggat ordnat längs den (och där antar jag i all rimlighet och vad jag fann intressantare men mindre viktigt här kanske att taggningen kommer uttrycka också ett annat uttryck av "tid" i mening att taggningen blir tätare relativt absolut-tid när fler minnen taggas på samma tid). Så när vi betraktar:


"One issue with presenting the XOR gate as the canonical example of synergistic information is that it is lossy. A two bit input is reduced to a single bit output, meaning that half the entropy has been irretrievably lost. If the brain integrated information in this manner, the inevitable cost would be the destruction of existing information."

Från: Is Consciousness Computable? Quantifying Integrated Information Using Algorithmic Information Theory, Phil Maguire (pmaguire@cs.nuim.ie). Philippe Moser (pmoser@cs.nuim.ie), Department of Computer Science, NUI Maynooth, Ireland, Rebecca Maguire (rebecca.maguire@ncirl.ie), School of Business, National College of Ireland, IFSC, Dublin 1, Ireland, Virgil Griffith (virgil@caltech.edu). Computation and Neural Systems, Caltech, Pasadena, California
http://arxiv.org/pdf/1405.0126.pdf

Kan vi tänka på strömchiffer och möjligen jämföra vad som strukturellt över minnes-topologin är samma sekvens av ordnad taggning (eller vad helst jämförbart där jag inte kan förstå hur vi fungerar annat än just därför att det är en relativ tid p.s.s. uttrycker andra meningsfullt ordnade minnen: trivialt hur man korrekt med en militärutbildning ska öppna en konservburk eller göra rent något verktyg).


I detta fall representerar resp. komponent vid XOR-operationen information. Vi har varken mer eller mindre information efter operationen (men vad vi kan kalla potentiell information innan). Dock har vi i någon mening redundant information innan (men knappast redundant i meningen att vi som för jämförelsen med strömchiffret kan avstå från att kryptera och spara lagringsutrymmet som krypteringsströmmen representerar).


Den stora frågan här är om serien i sin helhet representerar informationen eller om "faktisk" information precis som för alla praktiskt använda strömchiffer är den initiala krypteringsnckeln (eller lösenordet tillsammans med t.ex. en tidsstämpel den härleds från). Antag att:


  • Gör ett moment för första gången.
  • Det liksom allt enligt studien jag kom ihåg stämplas för allt som inträffar.
  • Vi gör samma moment vid andra tillfällen.
  • Vi lär oss hur man bäst gör det. D.v.s. vissa del-moment lyfts ut som viktigare.
  • Andra delmoment kan optimeras ner till vad som ej kräver medveten kontroll utan vad som kan automatiseras.
  • Än mer tränad - jämför med matlagning - kan vi lära oss att valmöjligheter finns resulterande i något varierat slutresultat som bättre eller sämre passar vid ett tillfälle. Det fodrar än mer medvetande.

Det rent automatiserade kan vi anta börjar där en taggnings-serie liknande den som taggar allt vi gör i tur och ordning börjar och följer den över varje delmoment. D.v.s. endast informationen inledande eller ev. delsteg vi kan hoppa in på krävs och detta tillsammans med viss i serien nödvändig redundans (kanske ungefär motsvarande vad som krävs för att kunna hoppa in i delsteg) motsvarar all dess information p.s.s. som krypteringsnyckel kombinerat med ett antal tidsstämplar eller räknar-positioner ger hela strömchiffrets generation för en viss del av det krypterade datat.


Tononi integrated information är förvisso elegant. Men jag upplever den inte intressantare eller mer praktiskt funktionell lösande problem eller söka skatta en del mått rörande det "maskinella" (och egentligen ogillar jag starkt att låna begreppet medvetande där) än flera andra besläktade koncept de senaste åren (flera läsvärda kom efter) liksom också mycket föregripande den från 1960-talet och fram till idag.


Relaterat:


Ej trivial att läsa och knappast korrekt i detaljer men upplever jag som implicit tanke indikerande framåt det mer intressanta publicerat här:



Från i år och inkluderar referenser till Tononi's arbeten:



Ett av en mängd praktiska frågor liggande runt sådant här om det intresserar mer (vilket det gör här):



Kamrat till Agent Sniff: med mindre av dennes "sniffande" (vad med vanligare term kallat random walk om än med viss intelligens kring lukterna):