En lätt men onödigt obalans i Google

2010-08-31

När man betraktar Googles algoritmer är den nuvarande situationen på alla sätt bra på de flesta sätt. Den fångar värde i innehåll liksom också att en entitet gör en ansträngning för sitt innehåll att synas där vi kan jämföra med som diskuterades av mig i Ett ramverk med fyra ben. I båda fallen och det kombinerat jämförbart diskuterat för citat här i Nyfiken vital ger en god grund.

Hur man sedan möter detta d.v.s. hur enskilda entiteter - motsvarande i min modell symboler i språket - rör sig, hur de förstärks av andra symboler och deras entropi bakåt i tiden - och om vi vill anstränga oss mer deras entropi i en enskild artikeltext - är en annan fråga.

Jag ser ingen anledning till att länkar tillsammans med artikeltext inte är en bra lösning för det. Det är vad vi använder för att uttrycka detta. På samma sätt finns inget hinder att ta precis vad som helst som uttrycker människans relationer och beskrivning av saker för samma sak. Människans språk och hierarkier är alltid de samma.

Problemet om vi här väljer att räkna bort länkar som avviker från riktlinjer är tror jag inte så mycket externa länkar en fråga om värdering så mycket som interna länkar bäst ska värderas.

Uttrycker dessa samma sak som övrigt finns här föga problem givet att man har kontextuell skalning av entitetens typ - tex. ett aggressivt diskussionsforum - men nu är det sällan så saker fungerar utan de interna länkarna hanteras ofta relativt totala mängden antingen enligt:

1. Via maskinell mjukvara som föreslår ofta mer eller mindre irrelevanta interna länkar som delar någon trivial likhet. Det är det vanliga för våra stora tidningar (den grundläggande problemet gissar jag).

2. Är taggar eller jämförbart

Problemet är att det stor rytmen och är meningslöst att värdera utanför trivial skalning därmed skapas också indirekt en uppenbar optimering där vi kan skära bort värdet av interna länkar allmänt ordentligt (d.v.s. mest uppenbart märkbart via att en extern länk nu värderas signifikant mer men det är egentligen inte poängen här) genom att större webbsajter som sammantaget tar upp större delar av utrymmet där det skulle ha värderas ändå hade värderats föga.

Problemet är att om man nu ev. gjorde detta (där vi ju haft entiteter som skalat sig onormalt i storlek där jag föreställer jag mig att om entropi inte hanteras i hastighet utan utan detta att viss problematik kan ha funnits) tror jag att det inte så mycket skapande en obalans som att en kanske kvarstår i ett mindre underområde. Det motsvarande område där vana för kombination av försäljning i fysisk person och utnyttjande av nätet finns. Givetvis bör den obalans återspeglas sig antar i större tidningar och ev. mer då jag nog tror sådant propagerar kanske.

Detta är dock en strunt sak. Sökresultaten har inte försämrats på många år via något problem som reder ut sig riktigt störande. I övrigt att bedöma kvaliteten är svårt utan användarstatistik men känns ungefär som det alltid gjort när det fungerat bra men längre än vanligen för säg fyra år sedan. D.v.s. vi har väldigt bra sökresultat just nu.

Det är dock ändå lätt intressant då den hängt kvar några år och gissningsvis ligger den i sofistikerad nätverkssäljning som kanske egentligen inte har med nätet att göra och för att vara ärlig tror jag inte den uttrycker något problem för någon. Ändå tror jag nog (jag följer nu inte annat än en väldigt liten del av saker och kanske är det en obalans där lösningen på den ger om man prövar möjlighet till bättre sökresultat allmänt) interna länkar på större sajter ska värderas upp något kanske skalat mot externa länkar redaktionella per artikel där hög kvalitet i dessa ökar upp värderingen av interna länkar därför att det då indikerar att sådant hanteras redaktionellt. Det är en optimering som gissningsvis när man ser över det fångar t.ex. specialiserade entiteter i allt från patientföreningar, över sådant som Nyfiken vital till våra statliga satsningar i informationsmaterial om forskning och hälsa där föga använder det meningslösa sättet att länka internt.

Vidare om vi nu tittar som här på hur "energi" uttrycks har vi vad som sker just nu när det korrekt värderas mer - explicit eller implicit t.ex. via startsidor o.s.v. - ansträngning av enskilda "symboler" (d.v.s. här mer syftande på en hungrig bloggare som tipsar sajter o.s.v.) m.m. Men ett annat sätt är att rekursivt också se symbolen representerade texten där denna motsvarar investerad energi där vi också kan få ut exakt samma sak som övrigt genom att uttrycka "energin" också utifrån denna d.v.s. mäta ansträngning motsvarande energin för den. Det är nu mer beräkningsintensivt men är ett sätt att göra stickprov för att hantera enligt tidigare.

Låt oss nu betrakta fallet att energi uttrycks via publicering. Uppenbara sätt för det är ju hastighet för nyheter, bloggpostning o.s.v. Men antar vi att vi t.ex. har ett nätverk för direktförsäljning i trianglar som samlar motivation (t.ex. "särtryck") för deltagarna och uttrycker det normalt otillåtet i andra format men där det aldrig noteras av någon mer än nätverket och Google därför att det uttrycks på "annat sätt" och är vad som används direkt finns ett möjligt problem också. Detta är dock ingenting som har med den lätta obalans jag sett ett par år och diskuterats men är värd att peka på.