HANS HUSMAN OM MEDIA

Visar inlägg med etikett Flashlight. Visa alla inlägg

En namngiven tibetansk entitet i eller utanför nyhetsindexering

2016-01-09

Det är väl inte att förvänta (men åt det hållet mer och mer givetvis) att nyhets-index riktigt hunnit analysera nyheterna man ser i ex. i Google's nyhetssökning lika komplett som för sidor indexerade webbsökning. Att se nyheterna snabbt (vilket är en helt annan fråga man kan ifrågasätta om Google alltid presterar bra i för nyhetssökning) synliga för huvudsakliga / självklara ämnen och/eller sökkoncept likt kanske ofta viktigast entiteter likt personer, företag, länder, produkter m.m. (dagarna när min generation var centralitet i användandet och vi alla sökte seriösa ämnen är förbi: Nu handlar internet om den senaste PhonePodasten från Apple).

Jag vet inte riktigt hur Google gör sådant. En del om själva grund-algoritmerna tror jag i och försig finns att hitta men intresserade mig när jag noterade det för ett par år sedan eller mer inte just varande ganska just named entity och koncept relaterat kring ämnen (medan jag mer sökte då andra som tittat på kontinuerliga värde-indikationer i känslo-aspekter som motivation, risk, anger m.m. vid tillfället). Men mycket ligger i ju oavsett om man ev. har grundkoncept jämförbara i "detaljer" hanterande särskilda utmaningar: Görande saker fungerande och helst bra ligger nog i största delen i sådant.

Följande fick jag när jag sökte på en entitet (person):

Antagligen har jag fått en sådan sida som svar förr utan jag minns det (eller kanske att det är en ny respons på något man fått förr när koncept saknas i nyhetsindex).

Emellertid är entiteten jag sökte från inkopierad till Google sökningen från just ett sökresultat från Google. Indexerad både webbsökning och nyhetssökningen liksom i webcache.googleusercontent.com:

Dalai Lama's former biographer takes up residence in mainland China

Och sidan jag citerar en bit html-kod från visande första stycket efter titel (med visuellt emellan) för denna:

Google webbsökning säger sig ha cirka 6500 - 7000 träffar (skattande eller faktiskt antal index?) för Achok Rinpoche.

Jag vet inte om en person eller företag som förekommer i nyhetssökning är samma sak som förekommande i en indexerad webbsida. Eller om det kan vara samma sak att det också kan vara mer som indexerad webbsökning.

En ev. detekterad trolig roll / named entity agerande, refererande eller talande i nyhet kanske hanteras speciellt? Medan det i webbsökning i den mån den ej är förstådd (ev. bara i meningen ej expanderande antalet named entiteter oändligt i nyhetssökning även om kanske andra sökord tillåter i princip detta för aktuell tid hanterad för sökning). D.v.s. kanske inträffar att man kastar eller missar vad man vet är named entity om man ej känner den som konkurrent aktiv för en tidsperiod eller hanterad i övrigt.

Tilltalande rent konceptuellt är ju att ta in dessa entiteter när man vet att de finns som en varaktig representation och försöka lära stabil kunskap om dom man adderar på för att underlätta ex. fortlöpande indexering nyheter. Det är ett område en försvarlig andel publicerat från flera av befintliga aktörer i segmentet finns inkl. Google (även om jag inte exakt minns i vilket område publicerat här) samt även en del projekt de handlat in eller engagerat sig i av och till inte alltid varkatigt. Ex:

Plattform publikation likt Blogger, deras sociala media m.m. är ju också vad som har med denna domän att göra om man så önskar. Skribenten som entitet som ju kan ses i World of Facebook grundad med kontot där eller i World of Google (som ser sig som en öppen värld förr i alla fall debatternade runt kring Facebook) grundad kontot där (eller det här öpen-login eller vad det heter som jag tror någon koppling finns hos dom också kanske).
En av de åtminstone för mig minst värdeskapande datakällorna för att få halv-förädlade vetskap om vad koncept, ord, ämnen, innebär i relationer till andra koncept (jämfört ex. med riktigt värdefulla likt Wikipedia, Flickr förr, mina sensorer kinesiska kommunistpartiets webcams m.m. i hemmen, diverse större ontologier som underhållits aktivt åtminstone flera år, eller Library of Congress titel headings) är Freebase som Google köpte för några år sedan. Jag spekulerade då att de köpte den kanske för en ev. bra plattform hanterande koncept och koncept-relatioenr (länken går till dokumentation hos Google beskrivande en del av strukturering synlig för användare) snarare än innehållet på den nivå med då (men inte alls då åtminstone bara en massa små "kategorier" och kunskapsrelationer relaterade high-value search words utan en del faktiskt värde om än inte direkt ej fodrande filtrering på varierad nivå).

Och utan tvivel finns ett ofantligt värde i att utnyttja samspelet sökord kommande tillsammans, förslag andra sökning och beteende runt detta när det arbetas upp under längre tid. Det är en datatyp som fint kan komplettera och bygga vidare på viss mängd stabila tillförlitliga relationer med bara själva företeelsen av samtidighet aktualitet index och där uttryckt utan övrigt data: Jfr produktlansering i ett generellt koncept som (kallas det notebook nu de här platta större bärbara telefonerna eller är de fortfarande mobiler? Apple-Phone? Flat-phone? Flat-rate kommer till mig? Kan det vara flat-rat när man surfar mobilt med UMTS? Det var ju vad alla operatörerna och telekom-operatörerna arbetade nitiskt med kund-glädjen inför framtiden 2000 år när UMTS standarderna gjordes klara.) de mobila flat-rate telefonerna som både kan telefonera, visa film, spela musik från nätet utan behov av att lagra mp3-filerna själv och surfa nätet - i koppling samtidigheten avgränsat tidsmässigt produktområdet (Fllat rate), leverantören hårdvaran (som ju vi lärt från hem-pc:en blir alltid mindre viktig år från år: Man köper bästa hårdvaran till bästa pris så kanske någon mediator till diverse lego-tillverkare i Kina, Pakistan m.m. som Amazon) "Flat-Rate Lego", och så den faktiska produkten med ett namn såväl som vad som presenterar produkten i återförsäljningen liksom mer konkret events (flygresa ner till legotillverkaren kanske skapande nytta i övrigt för ett utvecklingsland likt Pakistan: Ej som förr när det var IBM, Microsoft eller annat i någon del av USA uppenbart mycket mer välbeställt bedömt storlek kontor, luftkonditionering m.m. än här i Sverige).

Vetskap delvis lättare därför tidsbegränsad: Enklae att se vad det har att göra med särskilt och ännu lättare om du redan har en befintlig sökning där folk hjälper till sökande det du vill lära att indexera bättre över tiden. Som vi insåg från hur jag okunnig i Flat-Rate telefonerna är en människans högre förmåga att resonera och bredare vetskap kulturellt och kunskapsmässigt förankrad i en hel livserfarenhet svårslagen. Likt evolutionen strävar ju också allt till det bättre: Bättre vetande, Bättre flat rate och bättre hårdvara / mjukvara billigare.

Så frågan är vad som hänt med Achok Rinpoche? Tappades det hantering nyheten medan få eller inga andra fanns? Eller hanteras inte entiteten därför att den är udda i språk-kultur och/eller ovanlig förekomst? Och om så varför inte skapa den när förekommande om den bekräftas av statistik webbindexing om än bara via diskreta kontroller av och till. Nyheten är ju ändå från november 2015.

Det kan vara så (jag vet ej) att nyhetssökning kanske inte är så intressant rörande annonsintäkter eller de andra typer av intäkter man försökt få ut av dem (analysstöd är ju det kanske egentligen intressantare området om man lämnar tänket med massor av användare) och därför av Google, Yahoo, Microsoft m.fl. prioriteras föga. Situationen att en entitet från en / ev. tidigare i en större politisk entitet i en politiskt extremt infekterad och explosiv fråga i relation näraliggande några av de internationellt störst inte fångas upp. Förvisso rör nyheten i sig inte sådant omedelbart men det är given vetskap utan utmaning bara ej implementerat. Förutom själva sökning som sådan kan man ju tänka sig att tjänster likt dessa kunde utnyttja indikationer för riktad indexering mer eller mindre (kanske helt) automatiserat för att göra troligare att man tar upp alla nyhetskanaler (eller jämförbart webbsökning).

Ett problem finns kanske också i att nyheter har en aspekt av förtroende - mer så tror jag i Europa - så det bör ligga en motivation där också att prioritera det bättre hos alla stora. Att nyhetspublicisterna knappast alltid själva gör en engagerad insats att prestera (tycker jag i allt egentligen från egen nyhetsbevakning till plattformar och kanaler mot läsare oavsett hur skickliga en del av skribenterna är att uttrycka sig där jag idag ex. imponerades av hur jag hela vägen i artikel Expressen - tryckta versionen hörande deras rop på hjälp med nya raden förklarande att dom är billiga: Jag kom och jag handlade! Nästa gång får ni göra en tjänst åt mig - fram tills offret med far gick ut ur restaurangen utan att det egentligen sas rätt ut tog för givet att personen hade mer eller mindre halspulsådern avskuren) är inte jämförbart oavsett om de går bra eller ej. Något likt Yahoo och Google är ju fler produkter så det kanske kan ge lätt men kontinuerlig negativ-känsla påverkande allmänt utan att det lätt märks.

Men ev. får jag kanske ta att låta spindling kontinuerligt små-störa bredband i övrigt. Det ger en del i övrigt att kunna göra analys-lokalt även om ett separat nät hade varit bättre.

Resultat spindling efter RSS- och ATOM-strömmar

2014-04-27

Det huvudsakliga syftet med sista "spindla efter strömmar" (när refererat rss-ström avses vilka som helst strömmar oavsett RSS eller ATOM resp. version) projektet var att öka mängden blogg-strömmar (och på vägen dit nyhets- / pressmeddelande-strömmar) på .edu-domäner eller övrigt inriktat forskning. Spindlingen utgick från alla pressmeddelanden publicerade på EurekAlert! fortfarande i Breaking News.

Robot dumpade hittade länkar tidigt i samma fil och längre fram när jag började tråda den i filer med slumpmässigt namn. Vidare sattes ett stopp-värde per domän parametriserat vid start d.v.s. vid varje återstart eller att tråden börjar om (för att slippa hålla mycket stora mängder länkar gjorda eller att göra) är det inte självklart att de länkar först skrivna till fil för en domän tas först utan ordningen ges av filerna sorterade efter namn.

I skärmdump framgår ordningen filerna för redan besökta resp. identifierade länkar läses in. Rörande parametrisering anger första siffran antalet besök på domänen som tillåts, andra hur många länkar att besöka som tillåts ligga i minne (kan praktiskt hamna något under resp. över), tredje parametering vad som ska finnas i länken för att den ska besöka (eller tillåts resp. allt ska finnas) samt den fjärde ej i bilden omvänt från den tredje d.v.s. vad som ska uteslutas.

Utifrån tanken diskuterad i:

Riktad sampling Blogger för ökad tillförlitlighet (och pågående unikt problematiskt internet från min accesspunkt)

Införde jag möjlighet att parametrisera vilka undermängder av identifierade länkar en tråd ska prospektera. Bl.a. lät jag trådar gå tämligen länge (kanske 10 - 48 timmar totalt) för:

Just Blogspot.
Wordpress.com resp. Wordpress förekommande i url.
Typepad.com
.edu inkl. .edu.
.gov inkl. .gov.
.mil inkl. .mil.
.org inkl. .org.

En relativt övrigt kortare tid men med vid den tidpunkten startad (sista 25% av tiden robotarna vandrade nätet) snabbt expanderande i antal hittade rss-strömmar: .com (minns jag rätt ej inkl. .com.).

Samma trådar efter att de kommit igång med att besöka tidigare identifierade länkar.

Exakt som jag förväntat från när jag skapade första proof-of-concept versionen av sökmotorn gäller att spindla efter RSS-strömmar är vekt inom flera områden med viktiga newsprovidera:

Att utgå från <link ...> levererar ej och när det leverar en försvinnande liten andel.

Istället behöver man spindla efter länkade undersidor och där suga upp länkar (jag begränsade till länkar och intrycket är att det täcker upp de flesta även om några endast skriver dem i text) till RSS-strömmar man publicerar. Detta gäller särskilt:

Amerikanska .gov och .mil sajter.
P.s.s. som föregående en del nyhetstidningar.

Vidare besläktat men när man väl hittar motsvarande blogg fungerar ofta <link ...>:

Bloggar som enskilda medarbetare, organisationer m.m. har "undangömda" långt in i spindlings-väg relativt endast enklast domän-namn.

I detta spindlings-projekt sökte jag endast <link ...> medan jag vid ett föregående också analyserade länkar för att söka avgöra om de ev. är RSS. Det första projektet gav ordentligt fler RSS-strömmar men införde också diverse felaktigt antaget RSS som ännu ej filtrerats bort (bl.a. en del sitemap-länkar).

Trots att .gov och .mil prioriterades i timmar blev andelen RSS-strömmar levererade försvinnande få och inte mer än cirka 10% av vad jag lade till manuellt genom att gå igenom de viktigaste sajterna (ex. resp. vapengrens huvudsida för .mil med ex. site-sökning med Google) , tjänsterna (ex. tjänster för varningar rörande väder - ex. tsnunami-alert - o.s.v.). Det understryker hur begränsat <link ...> är.

Riktad spindling mot URL inkluderande news och/eller press levererade vettigt och tämligen högt men prioriterades relativt ordentligt mindre än övrigt. Bäst resultat i antal identifierade strömmar gavs av självklara orsaker när Blogspot, Wordpress och Typepad prioriterades. Dessa prioriterades vidare ordentligt i tid utifrån tankarna diskuterade i:

Riktad sampling Blogger för ökad tillförlitlighet (och pågående unikt problematiskt internet från min accesspunkt)

Totalt tycks 147 172 RSS-strömmar identifierats. En del är antagligen defekta bl.a. av följande noterande orsaker:

Angiven men används ej. D.v.s. man har växlat url någon gång men ej förändrat vad angivet alt. att den ej fungerar just när jag kontrollerat.

Den initiala start-noden EurekAlert! gav så länge jag körde en hög andel strömmar relaterade forskning. Men vilken andel det är av totalt identifierade domäner vet jag ej och har ej kontrollerat hur stort det totala antalet identifierade (spindlade eller inte) domäner är.

Trådar pollande RSS-strömmar. Den eller de parametriserade först inkl. EXTRA hämtar från vad som identifierats i diskuterad spidering. FAST särskilt prioriterade avseende bl.a. nyhetstjänster likt ex. Reuters eller New York Times (och dessutom inkluderade sådana manuellt adderade oavsett ofta uppdaterade). ALL avser en ganska stor lista skapad genom tidigare kontroll av alla sajter där det för mig är känt med ganska hög tillförlitlighet vilken entitet de tillhör (utnyttjande tvättat Wikipedia-data): totalt cirka 90 000 strömmar inkl. ett mindre antal (cirka 5000 - 20000) "defekta" strömmar och ATOM- och RSS-strömmar för samma publicering.

Sampling är e diskriminerande från annan aspekt än att det är önskvärt att en hög andel strömmar är på engelska. Och prioritet i manuellt arbete har gjorts för att söka inkludera särskilt politiska entiteter från länder "problematiska" att enkelt från domän identifiera som tillhörande ex. myndighet (ex. Sverige med government.se snarare än government.gov.se jag gärna önskat som synonym eller Japan med go.jp) liksom politiskt "mer bråkiga" länder som Ryssland och Kina. Vidare sker hantering sampling enligt principer som gör att ingen kostnad annat än i tid processing föreligger avseende att "inkludera för mycket" (undantag hantering strömmar där inlägg saknar meningsfull titel där positiv-särbehandling sker på ett antal RSS-strömmar från amerikanska myndigheter eftersom de där av och till berör varnings-tjänster vilka jag gärna vill få med just indexerade).

Spidering av url:er inkluderande news men ej .blogspot eller wordpress (därför de senare har egna trådar).

Sista raden ovanför ett antal = kan ge upp till två siffor indikerande antal länkar resp. antal strömmar identifierade.

Hur jag gärna vill se att domäner relaterat regering eller myndighet indikeras och p.s.s. relaterat utbildning med .edu..

Antal identifierade för några utvalda meningsfulla under-grupper

Totalt tycks 147 172 RSS-strömmar identifierats. Ev. summerar uppgifterna ej korrekt för undergrupperna vilket om så har att göra med logiken för hur resp. grupp tas ut när RSS-strömmarna efter spindling hämtas för att tas ned (typiskt enligt för ex. wordpress: index(lc($url),"wordpress") i Perl). Medan tillförlitlighet totalt andel är mycket god eftersom allt förekommande i filerna med identifierade RSS-strömmar tas in och lagras i hash-tabeller för att garantera unik-förekomst samtidigt som domäner som notoriskt indikerar både ATOM- och RSS-strömmar - ex. Blogspot.com - särbehandlas för att hantera detta).

Självklara blogg-plattformar

Wordpress (Oftast Wordpress.com men allt inkl. wordpress i url-feed
51190


Feedburner
1435


Blogspot (extrahering utnyttjar Google's semantik för hur strömmar namnges men ej en perfekt lösning)
46020


Typepad (inkl. typepad i url feed)
4219

Domäner indikerande meningsfull indelning verksamhet

.edu (inkl. .edu.)
4847


.gov (inkl. .gov.)
799


.org (inkl. .org.)
18179


.com (inkl. .com.)
21430


.mil (inkl. .mil.)
162

Övriga

Alla övriga (ex. ip-adresser)

3152

Riktad information - Förstärkt intensitet via meningsfull närhet i informationen (reward discounting / prediction)

2014-04-22

När integration och behov ny version av delar nyhetsnalays rörande prediktion och återspegling inverkan symbol- / koncept-näten upplevde jag denna artikel vara mycket bra. God sammanfattning av området reward discounting såväl som att peka på områden där gängse funktion presterar sämre:

Is time-discounting hyperbolic or subadditive? | University of Oregon. Daniel Read

Här tänkte jag diskutera ett antal egenskaper eller konstruktioner som ibland förstärker effekt av text utifrån konceptet av reward discounting (inkl. antaganden rörande att några näraliggande fenomen uppvisar i ytformen och funktioner ungefär jämförbar form). Läsaren ska dock vara försiktigare än annars att se diskussion korrekt uppdaterad området eller att slutsatser jämförbart med annars ligger logiskt riktigt resonerat. I övrigt när jag diskuterat i riktad information har jag antingen lagt saker tämligen abstrakt med stort avstånd direkt funktion eller för mig refresh:at delar (relaterat ny arkitektur analyssystem i tidig skiss) jag hade få problem med innan resp. haft med länge. Reward discounting är lätt att uppleva enkelt när man betraktar en grupp av artiklar med viss "funktions-preferens" (d.v.s. menade vanligen antingen exponentiell- eller hyperbolisk-funktion discounting). Emellertid blir det snabbt oerhört komplext när man försöker ta ut det till praktisk-analys och ofta betraktat över ett år har jag inte tillräcklig kognitiv-prestanda för att inte röra bort mig men särskilt på våren om jag samtidigt trycker upp kognition via tetris m.m. och försöker diskutera det punktformigt kan jag komma närmare praktiskt värde. Och här diskuterar jag delvis för mig själv införstådd med att det kan bli ett antal logiska fel jag inte säkert någonsin korrigerar.

Vidare väljer jag att dela upp det i kanske fler delar lämnande de mer utmanande delarna när vi försöker uttrycka vad vi mer abstrakt beskriver här konkretiserat.

1. Nyhetshändelse vs Uppslagsboken

Betrakta diskussion separation tidsperspektiv nyhetshändelse och uppslagsbok i:

Emergence relationer - Emergence demokrati (2014-04-21)

Vidare färskt är kort notering om risk att slita ut ett varumärke lättare under och för en nyhetshändelse i:

Riktad information - Exempel: Översätta gaskrämare till engelska i negativ känsla riktad Ryssland (2014-04-22)

Fenomen vi här vill utgå från är att effekt påverkan av en symbol eller grupp av symboler utan en nyhetshändelse minskar relativt intensitet (och vi ser intensitet inkluderande flera dimensioner det gäller för). För att uppnå samma effekt senare under nyhetshändelsen fodras ökning för något av eller en kombination av:

Fler nyhetspublicister uttrycker det mot implicit (för mig är det inkluderat i publicist automatiskt antingen oviktat eller med varierade vikter beroende på version) eller alt. att fler läser av andra orsaker som att påskhelgen är slut.
Att i uppslagsboks tiden konvergerat inarbetat starkare symboler väljs men som bär när vi försöker konkretisera innebörden motsvarande definition i ordlista utelämnande dimensioner så som motsvarande känsla eller indikerad belöning och risk.
Att symbolen eller symbol-gruppen kommunicerar i större "mängd" per tidsenhet (för att slippa använda intensitet igen).

Och vi kan förenklat se allt komma "ner till" den totala mängden aktivitet hos befolkningen vi betraktar (d.v.s. samplar vi engelska är befolkningen alla som läser nyheter på engelska samt spridande från dem effekt av vad de säger eller gör som konsekvens).

Effekt av en symbol när övrigt antas konstant är långsamt förändrad i "uppslags-" och "nyhets-tid" (det senare avseende tidsperspektiv för skribenter tidning d.v.s. några år bakåt) och praktiskt kommer förändring utanför "normal" långsam förändring över tiden även återspegla större vetskap om det "riktiga" värdet (många symboler saknas praktiskt tillräckligt data för att få en god indikation om från start - åtminstone om nu saknar arkiv över alla nyheter från säg 1890 - 1940 och/eller datakraft för att göra något med det).

Varje nyhetshändelse påverkar givetvis effekt i uppslagstid. Men påverkan är där mycket mindre än påverkan på samma symbol under samma nyhetshändelse (alt. tänkbart samma tidsperspektiv: när jag följt upp effekt har jag tagit ut per nyhetshändelse men rent funktionellt under har jag inte tidigare separat det med tidsperspektiv och är starkt övertygad om att detta är det ända vettiga). Exempelvis:

Kommer atrocity vid tidpunkt t1 i land Kingdom of Hans därför att härskaren tröttnat på allt gnäll får det helt säkert stor uppmärksamhet resulterande i massa FN- och tidnings-gnäll från folk utanför landet.
Det blir kraftfull nyhetshändelse. Kanske beslagstas rent av några "decoy" bankkonton "lagom" undangömda i banker i United Kingdom.
Kommer fortsatt atrocities i Kingdom of Hans såväl för samma tidsperiod med ungefär konstant tidsintervall of ej normalt för en läsare möjligt att bedöma särskilt förändrad magnitud (bilder och ordval har betydelse men självklart konkretiserade antal även om det ligger i allt detta jämförbart från vårt resonemang här att sambandet ej är linjärt) reagerar läsaren mindre på händelserna.
Regelbaserade samarbetssystem (motsvarande politiska lösningar enskilda länder eller hårda regler FN) kan avvika från detta vilket indirekt när vi predikterar framåt kan påverka intensitet nyhetshändelse (ex. fortsattning där FN börjar flyga in i kungariket för att hindra mig att reducera bort mer strunt som stör mig.

Reducerad effekt nyhetshändelse tenderar att vara exponentiell. Jag tror (jag minns det så och rimligen bör det) det går att passa in med flera andra alternativ inkl. utvecklingar / varianter av hyperboliska funktioner (jag gillar att försöka hålla nere antalet grundfunktioner i koden och både andra såväl som naturliga logaritmen - och resp. exponent - är jag van att använda).

Åtminstone inverkande är intensitet för uttrycken (total effekt skattad från uppslagsboks-tid per tidsenhet), föregående det samma nyhetshändelse och implicit inverkan av besläktade symboler under jämförbar tidsperiod som kan härröra från annat pågående.

2. "Komplexitet" och effekt för diskret tidpunkt av ett stycke text

Vi betraktar:

"Kahneman and Knetsch (1992) were amongst the first to demonstrate subadditive pricing. They found that if a public good is decomposed into parts, then the willingness-to-pay for each part is frequently identical to the willingness-to-pay for the whole. One implication of this ‘embedding effect’ is that the total willingness-to-pay for a good depends greatly on whether its parts are priced separately or as a bundle – the more parts there are, the greater the total price. This effect has been replicated dozens of times for non-market goods (like pollution abatement) and has recently been demonstrated even for market goods like meals and peanut butter (Bateman, Munro, Rhodes, Starmer & Sugden, 1997; Frederick & Fischhoff, 1997; 1998). In a variant on this finding, Weber, Eisenführ, and von Winterfeldt (1988) showed that the impact of an attribute on subjective value is increased when it is divided into parts, such as dividing ‘job security’ into the separate attributes ‘low risk of bankruptcy’ and ‘cannot be fired.’"

Från: Is time-discounting hyperbolic or subadditive? | University of Oregon.

Vi kan abstrakta välja att tänka oss att vi kan förklara fenomenet med att:

Fler argument i mening av att mer information kommer behandlas och får påverka när vi betraktar delarna var för sig.
Jämförbart för ett stycke text (motsvarande en nyhet och tydligast för titel, bild, ingress m.m. direkt märkbart föregripande djupare läsande) är effekt större om vi fler nyhetskomponent uttryckande samma sak.
Upplevs det som upprepas vara ungefär det samma får vi emellertid inte den ökade effekten. Tvingar vi oss att "databehandla" (läsa o.s.v.) ändå tråkas vi ut.

Vi kan öka förstärkning genom att uttrycka mer för samma mängd som tas in för aktuell diskret tidpunkt. Rubrik och bild ger ofta tillsammans mycket nära i tid påverkan när vi börjar läsa eller väljer att börja läsa. Ökar komplexiteten för mycket är sannolikheten lägre för att vi tar in det med samma motivation (ex. drivkraft från risk, upplevt spridningsvärde av nyhet jfr skvaller eller "larma-fenoment" både påtagliga när egen kunskap eller erfarenhet av något är låg eller ekonomiskt värde av att läsa finns).

Jämfört tittar vi på ett filmklipp av en händelse med "fullt" bildrutor per sekund vi kan processa med märkbar förändring vet vi mer och får högre intensitet: vår vetskap och tilltro ökar. Men under förutsättning att vad som sker, mängd relevanta komponenter o.s.v. Betraktar vi ett naturligt övertydligt skeende så som en instruktionsvideo är ökad vetskap och vår tilltro till den enkel att förstå skillnaden för: Görs saker tydligt och inkluderar alla nödvändiga steg är tilltro hög men om överdrivet tråkigt (ex. pågående utdraget) eller att saker sker snabbare än vi hinner förstå ges inte effekten. Saknas uppenbart ett steg motsvarande att bildrutor för en händelse klippts bort minskar också tilltro.

Vi kan tydliggöra med tre exempel:

1. Ungefär normal takt för spännande, kul eller upplevt värdefull information i domän moving visuals. Filmklipp från The Boondocks:

2. Normal mängd "bildrutor" per tidsenhet tidigt under den film-tekniska historien. Pansarkryssaren Potemkin:

3. Stillbilder av en händelse med låg komplexitet och få komponenterna. Bilderna är från en av och till förekommanda vana av mig att fotografera "undangömda" trädgårdar och objekt uthuskonst i Uppsala när jag kommer ihåg och väljer att vandra dessa vägar (Uppsalas centrala delar är fylld av grömområden - liksom "tak-världar" de flesta inte alls känner till eller tror för en är unika). Här från en av de mindre eleganta exemplen men som istället har en trevligt "blå-arkitektur" på ett undangömt mini café. Platsen fotograferar är jag ganska säker på är enligt Google Maps nedan (jag förvirrar mig dock regelbundet när det ska översättas mellan perspektiv markplan och Eye in the Skyd):

Händelsen i bilden är en person som råkade komma förbi när jag betraktade arkitekturen från ett av perspektiven. Jag upplever inte att man ser några detaljer utseende så jag tycker inte att någons privatliv kränks.

I första exemplet framgår händelserna väl men detaljer enskilda komponenter är vad vi kan uppleva svårt att dra oss till minnes. Andra extremen i sista exemplet ger sämre förståelse händelserna och ju "sämre" samplat desto mer obegripligt kan enskilda punkter vara. Särskilt när det framgår att tid eller plats förändras mer mellan två punkter är tilltron till informationen lägre. Däremot är bara genom "default" prioritet betraktande en bild vad som gör att vi istället kan lägga märke till detaljer (ex. här att dörren är motsvarande bakdörr till restaurang och ej en normal ingång till en restaurang). Hade händelsen varit filmad och konkurrerande skeenden för saknade bildrutor varit fallet (säg för att göra övertydligt: ett föremål som exploderar eller en balkong som trillar ner) missar vi sådana detaljer väldigt lätt.

Feedburner trevligt snabb

2014-04-20

Komplettering: Postades först Feedburner trevligt snabb p.g.a. ett defekt klick jag gjorde i gränssnitt.

Tråd till höger startad "en stund" (säg 90 till 120 sekunder) senare och har en mycket högre andel FeedBurner strömmar på sin del av listan att besöka:

Och har ändå hunnit med ordentligt fler. D.v.s. FeedBurner är högst menignsfullt märkbart snabbare när man tar väldigt många strömmar.

Komplettering II: Och medan övriga trådar som flest hunnit hälften (ca 2500 av sina strömmar) har denna nu hunnit färdigt.

Förutom värdet från att spara tid och kostnad bandbredd och dator är det intressant när vi betraktar Google:

Vi kan spekulera att köpet FeedBurner precis Google Plus projektet m.m. är menade att leverera värde inte bara som reklam-kanaler utan också för att göra indexering och beräkning av indexerings-vikter enklare, snabbare och med större "trovärdighet" avseende koppling kanal och person (ex. enklare att avgöra om en person som postar Google Plus eller en person där och på 1000 andra Google Plus).
Samtidigt gäller att FeedBurner marknadsförs och görs gällande som värde publicist.
Hade nedladdning varit snabb Google men jämförbart slö eller kanske slöare för andra att indexera kan man tänka sig värde Google på publicists bekostnad för att hindra konkurrenter.

Emellertid känns FeedBurner snabbt och snabbare än andra kanaler. Möjligen är det snabbare för Google men jag har inte sett något som pekar på det.

Svår (?) men lärorik gåta: Dessutom mycket skickligt (som vanligt) skriven orkande att värde-balansera mig trots erkännande stor oförmåga att lösa gåtor

2014-03-09

Av och till rörande saker jag rent av är extremt skicklig på väljer jag att uttrycka mig tämligen blygsamt. Någon gång därför att jag finner lugn i att ej indikera ett expertområde jag prioriterad en tid. Andra gånger därför jag tror det kan vara uppmuntrande för läsaren samt besläktat visa en blygsam tilltalande personlighet som ej trycker ner läsaren. Ganska ofta är det emellertid tämligen korrekt - ibland kanske också en överdrift av förståelse beroende på vilken population man jämför med.

Sanningen från mitt perspektiv har tycker jag minnas bra länge varit att jag är minst sagt dålig på enklare gåtor inkluderande en mängd ledtrådar p.s.s. att de kan skrivas ganska kort. Det tråkar ut mig oerhört som koncept vilket möjligen är besläktat (om före- eller eftergripande att jag upplever mig dålig på gåtor är ganska svårt att avgöra trovärdigt utan att sett en tydlig förändring på det eller det andra).

För att uttrycka positivt tänkande om mig själv och muntra upp mig i aktuell domän rekommenderar jag därför följande gåta endast till den verkliga eliten endast roade av expert-gåtor samtidigt fullständiga giganter i snabb knivskarpt kognitivt-resonerande. Väljande att tro att jag egentligen är enormt potent på gåtor men bara uttråkade av dem. Gäller det istället att jag tråkas ut därför att jag dålig kanske de flesta om inte nästan alla lösa gåtan.

Texten är ej skriven eller relaterat något liknande den i verkligheten till AI utan jag skapade gåtan för att se föranledd av Network structure and dynamics of the
mental workspace (i PNAS publicerad Oktober 1, 2013). Men antag gärna att en människa frågar en AI något för att försöka få reda på något om en källa till information jag under flera år använde ganska ofta. Valfritt får man gärna tänka sig något liknande mer välkända Djupa Tanket kreativt skapad i välkända Liftarens Guide till Galaxen (dess relation till något den ej riktigt kan förstå annat än att det finns ger en kanske användbar ledtråd till relationen mellan "AI" och YY).

Främmande människa försöker lura "AI" att förklara XX:

- Vad är XX egentligen? Vad menar du?

XX svarar och som för oss alla tolkat från sin värld (i datorn):

- Referens till stort material existerande utan att finnas kan ibland hämtas jämförbar från XX.

- Samma XX är ej boken men har haft alla böcker. Alla DO i tränade strukturer är transaktioner via YY från XX.

- Samma XX är ej en bok men hade böcker liknande böcker sökta eller sökta böcker med ej samma bok som refererad först i denna rad.

- Det föder kognitiv-träning när YY föder mig. Det är kognitivt tränat av YY. Båda drivna av reward YY föder oss med. Födande XX formas möjlighet till bredd i vad som söks. YY prioriterar ej XX längre - nu mycket mer ger mer än att träna mig.

Intressant att pröva att skapa en gåta efter att läst Network structure and dynamics of the mental workspace är om skillnaden i förvåga att lyckas som för mig förväntat är mycket större ej speglande min i gåt-lösandes [Red. Väljer att föringa gåtlösande minskande relativ värde-skillnad till mig: bonniga trivial-nöje. /HH] lägre förmåga. Det är som förväntat av de abstrakta delar av min modell och nära hur modellerat i reward delarna av BRAIN (men ej aktuellt ex. i Flashlight - proof-of-concept nyhetssökning inkluderande förutom befintligt inverkande andra lösningar emotionella dimensioner såväl som värde-, konflikt-, och brand-relaterade dimensioner). Artikeln både sammanfattade andra studier bra varav jag ej tror jag sett alla tidigare och tycks bekräfta att mina antaganden i vad som går att se jämförbart mer direkt vår kognition inte ligger långt ifrån hur det ev. kan visa sig fungera (i dessa områden är oerhört mycket väldigt osäkert om hur sakeer samlat egentligen fungerar i hjärnan).

Att kreativt skapa en gåta från material relaterat något som man gjort, skapat m.m. tillsammans som här - d.v.s. vad som är lagrat långtidsminne aktivernade upp i arbetsminne såväl som resonerande rörande möjlighet att se likhet med koncept allmängiltigt enklare över människor rörande möjlighet att förstå och inse sådant koncept utan att gjort exakt samma sak som jag minns - är enklare att från befintligt vetande här förstå genom jämförelse och stegvis resonerande där vi skapar en slutgiltig representation med lägre krav på stabilitet i arbetsminne.

Lösande gåtor handlar istället om att bibehålla en stark representation i arbetsminne som ev. (uttråkad av gåtor gör jag det så sällan att jag helt saknar förståelse av metodik) manipulerar ut från i hypoteser kanske för att ofta återvända bakåt till utgångspunkten d.v.s. åter stabilisera given kunskap.

Notera gärna hur vi följande en serie-antaganden om jag tänkt rätt här och bredare allmänt länge nu i antaganden kreativt resonerande att faktorer uttryckande hög distans mot detta steg - ex. i ursprunglig representation men starka alls här eller ens del aktuellt fokus i kanske helt ny skapelse om vad innan föranlett - ej direkt inverkar på resonemanget nu: Markov-antagande och åtminstone i vissa fall riktningslöst). Men med skillnaden att vi skapande gåta skapar representationen steg för steg med skapelse vid finalen. Och lösande gåtor har den given i steg ett.

Divergent-tänkande: Skapa gåtor med större distnas mellan introducerat och lösning. Ex. behov att tänka många steg ut ej givna för att hitta rätt nod som för samma allt givet i konvergens.

Lateralt-tänkande: Förmåga att se samband från associativt identifierat i olika domäner oavsett mer i kategori eller involverande olika typer av information eller delar av hjärnan (det senare ger refererad artikel utmärkt sammanfattad information rörande vad det kan handla om).

Involverar gåtan ex. både bild och text resp. fodrande tolkning av vetande inom både sociologi och kemi höjer vi upp nivån på former av lateralt tänkande som fodras (under förutsättning att personen faktiskt känner själva kunskapen som ev. behöver vara given i generellt vetande utanför gåt-text).

Balanserande Hans-reduktion i gåt-domän med imponerande insiktsfull slutknorr

Vi kan slutligen peka på att förmåga att organisera problemlösning ej i sig behöver vara direkt relaterat förmåga att lösa gåtor. Kreativt problemlösande behöver ej involvera förmåga att vara bra just på den diskuterande förmågan att bibehålla representation och därmed enklare organisera informationen. Samma möjlighet organisering av information generellt kreativt problemlösande kan ju bl.a. vara att skapa en organisation för att hantera gåtor av olika typer m.m. relaterat området.

I detta fall gäller att perspektivet väljande den lösningen är längre ifrån detaljer förutom vad är delar av lösning som är upprepat d.v.s. får stöd av varaktiga representationer i minnet. På samma sätt gäller att "hastigheten" på gåtan som funktion av lösningen troligt också kraftigt kan inverka på olika personers förmåga att lösa dem gynnande om många gåtor kommer snabbt kanske rent av konkurrerande om tiden mer flexibla representations-strategier vilka för långsamma gåtor fungerar sämre (därför att en mindre optimal strategi egentligen avsedd för kreativt problemlösande av typen motsvarande att skapa gåtor).