Visar inlägg med etikett Förgiftad information. Visa alla inlägg
Visar inlägg med etikett Förgiftad information. Visa alla inlägg

Nordkoreas kärnvapen och risken för felbedömning

2017-07-29

D.v.s. om korrekt så har mening mer allmänt skiftat från flera år fram i tiden Nordkorea når USA till att det möjligt är så nu. När jag sist gav min tolkning / skattning att det antagligen låg nära-inpå var vi fortfarande i att det sågs flera år fram i tiden. Frågan här liksom ibland annars om det endast är det konkreta som påverkat var viktning för skiftet gått inverkande till förändring. Utan tvivel är det inte endast konkret i form av provskjutningarna som inverkat då förändringen började långt innan (räknat från när jag sist påtalade här).


Även om jag nu själv får anses del av en tidig del av skiftningen ( under period 1 - 3 år sedan ungefär ) finner jag sådant här i allmänhet problematiskt. D.v.s. att informationen man bedömer ifrån ej framgår. Publicerat som här duger utmärkt oavsett sådant för att skatta förändring och från det skatta konkret slagkraft. Men det är om man gör sådant också mycket önskvärt att kunna göra fördjupade kontroller av och till i ämnen som är långsiktigt återkommande. Och i ämnen av denna typ med mindre att vi involverar människa med vissa egna kunskaper (d.v.s. mig själv här) blir ämnen som dessa problematiska därför det ej framgår information som går att processa vilka inverkat på bedömningar refererade. Generellt (och kanske inte alls här skiftande från mig och diverse andra som föregriper det där föregående i sig påverkar andra i deras bedömning kompletterande deras ev. konkreta fakta med flummigare black-box användande av andra när efterföljt i tiden det bekräftas i en serie konkreta händelser framtill första nya provskjutningen) kan vi inte anta att en eller flera entiteters bedömning i sig oavsett information de ger som ska antas inverkat på deras bedömning är okänd inte kan flytta andra personers bedömning om begränsade kända fakta därefter lösare på annars en för låg nivå talar för att de haft rätt.


Vi är i riskdomän av förgiftad information där analys kan önskas styras genom att ge ej egentligen ej korrekta bedömningar - eller korrekta mycket bra bedömningar som gång på gång visar sig riktiga för att längre fram göra en bedömning ej rationell från några kända fakta men som kan skapa en önskad verklighet (ev. vilka ej är sällsynt alls också bekräftande den bedömning gjord).



Min känsla är hur som helst fortsatt att jag tror det ej är ovanligt att Nordkoreas slagkraft i domäner som dessa såväl som förmåga att förbättra den samma underskattas från faktorer så som hur de klarat att underhålla taktiska styrkor. Värre sorters kärnvapen är kanske ej vad vi ska ta som givet ej kommer finnas i år. Om så är det ytterst allvarligt.

"Listening post Hawaii"

2017-07-22

Efter under flera år av och till - ej ofta men säg i genomsnitt kanske ett antal timmar 1 - 2 ggr per år - "aktivitet" när jag kom och tänka på det var att försöka återfinna utnyttjande också (eventuellt men ej säkert - mindre troligt kanske - källa till det) ett stycka text refererande till ett som jag velat minnas det hela när jag långt senare såg en annan tolkning till det hela (det lilla jag någonsin minns förutom själva textformateringen ungefär i Emacs - och udda nog något om min ej relaterade emotionella allmänna grundtillstånd vid tiden): gemensamt projekt Kina och USA, "listening post Hawaii" (och dessa ord har givit mig när jag sökt webben runt det diverse ganska konkret egentligen potentiellt oroande funktioner ev. ej orelaterade: Och egentligen är jag ej så otypisk svensk som man kanske ibland får intryck av om man ej väljer eller kan se konkreta risker som egentligen rena sammanträffande i livet fått mig att uppleva viss engagemang i där värdet vi i riskbedömning söker skydda är människor vilket upplever jag normalt lätt gör mycket mer allmänt kulturellt till ren bakgrund i hur man ser och värderar saker. Jfr Den of Snow som sprang ut från Hawaii några år senare landande i Hong Kong och har menats för mig referande bilder besökte PLA fastlandet under tiden där: Jag har ej, ser ej "värde" nog motiverande det, värderat eller kontrollerat detta: Det är egentligen mer intressant betraktande processer konsultinköp amerikanska myndigheter ty i den frågan bor svaret på om "moralisk phreak-event" gäller eller om systematisk risk kvarstår).


Faktiskt att jag många år senare hittade några av orden exakt samma i en nyhet ungefär från tiden. Som jag något år trodde var samma. Men senare kom att inse plötsligt - eller så upplevde antagligen / möjligen troligen mer var en ren slump. Senare och säg att vi nu är någonstans 2008 - 2010 kom jag att publicera lite tagande upp en sido-blogg till denna innan huvudsakligen använd relaterad vad vi kan kalla internet marketing sedan något år att jag indikerade risk visst läckage information vars källa ej enkelt visade sig. Möjligt helt orelaterat egentligen. På vissa sätt givet ej så men att A givit upphov till aktivitet B och aktivitet B visar något som det sunt försiktigt värderande sinnet (d.v.s. ej "konservativt undervärderande" utan sunt från förståelse av att problemet alltid finns och att det alltid är så att om vi finner problemet och korrigerar det kvarstår problemet alltid i annan person eller annan teknisk-funktion) känner luktar osunt (utanför att allt alltid luktar illa för det försiktiga sinnet: Det är så. Saker har aldrig varit bra något år jag betraktat Kina i världen. Inget någon större aktör har annat än luktat illa på nivå att de läcker om inte allt så det mesta till dem på alla sätt inkorrekt ej sällan förutom moraliskt också juridiskt).


För att ej göra litet / mycket till mycket här. Hur säljs konsulten till större entitet med regelbunden budget sådana inköp? Den säljs genom att man rekryterar seniora personer till konsultföretaget från den inköpande aktören. D.v.s. seniora personer i "arbetsför" ålder man räknar med att sälja och med gott rykte (eventuellt - ej säker - mindre intressant här) man kan sälja ex. säg någon teknisk-funktion, man rekryterar personer som haft ganska upp till höga chefs-positioner eller varit ansvariga för stora skapande projekt där ej över året mer "pool-köpta" / "halv-konstanta" konsult-inköp kommer i, och man rekryterar mycket seniora personer som ofta ligger post-"arbetsför ålder" som ex. suttit i Styrelse eller tidigare varit CEO, CFO eller liknande och ger dem en exempelvis direkt motsvarande funktion (d.v.s. troligare Styrelse eller annat ej krävande massor av timmar) tillsammans med ett ekonomiskt incitament.


Vill vi ta ut information från entitet A över en längre tid är en strukturell metod att ha person X1 som är mer "junior" och ej beslutar om access till något. Exempelvis att X1 ej beslutar om var han arbetar o.s.v. X1 är dock den som gör praktiskt arbete. Vi behöver med andra ord en mer senior person som beslutar var X1 arbetar. Det är det ibland mer krävande att få till. Arbetar vi i företaget kan man tycka att det ska vara enkelt: Och visst att det kan vara det. Emellertid gäller tror jag oftare för troligare och större entiteter att det snarare är en jobbigare väg. Du har normala säkerhetsfunktioner betraktande dig under längre tid utan att du är skyddad liggande i en extern funktion, du har arbetskamrater / karriär-konkurrenter m.fl. som betraktar dig. Och mer grundläggande är det inte överdrivet många roller som är flyttbara naturligt. Sådana roller hanteras ofta via konsultinköp. Viktigare om den vägen ska utnyttjas är att kunna välja konsulten under tillförlitliga avtal (från säljande aktörs perspektiv) d.v.s. senior-person hos konsultföretaget (som kanske arbetade många år tidigare i karriären hos myndigheten: Säg NSA för konkret exempel). Vi förutsätter här hur konsultaffären i alla normala omständigheter fungerar hos leverantören (vilket kanske inte alltid är uppenbart alltid hos alla roller associerad inköpare). Men vi som varit i dom affärerna från båda håkllen vet (där jag alltid varit konsulten men också som senare den ensamma konsulten post-det större konsultföretaget köpt konsulten från konsultföretaget "missbrukande" mitt vetande om hur konsultaffären fungerar för att gynna kunden förvånande bättre än normalt för ex. företaget Telia även om ganska många år sedan och föregripande detta. Dock affären är väldigt arketypiskt må det vara USA eller Sverige: Och jag tar på alla tänkbara goda grunder att den är helt jämförbar med föga skillnad i något jämförande NSA och Telia. På många sätt ganska lika tänker jag.).


Och inte bara från detta men att bara detta givet att ett flertal allvarliga läckage av information är kända inklusive sådana vars källa ännu ej visats finns finner jag att Booz används (kvarstår leverantör - och för ej balansera ner utan mer upp att antagligen mycket kvarstår myndigheterna som borde ha försvunnit än mer motiverat: Gissar jag) något som tycks skapande av strategisk infrastruktur:



Antingen var Snowden moralisk-pheak-event eller så ligger en strukturell kvarstående risk. Även om det första finns diverse läckage ej förklarade - inklusive sådana som resulterat i döda - ej förklarade vilka kan vara relaterat samma myndighet (den konservativt försiktigt betraktande information tappar dock ingen. Medan den för andra går åt i tiotal). Detta är ej en liten sak. Leverantörerna känns ej verifierade som sunda. Jag kan verkligen tänka mig att en senior person i området av en större grupp leverantörer är olämpligt rapporterande Kina. Det tycks som att övriga förklaringen givet mycket är föga troligare i jämförelse.


Egentligen gillar jag inte bra mycket annat utanför det konkreta händelser / möjliga läckage. Så som hur potentiella risker hanterats efter dem. Man borde funnit mycket mer. Men gör det ej. Jag tvivlar ej på att borrar man ner finner man. Den som söker skall finna. Men ibland är det svårare att från vissa utgångspunkter entitet kunna göra just detta. Man stirrar sig hemmablind. Och om det som ej är hemma dessutom är vad som umgås regelbundet med övergripande beslutsfattare i entitet kan de kanske för den hemmablinda vara svåra nog att se.


Jag gillar ej att vi ser för vissa leverantörer tappade kontrakt och så senare tecken på att de används mer igen. Jag tror ej de kontrollerats nog.


Förövrigt. En del stora konsultaktörer är impulsiva när de kritiseras. Jag tror ej som här uttryckt men antagligen om jag engagerade mig här djupare att resulterat kan bli döda för alla amerikanska myndigheter. Det är som inte målet här eller syftet här så mycket som att peka på ett hanterbart problem någon tittat på men tror jag ej nog. NSA är svår i sådant här genom att de av allt att döma hämtar in information lite varstans. D.v.s. läckage där kan inkludera läckage av känslig information andra egentligen äger ansvarig för den skada som kan induceras från denna om känd bredare. Men värt att uttrycka eftersom länkande direkt in i Booz webben. Men ev. om försvårande / bromsande processen kanske en bra lösning. Vi avslutar med så att allt ej blir så allvarligt med Join the Navy (lyrik inkluderad trivialt förgiftad information):




Good luck.

PS

Något rörande ursprunget bortklippt tidigare och oediterat. Mest reflekterande minet för mig själv men kanske intressant: "Om man tänker sig en mer alternativ tolkning / gissning källan än en underligt fel-formaterad press-release som flaggades bland tränings-data och gick ut och betraktades mig - då körd på min vid tiden äldsta dator inhandlad från Dell säg 2002 och kasserad helt och fullständigt säg 1 - 2 / 3 år innan reflekterade något efter att börja fundera av och till givet annan information vad i helvete den där texten egentligen var - och någon gång seende att även om ej görlig att se arkiverat data alls tekniskt så ev. på diskarna nedanför refererat om stora noga och där inseende att körd den äldsta av gamla datorer använda i detta och där dessutom förutom kasserad med vid den tidens och ännu mer nu liten hårddisk varande så gammal och hårddisk körande massor av data skapande och raderande diverse filer även om nu inte en fil per ex. nyhet processad - men kasserad och man kan mena att man ej ska räkna bort en sådan hårddisk ändå - fragmentering kan om bara ett stycke meta-data ger svaret bevara fakta evigheter också under dessa omständigheter och om mer kompetens och teknik än jag har rent personligen finns så eventuellt att kanske rent av en 5 till tio överskrivningar på samma topologiska platser kan hanteras."


PS igen: Spekulerar svaret 2011 här även om kanske elektroniska funktioner tycks troligare (och visst uppenbart där: Men rent allmänt oavsett något specifikt refelkterar man varför vissa aktörer indirekt drivet tycks som alternativ mindre trolig tolkning kanske i de subjektiva sannolikheterna att området märks mer: Vad är poäng med det? Men verkligen att att jag ej såg något av det innan jag fann detta som tänkbar). 10. En 3-letters-acronym kan verka den andra lik för vem som helst annat. Men så klart om A gör B och problemet är i B betraktas A. Men säg att C associerad A betraktar A som del av ett projekt A ej känner till och ej heller FBI känner till. Tja då är konsultleverantörer till C också vad man ska gå över. OPch man söker till man finner. Så har det alltid varit hos de som ser rätt. Tills man finner. Därmed inte sagt att jag just spekulerar att NSA avlyssnade CIA's kommunikation Kina.

Resonerande "More or Less" - Meningsfulla eller Meningslösa?

2014-04-16

Efter tips i DN tittade jag på Påven och Pengar som föga förvånande gav exempel på att också denna diktatur (i tämligen hög nivå på en ungefärlig glidande) har problem med korruption, maktmissbruk och svårighet att styra individer delar av och stödjande själva makt-strukturen (kardinaler m.m.). Och krönikör Johan Croneman reflektion:


"De första fröna till min ateism föddes redan på sextiotalet – jag tror att jag var tolv år när jag såg katolska präster stå och stänka vigvatten på amerikanska B52:or strax innan de gav sig i väg för att bomba vietnamesiska städer, byar, sjukhus. I nästa nyhetssändning kunde man se effekterna av den nyss välsignade bombmattan; en liten pojke som genom tv:n för första gången kom i brutal närkontakt med världen."

Från: Johan Croneman: En timmes lysande tv om katolska kyrkans groteska rikedomar (2014-04-15) | Dagens Nyheter

Fick mig att minnas den gigantiska association och betydelse både i riktad information och påverkande mer konkreta åtgärder katolska kyrkan såväl som andra kristna kyrkor hade förr och fortfarande har (men ej lika uttryckt speglande hela "konfliktens" utveckling i nivå intensitet) hade relativt kommunismen särskilt Kalla Kriget.


Och väckte tanken att använda motsvarande samma motsatts-koncept (vad jag kallar More or Less) jag använt (och fortfarande i större bredare grupper nära grund uttryckt i hjärna individ) använder för att ta ut närmare emotionella åsikts-uttryck över text producerad större populationer (ex. de flesta större tidningar på engelska):


Kommunism - Katolism

Kommunistisk entitet - Entitet Katolska kyrkan

Även om jag egentligen tänkte fel i ev. behov att införa det i mitt system då alla motsvarande förhållande likt ovan redan är hanterade via modell-koncept i linjen med på resp. sida två entiteter i låst konflikt med två olika mål för konvergens övergripande, resp. nära just ord-relationer Black and White jag nästan glömt då det i allt praktiskt hanterats i More or Less tydliggjorde det i alla fall några enkla exempel på vad jag tror kan vara fungerande enkla AI-regler i sig krävande ganska lite i statistik när det endast gäller att indikera något man kan önska prioritera mer tid och minne att betrakta djupare i nyhetshändelser.


Ex. om vi just tänker oss närmare mer av konflikt involverande länder:


"Changing side". X del av en sida (ex. individ) känt eller dolt del av ena sidan (B) går över till den andra sidan (A). Finns åtminstone följa förenklade utgångspunkter för analys av innehållet från symbol-kontext:


1. Korrekt övergång. Ett vinnande för A därför att man övertygat eller köpt en person till. Nivå motsvarande påverkan andra individer, informationen X representerar eller konkreta väpnade styrkor om ett land eller en rebell-styrka.


2. Falsk övergång. Att X fanns i B välkänt.


3. Falsk övergång. Ej känt att X fanns i B.


4. Falsk övergång helt eller delvis. Ej säkert eller tydligt känt att X fanns eller fortfarande finns i B.


D.v.s. vi kan tänka oss att oavsett om syftet i sig är att föra in förgiftad information i A eller extrahera information från A att associationen i sig kan dölja associationen B. Utmaningen i analys för detta är uppenbar när vi betraktar databehandling av nyheter:


  • Betraktar vi endast nyheter publicerade under aktuell nyhetshändelse eller kanske rent av månader eller år bakåt kan gälla att vi endast får associationen till A.
  • Medan association B kanske föga uttryckt långt bakåt ej framgår alls.
  • Och också inkluderande alla nyheter kan gälla att association till A är mycket mer i mängd och gör B otydlig utan annat stöd.

Men med vetskap i relativt enkla regler för Black and White relationen och förstöelse av att det är närmare en tydlig konflikt över linje där man står närmast "180 grader" mot varandra och nödvändiga inlärda vikter mellan resp. och relationen kan problem i mycket obalanserat uttryck av intensitet associerad A resp. B lättare hanteras utan helt felaktiga slutsatser.


Appendix A: Kommunism vs Katolska Kyrkan

Ganska typiskt för den här formen av hårda idé-konflikter gäller att båda sidorna "excommunicated" varandra. Enligt Wikipedia gjorde Katolska Kyrkan detta 1949:

"The Decree against Communism is a 1949 Catholic Church document (by Pope Pius XII) which excommunicates all Catholics collaborating in communist organizations. The document resulted in one of the largest formal excommunications in the history of the Catholic Church (it could include more than several million Catholics)."

Från: Decree against Communism: Wikipedia


En till artikel i Wikipedia jag ej läst men tycks åtminstone i rubriker täcka upp relevanta entiteter för ämnet: Anti-communism.


Och givetvis när konflikten ej är särskilt låst börjar som normalt för all mänskligt lärande och kreativtet koncept ytligt associerade det ena eller andra som upplevt senare i tiden (eller konkret lånat) ske:



Där nu gäller att Kina allt mer blir som förväntat pragmatiska i vad man förföljer. Religioner som håller sig något så när tysta vägs rörande förföljelse mot bl.a. PR-kostnader:



Påvens ev. anti-kapitaliska tankar tror jag dock inte går hem med kinesiska kommunistpartiet som ju mer än lånat kapitalism från andra sidan tog den längre än nästan alla andra.


Möts man i större grupper i parker och gör ungefär motsvarande tai chi samtidigt som man har ett gemensamt idé-system ej berörande kommunism är man dock självklart alltid hot som förföljs oavsett om egentligen konkret tämligen oengagerade i att söka stimulera förändring. Grupper som samlas och dessutom har en gemensam organisation med kännedom om varandra är ju vad som kan marschera ut samlat för att protestera lättare:



Appendix B: Referenser till Påven och Pengar i DN och SVTPlay och bonus innehåll Appendix C: Kvalitetsgranskning med betygssättning av Johan Croneman resp. SVTPlay

Är en av få krönikörer i DN jag minns att stanna och läsa de gånger jag bläddrar tidningen tryckt. Hans sura lätt men inte överdrivet gnubb-gnälliga personlighet stämmer väl med mig på morgonen och gissar jag jämnare över dagen och på högre nivå Dagens Nyheters genomsnittliga ganska tydligt äldre läsare (delvis spekulerat på åkldern men knappast ordentligt fel). Man vet alltid också ungefär vad han kommer tycka vilket tilltalar mig i nöjes-läsning i tidningar såväl som när jag väljer film och teve utanför dokumentärer (och också där kan jag åtminstone inte sällan ha preferens mot det samma). Aktuell krönika:


Johan Croneman
Betyg allt jag läser vulgär-kultur (teve, musik m.m. onyttigt): 3.6 / 5
Betyg normaliserat Dagens Nyheter: 4.5 / 5
Betyg normaliserat SVD Näringsbilaga: 3.9 / 5
Betyg normaliserat kultur-relaterat: 4.5 / 5


Aktuellt teve-avsnitt på SVTPlay samt för att bjuda till lite mot de gemensamt (smyg-)ägda tillgångarna och för att ställa mig in lite hos en av Sveriges största media-köpare och internet-trafik-uppsugare (i mening av att trafik andra tidningar, satsningar webb-teve, andra teve-kanaler m.m. tar en kostnad om än delvis för några kompenserad media statsbidrag) en kvalitetsgranskning av innehåll resp. teknik kortfattat uttryckt från upplevda känslor:


Även om SVTPlay inte direkt imponerar i innehåll jämfört med andra kostnadsfria tjänster - Betyg: 1.5 / 5 - utanför svenskt innehåll i mening av vad man täcker upp och erbjuder i valfrihet, och tittbarhets index på svenskt innehåll inte orkar längre än fyra till sex Hans-frekvens-titt-besök per år (väldigt dåligt) imponerar den desto mer på i prestanda och smidighet att förflytta i tiden för aktuellt "avsnitt" (eller motsvarande).

Om teknik-kraften ligger hos dem eller helt enkelt orsakas av att bredsleverantör lokalt mycket troligare har innehållet i cache vet jag inte men gissar att båda orsakerna kan spela in (oavsett det tycks den alltid för mig de gånger - ej direkt varje månad - jag använt den mycket stabil och välfungerande). Kanske kan man privatisera teknik-lösningen i ett företag och media-delen i ett annat för att konkurrera fritt med övriga medier och teknik-företag? Så får vi dessutom se om det genuin kvalitet i tekniken eller bara ovanligt fet budget för driften.

Snowden-filerna: Att detektera manipulerad information

2013-11-27

Antar vi att de flesta (inte alls otroligt alla ännu) filer stämer med som tagna (piratkopierade? spionerade?) från SSA's bygger det givetvis upp stort förtroende över tiden.


Vi kan här leka på antagandet att filer vid någon punkt kan innehålla enskilda delar manipulerade eller ändrade. Kanske endast en rad. Problematiken relaterat att detektera det är intressant bredare och Snowden-filerna kan passa som utgångspunkt för att diskutera det.


En möjlighet här är att om rimlig korrekt finns upparbetad i att ej förneka filer korrekta (åtminstone i meningen att man ej heller bekräftar dem) hos NSA kan det delvis vara funktionellt för att begränsa ev. skadeverkan på godtyckligt företag eller annan aktör.


Under förutsättning att NSA kan spåra publicerade filer till deras motsvarighet hos dem och noterar enskilda manipulationer av data (det tycks troligt).


Om den möjligheten saknas behöver vi först konstatera vår större utmaning i detektionen:


  • Vi kan ej anta att vi kan verifera fakta givet som korrekt eller inte på rimlig tid (istället kan det ta många år innan det klarar).
  • Manipulaton av enskild text rörande detaljer (ex. ersättande hypotetiskt och ej troligt något relaterat avlyssning Google's datacenter med något spelkonsol-leverantör Microsoft eller Playstation) kan vi heller inte detektera vi språkmodeller.

Några pdf-filer publicerade av Guardian jag tittade lite närmare på (utan något liknande god vetskap om pdf-formatet) tycks vara skapade av ett antal bildfiler efter varandra. Om så redan i NSA databas (eller ev. om kontorsdatorer om nu Snowden kopierade upp dem från sådana korrigerande problem eller installerade program) är det tror jag bättre här än om skapat mer direkt i relevant program för att göra sådant här genom att test, linjer m.m. då är uttryckt i meta-språk för pdf (om jag försår konceptet rätt).


Ändå för så begränsad manipulation betvivlar jag att det alls detekteras givet att mycket annat varit tycks det genomtänkt i detaljer i mycket kring det här. Det går ju enkelt via gissar jag räcker bra ex. Gump att utmärkt ta bort det som nu märks med lite filter m.m.


Så återstår möjligheter för detektion? Nja. På nivån vi anagit ovan är det nog tror svårt via andra metoder också. Men skillnad finns trots allt ändå mellan vad vi ser och hur något uttrycks. Ju mer "komponent-överskrivande" eller strukturellt det ändras (där det lär bli troligare förändrande om man mer försöker föra in saker och ting eller ändra struktur - d.v.s. manipulativt på störr nivåer och potentiellt farligare i skadeverkan ex. på företag eller liknande) desto ("eventuellt" läggs bäst för jag har aldrig prövat det pdf) blir en till metod möjlig (och möjligt när den är funktionell är övriga metoder vi antog ej möjliga minst lika effektiva samtidiga).


Vi förstår metoden från vad som kanske gör pdf känsligare än mycket annat:


"A PDF file consists primarily of objects, of which there are eight types:[38]
[...]
Objects may be either direct (embedded in another object) or indirect. Indirect objects are numbered with an object number and a generation number. An index table called the xref table gives the byte offset of each indirect object from the start of the file.[39] This design allows for efficient random access to the objects in the file, and also allows for small changes to be made without rewriting the entire file (incremental update). Beginning with PDF version 1.5, indirect objects may also be located in special streams known as object streams. This technique reduces the size of files that have large numbers of small indirect objects and is especially useful for Tagged PDF."

Från: PDF | Wikipedia

D.v.s. tänkbart kan vi etablera språkmodell ej för innehållet utan själva språket dokumentet uttrycks med. Där distansiering över tiden med relativt små-förändringar i klientprogram, personliga preferens hos användare m.m. kan bli märkbart.


Kan det hindras att detekteras genom medvetenhet om detta? Kanske. Det beror nog på hur mycket data Snowden egentligen har. Jag misstänker nog att PDF-filerna inte innehåller genomgående särskilt komplett information hur konfiguration sett ut ev. inverkande här (även om det nog kan förenklas till ett fåtal enkla grupper möjligt) medan jag mer tydligt kan tänka mig att corpus för användare nog här saknas.


Det räcker inte för att bevisa något men kanske kan ge en och annan out-lier via en kompletternade metod om jämförelse corpus kan påvisas personer. Detta är en helt annan fråga där en del alternativa lösningar kan existera men ligger utanför vad möjöigt att få med här vettigt begränsat och meningsfullt vad jag vet om representativt.


Artikel nedan från The Royal Society's journal Proceedings of the Royal Society B (B är mer hard-science och matematik närmare ingenjörs-tillämpning och A biologi och neuro science, bioinformation m.m.) ger illustration hur detektion meta-språk fungerar:


"Many prehistoric societies have left a wealth of inscribed symbols for which the meanings are lost. For example, the Picts, a Scottish, Iron Age culture, left a few hundred stones expertly carved with highly stylized petroglyph symbols. Although the symbol scripts are assumed to convey information, owing to the short (one to three symbols), small (less than 1000 symbols) and often fragmented nature of many symbol sets, it has been impossible to conclude whether they represent forms of written language."

"This paper reports on a two-parameter decision-tree technique that distinguishes between the different character sets of human communication systems when sample sizes are small, thus enabling the type of communication expressed by these small symbol corpuses to be determined. Using the technique on the Pictish symbols established that it is unlikely that they are random or sematographic (heraldic) characters, but that they exhibit the characteristics of written languages."

Från: Pictish symbols revealed as a written language through application of Shannon entropy
Rob Lee1, Philip Jonathan och Pauline Ziman,
Mars 2010 doi: 10.1098/rspa.2010.0041
Proc. R. Soc. A rspa20100041

Pressmeddelande: Unlocking the mysteries of the Picts | The Royal Society

Specifika algoritmer i artikel för bildspråk är dock något för förenklade här där från det mer begränsade jag sett för PDF-filerna istället graf-relaterade informationsmått (Entropy and Graphs, Seyed Saeed Changiz Rezaei (University of Waterloo, Kanada), 2013 är en diskussion men flera mått relaterat graf-entropier finns flera är nog vad som normalt oavsett tillämpning man prövar praktiskt hellre än att försenare för mycket kring resp. teori- se kompletterande att globala distributioner finns såväl som lokala ev- uttryckt i flera dimensioner per användare, miljö, tidpunkt, organisation i IT-mening fil passerade relaterat i samband med skapad och presenterad) är aktuella (PDF gör åtminstone för delar jag såg i standarder och från data extraherad från ett apr test-filer Snowden just vad som skapar vad vi kan se som graf inkl. vad vi programmatiskt kan se som rekursiva förhållanden - men mindre av det senare i aktuella filer vilket dock kan vara relaterat angvet sist här).


Motsvarande en värld där vi definierar meningsfullt språk som nivå med hur näraliggande "vanligt" som förväntad för skapare A, på plattform B, för event C där filen tas och sparas om för gemensam presentation (exempelvis) o.s.v.


Flera exempel på bildspråket finns i Wikipedia Pictish stones (artikel refererad längre upp har endast en bild).


Meningsfullhet i att koncept går igen med liknande betydelse är möjligt. Samband kan också tänkas uppstå från att de förekommer tillsammans meningsfullt utan att vara riktigt språk som vi oftare kanske tänker oss det nu.

Något jag minns mig uppleva när jag tittade på ett antal bilder av stenar i samband med att läste artikeln var kontrakts-liknande övrrenskommelser relaterade mark, giftemål, bokskap m.m. Att hugga det i sten ger det ju väldokumenterat och trovärdigt en tid i alla fall. Passande storbönder när de gifter sig samman med en näraliggande för tiden kraftfull aktör med många djur, betesmarker, gårdsfolk inkl. vapen till dem kanske mycket tiotal eller rent av hundra st även om det spontant utan att veta mycket alls om kulturen låter ovanligt stort under normala tider).

Där får vi ju statistiskt återkommande mönster meningsfulla med viss kontext runt stnen (kontrakt rörande giftemål ex.) men utan riktigt ren återkommande betydelse. Att storbonde eller motsvarande uttrycker relativ storlek till häst. Och ev. kontrakts-relaterat djur uttrycks relaterat det med djur eller jämförbart (jag minns ej exakt hur det brukade se ut).

Från den tanken kanske vi överst har et avtal relaterat jaktmark eller jämförbart.

Ett av många tänkbara ex. där dom statistiska relationerna ger mönster av språk men utan att vi enkelt förstår språket utan att veta en del av två kkonkurrerande storbönders historia några år tillbaka och giftmålet man önskade ha detaljerna huggna i sten kring rörande betesmarker o.s.v.

Relaterat



PDF-begränsning

Att understryka: PDF från sajt Guardian refererar är med säkerhet ändrade efter NSA och antagligen just relaterat denna. Vad av ursprunlgit data som kvarstår oföänrdrat för de få jag tittat på är inte helt trivialt att veta. Men en möjlighet att förutom webb-program för att hantera pdf'er där är det samma. Datum för event tycks stämma med geo och händelse konret visad som jag såg som möjligt stämmande med en presentation för data identifierad genom att med hjälp av Google.com's sökoperator site:gov sökande diverse sidor i och runt aktuella datum. Så möjligen stämmer det. Samtidigt är datum relaterat webb-api-pdf-grunkan för uardian's lagringstjänst också angiven relaterat den. Men det kan nog om alls riktigt variera "binärt" mellan filerna.


Möjligt gör samma mjukvara (ganska standardartad sådan och taggad i filerna så det går antagligen att kontrollera) filerna optimerade för snabbare nedladdning samtidigt som information från nod-relationerna vi här önskar analysera reduceras.