Visar inlägg med etikett Wordnet. Visa alla inlägg
Visar inlägg med etikett Wordnet. Visa alla inlägg

Söka bredare vetskap koncept-association: Wikipedia / Wiktionary på många språk

2014-04-15

Enligt principen enkel att förstå från:


  • Vi har definition på engelska (vi säger är vårt "mitt-språk" eftersom det är mitt) ex. integral i Wiktionary.
  • Där konstruktionen är sådan att motsvarande sida länkas i andra språkområden. Vi utgår där från länkning i vänstra marginalen motsvarande samma system i Wikipedia.
  • Vi utgår där från integral (svenska) som exempel.
  • Och gör översättning: integral (Google Translate).

En metod för att skapa system översättning bygger på alignment mellan text motsvarande samma definition eller jämförbart i olika språk. Vi inser att ex. Wiktionary är vad som tänkbart kan vara en del av data möjligt att använda för det. Jag kan föreställa mig att Google Translate är ett ex. på system som tydligt tidigt prioriterat denna typ av data för inlärning av statistiska relationer (nu antar jag att feedback från användare är den märkbara delen för förändring görande finare nyans korrektioner och inlärning).


Här är en av de två utgångspunkterna att denna inlärning är befintlig i systemet för översättning. Därmed görande översättningen från språk två (i exemplet svenska) får vi där indikerande koncept med sin troliga engelska motsvarighet. Det är vidare ytterst rimligt att anta att Wiktionary såväl som Wikipedia hör till datakälla ofta utnyttjade för väl-använda översättningssytem såväl i inlärning som feedback d.v.s. att ex. Google Translate utmärkt klarar översättning mellan definitioner eller uppslagssidor.


Därmed får vi kompletterad vetskap om associationer aktuella för aktuellt koncept och koncept i definitionen eller relationer mellan de koncept i definitionen.


Denna vetskap kan vara kontextuellt för språkområdet eller mer aktuellt för mig (där kontextuell inverkan hanteras via logiska beräkningar över generell vetskap association av ett antal typer) behandlade alla relationer detekterade p.s.s. för att bygga vetskap association.


I någon mening är det egentligen samma sak man gör när man tränar översättningssystem med tidigare indikerad algoritm. Och det var därifrån jag fick idéen till algoritmen.


Troligt ej aktuell för mig praktiskt förrän nästa omgång att söka kompletterande vetskap association från långsamt föränderliga datakällor i "uppslagsboks-tiden". Ett tänkbart problem praktiskt för mig är att jag ej har egen lösning översättning med den trovärdighet korrekt rörande olika sense på orden nödvändig här och ej heller underhålligt eller använt samtidigt som jag ej vet riktigt hur många request Google gillar per tyngd innan man stängs ner till nästa eller alternativt börjar betala för dem. Förr ett antal år sedan gällde ofta ungefär totalt 10 - 12 k requests medan stycke-prisen var sådana ovanför att jag ej ser praktisk meningsfullt för den här typen av användning när många miljoner requests behöver ske över en mängd datakällor (d.v.s. ev. krävande kanske rent av en budget på ett par miljoner).


Alternativa lösningar finns säkert men jag har ingen uppdaterad bild. Jag tror förövrigt att Google Translate är mycket ledande just i dom algoritm-system och deras maskin-inlärning viktigt för denna lösning. Mer regelbyggda lösningar och/eller statistiska med mindre eller ingen feedback från de som gör översättning (d.v.s. etablerande goda översättning mellan välbesökta sidor representerande motsvarighet - särskilt här där författare, redaktörer m.fl. kanske själva gör kvalitetskontroll) kan vara mycket sämre när kontext antingen lokalt mellan och i stycken resp. meningar eller aktuellt för något mer lokaliserat språkområdet är intressant. Men som sagt jag har väldigt dålig bild av hur väl alternativa lösningar fungerar här.


Komplettering: Jag vet ej (läste ej artikeln) om man gör samma sak i Polish and English wordnets - statistical analysis of interconnected networks men är jag ganska säker på utnyttjar en till uppenbar (men mycket mindre för språkområden såväl som data koncept-associationer) datakälla - Wordnet anpassningar för olika språk - jämförbart rörande metod ta ut statistiken för associationer. Ett problem med Wordnet-varianter utanför Princeton's välkända (wordnet.princeton.edu) är att åtminstone ett fåtal skapades med EU-finansiering föga genomtänkt rörande värdeskapande för medborgare och företag i unionen innebärande att de ej är tillgängliga för användning utan betalning licens resp. troligen inte normalt är tillgänglig för någon oavsett om betalning sker. Jag har fått intrycket att detta problem allmänt är vad EU nu ska ha börjat sett över med förändrade riktlinjer rörande finansiering av grundforskning med avgränsade leverabler. Ett annat problem jag ej vet om man hanterar ännu är att sidor med leverabler och redovisning av skapade saker (ex. resultat av intresse för alla som ska vara fritt) ofta efter en tid försvinner från nätet (ibland relaterat med att anpassningar av det sålts till kommersiella företag).

Kan jag få saker av Kina? Jag vill ha Eurowordnet och en Kungspudel

2013-05-14

Det har ju indikerats också nyligen att handelsavtal kan ta skada av att träffa Buddha-instansieringen Mr Lama. Frågan jag ställer mig är emellertid hur enkla vanliga människor som jag och många läsare kan konkretisera sådant till ett jämförbart värde för oss?


En idé jag fick är att vi kan pröva att be om gåvor som givna tar tid vi istället kanske skulle spendera på att uppmuntra deras medborgare att hänga sin lokala part-pamp högt. Att skrämmas med Lama-möten tror jag inte på. En känsla sedan år är att han mest är praktiskt för dem. Hellre fokus på honom än på andra aktörer längs kusterna som kan samla folk där riskerna att inducera mer resurser till dem. Men vi får väl se om Laman kommer hinna leverera sin livsuppgift. Han har troligt ett par år till på sig.


Jag skulle ex. vilja ta mig en titt på EuroWordnet utan att betala för den. Från licenskostnaden och det höga pan-europeiska-EU värde projektet självklart har förstår vi att EU knappast indirekt kan ha finansierat det hela. I så fall hade ju deras byråkrati inte låtit sig luras på alla värden det har för dom liksom både dem och deras leverantörer i och utanför datasystem, och de hade givetvis bevakat medborgarnas långsiktiga värde och intresse av att överbrygga språk-distanserna. Kanske dyker den upp som OWL indikerad på lämplig myndighet nere i Kina som har hand om belöningar m.m. till utländska aktörer?


Det i sig skulle "givetvis inte" påverka mig men det är ju heller inte jag som äger någon risk lika lite som kostnad för att peka på möjligheten här. Bl.a. vore det intressant att titta på sense kring konceptet "wink" jag inte fullt förstår... Jag vill ju gärna förstås rätt när jag skriver...


Mer spännande vore att pröva skapa något stort tillsammans vi Svenskar. Ett "Wikipedia" för att brandskatta kinesiska kommunistpartiet. Var och lär sig lite användbara termer och så ser vi om vi kan få en god summa i pension för utbetalning per månad för att inte spendera totalt en timme gånger 20 000 per dag eller var nu smärtgränsen börjar gå.


Jag skulle dessutom vilja ha en hund. Kanske en kungspudel? Inte från valp dock men heller mer än ett par tre år - ev. något år till på kungspudlar jag tror har lite av de belgiska vallhundarnas och bordercollie inlärnings-drivkraft - så man hinner ge den motivation och glädje i att samarbeta och lära. Hellre engelsk-talande än sittande på någon kinesisk dialekt.



Foto: Belinda Hankins Miller

Men man kan också pröva något omvänt genom att dedikera en kanal för det. Kommer en CD skiva med det eller en länk i e-post - och ingenting kring det publiceras - ska jag se till att titta över pack nature i kontext av regimen d.v.s. de "verb:artade" händelser och situationsförändringar för människans dynamik jag skapade för att styra semantisk-parsning kompletterande annat som ex. Framenet. Jag såg inte och har ännu inte hittat något alls samlat gjort för det. Hela lingvistiska-forskningen tycks till 90% riktat in sig på mjukvaru-agenter som "ser" i enskilda verb, att översätta eller försöka lista ut hur meningar påverkar varandra. Medan sociologerna - vetenskapsvärldens "utmanande" i allt relaterat teknik och matematik bland de som ändå inte riktigt alltid vill räknas in bland humanisterna - ännu handläser och identifierar övergripande koncept utan just någon entydiga system för det heller.


För en så pass stor aktör som alla delar av kommunistpartiet med relationer ut i det kommersiella och interaktion med omvärlden krävs nästan något sådant oavsett vilken analys man lägger på det. Svårt att följa i det händelserelaterade flödena ovanför eller utan attityder, idéer o.s.v. i koncept. Särskilt även om man analyserar koncept i intresse, attityd o.s.v. är det kostsamt och inte helt lätt annat än bruteforce att identifiera vägarna de påverkar varandra på lite längre avstånd. Händelser, det sociala m.m. är ett sätt att se på taktik och strategi och därigenom vad som intresserar oss och att söka nuhet, spridningsvektorer för ideer eller vad vi nu kallar den indirekta inverkan vi har mellan-koncept genom andra utanför vad vi direkt trivialt kan konstatera i co-occurance förändringar.


En sådan event jag ej infört än skulle kunna mimicking the superiour man.
(om deras återkommande taktik att plagiera mig är till god hjälp: min vilja att ge och dela med världen genom att uttrycka små tips, uppmuntrande utrop och ibland försiktigt välbalanserad kritik av världens länder, liksom världens politiska och religiösa ledare har de t.ex. nyligen tagit till sig som när China hails Pakistan där vi avstår från att göra oss lustiga för Xinhua's titel då vi nödvändigt är nöjda med att Kina är vänskaplig med Pakistan - I hail China för att vara en god-granne till Pakistan - och tror det kan ge Kina stor tur att vara vänskaplig och buga för Indien.


I Ching antyder framgång i detta lilla gåvo-projekt. Och kanske att CD-skivan från friheten eller att kinesiska gåvor inte bara är en hund utan en maiden wife. Och folket känner sig uppmuntrade av att jag villigt tar emot deras frukter. Om jag nu ska identifieras som the superior man (och vi sätter tilltro den aktuella översättningen av I Ching vilket man inte ska varande den äldsta låg-kvalitativa).


"31 - Hsien - Influence (Wooing)

The Judgement
Influence. Success. Perseverance furthers. To take a maiden to wife brings good fortune.

The Image A lake on the mountain: The image of Influence. Thus the superior man encourages people to approach him by his readiness to receive them."

Metaforer med Wordnet? Nja

2012-11-18

Testade stödet för att konvergera initial tolkning av mening för att ge initial primacy effect en situation sätts upp i märktes en till anledning att särskilt rörande mening vara mer noggrann med att separera "naturlig" association med de mer filosofiska idéer om hur man mer generellt kan uttrycka egenskaper och relationer mellan koncept.


Sådana ex. via Wordnet (jag använder fler inte sällan ofta för att just identifiera relationer som vad som existerar i sådana från större samlingar av data om relationerna mellan koncept) kan ha värden i många situationer, och många ser antagligen tolkning av betydelse som en.


Så länge vi håller oss till mycket lokaliserad information ex. enskilda meningar eller meningar i mycket direkt närhet är också Wordet och mycket liknande (och kanske lika ofta Verbnet inte ersättningsbart riktigt på samma sätt upplever jag).


Problemet med förståelse av mening uppstår när de noggrant genomtänkta idéerna om hur koncept sorterar och ansluter till varandra, och uttrycker över flera koncept återkommande "egenskaper, möter språkets och tankens kreativitet. Flexibla associationer mellan koncept fritt som mycket vi skriver och säger (jfr arbetsminne eller ett verktyg skapat från vetenskap i område X eller kombination av områden men tillämpat i ett annat) blir mer problematiskt) följer svårligen att uttrycker kunskapsmöten utifrån definierade regler som beskriver vad betydelse här. Vi kan jämföra mellan en grundläggande textbok för gymansiet om ett ämne och de implicita antaganden om konvergerad kunskap nödvändig för att bygga förståelse av ämnets benämningar och samband med den ständiga kunskapsutveckling där områden och vad som är möjligt förändras i praktisk tillämpning bland företag och uttryckt i universitetens forskning.


Ju mer lokaliserad ner till det extrema i en ensam mening tolkning görs desto mindre problem ger dessa sådana system helt enkelt därför att mindre utrymme för mer kreativa kopplingar finns. Därför är system som Wordnet värdefulla för att just tolka lokaliserad betydelse.


Under testandet där jag plockade ut en del mer ontologiska symboler ej definierade som sådana för att ha dem separerade till ett avgränsat annat system såg jag ett utmärkt exempel på just denna begränsning och där denna också är lokalt verkande motsvarande i samma princip i det lokala som våra kreativa associationer mer generellt: Metaforer. För tolkning och förståelse av metaforer adderar Wordnet med en del liknande system samtidiga här inte bara föga eller inget värde utan drar konkret ner värdet adderande en till anledning att hålla ontologiska dimensioner separerat för vad dom är bra till.


Det ska absolut inte förvåna oss. Att definiera en färdig lösning med ett språk som mer än fritt kreativt som vara vanliga språk ge oss alla möjligheter att uttrycka snarast försöker definiera vad vi kan uttrycka fodrar en enorm komplexitet om det inte ska ge en direkt begränsning närmare den katolska kyrkans syn på vetenskap under antingen än vad vi i dagligt tal klarar att flexibelt uttrycka. Och varför skulle vi behöva ontologier med regelstyrda tillståndsövergångar när språket i sig uttrycket fria möjligheter liksom vår kunskap?


Det är precis detta man jämförbart i ett oerhört lokalt mer "regel-enkelt" kontext ser för metaforer som är en av de mer kreativt flexibla i mening kanske oftare upplevda lite svårare än väldigt tråkigt språk utan meningens verkliga färg med alla dess nyanser och bara en av två verkande i lokalt kontext jag känner till som ej påverkas av faktorer utanför lokalt (i domänen syntax snarare än skattning av värde-dimensioner jfr stereotyper och associerad uppskattning eller ogillande av varumärken).


Fascinerande nog kan jag praktiskt utifrån de algoritmer jag föredrar också se skilda värden mellan konceptuella grupper av dessa mellan när vi tittar på de mer betydelse-nära relationer där similarity-koncept med ställda perspektiv fungerar bättre medan när vi tittar på ontologiska dimensioner tenderar koncept ungefär motsvarande Resniks (se Semantic Similarity in a Taxonomy: An Information-Based Measure and its Application to Problems of Ambiguity in Natural Language) och Lins (se An Information-Theoretic Definition of Similarity) algoritmer (men anpassat för att klara flexibla kopplingar och hantering salience för information o.s.v.) att fungera bättre. I det senare fallet är ju själva det vi utnyttjar just mer strukturellt ordnade relationer och där vinner man på att mer maximalt söka utnyttja det utan att bestraffa ner informationen via detekterade olikheter: finns en relation mellan ett koncept och en dimension eller över-gripande koncept litar vi på den.


Det ontologiska svaret på metaforer skulle jag hos de mer specialiserade på det området antagligen ofta skulle bli ett försök att definiera vad metaforer är rörande relationer, vad som förändras, vad som är en del av vad o.s.v. Men det har vi ju faktiskt en lösning för i språket och låter man det verka fritt och följer lite hur symboler (i meningen ord och kombinationer av ord) används kan det berätta ganska mycket utan att man behöver förstå allt i språket. Vi kanske kan jämföra med hur många tyckte att deras andra språk var problematiskt att lära sig trots att de från sitt första språk och vanligen ett antal år av ex. svenska undervisningen rimligen borde lärt sig en del upplevda regler för hur språk fungerar (vilka inte olikt kanske en del ontologi-filosofiska lösningar ibland får hjälpas upp med att lära sig saker utan-till som extra regler så att säga ungefär som med oregelbundna verb).


Det ontologiska epitetet ska dock inte generellt underskattas. Och om jag något roades av det här exemplet har det mer med traumatiska upplevelser mer specifikt relaterat Wordnet i samband med att jag importerade in delar av dess data till ett csv-format.
I mycket hör det ontologiska konceptet till det viktigaste vi har när det kommer till kunskap därför det hjälper oss att organisera vetande. Men man ska heller inte överutnyttja det och ex. för att tagga mina bloggpostningar låter jag mitt språk naturligt uttrycka vad jag just för postningen upplever är relevant inklusive värde-dimensioner och salience snarare än att följa förberedda noggranna regler för det. Praktiskt gör det närmast enklare - via sökmotor - just att hitta information jag eller en läsare söker efter som ligger i kreativa kombinationer ex. mellan personer och ämnen ej enkelt förberedda i färdiga regler.