All vs Most

2015-05-12

Det här var ju lite intressant givet att jag hållit lösning för att kvantifiera dessa typer av indikationer i NP öppen därför att trots i delar mycket vettig rangordning av dem från mitt viktsystem emotionell intensitet kombinerat med något vi kan jämföra med inverse-document-frequency (men ej skapat från just dokument alls) resp. Bluelight intensity ev. i kombination med ett till mått närmare en form av entropi) så avvek en del i toppen underligt. Bl.a. förutsätta jag att all ska vara ovanför most: Dels känns det ju spontant riktigt vidare är ju all i större utsträckning optimerad för användning (kortare så snabbare att processa).


"Indeed, the tendency for quantifiers to be recalled as generic was strongest for “most”, and weaker (though present) for 'all'. A possible explanation for why 'some' is treated differently is that adults understand “some” statements to express distinctly limited generalizations."

Från: Quantified Statements are Recalled as Generics: Evidence from Preschool Children and Adults.
Sarah-Jane Leslie och Susan A. Gelman.
Cogn Psychol. 2012 May; 64(3): 186–214.
doi: 10.1016/j.cogpsych.2011.12.001

Om det sedan för dessa uttryck har betydelse har två svar. För vanliga koncept likt all och most kan man lösa det regelbaserat. Emellertid innehåller själva filen som har alla kvantifierande ord oavsett typ som kan förekomma i dessa fras-typer med aktuell grammatiskt funktionalitet ett par tusen ord (och några 2-gram resp. en del fler-gram men de har mindre betydelse). Det är emellertid mycket lättare att försöka verifiera funktionalitet för numeriska beräknings-algoritmer för dom vanliga koncepten här eftersom det är dom forskning sker på. Jag har här egentligen inte sett över allt efter att lämnade just denna viktdel (det är i all verklighet en av de mindre kritiska delarna i övergripande beräkning av olika former av polaritet för ex. NP-fraser eller andra till noun-fras nära besläktade typer).


En sak jag kan lära här är att inte vara så brutalt försiktig rörande användning av denna grupp av viktlösningar jag använder. Att de fungerat relativt flera andra i andra områden exceptionellt bra är indikation på att man oftare kan chansa innan verifiering forskning om det inte är brutalt tidsödande kodning (vilket jag kanske för ofta avstår från för att inte riskera att få in senare atavistiska komponenter i subsystem).


Mycket uppmuntrande faktiskt.


Rörande some i citatet behöver jag läsa om det mer noggrant. Men möjligen har jag en jämförbar hantering redan här huvudsakligen dock funktionell i att exempelvis something bryts upp i analys till some thing tillfälligt i ett delsteg. Orsaken till det kanske är besläktad och om så ev. vad jag återkommer till (jag föredrar att diskutera sådant här när det fortfarande är unga lösningar ej testade djupt nog om det finns något att referera som tittat närmare på samma sak så att det inte blir fel för läsare underskattande betydelsen som djupare testning faktiskt har här: Även om det kanske inte är så himla många som sitter och implementerar human-like semantisk och emotionell analys av data).


Följande citat kanske jag tolkar lite fel rörande kontext men delvis håller jag ev. inte riktigt med om det:


"To express a generic generalization, however, we just ‘omit’ the quantifier: “tigers are striped”. There is no special linguistic marker (“gen”) that specifically signals a generic. Interestingly, this is not an isolated fact about English: no known language has a word or linguistic marker that specifically signals a generic (Dahl, 1985; Krifka et al., 1995). In this way, generics are less syntactically marked than quantified statements. Chomsky (2000) argues that less marked syntactic forms may be associated with default interpretations. Thus, if generics express cognitively default generalizations, this would explain why they are syntactically less marked than quantified statements."

Frågan är ju vad det är generiskt uttryck inducerat för vad typ. Här tar man nu tigrar som exempel men låt oss ta ett enklare exempel och betrakta typen Hans Husman. Kan vi göra ett generiskt uttryck för något typiskt för honom med ett särskilt ord:


Hans Husman is great.

Eller ej generiskt (om jag förstår meningen de lägger i det: Jag behöver verkligen egentligen läsa artikeln noggrannare):


Hans Husman is great during lent because he eat's enough to have energy.

Hans Husman is a great person to use for bread baking.

Eller varifrån inte:


Tigers has stripes.

Tigers is an animal with stripes.

Givetvis kan jag istället skriva:


All tigers has stripes.

All tigers is animals with stripes.

Eller ev. mer rätt eller mer fel (jag tror att alla renblodiga tigrar ej korsade med ex. lejon har stripes):


Most tigers has stripes.

Most tigers is animals with stripes.

Men för all varande den närmaste till att utelämna indikation helt behöver den egentligen inte. Även om jag egentligen behöver läsa artikeln noggrannare och ev. kan ha missuppfattat något kring generiskt här kändes det som en för mig väldigt relevant anteckning att göra rörande vad som tidigare kommenterades kring all. Reduktion redundans är ju en faktor nära relaterad komplexitet och tänkbart finns något i det som förklarar mitt tidigare feltänkt när jag tog all som vad som borde fått högre viktvärde än most. Det är emellertid lite för omfattande tror jag att försöka diskutera här.