Parole,parole,parole…estatistica PerdistinguereleparoleIlcervellopotrebbeusaremetodistatistici 19maggio2016 Distinguerelesingoleparolenelflussodelparlatononèunacosasempliceesecondoilinguisti perfarloilcervellopotrebbeusaredeimetodistatistici.UngruppodiscienziatiSISSAha applicatounmetododisegmentazionedelleparolebasatosullastatisticaenehamisurato l’efficaciasullinguaggionaturale,inben9linguediverse,scoprendocheilritmolinguisticohaun ruoloimportante.LaricercaèstatapubblicatasulJournalofDevelopmentalScience. Vièmaicapitatodiromperviilcervellocercandocogliereancheunasolaparolanelflusso ininterrottodiundiscorsoinunalinguacheconosceteamalapena?Èingenuopensareche quandoparliamoesistaunaancheminimapausafraunaparolael’altra(comelospazioche mettiamoperconvenzionequandoscriviamo):inrealtàilparlatoèquasisempreunflussosonoro continuo.Quandoperòascoltiamolanostralinguamadrequesta“segmentazione”delleparole noncicostaquasinessunosforzo.Qualisono,sichiedonoilinguisti,imeccanismicognitivi automaticiallabasediquestacapacità?Uncontributocertamentelodàlaconoscenzadel vocabolario:lamemoriadelsuonodellesingoleparoleciaiutaarilevarle,ma,sostengonomolti linguisti,esistonomeccanismiautomaticieinconscidi“bassolivello”checiaiutanoanchequando nonriconosciamoleparole,eanche,comenelcasodibambinimoltopiccoli,quandoabbiamo unaconoscenzaancorarudimentaledellalingua.Questimeccanismi,credonogliscienziati,si basanosull’analisistatisticadellafrequenza(stimatainbaseall’esperienzapregressa)dellesillabe inognilingua. Unindicechepotrebbecontribuireaiprocessidisegmentazioneèla“probabilitàtransizionale” (PT),chedàunastimadellaprobabilitàcheduesillabestianoall’internodellastessaparola, basandosisullafrequenzaconcuileduesillabesitrovanoassociateinunadatalingua.Inpratica, setuttelevoltechesentolasillaba“TA”vieneimmancabilmenteseguitadallasillaba“DA”,allora laprobabilitàtransizionaleper“DA”,data“TA”è1(ilmassimo).Seinvece,ognivoltachesentola sillaba“BU”permetàdellevoltecapitachelasegualasillaba”DI”epermetàdellevoltelasillaba “FI”,laprobabilitàtransizionaledi“DI”(edi“FI”)data“BU”è0,5,ecosìvia.Ilsistemacognitivo potrebbecomputareinmanieraimplicitaquestovaloresfruttandolamemorialinguistica,dalla qualericaverebbelefrequenze. LostudiocondottodaAmandaSaksida,ricercatricedellaScuolaInternazionaleSuperiorediStudi Avanzati(SISSA)diTrieste,conlacollaborazionediAlanLangus,ricercatoreSISSA,sottolaguida diMarinaNespor,professoressadellaSISSA,hausatol’indicePTpersegmentareillinguaggio naturale,conduediversiapprocci. Asecondadelritmo Saksidahalavoratoconicorpus,ossiacollezioniditestiraccolteappositamenteperl’analisi linguistiche.Inquestocasospecificositrattaditrascrizionidaregistrazionidell’”ambientesonoro linguistico”acuisonoespostibambinimoltopiccoli.“Volevamoavereunesempiodeltipodi stimolonelqualesisviluppaillinguaggiodeibambini”,haspiegatoSaksida,“Cichiedevamoseun meccanismodibassolivellocomelaprobabilitàtransizionalefunzionassesustimolilinguistici realistici,moltodiversidaglistimolicostruitiatavolinochesiusanonormalmenteinlaboratorio, chesonopiùschematicienoncontengonofontidi‘rumore’”.Saksidaecolleghihannousato corpusdiben9linguediverse,evihannoapplicatoduediversimodellibasatisullaPT. PrimadituttosonostaticalcolatiivaloridiPTinognipuntodelflussolinguisticopertuttiicorpus usati,successivamenteèstataeffettuatala“segmentazione”conduediversimetodi.Ilprimosi basavasullesoglieassolute:venivastabilitouncertovalorefissodiriferimentoperlaprobabilità transizionalesottoalqualevenivaidentificatounbordo.Ilsecondometodoinvecesibasavasu soglierelative:ibordicorrispondevanoaiminimilocalidellafunzionedellaPT. Intuttiicasi,hannoosservatoSaksidaecolleghi,laprobabilitàtransizionalesièdimostratauno strumentoefficaceperlasegmentazione(sivadal49%all’86%diparoleidentificate correttamente),indipendentementedalmetododisegmentazioneusato.Questoneconferma l’efficacia.Danotarecheentrambiimodellisisonodimostratimediamenteefficienti,lacosa singolareperòèchequandounmodelloandavaparticolarmentebeneconunalingua,quello alternativoalloraandavasempresignificativamentepeggio. “Questo‘incrocio’cisuggeriscecheciascunmodelloèpiùadattoperalcunelinguedell’altroe viceversa.Abbiamoquindicondottodelleanalisiulterioripercapirequalicaratteristichedella linguadeterminanoilmodellomigliore”,haspiegatoSaksida.Ladimensionecrucialesièrivelata ilritmolinguistico.“Possiamodividerelelingueeuropeeinduegrandigruppiperquelche riguardailritmo:lelinguebasatesull’accento(stress-based)equellebasatesullesillabe(syllablebased)“.Lelinguebasatesull’accentohannomenovocalieparolepiùcorte,comel’inglese,lo sloveno,iltedesco.Quellebasatesullesillabesonoinvecepiùricchedivocalieconleparolein mediapiùlunghe,comeitaliano,spagnolo,finlandese.Ilterzogrupporitmicodellelingue,che nonesisteinEuropaecheebassatosu“morae”(unpartedellasillaba),comegiapponese,si chiama“mora-based”edeancorapiùriccadivocalidellelinguebassatesullesillabe. Ilmetododellasogliaassolutaèrisultatofunzionaremegliosullelinguestress-based,mentrela sogliarelativaèmiglioreperlemora-based.“Èpossibiledunquecheilsistemacognitivoimparia usareilmetododisegmentazionemiglioreperlalinguamadre,cheporterebbedifficoltàperòcon lelinguechenonappartengonoallastessacategoriaritmica.Servirannoovviamentestudi sperimentaliperverificarequest’ipotesi.Sappiamodallaletteraturascientificacheibambini subitodopodallanascitausanogiàl’informazionesulritmo,epensiamochelestrategieper sceglierelasegmentazionepiùgiustapotrebberoessereunadelleareedovel’informazionesul ritmoèpiùutile”. Lostudioinfattinonpuòdireseilsistemacognitivo(siaadultochebambino)usidavveroquesto tipodistrategie.“Ilnostrostudioconfermainmanierachiarachequestastrategiafunziona attraversounampiospettrodilingue”,concludeSaksida.“Serviràoradaguidapergliesperimenti inlaboratorio.” LINKUTILI: • Articolooriginale:http://goo.gl/cOk5VD IMMAGINI: • Crediti:Jev55(Flickr:https://goo.gl/yVVdJ3) Contatti: Ufficiostampa: [email protected] Tel:(+39)0403787644|(+39)366-3677586 viaBonomea,265 34136Trieste MaggioriinformazionisullaSISSA:www.sissa.it