Parole,parole,parole…estatistica
PerdistinguereleparoleIlcervellopotrebbeusaremetodistatistici
19maggio2016
Distinguerelesingoleparolenelflussodelparlatononèunacosasempliceesecondoilinguisti
perfarloilcervellopotrebbeusaredeimetodistatistici.UngruppodiscienziatiSISSAha
applicatounmetododisegmentazionedelleparolebasatosullastatisticaenehamisurato
l’efficaciasullinguaggionaturale,inben9linguediverse,scoprendocheilritmolinguisticohaun
ruoloimportante.LaricercaèstatapubblicatasulJournalofDevelopmentalScience.
Vièmaicapitatodiromperviilcervellocercandocogliereancheunasolaparolanelflusso
ininterrottodiundiscorsoinunalinguacheconosceteamalapena?Èingenuopensareche
quandoparliamoesistaunaancheminimapausafraunaparolael’altra(comelospazioche
mettiamoperconvenzionequandoscriviamo):inrealtàilparlatoèquasisempreunflussosonoro
continuo.Quandoperòascoltiamolanostralinguamadrequesta“segmentazione”delleparole
noncicostaquasinessunosforzo.Qualisono,sichiedonoilinguisti,imeccanismicognitivi
automaticiallabasediquestacapacità?Uncontributocertamentelodàlaconoscenzadel
vocabolario:lamemoriadelsuonodellesingoleparoleciaiutaarilevarle,ma,sostengonomolti
linguisti,esistonomeccanismiautomaticieinconscidi“bassolivello”checiaiutanoanchequando
nonriconosciamoleparole,eanche,comenelcasodibambinimoltopiccoli,quandoabbiamo
unaconoscenzaancorarudimentaledellalingua.Questimeccanismi,credonogliscienziati,si
basanosull’analisistatisticadellafrequenza(stimatainbaseall’esperienzapregressa)dellesillabe
inognilingua.
Unindicechepotrebbecontribuireaiprocessidisegmentazioneèla“probabilitàtransizionale”
(PT),chedàunastimadellaprobabilitàcheduesillabestianoall’internodellastessaparola,
basandosisullafrequenzaconcuileduesillabesitrovanoassociateinunadatalingua.Inpratica,
setuttelevoltechesentolasillaba“TA”vieneimmancabilmenteseguitadallasillaba“DA”,allora
laprobabilitàtransizionaleper“DA”,data“TA”è1(ilmassimo).Seinvece,ognivoltachesentola
sillaba“BU”permetàdellevoltecapitachelasegualasillaba”DI”epermetàdellevoltelasillaba
“FI”,laprobabilitàtransizionaledi“DI”(edi“FI”)data“BU”è0,5,ecosìvia.Ilsistemacognitivo
potrebbecomputareinmanieraimplicitaquestovaloresfruttandolamemorialinguistica,dalla
qualericaverebbelefrequenze.
LostudiocondottodaAmandaSaksida,ricercatricedellaScuolaInternazionaleSuperiorediStudi
Avanzati(SISSA)diTrieste,conlacollaborazionediAlanLangus,ricercatoreSISSA,sottolaguida
diMarinaNespor,professoressadellaSISSA,hausatol’indicePTpersegmentareillinguaggio
naturale,conduediversiapprocci.
Asecondadelritmo
Saksidahalavoratoconicorpus,ossiacollezioniditestiraccolteappositamenteperl’analisi
linguistiche.Inquestocasospecificositrattaditrascrizionidaregistrazionidell’”ambientesonoro
linguistico”acuisonoespostibambinimoltopiccoli.“Volevamoavereunesempiodeltipodi
stimolonelqualesisviluppaillinguaggiodeibambini”,haspiegatoSaksida,“Cichiedevamoseun
meccanismodibassolivellocomelaprobabilitàtransizionalefunzionassesustimolilinguistici
realistici,moltodiversidaglistimolicostruitiatavolinochesiusanonormalmenteinlaboratorio,
chesonopiùschematicienoncontengonofontidi‘rumore’”.Saksidaecolleghihannousato
corpusdiben9linguediverse,evihannoapplicatoduediversimodellibasatisullaPT.
PrimadituttosonostaticalcolatiivaloridiPTinognipuntodelflussolinguisticopertuttiicorpus
usati,successivamenteèstataeffettuatala“segmentazione”conduediversimetodi.Ilprimosi
basavasullesoglieassolute:venivastabilitouncertovalorefissodiriferimentoperlaprobabilità
transizionalesottoalqualevenivaidentificatounbordo.Ilsecondometodoinvecesibasavasu
soglierelative:ibordicorrispondevanoaiminimilocalidellafunzionedellaPT.
Intuttiicasi,hannoosservatoSaksidaecolleghi,laprobabilitàtransizionalesièdimostratauno
strumentoefficaceperlasegmentazione(sivadal49%all’86%diparoleidentificate
correttamente),indipendentementedalmetododisegmentazioneusato.Questoneconferma
l’efficacia.Danotarecheentrambiimodellisisonodimostratimediamenteefficienti,lacosa
singolareperòèchequandounmodelloandavaparticolarmentebeneconunalingua,quello
alternativoalloraandavasempresignificativamentepeggio.
“Questo‘incrocio’cisuggeriscecheciascunmodelloèpiùadattoperalcunelinguedell’altroe
viceversa.Abbiamoquindicondottodelleanalisiulterioripercapirequalicaratteristichedella
linguadeterminanoilmodellomigliore”,haspiegatoSaksida.Ladimensionecrucialesièrivelata
ilritmolinguistico.“Possiamodividerelelingueeuropeeinduegrandigruppiperquelche
riguardailritmo:lelinguebasatesull’accento(stress-based)equellebasatesullesillabe(syllablebased)“.Lelinguebasatesull’accentohannomenovocalieparolepiùcorte,comel’inglese,lo
sloveno,iltedesco.Quellebasatesullesillabesonoinvecepiùricchedivocalieconleparolein
mediapiùlunghe,comeitaliano,spagnolo,finlandese.Ilterzogrupporitmicodellelingue,che
nonesisteinEuropaecheebassatosu“morae”(unpartedellasillaba),comegiapponese,si
chiama“mora-based”edeancorapiùriccadivocalidellelinguebassatesullesillabe.
Ilmetododellasogliaassolutaèrisultatofunzionaremegliosullelinguestress-based,mentrela
sogliarelativaèmiglioreperlemora-based.“Èpossibiledunquecheilsistemacognitivoimparia
usareilmetododisegmentazionemiglioreperlalinguamadre,cheporterebbedifficoltàperòcon
lelinguechenonappartengonoallastessacategoriaritmica.Servirannoovviamentestudi
sperimentaliperverificarequest’ipotesi.Sappiamodallaletteraturascientificacheibambini
subitodopodallanascitausanogiàl’informazionesulritmo,epensiamochelestrategieper
sceglierelasegmentazionepiùgiustapotrebberoessereunadelleareedovel’informazionesul
ritmoèpiùutile”.
Lostudioinfattinonpuòdireseilsistemacognitivo(siaadultochebambino)usidavveroquesto
tipodistrategie.“Ilnostrostudioconfermainmanierachiarachequestastrategiafunziona
attraversounampiospettrodilingue”,concludeSaksida.“Serviràoradaguidapergliesperimenti
inlaboratorio.”
LINKUTILI:
• Articolooriginale:http://goo.gl/cOk5VD
IMMAGINI:
• Crediti:Jev55(Flickr:https://goo.gl/yVVdJ3)
Contatti:
Ufficiostampa:
[email protected]
Tel:(+39)0403787644|(+39)366-3677586
viaBonomea,265
34136Trieste
MaggioriinformazionisullaSISSA:www.sissa.it