Modulo B I testi brevi 17. Collocazioni e polirematiche 25 maggio 2016 Linguistica italiana II Mirko Tavosanis A. a. 2015-2016 Entro giovedì 26 Eseguire le fasi preliminari della lavorazione, cioè: • Eseguire la normalizzazione delle lettere accentate e dei caratteri speciali, scrivendo in parallelo la nota sulle sostituzioni eseguite • Analizzare con READ-IT i singoli elaborati e il corpus nel suo assieme • Copiare i risultati della lemmatizzazione su fogli Excel • Copiare le statistiche riassuntive del singolo elaborato su fogli Excel Obiettivo: controllare entro giovedì 26 che non ci siano incertezze sulla lavorazione Aggiornamento sul corpus • Alcuni interventi sono stati eseguiti, ma adesso non è possibile restringere le interrogazioni in base alla L1 • Anche lo stemming è ancora attivo • Ci stiamo lavorando! Spero che nei prossimi giorni almeno le funzioni principali siano disponibili • Indirizzo di riferimento: http://corpusicon.fileli.unipi.it/ Lessico e grammatica • La differenza tra lessico e grammatica è un po’ meno rigida del modo in cui la vede la grammatica tradizionale – Alcune parole hanno «regole grammaticali» autonome – Alcune regole si applicano solo ad alcune parole • Per gli apprendenti (o per chi deve familiarizzare con un linguaggio settoriale) questi aspetti sono molto difficili da imparare • Esamineremo il problema dal punto di vista della «combinatoria» di una lingua Categorie a restrizioni crescenti • Lessico (in libera collocazione; ne abbiamo già parlato) • Collocazioni • Polirematiche (e da qui verso i modi di dire, i proverbi, le frasi fatte e i cliché…) I confini tra le categorie non sono molto chiari Per un primo orientamento, consiglio le voci Collocazioni e Polirematiche, parole dell’Enciclopedia dell’Italiano Treccani Anche on line: • http://www.treccani.it/enciclopedia/collocazioni_%28Enciclopediadell'Italiano%29/ • http://www.treccani.it/enciclopedia/parolepolirematiche_%28Enciclopedia-dell'Italiano%29/ Ai confini delle regole grammaticali Abbiamo visto i casi in cui l’uso dell’articolo è richiesto o vietato dalla lingua senza che ci siano ragioni chiare Problemi simili si pongono per situazioni simili: • Scelta delle preposizioni (perché si deve dire «è tempo di andare» invece di «è tempo per andare», come «è un buon momento per chiudere»?) • Scelta del verbo supporto (perché «lo rese famoso» invece di «lo fece famoso», come «ti fa bella»?) Collocazioni • Intuitivamente: le parole non si distribuiscono a caso in un testo, il lessico non si combina a caso • Dal punto di vista statistico, alcune parole compaiono assieme più di frequente rispetto a quanto non ci si aspetterebbe sulla base di una distribuzione casuale • Questa distribuzione si può spiegare sulla base di – regole grammaticali (piuttosto rigide): «il + cane» sarà più frequente di «il + aquila» – vincoli semantici: «costruire + case» sarà più frequente di «costruire alberi» – ragioni linguistiche (collocazioni): «mangiare + bene» sarà più frequente di «mangiare + a un buon livello qualitativo» • L’esame di questi fenomeni è stato incoraggiato dalla disponibilità di strumenti elettronici per il calcolo delle probabilità Indici matematici • Per il calcolo delle collocazioni esistono diversi sistemi, che forniscono valutazioni diverse • Il principio di base è comunque lo stesso: vedere se due (o più) parole adiacenti, o separate da un numero di parole deciso dal ricercatore, si presentano con una frequenza nettamente superiore rispetto a ciò che ci si aspetta da una distribuzione casuale del lessico Il CORIS / CODIS Lo strumento mette a disposizione online quattro sistemi di calcolo delle collocazioni: • Log-Likelihood Ratio • Mutual information, calcolata con la formula MI = 100 * log2 f(node,collocate)*DimCorpus / (f(node)*f(collocate)) particolarmente utile perché permette di isolare le parole piene! • T-score = 100 * (f(node,colloc) f(node)*f(colloc)/DimCorpus) / sqrt(f(node,colloc)) • Raw Frequency Fonte delle formule: M. Stubbs (1995), “Collocations and semantic profiles”, Functions of Language, 2, 1, pp. 23-5 Combinazioni preferenziali e collocazioni Simone (2006) distingue due livelli: • Combinazioni preferenziali • Collocazioni vere e proprie (che incorporano la propria testa e bloccano la sinonimia) Qui parleremo per entrambi i casi solo di «collocazioni» Il senso linguistico è un po’ diverso da quello puramente matematico: non si tratta di eventi definiti dalla probabilità ma di sequenze di cui è stata definita la natura Tratti identificativi delle collocazioni a. non-composizionalità: il significato di una collocazione non risulta dalla somma dei significati dei costituenti, ma presenta un elemento semantico aggiuntivo dato proprio dalla loro co-occorrenza (cfr. giornata nera, caffè nero, umore nero) b. non-sostituibilità: il costituente di una collocazione non può essere sostituito con un sinonimo (…) senza rischiare che si crei una combinazione inusuale o innaturale (cfr. umore nero rispetto a umore scuro); in altri termini, i sinonimi non possono scambiarsi liberamente; c. allo stesso tempo, possibilità di sostituire un collocato con un altro semanticamente analogo senza cambiare il senso della collocazione (cfr. dirimere una controversia e risolvere una controversia); d. relativa autonomia dei costituenti: a differenza delle espressioni idiomatiche, i componenti di una collocazione mantengono le proprie funzioni grammaticali anche variandone l’ordine (la guerra è scoppiata / è scoppiata la guerra), e tra il nodo (o base) e il collocato è sempre possibile inserire altre parole (cfr. la guerra che tanto si temeva è quindi scoppiata); e. inalterabilità semantica delle parole della collocazione: le parole mantengono il loro significato letterale. (Faloppa 2011) Tipi di collocazioni 1. verbo + articolo + nome (oggetto): «scattare una fotografia» 2. (articolo) + nome (soggetto) + verbo: «la situazione precipita» 3. nome + aggettivo: «nodo cruciale» 4. aggettivo + nome: «vasto orizzonte» 5. nome + nome: «parola chiave» 6. nome + preposizione + nome: «tavoletta di cioccolato» 7. avverbio + aggettivo: «diametralmente opposto» 8. verbo + avverbio: «rifiutare categoricamente» (Faloppa 2011) Polirematiche • Studiate soprattutto da Tullio De Mauro • Rispetto alle collocazioni hanno una maggiore rigidità • Si possono definire «parole polirematiche» perché in effetti svolgono funzioni assimilabili a quelle di una parola • Spesso i parlanti non riescono neanche a ricostruire i motivi per cui una polirematica ha quel significato: «luna di miele» non è una luna e non ha nulla a che fare con il miele – Il fenomeno è simile a quello che si ritrova nell’evoluzione del significato delle parole singole: oggi il parlante non riesce a ricondurre fegato al nome di un piatto (iecur ficatum) – In molte lingue questo è un procedimento normale di formazione delle parole: nel tedesco si arriva spesso all’uniformazione grafica (Weltanschauung invece di visione del mondo) • La categoria si sovrappone in buona parte a quella dei modi di dire: in pratica i modi di dire possono essere considerati polirematiche (e lo stesso vale per i proverbi) Differenza rispetto alle collocazioni • Le collocazioni possono essere facilmente modificate con: – inversioni – inserimento di altre parole all’interno dell’espressione («sono stati banditi cinque concorsi») • Le polirematiche tollerano molto meno questo tipo di interventi («una luna indiscutibilmente di miele»?) Rigidità per polirematiche a) non ammettono la sostituzione sinonimica dei costituenti interni (camera a gas → * stanza a gas) o la variazione per via di flessione, sia per quanto riguarda gli elementi che non sono testa del sintagma (fare acqua → *fare acque; gioco di carte → *gioco di carta), sia anche per lo stesso elemento testa (alte sfere → *alta sfera); b) non possono essere interrotte con l’interposizione di altre parole (casa di cura → *casa spaziosa di cura); c) non permettono dislocazioni (permesso di soggiorno → *è di soggiorno quel permesso?) o altri cambiamenti nell’ordine delle parole (alti e bassi → *bassi e alti); d) non consentono di pronominalizzare uno dei costituenti interni (prestare attenzione → *che cosa hai prestato? attenzione; cartone animato → *quelli animati sono i cartoni che mi piacciono di più). Tuttavia queste, più che regole assolute, sono tendenze. (Masini 2011) Rigidità decrescente Le polirematiche sono ammesse nel ruolo di diverse parti del discorso, ma la loro resistenza alle alterazioni è variabile. In ordine di resistenza decrescente: • Preposizioni («in preda a»), congiunzioni («al fine di») • Avverbi («all’aria aperta») e aggettivi («in erba») • Sostantivi («uscita di sicurezza») • Verbi («prender piede») Tipicamente, nel caso dei verbi il verbo si può coniugare («le abitudini presero piede», mentre nel caso dei sostantivi si può mettere al singolare o al plurale («uscite di sicurezza») (Masini 2011) Testa Il componente che determina le caratteristiche di un oggetto composto • Testa categoriale: determina la parte del discorso (le polirematiche possono appartenere a tutte le parti del discorso) • Testa semantica: determina il significato della parola (un «permesso di soggiorno» è un tipo di permesso, non un tipo di soggiorno) (Masini 2011) Sostantivi polirematici a. Nome + Aggettivo: «carta telefonica», «casa editrice», «anno accademico» b. b. Aggettivo + Nome: «prima serata», «doppio senso», «terzo mondo» c. Nome + Sintagma preposizionale: «punto di vista», «carta di credito», «mulino ad acqua» «A quest’elenco si potrebbero aggiungere, pur con qualche incertezza, le combinazioni Nome + Nome (punto vendita, viaggio lampo, treno merci). Tali strutture hanno però statuto incerto, poiché (proprio come i composti) non hanno elementi relazionali o di accordo, e allo stesso tempo sembrano presentare un grado di separabilità leggermente maggiore rispetto ai composti veri e propri (si veda un esempio come quello merci non è ancora partito, riferito a treno merci, che può essere accettabile). Dunque, probabilmente le combinazioni Nome + Nome costituiscono il punto di incontro tra le parole polirematiche e i composti veri e propri.» (Masini 2011) Aggettivi e avverbi polirematici Aggettivi polirematici a. Preposizione + Nome o Aggettivo: fuori stagione, in bianco b. b. Preposizione + Determinante + Nome o Aggettivo: alla mano, al verde Avverbi polirematici a. Preposizione + Nome o Aggettivo: a rate, a caldo b. Preposizione + Determinante + Nome o Aggettivo: sulla carta, al verde Aggettivi polirematici formati da binomi irreversibili a. Aggettivo + Congiunzione + Aggettivo: vero e proprio b. Nome + Congiunzione + Nome: acqua e sapone c. Verbo + Congiunzione + Verbo: usa e getta d. Preposizione + Nome + Congiunzione + Nome: senza arte né parte (Masini 2011) Oltre le polirematiche Oggi si riconoscono diverse categorie di verbi che contribuiscono in modo complesso alla definizione di un significato (molte sono state proposte da Raffaele Simone): • Verbi pronominali («prenderla male») • Verbi sintagmatici, con avverbio o altra prosecuzione («portare avanti») • Verbi supporto, in cui il significato è dato da un sostantivo o da un aggettivo e il verbo ha solo una funzione ausiliare («prendere coraggio»)