17. Collocazioni e polirematiche File

annuncio pubblicitario
Modulo B
I testi brevi
17. Collocazioni e
polirematiche
25 maggio 2016
Linguistica italiana II
Mirko Tavosanis
A. a. 2015-2016
Entro giovedì 26
Eseguire le fasi preliminari della lavorazione, cioè:
• Eseguire la normalizzazione delle lettere
accentate e dei caratteri speciali, scrivendo in
parallelo la nota sulle sostituzioni eseguite
• Analizzare con READ-IT i singoli elaborati e il
corpus nel suo assieme
• Copiare i risultati della lemmatizzazione su fogli
Excel
• Copiare le statistiche riassuntive del singolo
elaborato su fogli Excel
Obiettivo: controllare entro giovedì 26 che non ci
siano incertezze sulla lavorazione
Aggiornamento sul corpus
• Alcuni interventi sono stati eseguiti, ma adesso
non è possibile restringere le interrogazioni in
base alla L1
• Anche lo stemming è ancora attivo
• Ci stiamo lavorando! Spero che nei prossimi
giorni almeno le funzioni principali siano
disponibili
• Indirizzo di riferimento:
http://corpusicon.fileli.unipi.it/
Lessico e grammatica
• La differenza tra lessico e grammatica è un po’
meno rigida del modo in cui la vede la
grammatica tradizionale
– Alcune parole hanno «regole grammaticali» autonome
– Alcune regole si applicano solo ad alcune parole
• Per gli apprendenti (o per chi deve familiarizzare
con un linguaggio settoriale) questi aspetti sono
molto difficili da imparare
• Esamineremo il problema dal punto di vista della
«combinatoria» di una lingua
Categorie a restrizioni crescenti
• Lessico (in libera collocazione; ne abbiamo già
parlato)
• Collocazioni
• Polirematiche (e da qui verso i modi di dire, i
proverbi, le frasi fatte e i cliché…)
I confini tra le categorie non sono molto chiari
Per un primo orientamento, consiglio le voci Collocazioni e
Polirematiche, parole dell’Enciclopedia dell’Italiano Treccani
Anche on line:
• http://www.treccani.it/enciclopedia/collocazioni_%28Enciclopediadell'Italiano%29/
• http://www.treccani.it/enciclopedia/parolepolirematiche_%28Enciclopedia-dell'Italiano%29/
Ai confini delle regole grammaticali
Abbiamo visto i casi in cui l’uso dell’articolo è
richiesto o vietato dalla lingua senza che ci siano
ragioni chiare
Problemi simili si pongono per situazioni simili:
• Scelta delle preposizioni (perché si deve dire «è
tempo di andare» invece di «è tempo per
andare», come «è un buon momento per
chiudere»?)
• Scelta del verbo supporto (perché «lo rese
famoso» invece di «lo fece famoso», come «ti fa
bella»?)
Collocazioni
• Intuitivamente: le parole non si distribuiscono a caso in
un testo, il lessico non si combina a caso
• Dal punto di vista statistico, alcune parole compaiono
assieme più di frequente rispetto a quanto non ci si
aspetterebbe sulla base di una distribuzione casuale
• Questa distribuzione si può spiegare sulla base di
– regole grammaticali (piuttosto rigide):
«il + cane» sarà più frequente di «il + aquila»
– vincoli semantici:
«costruire + case» sarà più frequente di «costruire alberi»
– ragioni linguistiche (collocazioni):
«mangiare + bene» sarà più frequente di «mangiare + a un
buon livello qualitativo»
• L’esame di questi fenomeni è stato incoraggiato dalla
disponibilità di strumenti elettronici per il calcolo delle
probabilità
Indici matematici
• Per il calcolo delle collocazioni esistono diversi sistemi,
che forniscono valutazioni diverse
• Il principio di base è comunque lo stesso: vedere se
due (o più) parole adiacenti, o separate da un numero
di parole deciso dal ricercatore, si presentano con una
frequenza nettamente superiore rispetto a ciò che ci si
aspetta da una distribuzione casuale del lessico
Il CORIS / CODIS
Lo strumento mette a disposizione online quattro sistemi
di calcolo delle collocazioni:
• Log-Likelihood Ratio
• Mutual information, calcolata con la formula
MI = 100 * log2 f(node,collocate)*DimCorpus /
(f(node)*f(collocate))
particolarmente utile perché permette di isolare le
parole piene!
• T-score = 100 * (f(node,colloc) f(node)*f(colloc)/DimCorpus) / sqrt(f(node,colloc))
• Raw Frequency
Fonte delle formule: M. Stubbs (1995), “Collocations and
semantic profiles”, Functions of Language, 2, 1, pp. 23-5
Combinazioni preferenziali e collocazioni
Simone (2006) distingue due livelli:
• Combinazioni preferenziali
• Collocazioni vere e proprie (che incorporano la
propria testa e bloccano la sinonimia)
Qui parleremo per entrambi i casi solo di
«collocazioni»
Il senso linguistico è un po’ diverso da quello
puramente matematico: non si tratta di eventi
definiti dalla probabilità ma di sequenze di cui è
stata definita la natura
Tratti identificativi delle collocazioni
a.
non-composizionalità: il significato di una collocazione non risulta
dalla somma dei significati dei costituenti, ma presenta un elemento
semantico aggiuntivo dato proprio dalla loro co-occorrenza (cfr.
giornata nera, caffè nero, umore nero)
b. non-sostituibilità: il costituente di una collocazione non può essere
sostituito con un sinonimo (…) senza rischiare che si crei una
combinazione inusuale o innaturale (cfr. umore nero rispetto a umore
scuro); in altri termini, i sinonimi non possono scambiarsi liberamente;
c. allo stesso tempo, possibilità di sostituire un collocato con un altro
semanticamente analogo senza cambiare il senso della collocazione
(cfr. dirimere una controversia e risolvere una controversia);
d. relativa autonomia dei costituenti: a differenza delle espressioni
idiomatiche, i componenti di una collocazione mantengono le proprie
funzioni grammaticali anche variandone l’ordine (la guerra è
scoppiata / è scoppiata la guerra), e tra il nodo (o base) e il collocato è
sempre possibile inserire altre parole (cfr. la guerra che tanto si
temeva è quindi scoppiata);
e. inalterabilità semantica delle parole della collocazione: le parole
mantengono il loro significato letterale.
(Faloppa 2011)
Tipi di collocazioni
1. verbo + articolo + nome (oggetto): «scattare una
fotografia»
2. (articolo) + nome (soggetto) + verbo: «la
situazione precipita»
3. nome + aggettivo: «nodo cruciale»
4. aggettivo + nome: «vasto orizzonte»
5. nome + nome: «parola chiave»
6. nome + preposizione + nome: «tavoletta di
cioccolato»
7. avverbio + aggettivo: «diametralmente opposto»
8. verbo + avverbio: «rifiutare categoricamente»
(Faloppa 2011)
Polirematiche
• Studiate soprattutto da Tullio De Mauro
• Rispetto alle collocazioni hanno una maggiore rigidità
• Si possono definire «parole polirematiche» perché in effetti
svolgono funzioni assimilabili a quelle di una parola
• Spesso i parlanti non riescono neanche a ricostruire i motivi
per cui una polirematica ha quel significato: «luna di miele»
non è una luna e non ha nulla a che fare con il miele
– Il fenomeno è simile a quello che si ritrova nell’evoluzione del
significato delle parole singole: oggi il parlante non riesce a ricondurre
fegato al nome di un piatto (iecur ficatum)
– In molte lingue questo è un procedimento normale di formazione delle
parole: nel tedesco si arriva spesso all’uniformazione grafica
(Weltanschauung invece di visione del mondo)
• La categoria si sovrappone in buona parte a quella dei modi
di dire: in pratica i modi di dire possono essere considerati
polirematiche (e lo stesso vale per i proverbi)
Differenza rispetto alle collocazioni
• Le collocazioni possono essere facilmente
modificate con:
– inversioni
– inserimento di altre parole all’interno dell’espressione («sono
stati banditi cinque concorsi»)
• Le polirematiche tollerano molto meno questo tipo
di interventi («una luna indiscutibilmente di
miele»?)
Rigidità per polirematiche
a) non ammettono la sostituzione sinonimica dei costituenti interni
(camera a gas → * stanza a gas) o la variazione per via di flessione,
sia per quanto riguarda gli elementi che non sono testa del
sintagma (fare acqua → *fare acque; gioco di carte → *gioco di
carta), sia anche per lo stesso elemento testa (alte sfere → *alta
sfera);
b) non possono essere interrotte con l’interposizione di altre parole
(casa di cura → *casa spaziosa di cura);
c) non permettono dislocazioni (permesso di soggiorno → *è di
soggiorno quel permesso?) o altri cambiamenti nell’ordine delle
parole (alti e bassi → *bassi e alti);
d) non consentono di pronominalizzare uno dei costituenti interni
(prestare attenzione → *che cosa hai prestato? attenzione; cartone
animato → *quelli animati sono i cartoni che mi piacciono di più).
Tuttavia queste, più che regole assolute, sono tendenze.
(Masini 2011)
Rigidità decrescente
Le polirematiche sono ammesse nel ruolo di diverse parti
del discorso, ma la loro resistenza alle alterazioni è
variabile. In ordine di resistenza decrescente:
• Preposizioni («in preda a»), congiunzioni («al fine di»)
• Avverbi («all’aria aperta») e aggettivi («in erba»)
• Sostantivi («uscita di sicurezza»)
• Verbi («prender piede»)
Tipicamente, nel caso dei verbi il verbo si può coniugare
(«le abitudini presero piede», mentre nel caso dei
sostantivi si può mettere al singolare o al plurale
(«uscite di sicurezza»)
(Masini 2011)
Testa
Il componente che determina le caratteristiche di un
oggetto composto
• Testa categoriale: determina la parte del discorso (le
polirematiche possono appartenere a tutte le parti del
discorso)
• Testa semantica: determina il significato della parola
(un «permesso di soggiorno» è un tipo di permesso,
non un tipo di soggiorno)
(Masini 2011)
Sostantivi polirematici
a. Nome + Aggettivo: «carta telefonica», «casa
editrice», «anno accademico»
b. b. Aggettivo + Nome: «prima serata», «doppio senso»,
«terzo mondo»
c. Nome + Sintagma preposizionale: «punto di vista»,
«carta di credito», «mulino ad acqua»
«A quest’elenco si potrebbero aggiungere, pur con qualche
incertezza, le combinazioni Nome + Nome (punto vendita, viaggio
lampo, treno merci). Tali strutture hanno però statuto incerto, poiché
(proprio come i composti) non hanno elementi relazionali o di
accordo, e allo stesso tempo sembrano presentare un grado di
separabilità leggermente maggiore rispetto ai composti veri e propri
(si veda un esempio come quello merci non è ancora partito, riferito a
treno merci, che può essere accettabile). Dunque, probabilmente le
combinazioni Nome + Nome costituiscono il punto di incontro tra le
parole polirematiche e i composti veri e propri.»
(Masini 2011)
Aggettivi e avverbi polirematici
Aggettivi polirematici
a. Preposizione + Nome o Aggettivo: fuori stagione, in
bianco
b. b. Preposizione + Determinante + Nome o Aggettivo:
alla mano, al verde
Avverbi polirematici
a. Preposizione + Nome o Aggettivo: a rate, a caldo
b. Preposizione + Determinante + Nome o Aggettivo:
sulla carta, al verde
Aggettivi polirematici formati da binomi irreversibili
a. Aggettivo + Congiunzione + Aggettivo: vero e proprio
b. Nome + Congiunzione + Nome: acqua e sapone
c. Verbo + Congiunzione + Verbo: usa e getta
d. Preposizione + Nome + Congiunzione + Nome: senza
arte né parte (Masini 2011)
Oltre le polirematiche
Oggi si riconoscono diverse categorie di verbi che
contribuiscono in modo complesso alla definizione di un
significato (molte sono state proposte da Raffaele
Simone):
• Verbi pronominali («prenderla male»)
• Verbi sintagmatici, con avverbio o altra prosecuzione
(«portare avanti»)
• Verbi supporto, in cui il significato è dato da un
sostantivo o da un aggettivo e il verbo ha solo una
funzione ausiliare («prendere coraggio»)
Scarica