8 Morphology by itself Da tutto quello che abbiamo visto nei capitoli precedenti, si possono trarre alcune conclusioni sulle caratteristiche che dovrà avere un modello adeguato della costruzione delle forme flesse dei lessemi. In primo luogo, si è visto che non è possibile, in una gran quantità di casi, difendere modelli che prevedano un isomorfismo, una serie di corrispondenze biuniovoche, tra costituenti del significante (morfi) e costituenti del significato (tratti) di una forma flessa. Il modello basato sulla nozione di morfema, inteso come segno biplanare, associazione biunivoca di un significato e un significante, non riesce a spiegare molti fenomeni che si incontrano comunemente nella formazione delle forme flesse di numerose lingue. Da tempo si è perciò abbandonato il tentativo di spiegare la costituzione delle forme flesse come una concatenazione di morfemi (modello a entità e disposizioni), e si è passati a modelli cosiddetti a entità e processi, nei quali una forma flessa viene derivata da un’entità di base attraverso l’applicazione di un qualche processo. Il processo che si applica può essere, in qualche caso, un semplice processo di aggiunta, cioè di concatenazione di una nuova entità all’entità già data: in questi casi, non si coglie ancora una differenza sostanziale con il modello a entità e disposizioni. Ma in molti altri casi, il processo può portare ad alterare la struttura fonologica dell’entità di base non solo attraverso l’aggiunta di fonemi, ma anche attraverso la sostituzione o l’eliminazione di fonemi e/o l’aggiunta o la modifica di tratti prosodici,1 tutti fenomeni difficilmente descrivibili in un modello a entità e disposizioni. Un modello a entità e processi senza morfologia Un modello a entità e processi, però, non necessariamente incorpora quel livello di analisi specifico che chiamiamo livello morfologico. Sono stati proposti modelli a entità e processi che facevano uso esclusivamente di due livelli di analisi, quello sintattico e quello fonologico. Un modello di questo tipo è quello della fonologia generativa classica (esposto in Chomsky, Halle, 1968). Vediamo come sarebbero derivate alcune forme flesse verbali italiane in un modello di questo tipo. (1) Derivazione di amo, ama, amano, vedo, vede, vedono in fonologia generativa Lessema AMARE VEDERE Forma base ama vede a. Derivazione della prima persona singolare del presente indicativo base ama 1.sg.pres.ind. +o RCV Ø uscita amo b. +o Ø vedo Derivazione della terza persona singolare del presente indicativo base ama 3.sg.pres.ind. +Ø uscita ama 1 vede vede +Ø vede Esempi già visti: foot feet, platte plat, senti- sentì. 1 c. Derivazione della terza persona plurale del presente indicativo base ama 3.pl.pres.ind. +no RR e o --uscita amano vede +no o vedono Le derivazioni presentate funzionano nel modo seguente: ogni lessema è rappresentato da una forma di base (il tema verbale, costituito di radice più vocale tematica); a questa forma di base si aggiungono le desinenze specifiche della persona che si vuole derivare: -o per la prima persona singolare, zero per la terza persona singolare, -no per la terza persona plurale. Dopo l’aggiunta della desinenza, si applicano determinate regole fonologiche (dette regole di riaggiustamento), quali quelle illustrate in (2): (2) a. Regola di cancellazione di vocale (RCV) V[- acc] Ø / ___ + V “una vocale atona si cancella se è seguita da un confine di morfema e da un’altra vocale” b. Regola di riaggiustamento e o e o / ___+no “la vocale /e/ diventa /o/ se seguita dal morfo +no di terza persona plurale” Appare subito evidente che le due regole presentate in (2) hanno uno statuto abbastanza diverso. La regola (2a) è una regola che presenta una forte motivazione fonetica: in molte lingue operano regole che hanno come effetto quello di evitare la sequenza di due vocali atone in una stessa parola, per rendere le parole più vicine possibile a un’alternanza di C e V. Anche in italiano, una regola simile opera anche tra parole: si applica per esempio a sequenze di articolo terminante in vocale + nome iniziante in vocale, come quelle in (3): (3) la opera la amica la edera la isola l’opera l’amica l’edera l’isola Naturalmente ipotizzare l’operare della RCV (2a) nella derivazione della forma (1a) non è indispensabile; si potrebbe anche ipotizzare che la forma amo sia derivata per semplice aggiunta delle desinenza -o alla radice verbale am-, non al tema ama-; in questo modo, si eviterebbe di postulare l’applicazione di una regola della quale non si ha nessuna prova. Se si vuole render conto delle forme in (1a) senza ricorrere a RCV, però, si deve ipotizzare che il lessema verbale sia rappresentato in queste forme dalla radice e non dal tema. A questo punto si presenta però un altro problema: se ammettiamo che in alcune forme flesse (ad esempio quelle in (1a)) il lessema verbale è rappresentato dalla radice, e in altre (ad esempio quelle in (1b-c)) è rappresentato dal tema, perdiamo in economia: non abbiamo più una forma base unica per ciascun lessema, ma almeno due. Un’alternativa sarebbe naturalmente derivare tutte le forme in (1) da radici: ma questa soluzione realizzarebbe un’economia nelle forme base a prezzo di perdere economia nelle desinenze. Infatti, nell’analisi basata su temi proposta in (1) le desinenze di terza persona singolare e terza persona 2 plurale sono uguali per il verbo AMARE e per il verbo VEDERE, mentre in un’analisi basata su radici dovremmo ipotizzare un’allomorfia delle desinenze come quella rappresentata in (4): (4) a. desinenza di terza persona singolare: -a /am+___ -e /ved+___ b. desinenza di terza persona plurale: -ano /am+___ -ono /ved+___ Una soluzione come quella in (1) realizza invece la massima economia sia nelle forme base che nelle desinenze: opera con un’unica forma base per ciascun verbo, e con un unico insieme di desinenze per i due verbi. Anche questa soluzione ha però un prezzo: si economizza sul numero di entità che partecipano alla derivazione a prezzo di postulare l’intervento di numerose regole fonologiche, alcune delle quali decisamente ad hoc, cioè valide solo per un insieme limitato di dati. Ad esempio, la regola (2b) consiste in un processo fonologico senza paralleli nell’intera fonologia dell’italiano, l’arretramento e arrotondamento di /e/, che non è fondato su alcuna motivazione fonetica2: una sequenza /eno/ è infatti perfettamente ammissibile in italiano, come dimostra l’esistenza di parole come enorme, enoteca, meno, freno, baleno, fenomeno, prenotare, ecc. Una regola come (2b) è quindi ipotizzata al solo scopo di render conto di certe forme flesse verbali senza dover ricorrere a un’allomorfia delle basi (vede- per derivare vede e ved- per derivare vedono) o delle desinenze (-ano per derivare la terza plurale di AMARE dalla base am-, -ono per derivare la terza plurale di VEDERE dalla base ved-). La questione è empirica. Non si tratta tanto di decidere se sia preferibile (per scopi pratici, quali scrivere grammatiche implementabili computazionalmente, o per puro piacere estetico) operare con metodi che minimizzano l’allomorfia a prezzo di contenere molte regole cosiddette fonologiche (alcune delle quali sono pure regole di riaggiustamento prive della benché minima motivazione fonetica3), oppure con metodi che minimizzano il numero di regole a prezzo di un’esplosione dell’allomorfia (più di una forma base per ogni verbo, diverse desinenze in verbi diversi per uno stesso insieme di tratti di persona/numero e tempo/modo/aspetto). Si tratta invece di verificare se la scelta di una di queste due vie aiuti a scoprire fenomeni interessanti dell’organizzazione delle lingue, o invece oscuri certi fenomeni. La scelta di minimizzare l’allomorfia di base e moltiplicare le regole cosiddette fonologiche, percorsa per almeno un ventennio, non ha portato i risultati sperati: si sono invece moltiplicati studi che hanno sostenuto, sulla base di accurate analisi di ricchi insiemi di dati tratti da molte diverse lingue, che ci sono aspetti importanti della struttura delle lingue che vengono oscurati in un trattamento in cui la formazione delle forme flesse dei lessemi è spiegato esclusivamente tramite disposizione (sintattica) di entità e/o applicazione ad esse di processi fonologici. Morphology by itself: stems and inflectional classes I fatti che rendono necessario postulare l’esistenza di un livello di analisi linguistica diverso da quello fonologico, da quello sintattico e da quello semantico, che si aggiunge ad essi e senza il quale non è possibile spiegare certi fenomeni, possono essere raggruppati in due tipi: l’esistenza di classi di flessione, e l’esistenza di diverse forme base per uno stesso lessema, forme la cui distribuzione non è spiegabile in base a criteri esclusivamente semantici, sintattici o fonologici. Mentre la RCV, che cancella una vocale atona seguita da un’altra vocale, ha una motivazione fonetica, quella di evitare una sequenza di due vocali atone, rendendo i significanti più vicini all’ideale articolatorio e acustico costituito da alternanze tra vocali e consonanti (sillabe CV), e si applica in tanti altri casi in italiano (ad esempio, nei contesti in cui si ha elisione dell’articolo). 3 Diversi autori che hanno studiato fenomeni non spiegabili in un modello basato sulla minimizzazione dell’allomorfia hanno descritto in termini duri e anche ironici tale modello, basato su una “sometimes fanciful unique underlying representation invented by some generative phonologists” (Maiden, 1992, p. 285) e “marked by a fierce drive toward morphological invariance at all cost” che costringe a “phonological tours de force … ” (Aronoff, 1994, p. 9). 2 3 Il livello di analisi che permette di spiegare questio fatti è quello che possiamo chiamare autenticamente morfologico. Aronoff (1994), uno degli autori che più si sono dedicati allo studio delle proprietà e delle caratteristiche di questo livello, propone di chiamare questo livello “morphology by itself”, un’espressione che potremmo tradurre “morfologia in sé e per sé”. Vediamo ora qualche esempio di fenomeni morfologici “in sé e per sé”, non riducibili a fatti di ordine sintattico, semantico e fonologico. Stems Una prima serie di fenomeni morfologici “by itself” è data dalla distribuzione delle diverse forme che possono rappresentare un lessema nelle sue forme flesse o nei lessemi da esso derivati e con esso composti. Può venir spontaneo riformulare la frase precedente sostituendo all’espressione “distribuzione delle diverse forme che possono rappresentare un lessema” l’espressione più sintetica “distribuzione degli allomorfi di un lessema”. Tuttavia, per evitare di confondere nozioni che sono state sviluppate nell’ambito di modelli molto diversi del funzionamento di una lingua, eviteremo qui di usare il termine “allomorfo” per riferirci a queste entità,4 e adotteremo, per brevità (dato che l’espressione “le diverse forme che possono rappresentare un lessema” è piuttosto lunga e quindi scomoda da inserire in una struttura sintattica in funzione di soggetto o complemento) e in mancanza di meglio, il termine utilizzato da Aronoff, stem. Vediamo dunque alcuni fenomeni che hanno a che fare con la distribuzione delle stem di un lessema nelle sue forme flesse o derivate e che non possono essere spiegati in base a principi di ordine fonologico, sintattico o semantico. Si osservino i dati in (5), cioè le forme del presente indicativo di alcuni verbi italiani: (5) Paradigma del presente indicativo di alcuni verbi italiani FINIRE SEDERE USCIRE UDIRE ANDARE finisco siedo esco odo vado finisci siedi esci odi vai finisce siede esce ode va finiamo sediamo usciamo udiamo andiamo finite sedete uscite udite andate finiscono siedono escono odono vanno Ciascuno dei verbi in (5) è rappresentato, nelle forme del presente indicativo, da due diverse stem, come riepilogato in (6): (6) verbo stem1 stem2 FINIRE SEDERE USCIRE UDIRE ANDARE finiscsiedescodv(a(d))-5 finisedeusciudianda- La distribuzione delle due stem non è spiegabile in base fatti di ordine sintattico: la stem, quale che sia, occupa sempre la stessa posizione, prima della desinenza di persona/numero, in tutte le forme. Non è spiegabile neppure in base a fatti di ordine semantico: le due stem di ciascun verbo 4 Contro questo tipo di riformulazione mette in guardia lo stesso Aronoff, 1994, p. 181, nota 48. Il verbo ANDARE presenta un’ulteriore suddivisione all’interno della stem1; per ragioni di spazio non affronteremo qui questo problema; per il ragionamento condotto nel testo, quello che conta è confrontare la distribuzione di una stem di ANDARE che comincia con /v/ con quella della stem che comincia con /and/. 5 4 rappresentano altrettanto bene il significato lessicale del verbo, né è possibile ipotizzare che ciascuna di loro porti anche un significato aggiuntivo: non c’è infatti alcun elemento di significato comune alle tre persone del singolare e alla terza persona plurale, né c’è alcun significato comune alle prime due persone del plurale ad esclusione della terza. Una distribuzione di stems basata su criteri semantici, nel caso in cui ogni stem portasse, oltre al significato lessicale del verbo, anche un qualche significato grammaticale aggiuntivo (ad esempio, un certo valore della categoria di persona, o di quella di numero), darebbe luogo a paradigmi come quelli ipotetici illustrati in (7): (7) Ipotetici paradigmi con distribuzione delle stem governata semanticamente a. stem1 per il singolare, stem2 per il plurale odo odi ode UDIRE b. UDIRE c. UDIRE udiamo udite udono stem1 per la prima persona, stem2 per le altre persone odo udi ude odiamo udite udono stem1 per la terza persona, stem2 per le altre persone udo udi ode udiamo udite odono Una distribuzione di stem del tipo di quelle illustrate in (7) non è attestata in alcun verbo italiano. La distribuzione delle stem in (5) non è spiegabile neppure in base a criteri fonologici.6 Dunque la distribuzione delle diverse stem dei verbi italiani non è spiegabile in base a criteri né di ordine sintattico, né di ordine semantico, né di ordine fonologico. Eppure non si tratta di una distribuzione casuale: se la distribuzione fosse casuale, avremmo distribuzioni diverse in verbi diversi, e anche qualche caso di distribuzione come quella esemplificata in (8): (8) UDIRE UDIRE Distribuzioni non attestate udo odo odi udi ude ode odiamo udiamo udite odite odono udono Invece, ogni verbo italiano che presenti due diverse stem nelle forme del presente indicativo presenta una distribuzione di queste stem come quella in (5); altre ipotetiche distribuzioni possibili, come quelle casuali in (8) e quelle governate semanticamente in (7), non sono attestate. Dai dati fin qui illustrati, dobbiamo concludere che è necessario ipotizzare l’esistenza di un livello di analisi che renda conto della distribuzione delle stem nei paradigmi verbali italiani, che non è casuale e non è neanche spiegabile con rpincipi di ordine sintattico, semantico o fonologico. Questo livello è il livello morfologico “by itself”, che è dunque un livello di rappresentazione di informazione linguistica autonomo dagli altri tre. Uno dei fenomeni specifici di questo livello, come abbiamo appena visto, è rappresentato dal fatto che i lessemi vengono rappresentati in diverse forme flesse (o in diversi derivati e composti) da diverse stem: ogni stem compare in determinate celle di un paradigma, e/o in determinati tipi di derivati e composti. Lo spazio occupato da una stessa stem costituisce un’entità specifica del livello 6 Si sono fatti tentativi di spiegare questa distribuzione in base a criteri fonologici. Si è sostenuto che la stem1 appare in forme con desinenza atona, e la stem2 in forme con desinenza tonica. Questa spiegazione implica che le desinenze di seconda plurale siano analizzate come -ate, -ete, -ite, e non come -te, cioè che la vocale accentata delle forme di seconda plurale sia analizzata come parte della desinenza e non come parte della radice (altrimenti la desinenza della seconda plurale -te sarebbe una desinenza atona quanto la desinenza -no della terza plurale, che seleziona la stem1). Ci sono buoni motivi per considerare la vocale come parte della stem e non della desinenza (cfr. la discussione sulle vocali tematiche nel cap. 5). In ogni caso, anche se in questo caso la distribuzione delle stem risultasse riducibile a principi di ordine fonologico, si hanno molti altri casi in cui ciò non è possibile. 5 morfologico, denominata morfoma (Aronoff 1994), o classe di partizione (Pirrelli 2000). È importante capire che un morfoma è un’entità astratta, che non si identifica con una certa stem o con un certo modo di costituire una stem. Ad esempio, il morfoma che abbiamo definito stem1 nei paradigmi verbali italiani è realizzato in verbi diversi da entità fonologicamente molto diverse, e che hanno relazioni molto diverse l’una dall’altra con la stem2. Nei verbi come FINIRE, la stem1 può essere derivata dalla stem2 tramite aggiunta di -sc-; nei verbi come SEDERE la stem1 può essere derivata dalla stem2 tramite dittongamento della vocale; nel verbo ANDARE le due stem sono in relazione di suppletivismo forte; in verbi come UDIRE e USCIRE le due stem sono in relazione di suppletivismo debole: intrattengono una certa somiglianza fonologica tra di loro, ma presentano in ciascuna coppia una differenza vocalica priva di paralleli nel resto del lessico italiano. Dunque un morfoma è definibile solo in base alla sua distribuzione, e non in base alla sua forma fonologica (che può variare moltissimo da un verbo all’altro) né alla sua semantica (abbiamo visto che non ci sono elementi sematici comuni a tutte e sole le forme che presentano una stessa stem). Una caratteristica importante dei morfomi è che essi si comportano come entità attive nell’organizzazione dei paradigmi (con le parole di Maiden, 1992, p. 285: “an active, abstract structural property of morphological systems”). La prova di ciò è data da una serie di fatti diacronici. Consideriamo ad esempio il verbo italiano USCIRE: esso deriva dal latino EXIRE; dal punto di vista dell’evoluzione fonetica, le forme che presentano la stem usci- sono inspiegabili; una regolare evoluzione fonetica avrebbe potuto produrre solo forme come *esciamo, *escite, *escire, ecc. Lo sviluppo di una stem che presenta /u/ al posto di /e/ si spiega per effetto dell’influsso del sostantivo USCIO (< lat. tardo USTIUM < lat. OSTIUM “porta, apertura”): il significato del verbo, “andare fuori”, è infatti strettamente connesso con quello del nome, “porta, apertura attraverso cui si può andare fuori” (“si esce per l’uscio”, nella formulazione di Tekavčić, 1972, p. 273). Come spiegare, però, che il sostantivo USCIO non abbia avuto effetto sull’intero lessema verbale, ma solo su alcune sue forme? Perché continuiamo a dire esco, esci, esce, escono, e non diciamo *uscio, *usci, *usce, *usciono? Il fatto si spiega solo facendo ricorso alla nozione di morfoma: l’incrocio con il sostantivo USCIO è stato sfruttato, nel paradigma del verbo USCIRE, per la creazione di una stem1 che potesse realizzare un certo morfoma, e non per sostituire ogni stem del lessema verbale (cfr. Maiden 1995). I morfomi funzionano dunque attivamente nello strutturare l’organizzazione dei paradigmi. Per generare le forme flesse di un lessema è dunque necessario conoscere la distribuzione morfomica delle sue stem: non basta concatenare una forma base unica con le appropriate desinenze, applicando eventuali regole fonologiche. Classi di flessione Un altro aspetto dell’organizzazione delle lingue che non è riducibile a informazione di carattere fonologico, sintattico o semantico è rappresentato dall’esistenza delle classi di flessione. Solo l’appartenenza dei lessemi a diverse classi di flessione spiega la distribuzione di quelle che potremmo denominare allomorfie suppletive tra morfemi grammaticali. Si osservino i dati in (9): (9) Presente indicativo dei verbi AMARE e TEMERE AMARE TEMERE amo, ami, ama, amiamo, amate, amano temo, temi, teme, temiamo, temete, temono Possiamo confrontare i dati in (9) con gli ipotetici dati in (10): (10) Ipotetici presenti indicativi possibili dei verbi AMARE e TEMERE 6 a. b. c. d. e f. *amo, ami, ame, amiamo, amate, amano *amo, ami, ama, amiamo, amate, amono amo, ami, ama, amiamo, amate, amano *temo, temi, tema, temiamo, temete, temono *temo, temi, teme, temiamo, temete, temano temo, temi, teme, temiamo, temete, temono Come possiamo spiegare la non attestazione delle distribuzioni delle desinenze di terza persona esemplificate in (10a-b, d-e)? Osserviamo innanzitutto che la distribuzione delle due desinenze di terza persona singolare, -a e -e, e delle due desinenze di terza plurale, -ano e -ono, non è governata fonologicamente: entrambe possono occorrere dopo una stem che termina in /m/. La loro distribuzione non è governata neppure sintatticamente né semanticamente: si presentano entrambe dopo la stem, e entrambe le desinenze di ciascuna coppia realizzano (in modo amalgamato) gli stessi tratti di persona/numero. Da un certo punto di vista, la loro distribuzione non è governata neppure morfologicamente, nel senso che tutte le desinenze si presentano dopo una stem1, ma anche le forme non attestate in (10a-b, d-e) si presentano dopo una stem1, cioè non violano questa condizione (che sarebbe invece violata, per esempio, da forme come *amae, *temea, formate aggiungendo delle desinenze di terza singolare a una stem2). Se tutto questo è vero, come spiegare che le due desinenze di ciascuna coppia, completamente sinonime, sottoposte agli stessi condizionamenti fonologici e sintattici, e collocate dopo la stessa stem del verbo (la stem1), non siano in variazione libera? Se lo fossero, potremmo trovare verbi con tutte le distribuzioni elencate in (10), mentre troviamo solo verbi con la distribuzione in (10c) e (10f) (uguali a 9). La distribuzione delle desinenze di terza persona nel presente indicativo dei verbi italiani si spiega con un altro fattore che appartiene al livello della morfologia “by itself”: il fatto che i lessemi sono organizzati in classe di flessione. Le desinenze di terza persona sono selezionate non solo in base al loro significato, ma anche in base alla classe di flessione cui appartiene il lessema alla cui stem1 esse devono unirsi. L’occorrenza di una desinenza come -a è condizionata non solo da fattori sintattici (deve occorrere dopo la stem), semantici (deve occorrere in forme flesse di terza persona singolare), e morfomici (deve occorrere dopo una stem1), ma anche da un ulteriore fattore morfologico: deve occorrere in verbi della prima coniugazione. L’appartenenza di un lessema verbale a una coniugazione non correla con nessun fattore sintattico, semantico, o fonologico: appartengono alla prima coniugazione verbi di qualunque valenza (cfr. nevicare, camminare, amare, regalare), con i significati più svariati, e con ogni tipo di forma fonologica (le stem1 di verbi della prima coniugazione possono terminare in quasi qualunque fonema dell’italiano7: cfr. creare, striare, abituare, rubare, bucare, baciare, lasciare, badare, tifare, pagare, plagiare, calare, amare, sanare, sognare, rapare, arare, rasare, tritare, lavare, schizzare, utilizzare, cambiare, arcuare). D’altra parte, solo l’appartenenza del lessema (o della sua stem18) a una coniugazione può spiegare la distribuzione in (10) delle desinenze di terza persona: se un verbo seleziona -a nella terza singolare seleziona -ano nella terza plurale, e se seleziona -e nella terza singolare seleziona -ono nella terza plurale; altre combinazioni (-a, -ono; -e, -ano) non sono attestate. Dunque la coniugazione cui appartiene un verbo (più in generale, la classe di flessione cui appartiene un lessema) è un fattore ineliminabile che ha un ruolo nella generazione delle forme flesse di quel lessema, ed è un fattore che costituisce informazione propiamente morfologica, non riducibile a informazione di tipo né semantico, né sintattico né fonologico: è quindi un’altra componente della morfologia in sé e per sé. 7 Mancano verbi della prima coniugazione la cui stem1 termini in -a e in -o, ma verbi con stem1 in -a e in -o non si hanno neanche nelle altre coniugazioni. 8 Se ad appartenere a una certa classe di flessione siano i lessemi o le loro singole stem è un tema da discutere. Non lo faremo qui per motivi di spazio. 7