9 Le regole di formazione di lessemi Una regola di formazione di lessemi (d’ora in poi RFL) permette di derivare un nuovo lessema a partire da un lessema già esistente (o da due, nel caso della formazione di lessemi composti), attraverso un’operazione che ha effetti sintattici, semantici e fonologici. Ogni RFL specifica una classe di lessemi cui la regola può applicarsi, detti basi della regola, e un’uscita, cioè il tipo di lessema risultante dall’applicazione della regola a una base. Il significato dell’uscita è funzione del significato della base (o delle basi, nel caso di composti) combinato con il significato della regola; le regole di derivazione spesso, ma non sempre, introducono un affisso che si lega alla base; esistono anche regole, dette di conversione, che hanno effetti paragonabili a quelli di regole di suffissazione o prefissazione, ma non introducono nessun affisso (ad esempio, arrivo è derivato per conversione da arrivare, come partenza è derivato da partire tramite il suffisso -enza). Sul piano fonologico, l’applicazione di una RFL (di affissazione, di conversione o di composizione) può avere effetti più o meno rilevanti: si va dalla semplice concatenazione di base e affisso, a vari tipi di allomorfia che possono colpire sia la base che l’affisso. Le RFL sono soggette a restrizioni: non ogni affisso può unirsi a ogni base, come prova il giudizio di non grammaticalità che parlanti dell’italiano danno di fronte a parole come *bevista, *moritore, *danneggiazione, *alveolale. L’inaccettabilità di questi lessemi non dipende da una loro inconcepibilità semantica: potremmo parafrasare questi lessemi con sintagmi dotati di senso e interpretabili, quali, rispettivamente, «persona che beve», «persona che muore», «atto di danneggiare», «relativo agli alveoli», ed esistono altri lessemi che hanno questi significati e sono grammaticali: bevitore e beone, morente e moribondo, danneggiamento, alveolare. La sensazione di agrammaticalità che proviamo nei confronti dei lessemi che abbiamo asteriscato è dovuta al fatto che ciascuno di essi è stato costruito violando almeno una restrizione sulla RFL che introduce l’affisso che questi lessemi contengono. Illustreremo ora i tipi di restrizioni che si hanno sulle RFL, utilizzando esempi soprattutto di suffissazione, dato che la suffissazione è il procedimento di formazione dei lessemi più utilizzato in italiano (cfr. Thornton, Iacobini, Burani 1997, p. 80). Le restrizioni sulle RFL vengono di solito ricondotte ai diversi livelli di analisi linguistica: si possono individuare restrizioni fonologiche, morfologiche, sintattiche e semantiche (cfr. Aronoff 1976, p. 47 sgg., Booij 1977, pp. 120-143, Scalise 1994 pp. 108-118). In sostanza, qualunque informazione associata alla base può essere oggetto di restrizioni. Innanzitutto, i suffissi si attaccano solo a basi di una determinata categoria: ad esempio, il suffisso -ista si attacca a nomi, non a verbi, ed è per questo che un lessema come *bevista ci appare mal formato, anche se interpretabile. Per formare un nome di agente a partire da un verbo, si può usare il suffisso -tore, e infatti bevitore, nel senso di «persona che beve abitualmente, e/o eccessivamente» è un lessema ben formato. Tuttavia, si hanno restrizioni che vanno al di là di quella sulla categoria della base: i suffissi possono selezionare, tra le basi che appartengono a una certa categoria, solo quelle che presentano determinati tratti, ed escludere quelle che ne presentano altri. Ad esempio, -tore si attacca sì a verbi, ma non ai verbi il cui soggetto non ha le caratteristiche di Agente, tra cui morire, ed è per questo che il lessema moritore ci appare mal formato (cfr. Bisetto 1995). Gli studiosi oscillano nel classificare le restrizioni sui tratti della base come quella appena vista: secondo alcuni si tratta di una restrizione sintattica, secondo altri di una restrizione semantica, mentre altri ancora osservano che è difficile operare una distinzione netta tra sintassi e semantica a questo livello (cfr. Rainer 2004), e parlano di restrizioni sintattico-semantiche (cfr. Aronoff 1976, pp. 47-48, e Dovetto, Thornton, Burani 1998, pp. 455-456 per una discussione della questione). Oltre alle restrizioni sintattiche e semantiche, si hanno anche restrizioni chiamate solitamente morfologiche, tra le quali le più comuni riguardano l’impossibilità di certi suffissi di apparire dopo certi altri. Ad esempio, in italiano, sia -mento che -zione sono suffissi che si attaccano a verbi per formare nomi d’azione, e moltissimi verbi presentano derivati sia in -mento che in -zione; tuttavia, -zione non si attacca mai a verbi derivati con il suffisso -eggiare (per questo percepiamo *danneggiazione come lessema mal formato), mentre predilige i verbi derivati con i suffissi -izzare ed -ificare (nel GRADIT sono registrati 211 lemmi in -ificazione e ben 987 in -izzazione). Nel primo caso si tratta di una restrizione morfologica negativa (-zione non si attacca a verbi che contengono un determinato suffisso), nel secondo di una restrizione positiva (-zione predilige verbi che contengono determinati suffissi), chiamata anche potenziamento (potentiation, cfr. Aronoff 1983, p. 166). Le restrizioni morfologiche possono riguardare non solo la presenza di uno specifico elemento nella base, ma la struttura stessa della base: ad esempio, sembra che in italiano i verbi parasintetici1 in -ire formino nomi d’azione con il suffisso -mento e escludano -zione (cfr. Scalise 1983, p. 207). Aronoff (1976, pp. 51-52) classifica tra le restrizioni morfologiche anche quelle che hanno a che fare con i cosiddetti tratti di strato2: ad esempio, in inglese il suffisso -ity, che è parte del vocabolario inglese di origine latino-romanza, definito nel sistema di Aronoff dal tratto [+ latinate], e forma nomi di qualità a partire da aggettivi, si attacca solo ad aggettivi che siano anch’essi [+ latinate], mentre il suffisso -ness, semanticamente paragonabile, si attacca sia a basi [+ latinate] che a basi dello strato nativo, cioè a parole di origine germanica: esempi dell’operare di questa restrizione sono i diversi valori di grammaticalità di *happity, happiness, stupidity, stupidness. Infine, si hanno restrizioni di tipo fonologico: in italiano, il suffisso -ale che forma aggettivi a partire da nomi non si attacca a nomi la cui radice termini in /l/, ai quali deve attaccarsi l’allomorfo -are (per questo *alveolale ci appare mal formato, e diciamo invece alveolare); in inglese, il suffisso -y che forma ipocoristici (cioè vezzeggiativi di nomi propri) si attacca solo a basi monosillabiche, per cui sono ben formati ipocoristici come Billy, Tommy, Jimmy, ma non *Williamy, *Thomasy, *Jamesy. Un’ulteriore caratteristica delle RFL è che esse sono dotate di un certo grado di produttività, diverso da una regola all’altra. La definizione di produttività maggiormente condivisa è ancora quella proposta da Schultink (1961, p. 113, trad. mia): «la possibilità […] per gli utenti della lingua di formare non intenzionalmente attraverso un procedimento morfologico una quantità di nuove formazioni in linea di principio innumerevole». In pratica, una RFL è produttiva nella misura in cui si formano con essa nuovi lessemi («neologismi»), ed è tanto più produttiva quanti più neologismi forma. Recentemente, la possibiltà di effettuare ricerche su vasti corpora testuali su supporto elettronico ha permesso di elaborare un metodo matematico di calcolo della produttività (cfr. Baayen 1992, Gaeta e Ricca 2002, Gaeta e Ricca 2004). Il metodo è basato sostanzialmente sul conto del numero di lessemi morfologicamente complessi con una sola occorrenza in un vastissimo corpus testuale, quale per esempio un’intera annata di un quotidiano. Su un corpus di così vaste dimensioni, la probabilità che un lessema con una sola occorrenza (tecnicamente detto «hapax») sia un neologismo è molto alta (e in effetti che gli hapax rappresentino per lo più neologismi è stato dimostrato da Gaeta e Ricca (2002, pp. 227-229) attraverso una ricerca di tali lemmi sui più recenti dizionari dell’italiano). Dunque, maggiore il numero di hapax formati secondo una certa RFL in un determinato corpus, maggiore la produttività di quella regola. Ad esempio, su un corpus costituito da tre annate del quotidiano La Stampa, si hanno rispettivamente 486 e 402 hapax di nomi deverbali in -zione e -mento ma solo 29 hapax di nomi deverbali in -aggio, e 409 hapax di aggettivi deverbali in -bile ma solo 6 di aggettivi deverbali in -evole (Gaeta e Ricca 2004, Tavola 5).3 L’aspetto fonologico delle RFL e la Morphology by itself Sono detti parasintetici i verbi formati da una base nominale o aggettivale con l’aggiunta di un prefisso, come abbellire, atterrare, inaridire. 2 Così anche Booij (1977, pp. 131-139 ); Scalise (1994, pp. 115-116) considera invece le restrizioni che riguardano i tratti di strato un tipo di restrizione a sé. 3 Gaeta e Ricca (2002, 2003, 2004) forniscono dati quantitativi sulla produttività di diverse RFL dell’italiano, e propongono un adattamento migliorativo del metodo matematico di calcolo della produttività proposto da Baayen (1992). Per altri dati sull’italiano, elaborati con approcci quantitativi di vario tipo, cfr. anche Dovetto, Thornton, Burani 1998 e Thornton 1998. 1 La proposta di denominare le regole che permettono di formare nuovi lessemi «regole di formazione di lessemi» appare esplicitamente solo in Aronoff (1994, p. 7). Tradizionalmente queste regole sono state chiamate «regole di formazione delle parole» (in inglese word formation rules). Aronoff (1994, p. 7) osserva che l’uso di una denominazione contenente il termine ambiguo word (parola) ha dato luogo a un equivoco: poiché una definizione di parola largamente accettata è quella di forma libera minima (minimum free form, cfr. Bloomfield 1935 (19331), p. 178), alcuni autori hanno ritenuto che l’affermazione di Aronoff (1976) che le regole di formazione di parole sono «word-based» (basate su parole) andasse interpretata nel senso che le regole sono basate su forme libere (non quindi su radici o temi), mentre egli intendeva dire che sono basate su lessemi, senza però implicare che il lessema di base dovesse apparire nel derivato nella stessa forma che esso ha quando appare come forma libera. Una delle lingue sulla cui descrizione ha maggiormente pesato l’equivoco messo in luce da Aronoff 1994 è l’italiano. Nei suoi numerosi lavori sulla formazione dei lessemi (da lui denominata formazione delle parole) in italiano, Scalise (1983, 1984, 1990, 1994), partendo dal presupposto implicito che “basato su parole” significasse “basato su forme libere”, ha sviluppato un’analisi che cercava di risolvere alcuni aspetti problematici dell’aspetto fonologico della formazione di lessemi in italiano con un modello ispirato alla fonologia generativa. Vedremo qui di seguito alcune delle sue analisi, e il modo in cui si può render conto degli stessi fenomeni in un quadro di morphology by itself. I fenomeni che considereremo sono i seguenti: derivazione di nomi da nomi per suffissazione, derivazione di nomi da verbi, composti verbo-nome, derivazione di avverbi in -mente. Esempi dei fenomeni da trattare sono dati in (1): (1) a. derivazione di nomi da nomi GIORNALE GIORNALAIO b. derivazione di nomi da verbi VENDERE VENDITORE c. composti verbo-nome APPENDERE APPENDIABITI d. derivazione di avverbi in –mente CHIARO CHIARAMENTE L’analisi di questi fenomeni proposta da Scalise (1983, 1984, 1990, 1994) è riportata in (2). (2) Analisi di Scalise: a. base aggiunta di suffisso RCV uscita giornale +aio Ø giornalaio b. base aggiunta di suffisso RR e i vende +tore i c. d. uscita venditore base base RR e i uscita appende base aggiunta di suffisso RR o a uscita chiaro + abiti i appendiabiti +mente a chiaramente Nella derivazione di nomi da nomi si parte dalla forma di citazione del lessema nominale. Poiché praticamente tutti i nomi italiani hanno una forma di citazione che termina in vocale e tutti i suffissi italiani che si attaccano a nomi iniziano per vocale, si viene a creare una sequenza di due vocali atone, quella terminale della forma di citazione del nome e quella iniziale del suffisso. Interviene allora la RCV (regola di cancellazione di vocale, cfr. cap. 8, (2a)), che cancella la vocale terminale del nome. Nella derivazione di nomi da verbi e nella composizione con verbi, l’analisi di Scalise è più complessa. Partire dalla forma di citazione del verbo, cioè l’infinito, appare intuitivamente poco plausibile. Scalise sostiene allora in questo caso che si debba partire da una “parola astratta”, che si ottiene dalla parola concreta, cioè dalla forma di citazione del lessema verbale, secondo la formula in (3): (3) infinito meno -re Con parole astratte di questo tipo, la derivazione di nomi da verbi della prima e della terza coniugazione non presenta problemi: da “parole astratte” come lavora-, senti- si derivano nomi come lavoratore, sentimento. Con i verbi della seconda coniugazione si ha però un problema: la formula in (3) produce una “parola astratta” che termina in –e (vendere vende), mentre nei derivati il lessema verbale si presenta terminante in -i: si ha venditore, non *vendetore. Per risolvere questo problema, Scalise ipotizza che nella derivazione da verbi della seconda coniugazione si applichi una regola di riaggiustamento come (4): (4) e i (Scalise 1983, p. 79) Scalise non precisa ulteriormente i fattori condizionanti questa regola, ma dall’insieme della sua discussione del problema si può ipotizzare che si debba intendere che una /e/ che rappresenta la vocale finale di una “parola astratta” di categoria verbo diventa /i/ se seguita da un confine di morfema e da un suffisso derivazionale deverbale. La stessa regola si applica anche quando il verbo è seguito da un secondo membro di composto verbo+nome (cfr. (2c)). Anche nella derivazione di avverbi in -mente si applica una regola di riaggiustamento condizionata dal suffisso -mente, quale quella in (5): (5) oa /___+ mente Anche di questa regola non si trova una formulazione esplicita nelle opere di Scalise, ma dalla discussione condotta in Scalise et al. 1990, 1991 si può evincere che quella in (5) dovrebbe essere la formulazione della regola che Scalise ha in mente. Analisi alternativa In un modello di Morphology by itself, nel quale non è importante formulare regole a partire da un’unica forma base per ciascun lessema, e non è importante neppure che la forma base cui si applica una regola sia una forma libera, i dati del tipo di quelli in (1) possono essere analizzati in modo diverso, facendo ricorso alla nozione di stem, e senza bisogno di ipotizzare regole di riaggiustamento del tutto prive di motivazione fonetica o fonologica, quali quelle in (4) e (5). Vediamo in (6) queste analisi alternative. (6) a. derivazione di nomi da nomi Lessema GIORNALE Stem1 giornal Regola di suffissazione di -aio: Uscita giornalaio Stem1 + aio senza bisogno di alcun riaggiustamento b. derivazione di nomi da verbi Lessema VENDERE Stem1 vend Stem2 vende stemX vendi Regola di suffissazione di -tore Uscita venditore StemX + tore senza bisogno di alcun riaggiustamento c. composti verbo-nome Lessema APPENDERE Stem1 append Stem2 appende StemY appendi Regola di formazione di composti verbo+nome Uscita appendi+ nome StemY + nome d. derivazione di avverbi in –mente Lessema CHIARO Stem1 chiar Stem2 chiara Regola di suffissazione di –mente Uscita chiaramente Stem2 + mente Dalla presentazione schematica condotta fin qui può sembrare semplicemente che si sia scelto di ridurre le regole di riaggiustamento a prezzo di moltiplicare il numero di stems per ogni lessema. Ma le cose stanno diversamente. Le stems postulate sono necessarie in ogni caso per derivare diverse forme flesse dei lessemi, ed esprimere la base selezionata da un suffisso derivazionale in termini morfomici, cioè dichiarando quale stem dei lessemi il suffisso seleziona, permette di cogliere delle generalizzazioni. Una generalizzazione da moltissimo tempo nota è che il primo membro dei composti verbo-nome in italiano coincide formalmente con l’imperativo singolare dei lessemi verbali di base. Alcuni studiosi hanno quindi proposto che i composti verbo*nome siano formati a partire dall’imperativo. Questa analisi presenta però varie difficoltà: in particolare, è evidente che in questi composti non è presente il significato di “imperativo”. Vediamo dunque una possibile analisi alternativa. L’identità tra forma dell’imperativo e forma usata come primo membro dei composti si vede particolarmente bene nei casi in cui la forma dell’imperativo è distinta sia dalla forma di terza singolare del presente indicativo, sia dalla Stem2, sia dalla StemX che costituisce la base dei derivati deverbali. Si osservino i dati in (7), tratti da Rainer 2001, con aggiunte e adattamenti: (7) lessema Stem1 Stem2 PORTARE port porta 3.sg.pres.ind (basata su Stem1) porta TENDERE tend tende tende COPRIRE copr copri copre PULIRE pulisc puli pulisce StemX con esempio di derivato porta portatore tendi tenditore copri copritore puli pulitore imperativo singolare StemY porta porta portabagagli tendi tendicinghia copri copricapo pulisci puliscipenne tendi copri pulisci con esempio di composto Dai dati in (7), emergono le seguenti generalizzazioni: - la terza persona singolare del presente indicativo non coincide con la Stem2, ma è formata sulla Stem1 (cfr. l’analisi presentata nel capitolo 8); - la forma del lessema verbale che appare come base nei derivati con suffisso non coincide completamente né con Stem2 né con la terza persona singolare del presente indicativo (anche se in alcune coniugazioni coincide con l’una o con l’altra di queste entità): si deve quindi ipotizzare l’esistenza di una ulteriore Stem, che chiameremo StemX, usata come base per la derivazione con suffissi; - la forma dell’imperativo singolare non coincide completamente né con Stem2, né con la terza persona singolare del presente indicativo, né con StemX (anche se in alcune coniugazioni coincide con una o più di queste entità); - la forma del lessema verbale che appare come primo membro nei composti verbo+nome coincide sempre con la forma dell’imperativo singolare, e non coincide completamente né con Stem2, né con la terza persona singolare del presente indicativo, né con StemX (anche se in alcune coniugazioni coincide con una o più di queste entità). Si può quindi ipotizzare l’esistenza di una stem, che chiameremo StemY, usata come rappresentante del lessema verbale nei composti. La StemY è basata su Stem1, ed è formata da essa secondo le regole in (8): (8) Formazione di StemY a. StemY I coniugazione = Stem1+a b. StemY I coniugazione = Stem1+i Una volta stabilite le regole in (8), è possibile formulare anche le regole in (9): (9) a. imperativo singolare = b. forma del verbo nei composti = StemY StemY StemY realizza un morfoma, cioè occupa uno spazio nel paradigma delle forme flesse, derivate e composte di un verbo. Quanto abbiamo visto su StemY permette di illustrare anche altre proprietà delle Stem che finora non avevamo approfondito. In primo luogo, come si vede da (8), una Stem può essere derivata da un’altra: è per questo, tra l’altro, che nel capitolo 8 abbiamo evitato di chiamare “allomorfi” le diverse Stem di un lessema: adottando questa terminologia, si avrebbe la conseguenza paradossale che un elemento sarebbe allomorfo di un altro elemento dal quale è formato per derivazione. Le Stem non sono morfi, tra l’altro anche perché non necessariamente sono elementi minimi, potendo essere entità derivate da altre Stem. In alcuni casi una Stem può essere specificata nell’informazione lessicale associata a un certo lessema, in altri può essere derivata per regola. La Stem1 deve sempre essere specificata lessicalmente. Un’altra proprietà delle Stem che emerge chiaramente dalla discussione sulla StemY del verbo italiano è che le Stem non sono portatrici di un particolare significato, oltre al significato lessicale del verbo che realizzano: formulazioni come “la Stem dell’imperativo”, a volte usate, sono quindi fuorvianti, in quanto in realtà la StemY non porta in alcun modo il significato di imperativo; essa è usata tanto per realizzare l’imperativo quanto per formare i composti verbo+nome, la sua identità è definita dalla sua distribuzione nelle forme flesse di un verbo e nei suoi derivati e composti, non dal suo significato (non ne ha alcuno) né dalla sua forma fonologica (Stem che realizzano uno stesso morfoma in verbi diversi possono essere fonologicamente anche molto diverse le une dalle altre, e formate con operazioni fonologiche molto diverse a partire da un’altra Stem del lessema).