9 - Anna M. Thornton

9
Le regole di formazione di lessemi
Una regola di formazione di lessemi (d’ora in poi RFL) permette di derivare un nuovo lessema a
partire da un lessema già esistente (o da due, nel caso della formazione di lessemi composti),
attraverso un’operazione che ha effetti sintattici, semantici e fonologici. Ogni RFL specifica una
classe di lessemi cui la regola può applicarsi, detti basi della regola, e un’uscita, cioè il tipo di
lessema risultante dall’applicazione della regola a una base. Il significato dell’uscita è funzione del
significato della base (o delle basi, nel caso di composti) combinato con il significato della regola;
le regole di derivazione spesso, ma non sempre, introducono un affisso che si lega alla base;
esistono anche regole, dette di conversione, che hanno effetti paragonabili a quelli di regole di
suffissazione o prefissazione, ma non introducono nessun affisso (ad esempio, arrivo è derivato per
conversione da arrivare, come partenza è derivato da partire tramite il suffisso -enza). Sul piano
fonologico, l’applicazione di una RFL (di affissazione, di conversione o di composizione) può avere
effetti più o meno rilevanti: si va dalla semplice concatenazione di base e affisso, a vari tipi di
allomorfia che possono colpire sia la base che l’affisso.
Le RFL sono soggette a restrizioni: non ogni affisso può unirsi a ogni base, come prova il giudizio
di non grammaticalità che parlanti dell’italiano danno di fronte a parole come *bevista, *moritore,
*danneggiazione, *alveolale. L’inaccettabilità di questi lessemi non dipende da una loro
inconcepibilità semantica: potremmo parafrasare questi lessemi con sintagmi dotati di senso e
interpretabili, quali, rispettivamente, «persona che beve», «persona che muore», «atto di
danneggiare», «relativo agli alveoli», ed esistono altri lessemi che hanno questi significati e sono
grammaticali: bevitore e beone, morente e moribondo, danneggiamento, alveolare. La sensazione di
agrammaticalità che proviamo nei confronti dei lessemi che abbiamo asteriscato è dovuta al fatto
che ciascuno di essi è stato costruito violando almeno una restrizione sulla RFL che introduce
l’affisso che questi lessemi contengono. Illustreremo ora i tipi di restrizioni che si hanno sulle RFL,
utilizzando esempi soprattutto di suffissazione, dato che la suffissazione è il procedimento di
formazione dei lessemi più utilizzato in italiano (cfr. Thornton, Iacobini, Burani 1997, p. 80).
Le restrizioni sulle RFL vengono di solito ricondotte ai diversi livelli di analisi linguistica: si
possono individuare restrizioni fonologiche, morfologiche, sintattiche e semantiche (cfr. Aronoff
1976, p. 47 sgg., Booij 1977, pp. 120-143, Scalise 1994 pp. 108-118). In sostanza, qualunque
informazione associata alla base può essere oggetto di restrizioni. Innanzitutto, i suffissi si attaccano
solo a basi di una determinata categoria: ad esempio, il suffisso -ista si attacca a nomi, non a verbi,
ed è per questo che un lessema come *bevista ci appare mal formato, anche se interpretabile. Per
formare un nome di agente a partire da un verbo, si può usare il suffisso -tore, e infatti bevitore, nel
senso di «persona che beve abitualmente, e/o eccessivamente» è un lessema ben formato. Tuttavia,
si hanno restrizioni che vanno al di là di quella sulla categoria della base: i suffissi possono
selezionare, tra le basi che appartengono a una certa categoria, solo quelle che presentano
determinati tratti, ed escludere quelle che ne presentano altri. Ad esempio, -tore si attacca sì a verbi,
ma non ai verbi il cui soggetto non ha le caratteristiche di Agente, tra cui morire, ed è per questo
che il lessema moritore ci appare mal formato (cfr. Bisetto 1995). Gli studiosi oscillano nel
classificare le restrizioni sui tratti della base come quella appena vista: secondo alcuni si tratta di
una restrizione sintattica, secondo altri di una restrizione semantica, mentre altri ancora osservano
che è difficile operare una distinzione netta tra sintassi e semantica a questo livello (cfr. Rainer
2004), e parlano di restrizioni sintattico-semantiche (cfr. Aronoff 1976, pp. 47-48, e Dovetto,
Thornton, Burani 1998, pp. 455-456 per una discussione della questione). Oltre alle restrizioni
sintattiche e semantiche, si hanno anche restrizioni chiamate solitamente morfologiche, tra le quali
le più comuni riguardano l’impossibilità di certi suffissi di apparire dopo certi altri. Ad esempio, in
italiano, sia -mento che -zione sono suffissi che si attaccano a verbi per formare nomi d’azione, e
moltissimi verbi presentano derivati sia in -mento che in -zione; tuttavia, -zione non si attacca mai a
verbi derivati con il suffisso -eggiare (per questo percepiamo *danneggiazione come lessema mal
formato), mentre predilige i verbi derivati con i suffissi -izzare ed -ificare (nel GRADIT sono
registrati 211 lemmi in -ificazione e ben 987 in -izzazione). Nel primo caso si tratta di una
restrizione morfologica negativa (-zione non si attacca a verbi che contengono un determinato
suffisso), nel secondo di una restrizione positiva (-zione predilige verbi che contengono determinati
suffissi), chiamata anche potenziamento (potentiation, cfr. Aronoff 1983, p. 166). Le restrizioni
morfologiche possono riguardare non solo la presenza di uno specifico elemento nella base, ma la
struttura stessa della base: ad esempio, sembra che in italiano i verbi parasintetici1 in -ire formino
nomi d’azione con il suffisso -mento e escludano -zione (cfr. Scalise 1983, p. 207). Aronoff (1976,
pp. 51-52) classifica tra le restrizioni morfologiche anche quelle che hanno a che fare con i
cosiddetti tratti di strato2: ad esempio, in inglese il suffisso -ity, che è parte del vocabolario inglese
di origine latino-romanza, definito nel sistema di Aronoff dal tratto [+ latinate], e forma nomi di
qualità a partire da aggettivi, si attacca solo ad aggettivi che siano anch’essi [+ latinate], mentre il
suffisso -ness, semanticamente paragonabile, si attacca sia a basi [+ latinate] che a basi dello strato
nativo, cioè a parole di origine germanica: esempi dell’operare di questa restrizione sono i diversi
valori di grammaticalità di *happity, happiness, stupidity, stupidness. Infine, si hanno restrizioni di
tipo fonologico: in italiano, il suffisso -ale che forma aggettivi a partire da nomi non si attacca a
nomi la cui radice termini in /l/, ai quali deve attaccarsi l’allomorfo -are (per questo *alveolale ci
appare mal formato, e diciamo invece alveolare); in inglese, il suffisso -y che forma ipocoristici
(cioè vezzeggiativi di nomi propri) si attacca solo a basi monosillabiche, per cui sono ben formati
ipocoristici come Billy, Tommy, Jimmy, ma non *Williamy, *Thomasy, *Jamesy.
Un’ulteriore caratteristica delle RFL è che esse sono dotate di un certo grado di produttività,
diverso da una regola all’altra. La definizione di produttività maggiormente condivisa è ancora
quella proposta da Schultink (1961, p. 113, trad. mia): «la possibilità […] per gli utenti della lingua
di formare non intenzionalmente attraverso un procedimento morfologico una quantità di nuove
formazioni in linea di principio innumerevole». In pratica, una RFL è produttiva nella misura in cui
si formano con essa nuovi lessemi («neologismi»), ed è tanto più produttiva quanti più neologismi
forma. Recentemente, la possibiltà di effettuare ricerche su vasti corpora testuali su supporto
elettronico ha permesso di elaborare un metodo matematico di calcolo della produttività (cfr.
Baayen 1992, Gaeta e Ricca 2002, Gaeta e Ricca 2004). Il metodo è basato sostanzialmente sul
conto del numero di lessemi morfologicamente complessi con una sola occorrenza in un vastissimo
corpus testuale, quale per esempio un’intera annata di un quotidiano. Su un corpus di così vaste
dimensioni, la probabilità che un lessema con una sola occorrenza (tecnicamente detto «hapax») sia
un neologismo è molto alta (e in effetti che gli hapax rappresentino per lo più neologismi è stato
dimostrato da Gaeta e Ricca (2002, pp. 227-229) attraverso una ricerca di tali lemmi sui più recenti
dizionari dell’italiano). Dunque, maggiore il numero di hapax formati secondo una certa RFL in un
determinato corpus, maggiore la produttività di quella regola. Ad esempio, su un corpus costituito
da tre annate del quotidiano La Stampa, si hanno rispettivamente 486 e 402 hapax di nomi deverbali
in -zione e -mento ma solo 29 hapax di nomi deverbali in -aggio, e 409 hapax di aggettivi deverbali
in -bile ma solo 6 di aggettivi deverbali in -evole (Gaeta e Ricca 2004, Tavola 5).3
L’aspetto fonologico delle RFL e la Morphology by itself
Sono detti parasintetici i verbi formati da una base nominale o aggettivale con l’aggiunta di un prefisso, come
abbellire, atterrare, inaridire.
2
Così anche Booij (1977, pp. 131-139 ); Scalise (1994, pp. 115-116) considera invece le restrizioni che riguardano i
tratti di strato un tipo di restrizione a sé.
3
Gaeta e Ricca (2002, 2003, 2004) forniscono dati quantitativi sulla produttività di diverse RFL dell’italiano, e
propongono un adattamento migliorativo del metodo matematico di calcolo della produttività proposto da Baayen
(1992). Per altri dati sull’italiano, elaborati con approcci quantitativi di vario tipo, cfr. anche Dovetto, Thornton, Burani
1998 e Thornton 1998.
1
La proposta di denominare le regole che permettono di formare nuovi lessemi «regole di
formazione di lessemi» appare esplicitamente solo in Aronoff (1994, p. 7). Tradizionalmente queste
regole sono state chiamate «regole di formazione delle parole» (in inglese word formation rules).
Aronoff (1994, p. 7) osserva che l’uso di una denominazione contenente il termine ambiguo word
(parola) ha dato luogo a un equivoco: poiché una definizione di parola largamente accettata è quella
di forma libera minima (minimum free form, cfr. Bloomfield 1935 (19331), p. 178), alcuni autori
hanno ritenuto che l’affermazione di Aronoff (1976) che le regole di formazione di parole sono
«word-based» (basate su parole) andasse interpretata nel senso che le regole sono basate su forme
libere (non quindi su radici o temi), mentre egli intendeva dire che sono basate su lessemi, senza
però implicare che il lessema di base dovesse apparire nel derivato nella stessa forma che esso ha
quando appare come forma libera.
Una delle lingue sulla cui descrizione ha maggiormente pesato l’equivoco messo in luce da Aronoff
1994 è l’italiano. Nei suoi numerosi lavori sulla formazione dei lessemi (da lui denominata
formazione delle parole) in italiano, Scalise (1983, 1984, 1990, 1994), partendo dal presupposto
implicito che “basato su parole” significasse “basato su forme libere”, ha sviluppato un’analisi che
cercava di risolvere alcuni aspetti problematici dell’aspetto fonologico della formazione di lessemi
in italiano con un modello ispirato alla fonologia generativa.
Vedremo qui di seguito alcune delle sue analisi, e il modo in cui si può render conto degli stessi
fenomeni in un quadro di morphology by itself.
I fenomeni che considereremo sono i seguenti: derivazione di nomi da nomi per suffissazione,
derivazione di nomi da verbi, composti verbo-nome, derivazione di avverbi in -mente.
Esempi dei fenomeni da trattare sono dati in (1):
(1)
a. derivazione di nomi da nomi
GIORNALE

GIORNALAIO
b. derivazione di nomi da verbi
VENDERE

VENDITORE
c. composti verbo-nome
APPENDERE

APPENDIABITI
d. derivazione di avverbi in –mente

CHIARO
CHIARAMENTE
L’analisi di questi fenomeni proposta da Scalise (1983, 1984, 1990, 1994) è riportata in (2).
(2)
Analisi di Scalise:
a.
base
aggiunta di suffisso
RCV
uscita
giornale
+aio
Ø
giornalaio
b.
base
aggiunta di suffisso
RR e i
vende
+tore
i
c.
d.
uscita
venditore
base
base
RR e i
uscita
appende
base
aggiunta di suffisso
RR o a
uscita
chiaro
+ abiti
i
appendiabiti
+mente
a
chiaramente
Nella derivazione di nomi da nomi si parte dalla forma di citazione del lessema nominale. Poiché
praticamente tutti i nomi italiani hanno una forma di citazione che termina in vocale e tutti i suffissi
italiani che si attaccano a nomi iniziano per vocale, si viene a creare una sequenza di due vocali
atone, quella terminale della forma di citazione del nome e quella iniziale del suffisso. Interviene
allora la RCV (regola di cancellazione di vocale, cfr. cap. 8, (2a)), che cancella la vocale terminale
del nome.
Nella derivazione di nomi da verbi e nella composizione con verbi, l’analisi di Scalise è più
complessa. Partire dalla forma di citazione del verbo, cioè l’infinito, appare intuitivamente poco
plausibile. Scalise sostiene allora in questo caso che si debba partire da una “parola astratta”, che si
ottiene dalla parola concreta, cioè dalla forma di citazione del lessema verbale, secondo la formula
in (3):
(3)
infinito meno -re
Con parole astratte di questo tipo, la derivazione di nomi da verbi della prima e della terza
coniugazione non presenta problemi: da “parole astratte” come lavora-, senti- si derivano nomi
come lavoratore, sentimento. Con i verbi della seconda coniugazione si ha però un problema: la
formula in (3) produce una “parola astratta” che termina in –e (vendere  vende), mentre nei
derivati il lessema verbale si presenta terminante in -i: si ha venditore, non *vendetore. Per risolvere
questo problema, Scalise ipotizza che nella derivazione da verbi della seconda coniugazione si
applichi una regola di riaggiustamento come (4):
(4)
e i
(Scalise 1983, p. 79)
Scalise non precisa ulteriormente i fattori condizionanti questa regola, ma dall’insieme della sua
discussione del problema si può ipotizzare che si debba intendere che una /e/ che rappresenta la
vocale finale di una “parola astratta” di categoria verbo diventa /i/ se seguita da un confine di
morfema e da un suffisso derivazionale deverbale. La stessa regola si applica anche quando il verbo
è seguito da un secondo membro di composto verbo+nome (cfr. (2c)).
Anche nella derivazione di avverbi in -mente si applica una regola di riaggiustamento condizionata
dal suffisso -mente, quale quella in (5):
(5)
oa /___+ mente
Anche di questa regola non si trova una formulazione esplicita nelle opere di Scalise, ma dalla
discussione condotta in Scalise et al. 1990, 1991 si può evincere che quella in (5) dovrebbe essere la
formulazione della regola che Scalise ha in mente.
Analisi alternativa
In un modello di Morphology by itself, nel quale non è importante formulare regole a partire da
un’unica forma base per ciascun lessema, e non è importante neppure che la forma base cui si
applica una regola sia una forma libera, i dati del tipo di quelli in (1) possono essere analizzati in
modo diverso, facendo ricorso alla nozione di stem, e senza bisogno di ipotizzare regole di
riaggiustamento del tutto prive di motivazione fonetica o fonologica, quali quelle in (4) e (5).
Vediamo in (6) queste analisi alternative.
(6)
a. derivazione di nomi da nomi
Lessema
GIORNALE
Stem1
giornal
Regola di suffissazione di -aio:
Uscita
giornalaio
Stem1 + aio
senza bisogno di alcun riaggiustamento
b. derivazione di nomi da verbi
Lessema
VENDERE
Stem1
vend
Stem2
vende
stemX
vendi
Regola di suffissazione di -tore
Uscita
venditore
StemX + tore
senza bisogno di alcun riaggiustamento
c. composti verbo-nome
Lessema
APPENDERE
Stem1
append
Stem2
appende
StemY
appendi
Regola di formazione di composti verbo+nome
Uscita
appendi+ nome
StemY + nome
d. derivazione di avverbi in –mente
Lessema
CHIARO
Stem1
chiar
Stem2
chiara
Regola di suffissazione di –mente
Uscita
chiaramente
Stem2 + mente
Dalla presentazione schematica condotta fin qui può sembrare semplicemente che si sia scelto di
ridurre le regole di riaggiustamento a prezzo di moltiplicare il numero di stems per ogni lessema.
Ma le cose stanno diversamente. Le stems postulate sono necessarie in ogni caso per derivare
diverse forme flesse dei lessemi, ed esprimere la base selezionata da un suffisso derivazionale in
termini morfomici, cioè dichiarando quale stem dei lessemi il suffisso seleziona, permette di
cogliere delle generalizzazioni.
Una generalizzazione da moltissimo tempo nota è che il primo membro dei composti verbo-nome in
italiano coincide formalmente con l’imperativo singolare dei lessemi verbali di base. Alcuni
studiosi hanno quindi proposto che i composti verbo*nome siano formati a partire dall’imperativo.
Questa analisi presenta però varie difficoltà: in particolare, è evidente che in questi composti non è
presente il significato di “imperativo”. Vediamo dunque una possibile analisi alternativa.
L’identità tra forma dell’imperativo e forma usata come primo membro dei composti si vede
particolarmente bene nei casi in cui la forma dell’imperativo è distinta sia dalla forma di terza
singolare del presente indicativo, sia dalla Stem2, sia dalla StemX che costituisce la base dei
derivati deverbali. Si osservino i dati in (7), tratti da Rainer 2001, con aggiunte e adattamenti:
(7)
lessema
Stem1
Stem2
PORTARE
port
porta
3.sg.pres.ind
(basata
su
Stem1)
porta
TENDERE
tend
tende
tende
COPRIRE
copr
copri
copre
PULIRE
pulisc
puli
pulisce
StemX
con esempio di
derivato
porta
portatore
tendi
tenditore
copri
copritore
puli
pulitore
imperativo
singolare
StemY
porta
porta
portabagagli
tendi
tendicinghia
copri
copricapo
pulisci
puliscipenne
tendi
copri
pulisci
con esempio di
composto
Dai dati in (7), emergono le seguenti generalizzazioni:
- la terza persona singolare del presente indicativo non coincide con la Stem2, ma è formata sulla
Stem1 (cfr. l’analisi presentata nel capitolo 8);
- la forma del lessema verbale che appare come base nei derivati con suffisso non coincide
completamente né con Stem2 né con la terza persona singolare del presente indicativo (anche se in
alcune coniugazioni coincide con l’una o con l’altra di queste entità): si deve quindi ipotizzare
l’esistenza di una ulteriore Stem, che chiameremo StemX, usata come base per la derivazione con
suffissi;
- la forma dell’imperativo singolare non coincide completamente né con Stem2, né con la terza
persona singolare del presente indicativo, né con StemX (anche se in alcune coniugazioni coincide
con una o più di queste entità);
- la forma del lessema verbale che appare come primo membro nei composti verbo+nome coincide
sempre con la forma dell’imperativo singolare, e non coincide completamente né con Stem2, né con
la terza persona singolare del presente indicativo, né con StemX (anche se in alcune coniugazioni
coincide con una o più di queste entità). Si può quindi ipotizzare l’esistenza di una stem, che
chiameremo StemY, usata come rappresentante del lessema verbale nei composti.
La StemY è basata su Stem1, ed è formata da essa secondo le regole in (8):
(8)
Formazione di StemY
a.
StemY
I coniugazione
=
Stem1+a
b.
StemY
I coniugazione
=
Stem1+i
Una volta stabilite le regole in (8), è possibile formulare anche le regole in (9):
(9)
a.
imperativo singolare
=
b.
forma del verbo nei composti =
StemY
StemY
StemY realizza un morfoma, cioè occupa uno spazio nel paradigma delle forme flesse, derivate e
composte di un verbo. Quanto abbiamo visto su StemY permette di illustrare anche altre proprietà
delle Stem che finora non avevamo approfondito. In primo luogo, come si vede da (8), una Stem
può essere derivata da un’altra: è per questo, tra l’altro, che nel capitolo 8 abbiamo evitato di
chiamare “allomorfi” le diverse Stem di un lessema: adottando questa terminologia, si avrebbe la
conseguenza paradossale che un elemento sarebbe allomorfo di un altro elemento dal quale è
formato per derivazione. Le Stem non sono morfi, tra l’altro anche perché non necessariamente
sono elementi minimi, potendo essere entità derivate da altre Stem. In alcuni casi una Stem può
essere specificata nell’informazione lessicale associata a un certo lessema, in altri può essere
derivata per regola. La Stem1 deve sempre essere specificata lessicalmente. Un’altra proprietà delle
Stem che emerge chiaramente dalla discussione sulla StemY del verbo italiano è che le Stem non
sono portatrici di un particolare significato, oltre al significato lessicale del verbo che realizzano:
formulazioni come “la Stem dell’imperativo”, a volte usate, sono quindi fuorvianti, in quanto in
realtà la StemY non porta in alcun modo il significato di imperativo; essa è usata tanto per
realizzare l’imperativo quanto per formare i composti verbo+nome, la sua identità è definita dalla
sua distribuzione nelle forme flesse di un verbo e nei suoi derivati e composti, non dal suo
significato (non ne ha alcuno) né dalla sua forma fonologica (Stem che realizzano uno stesso
morfoma in verbi diversi possono essere fonologicamente anche molto diverse le une dalle altre, e
formate con operazioni fonologiche molto diverse a partire da un’altra Stem del lessema).