1 Parola Tradizionalmente, la morfologia è definita come la disciplina che studia la struttura interna delle parole. La sua esistenza è quindi fondata sull’esistenza delle parole. È allora necessario definire che cos’è una parola. Sulla definizione di “parola” si sono versati fiumi di inchiostro. Molti linguisti si sono dedicati all’analisi di questa nozione, mettendo in luce diversi elementi che senz’altro devono essere presi in considerazione quando si cerca di dare una definizione di questa entità. Di fatto non si è giunti a una definizione assoluta, universalmente valida e accettata, ma si sono evidenziati diversi elementi che contribuiscono alla definibilità di questa nozione. Un elemento importante è il fatto che i parlanti delle lingue di solito hanno una nozione intuitiva di parola, che permette loro di compiere operazioni come scandire un enunciato parola per parola, contare le parole che compongono un enunciato, fare elenchi di parole con una data caratteristica. Ma la parola parola è in realtà usata dai parlanti con valori diversi in contesti diversi. Per impostare uno studio scientifico della nozione di parola è necessario rendersi conto di questi diversi valori che la parola parola ha nel nostro uso comune, preteorico, e poi imparare ad utilizzare dei termini tecnici per nominare in modo diverso ciascuno dei diversi valori identificati.1 1.1. Occorrenze Partiamo da un semplice esercizio. Esaminiamo la frase (1): (1) Gli amici dei miei amici sono miei amici. Quante parole ci sono in questa frase? Una prima risposta può essere “8”. La risposta “8” non è né esatta né errata: è una delle risposte possibili, che ci permette di identificare un primo senso della parola parola nel nostro uso comune. 1 In questa sede non trattiamo dei diversi criteri che sono stati proposti per determinare se una certa sequenza costituisce una parola o un’entità linguistica di livello inferiore o superiore alla parola. Ad esempio, il criterio dell’essere enunciabile in isolamento, preceduto e seguito da pause, e del poter costituire un enunciato, permette di distinguere una parola, come questo, da una sua sottoparte, come -o. (Sottoparti di una parola sono enunciabili in isolamento solo quando si producono enunciati con funzione metalinguistica). Ma ovviamente sono enunciabili in isolamento anche sintagmi, come questo ragazzo. Per distinguere tra una parola e un sintagma si ricorre allora al criterio della non interrompibilità: in un sintagma posso di norma inserire del materiale (altre parole) tra due elementi, in una parola no: poiché posso dire questo bravo ragazzo, questo povero ragazzo, interrompendo la sequenza questo ragazzo, tale sequenza non è una parola. Non posso invece interrompere la sequenza questo inserendo in essa altro materiale (*que-ragazzo-sto, *questragazz-o, ecc.), e ciò dimostra che questo è in italiano una parola. Lo stesso vale per parole come pescecane: benché, a differenza di questo, la parola pescecane sia in qualche senso formata da due parole, essa costituisce comunque una parola unica, in quanto non è interrompibile: * pesce-feroce-cane / pescecane feroce. Per una trattazione introduttiva sui criteri che permettono di discriminare fra parole e sequenze che non sono parole, cfr. Donati (2002, cap. 1), Simone (1990, cap. 5.6); più approfondita la trattazione in Lyons (1975, cap. 5.4). Chi ha dato questa risposta ha contato gli elementi che si presentano, nella rappresentazione ortografica della frase, come una sequenza continua di lettere isolata da due spazi bianchi, o da uno spazio bianco e un altro separatore. Sono separatori, oltre allo spazio bianco, i segni di interpunzione e l’apostrofo. Nella frase (1) l’ultima parola è preceduta da uno spazio bianco, ma è seguita da un punto (<.>), non da un altro spazio bianco: nel contare le parole della frase, l’abbiamo comunque contata come una parola; lo stesso avremmo fatto con la parola amico se l’avessimo trovata nella sequenza l’amico. Per riferirci alla parola intesa come elemento compreso tra due separatori in un testo scritto possiamo usare il termine tecnico parola grafica. Ma la nozione di parola grafica non esaurisce i valori che la parola parola può avere nell’uso comune. Alcuni lettori, alla domanda posta poco fa, avranno risposto “5”. Anche questa risposta non è in assoluto né giusta né sbagliata, ma permette di cogliere un altro senso della parola parola. Chi ha risposto “5” ha osservato che alcune parole grafiche si ripetono nella frase più di una volta: amici si ripete tre volte, e miei due volte. In termini tecnici, possiamo dire che amici ricorre o occorre tre volte, e miei ricorre o occorre due volte nella frase (1). Nella frase (1) abbiamo quindi otto occorrenze di cinque diverse parole grafiche. 1.2. Lessemi Possiamo ora fare un secondo esercizio: cerchiamo su un vocabolario della lingua italiana le parole che compongono la frase (1). Ci accorgeremo subito che per compiere questa operazione non possiamo semplicemente cercare sul vocabolario, al loro posto in ordine alfabetico, le diverse parole grafiche che abbiamo identificato: non ne troveremmo nemmeno una. Abbiamo imparato a scuola che per cercare una parola sul vocabolario dobbiamo sempre prima compiere un’operazione: ricondurre la parola che abbiamo davanti alla sua forma di citazione. In pratica, nel nostro caso, dobbiamo ricondurre gli a IL, amici ad AMICO, miei a MIO, sono a ESSERE (di dei tratteremo fra breve). Questa operazione si basa sul riconoscimento del fatto che tra amici e amico (così come tra gli e il, sono e essere, ecc.) c’è una relazione particolare: si tratta, detto in termini non tecnici, di due forme della stessa parola. In termini tecnici, diciamo che amici e amico sono due forme flesse di uno stesso lessema, AMICO. Il concetto di lessema ci permette di cogliere un altro dei sensi in cui nel parlare comune usiamo la parola parola. Un lessema è un elemento dotato di un significato lessicale (ad esempio, AMICO significa “persona con cui si ha un legame di affetto, di amicizia”), che appartiene a una certa classe di parole (per esempio, IL è un articolo, ESSERE è un verbo, ecc.; cfr. cap. 2.1), ed è rappresentabile da una o più forme (ad esempio, IL è rappresentabile da il, lo, gli, ecc.; ESSERE è rappresentabile da sono, sei, era, saremmo, ecc.). Il lessema è un’unità di un livello più astratto di quello al quale appartengono le sue diverse forme: il significato del lessema AMICO è indipendente dal fatto che in certi enunciati esso sia usato nella forma flessa singolare amico e in altri nella forma flessa plurale amici. È importante inoltre distinguere sempre tra il lessema AMICO, che è un’entità astratta, e la forma flessa maschile singolare amico, che è un’entità meno astratta. Nei vocabolari le informazioni su un determinato lessema sono riportate in una voce (tecnicamente un lemma) che è ordinata alfabeticamente in base a una sola forma del lessema, detta forma di citazione. Le tradizioni grammaticali e lessicografiche di diverse lingue possono differire nella scelta delle forme flesse da usare come forme di citazione: per esempio, in italiano si usa il singolare dei nomi, il maschile singolare degli aggettivi, l’infinito dei verbi; in latino e greco, per i verbi si usa la prima persona singolare del presente indicativo; in arabo, per i verbi si usa la terza persona singolare del perfetto maschile. Ricapitoliamo quanto abbiamo appreso finora: nella frase (1) si presentano cinque diverse parole grafiche: gli, amici, dei, miei, sono. La parola grafica amici ha tre occorrenze, e la parola grafica miei ha due occorrenze. Queste parole grafiche rappresentano forme flesse di diversi lessemi, sui quali un vocabolario fornisce informazioni in entrate ordinate alfabeticamente in base a una delle forme del lessema, scelta come forma di citazione. Per convenzione, i lessemi si indicano scrivendo in maiuscoletto la loro forma di citazione, come abbiamo già fatto nel paragrafo precedente. Possiamo quindi dire anche che nella frase (1) abbiamo tre occorrenze della forma flessa amici del lessema AMICO, un’occorrenza della forma flessa sono del lessema ESSERE, ecc. inserire discorso su LESSICO 1.3. Forme flesse e “forme contestuali” Nello svolgere l’esercizio proposto all’inizio del par. 1.2 qualcuno si sarà chiesto: di quale lessema è forma la parola dei? Questa parola grafica rappresenta un caso nuovo, che non abbiamo ancora trattato. Come parlanti dell’italiano, sappiamo che dei è una entità (detta tradizionalmente preposizione articolata) che nasce dall’unione della preposizione di con l’articolo i. Si tratta quindi di una parola grafica che unisce in sé forme di due diversi lessemi: DI e IL. Dunque non sempre c’è una corrispondenza 1:1 tra parole grafiche e forme, né tra parole grafiche e lessemi: a volte una parola grafica riunisce in sé più di una forma, e rimanda quindi a più di un lessema. Dei rappresenta un caso nuovo anche per un altro motivo. Non solo dei incorpora in un’unica parola grafica forme di due lessemi diversi, DI e IL, ma ci presenta anche un nuovo tipo di forma di un lessema, la forma de- del lessema DI, che però non è corretto chiamare forma flessa (mentre è corretto chiamare i forma flessa di IL, amici forma flessa di AMICO, ecc.). Le forme flesse di uno stesso lessema esprimono il significato lessicale del lessema in combinazione con uno o più significati grammaticali: ad esempio, in italiano un nome deve esprimere un significato grammaticale di numero; i valori della categoria di numero nella grammatica dell’italiano sono due, singolare e plurale; ogni nome usato in un enunciato italiano sarà necessariamente o singolare o plurale: il lessema AMICO si presenterà necessariamente nella forma flessa singolare amico o nella forma flessa plurale amici, non potrà non presentarsi in una di queste due forme. La variazione di forma che si ha tra amico e amici è quindi collegata a una variazione di significato grammaticale: in generale, le forme flesse di uno stesso lessema differiscono per i loro significati grammaticali, mentre conservano un comune significato lessicale. Ci sono però anche casi in cui una differenza tra due forme di uno stesso lessema non è riconducibile a una differenza di significato grammaticale: ad esempio, l’articolo determinativo maschile italiano IL ha tre forme di maschile singolare, il, lo e l’, e due forme di maschile plurale, i e gli, e l’articolo indeterminativo inglese ha due forme di singolare, a e an. La differenza tra queste forme non sta nel loro significato grammaticale: il, lo e l’ sono tutti e tre articoli determinativi maschili singolari, sia i che gli sono articoli determinativi maschili plurali, e sia a che an sono articoli indeterminativi singolari. La distribuzione di queste forme dunque non è governata dal significato grammaticale delle parole cui l’articolo si riferisce, ma dalla struttura fonologica della parola che segue. In italiano, si usa l’ al maschile singolare e gli al maschile plurale davanti a parole che cominciano per vocale; lo al singolare e gli al plurale davanti a parole che cominciano per /j/, per /s/ seguita da consonante (detta “s impura” nella terminologia tradizionale), per una delle consonanti / ts dz /2, e per /ks/ (graficamente <x>) e altri nessi consonantici presenti solo in parole dotte o di origine straniera, quali /pn/, /kt/3; con parole che cominciano per /w/ si usa gli al plurale e l’ al singolare con parole del lessico italiano tradizionale (l’uomo, l’uovo…) ma si usano i al plurale e il al singolare con parole che sono state recentemente prese a prestito (il walkman, il whisky); nei casi restanti si usa il al singolare e i al plurale. In inglese, si usa a davanti a parole che cominciano per consonante, e an davanti a parole che cominciano per vocale. La preposizione DI appare nella forma de- quando costituisce il primo membro di una preposizione articolata (come nel nostro esempio dei, e in del, della, degli, ecc.). Non esiste un termine italiano comunemente utilizzato per denominare queste diverse forme di uno stesso lessema, che non differiscono per i significati grammaticali che esprimono, ma solo per il contesto fonologico o sintattico in cui si usano (e quindi non sono forme flesse, in quanto non sono portatrici di significati grammaticali diversi l’una dall’altra).4 In inglese si usa il termine shape5, che è distinto dal termine form usato per denominare le forme flesse; qui useremo all’occorrenza la formula “forma contestuale di un lessema”: diremo quindi che de- è la forma contestuale del lessema italiano DI usata nelle preposizioni articolate, a è la forma contestuale dell’articolo indeterminativo inglese usata davanti a parole che cominciano per consonante, ecc. È bene sottolineare che uno stesso lessema può avere sia forme flesse sia forme contestuali; i due tipi di forme non sono mutuamente esclusivi, si hanno lessemi che hanno solo un tipo di forme e lessemi che li hanno entrambi. Ad esempio, la preposizione DI ha le tre forme contestuali di, de- e d’, che non differiscono per significato grammaticale e non rappresentano quindi diverse forme flesse; il lessema MIO ha le quattro forme flesse mio, mia, miei, mie, che hanno diversi significati grammaticali (rispettivamente, maschile singolare, femminile singolare, maschile plurale e femminile plurale), ma nessuna di queste forme flesse ha diverse forme contestuali; il lessema IL, infine, ha diverse forme flesse che esprimono diversi significati grammaticali, e tre su quattro E anche davanti all’unica parola italiana che comincia con //, gliommero. Si usa gli anche davanti alla parola dèi “divinità”: in questo caso la scelta di gli invece di i non è governata dalla struttura fonologica della parola che segue, che sincronicamente richiederebbe i (cfr. i debiti / *gli debiti), ma è un residuo di un precedente stato dell’italiano, in cui il lessema si presentava nelle forme iddio / iddei, davanti alle quali si usavano regolarmente gli articoli l’ e gli (l’iddio, gl’iddei; cfr. Serianni, 1988, cap. IV.13 ). 4 In realtà, scarsa attenzione è riservata a questo tipo di forme nelle trattazioni di introduzione alla linguistica scritte in italiano; salvo errore, solo De Mauro (2003, p. 42) rileva l’esistenza di queste forme, per le quali non propone un termine particolare, chiamandole appunto semplicemente “forme”. De Mauro (2003) usa “forme” e non “forme flesse” anche per denominare quelle che qui abbiamo denominato “forme flesse”; quindi nella sua terminologia la differenza tra forme flesse di uno stesso lessema, portatrici di significati grammaticali diversi l’una dall’altra, e forme “contestuali” di un lessema, non portatrici di significati grammaticali diversi l’una dall’altra, resta inespressa. 5 Seguendo una proposta terminologica di Arnold Zwicky: cfr. Zwicky (1992), Stump (2001, p. 13). 2 3 combinazioni di significati grammaticali (il maschile singolare, il femminile singolare e il maschile plurale) si possono presentare in più forme contestuali: il maschile singolare si può presentare come il, lo o l’, il femminile singolare come la o l’, il maschile plurale come i o gli o gl’. 1.4 Omonimia Il rapporto tra parole grafiche e forme flesse non è biunivoco non solo perché una parola grafica può racchiudere in sé forme di più di un lessema, ma anche per un altro motivo: a volte una stessa parola grafica può rappresentare forme flesse diverse di lessemi diversi, o forme flesse diverse di uno stesso lessema. Ad esempio, gli può rappresentare sia una delle forme contestuali della forma flessa plurale maschile dell’articolo IL (così è nella frase (1)), sia una forma flessa singolare del pronome EGLI, come nella frase (2): (2) Paolo mi ha chiesto se ci vado, ma non gli ho ancora risposto. Diciamo quindi che le due forme flesse gli «plurale di IL» e gli «dativo singolare di EGLI» sono forme omonime, perché si scrivono e si pronunciano nello stesso modo (sono cioè omografe ed omofone) ma rappresentano forme di due lessemi diversi. Secondo un’altra distinzione terminologica che si rivela spesso utile, possiamo dire che gli è una parola grafica che rappresenta due diverse parole grammaticali, riconducibili a due diverse forme flesse di due diversi lessemi. Anche una forma come parli rappresenta diverse parole grammaticali: può costituire sia la seconda persona singolare del presente indicativo del verbo PARLARE, sia la prima, la seconda o la terza persona singolare del presente congiuntivo dello stesso verbo. In questo caso, ad essere omonime (omografe e omofone) non sono forme di lessemi diversi, ma quattro forme dello stesso lessema, PARLARE. Due forme possono anche essere omografe ma non omofone, o viceversa. Ad esempio, in italiano sono omografe ma non omofone le forme ancora // “singolare del sostativo ANCORA” e ancora // “avverbio che indica continuità o ripetizione nel tempo” e le forme subito // “immediatamente” e subito // “participio passato del verbo SUBIRE”: le forme delle due coppie si scrivono nello stesso modo, perché l’ortografia italiana nota l’accento solo se esso cade sull’ultima sillaba di una parola (quindi non sono omografe forme come papa e papà), ma sono fonologicamente diverse in quanto la prima parola di ciascuna coppia ha l’accento sulla terzultima sillaba, e la seconda lo ha sulla penultima.6 In inglese, sono omofone ma non omografe le forme sea “mare” e see “vedere”, fonologicamente entrambe // ma ortograficamente distinte. 1.5 6 Lessemi invariabili Quando si ritiene necessario disambiguare anche nello scritto di quale forma si tratti, si usano a volte grafie come àncora, subíto. Esistono anche lessemi che non hanno forme flesse. Come esempi potremmo citare, in italiano, il nome tesi, l’aggettivo blu, la preposizione su, gli avverbi in -mente (stranamente, dolcemente, facilmente, ecc.), e molti altri. Questi esempi mettono insieme però lessemi di due tipi: da una parte, lessemi come tesi e blu, atipici rispetto al resto dei nomi e degli aggettivi italiani, che si presentano normalmente in diverse forme flesse (due per i nomi, come per esempio libro / libri, e quattro o due per gli aggettivi, come per esempio rosso / rossa / rossi / rosse o felice / felici); dall’altra, lessemi come su e stranamente, rappresentanti tipici delle preposizioni e degli avverbi italiani, che non hanno mai diverse forme flesse (e solo in qualche caso, come quello della preposizione di già esaminato, hanno forme contestuali). Se le forme di lessemi come blu o tesi possono ancora essere chiamate forme flesse, in quanto dal contesto in cui occorrono si può determinare se costituiscano, ad esempio, occorrenze del singolare o del plurale (cfr. ho letto una tesi / ho letto tre tesi), di fronte a lessemi come su o stranamente si pone una questione terminologica: come chiamare le forme di questi lessemi? Non possiamo chiamarle forme flesse, perché esse non esprimono, nemmeno in modo nascosto ma ricostruibile dal contesto, particolari significati grammaticali obbligatoriamente espressi in italiano da preposizioni o avverbi; non possiamo neppure chiamarle forme contestuali, perché questi lessemi non si presentano in forme diverse in contesti diversi. La soluzione più semplice è di chiamarle semplicemente forme. Potremo dire allora che in italiano (come in moltissime altre lingue) ci sono lessemi che si presentano sempre in una stessa forma, e lessemi che si possono presentare in diverse forme, determinate dal contesto fonologico o sintattico (forme contestuali) o portatrici di diversi significati grammaticali che i lessemi di una certa classe esprimono obbligatoriamente in italiano (forme flesse). Nella terminologia grammaticale tradizionale, si dice che i lessemi che non hanno forme flesse (anche se possono eventualmente avere forme contestuali) appartengono a parti del discorso invariabili. Vengono a volte detti invariabili anche lessemi come TESI o BLU, che appartengono a parti del discorso non invariabili, ma che hanno forme flesse omonime (nel lessema TESI, la forma flessa singolare è uguale a quella plurale, entrambe tesi).