I linguaggi matematici Idee e simboli Marco Bramanti Dipartimento di Matematica Politecnico di Milano Giugno 2011 Abstract. In questo articolo si discute, a partire da esempi tratti da argomenti di matematica scolastica, il rapporto tra il progresso delle idee matematiche e lo sviluppo di certi linguaggi matematici specifici, e se ne trae qualche considerazione didattica1. Introduzione Che cos’è il linguaggio? Lo strumento col quale comunichiamo un certo contenuto. Spesso si tende a contrapporre nettamente linguaggio e contenuto, come se l’uno potesse prescindere dall’altro: quello che si dice in italiano si può tradurre in inglese (cambia il linguaggio, resta il contenuto), ciò che si dice in un linguaggio tecnico da addetti ai lavori può essere spiegato con un linguaggio divulgativo, alla portata di tutti. E così via. Ma è proprio così? Una poesia scritta in una lingua può essere tradotta esattamente in un’altra lingua? La teoria della relatività può essere spiegata col linguaggio comune, senza usare i termini tecnici della fisica? Si può spiegare la matematica “in soldoni”, senza usare i termini e i simboli matematici? Il contenuto è indipendente dal linguaggio col quale viene comunicato, o piuttosto necessita di un linguaggio adeguato ad esso? Ed il linguaggio aggiunge qualcosa al contenuto? Un po’ di riflessione su questi problemi suggerisce che la relazione tra linguaggio e contenuto sia profonda e complessa. Qui vogliamo affrontare il tema del ruolo del linguaggio in matematica. Per delimitare un po’ questo tema sconfinato, diciamo che non mi riferisco qui agli aspetti generali del linguaggio della matematica, che hanno a che fare con la logica, il modo di ragionare, o il modo di usare certe parole o espressioni del linguaggio comune che in matematica acquistano un significato univoco. Piuttosto, vorrei riflettere sull’apporto specifico che il linguaggio e il simbolismo danno a una specifica branca della matematica. Per questo motivo l’argomento di questa riflessione è meglio descritto dicendo che parliamo dei linguaggi della matematica, al plurale. Affronteremo questo tema attraverso alcuni esempi che mostrano come, da un punto di vista storico e logico, certi progressi del linguaggio matematico siano andati di pari passo con progressi nella comprensione delle idee. Gli esempi toccano argomenti di matematica scolastica, tuttavia le idee suggerite da questi esempi riguardano anche argomenti matematici più avanzati. 1. La scrittura dei numeri Tutti noi abbiamo imparato da piccoli a sommare e moltiplicare due numeri interi “abbastanza grandi”, mettendo i due numeri in colonna, e seguendo certe regole (sommare unità con unità, fare il riporto...). Come ben noto, ciò che rende possibile questo metodo è la scrittura posizionale in base dieci, cioè il fatto che il simbolo 132 denoti “un centinaio più tre decine più due unità”, e le proprietà formali della somma e del prodotto. Ad esempio, 132 + 46 = 1 Questo scritto costituisce una rielaborazione del testo di una conferenza tenuta il 29/11/2001 all’Università di Cagliari, per le matricole del corso di laurea in matematica. 1 178 perché 132+46 = (1x100 + 3 x 10 + 2 x 1) + (4 x 10 + 6 x 1) = per le proprietà associativa e commutativa della somma = (1x100) + (3 x 10 + 4 x 10) + (2 x 1+ 6 x 1) = per la proprietà distributiva = (1x100) + (3 + 4) x 10 + (2 + 6) x 1 = = 1x100 + 7 x 10 + 8 x 1 = = 178. I passaggi scritti sono la giustificazione formale del perché è lecito sommare unità con unità, decine con decine, e così via. Il fatto che la base scelta storicamente sia 10 non è essenziale (probabilmente dipende dal fatto che abbiamo 10 dita); il fatto realmente essenziale è la scrittura posizionale, cioè in cui la stessa cifra ha un significato diverso a seconda della posizione che occupa, e ogni posizione individua una certa potenza di 10: primo posto = unità, secondo posto = decine, ecc. Se, per confronto, proviamo a sommare 2 numeri scritti coi numeri romani, metterli in colonna non è di alcun aiuto: CXXXII + XLVI = ???? L’unica risorsa è usare un qualche tipo di abaco, per non perdere il conto! Il sistema posizionale in base 10 entrò in occidente nel 1202, col Liber Abaci di Leonardo Pisano, che l’aveva conosciuto dagli arabi, i quali a loro volta l’avevano ricevuto dagli indiani intorno al 770, e avevano migliorato il sistema indiano aggiungendo lo zero, che gli indiani non usavano (lasciando al suo posto uno spazio vuoto). In India il sistema posizionale in base 10 era noto almeno dal 500, e qualcuno sostiene che fosse stato a sua volta importato dalla Cina, in tempi ancora più antichi. Il linguaggio della scrittura posizionale in base 10 ha reso possibile l’esecuzione di calcoli numerici per iscritto, senza l’ausilio di abaco. Un progresso enorme non solo per la matematica, ma per la vita quotidiana di tutti. Riflettiamo sul pensiero che ha reso possibile l’invenzione del sistema posizionale e la costruzione delle regole per eseguire le 4 operazioni per iscritto: occorre la consapevolezza delle proprietà formali della somma e del prodotto (commutativa, associativa, distributiva), l’idea di potenza (decine, centinaia, migliaia sono potenze di dieci), l’idea che ogni numero intero si possa rappresentare come somma di potenze di 10, dove tutti i coefficienti, a loro volta, sono numeri interi minori di 10, e quindi si possono rappresentare con le 10 cifre 0, 1, …, 9. Forse queste idee erano possedute da chi ha inventato il sistema in modo solo semi-esplicito, ma certamente senza una profonda riflessione sulle proprietà dei numeri e delle operazioni su di essi, questo linguaggio non avrebbe potuto essere inventato. La scrittura posizionale dei numeri ci appare allora, in questa luce, come molto più che “un buon espediente notazionale”: è una tappa importante nel cammino storico di riflessione sul numero e le sue proprietà, che viene definitivamente fissato in un linguaggio che diventa di uso comune, rende possibile calcoli di complessità potenzialmente qualsiasi, facilita ulteriori riflessioni sulle proprietà dei numeri (per fare solo un esempio elementare, si pensi ai criteri di divisibilità per 3, 5, 11, che si basano essenzialmente sulle proprietà della scrittura 2 posizionale), ed è un presupposto per l’ulteriore estensione che consisterà nel considerare numeri con la virgola2, rivoluzionando in ogni ambito sistemi e unità di misura. Infine, la scrittura posizionale dei numeri rappresenta, per noi che l’abbiamo acquisita, il modo stesso in cui pensiamo i numeri, quando sono “grandi”: possiamo infatti pensare e visualizzare il numero 5 in molti modi (5 puntini su un foglio di carta, le 5 dita di una mano...), ma non conosco che un solo modo per pensare il numero 754: come sequenza di cifre 7, 5, 4, col significato di 7 centinaia, 5 decine e 4 unità. “Si fa molta fatica a pensare a qualche usanza universale che l’uomo abbia stabilito con successo sulla terra. Ce n’è una, tuttavia, di cui ci si può vantare: l’adozione universale dei numerali Indo-Arabi per scrivere i numeri. In questo abbiamo forse l’unico caso di vittoria mondiale di un’idea”. Howard W. Eves3 2. Il linguaggio dell’algebra Uno dei primi e più elementari problemi di cui l’algebra si è occupata è la risoluzione delle equazioni algebriche di primo e secondo grado. Col linguaggio attuale, si tratta delle equazioni del tipo: ax + b = 0 (primo grado) 2 (secondo grado) ax + bx + c = 0 dove x è l’incognita e a, b, c sono coefficienti assegnati. Per l’equazione di primo grado, ad esempio, la soluzione è: b x=− a (purché sia a ≠ 0 ). Questo modo di formulare i problemi è detto dell’algebra simbolica, ed è una conquista del 16° secolo, per arrivare alla quale è stato necessario un lungo e faticoso cammino del pensiero matematico. Qui non vogliamo tracciare un resoconto storico di questi sviluppi, ma solo segnalare due punti-chiave di questo progresso. Il primo, che si può far coincidere con l’invenzione stessa dell’algebra, è il concetto di equazione in un’incognita. Anzitutto l’idea di incognita, cioè l’idea di dare un nome a una quantità che ancora non conosciamo (e neppure sappiamo se esista) ma che, se esiste, deve soddisfare una certa uguaglianza. Successivamente, su questa uguaglianza contenente un’incognita (= equazione) possiamo eseguire determinate operazioni che trasformano l’uguaglianza in un’altra equivalente ma sempre più semplice, fino ad arrivare alla soluzione, se esiste. Esemplifichiamo su un problema tratto dal già citato Liber Abaci di Leonardo Pisano4: Dice un giovane: “Oggi, se al triplo della mia età aggiungo 1/4 e 1/3 di quanto ho già vissuto, mi manca solo un anno per avere 100 anni”. Qual è l’esatta età del giovane in anni, mesi e giorni? Possiamo formalizzare il problema introducendo un’incognita: x = età del giovane, e quindi traducendo l’informazione contenuta nel testo in un’equazione: 1 1 3 x + + x + 1 = 100 . 4 3 2 I numeri con la virgola furono introdotti in Europa da Simon Stevin nel 1585, quasi 400 anni dopo l’introduzione delle cifre indo-arabe, quindi. 3 Mathematical Circles Squared, Prindle, Weber and Schmidt, 1972. 4 Questo problema compare nella Parte III del Cap. XII del Liber Abaci. Citato in N. Geronimi: Giochi matematici del medioevo. Bruno Mondadori, 2006, p.6. 3 Su questa equazione si può ora operare, prima trasformando l’espressione a primo membro come 43 x + 1 = 100 , 12 quindi sottraendo ad ambo i membri dell’equazione 1 e successivamente moltiplicando ambo i membri dell’equazione per 12/43, ottenendo 1188 x= anni, cioè 27 anni, 7 mesi e 16 giorni5. 43 Tutte le operazioni effettuate sono lecite in base alle proprietà generali della somma e del prodotto dei numeri reali. Questo modo di procedere per noi è naturale e quasi banale, ma occorre riflettere sul grado di astrazione implicito in questo ragionamento, e consistente anzitutto nell’uso del concetto di incognita e di equazione, e quindi nell’utilizzo corretto delle proprietà delle operazioni anche quando queste coinvolgono un “numero incognito”. Senza queste idee, il problema andrebbe risolto con un ragionamento certamente più tortuoso. In realtà Leonardo Pisano risolve questo problema senza usare esplicitamente il metodo risolutivo dell’equazione di 1° grado, ma col metodo di falsa posizione; in generale Leonardo, che pure conosce le equazioni, ne riserva l’uso a problemi formulati in modo più intricato di questo. In sostanza, però, il suo ragionamento utilizza sia il concetto di incognita che quello di equazione (espressa a parole); solo nei passaggi risolutivi si discosta dal nostro metodo e si rifà piuttosto alle proporzioni (che comunque sono particolari equazioni). Tradotto in linguaggio simbolico infatti, il suo ragionamento verbale è il seguente: 1 1 poiché 3 x + + x + 1 = 100 , si ha anche 4 3 1 1 3 x + + x = 99. 4 3 Se fosse x = 12 (“falsa posizione”) il primo membro risulterebbe 43 invece che 99 (si noti che, grazie alla scelta astuta del numero 12, questo è un calcolo facile da fare a mente: la forza del metodo è questa). Dunque vale la proporzione 12 ⋅ 99 1188 x : 12 = 99 : 43, perciò x = = . 43 43 Anche se abbiamo usato il linguaggio simbolico moderno per fare un resoconto del ragionamento di Leonardo, si noti che di per sé l’idea di equazione in un’incognita è indipendente dall’uso di un particolare formalismo. Storicamente l’algebra nasce nell’alto medio evo, presso gli arabi, come algebra retorica, dove l’incognita è chiamata “la cosa” e tanto l’equazione quanto il suo procedimento risolutivo sono interamente raccontati a parole (da cui appunto il nome di algebra retorica). La risoluzione per questa via è molto faticosa6, e c’è voluta immaginazione e lungimiranza, da parte dei matematici medievali e del primo rinascimento, per pensare che questo metodo algebrico avrebbe potuto dare dei buoni frutti, se ben coltivato. Il secondo punto chiave in questo sviluppo, infatti, consiste appunto nel passaggio dall’algebra retorica all’algebra simbolica. Questo passaggio, lungo e graduale, ha un’interessante anticipazione intorno al 1200 con l’opera di Giordano Nemorario, che rimane però isolata, subisce un’accelerazione con gli algebristi italiani del rinascimento, che iniziano ad usare ciascuno le proprie abbreviazioni simboliche (si parla di “algebra sincopata” per descrivere questo stadio di sviluppo), e si considera avere un punto di svolta decisiva intorno al 1600 con la figura di François Viète7. L’algebra simbolica a sua volta è caratterizzata da due innovazioni cruciali: la prima è l’uso 5 Più una piccola frazione di giorno, che però il problema non chiede di esprimere. Un esempio istruttivo di come Al-Kuwaritzmi, matematico arabo del 9° secolo a cui si deve il primo trattato sulle equazioni, risolve l’equazione di 2° grado 21+x2 = 10x è riportato ad es. in Bottazzini, Fregugli, Toti-Rigatelli: Fonti per la storia della matematica. Sansoni, 1999, pp.165-6. 7 François Viète, 1591, “In artem analyticem isagoge”; 1600, “Algebra Nova”. 6 4 di un simbolismo standard per scrivere le equazioni (anziché doverle raccontare a parole), che rende celere e trasparente il procedimento risolutivo; la seconda è l’uso di coefficienti generici, cioè l’idea di dare dei nomi (ad es. a, b, c) ai numeri (considerati noti, non incogniti!) che compaiono nell’equazione, al fine di poter risolvere “in un colpo solo” tutte le equazioni di un certo tipo, e non solo una specifica equazione. Ad esempio, se vogliamo mostrare come si risolve la generica equazione di primo grado, è sufficiente scrivere ax + b = 0 con a, b generici numeri reali. Sottraendo b ad ambo i membri e quindi dividendo per a ambo i membri (se a ≠ 0 ), si trova la soluzione generale: b x=− . a Prima della nascita dell’algebra simbolica, i trattati di algebra insegnavano a risolvere le equazioni unicamente attraverso esempi numerici, senza la possibilità di enunciare simbolicamente una regola generale: non esisteva un linguaggio capace di questa generalità. L’uso di lettere per denotare coefficienti “generici” si intreccia con un altro problema, che è l’uso dei numeri negativi, pienamente affermatosi in Europa solo nel 16° secolo (con Bombelli, Stevin). Per chi non conosce i numeri negativi, le equazioni ax2 + bx = c; ax2 = bx + c; ax2 + c = bx non sono tre casi particolari dell’equazione generale ax2 + bx + c = 0, ma piuttosto tre classi di equazioni ben distinte. E’ il fatto di considerare anche la possibilità che a, b, c indichino numeri negativi che unifica i tre “casi” in uno solo. Sintetizziamo. Il linguaggio dell’algebra simbolica utilizza lettere per denotare incognite e coefficienti generici. Questo procedimento rende celere la formalizzazione e risoluzione di molti problemi, e consente di formulare sinteticamente le regole generali di risoluzione. Tutto ciò è strettamente connesso a certi progressi fatti nell’evoluzione del pensiero matematico: • L’affermarsi di un certo tipo di ragionamento astratto: dare un nome ad una ipotetica quantità che ancora non conosciamo, ma che, se esiste, deve soddisfare una certa uguaglianza, e trarre conseguenze opportune da questa uguaglianza. • L’idea di scrivere e risolvere le equazioni in simboli, non a parole. • L’idea che si possano stabilire relazioni valide per numeri qualsiasi indicando questi con delle lettere (parametri). Quest’idea è naturalmente intrecciata ad un approfondirsi della consapevolezza delle proprietà astratte delle operazioni di somma e prodotto di numeri: per scrivere a(x + 1) = ax + a occorre avere chiara la proprietà distributiva, e aver capito che proprio la generalità con cui vale quella proprietà ci consente di affermare che è lecito scrivere uguaglianze letterali: queste uguaglianze “non ci tradiranno” quando sostituiremo a una lettera un numero concreto, proprio perché le proprietà che applichiamo sono valide per ciascun numero. Ma allora si può usare sistematicamente lettere al posto di numeri e stabilire formule di valore generale. • Il concetto di numero negativo (e non solo di sottrazione di un numero da un altro), che consente di unificare procedimenti che altrimenti si frammenterebbero in una casistica complicata. L’esempio dell’algebra mostra quindi come il linguaggio matematico non sia semplicemente un modo per comunicare certe idee, ma sia esso stesso il luogo in cui risiedono certe idee. Il linguaggio incorpora in sé progressi, idee, giudizi, astrazioni frutto di una lunga storia. Per questo quando ragioniamo usando un certo linguaggio, certi problemi (non tutti!) appaiono banali, mostrano da sé la strada per la propria soluzione. In realtà il problema non può essere considerato banale di per sé; piuttosto, si può dire che in quel caso il linguaggio si sia fatto carico della maggior parte del lavoro necessario a risolvere il problema. Il linguaggio ricapitola i progressi concettuali di tutta una storia, e ci vedere le cose “dalle spalle dei giganti”. 5 3. La geometria analitica La geometria analitica è un’invenzione di Cartesio e Fermat (intorno al 1630), che ha rivoluzionato la geometria e il suo rapporto con l’algebra. Per gli antichi greci la geometria aveva un ruolo predominante, fondante, rispetto all’algebra. Le operazioni algebriche erano considerate sensate se avevano una interpretazione geometrica: ad esempio, il “quadrato” di un numero a era pensato come la misura del quadrato di lato a, piuttosto che la pura e semplice abbreviazione di axa; per questo motivo, ad esempio, a5 non aveva senso per i greci, non potendo immaginare un “ipercubo” in uno spazio di dimensione 5. La geometria analitica ha capovolto il rapporto tra l’algebra e la geometria. Con l’idea di sistema di riferimento e di coordinate, un punto sulla retta viene identificato con un numero reale, un punto del piano viene identificato con una coppia (x,y) di numeri. Ora ogni figura geometrica piana che sia esprimibile come luogo geometrico, cioè insieme di tutti e soli i punti che soddisfano una certa relazione, viene identificato con l’insieme di tutte e sole le coppie (x,y) che soddisfano una certa relazione algebrica (equazione o disequazione), e quindi con l’equazione o disequazione stessa. Rette, circonferenze, parabole diventano così equazioni nelle due variabili x,y. Un semipiano diventa una disequazione nelle due variabili x,y. L’operazione geometrica di intersecare due rette (trovare il loro punto comune) viene tradotto nell’operazione algebrica di cercare la coppia (x,y) che risolve simultaneamente due equazioni, cioè, che risolve il sistema delle due equazioni. Come si capisce, si tratta di un linguaggio potentissimo. Oggetti e concetti geometrici vengono tradotti in oggetti e concetti algebrici; la potenza di calcolo dell’algebra permette quindi di risolvere analiticamente i problemi; i risultati possono poi essere interpretati geometricamente. Per questa via diventano trattabili problemi che per la geometria tradizionale (o “sintetica”) erano inaccessibili o addirittura impossibili da formulare. Ad esempio, nello studio delle curve piane, la geometria sintetica tradizionale si era sostanzialmente limitata alla classe delle coniche (ellissi, iperboli, parabole), che dal punto di vista analitico sono le curve del second’ordine, cioè espresse da un’equazione polinomiale di secondo grado in (x,y). Ora il linguaggio della geometria analitica rende naturale porsi il problema di studiare le curve di grado superiore a 2. Solo poche di queste, però, hanno una definizione “sintetica” naturale, in termini di luoghi geometrici; di tutte le altre la geometria sintetica tradizionale non poteva neppure parlare. Incontriamo quindi un aspetto nuovo del linguaggio matematico: non solo il linguaggio incorpora in sé idee e progressi di tutta una storia, e quindi “si fa carico” di una parte importante del lavoro necessario a risolvere un problema; il linguaggio amplia anche l’orizzonte concettuale dei problemi che si possono e che è naturale studiare, suggerisce nuove domande, dà nuovi orizzonti alla ricerca. Sottolineiamo qualcuna delle idee importanti che stanno alla base della geometria analitica e che quindi, storicamente, l’affermarsi di questo linguaggio ha definitivamente incorporato nella matematica corrente. • L’idea che l’insieme dei numeri reali sia una buona rappresentazione dell’insieme dei punti della retta (e viceversa). Col linguaggio attuale, la corrispondenza biunivoca tra punti della retta e numeri reali (corrispondenza percepita oggi così naturale da far sì che i matematici dicano spesso “la retta reale”, confondendo perfino linguisticamente l’oggetto geometrico -retta- e l’oggetto analitico -numeri reali-). Questa idea ai tempi di Cartesio poteva solo essere intuita, mancando un’assiomatizzazione rigorosa sia del sistema dei numeri reali (sarà fatta da Dedekind, Cantor, Weierstrass nel 1872), sia dei fondamenti della geometria (sarà fatta da Hilbert nel 1899). Aver posto un’idea così profonda e semplice a fondamento di un’intera disciplina, la geometria analitica, è certamente un punto di non ritorno fondamentale nello sviluppo delle idee matematiche. • L’idea che la geometria euclidea si possa ricostruire dai suoi teoremi centrali, piuttosto che dai suoi assiomi. Infatti: l’idea di coordinate cartesiane si basa sulle proprietà delle rette parallele; l’equazione della retta si basa sul Teorema di Talete; il calcolo della distanza tra due punti a partire dalle loro coordinate si basa sul Teorema di Pitagora. Con 6 • questi concetti, grosso modo, si costruisce tutta la geometria analitica. Il fondamento geometrico della geometria analitica non riposa dunque sugli assiomi della geometria euclidea (che in Euclide, tra l’altro, sono formulati in modo carente, poco utilizzabile per una costruzione rigorosa), ma su pochi teoremi riconosciuti centrali nella geometria euclidea. Possiamo considerare questo punto di vista come uno sguardo pragmatico sulla geometria euclidea, quasi a dire: sulla sistemazione rigorosa dei fondamenti della geometria possiamo litigare all’infinito, ma i fatti centrali della geometria euclidea sono questi: le proprietà delle parallele, il teorema di Pitagora, il teorema di Talete. Il punto di vista sulla geometria euclidea che consiste nel privilegiare il concetto di luogo geometrico (vedere una figura come insieme di punti con certe proprietà), piuttosto che altre possibili descrizioni delle figure geometriche (ad esempio mediante proprietà “globali”). Considerare una figura come un insieme di punti è oggi per noi un fatto naturale, dopo 150 anni dal dilagare in matematica del linguaggio degli insiemi; ai tempi di Cartesio però non era così. Ad esempio: per Euclide, un angolo è la parte di piano compresa tra due semirette uscenti da un punto comune; l’espressione “parte di piano compresa fra” non fa riferimento esplicito ai punti del piano; noi ci esprimeremmo piuttosto così: “un angolo è l’insieme dei punti compresi fra due semirette uscenti da un punto comune”. E’ questo punto di vista insiemistico, naturale per noi oggi, quello adatto ad essere tradotto nel linguaggio della geometria analitica: i punti si rappresentano come coppie (x,y) di numeri, e una relazione tra i punti diventa una relazione algebrica tra x e y. Il punto di vista analitico-insiemistico che la geometria delle coordinate porta con sé è quindi uno dei presupposti da cui potranno nascere il calcolo infinitesimale del ‘700, il concetto di funzione e l’analisi matematica dell’800, la teoria degli insiemi del ‘900. Nessuno di questi sviluppi, naturalmente, è un frutto meccanico dei passi precedenti, ma ognuno presuppone i passi precedenti. In questo senso la nascita della geometria analitica getta il seme di una vera rivoluzione. 4. Il linguaggio degli insiemi e le funzioni Il linguaggio degli insiemi è stato utilizzato a partire dall’800, sempre più sistematicamente, in tutti i lavori sui fondamenti della matematica. Verso la fine dell’800, Cantor ha studiato in profondità la teoria degli insiemi infiniti, che è solitamente considerata una sua creazione. Nel 1900, la scoperta da parte di Russel di una famosa “antinomia” sembrò mettere in crisi il modo (oggi poco rispettosamente detto “ingenuo”) di concepire gli insiemi a quel tempo. Nei primi anni del ‘900 furono fatti vari tentativi di assiomatizzare rigorosamente questa disciplina (teoria di ZermeloFraenkel, teoria di von Neumann....), che da allora è diventata, dal punto di vista formale, una teoria matematica come le altre. Invece, nell’800 era pensata come una sorta di prolungamento della logica, intesa quest’ultima, al modo classico, come l’insieme delle “regole del ben ragionare” e non, come sarebbe divenuta nel ‘900, come una branca dell’algebra astratta. Qui ci interessa riflettere non tanto sulla teoria formale degli insiemi, con i suoi problemi, i suoi metodi, i suoi successi, coltivati dagli addetti ai lavori, ma sul linguaggio degli insiemi che dall’800 ad oggi è divenuto il pane quotidiano dei matematici, il modo normale in cui si formalizza, si scrive, si insegna la matematica nelle università e, almeno per quanto riguarda l’analisi matematica, anche a scuola. In particolare, vediamo come il linguaggio degli insiemi ha influito sul precisarsi del concetto di funzione, che è uno dei concetti centrali dell’analisi. Prima dell’800 i matematici usavano questo concetto senza una definzione esplicita. Ad esempio, per Newton una funzione (che lui chiama “fluente”) è pensata come una grandezza variabile nel tempo con continuità, “come una linea è generata dal moto continuo di un punto”8. Un’idea generale ma molto vaga. 8 Le prime parole del trattato di Newton “De quadratura curvarum”, dedicato al calcolo integrale e differenziale, sono: “Qui considero le grandezze matematiche non composte da piccolissime parti costanti, ma descritte per moto continuo. 7 In pratica Newton, anziché precisare teoricamente questa richiesta, si limita a considerare le funzioni che hanno un’espressione analitica ben precisa: polinomi, quozienti di polinomi, serie di potenze (da lui studiate, e viste come generalizzazione dei polinomi), e che generalmente soddisfano certi requisiti di regolarità. Il criterio pragmatico di demarcazione tra le funzioni accettabili in analisi, per Newton, diventa (implicitamente) la forma della loro espressione analitica. Nel 1718, J. Bernulli è altrettanto vago: “Chiamiamo qui funzione di una grandezza variabile, una quantità che è composta in ogni possibile maniera di questa grandezza variabile e di costanti”. Sotto la spinta del calcolo infinitesimale e della meccanica di Newton, a partire dal ‘700 si assiste a un fiorire di ricerche di fisica matematica. Alcune di queste ricerche si concentrano su problemi fisici (diffusione del calore, vibrazione di corde e membrane) che, per la loro risoluzione, coinvolgono problemi matematici rilevanti e stimolano la nascita di nuove teorie, come quella delle serie di Fourier. Questo circolo di idee rende sempre più pressante il problema di definire con precisione un ambito di lavoro: che cos’è una funzione, in generale? Quali sono le ipotesi sotto le quali i procedimenti del calcolo infinitesimale sono applicabili alle funzioni? Quali sono le ipotesi minime sotto le quali le varie “formule risolutive” trovate per i vari problemi della fisica matematica si possono considerare valide? Nel 1837, Dirichlet dà la seguente definizione di funzione, che sostanzialmente è quella che si dà ancora oggi (almeno nel contesto delle funzioni reali di variabile reale): “Se ad ogni x (di un certo intervallo) corrisponde un unico valore y finito, allora y è detto funzione di x su questo intervallo. Questa definizione non richiede una definizione comune per le varie parti della curva; si può immaginare la curva composta delle componenti più eterogenee oppure tracciata senza seguire alcuna legge”. L’idea di Dirichlet, espressa nel linguaggio attuale, è che ha il diritto di chiamarsi funzione una qualsiasi legge che permetta di associare univocamente ad ogni numero di un certo insieme A un numero di un certo insieme B. Non importa che questa legge abbia qualcosa a che fare con polinomi, logaritmi, esponenziali, o altre consuete funzioni elementari. L’univocità della corrispondenza è l’unica richiesta essenziale per poter parlare di funzione. Ad esempio (l’esempio è proprio dovuto a Dirichlet), è una funzione quella che ad ogni numero razionale associa 1 e ad ogni numero irrazionale associa 0. Questa idea è semplice ma rivoluzionaria, in quanto la completa arbitrarietà della legge che definisce una funzione destituisce di importanza l’esistenza di una particolare espressione analitica, a vantaggio di una totale generalità; al tempo stesso, viene a cadere il requisito (che aveva il difetto di essere espresso in modo vago, ma il vantaggio di essere intuitivo) di “grandezza che varia con continuità”. La funzione è definita punto per punto, e il suo valore in un punto non ha a priori alcuna relazione coi valori nei punti vicini. Ciò significa che non c’è da aspettarsi a priori nessuna particolare regolarità dal grafico della funzione: potrebbe essere una curva discontinua, con salti e strappi di ogni genere, oppure non avere retta tangente, o avere ogni sorta di “patologia”, come accade con l’esempio fatto sopra di funzione che vale 1 se x è razionale e 0 se x è irrazionale, il cui grafico è impossibile da disegnare. “Ci accorgemmo che le funzioni, alla pari degli uomini, sono capaci del peggio”. (F. Klein9). E’ chiaro che l’allargamento smisurato dell’ambito di ciò che si può considerare “funzione”, rende poi molto più delicata la dimostrazione dei teoremi: non ci si potrà appellare a proprietà “geometricamente intuitive” del grafico delle funzioni, perché di intuitivo in questo concetto è rimasto ben poco. Il precisarsi del moderno concetto di funzione, una conquista nel cammino di rigorizzazione compiuta dall’analisi matematica nel 19° sec., ha fissato il contesto di tutta la ricerca successiva in Le linee sono tracciate, e nel tracciarle sono generate, non per apposizione di parti, ma per moto continuo dei punti; le superfici sono generate dal moto di linee; i solidi dal moto di superfici; gli angoli per rotazione dei lati; eccetera”. 9 Felix Klein, 1849-1925, cit. in D’Amore-Matteuzzi, Dal numero alla struttura, Zanichelli, 1975, p.70. 8 analisi e dettato un nuovo canone di rigore matematico. E tutto questo semplicemente introducendo un termine, una definizione, che segna un punto di svolta nel linguaggio di tutta la matematica. A sua volta, questo è conseguenza (o se vogliamo è un aspetto) dell’affermarsi progressivo del linguaggio degli insiemi: la definizione moderna di funzione è semplice e “naturale” dal punto di vista del linguaggio degli insiemi. Ancora, il nuovo linguaggio ha in sé la potenzialità di aprire nuovi mondi all’esplorazione: perché limitarsi a considerare funzioni definite tra insiemi di numeri? Possiamo considerare, come si farà sistematicamente dall’inizio del ‘900 con l’analisi funzionale, funzioni definite tra insiemi arbitrari, in particolare tra insiemi di funzioni. Questo non è un circolo vizioso, ma il fenomeno, tipico del linguaggio degli insiemi, di prestarsi a una stratificazione dei livelli di astrazione. 5. Linguaggio e simbolisimo Quest’ultimo punto è in un certo senso trasversale rispetto ai precenti. Ci chiediamo quale sia il ruolo specifico del simbolismo, all’interno di un particolare linguaggio matematico. Partiamo da un esempio: è una questione di linguaggio decidere di definire le potenze come un’abbreviazione del prodotto di più fattori uguali, e dire “due alla tre” per indicare 2 x 2 x 2. E’ una questione di simbolismo decidere di indicarla con una scrittura del tipo 23 piuttosto che 32 o 23. Se fin da piccoli ci avessero insegnato a usare una di queste ultime due scritture, ora la considereremmo naturale. Detto così, sembrerebbe che il simbolismo usato sia puramente convenzionale, e quindi concettualmente secondario. Un grande matematico e filosofo, Leibniz, non era affatto d’accordo con quest’idea: “Ai simboli è da richiedere che essi si prestino alla ricerca; ciò succede principalmente quando essi esprimono in modo conciso e quasi dipingono l’intima natura della cosa, perché allora essi risparmiano mirabilmente lo sforzo di pensiero”10. Leibniz stesso ha offerto ottimi esempi di questo suo “programma”, nei simboli da lui introdotti dy nello studio del calcolo infinitesimale, come la notazione per la derivata di una funzione y = dx f(x) che, come noto, “ci ricorda” che la derivata è il limite del rapporto incrementale, quindi il limite a cui tende il rapporto tra due quantità sempre più piccole. Con questa felice notazione, un teorema importante come il teorema di derivazione della funzione composta, assume simbolicamente la forma: dy dy dx = ⋅ dt dx dt che è facile da ricordare perché sembra (anche se non è!) un passaggio puramente algebrico (“semplificare per dx”). Un esempio più elementare del precedente, ma pure interessante, è quello delle notazioni che oggi usiamo per le potenze a esponente razionale. Dopo aver definito le potenze a esponente intero positivo an come “abbreviazione del prodotto di n fattori uguali ad a”, si introducono le potenze a esponente negativo: 1 a −n = n a e quelle a esponente frazionario: 1 m n m a = a; a = m an m con n, m, interi positivi. Si tratta di pure e semplici scelte notazionali arbitrarie? Certamente no. 10 Leibniz, in una lettera a Tschirnhaus del 1678; citato in Castelnuovo, Le origini del calcolo infinitesimale nell’era moderna, Zanichelli 1938, p. 97. 9 Le potenze a esponente razionale, così definite, si dimostrano possedere tutte le proprietà formali delle potenze a esponente intero, ad esempio aras = ar+s se r, s sono frazioni qualsiasi. Ad esempio, questo significa che 1 6 1 1 a ⋅ 3 a = a6 ⋅ a3 = a2 = a , che è una proprietà delle radici n-esime, che con questa notazione viene facilmente ricordata, e pensata come perfettamente analoga alle proprietà delle più elementari potenze a esponente intero positivo. Le proprietà delle potenze a esponente negativo e razionale furono studiate per la prima volta nel 14° sec. da Oresme, che suggerì anche una speciale notazione per questi esponenti; i simboli di esponente negativo e razionale che usiamo oggi furono introdotti da Newton nel 1676, in una lettera a Oldenburg. Dietro la scelta di questi simboli c’è la scoperta della profonda analogia tra le proprietà delle potenze (elementari) e quelle delle radici, analogia che permette di vedere le radici anch’esse come potenze, ma con esponente frazionario. Il simbolo incorpora in sé le proprietà dimostrate e la sintesi di pensiero che ne consegue. E’ stato scelto in modo arbitrario? In un certo senso sì (si potevano scegliere simboli diversi), ma certamente l’aver scelto questi simboli, come diceva Leibniz, “risparmia mirabilmente lo sforzo di pensiero”. Esempi di questo tipo sono numerosi anche nella matematica un po’ più avanzata11. I simboli, inoltre, sono -almeno oggi, ed entro un periodo storico non troppo lungointernazionali, perciò fanno sì che matematici di tutto il mondo, almeno quando parlano in modo “tecnico”, parlino la stessa lingua. Sintesi e osservazioni didattiche A rischio di ripeterci, puntualizziamo alcune tesi documentate dal discorso precedente. Il linguaggio matematico non è un puro strumento per comunicare idee che esistono indipendentemente da esso. Il linguaggio codifica il modo in cui pensiamo oggetti e concetti matematici, perciò il linguaggio incorpora in sé idee, giudizi, sintesi di pensiero, progressi fatti da tutta una storia di ricerche su un certo problema. Il precisarsi del linguaggio è un punto d’arrivo e di partenza: il linguaggio infatti incorpora a volte risultati precisi e rigorosamente dimostrati in precedenza, altre volte idee che sono possedute in modo più implicito e non del tutto consapevole. In entrambi i casi, l’uso del linguaggio stesso diventa uno stimolo ad approfondire la riflessione su quel tema e farne maturare la consapevolezza. Un linguaggio adeguato guida nell’affronto dei problemi: suggerisce il modo di analizzare un “problema reale” e formalizzarlo. Talvolta una buona formalizzazione rende un problema banale, o per lo meno di routine, mentre senza disporre del linguaggio corretto, lo stesso problema avrebbe richiesto idee e intuizioni non immediate. Altre volte, naturalmente, il problema ben formalizzato rimane un problema difficile, tuttavia è almeno trattabile, mentre senza quel linguaggio rimarrebbe totalmente al di fuori della portata di coloro che fanno ricerca. Infine, un buon linguaggio apre nuovi orizzonti, rende naturale o per lo meno possibile porsi determinate domande che prima non erano neppure formulabili, indagare oggetti che prima non erano neppure definibili. 11 Qualche esempio significativo dalla matematica universitaria: la definizione dell’esponenziale complesso exp(x+iy) come serie di potenze è data in modo da “ricordare” vari teoremi di De Moivre; la notazione Tf per indicare l’azione di un operatore lineare su una funzione “ci ricorda” la proprietà di linearità T(f+g) = Tf +Tg, che “sembra” una semplice ∞ proprietà distributiva; la scrittura ∑a n = s aiuta a ricordare il teorema sulla somma di due serie convergenti. In tutti n =0 questi casi il simbolo ci aiuta a fare passaggi corretti nell’usarlo. 10 Perciò la scoperta e l’invenzione delle idee matematiche sono inseparabili dalla creazione e dall’uso del linguaggio matematico. Questo rapporto tra linguaggio e idee matematiche è certamente un motivo importante delle difficoltà che si incontrano nello studiare e nell’insegnare la matematica: una delle cose più faticose da acquisire per uno studente è un linguaggio corretto, e d’altro canto dovrebbe essere chiaro dal discorso precedente quanto questo sia importante. I motivi di questa fatica sono vari: • Il motivo più ovvio è proprio il fatto che apprendere un linguaggio significa in realtà apprendere un insieme di idee non banali, che hanno richiesto tempo per maturare nella storia; perché dovrebbero poter maturare istantaneamente nella persona? Di questo occorre semplicemente essere consapevoli. • Esiste anche una certa resistenza tipica da parte dello studente a voler imparare il linguaggio; resistenza dovuta al pregiudizio diffuso nel senso comune, e già ricordato, per cui linguaggio e contenuto sono pensati come aspetti nettamente separati. “Io voglio capire le idee, la sostanza; farei a meno di usare questo linguaggio se il professore non fosse così pedante”. Così facendo non si capisce che senza impadronirsi del linguaggio, sono proprio le idee che non si riescono a capire. E si perde il vantaggio di tutto il progresso e il pensiero che in quel linguaggio sono ricapitolati. • In terzo luogo, insegnare il linguaggio implica da parte del docente uno sforzo didattico non indifferente. Il linguaggio, infatti, è per il docente come un abito che indossa senza più neanche accorgersene; il docente mette a tema e sviscera esplicitamente certi contenuti, e molto più implicitamente comunica un certo linguaggio. Mettere a tema e sviscerare esplicitamente il linguaggio che si sta usando è un’operazione didattica delicata, che richiede nel docente uno sforzo di introspezione e di immedesimazione nell’ascoltatore (“qual è la difficoltà che questi studenti stanno incontrando nel recepire questo termine? O che ho incontrato io?”). • Infine (quest’ultima osservazione forse è più pertinente all’insegnamento universitario che a quello scolastico), l’economia dell’esposizione, sia parlata che scritta (lezioni o libri di testo) inevitabilmente spinge a scivolare rapidamente, ad esempio, sulle dimostrazioni più semplici, sulle implicazioni “di routine” che, se da una parte non sono certo quelle da cui si colgono le idee profonde di una disciplina, d’altro canto sono proprio la palestra migliore per impararne il linguaggio in quanto, come abbiamo segnalato, sono proprio quelle dimostrazioni in cui quasi tutto il lavoro è svolto dal linguaggio stesso. Studiare queste semplici dimostrazioni ripercorrendone la logica per cogliere la potenza del linguaggio in azione è un esercizio prezioso che lo studente dovrebbe fare. E senza l’attivo coinvolgimento del ragionamento da parte dallo studente, soffermarsi su queste cose da parte del docente non produce alcun frutto. 11