Introduzione alla Matematica La Matematica della Scuola Media Renzo Sprugnoli Dipartimento di Sistemi e Informatica Viale Morgagni, 65 - Firenze (Italia) 27 settembre 2005 2 Indice Introduzione 5 1 Il linguaggio della Matematica 1.1 Gli insiemi . . . . . . . . . . . . . . . . 1.2 Le relazioni . . . . . . . . . . . . . . . 1.3 Funzioni e operazioni . . . . . . . . . . 1.4 Il contare . . . . . . . . . . . . . . . . 1.5 Rappresentazione dei numeri naturali . 1.6 La nomenclatura della Matematica . . 1.7 Matematica e Logica . . . . . . . . . . 1.8 Predicati . . . . . . . . . . . . . . . . . 2 Aritmetica 2.1 L’addizione . . . . . . . 2.2 Confronto e sottrazione 2.3 Moltiplicazione . . . . . 2.4 Divisione . . . . . . . . 2.5 Divisibilità . . . . . . . 2.6 Numeri primi . . . . . . 2.7 Massimo comun divisore 2.8 Le altre operazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Numeri 3.1 I numeri interi . . . . . . . . . 3.2 I numeri razionali . . . . . . . . 3.3 I numeri decimali . . . . . . . . 3.4 I numeri reali . . . . . . . . . . 3.5 La costruzione dei numeri reali 3.6 Potenze, radici, logaritmi . . . 3.7 Espressioni e proporzioni . . . . 3.8 Matematica finanziaria . . . . . 4 Matematiche finite 4.1 Calcolo combinatorio . . . . 4.2 Permutazioni . . . . . . . . 4.3 Problemi combinatori . . . 4.4 Strutture dati . . . . . . . . 4.5 Il modello delle parole . . . 4.6 Il calcolo delle proposizioni 4.7 Calcolo delle probabilità . . 4.8 Distribuzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 11 14 17 20 24 28 31 35 . . . . . . . . 39 39 42 45 49 51 55 58 61 . . . . . . . . 65 65 68 72 77 81 86 90 95 . . . . . . . . 99 99 103 106 111 115 118 122 126 4 5 Algebra 5.1 Calcolo letterale . . . . . . . 5.2 I polinomi . . . . . . . . . . . 5.3 Risoluzione delle equazioni . . 5.4 Sistemi di equazioni . . . . . 5.5 Disequazioni . . . . . . . . . . 5.6 Numeri complessi . . . . . . . 5.7 Equazioni di grado superiore 5.8 Algebra astratta . . . . . . . INDICE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 133 136 140 143 147 151 155 158 6 Geometria Euclidea 6.1 Le basi della Geometria . . . . . 6.2 Perpendicolarità e parallelismo . 6.3 Congruenza e similitudine . . . . 6.4 La misura delle superfici . . . . . 6.5 Luoghi geometrici . . . . . . . . . 6.6 La geometria della circonferenza 6.7 Poligoni regolari e cerchio . . . . 6.8 Geometria dello spazio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 163 168 172 176 180 183 187 191 7 Le altre Geometrie 7.1 Coordinate Cartesiane . . . . . . 7.2 L’equazione della retta . . . . . . 7.3 La parabola . . . . . . . . . . . . 7.4 Circonferenza, ellisse e iperbole . 7.5 Geometrie non-Euclidee . . . . . 7.6 Geometria descrittiva e proiettiva 7.7 Topologia . . . . . . . . . . . . . 7.8 Gli spazi vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 199 202 206 208 211 215 215 215 8 Trigonometria e Calcolo 8.1 Le funzioni trigonometriche . . . . 8.2 Le formule di somma e sottrazione 8.3 Risoluzione dei triangoli . . . . . . 8.4 Il concetto di limite . . . . . . . . . 8.5 Logaritmo ed esponenziale . . . . . 8.6 Il calcolo differenziale . . . . . . . 8.7 Lo studio delle funzioni . . . . . . 8.8 Il calcolo integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 217 221 225 229 234 238 244 249 . . . . . . . . Introduzione noscenze umanistiche, quali la storia, la filosofia e la stessa letteratura. Si pensi, per fare qualche esempio, alla determinazione dell’età dei reperti archeologici con il metodo del carbonio, allo studio statistico dell’evoluzione di una lingua, ai modelli matematici dell’equilibrio biologico di un determinato ambiente, alle strutture spaziali delle molecole, alle grammatiche formali per comprendere la struttura di un linguaggio. Oggi, poi, la diffusione pervasiva degli elaboratori elettronici richiede un’impostazione mentale e un bagaglio di conoscenze di natura tecnologica e astratta, se non si vuole rimanere utenti puramente passivi di macchine che inglobano in sé, nei loro programmi, conoscenze logiche e matematiche molto profonde. E se queste macchine ci risparmiano lavoro di routine e la necessità di dover eseguire calcoli tanto numerosi quanto banali, non ci esimono dal conoscere i loro principi operativi (algoritmi e programmi) pena una sudditanza, psicologica ed economica, da chi è in grado di controllare queste macchine e quindi la parte di mondo, sempre più grande, che queste macchine controllano. Queste ed altre considerazioni ci spingono a tentare di riunire in un unico testo, di dimensioni abbastanza ridotte, le conoscenze di cui uno studente dovrebbe essere padrone alla fine dei suoi studi elementari e medi, e che quindi costituiscono il bagaglio di nozioni con cui affrontare gli studi universitari. Da un punto di vista puramente pratico, perciò, è qui raccolta tutta la Matematica che serve per l’accesso a un Corso di Laurea di tipo scientifico o tecnologico di una nostra Università, sia per poter seguire utilmente gli insegnamenti del primo anno, sia per superare i test per l’accertamento dei debiti formativi in Matematica, attualmente previsti. Questo testo ha l’ambizione di poter colmare le eventuali lacune degli studenti che intendono iscriversi al primo anno di Università. AVVERTENZA Queste note devono ancora essere messe a punto. L’autore è consapevole del fatto che esse contengono errori di forma e di sostanza. I lettori sono invitati a segnalare tutto ciò che ritengono scorretto o comunque da modificare, togliere e aggiungere. Di tali segnalazioni l’autore ringrazia anticipatamente. c R. Sprugnoli, 2002. ° 1. La conoscenza della Matematica è diventata un’esigenza fondamentale del mondo moderno, dove la scienza e la tecnica costituiscono una parte importante della cultura di ciascuna persona, che incontra, ad ogni passo, riferimenti precisi ai concetti matematici. Intorno al 1600, Galileo aveva puntualizzato l’inizio del pensiero moderno affermando che la natura è un libro scritto in termini matematici, e pertanto la Matematica è lo strumento fondamentale per la conoscenza della natura. Con questo spirito si è sviluppata la scienza moderna, che ha fatto della Matematica un punto di riferimento e un ideale da perseguire. Ma mentre nel 1700 e nel 1800 la scienza e la tecnica erano appannaggio di una stretta minoranza di persone, con il 1900 la base si è enormemente allargata ed ora, all’inizio del terzo millennio, le persone che hanno la necessità di usare la Matematica per il proprio lavoro sono diventate la maggioranza. Spesso la conoscenza della parte tecnica della Matematica è limitata alle nozioni che si apprendono alle scuole elementari e medie, sia inferiori che superiori; comunque, queste conoscenze formano la base indispensabile per acquisire le tecniche più evolute che si insegnano nelle Università. Il sapere matematico è un sapere unitario, che non permette frammentazioni, e una lacuna in un qualsiasi settore, l’aritmetica, l’algebra o la geometria, costituisce di fatto una mancanza in tutte le altre parti della Matematica. Per questo la cosiddetta “Matematica elementare” è una base di conoscenza dalla quale è difficile prescindere se si vuole avere accesso alle conoscenze del mondo scientifico e tecnologico, mondo che sempre più invade anche i campi tradizionalmente riservati alle co- — 2. La Matematica non è solo una serie di nozioni tecniche che permettono di risolvere problemi pratici, ma è anche, e soprattutto, un modo di pensare e un atteggiamento culturale. Per i Greci, che queste cose le avevano inventate, non c’era distinzione tra la Matematica (la Geometria) e la Filosofia. Talete e 5 6 Pitagora prima, Platone e Aristotele poi videro nella Matematica la forma perfetta del sapere; solo Socrate sembra non conformarsi a questa idea, ma sulla porta d’ingresso dell’Accademia platonica stava scritto “Nessuno entri che non conosca la Geometria”. Il ragionamento, nella vita di tutti i giorni come nella filosofia più astratta, segue un modello che è quello della Matematica, quello che la Matematica ha portato a un rigore assoluto. La necessità, il gusto della dimostrazione rigorosa si apprendono pienamente con la Matematica; questa dà anche i limiti di applicabilità del metodo deduttivo, che, ad esempio, non può entrare in un regressus ad infinitum, ma deve fondarsi su qualcosa che diamo per buono e per certo: ed è proprio la Matematica che ci fa capire come questo qualcosa di fondante abbia un senso o lo acquisti in un sistema di assiomi che si autosostengono. E anche senza arrivare a queste finezze che confinano con la filosofia, la Matematica ci dà la forma mentis necessaria ad affrontare, in modo rigoroso, tanto lo studio della natura quanto quello dell’uomo. Per questo motivo ho voluto inserire in queste pagine la dimostrazione di tutti i teoremi enunciati: le eccezioni credo si contino sulle dita di una mano; e ho cercato di essere semplice e chiaro e allo stesso tempo rigoroso. Questo è più di quanto si faccia normalmente nella scuola, che spesso (secondo me sbagliando) si accontenta di enunciare risultati da usare per risolvere gli esercizi ed essere promossi alla classe successiva. Il senso e l’amore del ragionamento vanno cosı̀ a sperdersi e la Matematica diviene una sequenza di nozioni, da applicare quando necessario, invece di un fatto culturale che forma la mentalità delle persone e fa da riferimento nell’affrontare la realtà che ci circonda (anche se mia moglie sostiene che è meglio cosı̀!) Analogamente, va coltivato il gusto delle definizioni precise, che puntualizzano idee e concetti, spesso piuttosto vaghi nel loro uso quotidiano, e quindi a rischio di diventare ambigui quando si cerchi di portarli alle estreme conseguenze, procedimento utile tutte le volte che si voglia criticare un atteggiamento o un’impostazione, facendo vedere le estreme conseguenze (negative) a cui potrebbe condurre. E, nello stesso spirito, ho cercato anche di introdurre vari concetti dei fondamenti della Matematica, attraverso i quali spero di chiarire cosa si intende per “teoria”, sia nella Matematica, sia in qualsiasi altro settore del sapere umano. INDICE parte e di Apollonio dall’altra. Indubbiamente, questo fu favorito da una inadeguata rappresentazione dei numeri e dalla mancanza di un’Algebra formalizzata. Quando però, dopo Viète, Fermat e Cartesio, l’Algebra (nel senso lato che oggi vi farebbe comprendere anche l’Analisi) prese il sopravvento, un tradimento fu perpetrato nei confronti di tutta la Matematica. La Geometria contemplava due metodologie distinte, anche se utilizzate indifferentemente: la dimostrazione astratta e la costruzione geometrica. Ad esempio, la prova che gli angoli alla base di un triangolo isoscele sono uguali (Teorema 6.12) è puramente astratta e fa riferimento solo a costatazioni di fatto e a risultati già noti. Il teorema di Pitagora, invece, nella prova per mezzo del primo teorema di Euclide (osservazione dopo il Teorema 6.27) fa uso di una costruzione, senza la quale la dimostrazione fallirebbe. Allorché l’Algebra si impose alla Geometria, quest’ultima tipologia di dimostrazione fu relegata in secondo piano e, quando possibile, evitata. La dimostrazione astratta è, idealmente, atemporale. Si svolge nel tempo, come tutte le faccende umane, ma questo sembra e vuol essere più un accidente che una parte intrinseca della prova. Si fanno certe valutazioni che “valgono” indipendentemente dal momento in cui le facciamo; usiamo assiomi o teoremi già dimostrati, che vengono prima “logicamente”, ma che ci rifiutiamo di considerare veri temporalmente prima del teorema che stiamo dimostrando e che ne fa uso. In altre parole, un teorema deve valere indipendentemente dal tempo, sia del momento in cui è stato dimostrato (il che sembra ovvio), ma anche a prescindere da azioni che debbono essere eseguite per dimostrarlo, e questo è un po’ meno ovvio. La costruzione geometrica, invece, non può prescindere dal tempo: prima si fanno certe cose e poi se ne fanno altre, che non si sarebbero potute fare se non avessimo completato quelle precedenti. L’idea di una Matematica statica, del pensare che “la Matematica è quella che è” risulta, proprio nel suo essere vagamente blasfema, un qualcosa di attraente, e più volte è stata riecheggiata da vari matematici, come il “Dio creò i numeri e il resto fu fatto dall’uomo” di Frege e di Platone. E’ anche, però, una concezione vecchia che fa della Matematica uno strumento di studio, cioè di indagine di una natura scritta in caratteri matematici, piuttosto che di una Matematica volta a operare nel mondo e quindi a provare interessi per i procedimenti e non solo pei teoremi. D’altra — parte, gli antichi avevano già chiara questa differenza 3. Fino al 1600 la Matematica è stata essenzial- ed è nota l’affermazione di Proclo sulla Geometria, mente Geometria. Se si escludono Pitagora e i suoi nella quale “si distinguono problemi e teoremi; i priseguaci di tutti i tempi, che ritenevano il numero co- mi contengono la generazione delle figure, i secondi stituire l’essenza dell’Universo, tutta la Matematica dimostrano le proprietà delle figure.” ruotava intorno alla Geometria, di Euclide da una In effetti, i procedimenti o, come è più adeguato 7 INDICE oggi dire, gli algoritmi sono da 300 anni relegati al ruolo secondario di “Matematica applicata”, considerata spesso uno o più gradini inferiore alla “Matematica Pura”. Ad esempio, il metodo di Gauss per la risoluzione dei sistemi lineari, di natura puramente algoritmica, è pressoché ignorato nei testi di Matematica e “relegato” in quelli di Calcolo Numerico. Ognuno ricorda come l’unico algoritmo menzionato dai programmi della scuola è quello di Euclide per il calcolo del massimo comun divisore, ma nessuno lo impara, perchè docenti e studenti preferiscono altri metodi. Oggi, però, l’affermarsi dell’Informatica ha riportato l’interesse per le soluzioni costruttive dei problemi, cioè per gli algoritmi, che costituiscono proprio la base teorica della programmazione. Gli algoritmi, tuttavia, non sono semplicemente un modo astratto per arrivare a programmare un elaboratore; essi sono una metodologia per affrontare problemi di qualsiasi natura e, quindi, per farne uno studio e darne una soluzione rigorosa, analoga ad un teorema, anche se concettualmente diversa. Gli algoritmi hanno influenzato anche parte della logica e stanno prendendo piede in molte parti della Matematica (si pensi al classico caso delle basi di Groebner). Cosı̀ le due metodologie antiche della Geometria classica, quella deduttivo-astratta e quella costruttiva, stanno avvicinandosi di nuovo. In questo testo ho cercato di seguire tale linea, anche se il risultato è a mio parere ancora molto parziale poiché, con mentalità tuttora vecchia, non riesco ad amalgamarle, e continuo a vedere il teorema come la fase di controllo della verità di un risultato e l’algoritmo come il metodo di risoluzione pratica di un problema, che basa la propria validità su un opportuno teorema. — 4. C’è, credo, una differenza fondamentale tra lo studio delle materie umanistiche e quello delle discipline scientifiche. Lo studio delle prime si svolge, idealmente, dal particolare al generale, mentre l’apprendimento delle seconde passa dal generale al particolare. Se, ad esempio, voglio capire che cos’è lo Sturm und Drang, è essenziale che io legga almeno le opere principali degli autori che si rifanno a quel movimento letterario. Solo prendendo atto delle somiglianze e delle differenze che esistono tra i vari autori, delle idee e delle emozioni che ciascuno di loro esprime o cerca di esprimere, mi posso fare un’idea generale di cosa sia lo Sturm und Drang. Spesso è utile leggere quello che è stato scritto sullo Sturm und Drang: un esperto professionista è capace di mettere in evidenza aspetti che abbiamo appena intuito o che non abbiamo afferrato nella loro importanza; un critico geniale può esprimere un punto di vista illuminante o originale. Tutto questo ci aiuta a formarci un’idea personale precisa, cioè a capire che cosa sia lo Sturm und Drang. Naturalmente, se leggiamo i commenti “al posto” delle opere originali, abbreviamo il percorso, ma invece di idee personali avremo acquisito le idee dei commentatori; questo è negativo, anche se talvolta fa parte del gioco. Al contrario, lo studio delle discipline scientifiche (che voglio nettamente distinguere dalla “scoperta scientifica”, di cui dirò più avanti) parte da considerazioni e soluzioni generali di classi di problemi. Infatti, sarebbe una perdita di tempo enorme cominciare ad esaminare soluzioni particolari di problemi specifici per poter poi indurre un metodo globale di soluzione di tutti i problemi della classe considerata. Se si può “dimostrare” che tutti i problemi di una certa classe hanno una determinata soluzione, si studia tale soluzione e poi si verifica se si è capito andando ad utilizzare quella soluzione nei problemi specifici. Questa impostazione vale non solo nel prosaico campo della soluzione pratica dei problemi (la tecnica), ma anche per l’apprendimento dei concetti, che si cerca di dare sempre nella forma più generale possibile, discutendo poi come si specializzino in idee particolari e casi speciali. Di nuovo, diventa un esercizio utile alla comprensione quello di passare dal generale allo specifico. Questo dà a molti l’impressione che la scienza sia dogmatica e che invece di favorire la formazione delle idee, inquadri la mente a seguire certe strade preordinate senza sviluppare un apparato critico appropriato. Ciò, ammettiamolo, può esser vero a un livello molto basso, ma non credo sia diverso dallo studiare la letteratura in un manuale di critica, che presenta le idee dell’autore come verità apodittiche da imparare più o meno a memoria. In realtà, la Matematica, anche negli aspetti più tecnici, fornisce sempre metodi alternativi di soluzione, stimola a cercare strade diverse, invoglia a dimostrare che una soluzione è migliore di altre, almeno nella situazione considerata. Di volta in volta, sta all’intuito, alla bravura e alle conoscenze del solutore trovare la strada più conveniente per affrontare il problema. Proviamo ad esempio a trovare le soluzioni dell’equazione x2 −x−2 = 0: avete cinque minuti di tempo a disposizione. . . .. Sono passati i cinque minuti; vediamo qual è stata la vostra soluzione: 1. avete applicato la formula classica, calcolando il discriminante ∆ = 1 + 8 = 9 e ottenendo x = 2 e x = −1. Bene, conoscete ed apprezzate la tecnica della Matematica, ma la vostra tendenza è quella di prendere le formule come verità da non discutere; 2. visto che i coefficienti sono semplici, avete visto ad occhio, o dopo un po’ di riflessione, che x2 − 8 INDICE x − 2 = (x + 1)(x − 2) e quindi le soluzioni sono 2 e −1. Avete un buon intuito matematico e fra più strade possibili sapete scegliere quella più appropriata al problema; ovvio o banale o chiaro è una conseguenza diretta di regole o proprietà che sono state appena citate o che fanno parte delle basi più semplici della Matematica, quelle cioè che il lettore non deve ignorare. Quindi, se costui non riesce a capire, è perché non sta ponendo 3. avete ragionato cosı̀: x2 −x−2 = x2 +x−2x−2 = attenzione a ciò che legge oppure ha qualche lacuna, x(x + 1) − 2(x + 1) = (x − 2)(x + 1). Altre che è opportuno venga rimossa. Purtroppo, c’è anstrade analoghe sono possibili, ma una soluzione che un uso scorretto dell’“ovvietà”, quando l’autore di questo tipo rivela una notevole predisposizione vuole nascondere qualche zona d’ombra del suo lavoper la Matematica; ro (e questo ha a che fare con l’etica professionale), 4. non avete nemmeno tentato di risolvere l’equa- oppure quando l’autore ha preso un abbaglio. Spero, zione e siete passati a leggere queste conside- in queste note, di non essere caduto in simili scorrazioni: avete un atteggiamento troppo pigro e rettezze, cercando di avvertire quando un punto può se non lo correggete le materie scientifiche non presentare qualche problema. fanno per voi. Ma, ci si può chiedere, non è forse vero che tutta E’ impossibile studiare la Matematica semplicemente leggendo un testo. I libri di divulgazione matematica agiscono “contro” l’apprendimento della Matematica. Possono fornire una serie di concetti, ma questi rimarranno solo in superficie e, dopo la lettura, ci si trova spesso al punto di prima. Per studiare la Matematica occorre leggere, munirsi di carta e penna (qualcuno preferisce la matita, ma va bene lo stesso) e svolgere per proprio conto i calcoli e gli esercizi. Se non si fa cosı̀, si perde tempo e basta. Lo sforzo personale non può essere sostituito da alcun testo, per chiaro che possa essere. Studiare seriamente cento pagine di Matematica equivale a studiare un intero scaffale di libri di una materia letteraria. Chi cerca strade più brevi va incontro a un sicuro fallimento, a meno che non sia un genio: non si sa mai. Oggi esistono programmi sull’elaboratore, quali Mathematica e Maple, che riescono a svolgere quasi tutta la Matematica conosciuta: se avete perso tempo a cercare la soluzione della precedente equazione, a suo tempo questi programmi vi saranno di enorme utilità, ma prima dovrete esservi formate solide basi. Se non avete nemmeno tentato di risolvere l’equazione (caso 4) è inutile che tentiate di utilizzarli: nessuna macchina si può sostituire a voi nel capire e nello svolgere i concetti. O meglio, forse può, ma allora è lei che pensa, e non voi. Non è la stessa cosa. — 5. I testi e gli articoli di Matematica sembrano abbondare di avverbi come “ovviamente”, “chiaramente” e di espressioni quali “è banale dimostrare che”, “si vede subito che”, e cosı̀ via. Poiché anche in queste note non potremo evitare tali modi di dire, è bene si capisca il loro senso, che parrebbe introdurre un aspetto troppo personale (per taluni una cosa può essere chiara, per altri molto meno) nel mondo oggettivo della Matematica. In realtà tali espressioni hanno un significato “abbastanza” preciso, e cioè vogliono significare questo: ciò che è dichiarato essere la Matematica è conseguenza di una serie ristretta di assiomi, ai quali vengono applicate regole di deduzione che man mano ci dimostrano tutti i teoremi ai quali siamo interessati? Nella Sezione ?? parleremo esplicitamente di questo aspetto, detto metodo assiomatico, e la risposta sı̀ a questa domanda ci dice allora che tutto nella Matematica dovrebbe essere ovvio e banale, visto che assiomi e regole di deduzione non possono [ovviamente] essere ignorati e tutto il resto è conseguenza diretta di quelli. Anche se c’è qualcosa di vero in tutto questo, e si può pensare ad una macchina che, da sola, sviluppasse tutta la Matematica, [s]fortunatamente le cose non stanno proprio cosı̀. Vogliamo dare alcune motivazioni di questo fatto: 1) La derivazione meccanica di tutti i settori della Matematica (a parte le difficoltà intrinseche, di tempo e di spazio, che comporterebbe) ci darebbe una visione piatta della Matematica stessa. Con questo voglio dire che ogni teorema avrebbe la stessa rilevanza di tutti gli altri e in effetti non sapremmo quali risultati, fra gli infiniti risultati che avremmo ottenuto, ci può servire più degli altri per risolvere un certo problema; anzi, addirittura, non sapremmo come e dove andare a cercarlo. Questa argomentazione ci mostra un punto importante della Matematica umana: noi procediamo per problemi, non per catene deduttive; per noi certi problemi sono importanti, altri meno. Noi costruiamo modelli della realtà e siamo interessati a sviluppare le teorie matematiche che stanno dietro a tali modelli; procediamo, cioè, in modo utilitaristico, non nel senso materialista del termine, ma nel senso che cerchiamo risultati utili alla nostra conoscenza. Quindi operiamo delle scelte e tali scelte dipendono da noi, non dalla consequenzialità della Matematica. Da questo punto di vista, più utile sarebbe una macchina alla quale potesse essere dato l’enunciato di un possibile teorema e quella ci dicesse se è vero oppure no. Questo si riesce a fare in molti settori ben delineati, ma rimane al momento il problema di una macchina dimostratrice universale. INDICE 9 Forse un giorno verrà realizzata, ma per ora si stanno risultato e cerca vari mezzi per convencersi che esso solo sviluppando teorie matematiche su macchine del è valido. Tali mezzi vanno dal proprio intuito alla sperimentazione in casi particolari, dalla discussione genere. 2) Se il precedente è un criterio di opportunità, con i colleghi alla simulazione sul calcolatore, e tanesiste anche un criterio logico per preferire o repu- ti altri marchingegni fra i quali ci può ben stare la tare necessario un approccio umano alla Matemati- dimostrazione formale. Qualcuno, a questo propoca. Gödel ha dimostrato che le nostre formalizzazioni sito, ha sostenuto e sostiene che la formalizzazione della Matematica non possono essere complete, inten- matematica è un sovrappiù, e quando una cosa è vedendo con questo che non ci possono permettere di ra tutti si possono convincere (a loro modo) che tale dimostrare tutti i risultati “veri”. In altre parole, la essa è. Questo però è del tutto irrazionale e, cosa macchina che pur potesse derivare tutta la Matemati- più importante, io non ci credo. Riconosco che ogni ca a partire dagli assiomi, non riuscirebbe comunque matematico si possa convincere della validità di un ad arrivare a dimostrare tutte le verità della Mate- teorema nel modo che crede più opportuno; il fatto, matica stessa. Alcune di esse (in realtà, infinite) ri- però, è che non deve crederci lui solo, specie se è un marrebbero fuori. Non sappiamo se l’uomo sarebbe risultato al quale è arrivato per primo, ma deve concapace di fare di meglio, né sappiamo se sia già riu- vincere anche gli altri che le cose stanno come lui crescito a fare qualcosa di più, ma naturalmente vale la de. Ecco allora che la dimostrazione diviene il mezzo pena di tentare, anzi sarebbe eticamente scorretto se comunicativo per eccellenza, nella Matematica come in tutta la scienza, poiché è in grado di darci ragioni non lo tentassimo. obiettive, o anche semplicemente intersoggettive (per 3) Esiste, infine, anche un criterio estetico. Ogni chi non crede all’universalità della scienza) per essere teorema ha più dimostrazioni; la macchina che ab- convinti che una certa affermazione è vera. Questo è biamo ipotizzato genererebbe tutte le prove possibili, il ruolo semantico fondamentale della dimostrazione rendendo ancora più difficile il nostro eventuale lavoro matematica e la giustificazione dell’esistenza dei libri di ricerca dei teoremi interessanti, che apparirebbero, di Matematica nella forma che essi hanno. E’ questa con tutti gli altri, innumerevoli volte. In effetti, ogni credenza, assieme al citato aspetto estetico delle didimostrazione umana ha un proprio carattere (se si mostrazioni, che creano ciò che abbiamo chiamato il preferisce, non ho obiezioni ad affermare che siamo “gusto della dimostrazione”, non acquisendo il quale noi a darglielo), e alcune ci appaiono ovvie e scon- penso che si perda molto del fascino della Matematate nel senso detto, altre sono interessanti o geniali tica. Essa allora diviene semplice strumento tecnico, per l’impostazione adottata o il metodo utilizzato, al- semmai difficile da usare, e/o fonte di curiosità, meno tre ancora rivelano connessioni inusitate con aspetti vicine alla scienza che all’enigmistica (disciplina che diversi, che semmai nulla hanno a che fare con l’argo- personalmente non disprezzo affatto). mento trattato. Queste due ultime categorie sono le dimostrazioni che preferiamo, sono quelle che danno — soddisfazione e meritano alla Matematica l’appellativo di Arte. Il Mathematical Intelligencer, una rivista 6. Concludo questa non breve introduzione con alscientifica, nel 1998 ha indetto una specie di votazione cune osservazioni su come è stata scritta questa serie per le più belle dimostrazioni della storia della Mate- di appunti di Matematica, che naturalmente risenmatica. Ha vinto la prova di Eulero per eiπ = −1 (un tono del mio modo di vedere la materia, le mie varie risultato che purtroppo trascende l’ambito di queste idiosincrasie e i pallini che ho acquisito con la frequennote). Questo mostra come l’aspetto estetico (un’e- tazione della materia del mio lavoro, e cioè l’Informastetica un po’ sui generis, se si vuole) abbia un ruolo tica. Va da sé che non mi permetterei mai di scrivere non indifferente nell’arido mondo della Matematica. un libro sulla Matematica seria, dove i colleghi maQueste considerazioni si legano a un altro aspetto che amo mettere in rilievo, e cioè la differenza tra un libro di Matematica e la soluzione matematica dei problemi. Qui intendo per problema una qualsiasi questione di Matematica, dall’esercizio didattico ai grandi temi della ricerca matematica (d’altra parte, per chi affronta per la prima volta un esercizio, esso è un tema di “ricerca”, l’unica differenza essendo che esso è già stato risolto da qualcuno). La “scoperta” matematica non avviene mai (o quasi mai) nel modo razionale in cui si espongono i risultati; piuttosto, il matematico intuisce, o immagina, o si figura un certo tematici sono ben più esperti e bravi di me: io mi posso limitare a scrivere delle semplici note su quelle parti della Matematica che tutti (e quindi, anche io) dovrebbero sapere. Note: Ho inserito nel testo un bel po’ di note che, spero, non siano del tutto peregrine. La loro natura è piuttosto varia: alcune sono note di approfondimento del materiale esposto nella sezione; altre sono considerazioni di carattere storico; alcune sono curiosità o divagazioni sul tema; altre infine sono anticipazioni o rimandi che non potevano essere inserite nel testo vero e proprio. Questo dovrebbe essere intelligibile 10 INDICE anche senza le note; in altre parole, se un lettore tra- per verificare i risultati dei programmi realizzati. lascia (ad esempio ad una prima lettura, ammesso che voglia leggere queste cose due volte) le note, dovrebbe riuscire a seguire tutti gli argomenti senza perdere nulla di essenziale alla comprensione. Spero che le note (questo è almeno il compito che io intendo loro affidare) soddisfino qualche curiosità e, soprattutto, ne sollevino molte altre, invogliando cosı̀ il lettore a proseguire questi studi, per i quali potrà utilmente ricorrere a testi universitari specifici, che incontrerà andando avanti negli studi. Punto decimale: La virgola che separa la parte intera di un numero dalla sua parte decimale costituisce una mia piccola idiosincrasia. Di fronte alla scrittura (5, 32) è spesso difficile rendersi conto (specie nello stampato, quando gli spazi sono ridotti al minimo indispensabile) se siamo di fronte al numero decimale cinque virgola trentadue o alla coppia di numeri interi 5 e 32. Per questo, preferisco alla virgola il punto decimale della notazione anglosassone, della quale ovviamente rifiuto l’uso della virgola per indicare i raggruppamenti in migliaia, milioni, etc.: a questo scopo userò un punto situato in alto. Pertanto, senza ambiguità, scrivere (51, 328) indicherà la coppia di numeri 51 e 328; scrivere (51.328) vorrà significare il numero decimale 51 punto 328; scrivere infine (51. 328) denoterà il numero intero cinquantuno mila trecentoventotto. Esercizi: Come ho avuto modo di affermare, lo studio della Matematica si deve fare con carte e penna o matita, e soprattutto si devono risolvere problemi, poiché solo la pratica ci rende familiari con i metodi di risoluzione che la Matematica ci fornisce. Questo testo è privo di esercizi, e ciò è una grave lacuna. E’ mia intenzione rimediare con un testo di esercizi, in parte anche svolti. Però, siccome ho le mie idee su come impostare un tale testo, per il momento la cosa è ancora in fieri e non so immaginare quando potrà essere realizzato. In queste note, spesso suggerisco di scrivere programmi sull’elaboratore che realizzano o simulano certi risultati: poiché naturalmente penso ai futuri studenti di Informatica, questi sono esercizi pressoché indispensabili. Visto che oggi l’Informatica ha pervaso un po’ tutte le materie, gli stessi esercizi penso possano essere utili anche agli altri, che avranno cosı̀ occasione per imparare un po’ di programmazione. Il linguaggio da usare è indifferente: il Pascal va tanto bene quanto il C; oggi il C++ e il Java sono più à la page ed introducono alla programmazione ad oggetti. Chi mai avesse a disposizione il Maple o Mathematica, può utilizzarli come linguaggi di programmazione a tutti gli effetti, anche se tanti degli esercizi sono già funzioni predefinite in tali linguaggi; il trucco sta nel programmare ignorando (o facendo finta di ignorare) tali funzioni e, semmai, utilizzarle Capitolo 1 Il linguaggio della Matematica fra di essi senza averne una coscienza esplicita. Cosı̀ diciamo che “tutti gli uomini hanno un naso”, aggregando in un’unica classe tutte le persone (passate, presenti e future), e allo stesso tempo separando quella che è una semplice parte di una persona, cioè il naso. Se l’ipotiposi del sentimento personale prostergando i prolegomeni della subcoscienza fosse capace di reintegrare il proprio soggettivismo alla genesi delle concomitanze, allora io rappresenterei l’autoprasi della sintomatica contemporanea che non sarebbe altro che la trasmificazione esopolomaniaca. Che bel talento, eh? Ma io non ci tengo né ci tesi mai . . . E. Petrolini “Gastone” 1.1 Gli insiemi La Matematica costituisce un vero e proprio linguaggio. Esso serve per esprimere proposizioni che riguardano quantità o relazioni. La forma più elementare di quantità è il numero e la forma più elementare di relazione è il confronto tra numeri. I numeri hanno avuto origine con il contare e al contare è collegato anche il confronto, per cui il numero cinque è inferiore al sette perché contando si arriva prima al cinque che al sette. Altre quantità, come la lunghezza o il peso, sono state acquisite dall’uomo molto presto e con esse è nato il concetto di misura. Il confronto fra numeri è stato poi generalizzato al concetto di relazione tra quanttà diverse: in questo modo sono state definite relazioni come quella che lega l’altezza del sole al passare del tempo, o quella che vogliamo instaurare tra il peso o la lunghezza di un oggetto e il suo costo. Prima di parlare di numero, occorre che ci intendiamo su cosa vogliamo e possiamo contare. La nostra mente concepisce la realtà secondo due metodi apparentemente contrapposti. Il primo tende a comporre vari oggetti in una entità unica, come quando pensiamo al “salotto” come all’aggregazione tra una stanza, mobili quali divano, poltrone e tavoli, e suppellettili quali quadri, soprammobili, ecc. Il secondo tende a scomporre un individuo in varie parti, ad esempio quando pensiamo a una persona come composta di una testa, un tronco, due braccia e due gambe. Questi due modi di vedere la realtà, detti rispettivamente aggregazione e separazione, non sono nettamente distinti l’uno dall’altro e noi ci muoviamo mentalmente 11 Per intenderci, ogni volta che saremo di fronte a processi di aggregazione o di separazione, distingueremo tra un individuo, considerato come un tutto unico e che chiameremo insieme, dalle parti in cui lo immaginiamo separato, che diremo elementi. In tal modo, vedremo il salotto come un insieme composto dagli elementi “stanza”, “divano”, ecc., e gli elementi “testa”, “tronco” e via di seguito come costituenti l’insieme “persona”. Gli insiemi e gli elementi sono i primi concetti che si incontrano nella Matematica. Volendo astrarre dalla loro natura specifica, useremo una notazione neutra, accettata ormai in tutte le parti della Matematica. Gli elementi si denotano con le prime lettere minuscole dell’alfabeto latino e gli insiemi con le lettere maiuscole. Per dire che un insieme A è composto dagli elementi a, b, c, d, si scrive A = {a, b, c, d}, dove le parentesi graffe corrispondono a ciò che abbiamo chiamato aggregazione e le virgole alla separazione. L’ellissi “. . . ” serve a denotare elementi che non si vogliono o non si possono specificare, come quando scriveremo A = {a, b, c, . . . , z}. Naturalmente, le convenzioni notazionali appena date hanno senso per insiemi generici; per insiemi specifici potremo adottare notazioni specifiche, disturbando lettere speciali, in grassetto o in gotico o dall’alfabeto greco, e simboli con significato particolare. Ad esempio, l’insieme dei numeri naturali, quelli con i quali contiamo (lo zero compreso), sarà indicato con N = {0, 1, 2, 3, . . .}, dove l’ellissi, questa volta, indica che non vogliamo scrivere i restanti elementi (perché li conosciamo) e che non possiamo riportarli tutti, in quanto non sono in numero finito. I simboli 0, 1, 2, 3, etc. hanno un significato convenzionale, accettato quasi universalmente: nei testi scritti in cirillico, arabo, cinese o giapponese, i numeri sono ormai scritti con le nostre dieci cifre arabiche, 12 CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA da sinistra verso destra. A B A B Per indicare il fatto che un certo elemento a appartiene ad un insieme A, si scrive a ∈ A e “∈” si dice simbolo di appartenenza; la sua negazione è a 6∈ A. Se P è l’insieme dei numeri pari, 10 ∈ P e 15 6∈ P. A∪B A∩B Siano A e B due insiemi tali che ogni elemento di B sia anche elemento di A: si dice che B è un sottoinsieA B A B me di A e si scrive B ⊆ A; se poi A contiene almeno un elemento che non sta in B, allora B è un sottoinsieme proprio di A e si scrive B ⊂ A. Ad esempio, P ⊂ N, dato che ogni numero pari è un numero, ma esistono numeri che non sono pari. Due insiemi A e A\B A△B B sono uguali, e si scrive A = B, se ogni elemento di A è anche elemento di B e, viceversa, ogni elemento di B è anche elemento di A. In altre parole, Figura 1.1: Diagramma di Venn A = B significa che A ⊆ B e, contemporaneamente, B ⊆ A. Spesse volte, per dimostrare che due insiemi sono uguali, si applica questa osservazione, provando che ogni elemento del primo appartiene al secondo, e legge “tale che”. Le seguenti tre operazioni tra insiemi ricorrono con estrema frequenza in tutte le parti viceversa. della Matematica: E’ bene rendersi conto perfettamente della differenza fra il concetto di appartenenza e quello di “conte• Unione: l’unione di due insiemi A e B si scrive nuto”: il primo mette in relazione un elemento con A ∪ B ed è l’insieme composto dagli elementi che un insieme, il secondo mette in relazione due insiemi. stanno in A, stanno in B oppure stanno in tutti Si sia certi di capire il seguente esempio: dato l’ine due gli insiemi; sieme A = {a, b, c, d}, si consideri l’elemento b ∈ A e si definisca B = {b}. In altre parole, B è l’insieme • Intersezione: l’intersezione di due insiemi A e B composto dal solo elemento b. Come insieme, si ha si scrive A ∩ B ed è l’insieme degli elementi che B ⊂ A, ma non hanno senso nessuna delle scritture stanno contemporaneamente in A e in B; b ⊂ A e B ∈ A. Infine, ricordiamo che se B ⊂ A (B ⊆ A), si può scrivere in modo equivalente A ⊇ B • Differenza: la differenza tra due insiemi A e B (A ⊃ B), che si legge “A contiene (propriamente) B” si scrive A\B ed è l’insieme degli elementi che e si dice che A è un soprainsieme di B. stanno in A, ma non appartengono a B. Un insieme privo di elementi, come l’“insieme degli unicorni” si dice un insieme vuoto. Se pensiamo all’“insieme dei triangoli con quattro lati”, ci rendiamo conto che di insiemi vuoti ne esiste uno solo, quello privo di qualsiasi elemento. L’insieme vuoto si indica con ∅. Si considera che l’insieme vuoto sia contenuto in (sia un sottoinsieme di) ogni altro insieme, e quindi sia un sottoinsieme improprio di sé stesso. Per completezza, ricordiamo che un insieme può essere definito elencando tutti i suoi elementi, come quando poniamo A = {1, 2, 3, 4, 6, 12}, e si dice che l’insieme è definito per estensione. Alternativamente, possiamo definire un insieme come composto di tutti e soli gli elementi che soddisfano una certa proprietà; ad esempio, possiamo porre B = {divisori di 12}, dove le parentesi graffe si leggono ancora “l’insieme dei”; in questo caso A = B, ma si dice che B è definito per intensione (attenzione, questa parola si scrive con la lettera “s”!). In modo più formale, si dovrebbe scrivere B = {x | x divide 12} e si legge “l’insieme degli elementi x tali che x divide 12”. Si osservi che x è una variabile di comodo e che la barra verticale si Due insiemi A e B si dicono disgiunti se la loro intersezione è l’insieme vuoto, cioè A∩B = ∅. L’unione disgiunta degli insiemi A, B si denota A ⊎ B, e corrisponde all’unione di A e di B quando questi siano disgiunti, o siano stati resi tali marcando in modo diverso i loro elementi cosı̀ da renderli distinguibili. Infine, la differenza simmetrica fra i due insiemi A, B è definita dalla relazione: A△B = (A \ B) ∪ (B \ A). Le operazioni tra insiemi si intuiscono facilmente se ci aiutiamo graficamente con i ben noti diagrammi di Venn: in tali diagrammi un insieme è rappresentato dai punti di un cerchio e quindi, disponendo opportunamente due o più cerchi, si può visualizzare l’effetto di una qualsiasi operazione tra insiemi. Nella Figura 1.1 abbiamo evidenziato in grigio le quattro operazioni introdotte. I diagrammi di Venn permettono anche di dare una prova grafica alle proprietà delle operazioni; ad esempio, si vede immediatamente che: A△B = (A ∪ B) \ (A ∩ B), 1.1. GLI INSIEMI 13 come d’altra parte si scopre facilmente la proprietà l’intersezione. Le proprietà di idempotenza, ugualdistributiva dell’unione rispetto all’intersezione: mente, non hanno corrispondenza nei numeri, ma ci dicono che, al contrario di questi, operando con un A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C). solo insieme non possiamo ottenere molto di più. Le regole che coinvolgono il complemento ci informano A B A B che questo ha qualcosa delle proprietà dell’opposto o dell’inverso nei numeri, cioè l’operazione che da 4 ci porta a −4 (opposto) oppure a 1/4 (inverso). Prima di tutto, l’opposto dell’opposto ci dà il numero di partenza, come ce lo dà l’inverso dell’inverso: cosı̀ agisce anche il complemento. L’analogia esiste anche C C con le regole a + (−a) = 0 e a × (1/a) = 1, ma qui, anche identificando 0 con ∅ e 1 con U , le regole sono A ∪ (B ∩ C) (A ∪ B) ∩ (A ∪ C) più stringenti, ed è come avessimo a × (−a) = 1 e a + (1/a) = 0, il che ben sappiamo non essere vero. Infine, in P(U ) valgono le celebri regole di De MorIn modo analogo il lettore è invitato a “dimostra- gan); costui era un matematico inglese della prima re” la proprietà distributiva dell’intersezione rispetto metà del 1800, che anticipò alcune idee di Boole sulla all’unione, cioè: logica formale; insegnò ad Ada Byron, la figlia del poeta, che fu cosı̀ brava da aiutare Charles BabbaA ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C). ge nell’uso della Macchina Analitica, tanto da essere considerata la prima programmatrice della storia (cirSpesso, si fissa un particolare insieme U , detto inca 1840). Le regole di De Morgan legano tra di loro sieme universo, e si considerano tutti i suoi sottoinsietutte e tre le operazioni definite su P(U ); possono esmi, che costituiscono il cosiddetto insieme delle parti sere facilmente verificate con l’uso dei diagrammi di di U e si denota con P(U ). Chiaramente, U ∈ P(U ) Venn, ma invitiamo il lettore a riflettere un po’ sul e ∅ ∈ P(U ), e per ogni A ⊆ U si definisce il comloro significato per cercare di capirlo senza l’aiuto di plemento di A (in U ) come la differenza A = U \ A; un disegno. Le regole non sono banali e può essere ovviamente, U = ∅ e ∅ = U : in generale A = A. Le un esercizio utile quello di raffigurarci mentalmente tre operazioni di unione, intersezione e complemento, il loro senso. definite in P(U ), godono di una serie di proprietà, che elenchiamo nella Tabella 1.1: esse si dicono proNota 1.1 Quella che abbiamo considerato è prietà dell’Algebra Booleana e le ritroveremo anche un’impostazione intuitiva della teoria degli insiemi. più avanti. Il lettore è invitato a dimostrare queste Dopo la sua introduzione da parte di Boole, Frege e proprietà con il metodo dei diagrammi di Venn. Cantor, il concetto di insieme venne variamente criticato e ci si accorse presto che tutta la teoria non poPossiamo dire due parole su questo elenco di regole. teva essere lasciata all’intuizione, ma doveva rientrare Esse assomigliano, ma non coincidono, con le regole nei canoni di un formalismo che, proprio in quell’edelle operazioni numeriche, che tutti conosciamo. Ad poca, si stava affermando e che, in un qualche moesempio, la proprietà commutativa è la stessa, mendo abbastanza miserevole, cercheremo di esporre nelle tre la proprietà distributiva sembra più ampia e vaprossime sezioni. Uno dei colpi di maglio che furono le tanto per l’unione rispetto all’intersezione, quanto sferrati contro l’impostazione intuitiva della teoria denel caso opposto; per i numeri, possiamo distribuigli insiemi è certamente il paradosso di Russell, che il re il prodotto rispetto alla somma, ma non vicevermatematico e logico inglese propose nel 1902. Ecco cosa. Questa analogia ha portato, specie all’inizio della me ragionò Russell. Il concetto di insieme sembra postoria della teoria degli insiemi, a parlare dell’unione ter schematizzare quella capacità di aggregazione che la mente umana possiede e sulla quale si basa parte come della “somma” tra insiemi e dell’intersezione della nostra conoscenza. Quindi possiamo aggregacome del “prodotto”. In effetti, se A e B sono due re oggetti in insiemi, ma anche insiemi in insiemi di insiemi disgiunti, rispettivamente con m ed n elemeninsiemi, e cosı̀ via, all’infinito. Possiamo addirittura ti, la loro unione A ∪ B = A ⊎ B contiene esattamente pensare all’insieme G di tutti gli insiemi. Questo inm + n elementi. Tuttavia, l’analogia finisce qui, dato sieme globale gode di una strana proprietà: esso deve che A ∩ B = ∅ e, in generale, A ∩ B ha meno elementi contenere sé stesso come elemento, in quanto contiedel solo A o del solo B. ne tutti gli insiemi. Generalmente, un insieme non Caratteristica degli insiemi è la proprietà di assorcontiene sé stesso come elemento, ma G non è certo bimento: A ∩ B è contenuto in A, per cui, se poi agl’unico insieme con tale proprietà. Ad esempio, “L’ingiungiamo tutto A, quello che otteniamo è proprio A; sieme di tutti gli insiemi che possono essere definiti con meno di venti parole italiane”, è un insieme deficosı̀ A ∪ B contiene A, e quindi ritorniamo ad A dopo 14 CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA commutativa associativa distributiva assorbimento idempotenza complemento identità zero doppia negazione de Morgan A∪B =B∪A A∩B =B∩A A ∪ (B ∪ C) = (A ∪ B) ∪ C A ∩ (B ∩ C) = (A ∩ B) ∩ C A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) A ∪ (B ∩ A) = A A ∩ (B ∪ A) = A A∪A=A A∩A=A A∩A=∅ A∪A=U A∪∅=A A∩U =A A∪U =U A∩∅=∅ A=A A∪B =A∩B A∩B =A∪B Tabella 1.1: Le regole dell’Algebra Booleana nito per intensione che contiene sé stesso, proprio per come l’abbiamo definito. Allora, gli insiemi si suddividono in due grandi classi: l’insieme P degli insiemi che contengono sé stessi, e l’insieme N di tutti gli altri. Ci chiediamo (cioè, si chiese Russell): l’insieme N dove si trova, in P o in N ? Se N stesse in N , sarebbe allora un elemento di sé stesso, ma ciò contraddice la sua definizione. Supponiamo allora che N stia in P ; ma per definizione di P , N dovrebbe contenere sé stesso, e siamo di nuovo in contraddizione. Non ci sono però altre possibilità, e siamo giunto a un paradosso. Lo stesso Russell, con Whitehead, sviluppoò una teoria assiomatica degli insiemi che permettesse di evitare questo ed altri paradossi. Un’altra importante assiomatizzazione è dovuta a Fraenkel e Zermelo. Ma noi, detto questo, ci dobbiamo arrestare. Avvertiamo solo che queste teorie rendono conto del concetto di numero cardinale (che vedremo) e di numero ordinale, che invece non vedremo. Questi ultimi “numeri” vogliono generalizzare all’infinito la categoria grammaticale di primo, secondo, terzo, etc.; naturalmente, le cose si complicano e ce ne possiamo rendere facilmente conto pensando di scrivere l’insieme (ordinato) dei numeri naturali, seguito da un’altra serie di numeri naturali. In questo insieme, qual è il numero d’ordine del secondo 1? 1.2 Le relazioni Gli insiemi, anche con la distinzione tra il tutto e i singoli elementi, non esauriscono il nostro modo di concepire il mondo; un altro aspetto essenziale è dato dalle relazioni reciproche tra gli insiemi e tra gli elementi. A ben guardare, tra questi oggetti abbiamo già introdotto almeno due relazioni: quella di appartenenza, che associa elementi ed insiemi, e quella di “contenuto”, che invece mette in relazione insiemi con insiemi. Se poi allarghiamo il nostro campo visuale a tutta la Matematica, vediamo che fra i numeri esistono le relazioni di uguaglianza, di minoranza, di maggioranza, di divisibilità e tante altre. Nella Geometria abbiamo la congruenza, la similitudine e l’equivalenza tra figure. E se passiamo al mondo che ci circonda, ci rendiamo conto che di fatto viviamo in un universo di relazioni tra persone, fra gruppi, fra nazioni, fra oggetti, e cosı̀ via. La parentela e l’amicizia tra persone, l’alleanza e il confinamento tra stati, l’esser sopra, sotto, dentro o fuori tra oggetti, sono relazioni con le quali abbiamo a che fare in ogni istante. Volendo formalizzare, almeno un po’, la nostra idea di “relazione”, possiamo cominciare restringendo il nostro interesse alle cosiddette relazioni binarie, quelle che cioè coinvolgono solo due insiemi di elementi o, se si vuole, mettono in connessione due soli elementi, che possono far parte o meno dello stesso insieme. Ad esempio, spesso si parla di “gruppi di amici”, intendendo che la relazione coinvolga più persone contemporaneamente; tuttavia, in questo caso, è facile immaginare che l’amicizia di gruppo sia il risultato di una serie di amicizie tra coppie di persone, e di tre amici A, B, C si possa dire che formano un gruppo di amici se A è amico di B, B di C e C di A. Talvolta questa riduzione è più difficile, ma immaginiamo che la si possa fare, oppure immaginiamo di non interessarci ad altri tipi di relazione. Una relazione binaria può essere data in due maniere diverse: 1. elencando puntigliosamente tutte le coppie di elementi che sono in relazione, cioè dando una definizione per estensione. La relazione di amicizia tra persone o di alleanza tra stati non può essere data che in questo modo; 2. dando una regola che permetta di stabilire, senza ambiguità, quando due elementi sono in relazione. Due stati sono confinanti se hanno un tratto di confine in comune, a prescindere da qualsiasi elencazione. Siamo di fronte a una definizione per intensione. L’elencazione, con un po’ di buona volontà, può essere assimilata a una regola, o legge, e quindi spesso si dice che una relazione è data da una legge che permette di associare gli elementi in relazione tra di loro, 15 1.2. LE RELAZIONI e quindi ci fornisce anche un criterio per dire quando due elementi non sono in relazione. Intuitivamente, avere un criterio per definire una relazione sembra essere il modo più naturale di impostare il problema, e sarà questo metodo intensionale che seguiremo nella presente sezione per esporre i principali tipi di relazione che si trovano nella Matematica. Tuttavia, prima di far questo, vogliamo ricordare la definizione matematica di relazione, che invece fa riferimento all’idea di estensione. Se A e B sono due insiemi (fra i quali vogliamo definire una relazione), si chiama prodotto cartesiano di A e B, e si indica con A × B, l’insieme di tutte le coppie ordinate (a, b) dove a ∈ A e b ∈ B. Ad esempio, se A è l’insieme di due elementi A = {maglia, camicia} e B è l’insieme di tre elementi B = {bianca, azzurra, fantasia}, il prodotto A × B è costituito dalle sei coppie: (maglia, bianca) (camicia, bianca) (maglia, azzurra) (camicia, azzurra) (maglia, fantasia) (camicia, fantasia). E’ bene distinguere chiaramente il concetto di coppia (ordinata) da quello di “insieme di due elementi”: la coppia (a, b) è diversa dalla coppia (b, a), anche se a e b appartengono allo stesso insieme; infatti, l’ordine degli elementi è essenziale. Viceversa, i due insiemi {a, b} e {b, a} sono lo stesso insieme, composto dai due elementi a e b, indipendentemente dall’ordine con cui essi sono scritti. Il nome di “prodotto cartesiano” deriva dalla Geometria Analitica, dove il piano cartesiano è costituito da tutte le possibili coppie di numeri reali, e quindi è proprio R × R. E’ facile vedere che se A e B sono due insiemi che contengono, rispettivamente, m ed n elementi, il loro prodotto cartesiano A×B contiene proprio m×n coppie distinte, il che, se si vuole, giustifica il nome di “prodotto“ per questa operazione. Accettato questo concetto, che associa gli elementi di A con quelli di B in tutti i modi possibili, la definizione di relazione è semplice: si dice relazione o corrispondenza tra A e B un qualsiasi sottoinsieme del prodotto cartesiano A × B. Il sottoinsieme determina le coppie di elementi in relazione tra di loro; le coppie che non appartengono al sottoinsieme, quindi, sono formate da elementi che non sono in relazione tra di loro. L’esempio precedente può essere illuminante: il mio guardaroba di maglie e camicie è una relazione che lega questi oggetti a possibili colorazioni: la relazione è data dal fatto che tali oggetti sono miei e non di qualcun altro (il guardaroba di un’altra persona costituirà un’altra relazione). Se ho due maglie, una bianca e una azzurra, e due camicie, una bianca e una fantasia tipo hawaiano, si vede immediatamente come il mio guardaroba sia un sottoinsieme di A × B. Nota 1.2 Aver insistito sulle relazioni binarie, è solo una semplificazione espositiva. Il prodotto cartesiano può essere esteso a un numero qualsiasi di insiemi: A1 × A2 × · · · × An è l’insieme delle n-uple ordinate (a1 , a2 , . . . , an ) composte con a1 ∈ A1 , a2 ∈ A2 , . . . , an ∈ An . Come per le coppie, anche per le terne, le quadruple, . . ., le n-uple l’ordine degli elementi è essenziale, e ciò distingue queste entità dagli insiemi di 3, 4, . . . , n elementi. Quando i vari insiemi sono di fatto lo stesso insieme A, si scrive A3 per A × A × A, e via di seguito. Una relazione o corrispondenza n-aria fra gli insiemi A1 , A2 , . . . , An è un sottoinsieme D del prodotto cartesiano A1 × A2 × · · · × An e gli elementi a1 , a2 , . . . , an si dicono in relazione o in corrispondenza tra di loro se la n-upla ordinata da loro composta appartiene a D. Le relazioni cosı̀ definite sono un concetto veramente basilare del nostro modo di concepire il mondo che ci circonda, tanto è vero che oggi costituiscono le strutture di riferimento per la modellazione della realtà operata, in Informatica, dalle Basi di Dati. Quando si vogliono gestire le informazioni di un’Azienda, si costruisce la base di dati che rappresenta il Sistema Informativo Aziendale. Tale base di dati non è altro che l’insieme delle relazioni che legano tra di loro le informazioni di tutta l’azienda (Modello Relazionale). Ad esempio, semplificando al massimo, una delle relazioni può essere un sottoinsieme R del prodotto N × C × D × Q × S, dove N è l’insieme dei nomi propri, C quello dei cognomi, D quello delle date di nascita, Q quello delle qualifiche e S quello degli stipendi annuali. La quintupla (Luigi, Rossi, 04/12/1975, D8, 32000), se appartiene ad R significa che il Sig. Luigi Rossi, nato il 4 Dicembre del 1975, ha la qualifica D8 (qualunque cosa ciò voglia significare) e guadagna 32 mila e all’anno. E’ interessante osservare come le relazioni, che costituiscono la base dei dati, e le associazioni fra le relazioni (cioè, le relazioni tra relazioni) permettano una modellazione operazionale di realtà complesse come quelle di aziende private e enti pubblici di qualsiasi dimensione. Alcune relazioni hanno un ruolo molto importante nella Matematica; citiamo le relazioni di equivalenza e di ordine tra elementi dello stesso insieme, e le funzioni tra elementi di insiemi (spesso) diversi. Su queste relazioni vogliamo ora entrare in maggiori dettagli. L’uguaglianza (tra numeri, tra figure o tra oggetti qualsiasi, non ha importanza) è una relazione che tutti conosciamo; essa fa parte di un gruppo di relazioni caratterizzate da alcune proprietà e che è noto col nome di “relazioni di equivalenza”. Formalmente, una relazione di equivalenza è una relazione tra gli elementi dello stesso insieme A (e, quindi, è un sottoinsieme di coppie appartenenti ad A × A = A2 ) che gode delle seguenti proprietà: 1. proprietà riflessiva: ogni elemento a ∈ A è in relazione con sé stesso; 16 CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA 2. proprietà simmetrica: se un elemento a ∈ A è in relazione con un elemento b ∈ A, allora anche b è in relazione con a; 3. proprietà transitiva: se un elemento a ∈ A è in relazione con b ∈ A e questo, a sua volta, è in relazione con c ∈ A, allora anche a è in relazione con c. La prima proprietà sembra ovvia, ma non lo è poi tanto, visto che molte relazioni come “a è diverso da b” non ne godono affatto. L’uguaglianza, la congruenza, la similitudine e l’equiscomponibilità tra figure sono relazioni di equivalenza. Un esempio meno ovvio lo si ha considerando le espressioni aritmetiche (ad esempio, formate da numeri e le operazioni di somma e sottrazione, come si studiano in IV elementare) e dire che sono equivalenti se e solo se hanno lo stesso valore. Ogni espressione è equivalente a sé stessa; se 2 + 3 = 1 + 4 allora 1 + 4 = 2 + 3 e, infine, se è anche 1 + 4 = 7 − 2, allora 2 + 3 = 7 − 2. Nota 1.3 Sia definita su A una relazione che goda delle proprietà simmetrica e transitiva. Se a, b ∈ A sono due elementi in relazione tra di loro, cioè a è in relazione con b, per la proprietà simmetrica è anche b in relazione con a. Per la proprietà transitiva, applicata a questi due casi, si ha che a è in relazione con sé stesso. Deve allora valere la proprietà riflessiva. Ci possiamo chiedere: se, come sembra da questo ragionamento, la proprietà riflessiva consegue dalle altre due, perché l’abbiamo inserita esplicitamente nella definizione? In realtà il ragionamento vale solo se a è in relazione con almeno un altro elemento, diverso da lui o no. Ma se nell’insieme esiste un elemento che non è in relazione con nessun altro elemento (nemmeno sé stesso) l’argomento viene a cadere e la proprietè riflessiva non vale più nella globalità dell’insieme. Avere una relazione di equivalenza R su un insieme A è la stessa cosa che avere una suddivisione di A in tanti sottoinsiemi che sono a due a due disgiunti tra di loro; è cioè come se l’insieme A fosse tagliato a fette. Infatti, se a ∈ A, indichiamo con Ea la classe di tutti gli elementi di A che sono in relazione con a; spesso, in modo suggestivo, si usa la notazione [a] per Ea , che mette bene in evidenza il ruolo di a. Comunque, se Eb è la classe di equivalenza di un altro elemento b ∈ A, abbiamo Ea = Eb oppure Ea ∩ Eb = ∅. Infatti, se a è in relazione con b, ogni elemento c equivalente ad a è anche equivalente a b per la proprietà transitiva, e viceversa, per cui Ea = Eb . Se invece b non è in relazione con a, nessun elemento c può essere in relazione tanto con a quanto con b, perché altrimenti a e b sarebbero in relazione tra loro: quindi Ea ∩ Eb = ∅. D’altra parte, ogni elemento di A sta in una classe di equivalenza, la sua, per la proprietà riflessiva, cosı̀ che le classi di equivalenza ricoprono tutto A. L’insieme delle classi di equivalenza degli elementi di A rispetto alla relazione d’equivalenza R si dice l’insieme quoziente di A modulo R e si indica con la notazione A/R. Si noti che è vera anche la proprietà inversa. Supponiamo che A sia diviso in tanti sottoinsiemi che: i) sono tra loro a due a due disgiunti; ii) ricoprono tutto A. Si dice che gli insiemi formano una partizione di A e se definiamo che due elementi a, b ∈ A sono in relazione se e solo se appartengono allo stesso sottoinsieme, vediamo che tale relazione è di equivalenza. Per questo basta dimostrare che valgono le tre proprietà caratteristiche: 1. la relazione è riflessiva perché ogni elemento si trova in un sottoinsieme (proprietà di ricoprimento ii)) e quindi è in relazione con sé stesso; 2. se a è nello stesso sottoinsieme di b, vale anche il viceversa e quindi la proprietà simmetrica è verificata; 3. se a è nello stesso sottoinsieme di b, e questi di c, essendo i sottoinsiemi disgiunti o coincidenti, a deve essere nello stesso sottoinsieme di c (proprietà transitiva). Questo fatto è spesso utile per ragionare in termini di classi di equivalenza piuttosto che in termini dei singoli elementi. Vedremo più casi di questo genere, ma qui, per fare un esempio preso dalla vita di tutti i giorni, pensiamo al modo diverso con cui un cliente e un’azienda vedono i prodotti da acquistare o vendere, rispettivamente. Il cliente è interessato, per esempio, a un’autovettura ben determinata, l’azienda lavora invece per classi e, in fase di produzione, essa produce un certo numero di vetture di un dato tipo, indipendentemente dai desideri del singolo cliente, se non per ciò che riguarda eventuali analisi di mercato. Solo recentemente, almeno nel settore degli autoveicoli, si è passati a una produzione più personalizzata. Naturalmente, la tipologia delle macchine prodotte è una partizione di tale insieme e la corrispondente relazione di equivalenza è: “la macchina a è dello stesso tipo della macchina b”. Se non fosse per il numero del motore, le due macchine sarebbero indistinguibili. Un’altra importante relazione è costituita dall’ordinamento. Sia A il solito insieme; si dice che gli elementi di A sono ordinati in senso stretto secondo una certa relazione, o che tale relazione è una relazione d’ordine stretto per A, se valgono le seguenti tre proprietà: 1. proprietà antiriflessiva: nessun elemento è in relazione con sé stesso; 17 1.3. FUNZIONI E OPERAZIONI 2. proprietà controsimmetrica: se un elemento a ∈ A è in relazione on b ∈ A, allora b non deve essere in relazione con a; 3. proprietà transitiva: se un elemento a ∈ A è in relazione con b ∈ A e questo, a sua volta, è in relazione con c ∈ A, allora anche a è in relazione con c. S = {a, b, c} {a, b} {a, c} {b, c} {a} {b} {c} Un esempio significativo è dato dalla relazione tra numeri a < b. Più spesso, tuttavia, si usa la relazione d’ordine non stretto, detta semplicemente relazione d’ordine o relazione d’ordine parziale per le cose che vedremo. Essa è caratterizzata dalle tre proprietà: 1. proprietà riflessiva: ogni elemento è in relazione con sé stesso; 2. proprietà antisimmetrica: se un elemento a ∈ A è in relazione con b ∈ A, e b è in relazione con a, allora a e b coincidono; ∅ 3. proprietà transitiva: se un elemento a ∈ A è in relazione con b ∈ A e questo, a sua volta, è in relazione con c ∈ A, allora anche a è in relazione con c. Figura 1.2: Diagramma di Hasse Per avere un riferimento concreto, si pensi alla relazione tra numeri a ≤ b. Tuttavia, è facile vedere che anche tutti i sottoinsiemi di un insieme dato S, se considerati con la relazione “contenuto”, godono di queste stesse proprietà: 1) ogni insieme si può considerare come sottoinsieme di sé stesso; 2) se A ⊆ B e B ⊆ A, allora A = B; 3) A ⊆ B e B ⊆ C implicano A ⊆ C, come risulta immediatamente dalla definizione. Ad esempio, se S = {a, b, c}, è facile disporre gli 8 sottoinsiemi di S in un diagramma (come nella Figura 1.2), detto diagramma di Hasse, che evidenzia le reciproche relazioni di “contenuto”. Se facciamo una cosa analoga per la relazione “≤” fra i numeri {1, 2, 3, 4} troviamo un diagramma di Hasse molto più semplice. In realtà quest’ultima relazione ha una caratteristica particolare: per “≤” fra numeri vale la proprietà aggiuntiva: 4. dati due elementi qualsiasi, il primo è in relazione col secondo oppure il secondo è in relazione col primo. Chiaramente, questa proprietà non è valida per gli insiemi {a} e {b, c}, che non hanno nessuna relazione di contenuto fra di loro. Quando questi due tipi di ordinamento si vogliono distinguere, si dice che quello fra gli insiemi è un ordinamento parziale, mentre quello tra numeri è un ordinamento totale. Un esempio ulteriore di ordinamento totale è costituito dall’ordinamento lessicografico, cioè quello delle parole nel dizionario: date due parole, si confrontano le prime lettere e se l’iniziale della prima è maggiore (minore) dell’iniziale della seconda, la prima parola segue (precede) la seconda. Se le prime due lettere sono uguali, si confrontano le seconde due, e si va avanti nello stesso modo finché non si trova la disuguaglianza che decide. Se una parola finisce prima che si sia arrivati a distinguere i due termini, questa precede l’altra. Cosı̀ mani < piedi, mani < manto, mani < manica. Un esempio, invece, di ordinamento parziale è il seguente. Si consideri un numero, diciamo 30, e l’insieme di tutti i suoi divisori: {1, 2, 3, 5, 6, 12, 15, 30}; diciamo che il divisore d1 precede il divisore d2 se e solo se d1 divide d2 . Cosı̀ 5 precede 10, 3 precede 15, ma nulla possiamo dire di 2 e 15. Il lettore è invitato a verificare che questo è un ordinamento parziale, sia nell’esempio del 30 sia in generale, per ogni numero naturale n. E’ anche invitato a disegnare il diagramma di Hasse per n = 30 e a confrontarlo con quello della Figura 1.2. 1.3 Funzioni e operazioni Il tipo più importante di relazione o corrispondenza è certamente costituito dalle funzioni. Una corrispondenza tra due insiemi A e B, cioè un sottoinsieme F ⊆ A × B, si dice una funzione se e solo se ad ogni elemento di A corrisponde uno e un solo elemento di B. Come si sa, espressioni come y = 3x + 2 oppure y = x2 − 4x + 1 rappresentano due funzioni perché, assegnato un valore ad x (la variabile indipendente), il valore di y (la variabile dipendente) è univocamente determinato. In generale si scrive y = F (x), anche 18 CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA se propriamente si dovrebbe scrivere (x, y) ∈ F . La corrispondenza tra A e B può essere di natura qualsiasi e non necessariamente numerica. Un’azienda che produce scarpe è interessata alla produzione mensile: si tratta di una funzione nella quale, come corrispondente di ogni mese, si ha un numero, ma questo numero non soddisfa necessariamente ad alcuna formula analitica analoga a quelle viste in precedenza. Cosı̀, la data di nascita e l’indirizzo di residenza sono funzione della singola persona, come lo sono il nome e il cognome. Invece, la data di nascita non è funzione del nome e del cognome, in quanto possono esistere due Giovanni Russo nati uno il 14 Aprile 1957 e l’altro il 21 Settembre 1961. su questo ritorneremo più avanti. La terminologia relativa alle funzioni è alquanto complicata, ma è essenziale in tutta la Matematica. Intanto, una generica funzione f dell’insieme A nell’insieme B si indica con la notazione: f : A → B, f oppure A → B; nel caso che f sia biunivoca, ciò si mette in evidenza scrivendo: f : A ↔ B o anche f A ↔ B. L’insieme A si dice dominio oppure insieme di partenza della funzione e B si dice il rango o codominio o insieme di arrivo; l’insieme degli elementi di B che sono corrispondenti di almeno un elemento di A si dice l’immagine di A in B e si indica con f (A); in generale, come s’è visto, f (A) ⊆ B, e se f (A) = B si dice che la funzione è surgettiva. Se b ∈ B è il corrispondente di a ∈ A secondo f , cioè (a, b) ∈ f , si dice che b è l’immagine di a secondo f e si scrive: b = f (a). Se abbiamo una corrispondenza D ⊆ A × B, cioè un insieme di coppie (a, b) ∈ D con a ∈ A e b ∈ B, è sempre possibile invertire tale corrispondenza cambiando l’ordine degli elementi, cioè considerando le coppie (b, a) tali che (a, b) ∈ D. Quella che cosı̀ si ottiene è una corrispondenza tra B ed A che si dice l’inversa di D e pertanto si indica con D−1 ⊆ B × A. Formalmente: Una funzione che faccia corrispondere ad elementi diversi di A elementi diversi di B si dice iniettiva. Le funzioni iniettive sono particolarmente simpatiche perché sono “invertibili”, cioè possiamo partire dagli elementi di B e stabilire, per ciascuno, se esiste e qual è l’elemento di A che lo ha come corrispondente; infatti, o l’elemento b ∈ B non è determinato da alcun elemento di A oppure è determinato da uno solo. Ad esempio, y = 2x è una funzione iniettiva perchè ad x diversi corrispondono valori di y diversi; gli y, però, non possono essere negativi. Pertanto, se partiamo da un y ≤ 0, sappiamo che esso non è determinato D−1 = {(b, a) ∈ B × A | (a, b) ∈ D ⊆ A × B}. da alcun valore di x; se però y > 0, esiste senz’altro un valore di x tale che y = 2x ; tale valore è dato da Quando la corrispondenza è una funzione, non è detx = log2 y, cioè il logaritmo in base 2 di y (si veda al to che la sua inversa sia ancora una funzione; questo Capitolo 3). accade solo se a elementi distinti di A corrispondono Ancora più simpatiche sono le funzioni iniettive che elementi distinti di B, di modo che nella corrisponper ogni b ∈ B hanno il corrispondente in A, cioè le denza inversa esista un’unica coppia che abbia come funzioni che sono anche surgettive: queste funzioni primo elemento b ∈ B. In altre parole, la corrisponsi dicono biunivoche (o corrispondenze biunivoche) ed denza inversa di una funzione è anch’essa una funziohanno un ruolo fondamentale in tutta la Matematica. ne se e solo se f è iniettiva. Se b = f (a), si scrive Esse si possono definire come quelle corrispondenze anche a = f −1 (b) ed a si dice l’immagine inversa di che ad ogni elemento di A associano uno e un solo b. elemento di B e, viceversa, ad ogni elemento di B Se f : A → B e g : B → C si può considerare la associano uno e un solo elemento di A. Si osservi funzione h : A → C definita nel modo seguente: si che se due insiemi A e B sono finiti, hanno cioè un parte da un qualsiasi elemento a ∈ A e si trova il corrinumero finito di elementi, e fra di essi esiste una corri- spondente di a in B secondo f , cioè si trova b = f (a). spondenza biunivoca, allora essi devono contenere lo Da questo elemento b si passa, tramite la g, all’elestesso numero di elementi: infatti, per la definizione, mento c = g(b) e si definisce questo come immagine di è possibile associare ad ogni elemento a ∈ A un unico a secondo h. Questa corrispondenza h si dice la comb ∈ B, e nessuno degli elementi di B rimane fuori. posizione delle due funzioni f e g e si scrive di solito Questo, come vedremo nella prossima sezione, sta a h = f ◦ g, di modo che h(a) = (f ◦ g)(a) = g(f (a)), fondamento dei numeri naturali, i numeri con i quali qualunque sia a ∈ A. Una osservazione importansi conta. E’ bene comunque avvertire che l’importan- te è che se f è una funzione biunivoca ed f −1 è la za delle corrispondenze biunivoche non è limitata agli sua funzione inversa, allora f −1 (f (a)) = a per ogni insiemi finiti. Ad esempio, la corrispondenza p = 2n a ∈ A, cioè f ◦ f −1 è la funzione identica su A, cioè tra i numeri naturali N e i numeri pari P è chiara- la funzione che ad ogni elemento fa corrispondere sé mente biunivoca e la sua inversa è n = p/2, che ha stesso. Spesso, tale funzione si indica con I ed f −1 si senso perché p è pari. Questo ci dice che i numeri pari dice l’inversa composizionale di f . sono tanti quanti sono tutti i numeri, il che appare Un insieme interessante di funzioni è costituito dai assurdo poiché P è propriamente contenuto in N. Ma predicati. Un predicato su un insieme A è una fun- 1.3. FUNZIONI E OPERAZIONI zione p : A → {0, 1}. Ad esempio, la funzione p : N → {0, 1} definita da: ½ p(n) = 1 se n è pari p(n) = 0 se n è dispari è un predicato. L’importanza dei predicati (su A) sta nel fatto che essi costituiscono un meccanismo matematico per parlare delle proprietà degli elementi di A; nell’esempio, la proprietà è: “il numero n è pari”. Di regola, si interpreta 1 come “vero” e 0 come “falso”, cosı̀ che p(10) = 1 significa “il numero 10 è pari”, mentre p(51) = 0 vuol dire “il numero 51 non è pari”. Dato un insieme S e l’insieme P(S) delle sue parti, i predicati su S corrispondono ai sottoinsiemi di S. Se infatti A ⊆ S, il predicato χA : S → {0, 1} definito da: ½ χA (x) = 1 se x ∈ A χA (x) = 0 se x 6∈ A 19 in particolare, per i predicati su A si scrive 2A , dove il “2” sta a significare l’insieme di due elementi B = {0, 1}. Vista la corrispondenza tra i predicati su A e i sottoinsiemi di A, spesso si indica con la stessa notazione 2A l’insieme delle parti di A, cioè P(A). Ritorneremo in diverse occasioni sulle cose appena dette, quando parleremo di cardinalità (si veda la Sezione 1.4), di calcolo combinatorio (vedere la Sezione 4.1), di calcolo delle proposizioni (nella Sezione 4.6); ma questi concetti sono pervasivi di tutta la Matematica. Un caso particolarmente importante di funzione è dato dalle operazioni; si consideri ad esempio la somma tra numeri naturali; essa associa ai numeri 3 e 5 il numero 8; si scrive 3+5 = 8 e pertanto siamo di fronte a una funzione che chiameremo S e che ha come dominio il prodotto cartesiano N × N, cioè le coppie di numeri naturali, e per codominio lo stesso N. Si scrive pertanto: S : N × N → N, ed m + n al posto di S(m, n). La stessa cosa si può dire del prodotto P : N × N → N, ove P (n, m) = n × m. Si osservi invece che la differenza e la divisione non sono funzioni nel senso detto: infatti, alla coppia (3, 5) non corrisponde alcun numero naturale 3 − 5, né alcun numero naturale 3/5. In effetti, i numeri interi, cioè i numeri con il segno, sono stati introdotti per rendere la sottrazione una funzione, cioè un’operazione sempre eseguibile, e i numeri razionali per rendere la divisione una funzione. Purtroppo, in quest’ultima operazione, come si sa, c’è un caso che non si risolve, e cioè la divisione per zero; a parte questo, nei numeri razionali è sempre possible fare a/b. Le operazioni non hanno sempre necessariamente due argomenti come le quattro operazioni di base, cioè addizione, sottrazione, moltiplicazione e divisione. Esistono operazioni con un solo argomento, come la radice quadrata, il cambiamento di segno o il valore assoluto. Si possono inventare operazioni con tre argomenti come logb (x + y), o anche a quattro come: ax /by , e cosı̀ via. Allora: identifica univocamente il sottoinsieme A: il sottoinsieme definisce il predicato e dal predicato si ricava l’insieme senza alcuna ambiguità. Il predicato χA si dice la funzione caratteristica di A (in S) e per la precedente osservazione possiamo dire che esistono tanti sottoinsiemi di S quante sono le possibili funzioni caratteristiche su S. L’insieme vuoto corrisponde alla funzione caratteristica fatta tutta di 0 (la funzione costante 0); S, come sottoinsieme di sé stesso, ha come funzione caratteristica quella fatta tutta di 1 (la funzione costante 1). Supponiamo che gli insiemi A e B contengano, rispettivamente, n ed m elementi; poniamo allora A = {a1 , a2 , . . . , an } e B = {b1 , b2 , . . . , bm }. Una funzione f : A → B è definita quando assegniamo a ciascun elemento di A il corrispondente elemento di B. Cosı̀, ad a1 possiamo assegnare uno qualsiasi degli m elementi di B; si hanno perciò m possibilità. Ad a2 possiamo associare ancora uno qualunque degli m elementi di B, e quindi abbiamo m2 possibili associazioni. Continuando nello stesso modo, vediamo che anche ad an si possono associare m immagini distinte • le operazioni con un solo argomento, come |x|, si e in tutto si hanno m × m × · · · × m = mn distinte dicono monadiche; funzioni di A in B. Ad esempio, se A = {a, b, c} e B = {0, 1}, le funzioni di A in B, cioè in questo caso • le operazioni con due argomenti, come x + y, si i predicati su A, sono 23 = 8 e possono essere elendicono binarie o diadiche; cati usando la notazione funzionale, che riporta nella • le operazioni con tre argomenti, come logb (x+y) riga superiore gli elementi di A e in quella inferiore si dicono ternarie o triadiche; le rispettive immagini: µ ¶ µ ¶ µ ¶ µ ¶ a b c a b c a b c a b c e cosı̀ via. Il numero di argomenti di una operazione 0 0 0 0 0 1 0 1 0 0 1 1 si dice la sua arietà o adicità. µ ¶ µ ¶ µ ¶ µ ¶ La notazione delle operazioni si è sviluppata dal a b c a b c a b c a b c 1500 ad oggi in modo abbastanza caotico; essa con1 0 0 1 0 1 1 1 0 1 1 1 tinua ad evolversi perché alcune parti della MatemaDa queste osservazioni discende la notazione B A tica usano ancora notazioni ad hoc, scelte in manieper indicare l’insieme di tutte le funzioni di A in B; ra piuttosto casuale, dettate spesso da considerazioni 20 CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA estetiche piuttosto che razionali. Per le operazioni monadiche due sembrano essere i tipi di notazione più ragionevoli; di gran lunga da preferire è la notazione prefissa o funzionale, nella quale il segno di operazione precede l’argomento; cosı̀ la negazione è −x, la negazione logica ¬p e si scrive cos(x) per il coseno di x e ln(x) per il logaritmo naturale. Meno usata è la notazione postfissa, come n! per il fattoriale, e la fantasia dei matematici si è sbizzarrita a √ cercare segni e disposizioni più originali: x indica la radice quadrata, |x| il valore assoluto, ex l’esponenziale, Ai l’indiciamento, A il complemento, e chi più ne ha, più ne metta. Per le operazioni diadiche la forma più usata è quella infissa: a + b, a/b, A ∪ B e via di seguito; molto usata è anche in questo caso la notazione prefissa o funzionale, adottata come standard nei linguaggi di programmazione, fatta eccezione per le operazioni di base: MCD(m, n). Ma anche per le √ operazioni binarie ¡ ¢lo sfoggio di fantasia è notevole: n x, logb (x), an , nk , e tante altre. Fortunatamente, infine, per le operazioni con più di due argomenti, la notazione funzionale è canonica, anche perché è difficile trovare una notazione più compatta. Le operazioni possono godere (o non godere) di particolari proprietà e possono possedere (o non possedere) particolari elementi che le caratterizzano. Diamo qui un elenco delle principali proprietà e dei più importanti elementi speciali, supponendo che le operazioni siano definite su un insieme A: dono di questa proprietà nei confronti dell’altra operazione; 5. un’operazione binaria x ⊙ y è distributiva rispetto a un’altra operazione binaria x ⋄ y se per ogni terna di elementi x, y, z ∈ A si ha: x⊙(y⋄z) = (x⊙y)⋄(x⊙z); come si sa, il prodotto è distributivo rispetto alla somma e alla sottrazione; l’unione e l’intersezione sono distributive una rispetto all’altra; 6. un’operazione binaria x ⊙ y è idempotente se per ogni elemento x ∈ A si ha x ⊙ x = x. L’operazione di Massimo Comun Divisore è idempotente perché MCD(n, n) = n; nessuna delle quattro operazioni di base è tale. 7. data un’operazione binaria x ⊙ y, si dice che un elemento e ∈ A è una identità per l’operazione se e ⊙ x = x ⊙ e = x, per ogni elemento x ∈ A. Lo 0 è l’identità per la somma e l’1 lo è per il prodotto. Poiché si ha x − 0 = x, ma 0 − x = −x, lo 0 non è identità per la sottrazione; talvolta, per mettere in evidenza la prima uguaglianza, si dice che 0 è un’identità destra per la sottrazione; 8. data un’operazione binaria x ⊙ y, si dice che un elemento z ∈ A è uno zero per l’operazione se si ha z ⊙ x = x ⊙ z = z, per ogni elemento x ∈ A. Lo 0 è uno zero per la moltiplicazione e uno zero sinistro per la divisione; 1. un’operazione binaria x ⊙ y è chiusa se, qualunque siano gli elementi x, y ∈ A, il risultato dell’o- 1.4 Il contare perazione è ancora un elemento di A. La somma e il prodotto in N sono operazioni chiuse, mentre Una delle attività di base dell’uomo è il contare. Connon lo sono la sottrazione e la differenza; come tare significa associare agli elementi di un insieme una s’è detto, né 3 − 5, né 3/5 sono numeri naturali; successione di parole convenzionali: uno, due, tre, quattro, . . .. Il numero degli elementi di un insieme 2. un’operazione binaria x⊙y è commutativa se per è il nome al quale si arriva quando tutti gli elemenogni coppia di elementi x, y ∈ A si ha x⊙y = y ⊙ ti sono stati esauriti. Idealmente, e talvolta anche x. Addizione e moltiplicazione sono operazioni praticamente, man mano che contiamo spostiamo gli commutative; sottrazione e divisione non lo sono; elementi dell’insieme in un altro insieme, in modo da 3. un’operazione binaria x ⊙ y è associativa se distinguere quelli già considerati da quelli che ancora per ogni terna di elementi x, y, z ∈ A si ha devono essere contati. In tal modo non si fanno con(x ⊙ y) ⊙ z = x ⊙ (y ⊙ z), cioè l’ordine di ese- fusioni e si determina facilmente quando il conteggio cuzione dell’operazione non è essenziale (si noti è terminato. In questa maniera, noi instauriamo una corrisponche la proprietà commutativa si riferisce all’ordine degli elementi; la proprietà associativa al- denza biunivoca tra gli elementi da contare e i numel’ordine delle operazioni). Di nuovo, addizione e ri: come abbiamo osservato nella sezione precedente, moltiplicazione sono esempi positivi, sottrazione è proprio l‘esistenza di una corrispondenza biunivoca che ci permette di dire che gli oggetti di un insieme e divisione negativi; sono tanti quanti gli elementi di un altro insieme. Ora 4. un’operazione binaria x ⊙ y gode della proprietà possiamo dire anche qualcosa di più: se due insiemi di assorbimento rispetto all’operazione x ⋄ y se si hanno lo stesso numero di elementi, allora è possibiha: x ⊙ (y ⋄ x) = x qualunque siano i due ele- le trovare tra di essi una corrispondenza biunivoca. menti x, y ∈ A. Come abbiamo visto, le due ope- Infatti, dire che hanno lo stesso numero di elemenrazioni di unione ed intersezione tra insiemi go- ti significa che esiste una corrispondenza biunivoca 21 1.4. IL CONTARE tra ciascun insieme e l’insieme dei numeri che hanno permesso di contarli; se facciamo corrispondere gli elementi contati dallo stesso numero, abbiamo la corrispondenza biunivoca cercata. Non è detto che essa sia la sola, ma ci basta di essere convinti che: due insiemi (finiti) hanno lo stesso numero di elementi se e solo se esiste tra di essi una corrispondenza biunivoca. I numeri che servono per contare si dicono numeri naturali: zero, uno, due, tre, quattro, . . .. Osserviamo esplicitamente che lo zero conta gli elementi dell’insieme vuoto (quante caramelle ci sono in un sacchetto vuoto?) e pertanto va considerato come uno dei numeri naturali. L’insieme dei numeri naturali si indica con N. Essi costituiscono uno dei mattoni fondamentali della Matematica, anzi, come ha dimostrato Peano (1858 – 1932) tutta la Matematica che conosciamo può essere fondata su una assiomatizzazione dei numeri naturali. Vedremo più avanti qualcosa a questo proposito, anche se tali argomenti vanno un po’ oltre l’impostazione elementare che vogliono avere queste note. Nota 1.4 Il resto della sezione è costituito da questa lunga nota, nella quale vogliamo riportare l’impostazione moderna del “contare”, che ha permesso di superare, in modo costruttivo e rigoroso, la barriera del “finito” nel ragionamento matematico. Le idee di base di tale impostazione sono dovute al matematico George Cantor (1845 – 1918), nato a San Pietroburgo da una famiglia danese, ma vissuto in Germania dall’età di undici anni; la sua opera fu inizialmente osteggiata, tanto da acuire la sua innata debolezza psicologica e da costringerlo a passare buona parte della vita in manicomio, dove morı̀. Cantor partı̀ dal concetto intuitivo di insieme, come anche noi l’abbiamo visto, e dal concetto di corrispondenza biunivoca, che permette di associare gli elementi di due insiemi diversi: egli chiamò equipotenti due insiemi A e B tra i quali è possibile istituire una corrispondenza biunivoca; si scrive allora A ∼ = B. Abbiamo già osservato che, per gli insiemi finiti, questo significa proprio che gli insiemi hanno lo stesso numero di elementi. Tuttavia, ciò che ha di interessante l’impostazione di Cantor è questo: il concetto di equipotenza non si basa su un’indefinita idea di numero data a priori, ma solo sui concetti di insieme e di corrispondenza che sono sicuramente a un livello più basso di quello di numero. Infatti, tali concetti fanno riferimento, anche se in modo completamente astratto, a idee singolari, come a singoli oggetti (elementi) o a loro raggruppamenti in insiemi singolari o ad associazioni specifiche tra insiemi. Viceversa, l’idea di numero ha a che vedere con un’astrazione a livello superiore: il numero 4 si riferisce a tutti gli insiemi che hanno 4 elementi, e sarebbe assurdo che ci riferissimo a certi insiemi di 4 elementi (quelli ad esempio di cui abbiamo esperienza diretta) e non ad altri. Quello che vogliamo è proprio questo: che il numero 4 conti anche insiemi che non conosciamo o con i quali mai avremo a che fare, come i 4 cavalieri dell’Apocalisse o i 4 angoli dell’Universo al di là di tutte le galassie conosciute. La definizione di numero cardinale proposta da Cantor, e che ora vedremo, cerca di cogliere proprio questo ulteriore livello di astrazione E’ facile vedere che la relazione di equipotenza è in effetti una relazione di equivalenza. La proprietà riflessiva vale in quanto la funzione identica, cioè la funzione I : A → A definita da I(a) = a qualunque sia a ∈ A, è certamente biunivoca; ciò significa che A∼ = A. Se f : A ↔ B è una corrispondenza biunivoca tra A e B, abbiamo già osservato come la sua inversa f −1 : B ↔ A sia anch’essa biunivoca; vale pertanto la proprietà simmetrica: A ∼ = B implica B ∼ = A. Infine, se A ∼ =B eB∼ = C, esistono due corrispondenze biunivoche f : A ↔ B e g : B ↔ C; la loro composizione è una funzione biunivoca fra A e C, il che significa A∼ = C, e ciò dimostra la proprietà transitiva. Come ormai sappiamo, dato un insieme A, la sua classe di equivalenza [A] è costituita da tutti gli insiemi equipotenti ad A. Definiamo allora la cardinalità o potenza di un insieme A la classe [A] di tutti gli insiemi ad esso equipotenti. Tale classe si indica con card(A). Leggendo o ascoltando questa definizione si ha spesso la sensazione del gioco di parole; ma non è cosı̀ e anzi è bene capirne il senso veramente profondo. Riunire in un unico insieme (o classe) tutti gli insiemi con 4 elementi (cioè equipotenti a un qualsiasi insieme di 4 elementi) è un’operazione concettuale che possiamo fare agevolmente (anzi, troppo agevolmente, tanto da arrivare facilmente a qualche paradosso, come osservò Russell alcuni anni dopo la formulazione di Cantor) e che dà un senso a quello che prima dicevamo sul concetto di numero. Questa classe contiene insiemi i più disparati e che, per la stessa definizione, possiamo anche non conoscere o non immaginare; ciò che li caratterizza è solo il numero dei loro elementi, quella corrispondenza biunivoca che ci dice: sı̀, questo insieme è equipotente a quello assegnato o considerato. Ecco allora che la classe è identificata e (in realtà, dal punto di vista in cui ci siamo messi) identifica il numero di elementi dei suoi insiemi. Ora, la proprietà che abbiamo osservato, e cioè che esiste una corrispondenza biunivoca tra due insiemi se e solo se essi hanno lo stesso numero di elementi, non è più qualcosa da intuire o da dimostrare: è giusto la definizione di cardinalità e quindi di numero. Possiamo ora definire alcune operazioni sulle cardinalità. Prima di tutto, date due cardinalità card(A) e card(B), la loro somma è definita come la cardinalità dell’unione disgiunta A ⊎ B, cioè: card(A) + card(B) = card(A ⊎ B). Ciò è fatto generalizzando quello che avviene tra gli insiemi finiti; il numero degli elementi di A ∪ B non coincide con la somma degli elementi di A con quelli di B, basta che A e B abbiano qualche elemento in comune, cioè non siano disgiunti. L’unione disgiunta, invece, funziona bene e corrisponde al nostro concetto 22 CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA intuitivo di somma: mettere assieme gli elementi dei due insiemi senza confondere gli uni con gli altri. Anche la moltiplicazione è definita generalizzando il caso degli insiemi finiti. Quando abbiamo introdotto il prodotto cartesiano A × B, abbiamo osservato che il numero delle coppie che si formano è dato da m × n, se m ed n sono il numero degli elementi di A e di B. Si definisce allora: card(A) × card(B) = card(A × B), cioè, il prodotto di due cardinalità è dato dalla cardinalità del prodotto cartesiano di due insiemi, uno appartenente a card(A) e l’altro a card(B) (in concreto, possiamo prendere gli stessi insiemi A e B). E’ bene osservare che le definizioni che stiamo dando, non dipendono dagli insiemi A e B usati; sfruttando la corrispondenza biunivoca che è implicita nella definizione di cardinalità, si dimostra che, cambiando insiemi, non si cambia il risultato. Il lettore, al solito, è invitato a provare formalmente queste affermazioni. L’ultima operazione è l’elevamento a potenza. Abbiamo visto che il numero delle possibili funzioni da un insieme A (finito e con n elementi) a un insieme B (finito e con m elementi) è dato da mn . Definiamo allora: card(B)card(A) = card(B A ), cioè come la cardinalità dell’insieme delle funzioni da A in B. Il termine “cardinalità”, pur riferendosi all’espressione classica di numero cardinale che designa i numeri naturali, ha l’ambizione di inglobare un concetto più generale che comprenda anche gli insiemi infiniti. Una definizione precisa di insieme infinito non è banale; intuitivamente, possiamo dire che se da un insieme togliamo man mano un elemento, allora, nel caso di un insieme finito, prima o poi rimarremo senza elementi (cioè, l’insieme si riduce a ∅); viceversa, se l’insieme è infinito potremo andare avanti in tale processo senza mai ridurci a ∅. Queste idee portarono Cantor a proporre questa costruzione; sia A un insieme infinito secondo la precedente intuizione; prendiamo un elemento a0 ∈ A e togliamolo da A ottenendo A \ {a0 }; poiché A è infinito, A\{a0 } non è vuoto, e quindi possiamo scegliere un altro elemento a1 ∈ A \ {a0 } e considerare A \ {a0 , a1 }. Anche questo insieme non è vuoto, e quindi possiamo scegliere un nuovo elemento a2 ∈ A \ {a0 , a1 }. Cosı̀ procedendo, si ottiene una successione infinita {a0 , a1 , a2 , . . .} contenuta in A e composta da elementi tutti distinti. Tale sequenza è equipotente ad N poiché la banale corrispondenza biunivoca è ai ↔ i, per ogni i ∈ N. Allora, possiamo dire che un insieme è infinito se e solo se contiene un sottoinsieme equipotente ad N, l’insieme dei numeri naturali. Questa può essere assunta come definizione di insieme infinito, poiché (sempre da un punto di vista intuitivo) è chiaro che da un insieme finito non si potrà mai estrarre una successione infinita di elementi distinti. Questa definizione è, quindi, ragionevole e osserviamo subito che essa ci suggerisce due considerazioni notevoli: primo, l’insieme N viene ad assumere il ruolo molto importante di “pietra di paragone”, in quanto ogni altro insieme verrà classificato finito o infinito solo per confronto con N; questo consacra N come insieme infinito per eccellenza, quello di cui si può dire: ecco un insieme infinito di cui siam certi di quello che è. Vorrei ricordare che l’essere N infinito si basa su un criterio di “scommessa”: vuoi scommettere che se tu dici un numero, io son capace a dirne uno più grande? E sappiamo bene che se l’avversario dice un n qualsiasi, noi possiamo dire n + 1. Il secondo fatto notevole è che, dalla definizione, discende che N è, in un certo senso, il più piccolo degli insiemi infiniti, in quanto ogni altro insieme infinito A viene a contenere un sottoinsieme che è l’immagine di N, quella successione {a0 , a1 , a2 , . . .} che siamo riusciti a cavarne fuori. Certo, può succedere che la successione esaurisca tutto A, ma la cosa non cambia, perché allora A sarà equipotente ad N. Data questa minimalità di N, Cantor propose di assegnare un simbolo speciale alla sua cardinalità, che è la più piccola delle cardinalità degli insiemi infiniti. A questo punto non sappiamo se esistono altre cardinalità di insiemi infiniti, ma ci proponiamo in seguito di dimostrare che questo è proprio il caso. Allora, per il momento, chiamiamo ℵ0 (Alef con zero, dove Alef è la prima lettera dell’alfabeto ebraico) la cardinalità di N e diciamo transfinite le cardinalità degli insiemi infiniti: per ribadire quanto detto, ciò che sappiamo al momento attuale della nostra esposizione è che ℵ0 è l’unica o la più piccola della cardinalità transfinite. Un insieme si dice numerabile se è equipotente ad N, cioè ha cardinalità ℵ0 , che pertanto si dice anche cardinalità del numerabile. Viene qui naturale fare un esempio: consideriamo P, l’insieme dei numeri pari; chiaramente P ⊂ N e P è infinito: come si conciliano le due cose? In realtà il problema ha una semplice soluzione: ad ogni numero naturale k associamo il numero pari 2k; otteniamo cosı̀ la successione {a0 , a1 , a2 , . . .} dove ak = 2k e quindi: P è infinito e P è in corrispondenza biunivoca con N, anche se è propriamente contenuto in tale insieme. Ma non aveva detto Aristotele che una parte è minore del tutto? Qui, una parte propria, P, è equipotente al tutto. Duecentocinquanta anni prima di Cantor, Galileo aveva osservato che esiste una corrispondenza biunivoca tra i numeri naturali e i quadrati perfetti, che si rarefanno sempre di più al crescere di n. Da questo, però, non era riuscito a dedurre altro che “non solamente non si possa dire di un infinito esser maggiore di un altro infinito, ma né anco che e’ sia maggiore di un infinito”. Cantor fece vedere che le cose non stanno nemmeno cosı̀ e che, in questo campo, Aristotele si sbagliava. Egli dimostrò addirittura che un insieme è infinito se e solo se è equipotente a una sua parte propria. La prova è quasi banale: se l’insieme A è infinito, estraiamone 23 1.4. IL CONTARE la successione S = {a0 , a1 , a2 , . . .} e sia B l’insieme (eventualmente vuoto) degli elementi che rimangono, cioè sia A = S ⊎ B. Consideriamo ora A′ = A \ {a0 } e vediamo che A e A′ sono equipotenti. L’ovvia corrispondenza biunivoca è la seguente: ad ogni elemento di B (in A) facciamo corrispondere sé stesso in A′ e ad ogni elemento ak della successione facciamo corrispondere ak+1 . Ma A′ ⊂ A (propriamente) e la prima parte della prova è fatta. Viceversa, se A è finito e A′ ⊂ A, sappiamo che A′ ha meno elementi di A e i due insiemi non possono essere messi in corrispondenza biunivoca tra di loro. Abbiamo cosı̀ una seconda caratterizzazione degli insiemi infiniti, che ci rende conto di varie anomalie che essi hanno nei confronti dei più usuali insiemi finiti. Una tale proprietà, tuttavia, potrebbe indurci a pensare che sia possibile mettere in corrispondenza biunivoca due insiemi infiniti qualsiasi: se un insieme è equipotente a un suo sottoinsieme, possiamo immaginare l’insieme “più piccolo” come sottoinsieme di quello “più grande” e cercare una corrispondenza biunivoca (analoga a quella appena vista) per dimostrare questo fatto. Una serie di risultati sembrerebbe confermare tale ipotesi: 1. se ad un insieme infinito A si aggiunge un insieme finito B = {b1 , b2 , . . . , bk }, quello che si ottiene è un insieme equipotente ad A. Sia S = {a0 , a1 , a2 , . . .} la solita successione tratta da A e sia D = A \ S. La corrispondenza biunivoca che ad ogni elemento di D fa corrispondere sé stesso e per la quale: a0 ↔ b1 , a1 ↔ b2 , . . . , ak−1 ↔ bk , ak ↔ a0 , . . . , ak+h ↔ ah , . . ., prova la nostra affermazione. Se l’insieme A è numerabile, in termini di cardinalità, questo risultato si esprime con la formula: ℵ0 + k = ℵ0 ; 2. se A e B sono due insiemi numerabili, allora A ⊎ B è equipotente ad A. Dire che A è numerabile significa che gli elementi di A sono ordinabili in una successione A = {a0 , a1 , a2 , . . .} per la quale k ↔ ak , per ogni k ∈ N. Analogamente B = {b0 , b1 , b2 , . . .}. Allora la corrispondenza biunivoca tra A ⊎ B ed N è (per ogni k ∈ N): se k = 2h è pari k ↔ ah , e se k = 2h + 1 è dispari k ↔ bh . Questo fatto si esprime con la formula: ℵ0 + ℵ0 = ℵ0 ; 3. se A e B sono due insiemi numerabili, allora il loro prodotto cartesiano A×B è anch’esso numerabile. Siano A e B come prima e disponiamo gli elementi di A × B in una matrice infinita come nella Figura 1.3. Il cammino segnato è la corrispondenza biunivoca tra A × B ed N. Questo fatto si esprime con la formula: ℵ0 × ℵ0 = ℵ0 . Ma allora, ci chiediamo, esistono davvero cardinalità transfinite più grandi di ℵ0 ? Apparentemente, dai tre casi precedenti, sembra che con le normali operazioni non si esca fuori del campo del numerabile. Ma Cantor dimostrò che di cardinalità transfinite ne esistono quante se ne vuole. (a0 , b0 ) ↓ (a0 , b1 ) (a0 , b2 ) ↓ (a0 , b3 ) (a1 , b0 ) ↑ (a1 , b1 ) → ← (a1 , b2 ) ← → (a1 , b3 ) → → (a2 , b0 ) ↓ (a2 , b1 ) ↓ (a2 , b2 ) (a2 , b3 ) → (a3 , b0 ) ↑ (a3 , b1 ) ↑ (a3 , b2 ) ↑ (a3 , b3 ) → Figura 1.3: Scorrimento di una matrice infinita Teorema 1.1 (di Cantor) Sia A un insieme qualsiasi e sia P(A) l’insieme di tutti i sottoinsiemi (le parti) di A; allora, la cardinalità di P(A) è strettamente maggiore della cardinalità di A. Prova: La dimostrazione è un classico della Matematica e consiste nel far vedere che: 1) A è equipotente ad un sottoinsieme di P(A), cioè che card(A) ≤ card(P(A)); 2) che P(A) non è equipotente ad A, e quindi card(A) 6= card(P(A)), cioè card(A) < card(P(A)). La prima parte della dimostrazione è ovvia, poiché ogni elemento a ∈ A si fa corrispondere al sottoinsieme {a} ∈ P(A). Per la seconda parte, supponiamo che esista una corrispondenza biunivoca ψ tra A e P(A), cioè ψ(a) ⊆ A, per ogni a ∈ A. Dato a ∈ A, ψ(a) potrà contenere a oppure no; ad esempio, se ψ(a′ ) = ∅ allora a′ 6∈ ψ(a′ ); se invece ψ(a′′ ) = A, allora certamente a′′ ∈ ψ(a′′ ). Possiamo quindi dividere gli elementi di A in due sottoinsiemi: P = {x ∈ A | x ∈ ψ(x)}, gli elementi “positivi”, ed N = {x ∈ A | x 6∈ ψ(x)}, gli elementi“negativi”. Poiché si suppone che ψ sia biunivoca, deve esistere un elemento b ∈ A tale che ψ(b) = N , e quindi dovrà essere b ∈ N oppure b 6∈ N . Ma se b ∈ N , per definizione di N deve essere b 6∈ ψ(b) = N , il che è chiaramente assurdo. D’altra parte, se fosse b 6∈ N , cioè b 6∈ ψ(b), per la definizione di N dovremmo avere b ∈ N , il che è di nuovo assurdo. Ma questi sono gli unici casi possibili, e quindi ψ non può esistere. Il lettore avrà notato l’analogia di questo ragionamento con il paradosso di Russell, ma questa volta l’argomentazione è corretta e la conclusione del teorema è vera. Questo risultato permette di “costruire” insiemi di cardinalità grande quanto si vuole. Si parte con N che ha cardinalità ℵ0 e si considera l’insieme delle parti di N, cioè N1 = P(N). La cardinalità di N1 è strettamente maggiore di quella di N e si indica con ℵ1 (questo spiega finalmente la presenza dello strano indice). Si prende poi N2 = P(N1 ) la cui cardinalità è ℵ2 > ℵ1 , e cosı̀ si può continuare quanto si vuole. Vedremo, quando avremo introdotto i numeri reali, che la loro cardinalità è strettamente maggiore di ℵ0 . Tale cardinalità si indica con c e si dice la cardinalità del continuo. Si dimostra che c = ℵ1 > ℵ0 e ci si può porre la domanda se esistono insiemi di cardinalità compresa tra ℵ0 e ℵ1 (o, in generale, tra ℵn e ℵn+1 ). Abbastanza stranamente, nel 1963, Paul Cohen ha 24 CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA dimostrato che non si può dimostrare né che una tale cardinalità intermedia esista, né che non esista. 1.5 Rappresentazione dei numeri naturali Il concetto di “contare”, come s’è visto, si esprime nel linguaggio naturale mediante una serie di nomi convenzionali: uno, due, tre, quattro, . . . . Le regole per la formazione dei nomi dei numeri sono abbastanza semplici e permettono di esprimere una grande quantità di numeri come cento miliardi o settanta miliardi di miliardi. Tuttavia, diventa estremamente difficile dare nomi a numeri molto grandi come ad esempio al prodotto dei primi cento numeri 1 × 2 × 3 × · · · × 100 che vale esattamente: 9332621544394415268169923885626670049071 5968264381621468592963895217599993229915 6089414639761565182862536979208272237582 51185210916864000000000000000000000000. Inoltre, i nomi usuali tendono a diventare presto molto lunghi e per esprimere 7. 546. 732. 449 bisogna dire: “sette miliardi, cinquecento quarantasei milioni, settecento trentadue mila, quattrocento quarantanove”, un nome lungo 85 lettere, più del triplo del celebre “precipitevolissimevolmente”. Queste considerazioni hanno fatto sı̀ che molto presto si siano sviluppati metodi formali per la rappresentazione dei numeri, attraverso simboli opportuni o ricorrendo alle lettere dell’alfabeto. A tutti è nota la numerazione romana, che aveva l’inconveniente di essere inadeguata per i numeri molto alti e nessuno si sognerebbe mai di tentare di scrivere il risultato del precedente prodotto in quella notazione; già per esprimere 12. 000 si doveva scrivere XIIM e a scrivere milioni non ci si pensava nemmeno. Inoltre, la numerazione romana aveva il difetto di usare ogni simbolo con un significato univoco: X indica il 10 sia nell’espressione LXXI quanto in MCCCXXIV, quanto infine in XCIV (questa notazione “in sottrazione” fu introdotta solo nel Rinascimento; i Romani scrivevano LXXXXIIII). Questo limita molto l’espressività della notazione, se si confronta con la nostra, dove la cifra 6 indica sei unità se sta da sola, ma indica sessanta in 63, seicento in 1647 e sei milioni nel numero che prima abbiamo espresso in italiano. Nell’antichità, apparentemente, solo i Babilonesi avevano sviluppato una notazione analoga alla nostra, anche se, misteriosamente, avevano scelto come base di riferimento il 60 invece del 10, che a noi sembra cosı̀ naturale. In effetti, la scelta della base 10 non è cosı̀ universale come ci può apparire. Essa è legata, quasi sicuramente, al fatto che abbiamo dieci dita, ma per la stessa ragione si conoscono numerazioni in base 5 (si considera una sola mano; la V dei romani rappresentava la mano aperta) e in base 20 (mani e piedi), come è ben noto dal modo francese di esprimere 80: “quatre-vingt”, e 90: “quatre-vingt dix”. La nostra notazione viene dal mondo arabo occidentale, e perciò le 10 cifre che usiamo si dicono cifre arabiche. A loro volta, gli arabi avevano importato la loro notazione dall’India verso l’800 d.C., e dal mondo arabo prima Gherardo da Cremona e poi Leonardo Fibonacci l’avevano diffusa in Europa verso il 1200. Tuttavia, fino al 1600 la notazione arabica rimase limitata al mondo del commercio e della finanza, mentre nel mondo accademico e scientifico continuò a dominare la notazione romana. La possibilità di esprimere in modo (abbastanza) sintetico anche numeri molto grandi non è però l’unico merito, o il principale, della notazione arabica: quello che la rende insostituibile è il fatto che essa permette di eseguire le operazioni di base (addizione, sottrazione, moltiplicazione, divisione e confronto) direttamente sulla rappresentazione dei numeri. Nell’antichità, contare e fare di conto erano operazioni avulse l’una dall’altra, almeno dal punto di vista tecnico. Contare consisteva nell’assegnare un nome convenzionale (o un simbolo) a una quantità di interesse; tale nome o simbolo non era però utilizzato per fare le somme, per le quali si ricorreva a strumenti come l’abaco o, in mancanza di meglio, a pietruzze o sassolini disposti su varie righe. Ricordiamo, a questo proposito, che la nostra parola “calcolo” deriva appunto dal termine latino “calculus” che significa “sassolino”. Leonardo Fibonacci nella sua opera “Liber Abaci” non solo introduce la notazione arabica, ma mostra come con essa sia possibile effettuare le quattro operazioni fondamentali, grosso modo con le regole che ancor oggi impariamo nelle prime classi delle scuole elementari e che costituiscono il nostro “saper far di conto”. Fibonacci chiamò algorismi (dal nome del matematico arabo al-Khuwarizmi, morto verso l’850 d.C.) queste regole e per secoli l’espressione “apprendere gli algorismi” ha significato “imparare a far di conto”. Nota 1.5 Come abbiamo accennato, la notazione arabica fu “snobbata” dal mondo accademico e scientifico fino al 1600, in quanto il calcolo (detto logistica e contrapposto all’Aritmetica) era considerato una disciplina pratica e non liberale, cioè facente parte del Trivio (Grammatica, Dialettica, Retorica) o del Quadrivio (Aritmetica, Geometria, Musica, Astronomia). Questo rallentò indubbiamente lo sviluppo della scienza legata agli aspetti algebrico-formali. Cosı̀ non era raro trovare notevoli scienziati che, letteralmente, non sapevano fare i conti. Lo stesso Galileo non aveva molta dimestichezza con il calcolo, anche se aveva inventato uno speciale compasso per 1.5. RAPPRESENTAZIONE DEI NUMERI NATURALI l’esecuzione di conti approssimati. Le sue opere fanno scarsi riferimenti ai numeri, e in questo differiscono in modo straordinario dai lavori di Newton, che è di poco posteriore, essendo nato l’anno stesso della morte di Galileo (a sua volta questi, guarda caso, era nato l’anno in cui morı̀ Michelangelo). Galileo non si sognò mai di dire che la Natura fosse un libro scritto in caratteri numerici (a lui poco familiari), ma dichiarò anzi che tale libro era “scritto in forma di triangoli, quadrati, cerchi” e altre figure geometriche. All’opposto, commercianti e banchieri del 1200 capirono subito l’importanza dell’opera di Fibonacci, e la supremazia in Europa della Toscana in questi settori fu in parte dovuta alla superiorità degli “algorismi” sugli altri metodi di calcolo. Quando, nella prima metà del 1300 “aveva in Firenze circa XXV M d’uomini da portare armi da XV in LXX anni,” riferisce Giovanni Villani nella “Nuova Cronica”, “I garzoni che stavano ad apprendere l’abaco e l’algorismi in VI scole [erano] da M in MCC. E quelli che stavano ad apprendere gramatica e loica in IIII grandi scuole da DL in DC.” Quindi, i ragazzi avviati a diventare contabili (come diremmo oggi) erano il doppio di quelli avviati alle lettere o alle leggi. La notazione arabica è una notazione posizionale basata sul numero 10. Le dieci cifre arabiche 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 assumono un valore diverso a seconda della posizione che hanno nel numero. A partire da destra, la prima è la cifra delle unità, poi c’è quella delle decine, delle centinaia, delle migliaia e cosı̀ via. Per essere esatti, se il numero n è rappresentato dalla sequenza di cifre dr dr−1 . . . d1 d0 , allora il suo valore è: n = 10r × dr + 10r−1 × dr−1 + · · · + 10 × d1 + d0 . Ad esempio, 3223 = 3 × 103 + 2 × 102 + 2 × 10 + 3. La notazione decimale dei numeri ci è ormai diventata tanto familiare che non ne avvertiamo più l’aspetto di artificio, legato al fatto che abbiamo 10 dita. Probabilmente, se come Paperino avessimo quattro dita per mano, la base più naturale sarebbe stata 8. Ma allora, ci possiamo chiedere, esiste una notazione veramente naturale per i numeri? L’unica che può rivendicare una qualifica del genere è la notazione ad aste o a stecchini, cioè la notazione che rappresenta il numero n con n aste (o stecchini o qualsiasi altro simbolo) disposte una dietro l’altra: il numero 7 sarebbe |||||||. In questa notazione, detta anche numerazione primitiva, abbiamo veramente un accordo, cioè una corrispondenza biunivoca evidente, fra ciò che vogliamo contare (seggiole, teste o stelle) e il modo di rappresentare tale conteggio: ogni oggetto un’asta, e viceversa. Gli inconvenienti di questa notazione sono la lunghezza e l’illeggibilità. Provate a scrivere anche solo 25 157 e fatelo leggere a qualcuno che non sappia quale numero avete scritto, e vi accorgerete dell’utilità della nostra rappresentazione decimale. Qual è allora il processo che sta dietro a tale notazione? Anche questo lo abbiamo imparato alle scuole elementari. Cominciamo col ricordare che esiste una notazione convenzionale per i numeri piccoli: ad una sola asta | associamo la cifra 1, a due aste || la cifra 2, e cosı̀ via fino a nove aste |||||||||, cui associamo la cifra 9. Quando di aste non ve ne sono, indichiamo questo fatto con la cifra 0. Nota 1.6 Come abbiamo accennato, i Babilonesi svilupparono una notazione posizionale, ancorché basata sul numero 60. Purtroppo, la cifra 0 non veniva considerata, di modo che 23 poteva indicare tanto il numero 23 quanto il 203 o il 2003, e si doveva capire dal contesto quale fosse l’interpretazione corretta. Ciò rendeva questa notazione inutilizzabile per eseguire i calcoli, e fu proprio su questo punto che i Babilonesi fallirono. Quando fu riscoperto, lo zero venne rappresentato da un tondino; si passò poi a un semplice punto, e solo in seguito si è arrivati all’attuale simbolo. Gli arabi usavano per lo zero il nome “sifr”, che significa vuoto. Il termine fu tradotto in latino con il termine zephyrum e da questo sono derivate le parole “zero” e “cifra”. Ecco allora che presentiamo il nostro primo algoritmo: Algoritmo 1.1 (Rappresentazione decimale) Ingresso: Un numero n scritto nella notazione ad aste; Uscita: La rappresentazione decimale di n. 1. sia S l’insieme contenente le aste che rappresentano n; 2. se S è vuoto, rappresentiamo n con la cifra 0 e usciamo; 3. altrimenti sia L una lista vuota; 4. se l’insieme S contiene meno di 10 aste, poniamo in testa ad L la cifra corrispondente al numero di aste di S; si esce e la sequenza ordinata delle cifre che si trovano in L è la rappresentazione decimale del numero n; 5. altrimenti, raggruppiamo in sottoinsiemi di 10 aste tutte le aste di S; 6. se, arrivati alla fine dell’operazione di raggruppamento, è rimasto un gruppetto di k aste (k < 10) mettiamo in testa alla lista L la cifra corrispondente al numero k; se invece non è rimasto nessun gruppetto, mettiamo la cifra 0 in testa ad L; 26 CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA 7. eliminiamo l’eventuale gruppetto di k aste rimasto; estraiamo da ciascuno dei gruppi di 10 aste un’unica asta e, con queste, formiamo un nuovo insieme che chiamiamo ancora S; 8. si torna al punto 4. Per il numero 34, il raggruppamento produce: |||||||||| | {z } |||||||||| | {z } |||||||||| | {z } ||||, La sequenza dei resti, letta da destra verso sinistra, 3245, dà la rappresentazione del numero in base 7. Per le basi maggiori di 10, le cifre ulteriori si indicano con le lettere dell’alfabeto: A = 10, B = 11, C = 12, etc. Ad esempio, se si vuole esprimere 148710 in base 12 si ha: 1 4 8 2 8 4 1 7 1 1 7 1 2 2 3 1 0 3 1 3 1 2 0 1 0 0 2 per cui la prima cifra da porre in L è 4. L’estrazione delle aste dai gruppi dà ||| e quindi la cifra 3 viene Questa volta la sequenza dei resti è 10, 3, 11, e quindi posta in testa ad L che diviene (3, 4). A questo pun- 1487 = A3B . 10 12 to si è finito e in L si legge il numero 34, come c’era da aspettarsi. Il lettore è invitato a immaginare quale Nota 1.7 Nel caso che la base sia 2, le divisioni semplificazione apporterebbe al precedente algoritmo si fanno ad occhio e il resto è ovviamente 0 oppure 1 a seconda che il numero sia pari o dispari. L’impostal’idea di generalizzare il concetto di “raggruppare in zione è allora la seguente e il numero in base 2 si legge sottoinsiemi di 10 aste” per intendere che tale ragdal basso verso l’alto: 17810 = 101100102 : gruppamento possa essere fatto (virtualmente) anche quando le aste sono meno di 10. 178 0 Il metodo realizzato dall’algoritmo è del tutto ge89 1 nerale e chiaramente univoco; permette perciò di 44 0 formulare un risultato molto importante: 22 0 11 5 2 1 0 Teorema 1.2 Se dr dr−1 . . . d1 d0 è la rappresentazione decimale di un numero naturale n, allora tale rappresentazione è unica. L’algoritmo 1.1 ha un’importanza molto superiore alla sua apparente banalità, come cercheremo di mettere ora in evidenza. La base 10, come s’è detto, è in larga parte arbitraria; potremmo usare la base 7 e avere una diversa rappresentazione dei numeri. In questo caso, ad esempio, dovremmo utilizzare 7 cifre, diciamo 0, 1, 2, 3, 4, 5, 6, e un numero come 3245 avrebbe per significato: 3 × 73 + 2 × 72 + 4 × 7 + 5 = 1029 + 98 + 28 + 5 = 1160. Si scrive anche 32457 = 116010 , se si vogliono mettere in evidenza le basi ed evitare possibili confusioni. Analogamente, in base 2 si usano le sole cifre 0,1, dette bit (in inglese: “BInary digIT”, cifre binarie), e un numero come 10110112 ha come valore in base 10: 1 × 26 + 0 × 25 + 1 × 24 + 1 × 23 + 0 × 22 + 1 × 2 + 1 = 64 + 16 + 8 + 2 + 1 = 91. Queste osservazioni permettono di capire il significato di un numero scritto in una base qualsiasi. Viceversa, se vogliamo scrivere un numero come 1160 in base 7, basta procedere come stabilito dall’Algoritmo 1.1, utilizzando il 7 al posto del 10. In pratica, il metodo si dice delle divisioni successive e si imposta, appunto, come una serie di divisioni: 1 1 4 6 0 7 6 1 4 0 5 6 5 2 5 4 7 2 3 2 7 3 7 3 0 1 1 0 1 Anche la conversione inversa può essere resa più veloce impostandola nel modo seguente: a partire da destra, si scrivono, sotto ogni cifra del numero binario di partenza, le potenze di due a partire da 20 = 1. Questo si fa raddoppiando ad occhio ogni volta il numero precedente (cioè, quello sulla destra). Alla fine, si sommano, sempre a mente, i numeri che stanno sotto i bit uguali ad 1. 1 128 0 64 1 32 1 16 0 8 0 4 1 2 0 1 In questo caso si ha 128 + 32 + 16 + 2 = 178, come si sapeva. Una domanda abbastanza naturale a questo punto è: quant’è lunga la rappresentazione di un numero n? Più precisamente, quante cifre servono per rappresentare il numero n nella base b? Per la regola posizionale, servono k + 1 cifre se il numero è compreso tra bk e bk+1 , cioè se abbiamo: bk ≤ n < bk+1 . Passando ai logaritmi in base b (siamo in una nota!) si ottiene: k ≤ logb (n) < k + 1; poiché k è un numero intero, si ha k = ⌊logb (n)⌋, dove questa notazione significa: “Prendi la parte intera di . . .”. Aggiungendo 1, si ottiene il risultato generale: il numero di cifre necessarie a scrivere il numero n nella base b è ⌊logb (n)⌋ + 1. Spesso e volentieri, quando si usa un elaboratore, occorre passare rapidamente dalla base 2 alla base 10, o viceversa. Se non si deve essere molto precisi, e ci si accontenta del solo 1.5. RAPPRESENTAZIONE DEI NUMERI NATURALI ordine di grandezza, siano k2 e k10 il numero di cifre necessario a scrivere il numero n in base 2 e in base 10. Dall’approssimazione classica 210 ≈ 103 si ha la semplice proporzione: k2 : k10 = 10 : 3, che permette il calcolo veloce di k2 conoscendo k10 , e viceversa. Ad esempio, nella rappresentazione interna dell’elaboratore, di solito si riescono a rappresentare i numeri fino a 2128 ; dalla precedente proporzione si ricava che tale numero corrisponde, grosso modo, a 1038 . La numerazione posizionale con base fissa, sia che questa venga scelta come 10, sia che si preferisca 2, 8 o 12, è in effetti il metodo più semplice di rappresentare i numeri e permette di eseguire direttamente le operazioni elementari. Tuttavia, si possono concepire numerazioni posizionali con una base composta, e nella realtà esistono ancora oggi (e più ne esistevano nel passato) numerazioni di questo tipo. La più utilizzata nella pratica è la numerazione dei giorni, per la quale un anno si compone di 12 mesi, un mese di (circa) 30 giorni, un giorno di 24 ore, un’ora di 60 minuti e un minuto di 60 secondi. Limitandoci ai giorni, la scrittura 5d 14h 35′ 18′′ si legge: cinque giorni, quattordici ore, trentacinque minuti e diciotto secondi. Cosı̀ come nella base 10 ogni cifra deve essere compresa nel rango 0 ÷ 9, qui ogni indicazione di ora deve essere compresa tra 0 e 23, ogni indicazione di minuto e di secondo deve rientrare nel rango 0÷59; la base composta si scrive pertanto (24, 60, 60), quando ci si limiti ai giorni, e (12, 31, 24, 60, 60) oppure (365, 24, 60, 60) quando la si voglia estendere a tutto l’anno. In questa ottica, 4d 36h 154′ 78′′ è apparentemente una scrittura priva di senso, analoga al numero 2013 in base 2. Tuttavia, conviene dare un senso a tale notazione, interpretando le varie quantità in funzione del corrispondente valore della base. Ciò, come vedremo, è molto conveniente per eseguire le operazioni e avviene nel modo seguente, procedendo da destra verso sinistra: 27 1.1 permette, conoscendo i numeri che definiscono la base composta, di trovare la rappresentazione di una quantità data come numero di secondi (o di minuti o di ore) interpretati come stecchini od aste. Naturalmente, le suddivisioni in gruppi non avvengono più tutte nella stessa maniera, ma in funzione delle componenti della base: cosı̀ i secondi vengono riuniti in gruppi di 60, i minuti ancora in gruppi di 60, ma le ore in gruppi di 24. In questo caso, le abbreviazioni d, h per giorno ed ora non vengono dall’inglese day e hour, ma dal latino dies ed hora, il che potrà tranquillizzare più di una persona. I minuti primi e i minuti secondi sono un’espressione antica, nella quale “minuto” sta appunto per “piccolo”, cioè suddivisione piccola dell’ora; l’uso ha poi portato a chiamare i primi semplicemente minuti e i secondi secondi (spero si voglia apprezzare il bisticcio). La notazione con gli esponenti è tipograficamente un po’ ostica; cosı̀ dal quotidiano apprendo che Gilberto Simoni ha vinto la tappa di ieri del Giro d’Italia in 4h46′ 43′′ ; negli orari, ferroviari e non, la partenza è annunciata alle 15:46, evitando giustamente il punto o la virgola decimale, visto che questi numeri decimali non sono. Anche gli orologi digitali e i calcolatori elettronici hanno adottato questa notazione con i due punti, riferendola costantemente alle ore del giorno. Mi capita anche di vedere 18:37:58 per 18h 37′ 58′′ e, costretti dagli orari, perfino gli anglosassoni oggi accettano di scrivere 15:46 invece di 3:46 p.m., arrivando a pronunciare “fifteen hundred forty six”. Dove si andrà a finire? Analoghe considerazioni valgono per la notazione relativa agli angoli, dove la base composta è (360, 60, 60), con l’ulteriore precisazione che non si possono superare i 360◦ , corrispondenti a un angolo giro completo. Un angolo è dato in gradi compresi tra 0 e 359 (si ripetono poi ciclicamente); un grado è composto di 60 primi e un primo di 60 secondi. Cosı̀ 1000◦ 324′ 97′′ è una brutta rappresentazione di un angolo di 285◦ 25′ 37′′ , come il lettore avrà la compiacenza di verificare con quattro calcoli elementari. • 78′′ si interpreta come 1 minuto e 18′′ , visto che un minuto corrisponde a 60 secondi; queIl sistema metrico decimale, prodotto dall’Illumisto minuto va a incrementare i 154′ portandoli a nismo del 1700 e messo in atto dalla Rivoluzione 155′ ; Francese, ha in pratica lasciato alle basi composte soltanto il computo del tempo e la misurazione de′ ′ ′ • 155 si interpreta come 2 ore (cioè, 120 ) e 35 ; le gli angoli. Nel mondo anglosassone, più restio ad h due ore vanno ad incrementare le 36 portandole accettare le novità venute dalla Francia, fino al 14 a 38h ; Gennaio del 1971 la sterlina si divideva in 20 scellini • 38h si interpreta come 1 giorno (cioè, 24h ) più (ma la ghinea valeva 21 scellini), e lo scellino in 12 14h ; questo giorno incrementa di 1 il numero pence (plurale, questo, di penny, anche se tre monete da un penny erano “three pennies”); la base era complessivo dei giorni. quindi (∞, 20, 12) o anche (20, 12) e lo straniero era In definitiva, abbiamo 4d 36h 154′ 78′′ = 5d 14h 35′ 18′′ e guardato in modo supercilioso se si imbrogliava anquesta è la rappresentazione standard. L’Algoritmo che un po’. Ancora oggi, le unità di misura lineare, 28 CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA e di conseguenza le misure di superficie e di volume, non si rifanno alla base 10: il pollice (2.54 cm) ha come multipli il piede, composto di 12 pollici, la yarda, formata da 3 piedi, e il miglio, che di yarde ne conta esattamente 1760. Come sottomultipli del pollice si usano il mezzo pollice, il quarto, l’ottavo e anche il sedicesimo di pollice, il che porta in ballo, del tutto inaspettatamente, la base 2. Facco grazia al lettore delle misure di peso (oncia, libbra, etc.) e di quelle di volume (quarto, pinta e gallone). 1.6 La nomenclatura della Matematica Gli insiemi e i numeri, di cui abbiamo parlato, sono sicuramente concetti che appartengono alla Matematica, anche se non è chiaro perché il concetto di “mandorla” non ne debba far parte. Si pensa, in genere, che concetti troppo specifici, come appunto quello di mandorla, non possano portare a conclusioni generali: o la mandorla è vista come elemento di un insieme, e allora il concetto di insieme viene a inglobare quello di mandorla, oppure vogliamo contare le mandorle, e allora dobbiamo proprio astrarre dal fatto di contare mandorle, e di nuovo l’interesse per tale concetto viene a cadere. Ma allora, ci chiediamo, quanto deve essere generale un concetto per poter appartenere alla Matematica? Questo è difficile a dirsi e se si pensa che per secoli la rappresentazione arabica dei numeri non è stata presa in considerazione dalla Matematica accademica, ci si rende conto come la demarcazione sia estremamente labile. Diciamo che un concetto o, meglio, una serie di concetti fanno parte della Matematica quando si riesce a creare una teoria che li comprende. Che cos’è allora una teoria? La misurazione dei campi potrebbe, oggi come oggi, difficilmente essere considerata una parte, perfino importante, della Matematica: il suo grado di generalità sembra alquanto basso se confrontato, ad esempio, con la Fisica nucleare, l’astronomia o la ricerca operativa. In effetti la Geometria (cioè la misurazione dei terreni) è uno dei più classici esempi di teoria matematica. Partendo dalla considerazione delle figure dei campi, i geometri dell’antichità hanno individuato alcuni concetti che costituiscono la base di ogni altro concetto geometrico. Per far questo hanno cercato di dare una definizione di triangolo e di rettangolo, ma queste implicano una definizione di angolo e di lato, e quindi la definizione di segmento e di semiretta, e cosı̀ via. Questo processo che ci porta a concetti sempre più generali non può continuare all’infinito, ma dobbiamo interromperlo da qualche parte. Fu deciso di interromperlo ai concetti di punto, retta, piano, spazio e alle loro reciproche disposizioni. Ciò significa che non possiamo (e non vogliamo) definire che cosa è un punto, che cosa è una retta o che cosa vuol dire che un punto si trova su una retta. Ma allora, come possiamo sapere che cosa sono questi oggetti e queste relazioni? Gli antichi (ad esempio Euclide) avevano dato una risposta a livello di intuizione: i concetti primitivi, cioè non definiti e non definibili, sono astrazioni estreme di concetti evidenti e, come tali, noi li accettiamo per buoni. La realtà, di cui sono astrazione, ci assicura della loro “esistenza” e della validità delle loro proprietà. In questa ottica, una retta può essere infinitamente lunga e infinitamente smilza, anche se nella realtà non è cosı̀: le proprietà sono intuite quando operiamo l’atto di pensare di restringere sempre più una retta reale e di farla continuare oltre ogni limite fisico. In ogni modo, ai concetti di base della teoria rimane legata una “realtà” che permette di applicare al mondo che ci circonda i risultati della teoria stessa. Cosı̀, nella visione antica, la Geometria, oltre ad essere una teoria, è uno strumento pratico, ed è proprio questo aggancio al mondo reale che rende una teoria “vera”: se scoprissimo qualche divario tra teoria e pratica, la teoria non andrebbe più bene e dovrebbe essere abbandonata. Questa dipendenza della teoria dalla pratica ha fatto molto pensare i matematici, che non erano soddisfatti proprio per niente. Cosı̀, durante il 1800 hanno cambiato le carte in tavola, invertendo completamente il vecchio punto di vista: non è la realtà che determina o convalida una teoria, ma questa è un’entità autonoma che, semmai, trova un suo modello nella realtà, o almeno in quella parte della realtà che ha il buon gusto di adeguarsi alla teoria. Cosa significa questo per la Geometria? Significa che punto, retta, piano e spazio non sono astrazioni della realtà, ma sono dei puri nomi o simboli, le cui reciproche relazioni sono definite negli assiomi della teoria. Gli assiomi, cioè le verità che nella concezione antica erano stabiliti dalla realtà e accettate come tali, ora sono concepiti come proprietà che regolano le relazioni reciproche fra i simboli della teoria. In questo senso, gli assiomi potrebbero essere del tutto arbitrari; esiste però un’ovvia limitazione: essi non si possono contraddire tra di loro, né portare a contraddizioni interne alla teoria. Cosı̀, in altre parole, non deve mai succedere che si dimostri una certa affermazione insieme alla sua contraria. La mancanza di contraddizioni si dice coerenza della teoria. Nota 1.8 Aristotele dava significati distinti alle parole “assioma” e “postulato” (si veda al Capitolo 6 sulla Geometria Euclidea). Gli assiomi, o ‘nozioni comuni’, sono affermazioni evidenti di per sé e comuni a tutte le scienze (ad esempio: se due oggetti sono uguali ad un terzo, allora sono anche uguali tra di loro). I postulati sono invece verità specifiche della 1.6. LA NOMENCLATURA DELLA MATEMATICA 29 direttamente. La coerenza della teoria di Peano ci dice che tutte le affermazioni che possiamo dimostrare sono vere nel senso detto: vorremmo anche che, viceversa, tutte le affermazioni vere potessero essere dimostrate. Qui entra in ballo la completezza e ci farebbe piacere dimostrare che la teoria di Peano è completa, cosa che potrebbe essere ragionevolmente vera, visto che i Matematici sono riusciti a costruire (quasi) tutta la Matematica conosciuta partendo da quegli assiomi. Qui, però, viene il difficile, poiché si tratta di dimostrare qualcosa di generale sulla teoria agendo dall’interno della teoria stessa. Nel 1928, il logico e Matematico austriaco Kurt Gödel riuscı̀ a dimostrare (proprio dall’interno della teoria) che gli assiomi di Peano non sono completi, cioè che esistono affermazioni vere, ma indimostrabili. Non solo, ma egli fece vedere che qualunque teoria che comprenda gli assiomi di Peano (e quindi voglia assiomatizzare l’Aritmetica e la Matematica) è di per sé non comIn un certo senso, la coerenza di una teoria si rife- pleta. In altre parole, la nostra speranza di poter risce al nostro desiderio che, all’interno della teoria, dimostrare tutto ciò che è vero nella Matematica è non si riescano a dimostrare “troppe” affermazioni, un sogno destinato comunque a fallire. cosı̀ tante da includere anche la negazione di un teoreUn aspetto, infine, forse meno importante ma cerma già dimostrato vero. All’opposto, desidereremmo to interessante, è costituito dall’indipendenza dei vari anche che la teoria non fosse troppo ristretta da non assiomi di una teoria. Un assioma si dice indipenpermetterci di dimostrare affermazioni che sappiamo dente dagli altri considerati, se, togliendolo dalla foressere vere e che vorremmo fossero incluse nell’ambito mulazione della teoria, questa perde una parte dei della teoria. Se i nostri assiomi sono troppo specifici o le regole con cui effettuiamo i nostri ragionamenti non suoi teoremi. Questa affermazione può essere messa sono abbastanza potenti, rischiamo di non arrivare a in positivo dicendo che un assioma dipende dagli altri dimostrare fatti che, invece, per la nostra esperien- assiomi della teoria, se esso può essere dimostrato a za o anche solo per la nostra volontà, dovrebbero far partire da quelli (e pertanto non è un vero assioma). parte della teoria che stiamo sviluppando. Una teo- Fondare una teoria su assiomi indipendenti vuol dire ria (coerente) nella quale si possono dimostrare tutti riuscira a svilupparla con un numero minimo di coni teoremi che sono “veri” si dice completa. Quindi, cetti “dati per buoni”; questo rientra in quel gusto in altre parole, una teoria ideale o perfetta è una estetico che i matematici hanno per la loro scienza e teoria coerente e completa, nel senso preciso che in del quale parlavamo già nella Premessa. disciplina che stiamo studiando; la loro evidenza è subordinata al fatto che si abbia idea della disciplina in questione. Ad esempio, un postulato della Geometria Euclidea è: “Tutti gli angoli retti sono uguali”, il che è sı̀ apparentemente vero, ma occorre che si sappia che cos’è un angolo retto. Il famoso postulato “Per un punto P esterno a una retta r passa una e una sola retta parallela ad r” (dato da Euclide in tutt’altra forma; si veda ancora il capitolo sulla Geometria Euclidea) non è stato mai considerato troppo evidente e, come è noto, ha dato origine alle Geometrie non Euclidee, teorie che sono coerenti (se ne danno semplici modelli nella nostra realtà forse Euclidea), ma nelle quali è “evidente” che per P possono passare infinite rette parallele ad r, o anche nessuna. Oggi la distinzione tra assioma e postulato è caduta e si usano indifferentemente i due termini per indicare gli elementi di base di una teoria. una tale teoria si riescono a dimostrare tutte e sole le affermazioni vere. Possiamo forse essere più precisi facendo un esempio importante. Nella Nota 2.8 vedremo l’assiomatizzazione dell’Aritmetica proposta da Peano; in realtà, essa è molto di più, poiché può essere presa come base dell’assiomatizzazione di tutta la Matematica. Che essa sia coerente, è ragionevole pensarlo, dato che gli assiomi sembrano adattarsi bene alle proprietà dei numeri naturali che essi vogliono descrivere; ci aspettiamo pertanto che tutti i teoremi che in essa riusciamo a dimostrare siano veri. Dire che un’affermazione è “vera” significa qui che essa è verificata nel mondo della Matematica, reale o ideale che esso sia. Ma come possiamo dire che un’affermazione è vera in questo senso? Le affermazioni della Matematica (ma basta considerare quelle dell’Aritmetica) coinvolgono in generale un numero infinito di oggetti (cioè, di numeri) e quindi è impensabile poterli “verificare” Ma cosa significa “dimostrare”? Il senso comune ci fornisce alcune regole che ci permettono di stabilire se una frase è conseguenza logica di un’altra frase, come “Se non ti metti le scarpe, andrai scalzo”. L’esperienza ce ne fornisce altre di tipo più specifico, come: “Se non ti metti la maglia, prenderai un raffreddore”. Come si vede, le prime regole prescindono dal contenuto particolare della frase e si basano su una riformulazione dello stesso concetto: non mettersi le scarpe o andare scalzi significano la stessa cosa. Queste regole possono sembrare ovvietà, ma spesso si rivelano più utili di quanto non ci si aspetterebbe: esse sono le comuni regole della logica e tutti i ragionamenti, sia in Matematica sia nella vita di tutti i giorni, ne fanno largo uso. Il secondo tipo di regole è specifico dell’argomento che si sta trattando, cioè della teoria che stiamo elaborando: la frase precedente sul raffreddore fa parte (con un po’ di fantasia) della Medicina e non della Matematica, ma si possono fare esempi 30 CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA come “Se A, B, C sono tre punti su una retta ed A è compreso tra B e C, allora la distanza di A da B è minore della distanza di B da C”. Le regole di deduzione specifiche di una teoria si dicono regole di inferenza della teoria e, assieme agli assiomi, costituiscono la base della teoria stessa. Sviluppare una teoria significa dedurre le conseguenze possibili degli assiomi usando le regole della logica e le regole di inferenza. Nella prossima sezione vedremo le tecniche più importanti che ricorrono nelle dimostrazioni della Matematica. Che gli assiomi siano coerenti tra di loro è, di solito, facile a vedersi; più difficile è capire se, procedendo nello sviluppo della teoria, non si arriverà mai a qualche contraddizione. Un metodo consiste nel cercare nella realtà un modello della teoria, cioè una parte della realtà che soddisfi gli assiomi della teoria. Se abbiamo fiducia nella coerenza della realtà (che cioè questa non cada in contraddizione con sé stessa), questo adeguarsi del modello alla teoria ci può rassicurare sulla coerenza di quest’ultima. Riassumendo, una teoria è costituita: parola “teorema” è oggi un termine generico che indica tutte le conseguenze possibili degli assiomi. Nella pratica, si lascia il nome di “teorema” ai risultati veramente importanti, e si preferisce usare i seguenti termini in situazioni più specifiche: • osservazione e proposizione: allargando un po’ il concetto di “affermazione singolare” questi nomi indicano risultati di semplice verifica, cioè dimostrabili senza sforzi, in maniera elementare e di solito non interessante; • lemma: indica un teorema che non è un risultato importante di per sé, ma che serve a semplificare la dimostrazione di uno o più risultati interessanti (che probabilmente saranno definiti “teoremi”); • corollario: si riferisce a un teorema che è una immediata conseguenza di un altro teorema appena dimostrato. La dimostrazione di un corollario si riduce spesso a una o due righe e, talvolta, si può omettere addirittura. • da un insieme di assiomi, che consideriamo veNon tutte le affermazioni che riteniamo vere possori per definizione e che legano tra di loro i vari no essere dimostrate; come abbiamo osservato, questo concetti di base della teoria stessa, definendoli fatto è intrinseco alle teorie formali e non possiamo implicitamente; che prenderne atto. Tuttavia, di fronte a un’affermazione che ha resistito all’attacco di generazioni di • da un insieme di regole di inferenza, cioè di mematematici, i quali hanno miseramente fallito, ma che todi di ragionamento specifici della teoria che ci sembra vera per varie ragioni (la sensatezza, l’especi permettono di passare dagli assiomi ad alrienza, le prove effettuate, la ricerche mediante l’uso tre affermazioni vere, sempre più profonde e che di calcolatori elettronici), non possiamo sapere se: 1) costituiscono il corpo della teoria. stiamo sbagliando e l’affermazione è in realtà falsa; 2) siamo imbranati e nono siamo riusciti a trovare la Partendo dagli assiomi e lavorando con le regole di strada giusta per la dimostrazione, che perciò verrà inferenza e le regole comuni della logica si ottengofuori fra qualche annetto; 3) siamo davvero sfortunati no nuove affermazioni vere che si dicono teoremi. La e ci siamo imbattuti in una proposizione pevista dal forma generale di un teorema è: “Se è vero un certo teorema di incompletezza di Gödel. Si usa per questa insieme di affermazioni A1 , A2 , . . . , Ar , allora è vera situazione il termine: l’affermazione B”; si dice che A1 , A2 , . . . , Ar costituiscono le ipotesi del teorema e che B è la tesi. Se il • congettura: si riferisce ad affermazioni che teorema risulta vero, si dice anche che A1 , A2 , . . . , Ar pensiamo essere vere, ma per le quali non sono condizioni sufficienti per B, o che B è condizione conosciamo (ancora) alcuna dimostrazione. necessaria per A1 , A2 , . . . , Ar . Talvolta un teorema si esprime nella forma più sintetica dell’implicazione “A Come esempio della terminologia introdotta, conimplica B”. Alcuni teoremi assumono la forma “A è sideriamo la seguente sequenza di dimostrazioni. Covero se e solo se tale è B”; questo equivale ai due minciamo con l’osservare che se sommiamo i primi teoremi “A implica B” e “B implica A”, e cioè “A è due numeri dispari 1 e 3 otteniamo 4 = 22 . Sommancondizione necessaria e sufficiente per B”. In questo do i primi tre dispari si ha 1 + 3 + 5 = 9 = 32 , e se caso la forma sintetica è “A se e solo se B”, e si dice sommiamo i primi quattro otteniamo proprio 42 . E’ una doppia implicazione. possibile dimostrare che la somma dei primi n numeri I teoremi sono sempre affermazioni di carattere ge- dispari è proprio n2 ? Prima di tutto dimostriamo il nerale; ad esempio, “52 + 19 = 71” è un’affermazione seguente: deducibile dagli assiomi dell’aritmetica. Tuttavia, essa non verrà mai considerata un teorema, ma sempli- Lemma 1.3 I primi n numeri dispari sono cemente una affermazione singolare della teoria. La 1, 3, . . . , 2n − 1. 1.7. MATEMATICA E LOGICA Prova: Se escludiamo lo 0, i primi n numeri sono 1, 2, . . . , n e quindi i primi n numeri pari sono 2, 4, . . . , 2n. I primi n numeri dispari sono quelli che precedono i primi n numeri pari e quindi sono proprio 1, 3, . . . , 2n − 1. Questo risultato ci serve ora a dimostrare: Teorema 1.4 La somma dei primi n numeri dispari vale: 1 + 3 + · · · + (2n − 1) = n2 . Prova: Posto S = 1 + 3 + · · · + (2n − 1), si ha anche S = (2n − 1) + · · · + 3 + 1. Sommando le coppie di elementi corrispondenti si ha: 2S = 2n + 2n + · · · + 2n + 2n = 2n2 , essendo la somma composta di n termini tutti uguali a 2n. Dividendo per 2 si ha il risultato desiderato. Questo è il nostro teorema importante che ha come conseguenza immediata: Corollario 1.5 La media dei primi n numeri dispari è uguale ad n. Prova: Essendo n i numeri, la media è S/n = n2 /n = n. Ricordiamo infine che la forma canonica o normale di un oggetto matematico è un’espressione che denota quell’oggetto in una maniera standard, secondo opportune convenzioni, ed è adatta a semplificare le elaborazioni relative a quell’oggetto. Ad esempio, la forma canonica di un’equazione di secondo grado è ax2 + bx + c = 0, e da questa forma si deducono le eventuali soluzioni. La forma normale di una retta (non perpendicolare all’asse delle x) è y = mx + b, dove m è la pendenza e b è l’intercetta, cioè il valore dell’intersezione con l’asse delle y. Tuttavia, in particolari contesti, si considera come forma canonica della retta ax + by + c = 0 e quando si voglia trovare l’intersezione di due rette si preferisce una terza forma canonica, e cioè ax + by = c, che vale anche per le rette perpendicolari all’asse delle x. 1.7 Matematica e Logica Il ragionamento matematico è un caso particolare del ragionamento logico e, più in generale, le teorie matematiche sono parte delle teorie logiche. Spesso, oggi, si tende ad identificare Matematica e Logica, perché quest’ultima può essere formalizzata in una teoria matematica. Dal nostro punto di vista, volutamente elementare, questa identità interessa come curiosità, piuttosto che come situazione effettiva. Tuttavia, non possiamo ignorare le grandi e importanti connessioni che legano Matematica e Logica. In particolare, è bene mettere in evidenza quelle parti, o almeno 31 quei concetti della Logica che hanno un immediato riscontro nella Matematica. La teoria logica più elementare è senza dubbio il Calcolo proposizionale o Logica delle proposizioni. Inventata da Boole (1815 – 1864) alla metà del 1800, e sviluppata dai matematici inglesi di quel periodo, questa teoria tratta in modo del tutto generale delle proposizioni, ove informalmente con questo termine si intende ogni affermazione che possa essere vera o falsa. Questo esclude dalla teoria le domande e le esclamazioni, ma comprende quasi tutto il discorso comune. Per questo la sua connessione con la Matematica è forte e deve essere conosciuta. Gli esempi che faremo sono presi dalla lingua parlata, ma cercheremo di dare anche significativi agganci alle proposizioni della matematica, in particolare ai teoremi. Nel Capitolo 4 dedicheremo la Sezione 4.6 al calcolo delle proposizioni; per il momento ci accontentiamo di introdurre i concetti e le tecniche principali. Le proposizioni che si prendono in considerazione devono sempre essere ben determinate; cosı̀ la frase “domani è domenica” suppone che si stia ragionando in un preciso giorno e che quindi la frase sia vera (siamo di sabato) o falsa (siamo in qualche altro giorno della settimana); va cioè esclusa l’idea che la frase possa dipendere dal giorno in cui è stata pronunciata. Le frasi con quest’ultimo intendimento, che prevedono una variabilità del discorso in funzione di quale giorno della settimana è oggi, non sono proposizioni, ma nella terminologia della Logica si dicono predicati e hanno una propria teoria, alla quale accenneremo nella Sezione 1.8. Analogamente, la frase “Carlo è andato a Roma” presuppone che sia perfettamente individuato il Carlo di cui si parla, e “questo è un coltello” faccia riferimento a un oggetto ben definito, che può essere o non essere un coltello. La negazione di una proposizione è un’altra proposizione, che risulta vera o falsa a seconda che quella originaria fosse falsa o vera. Ovviamente, se il Carlo di cui parliamo è andato a Roma, la proposizione “Carlo non è andato a Roma” è una proposizione falsa. Ciò può essere espresso sinteticamente per mezzo della tabella di verità che esprime, in funzione dei possibili valori di verità di p, il valore di verità della negazione ¬p; assumendo come convenzione che 1 indichi il valore “vero” e 0 il valore “falso”, la tabella è: p ¬p 0 1 1 0 La congiunzione di due proposizioni è la proposizione che si ottiene interponendo la congiunzione “e” fra le due proposizioni; ad esempio “Carlo è andato a Roma e si è iscritto all’Università”. La congiunzione è vera se e solo se risultano vere entrambe le 32 CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA con p → q. Questa è la forma dei teoremi della Matematica, ma naturalmente la lingua comune è piena di implicazioni: “Se vai da Carlo [allora] riportagli il suo libro”. La doppia implicazione si esprime “. . . se e solo se . . . ”, è assai comune in Matematica, molto meno nei discorsi di tutti i giorni, dove, creando sovente più di qualche ambiguità, si preferisce esprimersi con semplici implicazioni: “Pagherò se mi conviene” di solito significa “Pagherò se e solo se mi conviene”, anche se, letteralmente, chi ha pronunciato la frase non ha detto “se pagherò allora mi conviene”, ma si è limitato a dire: “se mi conviene allora pagherò.” La notazione per la doppia implicazione è p ↔ q. La verità o falsità di una implicazione è un problema non del tutto banale. Normalmente, come si è detto, se “p → q” è un’implicazione, p si dice l’ipotesi e q la tesi. Se l’ipotesi è vera e ragioniamo in modo corretto, vogliamo che sia vera anche la tesi, anzi non possa essere falsa. Se la tesi risulta falsa, significa semplicemente che abbiamo sbagliato la deTale formalismo, che qui è appena accennato, ma duzione, cioè siamo di fronte a una non-implicazione. che svilupperemo nel Capitolo 4, serve almeno a dare Secondo la tradizione, questa regola si dice modus poun’espressione semplice ad antichi principi: nens e si enuncia: se p è vera e “p implica q” è vera, allora è vera q: • principio del terzo escluso (tertium non datur): la proposizione p è vera o falsa, cioè p = 1 ((p ∧ (p → q)) → q. oppure p = 0. Questo principio, per noi, fa parte della stessa definizione di proposizione; D’altra parte, se una deduzione è corretta, ma la te- proposizioni che la compongono. La disgiunzione di due proposizioni si ottiene interponendo tra di esse la congiunzione “oppure” con significato disgiuntivo, cioè che la verità di una proposizione non esclude la verità dell’altra. Un esempio significativo è “mangerò il dolce oppure [mangerò] la frutta”, volendo intendere che comincerò a mangiare uno dei due e poi, se avrò ancora fame, mangerò anche l’altro (conoscendomi, avrei potuto dire “mangerò il dolce e la frutta”, ma un po’ di ritegno non guasta mai). La disgiunzione è vera quando almeno una delle due proposizioni di partenza è vera, o sono vere tutt’e due, come illustrato nell’esempio. Le rispettive tabelle di verità sono: p q p∧q p q p∨q 0 0 0 0 0 0 0 1 0 1 0 1 0 1 1 0 1 0 1 1 1 1 1 1 • principio di non contraddizione: la verità si è manifestamente falsa, dobbiamo concludere che di p esclude la verità di ¬p, e viceversa, cioè l’ipotesi era falsa. Nella logica aristotelica questo si p ∧ ¬p = 0. La congiunzione di p e della sua dice modus tollens e si formalizza: negazione è sempre una proposizione falsa, cioè ((p → q) ∧ ¬q) → ¬p. è una contraddizione. Questo è ragionevole, ma quando l’ipotesi è falCome avremo modo di ribadire più volte, nella Logica sa, cosa ci possiamo aspettare? Se l’ipotesi è falsa, e nella Matematica moderne, questi principi non si supporla vera è un controsenso o una contraddizione, reputano più validi in senso assoluto. e da una contraddizione possiamo ricavare tutto ciò Boole dimostrò che i tre modi di connettere le proche vogliamo, cioè possiamo ricavare tanto tesi false posizioni (e il loro nome tecnico è appunto connettivi quanto tesi vere. Quindi, in conclusione, l’implicalogici) sono sufficienti a generare tutti i possibili lezione sarà vera qualunque sia la verità o falsità della gami tra proposizioni, e noi lo vedremo nella sezione tesi. dedicata al calcolo delle proposizioni. Esistono tuttavia altri connettivi logici importanti. L’esclusione Nota 1.9 Questo punto non è intuitivo poiché fra due proposizioni si ottiene, come la disgiunzione, tendiamo a rifiutare l’idea che se partiamo da mettendole insieme con la congiunzione “oppure”, ma un’ipotesi falsa ragionando bene possiamo arrivare tanto a conclusioni vere che false. Ma l’implicazione il significato di questa deve essere esclusivo, cioè l’un p → q indica la correttezza della deduzione, e quindi caso deve escludere l’altro; cosı̀ possiamo dire: “Non dal vero non possiamo dedurre il falso, ma dal falso abbiamo molto tempo: passiamo dal supermercato o possiamo dedurre tutto ciò che vogliamo. Si narra andiamo dal commercialista” intendendo che se facche ad una conferenza Bertrand Russell (1872 – 1970) ciamo una cosa non potremo fare l’altra. L’esclusiocercasse di spiegare questo punto. Uno dei presenti, ne, pertanto, è vera se e solo se una sola tra le due allora, lo sfidò a dimostrare dall’ipotesi falsa 1 = 2 proposizioni è vera; essa si indica con la notazione che lui, Russell, e la Regina di Inghilterra erano la p ⊕ q. stessa persona. Russell non ci stette a pensar molto L’implicazione si esprime di solito con “se . . . , ale propose il seguente ragionamento: “Io sono una lora . . . ”, dove le ellissi stanno ad indicare le due persona”; “La Regina d’Inghilterra è una persona”; “quindi io e la Regina di Inghilterra siamo due proposizioni da collegare; simbolicamente, si denota 1.7. MATEMATICA E LOGICA persone”, “Ma se 1 = 2, allora queste due persone sono una persona sola”; “In conclusione, io e la Regina d’Inghilterra siamo la stessa persona”. L’aneddoto è probabilmente inventato, ma illustra bene come l’ipotesi falsa serva a cambiare le carte in tavola pur rimanendo nell’ambito della corretta deduzione. Possiamo mettere le cose in modo un po’ diverso. Quando diciamo “se piove apro l’ombrello”, possiamo dire, con lo stesso significato, “Non piove oppure apro l’ombrello”. Analogamente, “Se ti affretti arriverai in tempo alla stazione” si può dire: “Non ti affretti oppure arriverai in tempo alla stazione”. Questo significa che “p implica q” è equivalente alla disgiunzione fra la negazione dell’ipotesi da una parte, e la tesi dall’altra. Il proverbio “Chi non risica non rosica” significa “se non rischi non ottieni niente”, il che si può anche dire “o rischi oppure non ottieni nulla”. E “chi dorme non piglia pesci” vale come “o sei sveglio oppure non pigli pesci”, e si potrebbe continuare con un’interessante carrellata sui più noti proverbi. La conclusione è che l’implicazione p → q equivale alla disgiunzione ¬p ∨ q. Un aspetto importante di questa constatazione riguarda il fatto che la disgiunzione è vera anche quando tutte e due le proposizioni coinvolte sono vere. Pertanto, nell’esempio di “chi dorme non piglia pesci” si può verificare, come tutti sappiamo per esperienza, che uno sia sveglio, ma non riesca a prendere pesci. In effetti, quello che il proverbio assicura è che per poter prendere pesci bisogna essere svegli, ma questo fatto, di per sé, non assicura che i pesci li prenderemo davvero. Questo significa che la proposizione inversa “chi non piglia pesci, dorme” non è necessariamente vera, cioè non è deducibile dal proverbio. Il mio esempio favorito è un altro proverbio: “Fortunato in amor non giochi a carte” che significa “Se sei fortunato in amore, sarai sfortunato alle carte”. Talvolta il proverbio si usa per consolare chi perde al gioco, suggerendo che questo fatto voglia dire che la persona è fortunata in amore. Ma il proverbio non afferma questo, come si capisce con un attimo di riflessione; se poi lo parafrasiamo come “O sei sfortunato in amore oppure sei sfortunato al gioco”, si intende bene che una persona, ahimè, può essere sfortunata tanto in amore quanto al gioco. Il seguente schema fa il punto su una terminologia che va conosciuta: p → q implicazione diretta ¬p → ¬q implicazione inversa Se q → p implicazione contraria ¬q → ¬p implicazione contropositiva la verità di una implicazione non comporta la verità della sua contraria, comporta però la verità della cosiddetta contropositiva, cioè la proposizione che dalla negazione della tesi fa discendere la negazione del- 33 l’ipotesi. Esemplificando, possiamo osservare che è la stessa cosa dire “Se sei fortunato in amore, sarai sfortunato al gioco” oppure “Se sei fortunato al gioco, allora sarai sfortunato in amore”. O anche “Se dormi non pigli pesci” o “Se pigli pesci allora non dormi”. In altre parole, una implicazione e la sua contropositiva sono proposizioni equivalenti e una è vera se e solo se è vera l’altra, cioè p → q risulta vera se e solo se tale risulta ¬q → ¬p. Questo viene sfruttato ampiamente in Matematica dove, spesso, si usa dimostrare la proposizione contropositiva invece di dimostrare direttamente un teorema. Questo tipo di prova viene di solito introdotto cosı̀: “Supponiamo per assurdo che la tesi sia falsa” e prosegue tentando di dimostrare che è vera la negazione dell’ipotesi. Talvolta, del tutto impropriamente, questa tecnica è detta “dimostrazione per assurdo”, che in realtà è tutta un’altra cosa e la vedremo un po’ più avanti. Facciamo un semplice esempio di dimostrazione nella quale, invece di provare l’asserto del teorema, dimostriamo la proposizione contropositiva: Teorema 1.6 Se il numero intero positivo n non è un quadrato perfetto ed n = p × q, allora il quadrato di uno dei fattori è minore di n e il quadrato dell’altro fattore è maggiore di n. Prova: Intanto, non può essere p2 = n o q 2 = n, altrimenti n sarebbe un quadrato perfetto. Allora deve essere p 6= q. Se supponiamo falsa la conclusione del teorema, allora i due quadrati p2 e q 2 devono essere tutti e due minori o maggiori di n. Nel primo caso però abbiamo p2 × q 2 < n2 , cioè p × q < n e in modo analogo nel secondo p × q > n, contro l’ipotesi p × q = n. Spesso, come s’è ricordato, questo tipo di dimostrazione è detto “per assurdo”, ma le vere dimostrazioni per assurdo hanno uno schema un po’ più complicato. Per dimostrare l’implicazione p → q si suppone che valga p e che q sia falsa, cioè sia vera la sua negazione. In altre parole, si parte immaginando vera la proposizione p ∧ ¬q e da essa si cerca di ottenere una contraddizione o assurdità, che è quello che dà il nome al modello di dimostrazione. Una contraddizione è semplicemente una proposizione senz’altro falsa, cioè la negazione di un assioma A o di un teorema T che abbiamo già dimostrato essere vero. Cosı̀ facendo sappiamo che p ∧ ¬q deve essere falsa, perché altrimenti avremmo la dimostrazione che l’assioma A o il teorema T sono tanto veri che falsi, cioè la nostra teoria (la Matematica) non è coerente, il che sarebbe un tantino grave. Ma se p ∧ ¬q è falsa, allora o p è falsa oppure, se p è vera, ¬q è falsa, cioè q è vera. Ma questo, per la discussione fatta in precedenza, vuol dire proprio che p implica q, cioè che p → q è vera. Una celebre e antichissima dimostrazione per assur- 34 CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA √ do è la prova che 2 non è un numero razionale; si 3n(n + 1) = 6h; si ha allora m3 − m = 6k + 6h = veda, per questo, il Teorema 3.18. Se indichiamo con 6(k+h), cioè m3 −m è divisibile per 6. Ecco l’assurdo: quindi m non può esistere e V deve essere vuoto. r l’assioma A o il teorema T , lo schema è: Conclusione, la proprietà vale per ogni n ∈ N. (r ∧ ((p ∧ ¬q) → ¬r)) → (p → q). Infine, un ultimo schema di dimostrazione che vogliamo ricordare è il seguente. Cominciamo con l’osservare che ogni sottoinsieme di N possiede un elemento minimo, cioè più piccolo di tutti gli altri. Spesso e volentieri non ha un massimo, come l’insieme dei numeri pari o quello delle potenze del 3, ma un minimo ce l’ha sempre. Supponiamo allora di voler dimostrare che una certa proprietà vale per tutti i numeri naturali; questo, in altre parole, significa che l’insieme V dei numeri naturali che non godono di quella proprietà è vuoto. Immaginiamo allora che V non sia vuoto e che quindi contenga un elemento minimo m. Cerchiamo ora di dimostrare due cose: primo, che per 0 la proprietà è valida. Questo prova che m > 0 e quindi che se poniamo m = n + 1, per n la proprietà deve essere valida. Come seconda cosa cerchiamo di dimostrare che se la proprietà è vera per il numero n, allora deve essere vera anche per n + 1, cioè per m. Se ci riusciamo siamo giunti ad un assurdo, e quindi l’ipotesi che V non sia vuoto è errata. Ma V = ∅ vuol dire che la proprietà è valida per tutti i valori di N, che è proprio quello che volevamo. Un esempio potrà essere illuminante. Dimostriamo la proposizione: per ogni valore di n ∈ N, n3 − n è divisibile per 6. Il lettore può divertirsi a calcolare n3 − n per 0, 1, 2, 3, 4 e verificare che la proprietà vale; ma, ci chiediamo, è davvero valida per ogni n ∈ N? Certo, se tentiamo per uno specifico valore, diciamo n = 364, troviamo che davvero 3643 −364 = 48228180 è divisibile per 6, ma chi ci dice che non esista un numero (semmai grandissimo) per cui la verifica fallisce? Procediamo allora come s’è visto: Teorema 1.7 Qualunque sia il numero naturale n ∈ N, la quantità n3 − n è divisibile per 6. Prova: Supponiamo che esista qualche numero n per cui n3 − n non è divisibile per 6 e chiamiamo V l’insieme di questi numeri. Per le prove effettuate, i numeri da 0 a 4 non stanno in V , e quindi sia m 6= 0 il più piccolo elemento di V . Se n è il numero che precede m, n 6∈ V e dobbiamo avere n3 − n = 6k, per qualche k ∈ N. Consideriamo m = n+1 e calcoliamo: m3 −m = (n+1)3 −(n+1) = n3 +3n2 +3n+1−n−1 = = n3 − n + 3(n2 + n) = 6k + 3n(n + 1). Osserviamo ora che 3n(n + 1) è un numero senz’altro divisibile per 6, poiché il fattore 3 è presente in modo esplicito e, sicuramente, uno dei numeri n o n + 1 è pari (se non è pari n, deve esserlo n + 1). Poniamo Nota 1.10 Questo tipo di dimostrazione è molto importante, anche se noi ne limiteremo l’uso al minimo indispensabile. La tecnica viene detta dimostrazione per induzione matematica e spesso si formula nella seguente maniera. Sia P (n) una proprietà che dipende dal numero naturale n. Se P (0) è vera e possiamo dimostrare che dalla verità di P (n), con n un generico numero naturale, discende la verità di P (n + 1), allora P (n) è vera per ogni n ∈ N. Il procedimento che abbiamo visto sopra è la dimostrazione di questo principio di induzione matematica. Infatti, abbiamo verificato che il minimo numero m che non verifica la proprietà non può esistere. Intuitivamente, il senso del principio è il seguente: se verifichiamo direttamente che P (0) è vera, dal fatto che P (n) implica P (n+1) possiamo dedurre che anche P (1) è vera. In modo analogo, da P (1) discende la verità di P (2), e cosı̀ via per ogni valore di n. Il principio di induzione è molto usato in tante parti della Matematica, dove si rivela un potente metodo di dimostrazione. Tuttavia, esso ha una serie di inconvenienti, il primo dei quale è che per poterlo applicare occorre già conoscere la soluzione del problema che vogliamo affrontare. Ad esempio, di fronte alla quantità n3 − n, occorre già sapere che essa è divisibile per 6, se vogliamo dimostrare tale fatto per induzione. In altre parole, il principio funziona da verifica, ma non è un metodo costruttivo, cioè un metodo che ci faccia capire come si è arrivati alla soluzione del problema. Da questo punto di vista, il principio di induzione è antieducativo e proprio per questo ne limiteremo l’uso, anche se si tratta di un metodo validissimo di dimostrazione. Ci si deve rendere conto che, di regola, è molto più facile verificare una certa proprietà che scoprirla; il principio di induzione ci dà una prova di quella proprietà, ma nulla ci dice su come affrontare la ricerca di proprietà analoghe. Noi lo considereremo una specie di “ultima spiaggia” a cui ricorrere quando proprio non c’è altro da fare. Per chiudere questa nota in modo poco serio, vediamo come l’applicazione del principio di induzione richieda qualche cautela. Chi ha mai contato il numero delle foglie di un albero? Ebbene, ora dimostreremo che (qualunque sia tale numero) tutti gli alberi hanno la stessa quantità di foglie! Il nostro ragionamento parte con una base P (1), cioè con un insieme costituito da un unico albero: tale albero ha un certo numero di foglie, che ovviamente è lo stesso per tutti gli alberi dell’insieme, cioè lui. Supponiamo allora di aver dimostrato che tutti gli insiemi di n alberi sono costituiti da alberi con la stessa quantità di foglie e prendiamo un insieme A composto di n + 1 alberi. Se da A togliamo un albero a, rimaniamo con un insieme di n alberi che, per l’ipotesi di induzione, hanno 35 1.8. PREDICATI tutti lo stesso numero di foglie. Rimettiamo a in A e togliamo ora un albero b diverso da a. Abbiamo un altro insieme di n alberi e, di nuovo, tutti debbono avere lo stesso numero di foglie. Quindi, anche a ha lo stesso numero di foglie di tutti gli altri, e quindi gli n + 1 alberi di A hanno tutti la stessa quantità di foglie. La conclusione, ora, è la straordinaria affermazione fatta in precedenza. Dove abbiamo sbagliato? 1.8 Predicati Una teoria ben più vasta del calcolo proposizionale è il cosiddetto calcolo dei predicati. A suo tempo abbiamo definito un predicato come una funzione p : A → {0, 1}, dove A è un insieme qualsiasi. Abbiamo fatto anche esempi significativi, ma veniamo ora a spiegare qual è l’aggancio fra predicati e proposizioni. Un esempio semplice di predicato su N è “n ≥ 5”; se indichiamo con p(n) tale predicato, si ha p(10) = 1 e p(2) = 0, poiché p(10) è la proposizione vera “10 ≥ 5, mentre p(2) è la proposizione falsa “2 ≥ 5”. Questo ci fa intendere che un predicato si trasforma in una proposizione ogni volta che specifichiamo l’elemento di A che funge da argomento del predicato stesso. L’insieme A può anche essere il prodotto cartesiano di vari insiemi; se A = B × C, un predicato p : B × C → {0, 1} è un predicato binario p(x, y) che diviene una proposizione (e quindi assume uno dei due valori 0 = falso oppure 1 = vero) quando assegniamo ad x uno specifico elemento b ∈ B e ad y uno specifico elemento c ∈ C. Secondo la terminologia classica, x ed y si dicono le variabili, nel senso che il loro valore può “variare” nel dominio del predicato (B e C nel caso presente, A in precedenza). Quindi, p(b, c) è una proposizione, ma p(b, y) e p(x, c) sono predicati monadici, il primo su C e il secondo su B. In modo analogo, si parla di predicati ternari o triadici, quaternari, e cosı̀ via. A causa di questa relazione tra proposizioni e predicati, questi ultimi si dicono forme proposizionali o anche forme enunciative; noi preferiremo sempre il termine “predicato”. Nota 1.11 Il problema della soddisfacibilità di un predicato k-ario p(x1 , x2 , . . . , xk ) su A1 × A2 × · · · × Ak è quello di scoprire (se esistono) k valori a1 ∈ A1 , a2 ∈ A2 , . . . , ak ∈ Ak che rendono vero il predicato, tali cioè che p(a1 , a2 , . . . , ak ) = 1. Anche se gli insiemi A1 , A2 , . . . , Ak sono finiti, e quindi il problema è senz’altro risolubile, la sua complessità è esponenziale, cioè cresce in modo tale, al crescere di k, che nessun calcolatore, per veloce che sia, è in grado di arrivare alla soluzione in tempi ragionevoli. Tecnicamente, un problema del genere è detto di complessità NP (si veda anche la Nota 4.4). In particolare, la soddisfacibilità è un problema NP completo, tale cioè che se potesse essere risolto in modo “veloce” (cioè in tempo polinomiale nel numero dei suoi argomenti k) dimostrerebbe che tutta una classe di problemi di complessità NP avrebbero anch’essi una soluzione veloce. Questo sarebbe molto importante per l’informatica che trova nei problemi NP una classe di problemi ostica, particolarmente difficile ad essere risolta in tempi di calcolo ragionevoli, diciamo in qualche giorno, se questo vi pare poco. La natura dei predicati può essere la più varia. E’ un predicato la frase p(x) = “Il signor x è nato a Scandicci”. Il mio amico Carlo è nato a Lastra a Signa, per cui p(Carlo) = 0, mentre mio cugino Luigi è nato proprio a Scandicci, per cui p(Luigi) = 1. In Matematica, siamo di solito interessati a predicati di tipo numerico, tipo p(n) =“Il numero n3 − n, per n ∈ N, è divisibile per 6” oppure q(x) = “Il numero reale x è tale ch x2 + 1 = 0”. Ogni equazione è in effetti un predicato, come x2 + x − 2 = 0; ogni valore che rende vero questo predicato si dice una soluzione o radice dell’equazione (si veda la Sezione 5.2); in questo specifico esempio, le soluzioni sono x = 1 ed x = −2, come si verifica facilmente facendo i calcoli o risolvendo l’equazione. Se una equazione è vera qualunque sia il valore assunto dalla sue variabili, essa si dice più propriamente una identità. Un classico esempio di identità è dato dalla regola della differenza dei quadrati, ovvero del prodotto di una somma per la differenza, a secondo del punto di vista da cui si legge: x2 − y 2 = (x + y)(x − y). Quello di assegnare un valore specifico ad ognuna delle variabili non è il solo modo per trasformare un predicato in una proposizione. A proposito del precedente predicato su n ∈ N, abbiamo già visto che è vera la proposizione: “per ogni valore di n ∈ N, il numero n3 −n è divisibile per 6”. Naturalmente, proprio il fatto che sia vera ci assicura che questa è una proposizione; se osserviamo bene, ci rendiamo conto che il predicato originale si è trasformato in una proposizione perché vogliamo considerare che cosa succede “per ogni valore di n ∈ N”. In modo analogo, se consideriamo la frase: “Per ogni numero reale x si ha x2 + 1 > 0” basata sul predicato: “x2 + 1 > 0”. La frase è vera perché x2 ≥ 0, qualunque sia x ∈ R, e quindi aggiungendo 1 si ha la disuguaglianza asserita. L’espressione: “per ogni n ∈ N” oppure “per ogni x ∈ R” si dice quantificazione universale e l’espressione stessa si scrive in modo compatto: “∀n ∈ N” e “∀x ∈ R”. Il simbolo “∀” si dice quantificatore universale e si legge sempre “per ogni” o “qualunque sia”. Le proposizioni vere di questo tipo si dicono “verità generali”; abbiamo visto come il principio di 36 CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA induzione matematica sia un metodo per dimostrare verità generali sui numeri naturali. Talvolta è impossibile dimostrare verità generali, anche semplicemente perché non sono vere; ad esempio, non è vero che “(∀x ∈ R) x2 + x − 2 = 0”, visto che per x = 0 si avrebbe −2 = 0, il che è ovviamente falso. In queste situazioni, può già essere utile dimostrare una verità esistenziale, cioè che esiste almeno un numero reale x tale che “x2 + x − 2 = 0”. Come si sa (e come vedremo col Teorema 5.10), ciò è assicurato dal fatto che il determinante dell’equazione, ∆ = 1 + 8 = 9, è non negativo, per cui possiamo concludere che: “esiste almeno un numero x ∈ R per cui x2 + x − 2 = 0”. L’espressione: “esiste almeno un x ∈ R” si dice quantificazione esistenziale e si abbrevia scrivendo: “∃x ∈ R”; il simbolo “∃” si dice quantificatore esistenziale e si legge “esiste almeno uno”; talvolta, in modo familiare, si legge semplicemente “esiste”. Naturalmente, per ogni predicato p(x), se è vero “(∀x ∈ A) p(x)” ed A non si riduce all’insieme vuoto, allora in particolare è vero che “(∃x ∈ A) | p(x)”, dove il simbolo “—” si legge “tale che” e può essere spesso sottinteso. Ci possono essere occasioni in cui siamo interessati a una verità esistenziale forte, cioè un predicato che risulti vero per un unico valore della variabile. Ad esempio, alcuni giovani dall’animo poetico, si sforzano di dimostrare che la ragazza del momento è l’unica donna che amano; alcuni matematici sono interessati al fatto che una certa equazione abbia un’unica radice compresa tra 0 ed 1 (ognuno ha i suoi problemi). Il quantificatore “esiste uno ed un solo elemento x ∈ A” si abbrevia talvolta con l’espressione: “∃!x ∈ A”. Tuttavia, si è restii ad assegnargli un nome specifico, poiché può essere parafrasato in vario modo, come ad esempio: “esiste almeno un elemento x ∈ A tale che p(x) = 1, e se x1 , x2 ∈ A sono tali che p(x1 ) = p(x2 ) = 1, allora è x1 = x2 ”. Questo dimostra che non è necessario introdurre esplicitamente questo ulteriore quantificatore. I due quantificatori “∀” e “∃” sono, in un certo senso che ora vedremo, uno l’inverso dell’altro. E’ chiaro che non esiste alcun numero reale x che sia contemporaneamente minore di 5 e maggiore di 10. Se allora p(x) =“x ∈ R è minore di 5” e q(x) =“x ∈ R è maggiore di 10”, l’affermazione appena enunciata si può formalizzare scrivendo: La precedente proposizione diviene pertanto: (∀x ∈ R) ¬(p(x) ∧ q(x)) che si legge: qualunque sia il numero reale x, non può essere vero che x < 5 e, allo stesso tempo, x > 10 (naturalmente, la negazione di a < b è a ≥ b!). Questo passaggio ci convince, ed ora possiamo procedere applicando la regola di De Morgan. Si ha cosı̀: (∀x ∈ R) (¬p(x) ∨ ¬q(x)) che si legge: per ogni numero reale x si ha x ≥ 5 oppure x ≤ 10. Anche questo passaggio suona bene e ci permette di renderci conto della validità della regola enunciata. Essa va di pari passo con la duale: • La negazione del quantificatore universale applicato a un predicato equivale al quantificatore esistenziale della negazione del predicato stesso. Continuando l’esempio precedente, possiamo osservare che: “Non è vero che per ogni numero reale x, si ha che x è minore di 5 oppure che x è maggiore di 10”; infatti, i numeri 7 ed 8 (insieme agli infiniti altri compresi tra 5 e 10) non sono né minori di 5, né maggiori di 10. La formulazione di questa proposizione è: ¬(∀x ∈ R) (p(x) ∨ q(x)). Da questa si passa a: (∃x ∈ R) | ¬(p(x) ∨ q(x)) cioè: esiste almeno un numero reale x per il quale non è vero che x < 5 oppure x > 10 (naturalmente, vanno ancora bene gli esempi di prima). Infine si passa a: (∃x ∈ R) | (¬p(x) ∧ ¬q(x)); questo significa: esiste almeno un numero reale x per il quale x ≥ 5 e, allo stesso tempo, x ≤ 10. Questo, ovviamente, è proprio vero! I matematici, spesso, sembrano insistere un po’ troppo sulla “esistenza” di certi oggetti matematici, come ad esempio soluzioni di equazioni, elementi particolari, etc.. In realtà, questo atteggiamento è giustificato dal fatto che, se qualcosa non esiste, si arriva a evidenti paradossi quando si ragioni come se invece esistesse. L’esempio classico è il seguente: sia N il più grande dei numeri naturali; se consideriamo ¬(∃x ∈ R) | (p(x) ∧ q(x)). N 2 si deve avere N 2 ≤ N , dato che N non è superaTrasformiamo questa proposizione usando la seguente to da nessun altro naturale. Semplificando, abbiamo N ≤ 1, cioè N = 0 oppure N = 1. Poiché 1 > 0, regola: abbiamo dimostrato che 1 è il più grande dei numeri • La negazione del quantificatore esistenziale ap- naturali! plicato a un predicato equivale al quantificatore Esiste un’evidente asimmetria tra le verità geneuniversale della negazione del predicato stesso. rali e quelle esistenziali. Per dimostrare infatti che 37 1.8. PREDICATI un’affermazione di quest’ultimo tipo non è vera occorre far vedere che essa non è verificata da alcun elemento dell’insieme S considerato, il che potrebbe richiedere anche un tempo infinito, se infiniti sono gli elementi di S. Viceversa, per dimostrare la non validità di un’affermazione generale basta fornire un esempio in cui essa non vale. Tale esempio costituisce un controesempio dell’affermazione e assume il ruolo di una vera e propria dimostrazione, ancorché negativa. Ricordiamo che da questa osservazione deriva il concetto di falsicabilità, su cui Popper costruisce la sua filosofia della scienza. Per dare un’idea più matematica dei predicati, vorrei cercare di esporre un semplice ma importante esempio di struttura algebrica. Con questo termine si intende un insieme S sul quale sono definite una o più operazioni, secondo quanto visto nella Sezione 1.3. Rispetto a tali operazioni l’insieme può godere di alcune proprietà che permettono di caratterizzare il significato della struttura. I numeri, con le quattro operazioni elementari sono un esempio di struttura algebrica e tale concetto serve a generalizzare le proprietà degli insiemi numerici rendendole indipendenti dal concetto stesso di numero. In effetti, le strutture algebriche costituiscono l’argomento fondamentale dell’Algebra Astratta, detta anche Algebra Moderna, perché si è sviluppata negli ultimi centocinquanta anni. Ritorneremo sopra a questo argomento nel Capitolo 5 sull’Algebra; per il momento limitiamoci ad introdurre alcuni concetti sia validi di per sé, sia a mo’ di esempio dell’idea di predicato che stiamo discutendo. L’esempio più semplice di struttura algebrica è costituito certamente dal monoide, un insieme S con un’operazione diadica indicata con un puntino (o la semplice giustapposizione), detta prodotto, rispetto alla quale S è chiuso, gode della proprietà associativa e dell’esistenza di una identità. Formalmente, il monoide si indica con la coppia (S, ·) e le sue proprietà si riassumono cosı̀: 1. ∀x, y ∈ S, il prodotto x · y sta in S; 2. ∀x, y, z ∈ S, si ha (x · y) · z = x · (y · z); 3. ∃e ∈ S tale che ∀x ∈ S si ha e · x = x · e = x. E’ abbastanza naturale sentirsi sconfortati quando ci si trovi davanti per la prima volta a una definizione del genere. Ma bisogna abituarsi poiché le strutture algebriche sono sempre definite in questo modo; e bisogna andare oltre l’aspetto formale e cercare di costruirsi un’idea più concreta cercando esempi significativi. A loro volta, tali esempi permettono di indurre proprietà della struttura algebrica che ce la fanno conoscere in modo più approfondito. La cosa a cui bisogna stare attenti è di non confondere le proprietà specifiche dell’esempio con proprietà generali della struttura: per questo è sempre opportuna dare dimostrazioni formali ed astratte delle proprietà interessanti. L’esempio più semplice di monoide è costituito dai numeri naturali con l’operazione di somma, cioè (N, +); le sue proprietà sono quelle stesse della somma e l’identità è il numero 0. In effetti, questo è un monoide un po’ particolare, poiché per la somma vale anche la proprietà commutativa, cioè: ∀x, y ∈ S si ha x · y = y · x. Non è però difficile trovare esempi nei quali la proprietà commutativa non vale. Se A = {a1 , a2 , . . . , ak } è un insieme di simboli (o lettere, per cui A si dice anche alfabeto), chiamiamo A∗ l’insieme delle parole (o stringhe) su A, cioè le sequenze finite di simboli di A; fra le parole mettiamo anche la parola vuota, cioè la sequenza priva di simboli. La concatenazione di due parole w1 , w2 ∈ A∗ è la sequenza formata dai simboli di w1 seguiti da quelli di w2 . L’insieme A∗ con questa operazione è un monoide (non commutativo). Infatti, la concatenazione di due parole è ancora una parola (chiusura) e la concatenazione di tre parole, comunque la si esegua w1 · (w2 · w3 ) oppure (w1 · w2 ) · w3 dà sempre la parola formata dai simboli di w1 , seguiti da quelli di w2 , seguiti da quelli di w3 . Infine, concatenando la parola vuota a un’altra parola, sia che la si metta a sinistra, sia che la si metta a destra, quest’ultima parola non cambia. Un terzo esempio di monoide è costituito da (N0 , ×), cioè l’insieme dei numeri naturali (senza lo zero) con l’operazione di moltiplicazione. Questi esempi cosı̀ diversi ci fanno capire (o almeno intuire) l’importanza delle strutture algebriche: ragionando in astratto sulla struttura si ottengono proprietà che valgono per tutti i monoidi, indipendentemente dalla loro natura specifica. Questo, speriamo, sarà ancora più chiaro quando, nella Sezione 5.8, faremo vari esempi di tali dimostrazioni. Nota 1.12 Se si pensa alla notazione a stecchini e ai numeri naturali come a sequenze di aste, ci si accorge che i due monoidi (N, +) e (A∗ , ·) non hanno poi natura tanto diversa, ed N altro non è che A∗ quando A = {|}. La commutatività in N è semplicemente dovuta al fatto che l’alfabeto si riduce a un solo elemento. D’altra parte, è spesso importante considerare sequenze di simboli che formalizzano espressioni e formule. Ad esempio, l’Aritmetica tratta sequenze del tipo “3+(12/4)”, l’Algebra ha a che fare con sequenze come “3x2 − 5x − 8 = 0” e la logica formale considera sequenze come “(p ∨ ¬q) ∧ r”, ognuna costruita su un dato insieme di simboli. La manipolazione di tali sequenze è un lavoro effettuato usando l’operazione di concatenazione e la sua inversa, cioè l’estrazione di 38 CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA una sottosequenza da una sequenza data. Se si vuole, l’Algebra e la Logica formale sono semplicemente l’elaborazione di simboli mediante regole di trasformazione. Questo punto di vista si è rivelato fondamentale per la Logica ed è l’impostazione che usano gli elaboratori elettronici per ogni applicazione non numerica. Proprio grazie agli elaboratori attuali si ritiene ovvia la corrispondenza tra numeri e simboli (si pensi alla codifica ASCII per i caratteri), ma tale corrispondenza, cambiando sequenze di simboli in sequenze di numeri, non sempre è appropriata agli scopi che soprattutto la Logica si prefigge. Più interessante sarebbe trovare una corrispondenza tra parole e numeri tale che ad ogni parola corrispondesse un numero ben preciso. Se l’alfabeto A contiene k simboli, possiamo pensare a w ∈ A∗ come a un numero scritto in base k + 1 (spiegare perché non si può pensare ai numeri in base k). Purtroppo, in Logica si deve poter disporre di un alfabeto (potenzialmente) infinito, per rappresentare le proposizioni e le variabili. In questo caso, il trucco precedente non funziona più. Verso la fine degli anni 1920, Gödel pensò a questa corrispondenza. Sia A = {a1 , a2 , . . .} l’insieme infinito dei possibili simboli e sia w = ai1 ai2 . . . ain una parola non vuota su A. Se pi indica l’i-esimo numero primo a partire da 2 (cioè p1 = 2, p2 = 3, p3 = 5, p4 = 7, p5 = 11, etc.), allora il numero naturale corrispondente a w è dato da: G(w) = pi11 pi22 . . . pinn . Ad esempio, se A = {a, b, c, d, . . .}, la parola bacca è rappresentata da: 22 × 31 × 53 × 73 × 111 = 5. 659. 500. Il numero è piuttosto alto, ma quello che interessa non è la manipolazione effettiva di questi numeri, quanto piuttosto la possibilità di trovare funzioni numeriche che, in principio, agiscano come le operazioni sulle parole; questo, infatti, permette di simulare le operazioni sulle parole o sulle espressioni per mezzo di operazioni aritmetiche, le cui proprietà noi meglio conosciamo. Il lettore volenteroso si può impegnare a trovare funzioni che calcolano la lunghezza di una parola (vista come numero), la concatenazione di due parole (viste come numeri), il fatto che una parola (numero) sia contenuta in un’altra (un altro numero), e cosı́ via. Naturalmente, la prima cosa da fare è di definire due funzioni per trasformare una parola in un numero, e viceversa. Una struttura algebrica un po’ più complessa del monoide, ma anche molto più importante, è il gruppo. Anche in questo caso, abbiamo un insieme G e un’operazione “·”, ma oltre alle proprietà di chiusura, associatività ed esistenza dell’identità, si richiede che ogni elemento abbia un inverso, cioè: 4. ∀x ∈ G, esiste y ∈ G tale che x · y = y · x = e. Un elemento y che goda di tale proprietà si scrive x−1 e si dimostra che è unico. Supponiamo infatti che anche z sia un inverso di x; si ha allora: z = z · e = z · (x · y) = (z · x) · y = e · y = y, dove si sono applicate varie regole dei gruppi, in particolare la proprietà associativa e quella dell’identità. Questo, osserviamo, è un teorema generale dei gruppi, valido, cioè, per ogni gruppo, indipendentemente dalla natura particolare dei suoi elementi. A questo punto, però, ci arrestiamo e rimandiamo il lettore a ciò che diremo nella Sezione 5.8 o, meglio ancora, ai testi universitari sull’Algebra Astratta. Capitolo 2 Aritmetica Legati ai numeri primi ci sono fondamentali concetti come quello di divisibilità e di massimo comun divisore che, definiti dai Greci, si sono andati sempre più sviluppando, e le loro problematiche si incontrano e si scontrano, oggi, con quelle dei moderni elaboratori. Ad esempio, il problema della scomposizione di un numero in fattori primi si è rivelato essere uno dei problemi “intrattabili” per eccellenza, cioè uno dei problemi per i quali non si conosce (e probabilmente non è nemmeno possibile conoscere) una soluzione in G. Rodari “Filastrocche in cielo e in terra” tempi ragionevoli (ovviamente, quando il numero è L’Aritmetica è la scienza dei numeri, più propria- abbastanza grande) perfino con i calcolatori più pomente dei numeri naturali N = {0, 1, 2, 3, . . .}, ed è tenti che esistono oggi o potranno esistere nel prosperciò strettamente connessa al concetto di “conta- simo futuro. Questo, per il momento, ha permesso re”, visto nel capitolo precedente. Oggi, l’Aritmetica di utilizzare la scomposizione dei numeri nei moderè indissolubilmente associata alle operazioni elemen- ni metodi di cifratura per la trasmissione sicura di tari, ed è con queste che si affronta lo studio dell’Arit- informazioni riservate nelle reti di calcolatori. metica, non appena ci siamo impadroniti dei numeri attraverso il contare. Non sempre è stato cosı̀, anzi, fino al 1600 il saper fare di conto (detto anche “logi- 2.1 L’addizione stica”) era considerata un’attività volgare, riservata a commercianti e banchieri piuttosto che a scienziati Certamente l’operazione più semplice e naturale è e filosofi. Questi, invece, erano dotti nell’Aritmeti- quella di sommare due numeri. L’antico pastore col ca, inclusa come s’è detto nel Quadrivio, intesa come suo gregge di 57 pecore, alla fine dell’inverno, quanscienza che studia le proprietà dei numeri naturali. do trovava che erano nati 14 agnellini, era interessato In questo senso, l’Aritmetica è nata in Grecia, e i a sapere di essere diventato proprietario di ben 71 Pitagorici consideravano i numeri come l’essenza del animali. Con numeri cosı̀ piccoli, la somma si può rimondo. Con Platone e Euclide la Geometria prese condurre al contare: il pastore poteva prima contare il sopravvento, ma negli “Elementi” Euclide dedica le vecchie pecore (o ricordare quante fossero, incidentre libri all’Aritmetica. In particolare, i numeri pri- do delle tacche su un osso o un tronco), arrivare cosı̀ mi hanno sempre attratto matematici professionisti e a 57, e poi continuare a contare gli agnelli appena nadilettanti per le loro proprietà, spesso tra il meravi- ti: cinquantotto, cinquantanove, e via di seguito fino glioso e l’incredibile, sempre comunque imprevedibili. a 71. Non sono rari reperti archeologici, risalenti anCi sono state persone che hanno dedicato la propria che a trentamila anni fa, costituiti da ossa di animali, vita allo studio dei numeri primi, alla loro elencazio- sulle quali sono incise tacche con l’evidente scopo di ne, nella vana ricerca di regolarità, di leggi e di regole registrare conteggi: queste tacche sono la prima rappresentazione pratica di ciò che abbiamo chiamato la specifiche. Bisogna dire che la curiosità per i numeri primi notazione ad aste. è comune a tutta l’umanità e non è solo appannagQuando i numeri cominciano a superare il centinagio della cultura occidentale, derivata da quella gre- io, la conta diretta e la notazione ad aste diventano ca. Oltre ai grandi matematici arabi, il celeberrimo inadeguate, ed è per questo che si sono cercati meto“teorema cinese dei resti” ci dice come anche nella di più veloci per eseguire la somma, come l’abaco o lontana Cina (si parla del 1200) l’interesse fosse vivo. l’uso sapiente dei ciottoli. Questi, come le biglie delMa cosa era successo? Che l’Uno e lo Zero seduti vicini, uno qua l’altro là formavano un gran Dieci: nientemeno, un’autorità! Da quel giorno lo Zero fu molto rispettato, anzi da tutti i numeri ricercato e corteggiato. 39 40 l’abaco, sono disposti su più linee, ognuna preposta a rappresentare le unità, le decine, le centinaia e cosı̀ di seguito. Tale modo di disporre ciottoli o biglie prefigura la nostra notazione, ma, come s’è visto, non ci si è resi conto, fino a tempi relativamente recenti, come la scrittura potesse essere direttamente utilizzata per fare i conti. Nella notazione posizionale, l’idea fondamentale è che le unità si sommano alle unità, le decine alle decine, le centinaia alle centinaia, e cosı̀ via. Questo funziona bene se facciamo 125 + 342, e il risultato è proprio 467. Quando però tentiamo lo stesso metodo su 347 + 158, ci troviamo subito di fronte alla difficoltà che 7 + 8, la somma delle unità, ci dà un valore maggiore di 9 che quindi non è rappresentabile con un’unica cifra. Tuttavia, si osserva, se prendiamo la cifra delle unità di 7 + 8 = 15, cioè 5, la decina in più può andare a incrementare il numero totale delle decine della somma, cioè 4 + 5, che diventa 4 + 5 + 1. Questo è il concetto di riporto, che ci è ormai familiare e che spiega come comportarci ogni volta che una somma di unità, di decine, di centinaia, etc., ci porta fuori del proprio ambito. Il riporto è la parte che va al di là del gruppo di appartenenza delle cifre considerate, e quindi va ad aggiungersi alla cifra della successiva potenza del 10: da unità a decine, da queste a centinaia, e cosı̀ via. Nel nostro esempio, 4 + 5 + 1 = 10, e di nuovo dobbiamo considerare lo 0 come cifra della somma (delle decine, questa volta) e l’1 come il riporto verso le centinaia. Qui, infine, abbiamo 3 + 1 + 1 = 5, e quindi 505 è il risultato corretto. Naturalmente, il gioco del riporto spiega perché, nel caso che avessimo avuto riporto con la cifra di valore più alto (in questo caso, delle centinaia) avremmo dovuto scrivere il riporto stesso come cifra della successiva potenza del 10, delle migliaia nell’esempio. Cosı̀, 735 + 517 dà : 5 + 7 = 12, 2 come cifra delle unità e 1 come riporto; 3 + 1 + 1 = 5, che è la cifra delle decine; 7 + 5 = 12, cosı̀ che 2 è la cifra delle centinaia e il riporto 1 diviene la cifra delle migliaia, anche se nei due numeri di partenza la cifra delle migliaia era assente. L’impostazione pratica della somma prevede di scrivere i due numeri da sommare uno sotto l’altro, allineati a destra. Questo fa sı̀ che cifre omologhe, cioè che si riferiscono alla stessa potenza del 10, si trovino una sotto l’altra. E’ cosı̀ più agevole eseguire le somme parziali procedendo da destra verso sinistra. Per rendere spedito il calcolo, è bene sapere a memoria il risultato della somma di tutte le coppie possibili di cifre decimali, che riportiamo nella Tabella 2.1. L’uso della tabella è ben noto: quando il risultato è un’unica cifra, questa è la cifra da trascrivere nella somma e non si ha alcun riporto (o, se si preferisce, il riporto è 0); quando il risultato è costituito da due CAPITOLO 2. ARITMETICA 9 8 7 6 5 4 3 2 1 0 9 10 8 9 7 8 6 7 5 6 4 5 3 4 2 3 1 2 0 1 0 1 11 10 9 8 7 6 5 4 3 2 2 12 11 10 9 8 7 6 5 4 3 3 13 12 11 10 9 8 7 6 5 4 4 14 13 12 11 10 9 8 7 6 5 5 15 14 13 12 11 10 9 8 7 6 6 16 15 14 13 12 11 10 9 8 7 7 17 16 15 14 13 12 11 10 9 8 8 18 17 16 15 14 13 12 11 10 9 9 Tabella 2.1: La tavola della somma cifre, quella delle unità va trascritta nella somma, e quella delle decine rappresenta il riporto da sommare alle due cifre successive più a sinistra. In termini più formali abbiamo il seguente algoritmo per eseguire l’addizione: Algoritmo 2.1 (Addizione di numeri decimali) Ingresso: due numeri n = dr dr−1 . . . d1 d0 ed m = cs cs−1 . . . c1 c0 scritti in notazione decimale; Uscita: la somma n + m = bt bt−1 . . . b1 b0 . 1. se r < s scambiamo tra di loro i due numeri n ed m; 2. se s < r, aggiungiamo alla sinistra di m esattamente r − s cifre 0. Questo non cambia il valore di m avendo aggiunto 0 × 10r + 0 × 10r−1 + · · · + 0 × 10r−s+1 = 0. Questa operazione corrisponde all’allineamento a destra dei due numeri, ma in questo modo possiamo assumere che i due numeri abbiano la stessa lunghezza; 3. si pone p := 0, dove p indica il riporto; 4. Procedendo da destra verso sinistra, ponendo successivamente j := 0, 1, . . . , r: cioè (a) poniamo v := dj + cj secondo quanto riportato nella Tabella 2.1; (b) poniamo v := v + p. Poiché il riporto p può valere solo 0 oppure 1, questa somma richiede, al più, di conoscere il successivo dei numeri da 0 a 18; (c) si pone bj uguale alla cifra delle unità di v e si assegna al riporto p la cifra delle decine di v (che sarà 0 oppure 1); (d) si incrementa j e se risulta j ≤ r si cicla tornando al punto 4a.; 41 2.1. L’ADDIZIONE 5. se il riporto p è zero, si pone t := r e la somma è finita; altrimenti (p = 1) si pone br+1 := 1, t := r + 1 e la somma è finita. 4 3 2 1 0 4 3 2 1 0 0 10 4 3 2 1 1 11 10 4 3 2 2 12 11 10 4 3 3 13 12 11 10 4 4 Il lettore si può divertire a riformulare questo algoritmo in modo da prevedere tutte le azioni svolte da un operatore umano, come l’allineamento a destra e le operazioni da fare quando si siano esaurite le cifre del numero più corto. Abbiamo evitato questi passi Tabella 2.2: La somma in base 5 estendendo le cifre del numero corto con una serie opportuna di zeri, un trucco che si usa sui calcolatori, la stessa quantità di aste, gli insiemi rimangono ma che non viene insegnato agli scolari. uguali. Si osservi che, di proposito, abbiamo utilizzato una nomenclatura esatta, ma un po’ vaga; ora è bene Queste proprietà formali della somma sono molto utili anche nella pratica; ad esempio, per sommare ricordare la terminologia ufficiale. 68 + 14 + 32, ci si rende conto che 68 + 32 = 100, Definizione 2.1 L’operazione definita dal preceden- e quindi il risultato è 114. Formalmente, occorrono i te algoritmo si dice propriamente addizione e il suo seguenti passaggi, ma noi li eseguiamo ormai in modo risultato è detto somma o totale. I numeri che si meccanico: sommano si dicono addendi o termini. (68 + 14) + 32 = 68 + (14 + 32) = 68 + (32 + 14) = Quest’ultimo nome è un po’ ambiguo, poiché si parla = (68 + 32) + 14 = 100 + 14 = 114. anche di “termini di un’espressione”, di “termini di una successione”, e cosı̀ via, però è del tutto approIl richiamo alla notazione ad aste ci vuol far capire priato. La parola “addendo” si usa soprattutto per che queste proprietà non dipendono in alcun modo enfatizzare il fatto che l’operazione che si sta conside- dalla notazione adottata, sia essa decimale od altra, rando è proprio un’addizione. Di solito è tollerato l’a- ma sono intrinseche ai numeri come tali. Le ritrobuso di termine “operazione di somma”, ma è meglio veremo pertanto in vari capitoli, tra i quali quello evitarlo, quando sia possibile (cioè quasi sempre). dell’Algebra, dove si trattano le proprietà formali dei La notazione ad aste, molto più di quella decimale, numeri, ignorando la loro rappresentazione, nascosta è utile per dimostrare: di proposito con l’uso delle lettere. Naturalmente, l’Algoritmo 2.1 non è limitato, al• la proprietà commutativa dell’addizione: a + b = meno nello spirito, ai soli numeri decimali; esso vale b + a. Mettere in fila a aste e poi aggiungerne per una qualsiasi base, purché si cambi opportunaaltre b è lo stesso che mettere b aste e aggiungerne mente la Tabella 2.1. Ad esempio, per la base 5 si a. In altri termini, a + b aste possono essere usa la Tabella 2.2, dove tutti i numeri sono scritti in immaginate anche come b + a aste; quella base, per cui 125 = 710 , come ognuno s’aspetta • la proprietà associativa: a + (b + c) = (a + b) + c. quando si sommi 3 con 4. I numeri di due cifre, come Con le aste, comunque si proceda, si arriva alla appunto 12, stanno ad indicare un risultato (la cifra delle unità) e un riporto (la cifra delle decine, che qui fine con a + b + c aste; sarebbe meglio dire delle cinquine). • l’elemento neutro, o identità, per l’addizione è Può essere un buon esercizio partire con due nu0: 0 + a = a + 0 = a. Aggiungere 0 aste vuol meri decimali, ad esempio 732 e 473, convertirli in dire non cambiare proprio niente in un insieme base 5 mediante il metodo delle divisioni successive di aste già predisposto, sia pur esso vuoto (cioè, (v. Sezione 1.5) ed eseguire la loro somma usando la 0 + 0 = 0). Tabella 2.2. Si trova 73210 = 104125 e 47310 = 33435 ; i due numeri vanno allineati a destra, e la somma si • la proprietà dissociativa: se a = b + c allora imposta in questo modo: a + d = b + c + d; nella notazione ad aste, questo significa che un gruppo di aste può essere “dis1 1 1 sociato” in due (o più) gruppi senza cambiare 1 0 4 1 2 + il risultato finale; formalmente, questa proprietà 3 3 4 3 = si può far discendere da quella associativa, ma 1 4 3 1 0 nella pratica è comodo distinguerla; Abbiamo evidenziato i riporti, come si fa quando • la proprietà di eliminazione: se a + c = b + c si impara a fare la somma e a questo punto basta riallora a = b; questo vuol dire che se abbiamo convertire il risultato 143105 = 120510 per controllare due insiemi uguali di aste e da entrambi togliamo che l’operazione è ben fatta. 42 CAPITOLO 2. ARITMETICA Il caso più semplice si ha quando la base è 2; non serve nemmeno scrivere esplicitamente la tabella, visto che 0 + 0 = 0, 0 + 1 = 1 + 0 = 1 e 1 + 1 = 0 con riporto di 1. Quando il riporto 1 si aggiunge a una somma parziale 1 + 1 si ha come risultato 1 e un nuovo riporto unitario. Con queste cinque regole si provi ad eseguire 90 + 57 = 147; procedendo come sopra si ha: 1 1 1 1 0 1 0 0 1 1 1 1 1 1 0 0 1 0 0 0 1 0 1 1 + = e di nuovo lasciamo che il lettore si eserciti nella conversione tra basi diverse per controllare che il risultato è corretto e non lo stiamo ingannando con un gioco di cifre. Ma l’Algoritmo 2.1 funziona bene, con pochi accorgimenti in più, anche quando abbiamo di fronte una base composta. Un esempio sarà sufficiente a capire come si opera. Si considerino due angoli di 32◦ 47′ 54′′ e 18◦ 23′ 8′′ ; la somma si imposta allineando a destra sia le quantità, sia le loro parti omogenee ed eseguendo poi le singole somme: 32◦ 18◦ 50◦ 47′ 23′ 70′ 54′′ 8′′ 62′′ + = Ora teniamo conto di quanto detto nella Sezione 1.5 per i numeri scritti fuori dei limiti della base composta; partendo da destra, 62′′ corrispondono ad 1′ 2′′ , cosı̀ che 1′ va a sommarsi agli altri 70′ . Ora, 71′ corrispondono a 1◦ 11′ , e il grado si somma agli altri 50◦ . Il risultato finale è pertanto 51◦ 11′ 2′′ . Come si vede, il riporto avviene ora passando dai secondi ai primi e da questi ai gradi; infatti, secondi, primi e gradi sono le vere cifre della notazione e son loro che devono rientrare nei limiti della base composta (360, 60, 60). All’interno dei secondi, dei primi e dei gradi la somma avviene regolarmente, poiché in essi rispettiamo la notazione decimale. Nessuno ci vieterebbe di usare per le tre parti una base diversa da 10, ed eseguire le somme di conseguenza; l’elaboratore elettronico, ad esempio, rappresenta tutto in binario. Ma quest’ultima, ulteriore complicazione lasciamola perdere e accontentiamoci di aver capito come si opera quando la notazione all’interno delle varie “cifre” è quella decimale. 2.2 Confronto e sottrazione Un’altra operazione elementare è il confronto tra numeri; il risultato non è questa volta un numero, come per l’addizione, ma un valore di verità, cioè vero o falso. Ad esempio, 5 = 3 è falso, mentre 3 < 5 è vero. Di regola si considerano sei tipi di confronto che si spiegano bene in termini di conteggio o nella notazione ad aste: • n = m (n è uguale ad m): i due numeri n ed m sono uguali se sono indicati con lo stesso nome ovvero se le loro rappresentazioni ad aste sono lunghe uguali, quindi se c’è una corrispondenza biunivoca tra le aste che rappresentano i due numeri; • n 6= m (n è diverso da m): i due numeri non sono uguali, cioè sono indicati da nomi diversi ovvero la lunghezza delle loro rappresentazioni ad aste sono differenti; • n < m (n è minore di m): il nome di n precede il nome di m nel conteggio, ovvero c’è una corrispondenza biunivoca tra le aste di n e un sottoinsieme proprio delle aste di m (questo significa che la rappresentazione ad aste di n è più corta di quella di m); • n ≤ m (n è minore o uguale ad m): i due numeri sono uguali (n = m) oppure n è minore di m, secondo le precedenti specifiche; • n > m (n è maggiore di m): il nome di n segue il nome di m nel conteggio, ovvero c’è una corrispondenza biunivoca tra le aste di m e un sottoinsieme proprio delle aste di n (questo significa che la rappresentazione ad aste di n è più corta di quella di m); • n ≥ m (n è maggiore o uguale ad m): i due numeri sono uguali (n = m) oppure n è maggiore di m, secondo le precedenti specifiche. Nota 2.1 I concetti di “uguale” e “diverso” sono tanto elementari che una loro definizione appare assurda o fuorviante, perché cerca di spiegare cose semplici con argomenti complessi. A ben guardare, la nostra definizione di uguaglianza tra numeri è riportata all’uguaglianza verbale (il che può avere abbastanza senso) o ad una corrispondenza biunivoca. Quest’ultima impostazione, come s’è visto, ha un senso molto profondo e permette di ragionare di “uguaglianza” anche per quantità non finite. Per tali quantità, una impostazione puramente nominalista non dà alcun risultato. Dovrebbe essere chiaro dalla precedente elencazione che, in realtà, i confronti si riducono a due soli: n = m ed n < m. Per gli altri si ha: • n 6= m: non è vero che n = m; • n > m: m < n; 2.2. CONFRONTO E SOTTRAZIONE • n ≤ m: non è vero che n > m; • n ≥ m: non è vero che n < m. Come abbiamo visto per la somma, la notazione ad aste è utile per dimostrare certe proprietà dei numeri relativamente ai confronti; formuliamo le seguenti proprietà per la relazione “≤”, ma esse valgono anche per “<”, “≥”, “>” e “=”. Per la relazione “6=” valgono le prime due, ma non vale la terza, come il lettore dimostrerà con un controesempio, cioè fornendo quattro numeri a, b, c, d per i quali si ha a 6= b e c 6= d, ma risulta a + c = b + d: • proprietà di eliminazione: se a + c ≤ b + c allora a ≤ b; se abbiamo due gruppi di aste, il primo con un numero di aste non superiore al secondo, ed eliminiamo dai due gruppi lo stesso numero di aste, il primo rimane con un numero di aste non superiore al secondo; • proprietà di aggiunzione: se a ≤ b allora a + c ≤ b+c; questa è la proprietà inversa della precedente e si “dimostra” allo stesso modo rifacendosi alla notazione ad aste; 43 1. se r < s, cioè le cifre di n sono in numero minore delle cifre di m, si esce con il risultato “vero”; 2. altrimenti, se r > s, cioè se m ha più cifre di n, si esce col risultato “falso”; 3. altrimenti (in questo caso r = s, i due numeri hanno lo stesso numero di cifre), si pone j := r e si procede da sinistra verso destra: (a) se dj < cj si esce col risultato “vero”, poiché la cifra di 10j in n è minore di quella in m e le cifre delle potenze superiori sono uguali (se ce ne sono); (b) altrimenti, se dj > cj si esce col risultato “falso”; (c) altrimenti (dj = cj ) si decrementa j di uno e se è ancora maggiore o uguale a 0 si cicla tornando al punto 3a. 4. se si arriva a questo punto (uscendo dal ciclo 3.) significa che tutte le cifre di n sono ordinatamente uguali alle cifre di m, cioè n = m, e quindi si esce col risultato “falso”. Il lettore che abbia provato a scrivere l’algoritmo • proprietà di monotonia: se a ≤ b e c ≤ d allora per m = n o che abbia seguito l’algoritmo precedente, a + c ≤ b + d; se mettiamo insieme gruppi piccosi sarà certamente accorto che, cosı̀ come stanno, queli di aste otteniamo gruppi piccoli; se mettiamo sti algoritmi sono errati. Infatti, ad esempio, già nel insieme gruppi grandi, otteniamo gruppi grandi. passo 1. ci si chiede se r < s: ma questo è proprio lo Per portare questi confronti nel campo della rap- scopo dell’algoritmo! Lo stesso succede quando, per presentazione decimale possiamo procedere con un controllare la condizione A), ci chiediamo se r = s, teorema e con un algoritmo. Il teorema riguarda il laddove l’algoritmo vuol proprio servire a controllare caso dell’uguaglianza e dal teorema discende un’ov- l’uguaglianza di due numeri. Come si risolve questo via procedura, la cui formulazione lasciamo al piacere problema? La soluzione è semplice se trasformiamo del lettore. L’algoritmo che diamo si riferisce invece questi algoritmi in algoritmi ricorsivi, cioè in procedure che, giunte a dover stabilire se r < s, o r = s, al confronto n < m. richiamano sé stesse per effettuare tale controllo. Teorema 2.1 Siano n, m ∈ N; allora n = m se Ha senso una cosa del genere, oppure ci trascina in e solo se le rappresentazioni decimali di m ed n un circolo vizioso in cui l’algoritmo richiama sé stesso coincidono. infinite volte senza riuscire a trovare alcun risultato definitivo? In realtà tutto procede in modo molto Prova: Come abbiamo visto nella Sezione 1.5, la semplice, poiché la lunghezza di un numero è di regorappresentazione decimale di un numero è unica, e la molto inferiore al suo valore: bisogna escludere da quindi le rappresentazioni coincidono se e solo se i questa regola i numeri 0 ed 1, ma per essi vedremo numeri sono lo stesso. tra un momento. Ad esempio, supponiamo di doNaturalmente, per controllare che le rappresentazio- ver confrontare un numero di 1274 cifre con uno di ni di n ed m sono uguali occorre: A) stabilire se 853, cioè due numeri piuttosto grandi. Per effettuare le lunghezze delle due rappresentazioni coincidono; tale confronto dobbiamo pertanto confrontare queste B) se ciò è vero, stabilire se le cifre decimali sono lunghezze (r = 1273 ed s = 852, visto che gli indici partono da 0). L’uso ricorsivo dell’algoritmo implica ordinatamente uguali. di dover valutare le lunghezze di questi due numeri, che sono 4 e 3 rispettivamente (in effetti, il nuovo r è Algoritmo 2.2 (Stabilire se n è minore di m) Ingresso: Due numeri n, m ∈ N con la loro rap- 3 e il nuovo s è 2, ancora per la storia degli indici). A questo punto, però, possiamo osservare che il presentazione decimale n = dr dr−1 . . . d1 d0 ed m = confronto fra cifre può essere codificato in una tabelcs cs−1 . . . c1 c0 ; dr 6= 0, cs 6= 0. Uscita: “vero” se n < m, “falso” altrimenti. la, analoga a quella dell’addizione, ma che per ogni 44 CAPITOLO 2. ARITMETICA 9 8 7 6 5 4 3 2 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 2 0 0 0 0 0 0 0 1 1 1 3 0 0 0 0 0 0 1 1 1 1 4 0 0 0 0 0 1 1 1 1 1 5 0 0 0 0 1 1 1 1 1 1 6 0 0 0 1 1 1 1 1 1 1 7 0 0 1 1 1 1 1 1 1 1 8 0 1 1 1 1 1 1 1 1 1 9 l’effettuabilità della sottrazione; fatto questo, la giustificazione della proprietà è del tutto analoga alla .precedente. L’esecuzione della sottrazione avviene con un ben noto algoritmo, nel quale il punto più complesso è costituito dal prestito, cioè l’analogo del riporto nell’addizione. Purtroppo, il concetto di prestito è un po’ più complicato: infatti il riporto agisce sulla cifra immediatamente a sinistra del punto in cui si è verificato. Invece, il prestito può coinvolgere una cifra più lontana, quando nel mezzo ci siano degli 0. D’altra parte, come si sa, da chi non ha niente come lo 0 non si possono ottenere prestiti. Nel seguente Tabella 2.3: La tavola del confronto per ‘minore’ algoritmo si usa la Tabella 2.1 che già conosciamo dall’addizione. In realtà, il suo uso avviene all’inconcoppia di cifre (d, d′ ) ci dà 1 per “vero” se d < d′ , trario secondo quanto stabilito dalla Definizione 2.2: e 0 per “falso” in caso contrario; si veda la Tabella per vedere quanto vale a − b occorre cercare nella riga 2.3. Questa tabella, molto meno interessante di quel- di b il valore a e quindi leggere il risultato nella base la della somma, si ricorda però molto più facilmente e, della colonna corrispondente. di solito, non viene data esplicitamente, come invece abbiamo fatto noi ora, presi da un raptus di “amore Algoritmo 2.3 (Sottrazione) Ingresso: Due numeri n, m ∈ N con m ≤ n e la di completezza”. Legata al concetto di confronto, c’è la seconda loro rappresentazione decimale n = dr dr−1 . . . d1 d0 ed m = cs cs−1 . . . c1 c0 ; operazione di base dell’aritmetica: la sottrazione: Uscita: la rappresentazione della differenza p = n − Definizione 2.2 Dati due numeri n ed m tali che m = b b r r−1 . . . b1 b0 m ≤ n, si dice differenza di m da n, e si indica con n − m, il numero p tale che n = m + p. Il numero n 1. si procede da destra verso sinistra ponendo si dice il minuendo mentre il numero m si chiama il successivamente j := 0, 1, . . . , r; sottraendo. L’operazione che permette di calcolare la (a) se dj ≥ cj si pone bj = dj − cj secondo differenza si dice sottrazione. quanto riportato nella Tabella 2.1 e si va al Da questa definizione discende che la sottrazione passo 1f.; è l’operazione inversa dell’addizione. Per questo mo(b) altrimenti (dj < cj ) sia k il primo indice tivo, le proprietà di eliminazione e di aggiunzione, maggiore di j tale che dk 6= 0 (per l’ipotesi viste per la somma in relazione ai confronti, valgono, che sia n ≥ m tale indice esiste senz’altro); all’inverso, per la sottrazione, e invitiamo il lettore a (c) si pone dk := dk − 1 (si effettua il prestito); formularle in modo esplicito. La proprietà di monotonia, invece, non vale più e, anche in questo caso, (d) per ogni indice h compreso tra k + 1 e j (se il lettore è invitato a fornire qualche controesempio. ce ne sono) si pone dh := 9 (era dh = 0); Due nuove proprietà, che possono essere chiamate di (e) si pone bj := (10 + dj ) − cj , secondo la antimonotonia, risultano importanti; la prima è limiTabella 2.1; tata a “≤” e “<”, la seconda è limitata a “≥” e a (f ) si incrementa j e se è ancora j ≤ r si “>”, : riprende il ciclo al punto 1a.; • se a ≤ b, c ≤ d e d ≤ a, allora a − d ≤ b − c; si os2. se, come può succedere, cr = 0 si eliminano le servi che le condizioni date implicano c ≤ b, per cifre iniziali br , br−1 , . . . , bh che siano 0 (e sia cui le due sottrazioni sono entrambe valide; la invece bh−1 6= 0). giustificazione è abbastanza ovvia: se abbiamo due insiemi di aste, il primo con un numero di Dal significato della rappresentazione posizionale aste non superiore al secondo, e dal primo togliadiscende la giustificazione del prestito, che si spiemo tante o più aste di quante non ne togliamo ga meglio con un esempio: se dobbiamo eseguire al secondo, questo rimane con un numero di aste 1003−8, la prima azione da compiere è eseguire 3−8, non inferiore al primo; che non si può fare. D’altra parte, il prestito non • se a ≥ b, c ≥ d, a ≥ d e b ≥ c, allora a − d ≥ b − c; può essere ottenuto né dalle decine né dalle centinaqui dobbiamo avere condizioni che ci assicurino ia; ottenerlo dalle migliaia vuol dire in effetti eseguire 45 2.3. MOLTIPLICAZIONE proprio 1003 − 8. Ci si rende conto, allora, che un prestito da 1000 può esser visto come un prestito da 990 + 10: il 10 si porta alle unità e il 990 rappresenta le 9 decine e le 9 centinaia che abbiamo sostituito agli 0 preesistenti. L’impostazione tradizionale è: 0 9 9 10 1 0 0 0 9 9 3 8 5 − = e lo 0 iniziale si toglie per ottenere la rappresentazione consueta. Anche per il confronto e la sottrazione, pensare ad una base diversa da 10 non crea grossi problemi. Il confronto rimane inalterato, ed equivarrebbe ad un insulto per il lettore riscrivere la Tabella 2.3 nel caso della base 5. La sottrazione, invece, prevede di utilizzare la tabella della somma all’inverso e quindi, se vogliamo sottrarre due numeri scritti in base 5, è bene avere sott’occhio la Tabella 2.2. La parte interessante è fornita dal gioco del prestito che va seguito attentamente. Utilizzando ancora i numero 732 e 473 (liberando il lettore dal tedio di altre conversioni) la sottrazione si imposta cosı̀: 10 1 0 3 2 4 3 0 10 10 1 4 1 2 3 4 − = Partendo da destra ci accorgiamo che da 14′′ non possono essere sottratti 26′′ ; si prende allora 1′ in prestito dai 12′ del minuendo; questi sono ridotti ad 11′ , ma i secondi crescono a 74′′ , in quanto 1′ = 60′′ . Abbiamo allora 74 − 26 = 48 come risultato per i secondi. Passando ai primi, non possiamo togliere 32′ dagli 11′ rimasti; si chiede un grado in prestito dai 28◦ del minuendo e si passa a 71′ , cioè 60 + 11. La differenza 71 − 32 = 39 ci aggiusta il risultato per i primi e quindi non rimane che sottrarre dai 27◦ rimasti gli 8◦ del sottraendo. Si ha cosı̀ il risultato finale 19◦ 39′ 48′′ . Il lettore può utilmente provare con altri angoli o passare ad ore, minuti e secondi, per un più diretto aggancio con la realtà di tutti i giorni. Quando si passa ai mesi e agli anni i calcoli si complicano assai a causa della variabilità della lunghezza dei mesi e dell’intercalarsi degli anni bisestili. Il lettore può provare a calcolare la propria età in numero di giorni vissuti, basandosi sul giorno corrente e sulla data di nascita e non trascurando i 29 di Febbraio che gli è capitato di incontrare lungo la vita. Concludiamo ricordando un altro metodo per eseguire la sottrazione. Fissiamo ad m + 1 il numero delle cifre decimali con cui rappresentare i numeri, cosı̀ che n = dm dm−1 . . . d1 d0 con le cifre più a sinistra eventualmente 0. Si dice complemento a 9 di n il numero n̄ = cm cm−1 . . . c1 c0 definito da cj = 9 − dj , per ogni indice 0 ≤ j ≤ m. Si dice invece complemento a 10 di n il numero n b = n̄ + 1. Lasciamo al lettore la dimostrazione di questo fatto, dove p è un numero naturale qualsiasi: Ogni cifra che effettua un prestito va considerata come diminuita di 1; cosı̀ la cifra 1, seconda da destra, diviene 0 e, dopo il prestito da 4, dà 10−4 = 1. Ora il p+n b − 10m+1 = p − n. 4 diviene 3 e 3 − 3 = 0. Anche in questo caso il lettoQuesto ci dà il metodo alternativo per eseguire la re verificherà la correttezza del risultato mostrando che 20145 = 25910 e 259 = 732 − 473 nella nostra sottrazione. Sia m = 5 cosı̀ che 1003 = 001003 e 8 = 000008, di modo che il complemento a 9 sia 999992 e tradizionale base 10. Non possiamo tralasciare un esempio in base 2, al- il complemento a 10: 999993. Eseguendo la somma: meno come omaggio a sua maestà l’Elaboratore Elet0 0 1 0 0 3 + tronico, campione di stenaritmia. La differenza tra 9 9 9 9 9 8 = 49 e 42 si calcola cosı̀: (1) 0 0 0 9 9 5 1 1 1 1 0 0 0 1 10 0 0 1 0 0 1 1 0 1 1 1 0 1 − = dove il gioco del prestito è ben messo in evidenza. Il risultato ignora i primi 0 e corrisponde al nostro numero 7, come deve essere. Aver capito il meccanismo del prestito significa aver capito la sottrazione, anche nel caso dei numeri scritti in una base composta. Facciamo un esempio utilizzando ancora gli angoli e la notazione in gradi. Si debba eseguire: 28◦ 7◦ 12′ 32′ 14′′ 26′′ − = si trova il risultato che ci aspettavamo. L’elaboratore preferisce questo metodo, anche se naturalmente trasposto alla base 2. 2.3 Moltiplicazione La moltiplicazione altro non è che una sequenza di somme; ad esempio, 5 × 4, che si può leggere “5 per 4 volte”, rappresenta la somma del numero 5 per 4 volte, cioè 5 × 4 = 5 + 5 + 5 + 5. Analogamente, 7 × 5 = 7 + 7 + 7 + 7 + 7 e scopo dell’operazione di moltiplicazione è quello di abbreviare il calcolo di queste somme ripetute. Ricordiamo che, tecnicamente, il termine “moltiplicazione” indica l’operazione, 46 CAPITOLO 2. ARITMETICA mentre con prodotto ci si riferisce al risultato ottenuto; spesso si tende a usare queste due parole come sinonimi, ma è bene che si impari a fare la distinzione per intendersi senza ambiguità. Il primo dei due numeri da moltiplicare si dice moltiplicando, mentre il secondo si chiama moltiplicatore; quando non sia necessario distinguere tra i due, si usa il termine più generico, ma perfettamente appropriato, di fattore. Quindi, riassumendo, il prodotto è il risultato dell’operazione di moltiplicazione svolta tra due (o più) fattori. La proprietà associativa della somma permette di eseguire il prodotto raggruppando in modo qualsiasi i vari addendi; cosı̀ 7 × 5 = (7 + 7 + 7) + (7 + 7) = 7 × 3 + 7 × 2, cioè si ha: a × b = a × b1 + a × b2 purché sia b = b1 + b2 . Questo si può scrivere: a × b1 + a × b2 = a × (b1 + b2 ), e questa si chiama la proprietà distributiva del prodotto rispetto alla somma. Un po’ meno ovvia è la proprietà commutativa, che cioè sia a × b = b × a; infatti, non è affatto evidente che a sommato a sé stesso per b volte sia la stessa cosa che b sommato a sé stesso per a volte. Tuttavia, se rappresentiamo il numero 7 come una colonna di 7 palline, 7 × 5 vuol dire mettere di seguito 5 colonne, ognuna formata di 7 palline. Otteniamo cosı̀ un rettangolo di palline e se lo leggiamo in ordine di riga, ci accorgiamo che esso è composto di 7 righe di 5 palline ognuna. Invertendo il ruolo tra righe e colonne, questo significa che le stesse palline possono essere contate da 5 × 7, cioè 5 × 7 = 7 × 5. e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e Lo stesso tipo di difficoltà rilevato per la proprietà commutativa, si trova quando vogliamo renderci conto della proprietà associativa, cioè la proprietà secondo la quale l’ordine di esecuzione di più moltiplicazioni consecutive non cambia il prodotto finale. Formalmente, questo si esprime con l’identità a × (b × c) = (a × b) × c. In questo caso può aiutare la visione spaziale del risultato. Prendiamo una colonna di a palline; come s’è visto, a × b corrisponde a un rettangolo di palline; ora, (a × b) × c vuol dire ripetere questo rettangolo per c volte; questo si fa bene sovrapponendo i c rettangoli su c strati; si ha cosı̀ un parallelepipedo contenente a × b × c palline. Quando si considera a × (b × c), dobbiamo prima eseguire il prodotto b×c: partendo da una fila con c palline e replicandola b volte, otteniamo un rettangolo con b × c palline; immaginiamo di disporlo verticalmente nello spazio e replichiamolo a volte; otteniamo ancora un parallelepipedo composto da a×b×c palline, e quindi con lo stesso numero di palline di quello ottenuto in precedenza. L’uguaglianza è cosı̀ provata. Naturalmente, vale anche una proprietà dissociativa, per la quale al prodotto a × b possiamo sostituire a × c × d se b = c × d. Per quanto riguarda moltiplicazione e confronti, si hanno proprietà analoghe a quelle della somma e che si possono dimostrare proprio a partire da quelle: • per tutte e sei le relazioni vale la proprietà di aggiunzione: se a R b e c 6= 0, allora ac R bc; • per tutte e sei le relazioni vale la proprietà di eliminazione: se ac R bc e c 6= 0, allora a R b; • per le cinque relazioni “≤”, “<”, “≥”, “>” e “=” vale la proprietà di monotonia: se a R b e c R d, allora ac R bd (con a, b, c, d 6= 0). Partendo da queste proprietà possiamo cercare un metodo per eseguire la moltiplicazione a partire dalla notazione posizionale dei numeri. Procediamo Da questo modo di concepire il prodotto (che è per gradi, formulando via via alcune osservazioni. poi del tutto naturale) seguono alcune proprietà re- La prima osservazione costituisce un vero e proprio lative a fattori particolari quali lo 0 e l’1. Intanto, lemma: 1 × a = a deriva dal fatto che ripetere 1 per a volte ci fa chiaramente ottenere a. Si noti che questo è Lemma 2.2 Per moltiplicare un numero per 10 è diverso da a × 1 che significa ripetere a per una sola sufficiente aggiungere uno 0 in fondo a destra alla volta, e ottenere comunque a. Quello che sorprende sua rappresentazione decimale. nella moltiplicazione è proprio il fatto che valga la proprietà commutativa a × b = b × a, quando l’inter- Prova: Se n è il numero considerato, sia: pretazione che diamo dei due fattori è completamente n = dr dr−1 . . . d1 d0 = diversa: di numero puro il moltiplicando e di “ripetitore” il moltiplicatore. Anche nel caso di un fattore = dr × 10r + dr−1 × 10r−1 + · · · + d1 × 10 + d0 ; 0 questa diversità è evidente: 0 × a significa ripetere 0 per a volte, laddove a × 0 vuol dire ripetere a per per le proprietà associativa e distribuita si ha allora: 0 volte. Comunque, il risultato è sempre zero, cioè 10×n = dr ×10r+1 +dr−1 ×10r +· · ·+d1 ×100+d0 ×10 a × 0 = 0 × a = 0. 47 2.3. MOLTIPLICAZIONE e quindi la rappresentazione di 10 × n è proprio dr dr−1 . . . d1 d0 0 come si voleva. Naturalmente, questo lemma si può estendere al caso di moltiplicazione per 100, 1000 e cosı̀ via: basta aggiungere alla rappresentazione decimale di n l’appropriato numero di 0, cioè quanti ne compaiono nell’altro fattore. La seconda osservazione è tanto semplice che la possiamo fare in modo discorsivo: se i due fattori di una moltiplicazione sono semplici cifre decimali, allora il prodotto è minore di 100, cioè contiene al più due cifre decimali. D’altra parte, come ben si sa, il valore massimo è 9 × 9 = 81. Più complessa è la terza osservazione: Lemma 2.3 Se n è un numero qualsiasi ed m è rappresentato da un’unica cifra m = c, allora ogni cifra di n × c è unicamente determinata dalla corrispondente cifra di n e dall’eventuale riporto del prodotto di c con la precedente cifra di n. Prova: Sia al solito dr dr−1 . . . d1 d0 la rappresentazione decimale di n; abbiamo allora: 9 8 7 6 5 4 3 2 1 1 18 16 14 12 10 8 6 4 2 2 27 24 21 18 15 12 9 6 3 3 36 32 28 24 20 16 12 8 4 4 45 40 35 30 25 20 15 10 5 5 54 48 42 36 30 24 18 12 6 6 63 56 49 42 35 28 21 14 7 7 72 64 56 48 40 32 24 6 8 8 81 72 63 54 45 36 27 18 9 9 Tabella 2.4: La Tavola Pitagorica (b) sia sj la cifra delle unità di v; questa è la j-esima cifra del risultato; (c) sia k la cifra delle decine di v; questo è il nuovo riporto; (d) si riprende dall’inizio del ciclo; 3. Se k 6= 0 si pone sr+1 := k, mentre se k = 0 il valore di sr+1 è nullo. n×c= dr ×c×10r +dr−1 ×c×10r−1 +· · ·+d1 ×c×10+d0 ×c. La precedente osservazione ci assicura che d0 ×c ≤ 81, e quindi tale prodotto determina la cifra delle unità e può avere un riporto che influenzerà la cifra delle decine; sia k tale riporto. La cifra delle decine si calcola facendo d1 × c + k; questo valore non supera 81 + 8 = 89 e quindi genera al più un riporto verso la cifra delle centinaia, ma non oltre. Si noti che anche questa volta il riporto può essere al massimo 8. Procedendo in modo analogo per le cifre successive, si dimostra quanto affermato dal lemma. Questo lemma porta a un algoritmo che stabilisce operativamente cosa dobbiamo fare per eseguire la moltiplicazione fra un moltiplicando generico e un moltiplicatore costituito da una sola cifra decimale. Algoritmo 2.4 (Moltiplicazione per una cifra) Ingresso: Un moltiplicando n = dr dr−1 . . . d1 d0 e un moltiplicatore m costituito da un’unica cifra c. Uscita: La rappresentazione decimale del prodotto n × m = sr+1 sr sr−1 . . . s1 s0 . 1. Si pone k := 0 come riporto iniziale; 2. Procedendo da destra verso sinistra, ponendo j := 0, 1, . . . , r: 9 8 7 6 5 4 3 2 1 cioè (a) sia v := dj × c + k, dove il valore di dj × c risulta dalla Tabella 2.4, la ben nota Tavola Pitagorica; Sapendo moltiplicare n per un numero composto da una sola cifra, il Lemma 2.3 ci permette ora di moltiplicare due numeri qualsiasi. Infatti, sia m = dr dr−1 . . . d1 d0 e si consideri n × m = n × dr × 10r + n × dr−1 × 10r−1 + · · · + n × d1 × 10 + n × d0 . Qui, n × d0 è il prodotto di n per la cifra delle unità d0 , e questo può essere eseguito con l’algoritmo precedente; n × d1 × 10 è il prodotto di n per la cifra delle decine (e anche questo lo sappiamo fare) con uno zero in fondo, e cosı̀ via fino a n × dr , che deve essere seguito da r zeri. A questo punto, basta fare le somme di tutti questi prodotti parziali. Questo è il principio che tutti conosciamo, come conosciamo l’algoritmo e la costruzione che servono ad eseguire comodamente il prodotto nel suo complesso: Algoritmo 2.5 (Moltiplicazione) Ingresso: il moltiplicando n e il moltiplicatore m = dr dr−1 . . . d1 d0 ; Uscita: La rappresentazione decimale di n × m. 1. si scrive il moltiplicando n, il simbolo del prodotto “×” e, accanto o sotto, il moltiplicatore m. Si scrive una linea di divisione dei fattori dai risultati parziali e dal prodotto; 2. procedendo da destra verso sinistra, si considerano le varie cifre (j := 0, 1, . . . , r) del moltiplicatore; (a) si moltiplica n per dj e si aggiungono j zeri alla fine; 48 CAPITOLO 2. ARITMETICA (b) si aggiunge il prodotto cosı̀ ottenuto ai risultati parziali, allineandolo a destra con quelli già presenti (se ce ne sono); (c) si incrementa j e se non si è superato r si cicla tornando al passo 2a.; 3. si scrive una linea di separazione che chiude i risultati parziali cosı̀ ottenuti; 4. si esegue la somma dei risultati parziali, ottenendo il prodotto finale. Ad esempio, per moltiplicare 732 per 263 si procede nel modo seguente: × 263 732 2196 43920 146400 192516 Spesso, al posto degli zeri finali si preferisce operare una scalatura dei prodotti n × dj , ma ovviamente il significato e il risultato sono gli stessi. Nota 2.2 La Tavola Pitagorica è stata la croce di tanti scolari. D’altra parte, essa costituisce il perno dell’esecuzione della moltiplicazione e, come tale, va saputa a memoria, anche oggi che cosı̀ spesso demandiamo a calcolatori elettronici la maggior parte dei nostri conti. La tavola serve per eseguire il prodotto anche secondo un’impostazione che nei tempi passati ha avuto molto successo; se, ad esempio, vogliamo calcolare 27 × 184, l’operazione si imposta cosı̀: 1 7 2 8 7 0 4 6 5 2 2 0 6 1 0 8 8 0 4 8 6 9 Si noti che ogni quadrato contiene il prodotto di due cifre, cioè proprio il risultato dato dalla Tavola Pitagorica. Procedendo da destra verso sinistra, si eseguono le somme per diagonale alto/sinistra verso basso/destra e il risultato 4968 si legge facilmente. Questo metodo evita l’uso dell’algoritmo classico di moltiplicazione e riduce tutto alla Tavola Pitagorica. Ciò lo rende abbastanza simpatico, l’unica difficoltà essendo l’esecuzione delle somme per diagonale, almeno ai primi tentativi. Il lettore è invitato a formulare l’algoritmo per realizzare questo metodo. Quasi non fa uso della Tavola Pitagorica la tecnica detta dei “contadini russi”. Scritti uno accanto all’altro moltiplicatore e moltiplicando, al di sotto si scrivono rispettivamente la metà del primo (ignorando punto decimale e resto) e il doppio del secondo. Si va avanti cosı̀ fino a che il moltiplicatore non è ridotto ad 1, e si sommano infine i vari “doppi” del moltiplicando che corrispondono a valori dispari delle “metà” del moltiplicatore. Ecco come si sviluppa il calcolo di 25 × 347: 25 12 6 3 1 347 (694) (1388) 2776 5552 8675 12 è pari 6 è pari Conviene prendere sempre come moltiplicatore il fattore più piccolo. Si dà per scontato che si sappia calcolare senza difficoltà il doppio di un numero, senza usare la Tavola Pitagorica. La somma finale è inevitabile ed è opportuno aver cancellato bene i termini da ignorare per non incorrere in facili errori. Perché questo metodo funziona? Se convertiamo il moltiplicatore 25 in binario, si ottiene 11001, dove gli 1 corrispondono alle potenze di 2 da considerare per formare il 25 = 24 + 23 + 20 (si veda la Sezione 1.5). Allora, 25 × 347 = 24 × 347 + 23 × 347 + 347 e questo è proprio ciò che si è fatto applicando il metodo dei contadini russi. Costoro, c’è da scommeterci, non immaginavano nemmeno che la loro tecnica di moltiplicazione sarebbe stata adottata dagli odierni elaboratori. Nel sistema binario la moltiplicazione per 2 (cioè il raddoppio) e la divisione per 2 (cioè il dimezzamento) sono operazioni particolarmente facili. Poiché 210 = 102 , raddoppiare un numero binario significa aggiungergli uno 0 in fondo: il doppio di 510 = 1012 è 10102 = 1010 . Analogamente, dimezzare un numero vuol dire togliergli l’ultima cifra. Fra l’altro, questa rappresenta il resto ella divisione: la metà di 2110 = 101012 è 10102 = 1010 con il resto di 1; la metà di 2810 = 111002 è 11102 = 1410 con resto 0. Ecco allora come si imposta il prodotto di 2510 = 110012 per 2710 = 110112 : 11001 1100 110 11 1 11011 (110110) (1101100) 11011000 110110000 resto 0 resto 0 A questo punto, dobbiamo sommare i “doppi” corrispondenti al resto 1; sappiamo fare la somma di due addendi alla volta e quindi il risultato è dato da: 11011 11011000 11110011 110110000 1010100011 + = + = La conversione finale mostra che questo numero binario significa 675, il risultato corretto. A onor del 49 2.4. DIVISIONE vero, se eseguiamo la moltiplicazione tra numeri binari secondo la tecnica consueta esposta per la base 10, otteniamo gli stessi risultati parziali del metodo dei contadini russi: basta osservare che, usando 25 come moltiplicatore, ogni 0 non dà niente da sommare, e ogni 1 dà lo stesso moltiplicando, scalato del numero opportuno di posizioni, cioè con la coda di 0 che gli compete. La somma dei risultati parziali, infine, è proprio quella appena eseguita. Volendo filosofeggiare, si vede cosı̀ come, qualche volta, strade diverse si riuniscano per formare un unico, grande viale. Questi metodi per eseguire la moltiplicazione, comunque, vanno bene solamente per numeri relativamente piccoli, diciamo qualche decina di cifre binarie. Oggi, però, come vedremo nel prossimo capitolo, la tecnica richiede il prodotto di numeri espressi da qualche centinaio di cifre binarie. Fortunatamente, esiste almeno un metodo che permette di effettuare le moltiplicazioni in modo molto più veloce, basato sulla tecnica detta della trasformata veloce di Fourier (FFT = Fast Fourier Transform), della cui esistenza informiamo il lettore, ma il cui trattamento lasciamo ai testi universitari. Concludiamo accennando alla moltiplicazione dei numeri scritti in una base composta. In effetti, non moltiplicheremo due numeri del genere, ma ci limiteremo a moltiplicare un angolo per un numero scritto in base 10. Ad esempio, cerchiamo il triplo di 28◦ 32′ 54′′ ; moltiplicando separatamente per 3 le tre componenti, si ha 84◦ 96′ 162′′ e a questo punto scriviamo correttamente questa quantità: 162′′ sono 2′ 42′′ , e quindi i 2′ si aggiungono ai 96′ presenti. Ora, 98′ sono 1◦ 38′ e il grado si aggiunge agli 84◦ già trovati. In conclusione, il prodotto vale 85◦ 38′ 42′′ . 2.4 Divisione Come la moltiplicazione è un’operazione che abbrevia l’esecuzione di somme successive della stessa quantità, cosı̀ la divisione abbrevia la sottrazione da un quantità data di un certo valore, tante volte quanto ciò risulti fattibile. Con un semplice esempio, la divisione di 19 per 5 corrisponde a sottrarre da 19 il numero 5 tante volte quanto sia possibile. Cosı̀, 19 − 5 = 14, 14 − 5 = 9, 9 − 5 = 4 e a questo punto non è lecito sottrarre ulteriormente 5 dalla differenza ottenuta, cioè 4. Poiché abbiamo potuto sottrarre per tre volte il 5 dal 19, il numero 3 costituisce il risultato della divisione. Talvolta si dice che il 5 sta 3 volte nel 19. La terminologia legata alla divisione è la seguente: risultato si dice quoziente della divisione e il numero che rimane dopo aver effettuato tutte le sottrazioni (cioè il 4) vien detto resto o modulo. Se il resto di una divisione è zero, si dice che la divisione è esatta, o anche che il divisore sta nel dividendo. Infine, dati due numeri n, m ∈ N si dice che n è divisibile per m, o che n è multiplo di m, o che m divide n, o anche che m è un divisore o un fattore di n, se esiste un numero q ∈ N tale che n = m × q. Da questa definizione consegue che il resto della divisione è sempre strettamente minore del divisore, altrimenti si potrebbe eseguire almeno un’altra sottrazione. Il concetto di divisione esatta innesca un importante capitolo della Matematica: quello della divisibilità. Esso merita una speciale attenzione e verrà compiutamente trattato più avanti. Il fatto che n sia un multiplo di m (o che m sia un divisore di n) si può esprimere affermando che il resto della divisione di n per m è zero, cioè n = m × q + 0. Talvolta, per indicare questo concetto, si scrive m|n ovvero m[n. Lo 0 si considera divisibile per ogni numero naturale m, in quanto soddisfa la definizione precedente con q = 0. Quella che abbiamo definito è talvolta detta divisione intera per mettere in evidenza che sono coinvolti solo numeri interi e mai numeri con il punto decimale, che, fra l’altro, finora non abbiamo nemmeno introdotto. Il quoziente tra 19 e 5 è, come s’è visto, 3 e non 3.8, un numero che ancora non conosciamo ufficialmente. Se n, m ∈ N, il quoziente si indica con n/m, anche se talvolta si trovano le notazioni n//m oppure n div m, per distinguere la divisione intera dalla divisione decimale. Se q è il quoziente della divisione di n per m, ed r ne è il resto, si ha chiaramente n = m × q + r, con 0 ≤ r < m. Infatti, m × q ha l’effetto opposto delle differenze successive e ristabilisce, a parte il resto r, il dividendo; questo lo si ottiene poi in modo esatto aggiungendo r. Naturalmente, l’operazione di divisione non si esegue effettuando una dopo l’altra le sottrazioni necessarie: se il risultato fosse anche solo dell’ordine delle migliaia, occorrerebbero ore ed ore per portare a termine un’operazione. Anche in questo caso si può sfruttare la rappresentazione decimale dei numeri. Bisogna tuttavia essere coscienti del fatto che la divisione è l’operazione più difficoltosa fra le quattro operazioni di base. Daremo ora il ben noto algoritmo per eseguire la divisione, ma vedremo come almeno un passo rimane abbastanza oscuro e arbitrario, ancorché del tutto corretto. Questo parzialmente giustifica coloro che si trovano in difficoltà nel fare le divisioni, specie quelle a più cifre. Definizione 2.3 Il numero sul quale si effettua la Algoritmo 2.6 (La divisione) divisione (il 19 nell’esempio) si dice il dividendo; il Ingresso: il dividendo n e il divisore m; numero da sottrarre (cioè il 5) si chiama divisore. Il Uscita: il quoziente q e il resto r della divisione. 50 1. se n < m si pone q := 0, r := n e l’operazione è terminata; CAPITOLO 2. ARITMETICA trovare come scoprirlo, senza perdere troppo tempo. Questo fatto rende la divisione a due cifre uno scoglio fra i più complessi della matematica applicata, 2. altrimenti, siano n = nt nt−1 . . . n1 n0 ed m = oggi superato grazie all’uso massiccio dei calcolatori ms ms−1 . . . m1 m0 le rappresentazioni decimali da tasca. dei due numeri; deve essere t ≥ s dato che è Un esempio di come si imposta la divisione può torn ≥ m; nare utile; per maggiore chiarezza, abbiamo riportato 3. si considerano le prime s + 1 cifre di n, cioè esplicitamente le sottrazioni, anche se di regola viene nt nt−1 . . . nt−s+1 nt−s = n′ e si confrontano con insegnato come evitare tale passaggio: m; se n′ ≥ m si prosegue al passo successivo, 1 7 4 4 8 2 8 altrimenti si aggiunge ad n′ la cifra successiva di 1 6 8 6 2 3 n, ponendo ora n′ := nt nt−1 . . . nt−s nt−s−1 . Si 6 4 osservi che in questo caso è certamente n′ > m, 5 6 visto che n′ ha una cifra in più rispetto ad m; 8 8 4. sia k il massimo numero intero tale che m × k ≤ 8 4 n′ . Tale numero è ≤ 9: infatti, per come si è 4 proceduto al punto precedente abbiamo n′ < 10 × Per le divisioni molto complesse, come per esempio m e quindi k = n′ /m < 10. Quindi k è una cifra . . . e rappresenta la cifra decimale più a sinistra del 347 586 344 812 diviso per 1758, può essere conveniente scriversi, da una parte, la tabella dei multipli quoziente q; del divisore, cosı̀ da averla sempre sott’occhio e sco5. si esegue la sottrazione n′ − k × m = prire immediatamente quante volte il 1758 sta nella pv pv−1 . . . p1 p0 , come rappresentazione decimale; parte considerata del dividendo. La divisione per 2 si dovrebbe saper eseguire a men6. per ognuna delle cifre nj del dividendo non consite o, almeno, senza dover impostare l’operazione coderate al passo 3. e procedendo da sinistra verso me nel caso generale. Le divisioni per 10, 100, 1000, destra: . . . , si fanno togliendo l’ultima cifra, le ultime due (a) si aggiunge tale cifra nj a destra di cifre, le ultime tre, e cosı̀ via; le cifre tolte costituipv pv−1 . . . p1 p0 e questo numero lo si asse- scono il resto della divisione. Le divisioni per 4 si gna ad n′ (si dice che si abbassa la cifra fanno bene dividendo due volte per 2; cosı̀, 147/4 si nj ); esegue dimezzando 147 in 73 e poi questo in 36. Ana(b) si trova il massimo numero k per cui k × logamente, le divisioni per 8 richiedono di dimezzare m < n′ (qui possiamo anche avere k = 0 se per tre volte. Le divisioni per 5 si fanno raddoppiann′ < m, eventualità da escludere al punto do il dividendo e poi dividendo per 10, cioè togliendo 4.; anche questa volta, k è un’unica cifra e l’ultima cifra. Infine, ricordarsi sempre che la divicostituisce la cifra successiva del quoziente); sione per 0 non ha senso (l’operazione è impossibile), mentre la divisione per 1 dà sempre come quoziente (c) si esegue la sottrazione n′ − k × m = il dividendo stesso. pv pv−1 . . . p1 p0 , e, se ci sono altre cifre nel Per quanto concerne divisione e confronti, possiadividendo n si cicla tornando al passo 6a.; mo limitarci a riprendere dalla moltiplicazione la pro7. la sequenza delle cifre k ottenute ai passi 4. e prietà di eliminazione: se c è un numero diverso da 6b. costituisce il quoziente q; l’ultima differenza 0 e si ha ac R bc, allora possiamo dividere per c ed ottenere a R b. La relazione R è una qualsiasi delle pv pv−1 . . . p1 p0 è il resto r della divisione. sei relazioni di base “≤”, “<”, “≥”, “>”, “=” e “6=”. Come si vede, questo è l’algoritmo più complicato Il resto della divisione intera ha un ruolo fondamenper ora incontrato; inoltre, come si diceva, c’è un pun- tale in Aritmetica e, di fatto, in tutta la Matematica. to difficile costituito dai passi 4. e 6b. (che sono del Pertanto, e’ importante la seguente: tutto analoghi): dati n′ ed m, come si trova k? cioè, come si stabilisce quante volte m sta in n′ ? Quando Definizione 2.4 Il resto o modulo della divisione si m è costituito da un’unica cifra, la Tavola Pitagorica, indica con la notazione n mod m, e se due numeri n1 usata all’inverso di come la si usa nella moltiplicazio- ed n2 hanno lo stesso resto nella divisione per m, si ne, fa al nostro scopo, ma quando m è fatto di più scrive n1 ≡ n2 (mod m), che si legge: “n1 è concifre, è solo l’intuito matematico, l’esperienza o la for- gruo ad n2 , modulo m”. L’operazione che ci fa pasza bruta del provare che ci possono aiutare. E’ chiaro sare da un numero n ∈ N al resto n mod m si dice che il valore di k è ben determinato, ma il difficile è riduzione modulo m. 51 2.5. DIVISIBILITÀ Ad esempio, abbiamo 19 ≡ 14 (mod 5). Dati due qualsiasi numeri n1 , n2 ∈ N, e fissato un numero m ∈ N, possiamo sempre dire se n1 è congruo, o non è congruo, ad n2 , modulo m: basta eseguire la divisione e calcolare i due resti, cosı̀ che n1 ≡ n2 (mod m) se e soltanto se n1 mod m = n2 mod m. Questo significa che abbiamo definito una relazione su N, cioè una regola per correlare (o non correlare) due qualsiasi numeri naturali. La cosa curiosa è che questa relazione, detta di congruenza, gode delle stesse proprietà formali dell’uguaglianza: 1) la proprietà riflessiva: ogni numero è congruente con sé stesso (infatti, il resto della divisione per m non può cambiare); 2) la proprietà simmetrica: se un numero n1 è congruo ad n2 , anche n2 è congruo ad n1 (infatti, si tratta ancora dell’uguaglianza dei due resti); 3) la proprietà transitiva: se n1 è congruo ad n2 , e questo è congruo ad n3 , allora il numero n1 è congruo ad n3 (infatti, i tre numeri hanno lo stesso resto nella divisione per m). Si tratta quindi di una relazione di equivalenza e, per quanto detto a suo tempo, possiamo mettere assieme tutti i numeri che hanno lo stesso resto nella divisione per il numero fissato m. Ad esempio, se m = 3 si hanno tre classi di equivalenza: • numeri con resto 0: [0] = {0, 3, 6, 9, . . .}; • numeri con resto 1: [1] = {1, 4, 7, 10, . . .}; • numeri con resto 2: [2] = {2, 5, 8, 11, . . .}. Non vi possono essere altri casi e gli insiemi cosı̀ ottenuti si dicono classi di resti. Ogni classe, infatti, è individuata dal resto r che i suoi elementi hanno nella divisione per m. Fissato m, esistono esattamente m classi, ciascuna corrispondente a uno dei possibili resti 0, 1, . . . , m − 1. Per m = 2 le due classi sono costituite, rispettivamente, dai numeri pari e dispari. L’insieme delle classe di resti modulo m si indica con la notazione Zm . Di solito, per semplificare le notazioni, si scrive semplicemente r invece di [r] e Zm = {0, 1, . . . , m−1}. Le operazioni di addizione e di moltiplicazione su N inducono operazioni analoghe su Zm : Lasciando perdere, per ragioni di semplicità, la divisione, si chiama Aritmetica modulare di base m l’insieme Zm con le operazioni dette. Il calcolatore elettronico rappresenta i numeri naturali con una quantità fissa di bit, cioè di cifre binarie; di solito sono 16 o 32, cosı̀ che l’aritmetica del calcolatore è in realtà un’aritmetica modulare, in cui m = 216 oppure m = 232 . Poiché 216 = 65536, questo significa che 27438 + 49512 = 11414 e 1000 × 100 = 34464; il programmatore ben conosce queste limitazioni e adotta i necessari accorgimenti se un programma richiede l’uso di numeri che possono superare m. La somma, a causa dei riporti che si propagano da destra verso sinistra, va eseguita sequenzialmente in questa direzione, di modo che, più sono i bit usati nella rappresentazione dei numeri, più tempo l’operazione richiede. All’inizio della storia degli elaboratori, pertanto, furono proposte tecniche di rappresentazione che, sfruttando comunque l’aritmetica modulare, potessero accelerare le operazioni, rendendole eseguibili in modo più parallelo, cioè senza un uso massiccio dei riporti. Se fissiamo k numeri (m1 , m2 , . . . , mk ), a due a due primi tra loro, possiamo rappresentare univocamente un numero naturale a < M = m1 × m2 × · · · × mk mediante una k-upla (a1 , a2 , . . . , ak ), dove ai ≡ a (mod mi ), per i = 1, 2, . . . , k. Per le proprietà del modulo, se b = (b1 , b2 , . . . , bk ) si ha: a+b a×b = (a1 + b1 , a2 + b2 , . . . , ak + bk ) = (a1 × b1 , a2 × b2 , . . . , ak × bk ) dove ogni operazione è eseguita modulo mi ; il vantaggio è che le k operazioni sono indipendenti l’una dall’altra e quindi possono essere eseguite in parallelo, accelerando cosı̀ il calcolo. Prendiamo ad esempio m1 = 32 e m2 = 27, di modo che M = 32 × 27 = 864, il numero 100 è rappresentato dalla coppia (4, 19) e il numero 8 da (8, 8). Per esempio, si ha: (20, 23) + (24, 20) (14, 14) × (8, 13) = = (12, 14) (16, 20) Il problema, a questo punto, è risalire da una coppia (o, in generale, da una k-upla) al numero che a + b = a + b (mod m) a × b = a × b (mod m). essa rappresenta; il lettore è invitato (per non dire sfidato) a trovare i numeri naturali che hanno daQueste operazioni godono (più o meno) delle stesse to origine ai due esempi precedenti. Su questo punto proprietà formali dell’addizione e delle moltiplicazio- (anche se non solo su questo) sono falliti questi strani ne in N: chiusura, commutatività, associatività, di- calcolatori. stributività. Inoltre, per ogni elemento r ∈ Zm , la classe m − r agisce da opposto, poiché r + (m − r) = Divisibilità m = 0 (mod m), e quindi possiamo definire la 2.5 sottrazione in Zm : Alcune proprietà dei numeri relative alla divisibilità sono tanto importanti che è opportuno partire proa − b = a + (m − b), prio da esse per parlare più diffusamente di questo e questo è qualcosa di nuovo rispetto ad N. concetto. 52 CAPITOLO 2. ARITMETICA Teorema 2.4 Siano a, b due numeri naturali; allora: Prova: Consideriamo il caso del 9 e dimostriamo qualcosa di più forte, e cioè che: la somma delle cifre • se a e b sono divisibili per m, allora anche a + b decimali di un numero n ha lo stesso resto di n nella e a − b (se a ≥ b) sono divisibili per m; divisione per 9. Sia infatti n = ds ds−1 . . . d1 d0 la rappresentazione decimale di n. Per la regola posizionale • se a è divisibile per m, allora a × b è divisibile abbiamo: per m; se poi anche b è divisibile per m, allora a × b è divisibile per m2 ; n = 10s × d + 10s−1 × d + · · · + 10 × d + d . s s−1 1 0 • se a è divisibile per m e b è divisibile per n, allora La somma delle cifre di n è σ = d +d +· · ·+d +d s s−1 1 0 a × b è divisibile per m × n. e quindi: n−σ = Prova: Dire che a è divisibile per m significa che esiste un numero naturale q tale che a = m × q; ana- (10s −1)×d +(10s−1 −1)×d s s−1 +· · ·+99×d2 +9×d1 . logamente, esiste r ∈ N tale che b = m×r. Per la proprietà distributiva del prodotto rispetto alla somma Gli addendi di questa somma sono tutti divisibili per 9 e quindi n − σ = 9 × k per qualche k. Questo ci dice si ha: che n e σ hanno lo stesso resto nella divisione per 9. a + b = (m × q) + (m × r) = m × (q + r) Da ciò segue che n è divisibile per 9 se e solo se tale è σ. Il risultato si estende ora immediatamente al caso e questo significa che a + b è divisibile per m. Nello del numero 3. stesso modo si dimostrano le altre proprietà. Osserviamo esplicitamente che se σ > 9, si può calL’esecuzione della divisione è il metodo generale colare la somma σ ′ delle cifre di σ, che deve ancora per determinare se un numero m divide o meno un godere della stessa proprietà. Applicando eventualaltro numero n (con n > m). Tuttavia, nella pratica, mente più volte questo procedimento, si arriva sempre si possono dare alcuni criteri per stabilire ad occhio se a un valore compreso tra 0 e nove. Su questa proun numero n ∈ N è divisibile per un numero piccolo prietà, e sull’aritmetica modulare in base 9, si fonda assegnato. Sono facili i criteri di divisibilità per 2, la famosa prova del nove. Sia ad esempio m × p = n e 3, 4, 5, 6, 8, 9, 10, 11, 12; più difficili e perciò non si voglia controllare che il risultato n della moltiplicapraticati sono i criteri per il 7 e per i numeri più zione sia esatto. Dividendo per 9 si ha: n = 9×a+rn , grandi, eccetto qualche caso particolare come 16, 25, m = 9×b+rm , p = 9×c+rp . Eseguendo il prodotto si 50, 100 e cosı̀ via. trova m×p = 81×b×c+9×b×rp +9×c×rm +rm ×rp . I primi tre addendi sono divisibili per 9 e quindi il reTeorema 2.5 Un numero n ∈ N è divisibile per 2 se sto della divisione di m × p per 9 deve essere uguale e solo se la sua ultima cifra è tale; n è divisibile per al resto r della divisione di rm × rp per 9, e questo 4 se e solo se le sue due ultime cifre sono tali; n è r deve coincidere con rn . La prova del nove della divisibile per 8 se e solo se le sue tre ultime cifre sono moltiplicazione consiste nel valutare r ed rn : se sotali. no diversi, sicuramente la moltiplicazione è errata; se sono uguali c’è una buona probabilità (non la certezProva: Se d è l’ultima cifra decimale di n, si ha za) che sia stata eseguita correttamente. Ad esemn = 10×k+d; poichè 10×k è certamente divisibile per pio, 25 × 37 = 925 e si ha rm = 7, rp = 1, quindi 2, n sarà tale se e solo se tale è d. Lo stesso argomento r = 7 che coincide con rn = 7. Si osservi però che è valido per 4, quando si scriva n = 100 × k + h ed se avessimo ottenuto come risultato 952 (effettuando h rappresenta il numero dato dalle due ultime cifre per errore il classico “rovescione”) la prova del nove di n. Infine, per 8 si procede in modo analogo dopo avrebbe comunque dato un risultato positivo! aver scritto n = 1000 × k + h, essendo questa volta h il numero costituito dalle ultime tre cifre decimali di Teorema 2.7 Un numero n ∈ N è divisibile per 5 se n. e solo se tale è la sua ultima cifra decimale (cioè, se e solo se termina per 0 o per 5); è divisibile per 10 Un numero si dice pari se e solo se è divisibile per 2; se e solo se termina per 0. dispari altrimenti. Lo 0 è pertanto un numero pari. Il criterio dato dal teorema precedente ci permette Prova: Analoga al caso del criterio di divisibilità di stabilire se un numero è pari o dispari guardando per 2. semplicemente la sua cifra finale. Naturalmente, da questo criterio discendono i Teorema 2.6 Un numero è divisibile per 3 o per 9 se criteri di divisibilità per 25, 50, 100 e cosı̀ via. e solo se tale risulta la somma delle sue cifre decimali. Analogamente, si ha il seguente risultato: 2.5. DIVISIBILITÀ 53 Corollario 2.8 Un numero n ∈ N è divisibile per 6 primo se è divisibile soltanto per sé stesso e per l’use e solo se è divisibile sia per 2 che per 3; è divisibile nità. Un numero che non sia primo si dice composto. Il numero 1 è convenzionalmente considerato primo. per 12 se e solo se è divisibile sia per 3 che per 4. Diamo infine, senza dimostrazione che ormai dovrebbe essere alla portata del lettore, il seguente criterio: Teorema 2.9 Un numero n ∈ N è divisibile per 11 se e solo se: detta d la somma delle sue cifre di posto dispari e p la somma delle sue cifre di posto pari, si ha che la differenza: |d − p| = (d − p) se d ≥ p, (p − d) altrimenti è divisibile per 11. Se indichiamo con Dm l’insieme dei divisori del numero m, dire che m ed n sono primi tra loro significa che Dm ∩ Dn = {1}. Ad esempio, 24 e 35 sono primi tra loro, in quanto D24 = {1, 2, 3, 4, 6, 8, 12, 24} e D35 = {1, 5, 7, 35}. Poiché lo 0 è divisibile per qualsiasi altro numero, non lo si considera affatto nel concetto di coprimalità. Si osservi infine che Z∗12 = {1, 5, 7, 11} e Z∗15 = {1, 2, 4, 7, 8, 11, 13, 14}; quindi φ(12) = 4 e φ(15) = 8. Se due numeri sono primi tra loro, non è detto che siano primi; l’esempio più semplice è dato dai numeri 4 e 9. Viceversa, come vedremo, se due numeri sono primi, essi sono anche primi tra di loro. I numeri primi verranno trattati più compiutamente nella prossima sezione. La funzione toziente è molto importante nella teoria dei numeri e merita qualche considerazione, anche se del tutto elementare. Dimostriamo il seguente: Ad esempio, con questo criterio si vede subito che 83413 e 3465 sono entrambi divisibili per 11. I criteri che abbiamo presentato dipendono dalla base con cui i numeri sono scritti; pertanto, non ci possiamo aspettare che essi siano ancora validi per i numeri scritti in base 7 o in base 2. Ad esempio, Teorema 2.10 Siano p, q due numeri primi; si ha poiché in base 2 si ha 210 = 102 , un numero scritto in allora: base 2 è pari se e solo se termina per 0. Analogamen1. φ(p) = p−1 te, sarà divisibile per 4 se termina per 00, divisibile 2. φ(pq) = (p − 1)(q − 1) per 8 se termina con 000, e cosı̀ via. Come esercizio, 3. φ(pk ) = pk − pk−1 il lettore è invitato a dimostrare che un numero bik h 4. φ(p q ) = (pk − pk−1 )(q h − q h−1 ) nario è divisibile per 3 se e solo se vale il criterio del Teorema 2.9. Trasposto al caso corrente, esso signifi- Prova: 1. e 3. sono casi particolari di 2. e 4. ca: siano d e p le somme delle cifre di posto dispari e 1. Si considerino i p numeri da 0 a p − 1; quando p di posto pari; il numero è divisibile per 3 se e solo se è primo, tutti questi numeri, eccetto lo 0, sono |d − p| è divisibile per 3. Si provi con 1365. primi con p. I criteri di divisibilità fanno parte della stenaritmia, cioè quell’insieme di regole che permettono di 2. Si considerino i pq numeri da 0 a pq − 1; ci sono accelerare i conteggi. A parte il matematico profesq multipli di p: 0, p, 2p, . . . , (q − 1)p, e p multipli sionista (che però per principio preferisce non fare i di q: 0, q, 2q, . . . , (p − 1)q. Questi numeri sono conti) sapere se un numero è divisibile per 2, 3, 4, gli unici a non essere primi con pq e sono tutti 5 e cosı̀ via risulta utile quando si paga alla romana distinti tra di loro, eccetto lo 0, che si trova in o si debbono suddividere certe risorse tra un numero entrambe le sequenze. Pertanto si ha: di persone. Oggi si fanno i conti con i calcolatori, φ(pq) = pq − p − q + 1 = (p − 1)(q − 1). sia quelli grandi, sia quelli da tasca, ma saper destreggiarsi mentalmente tra i numeri è utile (anche i 3. Fra i pk numeri da 0 a pk − 1, solo quelli dicalcolatori, se impostati male, sbagliano) e salutare visibili per p non sono primi con pk ; essi sono: (un po’ di ginnastica al cervello non fa mai male). 0, p, 2p, . . . , pk − p = p(pk−1 − 1), cioè sono pk−1 Comunque più importanti sono altri concetti legati in tutto. Da questo segue la formula. alla divisibilità, come i numeri primi tra loro (che vedremo tra un istante), i numeri primi e il massimo 4. Il ragionamento è analogo a quello del punto 2. comun divisore, che invece saranno introdotti nelle Fra i pk q h numeri compresi tra 0 e pk q h − 1, non sezioni successive. sono primi con pk q h tutti e soli i multipli di p e i multipli di q; ma i primi sono pk−1 q h e i seDefinizione 2.5 Due numeri si dicono primi tra locondi pk q h−1 , che vanno perciò esclusi dal totale ro o coprimi se non hanno divisori comuni, eccetto di pk q h numeri. In questo modo, però, abbiamo l’1. Se m ∈ N è un numero diverso da 0, si inditolto due volte i multipli di pq, che sono in tutca con Z∗m l’insieme dei numeri minori di m e primi to pk−1 q h−1 e devono essere di nuovo inclusi nel ∗ con m; la cardinalità di Zm si indica con φ(m) e la totale: funzione φ : N → N cosı̀ definita si dice la funzione φ(pk q h ) = pk q h − pk−1 q h − pk q h−1 + pk−1 q h−1 toziente di Eulero. Infine, un numero p ∈ N si dice 54 CAPITOLO 2. ARITMETICA e questa è la formula desiderata. Queste formule permettono di calcolare la funzione φ(n) senza dover cercare esplicitamente i numeri primi con n, come abbiamo dovuto fare dopo la Definizione 2.5; il lettore può ora verificare che i valori là trovati son quelli che si calcolano col precedente teorema e non avrà difficoltà a valutare φ(72) e φ(100), o anche φ(1. 000. 000). Nei primi due casi, lo invitiamo a scrivere esplicitamente gli elementi di D72 e di D100 . Ma quanto vale φ(30)? Poiché 30 = 2 × 3 × 5, il teorema non si può utilizzare; la sua dimostrazione, però, fornisce il metodo per risolvere il problema generale. Si consideri il numero n = pqr, dove p, q, r sono numeri primi; il metodo usato nella dimostrazione del teorema si dice principio di inclusione ed esclusione e possiamo ora applicarlo in questo modo: • i numeri minori di n sono in tutto pqr e da questa quantità partiamo; • dal numero precedente dobbiamo escludere i multipli di p (che sono qr), i multipli di q (che sono pr) e i multipli di r (che sono pq), e si ha pertanto pqr − pq − qr − rp; • in questo modo, però, abbiamo escluso due volte i multipli di pq (che sono r), i multipli di qr (che sono p) e i multipli di rp (che sono q); essi devono essere inclusi di nuovo, ottenendo cosı̀ pqr − pq − qr − rp + p + q + r; • ci accorgiamo ora che lo 0 (che deve essere escluso e che è l’unico multiplo di pqr), è stato prima incluso, poi escluso 3 volte e quindi incluso 3 volte ancora; quindi va escluso di nuovo. In conclusione, si ha: φ(pqr) = pqr − pq − qr − rp + p + q + r − 1 = = (p − 1)(q − 1)(r − 1), e il lettore verificherà direttamente che φ(30) = 1 × 2 × 4 = 8, trovando esplicitamente D30 = {1, 7, 11, 13, 17, 19, 23, 29}. Nota 2.3 Questa tecnica fa vedere che il toziente è una funzione moltiplicativa; con tale termine si indica una funzione f : N → N per la quale vale la seguente proprietà. Sia n = pk1 1 pk2 2 · · · pkuu la decomposizione in fattori primi (si veda la sezione successiva); allora: f (n) = f (pk1 1 pk2 2 · · · pkuu ) = f (pk1 1 )f (pk2 2 ) · · · f (pkuu ). Naturalmente, dobbiamo sapere quanto vale la f sulle potenze di un numero primo, ma per il toziente sappiamo che φ(pk ) = pk −pk−1 , qualunque sia k, e quindi la funzione risulta completamente definita. Un’osservazione interessante è la seguente: siano x, y ∈ Z∗m e consideriamo il loro prodotto xy; poiché né x né y hanno un divisore comune con m, nemmeno xy può averne. Ad essere rigorosi, questo fatto discende dal Corollario 2.12 che ancora dobbiamo dimostrare; tuttavia, siamo in una nota e possiamo permetterci qualche libertà. Prendiamo ora il resto r della divisione di xy per m, cioè sia xy = km + r. Se r avesse un fattore comune con m, tale fattore potrebbe essere messo in evidenza nel membro destro e, ancora per il futuro Corollario 2.12, xy dovrebbe essere divisibile per tale fattore, cosa che abbiamo già escluso. Con ciò abbiamo dimostrato che l’operazione x ∗ y = xy (mod m) è chiusa. Ad esempio, in Z∗15 si ha 4∗7 = 13, 7 ∗ 8 = 11, 11 ∗ 13 = 8, 8 ∗ 8 = 82 = 4 e cosı̀ via. Valgono ovviamente le proprietà associativa e commutativa, in quanto tali proprietà valgono per la moltiplicazione usuale, sulla quale x ∗ y si basa. L’1 agisce da identità e ogni elemento ha il suo inverso: 2 ∗ 8 = 1, 4 ∗ 4 = 1, 7 ∗ 13 = 1, 11 ∗ 11 = 1, 14 ∗ 14 = 1, di modo che 2 e 8, 7 e 13 sono l’inverso l’uno dell’altro, mentre 4, 11, 14 hanno come inverso sé stessi. Siamo quindi di fronte a un gruppo (v. Sezione [1.8]). I matematici si sono dati da fare per studiare questi strani gruppi ∗ , ∗) e ne hanno trovato tante proprietà. Inaspet(Zm tatamente, alla metà degli anni 1970, Rivest mostrò come questi gruppi potessero essere utili per assicurare la privatezza dei messaggi, ad esempio durante la loro trasmissione in una rete pubblica come Internet. Essi infatti permettono di cifrare i messaggi in modo particolarmente efficace. Il metodo si basa su questa proprietà, già dimostrata da Eulero 200 anni prima: per ogni elemento x ∈ Z∗m si ha xφ(m) = 1, cioè in Z: xφ(m) ≡ 1 (mod m). Il lettore è invitato a verificare questa proprietà su Z∗15 , ma la dimostrazione (che vedremo parlando di Algebra Astrattanella Sezione 5.8) ci assicura che la regola vale in generale. Quello che interessa è questo: moltiplicando i due membri dell’uguaglianza per x si ha: xφ(m)+1 = x. Se abbiamo due numeri p ed s, tali che ps = kφ(m) + 1, possiamo procedere a cifrare e decifrare un messaggio con la seguente tecnica. Sia x il messaggio, interpretato come numero; questo è sempre possibile poiché possiamo, ad esempio, interpretare ogni lettera come cifra in un sistema di numerazione in base 21 (vedere la Sezione 1.5). Prendiamo xp ∈ Z∗m come codifica cifrata del messaggio e usiamo l’altro numero s per decifrarlo; in effetti si ha: (xp )s = xps = xkφ(m)+1 = x(xφ(m) )k = x1k = x (tutte le operazioni sono fatte modulo m) e quindi abbiamo ottenuto il messaggio di partenza, decifrando il messaggio cifrato. Naturalmente, affinché il marchingegno funzioni si devono verificare certe condizioni: 1. il numero s sia segreto, conosciuto solo da chi deve ricevere il messaggio, altrimenti addio privatezza. Viceversa, il numero p deve essere pubblico, noto a tutti, in modo da poter essere usato 55 2.6. NUMERI PRIMI da chiunque voglia mandare un messaggio a chi conosce s; 3. Si cancellano dalla lista L tutti i multipli di p, p escluso; 2. dalla conoscenza di p e di m non si possa risalire a φ(m), altrimenti dal fatto che ps = kφ(m) + 1 si potrebbe conoscere s e “rompere” il codice; 4. Si considera il primo numero della lista successivo a p che non sia stato cancellato; 3. sia facile (almeno per un calcolatore) eseguire le potenze xp ed (xp )s modulo m. 5. Se tale numero esiste, lo si assegna a p e si torna al punto 3. La prima condizione è una questione personale di chi conosce s: poiché lo conosce solo lui, starà a lui non rivelarlo a nessun altro. La seconda condizione sembra assurda, perché m deve essere noto a tutti per poter fare le operazioni modulo m, e da m si deve poter risalire a φ(m). In realtà, questo è il punto interessante del metodo, ma ci ritorneremo sopra un po’ più avanti, non appena avremo approfondito il concetto di numero primo, per il momento, diamola per buona. La terza condizione, invece, è semplice: per calcolare xp (mod m) non si deve calcolare xp e poi ridurre modulo m, il che comporterebbe la manipolazione di numeri enormi. Conviene piuttosto ridurre modulo m ad ogni operazione. E’ questo uno dei casi in cui la tecnica dei contadini russi risulta particolarmente utile, come mostra un semplice esempio. Si voglia calcolare 513 (mod 7); valutiamo le potenze raddoppiando ogni volta l’esponente: 52 = 4, 54 = (52 )2 = 42 = 2, 58 = (54 )2 = 22 = 4, tutto modulo 7. A questo punto sarebbe inutile calcolare 516 , ma usiamo piuttosto le potenze trovate per calcolare 513 : 512 = 58 × 54 = 4 × 2 = 1, e infine 513 = 512 × 5 = 1 × 5 = 5. Si noti che φ(7) = 6, e quindi questa è anche una verifica del precedente risultato di Eulero. Nella realtà, come vedremo, sono coinvolti numeri con oltre 200 cifre decimali, ma, fortunatamente, i conti non devono essere fatti a mano e i bravi calcolatori pensano loro a tutto. 6. Altrimenti, avendo esaurito la scansione della lista L, si è finito ed L contiene i numeri primi desiderati. 2.6 Numeri primi Ad esempio, per i numeri da 1 a 25, si comincia con la lista: (1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25) dove abbiamo marcato il valore di p. Cancelliamo i multipli di 2: (1, 2, 3, 4 , 5, 6 , 7, 8 , 9, 10 , 11, 12 , 13, 14 , 15, 16 , 17, 18 , 19, 20 , 21, 22 , 23, 24 , 25). Il nuovo valore di p è 3 e se ne cancellano i multipli rimasti: (1, 2, 3, 5, 7, 9 , 11, 13, 15 , 17, 19, 21 , 23, 25). A questo punto il successivo valore di p è 5, e il suo unico multiplo nella lista L è 25. Tolto anche lui, abbiamo: L = (1, 2, 3, 5, 7, 11, 13, 17, 19, 23); i numeri rimasti non hanno multipli in L, e quindi questo è l’insieme dei numeri primi minori o uguali a 25. La determinazione del fatto che un numero sia primo o composto può essere fatta senza costruire in modo esplicito una tabella di numeri primi. Si osservi che se un numero p è composto, cioè p = n×m con n ed m diversi da 1, allora uno dei due fattori deve √ essere minore o uguale a ⌊ p⌋. Infatti, se avessimo √ √ m > ⌊ p⌋ e n > ⌊ p⌋, sarebbe anche m × n > p (si veda il Teorema 1.6). Si ha allora il seguente metodo: I numeri primi rappresentano sicuramente uno dei più antichi e misteriosi concetti della Matematica. Sono primi i numeri 2, 3, 5, 7, 11, 13, 17. Sono composti tutti i numeri pari, eccetto il 2, nonché 9, 15, 21, etc. Se si esclude il 2, tutti i numeri primi sono dispari. Un elenco di tutti i numeri primi minori o uguali a un assegnato numero n si può ottenere con il seguente algoritmo, noto fin dall’antichità come crivello di Algoritmo 2.8 (Numero primo o composto?) Eratostene: Ingresso: Un numero n ∈ N. Uscita: “Primo” se n è un numero primo, Algoritmo 2.7 (Crivello di Eratostene) “Composto” altrimenti. Ingresso: un numero n ∈ N maggiore di 2; Uscita: l’elenco dei numeri primi minori o uguali ad 1. Si pone p := 2; n. 2. Se n è divisibile per p, allora il numero n non è 1. Si dispongono in una lista L tutti i numeri da 2 primo e si esce dopo aver scritto “Composto”; fino ad n. 3. Altrimenti (p non divide n) si considera il 2. Si pone p := 2; numero primo successivo a p; 56 CAPITOLO 2. ARITMETICA 4. Detto ancora p tale numero primo, se p2 > n il la scomposizione in fattori primi è da seguire con numero n non ha divisori e quindi si esce dopo attenzione: aver scritto “Primo”; Algoritmo 2.9 (Scomposiz. in fattori primi) 5. Altrimenti (p2 ≤ n) si torna la punto 2. Ingresso: Un numero n ∈ N; Uscita: La sua scomposizione in fattori primi. Come esempio, si consideri n = 317. I numeri primi con cui provare la divisibilità sono 2, 3, 5, 7, 11, 13, 1. si pone m := n, p := 2 e si inizializza L come 17, in quanto 192 = 361 > 317. Nessuno di questi lista vuota; numeri primi divide 317, e quindi si può concludere che 317 è un numero primo. 2. se m è divisibile per p allora: Per un numero composto n ha senso trovare la sua scomposizione in fattori primi, cioè l’insieme dei nu(a) si aggiunge p alla lista L; meri primi p1 , p2 , . . . , pk tali che n = p1 ×p2 ×· · ·×pk . (b) si divide m per p e il quoziente diviene il Naturalmente, anche un numero primo p ha una nuovo valore di m; scomposizione che si riduce al solo fattore p. Convenzionalmente, la scomposizione di un numero si (c) se m = 1 allora l’algoritmo è terminato; L scrive n = pk11 pk22 . . . pkuu dove p1 , p2 , . . . pu sono nucontiene la lista ordinata dei fattori primi meri primi distinti; ki si dice la molteplicità di pi . di n; Un’osservazione importante è il seguente: (d) altrimenti (m 6= 1) si riprende il ciclo dal punto 2. Teorema 2.11 Se n ∈ N è un numero naturale qualsiasi, allora la sua scomposizione in fattori primi è 3. altrimenti, cioè se m non è divisibile per p: unica, a parte l’ordine con cui i vari fattori sono considerati. (a) si considera il numero primo successivo a Prova: Supponiamo che n abbia due scomposizioni p; pk11 pk22 . . . pkuu e q1h1 q2h2 . . . qshs . Alcuni fattori possono (b) si chiama ancora p tale numero primo; essere uguali, per cui dividiamo entrambe le scompo(c) se p2 > n allora l’algoritmo è finito: si agsizioni per tali fattori. Si ottengono cosı̀ due scompo′ giunge m alla lista L che viene a contenere sizioni di un numero n che non hanno fattori comuni. l’elenco ordinato dei fattori primi di n; Vogliamo dimostrare che n′ = 1. Se cosı̀ non è, sia p un fattore della prima scomposizione, per cui si ha (d) altrimenti (p2 ≤ n) si riprende dal punto 2. n′ = p × t. D’altra parte p non può dividere nessuno dei q dell’altra scomposizione, che sono tutti primi, Il passo 3a non è particolarmente semplice, poiper cui si deve avere n′ = p × t′ + r, con 0 < r < p. ché richiede di sapere già quali sono i numeri primi; Uguagliando le due espressioni si ha p × t = p × t′ + r, per questo si sostituisce in pratica con l’istruzione: cioè p × (t − t′ ) = r. Ora, se t = t′ si ricava r = 0 (a’) si pone p := p + 2; cioè si considerano tutti i contro l’ipotesi su r; se viceversa t > t′ (in quanto numeri dispari; ciò rallenta un po’ l’esecuzione, ma non ha senso che sia t < t′ ), allora abbiamo che p è non lede la correttezza dell’algoritmo. Si osservi inolun fattore di r, contro l’ipotesi che r sia minore di p. tre che il punto 3c. prende in considerazione anche Quindi l’ipotesi delle due scomposizioni è assurda, a l’eventualità che n possa essere un numero primo. meno che non sia n′ = 1, ma questo, di fatto, significa Nella lista L il numero primo p compare k volte, se che le due scomposizioni di n erano uguali. k è la molteplicità di p in n. Ad esempio, il numero Vale la pena di scrivere esplicitamente il seguente fatto: Corollario 2.12 Se p è un numero primo che divide il prodotto m × n, allora p deve dividere m o n. Prova: Se p divide m × n, deve comparire nella sua scomposizione in fattori primi. Se non compare né in quella di n, nè in quella di m, per l’unicità della scomposizione, non può comparire nemmeno nel loro prodotto. 792 dà luogo alla seguente computazione: 792 396 198 99 33 11 1 2 2 2 3 3 11 Si scrive 792 = 23 ×32 ×11; il fattore 2 ha molteplicità Poiché un certo numero primo p può divide- 3, il fattore 3 ha molteplicità 2 e il fattore 11 ha re n più di una volta, l’algoritmo di ricerca del- molteplicità 1. 57 2.6. NUMERI PRIMI Nota 2.4 Se n persone si volessero scambiare tra loro messaggi mantenendone la privatezza, è facile vedere che occorrerebbero n(n−1)/2 chiavi di ciframento diverse, una per ogni coppia di utenti. Cosı̀, un milione di persone richiederebbero 500 miliardi di chiavi distinte. Più ragionevole è il metodo seguente: ogni persona ha una chiave pubblica di ciframento P , nota a tutti, e una chiave di deciframento segreta S, nota a lui solo. Se qualcuno gli deve spedire un messaggio M , lo codifica con la chiave pubblica ottenendo un messaggio cifrato P (M ), ed è questo che spedisce. Chiunque lo intercetti, non conoscendo la chiave di deciframento S non lo potrà leggere in chiaro; solo chi lo deve ricevere, applicando a P (M ) la chiave S otterrà S(P (M )) = M . Questo metodo richiede solamente due milioni di chiavi (un milione di P e un milione di S) per il nostro milione di persone, e questo è un bel risparmio. Per trovare praticamente le chiavi, si fissano due numeri primi x ed y piuttosto grandi, diciamo con 100 cifre decimali; fortunatamente, esistono metodi abbastanza veloci per determinare se un numero è primo o composto senza dover fare tutte le prove di divisibilità. Si pone poi m = xy di modo che φ(m) = (x−1)(y−1); si osservi che m è un numero di 200 cifre decimali. I due fattori x ed y sono tenuti segreti, mentre m è reso pubblico. I metodi conosciuti per trovare la decomposizione in fattori primi di m sono riconducibili tutti al metodo esaustivo di cercare sistematicamente i divisori mediante il precedente algoritmo; questo metodo, applicato a un numero grande come m richiede qualche centinaio di anni di lavoro del più potente calcolatore attuale. Ciò dà la sicurezza che, in pratica, la scomposizione m = xy non verrà mai trovata, poiché non c’è alcuna certezza nel cercarla. A questo punto si procede cosı̀: se un utente U chiede di poter usufruire del servizio (ad esempio su Internet), il sistema o l’ente preposto a queste cose estrae a caso un numero primo p, diverso da x ed y e dai numeri già assegnati. Anche p è un numero di circa 100 cifre decimali, cosı̀ che se ne possano trovare in abbondanza. Viene poi determinato un numero s (non necessariamente primo) tale che ps ≡ 1 (mod φ(m)), cioè ps = kφ(m) + 1 per qualche numero intero k. Il numero p viene reso pubblico e inserito nell’elenco delle chiavi pubbliche associato al nome dell’utente U ; il numero s viene comunicato ad U e costituisce la sua chiave segreta. Quando un utente V vuole spedire ad U un messaggio M , cerca nell’elenco (una specie di elenco telefonico elettronico delle chiavi pubbliche) il numero p corrispondente ad U . Trasforma il messaggio M in una sequenza di numeri di 200 cifre ciascuno M1 , M2 , . . . , Mr ; applica ad ogni numero la chiave pubblica ottenendo M1p , M2p , . . . , Mrp e spedisce il messaggio cosı̀ codificato (ogni numero Mi deve essere un numero minore di m e viene trasformato in un altro numero minore di m). Il ricevente U applica la chiave s a ciascuno dei numeri ricevuti, ottenendo (M1p )s = M1 , (M2p )s = M2 , . . . , (Mrp )s = Mr , per quanto detto. Ma questa è la sequenza di partenza che, letta in lettere invece che in cifre, è il messaggio in chiaro che doveva ricevere. Questo è quanto e, se U non rivela il suo numero s, il metodo è praticamente al sicuro da ogni tentativo di “rottura”. Naturalmente, i conti da eseguire richiedono l’uso di un calcolatore, ma tutto questo è, in realtà, fatto per il calcolatore! I numeri primi sono molti all’inizio, ma vanno poi diradandosi poiché cresce la probabilità di trovare divisori. Tuttavia, è facile vedere che esistono numeri primi grandi quanto si vuole. Si ha infatti il seguente risultato: Teorema 2.13 (di Euclide) Esistono infiniti numeri primi. Prova: Supponiamo per assurdo che il numero dei numeri primi sia finito e che quindi esistano solo k numeri primi p1 , p2 , . . . , pk . Si consideri il numero n = p1 × p2 × · · · × pk + 1. Questo numero n non può essere divisibile né per p1 , né per p2 , . . . , né per pk , poiché la corrispondente divisione darà sempre 1 come resto. Allora n è un numero primo, contro l’ipotesi che p1 , p2 , . . . , pk fossero tutti e soli i numeri primi. Nota 2.5 La precedente dimostrazione, che i numeri primi sono infiniti, è considerata una delle più belle della Matematica (figuriamoci le altre, si potrebbe dire!), classificandosi al terzo posto nel sondaggio promosso dal Mathematical Intelligencer nel 1988. In generale i numeri primi sono uno degli argomenti più interessanti (e misteriosi) della Matematica, tanto da affascinare moltitudini di ricercatori professionisti e dilettanti. Sono state compilate tavole di numeri primi e, con i moderni calcolatori, ci si è divertiti a scoprire numeri primi sempre più grandi; attualmente, a quanto mi risulta, il record è costituito . . da 213 466 917 − 1, un numero composto da 4. 053. 946 cifre decimali, ma le cose cambiano da un momento all’altro. Non esistono formule che permettano di trovare tutti e soli i numeri primi; curiosamente, già Eulero aveva scoperto espressioni che producono molti numeri primi; ad esempio, n2 + n + 41 genera numeri primi per n = 0, 1, 2, . . . , 39, come il lettore curioso e interessato può verificare, ad esempio utilizzando un semplice programma su un elaboratore. I numeri primi sono una fonte inesauribile di misteri matematici, cioè di proposizioni che, per quanto ne sappiamo, sono vere, ma che nessuno è mai stato in grado di dimostrare. La congettura più famosa è quasi certamente quella di Goldbach: ogni numero pari è la somma di due primi. Ad esempio, 100 = 11+89, e con il calcolatore si è riusciti a verificare questa congettura fino a numeri grandissimi; non esistono tuttavia dimostrazioni che essa sia vera in generale. Goldbach era un matematico russo che verso il 1750 scrisse ad Eulero proponendogli la sua congettura e invitandolo a darne una dimostrazione; ma questa fu una 58 CAPITOLO 2. ARITMETICA delle poche cose che Eulero non riuscı̀ a fare. Oggi, la congettura di Goldbach è diventata nota al grande pubblico grazie al libro di Apostolos Doxiadis “Lo zio Petros e la Congettura di Goldbach”, un libro interessante sia per gli agganci alla Matematica, sia, e soprattutto, per la ricerca psicologica sui personaggi dello zio e del nipote. Un’altra famosa congettura è legata ai cosiddetti primi gemelli: esistono coppie di numeri primi separati soltanto da due unità, o, se si preferisce, costituite da due dispari contigui. Esempi semplici sono 3 e 5, 5 e 7, 11 e 13, 17 e 19, e cosı̀ via. I numeri di ciascuna coppia si dicono appunto gemelli e, pur rarefacendosi, se ne continuano a trovare man mano che si considerano numeri sempre più grandi. Prima del miliardo ne esistono 3. 424. 506, cosı̀ che è stata proposta la congettura che di primi gemelli ne esistano infiniti. Anche questa congettura è rimasta tale,perché nessuno ne ha mai dato una dimostrazione, nonostante che i matematici si siano accaniti a cercarne una prova. Come s’è detto, man mano che si va avanti con numeri sempre più grandi, i numeri primi diminuiscono di frequenza. Ad esempio, il numero di numeri primi compresi tra 1 ed un milione, calcolati di centomila in centomila è: 0 9592 1 8392 2 8013 3 7863 4 7678 5 7560 6 7445 7 7408 8 7323 9 7224 Una domanda che viene abbastanza naturale (almeno ai matematici) è quella relativa alla frequenza dei numeri primi. La precedente tabella è abbastanza significativa, ma possiamo dire qualcosa di più quantitativo? Tecnicamente, si parla della densità dei numeri primi e, per essere più precisi, consideriamo un numero n ∈ N qualsiasi e chiediamoci: quanti sono i numeri primi che precedono n? Questa quantità si indica con la notazione π(n), cioè π : N → N è la funzione che ad ogni n ∈ N associa il numero di numeri primi minori o uguali ad n. Per n piccolo, il calcolo è facile e si vede subito che π(10) = 4 e π(20) = 8; già trovare che π(100) vale 25 richiede un bel po’ di lavoro, a meno di non avere a disposizione un elenco di numeri primi. Dalla tabellina precedente si ha π(100. 000) = 9592 e, facendo le somme, π(1. 000. 000) = 78. 498. Purtroppo, come abbiamo detto, i numeri primi non sembrano godere di alcun senso della regolarità e il calcolo di π(n) si basa sul banale conteggio di un primo dopo l’altro. Nonostante questo, i matematici non si sono arresi e già alla fine del 1700 Gauss (sembra all’età di 14 anni) ipotizzò la formula: π(n) ≈ n . ln n Ci volle un secolo prima che, nel 1896, due altri matematici, de la Vallée Poussin e Hadamard riuscissero a dimostrare questa formula, indipendentemente l’uno dall’altro. Si tratta di una formula asintotica, cioè di una formula che, quando n è piccolo, può non essere molto buona, ma l’errore relativo (v. Sezione 3.7) fra il valore vero e quello approssimato va calando al crescere di n. Ad esempio, la formula precedente dà per n = 100. 000 il valore 8686, con un errore di oltre il 10% sul valore vero. Ma per n = 1. 000. 000 si ottiene 72. 382 e l’errore si è già ridotto all’8.4%. E questi, naturalmente, di fronte all’infinito, sono numeri ancora molto piccini! Si veda la Sezione 8.8 per qualche specifica ulteriore. 2.7 Massimo comun divisore Per definizione, un numero primo p ha due soli divisori: 1 e p stesso. In generale, è facile calcolare il numero di divisori di un numero n ∈ N quando se ne conosca la scomposizione in fattori primi: Teorema 2.14 Se n ∈ N ha scomposizione in fattori primi n = pr11 × pr22 × · · · × prkk , con p1 , p2 , . . . , pk numeri primi distinti, allora il numero dei divisori di n è: (r1 + 1)(r2 + 1) · · · (rk + 1). Prova: Un divisore m di n deve avere gli stessi divisori primi di n; quindi, relativamente al fattore primo p1 , dovrà avere un fattore p01 (cioè, in effetti, m non sarà divisibile per p1 ), oppure un fattore p11 , oppure p21 , . . . , oppure pr11 , per un totale di r1 + 1 possibilità. La stessa cosa vale per p2 , . . . , pk , e da questo segue la formula data. Ad esempio, il numero 792 = 23 × 32 × 11 avrà (3 + 1)(2 + 1)(1 + 1) = 24 divisori. Esplicitamente, essi sono: {1, 2, 3, 4, 6, 8, 9, 11, 12, 18, 22, 24, 33, 36, 44, 66, 72, 88, 99, 132, 198, 264, 396, 792}. Il teorema può essere seguito meglio con un caso più semplice come n = 12 = 22 × 3, che deve avere (2 + 1)(1 + 1) = 6 divisori. I fattori con 2 e con 3 sono: {1 = 20 , 2 = 21 , 4 = 22 } e {1 = 30 , 3 = 31 } e danno le sei possibilità: 1×1=1 1×3=3 2×1=2 2 × 3 = 6 4 × 1 = 4 4 × 3 = 12. Nota 2.6 I Pitagorici furono molto interessati al concetto di divisibilità. Definirono perfetto un numero che fosse la somma di tutti i suoi divisori, eccetto ovviamente sé stesso. L’esempio più semplice è 6 = 1+2+3, ma perfetto è anche 28 = 1+2+4+7+14 e quindi seguono 496 = 24 × 31, 8128 = 26 × 127 e 33550336 = 212 × 8191; non si sa se i numeri perfetti siano infiniti. Un concetto analogamente sviluppato 59 2.7. MASSIMO COMUN DIVISORE dai Pitagorici fu quello di numeri amicabili. Consideriamo tutti i divisori di 220 = 22 × 5 × 11; come s’è visto essi sono 12 e cioè 1, 2, 4, 5, 10, 11, 20, 22, 44, 55, 110, 220. Se sommiamo tutti questi numeri eccetto il 220, troviamo 284. Procedendo nello stesso modo per questo numero 284 = 22 × 71, troviamo 5 divisori propri: 1, 2, 4, 71, 142 e la loro somma è 220. Abbiamo ritrovato il numero di partenza e per questo 220 e 284 si dicono amicabili, ognuno essendo la somma dei divisori propri dell’altro. I Pitagorici probabilmente conoscevano questa sola coppia, che è la più piccola possibile. I matematici arabi al-Farı̄sı̄ e al-Banna scoprirono le coppie 17296 – 18416 e 9. 363. 584 – 9. 437. 056, che più tardi furono riscoperte da Cartesio e da Fermat. Nel 1700, Eulero scoprı̀ una trentina di nuove coppie, me nel 1866 un ragazzo italiano di 16 anni, un certo B. N. I. Paganini (nessuna parentela col violinista) trovò la coppia (1184, 1210), la più piccola dopo (220, 284), ma che era sfuggita a tutti, perfino a Eulero. Oggi, con l’aiuto dei calcolatori elettronici, se ne conoscono una quantità enorme, tutte formate da due numeri pari o da due numeri dispari. Nessuno sa se esistono coppie di numeri amicabili formate da un numero pari e uno dispari. Prendiamo ora due numeri n, m consideriamo i loro divisori: ∈ N e Questo metodo dà MCD(12, 30) = MCD(22 × 3, 2 × 3×5) = 2×3 = 6 e MCD(792, 220) = MCD(23 ×32 × 11, 22 × 5 × 11) = 22 × 11 = 44. Sicuramente questo metodo è molto più efficiente dell’applicazione diretta della definizione, che richiede la costruzione delle liste di tutti i divisori di m ed n. Tuttavia, la necessità di eseguire la scomposizione in fattori primi, rende il teorema di non facile applicazione quando i numeri coinvolti sono piuttosto grandi. Allora, fin dall’antichità, è stato proposto un algoritmo che rende estremamente facile il calcolo del massimo comun divisore anche di numeri grandi. Cominciamo con l’osservare una semplice conseguenza del teorema precedente: Corollario 2.16 Dati due numeri m, n ∈ N, se n è un divisore di m (in particolare, se n = m), allora MCD(m, n) = n. L’algoritmo si basa sul fatto che MCD(m, n) = MCD(m − n, n) se m > n. Infatti, se s è il massimo comun divisore cercato, si ha m = s × k e n = s × h; quindi m − n = s × (k − h), cioè s divide m − n. Se m − n è ancora maggiore di n, continuando si ha MCD(m, n) = MCD(m − 2 × n, n), e cosı̀ via fino a MCD(m − d × n, n) quando sia m − d × n < n. Ma questo significa che d è il quoziente della divisione di m per n e m − d × n è semplicemente il resto della stessa divisione. Ecco allora il celebre: Definizione 2.6 Si dice Massimo Comun Divisore di m ed n, e si indica con MCD(m, n), o anche Algoritmo 2.10 (Algoritmo di Euclide) semplicemente con (m, n), il più grande dei divisori Ingresso: due numeri m, n ∈ N; comuni ad m ed n. Uscita: il MCD(m, n). Si osservi che, nel peggiore dei casi, m ed n hanno almeno il fattore comune 1. Ad esempio, abbiamo MCD(12, 30) = 6; infatti, 30 = 2 × 3 × 5 ha 8 divisori che sono (1, 2, 3, 5, 6, 10, 15, 30); confrontandoli con i divisori di 12 dati sopra, si trova che il divisore comune più grande è proprio 6. Il seguente teorema dà un modo abbastanza pratico per calcolare il massimo comun divisore di due numeri: 1. Se m = n l’algoritmo termina e il massimo comun divisore è n; 2. Se m < n, si scambiano tra di loro m ed n (cosı̀ d’ora in avanti possiamo supporre che sia m > n); Teorema 2.15 Dati due numeri m, n ∈ N, il MCD(m, n) si trova considerando il prodotto dei divisori primi comuni ad m ed n, presi col minimo esponente che compare nelle due scomposizioni in fattori primi. 3. Sia r il resto della divisione di m per n; Prova: Sia s = MCD(m, n); i fattori primi di s devono ovviamente essere a comune tra m ed n. Inoltre, se p è un fattore primo comune, e k è l’esponente minore con cui p compare nella scomposizione di m ed n, pk deve dividere s. Infatti, un esponente più piccolo di k non darebbe il valore massimo di s e un esponente più grande di k farebbe sı̀ che s non dividerebbe più quello fra m ed n corrispondente all’esponente più piccolo per p. 5. Altrimenti (0 < r < n), si cambiano i nomi: n diviene il nuovo m, r diviene il nuovo n e si torna al punto 3. 4. Se r = 0, allora n è un divisore di m e per il corollario precedente l’algoritmo termina col valore del MCD in n; Si noti che l’algoritmo termina sempre: siccome m ed n vanno continuamente a diminuire pur rimanendo positivi, nel peggiore dei casi arriveremo ad avere n = 1; al passaggio successivo il resto della divisione di m per 1 sarà senz’altro 0 e l’algoritmo finirà. La ricerca 60 CAPITOLO 2. ARITMETICA di MCD(792, 220) si imposta cosı̀: 792 220 132 88 = 3 × 220 = 1 × 132 = 1 × 88 = 2 × 44. + + + 132 88 44 Nota 2.7 Il più delle volte, l’algoritmo di Euclide è ignorato dalla Scuola Media, e per trovare il MCD gli si preferisce il Teorema 2.15. Per i numeri piccoli, quando la scomposizione in fattori primi si può fare più o meno ad occhio, tale metodo è più semplice, anche perché la maggior parte dei nostri studenti ha difficoltà a fare le divisioni con più di una cifra, richieste dall’algoritmo di Euclide. Purtroppo, quando i numeri crescono, la scomposizione in fattori primi diviene un’operazione molto complessa, e non si conoscono modi per accelerare la ricerca esaustiva di un fattore dopo l’altro, ricerca che richiede un numero di prove molto elevato (e tali prove, ohimè, sono divisioni a più cifre!). In effetti, dato il numero n, la ricerca del √ primo fattore, se non è piccolo, richiede n/2 divisioni (Algoritmo 2.9), che per n nell’ordine di 10 miliardi è già circa 50. 000. Per vedere cosa succede con l’algoritmo di Euclide, e fare un confronto, possiamo chiederci quali numeri innescano il processo più laborioso per trovare il MCD. Nell’esempio di MCD(792, 220), la prima divisione, che ha dato quoziente 3, ha ridotto drasticamente le dimensioni dei numeri coi quali continuare l’algoritmo, che sono diventati 220 e 132. Più alto è il quoziente, più netta è la riduzione; quindi, il quoziente 1 dà la minima riduzione dei numeri. Ma avere quoziente 1 per due numeri m, n (m > n) significa m = 1 × n + r, cioè m = n + r. In altre parole, il più grande dei due numeri è la somma dell’altro (che lo sostituerà al passo successivo) e del resto, che sostituerà n. Questa stessa proprietà dovrà verificarsi al passo successivo, cioè dovremo avere n = r + s, e cosı̀ via, fino a che non ci saremo ridotti ad 1. Si definisce sequenza di Fibonacci una sequenza di numeri F0 , F1 , F2 , F3 , . . . tale che F0 = 0, F1 = 1 e ogni altro numero è dato dalla somma dei due precedenti, cioè Fn = Fn−1 + Fn−2 . Gli Fk si dicono numeri di Fibonacci e i primi dieci sono: n Fn 0 0 1 1 2 1 3 2 4 3 5 5 6 8 7 13 8 21 9 34 Il lettore può calcolare i valori successivi, cominciando con F10 = 55. Per verificare quanto detto, basta ora prendere due numeri consecutivi di questa sequenza e cercare il loro MCD; ad esempio, per 55 e 34 si ha: 55 34 21 13 8 5 3 2 = = = = = = = = 1 × 34 1 × 21 1 × 13 1×8 1×5 1×3 1×2 2 × 1. + + + + + + + 21 13 8 5 3 2 1 Si osservi che sull’ultimo quoziente non si può migliorare e che, per costruzione, due numeri di Fibonacci consecutivi sono primi tra loro. Per rendersi conto che queste 8 divisioni costituiscono davvero un massimo, si provi a calcolare MCD(55, 33) e MCD(55, 35) con lo stesso algoritmo. Ad ogni modo, questo prova che dati due numeri m, n (m > n) e trovato quell’Fk tale che Fk > m, la ricerca del MCD(m, n) col metodo di Euclide richiederà meno di k divisioni (in effetti, meno di k − 1). I numeri di Fibonacci sembrano crescere in modo abbastanza contenuto; ma questa è solo l’apparenza dei primi termini della sequenza. In realtà essi crescono molto rapidamente ed F50 = 12. 586. 269. 025, come si può trovare facilmente con un calcolatore o applicando la formula (che dimostreremo più avanti nella Sezione 4.3): õ √ ¶k ! √ ¶k µ 1 1− 5 1+ 5 Fk = √ ; − 2 2 5 per quanto incredibile, questa formula produce numeri interi! In conclusione, tutto questo significa che, per trovare il MCD di due numeri dell’ordine di 10 miliardi, l’algoritmo di Euclide richiede al più 50 divisioni, già un bel po’ di meno della semplice ricerca del primo divisore di uno dei due numeri! Una importante definizione è la seguente: Teorema 2.17 Due numeri n, m ∈ N hanno MCD(m, n) = 1 se e solo se sono primi tra loro. Prova: Per definizione di Massimo Comun Divisore, MCD(m, n) = 1 significa che i due numeri non hanno divisori comuni diversi dall’unità, cioè sono primi tra loro. Le proprietà formali del massimo comun divisore, visto come operazione tra numeri naturali, sono le seguenti: commutativa associativa idempotenza identità zero MCD(m, n) = MCD(n, m) MCD(m, MCD(n, p)) = = MCD(MCD(m, n), p) MCD(n, n) = n MCD(n, 0) = n MCD(n, 1) = 1 Assieme al massimo comun divisore, si è soliti considerare anche il minimo comune multiplo di due numeri m, n ∈ N, definito come il più piccolo dei multipli comuni ad m ed n, e si indica con la notazione mcm(m, n). In analogia a quanto fatto per il massimo comun divisore, si dimostra che: Teorema 2.18 Il minimo comune multiplo di due numeri m, n ∈ N si trova considerando, nella scomposizione di m ed n in fattori primi, il prodotto 61 2.8. LE ALTRE OPERAZIONI dei fattori primi comuni e non comuni, presi con questa notazione si scrive: max{x ∈ N | P (x)} per inil maggiore degli esponenti che compaiono nelle due dicare il massimo numero naturale per cui vale la proscomposizioni. prietà P (x). Analoga notazione si usa per il minimo, ed à facile vedere come esempio che 15 = min{x ∈ La dimostrazione è analoga a quella vista per il N | x2 > 200}. massimo comun divisore e la lasciamo perciò al letQueste operazioni ci permettono di osservare che, tore. Dal teorema segue la seguente proprietà, an- da un punto di vista logico, le uniche operazioni che ch’essa usata spesso per il calcolo del minimo comune sarebbe necessario introdurre sono il confronto e l’admultiplo: dizione, tutte le altre essendo definibili in termini di queste. Abbiamo appena visto come min e max siano m×n mcm(m, n) = . dipendenti dal solo confronto; per le altre operazioni MCD(m, n) abbiamo: Anche le proprietà formali del minimo comune multin−m = max{x ∈ N | m + x ≤ n} plo sono simili a quelle del massimo comun divisore: n⊖m = min{x ∈ N | m + x ≥ n} proprietà commutativa, associativa e di idempotenza. n×m = m + m + · · · + m (n volte) Si ha invece: n/m = max{x ∈ N | m × x ≤ n} mcm(n, 0) = 0 mcm(n, 1) = n. Infine, vogliamo osservare che per le operazioni di MCD e mcm valgono le proprietà distributiva e di assorbimento, che lasciamo alla delizia del lettore, sia per la formulazione, sia per una eventuale dimostrazione. Confrontando queste proprietà con quelle viste per gli insiemi (Sezione 1.1) e quelle che vedremo (Sezione 4.6) per il calcolo delle proposizioni, non si può non essere colpiti dalla fortissima analogia. Siamo infatti di fronte ad esempi diversi di una struttura algebrica particolare, nota come Algebra Booleana. Ritorneremo su questi fatti più avanti, quando parleremo un po’ di Algebra Astratta (Sezione 5.8. 2.8 Le altre operazioni Le quattro operazioni fondamentali sono la base del calcolo e, come vedremo, non solo del calcolo dei numeri naturali, ma di tutti gli insiemi numerici che man mano introdurremo. Tuttavia, esse non costituiscono, assieme al confronto, la totalità delle operazioni e, anzi, molte altre possono essere definite a partire da quelle; in questa sezione introdurremo le principali operazioni che si incontrano nella pratica. Prima di tutto, basate sul confronto, ci sono le operazioni di minimo e di massimo: ½ a se a ≤ b min(a, b) = b altrimenti max(a, b) = ½ a se a ≥ b b altrimenti. n mod m = n − (n/m) × m. Si osservi che con queste definizioni 3 − 5 non è definito mentre 3⊖5 = 0. Quest’ultima operazione si usa quando è necessario far sı̀ che la sottrazione sia un’operazione su N, nel senso della Sezione 1.3, e quindi sia definita per ogni possibile valore di m ed n. Un’altra operazione che si basa sul principio di abbreviare l’iterazione di un’operazione elementare è l’elevamento a potenza. Con la notazione nm si indica il prodotto di n per sé stesso per m volte, cioè: nm = n×n×· · ·×n per m volte. Con questo si suppone m ≥ 2, ma, come per la moltiplicazione, possiamo estendere la definizione ad m = 0 ed m = 1. Ricordando che nell’espressione nm il numero n si dice la base e il numero m si dice l’esponente, si ha: ½ 0 n = 1 nm+1 = n × nm m ≥ 0. Ad esempio, per n = 5 si ha: 50 = 1, 51 = 50 × 5 = 1 × 5 = 5, 52 = 51 × 5 = 5 × 5 = 25, e via di seguito. Questo fa vedere la convenienza di avere n0 = 1. Questa regola vale anche per n = 0, cioè si ha: 00 = 1, 01 = 0 × 00 = 0 × 1 = 0, e cosı̀ di seguito. Il fatto che sia 00 = 1 è alquanto controintuitivo, ma è in accordo con altre definizioni e con argomenti dell’Analisi Matematica, in cui si dimostra che limx→0 xx = 1, come lo studente vedrà nei corsi universitari. Per il resto, dalla definizione discendono alcune importanti (e ben note) proprietà delle potenze: Teorema 2.19 Se n, m, p ∈ N, si hanno le seguenti identità: a) nm+p = nm np c) (nm )p = nm×p b) nm−p = nm /np (m ≥ p) d) np × mp = (n × m)p . E’ ovvio osservare, ed è altrettanto semplice dimostrare, che valgono le proprietà della Tabella 2.5. La proprietà associativa permette di scrivere min(a, b, c) Prova: Si consideri nm np = (n × n × · · · × n) × e max(a, b, c) al posto di una delle più complicate (n × n × · · · × n), dove il fattore n è ripetuto m volte espressioni date nella tabella. Come estensione di entro le prime parentesi e p volte entro le seconde. 62 commutativa associativa distributiva assorbimento idempotenza identità zero CAPITOLO 2. ARITMETICA min(a, b) = min(b, a) min(min(a, b), c) = min(a, min(b, c)) min(a, max(b, c)) = max(min(a, b), min(a, c)) min(a, max(a, b)) = a min(a, a) = a max(a, b) = max(b, a) max(max(a, b), c) = max(a, max(b, c)) max(a, min(b, c)) = min(max(a, b), max(a, c)) max(a, min(a, b)) = a max(a, a) = a max(a, 0) = a min(a, 0) = 0 Tabella 2.5: Proprietà del minimo e del massimo Per la proprietà associativa del prodotto le parentesi possono esser tolte e quindi il fattore n è ripetuto m + p volte. La dimostrazione delle altre proprietà si effettua in modo del tutto analogo e, per l’ultima, si fa uso anche della proprietà commutativa per riunire (o separare) i fattori n ed m. famoso l’aneddoto che si racconta sul mitico inventore del gioco degli scacchi. Al re che gli chiedeva cosa volesse come ricompensa per la sua invenzione, chiese tanto grano quanto se ne poteva ottenere associando un chicco alla prima casella della scacchiera, due chicchi alla seconda, quattro alla terza, otto alla quarta, e cosı̀ via, raddoppiando ogni volta il numeE’ un utile esercizio quello di provare ad esprimere, ro di chicchi. L’ingenuo sovrano acconsentı̀, senza con proprie parole per evitare la citazione di formule, rendersi conto che il numero totale di chicchi sareble quattro proprietà di questo teorema. be stato 1 + 2 + · · · + 262 + 263 ≈ 1.84 × 1019 ben Nonostante il fatto che, per definizione, una potendi più di quanto grano sia mai stato prodotto sulza sia l’abbreviazione di una sequenza di moltiplicala terra. Probabilmente, l’inventore degli scacchi fu zioni, non esiste un algoritmo specifico per il calcodecapitato per aver voluto fare troppo il furbo. lo delle potenze, come invece abbiamo visto per la E’ bene dare la seguente: moltiplicazione, che ha un proprio algoritmo, pressoché indipendente da quello dell’addizione, di cui Definizione 2.7 Un numero naturale p ∈ N si dice è pure un’abbreviazione. Per potenze con esponen- una potenza m-esima perfetta se esiste un numero te piccolo, diciamo 2 o 3, il metodo di calcolo più naturale n tale che p = nm . In tal caso, si dice anche conveniente è l’esecuzione delle relative moltiplica- che n è la radice m-esima perfetta di p e che m è il zioni; cosı̀ 53 = 5 × 5 × 5 = 25 × 5 = 125. Per logaritmo in base n di p, e si scrive rispettivamente √ esponenti più grandi si può adottare il metodo dei n = m p ed m = logn p. contadini russi, analogo a quello visto per la moltiplicazione (vedere anche la Nota 2.3). Ad esempio, In generale, le potenze con esponente 2 si dicono meper calcolare 54 conviene calcolare 52 = 25 e quindi glio quadrati e le potenze con esponente 3 si dicono 54 = (52 )2 = 252 = 625; e cosı̀ si procede per espo- cubi; ad esempio, 0, 1, 4, 9, 16, 25 sono quadrati pernenti che siano potenze di 2. Più in generale, per cal- fetti, mentre 0, 1, 8, 27, 64 sono cubi perfetti. Anacolare 513 si osserva che 13 può essere espresso come logamente, le radici seconde si dicono radici quadrate radici terze radici cubiche. Essendo 64 = 43 , si somma di potenze di 2: 13 = 8 + 4 + 1 e quindi 513 = e le√ 3 ha 64 = 4 e log4 64 = 3; cosı̀, da 81 = 34 si deduce 58+4+1 = 58 × 54 × 51 . Procedendo come visto prima, √ 4 81 = 3 e log3 81 = 4. Le radici e i logaritmi sono le abbiamo 52 = 25, 54 = 625, 58 = 6252 = 390. 625. 13 . . . . operazioni inverse delle potenze; per definizione, se n Quindi 5 = 390 625 × 625 × 5 = 1 220 703 125. In è una potenza p-esima perfetta, cioè n = mp ; allora altri termini, come per la moltiplicazione, disposti ac√ p log n p canto base ed esponente, si eseguono successivamen- si ha ( n) = n e m m = n. Le principali proprietà delle radici e dei logaritte i quadrati a partire dalla prima, e si calcolano le mi derivano da quelle delle potenze e descritte nel metà a partire dal secondo. Si fa poi il prodotto dei Teorema 2.19. Per le radici p-esime abbiamo: quadrati corrispondenti alle metà di valore dispari: √ Teorema 2.20 Se m ed n sono potenze perfette 5 13 opportune, si ha: 25 6 √ q 625 3 √ √ √ √ √ p √ p p p q . m × n = m × n n = p×q n. 390 625 1 Come ci si accorge facilmente, le potenze crescono ra- Prova: La prima proprietà deriva dalla d) del Teopidamente al crescere dell’esponente. Già con la base rema 2.19, se m ed n sono potenze p-esime perfette; 2, 220 supera il milione e 230 supera il miliardo. E’ elevando alla potenza p-esima, il membro sinistro dà 63 2.8. LE ALTRE OPERAZIONI √ √ m×n e il membro destro dà ( p m)p ×( p n)p = m×n. La seconda proprietà, in modo analogo, si deduce dalla c) dello stesso Teorema 2.19. Per i logaritmi si ottiene: Teorema 2.21 Se i numeri naturali a, b sono potenze perfette della stessa base n, diciamo a = nm e b = np , allora logn a × b = logn a + logn b. Prova: Per la proprietà a) del Teorema 2.19, si ha: logn (a × b) = logn (nm × np ) = = logn nm+p = m + p = logn a + logn b come si desiderava. Anche se hanno senso solo per le potenze perfette, si possono dare definizioni opportune di radici e di logaritmi per tutti i numeri naturali. Dato un numero naturale p ∈ N, si dicono radici m-esime di p per difetto e per eccesso le quantità: √ ⌊ m p⌋ = max{x ∈ N | xm ≤ p} √ ⌈ m p⌉ = min{x ∈ N | xm ≥ p} Analogamente, si dicono logaritmi in base n di p per difetto e per eccesso: ⌊logn p⌋ = ⌈logn p⌉ = max{x ∈ N | nx ≤ p} min{x ∈ N | nx ≥ p} Se p è una potenza m-esima perfetta, le due approssimazioni coincidono con la radice m-esima e col logaritmo in base n. Anticipando cose che dovremmo dire più avanti, dato un numero reale r qualsiasi, con la notazione ⌊r⌋ si indica il massimo numero intero che sia minore o uguale ad r, e con la notazione ⌈r⌉ si indica il minimo numero intero maggiore o uguale ad r. Queste operazioni hanno, in inglese, nomi fantasiosi che, tradotti in italiano, suonano a dir poco inusitati; la prima si dice pavimento di r (in inglese, “floor of r”) e la seconda soffitto di r (in inglese, “ceiling of r”). Un’ultima operazione di abbreviazione è il fattoriale: si dice fattoriale del numero n ∈ N il prodotto di tutti i naturali da 1 fino ad n. Ad esempio, 4! = 1 × 2 × 3 × 4 = 24. Una definizione ricorsiva permette di introdurre anche il valore di 0!: ½ 0! = 1 (n + 1)! = (n + 1) × n! Cosı̀, 4! = 4 × 3! = 4 × 3 × 2! = 4 × 3 × 2 × 1! = 4 × 3 × 2 × 1 × 0! = 4 × 3 × 2 × 1 = 24. Come nel caso di 00 , definire 0! = 1 sembra controintuitivo, ma in realtà è consistente col resto della definizione e con altre impostazioni dello stesso concetto, come ad esempio la funzione Gamma Γ(x). Come vedremo, l’operazione di fattoriale si incontra comunemente nel calcolo combinatorio e nel calcolo delle probabilità. Nota 2.8 L’Aritmetica, cioè la teoria dei numeri naturali, è la base di tutta la Matematica, che può essere costruita a partire dalle proprietà dei naturali. Come vedremo concretamente, i numeri interi e quelli razionali, i numeri reali e quelli complessi sono costruzioni che si fondano sui numeri naturali e le loro operazioni sono estensione delle analoghe operazioni fra naturali, delle quali mantengono le proprietà principali. D’altra parte, le proprietà dei naturali si basano sulle quattro operazioni elementari e il confronto; la definizione delle altre operazioni parte da quelle e si basa su due semplici principi: i) sia priva di ambiguità, e 2) permetta di arrivare al risultato in un tempo finito. Questo modo di porre le cose può essere formalizzato in una teoria, secondo quanto visto nel primo capitolo. Questo modo di concepire la Matematica si dice aritmetizzazione e sembra che l’idea risalga a Ohm, che la introdusse in un suo libro del 1832. Verso il 1860 si cominciarono ad avere le prime definizioni formali dei numeri reali (noi ne vedremo una nel prossimo capitolo) e questo dette un enorme impulso al processo di aritmetizzazione, che si propose di dare una teoria completa dell’Aritmetica, dalla quele si potesse partire per aritmetizzare tutta la Matematica. La più famosa formulazione della teoria dell’Aritmetica è senz’altro quella del matematico torinese Giuseppe Peano (1858 – 1932), uno dei grandi logici vissuti a cavallo tra ’800 e ’900. Egli introduce tre enti fondamentali: “numero”, “zero” e “successore” che, secondo il concetto moderno di teoria assiomatica, non sono definiti, ma che sono completamente determinati dalle proprietà specificate negli assiomi. Naturalmente, noi possiamo immaginare che questi tre termini si riferiscano a ciò che comunemente intendiamo per numero, per zero e per successore (di un numero), ma questo può aiutare la nostra comprensione, non certo la costruzione logica che intendiamo affrontare, cioè lo sviluppo dell’Aritmetica e di tutta la Matematica. Ecco comunque i cinque assiomi: 1. zero è un numero; 2. ogni numero ha un successore; 3. zero non è successore di alcun numero; 4. se i successori di due numeri sono uguali, allora anche i numeri sono uguali; 5. se un’affermazione è vera per zero, e supposta vera per un numero risulta vera anche per il suo successore, allora essa è vera per ogni numero. Quest’ultimo assioma altro non è se non il principio di induzione, il quale, secondo Peano, è il modo naturale per dimostrare le proprietà dei numeri naturali. Normalmente, i tre enti si denotano con i simboli N, 0, ′ , e si introducono le abbreviazioni: 0′ = 1, 0′′ = 1′ = 2, 0′′′ = 1′′ = 2′ = 3, e cosı̀ via. La somma si definisce allora mediante la ricorsione: ½ n+0 = n n + m′ = (n + m)′ 64 CAPITOLO 2. ARITMETICA Questo significa che se il secondo argomento è zero, la somma si riduce al primo argomento; se non è zero, allora è il successore di qualche numero m, e la somma è il successore della somma di n ed m. Occorre capire bene questo punto che sembra definire la somma in termini di sé stessa, cioè mordendosi illegalmente la coda. In realtà, come già c’è capitato di osservare, m è “minore” del suo successore e la riduzione del secondo argomento porta inevitabilmente a ridursi al caso m = 0, che finalmente è trattabile con la prima regola. In altre parole, il ripiegarsi su sé stessa è solo apparente o provvisorio e la ricorsione a un certo punto termina, rendendo buona la definizione. Supponiamo di voler eseguire 3 + 2; poiché 2 non è zero, esso è il successore di un numero; per definizione è 2 = 1′ e quindi si ha: 3 + 2 = 3 + 1′ = (3 + 1)′ . Ancora, 1 non è zero e perciò è il successore di un numero; per definizione sappiamo 1 = 0′ e quindi (3 + 1)′ = (3 + 0′ )′ = (3 + 0)′′ . Finalmente, il secondo argomento è zero e di conseguenza: 3 + 2 = (3 + 0)′′ = 3′′ = 4′ = 5. Se dovessimo fare cosı̀ per eseguire ogni somma, la Matematica non avrebbe proceduto oltre questa definizione. Il senso di questa è di farci capire come, concettualmente, l’operazione di successore sia sufficiente per introdurre la somma. Quello che importa è comprendere la semplificazione logica di questo modo di procedere. Il processo non termina con la definizione dell’operazione; occorre ora dimostrare che la somma, cosı̀ definita, gode delle proprietà commutativa e associativa, e ammette 0 come identità. Per fare ciò risulta essenziale il principio di induzione, che pertanto a buon diritto è stato inserito tra gli assiomi. Naturalmente, si va avanti con lo stesso spirito, e la moltiplicazione è definita ricorsivamente cosı̀: ½ n×0 = 0 n × m′ = n × m + n dove si sfrutta la somma, ormai acquisita. Non possiamo sviluppare qui, partendo dagli assiomi di Peano, tutta l’Aritmetica, e men che mai tutta la Matematica; il lettore interessato potrà utilmente approfondire l’argomento dando altre definizioni per le varie operazioni conosciute e tentando la dimostrazione delle loro proprietà. Concludiamo introducendo una speciale notazione (più che una nuova operazione). Capita spesso di dover eseguire somme con molti addendi: quando facciamo la spesa al supermercato o quando tiriamo le somme del bilancio personale alla fine del mese. Se indichiamo con c1 , c2 , . . . , cn il costo dei singoli prodotti acquistati o con v1 , v2 , . . . , vm le spese effettuate, interessa calcolare le somme c1 + c2 + · · · + cn ovvero v1 + v2 + · · · + vm . Una comoda notazione è: n X i=1 ci = c1 + c2 + · · · + cn m X i=1 vi = v1 + v2 + · · · + vm . P Qui, il simbolo , che è una sigma maiuscola stilizzata, si dice simbolo di somma. La prima somma, ad esempio, si legge: “somma per i che va da 1 ad n dei ci ”. In generale avremo: n X i=k ci = ck + ck+1 + · · · + cn dove k ed n sono gli estremi della somma ed i è la variabile di somma che assume i propri valori da k fino ad n. Si suppone che n ≥ k e se k = n la somma si riduce al solo elemento ck ; si conviene inoltre che quando k ≥ n la somma sia 0. Gli elementi che si sommano costituiscono un vettore, cioè un insieme di valori presi in un certo ordine e ciascuno distinto da un proprio indice. Cosı̀, P5se v1 = 8, v2 = 7, v3 = 8, v4 = 6, v5 = 7, si ha: i=1 vi = 36. Si osservi che, per le proprietà della somma, abbiamo: n X i=m ci = p X ci + i=m n X i=m n X ci se i=p+1 rci = r n X m≤p<n ci ; i=m infatti, la prima è la proprietà associativa e la seconda è la proprietà distributiva. La proprietà commutativa scambia la posizione dei vari addendi, cioè scombussola il vettore, e pertanto si usa solo in situazioni particolari. Capitolo 3 Numeri . . . chi è abituato a sbrigare le proprie faccende col regolo calcolatore non può ormai prendere sul serio una buona metà delle asserzioni umane. Il regolo calcolatore consta di due sistemi di numeri e di lineette combinati con straordinaria accortezza: due tavolette scorrevoli verniciate di bianco, a sezione trapezoidale piatta, mediante il quale si risolvono i più intricati problemi, senza sciupare inutilmente un solo pensiero. . . Quando si possiede un regolo calcolatore, e arriva qualcuno con grandi affermazioni e grandi sentimenti, si dice: “Un attimo, prego, prima calcoliamo il limite d’errore e il valore probabile di tutto ciò!” R. Musil “L’uomo senza qualità” 3.1 I numeri interi I numeri naturali, nonostante le difficoltà presentate dalla loro definizione, hanno un aggancio immediato con la realtà, in quanto servono a contare. Le frazioni, che vedremo più avanti in questo capitolo, hanno anch’esse un rapporto preciso con la realtà e fin dall’antichità è stato chiaro cosa significasse mezza mela o tre quarti di focaccia. Invece, i numeri negativi hanno rappresentato per lungo tempo un concetto strano, poco comprensibile e, quindi, spesso bandito dalle acque limpide della Matematica. Oggi, l’esempio delle temperature o della contabilità, con i soldi a credito (numeri positivi) o a debito (numeri negativi), ci è tanto familiare che stentiamo a credere che fino a 300 anni fa il segno − non fosse accettato come qualcosa di ovviamente utile, ma fosse ricacciato come ambiguo o, addirittura, come un attributo diabolico. Comunque, in molte persone perdura ancora l’idea che qualcosa di satanico sia intrinseco nella “regola dei segni”, per la quale meno per meno fa più. La necessità di introdurre i numeri negativi sorge dal desiderio di poter eseguire una differenza come 3 − 5, che con i numeri naturali non ha senso: come è infatti possibile prendere cinque caramelle da un insieme di tre? L’interpretazione insiemistica dei numeri esclude questa possibilità ed è proprio questo 65 che gli antichi avevano in mente, pur senza aver dato una definizione formalizzata di cardinalità. Alla metà del 1500, il matematico olandese Stevin (1487 – 1567) chiamava “numeri absurdi” i numeri negativi, che pure si era visto essere utili nella risoluzione delle equazioni. Per i Greci i numeri erano legati alla misura delle grandezze (specie dei segmenti) e anche per loro pensare a misure negative era praticamente assurdo. Tuttavia, a posteriori, si è visto come avere 3 e e spenderne 5 significa avere un debito di 2 e; e se la temperatura è a 3◦ sopra lo 0 e scende di 5◦ , allora si troverà a 2◦ sotto zero. Ma tutto questo è venuto dopo l’accettazione dei numeri negativi. Formalmente, un numero intero è 0 oppure un numero naturale preceduto da uno dei segni + o −; i numeri preceduti da + si dicono interi positivi; quelli preceduti dal segno − si dicono interi negativi. Il numero privato del segno si dice valore assoluto dell’intero, ed è pertanto un numero naturale; il valore assoluto si indica ponendo il numero intero tra barre; cosı̀ | + 6| = 6, | − 5| = 5 e |0| = 0. I due segni +, − si dicono opposti tra di loro; convenzionalmente, il segno positivo si tende a sottintendere, cosa che cercheremo di non fare in questa sezione per distinguere chiaramente i numeri interi positivi dai numeri naturali, anche se la regola è che i loro insiemi vengano identificati, regola che naturalmente adotteremo anche noi. Si osservi la seguente definizione che talvolta torna utile: +1 se a è positivo 0 se a è zero sgn(a) = −1 se a è negativo. Il significato dei segni +, − è definito dal loro comportamento nelle usuali operazioni: Definizione 3.1 Siano a, b due numeri interi; si definisce somma di a e b e si indica con a + b, il numero intero cosı̀ ottenuto: a) se a, b sono entrambi positivi, la loro somma è il numero positivo che si ottiene sommando i valori assoluti dei due numeri; b) se a, b sono entrambi negativi, la loro somma è il numero negativo che ha per valore assoluto la somma dei valori assoluti di a e di b; c) se a, b sono discordi (cioè, 66 CAPITOLO 3. NUMERI esatta) ed n − 1. Prima di tutto, la divisione opera sempre con un divisore positivo, quindi se questo risulta negativo, gli si cambia il segno, cambiandolo contemporaneamente anche al dividendo. Se ora a ∈ Z e b > 0 sono i due numeri da dividere, il quoziente è dato dal numero q tale che a = b × q + r, con 0 ≤ r < b. Pertanto (−14) : (+5) = −3 con resto 1, L’opposto di un numero a si indica con −a ed è il che è la stessa cosa di (+14) : (−5). numero intero che ha lo stesso valore assoluto di a, Questo modo di concepire i numeri interi è quello ma segno opposto a quello di a. Quindi −(+7) = −7 e classico usato nelle Scuole Medie e quello che si ritro−(−5) = +5. La sottrazione a−b è, per definizione, la va nella struttura logica degli elaboratori elettronici, somma di a con l’opposto di b. L’insieme dei numeri dove il segno è costituito da un bit, 0 per positivo e interi si indica con Z, dal tedesco Zahl = numero. 1 per negativo. Tuttavia, l’impostazione matematica Il prodotto di due numeri interi a, b è il numero più rigorosa ed elegante è completamente diversa e, intero a × b (o semplicemente a · b, oppure ab) che ha come vedremo, spiega automaticamente la regola dei come valore assoluto il prodotto dei valori assoluti di segni. a e di b, e come segno quello stabilito dalla cosiddetta Il problema generale che ci poniamo è quello di regola dei segni: estendere l’insieme numerico di partenza S (in questo caso, i numeri naturali N) in modo da ottenere un a\b + − nuovo insieme T che: + + − 1. permetta di definire le quattro operazioni ele− − + mentari e i confronti, mantenendo le stesse proprietà di S ed eventualmente acquisendone di Perché questa regola dei segni? Perché, soprattutnuove; to, meno per meno fa più, come di solito si esprihanno uno segno positivo e l’altro negativo) la loro somma ha come segno lo stesso segno del numero che ha valore assoluto più alto e come valore assoluto la differenza tra il più grande e il più piccolo dei due valori assoluti (se a, b hanno segno opposto ma uguale valore assoluto si ha a + b = 0). me la regola più misteriosa? Il fatto fondamentale è questo, che vogliamo conservare ai numeri interi le principali proprietà formali, già viste per i numeri naturali e le relative operazioni. Cosı̀, è facile vedere che per l’addizione valgono ancora le proprietà commutativa ed associativa, e lo 0 fa da identità. Per la moltiplicazione, vogliamo che proprietà commutativa, associativa e distributiva siano valide. Consideriamo allora, come esempio, il prodotto (+3) × ((+2) + (−2)); se prima eseguiamo la somma abbiamo (+3) × 0 = 0, poiché 0 deve operare da zero, cioè annullare il prodotto. D’altra parte, se vale la proprietà distributiva, l’espressione diviene: (+3) × (+2) + (+3) × (−2) e deve essere 0 per quanto appena detto. Poiché abbiamo identificato gli interi positivi con i naturali, si ha (+3) × (+2) = 3 × 2 = 6. Si ha pertanto 6 + (+3) × (−2) = 0, e sommando −6 ai due membri: (+3) × (−2) = −6; questo spiega la regola “più per meno uguale meno”, e in modo analogo si trova che “meno per più uguale meno”. A questo punto abbiamo: (−3) × ((+2) + (−2)) = (−3) × 0 = 0 ancora per la proprietà distributiva, e quindi (−3) × (+2) + (−3) × (−2) deve dare 0. Ma ora sappiamo che (−3) × (+2) = −6 e quindi (−3) × (−2) = −(−6) = 6, cioè è giocoforza accettare la regola che “meno per meno fa più”. Infine, per la divisione, abbiamo una regola molto complicata (certo più complicata di quella della divisione fra naturali) per rispettare la regola fondamentale del resto, cioè che nella divisione per n il resto deve essere un numero compreso tra 0 (divisione 2. contenga propriamente S, nel senso che si possa definire un sottoinsieme T ′ ⊂ T “identificabile” con S, tale cioè che esista una corrispondenza biunivoca ϕ tra T ′ ed S per cui se s, s′ ∈ S danno come risultato s∗ rispetto a una qualsiasi delle quattro operazioni o ad un confronto (nel qual caso s∗ = 0/1) allora i corrispondenti elementi ϕ(s), ϕ(s′ ) ∈ T ′ diano come risultato della stessa operazione o dello stesso confronto proprio il corrispondente ϕ(s∗ ). Quest’ultima proprietà si dice tecnicamente di isomorfismo e si dice anche che S e T ′ sono isomorfi. Nel caso in questione, i numeri interi che vogliamo costruire, devono godere di tutte le proprietà dei numeri naturali più il fatto che la sottrazione sia sempre definita. Come si sa (ma che qui, prima della costruzione, dobbiamo far finta di non sapere) sono gli interi positivi, compreso lo 0, che si identificano con i numeri naturali. Formalmente, c’è da dimostrare che Z+ ed N sono isomorfi. Il metodo seguito per estendere un insieme numerico è in sostanza sempre lo stesso. Tanto la costruzione di Z da N, quanto la costruzione dei numeri razionali da Z, quanto ancora la costruzione dei numeri reali dai razionali, seguono uno schema ben preciso. Vediamolo allora in generale. Sia, come sopra, S l’insieme numerico di partenza e si voglia costruire l’insieme esteso T : 1. si definisce un insieme U basandoci sugli elementi di S; 3.1. I NUMERI INTERI 67 2. si definisce su U una relazione di equivalenza e (c, d) ∼ (e, f ) cioè c + f = d + e, sommando mem“∼”; bro a membro si ha a + d + c + f = b + c + d + e, ovvero a + f = b + e che vuol dire (a, b) ∼ (e, f ). Pos3. si definiscono su U le quattro operazioni e i siamo allora dividere N × N in classi di equivalenza, confronti; e si dice numero intero ciascuna delle classi ottenu4. si dimostra che sono compatibili con la relazio- te. Nell’interpretazione vista, (a, b) e la sua classe di ne “∼”, cioè elementi equivalenti danno risultati equivalenza identificano il numero a − b poiché tutte le coppie hanno la stessa differenza. Se a > b questa equivalenti; dà un numero positivo, se a = b si ha lo 0 e se a < b 5. si definisce T come l’insieme quoziente di U si ha un numero negativo. modulo “∼”; Definiamo ora la somma (a, b) + (c, d) = (a + c, b + d): affinché questa definizione abbia senso non 6. si definisce un opportuno sottoinsieme T ′ ⊂ T e deve dipendere dalle particolari coppie scelte. Ma si dimostra che T ′ è isomorfo ad S. se (a, b) ∼ (a′ , b′ ) e (c, d) ∼ (c′ , d′ ) e si esegue L’insieme U è un insieme di comodo, che ingloba la (a′ , b′ ) + (c′ , d′ ) = (a′ + c′ , b′ + d′ ), vediamo che nostra idea di estensione, ad esempio che sia sempre (a′ +c′ , b′ +d′ ) ∼ (a+c, b+d). Infatti abbiamo per ipodefinita la sottrazione. La costruzione di U è di regola tesi a+b′ = a′ +b e c+d′ = c′ +d e sommando membro pleonastica e si ottiene un insieme troppo grande; per a membro: a + b′ + c + d′ = a′ + b + c′ + d che definisce questo si definisce la relazione di equivalenza che per- proprio l’equivalenza tra le due somme. Può essemette di ridurre gli elementi a quelli essenziali. Gli re divertente dimostrare ora tutte le proprietà della elementi sono in effetti classi di equivalenza: questa somma (commutatività, associatività e identità dello è una delle difficoltà concettuali maggiori, poiché le 0), ma ci limitiamo a far vedere che se (a, b) è positivo, prime volte ci risulta ostico accettare che un numero (c, d) è negativo e il valore assoluto di (a, b) è maggioè una classe di equivalenza. D’altra parte, questo è re di quello di (c, d), allora il risultato della somma è proprio ciò che si fa con le frazioni (anche se non lo si |(a, b)| − |(c, d)|. Infatti, abbiamo (a, b) ∼ (a − b, 0) dice in questi termini) dove 3/5, 6/10 e 33/55 sono se a > b, e (c, d) ∼ (0, d − c) se c < d. Quindi lo stesso numero razionale. (a, b) + (c, d) = (a − b, 0) + (0, d − c) = (a − b, d − c), Il fatto che un numero sia una classe di equivalenza ma questo numero rappresenta proprio la differenza impone di dimostrare che le operazioni e i confronti dei due valori assoluti. Si noti infine che l’opposto di sono indipendenti dai particolari elementi di U usati (a, b) è (b, a), per cui la differenza si definisce molto per la loro esecuzione. Questo dà piena validità al- semplicemente: la costruzione di T . Infine, bisogna far vedere che T (a, b) − (c, d) = (a, b) + (d, c). estende S e quindi, fra le classi di U , dobbiamo iden′ tificare quelle che costituiscono l’immagine T di S e Il confronto fra due coppie si fa definendo: dobbiamo far vedere che le operazioni e i confronti in S e in T ′ danno proprio gli stessi risultati. (a, b) ≤ (c, d) se e solo se a + d ≤ b + c, Per la costruzione di Z si comincia col considerare le coppie di numeri naturali (a, b) ∈ N × N, che il cioè estendendo la relazione di equivalenza; a destra lettore è bene immagini di interpretare come a − b, abbiamo un confronto tra numeri naturali, e quindi anche (e soprattutto) quando a < b. Naturalmen- sappiamo come funziona. Anche questa definizione te, questo è logicamente scorretto perché non si sa ha un senso abbastanza ovvio se guardiamo alla noancora ufficialmente cosa sia a − b proprio quando stra interpretazione; infatti, a − b ≤ c − d significa a < b, ma l’idea ci permette di entrare nello spirito proprio a + d ≤ b + c. Facciamo ora vedere che la di questa impostazione. Si dice che due coppie so- relazione cosı̀ definita è una relazione d’ordine che no equivalenti, e si scrive (a, b) ∼ (c, d) se e solo se estende la relazione “≤” fra i numeri naturali. La proa + d = b + c; questa è un’uguaglianza tra numeri prietà riflessiva è ovvia, poiché (a, b) ≤ (a, b) significa naturali, e quindi sappiamo cosa significa. Nell’inter- a + b ≤ a + b. Per l’antisimmetria, se (a, b) ≤ (c, d) si pretazione suggerita, due coppie sono equivalenti se ha a + d ≤ b + c, e se (c, d) ≤ (a, b) si ha b + c ≤ a + d; e solo se hanno la stessa differenza: a − b = c − d, da queste sono relazioni su N, insieme in cui la procui a + d = b + c, ma osserviamo di nuovo che questo prietà antisimmetrica vale, per cui a + d = b + c, avrà senso solo a posteriori. E’ facile vedere che la cioè (a, b) = (c, d). Infine, per la proprietà transitiva, relazione definita è proprio di equivalenza: proprietà se (a, b) ≤ (c, d) si ha a + d ≤ b + c e se (c, d) ≤ (e, f ) riflessiva (a, b) ∼ (a, b) ovvia perché a+b = a+b; pro- si ha c + f ≤ d + e; sommando membro a membro prietà simmetrica: se (a, b) ∼ (c, d), cioè a+d = b+c, si ha a + c + d + f ≤ b + c + d + e e semplificando allora c + b = a + d che significa (c, d) ∼ (a, b); pro- a+f ≤ b+e, cioè (a, b) ≤ (e, f ). Lasciamo al lettore il prietà transitiva: se (a, b) ∼ (c, d) cioè a + d = b + c compito di far vedere che se restringiamo il confronto 68 CAPITOLO 3. NUMERI a elementi positivi (quelli che corrispondono con N) il confronto dà gli stessi risultati che dà in N. Il prodotto è definito da: che produce un Do, si ha ancora un Do, ma un’ottava più bassa. Gli altri rapporti sono: 9/8 per il Re, 5/4 per il Mi, 4/3 per il Fa, 3/2 per il Sol, 5/3 per il La e 15/8 per il Si: (a, b) × (c, d) = (ac + bd, ad + bc). Questa regola non è poi tanto misteriosa; se (a, b) rappresenta a − b e (c, d) rappresenta c − d, allora il loro prodotto deve rappresentare (a − b)(c − d) = ac − ad − bc + bd, e quindi basta separare gli addendi positivi da quelli negativi per ottenere la formula del prodotto. Anche per questa operazione, le proprietà formali valgono integralmente, ma lasciamo la loro verifica alla pazienza del lettore volenteroso. Veniamo invece alla regola dei segni, che più ci interessa. Cominciamo con l’osservare che ogni numero positivo ha, fra le coppie che lo definiscono, una del tipo (n, 0), mentre ogni numero negativo ne ha una del tipo (0, n). Se consideriamo i quattro casi possibili, abbiamo: (n, 0) × (m, 0) (n, 0) × (0, m) (0, n) × (m, 0) (0, n) × (0, m) = (nm, 0) = (0, nm) = (0, nm) = (nm, 0) positivo negativo negativo positivo. Purtroppo, la divisione è un’operazione piuttosto complicata, e qui la lasciamo perdere. 3.2 I numeri razionali L’idea di numero frazionario è molto antica e, bisogna dire, anche molto naturale, al contrario del concetto di numeri negativo che si è affermato soltanto nel 1600 e non senza notevoli difficoltà. Le frazioni scaturiscono direttamente dalla realtà: come ci sono 2 mele o 10 arance, cosı̀ c’è mezza mela, un quarto di pollo o un ottavo di torta. Storicamente, le frazioni con numeratore unitario, come 1/2, 1/3 o 1/12, hanno avuto un ruolo privilegiato fino al 1600, quando si impose la notazione decimale con il punto o la virgola di separazione. Gli Egizi usavano solo tali frazioni, con l’eccezione di 2/3, per cui per esprimere 3/5 dovevano scrivere 1/2 + 1/10, e per esprimere 4/5 si rifacevano a 1/2 + 1/5 + 1/10. Questo uso, come s’è detto, si protrasse per tutto il Medio Evo, e anche in seguito. Invitiamo il lettore a scrivere un algoritmo che trasformi una frazione nella somma di frazioni con il numeratore unitario. Nella Matematica Greca le frazioni avevano un ruolo molto importante e su di esse era in pratica basata la teoria delle proporzioni, che a lungo dominò la Geometria e l’Aritmetica, fin da quando Pitagora aveva scoperto i rapporti armonici, cioè i rapporti che regolano la lunghezza delle corde per produrre, vibrando, le varie note: raddoppiando la lunghezza della corda Do Re Mi Fa Sol La Si Do Nota 3.1 Questi rapporti corrispondono alla cosiddetta scala naturale, che è un po’ diversa dalla scala pitagorica nella quale il Mi ha rapporto 81/64, il La 27/16 e il Si 243/128. Queste differenze dipendono dal fatto che, verosimilmente, il nostro orecchio percepisce una certa nota se la frequenza del suono è compresa in un dato intervallo e non solo quando tale frequenza ha un valore preciso. Entrambe le scale sono approssimazioni che, comunque, appartengono a questi supposti intervalli. Quale è allora il loro valore centrale? Per determinarlo possiamo fare tre ipotesi: • le note si ripetono di ottava in ottava; si passa da un’ottava all’altra raddoppiando la frequenza; • per motivi fisiologici, educativi e convenzionali riusciamo a distinguere 12 note in ciascuna ottava, cosı̀ come riusciamo a distinguere un numero finito di colori dall’insieme infinito delle lunghezze d’onda luminose; • il rapporto r tra due note consecutive è costante (natura non facit saltus), contrariamente a quanto si suppone nelle scale naturale e pitagorica. Se poniamo uguale ad 1 la frequenza del Do in una qualsiasi ottava, la nota successiva (che propriamente è il Do diesis o il Re bemolle) avrà frequenza 1 · r = r, la nota successiva, cioè il Re, avrà frequenza r2 , e cosı̀ via, fino al Do dell’ottava successiva, che avrà frequenza r12 . Ma questa frequenza, per la prima ipotesi for12 mulata, √ è uguale a due e quindi si ha r = 2, cioè 12 2 ≈ 1.059463. Questi nuovi rapporti, costituiti r= in effetti da numeri irrazionali (si veda più avanti in questo capitolo), formano la cosiddetta scala temperata. Trascurando le note intermedie, date dai diesis e dai bemolle delle note corrispondenti agli intervalli maggiori, si ha la seguente tabellina: nota Do Re Mi Fa Sol La Si Do scala pitagorica 1 1.125 1.266 1.333 1.500 1.688 1.898 2 scala naturale 1 1.125 1.250 1.333 1.500 1.667 1.875 2 scala temperata 1 1.122 1.260 1.334 1.498 1.682 1.888 2 3.2. I NUMERI RAZIONALI 69 cioè, semplificando, mn′ = m′ n. Questa è una uguaglianza tra numeri interi, e quindi sappiamo come gestirla. Purtroppo il ragionamento che ci ha portato a questa uguaglianza è basato sul nulla, in quanto sono Inizialmente, i Greci credevano che presi comunque proprio le regole di comportamento delle frazioni che due segmenti (o due grandezze omogenee) fosse sem- ci mancano. Il trucco (se di trucco si puó parlare) pre possibile trovare un loro sottomultiplo comune: se è allora proprio quello di assumere i nostri desideri questo era 1/n del primo segmento e 1/m del secon- come punto di partenza: do, il secondo risulta m/n del primo (e il primo n/m del secondo). I filosofi rimasero sconcertati quando Definizione 3.2 Date due frazioni m/n ed m′ /n′ , si Pitagora dimostrò che questo non è sempre vero. Ve- dice che esse sono equivalenti se e solo se mn′ = m′ n, dremo più avanti come stanno le cose, ma, nonostan- e in tal caso scriveremo m/n ∼ m′ /n′ . te questo risultato negativo, le frazioni rimasero al Il nome è giustificato dal seguente teorema: centro del concetto di misura delle grandezze. Da questa tabella si vede come le approssimazioni pitagoriche siano migliori di quelle “naturali”. Nota 3.2 La costruzione formale dei numeri razionali segue fedelmente la loro introduzione pratica tradizionale. Questo è l’unico caso in cui ció avviene, e aiuterà la fantasia del lettore a capire bene anche le altre costruzioni in cui, come nel caso dei numeri interi, la costruzione matematica e l’impostazione pratica differiscono. In effetti, la costruzione matematica dei razionali introduce coppie appartenenti all’insieme Z × N0 , fra le quali è definita la relazione di equivalenza (a, b) ∼ (c, d) se e solo se ad = bc. Ma allora, nella coppia (a, b) ri riconosce sotto mentite spoglie la frazione a/b e il trucco è subito svelato. Con queste definizioni, si applicano tutte le considerazioni viste nella Sezione 3.1 e relative all’estensione degli insiemi numerici. Teorema 3.1 La relazione m/n ∼ m′ /n′ è una relazione di equivalenza. Prova: La proprietà riflessiva afferma che ogni frazione deve essere equivalente a sé stessa; qui dovremmo avere m/n ∼ m/n, ma in effetti questo significa mn = mn, il che è senz’altro vero. La proprietà simmetrica parte supponendo che sia m/n ∼ m′ /n′ , cioè mn′ = m′ n; da questo dovremmo dedurre m′ /n′ ∼ m/n, cioè m′ n = mn′ , che però è valido grazie alla proprietà simmetrica dell’uguaglianza. Infine, se supponiamo m/n ∼ m′ /n′ ed m′ /n′ ∼ m′′ /n′′ , cioè mn′ = m′ n e m′ n′′ = m′′ n′ , possiamo moltiplicare queste due uguaglianze membro a membro e ottenere mn′ m′ n′′ = m′ nm′′ n′ . Semplificando, per la proprietà di eliminazione del prodotto (v. Sezione 2.3), si ha mn′′ = m′′ n, il che vuol dire m/n ∼ m′′ /n′′ , e Formalmente, una frazione è il rapporto di due nuquesta è proprio la proprietà transitiva. meri interi, il primo detto numeratore e il secondo denominatore, con quest’ultimo diverso da zero. Ad Useremo il seguente risultato: esempio, sono frazioni 3/5, −7/6, 5/(−8), −3/(−1). ′ ′ Convenzionalmente, non si considerano le frazioni che Teorema 3.2 Due frazioni m/n e m /n sono equi′ siano il rapporto di due numeri negativi, che, per la valenti se e solo se esistono due numeri interi k, k ′ ′ ′ ′ regola dei segni, è uguale a un opportuno rappor- tali che mk = m k e nk = n k . to tra numeri positivi. In modo analogo, le frazioni Se le due frazioni sono equivalenti si ha con numeratore positivo e denominatore negativo si Prova: ′ ′ mn = m n, ma è anche nn′ = n′ n e quindi possiamo considerano uguali a quelle analoghe con numerato′ ′ re negativo e denominatore positivo. In altre parole, porre k = n′ e k = n. Viceversa, supponiamo che in mentre il numeratore è un numero intero qualunque, esistano k, k con la proprietà detta; moltiplicando croce le due uguaglianze si ha: mkn′ k ′ = m′ k ′ nk; il denominatore è un intero strettamente positivo. non nullo kk ′ può essere eliminaIl problema che nasce in modo naturale con le fra- il fattore comune ′ ′ zioni è quello della loro uguaglianza. Sappiamo tutti to e quindi mn = m n, e questo significa che le due frazioni sono equivalenti. per esperienza che mezza mela è la stessa quantità di due quarti di mela, cioè 1/2 = 2/4, e quindi la rappresentazione delle frazioni non è unica. A livello intuitivo, vorremmo che per le frazioni valesse la stessa regola che conosciamo per i numeri interi, cioè che due frazioni uguali rimangono tali se le moltiplichiamo o le dividiamo per la stessa quantità diversa da zero. Ad esempio, se m/n = m′ /n′ , vorremmo che questa rimanesse un’uguaglianza quando moltiplichiamo tutto per nn′ ; questo ci darebbe mnn′ /n = m′ nn′ /n, Se abbiamo due frazioni equivalenti e facciamo la scomposizione in fattori primi di numeratori e denominatori, possiamo semplificare i fattori comuni; si ottengono cosı̀ frazioni identiche, nel senso che coincidono tanto i numeratori che i denominatori. Teorema 3.3 Siano m/n ed m′ /n′ due frazioni equivalenti; esiste allora un’unica frazione r/s equivalente alle due frazioni date e tale che MCD(r, s) = 1. 70 Prova: Consideriamo m/n ed eliminiamo eventuali fattori primi comuni a numeratore e denominatore ottenendo cosı̀ la frazione r/s tale che MCD(r, s) = 1. La semplificazione ci assicura che m/n ed r/s sono frazioni equivalenti e quindi esistono due interi h, h′ tali che mh = rh′ ed nh = sh′ . D’altra parte, per l’equivalenza delle frazioni assegnate, devono esiste k, k ′ tali che mk = m′ k ′ ed nk = n′ k ′ . Poiché, dalla divisione fra naturali, si ha m = rh′ /h ed n = sh′ /h, sostituendo si ottiene: rh′ k/h = m′ k ′ , cioè rh′ k = m′ hk ′ , e analogamente sh′ k/h = n′ k ′ , cioè sh′ k = n′ hk ′ . Ma questo significa che r/s è equivalente anche ad m′ /n′ . Quindi frazioni equivalenti si riducono alla stessa frazione r/s, con MCD(r, s) = 1. Vediamo ora che tale frazione è unica. Se ne esistesse un’altra r′ /s′ , essa dovrebbe comunque essere equivalente ad r/s e quindi avremo rs′ = r′ s. Poiché r non divide s, r dovrà dividere r′ , cioè r′ = kr; questo porta a rs′ = rks, cioè s′ = ks; in altre parole, r′ /s′ è la frazione kr/ks; ma dall’ipotesi MCD(r′ , s′ ) = 1 deriva k = 1 e quindi r/s = r′ /s′ . Le frazioni r/s tali che MCD(r, s) = 1 si dicono ridotte ai minimi termini; poiché rappresentano il modo più semplice di scrivere una frazione della propria classe di equivalenza, costituiscono un punto di riferimento preciso e spesso è conveniente rifarsi direttamente a loro. Secondo una vecchia classificazione, le frazioni si dividono in proprie, improprie ed apparenti. Le frazioni proprie sono quelle in cui il numeratore è inferiore al denominatore; queste sono le vere frazioni, nel senso che corrispondono a una parte propria del tutto, come 1/3, 2/5 o 7/10. Frazioni come 7/5 o 9/2 indicano quantità maggiori del tutto, e pertanto si dicono “improprie”; esse possono essere espresse come un numero intero più una frazione propria: 7/5 = 1 + 2/5 e 9/2 = 4 + 1/2; queste espressioni si ottengono eseguendo la divisione intera fra numeratore e denominatore e poi considerando il resto come frazione propria. Infine, una frazione come 6/3 è solo tale in apparenza ed eseguendo la riduzione ai minimi termini si trova come sia equivalente al numero intero 2. Da questo punto di vista, l’insieme delle frazioni è più esteso dell’insieme dei numeri interi, che corrispondono solamente alle frazioni apparenti. Vedremo fra poco come si estende e si formalizza tale osservazione. Quel che ora ci preoccupa è: come si eseguono le operazioni fra frazioni e come si confrontano due frazioni? Abbiamo visto come il confronto e le operazioni siano aspetti essenziali dei numeri naturali e dei numeri interi; vogliamo che sia cosı̀ anche per le frazioni. Consideriamo come emblematici il confronto e l’operazione di addizione. Se dobbiamo sommare 1/4 e 2/5 ci troviamo in imbarazzo perché sembra di voler CAPITOLO 3. NUMERI sommare una mela con due pere: infatti, 1/4 di torta è una certa quantità che possiamo immaginare come una bella fetta; 2/5 di torta li vediamo come due fette, ma ciascuna un po’ più piccola della fetta corrispondente a 1/4. Allora, l’imbarazzo è quello di dover sommare fette grosse con fette piccole. Per vedere le cose da un altro punto di vista, se dovessimo sommare 1/4 e 2/4, l’operazione non risulterebbe difficile, perché le fette sono della stessa grandezza e il risultato sarebbe 3/4 senza dubbio. Allora è importante il seguente procedimento: Algoritmo 3.1 (Stesso denominatore) Ingresso: due frazioni m/n ed m′ /n′ ; Uscita: due frazioni r/s ed r′ /s, equivalenti a quelle date, ma con lo stesso denominatore s; 1. si pone s := mcm(n, n′ ); 2. si pone r := m × s/n; 3. si pone r′ := m′ × s/n; 4. si esce con le due frazioni r/s ed r′ /s. La dimostrazione che r/s ∼ m/n è immediata; infatti, per costruzione, abbiamo r/s = ms/ns e questa frazione è chiaramente equivalente ad m/n. Lo stesso vale per r′ /s ∼ m′ /n′ . Sapendo riportare due frazioni a un denominatore comune, scatta l’osservazione fatta in precedenza: Algoritmo 3.2 (Confronto tra frazioni) Ingresso: due frazioni m/n ed m′ /n′ ; Uscita: “Maggiore”, “Uguale” o “Minore” a seconda che tale sia m/n nei confronti m′ /n′ ; 1. si pone s := mcm(n, n′ ) e si considerano le due frazioni r/s ed r′ /s equivalenti ad m/n ed m′ /n′ , secondo il precedente algoritmo; 2. se r < r′ allora si esce con “Minore”; 3. altrimenti, se r “Maggiore”; > r′ allora si esce con 4. altrimenti (r = r′ ) si esce con “Uguale”. Essendo i denominatori uguali, cioè avendo ridotto le fette della torta a “fettine” delle stesse dimensioni, il numeratore regola il confronto, secondo l’ovvio criterio che la frazione con il maggior numero di fettine è quella più grande. In modo analogo si procede per la somma: Algoritmo 3.3 (Somma di due frazioni) Ingresso: due frazioni m/n ed m′ /n′ ; Uscita: la somma m/n + m′ /n′ ; 1. si pone s := mcm(n, n′ ) e si considerano le due frazioni r/s ed r′ /s equivalenti ad m/n ed m′ /n′ ; 3.2. I NUMERI RAZIONALI 2. si esce col risultato (r + r′ )/s. 71 Teorema 3.4 Siano m/n ed m′ /n′ due frazioni tali che m/n < m′ /n′ . Allora, per ogni altra frazione µ/ν ∼ m/n e µ′ /ν ′ ∼ m′ /n′ , si ha µ/ν < µ′ /ν ′ . La differenza si esegue come l’addizione, per cui non diamo l’algoritmo in modo esplicito. Il prodotto segue la logica delle parti, propria del concetto di Prova: Siano r/s ed r′ /s′ le due frazioni di partenza frazione. Ad esempio, (2/3) × (3/5) significa: ridotte ai minimi termini. Questo significa m = rk, n = sk, m′ = r′ h ed n′ = s′ h. Supponiamo anche • dividere un oggetto in 5 parti e prenderne 3; che le frazioni siano positive (negli altri casi la proavanti nello stesso modo); la • di quello che si ottiene, dividere in 3 parti e va è banale o si porta ′ ′ condizione m/n < m /n equivale a mn′ < m′ n. Per prenderne 2. le uguaglianze viste si ha allora: rks′ h < skr′ h, cioè Ma dividere prima in 5 parti e poi in 3 è come divi- rs′ < sr′ il che significa r/s < r′ /s′ . Poiché il ragiodere l’oggetto in 15 parti; fatto questo, si prendono 2 namento si può invertire, vediamo che m/n < m′ /n′ parti per ognuna delle 3 parti considerate nella prima equivale ad r/s < r′ /s′ . Ma questo si può ripetere ansuddivisione: in definitiva, si prendono 6 parti delle che per µ/ν e µ′ /ν ′ , che si riducono alle stesse frazioni r/s ed r′ /s′ . Quindi la disuguaglianza si trasferisce a 15 della divisione. In generale, abbiamo: tutte le frazioni equivalenti ad m/n ed m′ /n′ , come m m′ mm′ si voleva. × ′ = . n n nn′ Questo teorema ha una dimostrazione noiosa, ma è Se anche le due frazioni sono ridotte ai minimi ter- importante perché ci permette di capire come la defimini, può accadere che il prodotto non lo sia: questo nizione di confronto data in precedenza non dipenda perché ci possono essere fattori a comune tra m ed n′ dalla particolare frazione con cui stiamo lavorando, oppure tra n ed m′ . Può essere allora conveniente ese- ma valga per tutte le frazioni ad essa equivalenti. La guire una semplificazione prima della moltiplicazione, stessa proprietà vale per la somma: come ad esempio in: Teorema 3.5 Siano m/n ed m′ /n′ due frazioni; se 8 4 8 32 20 r/s ∼ m/n e r′ /s′ ∼ m′ /n′ , allora m/n + m′ /n′ ∼ × = × = . 7 15 7 3 21 r/s + r′ /s′ . Concludiamo con la divisione; l’operazione, come Prova: Se r/s ∼ m/n, si ha rn = ms e se si sa, è l’inversa della moltiplicazione, e quindi si ha: r′ /s′ ∼ m′ /n′ è anche r′ n′ = m′ s′ . Moltiplicando la prima uguaglianza per n′ s′ e la seconda per ns, m m′ m n′ mn′ : ′ = × ′ = . si ottiene rnn′ s′ = msn′ s′ e nsr′ n′ = nsm′ s′ . Somn n n m nm′ mando membro a membro si ha rnn′ s′ + nsr′ n′ = Se le due frazioni di partenza sono equivalenti, cioè msn′ s′ +nsm′ s′ , cioè (rs′ +r′ s)nn′ = (mn′ +m′ n)ss′ . mn′ = m′ n, il loro rapporto è 1, come ci si può Ma questo significa: aspettare. rs′ + r′ s mn′ + m′ n r r′ m m′ La relazione di equivalenza m/n ∼ m′ /n′ ci per∼ o + ∼ + ′ ss′ nn′ s s′ n n mette di raggruppare insieme frazioni equivalenti, cioè frazioni che hanno lo stesso significato, come 1/2 che è giusto quello che si voleva. e 2/4. Abbiamo anche visto come si fanno i confronti Questo tipo di dimostrazione può essere esteso al e come si eseguono le operazioni fra frazioni. Formalmente, potremmo considerarci a posto, ma in realtà prodotto, alla differenza e alla divisione. I dettagli il lettore si sarà sentito a disagio per un motivo mol- interessano abbastanza poco, ma quello che vogliamo to profondo: quando ad esempio confrontiamo 2/3 e sottolineare è come, in tutti i casi, frazioni equivalenti 3/5 e, portandoli allo stesso denominatore, confron- si comportino nello stesso modo. C’è quindi qualcosa tiamo di fatto 10/15 e 9/15, ci chiediamo: se fossimo in più della semplice somiglianza formale fra frazioni partiti da due frazioni equivalenti a 2/3 e 3/5, ad equivalenti: c’è addirittura lo stesso significato, nel esempio 20/30 e 27/45, saremmo comunque arrivati senso di comportamento nei confronti delle operazioalla stessa conclusione, e cioè che la prima è maggiore ni. Questo è il vero motivo (e non certo la sola nostra della seconda? Propriamente, per confrontare 20/30 intuizione) che ci porta ad identificare in un concete 27/45 dobbiamo riportare tutto allo stesso deno- to unico tutte le frazioni equivalenti. Pertanto, da minatore 90, e cioè a 60/90 e 54/90: vediamo che questo momento in avanti, come si fa di regola, non il primo è ancora maggiore, ma come assicurarci che diremo più che due frazioni sono equivalenti, ma adquesto vale per tutte le infinite frazioni equivalenti a dirittura uguali, e useremo il segno = invece del segno 2/3 e 3/5? Vale il seguente: ∼. 72 CAPITOLO 3. NUMERI Definizione 3.3 Un numero razionale è la classe di oggi. Fino al 1600 non si ebbe idea della rappretutte le frazioni fra loro equivalenti. L’insieme dei sentazione decimale delle frazioni, se si eccettuano i numeri razionali si indica con Q. Babilonesi, che anche in questo furono precursori di concezioni moderne. Come le cifre prima del punto Anche se ormai ci dovremmo essere abituati, questa decimale indicano multipli di potenze del 10, cosı̀ le è una definizione ben strana, visto che afferma cosı̀ cifre dopo il punto decimale denotano multipli di pocategoricamente che una classe (cioè un insieme) è tenze di 1/10. Pertanto 154.327 sta a rappresentare un numero. Ma ormai sappiamo che la Matematica il numero: è ricca di queste apparenti incongruenze e le consi2 7 3 derazioni e le prove precedenti ci assicurano che il + 2 + 3; 1 × 102 + 5 × 10 + 4 + 10 10 10 confronto e le quattro operazioni sono ben definite in Q, perché non dipendono dal particolare elemen- come si sa, la prima cifra dopo il punto indica i decito scelto per eseguire il confronto o l’operazione. Di mi, la seconda i centesimi, la terza i millesimi, e cosı̀ fatto, il senso della definizione è proprio questo: è in- via all’infinito, anche quando mancano nomi specifici differente considerare una qualsiasi delle frazioni che di riferimento; tuttavia, tutti sappiamo cosa signifistanno in una certa classe; il risultato di un confronto ca 3/1035 e quale posto la cifra 3 occuperebbe in un o di un’operazione sarà sempre lo stesso, cioè sarà in- numero di cui tale frazione facesse parte. dipendente da quel particolare valore che scegliamo, Partendo da una frazione specifica, ad esempio o siamo costretti a scegliere, all’interno della classe. 24/7, il numero decimale ad esso corrispondente si Spesso, come si sa, si preferisce avere a che fare con trova eseguendo la divisione decimale, o, secondo l’ule frazioni ridotte ai minimi termini, ma si tratta solo so, la divisione tout-court, quando si chiami, come di una questione di convenienza, data dal fatto che già detto, divisione intera la divisione che produce un una frazione ridotta ai minimi termini ha il numera- quoziente intero e un resto. L’esecuzione della divitore e il denominatore più piccoli fra le frazioni equi- sione avviene in modo analogo a quanto visto nell’alvalenti, cioè nella stessa classe. Cosı̀ preferiamo 2/3 goritmo della divisione intera, solo che quando sono a 52/78 o a 4354/6531, ma se confrontiamo quest’ul- esaurite le cifre della parte intera del dividendo, si tima frazione con 1/2, troviamo che essa è maggiore, mette il punto decimale al quoziente e si continua, esattamente come lo è 2/3. abbassando o calando le cifre decimali del dividendo Concludiamo dimostrando una delle proprietà im- (se ce ne sono) o la cifra 0, quando quelle manchino o portanti dei numeri razionali. I numeri interi costi- siano esaurite. Qui riportiamo la divisione di 24 per tuiscono un insieme numerico discreto, tale cioè che 7: tra due interi consecutivi, diciamo 5 e 6, esiste un 7 2 4 “vuoto”, ovvero un intervallo nel quale non esistono 3 0 3. 4 2 6 5 7 1 numeri interi. Per i razionali questo non è vero, e vale 2 0 invece: 6 0 Teorema 3.6 (di densità) Se q1 < q2 sono due 4 0 numeri razionali qualsiasi, esiste sempre un numero 5 0 q ∈ Q tale che q1 < q < q2 . 1 0 3 Prova: Basta considerare la semisomma q = (q1 + q2 )/2, che gode chiaramente della proprietà Teorema 3.7 Se due frazioni m/n ed m′ /n′ sodesiderata. no equivalenti, allora esse corrispondono allo stesso numero decimale. Come vedremo nella Sezione 3.5, i numeri reali hanno una propriet ancora più forte, detta continuità. Prova: Come osservato a suo tempo, un rapporto La proprietà dei razionali appena dimostrata si dice non cambia se moltiplichiamo o dividiamo dividendo invece densità e si esprime con la frase: “i numeri e divisore per una stessa quantità diversa da 0. Ma se razionali sono densi”. r/s è la frazione ridotta ai minimi termini equivalente 3.3 I numeri decimali ad m/n, tale sarà anche per m′ /n′ . Quindi m/n, m′ /n′ e r/s devono dare lo stesso risultato quando si divide numeratore per denominatore onde ottenere il corrispondente numero decimale. Come s’è detto, le frazioni hanno un’origine antichisLa divisione potrebbe continuare, determinando sima, dovuta alla loro natura intuitiva e fondamentalmente pratica. Curiosamente, gli Egizi rappresenta- spesso (come nel caso dell’esempio precedente) uno vano le frazioni in modo analogo a quanto facciamo sviluppo infinito del numero decimale: 3.3. I NUMERI DECIMALI Teorema 3.8 Sia m/n una frazione e sia r/s ∼ m/n la stessa frazione ridotta ai minimi termini. Se il denominatore s contiene solo i fattori 2 e 5, allora la frazione corrisponde a un numero decimale finito. 73 insieme; e vale anche per l’insieme C dei numeri complessi che noi tratteremo solo superficialmente, e che verrà approfondito nei corsi universitari. Fissiamo allora uno di questi insiemi e chiamiamo “successione numerica” una regola che ad ogni elemento di N Prova: Sia s = 2i 5j , con i e j eventualmente 0, associa uno ed uno solo degli elementi dell’insieme ma non entrambi. Sia k il massimo tra i e j, e numerico fissato. Ad esempio, se la regola associa a 0 moltiplichiamo r ed s per 2k−i 5k−j . Allora si ha: lo stesso numero 0, ad 1 il numero 2, a 2 il numero 4, k−i k−j k−i k−j a 3 il 6, e cosı̀ via, ciò che otteniamo è la successione r×2 ×5 r×2 ×5 r = = dei numeri pari. s 2k × 5k 10k Formalmente , una successione è una funzione f : e questo, come sappiamo, è un numero decimale con N → K, dove K è un opportuno insieme numerik cifre dopo il punto decimale. co. Convenzionalmente, l’immagine f (k) si scrive fk 3 e l’intera successione si denota come {fk }k∈N . La Come esempio consideriamo 77/250 = 77/(2 × 5 ) = 2 3 3 successione: 77 × 2 /(2 × 5 ) = 308/1000 = 0.308. L’importante caso alternativo è il seguente: x0 = 0, x1 = 1, x2 = 4, x3 = 9, x4 = 16, x5 = 25, . . . Teorema 3.9 Sia m/n una frazione e sia r/s ∼ m/n la stessa frazione ridotta ai minimi termini. rappresenta chiaramente la successione dei quadrati, Se s contiene fattori diversi da 2 e da 5, allora la il cui elemento generico sarà scritto xk = k 2 e la frazione corrisponde a un numero decimale periodico. successione nel suo insieme {xk }k∈N = {n2k }k∈N . Un altro esempio è dato dalla successione: Prova: Si immagini di effettuare la divisione decimale fra r ed s; come visto, ad ogni passaggio dob1 2 3 4 x0 = 0, x1 = , x2 = , x3 = , x4 = , . . . biamo stabilire quante volte s sta in un numero che 2 3 4 5 termina per 0; questo è divisibile per s soltanto se s contiene fattori 2, 5 e nessun altro. Quindi, s non il cui elemento generico è xk = k/(k + 1), cioè, glosarà mai un divisore dei numeri con i quali viene con- balmente, {xk }k∈N = {k/(k + 1)k }k∈N . Una succesfrontato, ma ciò significa che il numero decimale che sione molto famosa, e che abbiamo già incontrato, è man mano si ottiene non può essere finito. D’altra quella di Fibonacci (vedere Nota 2.7): parte, i possibili resti che si hanno nella divisione soF0 = 0, F1 = 1, F2 = 1, F3 = 2, F4 = 3, F5 = 5, no solo 1, 2, . . . , s−1, quindi dopo al più s−1 passaggi si avrà la ripetizione di un resto; da quel momento in F6 = 8, F7 = 13, . . . poi i resti si ripeteranno nello stesso ordine e quindi il numero sarà periodico. nella quale ogni elemento (a partire da F2 ) è dato dalL’esempio precedente della frazione 24/7 è signifi- la somma dei due che lo precedono. Possiamo definire cativo; quando si ottiene il resto 3, che già si era avu- anche successioni arbitrarie, scegliendo casualmente i to, la divisione continuerà con i resti 2, 6, 4, . . . corri- vari elementi; in questo caso, però, non possiamo daspondenti alle cifre del quoziente 4, 2, 8, . . .. Quindi, re una formula esplicita per calcolare il generico eleil periodo è costituito dalle cifre 428571, che si ripe- mento xk . Generalmente, si incontrano successioni teranno un numero infinito di volte. Secondo l’uso, il definite con regole abbastanza semplici e chi ha espeperiodo si denota soprallineando le cifre che lo com- rienza di Excel, un programma di foglio elettronico, pongono, e pertanto scriveremo 24/7 = 3.428571, cosı̀ sa che dando all’elaboratore i primi elementi di una come 1/3 = 0.3, 7/11 = 0.63 e 39/22 = 1.772. Il let- successione, quello cercherà di “indurre” gli elementi tore curioso può divertirsi a trovare (e a confrontare) successivi ipotizzando una regola di formazione che il periodo delle frazioni 1/7, 2/7, 3/7, 4/7, 5/7 e 6/7. sia “abbastanza” semplice. Il concetto che ora vogliamo introdurre è molto imQuando siamo interessati soltanto ai primi elemenportante e riguarda le cosiddette successioni numeri- ti di una successione (x1 , x2 , . . . , xr ), tale sequenza che. Intuitivamente, una successione è una sequenza finita è detta più propriamente progressione. Qui ci ordinata di numeri nella quale si distinguono un pri- occuperemo di due tipi particolari di progressione. Si mo elemento, un secondo elemento, e cosı̀ via. Questo dice progressione aritmetica di ragione q una progresnon spiega granché, per cui cerchiamo di essere più sione il cui primo elemento è un numero qualsiasi x0 e precisi. Consideriamo un insieme numerico; abbiamo ogni altro elemento è ottenuto aggiungendo q a quelgià introdotto N, Z e Q, e su di questi ci baseremo. lo precedente. Pertanto, x1 = x0 + q, x2 = x0 + 2q, Tuttavia, in seguito, introdurremo l’insieme dei nu- x3 = x0 + 3q e cosı̀ via fino ad xr = x0 + rq. La promeri reali R e ciò che diremo ora vale anche per tale gressione aritmetica più semplice è (0, 1, . . . , r), nella 74 CAPITOLO 3. NUMERI S S 2S = x0 = x0 + rq = 2x0 + rq + x0 + q + x0 + (r − 1)q + 2x0 + rq + ··· + ··· + ··· + x0 + (r − 1)q + x0 + q + 2x0 + rq + + + x0 + rq x0 2x0 + rq Tabella 3.1: Somma di una progressione aritmetica quale x0 = 0 e q = 1. Una progressione aritmetica di ragione 3 è (5, 8, 11, . . . , 44) e si può considerare aritmetica anche una progressione costante come (5, 5, . . . , 5), dove x0 = 5 e q = 0. Il risultato più importante relativo alle progressioni aritmetiche riguarda la somma di tutti i suoi elementi: metodo ingenuo di far la somma di tutti gli elementi, l’altro sfruttando la formula del corollario. Discuta poi quale dei due algoritmi è da preferire. Il secondo tipo di progressione che vogliamo considerare è quello delle progressioni geometriche: queste Teorema 3.10 Sia (x0 , x0 + q, x0 + 2q, . . . , x0 + rq) sono definite dalle regole: x0 = 1 e xj+1 = qxj , cioè, una progressione aritmetica; detta S la somma dei a parte x0 , ogni altro elemento della progressione è il prodotto dell’elemento precedente per una quantità q, suoi elementi, si ha: detta la ragione della progressione. Questo significa: x0 + xr r(r + 1)q = (r + 1). S = x0 (r + 1) + x0 = 1, x1 = q, x2 = q 2 , . . . , xr = q r . 2 2 Nel seguito considereremo valori di q > 0; osserviamo esplicitamente che se q > 1 allora gli elementi della progressione vanno crescendo e diventano sempre più grandi al crescere di r. Viceversa, se q < 1 la progressione va decrescendo e i suoi elementi si avvicinano sempre di pù a 0. Invitiamo fin d’ora il lettore a modificare (dimostrandole) le formule successive nell’ipotesi che sia x0 = a 6= 0, e quindi xj = aq j . La quantità più interessante è ancora la somma di Un caso particolarmente importante corrisponde tutti gli elementi della progressione; il risultato è il alla progressione (0, 1, 2, . . . , r): seguente: Prova: Scriviamo gli elementi della progressione da sinistra a destra e poi, al di sotto, da destra a sinistra. Si ha allora la situazione della Tabella 3.1. Sommando termine a termine, nell’ultima riga abbiamo la somma di r + 1 termini tutti uguali a 2x0 + rq = x0 + xr , per cui si trova: 2S = (r + 1)(2x0 + rq) = (x0 + xr )(r + 1). Ricavando S, si ha la formula desiderata. Corollario 3.11 La somma dei primi r numeri Teorema 3.12 Sia (1, q, q 2 , . . . , q r ) una progressiointeri positivi vale: ne geometrica di ragione q 6= 1; allora: 1 + 2 + ··· + r = r(r + 1) . 2 Prova: Basta porre x0 = 0, xr = r e q = 1 nelle formule del teorema precedente. Nota 3.3 Gauss (1777 – 1855) è considerato uno dei più grandi matematici mai esistiti, essendosi interessato di tutti i rami della Matematica e ottenendo ovunque fondamentali risultati. Si dice che quando frequentava la scuola elementare, un giorno il maestro desse alla classe il compito di trovare la somma dei primi cento numeri. Sperava cosı̀ di avere un po’ di tranquillità per potersi dedicare a qualche propria occupazione. Ma dopo appena due minuti Gauss si alzò affermando di aver già risolto il problema. Il maestro, incredulo, gli chiese il risultato, che era naturalmente quello esatto: 5050. Gauss aveva intuito la formula data nel corollario e aveva semplicemente calcolato il prodotto 100 × 101/2 = 50 × 101 = 5050. Il lettore è invitato a scrivere due algoritmi per la somma dei primi r numeri interi: uno applicando il S = 1 + q + q2 + · · · + qr = q r+1 − 1 . q−1 Prova: Consideriamo il prodotto qS = q + q 2 + q 3 + · · · + q r+1 e la differenza qS − S; in questa i termini q, q 2 , . . . , q r si eliminano l’un l’altro e, in conclusione, non rimane che qS − S = q r+1 − 1. Ricavando S da questa equazione si ottiene proprio l’identità desiderata. Si osservi che abbiamo escluso il caso q = 1; la somma sarebbe banale, ma la formula del teorema porterebbe alla forma indeterminata 0/0. Nel caso q = 2, la somma 1 + 2 + 4 + · · · + 128, cioè da 1 a 27 , dà 28 − 1 = 255. Si osservi anche il caso in cui q < 1; ad esempio, ponendo q = 1/2 si ha per r = 10: 1+ 1 1/2048 − 1 1 1 + + ··· + = = 2 4 1024 1/2 − 1 = 1 − 1/2048 1 =2− . 1 − 1/2 1024 75 3.3. I NUMERI DECIMALI Questo numero differisce per meno di un millesimo da 2. Che succede se passiamo ora ad r = 20, o addirittura ad r = 100? La differenza da 2 diventa sempre più piccola. Questa osservazione ci verrà molto utile nelle considerazioni successive. Come abbiamo osservato, ogni frazione corrisponde a un numero decimale, necessariamente finito (se il denominatore contiene solo potenze del 2 e del 5) o periodico. Vogliamo ora affrontare il problema opposto: dato un numero decimale finito o periodico, è vero che questo corrisponde a una frazione, cioè a un numero razionale? La risposta sarà sı̀, e vedremo anche qual è l’algoritmo che, dato il numero decimale, permette di trovare la frazione equivalente. Intanto, la cosa è semplice per i numeri decimali finiti. Cominciamo col dimostrare il seguente teorema sulla divisione per 10: Teorema 3.13 Se la rappresentazione decimale del numero a è dr dr−1 . . . d1 d0 .c1 c2 . . ., allora la rappresentazione di a/10 è dr dr−1 . . . d1 .d0 c1 c2 . . ., cioè a/10 si ottiene spostando il punto decimale di una posizione a sinistra. 1 = 10 = µ 1 1 1+ + . . . + r−1 10 10 ¶ = 1 1 − 1/10r 1 1 = − . 10 1 − 1/10 9 9 × 10r Possiamo osservare che quando r è 10 o 20, questa quantità è molto vicina a 1/9 e, anzi, man mano che r cresce, la vicinanza a 1/9 è sempre più marcata, nel senso che la differenza 1/(9 × 10r ) è praticamente nulla. Se allora consideriamo il numero periodico 1 + 1012 + 1013 + · · · e lo vediamo come la som0.1 = 10 ma di infiniti termini, possiamo immaginare che esso divenga 1/9 in quanto la r è infinitamente grande: la differenza 1/(9 × 10r ) deve diventare 0. Questo ragionamento è plausibile e ha solo l’inconveniente di tirare in ballo quantità infinite: un numero infinito di termini del tipo 1/10r , un r che diviene infinito, un errore che tende ad essere infinitamente piccolo. Ha senso tutto questo? In effetti sı̀, e la riprova sta nel semplice fatto che se partiamo da 1/9 ed eseguiamo la divisione, troviamo appunto 0.111 . . . = 0.1. La conclusione è quindi 0.1 = 1/9, nel senso preciso che l’uguaglianza si può leggere tanto da sinistra verso destra, quanto da destra verso sinistra. Possiamo allora generalizzare questo ragionamento: Prova: Per le proprietà della notazione posizionale, a/10 vale: ´ 1 ³ c1 dr × 10r + · · · + d1 × 10 + d0 + + ··· = Lemma 3.15 Sia (1, q, q 2 , q 3 , q 4 , . . .) una successio10 10 ne di infiniti termini in cui ognuno è ottenuto moltic1 d0 plicando per q < 1 il precedente. La somma S di tutti r−1 + + ··· = dr × 10 + · · · + d1 + 10 102 gli elementi della successione è allora S = 1/(1 − q). e questo, riportato alla notazione decimale, ci dà il Prova: Naturalmente, non sappiamo eseguire una risultato cercato. somma con infiniti termini; arrestiamo allora la sucNaturalmente, la stessa proprietà vale per le divi- cessione al termine q r , ottenendo cosı̀ una progressiosioni per 100, 1000 e cosı̀ via; pertanto un corollario ne geometrica di ragione q.Il Teorema [3.11] ci dice del teorema è: che la somma Sr (l’indice r serve a ricordarci che ci siamo fermati al termine q r ) è: Corollario 3.14 Se un numero decimale finito ha k cifre dopo il punto decimale, diciamo a = 1 − q r+1 1 q r+1 dr dr−1 . . . d1 d0 .c1 . . . ck , allora a è equivalente alla Sr = = − . 1−q 1−q 1−q frazione: dr dr−1 . . . d1 d0 c1 . . . ck . 10k Essendo q < 1, la quantità q r+1 diviene sempre più piccola al crescere di r e tale, perciò, è anche r+1 Quindi, la semplice regola per trasformare a in una q /(1 − q). Man mano quindi che consideriamo frazione è: togliere il punto decimale e dividere per più termini della successione, la differenza di Sr da 10k , se k è il numero delle cifre di a dopo il punto 1/(1 − q) si avvicina a 0 e, in conclusione, possiamo decimale. Pertanto 5.7 = 57/10 e ci possono essere assumere che, per la successione completa, si abbia S = 1/(1 − q). semplificazioni come in 8.375 = 8375/1000 = 67/8. Per affrontare il caso dei numeri decimali non fiSe q = 1/2 come nella sezione precedente, e pensianiti, e quindi periodici, è opportuno partire conside- mo a sommare 1+1/2+1/4+· · ·, intuitivamente comrando progressioni geometriche con ragione q minore prendiamo che la somma totale deve essere 2; questo di 1. Prendiamo il caso q = 1/10 che è quello che ci è in accordo con la formula S = 1/(1 − 1/2) = 2. Nel interessa e cerchiamo la somma della progressione: caso q = 1/10 abbiamo 1+1/10+1/100+· · · = 10/9 = 1, 1. Ma quello che più ci interessa è il seguente 1 1 1 1 + + 3 + ··· + r = risultato: 10 102 10 10 a= 76 CAPITOLO 3. NUMERI Corollario 3.16 Sia r ∈ N, r ≥ 1; allora vale Nell’esempio abbiamo: l’uguaglianza: 1 1 0.57999 . . . = 0.57 + + + ··· = 1 1 1 1 1000 10000 + + + · · · = , 10r 102r 103r 10r − 1 1 = 0.57 + 0.01 = 0.58. = 0.57 + 100 cioè la somma è uguale a una frazione il cui numeratore è 1 e il cui denominatore è costituito da r cifre Questa proprietà ci dice che i numeri con periodo 9 sotutte uguali a 9. no dei doppioni, e quindi possono essere (anzi, devono essere) ignorati. Da questo momento in avanti, quanProva: Basta applicare il lemma precedente: do parleremo di rappresentazione decimale dei numeri, escluderemo, esplicitamente o implicitamente, 1 1 1 + 2r + 3r + · · · = quelle che presentano il periodo 9. r 10 10 10 Un altro passo può ora essere fatto considerando ¶ µ 1 1 1 un numero con una parte intera diversa da 0. Sia = r 1 + r + 2r + · · · = a = dh dh−1 . . . d1 d0 .c1 c2 . . . cr il numero decimale pe10 10 10 riodico che vogliamo considerare; per quanto visto, r 1 1 1 10 = r = ; abbiamo: 10 1 − 1/10r 10r 10r − 1 c1 c2 . . . cr = a = dh dh−1 . . . d1 d0 + questa espressione si semplifica dando quella deside10r − 1 rata. dh . . . d1 d0 × 10r + c1 c2 . . . cr − dh . . . d1 d0 Questo corollario ci dice che il numero periodi= . 10r − 1 co 0.01 equivale alla frazione 1/99 essendo 0.01 = 1/100 + 1/10000 + · · ·. L’estensione a un numero del La quantità dh dh−1 . . . d1 d0 × 10r + c1 c2 . . . cr è semplicemente la sequenza delle cifre che compongono a, tipo 0.c1 c2 . . . cr è immediata: senza il punto decimale e senza la soprallineatura del 0.c1 c2 . . . cr = periodo; pertanto possiamo dire che a equivale a una frazione cosı̀ composta: c1 c2 . . . cr c1 c2 . . . cr c1 c2 . . . cr = + + + ··· = r 2r 3r 10 10 10 • il numeratore si ottiene sottraendo le cifre della c1 c2 . . . cr parte intera dal numero composto di tutte le cifre = 10r − 1 di a senza punto decimale e soprallineatura; cioè, il numero periodico 0.c1 c2 . . . cr equivale a una • il denominatore è il numero composta da tante frazione il cui numeratore è costituito dalle cifre cifre 9 quante sono le cifre del periodo. c1 , c2 , . . . , cr e il cui denominatore è il numero composto di r cifre 9. Quindi, 0.324 = 324/999 = 12/37, L’ultimo passo è ora quello di considerare un nucome si può verificare direttamente eseguendo la di- mero periodico nella sua forma più generale, con una visione. Un’altra conseguenza del precedente corol- parte intera dh dh−1 . . . d1 d0 , un antiperiodo (cioè la lario riguarda un’anomalia della notazione decima- parte che segue il punto decimale, ma precede il pele, e cioè i numeri che presentano il periodo 9, come riodo) p1 p2 . . . ps , e un periodo c1 c2 . . . cr . Ma se s 0.579999. . .. Precisamente si ha: sono le cifre dell’antiperiodo, abbiamo: Corollario 3.17 Un numero decimale che abbia come periodo 9 è equivalente a un numero decimale finito. Prova: Se il periodo inizia dalla r-esima cifra decimale, esso vale: = 9 10r−1 9 9 9 + r+1 + r+2 + · · · = 10r 10 10 µ ¶ 1 1 9 1 1 + + · · · = r−1 · = r−1 10 102 10 9 10 a= dh dh−1 . . . d1 d0 p1 p2 . . . ps + 10s ´ c1 c2 . . . cr 1 ³ c1 c2 . . . cr + + · · · = 10s 10r 102r c1 c2 . . . cr dh dh−1 . . . d1 d0 p1 p2 . . . ps + s r = = 10s 10 (10 − 1) + = (dh . . . d1 d0 p1 p2 . . . ps × 10r + c1 c2 . . . cr − −dh . . . d1 d0 p1 p2 . . . ps )/(10s (10r − 1)). Di nuovo, dh dh−1 . . . d1 d0 p1 p2 . . . ps × 10r + c1 c2 . . . cr dove abbiamo applicato il corollario precedente. Que- è il numero composto da tutte le cifre di a senza il sta quantità, sommata alla parte non periodica, dà un punto decimale e la soprallineatura. Possiamo perciò chiudere questa sezione con il classico: numero decimale finito. 77 3.4. I NUMERI REALI Algoritmo 3.4 (Conversione in frazione) Ingresso: a = dh dh−1 . . . d1 d0 .p1 p2 . . . ps c1 c2 . . . cr , dove s può anche essere 0; Uscita: La frazione equivalente ad a, ridotta ai minimi termini. 1. si assegna a t il numero naturale costituito da tutte le cifre di a, senza punto decimale e senza soprallineatura, cioè: t := dh dh−1 . . . d1 d0 p1 p2 . . . ps c1 c2 . . . cr ; 2. si assegna ad f il numero naturale costituito dalle cifre della parte intera e dell’eventuale antiperiodo di a, cioè: f := dh dh−1 . . . d1 d0 p1 p2 . . . ps ; 3. ν := t − f ; 4. si assegna a δ il numero costituito da r cifre 9 (tante quante sono le cifre del periodo), seguite da s cifre 0 (tanta quante sono le cifre dell’antiperiodo; se s = 0 l’antiperiodo manca e le cifre 0 non vengono generate); 5. µ := MCD(ν, δ); 6. se µ 6= 1, poniamo ν := ν/µ e δ := δ/µ; 7. i numeri ν e δ costituiscono il numeratore e il denominatore della frazione corrispondente ad a e ridotta ai minimi termini. 3.4 I numeri reali Il teorema e l’algoritmo che hanno concluso la precedente sezione sono di fondamentale importanza per approfondire il nostro concetto di numero. Poiché le frazioni corrispondono ai numeri decimali finiti o periodici, i numeri razionali (cioè le stesse frazioni) non possono esaurire tutti i numeri pensabili. E’ del tutto ovvio che esistono numeri decimali infiniti che non sono periodici, come: ξ = 2.131133111333111133331 . . . e infiniti altri se ne possono concepire sullo stesso schema o su schemi analoghi. Per i Greci, che non avevano una notazione decimale analoga alla nostra, le cose non erano cosı̀ semplici. Essi rappresentavano i numeri come segmenti: fissato un segmento come unità di misura, un numero era semplicemente il rapporto tra un segmento e l’unità di misura, cioè la sua lunghezza. A lungo essi credettero che fosse sempre possibile trovare un sottomultiplo comune tra il segmento e l’unità di misura. Questo equivale a dire che se questo sottomultiplo è la n-esima parte del segmento e la m-esima parte dell’unità di misura, la misura del segmento è il numero razionale n/m. L’esistenza di un sottomutiplo comune era cosı̀ intuitiva che fino ai tempi di Pitagora si pensò che le cose non potessero stare che in questo modo: si diceva che tutte le lunghezze sono commensurabili. Fu dunque uno shock intellettuale notevole quando qualcuno (un discepolo di Pitagora, se non Pitagora stesso) dimostrò che esistono lunghezze incommensurabili, cioè per le quali non esiste alcun sottomultiplo comune con il segmento fissato come unità di misura, per quanto piccolo possiamo immaginare tale sottomultiplo. Le grandezze che provocarono questa rivoluzione furono il lato e la diagonale del quadrato √ e questo, nei nostri termini, vuol dire che il numero 2 non è un numero razionale. I Pitagorici erano riuniti in una setta dalle regole molto rigide e non divulgavano i loro segreti. Si racconta che a rivelare la scoperta delle grandezze incommensurabili fu Ippaso di Metaponto, che poi abbandonò la setta. I suoi ex compagni, com’era l’uso in questi casi, gli eressero una stele funeraria per dire che per loro Ippaso era morto. Qui diamo la classica dimostrazione per assurdo, notando che essa vale per la radice quadrata di un qualsiasi numero che non sia un quadrato perfetto: √ 2 non è un numero Teorema 3.18 Il numero razionale. √ Prova: Supponiamo per assurdo che 2 sia un numero razionale, e cioè esista una frazione m/n = √ 2, che possiamo supporre ridotta ai minimi termini. Elevando al quadrato si ha: m2 /n2 = 2, cioè m2 = 2n2 . Il fattore 2, presente a destra, deve essere presente anche a sinistra, cioè m deve essere divisibile per 2, diciamo m = 2k. L’identità diventa 4k 2 = 2n2 , ovvero 2k 2 = n2 . Questo significa, però, che 2 deve essere anche un fattore di n, il che contraddice l’ipotesi che m/n fosse ridotta ai minimi termini, cioè che m√ ed n fossero primi tra di loro. √L’ipotesi che fosse 2 = m/n è quindi assurda e 2 non può essere razionale. Nota 3.4 I numeri reali sono più numerosi dei numeri naturali. Questa affermazione può essere considerata banale se si osserva, come s’è fatto, che N ⊂ R; è meno banale se si ritorna alla teoria di Cantor e al fatto che la frase significa: non esiste alcuna corrispondenza biunivoca tra N ed R. Questo è vero, come fra poco vedremo, ma la dimostrazione non è affatto banale. Intanto, abbiamo introdotto, dopo N, gli insiemi numerici Z e Q, ma è facile vedere che essi sono numerabili. La dimostrazione è in pratica già stata effettuata nel primo capitolo, ma può tornare utile rivederla nel caso specifico. Se consideriamo Z come l’unione di numeri positivi e negativi, cioè l’unione disgiunta di due 78 CAPITOLO 3. NUMERI insiemi numerabili, possiamo scrivere esplicitamente la corrispondenza biunivoca con N: 0 ↔ 0, 4 ↔ −2, 1 ↔ 1, 5 ↔ 3, 2 ↔ −1, 6 ↔ −3, 3 ↔ 2, . ... Anche Q può essere visto come il prodotto cartesiano Z × N0 , cioè di due insiemi numerabili; la corrispondenza biunivoca, limitata a Q+ è la seguente, derivata da quella schematizzata nella Figura 1.3: 1/1 ↓ 1/2 1/3 ↓ 1/4 2/1 ↑ 2/2 → ← 2/3 ← → 2/4 → → 3/1 ↓ 3/2 ↓ 3/3 3/4 → → 4/1 ↑ 4/2 ↑ 4/3 ↑ 4/4 E’ facile vedere che la corrispondenza funziona, a maggior ragione per il fatto che le frazioni sono “di più” dei numeri razionali. Quando si arriva ai numeri reali le cose si complicano, ma Cantor riuscı̀ a dimostrare che la cardinalità di R è maggiore di ℵ0 con una prova che costituisce un’altra pietra miliare nella tecnica matematica. Essa è nota come diagonalizzazione di Cantor ed è stata più volte utilizzata per dimostrare risultati importanti in vari settori della Matematica e della Logica formale. Vediamo in che cosa consiste e come si dimostra che c > ℵ0 . Intanto, una semplice dimostrazione geometrica permette di stabilire che un qualsiasi segmento è equipotente a tutta la retta, cioè, in termini numerici, che un intervallo aperto (a, b) è in corrispondenza biunivoca con R. A P B Y X C r X ′ C ′ Y ′ Sia r la retta e, spezzato il segmento AB di modo che A, B, C siano equidistanti dal punto P ed A, B giacciano sulla parallela ad r passante per P , è facile vedere che la proiezione da P (che ad X, Y fa corrispondere X ′ , Y ′ ) è una corrispondenza biunivoca. Allora, è sufficiente dimostrare che l’insieme dei numeri reali nell’intervallo [0, 1) (immaginiamo che lo 0 sia presente; questo semplifica il ragionamento e non cambia sostanzialmente la corrispondenza che abbiamo visto) ha cardinalità maggiore di N0 perché la tesi c > ℵ0 sia provata. Supponiamo che tale corrispondenza esista e scriviamola, esprimendo i numeri reali in forma decimale: 1 2 3 4 ··· ↔ ↔ ↔ ↔ ↔ 0.d1,1 d1,2 d1,3 d1,4 . . . 0.d2,1 d2,2 d2,3 d2,4 . . . 0.d3,1 d3,2 d3,3 d3,4 . . . 0.d4,1 d4,2 d4,3 d4,4 . . . ··· Nell’intervallo [0, 1) i numeri hanno tutti la forma 0.d1 d2 d3 . . . e quindi di,j indica la j-esima cifra del numero reale corrispondente al numero naturale i. In questo elenco devono essere compresi tutti i numeri dell’intervallo, altrimenti la corrispondenza non sarebbe biunivoca. Costruiamo ora un numero reale x = 0.x1 x2 x3 . . . con la seguente regola: xi deve essere diverso da di,i e da 9. Il numero x sta nell’intervallo [0, 1) ed è un numero decimale legale visto che, per costruzione, non può avere periodo 9. Quindi deve essere uno dei numeri dell’elenco. Tuttavia, non può essere il corrispondente di 1 perché x1 6= d1,1 ; non può essere il corrispondente di 2 perché x2 6= d2,2 , e cosı̀ via, non può essere il corrispondente di n perché xn 6= dn,n . Quindi x non si trova nell’elenco, il che è assurdo e prova che la corrispondenza biunivoca ipotizzata non può esistere. Conclusione: c > ℵ0 . Come detto nella Sezione 1.4, si sa che c = ℵ1 , cioè i numeri reali sono tanti quanti i sottoinsiemi di N. Il fatto che i numeri reali siano cosı̀ numerosi ha molte interessanti applicazioni. Ad esempio, gli elementi dell’insieme R\Q si dicono numeri irrazionali, e poiché Q è numerabile, ne consegue che i numeri irrazionali hanno cardinalità c, cioè sono più numerosi dei razionali. Un’altra categoria di numeri che è facile contare è costituita dai numeri algebrici: questi sono definiti come le soluzioni reali delle equazioni algebriche, cioè delle equazioni polinomiali a coefficienti razionali, ovvero a coefficienti interi, poiché a queste ci si riduce sempre dalle prime moltiplicando per il denominatore comune (v. Sezione 5.2 per varie affermazioni che stiamo facendo in questa Nota). Tutti i numeri razionali m/n sono algebrici, in quanto soluzione del√ l’equazione nx − m = 0. Anche tutte le radici k m sono numeri algebrici se k, m ∈ N; sono infatti soluzione dell’equazione di grado k: xk − m = 0. Sono numeri algebrici anche le espressioni più complicate che comprendono radicali di numeri razionali, come p p √ √ 3 (3 + 5/2 − 4 7)/ 2 − 5 2 e anche numeri che non sappiamo esprimere come radicali. E’ noto infatti che le equazioni di grado superiore al quarto non sono in generale risolubili per radicali. Quindi, i numeri algebrici sono tantissimi; tuttavia, ogni equazione di grado k ha al più k soluzioni reali e possiamo procedere in questa maniera per dimostrare che i numeri algebrici sono una quantità numerabile. Cominciamo con l’osservare che le equazioni algebriche di primo grado sono numerabili: esse hanno la forma ax + b = 0 e quindi sono tante quante le possibili coppie ordinate (a, b) di numeri interi, che però già sappiamo essere numerabili. Perciò, i numeri algebrici 79 3.4. I NUMERI REALI di primo grado (cioè le soluzioni delle corrispondenti equazioni algebriche) sono numerabili. Passando alle equazioni di secondo grado, come ax2 +bx+c = 0 possiamo immaginarle come coppie (a, bx + c) di numeri e di equazioni algebriche di primo grado. Quindi anch’esse sono numerabili e poiché i numeri algebrici di secondo grado sono al più il doppio delle corrispondenti equazioni, anch’essi costituiscono un insieme numerabile. Aggiunto al precedente, come sappiamo fin dal primo capitolo, ci dà ancora un insieme numerabile. Possiamo allora ripetere il ragionamento per le equazioni algebriche di terzo grado ax3 + bx2 + cx + d = 0, viste come coppie (a, bx2 + cx + d), e provare che i numeri algebrici di primo, secondo e terzo grado sono una quantità numerabile. Procedendo nella stessa maniera si arriva alla conclusione preannunciata, e cioè che tutti i numeri algebrici costituiscono un insieme numerabile. I numeri non algebrici si dicono trascendenti e possiamo ora affermare che essi costituiscono un insieme di cardinalità c. E’ stato dimostrato che π = 3.14159 . . ., il rapporto tra la circonferenza e il diametro di un cerchio, ed e = 2.71828 . . ., la base dei logaritmi naturali, sono numeri trascendenti. Anche tante altre proprietà di questi numeri sono ben note, ma noi, naturalmente, qui ci dobbiamo fermare. Se tentiamo di forzare la nostra logica finita per indulgere, come spesso si fa, a considerazioni che coinvolgono l’infinito, possiamo dare la seguente: Pseudodefinizione: si intende per numero pseudoreale un numero intero D, seguito da un punto, detto punto decimale, seguito da infinite cifre decimali che non siano definitivamente tutte uguali a 9. Per l’uso del punto decimale si veda il punto 6 dell’Introduzione. Come abbiamo appena detto, “definitivamente” significa “da un certo momento in poi”, senza ulteriore specificazione del punto del quale si parla. Abbiamo già visto che senso ha la condizione sul 9; notiamo invece esplicitamente che non si vieta che le cifre possano essere definitivamente tutte uguali a 0: questa situazione corrisponde ai numeri decimali finiti. Il punto debole di questa definizione, ciò che la rende una semplice pseudodefinizione, è il tentativo di voler attualizzare il concetto di infinito, parlando di “infinite cifre” dopo il punto decimale. Questo non ha molto senso e dobbiamo preferire una definizione che faccia uso solo dell’aspetto potenziale dell’infinito. Ad esempio, si potrebbe modificare la pseudodefinizione e parlare di una corrispondenza (nel senso del primo Capitolo) che associa ad ogni posizione decimale (cioè dopo il punto) una cifra ben definita. Cosı̀, associando ad ogni posizione la cifra 5, e definendo la parte intera come 3, si ha il numero 3.555 . . ., corrispondente al numero razionale 3.5 = 32/9. Associando invece alle cifre di posto p (p numero primo) la cifra 2 e a quelle di posto p non primo la cifra 3 (la parte intera sia 1) , si ottiene il numero 1.22232323332 . . ., irrazionale perché i numeri primi non presentano alcun tipo di periodicità. Questa impostazione, però, presenta diversi inconvenienti. Ad esempio, lega la definizione a una specifica base, il 10, il che è chiaramente limitativo, se non addirittura scorretto. Ci obbliga a cercare associazioni che funzionano cifra per cifra: questo può essere molto complicato come nel caso del numero ξ visto in precedenza (provare per credere), o molto limitativo, come per il numero 0.12345678910111213 . . .. Ad onor del vero, se non ci leghiamo a regole che funzionano cifra per cifra, questo metodo permette di definire i numeri reali computabili, come sono trattati nella teoria della Computabilità. Purtroppo, questi numeri hanno la cardinalità del numerabile e quindi non comprendono tutti i numeri reali. Nota 3.5 La notazione decimale dei numeri reali estende quella dei numeri razionali, vista nella sezione precedente. Ma mentre tutti i numeri razionali hanno anche una rappresentazione finita, data dalla frazione corrispondente, ciò non succede per i numeri irrazionali. Come abbiamo visto, possono esistere regole (o leggi) di carattere finito che determinano la successione delle cifre decimali; altre volte esistono regole (o leggi o algoritmi) che determinano tante cifre √ decimali quante se ne vogliono, come succede per 2 e per π (si vedano le Sezioni 3.6 e 6.7). Si pone allora il problema di dare la migliore rappresentazione finita di un numero reale. Di solito, sulla carta o nella memoria di un elaboratore, si lavora con un certo numero di cifre (la precisione); per semplicit‘a d’esempio, supponiamo di fare i nostri conti con quattro cifre decimali. Questo significa che dobbiamo ignorare la quinta cifra e le cifre successive, creando un’approssimazione della quantità considerata. Se semplicemente troncassimo il numero alla quarta cifra, avremmo dei problemi man mano che si procede con i conti. Tali approssimazioni per difetto, infatti, tenderebbero ad accumularsi, creando errori sempre più consistenti. Si operano allora approssimazioni per difetto e per eccesso secondo una regola precisa: 1. se la quinta cifra decimale è 0, 1, 2, 3, 4, il numero viene troncato alla quarta cifra; 2. se la quinta cifra decimale è 5, 6, 7, 8, 9, la quarta cifra viene incrementata di 1 (ciò si può riflettere anche sulle cifre precedenti). In questo modo, avremo il 50% di approssimazioni per difetto, secondo il caso 1, e il 50% per eccesso, secondo il caso 2. Ad esempio: 3.14159 . . . 3.14153 . . . 3.14197 . . . → → → 3.1416 3.1415 3.1420 In questo modo, gli 0 finali diventano significativi; continuando l’esempio, il numero 3.142 indica il 80 CAPITOLO 3. NUMERI numero razionale finito 3.142, mentre 3.1420 indica l’approssimazione di un numero (razionale o reale) con almeno quattro cifre decimali. Queste regole si ritrovano in Fisica; se una costante è specificata come 4.2, vuol dire che di essa si conosce una sola cifra decimale: Se è specificata come 4.2000, significa che si conoscono quattro cifre decimali e si sa che le ultime tre sono 000 (o anche 1999, e la cifra successiva è alta, 8 o 9 pur non essendo ancora nota). Vedremo nella prossima sezione una costruzione sensata dei numeri reali e giustificheremo il fatto che tale costruzione è consistente con la pseudodefinizione appena data. Qui, analogamente a quanto abbiamo fatto per i numeri naturali, dedichiamo un po’ di tempo alla rappresentazione dei numeri reali e alla loro conversione da una base all’altra. Dato un numero decimale dk dk−1 . . . d1 d0 .c1 c2 c3 . . ., rappresentazione e conversione della parte intera dk dk−1 . . . d1 d0 sono già state considerate e quindi possiamo limitarci alla parte decimale 0.c1 c2 c3 . . .. Come per la parte intera, il caso più semplice si ha partendo con un numero 0.c′1 c′2 c′3 . . . scritto in base b e cercandone la conversione in base 10. Anche questa volta basta applicare la regola posizionale, cioè il fatto che il numero considerato è, per definizione: A sinistra abbiamo ottenuto un numero (in base b) la cui parte intera è c′1 e la cui parte decimale è 0.c′2 c′3 . . .. Questo deve corrispondere al valore di destra, e in particolare la parte intera di b × 0.c1 c2 c3 . . . deve coincidere con c′1 . In altre parole, la cifra b-aria c′1 è data dalla parte intera del prodotto b × 0.c1 c2 c3 . . .. Iterando questo processo, si ottengono via via le altre cifre c′2 , c′3 , . . .. Tutto ciò è descritto dal seguente: Algoritmo 3.5 (Conversione in base b) Ingresso: un numero decimale C = 0.c1 c2 c3 . . . e due numeri naturali b, n > 0; Uscita: le prime n cifre del numero equivalente C ′ = 0.c′1 c′2 c′3 . . . in base b; 1. si pone i := 1;; 2. si pone c′i uguale alla parte intera di b × C; 3. si ridefinisce C come la parte decimale dello stesso prodotto b × C; 4. si incrementa i di 1; 5. se i ≤ n si torna al passo 2., altrimenti si è finito. Questo algoritmo, naturalmente, funziona qualunque sia il numero n, determinando n cifre del risultato; occorre stare attenti al numero delle cifre di C + + + ···. 0.c′1 c′2 c′3 . . . = b per non correre il rischio di perdere precisione a causa E’ quindi sufficiente eseguire i vari conti; ad esempio, delle varie moltiplicazioni. In effetti, se C è razionale, si può utilizzare la frazione equivalente, invece del per 0.6427 si ha: valore decimale. Consideriamo, come primo esempio, 6 4 2 la trasformazione di 0.944 in base 7; si procede cosı̀: 0.642 = + 2 + 3 = 0.944606413. 7 7 7 0.944 × 7 = 6.608 Può essere questo il momento di osservare che la 0.608 × 7 = 4.256 proprietà dei numeri razionali di corrispondere ai nu0.256 × 7 = 1.792 meri decimali finiti o periodici, non è limitata alla 0.792 × 7 = 5.544 base 10, ma vale in generale, come si capisce dalle di0.554 × 7 = 3.808 mostrazioni delle sezioni precedenti: basta sostituire ··· la base b alla base 10. La finitezza può essere interpretata come la presenza di un periodo 0, e questo Si ha pertanto 0.94410 = 0.64153 . . .7 , e dallo svilupci fa capire che un numero finito in una base b può po ottenuto si capisce facilmente che si otterrà un essere un numero periodico in un’altra base b′ , e vi- numero periodico. La frazione 1/3 in base 5 si scrive: ceversa. Qui abbiamo visto che 0.642, finito in base 1/3 × 5 = 5/3 = 1 + 2/3 7, diviene periodico in base 10. Nessuna meraviglia. 2/3 × 5 = 10/3 = 2 + 1/3 Per la conversione inversa, osserviamo quanto se1/3 × 5 = 5/3 = 1 + 2/3 gue; sia 0.c1 c2 c3 . . . un numero decimale (in base ··· 10) e sia 0.c′1 c′2 c′3 . . . il suo equivalente in una base b qualsiasi. Avremo pertanto: La prima frazione propria che si ripete, innesca il calcolo di un periodo, e quindi si ha: c′1 c′2 c′3 + 2 + 3 + · · · = 0.c1 c2 c3 . . . . b b b 1 = 0.310 = 0.135 . 3 Moltiplicando ora i due membri per b: c′1 c′1 + c′2 b2 c′3 b3 c′2 c′ + 23 + · · · = b × 0.c1 c2 c3 . . . . b b Il lettore è invitato a fare altri esempi e, in particolare, ad usare la base 2, per capire bene cosa fa 3.5. LA COSTRUZIONE DEI NUMERI REALI 81 proporre costruzioni di R che fossero concettualmente semplici, ma rigorose da un punto di vista formale. Tutte queste proposte, per ciò che si è detto, coinvolgono oggetti matematici “infiniti”, cioè strutture contenenti un numero infinito di numeri razionali. Emblematico, a questo proposito, è il metodo delle sezioni di Dedekind, nel quale un numero reale è l’insieme di tutti i numeri razionali che gli sono minori (o uguali); questo, automaticamente, definisce anche l’insieme dei numeri razionali che gli sono maggiori, e questi due insiemi costituiscono √ una sezione di Q. • dalla mantissa 1100010011001 . . ., con un nu- Ad esempio, il numero irrazionale 2 è dato da: mero di bit legato all’hardware e alle istruzioni + 2 dell’elaboratore (spesso 32, 64 o più); Q− 0 ∪ {q ∈ Q | q < 2}; un elaboratore elettronico. All’interno di questo, un numero come 12.3 è rappresentato nel modo seguente. Prima di tutto, l’elaboratore converte il numero in binario secondo il precedente algoritmo, ottenendo 1100.01001. In secondo luogo, divide questo numero per un’opportuna potenza di 2, in modo da portare l’1 più a sinistra come prima cifra dopo il punto decimale. Nell’esempio corrente, dividendo per 24 si ha 0.1100010011001. Il numero è univocamente rappresentato: • dall’esponente 4 cui occorre elevare il 2 per naturalmente, l’uguaglianza può essere considerata riportare la mantissa all’effettivo valore del soltanto se il numero reale da definire è, di fatto, un numero. numero razionale. Il metodo delle sezioni è abbastanza intuitivo; se, Si osservi che tanto la mantissa quanto l’esponente come facevano i Greci e facciamo anche noi nella Geopossono essere negativi; il numero scritto come coppia metria Analitica, pensiamo ad R come ad una retta, (mantissa, esponente) si dice normalizzato. un numero reale r è individuato dalle due semirette in cui il punto corrispondente ad r divide la retta stessa. Questo implica la scelta sulla retta di un punto di 3.5 La costruzione dei numeri origine, di un verso (positivo) e di una unità di misura, seconda la quale r risulta la misura del segmento reali determinato dal punto e dall’origine fissata. In effetNelle sezioni precedenti abbiamo visto come i numeri ti, i Greci identificavano il concetto di numero reale interi possano essere “costruiti” a partire dai nume- con quello della misura (in particolare, la misura delri naturali, e come i numeri razionali si costruiscano le lunghezze), e da ciò derivava la loro idiosincrasia dai numeri interi. Le due costruzioni si assomiglia- per i numeri negativi. Nel metodo delle sezioni, dono abbastanza: 1) si considerano coppie di elementi vremmo immaginare la retta come costituita solo dai dell’insieme numerico di partenza; 2) su tali coppie si punti razionali, sui quali fondare poi i numeri reali. definisce una relazione di equivalenza; 3) si definisco- Per questo, l’impostazione geometrica lascia perplesno le quattro operazioni di base e il confronto in modo si ed è meglio affrontare il problema da un punto di da essere compatibili con la relazione di equivalenza; vista puramente numerico, come di fatto fa il metodo 4) si osserva infine che un sottoinsieme dell’insieme delle sezioni. cosı̀ costruito è identificabile con (è isomorfo a) l’inD’altra parte, il metodo delle sezioni non sembra sieme di partenza. Quest’ultima affermazione signi- avere un aggancio pratico consistente. Se vogliamo fica che, effettuata l’identificazione, il risultato delle “usare” un numero reale (per sommarlo, confrontarlo, operazioni e dei confronti è lo stesso, sia nell’insieme etc.) la sua sezione è ben poco utile, anzi ci impaccia di partenza, sia nel sottoinsieme dell’insieme definito. perché introduce troppi numeri razionali, la maggioQueste costruzioni avvengono in termini finiti, cioè ranza dei quali nulla hanno a che vedere col numero tutte le definizioni coinvolte operano su espressioni stesso. Ad esempio, i numeri −3,√1/2 e 127/343 apfinite, ovvero le coppie che sono gli oggetti costituti- partengono tutti alla sezione di 2, ma √ questo non vi dell’insieme costruito. Questo, in modo intuitivo, ci è molto utile quando lavoriamo con 2. Preferiagiustifica il fatto che tanto Z quanto Q non vanno al mo pertanto un altro metodo che ci pare più consono di là del numerabile. ad un uso effettivo e che, comunque, mantiene quelPur ribadendo un procedimento già visto nella Se- la dote di intuibilità che caratterizza il metodo delle zione 3.1, la costruzione dei numeri reali non può es- sezioni. Alla fine di questa sezione, comunque, risere altrettanto semplice. Come abbiamo osservato torneremo a considerare il metodo delle sezioni (ci si nella Nota 3.4, la loro cardinalità è maggiore del nu- perdoni il bisticcio). merabile, e questo significa che una costruzione “fiRiprendiamo il concetto di sequenza o successione nita”, fatta di coppie o di terne di numeri razionali, già introdotta nella Sezione 3.3. Formalmente, posnon è ragionevolmente possibile. A partire dalla se- siamo specificare che in questa sezione considerereconda metà del 1800, i matematici hanno cercato di mo solo successioni di numeri razionali, cioè funzioni 82 CAPITOLO 3. NUMERI a : N → Q, per le quali si usa scrivere ak invece di a(k), come per le altre funzioni. Spesso, una successione si indica con la notazione {ak }k∈N e possiamo dare la seguente: infatti il nostro avversario virtuale fissa ǫ = 1/1000, ci basta considerare l’elemento 2.131 (m = 3) e osservare che ogni altro elemento è minore di 2.132, per essere sicuri che le differenze |an − a3 | sono tutte minori di ǫ. Se poi costui fissasse come ǫ un miDefinizione 3.4 Una successione (di numeri raziolionesimo, è sufficiente prendere l’elemento 2.131133 nali) {ak }k∈N si dice di Cauchy se assegnato un nu(m = 6), per assicurarsi che tutti i successivi elementi mero razionale positivo ǫ (piccolo quanto si vuole), sono a distanza minore di ǫ da questo am . Quindi, la è possibile determinare un indice m ∈ N tale che, successione è di Cauchy. qualunque sia n > m, si abbia |an − am | < ǫ. Questa definizione è, riconosciamolo, abbastanza astrusa e non è banale capirla di primo acchito. Cerchiamo allora di spiegare informalmente il suo significato per arrivare ad afferrarne, infine, il senso logico. Una successione di Cauchy è, nelle nostre intenzioni, una sequenza di numeri razionali i cui valori si vanno concentrando sempre di più. Questo significa due cose: primo, che questi numeri razionali si avvicinano tra di loro man mano che l’indice della successione cresce, e secondo che tutti (almeno da un certo punto in poi) rimangono tra di loro a una distanza limitata. Purtroppo, queste due condizioni coinvolgono un numero infinito di elementi della successione: quelli che vanno “da un certo punto in poi”, e questo è difficile da tenere sotto controllo con i nostri mezzi disgraziatamente finiti. Abbiamo già trovato questa difficoltà quando abbiamo voluto esprimere il concetto che i numeri naturali sono infiniti (v. Nota nella Sezione 1.4); abbiamo allora introdotto il criterio della scommessa, un metodo per parlare di infinito potenziale che ci evita l’introduzione, surrettizia o meno, dell’infinito in atto. Intuitivamente, il restringersi e il limitarsi dei valori della successione significa che la distanza fra due elementi qualsiasi (purché abbastanza avanti nella sequenza) diviene sempre più piccola. Facciamo perciò la seguente scommessa contro un ipotetico avversario: la successione è data e siamo sicuri che essa è di Cauchy; se il nostro avversario sceglie un numero (chiamiamolo ǫ), piccolo quanto vuole, un millesimo, un milionesimo o anche un miliardesimo, noi siamo capaci di trovare una posizione nella nostra successione (diciamo, m), tale che tutti gli elementi successivi differiscono da am per meno di ǫ. E’ chiaro che se ci riusciamo per valori piccoli di ǫ, a maggior ragione ci riusciamo per valori grandi. Pertanto, la specifica “piccolo quanto si vuole” non ha funzione logica, ma solo psicologica e potrebbe essere cancellata (l’abbiamo messa, almeno, tra parentesi!). Facciamo un semplice esempio; si consideri la successione: 2 2.1 2.131133 2.13 2.131 2.1311331 2.1311 2.13113 2.13113311 ... la cui legge di formazione dovrebbe essere chiara. Essa è formata da numeri decimali finiti, cioè da elementi di Q, e il criterio della scommessa funziona bene. Se Nota 3.6 I primi elementi della successione possono essere scelti anche a caso e presentare ampie variazioni. Ciò vuol dire, semplicemente, che dobbiamo spostare in avanti il nostro indice m che ci assicura la vincita della scommessa. L’importante è che, da un certo momento in poi (cioè dopo m), si verifichi e si possa accertare la vicinanza di tutti gli an ad am . Come si dice, vogliamo che la differenza |am − an | sia minore dell’ǫ avversario definitivamente, cioè per tutti gli infiniti valori di n maggiori di m. Vogliamo anche osservare che gli elementi della successione possono andare crescendo, come nell’esempio precedente, ma possono anche decrescere o oscillare: l’unica condizione essenziale è che non si allontanino più di ǫ da am . Naturalmente, il criterio della scommessa ha senso se possiamo “dimostrare” che esso vale realmente. Per questo è essenziale conoscere la regola (o legge) di formazione della successione. In situazioni come quella dell’esempio, ci si accorge, o si sa, che la prima parte del numero rimane invariata e ad ogni passo si aggiunge un decimale ulteriore. Questa è la ben nota regola del valori per difetto di una certa quantità, e analoga è la regola del valori per eccesso. Più avanti vedremo di generalizzare queste regole, ma il loro significato è ben noto, e son proprio esse a permetterci di valutare un numero reale (che per ora, ricordiamo, non abbiamo ancora definito propriamente). Un punto delicato è il seguente. Si potrebbe pensare che se gli elementi di una successione si avvicinano sempre di più l’uno all’altro, allora la successione sia sicuramente di Cauchy. In altre parole, più formalmente, si potrebbe sostituire al criterio di Cauchy la condizione che per ogni n > m si debba avere |an+1 − an | < ǫ, una condizione che potrebbe essere più semplice da verificare. Purtroppo, questo non è vero, come si prova col semplice esempio che stiamo per fare, e la condizione di Cauchy va espressa come l’abbiamo definita, senza ulteriori semplificazioni. L’esempio concerne i numeri armonici, cioè i numeri definiti dalla relazione: Hn = 1 + 1 1 1 + + ... + ; 2 3 n i primi elementi sono H1 = 1, H2 = 3/2, H3 = 11/6, H4 = 25/12, e cosı̀ via.; convenzionalmente, si pone H0 = 0. Gli elementi della successione {Hk }k∈N si avvicinano sempre di più, dal momento che Hn+1 − Hn = 1/(n + 1), ma dimostriamo che essa cresce oltre ogni limite: 3.5. LA COSTRUZIONE DEI NUMERI REALI Teorema 3.19 Se H2k è il 2k -esimo numero armonico, allora H2k > 1 + k/2 e quindi la successione dei numeri armonici non è limitata. 83 ad r, cosı̀ che possiamo affermare che la successione “definisce” r; sfrutteremo tra poco questa proprietà intuitiva. Prima di tutto, facciamo vedere che esiste almeno un numero pseudoreale r con la proProva: Consideriamo ad esempio: prietà desiderata. Si consideri ǫ = 10−(k+1) e sia am l’elemento della successione di Cauchy per il quale 1 1 1 1 1 1 1 + + + + + + H8 = H 23 = 1 + |am − an | < 10−(k+1) , qualunque sia n > m. Que2 6 {z 7 8} |{z} |3 {z 4} |5 sto significa che an coincide con am per tutte le cifre decimali (oltre ovviamente alla parte intera) fino ale sommiamo i 2k−1 elementi compresi tra 1/(2k−1 +1) la k-esima compresa. Definiamo, in questo modo, la e 1/2k . Si tratta ovviamente di 2k−1 termini, ognuno parte intera e le prime k cifre di r. A questo punto si dei quali è maggiore di 1/2k . La loro somma è pertanha |an − r| < 10−k e quindi il criterio della scommesto maggiore di 1/2, e quindi, oltre all’1 iniziale, H2k volta che il nostro avversario è composto di k gruppi, ognuno dei quali vale almeno sa si può applicare ogni −k abbia posto ǫ = 10 . Che poi tale r sia unico, di1/2. Da questo discende l’affermazione del teorema. scende dall’osservazione che se r′ 6= r godesse delle stesse proprietà, dovrebbe esistere un indice k per il I numeri armonici costituiscono una successione quale la k-esima cifra dopo il punto decimale relativa importante e perciò avremo modo di incontrarli di ad r è diversa dalla k-esima cifra di r ′ . Si ha allora nuovo in queste note. |r − r′ | > 10−(k+1) . D’altra parte, per definizione, posto ǫ = 10−(k+1) , esistono due indici m ed m′ per i quali si ha |r − an | < ǫ e |r′ − an | < ǫ, qualunque A questo punto, possiamo cercare di aiutare la no- sia n maggiore del più grande fra m ed m′ . Poiché stra intuizione portando avanti, e distinguendo accu- il valore assoluto di una somma è sempre minore o ratamente, sia un discorso rigoroso sulla natura dei uguale alla somma dei valori assoluti, segue: numeri reali, sia un discorso meno rigoroso, ma più suggestivo, su come possiamo pensare a tali nume|r − r′ | = |r − an − (r′ − an )| ≤ ri. Riprendiamo il concetto di numero pseudoreale ≤ |r − an | + |r′ − an | < ǫ + ǫ < 10−k . introdotto nella precedente sezione. Come osservato per ξ = 2.131133 . . ., aggiungere una cifra decima- Questa disuguaglianza contraddice quanto avevamo le alla volta ci permette di ottenere una successione trovato in precedenze, rivelando che l’esistenza di due di Cauchy che definisce il numero per difetto. Pos- valori distinti r ed r′ non è possibile. siamo immaginare altre successioni di Cauchy, come A questo punto, possiamo essere ragionevolmente la sequenza delle approssimazioni (decimali) per eccesso, e vedremo più avanti il caso del calcolo della convinti che ogni successione di Cauchy determina radice quadrata col metodo di Newton e il calcolo un numero (pseudo)reale; come osservato, il viceverdi π col metodo della media aritmetico/geometrica. sa è ovvio e quindi l’identificazione dei due concetti Comunque, i metodi di questo genere portano a par- si presenta del tutto naturale (almeno per un mateticolari successioni di Cauchy, quelle appunto in cui ǫ matico). Dobbiamo però superare un ultimo ostacoè esplicitamente suggerito essere della forma 10−m e lo: ogni successione di Cauchy determina un unico gli elementi della successione aumentano di una o più pseudoreale, ma a questo possono corrispondere più cifre decimali alla volta. Tanto vale, allora, definire successioni; ad esempio, una successione di valori per le successioni di Cauchy in termini generali e rigorosi difetto e una per eccesso. Definiamo allora: e usarle poi per la definizione dei numeri reali come Definizione 3.5 Due successioni di Cauchy la vedremo tra breve. {ak }k∈N e {bk }k∈N si dicono equivalenti se per ogni Per sottolineare meglio il rapporto tra le succesǫ razionale positivo, esiste un indice m tale che per sioni di Cauchy e la pseudodefinizione precedente, ogni n > m si abbia: |an − bn | < ǫ. insistiamo dimostrando il seguente: Pseudoteorema: Per ogni successione di Cauchy Si osservi prima di tutto che, a differenza di quanto {ak }k∈N esiste uno ed un solo numero pseudoreale r abbiamo fatto nella prova del precedente pseudoteotale che, fissato un qualsiasi numero razionale ǫ po- rema, la differenza an −bn è fatta tra numeri razionali, sitivo, esiste almeno un indice m tale che, qualunque e quindi ha perfettamente senso. La definizione è insia l’indice n > m, si ha che an differisce da r per tuitivamente chiara: due successioni sono equivalenti meno di ǫ. se si avvicinano sempre di più quando le confrontiamo Prova: Si osservi che lo pseudoteorema è un mo- termine a termine. Anche qui applichiamo strategido complicato di dire che gli elementi della successio- camente il criterio della scommessa: le due successione si accumulano definitivamente sempre più vicino ni si avvicinano se, fissato ǫ piccolo ad arbitrio dal 84 CAPITOLO 3. NUMERI nostro avversario, riusciamo a stabilire che ogni differenza |an − bn | è definitivamente minore di tale ǫ. Questo è evidente, ad esempio, quando si considerano le approssimazioni per difetto e per eccesso di un numero reale. Il punto importante è, comunque, che siamo di fronte a una relazione di equivalenza, come il nome suggerisce: poiché operazioni e confronto sono parte essenziale della nostra idea intuitiva di numero. Cominciamo con la somma: dati due numeri reali r ed s come classi di equivalenza [{ak }k∈N ] e [{bk }k∈N ], la loro somma è definita come r + s = [{ak + bk }k∈N ]. Affinché questa definizione abbia senso, occorre dimostrare tre cose: • la proprietà riflessiva si riduce a |an − an | = 0 < ǫ, il che è banale; 1. che la sequenza {ak + bk }k∈N è una successione di Cauchy, altrimenti saremmo fuori dell’ambito dei numeri reali come li abbiamo appena definiti; • la propietà simmetrica è anch’essa ovvia poiché |an − bn | = |bn − an | e se l’uno è minore di ǫ, tale è anche l’altro; • la proprietà transitiva è un po’ più complessa; siano {ak }k∈N , {bk }k∈N e {ck }k∈N tre successioni tali che la prima sia equivalente alla seconda e questa alla terza. Fissato ǫ, cerchiamo un indice m per cui |an − bn | < ǫ/2 (per ogni n > m) e un indice m′ per cui |bn − cn | < ǫ/2 (per ogni n > m′ ). Se ora M è il più grande fra m ed m′ , per ogni n > M si ha: |an − cn | = |an − bn + bn − cn | ≤ 2. che la definizione di somma è indipendente dalle successioni scelte a rappresentare la classe, altrimenti la somma non sarebbe compatibile con la relazione d’equivalenza e l’operazione non sarebbe più sotto controllo; 3. che se r ed s corrispondono a due numeri razionali r′ ed s′ allora la somma r + s come classe d’equivalenza di successioni di Cauchy coincide con il numero razionale r′ + s′ ; questo permette di concludere che i numeri reali sono davvero un’estensione dei numeri razionali che già conosciamo. ǫ ǫ + = ǫ, 2 2 Fissato ǫ > 0 dal nostro avversario, siano m e p i valori per cui, rispettivamente, si ha |am − an | < ǫ/2 e questo ci dà l’equivalenza tra la prima e la terza per ogni n > m, e |bp − bn | < ǫ/2 per ogni n > p. successione. Poniamo M al valore del più alto fra m e p, cosı̀ che Possiamo finalmente dare la vera definizione: si ha: |(aM + bM ) − (an + bn )| ≤ Definizione 3.6 Si dicono numeri reali le classi di equivalenza delle successioni di Cauchy secondo la ǫ ǫ ≤ |aM − an | + |bM − bn | < + = ǫ. precedente relazione. 2 2 ≤ |an − bn | + |bn − cn | < Intuitivamente, supponiamo che una successione di Cauchy determini un numero pseudoreale r e che un’altra successione, equivalente alla prima, determini un altro numero pseudoreale r′ . Per l’equivalenza delle successioni deve essere r = r′ e quindi tutte le successioni di una classe determinano lo stesso numero pseudoreale. Astraendo, possiamo finalmente lasciar perdere i numeri psudoreali, che essendo “pseudo” ci sono ora di impaccio e basta, e consideriamo, secondo la definizione, un numero reale come la classe di tutte le sequenze di Cauchy equivalenti tra di loro. Se una persona riesce a superare lo shock derivato dal fatto che un numero reale è una classe di successioni di Cauchy, si rende conto che la definizione è perfettamente corretta, formalmente accettabile e semanticamente utile e ineccepibile. Come abbiamo osservato fin dal principio, la definizione di numero reale non conclude il nostro lavoro: occorre ora far vedere che anche le quattro operazioni di base e il confronto sono compatibili con tale definizione ed estendono le analoghe operazioni sui razionali. In mancanza di questo, tutto verrebbe a cadere, Per dimostrare che la somma è indipendente dalle particolari successioni {ak }k∈N e {bk }k∈N che abbiamo considerato, sia {a′k }k∈N equivalente a {ak }k∈N , e {b′k }k∈N equivalente a {bk }k∈N . Fissato un ǫ > 0 arbitrario, siano m ed m′ tali che |a′n − an | < ǫ/2 per ogni n > m, e |b′n − bn | < ǫ/2 per ogni n > m′ ; per ogni n più grande del maggiore tra m ed m′ si ha allora: |an +bn −(a′n +b′n )| ≤ |an −a′n |+|bn −b′n | < ǫ ǫ + =ǫ 2 2 che prova l’equivalenza della somma delle diverse successioni. Infine, se r ed s sono razionali, esiste fra le successioni della classe di equivalenza di r la successione costante i cui elementi sono tutti uguali ad r′ , il razionale che identifichiamo con il numero reale r. La stessa cosa vale per s se anch’esso è razionale. Si vede allora facilmente che la somma di r ed s come numeri reali, data dalla successione costante r′ + s′ viene ad essere identificata proprio con il numero razionale r′ + s′ . (Consigliamo di seguire almeno due volte questo ragionamento). 85 3.5. LA COSTRUZIONE DEI NUMERI REALI Esattamente nello stesso modo si procede per la differenza. Per quanto riguarda il confronto, un ovvio risultato è che dati due numeri reali r ed s per mezzo di due successioni di Cauchy {ak }k∈N per r e {bk }k∈N per s, essi sono uguali se e solo se definiscono la (o appartengono alla) stessa classe di equivalenza. Analogamente semplice è osservare che r > s oppure r < s se e solo se la successione delle differenze [{ak − bk }k∈N ] è definitivamente composta di elementi positivi oppure è definitivamente composta di elementi negativi. La moltiplicazione richiede un ragionamento più delicato. Siano r ed s due numeri reali definiti come sopra e si consideri il prodotto definito da rs = [{ak bk }k∈N ]. Per la limitatezza delle due successioni di Cauchy prese a rappresentare r ed s, esistono due numeri razionali, chiamiamoli a e b, che sono maggiori (in valore assoluto) rispettivamente di tutti gli elementi di {ak }k∈N e di tutti gli elementi di {bk }k∈N . Fissato ǫ positivo (ma comunque piccolo) sia m l’indice corrispondente alla relazione |am − an | < ǫ/(2b) (per ogni n > m) e p l’indice per cui |bp −bn | < ǫ/(2a) (per ogni n > p). Sia ora M il più grande fra m e p; per ogni n > M si ha allora: |aM bM − an bn | = |aM bM − an bM + an bM − an bn | = = |(aM − an )bM + an (bM − bn )| ≤ ≤ |aM − an | |bM | + |an | |bM − bn | < ǫ ǫ b+a = ǫ. 2b 2a Questo dimostra che la successione che definisce il prodotto di r per s è una successione di Cauchy, quindi non rimane che provare come la definizione sia indipendente dalle due successioni scelte. A questo punto il lettore dovrebbe aver capito come si procede in modo formale e quindi ci rifiutiamo di procedere oltre con sviluppi in buona parte scontati. Lo stesso lettore, invece, è vivamente consigliato di riprendere foglio e matita (se per caso li avesse riposti: male, male!) e impegnarsi a portare avanti tutti i passaggi necessari. Se poi r ed s sono razionali, la compatibilità dei risultati è di nuovo ovvia. Per quanto riguarda la divisione, conviene prima definire l’operazione per il calcolo dell’inverso, cioè s−1 = 1/s, e quindi osservare che r/s = rs−1 . Anche per l’inverso dobbiamo dimostrare tutti e tre le condizioni viste per la somma. Se il numero reale s 6= 0 è definito dalla classe [{ak }k∈N ], dobbiamo supporre (senza per questo venir meno alla generalità dei nostri ragionamenti) che tutti gli elementi della successione siano diversi da 0; ha allora senso definire la successione {1/ak }k∈N e assumerne la classe di equivalenza come il numero reale s−1 . Ci limiteremo ora a dimostrare la prima condizione, e cioè che la nuova successione non esce dall’ambito delle successioni di Cauchy; lasciamo poi che il lettore si cimenti a dimostrare che la definizione è indipendente dalla successione scelta e che essa è compatibile con l’operazione di inverso nei numeri razionali. Sia a 6= 0 un numero razionale maggiore, in valore assoluto, a tutti i numeri della successione {ak }k∈N ; tale numero esiste per la limitatezza della successione. Fissato ǫ > 0 a piacere, determiniamo un indice m per il quale |am − an | < a2 ǫ per tutti gli n > m; si ha allora: ¯ ¯ ¯ ¯ ¯ 1 1 ¯¯ ¯¯ am − an ¯¯ |am − an | a2 ǫ ¯ = ≤ − < =ǫ ¯ am an ¯ ¯ am an ¯ a2 a2 e questo conclude il nostro lavoro. Le successioni di Cauchy, come abbiamo appena visto, costituiscono un metodo, astratto ma effettivo, di definire i numeri reali. Il nostro insistere sulle approssimazioni per difetto e per eccesso non riveste un aspetto casuale: spesso, la determinazione di un numero reale eseguita valutando un numero sempre maggiore di cifre decimali (anche una alla volta) può essere una procedura effettiva ed anche efficiente. Altre volte, il numero è “isolato” valutando un intervallo di numeri razionali che lo contiene, e ad ogni passo l’intervallo viene dimezzato: si hanno cosı̀ ancora approssimazioni per difetto e per eccesso, ma invece di determinare una cifra decimale, si determina una cifra binaria dopo l’altra; in definitiva, non c’è poi una grande differenza. Come abbiamo detto, accanto a questi metodi ne esistono altri che permettono di valutare più cifre alla volta: capito il procedimento, in linea di principio tutti i metodi vanno bene, ma si possono avere comportamenti molto diversi dal punto di vista dell’efficienza del calcolo. L’idea di poter identificare l’insieme dei numeri reali R con la retta della Geometria, ha portato alle√seguenti considerazioni. Si torni per un attimo a 2, che non è razionale per il Teorema 3.18. Possiamo allora dividere l’insieme Q in due parti disgiunte: + 2 Q< = Q− 0 ∪ {q ∈ Q | q < 2} Q> = {q ∈ Q+ | q 2 > 2}. Chiaramente, Q< ∪ Q> = Q e Q< ∩ Q> = ∅; d’altra parte, per il citato teorema, Q< non ha alcun elemento massimo e Q> non ha alcun elemento minimo. Questo ricorda un po’ la proprietà degli interi di essere “discreti”, anche se il buco fra Q< e Q> è per cosı́ dire infinitesimo, e non vasto come quello tra 5 e 6. Nella retta R della Geometria tali buchi proprio non esistono e quindi, se vogliamo che R possa essere identificato con R, dobbiamo escludere che si verifichi un fenomeno come quello dei razionali. Per essere più specifici, definiamo sezione di Q ogni coppia (Q1 , Q2 ) tale che: i. (∀q1 ∈ Q1 ) e (∀q2 ∈ Q2 ) 86 CAPITOLO 3. NUMERI si abbia q1 < q2 ; ii. Q1 ∪ Q2 = Q; iii. Q1 ∩ Q2 = ∅. Come abbiamo accennato all’inizio di questa sezione, il metodo di Dedekind definisce i numeri reali come sezioni dell’insieme dei numeri razionali; in particolare, una sezione (Q1 , Q2 ) di Q corrisponde a un numero razionale se Q1 ha elemento massimo (oppure se Q2 ha elemento minimo, ma convenzionalmente questo caso non si considera). Di conseguenza, i numeri irrazionali corrispondono alle sezioni di Q in cui Q1 non ha massimo e Q2 non ha minimo. Se ora, in modo analogo a quanto fatto per Q, definiamo le sezioni in R, quest’ultimo caso non si deve verificare, per non creare quella sorta di buco che si diceva, e ciò si pone come assioma: Assioma (di continuità) Sia (R1 , R2 ) una sezione di R. Allora R1 ha un elemento massimo oppure R2 ha un elemento minimo. √ − 2 Nel caso di 2, definendo √ R1 = R ∪{x ∈ R | x ≤ 2}, allora R1 possiede 2 come elemento massimo, mentre definendo R1 = R− ∪ {x ∈ R | x2 < 2} si fa sı̀ che R2 venga a contenere l’elemento massimo √ 2. L’assioma afferma che non vi possono essere altri √ modi per dividere R nel punto corrispondente a 2. Questo concetto di continuità ha un ruolo molto importante nel concetto di limite, e lo ritroveremo appunto quando affronteremo tale argomento nella Sezione 8.4. Ad esso è legato il concetto di intervallo: Definizione 3.7 Si dice intervallo di estremi a, b ∈ R l’insieme di tutti i numeri reali x tali che a ≤ x ≤ b. Propriamente, questo si dice un intervallo chiuso, in quanto comprende i suoi estremi, e si indica con la notazione [a, b]. Si dice invece intervallo aperto l’insieme dei numeri reali x tali che a < x < b, che non comprende perciò gli estremi a e b; tale intervallo si indica con (a, b). Si usano anche intervalli misti come [a, b), chiuso a sinistra e aperto a destra, e (a, b] aperto a sinistra e chiuso a destra. 3.6 Potenze, radici, logaritmi I numeri reali sono l’ambiente ideale per parlare di potenze e, quindi, delle loro operazioni inverse, le radici e i logaritmi. Abbiamo già introdotto queste operazioni per i numeri naturali, e come questi si sono estesi agli interi, ai razionali e ai reali, cosı̀ lo stesso tipo di estensione deve essere fatta per le potenze. Intanto, la base di partenza rimane la stessa e se r ∈ R, n ∈ N, si definisce: ½ 0 r =1 rn+1 = r · rn . se q è un numero razionale, q = n/m, cosa vuol dire rq = rn/m ? E se infine s è un numero reale, ha senso una potenza come rs , e, se ha senso, qual è il suo valore? Cominciamo con i numeri interi, dei quali ci interessano i negativi, visto che i positivi coincidono con i naturali e le potenze con tali esponenti sono state definite un attimo fa. Per i numeri reali vale la stessa regola vista per i naturali: rm+n = rm rn ; la dimostrazione è esattamente la stessa. Naturalmente, se estendiamo le potenze agli esponenti negativi, vogliamo che questa regola continui a valere, altrimenti dovremmo considerare proprietà diverse per due operazioni che, invece, vorremmo vedere come una sola. Pertanto vogliamo che sia: rm r−m = rm+(−m) = r0 = 1; ma questo significa che r−m è l’inverso di rm , cioè, in termini di numeri reali, deve essere r−m = 1/rm . Questa è una buona definizione e conferma cose che già ci sono note: abbiamo visto che per i numeri naturali abbiamo k m−n = k m /k n se m ≥ n; interpretando k come numero reale, questo significa k m−n = k m (1/k n ), proprio la regola appena vista, anche se limitata a k ∈ N ed m ≥ n. Questo è molto confortante. Visto il successo con i numeri negativi, poniamoci il problema di definire cosa significa rm/n , cominciando col supporre m, n > 0. Anche qui ricordiamo che per i numeri naturali vale la regola (k m )n = k mn , che naturalmente vogliamo conservare. Dovrà essere allora (rm/n )n = rnm/n = rm , e in particolare (r1/n )n = r1 = r. Questa condizione ci fa venire in mente come, per definizione, il numero che elevato alla potenza n-esima ci dà r è ciò che si chiama la√radice n-esima di r: ma allora deve essere r1/n = n r. Per i numeri naturali eravamo condizionati dal fatto che r doveva essere una potenza n-esima perfetta. Qui, tra i numeri reali, questa condizione non è più necessaria e ogni numero reale positivo può essere visto come potenza n-esima perfetta, come vedremo ora con un esempio. E’ bene osservare esplicitamente che la cosa non è vera per i numeri reali negativi; −4 non può essere un quadrato perfetto, poiché il quadrato di un numero reale è sempre una quantità positiva. Allora vediamo che 2, come numero reale, è un cubo perfetto, cioè è il cubo di un qualche numero reale. Applichiamo quanto detto nella sezione precedente: si comincia con l’osservare che 13 < 2 < 23 e quindi √ 3 1 < 2 < 2, il che ci dà una prima approssimazione √ per difetto e per eccesso di 3 2. Possiamo migliorare l’approssimazione provando successivamente per 1.1, 1.2, 1.3, . . . ; si trova facilmente anche a mano 1.13 = 1.331, 1.23 = 1.728, 1.33 = 2.197. Qui √ ci posMa se l’esponente non è un numero naturale, ci chie- siamo arrestare e abbiamo trovato 1.2 < 3 2 < 1.3. diamo, possiamo dare un significato alla potenza? Ad Cerchiamo di migliorare ancora trovando l’approssiesempio, se k < 0 è un intero, cosa significa rk ? E mazione a meno di un centesimo; osservando dai de- 87 3.6. POTENZE, RADICI, LOGARITMI √ cimali che 3 2 è più vicina a 1.3 che a 1.2, proviamo a partire da 1.25, 1.26, . . . . Anche questa volta si 3 3 ha subito √1.25 = 1.953125, 1.26 = 2.000376, per cui 1.25 < 3 2 < 1.26. Come si vede dal cubo, 1.26 è un’approssimazione già molto √ buona e infatti con un qualsiasi calcolatore si trova 3 2 ≈√1.2599210498, cioè l’errore che si commette ponendo 3 2 = 1.26 è minore di un decimillesimo. A questo punto possiamo definire ogni potenza che ha come esponente un numero razionale n/m; si ha √ n n/m 1/m n m infatti: r = (r ) = ( r) = (rn )1/m = √ m rn . Poiché m è un intero positivo ed n è un intero qualsiasi, entrambe le operazioni di elevamento a potenza e di radice sono ben definite. Osserviamopesplicitamente che se n è negativo, si ha: rn/m = m 1/r|n| . L’ultimo passo consiste nel definire rs quando s sia un numero reale qualsiasi, cioè, in pratica, sia un numero irrazionale. Intanto, se s è negativo, per essere coerenti con quanto affermato fin ora, dobbiamo porre: rs = 1/r|s| . Supponiamo allora che s sia positivo e consideriamo due successioni {s′i }i∈N e {s′′i }i∈N di numeri razionali (la prima crescente e la seconda decrescente) che determinano s, cioè lo approssimano per difetto e per eccesso. Sappiamo calcolare ′ ′′ rsi e rsi e quindi possiamo ottenere approssimazioni per difetto e per eccesso di rs , la cui differenza ′ ′′ ′ ′′ ′ rsi − rsi = rsi (1 − rsi −si ) diviene piccola quanto si vuole al crescere di i: infatti, per ipotesi, la differen′′ ′ za s′′i − s′i tende a diventare 0 e quindi rsi −si tende a diventare 1. In questa maniera, rs risulta definito come numero reale. Calcoliamo, come esempio, π π ; come prima approssimazione abbiamo π 3 < π π < π 4 e questi numeri li sappiamo calcolare. Poi abbiamo π 3.1 < π π < π 3.2 e possiamo calcolare anche queste limitazioni in quanto 3.1 e 3.2 sono numeri razionali: qui non ci dobbiamo preoccupare della difficoltà di tali calcoli; quello che ci interessa è l’aspetto teorico dell’approssimazione e non il tempo impiegato ad ottenerla; questo fa parte della complessità degli algoritmi e, tradizionalmente, si chiama “stenaritmia”. Come già detto, andando avanti calcoleremo π 3.14 < π π < π 3.15 , e cosı̀ via, restringendo sempre di più l’intervallo che comprende π π . Nella Tabella 3.2 riportiamo i primi passi, ricordando che si ha π π ≈ 36.4621596072. Le proprietà formali delle potenze, pur cosı̀ estese, rimangono quelle già viste per i numeri naturali, senza più il vincolo delle potenze perfette: rs rt (rs )t r0 r1 0s = = = = = rs+t rst 1 r 0 ma rs /rt rs v s 1s −1 r 00 = = = = = rs−t (rv)s 1 1/r 1 Qui, ricordiamo, le basi r e v sono numeri reali po- sitivi, mentre gli esponenti s e t sono numeri reali qualsiasi, anche negativi. Abbiamo avuto modo di √ osservare come (−3)1/2 = −3 non ha significato dal momento che nessun numero elevato al quadrato può dare un numero negativo come −3. Quindi, in generale, non possiamo prendere in considerazione potenze reali di numeri negativi. Questo naturalmente non vuol dire che, in casi particolari, non abbiano senso anche tali potenze. Infatti, mentre r2k (k ∈ N) è sempre positivo, r2k+1 ha lo stesso segno di r e quindi sono definite √ le radici dispari di numeri negativi. Ad esempio, 3√ −8 = −2, in quanto = −3; ma, in (−2)3 = (−2)(−2)(−2) = −8, e 5 −243 √ 4 −16 (attenzione! modo altrettanto ovvio, non esiste √ scrivere 4 −16 = −4 è uno strafalcione che è opportuno evitare per scansare sacrosante rappresaglie da parte del docente). √ Dalla precedente definizione r1/m = m r, si√ha un’ovvia estensione a tutti i numeri reali: r1/s = s r, che definisce completamente il concetto di radice come operazione inversa dell’elevamento a potenza, quando questa regola si legga da destra verso sinistra. Si hanno allora le seguenti proprietà, conseguenza diretta della definizione e delle proprietà delle potenze: √ √ √ st s r t r = r1/s r1/t = r(s+t)/st = rs+t p √ √ √ √ √ t s s s s ts r r √v = rv r = √ s s 1 = 1 0 = 0 (s 6= 0). La radice che si trova più di frequente è naturalmente la radice quadrata e per questo si sono √ sviluppati algoritmi che permettono il calcolo di r in modo diretto e senza incorrere nelle lungaggini di trovare per tentativi un √ decimale dopo l’altro, come si è fatto per calcolare 3 2. L’algoritmo che viene insegnato è laborioso, ma effettivo: Algoritmo 3.6 (La radice quadrata) Ingresso: un numero reale s = dr dr−1 . . . d1 d0 .c1 c2 . . . e un numero naturale k; √ Uscita: la rappresentazione decimale di s con k cifre decimali; 1. a partire dal punto decimale, si divide la parte intera di s in blocchi di due cifre; la parte decimale è anch’essa divisa in k blocchi, utilizzando 2k cifre decimali, aggiungendo eventualmente alcuni 0 per raggiungere tale numero; 2. sia a il valore del primo blocco a sinistra, cioè a = dr oppure a = dr dr−1 ; si pone come prima cifra del risultato, fr/2 , la massima cifra f tale che f 2 ≤ a; 3. sia ∆ la differenza a − f 2 ; 4. per ogni ulteriore blocco in cui sia stato suddiviso s: 88 CAPITOLO 3. NUMERI π3 π 3.1 π 3.14 π 3.141 π 3.1415 π 3.14159 ≈ ≈ ≈ ≈ ≈ ≈ 31.00628 34.76679 36.39574 36.43743 36.45829 36.46204 < < < < < < ππ ππ ππ ππ ππ ππ < < < < < < 97.40909 38.98339 36.81477 36.47916 36.46246 36.46246 ≈ ≈ ≈ ≈ ≈ ≈ π4 π 3.2 π 3.15 π 3.142 π 3.1416 π 3.14160 Tabella 3.2: Calcolo di π π (a) si considerano le cifre della radice x0 = 1: µ ¶ fr/2 fr/2−1 . . . fj finora ottenute e si 2 3 1 chiama a il doppio del numero da esse 1+ = = 1.5 x1 = 2 1 2 µ ¶ rappresentato; 1 3 17 2 x = = + = 1.41666 2 (b) si abbassa il blocco corrente, nel senso che 2 µ 2 3/2 ¶12 a ∆ si aggiungono le due cifre del blocco 2 577 1 17 + = = 1.4142156 x3 = considerato: ∆ := 100 × ∆ + 10 × dℓ + dℓ−1 ; 2 12 17/12 408 (c) si cerca la massima cifra f tale che (10 × Come si vede, già dopo 3 iterazioni il valore ottenuto a + f ) × f ≤ ∆; tale cifra si aggiunge come è abbastanza buono; la quarta iterazione dà 12 cifre cifra ulteriore del risultato; decimali esatte, e cosı̀ via. Naturalmente, ci accor(d) se ci sono altri blocchi da elaborare, si cicla giamo che il valore ottenuto è buono quando la differenza dal valore ottenuto all’iterazione precedente è tornando al punto 4a); trascurabile. 5. si mette il punto decimale dopo la r/2-esima cifra Il lettore è fortemente invitato a formulare l’algoritdel risultato, e si esce. mo che realizza questo metodo e a scrivere e provare un programma sull’elaboratore. Il metodo può essere L’impostazione dell’operazione è quella della Figu- adottato anche al calcolo delle altre radici, ma per √ ra 3.1, dove si cerca 200 con 3 cifre decimali. L’al- questo rimandiamo all’esposizione generale del megoritmo risale a Fibonacci, ma il metodo più semplice todo di Newton come si trova nei testi di Calcolo 3 ed interessante per trovare la radice quadrata di un Numerico. Invitiamo però il lettore a calcolare √ 2 numero risale ai Babilonesi, anche se oggi è di soli- mediante la formula iterativa: to citato come metodo di√Newton. Sia r un numero ¶ µ 1 r reale e si voglia calcolare r; se x0 è un’approssimaxn+1 = 2xn + 2 3 xn zione di tale radice, è immediato dimostrare questa proprietà: dove r = 2 e x0 = 1. Naturalmente, una espressione aritmetica può conTeorema 3.20 Sia r un numero reale positivo √ √ e sia tenere una o più radici; se queste si trovano a denox0 un’approssimazione di √r. Se x0 < r √allora √ minatore di una frazione, è preferibile eliminarle con r/x0 > r, mentre se x0 > r allora r/x0 < r. una tecnica che è detta √ di razionalizzazione. Si consi√ Prova: √Si consideri il caso x0 < r; se fosse anche deri ad esempio 1/ 3, che risulta di difficile calcolo; √ se moltiplichiamo numeratore e denominatore per 3 r/x0 < r, moltiplicando √ √ membro a membro, avremmo: x0 · r/x0 < r · r, cioè r < r, il che è assurdo. si ottiene: √ √ Analogamente si procede nell’altro caso. 3 1.732 1· 3 1 √ =√ √ = ≈ ≈ 0.577, Stando 3 3 3 3· 3 √ cosı̀ le cose, qualunque sia l’approssimazione x0 di r, se eseguiamo la media: x1 = (x0 + r/x √0 )/2, una forma molto più ragionevole. Se a denominatore questa sarà un’approssimazione migliore a r di c’è una somma o una differenza di radicali quadratici quanto non lo fosse x0 . Possiamo ora applicare iteraconviene procedere in questo modo: tivamente il metodo ad x1 e ottenere un’approssima√ √ zione ancora migliore, e cosı̀ di seguito. Il merito di 2 2( 6 + 2) √ √ = √ √ √ √ = Newton è stato quello di dimostrare che questo algo6− 2 ( 6 + 2)( 6 − 2) ritmo trova √ velocemente approssimazioni molto accu√ √ √ √ rate 6+ 2 2( 6 + 2) √di r. Vediamo infatti come si possa determina= . = re 2 ≈ 1.414213562 partendo dall’approssimazione 6−2 2 89 3.6. POTENZE, RADICI, LOGARITMI √ 2 1 1 0 0. 0 9 0 6 4 2 1 1 0 0 0 8 1 1 0 1 9 2 6 5 0 0 0 9 0 6 3 0 6 4 5 8 0 0 1 2 2 2 2 4 4 8 8 8 . 1 4 2 × 4 = 9 6 1 × 1 = 2 8 2 4 × 4 = 1 2 8 2 × 2 = 1 1 5 2 9 6 6 5 6 4 0 0 6 4 3 6 Figura 3.1: La radice quadrata Lasciamo al lettore, come esercizio, la razionalizzazione di: 1 √ , 3+ 2 1 1 √ √ , √ , 3 5− 3+ 2 5 √ √ √ 3 25 + 3 10 + 3 4 1 √ = √ . 3 3 5− 32 Ma questa espressione è proprio il quadrato del membro sinistro. Poiché le due quantità sono entrambe positive, l’uguaglianza è verificata. √ Questa formula è particolarmente interessante quando a2 − b è un quadrato perfetto; in tal caso, infatti, le radici quadrate interne scompaiono e il radicale doppio di sinistra si trasforma nella somma (o nella differenza) di due radicali semplici. L’esempio Non è raro incontrare espressioni che richiedono il precedente è significativo:p poiché 62 − 20 = 16 = 42 , p calcolo di radici p di altre espressioni composte da radi√ √ la formula del teorema dà 6 − 20 = (6 + 4)/2− √ ci; ad esempio, 6 −√ 20 = 1.2360679777 . . .. Se si p (6 − 4)/2 = 5 − 1, il che dimostra che la coinconsidera la quantità 5 − 1, molto più semplice (sia cidenza dei decimali non è limitata alle sole prime da portarsi dietro sia da calcolare), si può osservacifre. re che anch’essa vale 1.2360679777 . . . e ci chiediamo se le due espressioni sono davvero uguali o se sono Nota 3.7 Verificare che due numeri reali hanno soltanto molto simili, ma, proseguendo col calcolo di alcune cifre iniziali uguali, non significa e non prova altri decimali, si trovi poi una discrepanza. E’ questo che i due numeri siano uguali. Per far ciò occorre una il problema dei cosiddetti radicali doppi, argomento vera dimostrazione, come quella derivante dal teoremolto bello e molto amato dal mitico matematico inma precedente. Un semplice esempio √ contrario è dato √ diano Srinavasa Ramanujan. Per i radicali quadratici dalla falsa uguaglianza π = 2 + 3; se ci si limita vale il seguente risultato: alle prime due cifre decimali si ha: 1.41 + 1.73 = 3.14, p √ ma già la terza cifra è diversa. La frazione 355/113 Teorema 3.21 Sia data l’espressione a ± b con vale 3.14159292 e le prime sette cifre coincidono√con 2 a, b > 0; se a > b allora vale l’identità: quelle di π. Ancora più eclatante è il caso di 2 e della frazione 665857/470832, frazione che il lettore s s √ √ q industrioso avrà già √ a + a2 − b a − a2 − b √ incontrato applicando il Teorema a± b= ± . 3.20 al calcolo di 2. Il calcolatore dà per entrambi il 2 2 Prova: Si osservi prima di tutto che a > √ a2 − b. Se eleviamo al quadrato il secondo membro dell’uguaglianza nell’enunciato, si ottiene: √ √ a + a2 − b a − a2 − b + ± 2 2 s √ √ a + a2 − b a − a2 − b = ±2 2 2 r √ a2 − (a2 − b) = a ± b. =a±2 4 valore 1.41421356237, ma naturalmente, nonostante questa identità, i due numeri non possono coincidere, √ poiché come sappiamo 2 non è un numero razionale. Come abbiamo avuto già modo di osservare, l’elevamento a potenza ab = c ha due operazioni inverse: se si conoscono c e b, per ricavare a si esegue l’estrazione di radice, che abbiamo visto essere una semplice estensione dell’elevamento a potenza. Possiamo però anche conoscere a e c e cercare l’esponente b: questa operazione si chiama calcolo del logaritmo. Quindi, per definizione, il logaritmo in base a 90 CAPITOLO 3. NUMERI di c è l’esponente b al quale occorre elevare a per ottenere c; questa quantità si scrive: b = loga c. Se sappiamo fare le potenze, possiamo trovare qualsiasi logaritmo applicando il metodo delle approssimazioni successive. Ad esempio, calcoliamo il log2 10; poiché 23 < 10 < 24 , si ha 3 < log2 10 < 4. Dal momento che 23 è più vicino a 10 di quanto non lo sia 24 , partiamo da 3.1 e calcoliamo le varie potenze: 23.1 = 8.574, 23.2 = 9.189, 23.3 = 9.849, 23.4 = 10.556, e quindi 3.3 < log2 10 < 3.4. Ancora, 23.3 è più vicino a 10 di 23.4 , e cosı̀ abbiamo: 23.31 = 9.917, 23.32 = 9.986, 23.33 = 10.056, per cui 3.32 < log2 10 < 3.33. Cosı̀ procedendo si può trovare il valore approssimato log2 10 ≈ 3.32192809. Le regole fondamentali dei logaritmi sono le seguenti: loga (rv) loga (r/v) loga (r√s ) loga s r loga a loga 1 = = = = = = loga r + loga v loga r − loga v s loga r 1 s loga r 1 0 Inoltre, è importante la seguente proprietà che permette di cambiare la base di un logaritmo, operazione abbastanza frequente: Teorema 3.22 Vale la seguente identità: loga b = 1/ logb a. Prova: Sia x = loga b; per definizione è b = ax e se si prende il logaritmo in base b dei due membri si ha: logb b = logb ax = x logb a. Ma logb b = 1 e se diamo ad x il suo valore si ha: 1 = (loga b)(logb a), da cui deriva immediatamente la formula desiderata. Ad esempio, si calcola: log10 2 = 1/ log2 10 = 1/3.32192809 . . . = 0.301029995 . . .. L’utilità dei logaritmi è legata alle loro proprietà: le moltiplicazioni sono ridotte ad addizioni, le divisioni a sottrazioni, le potenze a moltiplicazioni e le radici a divisioni. Oggi, con l’uso intensivo dei calcolatori elettronici di ogni dimensione, non ci rendiamo conto delle difficoltà pratiche dei calcoli. Molti studenti, oggi, non conoscono neppure le tabelline (cioè la Tavola Pitagorica) e non sanno eseguire le divisioni. Se vogliamo estrarre la radice quinta di 1639, il calcolatore ci dà immediatamente 4.39456397, ma nel 1600 o nel 1800, applicando i metodi che abbiamo visto, sarebbe occorsa una giornata di duro lavoro per arrivare ad ottenere cinque o sei decimali. I logaritmi permettono di risolvere il problema in pochi minuti. Su una √ tavola si trova log10 1639 = 3.21458 e quindi log10 5 1639 = 3.21458/5 = 0.64292 e, ancora dalla tavola, si ricava: 100.64292 = 4.3946, il che è sufficiente per la maggior parte delle applicazioni. In questo esempio abbiamo immaginato di usare tavole dei logaritmi in base 10 con 5 cifre decimali; in effetti queste erano le tavole di uso più comune, ma ne sono esistite anche con 15 o 20 decimali. I logaritmi furono inventati dal matematico scozzese John Napier (Giovanni Nepero era il suo nome latinizzato) verso la fine del 1500 e le sue tabelle a 14 decimali, con relativo manuale d’uso, furono pubblicate nel 1614, dopo 20 anni di laboriosi calcoli (si veda anche il Capitolo 8). I logaritmi di Napier erano, grosso modo, ciò che oggi chiamiamo logaritmi naturali, cioè i logaritmi nella particolare base e = 2.7182818284 . . ., sul cui significato avremo molto da dire più avanti. Immediatamente, l’opera di Napier venne apprezzata, utilizzata e imitata. Henry Briggs, dopo aver discusso con Napier nel 1615, introdusse i logaritmi decimali (cioè in base 10), che da allora divennero quelli più popolari ed utilizzati nella pratica. Fino all’introduzione dei calcolatori elettronici da tasca verso il 1970, i logaritmi decimali sono rimasti lo strumento più largamente usato nei calcoli di precisione, battuto per i calcoli approssimati solo dal regolo calcolatore, uno strumento meccanico derivato proprio dai logaritmi. In effetti, una tavola di logaritmi era maneggevole e alla portata economica di tutti; già il regolo calcolatore, come strumento di calcolo, era più costoso e, come s’è detto, meno preciso, per cui era usato solo per calcoli veloci, come il puntamento delle armi o la misurazione dei terreni sul posto. Meno maneggevoli e molto più care erano le macchine calcolatrici meccaniche: inventate da Pascal verso il 1640, estese alla moltiplicazione da Leibniz, erano pesanti e ingombranti, e quindi adatte solo ai conti che potevano esser fatti in un ufficio o in uno studio. Per questo, molti altri strumenti di calcolo furono proposti, come il già citato celebre compasso, inventato e commercializzato da Galileo intorno al 1600. 3.7 Espressioni e proporzioni La rappresentazione di un conto, come 3 + 5 oppure 14 × (424 − 35/5), si suol chiamare una espressione aritmetica. L’ordine di esecuzione delle operazioni è regolato da alcune norme convenzionali: 1. le operazioni si eseguono da sinistra verso destra, ma moltiplicazione e divisione hanno la precedenza su somma e sottrazione. Quindi 5 − 2 + 1 vale 4, ma 5−2×2 vale 1 poiché il prodotto 2×2 si esegue prima della sottrazione; 2. le parentesi possono essere usate per modificare questo ordine. Pertanto (5−2)×2 dà come valore 6, poiché la sottrazione viene eseguita prima del prodotto. 3.7. ESPRESSIONI E PROPORZIONI Operando in questa maniera, il risultato di un’espressione aritmetica è determinato univocamente e due persone (o anche una persona e un elaboratore elettronico) devono ottenere lo stesso valore se partono con la medesima espressione. Alla Scuola Media si insegna ad usare vari tipi di parentesi: le parentesi tonde sono quelle a più basso livello; per raggruppare espressioni che già contengono parentesi tonde si usano le parentesi quadre; e infine, a livello più alto si usano le parentesi graffe. In realtà, nella pratica, si tende ad usare solamente le parentesi tonde, eventualmente di dimensione crescente man mano che si sale di livello. E’ molto raro l’utilizzo di parentesi quadre e graffe all’interno delle espressioni aritmetiche: a queste parentesi viene di solito dato un significato diverso e che non ha niente a che fare con il raggruppamento dei termini in un’espressione aritmetica. Abbiamo già incontrato le notazioni {a, b, c} e {x ∈ N | x2 < 200}, che usano le parentesi graffe per denotare un insieme, sia che lo si voglia definire per estensione o per intensione. C’è stata anche l’occasione di introdurre le parentesi quadre nella notazione delle liste, ed esistono altri usi più specifici di queste parentesi. Pertanto, eviteremo di mescolare le parentesi dando loro lo stesso significato e, per le espressioni aritmetiche, useremo soltanto le parentesi tonde. A voler essere precisi (e in Matematica questo è proprio il caso) non tutte le espressioni aritmetiche danno un risultato numerico; ad esempio 4/(5 − 5) diviene 4/0 e questa è un’operazione che non ha risultato. Infatti, 4/0 starebbe a indicare quel numero che moltiplicato per 0 dà 4, ma nessun numero gode di questa proprietà. Poiché nei vari insiemi numerici che abbiamo visto la divisione per 0 è sempre vietata per gli stessi motivi, dobbiamo vietarla in generale nelle espressioni aritmetiche e considerare valide solo quelle che, al termine della computazione, ci danno un valore numerico. Definiamo allora una relazione di equivalenza tra espressioni: due espressioni aritmetiche A e B sono equivalenti se e solo se sono entrambe valide e danno lo stesso valore numerico come risultato. Il termine “equivalente” è giustificato dal fatto che tale relazione risulta veramente essere una relazione di equivalenza, e al lettore basterà un momento di riflessione per rendersi conto della validità delle tre proprietà riflessiva, simmetrica e transitiva. Può, al solito, essere un buon esercizio verificare formalmente queste proprietà, ma lasciamo la cosa alla buona volontà e all’interesse del lettore. Per indicare che due espressioni aritmetiche A e B sono equivalenti si scrive A = B che si legge “A uguale a B”; la relazione di equivalenza si dice propriamente uguaglianza e ci si riferisce ad A e a B come al membro sinistro e al membro destro dell’uguaglianza. 91 Questa relazione di equivalenza può essere arricchita da altre proprietà che risulteranno molto importanti: Teorema 3.23 Siano A e B due espressioni aritmetiche valide ed equivalenti fra di loro, e sia C una terza espressione aritmetica valida; si ha allora A + C = B + C, A − C = B − C e A × C = B × C. Infine, se il valore dell’espressione C è diverso da 0, si ha anche A/C = B/C. Prova: Se A e B hanno lo stesso valore numerico, diciamo n, e C ha valore numerico m, allora A + B ha valore numerico n + m come lo ha B + C. La stessa osservazione vale anche negli altri casi; per la divisione, se C ha valore 0, dividendo A o B per C si hanno espressioni non valide. Una semplice osservazione notazionale è la seguente: se le espressioni contengono più di un numero, è bene scrivere A − (C), (A) × (C) e (A)/(C), usando opportunamente le parentesi per assicurarsi che le operazioni vengano eseguite nell’ordine giusto. E’ bene anche osservare che somma e sottrazione agiscono in modo simmetrico: nel caso che A e B siano espressioni equivalenti, se prima si somma e poi si sottrae C (o viceversa), si torna a due espressioni equivalenti. Lo stesso succede per moltiplicazione e divisione, se C non vale 0. Se invece C vale 0, non solo è vero che da A = B si ricava A × C = B × C, ma questa uguaglianza si ottiene anche quando fosse A 6= B, cioè A e B non fossero equivalente: infatti, il valore comune delle due espressioni ottenute sarebbe comunque 0. Naturalmente, a questo punto non si può più tornare indietro dividendo per C. Questo, se si vuole, è un altro argomento per spiegare la necessità di evitare moltiplicazione e divisioni per 0. Il teorema precedente può essere esteso nel modo seguente: Teorema 3.24 Siano A, B, C, D quattro espressioni aritmetiche valide tali che A = B e C = D; se se sommano o si sottraggono tali uguaglianze membro a membro si hanno ancora espressioni equivalenti, cioè A + C = B + D e A − C = B − D. Inoltre, se il valore comune di C e D non è 0, si ha anche A×C = B ×D e A/C = B/D. Prova: Per il teorema precedente, da A = B si ricava A + C = B + C e da C = D si ha C + B = D + B, ovvero B + C = B + D per la proprietà commutativa della somma; si ha allora A + C = B + D. Per la sottrazione non vale la proprietà commutativa ed occorre perciò un’osservazione in più: se C = D allora −C = −D, come si vede immediatamente pensando al valore comune di C e di D. Allora, da A = B si ha A − C = B − C e da −C = −D si ricava 92 −C + B = −D + B, cioè B − C = B − D, questa volta per la proprietà commutativa della somma. Per la moltiplicazione e la divisione si procede in modo analogo, osservando che da C = D discende 1/C = 1/D purché il valore comune di C e D sia diverso da 0. CAPITOLO 3. NUMERI se: 1) ogni antecedente si inverte col proprio conseguente (proprietà dell’invertendo); 2) si permutano gli estremi e/o i medi (proprietà delle permutando). Prova: La proporzione originale è equivalente a ad = bc; è facile osservare che ciascuna delle altre proUn’osservazione importante è la seguente: se A = porzioni è equivalente alla stessa identità. Ad esemB e il valore delle espressioni è diverso da 0, molti- pio, permutando gli estremi si ha: d : b = c : a, il che plicando questa uguaglianza membro a membro per significa ancora ad = bc. sé stessa, si ha A2 = B 2 . Tuttavia, da A2 = B 2 non Due altre proprietà sono utili per risolvere molti si può dedurre A = B, come prova il controesempio problemi: 2 2 (−2) = 2 . Il teorema precedente, infatti, afferma 2 2 solo che se A = B e A = B allora (dividendo mem- Teorema 3.27 Si abbiano quattro numeri in proporbro a membro) si ricava A = B; ma questo non è zione a : b = c : d. Allora, la somma (o la differenza) particolarmente interessante. degli antecedenti sta alla somma (o alla differenza) Queste proprietà delle espressioni aritmetiche si ge- dei conseguenti, come ciascun antecedente sta al proneralizzeranno più avanti alle espressioni algebriche; prio conseguente (proprietà del componendo e dello per il momento ci interessa la loro applicazione alla scomponendo). Equivalentemente, la somma (o la teoria delle proporzioni. differenza) del primo e del secondo sta al primo (o al secondo) come la somma (o la differenza) del terzo e Definizione 3.8 Una proporzione è l’uguaglianza di del quarto sta al terzo (o al quarto). due rapporti: a/b = c/d. Quattro numeri a, b, c, d si Formalmente, il componendo corrispondicono in proporzione se il rapporto dei primi due è Prova: uguale al rapporto degli ultimi due. Si scrive a : b = de alla proporzione: (a + c) : (b + d) = a : b o c : d e si legge “a sta a b come c sta a d”. I quattro (a + c) : (b + d) = c : d, mentre la seconda formulanumeri si dicono termini della proporzione; a e d si zione corrisponde a (a + b) : a = (c + d) : c o anche dicono gli estremi e b e c i medi; a e c si dicono gli (a + b) : b = (c + d) : d. Permutando i medi nella proporzione di partenza, si ha a : c = b : d e quindi la antecedenti e b e d i conseguenti. prima formulazione ci dà (a+b) : (c+d) = b : d e perLa proprietà fondamentale delle proporzioni è data mutando di nuovo i medi: (a + b) : b = (c + d) : d, che dal seguente: è la seconda formulazione. Visto che le due formulazioni sono equivalenti, basta dimostrare la validità di Teorema 3.25 Quattro numeri sono in proporzione quest’ultima proporzione. Ma essa equivale a: se e solo se il prodotto dei medi è uguale al prodotto degli estremi. a+b c+d a c = o + 1 = + 1; b d b d Prova: Supponiamo che a : b = c : d, cioè a/b = c/d; ovviamente dobbiamo avere b 6= 0 e d 6= 0, e sottraendo 1 ad entrambi i membri, si ottiene proprio per il Teorema 3.23 possiamo moltiplicare entrambi i la proporzione di partenza. Una prova analoga vale membri diquesta uguaglianza per bd e semplificando ovviamente per lo scomponendo. si ha ad = bc come si voleva. Viceversa, se ad = bc Una applicazione del componendo si ha nella rie i quattro numeri sono diversi da 0, sempre per il soluzione di questo tipo di problemi: di due numeri teorema 3.23 possiamo dividere entrambi i membri si sa che il loro rapporto è 3/5 e che la loro somma per bd 6= 0; si ottiene a/b = c/d, cioè proprio a : b = è 32; quali sono i due numeri? Se chiamiamo i due c : d. numeri x ed y, la prima condizione ci dà la propor- zione x : y = 3 : 5 e quindi la seconda formulazione del componendo ci dice: (x + y) : x = (3 + 5) : 3, cioè 32 : x = 8 : 3. Per la proprietà fondamentale, questo ci permette di scrivere l’uguaglianza 8x = 96; dividendo i due membri per 8 si ha allora x = 12. La proporzione di partenza diviene ora 12 : y = 3 : 5 e di nuovo la proprietà fondamentale ci dà 3y = 60, cioè y = 20. La proprietà del componendo si può utilmente estendere alle catene di rapporti: si dice catena di Teorema 3.26 Si abbiano quattro numeri in propor- rapporti l’uguaglianza di due o più rapporti. Ad zione a : b = c : d. Si ottengono nuove proporzioni esempio, costituisce una catena di rapporti la serie I Greci svilupparono la teoria delle proporzioni basandola su questo teorema, che rimane il fulcro dell’applicazione pratica delle proprietà delle proporzioni. Ad esempio, poiché 2 × 12 = 3 × 8, si ha subito: 2 : 3 = 8 : 12. E’ chiaro che dalla uguaglianza si possono ottenere altre proporzioni, quali 12 : 3 = 8 : 2 oppure 2 : 8 = 3 : 12, e cosı̀ via. Queste variazioni rientrano fra alcune proprietà caratteristiche, contemplate dalla teoria: 93 3.7. ESPRESSIONI E PROPORZIONI di tre uguaglianze: 8 : 2 = 12 : 3 = 20 : 5. In questo caso il componendo assume la forma: in una catena di rapporti la somma degli antecedenti sta alla somma dei conseguenti, come ogni antecedente sta al proprio conseguente. Nell’esempio precedente si ha: (8 + 12 + 20) : (2 + 3 + 5) = 8 : 2, cioè 40 : 10 = 8 : 2, che è ovviamente una proporzione, come si verifica con il teorema fondamentale: 40 × 2 = 10 × 8. Nella risoluzione dei problemi legati alle proporzioni, come nell’esempio dei due numeri visto in precedenza, si cerca di determinare un termine della proporzione quando se ne conoscano gli altri. La regola fondamentale delle proporzioni è la panacea universale per tali problemi e la sua applicazione porta facilmente a un risultato positivo. Esiste tuttavia una nomenclatura precisa, che è opportuno conoscere: Definizione 3.9 Dati tre numeri a, b, c si dice quarto proporzionale (dopo a, b, c) il numero x tale che: a : b = c : x. Dati due numeri a, b si dice terzo proporzionale (dopo a, b) il numero x tale che: a : b = b : x. Infine, dati due numeri a, c si dice medio proporzionale tra a e c il numero x tale che: a : x = x : c. I Greci, come s’è detto, svilupparono la teoria delle proporzioni, introdussero questi concetti a proposito della similitudine delle figure (si veda al Capitolo sulla Geometria Euclidea) e trovarono costruzioni geometriche per “calcolare” il quarto, il terzo e il medio proporzionale di segmenti assegnati; essi, infatti, erano più bravi con la geometria che col calcolo e si trovavano più a loro agio con i segmenti che con i numeri. Per noi le cose sono diametralmente opposte, anche se, a suo tempo, vedremo le costruzioni proposte dai Greci. • un confronto: se cioè, dati due oggetti A, B ∈ G, si possa dire se il primo A è uguale, maggiore o minore del secondo B; • una somma: se cioè A, B ∈ G sono due oggetti, si può trovare in G un oggetto che sia la somma A + B dei due oggetti; naturalmente, tale somma deve godere delle proprietà consuete della somma tra numeri; • un prodotto scalare: se cioè A ∈ G ed r è un numero reale qualsiasi, si può trovare in G un oggetto che sia r volte l’oggetto A; tale oggetto si indica con rA. Si deve avere: r(A+B) = rA+rB e (r + s)A = rA + sA. Se gli oggetti sono di natura fisica, si parla di grandezza fisica; se sono di natura matematica, si parla di grandezza matematica. Fra queste, viene naturale pensare ai segmenti e agli angoli, e in effetti studieremo queste grandezze (e altre) nel capitolo sulla Geometria Euclidea. Fra le classi di grandezze fisiche, ricordiamo gli oggetti pesanti o i conduttori di elettricità. Ogni classe di grandezze G può essere associata a una misura: si definisce arbitrariamente un oggetto U ∈ G della classe come unità di misura e si dice che un oggetto A ∈ G ha misura r = µ(A) se r è il numero reale tale che A = rU . Nel caso degli oggetti pesanti, l’unità di misura è il peso di un litro d’acqua distillata alla temperatura di 4◦ centigradi. Tale quantità si dice convenzionalmente kilogrammo o chilogrammo (kg) e il peso di un oggetto pesante è il rapporto dell’oggetto con tale unità di misura. La misura deve godere delle due proprietà formali: µ(rA) = rµ(A) µ(A + B) = µ(A) + µ(B). Teorema 3.28 1) Il quarto proporzionale dopo i numeri a, b, c, è il numero x = bc/a; 2) il terzo proporIl conteggio costituisce una specie di misura per alzionale dopo a, b è il numero: x = b2 /a; 3) il medio cuni oggetti, sia del mondo fisico, sia di quello mate√ proporzionale fra i numeri a e c è il numero x = ab. matico (si veda il Capitolo 4); tuttavia, in questo caProva: Come accennato, basta applicare la regola so, il prodotto scalare ha senso solo per r ∈ N. Questo fondamentale; ad esempio, da a : b = c : x si ha porta a distinguere le grandezze in due categorie: ax = bc e dividendo i due membri per a (supposto diverso da 0) per il Teorema 3.23 si trova x = bc/a. La dimostrazione degli altri punti è simile. L’ambito naturale di applicazione della teoria delle proporzioni è costituito dalle grandezze proporzionali. Vediamo allora di ricordare brevemente cosa si intende per grandezza, un concetto legato al mondo fisico, anche se trova molti riscontri nella Matematica tradizionale, specie nella Geometria che, come abbiamo ricordato, è il settore in cui si è originariamente sviluppata la teoria delle proporzioni. Una classe di grandezze è un insieme G di oggetti (di natura fisica o matematica) per i quali è possibile definire: • le grandezze continue o analogiche per le quali il prodotto scalare è definito per ogni r ∈ R; • le grandezze discrete o digitali per le quali il prodotto scalare è definito solo per r ∈ N. La teoria delle proporzioni tratta solamente grandezze continue; tradizionalmente, si dice che due (classi di) grandezze sono direttamente proporzionali (si pensi al peso di una merce e al suo costo) se raddoppiando, triplicando, etc. la prima anche la seconda raddoppia, triplica, etc. Analogamente, si dice che due grandezze sono inversamente proporzionali se raddoppiando, triplicando, etc. la prima, la seconda diviene la metà, un terzo, etc. Queste espressioni 94 CAPITOLO 3. NUMERI danno bene l’idea intuitiva di proporzionalità diretta e inversa, ma formalmente non sono granché; infatti, se gli “etc.” ci stimolano ad afferrare un concetto di variabilità che riusciamo intuitivamente a cogliere, in sostanza non ci dicono niente. Migliore è allora la seguente: Definizione 3.10 Due grandezze si dicono direttamente proporzionali quando il rapporto fra ogni valore della prima e il corrispondente valore della seconda è costante. Si dicono invece inversamente proporzionali se il prodotto di ogni valore della prima per il corrispondente valore della seconda è costante. Nel caso del prezzo e del peso, se K è il costo di una merce al chilogrammo, e al peso W corrisponde il prezzo P , si avrà: P/W = K, qualunque siano P e W . Invece, se v è la velocità oraria di un’autovettura che impiega il tempo t a percorrere la distanza d, si scrive: vt = d. Viceversa, si osservi che, fissata la velocità v di percorrenza, la distanza percorsa e il tempo per percorrerla sono grandezze direttamente proporzionali, e questa osservazione, che si generalizza facilmente, ci fa capire come i due concetti siano strettamente collegati, e non solo per il nome. D’altra parte, la precedente definizione rende perfettamente conto della relazione tra grandezze proporzionali e proporzioni. Ad esempio, una volta stabilito (o dato per definizione) che il costo di una merce è direttamente proporzionale al suo peso, e supposto che questa costi 3.5 e al Kg, chiederci quanto vengono a costare 2.7 Kg della stessa merce vuol dire risolvere la proporzione: 3.5 : 1 = x : 2.7. Invertendo si ha: 1 : 3.5 = 2.7 : x, e quindi, come abbiamo visto, si trova: x = 3.5 × 2.7 = 9.45 e. La regola esplicita è: costo1 : peso1 = costo2 : peso2 . Quando le grandezze sono inversamente proporzionali, il secondo rapporto va invertito; cosı̀ se una macchina che va a 75 km/h impiega 45 minuti a percorrere una certa distanza, per sapere quanto impiegherebbe se andasse a 90 km/h, la proporzione da impostare è: 75 × 45 = x × 90, cioè 75 : 90 = x : 45, secondo lo schema: velocità1 : tempo1 = tempo2 : velocità2 ovvero: velocità1 : velocità2 = tempo2 : tempo1 dove si deve notare l’inversione degli indici. In questo caso troviamo x = 37.5, cioè x = 37′ 30′′ . Una celebre classe di problemi legati alle grandezze inversamente proporzionali è costituito dai problemi relativi al riempimento di una vasca. Ad esempio, una vasca di capacità ignota ha due rubinetti e uno scarico; se il primo rubinetto fosse aperto da solo (con lo scarico chiuso) impiegherebbe 24 minuti per riempire la vasca; il secondo rubinetto, sempre da solo, riempirebbe la vasca in 30 minuti. Invece lo scarico, se agisse da solo, vuoterebbe la vasca piena in 20 minuti. La domanda è: se si aprono contemporaneamente i due rubinetti e lo scarico, in quanto tempo si riempie la vasca? Solo i matematici possono inventare problemi tanto assurdi, ma, una volta posto, il quesito va risolto. Il fatto è che i tempi di riempimento sono una grandezza inversamente proporzionale alla quantità di acqua immessa nella (o estratta dalla) vasca, mentre è questa grandezza che si somma o si sottrae per stabilire quando la vasca si è riempita o si è svuotata. Questa inversione di solito imbarazza il solutore, ed è opportuno ragionare in questo modo: in un minuto il primo rubinetto riempie 1/24 della vasca e il secondo ne riempie 1/30; lo scarico ne vuota 1/20 e sono queste le grandezze che si possono sommare e sottrarre. In un minuto la vasca si riempie per: 1 1 1 5+4−6 1 + − = = 24 30 20 120 40 e quindi occorrono in tutto 40 minuti per il riempimento. Tutto qui. Il lettore può ora risolvere il problema dei due automobilisti Carlo e Dario: Carlo è in grado di percorrere l’autostrada da A a B in 60 minuti; Dario la percorre in 40 minuti. Se Carlo parte da A e Dario da B, dopo quanto tempo si incontreranno? Importante è il seguente concetto: Definizione 3.11 La percentuale di una quantità q rispetto a una quantità Q è il rapporto q/Q riportato a 100. In altre parole, la percentuale x di q a Q è il quarto proporzionale: q : Q = x : 100, e quindi per il Teorema 3.28 è: x = 100q/Q. Ad esempio, se un oggetto costa 60 e e viene scontato di 12 e, in percentuale lo sconto è dato dalla proporzione: 12 : 60 = x : 100, cioè x = 1200/60 = 20 per cento (o, come si scrive, 20%). Viceversa, se su un oggetto che costa 70 e viene operato lo sconto del 15%, tale sconto si calcola risolvendo la proporzione. x : 70 = 15 : 100, cioè x = 70 × 15/100 = 10.5 e. Naturalmente, una proporzione risolve anche il caso della percentuale di pagamento (e non dello sconto); ad esempio, per sapere quanto dobbiamo pagare per acquistare un abito all’80% del suo costo di 370 e, basta impostare la proporzione: x : 370 = 80 : 100 e scoprire che x = 296 e. Infine, le percentuali sono spesso usate per valutare l’errore commesso in una misurazione, in una valutazione o in un conteggio approssimato. Ad esempio, se 95 3.8. MATEMATICA FINANZIARIA di una persona alta 172 cm diciamo che è alta 170 cm, quale errore commettiamo? Intanto, si distingue tra errore assoluto ed errore relativo: l’errore assoluto è il valore assoluto della differenza fra il valore reale e quello considerato. Pertanto: Ea = |172 − 170| = 2 cm. Naturalmente, un tale errore su 172 cm è abbastanza sensibile ma non troppo; un errore di 2 cm su 1 km è trascurabile; un errore di 2 cm su 10 cm è enorme. Questo ci fa capire che l’errore assoluto, pur essendo significativo, non ci dà un’idea della rilevanza dell’errore stesso, cioè non ci dice se il valore approssimato è vicino o lontano dal valore vero. Per questo si introduce il concetto di errore relativo, definito come il rapporto tra l’errore assoluto e il valore vero della quantità considerata. In altre parole: Er = Ea /qv , se qv è il valore vero della nostra quantità. Nel caso dell’altezza abbiamo Er = 2/172 ≈ 0.0116, e questo ci fa capire immediatamente che l’errore è abbastanza modesto. L’errore relativo si esprime spesso in percentuale; questa è semplicemente 100×Er , e la si può ottenere in modo diretto impostando e risolvendo la proporzione: Ea : qv = x : 100. Se qa è il valore approssimato di qv , abbiamo |qv − qa | : qv = x : 100 e a formula si scrive: 100|qv − qa | = Er %. qv Nel caso dell’altezza, l’errore è stato dell’1.16%. 3.8 Matematica finanziaria Un’applicazione importante delle cose dette è la Matematica finanziaria, largamente usata nel commercio, nelle banche e nella finanza. In effetti, la Matematica finanziaria è un argomento che presenta diversi caratteri interessanti. Intanto, almeno nelle parti iniziali, è abbastanza elementare da consentire un facile approccio da parte di tutti: le operazioni coinvolte sono le quattro operazioni elementari, le potenze, le radici e, per alcuni problemi meno comuni, i logaritmi. Questi, guarda caso, non vengono trattati proprio in quelle scuole nelle quali la Matematica finanziaria costituisce uno dei principali argomenti di insegnamento. In secondo luogo, la materia ha un aggancio immediato con il mondo reale e ognuno ha costantemente a che fare con gli interessi bancari sui conti correnti, gli investimenti, gli sconti e gli scoperti, con le polizze o le rate dell’assicurazione e del mutuo, e via discorrendo. In terzo luogo, specie per quello che ci riguarda, si presta a darci l’abitudine a fare un po’ di conti e di esercizi su vari argomenti che abbiamo toccato, quali le conversioni di base, le proporzioni e le percentuali, le potenze e i logaritmi. A questo proposito, è bene che, leggendo questa sezione, ci si munisca di un calcolatore da tasca, possibilmente in grado di eseguire potenze, radici e logaritmi. Sicuramente, il problema più elementare è quello dell’interesse semplice. Supponiamo di avere una certa somma, che indicheremo con C; questo ci introduce nella terminologia, piuttosto specifica, della Matematica finanziaria. Infatti C sta per capitale, ed è la quantità di denaro di riferimento: quanto possediamo, quanto vogliamo investire o spendere, quanto possiamo mettere in campo. Se impieghiamo il nostro capitale C, ad esempio depositandolo in banca sul nostro conto corrente, ci aspettiamo che, nel giro di un anno, esso aumenti. Pensiamo infatti che la banca ottenga un guadagno finanziando imprese con i soldi che ha raccolto da noi e da altri cittadini e che pertanto ne darà in parte anche a noi, che abbiamo partecipato, indirettamente, al loro finanziamento. Per questo concordiamo con la banca (o, meglio, la banca concorda con noi) un certo tasso di interesse, indicato di regola con i o con r, cioè la frazione di capitale che costituirà il nostro guadagno. Tale tasso di interesse è di norma considerato su base annua e quindi, dopo un anno, noi ritroveremo il nostro capitale C più la quantità rC che è appunto ciò che il nostro capitale ha fruttato. Di conseguenza, il nostro capitale sarà: C ′ = C + rC = C(1 + r). Il tasso di interesse è dato tradizionalmente in percentuale; pertanto, un tasso del 3% significa r = 0.03. Ad esempio, se impieghiamo 2000.00 e al 3%, dopo un anno avremo guadagnato 2000 × 0.03 = 60.00 e e il nostro capitale sarà 2000 × 1.03 = 2060.00 e. Naturalmente, il vantaggio che ci offre la formula precedente è quello di permetterci una facile soluzione di problemi inversi. Ad esempio, quale somma devo impiegare al 4.5% per avere, dopo un anno, 2000.00 e? Questa volta, il capitale C è la nostra incognita e quindi dalla formula ricaviamo: C = C ′ /(1 + r) che ci dà C = 2000/1.045 = 1913.88 e. Analogamente, se vogliamo sapere a quale tasso occorre impiegare 1900.00 e per averne, dopo un anno, 2000.00, dalla formula otteniamo: 1+r = C′ C ovvero r= C′ C′ − C −1= . C C Nell’esempio, abbiamo r = 100/1900 = 0.0526, e cioè il tasso deve essere del 5.26%. Questi problemi, nel gergo commerciale e finanziario, sono noti come problemi di sconto. Supponiamo infatti di dover pagare 2000.00 e fra un anno a un nostro fornitore; trattiamo con lui e quello è disposto, se paghiamo subito, a farci uno sconto del 4.5%; col ragionamento di sopra 96 CAPITOLO 3. NUMERI vediamo che ce la possiamo cavare pagando (subito) 1933.88 e, e ciò ci può essere conveniente, se non abbiamo problemi finanziari. Similmente, supponiamo che, ancora trattando con il fornitore, quello ci dica che si accontenta di incassare 1900.00 e, se paghiamo subito (forse ha problemi di liquidità). Qual è lo sconto che è disposto a farci? Come abbiamo visto si tratta del 5.26%, una bella roba! Tornando al nostro investimento, se, alla fine dell’anno, ritiriamo il nostro guadagno rC e lasciamo il capitale C alla banca ancora per un anno, alla fine del secondo anno avremo un nuovo guadagno rC e quindi (se ancora non abbiamo speso niente) possiamo considerarci possessori di un capitale C ′′ = C + rC + rC = (1 + 2r)C. Se si va avanti cosı̀ per n anni, si avrà in tutto il capitale (1+nr)C. Tanti anni fa, quando ero ragazzo, l’interesse semplice era presentato proprio cosı̀. Nella realtà, specie al giorno d’oggi, le cose sono un po’ più complicate. Se mettete un po’ di denaro in banca all’interesse r, la banca vi richiede di partecipare alle spese (costo del personale, delle attrezzature, e cosı̀ via) con una cifra fissa S oppure proporzionale al vostro capitale, diciamo sC. In quest’ultimo caso, in effetti, il vero tasso di interesse è per voi r − s; infatti, in fondo all’anno, il vostro capitale sarà C ′ = C(1 + r) − sC = C(1 + (r − s)), per cui dovete stare attenti che s sia abbastanza minore di r, se non volete andare a rimetterci. Occorre ricordare, inoltre, che sul vostro guadagno dovete pagare le tasse, che oggi, inizio del terzo millennio, in Italia, sono del 12.5%. Questo significa che il vero tasso di interesse è r − 0, 125r = 0.875r, cosı̀ che, fatti tutti i conti, alla fine dell’anno il vostro capitale sarà C ′ = C(1 + 0.875r − s), con un tasso di interesse reale dato da 0.875r − s. E’ bene rendersi conto che se la banca vi offre un tasso di interesse del 2% e le spese assommano allo 0.5% del capitale investito, il tasso reale è: 0.875 × 0.02 − 0.005 = 0.0125 = 1.25%. Quindi, se dai vostri 2000.00 e pensate di ricavare un guadagno di 2000 × 0.02 = 40.00 e, scordatevelo e cominciate a rassegnarvi all’idea di ottenere invece 2000 × 0.0125 = 25.00 e. Un discorso diverso va fatto se la banca vi trattiene una cifra fissa S; ve la può trattenere all’inizio o alla fine del periodo, cioè dell’anno. Se ve la trattiene all’inizio (in modo anticipato) il vostro capitale finale sarà C ′ = (C − S)(1 + r) in quanto, di fatto, voi state impiegando un capitale decurtato delle spese sostenute. Se invece S vi viene trattenuto alla fine del periodo (posticipato), avrete C ′′ = C(1 + r) − S. A parità di S, ovviamente, questa seconda soluzione vi sarà più favorevole; altrettanto ovviamente, la banca si trattiene sempre le spese S all’inizio dell’anno. Può essere un utile ed interessante esercizio vedere, anche in questo caso, cosa succede introducendo la tassa governativa del 12.5%. Il fatto che, convenzionalmente, il tasso di interesse sia considerato su base annua (almeno nel 90% dei casi) fa sı̀ che occorra ritornare a ciò che abbiamo detto sulle basi composte, quando si voglia impiegare un capitale per alcuni mesi o per un certo numero di giorni. Supponiamo di impiegare 2000.00 e per 9 mesi al tasso del 3% annuo. La cosa migliore è riportare i mesi o i giorni alla frazione di anno corrispondente, e quindi ragionare su questo numero, che è diventato un numero decimale. Nell’esempio, 9 mesi sono 9/12 di anno, cioè, eseguendo la divisione, 0.75 parti di anno. L’interesse r viene ridotto in proporzione: 3 : 1 = x : 0.75, cioè x = 2.25, e il nostro guadagno (sempre al lordo delle spese e delle tasse) sarà 2000 × 0.0225 = 45.00 e. Quando il periodo si conta in giorni, la Matematica finanziaria introduce un altro livello di complessità: si considera infatti un anno civile, composto convenzionalmente di 365 giorni (anche se l’anno considerato è bisestile) e un anno commerciale, ridotto a 360 giorni. Di fatto, le cose cambiano di poco, ma bisogna essere coscienti di cosa si sta facendo. Impieghiamo i nostri 2000.00 e per 215 giorni; se si usa l’anno civile, la proporzione è: 3 : 365 = x : 215, e quindi x = 1.7671233, che ci dà un guadagno di 35.34 e. Se si usa l’anno commerciale, si ha: 3 : 360 = x : 215, cioè x = 1.7916667 con un guadagno di 35.83 e. Per una qualche misteriosa ragione, la banche adottano ormai sistematicamente l’anno civile nel trattamento dei conti correnti in attivo per il cliente. Quando dagli investimenti di un anno passiamo a investimenti pluriennali, l’interesse semplice va bene solo se, alla fine di ogni anno, ritiriamo gli interessi maturati (le “cedole”) e, quindi, il capitale investito C rimane costante nel tempo. Spesso però succede che il capitale venga lasciato a fruttare per diversi anni senza ritirare alcuna cifra. In questo caso, gli interessi si accumulano al capitale o, come si dice, reinvestiamo gli interessi stessi. Questo significa che in fondo al primo anno, reinvestiamo per intero il nostro capitale, che è diventato C(1 + r); se il tasso di interesse rimane r, alla fine del secondo anno abbiamo: C(1 + r)(1 + r) = C(1 + r)2 . Continuando cosı̀, dopo n anni il nostro capitale sarà diventato: C ′ = C(1 + r)n ; è questo il concetto, e la formula relativa, dell’interesse composto, per il quale gli interessi si accumulano mano mano e vanno quindi ad incrementare gli interessi successivi. Quando facevo le Scuole 3.8. MATEMATICA FINANZIARIA Elementari, all’inizio degli anni 1950, il sussidiario non mancava di tentare il nostro stupore con questo problema: sapete, ragazzi, quanto sarebbe diventata oggi una Lira se, al tempo di Giulio Cesare, fosse stata messa in banca all’interesse composto dell’1%? A quell’epoca, giravano le lire, ma ora possiamo senz’altro passare all’Euro. La risposta, che ci veniva fornita senza spiegarci come era stata ottenuta, era: quasi mezzo miliardo di Lire (o di Euro), una somma davvero stratosferica. La formula precedente ci dà la soluzione che allora ci mancava: 1 × (1.01)2000 = 431. 286. 205.72. 97 Più complicato è il caso che siano fissati il capitale C e il montante M , e si voglia determinare il tasso di interesse necessario a raggiungere lo scopo in un numero di anni n assegnato. Ancora dalla formula, si ha: p M = C(1 + r)n ovvero 1 + r = n M/C. Se C = 10. 000, 00, M = 15. 000, 00 e ed n = 10 anni, si ha: r √ 10 10 15000 1.5 = 1.04138, 1+r = = 10000 Oggi potremmo osservare che, a cinquant’anni di corrispondente a un tasso del 4.138%. E’ addirittura distanza, saremmo già a: necessario introdurre ed utilizzare i logaritmi quando 2050 . . siano assegnati capitale, montante e tasso d’interesse, 1.01 = 722 464 071.72, e si voglia determinare il numero n di anni necessari che mette bene in evidenza la crescita esponenziale a raggiungere il montante M impiegando al tasso r il (n, il numero di anni, si trova all’esponente) del no- capitale iniziale C. La formula M = C(1 + r)n ci dà: stro capitale, impiegato all’interesse composto. Viceversa, se avessimo impiegato la Lira o l’Euro iniziale n = log1+r M/C = log1+r M − log1+r C. all’interesse semplice, oggi avremmo: Purtroppo, il calcolatore non dà direttamente il lo1 × (1 + 2050 × 0.01) = 21.50 garitmo in base 1 + r; di solito fornisce il logaritmo Lire (o Euro), una cifra del tutto insignificante, do- naturale, che però vedremo nel Capitolo 8, e il logavuta alla crescita lineare del capitale: in questo ca- ritmo decimale. Come sappiamo, si ha: log1+r x = so, il numero degli anni n sta a moltiplicare il tasso log10 x/ log10 (1 + r), e questo riporta tutto al calcolo . d’interesse. Proprio per questo modo di crescere, il dei logaritmi decimali. Se abbiamo M = 15 000, 00, . ′ C = 10 000, 00 e ed r = 2.50%, si ha M/C = 1.5, capitale risultante C dall’interesse composto si dice log 1.5 = 0.17609126 e log 1.025 = 0, 01072387, montante, cioè che monta, che cresce. 10 10 Problemi più concreti riguardano investimenti plu- per cui n = 16.42. Occorrono pertanto 16 anni e riennali. Anche in questo caso, se astraiamo dalle spe- 42/100 di anno; per riportare questa frazione a giorse e dalle tasse, un capitale di 2000.00 e, impiegato ni secondo l’anno civile, si imposta la proporzione: 42 : 100 = x : 365, e da questa si ricava x ≈ 153. al 3% annuo per 7 anni, ammonterà a: Il tempo richiesto è perciò di 16 anni e 153 giorni, 2000 × 1.037 = 2459.75e. ovvero, se preferiamo, 16 anni e 5 mesi. Tutto arriva La formula, come nel caso dell’interesse semplice, per- per chi sa aspettare. L’interesse composto richiede un pizzico d’attenmette di risolvere anche i problemi inversi. Ad esemzione quando, dalla base annua, lo si voglia portare a pio, ci possiamo chiedere qual è il capitale C che una base frazionaria, come il semestre, il trimestre, il dobbiamo impiegare al 2.50% per avere, dopo 10 an. mese o addirittura il giorno. Ad esempio, un interesse ni, 20 000, 00 e; la formula ci dice che deve essere 10 annuo del 4% non è un interesse composto semestra20000 = C×1.025 , cioè C = 20000/1.28 = 15623.97 le del 2%, come si potrebbe pensare e come talvolta e. Come nel caso dell’interesse semplice, questo può si assume per semplicità. Secondo la regola generale, essere visto come un problema di sconto; nella realtà, poiché un semestre è la metà di un anno, il capitale tuttavia, è raro avere pagamenti dilazionati per più di √ al′ 1/2 1+r la fine del semestre sarà: C = C(1+r) = C un anno. Ha senso invece porsi come obiettivo quello √ 1 + r. Facendo i calcoli nel caso e il tasso sarà 1 − di arrivare ad avere un montante M nel giro di n an√ di r = 4%, si ha 1 − 1.04 = 0.0198, cioè 1.98%, che ni, impiegando una certa somma a un interesse noto. è un po’ più basso del 2% ipotizzato. Si osservi che, Allora, la cifra C di partenza si dice il valore attuale del montante M . Ad esempio, qual è il valore attuale sempre considerando un tasso del 4% su base annua, di un montante di 10. 000, 00 e scadente fra 5 anni e si ha: √ 78 giorni, al 3%? Usando l’anno civile, 78 giorni cor3 1.04 = 1.316% base quadrimestrale 1 − √ rispondono a 78/365 = 0.2137 parti di anno, e quindi 4 base trimestrale 1 − √1.04 = 0.985% dalla formula ricaviamo: 6 base bimestrale 1− √ 1.04 = 0.656% 5.2137 12 10000 = C × 1.03 ovvero C = 8571.77e. base mensile 1 − 1.04 = 0.327% 98 CAPITOLO 3. NUMERI Chiaramente, il tasso cosı̀ calcolato è sempre inferiore al tasso “ingenuo” ottenuto dividendo r per la periodicità: infatti gli interessi si accumulano col passare del tempo. Ad esempio, se comprate dei BOT a tre mesi, il tasso viene calcolato cosı̀, poiché si suppone che, finito il periodo, reinvestiate il ricavato. Affrontiamo, come conclusione di queste note sulla Matematica Finanziaria, un problema classico e non del tutto banale. Se volete comprar casa, molto probabilmente avrete necessità di fare un mutuo, cioè di chiedere soldi in prestito a una Banca per pagare l’attuale proprietario, il notaio, le tasse e quanto altro sia necessario. Se C è la cifra che desiderate, la Banca sarà disposta a prestarvelo mettendo un’ipoteca sulla casa e chiedendovi un “ragionevole” interesse. La Banca vi fornisce la somma C comprensiva delle spese dell’operazione fra voi e la Banca stessa, e voi vi impegnate a restituire a rate, in un certo periodo di anni, la somma e gli interessi. Questo significa, prima di tutto, che la Banca vi fornirà una cifra C ′ < C, essendo C − C ′ il costo dell’operazione; d’altra parte, poiché C è comunque la somma che dovete restituire, c’è il problema del calcolo degli interessi. Poiché restituite la cifra a rate, di solito semestrali, alla prima rata avrete già accumulato gli interessi dei primi sei mesi. Alla fine dei secondi sei mesi avrete accumulato altri interessi da restituire, ma solo sulla cifra precedente diminuita della rata pagata alla fine dei primi sei mesi. Chiamiamo allora Ck la quantità di danaro da restituire alla fine del k-esimo periodo di sei mesi; in particolare, sarà C0 = C il capitale (si fa per dire) iniziale. Le modalità di restituzione possono essere varie, ma di solito si riducono a due: a rate fisse e a rate variabili. Quest’ultima modalità prevede come regola un adeguamento del tasso di interesse a quello praticato dalla Banca al momento della rata; ciò implica un ricalcolo semestrale della rata da pagare, che sarà più alta se il tasso corrente cresce e sarà più bassa se il tasso decresce. Più interessante, almeno dal punto di vista matematico, è l’altro caso; la Banca fissa per gli anni di restituzione un tasso annuo r (di regola più alto di quello corrente) e calcola le rate, di importo costante x, secondo tale tasso. Vediamo come si esegue il calcolo. Alla fine del primo periodo (che per fissare le idee e seguendo l’uso stabiliamo essere un semestre), il capitale iniziale C0 sarà cresciuto secondo il tasso di interesse a C0 (1 + r/2), ma pagando la rate x ci si riporta a un nuovo capitale: ³ r´ C1 = C0 1 + − x. 2 Si riparte cosı̀ per il secondo periodo di sei mesi con C1 e un ragionamento analogo ci porta a un capitale da restituire dopo il secondo pagamento pari a: ³ ³ ³ r´ r´ r ´2 C2 = C1 1 + −x 1 + −x = C0 1 + −x. 2 2 2 Alla fine dei successivi sei mesi il capitale da restituire sarà: ³ r´ C3 = C2 1 + −x= 2 ³ ³ ³ r ´2 r´ r ´3 −x 1+ −x 1+ − x. = C0 1 + 2 2 2 Cosı̀ continuando, alla fine dei 2n periodi semestrali corrispondenti alla durata del prestito, si arriva a: ³ r´ C2n = C2n−1 1 + −x= 2 ³ ³ ³ r ´2n r ´2n−1 r´ = C0 1 + −x. −x 1 + −· · ·−x 1 + 2 2 2 Poiché a questo punto il prestito deve risultare restituito completamente, occorre che sia C2n = 0, e questo ci permette di calcolare il valore di x. La precedente equazione si scrive infatti: ³ r ´2n = C0 1 + 2 ¶ µ³ r ´2n−2 r ´2n−1 ³ + 1+ + ··· + 1 . =x 1+ 2 2 L’espressione compresa nelle ultime due parentesi è una progressione geometrica di ragione 1 + r/2 e quindi sappiamo come calcolarla: ³ (1 + r/2)2n − 1 r ´2n =x C0 1 + 2 1 + r/2 − 1 e da questo si ricava il valore della rata: x= C0 (1 + r/2)2n r/2 . (1 + r/2)2n − 1 Facciamo un esempio, per renderci conto di ciò che può dare questa formula. Se avete bisogno di 50. 000 e (la Banca, per quanto detto, vi darà un po’ di meno, trattenendo le sue spese) e riuscite ad avere un tasso fisso del 6% per restituire il tutto in 15 anni, la rata sarà: x= 0.03 × 50000 × 1.0330 ≈ 2550.96. 1.0330 − 1 Dovete quindi prepararvi a dare alla banca questa cifra ogni sei mesi (più di 400 e al mese da risparmiare). Alla fine dei 15 anni avrete restituito più di 76. 528 e, cioè avrete pagato per interessi ben 26. 528 e, ma questo, si sa, fa parte del gioco, anche se ne è la parte meno piacevole. Capitolo 4 Matematiche finite Mi pareva che il calcolo in se stesso servisse molto poco e non avesse affatto quell’importanza che molti giocatori gli attribuiscono. Essi se ne stanno seduti davanti a foglietti di carta rigata, segnano i colpi, contano, deducono le probabilità, fanno calcoli e infine puntano e perdono come noi, semplici mortali, che giochiamo senza calcoli. In compenso ho tratto una conclusione che mi pare giusta: realmente, nel susseguirsi delle probabilità favorevoli c’è, se non un sistema, un certo quale ordine, il che è, naturalmente, molto strano. F. Dostoevskij Il giocatore Il calcolo combinatorio è la parte della Matematica che conosco un po’ meglio, poiché è in questo settore, applicato all’Informatica, che lavoro e pubblico i miei articoli. Per questo motivo, voglio rifarmi alle parole di un vero matematico per presentare l’argomento. Jean Dieudonné è uno, se non il primo, dei matematici reali che costituiscono il matematico virtuale Nicolas Bourbaki, la cui opera, a partire dal 1935, è riuscita a sistematizzare grande parte della Matematica attuale, attraverso il concetto di “struttura” e mediante un formalismo molto spinto. Alla metà degli anni 1980, Dieudonné ha scritto un libro di divulgazione matematica che intitolò “Pour l’honneur de l’esprit humaine”; nella presentazione di uno schema dei vari settori della Matematica moderna, dedica alla Combinatoria le seguenti parole, che cito dalla traduzione italiana “L’arte dei numeri” a pagina 143: “Inizialmente si può dire che ciò che si indica con questo nome [la Combinatoria] costituiva una parte della teoria degli insiemi, cioè la teoria degli insiemi finiti, e i problemi relativi alla valutazione del numero di elementi di insiemi di questo tipo costruiti mediante procedimenti diversi; alcuni di questi problemi risalgono all’antichità, per esempio il numero delle coppie di elementi di un insieme di n elementi, uguale ad n(n − 1)/2; [. . .] un altro esempio [è] il calcolo del numero n! delle permutazioni di un insieme di n elementi.” “I metodi collegati a questi problemi sono stati a 99 lungo considerati di scarso interesse da molti matematici, che li collocavano volentieri nel settore che prende il nome di ‘giochi matematici’, a cui sono appassionati molti lettori di divulgazione scientifica. Ma nel volgere di poche dozzine d’anni la situazione è notevolmente cambiata: ci si è accorti che certi metodi ‘combinatori’ potevano avere importanti applicazioni in settori della Matematica del tutto ‘rispettabili’, come la teoria dei gruppi, la teoria delle algebre di Lie, la geometria algebrica e la topologia algebrica; sono stati utilizzati con successo perfino in varie applicazioni della Matematica, tra cui l’Informatica.” La Combinatoria o Analisi Combinatoria, o anche Calcolo Combinatorio, è, come dice Dieudonné, lo studio delle proprietà degli insiemi finiti. Pertanto, problemi combinatori vengono fuori ogni volta che consideriamo insiemi e strutture finite, per le quali essere composte da un numero finito di oggetti è essenziale; vedremo, come esempi, la schedina del totocalcio o il gioco del lotto. Se le partite della schedina fossero infinite o fossero infiniti i numeri del lotto, tali giochi non esisterebbero nemmeno oppure nessuno li prenderebbe in considerazione. Ma, come dice ancora Dieudonné, l’ambito dell’Analisi Combinatoria è ben più ampio di quello dei giochi; un’applicazione molto importante è legata al Calcolo delle Probabilità, almeno nelle impostazioni insiemistica e frequentistica. Per questo, dedicheremo parte del Capitolo alle nozioni di base del Calcolo delle Probabilità, lasciando al lettore il problema di approfondire (quando sarà il momento) quegli aspetti legati alla Teoria della Misura e che possono essere affrontati solo dopo aver studiato il Calcolo Integrale. 4.1 Calcolo combinatorio Il problema più semplice dell’analisi combinatoria è certamente quello di contare gli elementi di un insieme, e su questo abbiamo discusso in abbondanza al momento opportuno. Vediamo pertanto problemi un po’ più complessi. Sia A = {a1 , a2 , . . . , an } un insieme di n elementi e consideriamo le possibi- 100 li sequenze di elementi di A, cioè le parole su A, come abbiamo visto nella Sezione 1.8. Ad esempio, se A = {a, b, c} le sequenze di lunghezza 2 sono [a, a], [a, b], [a, c], [b, a], [b, b], [b, c], [c, a], [c, b], [c, c], cioè 9 in tutto. E’ facile vedere che le sequenze di lunghezza 3 sono 27 e quelle di lunghezza 4, 81. Possiamo anche osservare che le sequenze di elementi di A di lunghezza 1 sono esattamente n, essendo in corrispondenza biunivoca con gli elementi di A: [a1 ], [a2 ], . . . , [an ]. L’unica sequenza di lunghezza 0 è la sequenza vuota [ ] e quindi in generale abbiamo: CAPITOLO 4. MATEMATICHE FINITE stinti di A; di nuovo, se A = {a, b, c}, tali sequenze di lunghezza k, dette disposizioni a k a k, per k = 2 sono: [a, b], [a, c], [b, a], [b, c], [c, a], [c, b], poiché nessun elemento può essere ripetuto. Dette Dn,k le disposizioni a k a k, è facile dimostrare: Teorema 4.2 Se A è un insieme di n elementi, le disposizioni a k a k di tali elementi sono: Dn,k = n(n − 1) · · · (n − k + 1). Prova: Il primo elemento della sequenza può essere uno qualsiasi degli n elementi dell’insieme. Il secondo elemento può essere uno degli n elementi, escluso Teorema 4.1 Il numero delle sequenze di lunghezza quello che ha occupato la prima posizione: quindi vi m degli elementi di un insieme A di cardinalità n è sono n(n − 1) possibili sequenze di 2 elementi, o diesattamente nm . sposizioni a 2 a 2. Analogamente, il terzo elemento Prova: I due casi m = 0 ed m = 1 sono stati vi- può essere uno qualsiasi degli n elementi di A eccetsti in precedenza; se m > 1, nella prima posizione to i due che hanno occupato i primi due posti: si della sequenza possiamo mettere uno qualsiasi degli hanno quindi n(n − 1)(n − 2) disposizioni a 3 a 3. n elementi; indipendentemente da questa, nella se- Continuando, si ottiene la formula desiderata. conda posizione possiamo ancora inserire uno degli E’ chiaro che disposizioni con più di n elementi n elementi ottenendo cosı̀ n2 sequenze di 2 elementi. non sono possibili; le disposizioni ad n ad n hanno Come terzo elemento possiamo inserire uno degli n un interesse particolare e si dicono permutazioni. Ad elementi ottenendo n3 sequenze di 3 elementi, e cosı̀ esempio, le permutazioni di un insieme con 3 elementi via fino ad m. Naturalmente, questa dimostrazione sono: [a, b, c], [a, c, b], [b, a, c], [b, c, a], [c, a, b], [c, b, a] e potrebbe espremersi in modo più formale usando il dalla formula si ha D3,3 = 3×2×1 = 6. L’insieme delprincipio di induzione, ma accontentiamoci di quanto le permutazioni di un insieme di n elementi si indica detto. con Pn e il numero dei suoi elementi è n(n−1) · · · 2·1; per la sua importanza, questo numero che abbiamo Questo teorema permette di risolvere qualche progià introdotto ha una speciale notazione: esso si inblema pratico di tipo elementare. Ad esempio, quante dica con il simbolo n! che si legge “n fattoriale”. Un sono le possibili schedine del Totocalcio? Una schesemplice esempio è costituito dai possibili anagramdina può essere vista come una sequenza di lunghezmi della parola spero; come sequenza di 5 lettere, si za 13 dell’insieme {1, X, 2} e quindi il teorema ci dà hanno 5! = 120 permutazioni; di queste, alcune come 13 . . come numero complessivo 3 = 1 594 323. Questo spore, preso, perso hanno un senso compiuto; alsignifica che se avessimo a disposizione tanto denatre, come eoprs e reops sono semplici accostamenti ro da poter giocare tutto questo milione e mezzo di di lettere. schedine saremmo sicuri di fare un 13 e tredici 12. Per definizione si ha 1! = 1 e per convenzione si Naturalmente, il numero 13 è stato scelto in modo da pone 0! = 1. I fattoriali crescono molto rapidamente, non rendere conveniente una strategia del genere. come si vede dalla seguente tabella: Questo è un caso molto semplice; talvolta il ragionamento può essere più complesso. Ad esempio, ci possiamo chiedere quanti sono i possibili sottoinsiemi di un insieme di n elementi. Usiamo per questo il concetto di funzione caratteristica, già introdotto nel Capitolo 1. Ad ogni sottoinsieme possiamo associare una sequenza di lunghezza n composta da 0 ed 1 con questa proprietà: se A = {a1 , a2 , . . . , an } e B ⊆ A, il j-esimo elemento della sequenza corrispondente a B è 1 se e solo se aj ∈ B (altrimenti, questo elemento è 0). Ad esempio, se A = {a, b, c, d} e B = {a, c}, abbiamo la sequenza χB = [1, 0, 1, 0], e se B = ∅ abbiamo χB = [0, 0, 0, 0]. Si vede allora che i sottoinsiemi sono tanti quanti queste sequenze, che per il teorema precedente sono esattamente 2n . Un problema diverso, anche se analogo, è quello di contare le sequenze ottenute con elementi di- 1! 2! 3! 4! 5! 1 2 6 24 120 6! 7! 8! 9! 10! 720 5040 40320 362880 3628800 Si veda la Sezione 1.5 per il valore esatto di 100!; si veda anche la nota alla fine di questa sezione per il valore approssimato di n!. Il concetto più importante dell’analisi combinatoria è tuttavia quello di “combinazione”. Sia A un insieme di n elementi; si dicono combinazioni a k a k degli elementi di A i sottoinsiemi di A contenenti esattamente k elementi. Ad esempio, se A = {a, b, c}, le combinazioni a 2 a 2 sono i sottoinsiemi {a, b}, {a, c}, {b, c}. Le combinazioni differiscono dalle disposizioni per il 101 4.1. CALCOLO COMBINATORIO semplice fatto che le prime non tengono conto dell’ordine; cosı̀ abbiamo le disposizioni [a, b] e [b, a], ma solo la combinazione {a, b}. Questo ci dà un semplice metodo per contare quante sono le combinazioni a k a k di un insieme di n elementi: Teorema 4.3 Se A è un insieme di n elementi, i sottoinsiemi di A contenenti esattamente k elementi sono: n(n − 1) · · · (n − k + 1) . Cn,k = k! Prova: Se Cn,k sono le combinazioni che dobbiamo contare, si osservi, come s’è fatto, che ad ogni combinazione corrispondono più disposizioni; in effetti, da una combinazione si ottengono disposizioni permutando in tutti i modi possibili gli elementi del sottoinsieme. Ma se il sottoinsieme ha k elementi, le sue possibili permutazioni sono k! e quindi si ha: k!Cn,k = Dn,k . Da questa si ha la formula desiderata, quando si sostituisca a Dn,k il valore precedentemente trovato. I numeri Cn,k si dicono coefficienti binomiali perché legati alle potenze di un binomio, come vedremo nella Sezione 5.1. Esiste una notazione accettata universalmente: µ ¶ n n(n − 1) · · · (n − k + 1) = Cn,k = k! k 0 1 2 3 4 5 6 0 1 1 1 1 1 1 1 1 2 3 4 5 6 1 2 3 4 5 6 1 3 6 10 15 1 4 10 20 1 5 15 1 6 1 Tabella 4.1: Il triangolo aritmetico Europa e nel mondo arabo. Sicuramente, i coefficienti binomiali sono le quantità più utilizzate in tutta la Matematica, in quanto legati alla numerazione dei sottoinsiemi di un insieme. Come si costruisce il triangolo aritmetico? Intanto osserviamo che la prima colonna e la diagonale principale sono composte unicamente da 1: µ ¶ µ ¶ n n =1 ∀n ∈ N. =1 n 0 Infatti, il primo di questi coefficienti binomiali conta i sottoinsiemi di 0 elementi di un insieme di n elementi, ma tale è solo l’insieme vuoto (anche quando n = 0). Per il secondo, si osserva invece che l’unico sottoinsieme di n elementi di un insieme di n elementi è l’insieme stesso. Detto questo, ogni altro elemenche si legge “n su k”. Un semplice problema consiste to del triangolo è la somma dei due elementi che lo nel contare quanti ambi e quanti terni esistono nel sovrastano: quello nella riga precedente una posiziogioco del lotto; gli ambi sono i sottoinsiemi di due ne a sinistra e quello, ancora nella riga precedente, elementi dell’insieme dei primi 90 numeri; i terni sono ma proprio sopra di lui. Questo fatto si può dimoi sottoinsiemi di tre elementi. Quindi gli ambi sono: strare facilmente; qui ne diamo una prova combinatoria, cioè che fa uso della definizione dei coefficienti µ ¶ 90 × 89 90 binomiali come sottoinsiemi. Più avanti ne vedre= = 4005 2 2×1 mo una dimostrazione algebrica, che cioè fa uso delle proprietà numeriche dei coefficienti binomiali. e i terni: µ ¶ Teorema 4.4 Se n e k sono due interi positivi, si 90 90 × 89 × 88 = 117. 480. = ha: µ ¶ µ ¶ µ ¶ 3×2×1 3 n n−1 n−1 = + . k k k−1 Poiché su una ruota (ad esempio, Napoli) vengono estratti 5 numeri, questi corrispondono a: Prova: Prima di cominciare la dimostrazione, si sia µ ¶ µ ¶ certi di aver capito che questa identità corrisponde 5 5 = 10 ambi e a = 10 terni diversi. alla proprietà del triangolo aritmetico enunciata più 2 3 sopra. Si consideri allora un insieme A di n elemenI coefficienti binomiali si possono disporre in un ti e se ne isoli un elemento particolare, diciamo a. triangolo numerico infinito, noto come Triangolo di I sottoinsiemi di ¡A¢ composti di k elementi (che per Tartaglia o triangolo di Pascal, o, per antonomasia, definizione sono nk ) si dividono in due classi: quelcome triangolo aritmetico (si veda la Tabella 4.1). li che contengono a e quelli che non lo contengono. Tartaglia lo aveva scoperto nella prima metà del 1500; Sono due classi chiaramente disgiunte e che esauriPascal l’aveva riscoperto intorno al 1650, quando si scono tutti i sottoinsiemi considerati; basta allora diinteressava alle prime ricerche sul calcolo delle pro- mostrare che le loro cardinalità sono proprio quelle babilità. In realtà, esso era già noto ai cinesi del che formano il membro destro della formula dell’e1200 e se ne possono trovare anticipazioni anche in nunciato. Consideriamo la classe A1 dei sottoinsiemi 102 CAPITOLO 4. MATEMATICHE FINITE che contengono a e immaginiamo di togliere a da A e denominatore per (n − k)!, si ha: e da questi sottoinsiemi: ciò che si ottiene sono i sotµ ¶ n n(n − 1) · · · (n − k + 1) toinsiemi di k − 1 elementi dell’insieme A \ {a}, un = = k k! insieme di n−1 elementi (è facile vedere che sono proprio tutti: ¡ basta ¢ aggiungere di nuovo a); quindi A1 n(n − 1) · · · (n − k + 1) (n − k) · · · 2 · 1 = = contiene n−1 k−1 elementi. Per la classe A2 dei sottoink! (n − k) · · · 2 · 1 siemi che non contengono a, eliminare a da A vuol n! dire ottenere i sottoinsiemi di k elementi dell’insieme ¡ ¢ (4.1) = A \ {a} di n − 1 elementi; questi sono in tutto n−1 , k!(n − k)! k e il teorema è dimostrato. e questo permette di esprimere i coefficienti binomiali in termini del solo fattoriale. Da questo discende la Nota 4.1 Un problema che avevamo lasciato vo- proprietà di simmetria: lutamente in sospeso è il seguente: se si ha una parola formata da n lettere diverse, i suoi anagrammi sono n!, ma se la parola contiene alcune lettere uguali? Ad esempio, con non si possono comporre solamente onn e nno, cioè vi sono in tutto tre possibilità contro le sei di ahi e di mio. E se volessimo sapere quanti sono gli anagrammi di abracadabra?. Vale il seguente: Teorema 4.5 Sia A = {a1 , a2 , . . . , an } un insieme di n elementi e si considerino k1 repliche di a1 , k2 repliche di a2 , . . . , kn repliche di an . Il numero delle sequenze distinte che si possono formare utilizzando tutte queste repliche degli elementi di A è: (k1 + k2 + · · · + kn )! . k1 ! k2 ! · · · kn ! Prova: Cominciamo col distinguere le varie repliche degli elementi di A, di modo che ci appaiano come elementi distinti. In questo caso le sequenze distinte che si ottengono sono le permutazioni di tutti gli elementi (con le loro repliche), cioè sono (k1 + k2 + · · · + kn )!. Eliminiamo ora la distinzione tra le varie repliche di a1 ; questo significa che tutte le sequenza distinte perché avevano repliche distinte di a1 nelle stesse posizioni, collassano nella medesima sequenza; ma tali sequenze si distinguono solo per l’ordine assunto dalle k1 repliche di a1 e quindi sono k1 !. Questo vuol dire che, togliendo la distinzione tra le repliche di a1 , si hanno (k1 + k2 + · · · + kn )!/k1 ! sequenze. Procedendo nello stesso modo per le repliche di a2 si passa a (k1 + k2 + · · · + kn )!/(k1 ! k2 !) sequenze. Alla fine, naturalmente, si ottiene la formula desiderata. Nel caso di abracadabra si hanno 5 repliche di a, 2 repliche di b e di r, 1 replica di c e di d; naturalmente, k1 + k2 + · · · + kn è la lunghezza della parola e quindi i possibili anagrammi sono: Teorema 4.6 Per ogni valore di n e k ≤ n si ha: ¶ µ ¶ µ n n . = k n−k Prova: Passando alla espressione con i fattoriali, si ha: ¶ µ n! n = = n−k (n − k)!(n − (n − k))! µ ¶ n n! = = (n − k)!k! k come si voleva. Questa proprietà ¡ ¢ è interessante perché, ad esempio, per calcolare 20 17 dalla definizione occorre eseguire 32 prodotti, o addirittura 40 se applichiamo la formula (4.1). Ma per la simmetria si ha: µ ¶ µ ¶ 20 20 · 19 · 18 20 = = = 1140. 3 17 6 Si osservino i seguenti casi particolari: µ ¶ µ ¶ n n =n =n 1 n−1 ¶ µ µ ¶ n n(n − 1) n . = = n−2 2 2 La dimostrazione algebrica del Teorema 4.4 è ora semplice, anche se richiede un po’ di attenzione poiché si tratta di aggiungere e togliere fattori da certe frazioni: µ ¶ µ ¶ n−1 n−1 (n − 1) · · · (n − k + 1) + + = (k − 1)! k−1 k (n − 1) · · · (n − k + 1)(n − k) ; k! moltiplichiamo e dividiamo la prima frazione per k, la maggior parte dei quali non ha nessun senso ottenendo k! a denominatore. Le due espressioni sono compiuto. ora uguali eccetto per un fattore k nella prima e un fattore (n − k) nella seconda; ma la somma è proprio n, per cui: ¶ ¶ µ µ Alcune proprietà dei coefficienti binomiali sono den−1 n−1 = + gne d’attenzione. Intanto, moltiplicando numeratore k k−1 11! = 83160, 5! 2! 1! 1! 2! + 103 4.2. PERMUTAZIONI (k + n − k)(n − 1) · · · (n − k + 1) = = k! Un’altra proprietà è: µ ¶ n . k Teorema 4.7 Per ogni valore di n e k ≤ n si ha: µ ¶ µ ¶ n n n−1 = k k−1 k Questa formula si prova in modo quasi immediato, una volta accettata l’approssimazione di Stirling e pertanto lasciamo la dimostrazione alla buona volontà del lettore. 4.2 Permutazioni Prova: Applicando la definizione: µ ¶ n n(n − 1) · · · (n − k + 1) = = k k! Le permutazioni, che abbiamo introdotto nella precedente sezione, meritano un’attenzione speciale, e ad esse dedicheremo ora un po’ di spazio. Permutare gli elementi dell’insieme {a, b, c} o quelli dell’insieme {1, 2, 3} è la stessa cosa, una volta che abbiamo n (n − 1) · · · (n − k + 1) = identificato, ad esempio, a con 1, b con 2 e c con 3. k (k − 1)! Pertanto, d’ora in avanti, salvo avviso contrario, concome desiderato. sidereremo l’insieme di n elementi Nn = {1, 2, · · · , n} e le permutazioni su di esso. La classe di tutte le Questa formula fornisce un metodo efficiente per calpermutazioni di tale insieme si indica con Pn ; le percolare i coefficienti binomiali mediante il calcolatore. mutazioni stesse hanno varie notazioni, delle quali è Si ha infatti: bene conoscere le tre principali. Algoritmo 4.1 (Coefficienti binomiali) Osserviamo prima di tutto che l’aver definito le perIngresso: due numeri naturali n,¡k ¢con n ≥ k; mutazioni per mezzo delle disposizioni dà immediaUscita: il coefficiente binomiale nk . tamente un ovvio modo di scriverle: in testa il primo 1. se k > n/2 si pone k := n − k [si applica la elemento scelto, poi il secondo e cosı̀ via. Si ottiene cosı̀ una lista, nella quale l’ordine degli elementi proprietà di simmetria]; è essenziale, perché indica l’ordine di scelta. Pertan2. se k = 0 si esce col risultato 1; to, (3, 2, 1) è una permutazione diversa da (2, 1, 3) e da (1, 3, 2); come si vede, gli elementi si raggruppa3. altrimenti, si pone m := n, h := k ed r := 1 e no tra parentesi tonde, ed in effetti una permutazioquindi: ne cosı̀ scritta è una n-upla o un vettore, e il modo di rappresentarla si dice notazione vettoriale. Le sei (a) si calcola r := r · m/h; permutazioni di P3 si denotano: (b) si diminuiscono m ed h di 1; (c) se h 6= 0 si cicla tornando al punto 3a; 4. si esce col valore r = Cn,k . (1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1). Si osservi che per scrivere sistematicamente tutte le permutazioni di Pn si può fissare il primo elemenI coefficienti binomiali che richiedono più temto, facendolo variare da 1 ad n, e scrivendogli accanto po per il calcolo ¡2n¢sono i cosiddetti coefficienti bino- tutte le permutazioni degli altri n − 1 elementi, che miali centrali n ; infatti, per essi la proprietà di (tenendo presente l’elemento messo in prima posiziosimmetria non fornisce alcun aiuto. ne) si ottengono esattamente nella stessa maniera. In Nota 4.2 Verso il 1730 il matematico inglese Ja- questo modo abbiamo scritto le permutazioni di P3 e mes Stirling trovò una formula approssimata per invitiamo il lettore a fare lo stesso per le 24 permutan!: ³ n ´n zioni di P4 . La notazione vettoriale è particolarmente √ n! ≈ 2πn utile quando si trattano le permutazioni con l’elaboe dove e = 2.7182818284 . . . è la base dei logaritmi na- ratore, dove i vettori sono una “struttura dati” molto turali. Ad esempio, per n = 10 il valore vero è quello semplice da definire ed utilizzare. Essa, tuttavia, non visibile nella precedente tabella sui fattoriali, mentre è la notazione preferita dai matematici. la formula di Stirling dà: 3. 598. 695.62, con un erroUn attimo di riflessione ci fa capire che una permure dello 0.84%. Purtroppo, la dimostrazione di questa tazione è una funzione di Nn con sé stesso: scegliere formula famosissima va al di là della struttura elemen- un primo elemento vuol dire associare al numero 1 tare di questo testo. La formula di Stirling ci permet- proprio quell’elemento; scegliere un secondo elemente di trovare un valore approssimato per i coefficienti to significa associare tale elemento al numero 2, e binomiali centrali: cosı̀ di seguito. Abbiamo visto che tutte le funzioni à ! (2n)! 4n 2n Nn → Nn sono nn , mentre le permutazioni non sono ≈ √ . = n!2 n proprio tutte le funzioni, poiché le immagini devono πn 104 essere tutte differenti; questo ci dice che n! ≤ nn (in effetti, per n > 2 si ha n! < nn ). Ma a quali funzioni corrispondono le permutazioni? Il fatto che le immagini debbano essere tutte diverse ci dice che siamo di fronte a funzioni iniettive; poiché poi, per costruzione, una permutazione prende tutti gli elementi del suo codominio Nn , le funzioni sono anche surgettive. Concludendo, le permutazioni di Nn sono tutte e sole le corrispondenze biunivoche di Nn . Questa è la definizione preferita dai matematici ed essa ci porta immediatamente a un altro tipo di notazione: la notazione funzionale. Si scrivono i numeri da 1 ad n su una riga e, sotto ad ognuno di essi, si scrive l’elemento corrispondente nella permutazione, cioè l’immagine nella corrispondenza biunivoca. Le 6 permutazioni di P3 sono: µ ¶ µ ¶ µ ¶ 1 2 3 1 2 3 1 2 3 1 2 3 1 3 2 2 1 3 µ ¶ µ ¶ µ ¶ 1 2 3 1 2 3 1 2 3 . 2 3 1 3 1 2 3 2 1 Per scrivere le permutazioni, c’è ancora un altro modo che fa furore in Matematica. Prendiamo l’ultima delle sei permutazioni e partiamo dal numero 1; la sua immagine è il 3, e l’immagine di questo è ancora 1. Con un modo di dire caratteristico, ciò si esprime cosı̀: l’1 va nel 3 e il 3 va nell’1. Se prendiamo una permutazione di P8 : µ ¶ 1 2 3 4 5 6 7 8 5 4 8 6 3 2 1 7 abbiamo una catena più lunga: l’1 va nel 5, il 5 va nel 3, il 3 va nell’8, l’8 va nel 7, e infine il 7 va (o torna) nell’1. Una catena siffatta si dice tecnicamente un ciclo, e in questa permutazione ne troviamo un secondo, composto da 2, 4 e 6. Un ciclo si può ridurre a un elemento solo, come il 2 nell’ultima permutazione di P3 ; in questo caso l’elemento si dice un punto fisso della permutazione. Dovrebbe essere chiaro che una permutazione è composta sempre da un numero finito di cicli, e due cicli, o contengono gli stessi elementi o sono disgiunti tra di loro. Questo permette di definire una notazione a cicli per le permutazioni: ogni ciclo si scrive tra parentesi tonde, a partire dall’elemento più piccolo. La precedente permutazione di P8 viene denotata come (1 5 3 8 7) (2 4 6) e le solite permutazioni di P3 sono: (1)(2)(3), (1)(2 3), (1 2)(3), (1 2 3), (1 3 2), (1 3)(2). I punti fissi spesso non si scrivono; l’unica eccezione è la permutazione composta di tutti punti fissi; essa si scrive semplicemente (1), ignorando gli altri elementi. Si osservi che, per convenzione, la separazione fra due elementi di un ciclo è data da uno spazio bianco; CAPITOLO 4. MATEMATICHE FINITE questo infatti permette di distinguere la permutazione (1 3 2), formata da un unico ciclo, dalla notazione vettoriale (1, 3, 2) che rappresenta una permutazione completamente diversa. Con le convenzioni adottate, scrivere un ciclo con in testa l’elemento più piccolo e ordinare i cicli secondo il primo elemento, fa sı̀ che la rappresentazione a cicli di una permutazione sia unica. E’ bene avvertire, tuttavia, che non sempre si adotta tale convenzione e capiterà anche a noi di considerare cicli non disgiunti e/o non ordinati. Questa lunga premessa notazionale è indispensabile, perché occorre avere ben presenti le tre notazioni e saper passare agilmente dall’una all’altra. Infatti, a seconda di come si vuol trattare una permutazione (o un insieme di permutazioni) conviene ricorrere a una notazione specifica. Veniamo ora ad effettive proprietà delle permutazioni. In ogni insieme Pn c’è sempre una permutazione nella quale ogni elemento ha sé stesso come immagine; questo significa che ogni elemento è un punto fisso o, nella definizione con le disposizioni, alla scelta k-esima si prende proprio il numero k. Questa speciale permutazione si chiama identità e, come ora vedremo, ha un ruolo particolare. La preferenza dei matematici per l’aspetto funzionale delle permutazioni non è ovviamente dovuta a qualche ghiribizzo; queste serissime persone agiscono a ragion veduta e sanno bene che per le funzioni in generale (e quindi per le permutazioni in particolare) è possibile considerare un’operazione speciale: la composizione (v. Sezione 1.3). Si considerino le seguenti permutazioni di P5 : µ ¶ µ ¶ 1 2 3 4 5 1 2 3 4 5 π= ρ= . 3 5 2 1 4 4 2 5 1 3 Ricordiamo che la composizione di due funzioni π e ρ avviene cosı̀: si prende un qualsiasi elemento x nel dominio di π e se ne considera l’immagine π(x); se questa appartiene al dominio di ρ, le si applica la stessa ρ ottenendo ρ(π(x)), che, per definizione, è l’immagine di x secondo la composizione π ◦ ρ, cioè: (π ◦ ρ)(x) = ρ(π(x)). Si dice allora composizione o prodotto di due permutazioni la loro composizione come funzioni. Per le permutazioni in Pn dominio e codominio coincidono, e quindi la composizione è sempre possibile e applicabile a tutti gli elementi. Si ha pertanto: µ ¶ µ ¶ 1 2 3 4 5 1 2 3 4 5 π◦ρ = ◦ = 3 5 2 1 4 4 2 5 1 3 µ ¶ 1 2 3 4 5 = . 5 3 2 4 1 Infatti, l’immagine di 1 secondo π è 3, e l’immagine di 3 secondo ρ è 5, di modo che ρ(π(1)) = 5. Per gli altri elementi si procede in modo analogo. Quella che si ottiene è ancora una permutazione di P5 , 4.2. PERMUTAZIONI in quanto, come sappiamo, la composizione di due corrispondenze biunivoche è ancora biunivoca. L’operazione di composizione è allora chiusa in Pn , e ci possiamo chiedere di quali altre proprietà essa goda. E’ facile vedere che la composizione è associativa, cioè che date tre permutazioni di Pn , diciamo π, ρ, σ, si ha π ◦ (ρ ◦ σ) = (π ◦ ρ) ◦ σ: in effetti, considerato un qualsiasi elemento k ∈ Nn , comunque si costruisca la composizione, il risultato finale è sempre σ(ρ(π(k))). Non vale invece la proprietà commutativa; un unico esempio, cio‘e un controesempio, è sufficiente a farci vedere che in generale è π ◦ ρ 6= ρ ◦ π. Prendendo le due permutazioni di P5 già considerate si ha: µ ¶ µ ¶ 1 2 3 4 5 1 2 3 4 5 ρ◦π = ◦ = 4 2 5 1 3 3 5 2 1 4 105 infiniti; ad esempio, sono tali Z, l’insieme dei numeri interi con l’operazione di somma; i numeri razionali positivi Q+ con l’operazione di prodotto; i numeri reali positivi R+ con la stessa operazione, e cosı̀ via. Una permutazione che si riduca allo scambio di due elementi si dice una trasposizione; ad esempio, in P5 una trasposizione è: µ ¶ 1 2 3 4 5 ; 1 5 3 4 2 nella notazione a cicli essa si scrive semplicemente (2 5), in quanto i due elementi che si scambiano formano un ciclo, tutti gli altri sono punti fissi. E’ interessante osservare che un ciclo può sempre essere immaginato come il risultato (cioè, la composizione) µ ¶ 1 2 3 4 5 di un certo numero di trasposizioni. Ad esempio, = 6= π ◦ ρ. 1 5 4 3 2 (2 5 3), per cui 2 va in 5 e questi va in 3, può esLa permutazione con tutti punti fissi, che abbia- sere visto come la trasposizione (2 3) composta con mo chiamato identità, si comporta come tale nella l’altra trasposizione (3 5). Infatti abbiamo: composizione; infatti, essa manda ogni elemento in 1. il 2 va in 3 e questo va in 5, cioè, nella sé stesso e quindi lascia invariata la destinazione che composizione, il 2 va nel 5; ogni altra permutazione ha assegnato a ciascun ele2. il 3 va nel 2 e poi questo rimane fisso nella mento, cioè: (1) ◦ π = π ◦ (1) = π. Questo giustifica seconda trasposizione; il nome che le abbiamo dato. Ciò che però è più interessante è il fatto che ogni permutazione π abbia un 3. il 5 rimane fisso nella prima trasposizione e poi inverso, cioè una permutazione, indicata da π −1 , tale va nel 3. che π ◦ π −1 = π −1 ◦ π = (1). Si scambino infatti le due linee che definiscono π nella notazione funzionale Tutti gli altri elementi rimangono fissi, ma l’osservae si riordinino gli elementi in modo da far appari- zione vale in generale, anche se gli altri elementi core in sequenza quelli della linea divenuta superiore, stituiscono cicli per proprio conto (purché non intere cambiando di posizione anche i corrispondenti ele- feriscano con quello considerato). Esiste una regola menti della linea inferiore. Per la permutazione π già generale per capire da quali trasposizioni è composto considerata, si ha ad esempio: un ciclo (a b c . . . m n): basta considerare il prodotto µ ¶ µ ¶ (a n)(n m) · · · (d c)(c b). A parte la prima trasposi3 5 2 1 4 1 2 3 4 5 π −1 = = . zione, nella quale il primo elemento va nell’ultimo, 1 2 3 4 5 4 3 1 5 2 le altre mandano ogni elemento nel precedente. Eseguendo la composizione, a va in n, che va in m, che Questa nuova permutazione gode della seguente va . . ., che va in d, che va in c, che va in b: in conproprietà derivata proprio dalla sua costruzione: se π clusione, a va in b. A questo punto b va in c, il che manda k in h, allora π −1 manda h in k. Quando si va è definitivo poiché c non è presente in trasposizioni a fare la composizione, pertanto, k va in h e e questo successive. Cosı̀ c va in d, non più coinvolto nelle tratorna in k, cioè è un punto fisso. Ciò accade per ogni sposizioni successive, e via di seguito. Infine, n va in k ∈ Nn , e perciò π ◦ π −1 = (1). Analogamente si a, chiudendo il ciclo, come si voleva. trova π −1 ◦ π = (1). Riprendendo come esempio la permutazione di P8 vista sopra, possiamo scrivere: Nota 4.3 Queste, come vedremo nella Sezione 5.8, sono le proprietà di gruppo (non commutativo). I gruppi sono la più importante struttura algebrica e, storicamente, i gruppi di permutazioni, cioè i nostri Pn , sono stati i primi considerati all’inizio del 1800. Essi costituiscono un importantissimo esempio di gruppi finiti, cioè contenenti un numero finito di elementi. Si può addirittura dimostrare che ogni gruppo finito è un sottogruppo di un gruppo di permutazioni. Si scoprirono poi anche gruppi (1 5 3 8 7)(2 4 6) = (1 7)(7 8)(8 3)(3 5)(2 6)(6 4) e il lettore è invitato caldamente ad eseguire il prodotto delle trasposizioni per verificare che la permutazione ottenuta è proprio quella di partenza. Quando abbiamo un punto fisso, osserviamo che anch’esso è esprimibile come prodotto di due trasposizioni; ad esempio, (1) = (1 2)(1 2). Anche 2 rimane fisso in 106 questo prodotto, il che è corretto: se 2 è un punto fisso di tutta la permutazione, rimane ancora fisso; se non lo è, queste due trasposizioni non cambiano nulla e nulla viene modificato in ciò che segue e in ciò che precede nell’espressione della permutazione. Abbiamo cosı̀ dimostrato: Teorema 4.8 Ogni permutazione può essere espressa come prodotto di trasposizioni. Un altro esempio, che coinvolge anche punti fissi, è: (1 4 6 7)(2)(5 9 8) = (1 7)(7 6)(6 4)(2 5)(2 5)(5 8)(8 9). In realtà, il teorema precedente può essere rafforzato nel modo seguente. Se a un prodotto di trasposizioni ne aggiungiamo 2 come (a b)(a b) il risultato non cambia; questo significa che una permutazione può essere scritta in vario modo come prodotto di trasposizioni; si può però dimostrare (anche se noi non lo facciamo) il seguente: Teorema 4.9 Se una permutazione π è esprimibile come numero pari (dispari) di trasposizione, ogni altra rappresentazione di π contiene un numero pari (dispari) di trasposizioni. Una permutazione si dice allora pari o dispari a seconda del numero di trasposizioni con cui può essere scritta. Poiché il prodotto π ◦ ρ si ottiene semplicemente scrivendo le trasposizioni di π seguite da quelle di ρ, si ha immediatamente: Teorema 4.10 Il prodotto di due permutazioni entrambi pari o entrambi dispari è sempre pari; il prodotto di una permutazione pari e una dispari (o viceversa) è sempre dispari. Una rappresentazione mediante trasposizioni della permutazione π contiene, per costruzione, cicli non disgiunti, cioè cicli nei quali un elemento può comparire più volte. Questo non è vero, come si è osservato, per la rappresentazione standard. Questa, per certe permutazioni, può essere composta da soli punti fissi e trasposizioni; detta π una tale permutazione, se si esegue il prodotto π◦π = π 2 si trova che: i) i punti fissi rimangono tali; ii) gli elementi di una trasposizione (a b), moltiplicando questa per sé stessa, divengono due punti fissi (a)(b). In conclusione, π 2 contiene solo punti fissi, cioè π 2 = (1). Una permutazione che gode di questa proprietà si dice una involuzione; risulta facile vedere che tutte e sole le involuzioni sono composte di cicli disgiunti di un solo elemento (punti fissi) e/o di due elementi (trasposizioni). Si provi ad esempio ad eseguire il quadrato di π ∈ P8 con π = (1 4)(2 5)(6 8). CAPITOLO 4. MATEMATICHE FINITE Nota 4.4 Le permutazioni hanno un ruolo fondamentale in molte parti dell’Informatica. Il problema dell’ordinamento consiste nel partire da una permutazione qualsiasi π ∈ Pn e trovare un algoritmo (più veloce possibile) che permetta di rimettere in ordine gli elementi di π. Il caso in cui il dominio di π sia Nn non è molto interessante, in quanto la soluzione è lo stesso Nn . Se invece il dominio di π è, ad esempio, un insieme di nomi, di numeri qualsiasi o di codici, il problema ha un interesse pratico effettivo e soluzioni non banali. Si pensi all’anagrafe di un comune, ai dipendenti di un’azienda, ai codici fiscali dei contribuenti, ai codici dei prodotti di un supermercato. In questi casi, elenchi disordinati non servono a nulla, come sono inutili dizionari non ordinati o elenchi telefonici con i nomi messi a caso. Per questo, ordinare un elenco è considerata un’operazione fondamentale, che oggi facciamo compiere agli elaboratori. Questi usano algoritmi molto veloci, e lo studio e la realizzazione di tali algoritmi costituiscono un problema di base dell’Informatica. Su di essi si sono cimentati scienziati di primo piano, che hanno proposto algoritmi oggi usati universalmente, anche se le ricerche in questo settore continuano senza tregua. Un altro importante problema in cui intervengono le permutazioni è quello cosiddetto del commesso viaggiatore. Un commesso viaggiatore, partendo da una città X (diciamo, la città in cui abita) deve visitare le città A1 , A2 , · · · , An , in un ordine che egli può scegliere, ma che, ovviamente, sia quello che gli procura meno spese. Il nostro commesso conosce i costi che gli si presenteranno in ogni tratta Ai Aj e quindi, teoricamente, potrebbe considerare tutte le n! possibili permutazioni, far eseguire all’elaboratore i relativi conteggi, e scegliere infine la permutazione per lui più conveniente. Purtroppo, il numero di permutazioni cresce, come s’è visto, in modo troppo veloce e già per un numero di città piuttosto limitato, come potrebbe essere 20, il numero di strade da tentare è dell’ordine di 1019 , un numero enorme anche per il più veloce dei nostri elaboratori. A tutt’oggi non si conoscono metodi migliori di quello (abbastanza ovvio) di tentare tutte le permutazioni per essere sicuri di trovare il percorso ottimo. Per questo il problema del commesso viaggiatore costituisce uno dei problemi difficili; tecnicamente, si dice un problema intrattabile o che fa parte dei problemi NP. Insieme al problema della scomposizione in fattori primi, a quello della soddisfacibilità dei predicati visto nella Nota 1.11 (e a tanti altri) è una delle bestie nere dell’Informatica. 4.3 Problemi combinatori I problemi dell’Analisi Combinatoria sono, in generale, problemi di conteggio e, come tali, possono sorgere in qualsiasi contesto; come s’è detto, si può affermare che l’Analisi Combinatoria si interessa degli insiemi 107 4.3. PROBLEMI COMBINATORI finiti, dei quali vuole contare i sottoinsiemi che posseggono una qualche proprietà caratteristica. Le disposizioni e le combinazioni sono esempi elementari, ma significativi; spesso si ha a che fare con situazioni particolari, come quando si desidera contare le possibili posizioni delle regine su una scacchiera, disponendole in modo che non si possano reciprocamente mangiare. In questi casi, il problema specifico viene generalizzato, e si cerca una formula che dia il numero di posizioni quando si hanno n regine e una scacchiera di n × n caselle. Quello, che è forse il più antico dei problemi combinatori, si trova citato in testi egizi e babilonesi; ha resistito ai secoli ed oggi si ritrova in forma di filastrocca in tanti paesi. In Italia suona cosı̀: Per una strada che mena a Camogli passava un uomo con sette mogli. E ogni moglie aveva sette sacche, e ogni sacca aveva sette gatte, e ogni gatta sette gattini. Fra gatti e gatte e sacchi e mogli, in quanti andavano, dite, a Camogli? Il lettore può usare i teoremi che abbiamo visto nella Sezione 3.2, relativamente alle progressioni geometriche, per risolvere la questione. Un problema combinatorio molto più interessante risale a Fibonacci, il quale inventò il seguente quesito: un contadino possiede una coppia di conigli appena nati; i conigli diventano fertili dopo un mese, e un mese è anche il loro periodo di gestazione. Ogni coppia di conigli genera ogni mese (eccetto il primo dopo la nascita, durante il quale giunge alla maturità sessuale) un’altra coppia di conigli. Pertanto, il contadino, all’inizio del secondo mese, avrà ancora un’unica coppia, ma all’inizio del terzo mese avrà due coppie. All’inizio del quarto mese, la prima coppia avrà generato una seconda coppia, e siamo cosı̀ a tre coppie. Al quinto mese, sia la coppia primigenia, sia la prima coppia generata avranno dei figli; in tal modo, le coppie saranno diventate cinque. Si chiede quante coppie di conigli possiederà il nostro contadino dopo n mesi, nell’ipotesi (abbastanza teorica) che nessun coniglio muoia, per cause naturali o alimentari? Sia Fn il numero di coppie di conigli in possesso del contadino all’inizio dell’n-esimo mese; all’inizio del successivo egli avrà queste n coppie, più le coppie nate quel mese; ma queste sono esattamente tante quante le coppie fertili all’n-esimo mese, cioè le coppie presenti il mese precedente, ovvero Fn−1 . Abbiamo quindi la relazione Fn+1 = Fn + Fn−1 , che possiamo considerare assieme alle condizioni iniziali F1 = 1 ed F2 = 1, le coppie di conigli possedute all’inizio del primo e del secondo mese. Abbiamo già incontrato questa sequenza di numeri e possiamo supporre F0 = 0 mantenendo tutte le caratteristiche viste. Questa storia giustifica il nome di “numeri di Fibonacci” dato agli elementi della sequenza. La soluzione del problema di Fibonacci è dato dal seguente: Teorema 4.11 L’n-esimo numero di Fibonacci vale: Ãà √ !n ! √ !n à 1 1− 5 1+ 5 Fn = √ − . 2 2 5 Prova: Procedendo per induzione, osserviamo che, dalla formula, discende subito F0 = 0 e: à √ ! √ 1 1+ 5−1+ 5 F1 = √ = 1. 2 5 Il lettore può continuare e verificare altri valori, ma questi due sono sufficienti come base del ragionamento. Supponiamo che ci siano valori di n per i quali la formula del teorema non sia valida; chiamiamo m il loro valore più piccolo, che deve esistere e deve essere maggiore di 1 per le verifiche fatte. Per m−1 ed m−2 la formula deve perciò essere valida e proviamo a calcolare Fm−1 + Fm−2 che per la proprietà dei numeri di Fibonacci deve essere uguale proprio ad Fm : Fm = Fm−1 + Fm−2 = à √ !m−1 √ !m−1 à 1− 5 1 1+ 5 − + =√ 2 2 5 à √ !m−2 à √ !m−2 1+ 5 1− 5 = + − 2 2 à √ !m−2 à √ ! 1+ 5 1 1+ 5 1+ + =√ 2 2 5 à √ ! √ !m−2 à 1− 5 1− 5 . 1+ − 2 2 Ora osserviamo che: à √ !2 √ √ 1+ 5 1+2 5+5 1+ 5 = = 1+ 2 4 2 √ e un’analoga identità vale per 1+(1− 5)/2. Pertanto si ha: Fm−1 + Fm−2 = Ãà √ !m à √ !m ! 1+ 5 1 1− 5 =√ = Fm − 2 2 5 contro l’ipotesi che per Fm non valesse questa formula. Questo dimostra che non esiste un valore di m, per cui la formula non valga, cioè, in altre parole, la formula è valida per ogni numero naturale n. 108 Questa dimostrazione, che abbiamo voluto portare avanti secondo la formulazione delle prove per induzione vista nel primo capitolo, mette in evidenza l’utilità e i limiti dell’induzione. I conti che abbiamo fatto sono elementari, e quindi ci convincono che la formula per Fn è proprio quella data dal teorema. Ma come ha fatto lo scopritore di questa formula a immaginare un’espressione del genere che, all’apparenza, è notevolmente complessa? In realtà si è arrivati alla scoperta della formula per tutt’altra via e, come abbiamo già avuto modo di dire, l’induzione non ci aiuta affatto a scoprire le formule. Si provi, ad esempio, ad immaginare una formula per Gn , definito dalla relazione Gn = Gn−1 + 2Gn−2 , apparentemente simile a quella dei numeri di Fibonacci. Anche se imponiamo le condizioni iniziali G0 = 0 e G1 = 1, la soluzione è completamente diversa. Essa è riportata in fondo a questa sezione ed è molto più semplice di quella dei numeri di Fibonacci. Se il lettore è comunque riuscito a scoprirla dopo aver osservato alcuni elementi della sequenza, merita i nostri complimenti. Va detto, tuttavia, che esistono metodi del tutto generali per trovare la soluzione di tutte le sequenze, i cui elementi sono definiti da ricorrenze del tipo visto. I conigli di Fibonacci o le mogli che vanno a Camogli ci mostrano che i problemi combinatori possono nascere in qualsiasi contesto. Per semplificarne l’analisi, e quindi la risoluzione, i matematici hanno proposto e studiato alcune classi standard di oggetti, ai quali tentare di ricondurre problemi nati in situazioni diverse. Queste classi, o i loro elementi, sono detti genericamente oggetti combinatori e su di essi si concentra l’Analisi Combinatoria; è chiaro che se un problema qualsiasi può essere ricondotto a uno equivalente ma che si riferisce a qualche tipo di oggetto combinatorio noto, allora o se ne ha già una soluzione o si è sulla strada per trovarla, poiché è più facile trattare oggetti con proprietà ben conosciute, piuttosto che gli strani insiemi, nei quali era stato formulato il problema originale. Vedremo più avanti una serie di oggetti combinatori utilizzati dai matematici; come sempre accade, alcuni sono stati studiati maggiormente, altri un po’ meno; alcuni sono più ricchi di proprietà, altri più poveri; alcuni hanno maggiormente stimolato la fantasia, altri non sono stati altrettanto fortunati. Non potremo certo essere esaurienti in un campo per molti versi assai ricco di proposte, di alternative e di mode. Alcune classi di oggetti combinatori si sono affermate in modo speciale, costituendo punti di attrazione tanto da diventare veri e propri paradigmi a cui ricondurre la dimostrazione di proprietà combinatorie molto disparate. Per questo motivo, tali classi hanno assunto il ruolo di modelli combinatori, strutture di riferimento a cui ricondursi quasi costantemente. La CAPITOLO 4. MATEMATICHE FINITE varietà e l’imprevedibilità dei problemi combinatori fanno sı̀ che anche questi modelli non esauriscano le possibilità di soluzione da prendere in considerazione, ma di sicuro sono i primi oggetti a cui cercare di riportare un problema nuovo. Il modello delle urne. Uno dei modelli combinatori più vecchi e più usati è quello detto delle urne. Si supponga di avere un certo numero di contenitori, detti convenzionalmente urne, e degli oggetti che, a seconda dei gusti di chi usa il modello, sono detti gettoni o palline. Le urne possono essere tutte uguali (cioè, come si dice, indistinguibili) o possono essere una distinta dall’altra, ad esempio per mezzo di un numero di identificazione; analogamente, le palline possono essere indistinguibili o di diverso colore. Ad esempio, se le urne sono n e tutte uguali, e le palline dello stesso colore, possiamo immaginare di mettere o non mettere una pallina in ciascuna delle urne. Se ci chiediamo in quanti modi diversi possiamo inserire una pallina in ciascuna delle urne, otteniamo lo stesso problema del lancio delle monete. All’opposto, se le urne sono numerate 1, 2, . . . , n e in ciascuna di esse inseriamo una pallina fra n palline distinte da n colori diversi, otteniamo esattamente le n! permutazioni che ben conosciamo. Come si vede da questi esempi, le urne e le palline simulano gli insiemi e gli elementi, e numerazione e colorazione possono simulare le funzioni. Oggi, quando ormai il linguaggio degli insiemi è insegnato (quando lo è) fin dalla scuola elementare ed è diventato abbastanza comune, è spesso più facile ragionare in termini di insiemi, elementi e funzioni piuttosto che di urne, palline e colori. Per questo motivo il modello delle urne non si usa più molto spesso e, personalmente, devo dire che non mi è mai stato particolarmente simpatico. Ad onor del vero, il modello delle urne serve bene a introdurre un principio che risulta utile in diversi ragionamenti. In inglese si chiama “pigeon hole principle”, un nome che, come ora vedremo, è perfettamente appropriato. Il termine principio vuole mettere in evidenza che si tratta di una verità piuttosto ovvia, anche se di ampia applicazione. Noi lo possiamo enunciare come un vero e proprio teorema: Teorema 4.12 (pigeon hole principle) Se supponiamo di avere n urne ed almeno n + 1 palline da distribuire nelle urne, esiste almeno un’urna che verrà a contenere più di una pallina. Prova: Se nessuna urna contenesse più di una pallina, queste potrebbero essere al più n, contro l’ipotesi fatta. Naturalmente, il nome inglese del principio fa riferimento al fatto che n + 1 piccioni non possono tutti avere un proprio buco sotto il tetto, se i buchi a disposizione sono solo n. Alcuni problemi, che sembrano 109 4.3. PROBLEMI COMBINATORI formidabili, si risolvono facilmente applicando il principio. Ci si può chiedere, ad esempio, se in una città di 200. 000 abitanti ci sono due donne che hanno lo stesso numero di capelli (parliamo di donne, poiché due uomini completamente calvi hanno, in modo banale, lo stesso numero di capelli: zero). Di fronte a questo problema ci si sente un po’ sconcertati, ma basta pensare a questo: il numero dei capelli di una donna può variare da 40 a 50 mila; possiamo allora immaginare di avere, diciamo, 60 mila urne numerate da 1 a 60. 000, dove il numero k rappresenta k capelli; ogni donna inserisce una pallina nell’urna designata col numero dei propri capelli. La procedura è solo ideale, ma ci fa capire che due almeno delle 100. 000 palline, per il principio dei piccioni, devono finire nella stessa urna. In modo analogo, visto che in città viaggio spesso in autobus, mi è capitato di chiedermi se mi è mai successo di viaggiare due volte sullo stesso mezzo. Ormai ho preso l’autobus per più di mille volte e l’Azienda dei trasporti pubblici ha al massimo a disposizione un paio di centinaia di mezzi: il principio dei piccioni permette di dare una risposta immediata. Ignoro invece se ho preso almeno una volta ciascuno degli autobus dell’Azienda; su questo quesito, purtroppo, il principio non ci aiuta. Numeri figurati. Probabilmente, i più antichi oggetti combinatori sono i cosiddetti numeri figurati. Tutti sappiamo che 25 è il quadrato di 5 perché occorrono 25 gettoni per disporli su un quadrato che abbia per lato 5 gettoni. I numeri quadrati si ottengono appunto in questo modo e, partendo da un unico gettone, si ottengono gli altri numeri quadrati procedendo come nella Figura 4.1. Si può osservare che ogni volta si aggiunge un numero dispari di gettoni: prima 3, poi 5, poi 7 e cosı̀ via. Come ricordiamo, abbiamo dimostrato fin dal primo capitolo che la somma dei primi n numeri dispari è uguale ad n2 , ed ora, se si vuole, abbiamo una prova combinatoria di tale fatto. Figura 4.1: Numeri quadrati e numeri triangolari I Pitagorici, accanto ai numeri quadrati, considerarono i numeri triangolari, pentagonali, esagonali e, in generale, i numeri poligonali. L’n-esimo numero triangolare Tn ha una base composta da n gettoni; sopra ad essa sono disposti n − 1 gettoni, e sopra ancora n − 2, fino a ridursi a un solo gettone. Pertanto si ha: n(n + 1) Tn = 1 + 2 + · · · + n = 2 come abbiamo dimostrato nel Corollario 3.11. Gli stessi Pitagorici si divertirono a trovare molte proprietà dei numeri triangolari che, bisogna dire, sono piuttosto curiose. Limitiamoci qui a qualche considerazione elementare. Intanto, è immediato dimostrare che Tn + Tn−1 = n2 ; una dimostrazione algebrica si ottiene sostituendo a Tn e Tn−1 il loro valore appena trovato. Più interessante è dare di questa relazione una dimostrazione combinatoria, cioè basata sugli oggetti combinatori considerati. Nel nostro caso, basta dividere un numero quadrato mediante una retta, ad esempio al di sotto della diagonale che va da sinistra in alto a destra in basso, e osservare che al di sopra della retta si hanno Tn gettoni e al di sotto Tn−1 . Meno immediato è il seguente: Teorema 4.13 Per ogni numero naturale n si ha: 2 Tn2 − Tn−1 = n3 . Prova: Questa relazione lega i numeri triangolari ai numeri cubi, che possiamo considerare numeri figurati in tre dimensioni. La dimostrazione algebrica è abbastanza immediata: 2 Tn2 − Tn−1 = = n2 (n + 1)2 (n − 1)2 n2 n2 − = ((n+1)2 −(n−1)2 ) = 4 4 4 = n2 n2 (n + 1 + n − 1)(n + 1 − n + 1) = · 2n · 2 = n3 4 4 dove abbiamo applicato il prodotto notevole della differenza di due quadrati. Un’osservazione importante che conviene fare a questo punto è la seguente: ogni volta che sappiamo qualcosa sulla differenza di due elementi consecutivi di una sequenza, sappiamo automaticamente qualcosa sulle somme della sequenza di tali differenze. Per essere più precisi, dimostriamo il seguente risultato; esso è un po’ ridotto rispetto a quello che potremmo fare, ma è sufficiente ai nostri scopi: Teorema 4.14 Si abbiano due sequenze {An }n∈N e {Bn }n∈N con A0 = B0 = 0; allora An − An−1 = Bn se e solo se An = B1 + B2 + · · · + Bn . Prova: Supponiamo dapprima che An sia la somma dei primi n elementi della sequenza {Bn }n∈N ; allora sarà anche: An−1 = B1 +B2 +· · ·+Bn−1 , e sottraendo membro a membro questa relazione dalla precedente, si ha An − An−1 = Bn , cancellandosi tutti gli altri 110 CAPITOLO 4. MATEMATICHE FINITE elementi. Se, viceversa, An − An−1 = Bn ,, avremo anche: An −An−2 = An −An−1 +An−1 −An−2 = Bn +Bn−1 . Si può andare avanti con An − An−3 = Bn + Bn−1 + Bn−2 , e cosı̀ via fino ad ottenere: An − A0 = Bn + Bn−1 + · · · + B1 , da cui deriva la conclusione, essendo per ipotesi A0 = 0. Da questo teorema otteniamo, come immediato corollario, che ogni numero triangolare Tn è dato dalla Figura 4.2: Numeri pentagonali radice quadrata della somma di tutti i cubi da 1 fino ad n. Ad esempio, T5 = 15 ed infatti abbiamo: Teorema 4.16 L’n-esimo numero pentagonale vale: p √ 13 + 23 + 33 + 43 + 53 = 225 = 15. n(3n − 1) Pn = . 2 Per quanto riguarda i numeri quadrati, ci limitiamo a dimostrare il seguente risultato che ha moltissime Prova: Per la scomposizione appena vista, si ha: applicazioni (si veda ad esempio la Sezione 8.8): Pn = Tn + 2Tn−1 = Teorema 4.15 Il valore della somma dei primi n numeri quadrati è dato da: n n(n + 1) + n(n − 1) = (2n − 2 + n + 1) = 2 2 n X n(n + 1)(2n + 1) che dà esattamente la formula desiderata. 2 2 2 2 k = Sn = 1 + 2 + · · · + n = . 6 k=0 Prova: Procediamo per induzione, verificando che S0 = 0, S1 = 1 e S2 = 5 sono dati effettivamente dalla formula proposta. Se questa però non fosse vera per ogni n ∈ N, esisterebbe un numero m > 2 per il quale la formula è falsa. Allora, se n = m − 1, per n la formula deve essere vera e quindi: Sn+1 = Sn +(n+1)2 = n(n + 1)(2n + 1) +(n+1)2 = 6 Nota 4.5 Ragionare sui numeri triangolari, quadrati e pentagonali permette di generalizzare abbastanza agevolmente alcuni risultati e ottenere pro[k] prietà di questi numeri. Chiamiamo Φn l’n-esimo [3] [4] numero k-gonale, di modo che Φn = Tn , Φn = n2 [5] [k] e Φn = Pn ; per costruzione, se disegniamo Φn , per [k] disegnare Φn+1 occorre aggiungere k − 2 lati (si veda la Figura 4.2 relativa ai Pn ); ogni lato ha n + 1 gettoni, ma uno è in comune con il lato successivo, eccetto l’ultimo. Si ha pertanto la ricorrenza: [k] n+1 (n + 1)(n + 2)(2n + 3) = (2n2 + 7n + 6) = . 6 6 Ma questa è la stessa espressione data dal teorema, quando si consideri n + 1 al posto di n, e ciò dimostra che anche per n + 1 = m la formula è valida, contro l’ipotesi fatta. Dopo i numeri triangolari e quadrati, vengono i numeri pentagonali, la cui sequenza comincia con P1 = 1, P2 = 5, P3 = 12, P4 = 22, P5 = 35, come si vede dalla Figura 4.2. Per trovare una formula che ci dia l’n-esimo numero pentagonale, si osservi che le due rette tratteggiate dividono i pentagoni in tre zone: in quella centrale, che comprende gli estremi dei lati opposti al vertice centrale, riconosciamo i numeri triangolari Tn , mentre nelle due zone laterali riconosciamo i numeri triangolari Tn−1 . Si ha pertanto: Φn+1 = Φ[k] n + n(k − 2) + 1, [k] da mettere insieme alla condizione iniziale Φ1 = 1. Ci si accorge ora del ruolo fondamentale dei numeri triangolari: con una decomposizione analoga a quella dei numeri quadrati e pentagonali, si vede che: Φ[k] n = Tn + (k − 3)Tn−1 [k] che permette di calcolare una formula per ogni Φn : Teorema 4.17 Il valore dell’n-esimo numero kgonale è dato da: Φ[k] n = kn(n − 1) − 2n(n − 2) . 2 Prova: Applichiamo la formula dei numeri triangolari alla precedente relazione: Tn + (k − 3)Tn−1 = n(n − 1) n(n + 1) + (k − 3) = 2 2 4.4. STRUTTURE DATI kn(n − 1) − 2n2 + 4n 2 da cui discende la formula desiderata. = Esistono altri approcci ai numeri k-gonali, ma noi possiamo accontentarci di quanto detto fin qui, non senza aver citato un risultato ottenuto dal solito Eulero: ogni numero naturale è la somma di al più k numeri k-gonali, cioè di al più tre numeri triangolari, di al più quattro numeri quadrati, e cosı̀ via. 111 i dati che potrebbero servire per accertare, al di là di ogni dubbio, se la persona, non solo è un cliente, ma è veramente l’individuo che pretende di essere. Questo, però, grazie all’Informatica. Una volta, non poi tanti anni fa, le cose non andavano cosı̀. Tutto era semplice se il cliente era conosciuto dal cassiere o da qualche altro impiegato; ma, in caso contrario, era necessario far partire una procedura di ricerca che, attraverso la consultazione di elenchi, la presentazione di documenti, la firma di moduli e ammennicoli vari permetteva, alla fine, di dire: sı̀, costui è uno dei clienti della banca, oppure no, si tratta di un millantatore e nulla gli può essere concesso. Lo stesso problema si presenta in mille occasioni: l’utente di una biblioteca ha diritto al prestito? un certo farmaco è prodotto o meno dalla casa farmaceutica XYZ? esiste in Italia un comune che si chiama Cogoleto? Oggi, poi, il problema si è allargato a dismisura. Un biologo si chiede se una certa sequenza di aminoacidi è presente fra i miliardi di aminoacidi che formano l’elica del DNA di un crostaceo. Un navigatore di Internet cerca informazioni su Teofilo Folengo, sperando di trovar qualcosa tra i miliardi di dati presenti nel Web, la tela che tutti ci avvolge. I numeri poligonali sono i numeri figurati più semplici, ma ne esistono, e se ne possono inventare, molti altri, fra i quali i numeri stellati hanno ricevuto molta attenzione. Si può anche passare dal piano allo spazio e immaginare di avere delle palline al posto dei gettoni; esse possono essere disposte in forma di piramide con base triangolare, quadrata o esagonale. Si possono pensare altre costruzioni e si può addirittura immaginare di passare a 4, 5 o m dimensioni; per queste note, tuttavia, pensiamo di poterci fermare a questo punto. Il modello delle urne e i numeri figurati si riferiscono ai più antichi problemi combinatori; oggi si sono sviluppati altri modelli e altri oggetti, alcuni dei quali sono legati alle strutture dati dell’Informatica. A In tutti questi casi, il calcolatore è stato fornito, o questi aspetti dell’Analisi Combinatoria dedicheremo ha creato lui stesso, un elenco delle informazioni che le prossime sezioni, naturalmente dopo aver dato la gli servono: gli utenti della biblioteca, i farmaci della formula a suo tempo promessa: ditta XYZ, e cosı̀ via. Questi elenchi possono essere 2n − (−1)n lunghissimi, contenere anche miliardi di dati diversi, . Gn = e certo l’elaboratore non può consultarli uno dietro 3 l’altro: cosı̀ facendo, anche il calcolatore più veloce impiegherebbe minuti ed ore a trovare una particola4.4 Strutture dati re informazione, e nessun utente di queste macchine L’Informatica ha portato alla ribalta alcuni proble- potenti accetterebbe di aspettare cosı̀ a lungo. Un mi che la Matematica aveva ignorato o sottovalutato metodo usato dall’elaboratore è derivato da un trucperché sembravano non presentare risvolti teorici ap- co che adoperiamo quando cerchiamo una parola nel prezzabili. L’esempio più eclatante è costituito dal dizionario o un cognome sull’elenco telefonico: invece problema della ricerca: dato un insieme S e un ele- di partire dall’inizio, scegliamo ad occhio una pagina mento x, si vuole sapere se x ∈ S oppure x 6∈ S. Per ragionevolmente vicina a ciò che cerchiamo. Il trucco un matematico, questo non è neppure un problema; è reso sistematico nel modo seguente. Supponiamo come abbiamo osservato fin dall’inizio, elementi e in- che le informazioni nell’elenco dell’elaboratore siano siemi sono entità che non si definiscono nemmeno e ordinate, cosı̀ come lo sono quelle del dizionario o della loro “esistenza” è legata al fatto di poter istituire l’elenco telefonico. Si comincia allora la ricerca dall’etra di esse alcune relazioni che le caratterizzano; una lemento mediano, cioè l’informazione che sta proprio di queste è proprio l’appartenenza, per cui, dato S e nella posizione di mezzo. Si potrebbe essere fortunadato x, è immediato sapere se x ∈ S, o meno. Tutti ti e trovare al primo colpo ciò che si cerca, ma non i nostri ragionamenti su elementi e insiemi si basano siamo cosı̀ ottimisti: se l’informazione cercata è misul fatto (anche se non solo su quello) che si possa nore (cioè, viene prima) di quella individuata, allora dire senza problemi quando x sta o non sta in S. possiamo escludere dalla ricerca successiva tutta le Nella pratica, le cose non stanno proprio cosı̀. Se seconda metà dell’elenco; se l’informazione cercata è una persona si presenta alla cassa di una banca e vuol maggiore (cioè, viene dopo) si escluderà la prima parritirare del denaro, il problema che si presenta al cas- te. In ogni caso, il tentativo successivo sarà limitato siere è: questa persona è o non è cliente della banca? a una sola metà dell’elenco, e questo fa una bella difOggi, basta digitare sul terminale il nome della perso- ferenza. Tale metodo si dice ricerca binaria e per essa na e il calcolatore fornisce la risposta, insieme a tutti vale il seguente risultato: 112 CAPITOLO 4. MATEMATICHE FINITE Teorema 4.18 Sia S un insieme di n elementi, dato combinatori detti alberi binari di ricerca, che qui cacome elenco ordinato; il numero massimo di confronti dono giusto a proposito. Per brevità, spesso diremo necessari a determinare se un elemento x appartiene “albero binario” per “albero binario di ricerca”. o non appartiene ad S è log2 (n + 1). Definizione 4.1 Un albero binario di ricerca è una Prova: Onde semplificare i conti necessari, limitia- struttura finita cosı̀ fatta: è vuota oppure è costituita moci a considerare i valori per cui n è 1 meno di una da un nodo etichettato dal quale partono due rami, potenza di 2, cioè vale 0, 1, 3, 7, 15, 31, . . .. Questi nu- all’estremità dei quali si trovano due alberi binari di meri hanno la caratteristica che, quando procediamo ricerca, detti rispettivamente il sottoalbero di sinistra nella ricerca e riduciamo a metà l’elenco, il numero e di destra dell’albero binario. degli elementi rimasti è ancora dello stesso tipo. Indichiamo allora con Cn il massimo numero di confronti Un nodo etichettato è semplicemente un nodo che necessari alla ricerca in un elenco di n elementi e po- contiene un’etichetta, cioè un nome o un numero, in niamo ck = Cn = C2k −1 . Per l’osservazione fatta, ogni caso l’identificazione di un elemento dell’insieme abbiamo C2k −1 = 1 + C2k−1 −1 , la qual formula si- S. Il primo nodo dell’albero si dice la radice, e le radignifica che il numero totale dei confronti è uguale ad ci dei due sottoalberi di sinistra e di destra si dicono 1 (il confronto effettuato) più il numero di confronti i figli sinistro e destro della radice, alla quale ci si per la metà rimasta dell’elenco. Questa relazione si riferisce come nodo genitore. Per capire bene il conscrive: ck = 1 + ck−1 e quindi, iterando, si ha: cetto di albero binario, la cosa migliore è utilizzarlo e pertanto vedremo ora come si costruisce e come si ck = 1 + ck−1 = 2 + ck−2 = · · · = k + c0 . usa. All’uopo, useremo l’insieme S delle parole contenute nella Divina Commedia; si dà per scontato che Ma c0 = C20 −1 = C0 = 0, poiché se un elenco non ha l’incipit sia conosciuto da tutti. La prima parola nel elementi (cioè, S = ∅) non c’è bisogno di confronti per viene a costituire l’etichetta della radice: stabilire che x 6∈ S. In conclusione, abbiamo Cn = k, dove n = 2k − 1. Ricavando k si ha k = log2 (n + 1), nel come si voleva. ¡ @ q¡ @q Se n è un milione, Cn ≈ 20 e se n vale un miliardo si ha Cn ≈ 30. Per un potente elaboratore, fare 20 o I due rami che si dipartono da questa radice “punta30 confronti è pressoché immediato, e questo spiega no”, per il momento, a due alberi vuoti che, però, preperché la nostra domanda su Teofilo Folengo ottenga sto, si riempiranno. Per inserire nell’albero la seconda parola mezzo, si procede cosı̀: si confronta la nuova una risposta in una frazione di secondo. La ricerca binaria funziona se l’elenco è ordinato. parola con l’etichetta della radice; poiché mezzo è alPurtroppo, i dati grezzi ben raramente sono ordinati, fabeticamente inferiore, si procede lungo il ramo di basti pensare alle informazioni su Internet. Il cal- sinistra. L’albero che si trova è vuoto e perciò lo si colatore, perciò, ha anche il problema di ordinare i sostituisce con un nodo avente mezzo come etichetta: dati dell’elenco, e questa è un’altra operazione che la nel Matematica classica ha sottovalutato. In pratica, n ¡ @ elementi diversi possono assumere una qualsiasi delle ¡ @q mezzo n! permutazioni possibili, e ciò rende conto della variabilità del problema. Abbiamo a suo tempo visto ¡ @ q¡ @q quanto vale 100!, e pensare a 1. 000. 000! è semplicemente assurdo. Questo pone il problema generale del- Per la terza parola del si procede in modo analogo: l’ordinamento, che è considerato, assieme alla ricerca, confrontata con la radice, essa è minore e quindi si uno dei problemi di base dell’Informatica. segue il ramo di sinistra. Qui si trova il nodo con etiSi rifletta un attimo come un elenco non ordina- chetta mezzo, di cui del è minore. Continuando a sito sia praticamente illeggibile, cosı̀ come ogni uscita nistra, si trova l’albero vuoto, che perciò sostituiamo prodotta dall’elaboratore deve essere ordinata, se vo- con un nodo nuovo etichettato del: gliamo che serva a qualcosa. Gli informatici hanno nel inventato metodi ingegnosi per ordinare velocemente ¡ @ gli insiemi di dati, metodi che non fanno propriamen¡ @q te parte dell’Analisi Combinatoria; ma questo argomezzo mento va al di là degli scopi di queste note. Acconten¡ @ ¡ @q tiamoci allora di introdurre un metodo che permette del di ottenere ordinamento e ricerca in tempi decisa¡ @ q¡ @q mente buoni. Questo metodo è legato a certi oggetti 113 4.4. STRUTTURE DATI L’inserimento di cammin e di di è semplice e basta osservare che di è maggiore di del e quindi verrà posto alla sua destra. Analogo caso avviene per nostra, che si colloca alla destra della radice. Nella Figura 4.3 mostriamo il nostro albero dopo l’inserimento delle prime 15 parole. Ora, la ricerca di un termine avviene con lo stesso criterio dell’inserimento. Si supponga di voler cercare oscura. Si confronta con la radice nel e poiché è maggiore si procede col ramo di destra. Qui troviamo nostra, di cui oscura è ancora maggiore, per cui continuaiamo verso destra. La parola oscura è invece minore di vita e noi procediamo verso sinistra. Cosı̀ andiamo avanti finché non recuperiamo oscura. Lo stesso procedimento avrebbe avuto luogo per ricercare oscuro, una parola per il momento non ancora presente nel nostro albero; naturalmente, però, l’ultimo confronto ci avrebbe portato in un sottoalbero vuoto, il che denota le ricerche con insuccesso. La proprietà fondamentale degli alberi binari di ricerca è che, preso un qualsiasi nodo N , il suo sottoalbero di sinistra contiene solo etichette minori di quella in N , e il suo sottoalbero di destra contiene solo etichette maggiori. Questo è vero per costruzione e ci suggerisce che le etichette sono virtualmente ordinate. Il seguente algoritmo ricorsivo produce un elenco ordinato di tutte le etichette di un albero binario: Algoritmo 4.2 (Ordinamento) Ingresso: un albero binario di ricerca; Uscita: l’elenco ordinato delle etichette dell’albero. 1. se il sottoalbero di sinistra non è vuoto, chiamare ricorsivamente questo programma per ordinarlo; 2. scrivere nell’elenco l’etichetta della radice di questo albero; 3. se il sottoalbero di destra non è vuoto, chiamare ricorsivamente questo programma per ordinarlo. fr ´Q ´ Q ´ Q ´ Q Q e d ´ r´ Qr Q ´ D Q ´ ¥¥ D Q ´ D ¥ Q c ´ Q ´ Qr´ D ¥ ­J D ¥ D ¥ ­ J D ¥ ­ J D ­ J ¥ a D­ r Jr¥ b Figura 4.4: Un grafo connesso (x, y) ed (y, x) si scrive una doppia freccia. Un grafo pesato è un grafo nel quale ad ogni arco è associato un numero reale non negativo, detto il peso dell’arco. Nei grafi orientati e pesati, il peso dell’arco (x, y) puó essere diverso dal peso dell’arco (y, x). Un sottografo di G è un grafo G′ = (V ′ , A′ ) dove V ′ ⊆ V e A′ ⊆ A. Se x è un vertice, il grado di x è il numero di archi che hanno x come vertice. Se il grafo è orientato, si distingue il grado di ingresso, cioè il numero di archi che arrivano ad x, dal grado d’uscita, cioè il numero di archi che partono da x. La figura riporta il grafo definito da V = {a, b, c, d, e, f } e composto di 8 archi. Abbiamo già avuto modo di incontrare grafi; è chiaro che un grafo è un modo di rappresentare una qualsiasi relazione simmetrica su un insieme finito V ; in generale, una relazione su V corrisponde a un grafo orientato. Per le relazioni di ordine, possiamo limitare gli archi a quelle coppie (x, y) per le quali x ≤ y e non esiste alcun altro elemento z tale che x ≤ z ≤ y; in questo caso, prendendo come convenzione che un arco è sempre diretto dal basso verso l’alto, ritroviamo i diagrammi di Hasse, introdotti nella Sezione 1.2. Una corrispondenza tra due insiemi A e B può essere rappresentata da un grafo i cui vertici sono gli elementi di A ⊎ B e i cui archi collegano elementi di A e di B in corrispondenza tra loro; si tratta di un grafo un po’ particolare e lo si dice bipartito. La terminologia relativa ai grafi riflette la loro generalità. Il concetto di albero binario di ricerca fa parte di una serie di oggetti combinatori importanti, che possiamo classificare addirittura come modello. Il modello dei grafi. La seguente definizione introduce il concetto di “grafo” e di alcune sue Definizione 4.3 Sia dato un grafo G = (V, A); si varianti. dice cammino di G una sequenza finita di vertici di Definizione 4.2 Un grafo è una coppia G = (V, A), V , diciamo (v0 , v1 , . . . , vh ), per i quali {vi , vi+1 } è un dove V è un insieme finito di elementi detti vertici o arco di A per i = 0, 1, . . . , h − 1. Un cammino per il nodi, di solito rappresentati graficamente da punti; se quale v0 = vh si dice un ciclo. Nei grafi orientati può D è l’insieme dei sottoinsiemi di due elementi di V , si esistere il ciclo formato dal solo arco (v, v), il quale ha A ⊆ D; ogni {x, y} ∈ A si dice un arco o spigolo, e più propriamente viene detto laccio. Se G è un grafo si rappresenta con una linea che unisce i due vertici pesato, il peso di un cammino è la somma dei pesi interessati. Un grafo orientato è una coppia Go = degli archi che lo compongono. Il grafo G si dice con(V, A), dove V è come prima, ed A ⊆ V 2 , di modo nesso se, presi comunque due suoi vertici v, v ′ , esiste che ogni arco orientato (x, y) ∈ A è rappresentato da almeno un cammino che va da v a v ′ . Dato un vertiuna freccia da x ad y; se sono presenti i due archi ce v, si dice componente connessa di v l’insieme dei 114 CAPITOLO 4. MATEMATICHE FINITE nel © ©© © © ©© ©© mezzo mi @ @ ¡ q¡ di @ @ che ¡ q¡ nostra q¡ ¡ @ @ del cammin ¡ q¡ HH H ¡ q¡ @ @q @ @q @ @q vita ¡ ¡ ritrovai ¡ ¡ HH H @ @q ¡ ¡ per ¡ ¡ oscura q¡ ¡ @ @ @ @q @ @q una ¡ q¡ selva @ @q @ @q Figura 4.3: La parte iniziale dell’albero binario di ricerca della Divina Commedia vertici v ′ del grafo per i quali esiste un cammino da v a v ′ ; un grafo connesso ha un’unica componente connessa. Un albero è un grafo connesso e privo di cicli. Se G è un grafo connesso, un albero di ricoprimento di G è un sottografo di G che sia un albero contenente tutti i vertici di G. Se G è pesato, un albero minimo di ricoprimento è un albero di ricoprimento che abbia peso minimo rispetto a tutti gli altri alberi di ricoprimento. che i sottoalberi di sinistra e di destra non possono essere scambiati tra di loro, cioè, in altre parole, i rami che partono da un nodo hanno un ordine che non può essere ignorato. La teoria dei grafi è vastissima e qui non possiamo dare che una vaga idea di alcune parti molto limitate. Un problema classico è il seguente: riprendiamo il grafo connesso della Figura 4.4 e chiediamoci se è possibile partire da uno dei suoi vertici e disegnarlo in un unico tratto, senza staccare la matita dal foglio, L’albero minimo di ricoprimento ha grande impor- e senza ripassare due volte per lo stesso arco. Già tanza in molte applicazioni dei grafi, poiché rappre- Eulero aveva dimostrato: senta il modo di raggiungere tutti i vertici del grafo con un costo, o peso, globalmente minimo. Il con- Teorema 4.19 Sia G = (A, V ) un grafo; è possibile cetto di albero, presentato in questa maniera, può partire da un vertice v ∈ V e disegnare il grafo con lasciare abbastanza sconcertati, almeno in un primo un sol tratto di matita (senza staccare la matita dal momento, e sarebbe forse meglio parlare di “struttu- foglio) e senza ripassare due volte per lo stesso arco ra arborescente”, ma tant’è. Se fra i nodi di un albe- se e solo se il numero dei vertici di grado dispari è al ro scegliamo un nodo particolare, questo viene detto più 2 (cioè, è 0 oppure 2). la radice dell’albero e l’albero, più propriamente, si Prova: Per poter entrare e uscire da un vertice senza chiama albero con radice; da un albero con n nodi si usare lo stesso arco occorre che il grado del vertice possono derivare n alberi con radice. Come abbiamo sia 2, o comunque sia pari. Se il grado è dispari, vi già fatto con gli alberi binari di ricerca, si preferisce si può entrare ma non uscire, o viceversa. Quindi, mettere la radice in alto e far crescere l’albero verso se i vertici di grado dispari sono più di 2, uno di il basso; è una semplice convenzione, che torna bene questi nodi bloccherà il disegno (lasciamo al lettore per il nostro modo di scrivere da sinistra a destra e la dimostrazione, abbastanza ovvia, che non possono dall’alto in basso. Nella Figura 4.5 abbiamo riportaesistere grafi con un numero dispari di nodi di grado to un albero con radice e la sua rappresentazione più dispari!). usuale. Il grafo della Figura 4.4 ha due vertici di grado La presenza della radice fa sı̀ che, praticamente, gli archi (detti anche rami) di un albero con radice sia- tre: uno si può usare come vertice di partenza, l’altro no orientati, esattamente dall’alto verso il basso. Da d’arrivo; con questa considerazione il disegno riesce questo fatto deriva l’usanza di parlare del grado di un facilmente. Lo stesso Eulero aveva osservato la senodo come del suo grado d’uscita; cosı̀ nell’esempio guente proprietà fondamentale. Un grafo si dice plaprecedente, il grado di a è 4, quello di c è 2 e quello di nare se si può disegnare sul piano senza che i suoi e è 0. In questo senso, gli alberi binari di ricerca sono archi si incrocino; si chiama faccia di un grafo plaalberi con radice i cui nodi hanno grado 0 oppure 2. nare ogni parte del piano delimitata dagli archi del Si aggiunge che sono orientati per sottolineare il fatto grafo, cioè da alcuni dei suoi cicli; si considera che la 115 4.5. IL MODELLO DELLE PAROLE rd A A A rb A Acr ¢ ¢ ¢ ¢ ¢r e ¢ ¢ ¢ r¢f f r © ¢ a ©© i© r © ©©HH jr © © © H kr HHr h r g ar ³f PP ³¡ ³ @ @ PP P ³ ¡ ³³ PPi r @r ³ ¡ r r b c ¢S ¢A ¢ S ¢ A ¢ A S ¢ ¢ S A ¢ Ar Sr r¢ r¢ r d e g h j rk Figura 4.5: Albero con radice e sua rappresentazione convenzionale cioè la loro rappresentazione lineare, come stringa di caratteri, invece che quella grafica. Per costruire un albero binario, noi partiamo da una delle n! permutazioni di un insieme S di n elementi; è facile tuttavia rendersi conto che non esistono n! alberi binari diverTeorema 4.20 Sia G = (V, A) un grafo connesso e si. Ad esempio, con n = 3 si hanno 6 permutazioni, indichiamo con v, a, f il numero dei suoi vertici, dei ma solo 5 alberi binari: suoi archi e delle sue facce. Si ha allora la relazione s s s s s di Eulero: f + v = a + 2. @ @ ¡ ¡ ¡@ ¡ ¡ ¡ @ @ @ ¡ Prova: Usiamo il principio di induzione matematica @s @ s s s¡ s¡ @s ¡ @ ¡ sul numero dei vertici che compongono il grafo. Se @ ¡ @ ¡ il grafo si compone di un unico vertice, si hanno due @ @s s¡ s¡ @s possibili situazioni: parte esterna al grafo costituisca una delle sue facce. Nel caso della Figura 4.4, si hanno in tutto 6 facce. Un albero ha un’unica faccia, essendo per definizione privo di cicli. Si ha allora: Infatti, l’albero centrale viene generato tanto dalla permutazione (2, 1, 3) quanto da (2, 3, 1). Si pone alv s lora il problema: quanti alberi binari distinti corrispondono alle permutazioni di n elementi? Ragioniamo in questa maniera: consideriamo un albero con n + 1 nodi; esso sarà composto dalla radice, da un La prima situazione corrisponde a (v = 1, f = 1, a = sottoalbero di sinistra con k nodi (con k variabile tra 0) e la seconda a (v = 1, f = 2, a = 1) e per entrambe 0 ed n) e un sottoalbero di destra che, di conseguenza, vale la relazione di Eulero. Si supponga allora che tale conterrà n − k nodi. Sia Ck il numero totale di alberi relazione valga per v vertici e aggiungiamo un vertice distinti con k nodi; poiché ogni sottoalbero di siniulteriore x. Poiché il grafo deve rimanere connesso, si stra con k nodi può essere associato un sottoalbero devono aggiungere anche 1 o più archi che partono da di destra con n − k nodi, si hanno in tutto: o arrivano ad x, mantenendo la planarità del grafo. n X Se se ne aggiunge uno solo, il numero della facce non C = Ck Cn−k ′ ′ ′ n+1 cambia e si ha (v = v +1, f = f, a = a+1), e quindi k=0 la relazione di Eulero vale ancora. Se si aggiungono k archi, questi devono dividere la stessa faccia, quella alberi binari con n+1 nodi. Questa formula permette in cui abbiamo inserito x; ma questo genera k − 1 di calcolare uno dietro l’altro il valore dei Cn , partenfacce, che si aggiungono alla precedente e quindi si do dalla “condizione iniziale” C0 = 1; infatti, esiste ha (v ′ = v + 1, f = f + k − 1, a′ = a + k), e la un unico albero con 0 nodi, ed esattamente l’albero relazione di Eulero vale ancora. vuoto. Si ha allora: m s v 4.5 Il modello delle parole Il modello delle parole: Il secondo problema posto dagli alberi binari di ricerca è la loro linearizzazione, C1 C2 C3 C4 = = = = = C0 C0 = 1 · 1 = 1 C0 C1 + C1 C0 = 1 · 1 + 1 · 1 = 2 C0 C2 + C1 C1 + C2 C0 = 2 + 1 + 2 = 5 C0 C3 + C1 C2 + C2 C1 + C3 C0 = 5 + 2 + 2 + 5 = 14. 116 CAPITOLO 4. MATEMATICHE FINITE Dopo aver capito bene il gioco degli indici di questa somma di prodotti, il lettore è caldamente invitato a calcolare il valore di C4 ed, eventualmente, di C5 . E’ possibile dimostrare (ma noi non ci proveremo nemmeno) che vale la formula generale: µ ¶ 1 2n Cn = n+1 n che però il lettore verificherà con i valori appena calcolati. I numeri Cn si dicono numeri di Catalan, dal nome del matematico belga che li studiò per primo alla metà del 1800. Un’espressione parentesizzata è una sequenza di parentesi “[” e “]” che si conformi alle usuali regole di apertura e chiusura. Esiste un’unica espressione con una sola coppia di parentesi: [ ]; ne esistono due con due coppie: [[ ]], [ ][ ], e ne esistono 5 con tre coppie: [[[ ]]], [[ ][ ]], [[ ]][ ], [ ][[ ]], [ ][ ][ ]. Si considera la sequenza vuota come l’unica espressione con 0 coppie di parentesi. Si ha: Teorema 4.21 Esistono tanti alberi binari di ricerca con n nodi quante espressioni parentesizzate con n coppie di parentesi. Prova: Consideriamo un albero binario e indichiamo con una coppia di parentesi la sua radice; quindi inseriamo tra queste due parentesi la rappresentazione del suo sottoalbero di sinistra e alla loro destra la rappresentazione del suo sottoalbero di destra. La rappresentazione dell’albero vuoto è la stringa vuota. Di conseguenza, ad ogni albero binario con n nodi corrisponde un’espressione parentesizzata con n coppie di parentesi (una per nodo). Ad alberi diversi corrispondono ovviamente espressioni diverse (la corrispondenza è iniettiva) ed ogni espressione parentesizzata proviene da un albero, in quanto la costruzione si può invertire (la corrispondenza è surgettiva). In conclusione, la corrispondenza è biunivoca, come si voleva. Nella prima metà degli anni 1950, il linguista Noam Chomski introdusse il concetto di linguaggio formale nel tentativo di creare uno strumento adatto a modellare il linguaggio naturale. Il suo concetto di grammatica formale (o semplicemente grammatica) è stato effettivamente usato a tale scopo, ma il maggior successo l’ha avuto in Informatica. Qui, esso è stato usato per almeno tre scopi fondamentali: 1. come strumento teorico per formulare la teoria della computabilità, cioè la teoria che cerca di stabilire quali problemi sono risolubili da un punto di vista computazionale. Le grammatiche di Chomski di tipo 0 sono una formulazione alternativa alle macchine di Turing, alle funzioni parzialmente ricorsive, al λ-calcolo, agli algoritmi normali di Markov e alle altre impostazioni della teoria; 2. come metodo pratico per definire con precisione quelle lingue artificiali che sono i linguaggi di programmazione. Le grammatiche di tipo 2 sono correntemente usate sia per dare una formulazione esatta di linguaggi come Pascal, C o Java, sia per dirigere la loro “traduzione” nel linguaggio macchina del particolare elaboratore utilizzato dal programmatore; 3. come strumento per la definizione formale delle strutture dati usate nei programmi, per lo studio del loro comportamento e, quindi, per la valutazione della loro efficienza nella risoluzione di determinati problemi. Questo ultimo è l’argomento che qui particolarmente ci interessa, anche se dovremo limitare drasticamente le nostre considerazioni. Prima di addentrarci negli aspetti più formali; cerchiamo di capire, con un semplice esempio non del tutto banale, qual era l’idea di Chomski. Nella Tabella 4.2 riportiamo una piccola “grammatica formale” che vorrebbe dare una vaga idea di come si possa definire una frase nominale, qui indicata dal simbolo hfrasei; le parentesi a punta “h” e “i” sono utilizzate per delimitare un simbolo che si vuole considerare come unico, anche se composto da lettere e altri segni, che danno un aiuto mnemonico per capire e ricordare il significato del simbolo stesso, in questo caso una “frase nominale”. Il simbolo “::=” significa “si può pensare come”, e quindi una frase nominale si può pensare come: un soggetto, seguito da uno spazio (il simbolo “⊔”), seguito da una copula, seguito da uno spazio, seguito infine da una sequenza di aggettivi. Questo, semplificando molto, è ciò che ci aspettiamo da una frase nominale. Il soggetto si può pensare come un nome proprio hnomei oppure (tale è il significato della barra verticale “|”) un articolo seguito da un sostantivo. I nomi propri che consideriamo sono solo quattro, ma potrebbero essere tutti quelli che riusciamo ad immaginare, purché in numero finito. La barra verticale si usa per creare tante alternative quante si desiderano. Si noti che una lista di aggettivi è costituita da un unico aggettivo, oppure da vari aggettivi separati da virgole (cioè, una sequenza di aggettivi), ma l’ultimo è separato dagli altri dalla congiunzione E. Ogni alternativa è detta una produzione, nel senso che il simbolo di sinistra produce i vari simboli di destra. Partendo da hfrasei, l’applicazione delle produzioni, da sinistra verso destra, cambia hfrasei in altre sequenze, generando alla fine una sequenza di lettere (senza più simboli tra parentesi a punta) che 4.5. IL MODELLO DELLE PAROLE hfrasei hsoggettoi hnomei harticoloi hsostantivoi hfinalei hcopulai hseq. agg.i hlista agg.i haggettivoi ::= ::= ::= ::= ::= ::= ::= ::= ::= ::= 117 hsoggettoi ⊔ hcopulai ⊔ hseq. agg.i hnomei | harticoloi ⊔ hsostantivoi PAOLO | CHIARA | SARA | ANTONIO IL | LO | LA | I | GLI | LE RAGAZZhfinalei | SARThfinalei | CAVALLhfinalei A|E|I|O E′ | SONO | ERA | ERANO haggettivoi | hlista agg.i ⊔ E ⊔ haggettivoi haggettivoi | hlista agg.i, ⊔haggettivoi BELLhfinalei | BIONDhfinalei | PICCOLhfinalei | ALThfinalei Tabella 4.2: Una grammatica formale costituisce un esempio valido di frase nominale. Ecco un semplice esempio di generazione: che è davvero sgrammaticata. In realtà, la grammatica formale non tiene conto del contesto, cioè di cosa sta vicino a ciascun elemento della frase: l’articolo hfrasei deve concordare in numero e genere con il sostantivo; questo determina il numero della copula, e cosı̀ via. hsoggettoi ⊔ hcopulai ⊔ hseq. agg.i Per questo, una grammatica del genere si dice libera dal contesto. Chomski introdusse anche grammatiharticoloi⊔hsostantivoi⊔hcopulai⊔hseq. agg.i che contestuali più realistiche, ma dal nostro punto LA ⊔ hsostantivoi ⊔ hcopulai ⊔ hseq. agg.i di vista sono troppo complesse e meno interessanti. La notazione adottata nella Tabella 4.2 si dice BacLA ⊔ SARThfinalei ⊔ hcopulai ⊔ hseq. agg.i kus Normal Form (BNF) perché inventata da Backus per adattare le grammatiche di Chomski alla definiLA ⊔ SARTA ⊔ hcopulai ⊔ hseq. agg.i zione dei linguaggi di programmazione, in particolare LA ⊔ SARTA ⊔ ERA ⊔ hseq. agg.i dell’Algol’60. Essa fa capire in modo immediato il LA ⊔ SARTA ⊔ ERA ⊔ hlista agg. ⊔ E ⊔ haggettivoi significato dei vari simboli, il che è molto utile quando si ha a che fare con decine o centinaia di simboli LA ⊔ SARTA ⊔ ERA ⊔ haggettivoi ⊔ E ⊔ haggettivoi diversi, come accade in linguaggi abbastanza vasti LA⊔SARTA⊔ERA⊔PICCOLhfinalei⊔E⊔haggettivoi (anche se relativamente semplici), quali sono quelli usati nella programmazione. Normalmente, tali simLA ⊔ SARTA ⊔ ERA ⊔ PICCOLA ⊔ E ⊔ haggettivoi boli si dicono “non terminali” e si indicano con lettere dell’alfabeto greco. Formalmente, una grammatica LA ⊔ SARTA ⊔ ERA ⊔ PICCOLA ⊔ E ⊔ BIONDhfinalei libera dal contesto, o anche, con terminologia inglese abbastanza accettata, context-free è una quadrupla LA ⊔ SARTA ⊔ ERA ⊔ PICCOLA ⊔ E ⊔ BIONDA G = (T, N, σ, P) dove: Questo è l’aspetto generativo della grammatica, cioè delle produzioni che costituiscono la gramma1. T è l’insieme dei simboli terminali; tica formale. Tante altre frasi di senso compiuto si 2. N è l’insieme dei simboli non terminali; T ∩ N = possono generare, come: ∅; PAOLO ⊔ E′ ⊔ ALTO 3. σ ∈ N è il simbolo iniziale; I ⊔ RAGAZZI ⊔ SONO ⊔ BIONDI, ⊔ALTI ⊔ E ⊔ BELLI 4. P è un insieme di produzioni: una produzione è Se leggiamo la derivazione dal basso verso l’alto, abuna coppia (π, x) dove π ∈ N e x ∈ (T ∪N )∗ , cioè biamo la divisione strutturale della frase, che metx è una parola di T ∪ N , eventualmente vuota. te in chiaro quale sia il soggetto, quale la copula e quale o quali gli aggettivi (aspetto strutturale della Supponiamo che w = w1 αw2 sia una parola su T ∪N , che α ∈ N e w1 non contenga il simbolo α, cioè l’α grammatica). Purtroppo, la grammatica genera anche frasi del indicata sia l’occorrenza più a sinistra di tale simbolo. Se w′ = w1 yw2 e (α, y) è la i-esima produzione di P, tipo: allora si dice che w genera immediatamente w′ e si scrive w ⊢i w′ o semplicemente w ⊢ w′ , se non si GLI ⊔ CAVALLE ⊔ ERA ⊔ PICCOLA ⊔ E ⊔ ALTI 118 CAPITOLO 4. MATEMATICHE FINITE vuol mettere l’accento sulla produzione considerata. è ambigua; 2) le parole di L(G) sono le sequenze di Si dice poi che w0 genera wn se esistono n − 1 parole 0/1 nelle quali lo 0 è isolato e non si trova né in cima né in fondo; 3) le parole di L(G) di lunghezza n sono w1 , w2 , . . . , wn−1 tali che risulti: contate dall’n-esimo numero di Fibonacci Fn . w0 ⊢ w1 ⊢ w2 ⊢ · · · ⊢ wn−1 ⊢ wn ; Accenniamo alla dimostrazione di quest’ultima proprietà. Sia L(G) il linguaggio generato dalla questa catena di generazioni si dice la derivazione sigrammatica; la produzione (φ, 1) ci dice che 1 ∈ L(G) nistra di wn da w0 e si scrive w0 ⊢∗ wn . Si dice e che quindi ǫ 6∈ L(G), se ǫ è la sequenza vuota; quininfine linguaggio generato dalla grammatica G l’indi L(G) non contiene sequenze di lunghezza 0, e ne sieme delle parole su T generate dal simbolo iniziale contiene una sola di lunghezza 1. Ciò corrisponde alle σ, cioè formalmente: condizioni iniziali F0 = 0 e F1 = 1 dei numeri di Fibo∗ ∗ nacci. Per quanto riguarda la ricorrenza, osserviamo L(G) = {w ∈ T | σ ⊢ w}. che la produzione (φ, φ1) ci dice che una sequenza di La grammatica G si dice non ambigua se ogni parola lunghezza n che termina con 1 proviene da un’unica di L(G) può essere generata in uno e un solo modo sequenza di lunghezza n − 1. La produzione (φ, φ01) da σ attraverso una derivazione sinistra. ci dice che una sequenza che termina con 01 provieA questo punto un esempio è fortemente richiesto. ne da un’unica sequenza di lunghezza n − 2. Poiché Sia T = {[, ]}, di modo che i simboli terminali del queste sono le uniche produzioni, tali considerazionostro linguaggio siano le due parentesi; sia poi N = ni corrispondono alla ricorrenza Fn = Fn−1 + Fn−2 , {∆} e, di conseguenza, σ = ∆; infine, l’insieme delle e ciò è sufficiente a dimostrare il nostro asserto, che produzioni sia: le parole di Fibonacci di lunghezza n sono proprio contate dell’n-esimo numero di Fibonacci. P = {(∆, [ ])1 , (∆, [∆])2 , (∆, [ ]∆)3 , (∆, [∆]∆)4 }, dove l’indice sta ad indicare il numero d’ordine del4.6 Il calcolo delle proposizioni la produzione per semplificare la comprensione del seguente esempio. Vediamo infatti la derivazione Il calcolo delle proposizioni è una teoria che tratta del sinistra della parola [[ ]][ ]: modo in cui si possono elaborare le espressioni proposizionali per calcolarne il valore di verità e/o per ∆ ⊢4 [∆]∆ ⊢1 [[ ]]∆ ⊢1 [[ ]][ ]. trasformare proposizioni in altre equivalenti. Questo Si osservi che, quando sono presenti più simboli non calcolo si basa sul concetto di equivalenza tra proterminali uguali, la produzione si deve applicare al posizioni: due proposizioni sono equivalenti quando, simbolo più a sinistra e da questa regola è nato il ter- scelti comunque i valori di verità delle proposizioni mine di “derivazione sinistra”. Questa grammatica elementari che le compongono, i valori di verità delnon è ambigua; lasciamo al lettore il non facilissimo le due proposizioni coincidono. Il lettore verificherà compito di provare questo fatto; suggeriamo di di- che si tratta proprio di una relazione di equivalenza. mostrare che ogni parola di L(G) ha una e una sola Le proposizioni sono costruite a partire da un certo decomposizione secondo le produzioni di P. E’ invece numero (non meglio specificato) di proposizioni elefacile osservare che L(G) è composto di tutte e sole mentari p, q, r, . . . e dai tre connettivi logici negazione le espressioni parentesizzate (eccetto quella vuota), e ¬, congiunzione ∧, disgiunzione ∨, e le parentesi per quindi G è un metodo formale per definire gli albe- regolare la precedenza delle operazioni. ri binari di ricerca, nella loro forma linearizzata. Da La tabella di verità di una proposizione è una taquesta definizione, in effetti, è possibile derivare una bella che, in funzione dei diversi e possibili valori di serie di proprietà degli alberi binari di ricerca, delle verità delle funzioni elementari, dà il valore di verità quali, tuttavia, facciamo grazia al lettore. Notiamo della proposizione. Una tabella di verità si costruisolo che questa è una delle tante vie per dimostrare sce a partire dalle tabelle di verità dei tre connetla validità della formula di Catalan. tivi logici, viste nel Capitolo 1. Possiamo dire che Concludiamo con due ulteriori grammatiche. La due proposizioni sono equivalenti se e solo se hanno prima è abbastanza ovvia e fa uso della paro- la stessa tabella di verità. Si consideri ad esempio la vuota ǫ: T = {a, b, c}, N = {σ} e P = la proposizione: (p ∧ ¬q) ∨ r, e si osservi la Tabella {(σ, ǫ), (σ, aσ), (σ, bσ), (σ, cσ)}. Lasciamo al lettore 4.3. Sulla sinistra abbiamo riportato tutte le possibili la dimostrazione, questa volta semplice, del fatto combinazioni dei valori di verità delle tre proposizioche L(G) = {w ∈ T ∗ }. La seconda grammati- ni elementari p, q, r. Nella colonna ¬q si è riportato ca è meno ovvia: T = {0, 1}, N = {φ}, σ = φ, il valore della negazione di q e, analogamente, nelP = {(φ, 1), (φ, φ1), (φ, φ01)}. In questo caso il let- la colonna p ∨ ¬q abbiamo valutato il risultato della tore dovrebbe dimostrare che: 1) la grammatica non disgiunzione tra p e la negazione di q. Infine, con 119 4.6. IL CALCOLO DELLE PROPOSIZIONI p 0 0 0 0 1 1 1 1 q 0 0 1 1 0 0 1 1 r ¬q 0 1 1 1 0 0 1 0 0 1 1 1 0 0 1 0 p ∨ ¬q 1 1 0 0 1 1 1 1 (p ∨ ¬q) ∧ r 0 1 0 0 0 1 0 1 Tabella 4.3: Calcolo di una tabella di verità vuol dire (¬p ∨ q) ∧ (¬q ∨ p) = (¬p ∧ ¬q) ∨ (¬p ∧ p) ∨ (¬q ∧q)∨(p∧q) = ¬(p∨q)∨(p∧q) = (p∨q) → (p∧q): il lettore è invitato a costruire le varie tabelle di verità. La proposizione p ⊕ q indica l’esclusione fra p e q e la sua tabella di verità è giusto la negazione della doppia implicazione: p 0 0 1 1 q p⊕q 0 0 1 1 0 1 0 1 la tabella di verità della congiunzione, si è calcolata E’ bene osservare che essa si calcola facendo la somma l’ultima colonna, che rappresenta proprio la tabella (modulo 2) dei valori di verità di p e q: nel caso che sia p = q = 1, si ha p + q = 2, ma: 2 mod 2 = 0 di verità della proposizione (p ∨ ¬q) ∧ r. (vedere Definizione 2.4). Nota 4.6 Il calcolo combinatorio ci dice che vi Ciò che è interessante nella Tabella 4.4 è il fatsono 8 possibili combinazioni dei valori 0/1 da asso- to che le regole esposte non solo trasformano una ciare alle tre proposizioni p, q, r. Esistono vari metodi, proposizione in un’altra proposizione ad essa equiestendibili a 4 o più proposizioni, per scriverle in modo valente, ma date due espressioni equivalenti, cioè con sistematico. la stessa tabella di verità, esse permettono di tra1. la colonna di p è costituita da quattro 0 e da sformare l’una nell’altra. Per il momento, limitiaquattro 1; la colonna di q da due 0 e da due moci ad un esempio. Si consideri la proposizione: 1, seguiti da altri due 0 e due 1; la colonna di (¬p ∧ ¬q ∧ r) ∨ (p ∧ ¬q ∧ r) ∨ (p ∧ q ∧ r) e se ne r è fatta da 0 e 1 in sequenza. Lasciamo per costruisca la tabella di verità: si osserva allora che esercizio estendere questa regola a quattro o più tale tabella coincide con quella di (p ∨ ¬q) ∧ r. Come proposizioni; possiamo trasformare questa in quella? Se riusciamo 2. partendo dalla combinazione composta di tutti in tale impresa, applicando le regole all’inverso (esse 0, si procede cambiando da 0 in 1 l’ultimo 0 pre- sono tutte simmetriche) si ottiene una trasformaziosente nella combinazione. Contemporaneamen- ne di quella in questa: è quindi sufficiente trovare te, si cambiano in 0 tutti gli 1 che lo seguono una qualsiasi della due trasformazioni. Partiamo da (se ce ne sono). La validità di questo modo di (p ∨ ¬q) ∧ r e applichiamo la proprietà distributiva; procedere è più nascosta, ma il metodo funziona! si ha: 3. se leggiamo le combinazioni come numeri in base (p ∨ ¬q) ∧ r ≡ (p ∧ r) ∨ (¬q ∧ r). 2 (v. alla fine della Sezione 1.5) vediamo apparire tutti i numeri da 0 a 7. In generale, si hanno i numeri da 0 a 2n − 1 e un po’ di esercizio insegna come scriverli facilmente uno dopo l’altro. Qualche prova è sufficiente a capire come procedere. Per mezzo delle tabelle di verità è possibile dimostrare una serie di proprietà formali del calcolo delle proposizioni; lasciando al lettore la cura delle verifiche, abbiamo elencato nella Tabella 4.4 le principali proprietà. Una proposizione che come p ∨ ¬p risulta sempre vera si dice una tautologia; una che come p ∧ ¬p è sempre falsa, si dice una contraddizione. Per quanto abbiamo visto nella Sezione 1.7, l’implicazione p → q è equivalente a ¬p ∨ q. Questo ci dice subito che p → q non è la stessa cosa della sua contraria q → p, che equivale a p ∨ ¬q. Invece, la contropositiva di p → q è ¬q → ¬p, cioè ¬¬q ∨ ¬p = q ∨ ¬p = ¬p ∨ q, quindi coincide proprio con p → q. La doppia implicazione (p → q) ∧ (q → p) Questo è un passo notevole, poiché ci ha portato a una disgiunzione di congiunzioni, proprio come la proposizione d’arrivo. L’inconveniente è che nella prima disgiunzione manca la q e nella seconda manca la p. La regola di identità p ∧ 1 = p ci dice che possiamo inserire degli 1 in ogni congiunzione: (p ∧ r) ∨ (¬q ∧ r) ≡ (p ∧ 1 ∧ r) ∨ (1 ∧ ¬q ∧ r) ≡ La regola del complemento p ∨ ¬p = 1 ci permette ora di inserire q e p nei posti giusti: ≡ (p ∧ (q ∨ ¬q) ∧ r) ∨ ((p ∨ ¬p) ∧ ¬q ∧ r) ≡ Di nuovo, la legge distributiva ci permette di tornare ad una disgiunzione di congiunzioni: ≡ (p∧q ∧r)∨(p∧¬q ∧r)∨(p∧¬q ∧r)∨(¬p∧¬q ∧r) ≡ Naturalmente, le varie applicazioni delle proprietà associativa e commutativa nemmeno si citano: però ci 120 CAPITOLO 4. MATEMATICHE FINITE commutativa associativa distributiva assorbimento idempotenza complemento identità zero doppia negazione de Morgan p∨q =q∨p p∧q =q∧p p ∨ (q ∨ r) = (p ∨ q) ∨ r p ∧ (q ∧ r) = (p ∧ q) ∧ r p ∨ (q ∧ r) = (p ∨ q) ∧ (p ∨ r) p ∧ (q ∨ r) = (p ∧ q) ∨ (p ∧ r) p ∨ (q ∧ p) = p p ∧ (q ∨ p) = p p∨p=p p∧p=p p ∨ ¬p = 1 p ∧ ¬p = 0 p∨0=p p∧1=p p∨1=1 p∧0=0 ¬¬p = p ¬(p ∨ q) = ¬p ∧ ¬q ¬(p ∧ q) = ¬p ∨ ¬q Tabella 4.4: Le regole del calcolo proposizionale sono. Ora osserviamo che la due congiunzioni cen- sono falsi (la sua tabella di verità è la negazione della trali sono la stessa, e la proprietà di idempotenza ci disgiunzione, detta or in inglese, da cui il nome nor). Per il lemma precedente: p nor q = ¬p ∧ ¬q. Tale permette di concludere: lemma sembra molto particolare, ma si può estendere ≡ (p ∧ q ∧ r) ∨ (p ∧ ¬q ∧ r) ∨ (¬p ∧ ¬q ∧ r), immediatamente, coinvolgendo anche la disgiunzione: che è quanto volevamo dimostrare. Questo successo potrebbe essere solo un caso, come potrebbe essere casuale il fatto che in precedenza siamo riusciti ad esprimere i connettivi dell’implicazione, della doppia implicazione e dell’esclusione mediante i connettivi booleani. Ci poniamo pertanto le seguenti, fondamentali questioni: Lemma 4.23 Si consideri un connettivo che abbia una tabella di verità composta da almeno un 1; allora tale connettivo è esprimibile mediante i tre connettivi booleani. Prova: Si considerino, nella tabella di verità del connettivo, le linee corrispondenti al valore 1; il lemma precedente ci dà modo di esprimere (mediante nega1. E’ vero che i connettivi booleani permettono zione e congiunzione) il connettivo che avesse quel sodi esprimere tutti i possibili connettivi fra lo 1. La disgiunzione di tutti questi connettivi vale 1 proposizioni? solo in corrispondenza delle linee per cui il connettivo è vero, cioè, in altre parole, il connettivo di partenza 2. E’ vero che due proposizioni sono equivalenti e tale disgiunzione di congiunzioni sono equivalenti. (hanno la stessa tabella di verità) se e solo se è possibile trasformare l’una nell’altra mediante Si riprenda la tabella di verità dell’esclusione; il le regole della Tabella 4.4? lemma ci dice: La risposta ad entrambe le domande è positiva ed ora cercheremo di darne la dimostrazione. Cominciamo p ⊕ q = (¬p ∧ q) ∨ (p ∧ ¬q) con il seguente il che vuol dire: “(non andremo al supermercato ma Lemma 4.22 Si consideri un connettivo che abbia andremo dal commercialista) oppure (andremo al suuna tabella di verità composta da un unico 1, men- permercato ma non andremo dal commercialista)”, il tre tutti gli altri valori sono 0; allora, tale connettivo che è proprio quello che ci aspettiamo. La conclusione si può esprimere tramite i due connettivi booleani di è allora: negazione e di congiunzione. Teorema 4.24 Un qualsiasi connettivo è esprimibile Prova: Siano p, q, r, . . . le proposizioni elementari mediante i tre connettivi booleani. su cui è costruito il connettivo. Si osservi che una congiunzione è vera se e soltanto se risultano vere le Prova: Se la tabella di verità del connettivo consingole proposizioni elementari che la compongono. tiene almeno un 1, vale il lemma precedente. Se non Se allora si considera la congiunzione delle proposi- contiene alcun 1, il connettivo è una contraddizione. zioni elementari per cui il connettivo risulta vero e Se ne consideri la negazione; essa ha una tabella tutta della negazione delle proposizioni per cui risulta fal- composta di 1, per la quale vale ancora il lemma preso, tale congiunzione è vera se e solo se risulta vero il cedente; la negazione di ciò che si ottiene è pertanto equivalente al connettivo dato. connettivo, cioè è ad esso equivalente. Un connettivo molto importante è il cosiddetto Secondo questo teorema, ogni connettivo è esprinor, definito come vero se e solo se i suoi argomenti mibile in una forma standard, come disgiunzione di 121 4.6. IL CALCOLO DELLE PROPOSIZIONI tante congiunzioni, ognuna contenente tutte le proposizioni elementari coinvolte (o la loro negazione). Tale forma si dice la forma canonica disgiuntive della proposizione. Esiste anche una forma canonica congiuntiva, composta dalla congiunzione di tante disgiunzioni. Non insistiamo oltre su questo punto, ma vediamo piuttosto come la forma canonica disgiuntiva ci permetta di rispondere alla seconda domanda che ci eravamo posti. Teorema 4.25 Data una qualsiasi proposizione espressa mediante i connettivi booleani, essa può essere trasformata nella sua forma canonica disgiuntiva mediante le regole della Tabella 4.4. Prova: Le due proprietà distributive e le leggi di de Morgan permettono di ridurre ogni proposizione composta ad una serie di disgiunzioni di congiunzioni. Nelle congiunzioni possono non essere presenti tutte le proposizioni elementari: mediante l’aggiunta di 1 = p∨¬p si introducono le proposizioni elementari mancanti. Si usano di nuovo le proprietà distributive per riportarci a una disgiunzione di congiunzioni, che questa volta contengono tutte le proposizioni elementari. Infine, la proprietà di idempotenza permette di togliere le congiunzioni uguali. L’esempio precedente illustra in modo semplice questo teorema, dal quale discende la risposta alla nostra domanda: Teorema 4.26 Due proposizioni sono equivalenti se e solo se possono essere trasformate l’una nell’altra mediante le regole della Tabella 4.4. Prova: Siano P e Q le due proposizioni; se si può trasformare P in Q, allora P e Q sono equivalenti, poiché ogni regola della Tabella 4.4 conserva l’equivalenza. Viceversa, supponiamo che P e Q siano equivalenti. Per il lemma precedente possiamo trasformare P e Q nelle loro forme canoniche disgiuntive P1 e Q1 ; avendo P e Q la stessa tabella di verità, deve essere P1 = Q1 . La trasformazione che da P porta a P1 più la trasformazione inversa da Q1 a Q costituiscono una trasformazione di P in Q, come si voleva. I due teoremi meriterebbero diversi commenti; ci limitiamo ai seguenti due: 1. Per la proprietà espressa dal Teorema 4.24, i tre connettivi booleani si dicono costituire un insieme universale di connettivi. In realtà i tre connettivi sono sovrabbondanti perché, per le leggi di de Morgan, si ha: ¬(¬p ∧ ¬q) = ¬¬p ∨ ¬¬q = p ∨ q e quindi la disgiunzione può essere sostituita da congiunzione e negazione (è vero anche che la congiunzione può essere sostituita da disgiunzione e negazione; non è vero invece che la negazione possa essere sostituita dagli atri due connettivi: provare a dimostrare!). Naturalmente, esistono altri insiemi universali di connettivi: uno famoso e importante è costituito da negazione e implicazione. Per vederlo, basta dimostrare che la disgiunzione è esprimibile tramite questi due connettivi; ma poiché p → q = ¬p ∨ q, abbiamo p ∨ q = (¬p) → q. Ma la cosa più straordinaria è che, nella seconda metà del 1800, il famoso logico (e geologo e astronomo e mille altre cose) Charles Peirce dimostrò l’esistenza di connettivi che, da soli, costituiscono un insieme universale. Uno di questi è p nor q = ¬(p ∨ q), il nor che abbiamo già introdotto. Un altro è p nand q = ¬(p ∧ q), il cui nome è coniato dall’inglese and che indica la congiunzione. Si noti che p nor p = p nand p = ¬p, ma lasciamo al lettore il piacere di esprimere congiunzione o disgiunzione o implicazione mediante nor e nand. Forse qui è bene ricordare che Peirce è anche l’inventore delle tabelle di verità. 2. Il calcolo delle proposizioni, con i suoi teoremi conclusivi, è un esempio di teoria troppo semplice: praticamente, sappiamo tutto ciò che c’è da sapere su ogni proposizione. Questo, purtroppo, non succede nella realtà, che è molto più complicata. Ciò è dovuto alla rigidità del concetto di proposizione; come osservato a suo tempo, le frasi vere o false in assoluto sono poche e, soprattutto, poco interessanti, in quanto riguardano fatti specifici o convenzioni verbali. Di solito siamo interessati (specie in Matematica) ad affermazioni molto generali. Ad esempio, asserire che un certo triangolo rettangolo ha i lati lunghi 3, 4 e 5 m, è asserire un fatto apparentemente accidentale; molto più interessante è il teorema di Pitagora, che ci dice qualcosa su tutti i triangoli rettangoli. Come abbiamo visto, per questo esiste una teoria più vasta del calcolo delle proposizioni, cioè il calcolo dei predicati. Nel calcolo dei predicati, teoremi conclusivi analoghi ai precedenti proprio non esistono. Nota 4.7 Il calcolo delle proposizioni si è rivelato di fondamentale importanza in Informatica. Prima di tutto, le tabelle di verità permettono di progettare i calcolatori elettronici. Il principio è il seguente: si consideri la somma di due bit, che indicheremo con p e q. La loro somma è data da p ⊕ q e il riporto da p ∧ q; se si possono realizzare fisicamente i connettivi booleani (o un qualsiasi altro insieme universale di connettivi) si possono realizzare anche questi connettivi e quindi ottenere marchingegni che eseguono la somma (o qualsiasi altra operazione). Un metodo per realizzare elettricamente i connettivi booleani è quello di mettere due circuiti in serie (congiunzione) e in parallelo (disgiunzione), oppure di comandare un circuito mediante un relé (negazione). Cosı̀ furono 122 CAPITOLO 4. MATEMATICHE FINITE costruiti i primi calcolatori elettrici; si passò poi a quelli elettronici, ma i principi rimasero gli stessi, e sono gli stessi anche oggi quando le operazioni vengono eseguite tramite circuiti integrati. Il contributo del calcolo delle proposizioni all’Informatica non si limita a questo: esso governa le condizioni di esecuzione di un programma, intervenendo nelle istruzioni condizionali (tipo if e case) e in quelle iterative (tipo for, while e repeat). 4.7 Calcolo delle probabilità Il 1600 è stato un secolo interessante da molti punti di vista. In concomitanza con il nascere della scienza moderna, si vide, con il consolidarsi dei grandi stati nazionali, il sorgere di un interesse nuovo dei governi nei confronti dei cittadini, visti fino ad allora come semplici oggetti del potere. Già alla fine del 1500 il sovrano francese Enrico IV (1553 – 1610, re dal 1594 dopo aver giudicato che Parigi valeva bene una messa) aveva affermato “Voglio che ogni paesano abbia il suo pollo in pentola”. Ma questo atteggiamento paternalistico dei sovrani era motivato da tre esigenze di razionalizzazione: 1. come far rimpinguare le casse dello stato attraverso le tasse e altri mezzi per spillare soldi ai cittadini; 2. come gestire i nuovi, grandi eserciti nazionali, al tramonto delle milizie mercenarie; le due facce come testa (T ) e croce (C). Se le lanciamo e registriamo le facce che si presentano, possiamo ad esempio avere a = T, b = T, c = C, d = T . Possiamo gettare un’altra volta le monete e ottenere ora a = C, b = T, c = C, d = C. Se ci chiediamo quante possibili configurazioni diverse si possono ottenere, un ragionamento che abbiamo già visto e tipico dell’analisi combinatoria, ci dice che esse sono 24 = 16. Come si sa, e come vedremo, la connessione tra calcolo delle probabilità e analisi combinatoria è fortissima. Infatti, se ora vogliamo sapere quante volte possiamo ottenere due teste e due croci, l’analisi combinatoria ci viene ancora in aiuto. Pensiamo alle quattro monete come a un insieme A = {a, b, c, d} e a un singolo lancio come a un sottoinsieme di A, esattamente composto dalle monete che hanno dato testa: le altre sono determinate di conseguenza. Ad esempio, il primo dei lanci precedenti è equivalente al sottoinsieme {a, b, d} e il secondo a {b, d}. E’ chiaro che, viceversa, il sottoinsieme vuoto corrisponde a un lancio con tutte croci e il sottoinsieme A a un lancio con tutte teste. Allora, i lanci con due teste e due croci corrispondono ai sottoinsiemi di A formati di due elementi, cioè sono le combinazioni di ¡ 4¢ elementi a 2 a 2, che, come ora sappiamo, sono 42 = 6. In altre parole, sulle 16 configurazioni possibili, che si ottengono lanciando quattro monete, 6 corrispondono a 2 teste e 2 croci. In generale, possiamo dire che, se abbiamo n monete, le possibili configurazioni otte¡ ¢ nute in un lancio sono 2n ; di queste, ve ne sono nk che presentano k teste e, di conseguenza, n − k croci. 3. come interagire con la borghesia, sempre più Di solito, questi problemi si formulano come quesiti economicamente rilevante, sia nelle attività sulle probabilità: quante sono le probabilità che lantradizionali sia nella nascente industria. ciando quattro monete si ottengano esattamente due Fu allora inventata una nuova scienza che, trattan- teste e due croci? Il ragionamento di prima ci dice do della conduzione razionale dello Stato, fu detta che tali probabilità sono 6 su 16. Cerchiamo di formaStatistica. lizzare un po’ meglio questi concetti: si supponga di Da quel tempo la Statistica si è evoluta, sia nei voler considerare un certo insieme di eventi, ad esemmetodi di ricerca sia nei campi applicativi; di fatto pio il lancio di monete. Si dicono eventi possibili gli essa è diventata una metodologia di studio di tut- elementi dell’insieme, talvolta detto insieme univerti i fenomeni, naturali e artificiali, indispensabile alla so. Si noti che il concetto di evento non è definibile; Fisica, alla Chimica, alla Biologia, alla Medicina e al- con un tipico gioco verbale abbiamo appena cambiato l’Informatica. La Statistica è una scienza tipicamente l’idea di evento in quella di elemento di un insieme, sperimentale, che rileva ed elabora dati, e, come tutte concetto che a questo punto ci dovrebbe essere più fale scienze sperimentali, si avvale di una serie di meto- miliare, ancorché esso pure sia stato lasciato, ai suoi di e di tecniche matematiche, che nel loro insieme e tempi, indefinito. Si isoli ora una classe particolare nella loro formulazione costituiscono una vera e pro- di eventi nell’insieme considerato, come ad esempio pria teoria, il cosiddetto calcolo delle probabilità. Ci “i lanci che danno 2 teste e 2 croci”; gli elementi di proponiamo pertanto di introdurre i primissimi rudi- questa classe si dicono eventi favorevoli. La probabimenti di questa branca della Matematica, e di cercare lità che si verifichi un evento della classe particolare di capire i rapporti che essa ha con la sua controparte si definisce come il rapporto tra il numero degli evensperimentale, cioè la statistica. ti favorevoli e il numero degli eventi possibili. Nel Supponiamo di avere quattro monete, che distin- nostro esempio, la probabilità di avere 2 teste e 2 gueremo con le lettere a, b, c, d; distinguiamo anche croci o, se si preferisce, esattamente due teste sulle 4 123 4.7. CALCOLO DELLE PROBABILITÀ monete del lancio, è: π4,2 = 6 = 0.375. 16 Da questa definizione discende che la probabilità π è sempre un numero compreso tra 0 ed 1: 0 ≤ π ≤ 1. Se la classe degli eventi favorevoli coincide con l’insieme degli eventi possibili, allora la probabilità è 1; considerato che un qualsiasi evento possibile è certamente anche un evento favorevole, la probabilità π = 1 si dice anche certezza. Viceversa, se la classe degli eventi favorevoli è vuota, il rapporto che ci dà la probabilità è π = 0; in questo caso, è impossibile che un qualsiasi evento sia favorevole, e quindi la probabilità π = 0 si dice anche impossibilità. Fissato l’insieme di tutti gli eventi da considerare, la divisione in classi dei singoli eventi dipende ovviamente dal problema che stiamo trattando. Se, ad esempio, gli “eventi” sono gli alunni di una scuola, possiamo pensare a diverse divisioni: in maschi e femmine, in base al mese di nascita, in base al colore dei capelli o degli occhi, e cosı̀ via. Gli eventi che appartengono a classi disgiunte si dicono indipendenti tra di loro; è questo un concetto molto importante, sul quale ritorneremo tra breve. Il numero di eventi che appartengono a una certa classe si dice la frequenza di quella classe. Nell’esempio del lancio delle monete, la divisione degli eventi (o lanci) in base al numero di monete che presentano testa, è una divisione in classi disgiunte. In tal caso si può dare una rappresentazione grafica della distribuzione dei vari eventi nelle diverse classi, disegnando un diagramma nel quale ogni classe è raffigurata da una colonna, la cui altezza è proporzionale alla frequenza degli eventi nella classe. Poiché, come s’è visto, la probabilità è data dal rapporto fra la frequenza e il totale degli eventi possibili, tali colonne risultano automaticamente proporzionali anche alla probabilità che si verifichi un evento di quella classe. Se consideriamo il lancio di 8 monete, la probabilità che in un lancio si ottengano k teste è data dalla formula: µ ¶ µ ¶ 1 8 1 8 = . π8,k = 8 2 k 256 k Basta prolungare il triangolo aritmetico fino alla riga n = 8 per ottenere le frequenze di ciascuna classe. Nella Figura 4.6 abbiamo dato questa rappresentazione, che è detta istogramma. Un istogramma evidenzia visivamente la distribuzione degli eventi nelle classi che ci interessano, purché queste siano a due a due disgiunte, cioè corrispondano a classi di eventi tra loro indipendenti. Il concetto di indipendenza è molto importante e le seguenti regole, che abbiamo già avuto occasione di adoperare, vanno tenute sempre presenti: 1. la probabilità che si verifichi almeno uno di due o più classi di eventi indipendenti è dato dalla somma delle probabilità di ciascuna delle classi; 2. la probabilità che si verifichi una data sequenza di classi di eventi indipendenti è data dal prodotto delle probabilità delle singole classi. 0 1 2 3 4 5 6 7 8 Figura 4.6: Distribuzione binomiale Nota 4.8 Il nostro insistere sul fatto che gli eventi non sono altro che elementi di un insieme non è ovviamente casuale. Riprendendo cose che abbiamo introdotto proprio all’inizio, l’insieme degli eventi possibili può essere identificato con l’insieme universo U ; se questo è finito, saranno finiti anche i suoi sottoinsiemi. Una partizione di U (Sezione 1.1) è un modo per definire una distribuzione degli elementi di U . Se A ⊂ U , la frequenza di A coincide con card(A), e quindi si ha: card(A) π(A) = card(U ) come definizione di probabilità. Ad ogni operazione sull’insieme delle parti di U , cioè P(U ), corrisponde un assegnamento di probabilità al risultato. Ad esempio, π(A) = 1 − π(A); se A e B sono disgiunti, si ha π(A ∪ B) = π(A)+π(B) e π(A∩B) = 0, in quanto π(U ) = 1 e π(∅) = 0: qui si ritrovano i concetti di certezza e impossibilità. Purtroppo, se A e B non sono disgiunti, card(A∩B) può assumere diversi valori, ed esattamente 0 ≤ card(A ∩ B) ≤ min(card(A), card(B)); questo implica che per le probabilità si abbia: 0 ≤ π(A ∩ B) ≤ min(π(A), π(B)). Se ne deduce subito, guardando i diagrammi di Venn della Figura 1.1: π(A ∪ B) = π(A) + π(B) − π(A ∩ B). π(A ∩ B) = π(A) + π(B) − π(A ∪ B). Un’altra proprietà importante è la seguente: sia P1 , P2 , . . . , Pn , una partizione di U e sia A ⊆ U ; allora si ha: π(A) = π(A ∩ P1 ) + π(A ∩ P2 ) + · · · + π(A ∩ Pn ). 124 CAPITOLO 4. MATEMATICHE FINITE Naturalmente, esistono infinite altre proprietà, ma su di esse qui non possiamo insistere. Si voglia risolvere il seguente problema: in una classe vi sono 12 maschi e 14 femmine; di questi allievi, 16 abitano nel centro della città e 10 vengono dalla periferia. Sapendo che il totale delle femmine e di coloro che abitano in periferia è di 20 allievi, qual è la probabilità che un maschio abiti in città? Dette M, F e C, P le due partizioni di U , possiamo indifferentemente ragionare sulle cardinalità o sulle probabilità. L’ultima condizione significa π(F ∪ P ) = 20/26 e quindi la probabilità che una femmina abiti in periferia è: π(F ∩ P ) = π(F ) + π(P ) − π(F ∪ P ) = 10 20 4 14 + − = . 26 26 26 26 Da questo segue che π(M ∩ P ), cioè la probabilità che un maschio abiti in periferia, è: = π(M ∩ P ) = π(P ) − π(F ∩ P ) = 10 4 6 − = . 26 26 26 Infine, quello che ci interessa è: π(M ∩ C) = π(M ) − π(M ∩ P ) = = 6 6 12 − = ≈ 23.1%. 26 26 26 Questa impostazione dei concetti della probabilità va bene per gli insiemi finiti, ma non funziona più per quelli infiniti, quando card(U ) non è un numero naturale. Si consideri ad esempio un quadrato di lato ℓ nel quale è contenuto un triangolo equilatero con la base coincidente con uno dei lati del quadrato; si vuol sapere qual è la probabilità che, preso a caso un punto del quadrato, esso appartenga al triangolo. Il ruolo della cardinalità è qui preso dall’area che, in qualche modo, conta il numero di punti contenuti in una figura. L’area del quadrato è Aq = ℓ2 , mentre l’area √ del triangolo è At = 3ℓ2 /4 (si veda, più avanti, il Teorema 6.29); la probabilità cercata è pertanto: √ √ 3 2 1 3 At ℓ · 2 = ≈ 0.433 = 43.3%. = Aq 4 ℓ 4 Questa osservazione, per quanto banale, è alla base della teoria moderna del calcolo delle probabilità, che fa parte della più vasta Teoria della Misura, quel settore della Matematica che si interessa del calcolo integrale. Pascal iniziò a interessarsi del triangolo aritmetico per studiare i giochi che allora si stavano affermando, sia per divertire i ricchi, sia per cavare soldi alla povera gente per mezzo delle varie lotterie, a carattere locale e nazionale. Un gioco si dice equo se una puntata x su un evento E viene ricompensata, in caso di vittoria, con una cifra y inversamente proporzionale alla probabilità di verificarsi dell’evento E. Ad esempio, sulla roulette la probabilità che la pallina si fermi su un dato numero n è 1/37 a causa della presenza dello 0. Il gioco sarebbe equo se, in caso di vittoria, il banco pagasse 37 volte la puntata, cioè la cifra giocata. Ciò assicurerebbe un equilibrio statistico fra vincite e perdite, cosı̀ che a lungo andare ci sarebbe un sostanziale pareggio tra banco e giocatori (almeno nella loro globabilità, non certo per ogni singolo giocatore). Come è noto la roulette paga solo 36 volte la posta, congelando le puntate nel caso che la pallina si fermi sullo 0. Questo rende il gioco non equo; statisticamente, ad ogni giro il banco guadagna, in media, quasi 1/37 di tutte le giocate; alla fine della giornata (o della nottata) il vantaggio è enorme e questo costituisce il guadagno del gestore (a parte le tasse di concessione che deve dare allo Stato). Analogamente, come abbiamo visto, giocando un ambo su una ruota, la probabilità di vincere è: µ ¶.µ ¶ 5 90 10 π= = . 2 2 4005 Quindi, alla giocata di 1 e, in caso di vincita dovrebbe essere pagati 400.50 e; in effetti, lo Stato paga 242.50 e e il resto va a favore dell’erario. In pratica, se 10 mila giocatori giocano un ambo puntando 1 e ciascuno, lo Stato incassa 10. 000 e e paga 6062.50 e ai 25 vincitori (in media, uno ogni 400). Il guadagno medio dello stato è pertanto di 3937.50 e. Occorre ora chiarire qual è il rapporto tra il calcolo delle probabilità e la statistica. Fino a questo punto abbiamo parlato soprattutto di insiemi, e la realtà concreta è stata appena accennata, citando il lancio delle monete, il gioco del lotto e la roulette. In effetti, abbiamo guardato a questi giochi come a giochi astratti, senza effettuare dei veri lanci o delle vere estrazioni. Prendiamo allora 4 monete e, muniti di santa pazienza, facciamo una serie di lanci, registrando ogni volta su un foglio il numero delle teste che otteniamo. Fare anche solo 100 lanci è alquanto noioso, e servirebbe meglio ai nostri scopi farne 1000 o 10. 000. Oggi queste cose si fanno col calcolatore, simulando con opportuni programmi il lancio delle monete, e allora è un attimo simulare centomila o un milione di lanci. Nel 1600 s’era costretti a procedere a mano e c’era gente che passava la vita a fare esperimenti del genere; nel 1800 le cose non erano diverse, come ci informa Dostoevskij. Tutti sono invitati a provare, manualmente e/o al calcolatore, perché l’esercizio è veramente utile per rendersi conto delle cose. Quando diciamo che la probabilità di ottenere testa nel lancio di una moneta è il 50%, in realtà non abbiamo misurato proprio niente, né tanto meno abbiamo contato una qualche quantità legata alla moneta o ai suoi lanci. Ciò che intendiamo, è affermare che non esiste alcuna ragione plausibile perché testa debba uscire invece di croce. La stessa cosa si può dire 125 4.7. CALCOLO DELLE PROBABILITÀ quando affermiamo che ogni faccia di un dado uscirà con probabilità 1/6. Tali probabilità, che assegniamo con un qualche vago criterio di equità, si dicono probabilità a-priori, e riflettono le nostre aspettative sul verificarsi (o meno) di certi eventi. Al contrario, quando si effettuano dei lanci, reali o simulati sull’elaboratore, possiamo contare gli eventi che mano mano si verificano, ottenendo cosı̀ vere frequenze. E’ da queste frequenze che ricaviamo le probabilità, che pertanto si dicono prababilità statistiche o a-posteriori. Non è filosoficamente banale tradurre uno nell’altro i due concetti di probabilità a-priori e a-posteriori. Nel caso della moneta, se su mille lanci otteniamo ft = 504 teste ed fc = 496 croci, non ci sentiamo affatto di rivedere la nostra intuizione che vorrebbe si verificassero 500 teste e altrettante croci. Ottenere un risultato cosı̀ equo, andrebbe contro il nostro concetto di casualità, ricordandoci alla larga una sequenza 0, 1, 0, 1, 0, . . ., tutt’altro che casuale. La distribuzione 504/496 ci porta a dire che la probabilità a-posteriori conferma la probabilità a-priori. L’idea che coltiviamo è proprio questa: al crescere del numero n dei nostri lanci, i rapporti ft /n e fc /n tendano entrambi ad avvicinarsi ad 1/2, e affibbiamo l’imaginifico nome di fluttuazioni statistiche alle differenze, che speriamo piccole, fra frequenza statistica ft o fc e frequenza teorica n/2. Vedremo nella prossima sezione di dare criteri più oggettivi per stabile se e quando una distribuzione empirica (fatta di probabilità a-posteriori) si conforma a una distribuzione teorica (composta di probabilità a-priori). Facciamo un esempio un po’ più articolato. Con l’aiuto dell’elaboratore, simulando 160. 000 lanci di quattro monete, ho ottenuto questi risultati: n. teste simulaz. teoria 0 10063 10000 1 39951 40000 2 60060 60000 3 39891 40000 4 10035 10000 è già convincente, ma in Matematica non si possono fare le cose ad occhio. Esistono dei test (ad esempio, il cosiddetto test del chi quadro) che ci permettono di dire quand’è che, ragionevolmente, l’accordo c’è e quando, invece, possiamo con buona sicurezza asserire che tale accordo non ci sia. Vedremo queste cose nella prossima sezione, anche se in modo piuttosto veloce e senza troppi approfondimenti. Una domanda abbastanza naturale è la seguente: lanciamo sı̀ le nostre quattro monete, ma qual è il numero medio di teste che ci aspettiamo di ottenere in un gran numero di lanci? Cominciamo col considerare una sequenza di dati che indicheremo con {x1 , x2 , . . . , xn }; si dice media o valor medio o valore atteso di questi dati il rapporto tra la loro somma e il loro numero, cioè: n 1 1X x = (x1 + x2 + · · · + xn ) = xj n n j=1 P dove il simbolo indica la somma di termini omogenei, individuati da un indice, variabile dall’estremo indicato in pedice fino all’estremo indicato in apice (vedere la fine della Sezione 2.8). Ad esempio, se in una stanza vi sono cinque persone di altezza, rispettivamente: 1.72, 1.63, 1.84, 1.80, 1.71, la loro altezza media è (1.72+1.63+1.84+1.80+1.71)/5 = 8.70/5 = 1.74. Si noti che, nonostante il nome di “valore atteso”, la media non è il valore che ci aspettiamo possa avere un elemento del nostro insieme, preso a caso; infatti, nessuna delle persone nella stanza è alta 1.74. Piuttosto, la media indica il valore che ci permette di prevedere, col minor errore possibile, il valore di un elemento qualsiasi della serie considerata. Talvolta, come nel caso dei nostri lanci, abbiamo una divisione degli elementi in classi e di ogni classe abbiamo la frequenza: 0 teste si ottengono con una sola configurazione, 1 testa con 4 configurazioni, e cosı̀ via. In altre parole, se si hanno h classi, il valore x1 è assunto con frequenza f1 , il valore x2 con frequenza f2 , e via di seguito fino al valore xh assunto con frequenza fh . In tal caso il numero totale di dati è f1 + f2 + · · · + fh = n e quindi la media è data dalla formula: Ph x1 f1 + x2 f2 + · · · + xh fh j=1 xj fj . x= = Ph f1 + f2 + · · · + fh j=1 fj L’ultima riga contiene il numero di lanci teorico, cioè quanti avrebbero dovuto essere i lanci di ciascun tipo se la prova pratica, la simulazione, si conformasse perfettamente alla teoria. Tali valori si ottengono moltiplicando 160.000, il numero di prove, per la probabilità¡ di¢ ottenere quel certo numero di teste, ovvero π4,k = k4 /16. In pratica è impossibile che i dati relativi a una simulazione coincidano pari pari con ciò che prevede la teoria: anzi, quando in un esperimento Nel caso dei lanci si ha: di statistica ci dà valori troppo vicini a quelli previ1×0+4×1+6×2+4×3+1×4 sti dalla teoria, si può addirittura pensare a qualche = 2. x= 1+4+6+4+1 imbroglio, messo in atto per “far tornare” le cose. D’altra parte, quanto al più si possono discostare i Nota 4.9 La media non corrisponde nemmeno al dati sperimentali da quelli teorici affinchè si possa valore con la massima frequenza, anche se l’esempio affermare che i primi confermano i secondi (o viceprecedente ci potrebbe far pensare una cosa del geneversa)? Nel nostro caso, un confronto “ad occhio” re. Ad esempio, all’ultimo appello 13 studenti hanno 126 superato il mio esame: due hanno preso 21, sei hanno avuto 24, uno solo ha preso 25 e ci sono poi stati tre 28 e un 30. La media (2 × 21 + 6 × 24 + 1 × 25 + 3 × 28 + 1 × 30)/13 = 325/13 = 25, e uno solo degli studenti ha avuto 25. Il valore della sequenza che ha la frequenza maggiore, cioè il più gettonato, si dice la moda; nell’esempio, la moda è costituita dal valore 24. Più importante è però il concetto di mediana. Si consideri la nostra sequenza di dati (riprendiamo ad esempio quella dell’altezza delle cinque persone) e la si ordini in modo tale da mettere i dati stessi con valori mai decrescenti; tale ordinamento si dice sequenza per rango e la posizione assunta da ogni elemento si dice il rango di quell’elemento. Per le altezze si ha (1.63, 1.71, 1.72, 1.80, 1.84). Il valore mediano o mediana della distribuzione è l’elemento centrale di tale sequenza ordinata. Nell’esempio delle altezze, la mediana vale 1.72; nel caso dei voti è 24, corrispondente al settimo voto nella disposizione per rango. Se i dati sono in numero pari, ci sono due elementi centrali; in tal caso, la mediana è data dalla semisomma di tali due elementi. La media considerata si chiama anche aritmetica, per distinguerla da altri tipi di media che si considerano talvolta, anche se più raramente. La media geometrica sostituisce il prodotto alla somma e, di conseguenza, la radice n-esima alla divisione per n. Formalmente, se i dati sono a1 , a2 , . . . , an , la loro media geometrica è definita da: √ G = n a1 a2 . . . a n ; CAPITOLO 4. MATEMATICHE FINITE dei quadrati degli scostamenti dei singoli dati dalla loro media. Lo scostamento di xj dalla media x è la differenza (xj − x) e quindi si ha: σ2 = (x1 − x)2 + (x2 − x) + · · · + (xn − x)2 = n n = 1X (xj − x)2 . n j=1 Il simbolo σ 2 è universalmente usato per indicare la varianza di una distribuzione; σ, la radice quadrata della varianza, indica la cosiddetta deviazione standard. Nel caso delle persone nella stanza, le altezza uguali danno varianza 0, le altezze che crescono uniformemente danno varianza 0.0002 e la distribuzione di partenza dà 0.0086. In generale, la varianza è zero se e solo se tutti i dati coincidono col valore medio, e va crescendo mano mano che i dati se ne discostano. In altre parole, la varianza è tanto più grande quanto più i dati tendono ad essere lontani dalla media, cioè la varianza è un indicatore della dispersione dei dati intorno al loro valore medio. 4.8 Distribuzioni Un po’ di buon senso, o l’esperienza, ci fanno intuire che, lanciando le nostre otto monete, è più probabile se tutti i dati sono uguali ad a, abbiamo G = a, come ottenere una distribuzione bilanciata, come 4 teste ci si deve aspettare. La media armonica è un po’ più e 4 croci, piuttosto che una molto sbilanciata, come 8 teste oppure 8 croci. Invece, giocando a carte, alla complessa e si definisce come: roulette o al lotto, ci aspettiamo che ogni carta o ogni −1 −1 −1 H = ((a−1 , 1 + a2 + · · · + an )/n) numero sia equiprobabile, e anche se qualcuno insiste cioè come l’inverso della media aritmetica degli nel voler giocare al lotto i numeri che non escono inversi delle quantità considerate. Si può dimostrare da più tempo, sa razionalmente che tale metodo non che la media armonica è sempre minore o uguale alla gli sarà più favorevole del giocare del tutto a caso, media geometrica che, a sua volta, è sempre minore essendo impossibile che le giocate passate possano in o uguale della media aritmetica A, cioè H ≤ G ≤ A; qualche modo influenzare la prossima estrazione. l’uguaglianza si ha se e solo se tutti i dati sono uguali. Si dice che, durante la seconda guerra mondiale, Il lettore può controllare che con due soli dati a1 = 5 quando ormai la Statistica era una disciplina ben noe a2 = 7 si ha A = 6, G = 5.916 e H = 5.833. ta, l’esercito americano ordinasse a una ditta di conCome vedremo con l’Algoritmo 6.8, la media geofezioni bel 35. 000 divise in sette misure diverse; e la metrica fornisce un metodo assai interessante per . il calcolo di π, il rapporto tra circonferenza e diametro. ditta consegnò 7 000 divise di ciascuna misura. Fu cosı̀ che le misure medie non bastarono e quelle piccole e grandi avanzarono in grande quantità. Non so Se nella nostra stanza avessimo cinque persone come finı̀ la storia, ma oggi qualsiasi negozio di scarpe tutte alte 1.74, la loro altezza media sarebbe an- ordina molte misure medie (37 – 38 per la donna, 41 cora 1.74; e cosı̀ sarebbe se le persone fossero alte – 42 per l’uomo) e poche misure estreme come un 35 (1.72, 1.73, 1.74, 1.75, 1.76). La vecchia distribuzione o un 41 femminili, un 39 o un 45 maschili. Chi, come è la meno omogenea, mentre la più omogenea è quella me, calza il 39, sa quante difficoltà si incontrano per delle persone con la stessa altezza. Questa osserva- trovare un modello di nostro gradimento, proprio per zione ci dice che la media di una distribuzione non la scarsità delle scarpe di tale numero. Com’è che ci aspettiamo uniformità da una parte mette in evidenza come i vari elementi si discostano dal loro valore medio. Per questo esiste il concetto di (roulette, lotto) e variabilità dall’altra (altezza, nuvarianza : la varianza di una distribuzione è la media mero di scarpe, taglia)? Come dimostra il caso della 127 4.8. DISTRIBUZIONI ditta americana, le nostre previsioni sono legate all’intuito, all’esperienza o alla mancanza dell’uno e/o dell’altra. Per questo, la Statistica e il Calcolo delle Probabilità cercano di dare un’impostazione più scientifica e razionale al nostro modo di affrontare quella parte della realtà che appare governata dalla casualità. Fortunatamente, la natura sembra adeguarsi ad alcuni schemi (non molti, per la verità) che possono essere studiati in modo sistematico: come conclude Dostoevskij, “nel susseguirsi delle probabilità favorevoli c’è, se non un sistema, un certo qual ordine”. In tal modo, pur rimanendo impossibile prevedere il singolo caso (come cerca di fare il giocatore), è abbastanza facile prevedere in modo accurato l’andamente di un gran numero di eventi: è questo che aiuta le aziende di scarpe e di confezioni, che hanno dalla Statistica indicazioni precise sulle percentuali da produrre per ciascuna taglia. Se consideriamo il numero di persone che calzano una certa misura di scarpe, otteniamo la distribuzione dei numeri di scarpa; se misuriamo l’altezza degli abitanti di Milano e raggruppiamo tali altezze di centimetro in centimetro, abbiamo la distribuzione dell’altezza dei milanesi; se, come facevano i giocatori di Dostoevskij, contiamo le volte che viene estratto ciascun numero della roulette, abbiamo la distribuzione di tali numeri. Queste sono distribuzioni empiriche, legate alla frequenza dei singoli eventi, ma è possibile studiare teoricamente tali distribuzioni chiamando in campo il Calcolo delle Probabilità. Come si diceva, le distribuzioni teoriche alle quali si conformano la gran parte delle distribuzioni empiriche, sono stranamente poche. Noi, poi, ne introdurremo solo quattro, per semplificarci ancor di più la vita. 1. Distribuzione uniforme. Lanciando una moneta o un dado, giocando al lotto o alla roulette, ci aspettiamo che ogni evento (testa o croce, una faccia da 1 a 6, un numero tra 0 e 36, o un numero tra 1 e 90) abbia la stessa probabilità di verificarsi di ciascun altro evento. La corrispondente distribuzione di frequenze è perciò costituita da un istogramma con tutte le colonne della stessa altezza. I giocatori di Dostoevskij avrebbero dovuto trovare che ognuno dei 37 numeri della roulette ha una frequenza d’uscita vicina a tutti gli altri. Le oscillazioni che si possono riscontrare sono irrisorie di fronte alla frequenza registrata e possono essere compensate continuando a registrare le uscite successive. Semmai, si pone il problema di avere un criterio (o test, come si dice tecnicamente) per stabilire se, effettivamente, queste oscillazioni sono casuali o siano dovute a una possibile “truccatura” dell’apparecchio della roulette. Vedremo più avanti un possibile test. Nota 4.10 La distribuzione uniforme ha assunto un ruolo fondamentale con l’avvento degli elaboratori elettronici. Infatti, per mezzo di essa è possibile simulare anche le altre distribuzioni. E’ quindi importante avere un metodo efficace per produrre elementi distribuiti in modo uniforme. In realtà, l’elaboratore non è assolutamente in grado di produrre eventi casuali, in quanto esso è, per definizione, una macchina deterministica, cioè prevedibile in tutto quello che fa. Fortunatamente, la Matematica mette a disposizione alcune tecniche che permettono di produrre distribuzioni che, pur non essendo casuali, hanno tutti i crismi della casualità. Vengono pertanto dette distribuzioni pseudocasuali, e possono essere usate benissimo in luogo della distribuzione uniforme. Si consideri un numero primo p e il gruppo Z∗p composta da φ(p) = p − 1 elementi. Tale gruppo è ciclico, e quindi esistono numeri a, con 0 < a < p che generano tutto il gruppo, cioè {a, a2 , a3 , . . . , ap−1 } sono tutti gli elementi di Z∗p . Questi elementi, nell’ordine appena detto, anche se tale ordine è del tutto determinato, posseggono le caratteristiche delle sequenza casuali, e costituiscono pertanto una sequenza pseudocasuale. Ad esempio, se p = 11, le potenze di 7 sono: 7 5 2 3 10 4 6 9 8 1 che, ad occhio, forniscono una permutazione ragionevolmente casuale dei numeri da 1 a 10, cioè gli elementi di Z∗11 . Se poniamo a = 7 ed s = 1, il calcolo della sequenza può essere impostato semplicemente ponendo, iterativamente: s = as mod p di modo che il calcolo di ogni potenza successiva di a richiede solo un prodotto e una divisione; da questa formula, questo metodo di generazione viene detto congruenziale. Se volessimo utilizzare la sequenza per generare una serie di lanci di una moneta o di un dado, basterebbe ridurre i numeri modulo 2 e modulo 6. Nel caso del dado, bisogna poi aggiungere 1, ma questo è banale. Le sequenze sono: moneta dado 1101000101 2634551432 e ad occhio ci appaiono anch’esse ragionevolmente casuali. Naturalmente, p = 11 è solo un esempio, e dopo 10 numeri la sequenza si ripete, di modo che non possiamo proprio pensare di utilizzarla in applicazioni che coinvolgono migliaia, o anche milioni, di scelte casuali. Un numero più adeguato è p = 999999999989, assai vicino a 1012 . In questo modo, il numero s/1012 è un numero reale compreso tra 0 ed 1, e ciò serve ad avere una distribuzione uniforme continua; essa permette di ottenere ciascun numero reale nell’intervallo [0, 1) (con 12 cifre decimali) con la stessa probabilità. Questi numeri possono essere interpretati come probabilità e quindi costituiscono una buona distribuzione per tutti i problemi pratici che li debbano utilizzare. 128 CAPITOLO 4. MATEMATICHE FINITE 2. Distribuzione binomiale. Se lanciamo due o più monete e contiamo il numero di teste e di croci ottenute, abbiamo visto come non si ottenga più una distribuzione uniforme, ma entrino in gioco i coefficiente binomiali. La probabilità che gettando n monete si abbiano k teste, e quindi n − k croci, è data dalla formula: µ ¶. n 2n . πn,k = k ¡ ¢ Infatti, nk corrisponde agli eventi favorevoli, mentre 2n sono gli eventi possibili. La stessa cosa capita nel lancio di due o più dadi, anche se in questo caso la faccenda è più complicata a causa delle sei facce. Prendiamo n dadi, lanciamoli e chiediamoci qual è la probabilità che escano esattamente k facce col numero 1. Ognuna delle k facce ha probabilità 1/6 di apparire e poiché i dadi hanno un destino indipendente l’uno dall’altro, la probabilità che appaiano esattamente k facce è (1/6)k . Ricordiamo infatti, dalla sezione precedente, che le probabilità si moltiplicano quando corrispondono al verificarsi successivo di eventi indipendenti. Analogamente, la probabilità che una faccia non presenti il numero 1 è 5/6, e quindi la probabilità che n − k facce non presentino il nujmero 1 è (5/6)n−k . Infine, occorre valutare in quanti modi diversi vi siano esattamente k facce 1 fra le n facce ¡n¢ dei nostri dadi. Ma questo è facile e i modi sono k , cosı̀ che la probabilità cercata è: πn,k due dadi è dato dalle combinazioni: 1 + 4, 2 + 3, 3 + 2 e 4 + 1. Poiché due dadi danno luogo a 36 diverse configurazioni, la probabilità di ottenere 5 è 4/36 = 1/9 ≈ 0.1111 . . ., cioè un po’ più dell’11%. Se il numero dei dadi cresce, è un interessante problema combinatorio trovare tutte le possibili configurazioni che danno un certo numero N . Il problema è uno dei classici di questa disciplina, studiato fin dai tempi di Eulero e detto il problema delle partizioni di un intero. Originariamente, il problema consisteva nel trovare in quanti modi è possibile formare un numero intero; ad esempio: 4=1+3=2+2=3+1=1+1+2=1+2+1= = 2 + 1 + 1 = 1 + 1 + 1 + 1. La configurazione 1 + 3 può essere considerata uguale alla 3 + 1 e allora il modello cambia. Nel nostro caso, è richiesto che gli addendi siano un numero fissato n e il loro valore non ecceda un limite superiore (6 nel caso dei dadi). Non ci possiamo addentrare in questa materia, ma usando quattro dadi si ottiene l’istogramma della Figura 4.7, che ci introduce alla terza delle nostre distribuzioni. µ ¶ µ ¶k µ ¶n−k n 1 5 = = k 6 6 µ ¶ µ ¶n µ ¶ n 1 5 1 n n−k 5 = = n 6 k 6 k 5k dove entrano, appunto, i coefficienti binomiali che danno il nome a questa distribuzione. In generale, se un evento ha probabilità p di verificarsi, la probabilità che esso non si verifichi è q = 1 − p. Nelle monete abbiamo p = q = 1/2, poiché testa e croce sono alternative. Nel caso del dado, se l’evento è il comparire di una faccia determinata, la sua probabilità è 1/6; che perciò compaia uno degli altri numeri è 5/6. Pertanto, la probabilità che si verifichino k fra gli eventi considerati in una sequenza di n eventi, è dato dalla formula: µ ¶ n k n−k p q . πn,k = k Figura 4.7: Distribuzione quasi normale 3. Distribuzione normale. La forma a campana della distribuzione in Figura 4.7 è caratteristica di molti fenomeni naturali. Se misuriamo l’altezza delle persone o la lunghezza del loro piede; la circonferenza del tronco degli alberi in una foresta o la velocità delle molecole in un corpo a una certa temperatura; osserveremo sempre la caratteristica forma a campana. Questa formula generalizza tanto il lancio delle Gauss, il principe dei matematici, studiò teoricamenmonete, quanto quello dei dadi. te questa distribuzione e la chiamò normale proprio Quando si gioca a dadi, si può puntare sul nume- perché sembra essere la normale distribuzione dei fero totale che costituisce la somma di tutte le facce nomeni naturali. Egli trovò una formula che descrive dei dadi tirati. Cosı̀ il verificarsi di 5 nel lancio di la curva e che dipende da due parametri: la media 129 4.8. DISTRIBUZIONI e la deviazione standard della distribuzione. In altre parole, la forma della campana cambia a seconda del valore dei due parametri, alzandosi o ingrossandosi, pur rimanendo sostanzialmente la stessa. Per curiosità diamo qui la formula, ma per il momento rimane, appunto, una mera curiosità: à µ ¶2 ! 1 1 x−µ Nµ,σ (x) = √ exp − . 2 σ σ 2π La media µ corrisponde al punto più alto della curva, che è simmetrica rispetto alla retta x = µ. Un fatto caratteristico è costituito dalla percentuale degli eventi che si verificano in certi intervalli: il 68.27% il 95.45% il 99.75% si pone tra si pone tra si pone tra µ−σ e µ+σ µ − 2σ e µ + 2σ µ − 3σ e µ + 3σ; questo significa che ben 2/3 degli eventi si addensano nella zona che ha distanza pari alla deviazione standard dalla media e praticamente tutti si trovano a distanza della media per meno di tre volte la deviazione. Ciò giustifica l’importanza di σ. può non essere del tutto agevole. Per questo, si usano molto le tavole numeriche e alcune regole empiriche divenute standard. Le tavole contengono i valori di probabilità della distribuzione N0,1 (x), cioè della distribuzione normale di media 0 e di deviazione standard 1. Vi sono poi semplici formule di conversione a qualsiasi Nµ,σ (x). Uno degli approcci empirici più utilizzati è il seguente. Abbiamo visto, definendo il concetto di mediana, cosa sia l’ordinamento per rango di una certa distribuzione empirica, riferita ad n eventi. Sia allora x1 ≤ x2 ≤ · · · ≤ xn tale ordinamento e poniamo k = n/10. Si dice che gli elementi x1 ≤ x2 ≤ · · · ≤ xk costituiscono il primo decile della distribuzione; gli elementi xk+1 ≤ xk+2 ≤ · · · ≤ x2k il secondo decile, e cosı̀ via. In altre parole, il primo decile contiene il primo 10% dei dati nell’ordinamento per rango, e via di seguito fino al decimo decile, che contiene l’ultimo 10%. Il valore estremo di un certo decile si dice il valore del decile. I valori del primo e del nono decile sono molto usati per indicare convenzionalmente i valori di “norma” di una distribuzione. Ad esempio, in auxologia, si riportano in un grafico, per le varie età, il valore mediano dell’altezza e i valori del primo e del nono decile. Di “norma” la crescita deve avvenire costantemente nell’intervallo fra questi due decili, che rappresenta l’altezza dell’80% della popolazione a quell’età. Valori al di fuori della “norma”, relativi perciò al solo 20% della popolazione, possono indicare qualche disfunzione nel processo di crescita e vanno considerati con la debita attenzione. Concetti analoghi al decile sono quelli di percentile e di quartile, che però lasciamo alla buona volontà del lettore, dato che non presentano alcuna differenza concettuale. 4. Distribuzione di Poisson. Una distribuzione non simmetrica è quella di Poisson, definita in funzione di un parametro µ, che ne indica la media: pk = eµ Figura 4.8: La campana della distribuzione normale Il carattere generale della distribuzione normale si suole giustificare con la cosiddetta legge dei grandi numeri, che vede la distribuzione normale come una specie di limite al quale tendono tutte le distribuzioni, quando vengano iterate, come abbiamo fatto per il lancio delle monete. La legge (grosso modo) afferma che dato un fenomeno, il quale segua una qualsiasi distribuzione di probabilità, se lo si itera un numero sufficientemente grande di volte e si considera la distribuzione di probabilità del fenomeno cosı̀ iterato, allora tale distribuzione si può identificare con la distribuzione normale. Nota 4.11 Come si può intuire dalla formula di Gauss, lavorare con la matematica della distribuzione µk k! dove eµ è la funzione esponenziale che introdurremo ufficialmente nella Sezione 8.5. Questa distribuzione è discreta, ma assume valori per infiniti k; ben presto, tuttavia, i pk si riducono praticamente a 0 e le possibilità possono essere considerate in numero finito. La distribuzione di Poisson è molto frequente e ad essa si adeguano, ad esempio, le lunghezze degli intervalli con cui le persone arrivano ad uno sportello (banca, uffici pubblici, etc.). Come abbiamo già osservato, quelle viste non sono le uniche distribuzioni degne di nota. A cavallo dell’anno 1900, l’economista Pareto osservò che molti fenomeni economici seguono una distribuzione caratteristica. Ad esempio, se si mettono in ordine i contribuenti dal più ricco al più povero e chiamiamo R il reddito del più ricco, allora il reddito del secondo è (all’incirca) R/2, il reddito del terzo è R/3, e 130 cosı̀ via. Allo stesso modo sembra funzionare la produzione delle industrie e la popolazione delle città. Qualche anno dopo, il linguista Zipf fece notare che anche molti fenomeni linguistici, come la frequenza delle parole in un testo, hanno più o meno la stessa distribuzione. Essa viene perciò detta di Pareto-Zipf e si formula nel modo seguente: se r è il rango (cioè la posizione) che un evento viene ad assumere nell’ordinamento rispetto ad un parametro assegnato ed Rr è il valore di tale parametro, allora il prodotto rRr è costante. Nei fatti, abbastanza analoga alla legge di ParetoZipf è quella cosı̀ detta dell’80/20. Nel caso del reddito, essa afferma che il 20% dei contribuenti si suddividono l’80% del totale dei redditi. Nel caso delle città, il 20% delle città di un paese riuniscono l’80% di tutti gli abitanti. E cosı̀ via, dando spesso una valutazione numerica alle ingiustizie di questo mondo. Noi ci possiamo accontentare di aver ricordato tutto ciò. Concludiamo queste note dando una breve spiegazione del metodo del chi quadro. Nella sezione precedente, abbiamo visto una distribuzione empirica relativa al lancio di quattro monete ed essa si dovrebbe accordare con la distribuzione teorica binomiale. I dati empirici difficilmente coincidono con i dati teorici, anzi, se coincidessero, si potrebbe avere qualche sospetto proprio sulla rilevazione dei dati empirici. Al di là di generiche differenze, com’è possibile dire (ammesso che lo sia) se una certa distribuzione empirica si conforma a una distribuzione teorica? Una possibile risposta è data dal test del chi quadro (χ2 ), che vogliamo ora descrivere. Si supponga di avere una distribuzione empirica discreta, data dalle frequenze f1 , f2 , . . . , fn se n sono le classi in cui il fenomeno è suddiviso. Sia N = f1 + f2 + · · · + fn il numero totale dei dati rilevati e supponiamo che ogni fk sia non inferiore a 5: altrimenti possiamo accorpare più classi in una sola, fino a che questa condizione non sia soddisfatta. La distribuzione teorica prevederà certe probabilità p1 , p2 , · · · , pn in corrispondenza di ciascuna classe, e quindi possiamo parlare di frequenze attese se moltiplichiamo ciascuna di queste probabilità per N , il numero totale di osservazioni. Tali frequenze attese saranno perciò: CAPITOLO 4. MATEMATICHE FINITE Questo ci dice che più alto è il valore del χ2 , più lontana dalla distribuzione teorica risulta essere la distribuzione empirica. Il valore del χ2 ottenuto va confrontato con i valori di una tabella predisposta, secondo regole che vedremo fra un istante. Se il χ2 è compreso tra due opportuni valori della tabella potremo dire che distribuzione empirica è in accordo con la distribuzione teorica. Non si ha accordo, invece, se il χ2 è maggiore del più grande dei valori indicati. Nell’esempio precedente abbiamo già calcolato le frequenze attese della distribuzione teorica, per cui calcoliamo: χ2 = + (10063 − 10000)2 (39951 − 40000)2 + + 10000 40000 (60060 − 60000)2 (39891 − 40000)2 + + 60000 40000 + (10035 − 10000)2 = 0.9364. 10000 Ottenuto questo valore, vediamo come ci si deve comportare con la tabella del χ2 . Prima di tutto, occorre stabilire quanti sono i gradi di libertà della nostra distribuzione empirica. Grosso modo, i gradi di libertà di una distribuzione sono i dati (o i gruppi di dati) che possiamo scegliere in modo arbitrario (libero) senza cambiare la natura della distribuzione. Questo è piuttosto vago, ma concretamente, nel nostro caso, abbiamo considerato cinque classi e le frequernze di tali classi sono libere, eccetto per il fatto che in tutto abbiamo effettuato 160. 000 prove. Ciò significa che se possiamo scegliere liberamente il valore di quattro classi, quello della quinta è determinato dalla differenza fra 160. 000 e la somma delle frequenze delle prime quattro classi. Abbiamo perciò 4 gradi di libertà. Nella Tabella 4.5 del χ2 , dobbiamo considerare la riga corrispondente a 4 gradi di libertà. Cosa significano i valori presenti in tale linea? Nella testata della tabella troviamo delle probabilità: ad esempio, nella quarta riga c’è il valore 9.488 in corrispondenza della probabilità 0.95; questo significa che sperimentando con una distribuzione empirica che si adegua alla distribuzione teorica considerata, nel 95% dei casi si ottiene un χ2 con valore minore o uguale a 9.488. e1 = N p1 , e2 = N p2 , · · · en = N pn . Cosı̀ nel 5% dei casi troviamo χ2 ≤ 0.711. Si noti che non ha rilevanza quale tipo di distribuzione teorica si Con queste frequenze attese e quelle osservate consideri. calcoliamo la quantità: E’ chiaro che qualunque sia il valore del χ2 otten 2 X nuto, esso rientra nel 100% degli esperimenti; ciò si (fk − ek ) . χ2 = può vedere dalla tabella, i cui valori crescono man ek k=1 mano che si procede verso la parte destra. Nel caso Questa quantità è detta appunto “chi quadro” e os- di conformità, bisogna essere molto sfortunati per otserviamo subito che se le frequenze osservate coin- tenere valori altissimi e, di fronte a un χ2 molto elecidessero con le frequenze attese avremmo χ2 = 0. vato saremmo propensi a pensare che qualcosa non 131 4.8. DISTRIBUZIONI 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 20 25 30 35 40 50 75 100 2.5% 0.001 0.051 0.216 0.207 0.831 1.237 1.690 2.180 2.700 3.247 3.816 4.404 5.009 5.629 6.262 9.591 13.12 16.79 20.57 24.43 32.36 52.94 74.22 5% 0.004 0.103 0.352 0.484 1.146 1.635 2.167 2.733 3.325 3.940 4.575 5.226 5.892 6.571 7.261 10.85 14.61 18.49 22.47 26.51 34.76 56.05 77.93 95% 3.842 5.992 7.815 9.488 11.07 12.59 14.07 15.51 16.92 18.31 19.68 21.03 22.36 23.69 25.00 31.41 37.65 43.77 49.80 55.76 67.51 96.22 124.3 97.5% 5.024 7.378 9.348 11.14 12.83 14.45 16.01 17.54 19.02 20.48 21.92 23.34 24.74 26.12 27.49 34.17 40.65 46.98 53.20 59.34 71.42 100.8 129.6 Tabella 4.5: La tabella del χ2 va, piuttosto che ad accettare supinamente il risultato dell’esperimento. D’altra parte è sospetto anche un valore del χ2 molto vicino a 0 che, come si vede dalla tabella, corrisponde a una piccolissima parte degli esperimenti. Vedendo invece la cosa dal punto di vista di chi non sa se la distribuzione empirica si conforma o meno a quella teorica, possiamo procedere cosı̀: scegliamo due probabilità, una bassa e l’altra abbastanza alta: spesso si prendono il 5% e il 95%; nella Tabella 4.5 abbiamo considerato anche il 2.5% e il 97.5%. Se il χ2 ottenuto sperimentalmente è compreso fra questi valori, allora possiamo ragionevolmente accettare l’ipotesi che la distribuzione empirica si conformi davvero a quella teorica. Se il χ2 supera il valore corrispondente alla probabilità del 95%, saremo piuttosto dell’opinione di rigettare l’ipotesi, e saremo tanto più convinti di ciò quanto più alto è il valore del χ2 . Infine, se il χ2 è minore del valore corrispondente al 5%, dobbiamo sospettare che qualcosa nel nostro esperimento non va, e c’è qualche vizio logico o di rilevazione dei dati. Il nostro 0.9364 è giusto compreso tra 0.711 e 9.488; quindi la nostra distribuzione empirica si trova nell’intervallo di probabilità corretto per una distribuzione che si adegui a quella binomiale considerata. Ciò ci fa inclinare ad accettare l’ipotesi che la distribuzione binomiale sia effettivamente la distribuzione teorica che descrive quella dei nostri lanci. 132 CAPITOLO 4. MATEMATICHE FINITE Capitolo 5 Algebra Rischiai di dare lo spettacolo di un prigioniero messo a forza fuori di prigione. Erano le cinque. Uno dei convitati mi accompagnò fino alla porta, mi abbracciò, e promise di venirmi a trovare uscendo di prigione. Doveva fare ancora due o tre mesi. Era l’infelice Galois che non rividi mai più, perché l’indomani della sua liberazione venne ucciso in duello. G. de Nerval “Le mie prigioni” 5.1 Calcolo letterale L’associazione tra Algebra e calcolo letterale è piuttosto recente e risale alla fine del 1500, nonostante che fino dall’antichità si siano cercate regole e metodi per la risoluzione di equazioni. Già nel papiro di Rhind (ca. 1650 a.C.) e su tavolette babilonesi (ancora più vecchie) si trovano problemi di Algebra; ma furono gli Arabi, dopo l’800 d.C., che dettero i maggiori contributi a questa disciplina. Al-Khuwarizmi sapeva risolvere le equazioni di secondo grado, e dal suo libro “Al-jabr wa’l muqābalah” è stato tratto il termine Algebra. Cosa significhino le parole al-jabr e al-muqābalah è oscuro; si ritiene che al-jabr indichi il trasferimento di un termine da un membro all’altro di un’equazione, e al-muqābalah si riferisca alla cancellazione di termini uguali nei due membri, ma questa interpretazione non è sicura. Dalla traduzione latina “Liber Algebrae et Almucabala” (che toglie tutti i dubbi sul significato delle due parole!) fino al 1600 ci si riferı̀ alla risoluzione delle equazioni come alla “scienza dell’Algebra e dell’Almucabala”, poi l’Almucabala venne a cadere e l’Algebra è rimasta. Fino al 1500 la formulazione delle equazioni era puramente discorsiva e ci si riferisce a quell’Algebra come all’“Algebra retorica”. Prima del 1500 il francese Chuquet cominciò a introdurre forme abbreviate e le equazioni si iniziarono a formulare in modo più convenzionale: la variabile (che oggi diremmo x) era detta la “cosa”, il suo quadrato x2 era il “censo” e il suo cubo x3 era il “cubo”. Si usarono anche espressio√ ni simili a formule: 5p : Rm : 15 stava per 5 + −15, dove p e m era la notazione, detta “italiana”, per i simboli + e −. Questi ultimi furono introdotti in Germania verso il 1550 e il segno = fu inventato dall’inglese Recorde più o meno negli stessi anni. Questo nuovo tipo di notazione fu detto “Algebra sincopata”. Ma il vero e proprio calcolo letterale è nato, verso la fine del 1500, col francese Viète e mezzo secolo dopo Cartesio usava già una notazione molto simile a quella moderna. Sino al 1600 l’Algebra era concepita come un metodo per la risoluzione di problemi numerici specifici, o poco più. Poiché non si volevano considerare numeri negativi (che non si capivano) le due equazioni di secondo grado x2 + ax = b (“il censo più la cosa uguale a numero”) e x2 = ax + b (“il censo uguale alla cosa più un numero”) erano considerate diverse e trattate pertanto con regole risolutive differenti. Le lettere si imposero prima come incognite e solo successivamente per le costanti (cioè i parametri). Oggi, il calcolo letterale è alla base di tutta l’Algebra e tutti gli studenti ne hanno familiarità. Le lettere (dell’alfabeto latino o greco) hanno in realtà significati ed accezioni di natura assai diversa, ma, fortunatamente, la loro trattazione e manipolazione avviene in modo omogeneo. Ricordiamo che una lettera: 133 1. se indica un simbolo astratto, da non confondere con indicazioni di numeri o altre entità, si dice una indeterminata; 2. se indica valori che possono essere assunti da un insieme prestabilito (ad esempio, un insieme o un campo numerico) è detta variabile; nella notazione funzionale y = f (x), x è la variabile indipendente, y quella dipendente; 3. se indica, in un’equazione, un valore non noto e che vogliamo determinare, è detta incognita; 4. se indica, in un’equazione, un valore che si suppone noto (e quindi non deve essere determinato, ma anzi è da usare per trovare il valore della o delle incognite) si dice un parametro. 134 CAPITOLO 5. ALGEBRA polinomi si tratti. Quando le indeterminate sono più In ogni caso, per le lettere valgono sempre le regole di una, esse si indicano tra parentesi: Z[x, y] oppure di calcolo che estendono le regole di calcolo dei nuZ[x][y]. Quest’ultima notazione mette in evidenza meri. Come è ben noto, in Algebra il segno × della che possiamo prima considerare i polinomi nella moltiplicazione si sottintende o, al più, si denota con indeterminata x, e quindi quelli nella indeterminata y un puntino, cioè invece di a × b si preferisce scrivere aventi come coefficienti i polinomi di Z[x]. Eseguendo ab o a · b. Le proprietà commutativa ed associativa i prodotti si ha ovviamente l’uguaglianza dei due permettono di scrivere ab(ax(ba)xy) come aaabbxxy, insiemi. seguendo la regola generale di disporre le varie lettere in ordine alfabetico. Il prodotto di una lettera per sé stessa si può abbreviare con la notazione delle Sui polinomi è possibile definire le operazioni di potenze e, anche per le lettere, si definisce: somma e prodotto in modo da estendere la somma ½ e il prodotto tra numeri; prima di tutto diamo la a0 = 1 seguente: n+1 n a = a·a Definizione 5.3 La somma di due monomi simili è Si scriverà pertanto: aaabbxxy = a3 b2 x2 y. un monomio la cui parte letterale è uguale a quella dei Definizione 5.1 Si dice monomio il prodotto di un due addendi e il cui coefficiente è la somma algebrinumero per un prodotto di lettere; il numero si dice ca dei coefficienti dei due monomi. Il prodotto di due coefficiente o parte numerica del monomio, mentre le monomi è un monomio il cui coefficiente è il prodotto lettere ne costituiscono la parte letterale. Due mono- dei due coefficienti e la cui parte letterale è costituimi si dicono simili se hanno la stessa parte lettera- ta dalle lettere comuni e non comuni dei due monole; se questa non è presente, il monomio si dice una mi, quelle non comuni col proprio esponente e quelle comuni con esponente uguale alla somma degli espocostante. nenti. La somma e il prodotto di polinomi estendono Sono monomi 3a2 b, −5ax2 y, 7, 2.7xyz, ax2 y e il secon- queste regole in modo tale che sia valida la proprietà do è simile al quarto; un coefficiente 1 è di norma distributiva del prodotto rispetto alla somma. sottinteso. I monomi costituiscono la base per la moltiplichiamo i due polinomi x2 − costruzione delle espressioni letterali, le più semplici Come esempio, 2 delle quali sono i polinomi: si dice polinomio la som- 2x + 1 e x + x − 1; la proprietà distributiva impone ma di uno o più monomi. Ricordando che si scrive di moltiplicare ogni monomio del primo polinomio per 3ax2 − 2a2 x invece di 3ax2 + (−2a2 x), sono polinomi ogni monomio del secondo; pertanto si ottiene: a2 + 2ab + b2 , x2 − 3x + 1 e y 5 − 4. (x2 − 2x + 1)(x2 + x − 1) = Come abbiamo visto, si scrive a2 per aa; quindi a1 sta per a e a0 per il monomio costante 1. Come si sa, = x4 + x3 − x2 − 2x3 − 2x2 + 2x + x2 + x − 1. 1 0 a e a non si scrivono mai, e questo ci permette di A questo punto possiamo sommare i monomi simili introdurre la seguente: ed ottenere: Definizione 5.2 Si dice grado di un monomio la somma degli esponenti della sua parte letterale; il gra- (x2 − 2x + 1)(x2 + x − 1) = x4 − x3 − 2x2 + 3x − 1. do di un polinomio è il massimo dei gradi dei suoi Si osservi (a + b)(a + b) = a2 + ab + ab + b2 = a2 + monomi. 2ab + b2 . Questo è il più semplice esempio di potenza Il grado dei monomi nell’esempio precedente è, ri- di un binomio; un binomio è un polinomio con due soli spettivamente, 3, 4, 0, 3, 4. Il grado di un monomio termini, come x2 y+3wyz, ma possiamo indicarlo concostante è sempre 0 eccetto, convenzionalmente, il venzionalmente come a + b. Dalla regola precedente grado di 0 che si pone −∞ (meno infinito), cosa che abbiamo: (x2 y+3wyz)2 = x4 y 2 +6wx2 y 2 z+9w2 y 2 z 2 . tornerà utile in varie occasioni. Sviluppando i prodotti si ha: Nota 5.1 Esplicitamente, abbiamo considerato polinomi i cui coefficienti appartengono ai numeri reali. Può essere utile trattare anche polinomi a coefficienti in altri insiemi numerici. Se fissiamo una lettera x (che in questo caso ha il ruolo di “indeterminata”) l’insieme dei polinomi in x a coefficienti in un insieme numerico K si indica con K[x]; ad esempio, x2 − 3x + 1 ∈ Z[x] e 12 x3 − 41 x + 5 ∈ Q[x]. In generale, considereremo R[x], a meno che non si dichiari esplicitamente il contrario, specificando di quale insieme di (a + b)0 (a + b)1 (a + b)2 (a + b)3 (a + b)4 = = = = = 1 a+b a2 + 2ab + b2 a3 + 3a2 b + 3ab2 + b3 a4 + 4a3 b + 6a2 b2 + 4ab3 + b4 Come si vede, nell’espressione (a + b)n le potenze di a vanno decrescendo e quelle di b vanno crescendo in modo tale che in ai bj si abbia i + j = n. I coefficienti 135 5.1. CALCOLO LETTERALE sono dati dal triangolo di Tartaglia o triangolo di Pascal, nel quale, come sappiamo, ogni elemento è ottenuto sommando il numero che gli sta immediatamente sopra e quello che gli sta sopra, ma alla sinistra: il lettore è caldamente invitato a dare una dimostrazione per induzione di questa regola, basandosi sul fatto che (a + b)n+1 = (a + b)(a + b)n , supponendo di conoscere l’espressione per (a + b)n e sviluppando quindi il prodotto. In generale, si ha il seguente risultato: Teorema 5.1 Vale la formula: a G ab a−b a2 I H b 2 ab F b E b A a−b C D b J B Figura 5.1: Prodotti notevoli per via geometrica (a + b)n = Nota 5.2 I Greci, pur con la loro preferenza per µ ¶ µ ¶ µ ¶ µ ¶ n n 0 n n−1 1 n n 0 n la Geometria e l’ignoranza per il calcolo letterale, co1 n−1 a b + a b +· · ·+ a b + a b . noscevano alcune di queste regole e ne davano una 0 1 n−1 n Prova: Si consideri l’espansione (a + b)n = (a + b)(a + b) · · · (a + b) per n volte. Applicando la proprietà distributiva si ottengono tanti termini, ognuno composto di n fattori a oppure b, cioè del tipo ak bn−k . Quanti sono i termini di questo tipo? Sono quelli corrispondenti alla scelta di a da k dei fattori (a + b), e quindi la scelta di b dagli altri n − k fattori. Ma la scelta dei k fattori a è come la scelta di k elementi dall’insieme degli n fattori (a + b), e quindi si hanno Cn,k termini ak bn−k . Naturalmente, si ha: (a − b)2 (a − b)3 = a2 − 2ab + b2 = a3 − 3a2 b + 3ab2 − b3 e cosı̀ via, dove si osserva che i segni + e − procedono in modo alternato. Le potenze di un binomio sono, a loro volta, un esempio di prodotto notevole; con questo termine si indicano identità che è bene ricordare a mente perché permettono di semplificare molti conti. Un caso molto famoso è fornito dal prodotto di una somma per una differenza: (a + b)(a − b) = a2 − b2 che si dimostra ancora eseguendo i conti. Letto da destra verso sinistra, questo prodotto notevole si dice anche differenza di due quadrati e fa parte di una casistica più generale, di cui diamo i primi esempi: a2 − b2 a3 − b3 a4 − b4 a5 − b5 = = = = = (a − b)(a + b) (a − b)(a2 + ab + b2 ) (a − b)(a + b)(a2 + b2 ) (a − b)(a3 + a2 b + ab2 + b3 ) (a − b)(a4 + a3 b + a2 b2 + ab3 + b4 ) Per le somme di due potenze si ottengono prodotti solo per esponenti dispari: a3 + b3 a5 + b5 = = (a + b)(a2 − ab + b2 ) (a + b)(a4 − a3 b + a2 b2 − ab3 + b4 ) dimostrazione geometrica (vedere la Figura 5.1). L’identità (a + b)2 = a2 + 2ab + b2 è ovvia, come appare a sinistra della figura. Il lettore può utilmente costruire un cubo di lato a + b mettendo assieme un cubo di lato a, uno di lato b, tre parallelepipedi di dimensioni a × a × b e tre parallelepipedi di dimensioni a × b × b. In quanto alla a2 − b2 = (a + b)(a − b) si osservi che, nella Figura 5.1, togliendo al quadrato ABF G di area a2 il quadrato BCIJ di area b2 , si ottiene la stessa scomposizione del rettangolo DEGH, che ha dimensioni (a − b)(a + b). I restanti prodotti notevoli, naturalmente, sono più difficilmente dimostrabili per via geometrica. I prodotti notevoli si prestano a introdurre qualche curiosità, utile a ricordare che certe manipolazioni sono errate, come abbiamo avvertito parlando delle espressioni aritmetiche. Tali manipolazioni possono portare a errori gravissimi nella risoluzione delle equazioni, come vedremo tra poco. Ecco allora due dimostrazioni esemplari: la prima ci informa che tutti i numeri sono uguali; la seconda, più modestamente, ci fa vedere come 1 sia uguale a 2. Siano a, b ∈ R due numeri reali diversi tra loro e si chiami c la loro differenza, cioè a − b = c. Moltiplicando entrambi i membri per a − b e osservando che (a − b)2 è un prodotto notevole, si ha a2 + b2 − 2ab = ca − cb. Questa si scrive anche a2 − ab − ac = ab − b2 − bc ovvero a(a − b − c) = b(a − b − c) e semplificando a = b pur avendo supposto i due numeri differenti. La seconda “dimostrazione” parte invece da due numeri uguali a = b e li moltiplica per a: a2 = ab. Sottraendo b2 si ha a2 − b2 = ab − b2 , cioè (a − b)(a + b) = b(a − b). Ora si può semplificare e ottenere a + b = b, e poiché s’è supposto a = b si conclude 2b = b ovvero 2 = 1. Il lettore ha subito individuato dove è stato commesso l’errore, consistente in una indebita divisione per 0. Ci si può sbizzarrire e trovare analoghe perle; ma, per il momento, qui ci arrestiamo. Indubbiamente, i polinomi sono le espressioni letterali più semplici, e li studieremo in modo abbastanza approfondito. Altre espressioni importanti e d’uso assai frequente sono i rapporti tra polinomi, detti 136 CAPITOLO 5. ALGEBRA funzioni razionali fratte: x4 − 3x3 + x2 − 3x + 5 . x3 + 2x2 − x + 6 Nota 5.3 Come vedremo nella prossima sezione, eseguendo la divisione fra numeratore e denominatore, possiamo trasformare ogni funzione razionale fratta nella somma di un polinomio (il quoziente, eventualmente 0) e una funzione razionale fratta nella quale il grado del numeratore è inferiore a quello del denominatore. Nella Sezione 5.4 vedremo un’ulteriore semplificazione delle funzioni razionali fratte detta riduzione a frazioni parziali, che ha un notevole numero di applicazioni, le più importanti delle quali riguardano il calcolo integrale (vedere Sezione ??) e la risoluzione delle ricorrenze (vedere Sezione ??), argomento, questo, trattato purtroppo qui con pochi dettagli. Espressioni√letterali più complesse coinvolgono le radici, come x2 + 1, che possono apparire tanto al numeratore che al denominatore di espressioni frazionarie. Come abbiamo osservato nella Sezione ??, avere un radicale a denominatore di una frazione è particolarmente noioso e quindi è bene liberarsi di situazioni del genere mediante un’opportuna razionalizzazione. Ci sono problemi connessi all’equivalenza delle espressioni, che vedremo nella Sezione 5.3, ma le tecniche da adottare sono semplici e legate ai prodotti notevoli che abbiamo appena visto. Se il denominatore si riduce a un semplice radicale, la razionalizzazione è ovvia: √ 1 3x + 1 √ = 3x + 1 3x + 1 √ avendo moltiplicato sopra e sotto per 3x + 1. Se invece abbiamo la somma o la differenza di due o più radicali quadratici, la razionalizzazione è legata alla differenza di due quadrati. In questo √ esempio, dobbiamo moltiplicare sopra e sotto per 3x + 1 + √ 2x − 3: √ √ 1 3x + 1 + 2x − 3 √ √ = = 3x − 1 − 2x + 3 3x + 1 − 2x − 3 √ √ 3x + 1 − 2x − 3 = . x+2 I radicali cubici si affrontano nello stesso modo con la regola per a3 − b3 : 1 √ √ = 3 3x + 1 − 3 2x − 3 p p p 3 (3x + 1)2 + 3 (3x + 1)(2x − 3) + 3 (2x − 3)2 . = x+2 5.2 I polinomi Fra le espressioni letterali hanno un ruolo molto importante i polinomi, che abbiamo introdotto nella sezione precedente. Abbiamo anche visto come si eseguono tre delle operazioni di base: addizione, sottrazione e prodotto. Se K[x] è l’insieme dei polinomi a coefficienti in un insieme numerico K e nell’indeterminata x, le tre operazioni sono “chiuse” in K[x], cioè la somma, la differenza e il prodotto di due polinomi in K[x] sono ancora polinomi in K[x] e valgono le consuete proprietà, elencate nella Tabella 5.1. Anche il grado di un polinomio è stato introdotto nella sezione sul calcolo letterale; è bene aver presenti i seguenti risultati: Lemma 5.2 Sia gr(p(x)) il grado del polinomio p(x); allora si ha: gr(p(x) + q(x)) gr(p(x)q(x)) ≤ max(gr(p(x), gr(q(x)) = gr(p(x) + gr(q(x) Prova: Per definizione i monomi che compaiono in p(x) + q(x) sono simili ai monomi che compaiono in p(x) e/o q(x), a meno che, nella somma, due monomi simili, ma con coefficienti uno l’opposto dell’altro, non si eliminino a vicenda. In ogni caso gr(p(x) + q(x)) non può superare il massimo dei gradi dei due polinomi addendi. Per il prodotto, sia axn con a 6= 0 il monomio di grado massimo in p(x) e sia bxm con b 6= 0 il monomio di grado massimo in q(x). Allora, p(x)q(x) conterrà il monomio abxn+m , essendo ab 6= 0. Tutti gli altri monomi che compongono il prodotto hanno pertanto grado inferiore ad n + m, e questo dimostra l’asserto. Il lettore attento avrà osservato, a questo punto, l’importanza di aver definito gr(0) = −∞; quello un po’ meno attento è invitato a calcolare il grado della somma e del prodotto dei tre polinomi 0, 5, 7x2 + 4x − 1, presi due a due. Si osservi anche la seguente conseguenza del lemma precedente: Corollario 5.3 Se due polinomi p(x) e q(x) hanno grado diverso, allora p(x)+q(x) ha grado esattamente uguale al più grande dei gradi di p(x) e q(x). Ma la conseguenza veramente importante del lemma precedente è la seguente proprietà analoga a quella dei numeri interi: Teorema 5.4 Se il prodotto di due polinomi p(x), q(x) è zero, allora almeno uno di essi è il polinomio 0. Prova: Se m è il grado di p(x) ed n è quello di q(x), il grado del prodotto p(x)q(x) è m + n, ma affinché sia m + n = −∞, uno almeno tra m ed n deve essere −∞, cioè il corrispondente polinomio deve essere 0. 137 5.2. I POLINOMI commutativa associativa distributiva identità zero p(x) + q(x) = q(x) + p(x) p(x)q(x) = q(x)p(x) p(x) + (q(x) + r(x)) = (p(x) + q(x)) + r(x) p(x)(q(x)r(x)) = (p(x)q(x))r(x) p(x)(q(x) + r(x)) = p(x)q(x) + p(x)r(x) 0 + p(x) = p(x) + 0 = p(x) 1p(x) = p(x)1 = p(x) 0p(x) = p(x)0 = 0 Tabella 5.1: Somma e prodotto di polinomi Nota 5.4 Invitiamo naturalmente il lettore a formulare gli algoritmi per l’addizione e la moltiplicazione di due polinomi; quello per la sottrazione è un banale adattamento dell’algoritmo dell’addizione. Per coloro che hanno un po’ di esperienza di programmazione, consigliamo l’esercizio di scrivere esplicitamente, nel linguaggio di programmazione conosciuto, i programmi per le tre operazioni. Si usano, di solito, due rappresentazioni di un polinomio: la prima è una coppia costituita da un numero naturale (un integer) e un vettore di numeri reali (cioè real); il numero rappresenta il grado e il vettore i coefficienti dei vari monomi (ricordarsi di non saltare eventuali coefficienti 0, altrimenti la posizione nel vettore non corrisponde più al grado del monomio, ed è impossibile lavorare). La seconda rappresentazione è a lista, ogni elemento della lista costituito da una coppia (grado, coefficiente). Se si procede in senso decrescente, il grado del primo monomio è anche il grado del polinomio e si possono saltare i monomi con parte numerica 0; questa volta non ci sono problemi di interpretazione dei vari monomi, visto che il grado è scritto in modo esplicito. Molto più complicata delle altre operazioni è la divisione tra polinomi; questa si può eseguire solo se il grado del dividendo è maggiore o uguale al grado del divisore, e alla fine si ottengono un quoziente e un resto, che sono ancora due polinomi. Il resto ha grado minore del divisore e, se si riduce a 0, la divisione si dice esatta. La terminologia è analoga a quella per la divisione tra numeri e se la divisione è esatta si dice che il divisore sta nel dividendo, o che il divisore divide o è un fattore del dividendo; questo, a sua volta, è un multiplo del divisore. La procedura per eseguire la divisione è la seguente: Algoritmo 5.1 (Divisione tra polinomi) Ingresso: due polinomi: p(x) il dividendo e d(x) 6= 0 il divisore; Uscita: quoziente e resto della divisione. 1. se gr(d(x)) > gr(p(x)) si esce con 0 come quoziente e p(x) come resto; 2. altrimenti, si assegna p(x) ad r(x) e chiamiamo A il monomio di grado più elevato in d(x); (a) poniamo in B il monomio di grado più alto in r(x) [per la condizione sui gradi dei polinomi, gr(B) ≥ gr(A)]; (b) si assegna a C il rapporto fra i due monomi B ed A; inseriamo tale monomio nel quoziente q(x) e poniamo m(x) = C · d(x) [m(x) ha pertanto lo stesso grado di r(x) e i monomi di grado massimo hanno lo stesso coefficiente]; (c) si pone r(x) := r(x) − m(x) [per le osservazioni precedenti, il grado di r(x) è diminuito di almeno una unità]; (d) se gr(r(x)) ≥ gr(d(x)) si cicla tornando al punto 2.; (e) altrimenti si esce con q(x) come quoziente ed r(x) come resto della divisione. Un esempio di divisione con resto chiarirà eventuali dubbi; supponiamo di voler dividere 2x5 + 4x4 − 3x2 + 2x − 1 per x2 − x + 1. L’impostazione è analoga a quella della divisione tra interi ed è bene non dimenticare i monomi con coefficiente 0 che possono non comparire esplicitamente nell’espressione dei polinomi. Nella Figura 5.2 è riportata l’intera divisione; il quoziente vale 2x3 + 6x2 + 4x − 5 e il resto −7x + 4. Un semplice esercizio è verificare questo risultato eseguendo d(x)q(x) + r(x). Il polinomio che si ottiene deve essere p(x), il dividendo. Come la nomenclatura relativa alla divisione tra polinomi ricalca quella della divisione tra interi, cosı̀ i concetti derivati sono simili e si può introdurre una nozione di divisibilità tra polinomi con tutti gli annessi e connessi che conosciamo: modulo, polinomio primo, scomposizione in fattori primi, massimo comun divisore e minimo comune multiplo. Tuttavia, l’inquadramento di tutti questi concetti richiede una certa attenzione e l’introduzione di una serie di nuove definizioni. Definizione 5.4 Si dice equazione l’uguaglianza fra due espressioni letterali; se A = B è la rappresentazione di tale uguaglianza, l’espressione letterale A si dice il membro sinistro dell’equazione, e B si dice il membro destro. Se x, y, . . . , z sono le incognite che compaiono in un’equazione, una sua soluzione è 138 CAPITOLO 5. ALGEBRA 2x5 2x5 +4x4 −2x4 +6x4 +6x4 3 2x −2x3 −6x3 +4x3 +4x3 −3x2 +2x −1 −3x2 +6x2 −9x2 −4x2 −5x2 −5x2 +2x −1 +2x +4x −2x +5x −7x x2 2x3 −x +6x2 +1 +4x −5 −1 −1 −5 +4 Figura 5.2: Divisione tra polinomi un assegnamento a tali lettere di valori specifici che rendono vera l’uguaglianza. Se un’equazione ha come soluzione ogni possibile assegnamento alle incognite dei valori di un insieme numerico K, allora si dice più propriamente una identità in K. Un’equazione si dice algebrica se è costituita dall’uguaglianza di due polinomi. Due equazioni si dicono equivalenti se e solo se hanno le stesse soluzioni. La forma canonica di un’equazione è un’equazione equivalente a quella data, ma della forma: espressione algebrica uguale a zero. Il grado di un’equazione algebrica è il massimo grado dei monomi che compaiono nella sua forma canonica. Si dice zero o radice di un polinomio una qualsiasi soluzione dell’equazione che si ottiene uguagliando a zero quel polinomio. A(x, y, . . . , z) + C(x, y, . . . , z) = B(x, y, . . . , z) + C(x, y, . . . , z); sostituendo alle incognite i valori della soluzione si ottiene una uguaglianza tra due somme di espressioni numeriche uguali, che sappiamo essere uguali. La stessa cosa vale per il prodotto A(x, y, . . . , z)C(x, y, . . . , z) = B(x, y, . . . , z)C(x, y, . . . , z), il quale, quando C(x0 , y0 , . . . , z0 ) 6= 0, dà l’uguaglianza di due prodotti di numeri uguali. Tuttavia, è bene osservare esplicitamente, che se C(x0 , y0 , . . . , z0 ) = 0, si ottiene l’uguaglianza 0 = 0 anche se A(x0 , y0 , . . . , z0 ) 6= B(x0 , y0 , . . . , z0 ), per cui l’equazione derivata non è equivalente a quella data. E’ facile vedere e dimostrare che il concetto di equazioni equivalenti è effettivamente una relazione di equivalenza; lasciamo al lettore il compito di sviluppare i dettagli di questa affermazione e osserviamo invece che l’equivalenza si mantiene con le operazioni di al-jabr e di al-muqābalah: Teorema 5.5 Data una qualsiasi equazione, ottiene un’equazione equivalente se: Usando la prima delle due regole, ogni equazione può essere portata in forma normale: basta aggiungere ai due membri l’espressione letterale opposta a quella che costituisce il membro destro. Una identità ha come forma normale l’equazione 0 = 0. Nel caso delle equazioni algebriche, si ha un’ultesi riore specializzazione: Teorema 5.6 (di Ruffini) Sia p(x) un polinomio; regola della somma: si aggiunge o si sottrae ad allora un numero a è radice del polinomio se e solo entrambi i membri dell’equazione la stessa se p(x) è divisibile per (x − a). espressione letterale; Prova: Se p(x) = q(x)(x − a), è chiaro che andando regola del prodotto: si moltiplicano o si dividono a sostituire x con a si trova p(a) = q(a) · 0 = 0. Viceentrambi i membri dell’equazione per la stessa versa, eseguiamo la divisione di p(x) per (x − a); sia espressione letterale, purché questa sia sempre q(x) il quoziente, mentre il resto, dovendo avere gradiversa da zero. do inferiore ad (x − a), sarà una costante b. Abbiamo Prova: Sia K l’insieme numerico sul quale consi- quindi p(x) = q(x)(x − a) + b. Sostituendo a ad x deriamo l’equazione; siano x, y, . . . , z le incognite che e sfruttando l’ipotesi che a sia una radice di p(x), si compaiono nei due membri, di modo che l’equazione ha: 0 = q(a) · 0 + b, e questo implica b = 0. si scriva A(x, y, . . . , z) = B(x, y, . . . , z). Una soluzioConseguenza di questo teorema è che, se conosciane sia x = x0 , y = y0 , . . . , z = z0 , cosı̀ che sia vera la mo le radici di un polinomio, diciamo a , a , . . . , a , 1 2 k proposizione allora possiamo scrivere tale polinomio come (x − A(x0 , y0 , . . . , z0 ) = B(x0 , y0 , . . . , z0 ). Se C(x, y, . . . , z) è la quantità che aggiungiamo ai due membri, si ha la nuova equazione a1 )(x − a2 ) · · · (x − ak ). In realtà, possiamo anche moltiplicarlo per una costante (diversa da zero) senza cambiare la validità del risultato. Naturalmente, basta eseguire i prodotti per avere la forma tradizionale. 139 5.2. I POLINOMI Ad esempio, se le radici sono 1, 2 e 3, il polinomio è (x − 1)(x − 2)(x − 3) = x3 − 6x2 + 11x − 6. Il matematico italiano Paolo Ruffini (1765 – 1822) anticipò Abel nella dimostrazione della irrisolubilità delle equazioni di 5◦ grado, anche se in modo non del tutto soddisfacente. Inventò anche una tecnica, detto regola di Ruffini, per dividere un polinomio per il binomio (x − a) senza eseguire direttamente la divisione secondo il metodo visto. Se ad esempio si vuole eseguire (x4 −2x2 +x+1)/(x−1), il calcolo si imposta cosı̀: 1 0 −2 1 1 1 1 −1 0 1 1 1 −1 0 1 La prima riga contiene i coefficienti del dividendo, dove occorre non dimenticare quelli nulli; il primo elemento della seconda riga è l’opposto del termine costante del divisore (x − a). Si abbassa poi nella terza riga il primo coefficiente e si pone il suo prodotto per a nella colonna successiva della seconda riga. Si esegue poi la somma 0 + 1, ottenendo l’1 della terza riga, e si procede in modo analogo fino alla fine. Nella terza riga si leggono il quoziente x3 +x2 −x ed il resto, che in questo caso è 1. Per quanto riguarda i polinomi e le equazioni algebriche, teoricamente possiamo considerare tre insiemi distinti: Z[x], Q[x] e R[x]; tuttavia, i primi due sono associati dal seguente risultato: Teorema 5.7 Un numero razionale r è radice di un polinomio in Q[x] se e solo se è radice di un polinomio in Z[x]. Prova: Poiché Z[x] ⊂ Q[x], se un polinomio in Z[x] ha come soluzione r, lo stesso polinomio, visto come appartenente a Q[x], ha ancora r come radice. Viceversa, sia r una radice di p(x) ∈ Q[x] e sia m il minimo comune multiplo dei denominatori dei coefficienti di p(x); se consideriamo l’equazione p(x) = 0, abbiamo p(r) = 0 e se moltiplichiamo i due membri per m 6= 0 si ha mp(r) = 0, cioè r è una radice del polinomio mp(x) ∈ Z[x]. Si considerano allora due soli insiemi di polinomi: i polinomi a coefficienti interi (che coincidono, nel senso visto, con i polinomi a coefficienti razionali) e i polinomi a coefficienti reali, che sono l’insieme più ampio. Le proprietà di questi due insiemi sono un po’ diverse e, quindi, quando necessario, li distingueremo chiaramente per evitare confusioni ed ambiguità. Definizione 5.5 Un polinomio di K[x] si dice irriducibile su K se non ha alcuna soluzione in K. Pertanto, un polinomio di Z[x] è irriducibile se non ha soluzioni razionali; un polinomio di R[x] è irriducibile se non ha soluzioni reali. Per i polinomi di Z[x] vale il seguente teorema che permette di verificare facilmente se esso è o non è irriducibile: Teorema 5.8 (di Eisenstein) Le soluzioni razionali di un polinomio p(x) ∈ Z[x], p(x) = a0 xn + a1 xn−1 + · · · + an−1 x + an , se esistono, sono da ricercare tra i numeri razionali il cui denominatore è un divisore di a0 e il cui numeratore è un divisore di an . Prova: Sia m/d l’eventuale soluzione, ridotta ai minimi termini; sostituendo tale valore nell’equazione si ottiene: ³ m ´n ³ m ´n−1 m a0 + a1 + · · · + an−1 + an = 0 d d d e quindi, moltiplicando tutto per dn 6= 0 si ha: a0 mn + a1 mn−1 d + · · · + an−1 mdn−1 + an dn = 0. Portando tutti i termini, eccetto il primo, a destra dell’equazione, si trova che a0 mn deve avere un fattore d, e poiché d ed m sono per ipotesi primi tra di loro, d deve essere un divisore di a0 . Analogamente, portando tutti i termini a destra eccetto l’ultimo, si vede che m deve essere un divisore di an , come si voleva. Ad esempio, se il polinomio 27x3 +6x−12 ∈ Z[x] ha soluzioni razionali, basta cercarle fra le frazioni m/d dove m ∈ {±1, ±3, ±9, ±27} e d ∈ {1, 2, 3, 4, 6, 12} (come notato a suo tempo, nelle frazioni il segno può essere lasciato al solo numeratore). Si tratta di 24 valori diversi e quindi il procedimento può essere alquanto noioso; tuttavia, la soluzione (quando esista) si trova con un po’ di buona volontà, aiutandosi eventualmente con un calcolatore. Nel caso attuale si trova la soluzione 2/3 e applicando la regola di Ruffini si ricava 27x3 + 6x − 12 = 9(3x2 + 2x + 2)(x − 2/3), e vedremo nelle prossime sezioni come 3x2 +2x+2 non abbia addirittura soluzioni reali. Comunque, una nuova applicazione del teorema di Eisenstein con le possibili radici razionali ±1, ±2, ±1/2, ±2/3 mostra subito che il polinomio non ha altri fattori lineari x − a, con a ∈ Q. Per i polinomi di R[x] le cose stanno in modo alquanto diverso. Nella prima metà del 1800 fu dimostrato il seguente: Teorema 5.9 I polinomi irriducibili di R[x] sono: 1. le costanti; 2. i polinomi di primo grado ax + b; 3. i polinomi di secondo grado ax2 + bx + c per i quali si abbia b2 − 4ac < 0. 140 CAPITOLO 5. ALGEBRA La prova di questo teorema va, per il momento, al di là delle nozioni che abbiamo e anche degli scopi di questi appunti. Comunque, vedremo in una nota successiva le linee generali della dimostrazione. Sono quindi irriducibili i polinomi x − 3 e 3x2 + 2x + 2 in quanto b2 −4ac = 4−4×3×2 = −20. Si può osservare che il polinomio x2 + 1 è anch’esso irriducibile per lo stesso criterio; tuttavia, la dimostrazione della sua irriducibilità è diretta ed immediata. Le sue eventuali radici sono le soluzioni dell’equazione x2 + 1 = 0, cioè x2 = −1; ma non esiste alcun numero reale il cui quadrato valga −1, un numero negativo. A questo punto possiamo dare la seguente: Definizione 5.6 I polinomi irriducibili di K[x] si dicono anche polinomi primi. Dato un polinomio p(x) ∈ K[x], una sua scomposizione in fattori irriducibili (primi) è il prodotto p(x) = aq1 (x)q2 (x) . . . qk (x), dove a ∈ K e i polinomi q1 (x), q2 (x), . . . , qk (x) sono irriducibili su K. Si dice massimo comun divisore di due polinomi p(x), q(x) ∈ K[x] un polinomio di grado massimo che divida tanto p(x) quanto q(x). Si dice minimo comune multiplo un polinomio di grado minimo che sia divisibile tanto per p(x) che per q(x). Il lettore avrà notato che nella definizione non si afferma mai che la scomposizione, il massimo comun divisore e il minimo comune multiplo siano unici: infatti, moltiplicare o dividere per una costante (non nulla) non cambia le proprietà di un polinomio. Si dimostra tuttavia (anche se noi non lo faremo) che questa è l’unica eccezione; in altre parole, scomposizione, MCD e mcm di polinomi sono unici a meno di costanti moltiplicative. Per il MCD e il mcm valgono le stesse proprietà di calcolo viste per i numeri naturali: ad esempio, il massimo comun divisore può essere trovato prendendo i fattori (irriducibili) comuni a p(x) e a q(x) col minimo esponente. Qui si richiede molta attenzione perché la non unicità della scomposizione può trarre in inganno il principiante e chi voglia fare le cose con troppa fretta. 5.3 Risoluzione delle equazioni Secondo le definizioni della sezione precedente, un’equazione algebrica di primo grado ha come forma canonica ax + b = 0. In questo caso (e solo in questo caso) si preferisce considerare come canonica la forma ax = b, con a 6= 0. Tale equazione ammette “almeno” la soluzione x = b/a, che si verifica sostituendo ad x tale valore e notando che essa si riduce all’uguaglianza b = b, senz’altro vera. A questo punto è chiaro che questa è l’unica soluzione. Detta infatti r una soluzione diversa, scriviamola nella forma b′ /a, con b′ = ra. Deve essere b′ 6= b, altrimenti r coinciderebbe con la prima soluzione; sostituendo b′ /a nell’equazione, si ha b′ = b, il che è falso. Se a = 0, l’equazione ax = 0 perde di significato, ma per completezza introduciamo la seguente terminologia: 1. se a = b = 0, ogni numero reale rende vera l’uguaglianza; questa è pertanto ridotta all’identità 0 = 0 e si dice che l’equazione è indeterminata o che ammette infinite soluzioni; 2. se a = 0, ma b 6= 0, l’uguaglianza non può mai essere verificata; si dice allora che l’equazione è impossibile ovvero che non ammette alcuna soluzione. Ciò torna utile quando si voglia scrivere un algoritmo che, partendo da un’equazione che si suppone essere di primo grado, ne trovi la soluzione: Algoritmo 5.2 (Equazioni di 1◦ grado) Ingresso: Un’equazione di primo grado in x; Uscita: La soluzione x0 , oppure uno dei termini “Impossibile” o “Indeterminata”. 1. Usando ripetutamente la regola della somma, si portano a membro sinistro tutti i termini che contengono x e a membro destro tutti i termini che non lo contengono; 2. usando la regola della somma di monomi omogenei, si riduce il membro sinistro a un’espressione del tipo ax; eventualmente, questa espressione si riduce a zero e si pone allora a := 0; 3. usando le regole della somma, si riduce il membro destro alla costante b; 4. se a = b = 0, si esce dall’algoritmo dopo aver scritto “Indeterminata”; 5. altrimenti, se a = 0 ma b 6= 0, si esce dall’algoritmo dopo aver scritto “Impossibile”; 6. altrimenti, l’equazione ha l’unica soluzione b/a, determinata dall’applicazione della regola del prodotto. Come semplice esempio si consideri l’equazione 3x + 2 − x = 1 + 5x − 2; per il punto 1. dell’algoritmo abbiamo 3x + 2 − x − 2 − 5x = 1 + 5x − 2 − 5x − 2, cioè 3x − x − 5x = 1 − 2 − 2. Ora si applica il punto 2. e si ottiene −3x = −3; questa è l’equazione in forma canonica e possiamo applicare il passo 6. che dà la soluzione x0 = −3/(−3) = 1. Naturalmente, andando a sostituire il valore 1 cosı̀ ottenuto nell’equazione originale si ha: 3 + 2 − 1 = 1 + 5 − 2, cioè 4 = 4, il che è vero e “verifica” la validità della soluzione trovata. Più interessante è la risoluzione delle equazioni di secondo grado, che supponiamo essere già scritte in forma canonica: 141 5.3. RISOLUZIONE DELLE EQUAZIONI Ad esempio, data l’equazione 2x2 + x − 6 = 0, si Teorema 5.10 Sia ax2 + bx + c = 0 un’equazione di ha ∆ = 1 + 48 = 49 = 72 ; l’equazione quindi ha secondo grado in forma canonica; essa ammette: due soluzioni che sono x1 = (−1 + 7)/4 = 3/2 e x2 = a. due soluzioni se il discriminante ∆ = b2 − 4ac è (−1−7)/4 = −2. Nella pratica, è talvolta conveniente maggiore di 0; in tal caso le soluzioni sono date la seguente formula ridotta, che si applica quando il dall’espressione: coefficiente b è un intero pari, diciamo b = 2b′ . Si ha allora: √ −b ± ∆ √ √ x= ; −2b′ ± 4b′2 − 4ac −b ± b′2 − ac 2a x= = . 2a a b. una soluzione se il discriminante è uguale a 0; I tre coefficienti a, b, c contengono tutte le informatale soluzione è x = −b/(2a); zioni relative all’equazione considerata; la formula di c. nessuna soluzione se ∆ < 0. Prova: Si consideri il seguente procedimento detto metodo del completamento del quadrato e derivato dalle regole di somma e prodotto della sezione precedente: 1. si moltiplica per 4a 6= 0: 4a2 x2 + 4abx + 4ac = 0; 2. si somma b2 −4ac ai due membri: 4a2 x2 +4abx+ b2 = b2 − 4ac; risoluzione ne è un esempio convincente, ma vi sono altri aspetti che possono essere rivelati da tali parametri. Cominciamo con una proprietà abbastanza ovvia: Teorema 5.11 Se l’equazione ax2 + bx + c = 0 ha due soluzioni reali, allora la somma di tali soluzioni è −b/a e il loro prodotto vale c/a. Prova: Dalla formula risolutiva si ha: √ √ −b − ∆ −b + ∆ b + =− 2a 2a a 3. il membro sinistro è un quadrato: (2ax + b)2 = e ancora: b2 − 4ac. à √ !à √ ! −b − ∆ −b + ∆ b2 − (b2 − 4ac) c Si osservi che un quadrato è sempre non negativo e = = 2 2 2a 2a 4a a quindi se b −4ac = ∆ < 0, l’equazione non può avere alcuna soluzione (caso c.). Se b2 − 4ac = 0, l’equazione si riduce a 2ax + b = 0; questa è un’equazione di dato che il prodotto dei numeratori è il prodotto di primo grado che, come si è visto, ha come soluzione una somma per una differenza. x = −b/(2a) (caso b.). Infine, se ∆ > 0, estraendo la radice quadrata algebrica si √ hanno le due equazioni Nota 5.5 Come vedremo nelle prossime sezioni, √ la distinzione dei tre casi di soluzione di un’equazione di primo grado 2ax + b = + ∆ e 2ax + b = − ∆, di 2◦ grado è dovuta semplicemente all’ambito troppo dalle quali si ricavano i valori delle due soluzioni. Dal teorema discende un semplice algoritmo: Algoritmo 5.3 (Soluzione equazioni 2◦ grado) Ingresso: I coefficienti a, b, c del polinomio ax2 + bx + c; Uscita: Le eventuali soluzioni dell’equazione. ristretto in cui ci stiamo movendo, cioè i numeri reali. Quando si passi ai numeri complessi, ogni equazione di secondo grado ha sempre due soluzioni: nel caso b) esse coincidono, nel caso c) sono costituite da due numeri complessi coniugati. La proprietà espressa dal teorema precedente risulta vera in generale, e la si dimostra nello stesso modo. Infatti nel caso b) si ha ∆ = 0 e nel caso c) pur essendo ∆ < 0 i conti fatti sono ancora validi. 1. si calcola il discriminante ∆ = b2 − 4ac; 2. se ∆ < 0 si scrive “L’equazione non ammette soluzioni”; 3. altrimenti, se ∆ = 0, si scrive “L’unica soluzione è:” e si calcola x = −b/(2a); 4. altrimenti (∆ > 0) si calcolano le due soluzioni: √ −b − ∆ x1 = 2a √ −b + ∆ x2 = . 2a Un’altra proprietà che i coefficienti a, b, c permettono di prevedere facilmente è il segno delle radici. Siano α e β le due radici reali dell’equazione ax2 +bx+c = 0 che si può anche scrivere x2 + ab x+ ac = 0. Per il Teorema di Ruffini 5.6 questa si può anche scrivere (x − α)(x − β) = 0; sviluppando il prodotto si ha: x2 − (α + β)x + αβ = 0. Abbiamo cosı̀ ottenuto, se si vuole, un’altra dimostrazione del teorema precedente, ma vediamo di interpretarla nel modo seguente: 142 1. se le due soluzioni α, β sono entrambe positive, allora −(α + β) = b/a è un numero negativo mentre αβ = c/a è positivo. Si osservi che il coefficiente di x2 , che dopo la divisione per a è diventato 1, è sempre positivo; 2. se le due soluzioni α, β sono entrambe negative, allora −(α + β) = b/a è positivo, come lo è αβ = c/a; quindi i tre coefficienti 1, b/a, c/a sono tutti positivi; 3. se le due soluzioni α, β sono discordi, diciamo α > 0 e β < 0, allora −(α + β) = b/a sarà positivo o negativo a seconda che |α| > |β| oppure |α| < |β|. Il prodotto αβ = c/a è invece sempre negativo. Pertanto, se |α| > |β| i tre coefficienti sono nell’ordine: positivo, negativo, negativo. Se invece |α| < |β|, i tre coefficienti sono: positivo, positivo, negativo. CAPITOLO 5. ALGEBRA α = 10 e β = 7; oppure, α = 7 e β = 10. La sciamo al lettore la risoluzione nel caso si conosca la differenza dei numeri e il loro prodotto. Un’osservazione banale ma importante è la seguente: ogni equazione di secondo grado è simmetrica rispetto alle sue due soluzioni, nel senso che esse possono essere scambiate, ma l’equazione rimane la stessa. Nel nostro caso, trovati α e β, anche scambiando α con β si ottiene ancora una soluzione. Conclusione: ogni problema del tipo visto ha due soluzioni. Un’equazione può essere originata dall’uguaglianza di due espressioni razionali fratte, o comunque riconducibili a una forma del genere. Applicando le regole al-jabr e al-muqābalah ci si riduce sempre all’uguaglianza a 0 di un’unica espressione razionale fratta. Ad esempio: 9x + 13 9 = +6 x+1 x−2 Naturalmente, se a era inizialmente positivo, i se- dopo facili passaggi dà: gni dei tre coefficienti nell’equazione di partenza era3(x2 − x − 6) no proprio gli stessi; se a era negativo, vanno cam= 0. x2 − x − 2 biati scambiando positivo con negativo. Possiamo riassumere tutto in una tabellina: Una frazione si annulla solo quando il numeratore è zero e, allo stesso tempo, il denominatore è diverα, β > 0 +−+ −+− so da 0. Quindi, intanto, le soluzioni sono comprese α, β < 0 +++ −−− fra quelle dell’equazione ottenuto uguagliando a 0 il α > 0, β < 0 numeratore. Nel nostro caso sono comprese tra le |α| > |β| +−− −++ soluzioni di x2 − x − 6 = 0, cioè x = 3 e x = −2. |α| < |β| ++− −−+ A questo punto, però, il problema non è concluso, Se, come si fa di solito, chiamiamo permanenza il fat- poiché occorre verificare che le soluzioni trovate non to che, passando da un coefficiente al successivo, il annullino il denominatore. Se succede una cosa del segno non cambia (cioè si ha ++ oppure −−), e va- genere, la soluzione o le soluzioni incriminate vanno riazione il fatto che il segno cambia (cioè si ha +− tolte dal novero di quelle accettabili. Nel nostro caoppure −+), la precedente discussione e la relativa so, fortunatamente, il denominatore si annulla solo tabella dimostrano: per x = 1 e per x = 2, e quindi quelle trovate sono soluzioni legali. 2 Teorema 5.12 (dei segni di Cartesio) Sia ax + Non è strano il caso in cui un’equazione presenbx + c = 0 un’equazione di secondo grado con due ti l’incognita√ sotto un segno di radice; ad esempio, soluzioni distinte. Ad ogni variazione corrisponde a l’equazione x + 2 = 3 ha l’ovvia soluzione x = 7, una soluzione positiva e ogni permanenza a una socome si verifica direttamente. Queste equazioni venluzione negativa. Quando si ha una variazione e una gono dette irrazionali e il metodo di risoluzione che permanenza, la prima precede la seconda se la solusubito si presenta alla nostra mente è quello di elezione positiva è maggiore del valore assoluto di quella vare al quadrato entrambi i membri. Si ha infatti negativa, mentre la seconda precede la prima in caso x + 2 = 9, un’equazione lineare la cui facile soluziocontrario. ne ci dà appunto x = 7, a conferma della validità I teoremi precedenti permettono di risolvere in mo- della nostra √ intuizione. Tuttavia, se consideriamo do elementare problemi del tipo: di due numeri α e β l’esempio x + 2 = x − 4, elevando al quadrato si si conosce la somma (o la differenza) A e il prodotto ha: x + 2 = x2 − 8x + 16, cioè in forma normale: B; quali sono i due numeri? Immaginando che α e x2 − 9x + 14 = 0. Le due soluzioni x = 7 ed x = 2, β siano le due soluzioni di un’equazione di secondo però, hanno un comportamento strano: la x = 7 sogrado, tale equazione deve essere x2 − Ax + B = 0, stituita nell’equazione di partenza ci dà il risultato se A è la somma α + β. Facciamo un esempio: se la atteso 0 = 0 (e perciò va bene), ma la x = 2 ci dà somma di due numeri è 17 e il loro prodotto è 70, si 2 = −2, e questo proprio non va. Delle due soluzioni deve risolvere l’equazione x2 − 17x + 70 = 0, il cui di- trovate, solo una è accettabile. Questo, tuttavia, fa scriminante è ∆ = 172 +4×70 = 9 = 32 , per cui si ha parte di una situazione generale: 143 5.4. SISTEMI DI EQUAZIONI x = 12. A questo punto basta verificare che tale soluzione non è estranea. D) Lasciamo al lettore il compito di cavarsela quando i radicali sono tre o più, ma tali casi, per fortuna, si trovano quasi soltanto negli esercizi dei testi di Matematica. Prova: L’equazione A(x)k = B(x)k si può scrivere 2. Se uno o più radicali sono a denominatore, bisoanche A(x)k − B(x)k = 0, e per quanto visto sui gna ricordarsi di escludere, dalle eventuali soluzioni, prodotti notevoli equivale a: quelle che annullano il denominatore, secondo la regola generale che ben conosciamo: la divisione per 0 (A(x) − B(x))× non è un’operazione lecita. Ad esempio, consideriamo ×(A(x)k−1 + A(x)k−2 B(x) + . . . + B(x)k−1 ) = 0. l’equazione irrazionale: Un prodotto vale 0 quando uno dei suoi fattori è 0; 1 questo implica che deve essere A(x) − B(x) = 0, √ + 1 = x. 1 +x che dà le stesse soluzioni di A(x) = B(x), oppure A(x)k−1 + . . . + B(x)k−1 = 0, ma le soluzioni di La regola ci dice che un’eventuale soluzione x = −1 questa equazione (se non coincidono con quelle di dovrà essere rifiutata. Portato il termine 1 a destra, A(x) = B(x)) sono del tutto estranee all’equazione si ha: 1 = (x − 1)√1 + x, e a questa uguaglianza di partenza. applichiamo l’elevamento a potenza. Si ottiene 1 = Teorema 5.13 Sia A(x) = B(x) un’equazione nella variabile x; l’equazione A(x)k = B(x)k ha le stesse soluzioni dell’equazione di partenza, più eventuali altre soluzioni, dette estranee. Questo giustifica la scoperta della soluzione x = 2 nell’esempio precedente e ci avverte che le soluzioni estranee devono essere scartate. Il solutore di equazioni irrazionali è avvertito di stare bene attento a ciò che ottiene applicando meccanicamente la tecnica dell’elevamento a potenza. Tale tecnica, d’altra parte, è il metodo standard per affrontare le equazioni irrazionali, e non ci rimane che suggerire (o ricordare) alcuni accorgimenti per portare a buon fine la soluzione di specifiche forme che l’equazione può assumere. 1. Consideriamo quattro casi interessanti: A) Se l’equazione presenta un unico radicale, è bene che esso venga isolato, cosı̀ da costituire un membro dell’equazione, mentre l’altro membro contiene i termini √ razionali. Ad esempio, per risolvere x + 2 + 4 = x, si porta il termine 4 a destra, √ il che ci riconduce all’equazione già considerata x + 2 = x − 4. B) Se i radicali (quadratici) sono due e non ci sono termini razionali, se ne porta uno a membro sinistro e l’altro al√membro √ destro, prima di elevare a potenza. Cosı̀, x − 6 − 2 − x = 0 ci porta a x − 6 = 2 − x, cioè x = 4. Purtroppo, andando nel√ √ a sostituire l’equazione di partenza, si trova −2 − −2 = 0, che non ha senso nel campo dei numeri reali. C) Se invece, oltre ai due radicali, sono presenti termini razionali, questi si portano tutti a membro destro, mentre i radicali si spostano tutti a sinistra. L’elevamento a potenza, questa volta, non elimina i radicali, ma, nel caso dei radicali quadratici, ne cala il numero a uno solo, in modo che si può iterare quanto √già detto in precedenza. Se ad esempio ab√ x + 4 − 1 = x − 3, ci si porta alla forma biamo √ √ x + 4 − x − 3p= 1, e si eleva al quadrato. Si ottiene: x + 4 − 2 (x + 4)(x − 3) + x − 3 = 1, cioè p (x + 4)(x − 3) = x. Dobbiamo di nuovo elevare al quadrato, ottenendo infine: x2 + x − 12 = x2 , cioè x3 − x2 − x + 1, cioè x(x2 − x − 1) = 0. Le soluzioni b dove φ, come sono allora x = 0, x = φ e x = φ, √ sappiamo, indica il rapporto armonico ( 5 + 1)/2 e φb = −1/φ. Nessuna di queste tre soluzioni è −1 e non rimane che provarle nell’equazione originale. Solo x = φ dà risultato positivo e quindi rappresenta l’unica soluzione dell’equazione di partenza. 3. Per convenzione, i radicali pari, come le radici quadrate, si considerano in senso aritmetico, cioè con valore non negativo. Viceversa, i radicali dispari si considerano in senso algebrico, cioè con lo stesso segno del√radicando. Ci limitiamo √ qui al semplice esempio 3 x3 − 26 − x = 2, cioè 3 x3 − 26 = x + 2, dopo aver separato la parte razionale da quella irrazionale. Elevando al cubo e semplificando, si ottiene l’equazione di secondo grado x2 + 2x − 3 = 0, cioè x = −3 e x = 1. Ora si√tratta di effettuare la verifica; per x = −3 si ha 3 −27 + 26 = −3 + 2, cioè √ 3 −1 = −1, il che è corretto quando si considerino le radici algebriche, come s’è convenuto. Per x = 1 la verifica è immediata, e quindi i due valori trovati sono entrambi radici legali dell’equazione. 5.4 Sistemi di equazioni E’ abbastanza intuitivo che un problema possa essere risolto mediante un’unica equazione se c’è un’unica quantità da determinare. Se le quantità sono due, una sola equazione, cioè una sola condizione, può non essere sufficiente a darci le informazioni necessarie a risolvere il problema. Ad esempio, un amico burlone può farci una domanda di questo genere: di un numero di due cifre sappiamo che la somma di queste è sei e se invertiamo la loro posizione il numero aumenta di 18 unità. Qual è il numero? Pur essendo una domanda tipicamente accademica, o forse proprio per 144 questo, ci sentiamo sfidati a trovare la soluzione. Numeri che soddisfano la prima condizione ce ne sono diversi, come 15, 24, 33 o 60; e anche 6 se lo vediamo scritto come 06. Parimenti, di numeri che soddisfano la seconda condizione ce ne sono più d’uno, come 13, 24 o 35. Possiamo allora ricorrere a un metodo esaustivo: scriviamo separatamente tutti i numeri che soddisfano ciascuna condizione e osserviamo quali sono (se ce ne sono) quelli che compaiono in tutti e due gli elenchi. Quando, come in questo caso, i due elenchi sono finiti e siamo sicuri di riuscire a trovare tutti i numeri che soddisfano ciascuna condizione, questo può essere un metodo effettivo. Ma, ci chiediamo, c’è un metodo un po’ più generale e meno sensibile ad eventuali errori di elencazione? L’algebra fornisce un metodo di risoluzione che, oggi, ci appare molto naturale, ma che ha richiesto secoli per essere scoperto, e la cui scoperta ha richiesto l’invenzione di un formalismo che non è per niente banale, almeno fino a quando non lo si conosca e non lo si sia capito. Chiamiamo x ed y le due cifre del numero che stiamo cercando, cioè sia 10x + y tale numero, secondo la consueta notazione posizionale. La prima condizione si scrive facilmente x+y = 6. Per la seconda, cominciamo ad osservare che, invertendo le due cifre, si ha il numero 10y +x, e quindi la condizione si scrive: 10y + x = 10x + y + 18. Se A è l’insieme delle coppie (x, y) che soddisfano la prima condizione, cosı̀ che, ad esempio, (1, 5) ∈ A e (6, 0) ∈ A, e B è l’insieme delle coppie (x, y) che soddisfano la seconda condizione, di modo che (1, 3) ∈ B e (2, 4) ∈ B, le soluzioni che cerchiamo sono A ∩ B. Si dice allora sistema di equazioni in k incognite un insieme di equazioni nelle quali compaiono esattamente k incognite x, y, . . . , z e che devono diventare proposizioni vere per i medesimi valori di tali incognite. Una soluzione del sistema è appunto una k-upla di valori (x = x0 , y = y0 , . . . , z = z0 ) che sostituiti nelle varie equazioni le rendono tutte vere; in altre parole, le soluzioni del sistema sono gli elementi dell’intersezione delle possibili soluzioni delle varie equazioni che compongono il sistema. Le equazioni si scrivono una sotto l’altra, riunite da una parentesi graffa: questa ha lo scopo di mettere in rilievo il fatto che un’eventuale soluzione deve soddisfare tutte le equazioni; è pertanto parte essenziale della notazione e non può essere sottintesa. Nel nostro esempio abbiamo: ½ x+y =6 10y + x = 10x + y + 18. CAPITOLO 5. ALGEBRA che lo compongono (nel nostro esempio: 1 × 1 = 1). Nella sezione presente ci occuperemo soltanto della soluzione dei sistemi lineari in due e tre incognite. Un sistema lineare di due equazioni in due incognite è sempre riducibile alla forma normale: ½ ax + by = c (5.1) a′ x + b′ y = c′ mediante le usuali regole di semplificazione. Ad esempio, la seconda delle nostre equazioni dà 9y−9x = 18, cioè, per il Teorema 5.5, y − x = 2, e quindi il sistema ha come forma normale: ½ x+y =6 x − y = −2. Esistono almeno due metodi diretti per risolvere un sistema ridotto a forma normale: • per sostituzione: si ricava una delle due incognite da una delle due equazioni (come se l’altra incognita fosse un semplice numero) e la si sostituisce nell’altra equazione. Questa diviene un’equazione lineare in una sola incognita, e quindi sappiamo come risolverla. Trovato il valore di questa incognita, la si sostituisce in una qualsiasi delle due equazioni, ricavando cosı̀ il valore della prima incognita; • per somma e sottrazione: moltiplicando le due equazioni per opportune costanti, si rendono uguali (od opposti) i coefficienti della x; sottraendo (risp. sommando) membro a membro le due equazioni, la variabile x scompare e si ottiene un’equazione lineare in y, che si sa risolvere. Agendo in modo analogo sulla y, si ricava il valore della x. Applicando il primo metodo, dalla prima equazione si ottiene y = 6 − x; sostituendo questo valore nella seconda si ha: x − 6 + x = −2, cioè 2x = 4 che ci dà x = 2. Sostituendo questo valore in y = 6 − x si ottiene y = 4, e perciò il numero da indovinare era 24. Applicando il metodo di somma e sottrazione (in questo caso è il metodo da preferire), sommando si ottiene 2x = 4, cioè x = 2, e sottraendo 2y = 8, cioè y = 4, e di nuovo si trova la soluzione 24. Come c’era da aspettarsi. In questo esempio, la soluzione esiste ed è unica; ma, ci chiediamo, è questo sempre il caso o, come per le equazioni ad una incognita, vi sono anche altre posPoiché, in questo caso, le equazioni che compongono sibilità? Per rispondere a questo quesito, ripartiamo il sistema sono tutte lineari, il sistema si dice lineare; dalla forma canonica generale e vediamo di trovare propriamente, si tratta di un sistema lineare di due un’espressione per la (o le) possibili soluzioni, quanequazioni in due incognite. In generale il grado di un do almeno una soluzione esista. Usando il metodo di sistema è il prodotto dei gradi delle singole equazioni somma e sottrazione, si moltiplicano opportunamente 145 5.4. SISTEMI DI EQUAZIONI le due equazioni: ½ aa′ x + ba′ y = ca′ aa′ x + ab′ y = ac′ Nota 5.6 ½ ab′ x + bb′ y = cb′ ba′ x + bb′ y = bc′ Si sottraggono le due coppie di equazioni e si ottiene (a′ b − ab′ )y = a′ c − ac′ dalla prima e (ab′ − a′ b)x = b′ c − cb′ dalla seconda. Quindi la soluzione generale è: ac′ − a′ c b′ c − bc′ y= ′ . x= ′ ′ ab − a b ab − a′ b La discussione relativa alle possibili soluzioni è ora piuttosto semplice. Tutto dipende dall’espressione ab′ −a′ b che si trova al denominatore; se essa è diversa da zero la soluzione è unica e perfettamente determinata dalle formule precedenti. Se invece ab′ −a′ b = 0, la soluzione non è più determinata; questa condizione equivale a a/a′ = b/b′ , cioè il rapporto dei coefficienti della x e della y è lo stesso. Può allora succedere che il rapporto c/c′ ha ancora lo stesso valore, oppure ha un valore diverso. Nel primo caso le due equazioni ax + by = c e a′ x + b′ y = c′ sono in effetti la stessa equazione; quindi ogni soluzione della prima equazione è anche soluzione della seconda, e viceversa. Ma la prima equazione ha infinite soluzioni perché, assegnato un valore alla x, la y resta determinata di conseguenza. Il sistema si dice allora indeterminato. Se invece c/c′ 6= a/a′ , le due equazioni sono incompatibili, in quanto se ax + by è uguale a c non si può anche avere a′ x + b′ y = c′ ; quindi il sistema è impossibile. Queste considerazioni portano a scrivere il seguente algoritmo: Algoritmo 5.4 (Soluzione di un sistema 2 × 2) Una matrice 2 × 2 è costituita da 4 numeri disposti su 2 righe e 2 colonne: · ¸ a b M= ; a′ b ′ si dice determinante di M e si scrive det(M ) la quantità ab′ − a′ b, ottenuta sottraendo il prodotto degli elementi della diagonale secondaria da quello degli elementi della diagonale principale. Da un punto di vista notazionale, una matrice viene delimitata da una coppia di parentesi quadre (o tonde); un determinante è delimitato da linee verticali analoghe a quelle del valore assoluto. Nel caso del sistema 5.1, la precedente matrice (ottenuta disponendo in ordine i coefficienti della variabili nelle due espressioni) si dice la matrice del sistema e il suo determinante si dice determinante del sistema. Se, nella matrice del sistema, al posto della prima colonna sostituiamo i termini noti, si ha come determinante: ¯ · ¸ ¯ ¯ c b ¯ c b ¯ ¯ = cb′ − bc′ . det =¯ ′ c′ b′ c b′ ¯ Se poi sostituiamo i termini colonna: ¸ ¯ · ¯ a c a c = ¯¯ ′ det a c′ a′ c′ noti nella seconda ¯ ¯ ¯ = ac′ − a′ c. ¯ Si hanno allora le seguenti formule di Cramer per la risoluzione del nostro sistema: ¯ ¯ ¯ ¯ ¯ c b ¯ ¯ a c ¯ ¯ ¯ ′ ¯ ¯ ¯ c b′ ¯ ¯ a′ c′ ¯ y= . x= det(M ) det(M ) Queste formule, che sembrano complicare, invece che semplificare, la soluzione del nostro problema, sono in realtà estendibili a sistemi lineari di n equazioni in n incognite, e quindi rendono più agevole la formulazione della soluzione, anche se, spesso, non ne semplificano la soluzione numerica. Ingresso: i coefficienti a, b, c e a′ , b′ , c′ delle due equazioni del sistema; Uscita: la soluzione del sistema, oppure la parola Il metodo di somma e sottrazione risulta di solito “Indeterminato” con la formula delle soluzioni, più simpatico del metodo di sostituzione; questo però oppure il termine “Impossibile”; è del tutto generale e può essere esteso a sistemi di n equazioni in n incognite. Nel caso n = 3 spesso si 1. si calcola il valore ∆ := ab′ − a′ b; applica un metodo intermedio: si ricava da un’equazione un’incognita in funzione delle altre due e la si 2. Se ∆ 6= 0 allora: sostituisce nella rimanenti due equazioni, che perciò (a) si calcola x := (b′ c − bc′ )/∆ e y := (ac′ − vengono a formare un sistema di due equazioni in due incognite. Questo si risolve per somma e sottrazione e a′ c)/∆; (b) si esce scrivendo il valore ottenuto per x e i valori trovati si sostituiscono nella prima equazione per ricavare il valore dell’ultima incognita. Ad esemper y; pio, di un numero di tre cifre sappiamo: 1) la somma 3. altrimenti (∆ = 0) si calcola il rapporto r := delle tre cifre è 12; 2) la somma delle prime due cifre è uguale alla terza; 3) il numero formato dalle prime a/a′ ; due cifre è quattro volte la terza cifra. Dette allora (a) se r 6= c/c′ si esce scrivendo “Impossibile”; x, y, z le tre cifre, si ha il sistema: (b) altrimenti (r = c/c′ ) si scrive “Indeter x + y + z = 12 minato” e si esce con l’espressione y = x+y =z (c − ax)/b. 10x + y = 4z. 146 CAPITOLO 5. ALGEBRA La seconda equazione ci dà già una determinazione che 6x2 − 7x − 3 = (3x + 1)(2x − 3), e a questo punto di z in termini di x ed y; sostituendo tale valore di vediamo che la frazione si può scrivere come: z nelle altre due equazioni si trova un sistema di 2 A B x−7 equazioni in 2 incognite: = + , (3x + 1)(2x − 3) 3x + 1 2x − 3 ½ ½ x+y =6 2x + 2y = 12 dove A e B sono due numeri reali opportuni. In effet2x − y = 0. 6x − 3y = 0 ti, dimostreremo ora che questa scomposizione, detta Sommando, si trova 3x = 6, cioè x = 2 e quindi in frazioni parziali, è possibile proprio determinando y = 4. A questo punto, usando z = x+y è immediato il valore di A e di B. Portando le due frazioni allo dedurre z = 6, cioè il numero cercato è 246. In questo stesso denominatore si ottiene: caso la forma normale è: 2Ax − 3A + 3Bx + B x−7 = . (3x + 1)(2x − 3) (3x + 1)(2x − 3) x + y + z = 12 x+y−z =0 Affinché queste due espressioni siano uguali (come 10x + y − 4z = 0. deve essere) occorre che i due numeratori coincidano, cioè sia x − 7 = (2A + 3B)x − 3A + B. Essendo x Nota 5.7 Nell’esempio, la matrice del sistema è: una indeterminata, le due espressioni sono uguali se 1 1 1 e solo se coincidono i coefficienti della x e i termini M = 1 1 −1 noti. Deve cioè essere: 10 1 −4 ½ 2A + 3B = 1 e il determinante di una matrice 3 × 3 si trova con la −3A + B = −7 regola di Sarrus, o ¯ ¯ ¯ ¯ ¯ ¯ delle diagonali: ¯ a b c ¯¯ ′ ′ ′ ¯ a b c ¯= a′′ b′′ c′′ ¯ = ab′ c′′ + bc′ a′′ + ca′ b′′ − cb′ a′′ − ba′ c′′ − ac′ b′′ . Nel nostro caso il determinante vale: −4 − 10 + 1 − 10 + 4 + 1 = −18. Esso costituisce il denominatore per applicare le formule di Cramer. Sostituendo la colonna dei termini noti alla prima colonna della matrice del sistema si trova: ¯ ¯ ¯ 12 1 1 ¯¯ ¯ ¯ 0 1 −1 ¯ = −48 + 0 + 0 − 0 − 0 + 12 = −36, ¯ ¯ ¯ 0 1 −4 ¯ e quindi x = −36/(−18) = 2. Analogamente si trovano i valori di y e di z, l’elaborazione dei quali lasciamo al lettore (che sia arrivato fin qui) come semplice, ma assai utile esercizio. Un’importante applicazione della risoluzione dei sistemi lineari è costituita dalla semplificazione delle funzioni razionali fratte. Abbiamo già accennato nella Sezione 5.1 che esse possono sempre essere ridotte a frazioni il cui numeratore abbia grado inferiore al denominatore. Se poi questo può essere scomposto in fattori del tipo ax + b, la frazione si semplifica ulteriormente in somme di funzioni razionali fratte col denominatore semplice del tipo (ax + b)k . Il metodo si spiega bene con un esempio, che può essere generalizzato. Si consideri la funzione razionale fratta (x − 7)/(6x2 − 7x − 3). E’ un semplice esercizio sulla risoluzione delle equazioni di secondo grado scoprire e questo è un sistema lineare di due equazioni nelle due incognite A e B. Possiamo risolverlo per sostituzione, osservando che B = 3A − 7 dalla seconda equazione. Questo dà 11A = 22 dalla prima equazione, cioè A = 2, e di conseguenza B = −1. Si ha pertanto: 2 1 x−7 = − . (3x + 1)(2x − 3) 3x + 1 2x − 3 Nota 5.8 In generale, avremo situazioni come: ux + v A B = + ′ (ax + b)(a′ x + b′ ) ax + b a x + b′ dove ax + b e a′ x + b′ non sono equivalenti, cioè non esiste alcun numero reale k per cui a′ = ak e b′ = bk. Procedendo come nell’esempio, si arriva al sistema: ½ Aa′ + Ba = u Ab′ + Bb = v. Il determinante di questo sistema vale a′ b − ab′ , che è 0 se e solo se a/a′ = b/b′ , cioè proprio solo nel caso che abbiamo escluso. Questo ci assicura che il metodo ha sempre successo, purché i binomi a denominatore non siano, di fatto, lo stesso binomio. Il caso delle funzioni razionali fratte (ux + v)/(ax + b)2 non può essere risolto né con questo metodo, né con altri. Analogamente, non possono essere risolte le situazioni in cui a denominatore ci sia un polinomio di secondo grado irriducibile, cioè con discriminante minore di 0. Senza entrare in dettagli e dimostrazioni, lasciamo al lettore la verifica delle due seguenti scomposizioni, che esemplificano il metodo nei due casi noiosi appena detti. 147 5.5. DISEQUAZIONI Quando è presente una potenza k ≥ 2, occorre far intervenire tutte le potenze minori o uguali a k: A B C x2 − 7x + 1 = + + . (x + 1)2 (x − 2) (x + 1)2 x+1 x−2 Questo porta al sistema: B+C A − B + 2C −2A − 2B + C = = = 1 −7 1 e quindi si ottiene: −3 2 1 x2 − 7x + 1 = + − . (x + 1)2 (x − 2) (x + 1)2 x+1 x−2 Per i polinomi irriducibili occorre un numeratore più complesso, cioè un binomio di primo grado: 2x2 + x − 5 Ax + B C = 2 + , (x2 + 1)(x − 2) x +1 x−2 che porta alla scomposizione: x+3 1 2x2 + x − 5 = 2 + , (x2 + 1)(x − 2) x +1 x−2 attraverso la soluzione di un sistema di tre equazioni in tre incognite, che lasciamo alle amorevoli attenzioni del lettore. Come sappiamo, il grado di un’equazione algebrica è il più alto dei gradi dei monomi che lo compongono, dopo aver effettuato tutte le semplificazioni possibili. Il grado di un sistema è il prodotto dei gradi delle equazioni che lo compongono. Come abbiamo visto, se tutte le equazioni sono lineari, allora il grado del sistema è 1; se si considerano invece: ½ ½ 2 x+y = α x + y2 = γ oppure xy = β xy = δ si hanno, rispettivamente, un sistema di secondo e un sistema di quarto grado. In via del tutto teorica, la soluzione di uno di questi sistemi può avvenire operando per sostituzione; ad esempio, da x + y = α si ricava y = α − x e quindi, sostituendo nella seconda, x2 −αx+β = 0 (vedere anche la Sezione 5.3). In questo modo, si capisce come ogni volta si arrivi ad avere un’equazione con lo stesso grado di tutto il sistema, giustificando cosı̀ la definizione stessa di grado. Talvolta, il metodo di sostituzione è l’unico o il più appropriato metodo di procedere. In realtà, esiste una bellissima teoria sulla risoluzione dei sistemi polinomiali, ma non possiamo parlarne qui. Ciò che invece è importante fare è spingere il solutore ad utilizzare la propria intelligenza e le proprie conoscenze per cercare metodi indiretti di risoluzione. Ad esempio, per il secondo sistema si può procedere osservando che x2 +2xy +y 2 = γ +2δ e x2 −2xy +y 2 = γ −2δ. Questo dà il nuovo sistema lineare: ½ √ x + y = ±√γ + 2δ x − y = ± γ − 2δ che si può risolvere per somma e sottrazione. La scelta dei segni permette di trovare le quattro soluzioni previste, purché sia γ+2δ > 0 e γ−2δ > 0; altrimenti, il numero delle radici reali potrà essere minore. I sistemi di equazioni che abbiamo considerato prevedono una soluzione in termini di numeri reali o, se i coefficienti sono interi, in termini di numeri razionali. Spesso però accade che certi problemi richiedono una soluzione in numeri interi, come nel celebre caso del vecchio cammelliere arabo. Costui possiede 17 cammelli e li lascia in eredità ai tre figlioli, specificando che il primo debba averne la metà, il secondo un terzo e il terzo (che è un po’ birichino) solamente un nono. Ma come fare la divisione se, come sembra, i cammelli non possono essere divisi a fette? La soluzione del Visir, chiamato a risolvere la questione, è più astuta che matematicamente corretta. In realtà, le equazioni e i sistemi di equazioni per i quali si ricercano solo soluzioni intere sono stati studiati fin dall’antichità e vengono detti diofantei, in onore di Diofanto, il matematico greco - alessandrino che li affrontò in modo sistematico nel III secolo d.C.. Oggi si sa che questi problemi sono di difficile soluzione e, addirittura, è impossibile trovarne un metodo generale di risoluzione. Se sono coinvolte n variabili, le possibili soluzioni sono contenute in Zn , un insieme numerabile, e quindi si potrebbe pensare di provarle sistematicamente tutte, fino a che una soluzione non salti finalmente fuori. Questo, però, succede se almeno una soluzione esiste; purtroppo, si dimostra che è impossibile dimostrare che, per un dato sistema diofanteo, almeno una soluzione esista. Pertanto, procedendo per tentativi, potremmo andare avanti, andare avanti e non arrivare mai al termine della verifica. Tecnicamente, si dice che il problema della soluzione delle equazioni diofantee è indecidibile. Questo è uno dei casi in cui il principio del terzo escluso e il principio di non contraddizione non sono più applicabili. 5.5 Disequazioni Non vi è dubbio che molti problemi si risolvono con l’uso delle equazioni, specie quando si ricerchino valori precisi o caratteristici. Tuttavia, nella pratica sono molto frequenti i problemi nei quali si cerca un rango di valori che ci permettano una certa flessibilità, o che comunque abbiano a che fare con quantità che devono essere maggiori (o minori) di un 148 valore assegnato. Ad esempio, vorremmo sapere a che ora (al più tardi) dobbiamo partire per arrivare a Roma entro mezzogiorno, sapendo che il traffico non ci permetterà di superare gli 80 km/h. Nel classico problema del trasporto, un’azienda ha, diciamo, tre stabilimenti di produzione S1 , S2 , S3 , ciascuno dei quali, in un mese, può produrre una quantità q1 , q2 , q3 di un certo prodotto, compresa tra un minimo e un massimo: mi ≤ qi ≤ Mi , i = 1, 2, 3, legato agli impianti e al personale. Ha poi n punti vendita V1 , V2 , . . . , Vn che possono smaltire certe quantità ri , anch’esse comprese tra un minimo e un massimo: ti ≤ ri ≤ Ti , i = 1, 2, . . . , n. Si conosce poi il costo del trasporto della merce (per unità di prodotto) da ciascuno stabilimento a ciascun punto vendita. Il problema è quello di determinare le quantità Qi,j da trasportare dallo stabilimento Si al punto vendita Vj in modo da soddisfare i vincoli, cioè le condizioni sulle quantità della produzione e delle vendite, e da minimizzare i costi di trasporto. Una disequazione è un’espressione del tipo A(x, y, . . . , z) ⊳ B(x, y, . . . , z) dove A(x, y, . . . , z) e B(x, y, . . . , z) sono due espressioni letterali nelle incognite x, y, . . . , z ed ⊳ è uno dei quattro relatori: <, ≤, >, ≥. Una soluzione della disequazione è un qualsiasi assegnamento di valori reali alle variabili: x = x0 , y = y0 , . . . , z = z0 tale che la proposizione A(x0 , y0 , . . . , z0 ) ⊳ B(x0 , y0 , . . . , z0 ) risulti vera. Il grado di una disequazione è definito in modo analogo al grado di una equazione: ridotta la disequazione alla forma canonica C(x, y, . . . , z) ⊳ 0, il grado della disequazione è il grado dell’espressione letterale C(x, y, . . . , z). Per arrivare alla forma canonica di una disequazione, si applicano le regole di al-jabra e di al-muqābalah, ma con qualche attenzione: 1. se si aggiunge o si toglie ad entrambi i membri di una disequazione la stessa quantità, la disequazione non cambia; 2. se si moltiplicano o si dividono entrambi i membri di una disequazione per la stessa quantità maggiore di 0, la disequazione non cambia; CAPITOLO 5. ALGEBRA dobbiamo moltiplicare i due membri per l’espressione C(x), dobbiamo dividere il nostro problema in due sottoproblemi: C(x)A(x) ⊳ C(x)B(x) e C(x) ≥ 0 il primo, e C(x)B(x) ⊳ C(x)A(x) e C(x) ≤ 0 il secondo. Si tratta, propriamente, di due sistemi di disequazioni, ma come ora vedremo, questo fa parte della regola generale, secondo la quale ogni disequazione si risolve mediante lo studio di un opportuno sistema di disequazioni. Oggi, problemi analoghi a quello del trasporto nascono in molte modellazioni della realtà, spesso legati alla produzione di beni, alla progettazione ingegneristica ed economica; se le disequazioni sono tutte lineari, si dice che siamo di fronte a un sistema di programmazione lineare; esistono algoritmi, come quello famoso del simplesso che permettono di risolvere, con l’aiuto dell’elaboratore, sistemi con migliaia di incognite e decine di migliaia di disequazioni. Qui, naturalmente, ci occuperemo di problemi molto più semplici, ma che sono alla base di questo settore dell’Algebra, talvolta molto interessante e spesso assai complicato. Una disequazione lineare nella sola incognita x è di facile soluzione; la sua forma più generale, una volta applicate le regole viste sopra, è ax ⊳ b e, applicando ancora la regola 3, se a > 0 si ha x ⊳ b/a, mentre se a < 0 si trova b/a ⊳ x. Cosı̀, se la distanza da Roma a cui ci troviamo è 180 km, il tempo minimo di percorrenza sarà: 180/80 = 9/4 = 2h 15′ ; se vogliamo arrivare entro mezzogiorno, dobbiamo partire prima che manchi un quarto alle dieci. Le soluzioni di una disequazione si rappresentano in modo convenzionale, ma suggestivo, disegnando la retta reale e dividendola secondo i punti di transizione dalle zone di soluzione a quelle di non-soluzione; queste ultime si denotano con una linea tratteggiata, mentre le prime si indicano con una linea continua. Nel nostro esempio abbiamo: 9/4 La risoluzione delle disequazioni di primo grado è un passo importante. In pratica ci limiteremo a consi3. se si moltiplicano o si dividono entrambi i memderare disequazioni di tipo polinomiale o determinate bri di una disequazione per la stessa quantità da espressioni razionali fratte (con una sola incogniminore di 0, la disequazione cambia senso (cioè, ta), accennando appena alle disequazioni irrazionali, se A(x) ⊳ B(x), allora cB(x) ⊳ cA(x)). comunque riconducibili ai tipi precedenti. Dovendo La quantità a sommare o a moltiplicare può an- implicitamente considerare anche i sistemi di diseche dipendere da una o più delle variabili x, y, . . . , z, quazioni, ad essi non dedicheremo una trattazione ma nel caso della moltiplicazione questo introduce particolare. una nuova disequazione che ci permetta di manteCome vedremo nella prossima sezione sui numeri nere (o di invertire) il senso della disequazione mo- complessi, un polinomio p(x) ∈ R[x] è sempre scomdificata. Ad esempio, se A(x) ⊳ B(x) e sappiamo ponibile in polinomi di primo e di secondo grado con che x > 0, allora possiamo cambiare la disequazione discriminante minore di 0 (polinomi irriducibili). In in xA(x) ⊳ xB(x), se ciò ci conviene. Viceversa, se generale, queste scomposizione non si può ottenere 149 5.5. DISEQUAZIONI facilmente e richiede la ricerca delle radici del polinomio. Se questo è di secondo grado, sappiamo come procedere; se è di terzo o di quarto grado, si conoscono tecniche di scomposizione (si veda la Sezione 5.7), che spesso sono però assai complesse. In generale, per i polinomi di grado superiore al secondo si usano metodi numerici per determinare buone approssimazioni delle radici, e anche a questo accenneremo nella stessa Sezione 5.7, pur essendo la faccenda non del tutto banale. Pertanto, lo strumento più disponibile e simpatico (anche se talvolta piuttosto noioso) è dato dal Teorema di Eisenstein, che però funziona solo se i coefficienti del polinomio sono numeri interi (o razionali) e almeno una delle radici è razionale. Trovata questa, la regola di Ruffini permette di effettuare la prima scomposizione e ridurre il polinomio di un grado, semplificando cosı̀ (si spera) i passi successivi. Immaginando (con un po’ di buona volontà) di esser riusciti a scomporre in fattori irriducibili il nostro polinomio, la tecnica da utilizzare è standard e cercheremo ora di esporla; essa si basa su considerazioni relative a ciascun fattore e per quelli di primo grado l’osservazione precedente sul grafico con la retta reale è tutto ciò che serve. Per quanto riguarda i polinomi irriducibili di secondo grado, si ha il seguente risultato: risulta positiva per valori di x < α e di x > β, mentre risulta negativa per α < x < β. Prova: Il prodotto di due fattori risulta positivo se e solo se i due fattori hanno lo stesso segno; ma x − α è positivo per x > α e x − β per x > β. Quindi, solo per α < x < β i due fattori hanno segno discorde. Utilizzando ancora la retta reale, la seguente figura rappresenta molto bene la situazione (e può essere facilmente generalizzata): α β (x − α) (x − β) (x − α)(x − β) dove la terza linea (x − α)(x − β) deriva dalla diretta applicazione della regola dei segni alle due linee precedenti, quando si ricordi che la linea tratteggiata corrisponde a valori negativi e quella continua a valori positivi. La generalizzazione ad espressioni di grado superiore è allora immediata. Supponiamo di avere l’eLemma 5.14 Sia ax2 + bx + c (con a 6= 0) un’e- spressione, già fattorizzata, (x + 1)(x − 1)(x − 2) = 3 2 spressione di 2◦ grado con il discriminante negativo; x − 2x − x + 2; le tre linee corrispondenti ai tre allora tale espressione, al variare di x, risulta sempre fattori ci dicono subito il risultato: negativa se a < 0 e sempre positiva se a > 0. −1 1 2 (x + 1) Prova: Usiamo qui un’argomentazione che risulterà pienamente giustificata solo quando parleremo (x − 1) di continuità (vedere la Sezione 8.4); per il momento ci dobbiamo basare solo sulla nostra intuizione. Se (x − 2) il risultato esposto nell’enunciato non fosse vero, si avrebbe un valore x0 di x per cui ax20 + bx0 + c < 0 e un valore x1 di x per cui ax21 + bx1 + c > 0. Poiché a piccole variazioni di x corrispondono piccole variazioni dell’espressione, deve esistere un valore x̄ di x, L’espressione è positiva per −1 < x < 1 poiché risulcompreso tra x0 ed x1 , tale che ax̄2 + bx̄ + c = 0, cioè tano positivi due fattori su tre; è di nuovo positiva un valore che risulta radice dell’espressione, contro per x > 2 poiché tutti e tre i fattori sono positivi. l’ipotesi che il discriminante fosse negativo, e quindi L’espressione è invece negativa per x < −1 poiché è l’espressione senza radici reali. composta da tre fattori negativi, e per 1 < x < 2 poiché solo il fattore (x − 3) risulta negativo. La regola Lasciamo al lettore il compito di estendere queè: i) l’espressione è positiva se i fattori negativi sono sto risultato al caso del discriminante nullo, mentre in numero pari; ii) è negativa se i fattori negativi soci interessa vedere cosa succede se il discriminante è no in numero dispari. Anche se tutti lo dovrebbero positivo e quindi esistono due soluzioni α e β dell’e2 sapere, il numero 0 è pari! quazione ax + bx + c = 0. Possiamo allora scrivere 2 Ogni espressione polinomiale dà origine ad una diax +bx+c = a(x−α)(x−β) e supporre che sia a > 0; il caso a < 0 si tratta in modo del tutto analogo. Si sequazione risolubile con il metodo descritto, purché sia scomponibile in fattori irriducibili. Ci basterà osha allora: servare il seguente esempio, che ci permette di deTeorema 5.15 Data l’espressione ax2 + bx + c = scrivere il metodo generale. Il lettore è invitato (cala(x − α)(x − β) con a > 0 e α < β, tale espressione damente) a formalizzare il procedimento in un vero 150 CAPITOLO 5. ALGEBRA e proprio algoritmo, il che gli permetterà di chiari- dei suoi coefficienti contiene uno o più parametri, cioè re e di chiarirsi i vari passi necessari. Sia data la quantità non definite da un preciso valore, ma che, a disequazione: seconda dei casi, possono assumere valori precisi. Ad esempio, consideriamo l’equazione di secondo grado: x4 + 2x3 − x − 2 > 0 x2 − (m + 2)x − (4m + 8) = 0, e si cerchi di fattorizzare il polinomio di quarto grado. Il Teorema di Eisenstein ci dice che, se esistono radici per la quale siamo interessati a scoprire per quali razionali, esse sono comprese tra ±1 e ±2. Provando, valori di m (il parametro), l’equazione ha due sosi vede che x = 1 è proprio una radice, e applicando luzioni reali (come sottoprodotto, scopriremo anche quando essa ha un’unica soluzione). Naturalmente, la regola di Ruffini ci si riduce all’espressione: l’esistenza delle soluzioni è legata al discriminante: (x − 1)(x3 + 3x2 + 3x + 2) > 0. ∆ = (m + 2)2 + 4(4m + 8) = m2 + 20m + 36. Confidando ancora nella fortuna e in Eisenstein, si trova la radice x = −2 e di nuovo si usa Ruffini per Perché si abbiano due soluzioni, deve essere2 ∆ > 0 e quindi dobbiamo risolvere la disequazione m +20m+ ottenere l’espressione: 36 > 0. La scomposizione in fattori dà: m2 + 20m + 36 = (m+2)(m+18) e, in accordo a quanto detto, due (x − 1)(x + 2)(x2 + x + 1) > 0. soluzioni si hanno per m < −18 e m > −2, e il lettore L’ultima espressione di secondo grado ha discrimi- verificherà che per m = −20 e per m = 0 si hanno nante negativo e quindi, per il lemma precedente, ha davvero due soluzioni. A questo punto, per m = −18 sempre valore positivo. Basta allora disegnare il gra- e per m = −2 l’equazione di partenza ha un’unica fico per i fattori (x − 1) e (x + 2) e vedere che la soluzione, e infatti si ha: x2 + 16x + 64 = (x + 8)2 = 0 disequazione di partenza è vera per x < −2 e per e x2 = 0. Spesso, questa doppia soluzione di equazioni di sex > 1. Se invece che da un polinomio, abbiamo una dise- condo grado risulta ostica e lo studente, specie le priquazione costituita da un’espressione razionale fratta, me volte, tende a perdere il filo del ragionamento (io il metodo di risoluzione non cambia, visto che anche lo perdo ancora). Il ragionamento, in realtà, non è un rapporto è positivo se e solo se numeratore e de- poi troppo complicato e richiede solo un po’ di attennominatore sono concordi. Un esempio deve essere zione. Perciò il consiglio è quello di rileggere tutta questa tiritera e provare ancora una volta, ad esempio sufficiente: con l’equazione x2 − (m + 1)x − (2m + 5) = 0. x2 + x − 2 (x + 2)(x − 1) Le disequazioni sono utili anche per la risoluzio= >0 x2 − 2x x(x − 2) ne delle equazioni irrazionali, vista nella Sezione 5.3. Riprendiamo l’esempio considerato in quella occasio√ √ che si risolve col solito diagramma: x + 4 − x − 3 = 1. Affinché una soluzione ne: x0 sia accettabile, deve permettere l’estrazione di en−2 0 1 2 (x + 2) trambe le radici, cioè deve essere x0 > −4 e x0 > 3, cioè, in definitiva, x0 > 3. Questa osservazione evita (x − 1) di dover controllare la soluzione ottenute eseguendo i calcoli nell’equazione di partenza; quindi è proprio x un metodo da seguire. Osserviamo che, risolvendo la precedente equazione, p eravamo arrivati a un’altra (x − 2) equazione irrazionale: (x + 4)(x − 3) = x. Se fosse stata questa la nostra equazione di partenza, il metodo dei grafici ci avrebbe mostrato che le soluzioni accettabili devono stare negli intervalli x < −4 e x > 3. di modo che la soluzione è data dai tre intervalli x < Questa non è la stessa condizione vista in precedenza −2, 0 < x < 1 e x > 2. Naturalmente, il lettore e relativa alla vera equazione di partenza. Lo stuè invitato a controllare questi risultati provando con dente prenda questa osservazione come un ulteriore qualche valore significativo. avvertimento a non considerare l’equazione, ottenuta Un problema che si incontra abbastanza spesso, elevando a potenza i due membri, equivalente senz’alspecie nella Geometria Analitica, è quello di deter- tro all’equazione di partenza. Il Teorema 5.13 è un minare quando un’equazione di secondo grado para- punto troppo importante e non va mai trascurato. metrica ammette due radici o ne ammette una sola. In modo analogo, le disequazioni ci permettono di Un’equazione si dice parametrica quando almeno uno trattare in modo sistematico le equazioni (e le dise- 151 5.6. NUMERI COMPLESSI quazioni) contenenti qualche valore assoluto. Il valore assoluto di una espressione è uguale all’espressione stessa, se essa è positiva, ed è uguale all’opposto (cioè all’espressione cambiata di segno) se l’espressione è negativa. Tutto allora si accomoda e diviene semplice, se operiamo una separazione delle soluzioni, andando a sostituire al valore assoluto l’espressione stessa o il suo opposto. Come spesso succede, è più complicato esprimere il procedimento che attuarlo nella pratica. Si consideri pertanto l’equazione |x − 2| = x2 ; quando x > 2 si ha |x − 2| = x − 2 e quindi l’equazione è equivalente a x − 2 = x2 . Quando, viceversa, x < 2, si ha |x − 2| = −(x − 2) e quindi l’equazione è equivalente a 2 − x = x2 . In questo modo, la soluzione della nostra equazione è ricondotta alla soluzione dei due sistemi: ½ ½ x − 2 = x2 2 − x = x2 e x > 2 x < 2. In modo esplicito osserviamo che il caso x = 2 può, indifferentemente, essere considerato in proprio, essere inserito in uno dei due sistemi (ad esempio, il primo, ponendo x ≥ 2) o addirittura in tutti e due. La cosa più semplice è quello di vederlo come terzo caso e notare che non porta ad alcuna soluzione. Il lettore ora verificherà che il primo sistema non presenta soluzioni, mentre il secondo dà x = −2 e x = 1. Questo esposto è un caso molto semplice, ma le cose non cambiano molto quando si debbano affrontare equazioni, disequazioni o sistemi più complicati. Una volta riportato tutto a diversi sistemi (giusto come s’è visto) la difficoltà è scaricata sulle singole equazioni e/o sulle singole disequazioni. Ci si riconduce cosı̀ a cose discusse in questa e nelle precedenti sezioni. Questa visione ottimistica relativa alla soluzione di equazioni e di disequazioni può andare incontro a qualche delusione, specie se un problema richiede soluzioni in numeri interi. Abbiamo già visto le difficoltà relative ai sistemi diofantei, e qui mi piace dare come esempio uno dei problemi più belli che io conosca. Fortunatamente, la soluzione non è difficile se la si imposta in modo razionale. Due amici matematici, Alberto e Biagio, si incontrano dopo tantissimi anni e si scopre che B. si è sposato e ha avuto tre figli. A.: Quanti anni hanno? B.: Il prodotto delle loro età è 36. A.: Non mi basta per risolvere il problema, visto che è un problema quello che mi proponi! B.: Be’, la somma delle loro età è il numero civico su questo portone. A.: Mi spiace, ma non è ancora sufficiente. B.: Hai ragione, ma devi sapere che il più grande ha gli occhi azzurri. A.: Ora sı̀ che mi hai detto tutto! e gli spiattella le età dei tre figlioli. La domanda ora si impone: è il lettore in grado di trovare anche lui queste benedette età? La soluzione coinvolge soltanto numeri interi e quindi è facile trovare tutte le terne di numeri che hanno come prodotto 36; scriviamo, accanto a ciascuna terna, la somma dei tre numeri: 1 1 1 1 1 2 2 3 + + + + + + + + 1 2 3 4 6 2 3 3 + + + + + + + + 36 18 12 9 6 9 6 4 = = = = = = = = 38 21 16 14 13 13 11 10 Il lettore deve essere convinto che quelle elencate sono tutte e sole le terne possibili; mettendole in modo che sia a ≤ b ≤ c si ha un metodo sistematico per generarle. Ora osserviamo che se il numero civico (che noi non conosciamo, ma che Alberto vede) fosse stato 16, la soluzione avrebbe dovuto essere (1, 3, 12). Il fatto che Alberto avesse qualche dubbio vuol dire che la somma corrisponde a più soluzioni; ma ciò ci dice che tale somma è 13, il numero civico misterioso. A questo punto, l’ultima informazione (che esiste un figlio “più grande”) ci permette di escludere la soluzione (1, 6, 6), nella quale ci sono due gemelli più grandi, e quindi rispondere (2, 2, 9). Formalmente, il sistema si scrive: xyz = 36 x+y+z = k x > max(y, z) ma bisogna dire, con buona pace dei matematici formalisti, che questo è di ben poco aiuto alla soluzione. 5.6 Numeri complessi Come abbiamo detto, i numeri reali si dividono in due grandi categorie: i numeri algebrici, che sono i numeri soluzione delle equazioni algebriche a coefficienti razionali, e i numeri trascendenti, cioè tutti gli altri. Abbiamo anche visto che i numeri algebrici sono una infinità numerabile, cioè la loro cardinalità è ℵ0 , mentre i numeri trascendenti hanno la cardinalità del continuo.√Consideriamo ora un numero algebrico, ad esempio 2, e denotiamolo con un simbolo particolare, diciamo θ. L’equazione algebrica di cui è soluzione sarà x2 − 2 = 0, e quindi θ è caratterizzato dal fatto che θ2 = 2. Prendiamo allora tutti i numeri 152 CAPITOLO 5. ALGEBRA reali del tipo aθ √ + b, dove a, b ∈ Q. Questo insieme si denota con Q[ 2] = Q[θ] e si dice una estensione algebrica di Q. Il punto interessante è che la somma (aθ + b) + (a′ θ + b′ ) = (a + a′ )θ + (b + b′ ) rimane nell’ambito dell’insieme, cioè, come si dice, è chiusa e naturalmente, essendo eseguita su numeri reali, gode delle varie proprietà di associatività e commutatività. Inoltre, se consideriamo 0 = 0θ + 0 uno dei nostri numeri, esso si comporta da identità e si ha (aθ + b) + (−aθ − b) = 0, cioè −aθ − b è l’opposto di aθ + b. Ancora più notevole è il prodotto: ′ ′ ′ 2 ′ ′ ′ (aθ + b) × (a θ + b ) = aa θ + ab θ + a bθ + bb = = (ab′ + a′ b + aa′ )θ + (aa′ + bb′ ). Se poi intervengono radici di equazioni di grado superiore al secondo, occorre considerare anche le po√ tenze intermedie. Ad esempio, se θ = 4 2, allora θ è la soluzione di x4 − 2 = 0 e quindi le espressioni da considerare sono del tipo aθ3 + bθ2 + cθ + d. Il prodotto richiede un’elaborazione più complicata: (aθ3 + bθ2 + cθ + d)(a′ θ3 + b′ θ2 + c′ θ + d′ ) = = aa′ θ6 + (ab′ + a′ b)θ5 + (ac′ + bb′ + a′ c)θ4 + +(ad′ + bc′ + cb′ + da′ )θ3 + +(bd′ + cc′ + db′ )θ2 + (cd′ + dc′ )θ + dd′ . = (ab′ + a′ b)θ + (2aa′ + bb′ ) Ora occorre osservare che da θ4 = 2 discende θ5 = 2θ e θ6 = 2θ2 , per cui, continuando i calcoli, il prodotto dato che θ2 = 2. Quindi, anche il prodotto è un’opeviene a valere: razione chiusa e, di nuovo, essendo eseguito tra numeri reali, è senz’altro associativo, commutativo e (ad′ + bc′ + cb′ + da′ )θ3 + (2aa′ + bd′ + cc′ + db′ )θ2 + distributivo rispetto alla somma. Inoltre, scrivendo 1 = 0θ+1, si ha (aθ+b)×1 = aθ+b, cioè 1 fa da iden- +(2ab′ + 2ba′ + cd′ + dc′ )θ + (2ac′ + 2bb′ + 2ca′ + dd′ ). tità rispetto al prodotto. Ci possiamo allora chiedere Questa espressione è alquanto complessa, ma non poi se esiste un inverso di aθ+b: la risposta è affermativa. più di tanto, e permette anche di calcolare l’inverSia a′ θ + b′ l’eventuale inverso di aθ + b; si deve avere so di aθ3 + bθ2 + cθ + d come soluzione di un si(aθ+b)×(a′ θ+b′ ) = (ab′ +a′ b)θ+(2aa′ +bb′ ) = 0θ+1, stema lineare di quattro equazioni nelle quattro incioè ab′ + a′ b = 0 e 2aa′ + bb′ = 1. Questo è un sistecognite a′ , b′ , c′ , d′ : basta uguagliare la precedente ma lineare di due equazioni nelle due incognite a′ , b′ espressione all’identità 1 = 0θ3 + 0θ2 + 0θ + 1. e, come sappiamo, ha una e una sola soluzione se il Di conseguenza, da un punto di vista formale, quedeterminante del sistema è diverso da 0; ma: sti insiemi di numeri hanno le stesse proprietà di Q ¯ ¯ ¯ b a ¯ e di R, cioè sono dei campi, più vasti di Q, ma più 2 2 ¯ ¯ ¯ 2a b ¯ = b − 2a smilzi di R. Anche R, come sappiamo, non è completo rispetto alla soluzione delle equazioni: non è detto e questa espressione non può mai essere√0, altrimenti che un’equazione a coefficienti in R debba per forza 2 avremmo b2 = 2a2 , cioè 2 = b√ /a2 o 2 = b/a, ed avere una soluzione reale. Ad esempio, x2 +1 = 0 non essendo a, b ∈ Q sarebbe anche 2 ∈ Q. La soluzione ha soluzioni reali perché ogni numero reale elevato al del sistema dà: quadrato dà un numero non negativo, e aggiungendogli 1 si ha sempre un numero maggiore di 0. Come −a b a′ = 2 b′ = 2 , 2 2 prima θ era la soluzione ipotetica di una equazione b − 2a b − 2a irriducibile su Q, chiamiamo ora i l’immaginaria soe questo permette di trovare l’inverso di ogni numero luzione della precedente equazione; deve pertanto esdel tipo aθ + b. Ad esempio, l’inverso di 2θ + 3 si sere i2 + 1 = 0, ovvero i2 = −1. Proprio per questa trova calcolando: asserzione, i viene detta l’unità immaginaria e su di −2 essa possiamo costruire un nuovo campo R[i], che si ′ ′ = −2 b = 3; a = chiama il campo dei numeri complessi e si indica di√so9−8 lito con C. In analogia a quanto si diceva per Q[ 2], in effetti, eseguendo il prodotto (2θ + 3)(−2θ + 3) = gli elementi di C hanno la forma bi + a, che tradizio−4θ2 + 6θ − 6θ + 9 = −4 × 2 + 9 = 1. nalmente si scrive a + bi, e la somma è ovviamente Questo stesso √ procedimento può esser fatto, ad definita da: esempio, per 5, ma la regola del prodotto diviene: (aθ + b)(a′ θ + b′ ) = (ab′ + a′ b)θ + (5aa′ + bb′ ). (a + bi) + (a′ + b′ i) = (a + a′ ) + (b + b′ )i. Un po’ più complicato può essere considerare la radice Questa volta non conosciamo alcun campo che conθ dell’equazione x2 − x − 1 = 0; in questo caso è tenga C, e quindi dovremmo verificare che le proprietà associativa e commutativa valgono effettivaθ2 = θ + 1 e quindi il prodotto è definito da: mente. Per la proprietà commutativa, ad esempio, si ha: (a + bi) + (a′ + b′ i) = (a + a′ ) + (b + b′ )i = (aθ + b)(a′ θ + b′ ) = (ab′ + a′ b)θ + aa′ θ2 + bb′ = 153 5.6. NUMERI COMPLESSI (a′ +a)+(b′ +b)i = (a′ +b′ i)+(a+bi), e questo prova termine “immaginario” è, a questo proposito, molto che anche in C possiamo contare su questa proprietà significativo). della somma. Naturalmente, 0 + 0i è l’identità e si scrive semplicemente 0; −a − bi è l’opposto di a + bi 3 + 2i poiché (a + bi) + (−a − bi) = (a − a) + (b − b)i = 0. Per il prodotto abbiamo: −2 + i ′ ′ ′ ′ ′ ′ 2 (a + bi) · (a + b i) = aa + ab i + ba i + bb i = = (aa′ − bb′ ) + (ab′ + ba′ )i essendo per definizione i2 = −1. Anche qui dovremmo verificare le proprietà commutativa, associativa e distributiva rispetto alla somma. Per la commutatività abbiamo: (a + bi) · (a′ + b′ i) = (aa′ − bb′ ) + (ab′ + ba′ )i = (a′ + b′ i) · (a + bi), dato che per i numeri reali la proprietà vale. Lasciamo alla pazienza e alla buona volontà del lettore la dimostrazione noiosa (ma che almeno una volta nella vita è bene fare) delle altre due proprietà. Piuttosto, chi è l’identità rispetto al prodotto? Se (a′ + b′ i) indica questa presunta identità ed a + bi 6= 0, deve essere (a + bi) · (a′ + b′ i) = (aa′ − bb′ ) + (ab′ + ba′ )i = a + bi, cioè aa′ −bb′ = a e ab′ +a′ b = b. Abbiamo qui un sistema lineare di due equazioni nelle due incognite a′ , b′ ; moltiplicando la prima equazione per b e la seconda per a si ottiene: aba′ − b2 b′ = ab e aba′ + a2 b′ = ab; sottraendo membro a membro si ha: (a2 + b2 )b′ = 0. Ma qui osserviamo che l’ipotesi a+bi 6= 0 implica che sia a2 + b2 > 0, poiché a2 + b2 è 0 se e solo se sia a che b valgono 0. Un prodotto in R, d’altra parte, è 0 solo se un fattore è 0 e quindi possiamo concludere b′ = 0. Sostituendo questo valore in aa′ − bb′ = a (se a 6= 0) e in ab′ +a′ b = b (se a = 0 e quindi b 6= 0) si ha a′ = 1. Quindi, come ci si poteva aspettare, l’identità è 1 + 0i, che di regola si scrive semplicemente 1. In generale, tutti i numeri complessi della forma a + 0i si scrivono a e si identificano con i numeri reali: il numero complesso 5 + 0i è da intendersi come il numero reale 5. I numeri della forma 0 + bi si dicono immaginari e si scrivono nella forma abbreviata bi. I numeri complessi, nel loro insieme, si possono rappresentare come i punti del piano con le seguenti convenzioni: assimiliamo il numero complesso a + bi alla coppia ordinata (a, b) e quindi facciamo corrispondere il numero complesso a un punto del piano cartesiano. Propriamente, l’asse delle x diviene l’asse contenente tutti e soli i numeri reali, e pertanto viene detto l’asse reale. L’asse y invece contiene i punti corrispondenti ai numeri immaginari e si dice perciò l’asse immaginario. Nella Figura 5.3 sono riportati alcuni punti con i corrispondenti numeri complessi; il piano cartesiano, cosı̀ modificato e interpretato, si dice piano d’Argand, dal nome del matematico dilettante francese che l’ha introdotto alla fine del 1700 e che ha permesso di dare una rappresentazione concreta a un concetto ritenuto completamente astratto (il 1−i −1 − 2i Figura 5.3: Il piano di Argand Abbiamo di proposito tralasciato l’ultimo problema sulla struttura algebrica dei numeri complessi: dato un numero a + bi 6= 0, qual è il suo inverso? Se, al solito, a′ + b′ i è tale ipotetico inverso, si deve avere (a + bi) · (a′ + b′ i) = (aa′ − bb′ ) + (ab′ + ba′ )i = 1 + 0i, il che equivale al sistema: ½ aa′ − bb′ = 1 ba′ + ab′ = 0 nelle due incognite a′ , b′ . Il determinante di questo sistema è: ¯ ¯ ¯ a −b ¯ 2 2 ¯ ¯ ¯ b a ¯=a +b che è sempre diverso da 0, nell’ipotesi che sia a + bi 6= 0. Allora il sistema ha sempre una e una sola soluzione: a′ = a a2 + b2 b′ = −b . a2 + b2 Ad esempio, dato il numero complesso 2 − 3i, l’in2 3 verso è 13 + 13 i, come è facile verificare eseguendo il prodotto: ¶ µ ¶ µ ¶ µ 3 4 9 6 6 2 + i = + + − i = 1. (2−3i) 13 13 13 13 13 13 Gauss, intorno all’anno 1800, riuscı̀ a dimostrare che “ogni equazione algebrica a coefficienti in C ha in C almeno una soluzione”, risultato noto come Teorema fondamentale dell’Algebra. Tale proprietà che, come sappiamo, non vale né in Q né in R, ci dice che il campo dei numeri complessi è il campo numerico più adeguato nel quale si possano trattare le equazioni algebriche. Abbiamo esplicitamente visto che da Q si può passare a campi più ampi, se si aggiungono le radici di equazioni che non hanno soluzioni in Q; la stessa cosa si può fare in R, e proprio con tale metodo siamo arrivati a C. Qui la cosa non procede 154 CAPITOLO 5. ALGEBRA oltre, poiché ogni equazione algebrica ha soluzioni in C stesso. Se invece di partire dall’equazione x2 + 1 = 0 fossimo partiti da un’altra equazione irriducibile, ad esempio x2 + 2x + 3 = 0, avremmo ottenuto un campo leggermente diverso, ma isomorfo a C, cioè con le stesse proprietà di C. Se j è una radice di x2 + 2x + 3, il prodotto (a + bj) · (a′ + b′ j) sarebbe stato: aa′ + (ab′ + a′ b)j + bb′ j 2 = ′ ′ ′ ′ = aa + (ab + a b)j + bb (−2j − 3) = = (aa′ − 3bb′ ) + (ab′ + ba′ − 2bb′ )j, e questi numeri “complessi” avrebbero comunque avuto una rappresentazione su un piano analogo a quello di Argand. Da un altro punto di vista, se applichiamo la formula per la risoluzione delle equazioni di p abbiamo ∆√= 4−12 √ secondo √ = −8 √ e quindi: √ grado, ∆ = −8 =√ (−1) · 8 = −1 8 = i2 2, e quindi: x = −1 ± i 2, cioè√j è esprimibile in √C come uno dei due valori: −1 + i 2 oppure −1 − i 2. √Scelto ad esempio il primo valore e posto j = −1 + i 2, si ha: √ √ √ 2 2 i = (j + 1)/ 2 = + j, 2 2 il che fa vedere come j ed i siano esprimibili uno in funzione √ Questo naturalmente non succede √ dell’altro. per Q[ 2] e Q[ 3], anche se questi due campi hanno proprietà formali del tutto simili l’uno all’altro. Partendo da un polinomio di grado n, se questo ha una radice α ∈ C, dividendo per x − α si ottiene un polinomio di grado n − 1. Questo, a sua volta, avrà una radice che permette di ridurre il grado di 1, e cosı̀ via. Corollario del Teorema di Gauss è che ogni equazione algebrica di grado n ha in C esattamente n soluzioni (alcune delle quali, in particolare, possono essere uguali tra loro). I due numeri complessi a + bi e a − bi si dicono coniugati; nel piano di Argand sono rappresentati da punti simmetrici rispetto all’asse reale. Elevando al quadrato si ha: (a + bi)2 = (a + bi) · (a + bi) = (a2 − b2 ) + 2abi 2 2 2 (a − bi) = (a − b ) − 2abi, cioè si ottengono ancora due numeri complessi coniugati. Iterando, si ha che coniugate rimangono tutte le loro potenze. Se z ∈ C, il suo coniugato si indica con z, e quindi possiamo scrivere: z k = (z k ), qualunque sia k ∈ N. Si noti poi che un numero complesso z è uguale al suo coniugato, z = z, se e solo se z ∈ R: infatti, se z = a + 0b, il suo coniugato è a − 0b = a = z, e se a + bi = a − bi allora è 2bi = 0, cioè b = 0. Si ha allora il seguente: Teorema 5.16 Sia p(x) un polinomio a coefficienti reali; allora, se z ∈ C è una radice di p(x), cioè p(z) = 0, allora anche p(z) = 0. Prova: Sia p(x) = a0 xn + a1 xn−1 + · · · + an−1 x + an , dove a0 , a1 , . . . , an ∈ R. Abbiamo allora a0 z n + a1 z n−1 + · · · + an−1 z + an = 0 e prendendo il coniugato: a0 z n + a1 z n−1 + · · · + an−1 z + an = 0 = 0. Si applicano ora le regole del coniugato viste sopra e si ha: a0 z n + a1 z n−1 + · · · + an−1 z + an = 0. Ma i coefficienti sono numeri reali e quindi: a0 z n + a1 z n−1 + · · · + an−1 z + an = 0 il che prova che z è una soluzione dell’equazione p(x) = 0. Se p(x) ha come soluzione il numero complesso a + bi, ha come soluzione anche a−bi, e quindi è divisibile per x − a − bi e per x − a + bi; di conseguenza è divisibile per il loro prodotto: (x−a−bi)(x−a+bi) = (x − a)2 − (ib)2 = x2 − 2ax + a2 + b2 . Ma questo è un polinomio di secondo grado a coefficienti reali, per cui abbiamo dimostrato il seguente: Teorema 5.17 Sia p(x) un polinomio a coefficienti reali; allora esso è scomponibile in fattori di primo e di secondo grado in R[x]. In altre parole, questo dimostra che i polinomi irriducibili di R[x] sono soltanto i polinomi di primo e di secondo grado; naturalmente, per ciò che si è visto sulla risoluzione delle equazioni di secondo grado: Corollario 5.18 I polinomi irriducibili di R[x] sono (oltre alle costanti) tutti i polinomi di primo grado e i polinomi di secondo grado ax2 + bx + c per i quali si ha: ∆ = b2 − 4ac < 0. Non vi sono in R[x] altri polinomi irriducibili. Un’altra conseguenza del teorema è: Corollario 5.19 Un polinomio p(x) ∈ R[x] di grado dispari ha almeno una soluzione reale. Questo risultato può essere molto utile nella risoluzione delle equazioni a coefficienti reali, specialmente quelle di terzo grado. Queste, infatti, trovata la radice reale α possono essere ridotte di grado usando la regola di Ruffini, e tale riduzione porta a un’equazione di secondo grado, le cui soluzioni possono essere reali (se il discriminante ∆ ≥ 0) o complesse coniugate per il Teorema 5.16: potranno comunque essere trovate col Teorema 5.10 oppure col Teorema 5.21 che vedremo nella prossima sezione. Il punto, allora, è: come si determina la radice reale? Due casi interessanti sono i seguenti: 5.7. EQUAZIONI DI GRADO SUPERIORE • l’equazione è reciproca, cioè della forma ax3 + bx2 +bx+a = 0 oppure ax3 +bx2 −bx−a = 0. Nel primo caso ha la soluzione x = −1, nel secondo la soluzione x = 1, come si verifica direttamente; • se l’equazione ha coefficienti interi e ammette una radice razionale, questa può essere trovata col metodo di Eisenstein (Teorema 5.8). Abbiamo proprio visto l’esempio 27x3 + 6x − 12 = 0. Considerazioni analoghe valgono per le equazioni di quinto grado. 5.7 Equazioni di grado superiore Affrontiamo in questa sezione il problema della risoluzione delle equazioni di grado superiore al secondo. Alcune situazioni particolari possono essere trattate agevolmente con metodi ad-hoc: • si dicono biquadratiche le equazioni del tipo ax4 + bx2 + c = 0. Ponendo y = x2 esse si riducono ad equazioni di secondo grado che sappiamo √ risolvere. Se α è una soluzione, si ha x = ± α e quindi dobbiamo avere α ≥ 0 se vogliamo soluzioni reali. Ad esempio, l’equazione x4 − x2 − 12 = 0 si trasforma in y 2 − y − 12 = 0, con le soluzioni y = 4 ed y = −3; questi√valori danno luogo alle due soluzioni reali x = ± 4 = ±2 √ e alle soluzioni complesse immaginarie x = ±i 3; 155 il giunto cardanico) non scoprı̀ proprio niente e si divertiva più a fare il medico e il mago che non a fare il matematico. Il metodo di risoluzione delle equazioni di terzo grado sembra sia dovuto a Scipione del Ferro, che in punto di morte lo rivelò a un suo allievo. Le formule furono più tardi riscoperte da Niccolò Tartaglia che le rivelò a Cardano. Il metodo di risoluzione delle equazioni di quarto grado fu scoperto da Ludovico Ferrari, segretario di Cardano, al quale le passò. Nessuno, invece, nonostante ripetuti e approfonditi studi, riuscı̀ a trovare formule risolutive per le equazioni di grado superiore. Si cominciò allora a pensare che soluzioni generali per tali equazioni potessero non esistere. Che questo fosse il caso, fu dimostrato finalmente da Evariste Galois nel 1832, in una nota scritta la sera prima di morire in duello, all’età di 21 anni. La forma esatta del risultato di Galois è: per le equazioni algebriche di grado superiore al quarto non esistono formule risolutive nelle quali compaiano solamente le quattro operazioni di base e l’estrazione di radici. Di solito, si abbrevia questa affermazione dicendo che le equazioni di grado superiore al quarto non sono risolubili per radicali. Naturalmente, esistono metodi numerici per trovare anche le soluzioni di queste equazioni, con approssimazioni spinte quanto si vuole: tali metodi verranno accennati in questa sezione e saranno studiati durante i corsi universitari. Consideriamo una semplice equazione di secondo grado, ad esempio x2 + x − 6 = 0; sfruttando il fatto che, per il Teorema 5.11, il prodotto delle radici deve essere −6 e la loro somma −1, vediamo subito che le soluzioni sono x1 = −3 e x2 = 2. Se ora operiamo una trasformazione della nostra incognita, ponendo ad esempio x = X + 1, otteniamo una nuova equazione: • si dicono trinomie le equazioni del tipo ax2k + bxk +c = 0. Analogamente a quanto fatto prima, si pone y = xk riportandosi a un’equazione di √ (X + 1)2 + (X + 1) − 6 = secondo grado; questa volta abbiamo x = ± k y √ se k è pari, e x = k y se k è dispari. Ad esempio, 6 3 = X 2 + 2X + 1 + X + 1 − 6 = X 2 + 3X − 4. x − 7x − 8 = 0 si risolve ponendo y = x3 e trovando √ y = −1 e y = 8, quindi Questa nuova equazione ha come radici X = −4 √ le due soluzioni x = 3 −1 = −1 e x = 3 8 = 2; e X = 1. Potevamo prevedere facilmente questo • si dicono reciproche le equazioni del tipo axn + risultato, poiché la trasformazione si scrive anche: bxn−1 + cxn−2 + · · · + cx2 + bx + a = 0 (I specie) X = x − 1 e deve valere anche per la radici, che non oppure axn +bxn−1 +cxn−2 +· · ·−cx2 −bx−a = 0 sono altro che particolari valori, quelli che rendono (II specie). Si verifica immediatamente che se α vera l’equazione. Ma allora si deve avere X1 = x1 − 1 è una radice, allora anche 1/α è tale. Abbiamo e X2 = x2 − 1, come infatti si è verificato. Ocvisto il caso n = 3 e per x4 −2x3 + 34 x2 −2x+1 = corre stare attenti a come opera la trasformazione 0, sostituendo, si vede subito che sia 2, sia 1/2 x = X + α: se conosciamo una soluzione x1 dell’equazione di partenza, la soluzione dell’equazione trasono soluzioni. sformata è X1 = x1 − α; ma se conosciamo X1 , si ha ovviamente: x1 = X + α. Durante il 1500, alcuni matematici italiani scoprirono formule e algoritmi per la risoluzione delle equaLe trasformazioni di questo tipo, dette trasformazioni algebriche di terzo e di quarto grado. Il tutto zioni lineari sono necessarie in Geometria Analitica è riportato nel libro “Ars Magna” di Gerolamo Car- quando si voglia cambiare sistema di riferimento. In dano del 1545. Tuttavia, Cardano (al quale si deve Algebra sono utili se semplificano la risoluzione di 156 una equazione. Ad esempio, se riuscissimo ad eseguire una trasformazione che annulla il termine noto, almeno una soluzione sarebbe X0 = 0, e quindi, se abbiamo operato la trasformazione x = X + α, sapremmo immediatamente che una soluzione dell’equazione di partenza era x0 = X0 + α = α. Per la regola di Ruffini, ciò consentirebbe di abbassare di grado l’equazione di partenza, e quindi semplificare il nostro problema. Purtroppo la cosa non è banale, ma esiste una semplice trasformazione che ci permetterà di dare una seconda prova della formula risolutiva delle equazioni di secondo grado e, soprattutto, ci consentirà di risolvere le equazioni di terzo e di quarto grado. Formuliamo e dimostriamo allora: CAPITOLO 5. ALGEBRA Operiamo ora la trasformazione del lemma 5.20 con n = 2 e ponendo x = X − b/(2a): µ b X− 2a ¶2 b + a µ ¶ b c b2 − 4ac X− + = X2− = 0. 2a a 4a2 Questo significa: X2 = b2 − 4ac . 4a2 Il denominatore 4a2 è sempre positivo, per cui se b2 − 4ac > 0 si hanno le due soluzioni: √ b2 − 4ac X=± 2a Lemma 5.20 Data l’equazione xn +bxn−1 +cxn−2 + · · · + d = 0, la trasformazione x = X − b/n annulla il da cui discende la formula operando la trasformazione coefficiente del termine di grado n − 1 e l’equazione x = X − b/(2a). In modo analogo si procede quando diviene X n + c′ X n−2 + · · · + d′ = 0. ∆ = 0, mentre se ∆ < 0 le soluzioni per X sono due valori immaginari opposti; la trasformazione li Prova: Supporre che il coefficiente di xn sia 1 non cambia allora in due numeri complessi coniugati: è restrittivo, perché se fosse a 6= 0 e a 6= 1 potremp mo dividere tutta l’equazione per a. Eseguendo la |b2 − 4ac| b x=− ±i trasformazione e applicando la regola del binomio di 2a 2a Newton, il membro sinistro diviene: come si voleva. µ ¶n µ ¶n−1 µ ¶n−2 b b b X− +b X − +c X − +···+d = Vediamo allora come si risolvono le equazioni di n n n terzo grado. Usando il teorema sulle trasformazioni, facciamo scomparire il termine in x2 , per cui possiab n−1 n(n − 1) b2 n−2 n−1 n + X + · · · + bX + mo senz’altro considerare un’equazione della forma = X −n X n 2 n2 x3 = px + q; questa si dice l’equazione ridotta delb n−2 n−2 l’equazione originale. Cerchiamo ora le soluzioni del +b(n − 1) X + · · · + cX + ··· + d = n tipo x = u + v, dove u e v sono due quantità incon−2 n−2 n n − 1 2 n−2 n − 1 gnite. Questo sembra complicare le cose, ma facendo b X + bX +cX +· · ·+d. =X + 2n n i conti e applicando la regola del binomio di Newton Questa espressione ci dà anche il valore di c′ , e ci per la terza potenza, abbiamo: potrebbe dare il valore di tutti gli altri coefficienti, u3 + 3u2 v + 3uv 2 + v 3 = p(u + v) + q ma questo non è importante come il fatto che sia n−1 sparito il termine in X . u3 + v 3 + (3uv − p)(u + v) = q. Vediamo allora come questo lemma ci permetta di dare una dimostrazione alternativa della formula per Qui ora possiamo sfruttare il fatto che u e v sono numeri qualsiasi e li possiamo scegliere con una qualche la risoluzione delle equazioni di secondo grado: libertà; ad esempio, possiamo far sı̀ che il termine con Teorema 5.21 Sia ax2 + bx + c = 0 una qualunque (u + v) scompaia, e per far ciò basta che sia 3uv = p. equazione di secondo grado in forma canonica. Le Allora (u + v) è una soluzione della nostra equazione sue soluzioni sono: se abbiamo contemporaneamente: √ √ ½ 2 2 −b + b − 4ac −b − b − 4ac uv = p/3 x1 = x2 = . 2a 2a u3 + v 3 = q. se ∆ > 0 sono distinte. Se ∆ = 0 si ha la soluzione Ricavando u dalla prima equazione e sostituendolo x0 = −b/(2a) con molteplicità 2, mentre se ∆ < 0 nella seconda si trova: l’equazione ha due soluzioni complesse coniugate. p3 Prova: Dividendo l’equazione per a, essa diventa: =q u3 + 27u3 c b x2 + x + = 0. 27u6 − 27qu3 + p3 = 0. a a 5.7. EQUAZIONI DI GRADO SUPERIORE Sostituiamo ora U ad u3 ; si ha una semplice equazione di secondo grado: 157 distanti, y1 e y2 , possiamo immaginare, almeno in linea teorica, di trovare due valori di x, diciamo x1 e x 2 , tali che y1 = p(x1 ) e y2 = p(x2 ), e questi valori 27U 2 − 27qU + p3 = 0 di x saranno vicini tra di loro. Possiamo disegnare il grafico della funzione y = p(x) su un foglio di carta che sappiamo risolvere. Questa equazione si dice la millimetrata, considerando diversi valori di x, diciarisolvente dell’equazione di terzo grado, e ci dà: mo x1 , x2 , . . . , xn , e calcolando i corrispondenti valori r p della y, cioè y1 = p(x1 ), y2 = p(x2 ), . . . , yn = p(xn ). q p3 q2 27q ± 729q 2 − 108p3 = ± − . U= Lavorando con valori discreti x1 , x2 , . . . , xn , il grafico 54 2 4 27 sarà costituito da punti, ma l’osservazione precedenNaturalmente, se avessimo ricavato u dalla 3uv = te ci fa intuire che possiamo unire i punti ottenuti p, avremmo ottenuto esattamente la stessa soluzio- cosı̀ da rappresentare, in modo continuo, tutti i valori ne, per cui possiamo arbitrariamente associare ad u3 di y corrispondenti ai valori di x, almeno nell’interla soluzione con il segno positivo e a v 3 quella con vallo finito che la carta millimetrata ci permette di il segno negativo. Dalla x = u + v abbiamo infine tabulare. la sospirata soluzione dell’equazione ridotta di terzo Le radici dell’equazione corrispondono ai valori delgrado: la x per cui si ha p(x) = 0, cioè ai punti in cui la curva s s attraversa la base delle nostre computazioni, cioè la r r 3 2 3 q 3 q p p3 q q2 linea y = 0; nella figura questi punti sono compresi in + − + − − . x= 2 4 27 2 4 27 due intervalli, il primo che va da −2 a −1, il secondo che va da 0 ad 1. Questo significa che se a sinistra Ora, facendo all’indietro la trasformazione che ci ha di una radice il valore di p(x) è positivo, a destra deportato alla forma ridotta, si trova la soluzione del- ve essere negativo, e viceversa. Tale osservazione ci l’equazione originale, cioè dell’equazione generale di permette di fare un’asserzione fondamentale: se per terzo grado, da cui siamo partiti. due valori x1 e x2 con x1 < x2 si ha che p(x1 ) e p(x2 ) Come abbiamo detto, esistono formule risolutive hanno segni opposti, allora deve esistere almeno una anche per le equazioni di quarto grado, ma non in- radice compresa tra x ed x . Naturalmente, fra x e 1 2 1 tendiamo addentrarci ulteriormente in questa giungla x ce ne potrebbero essere anche 3 o 5 o più, ma que2 di formule. In effetti, il problema della ricerca delle sto non muta il senso dell’osservazione. Si badi bene soluzioni di un’equazione algebrica, se affrontato op- che dall’osservazione NON discende che se p(x ) e 1 portunamente, non è poi complicato come sembra, p(x ) hanno lo stesso segno, allora non esiste alcu2 purché si abbandoni l’idea di trovare una “formula” na radice compresa tra x e x : basta ricordarsi del 1 2 che esprima tali soluzioni. Può anche essere diverten- valore della contropositiva e della contraria di una te programmare su un elaboratore il metodo che ora proposizione. Nell’esempio, p(−2) = p(1) = 1, ma andiamo a descrivere; esso non è certamente il meto- fra −2 e 1 vi sono ben due radici (comunque, in quedo migliore che si conosca, ma certo è il più elemen- sta situazione, le radici possono solo essere in numero tare e diretto. Per chi non sa usare la programmazio- pari: 0, 2, 4, etc.). ne, sarà utile fare un po’ di conti a mano, aiutati da Una volta, il primo passo per trovare le radici conun calcolatore tascabile; anzi, anche chi vuol tentare sisteva proprio nel disegnare il grafico di p(x) e deterdi automatizzare il metodo, è bene che cominci con minare gli intervalli di separazione delle varie radici, qualche elaborazione manuale, per cercare di capire cioè gli intervalli [x1 ..x2 ] che isolano ciascuna radice. fino in fondo cosa si sta facendo. Questo procedimento non può essere portato avanti Prima di tutto, prendiamo il polinomio che deterdall’elaboratore, ma lo si può simulare in vari modi. mina l’equazione e usiamolo come formula, cioè come Ad esempio, si può valutare p(x) per valori interi di espressione che, dato un valore specifico della variabix o per valori che siano potenze di 2, restringendo le x, permette di calcolare il valore y del polinomio nel 2 poi tali intervalli se nulla si è riusciti a trovare. Nel punto x. Ad esempio, dall’equazione x + x − 1 = 0, 2 caso che il polinomio p(x) abbia grado dispari, un inconsideriamo l’espressione y = x + x − 2 che, posto 2 tervallo di separazione si trova sempre; infatti, per x = 1, ci dà il valore y = 1 + 1 − 1 = 1, e posto 2 valori molto grandi in valore assoluto, ma positivi e invece x = 2 ci dà y = 2 + 2 − 1 = 5. E’ questa la negativi, p(x) deve assumere per forza valori di senotazione funzionale y = p(x); x si dice la variabile gno diverso. Il caso del grado pari è più complesso e indipendente ed y la variabile dipendente. E’ bene una tale equazione potrebbe anche non avere alcuna osservare che se prendiamo due valori vicini tra di 2 radice reale, come succede a x + 1 = 0. loro, ad esempio x1 = 1 e x2 = 1.01, i corrisponSupponiamo allora di essere riusciti a trovare un denti valori della y sono ancora vicini tra di loro. E viceversa, se partiamo da due valori di y non molto intervallo [x1 ..x2 ] che separi (almeno) una radice; per 158 CAPITOLO 5. ALGEBRA 4 3 2 1 -3 -2 -1 0 1 2 Figura 5.4: La parabola y = x2 + x − 1 fissare le idee, immaginiamo che sia p(x1 ) < 0 e p(x2 ) > 0. Consideriamo ora il punto di mezzo di tale intervallo, x3 = (x1 + x2 )/2 e calcoliamo p(x3 ); se esso è positivo, allora l’osservazione di partenza ci dice che una radice deve essere compresa nell’intervallo [x1 ..x3 ], se invece è negativo, la radice sarà in [x3 ..x2 ]. Qualunque sia l’intervallo, possiamo iterare il procedimento e restringerci ad intervalli sempre più piccoli. Se siamo partiti con [x1 ..x2 ] ed x2 = x1 + 1 (come spesso accade), allora x1 è un’approssimazione per difetto della soluzione, e x2 ne è un’approssimazione per eccesso. Dimezzando l’intervallo ad ogni iterazione, occorrono dieci iterazioni per avere un intervallo di circa 1/1000, cioè per aver trovato tre cifre decimali della soluzione. Naturalmente il calcolatore può eseguire tante iterazioni quante se ne vogliono in tempi del tutto trascurabili. Ad esempio, cinquanta iterazioni corrispondono ad un intervallo di lunghezza 2−50 ≈ 10−15 , il che vuol dire avere circa quindici cifre decimali esatte. √ tradizionale, si trova essere ( 5 − 1)/2 ≈ 0.618034. Facendo i conti a mano, può essere preferibile (più per ragioni psicologiche che altro) determinare una cifra decimale dopo l’altra. Riprendendo l’esempio precedente, scoperto l’intervallo di separazione [0..1], sappiamo che la soluzione avrà la forma 0.d1 d2 d3 . . . e possiamo scoprire d1 calcolando il polinomio nei punti 0.1, 0.2, 0.3, . . . , 0.9. In particolare, si trova p(0.6) = −0.04 e p(0.7) = 0.19, il che restringe l’intervallo a [0.6..0.7]. Si continua, calcolando p(x) nei punti 0.61, 0.62, . . . , 0.69, per i quali si ha p(0.61) = −0.0179 e p(0.62) = 0.0044. Si è cosı̀ ottenuto l’intervallo [0.61..0.62] che già ci fa intravedere il risultato finale. Questa tecnica “decimale” è probabilmente un po’ più intuitiva, ma richiede un numero maggiore di operazioni per arrivare alla stessa precisione della precedente. Si osservi infatti che per avere la precisione di un centesimo abbiamo calcolato p(x) in nove punti diversi, cioè da 0.1 a 0.7 e poi 0.61 e 0.62. Col metodo binario, 9 operazioni permettono di ridurre l’intervallo a 1/512, cioè a un intervallo più piccolo di oltre 5 volte. Con un po’ di esperienza, si può ottimizzare il metodo; ad esempio, poiché p(0.61) = −0.0179 e p(0.62) = 0.0044, cosı̀ che l’approssimazione a 0 è migliore per 0.62, è probabile che il decimale successivo sia superiore a 5. Allora, invece di cominciare i calcoli da 0.611 si può cominciare direttamente con 0.615, e questo porta un bel risparmio. A ben guardare, però, questo accorgimento è un modo diverso per introdurre dalla finestra il criterio “binario” che avevamo appena scacciato dalla porta. Il lettore si sarà accorto che abbiamo già utilizzato questa tecnica in varie occasioni, in particolare nella Sezione 3.6 “Potenze, radici, logaritmi”; in realtà, esso rappresenta un metodo molto generale. In situazioni particolari può essere migliorato, come mostra, nella stessa sezione, il metodo iterativo per calcolare la radice quadrata. Ciò, tuttavia, non fa perdere di interesse al metodo. Nei corsi di Calcolo Numerico, all’Università, si studierà il metodo di Newton, o di Newton-Raphson, che funziona assai meglio. Qualche volta anche noi, un po’ surrettiziamente, abbiamo avuto modo (e ne avremo ancora) di citare e di applicare tale metodo. Tornando alla tecnica esposta sopra, il lettore può inventarsi le proprie equazioni e cercare di trovarne le soluzioni reali; questo sarà un buon esercizio per capire i passi descritti, scrivere poi un opportuno algoritmo e portarlo infine sull’elaboratore. Come esempio (v. Figura 5.4), riprendiamo la precedente equazione e supponiamo di essere riusciti a determinare l’intervallo [0..1], cioè x1 = 0 e x2 = 1; corrispondentemente, si ha p(x1 ) = −1 e p(x2 ) = 2. Calcolando il valore del polinomio per x3 = 1/2, si trova p(x3 ) = −1/4, e perciò la radice si deve trovare tra 1/2 ed 1. La divisione successiva ci porta a x4 = 3/4 e si calcola p(3/4) = 0.3125; il nuovo intervallo è [1/2..3/4]. Il passo ulteriore ci dà x5 = 5/8 e p(5/8) = 0.015; l’intervallo si riduce a [1/2..5/8]. Il nuovo passo permette di calcolare x6 = 9/16 e p(9/16) = −0.12, cosı̀ che l’intervallo è [9/16..5/8] = [0.5625..0.625]. A questo punto il lettore può andare avanti per conto proprio, considerando gli intervalli che man mano ottiene e i cui estremi 5.8 Algebra astratta costituiscono un’approssimazione per difetto e per eccesso della soluzione. Per controllo, tali estremi van- Abbiamo visto come la parola “algebra” derivi dalno confrontati con la soluzione esatta che, col metodo l’arabo, nel quale sembra indicasse il trasferimento di 5.8. ALGEBRA ASTRATTA un termine da un membro all’altro di una equazione. Pur cosı̀ specifico, il termine era consono ad una disciplina incentrata sulla soluzione dei problemi per mezzo della manipolazione delle espressioni, in questo caso delle equazioni. Con Viète, l’Algebra venne ad inglobare tutte le manipolazioni formali di simboli, e quindi si contrappose alla Geometria, dominata dal concetto di figura, e successivamente all’Analisi, cioè allo studio analitico delle funzioni. Lo studio delle equazioni impose, nella prima metà dell’Ottocento e, in modo più marcato, nella seconda, l’introduzione di strutture formali atte a comprendere il comportamento delle soluzioni di una data equazione o di un’intera classe di equazioni. L’esempio più eclatante è costituito dalla permutazioni e dal loro uso, come struttura di gruppo, nella dimostrazione della non risolubilità per radicali delle equazioni algebriche di grado superiore al quarto. Ad un certo punto, queste strutture hanno, per cosı̀ dire, preso la mano agli algebristi, e le loro proprietà si sono rivelate importanti di per sé e nei confronti di altri settori della Matematica. Cosı̀ si cominciarono a studiare le “strutture algebriche” (cioè insiemi muniti di operazioni) in modo indipendente da qualsiasi connessione numerica, come era invece implicito nell’idea di “risoluzione delle equazioni”. Questo studio è stato pertanto detto “Algebra astratta” ed oggi è diventato uno dei settori fondamentali della Matematica, dal quale nessun matematico può prescindere. D’altra parte, i successi ottenuti dall’Algebra astratta in tanti campi applicativi, dalla cristallografia alla fisica atomica e subatomica, alla biologia, hanno fatto sı̀ che alcuni suoi concetti siano diventati patrimonio comune di tutta la scienza. Alla base dell’Algebra astratta, sta, come abbiamo detto, il concetto di struttura algebrica; si intende con questa espressione un insieme S, detto il sostegno della struttura, munito di una o più operazioni (si veda il primo Capitolo), caratterizzate da alcune proprietà formali, come la chiusura, l’associatività o la commutatività. Come abbiamo visto nella Sezione ??, la struttura algebrica più semplice è il monoide, ma certamente quella più importante è il gruppo. Abbiamo già incontrato vari esempi di gruppo, ma rivediamo qui le situazioni più caratteristiche. I numeri interi con l’operazione di somma, cioè (Z, +), è un gruppo nel quale e = 0 e l’inverso di x è −x; in questo caso si preferisce parlare di opposto, piuttosto che di inverso, ma il concetto è quello. L’insieme dei numeri razionali positivi con l’operazione di moltiplicazione, cioè (Q+ , ×), nel quale l’identità è 1 e l’inverso di x è x−1 , cioè proprio l’inverso in senso tradizionale. Questi sono due esempi di gruppi commutativi o abeliani, visto che vale anche la proprietà commutativa. Questa non 159 vale invece per le permutazioni Pn su {1, 2, . . . , n} con l’operazione di composizione, cioè (Pn , ◦), come si è visto nel Capitolo 4. Storicamente, questo è stato il primo esempio di gruppo finito e non commutativo, e fu introdotto da Ruffini e da Abel nei loro studi sulla non risolubilità per radicali delle equazioni di grado superiore al quarto. Le rotazioni intorno a un punto e le traslazioni del piano costituiscono un gruppo quando si consideri l’operazione di composizione, cioè l’operazione che esegue una trasformazione dopo l’altra. E’ interessante prendere una figura e un punto sul piano della figura, e considerare poi le rotazioni che trasformano a figura in sé stessa: si provi con un quadrato, un rettangolo o un poligono regolare e il relativo centro. Questo ci fa capire perché il “centro” si chiama in questo modo. Nel Capitolo 2 sull’Aritmetica abbiamo trovato altri esempi di gruppo finito: l’insieme Zm dei numeri {0, 1, . . . , m − 1} con l’operazione x ⊕ y = x + y (mod m), e l’insieme Z∗m , dei numeri minori di m e primi con m con l’operazione x⊗y = x×y (mod m). Le proprietà là messe in evidenza non servivano ad altro se non a dimostrare le proprietà di gruppo di tali strutture. Ritorneremo tra breve su questi esempi, quando parleremo di gruppi finiti. Noi non possiamo addentrarci nella meravigliosa teoria dei gruppi, ma val la pena di dimostrare un risultato astratto di notevole interesse. Un sottoinsieme H di un gruppo G si dice un sottogruppo di G se è esso stesso un gruppo con l’operazione definita in G. Questo modo di esprimersi è formalmente scorretto e dovremmo dire: se H è un sottoinsieme del sostegno di un gruppo (G, ·) e . . .; naturalmente, si preferisce la forma più snella. Un semplice esempio di sottogruppo di (Z, +) è dato dai numeri pari, cioè {. . . , −4, −2, 0, 2, 4, . . .}, che costituisce un sottogruppo di (Z, +). I numeri pari sono i multipli di 2; si vede facilmente che l’insieme dei multipli di k (k fissato, multipli positivi e negativi) sono un sottogruppo di (Z, +). Se prendiamo una permutazione π ∈ Pn e tutte le permutazioni che da essa si ottengono eseguendo i prodotti π 2 = π ◦ π, π 3 = π 2 ◦ π, etc., vediamo subito che esse sono un sottogruppo di (Pn , ◦). Sia infatti Pπ = {π, π 2 , π 3 , . . .} e osserviamo prima di tutto che esso è finito; infatti Pπ ⊆ Pn per la chiusura della composizione, e quindi card(Pπ ) ≤ n!. Sia ora π r la prima potenza che si ripete; necessariamente, deve essere π r = π, poiché se cosı̀ non fosse avremmo π r = π s , con s ≥ 1. Ma se π −1 è l’inverso di π avremmo π −1 ◦ π r = π −1 ◦ π s , cioè π r−1 = π s−1 , contro l’ipotesi che π r fosse la prima potenza a ripetersi. Se allora π r = π, componendo ancora con π −1 si ha π r−1 = I, l’identità, che pertanto appartiene a Pπ . Finalmente, se π i , π j ∈ Pπ , anche il loro prodotto π i ◦ π j = π i+j sta in Pπ ; in particola- 160 CAPITOLO 5. ALGEBRA re, dato π i , la potenza π r−i−1 è tale che il prodotto π i ◦ π r−i−1 = π r−1 = I, cioè π i e π r−i−1 sono l’inverso l’una dell’altra. Ciò significa che (Pπ , ◦) è un sottogruppo di (Pn , ◦). Esso si dice il (sotto)gruppo ciclico generato da π e si indica con hgi. In P4 il sottogruppo ciclico generato da π = (1234) è costituito dalle permutazioni: g2 H, diciamo g2 h e mostriamo che esso sta anche in g1 H. Usando la precedente espressione per g2 si ha: hki = {· · · , −2k, −k, 0, k, 2k, · · ·}. xφ(m) = xkr = (xr )k = 1k = 1, g2 h = g1 h1 h−1 2 h ∈ g1 H in quanto h1 h−1 2 h ∈ H per la proprietà di chiusura in H. Naturalmente, in modo del tutto analogo, si dimostra che ogni elemento di g1 H sta anche in g2 H e quindi g1 H = g2 H come si voleva. Di conseguenza, 2 3 4 π = (1234), π = (13)(24), π = (1432), π = I. gli insiemi gH determinano, al variare di g, una partiConvenzionalmente, si pone π 0 = I e quindi π r−1 = zione di G (a g diversi, si noti, possono corrispondere π 0 = I. In generale, il minimo numero k per il qua- gH uguali), ogni parte composta dallo stesso numero le un elemento g ∈ G dia g k = e, si dice periodo di elementi, cioè proprio m. Se le parti sono k, di deve perciò avere n = mk. dell’elemento g. Il periodo di π è pertanto r − 1. Se il gruppo G è infinito, può contenere sottogruppi Il caso precedente di Pπ , che ha 4 elementi, è un finiti o infiniti; ad esempio, (Q+ 0 , ·) contiene il sotto- esempio di questo risultato. In generale, possiamo gruppo finito {1, −1} e il sottogruppo infinito com- enunciare il seguente: posto da tutte le potenze (positive e negative) del numero 5: {. . . , 5−2 , 5−1 , 50 = 1, 5, 52 , . . .}. Questo Corollario 5.23 Se (G, ·) è un gruppo finito e g ∈ è, in effetti, il sottogruppo ciclico h5i; nel caso in- G, il periodo di g è un divisore di card(G). finito, il sottogruppo ciclico deve contenere tanto le Prova: Il periodo di g coincide, per quanto detto, potenze positive quanto quelle negative del suo gene- con il numero di elementi del sottogruppo generato ratore. Un gruppo (G, ·) si dice ciclico se esiste un da g, e questo è un divisore di card(G). elemento g ∈ G che genera tutto il gruppo. Ad esemUn esempio importante di questo corollario è dato pio, (Z, +) è generato dal numero 1; si osservi che in dai gruppi (Z∗m , ×), la moltiplicazione intesa modulo questo caso, essendo la somma l’operazione del grupφ(m) elementi e quindi po, le potenze sono in realtà i multipli. Il lettore è m. Tali gruppi contengono ∗ invitato a dimostrare che i sottogruppi di un gruppo ogni elemento x ∈ Zm ha come periodo un numero ciclico sono anch’essi ciclici. Nell’esempio di (Z, +) si che divide φ(m) (diciamo r); si ha pertanto kr = φ(m), per qualche intero k. Ma allora: ha: Una delle più interessanti proprietà dei gruppi finiti un risultato che abbiamo sfruttato parlando dei è data dal seguente: metodi di ciframento a chiave pubblica. I gruppi sono probabilmente la struttura algebrica Teorema 5.22 (di Lagrange) Se (G, ·) è un gruppiù importante, e sono stati studiati in modo molto po finito ed H è un sottogruppo di G, allora il numeapprofondito. Inoltre, sul concetto di gruppo si basaro degli elementi di H è un divisore del numero degli no altre strutture algebriche che si avvicinano magelementi di G. giormente alle strutture numeriche più familiari. PriProva: Sia n = card(G) ed m = card(H); sia g ∈ G ma di tutto, definiamo cosa si intende per “anello”; e consideriamo l’insieme gH composto da tutti i pro- si parte da un insieme A e si suppone che in A siano dotti di g per gli elementi di H; esiste allora una definite due operazioni, indicate convenzionalmente corrispondenza biunivoca tra H e gH data dalla fun- con “+” (l’addizione) e con “·” (la moltiplicazione), zione h → gh, ∀h ∈ H. In effetti, essa è surget- quest’ultima scritta spesso con la semplice giustappotiva per definizione e se non fosse iniettiva dovrem- sizione. La struttura algebrica (A, +, ·) si dice anello mo avere due elementi distinti h1 , h2 ∈ H tali che se (A, +) è un gruppo commutativo, (A, ·) è un mogh1 = gh2 ; se cosı̀ fosse, moltiplichiamo per g −1 ot- noide commutativo e vale la proprietà distributiva del tenendo g −1 gh1 = g −1 gh2 , cioè eh1 = eh2 e h1 = h2 , prodotto rispetto alla somma, cioè: ∀x, y ∈ A si ha contro l’ipotesi. D’altra parte, se g1 , g2 sono due ele- x · (y + z) = x · y + x · z. L’esempio più importante menti di G, gli insiemi g1 H e g2 H o coincidono op- di anello è sicuramente (Z, +, ·), con le usuali operapure sono disgiunti. Supponiamo infatti che g1 H e zioni di somma e prodotto, ma sono anelli anche gli g2 H non siano disgiunti; hanno allora almeno un ele- altri insiemi numerici (Q, +, ·), (R, +, ·), (C, +, ·). Si mento in comune, diciamo g1 h1 = g2 h2 (notare che tratta però di casi un po’ particolari, e per questo ne h1 e h2 possono benissimo essere distinti). Ma questo riparleremo più avanti. Altri anelli importanti sono significa g2 = g1 h1 h−1 2 , ottenuto moltiplicando i due costituiti dai polinomi, con le operazioni che conomembri per h−1 2 . Prendiamo ora un altro elemento di sciamo; essi si indicano con (Z[x], +, ·), (Q[x], +, ·), 161 5.8. ALGEBRA ASTRATTA + 0 1 2 3 4 5 0 0 1 2 3 4 5 1 1 2 3 4 5 0 2 2 3 4 5 0 1 3 3 4 5 0 1 2 4 4 5 0 1 2 3 5 5 0 1 2 3 4 · 0 1 2 3 4 5 0 0 0 0 0 0 0 1 0 1 2 3 4 5 2 0 2 4 0 2 4 3 0 3 0 3 0 3 4 0 4 2 0 4 2 5 0 5 4 3 2 1 Tabella 5.2: Somma e prodotto in Z6 e cosı̀ via. Un’altra classe importante di anelli é data dagli (Zm , +, ·), dove, questa volta, la somma e il prodotto vanno intesi modulo m; poiché questi anelli sono finiti, le operazioni possono essere riassunte in due tabelline; riportiamo nella Tabella 5.2 il caso di (Z6 , +, ·) e il lettore è invitato a scrivere almeno quelle relative ad m = 5. Un caso particolare di anello è il seguente; sia U un insieme e sia P = P(U ) l’insieme delle sue parti, cioè dei suoi sottoinsiemi. In P si consideri l’operazione di differenza simmetrica A∆B = (A ∪ B) \ (A ∩ B) = (A \ B) ∪ (B \ A) (v. Capitolo 1); tale operazione è chiusa e associativa, come il lettore vorrà verificare con i diagrammi di Venn. Si ha inoltre: A∆∅ = ∅∆A = A, qualunque sia A ∈ P, e questo ci dice che ∅ è l’identità rispetto a ∆. Si ha anche A∆A = ∅ ed A∆B = B∆A, per cui (P, ∆) è un gruppo commutativo. Consideriamo ora l’operazione di intersezione in P; rispetto a tale operazione P è un monoide e si ha: A ∩ (B∆C) = (A ∩ B)∆(A ∩ C), (qualunque esso sia), si ottiene 0 = x · 0. In modo analogo si prova 0 = 0 · x. Un elemento di A può avere o può non avere un inverso rispetto al prodotto; in (Z6 , +, ·) gli elementi 1 e 5 hanno un inverso, come si vede dalla Tabella 5.2, mentre non lo hanno 2, 3 e 4. Gli elementi muniti di inverso si dicono unità dell’anello; lo 0 non può essere un’unità poiché, come abbiamo appena visto, 0 · x dà sempre 0, mentre se x fosse l’inverso di 0 si dovrebbe avere 0 · x = 1. D’altra parte, 1 è per definizione una unità, e questo ci fa capire che, in un anello, lo 0 e l’1 non possono mai coincidere (eccetto nell’anello banale, quello composto dal solo elemento 0: riflettere un attimo). Un elemento che, come 2, 3, 4 in Z6 , dà come prodotto 0 anche quando sia moltiplicato per un numero diverso da 0, si dice un divisore dello zero: poiché lo 0 non può avere un inverso rispetto alla moltiplicazione, cosı̀ non lo possono avere nemmeno i divisori dello zero; pertanto, la presenze in un anello di divisori dello zero fa sı̀ che certe semplificazioni, legate a moltiplicare per l’inverso di un elemento (come siamo abituati), non si possano fare. Ha allora importanza il concetto di dominio di integrità, col quale termine si indica un anello privo di divisori dello zero. Ancora (Z, +, ·), (Z[x], +, ·), (R[x], +, ·) sono domini di integrità nei quali non tutti gli elementi diversi da 0 sono unità. Ad esempio, in Z solo 1 e −1 sono unità, mentre in R[x] sono unità tutte le costanti diverse da 0, cioè, in pratica, R \ {0}. Vediamo allora dove si manifesta l’importanza dei domini di integrità. Si dice campo o corpo ogni anello nel quale tutti gli elementi, tranne lo 0, sono unità, cioè ogni elemento diverso da 0 possiede un inverso (rispetto alla moltiplicazione). Sono campi infiniti (Q, +, ·), (R, +, ·), (C, +, ·), ma esistono anche molti campi finiti; tutti gli (Zp , +, ·) (somma e prodotto modulo p), con p numero primo sono campi. Infatti, Zp \ {0} = Z∗p , che come sappiamo è un gruppo rispetto alla moltiplicazione, il che vuol proprio dire che ogni elemento non nullo ha un inverso. Il più importante di questi campi è Z2 = {0, 1} (toh! chi si incontra di nuovo!), che oltre ad essere un campo è anche un anello Booleano. Col significato 1 =“vero” e 0 =“falso” lo abbiamo già visto in azione nel calcolo delle proposizioni e dei predicati. I campi sono la struttura algebrica che compendia le proprietà degli insiemi numerici più ampi, e cioè Q, R, C; da qui la loro fondamentale importanza. Certi campi si costruiscono a partire dai domini di integrità, che perciò costituiscono dei quasi-campi: ancora da verificare con i diagrammi di Venn. La conclusione è che (P, ∆, ∩) è un anello, detto anello Booleano. Il lettore è invitato a consultare le Tabelle 1.1, 1.3, 2.5 e la fine della Sezione 2.7 sul Massimo Comun Divisore per trovare altri esempi di anelli Booleani. Quando si parla di anelli, l’identità rispetto alla somma si indica con 0 e quella relativa al prodotto con 1. Formalmente, si ha x · 0 = 0 · x = 0, qualunque Teorema 5.24 Sia D un dominio di integrità e sia sia l’elemento x ∈ A; infatti: D l’insieme delle coppie di elementi di D il cui secondo elemento non sia 0. La relazione (x, y) ≡ (x′ , y ′ ) x · 0 = x · (0 + 0) = x · 0 + x · 0, valida se e solo se xy ′ = x′ y, è una relazione di equidove si sono sfruttate le proprietà dell’anello; som- valenza su D. Sia allora [x, y] la classe di equivalenza mando ora ai due membri estremi l’opposto di x · 0 di (x, y) ed F l’insieme di tali classi di equivalenza; 162 CAPITOLO 5. ALGEBRA se definiamo su F le operazioni: [x, y] + [x′ , y ′ ] [x, y] × [x′ , y ′ ] = = [xy ′ + x′ y, yy ′ ] [xx′ , yy ′ ] allora tali operazioni sono indipendenti dagli elementi presi a rappresentare le classi ed (F, +, ×) è un campo. Prova: La prova di questo teorema, in realtà, è già stata fatta quando abbiamo costruito il campo (Q, +, ·) a partire dal dominio di integrità (Z, +, ·) e il lettore potrà ripetere i passi là effettuati astraendo dal caso numerico e concentrandosi sulle sole proprietà formali definite in D, D ed F. Partendo da (Z[x], +, ·) e da (R[x], +, ·) si costruiscono i due campi delle funzioni razionali fratte su Z e su R, che si indicano rispettivamente con (Z(x), +, ·) e (R(x), +, ·). Nella sezione sui numeri complessi abbiamo visto un altro metodo per costruire un tipo diverso di campi, il più importante dei quali è certamente il campo dei numeri complessi. Esso consiste nell’aggiungere uno (o più) elementi algebrici al campo, in modo da rispettarne la definizione. Capitolo 6 Geometria Euclidea pubblicati testi che rivedevano l’impostazione di Euclide secondo i nuovi criteri, anche se è l’impianto Euclideo quello che si studia a tutt’oggi. Mandai il triangolo equilatero a Treviranus. Sapevo che lei avrebbe aggiunto il punto che mancava: il punto che determinava il rombo perfetto, il punto che prefissava il luogo dove un’esatta morte l’attendeva. 6.1 J. L. Borges Finzioni Secondo Aristotele la Geometria (cioè la misurazione dei terreni) nacque in Egitto, dove ogni anno, dopo le inondazioni del Nilo, era necessario ristabilire i confini dei campi, assegnare un nuovo terreno a chi, eventualmente, avesse perduto il proprio, invaso in modo permanente dalle acque. Anche i Babilonesi coltivarono la Geometria, un po’ per ragioni analoghe, ma assai di più per il loro interesse all’Astronomia. Tuttavia, nessuno di questi popoli andò più in là delle considerazioni pratiche ed elementari, necessarie ai loro intendimenti. Ad esempio, nessuno sentı̀ mai il bisogno di dimostrare alcunché o di speculare in forma astratta. Lo studio teorico della Geometria cominciò in Grecia e uno dei precursori fu Talete (624 – 545 a.C.), il primo dei Sette Savi. Con i Pitagorici si affermò anche il concetto di dimostrazione e al tempo di Platone (427 – 347 a.C.), che fu un buon cultore di Geometria, le conoscenze teoriche erano abbastanza ampie da costituire un corpus di notevole rispetto. Fu però circa un secolo dopo che la Geometria trovò la sua sistemazione, in un certo senso definitiva, con l’opera di Euclide (sec. III a.C.) “Elementi”. Certo, gli “Elementi” non costituiscono la fine dello sviluppo della Geometria, che troverà in Archimede (287 – 212 a.C.) e Apollonio (262 – 180 a.C.) due altri grandi. Le scoperte si sono protratte fino ai nostri giorni, ma quel libro mostrò come si costruisce una teoria matematica, partendo dagli assiomi e edificando man mano un insieme organico di conoscenze (teoremi e problemi) logicamente fondati e perciò incontrovertibili. Gli “Elementi” di Euclide sono stati forse il libro più letto e più amato dopo la Bibbia e hanno costituito la base dello studio della Geometria fino al 1800. Con la revisione della Logica operata in quel periodo (che portò alla formulazione delle Geometrie non Euclidee), cominciarono a venir Le basi della Geometria Euclide fonda la Geometria su 10 verità, che egli reputa evidenti di per sé, e che quindi non richiedono alcuna dimostrazione. Egli le divide in 5 assiomi (che, ricordiamo, secondo Aristotele sono verità generali, indipendenti dal sapere geometrico) e in 5 postulati (cioè verità specifiche della materia in oggetto, la Geometria): Assiomi o nozioni comuni: 163 1. oggetti uguali a uno stesso oggetto sono uguali tra loro; 2. se oggetti uguali vengono aggiunti ad oggetti uguali, gli oggetti risultanti sono uguali tra loro; 3. se oggetti uguali vengono sottratti da oggetti uguali, gli oggetti risultanti sono uguali tra loro; 4. oggetti che si possono sovrapporre e far coincidere sono uguali tra loro; 5. l’intero è maggiore di ciascuna delle sue parti proprie. Postulati: 1. per due punti qualsiasi si può tracciare una retta; 2. ogni segmento si può prolungare indefinitamente; 3. su un piano si può tracciare una circonferenza di centro e raggio arbitrari; 4. tutti gli angoli retti sono uguali; 5. se due rette formano, con una retta che le interseca, da una stessa parte di questa, due angoli la cui somma è minore di due angoli retti, allora le due rette, prolungate all’infinito, si incontrano proprio da tale parte. 164 CAPITOLO 6. GEOMETRIA EUCLIDEA Quando Euclide parla di punti, rette e piani, egli ha in mente precise astrazioni degli analoghi concetti concreti e crede che tali astrazioni siano non un semplice modello della realtà, ma siano davvero la realtà, la sostanza rivelata del fenomeno concreto. Quindi, gli assiomi servono solo ad evitare il regressum ad infinitum che si creerebbe se tentassimo di definire tutti i concetti, il che richiederebbe di introdurne altri, e poi ancora altri, e cosı̀ via. Ma, a parte questo, gli assiomi sono veri in senso semantico, cioè sono veri nella realtà. Con l’affermarsi della Logica moderna questa idea è venuta a cadere e gli assiomi della Geometria sono stati rivisitati, per far loro inglobare la definizione implicita degli enti geometrici (punto, retta, piano) e delle loro reciproche relazioni. Volendo vedere le cose da un punto di vista un po’ diverso, mentre nella Geometria di Euclide le figure e le costruzioni geometriche hanno un ruolo fondamentale nello sviluppo della teoria, nelle formulazioni moderne deve essere possibile derivare tutti i teoremi in modo puramente formale, cioè utilizzando solo i simboli (e i modi di metterli insieme) definiti dagli assiomi o che man mano si introducono partendo da quelli. L’assiomatizzazione più famosa della nuova Geometria è quella di Hilbert, che elenca ben ventitré postulati. Diamo qui una versione semplificata con gli assiomi divisi in gruppi: • Assiomi di incidenza 1. due punti distinti, presi a piacere, appartengono a una retta e a una soltanto; 2. ad ogni retta appartengono almeno due punti; 3. esistono due punti che non appartengono alla stessa retta; 8. dati un segmento AB e una semiretta r di origine C, esiste un unico punto D della semiretta r tale che AB sia congruente a CD (e si scrive AB = CD); 9. Se AB = CD ed AB = EF allora CD = EF ; ogni segmento è congruente a sé stesso; 10. siano dati tre punti A, B, C su una retta, tali che B giaccia tra A e C, e altri tre punti D, E, F su un’altra retta, tali che E giaccia tra D ed F . Se AB = DE e BC = EF , allora AC = DF ; • Assiomi di congruenza tra angoli b e una semiretta DF , 11. dato un angolo B AC esiste un’unica semiretta DE, da una parte b è congruente fissata di DF , tale che B AC b (e si scrive B AC b = E DF b ). a E DF 12. dati tre angoli α, β, γ, se α = β e α = γ, allora β = γ; ogni angolo è congruente a sé stesso; 13. dati due triangoli ABC e DEF , si supponga che sia AB = DE, AC = DF e b = E DF b . Allora i due triangoli sono B AC b = DEF b congruenti, cioè BC = EF , ABC b b e ACB = DF E. • Assioma della parallela 14. data una retta r e un punto P fuori di essa, per P passa una e una sola parallela ad r. • Assioma di continuità o di Archimede 15. dati due segmenti AB e CD, esiste sempre un multiplo di AB che sia maggiore di CD. Proprio per la sua astrattezza, la formulazione di Hilbert va bene da un punto di vista sistematico, ma non certo didattico e fa parte di quella che si chiama 4. se il punto B giace tra A e C, allora A, B, C la Matematica elementare considerata da un punto sono tre punti distinti di una retta, e B di vista superiore. Essa non sviluppa il cosiddetto senso geometrico e si preferisce insegnare seguendo giace tra C ed A; l’impostazione euclidea, anche se rivista e aggiorna5. dati due qualsiasi punti A e B, si può trovata. Anche noi ci atterremo a questa regola, e vedremo re un terzo punto C tale che B giaccia tra soprattutto la Geometria del piano; lasciamo all’ultiA e C; ma sezione del capitolo quelle nozioni di Geometria 6. dati tre punti su una retta, ne esiste uno e dello spazio che riteniamo possano essere utili: ciò, lo uno solo che giace tra i restanti due; riconosciamo, è un difetto, poiché è con questo tipo 7. siano A, B, C tre punti non allineati e sia r di Geometria che si può coltivare il nostro senso spauna retta che non contiene nessuno di que- ziale, tanto utile anche quando si affrontano problemi sti tre punti. Se r contiene un punto D che di Geometria analitica a più di due dimensioni. La costruzione della Geometria richiede l’introdugiace tra A e B, allora r deve anche contenere un punto che giaccia tra A e C o tra zione di un certo numero di concetti, derivati dagli enti primitivi di punto, retta e piano, ma indispensaB e C; bili per poter progredire fissando la nostra mente sulle • Assiomi di congruenza tra segmenti cose importanti e, di conseguenza, lasciando perdere • Assiomi d’ordine 165 6.1. LE BASI DELLA GEOMETRIA costruzione di opportune figure; la validità di tali costruzioni è garantita dai teoremi, ma non è raro che la verità di un teorema sia dimostrata per mezzo di un’opportuna costruzione. Per questo, la Geometria euclidea mescola in modo indissolubile le dimostrazioni formali e le costruzioni geometriche; queste ultime sarebbero formalmente proibite nell’impostazione moderna di Hilbert. Le costruzioni geometriche vengono effettuate con due strumenti: la riga non graduata e il compasso. La riga serve per tracciare la retta che unisce due punti A B O (o, almeno, parte di tale retta); il compasso serve a tracciare le circonferenze, gli archi di circonferenza e a Si noti che molti assiomi fanno uso del concetto riportare gli estremi di un segmento. Per questo, si fa di segmento; questo significa semplicemente che gli centro su uno dei due estremi e si regola il compasso assiomi non si danno prima dello sviluppo della teo- in modo che l’altra delle sue punte coincida col seconria, ma le due cose procedono in parallelo, con l’unica do estremo. In questa maniera è possibile traslare il avvertenza che l’uso di un concetto non ne preceda segmento, poiché l’ampiezza o apertura del compasso la definizione. Questa stessa osservazione vale per il può essere riportata ovunque si voglia, a partire da concetto di semiretta; data una retta r e un punto un punto prestabilito e/o su una retta assegnata (si O su di essa, si dice semiretta ciascuno dei due trat- veda il terzo postulato di Euclide). Ciò permette di ti infiniti che si dipartono da O, detto origine della dare un definizione precisa: due segmenti sono uguasemiretta. In modo analogo, dato un piano π e una li se e solo se, riportando il primo sul secondo (cioè retta r su di esso, si dice semipiano ciascuna delle puntando su uno dei due estremi) l’altra punta del parti di piano in cui r divide π. Si dice angolo (v. compasso si può far coincidere col secondo estremo. Figura 6.1 ciascuna delle parti di piano compresa fra s s′ due semirette che hanno l’origine O in comune; tale C C′ origine si dice il vertice dell’angolo. Infine, tre punti si dicono allineati se giacciono su una stessa retta. le cose meno rilevanti: sono proprio le definizioni che, operando una scelta, danno uno specifico indirizzo alla strada che vogliamo percorrere. Prima di tutto, si dice segmento il tratto di retta compreso tra due punti A e B e che appartengono alla retta stessa; i due punti A e B si dicono estremi del segmento. Il primo postulato di Euclide e il primo assioma di Hilbert ci dicono che, dati due punti qualsiasi A e B, esiste sempre il segmento AB. A r r A O B ′ A r′ B′ Figura 6.2: Traslazione di un angolo B s Figura 6.1: Definizione dell’angolo Di fondamentale importanza in tutta la Geometria è il concetto di uguaglianza; qui siamo interessati all’uguaglianza tra segmenti e tra angoli; vedremo più avanti l’uguaglianza tra poligoni, specie tra triangoli, concetto estremamente importante in tutta la Geometria euclidea. Come afferma il quarto assioma di Euclide, i Greci ritenevano uguali due figure che, sovrapposte, vengono a coincidere. In termini moderni, noi diciamo che l’uguaglianza si conserva per traslazioni e rotazioni. Tuttavia, questa idea intuitiva deve essere specificata meglio e rigorosamente, e ciò ci permette di introdurre le costruzioni geometriche. I problemi di Geometria hanno soluzione in termini di Solo un po’ più complessa è la traslazione di un angolo, che mostriamo nella Figura 6.2. Si supponga di b e lo si voglia traslare a partire dalavere l’angolo rAs ′ la retta r con vertice in A′ . Con centro in A e raggio arbitrario si traccia l’arco BC e, con la stessa apertura e centro in A′ , si disegna una circonferenza che taglia r′ in B ′ . Ora, si apre il compasso con ampiezza BC e facendo centro in B ′ si traccia un arco che intersechi la precedente circonferenza in C ′ . Unendo, mediante la retta s′ , i punti A′ e C ′ si ha, per costruc′ s′ è la traslazione dell’angolo zione, che l’angolo r′ A di partenza. Osserviamo esplicitamente che l’angolo potrebbe essere riportato anche dalla parte di sotto, ottenendo un angolo speculare, ma comunque uguale a quello di partenza (sarebbe semplicemente ruotato di un angolo pari all’angolo stesso, a meno che non si vogliano identificare le due rette r ed r′ . Dati due segmenti AB e CD, si definisce la loro somma in questo modo: si prolunga il segmento AB 166 CAPITOLO 6. GEOMETRIA EUCLIDEA dalla parte di B e si riporta CD su tale semiretta a partire da B e in modo che D non cada tra A e B: il segmento AD è la somma richiesta. Il confronto tra AB e CD si fa riportando CD sulla retta AB a partire da A e nel verso in cui si trova B: se D cade tra A e B allora AB è maggiore di CD, altrimenti (se i due segmenti non sono uguali) AB è minore di CD. Infine, se CD è minore di AB, la differenza tra AB e CD si trova procedendo come per il confronto e considerando infine il segmento DB. B≡C A A≡C D D B secondo m di CD. La frazione n/m si dice il rapporto fra AB e CD. All’inizio, i Greci pensarono che due segmenti qualsiasi fossero comunque commensurabili tra di loro, ma poi Pitagora scoprı̀ che il lato e la diagonale del quadrato non possono essere tali. Dovettero perciò introdurre il concetto di segmenti incommensurabili e si disse rapporto fra i segmenti AB e CD il numero (che oggi diciamo “reale”) che si ottiene eseguendo il seguente procedimento: Algoritmo 6.1 (Rapporto fra due segmnti) Ingresso: due segmenti AB e CD. Uscita: il rapporto r fra AB e CD. 1. si determina il massimo multiplo r di CD che sia minore o uguale ad AB; 2. se AB = rCD si esce con r come risultato; A ≡ A0 A1 A2 A3 A4 B ≡ A5 3. altrimenti, si pone U V = CD, P Q = AB −rCD e j = 1; 4. si divide U V in dieci parti uguali e sia U ′ V ′ una di tali parti; U1 U2 U3 5. si trova il massimo multiplo dj di U ′ V ′ che non superi P Q; U4 U5 6. si pone r := r + dj /10j ; 7. se P Q = dj U ′ V ′ si esce con r come risultato; Figura 6.3: Divisione di un segmento in parti uguali Nota 6.1 Un segmento AB può essere facilmente diviso in n parti uguali mediante la costruzione che mostriamo nella Figura 6.3. Da A disegniamo una semiretta AP e su di essa riportiamo n repliche consecutive di un segmento arbitrario; siano U1 , U2 , . . . , Un i secondi vertici di tali segmenti; si unisca Un con B e si traccino le parallele ad Un B che passano per ciascuno degli Ui e incontrano il segmento AB nel punto Ai (i = 1, 2, . . . , n − 1). Posto A0 ≡ A e An ≡ B, per il Teorema 6.16 di Talete, i vari segmenti A0 A1 , A1 A2 , . . . , An−1 An sono tutti uguali. 8. altrimenti, si pone U V := U ′ V ′ , P Q := P Q − dj U ′ V ′ , j := j + 1 e si torna al passo 4. In modo analogo si definiscono la somma, il confronto e la differenza tra due angoli (v. Figura 6.4). b e A′ O c′ B ′ , si trasla quest’ultimo Dati due angoli AOB in modo che la semiretta O′ A′ venga a coincidere con la semiretta OB cosı̀ che O′ B ′ sia dalla parte opposta b ′ cosı̀ otdi OA rispetto a OB ≡ O′ A′ ; l’angolo AOB ′ ′ b +A O c′ B . Per il confronto e tenuto è la somma AOB c′ B ′ in modo da far la differenza, invece, si trasla A′ O ′ ′ coincidere O A con OA e l’altra semiretta O′ B ′ sia dalla stessa parte di OB; naturalmente, se ruotando da OA in senso antiorario si trova O′ B ′ prima di c′ B ′ è minore di AOB, b mentre Il segmento AB si dice multiplo secondo m del seg- OB, allora l’angolo A′ O mento CD se e solo se AB può essere suddiviso in è maggiore in caso contrario (naturalmente, se i due m parti tutte uguali a CD; in tal caso, si dice an- angoli non sono uguali, e cioè non si sovrappongono b è che che CD è un sottomultiplo secondo m di AB. Si esattamente). La differenza è definita quando AOB scrive AB = mCD o anche CD = AB/m. Due seg- maggiore di A′ O c′ B ′ , e il risultato è costituito dall’anmenti AB e CD si dicono commensurabili se esistono golo B ′ OB. b Naturalmente, i multipli di un angolo si due numeri interi m ed n tali che AB risulta essere il definiscono di conseguenza. multiplo secondo n del sottomultiplo secondo m del Definita cosı̀ come sovrapponibilità l’uguaglianza segmento CD. Si scrive: tra segmenti e tra angoli, nonché le operazioni tra tan li enti, possiamo passare al concetto di misura, stretAB = CD; m tamente legato a quello di uguaglianza. Si consideri, si osservi che in tal caso il multiplo secondo m di AB una volta per tutte, un segmento U V , che indichereè uguale al multiplo secondo n di CD, ovvero il sot- mo genericamente con u e che si dice l’unità di misutomultiplo secondo n di AB è uguale al sottomultiplo ra; si definisce allora come misura del segmento AB 167 6.1. LE BASI DELLA GEOMETRIA B B′ A O B′ O O′ B A A′ B O B′ A Figura 6.4: Operazioni sugli angoli analogamente, il primo multiplo è 100 volte l’unità di misura. Il primo sottomultiplo dell’unità di volume è 1/1000 dell’unità stessa, e il primo multiplo è 1000 volte più grande. Per ragioni pratiche si considerano anche gli altri multipli e sottomultipli rispetto a 10, ma essi creano abbastanza confusione. Ad esempio, il multiplo secondo 10 dell’unità √ di superficie è un quadrato che ha il lato pari a 10u, cioè circa 3.16227766 volte l’unità di lunghezza u. Ho visto persone di buona cultura tentennare di fronte a un fatto del genere! Anche per gli angoli devono valere le consuete proprietà delle misure. Per essi sembra esistere una misura naturale, cioè che non dipende dalla scelta dell’unità di misura. Infatti, l’angolo giro ha una rilevanza tutta propria, essendo l’angolo più grande che si possa considerare in modo naturale. Certo, possiamo girare e rigirare intorno al vertice di un angolo quante volte vogliamo, ma si torna sempre a un angolo compreso tra l’angolo nullo e quello giro. Arbitraria è invece la suddivisione dell’angolo giro in sottomultipli; seguendo una tradizione risalente ai Babilonesi, l’angolo giro si suddivide in 360 parti, assumendo una di queste parti come unità di misura standard: il grado; esso si indica con un circoletto ad esponente del valore. Quindi, la misura di un angolo giro è di 360◦ , e 180◦ è quella dell’angolo piatto. Essendo 360 il massimo valore della misura di un angolo, multipli del grado non si prendono in considerazione. Vi sono invece i sottomultipli che, sempre per tradizione, non si conformano alla base 10: (rispetto all’unità di misura u) il rapporto tra AB ed U V ; la misura del segmento AB si dice anche la sua lunghezza e spesso si denota con AB, sottintendendo l’unità di misura, che si suppone fissata. E’ bene ribadire che il segmento U V è arbitrario e non esiste un’unità di lunghezza preferibile ad un’altra. Nella pratica si usa il metro definito come la lunghezza di una certa barra di platino-iridio conservata al Bureau International de Poids et Mesures di Sèvres. Originariamente, nel 1791, il metro doveva essere la quarantamilionesima parte del meridiano terrestre, ma la misurazione di questo si è rivelata alquanto aleatoria; oggi si preferisce una definizione più operativa, che non obblighi a recarsi a Sèvres ogni volta che si debba controllare la precisione di uno strumento di misura. Si definisce allora il metro come la distanza percorsa dalla luce nel vuoto in un intervallo 1. si dice primo la sessantesima parte del grado e si di tempo pari a 1/299. 792. 458 secondi. Ricordiamo indica con un apice dopo il valore; infatti che, secondo la Fisica, la velocità della luce è una costante universale; il problema, semmai, è di definire l’unità di tempo, cioè il secondo. Naturalmente, una volta definita l’unità di misura, sono automati2. si dice secondo la sessantesima parte del primo e camente determinati i suoi multipli e sottomultipli, si indica con un doppio apice dopo il valore. sui quali pertanto non stiamo a insistere. Stabilita l’unità di lunghezza, le unità di superficie e di volume risultano conseguenza di quella; Un angolo di 22 gradi, 12 primi e mezzo si indica: anticipando la definizione di quadrato e di cubo: 22◦ 12′ 30′′ . Dopo i secondi, si torna alla suddivisione decimale, con decimi, centesimi, millesimi, etc. del 1. si dice unità di misura di superficie il quadrato secondo. Come vedremo quando tratteremo la tri2 di lato u; l’unità stessa si denota come u ; gonometria, c’è una misura degli angoli meno artifi2. si dice unità di misura di volume il cubo di lato ciosa di questa; essa assume come unità di misura il radiante, definito come l’angolo che sottende un arco u; l’unità di misura stessa si denota con u3 . di circonferenza uguale al raggio della circonferenza I multipli e sottomultipli si ottengono moltiplican- stessa. Il radiante, quindi, risulta indipendente daldo o dividendo opportunamente le varie dimensioni l’unità di lunghezza usata per la circonferenza, come del quadrato e del cubo; pertanto il primo sottomul- ci aspettiamo che debba essere. Per il momento, tuttiplo (secondo 10) dell’unità di superficie si ottiene tavia, in questa parte che riguarda la Geometria Eudividendo due lati consecutivi in 10 parti ciascuna, e clidea, limiteremo le nostre considerazioni alla misura perciò tale sottomultiplo è 1/100 dell’unità di misura; tradizionale in gradi, primi e secondi. 168 6.2 CAPITOLO 6. GEOMETRIA EUCLIDEA Perpendicolarità e parallelismo Due concetti molto importanti sono quelli di “rette perpendicolari” e di “rette parallele”; su di essi si basano moltissimi sviluppi della Geometria Euclidea, che dedica loro due postulati, il quarto e il quinto. Cominciamo col quarto postulato, che può essere enunciato nel modo seguente: tutti gli angoli retti sono uguali. Naturalmente, affinché questa affermazione abbia senso, occorre aver definito l’angolo retto; allora, la seguente definizione ha il duplice scopo di farci intendere cosa è un angolo retto e quand’è che due rette sono perpendicolari tra loro: Definizione 6.1 Se due rette, incontrandosi, formano quattro angoli uguali, si dicono perpendicolari; ciascuno dei quattro angoli si dice un angolo retto. Il quarto postulato ci assicura che, qualunque coppia di rette perpendicolari si consideri, gli angoli ottenuti sono non solo uguali tra di loro, ma uguali a quelli di ogni altra coppia di rette perpendicolari. Questo ci permette di affermare che un angolo piatto è la somma di due angoli retti e un angolo giro è la somma di quattro angoli retti. Secondo le convenzioni introdotte nella precedente sezione sulla misurazione degli angoli, possiamo dire che un angolo retto misura 90◦ , come quarta parte dell’angolo giro. La terminologia relativa agli angoli è ben nota; sia b l’angolo considerato: AOB • piatto: le due semirette OA ed OB sono allineate, cioè sono l’una il prolungamento dell’altra; • giro: le due semirette OA ed OB coincidono; • convesso: un angolo minore di un angolo piatto; Nota 6.2 Esistono vari metodi per costruire un angolo retto; qui diamo per esteso un algoritmo che sfrutta poco spazio, come mostrato nella parte sinistra della Figura 6.5: Algoritmo 6.2 (Angolo retto) Ingresso: una semiretta di origine A; Uscita: la semiretta per A perpendicolare alla semiretta data; 1. se r è la semiretta assegnata, con centro in A e con raggio arbitrario si disegna un arco di circonferenza che taglia r in B; 2. con centro in B e con lo stesso raggio di prima si disegna un arco che taglia il precedente in C; 3. con centro in C e con lo stesso raggio di prima si disegna un arco che taglia il primo in D; 4. con centro in D e ancora lo stesso raggio si traccia un arco che taglia il precedente in E; 5. la semiretta per A passante per E è perpendicolare ad r. La dimostrazione che questa costruzione è corretta è facile ed è lasciata allo studente dopo che avrà appreso (se non li conosce già) i teoremi delle prossime sezioni di questo capitolo. Come talvolta accade, le costruzioni geometriche richiedono conoscenze che non vanno in parallelo con l’esposizione sistematica dei vari concetti. Un’altra costruzione è mostrata nella parte destra della Figura 6.5, e il lettore la potrà schematizzare sotto forma di algoritmo come semplice esercizio: si prolunga la semiretta r oltre A, e con centro in A e raggio arbitrario si disegna una semicirconferenza che taglia r e il suo prolungamento in B e in C; con centro in B e C e raggio superiore al precedente, si disegnano due archi che si incontrano in D; la retta che congiunge A con D è perpendicolare ad r. E D • concavo: un angolo maggiore di un angolo piatto; • acuto: un angolo minore di un angolo retto; • ottuso: un angolo maggiore di un angolo retto (ma minore di un angolo giro). Inoltre, dati due angoli, essi si dicono: • opposti al vertice se ciascuno di essi è determinato dal prolungamento delle semirette dell’altro; due angoli opposti al vertice sono uguali; • complementari: due angoli la cui somma sia uguale ad un angolo retto; • supplementari: due angoli la cui somma sia uguale ad un angolo piatto; • esplementari: due angoli la cui differenza sia un angolo piatto. D C r A B r C A B Figura 6.5: Costruzioni dell’angolo retto Vale la pena di ricordare, infine, il metodo egizio, cosı̀ detto perché adottato dagli antichi Egizi (e non solo da loro) (v. Figura 6.6. A partire da A si riporta quattro volte un segmento arbitrario P Q, determinando cosı̀ il punto B. Con centro in A si traccia un arco di raggio tre volte P Q e con centro in B un arco di raggio cinque volte P Q. Se C è il punto di intersezione dei due archi, la retta AC è perpendicolare ad AB per il Teorema di Pitagora, che dà: 32 + 42 = 52 . 6.2. PERPENDICOLARITÀ E PARALLELISMO C A P Q B Figura 6.6: Il metodo Egizio Il concetto di parallelismo è legato al quinto postulato di Euclide e richiede di aver già introdotto la perpendicolarità e l’angolo retto. Il postulato fa uso, quando parla di angoli interni, di una terminologia specifica che bisogna conoscere: 169 Dal quinto postulato si deduce che se r ed s formano con t coppie di angoli la cui somma è uguale a due retti, esse, anche se prolungate indefinitamente, non si incontrano mai. Da questa osservazione intuitiva, discende la pseudo-definizione che comunemente si dà di rette parallele: due rette si dicono parallele se, prolungate indefinitamente, non si incontrano mai. Questa non può essere una vera definizione, perché prolungando due rette possiamo sı̀ determinare se esse si incontrano, ma è impossibile stabilire che esse non si incontrano; infatti, una cosa del genere richiederebbe uno spazio e un tempo infiniti che, di solito, non abbiamo a disposizione. Il senso del quinto postulato di Euclide, quindi, è di fornire un criterio “finito” per stabilire se due rette sono o non sono parallele: si tagliano con una trasversale e si misurano gli angoli; se la somma di due angoli interni è uguale a due retti, le rette assegnate sono parallele, altrimenti non lo sono e, in tal caso, dalla somma dei due angoli sappiamo da quale parte si incontreranno. Quindi la definizione corretta è: due rette sono parallele se, tagliate con una trasversale, formano angoli coniugati interni la cui somma è uguale a due angoli retti. A questo punto possiamo enunciare il famoso e importante risultato: Definizione 6.2 Siano r, s una coppia di rette e sia t una trasversale che le taglia. Gli angoli per i quali la semiretta della trasversale non incontra l’altra retta della coppia, si dicono esterni; gli altri si dicono interni. Le coppie di angoli che stanno dalla stessa parte rispetto a t e dalla stessa parte rispetto ad r ed s si dicono corrispondenti; essi sono sempre uno interno e uno esterno. Le coppie di angoli che stanno Teorema 6.1 Due rette r ed s sono parallele se e da parti opposte rispetto a t e da parti opposte rispet- solo se, tagliandole con una trasversale, si verifica to ad r ed s si dicono alterni; quindi una coppia può una delle seguenti condizioni: essere costituita da angoli alterni esterni o da angoli 1. angoli alterni (interni o esterni) sono uguali; alterni interni. Infine, le coppie di angoli che stanno 2. angoli corrispondenti sono uguali; dalla stessa parte rispetto a t, ma da parti opposte rispetto ad r ed s si dicono coniugati; anche in que3. angoli coniugati (interni o esterni) sono supplesto caso una coppia può essere costituita da angoli mentari. coniugati interni o angoli coniugati esterni. Prova: Se r ed s sono parallele, per definizione vale la proprietà 3) relativamente agli angoli coniugati t interni; i corrispondenti angoli coniugati esterni sono γ β r supplementari agli angoli coniugati interni e quindi devono essere supplementari tra di loro. Dei due anδ α goli corrispondenti, uno è uguale e l’altro è supplementare ad uno di due angoli coniugati, e quindi i ′ ′ s δ α due angoli sono uguali tra loro. La stessa osservaγ′ β′ zione vale per gli angoli alterni, che perciò devono anch’essi essere uguali tra di loro. Figura 6.7: Rette parallele tagliate da una trasversale Le tre condizioni costituiscono altrettanti criteri di parallelismo e come tali verranno usate ogni volta che Schematicamente, la situazione può essere rappre- dovremo ragionare su rette parallele. Ad esempio, disentata dalla Figura 6.7, nella quale α, α′ , δ, δ ′ sono mostriamo questa celeberrima conseguenza del quinto angoli interni e β, β ′ , γ, γ ′ sono angoli esterni. Il qua- postulato: dro completo è dato dalla Tabella 6.1, nella quale Teorema 6.2 Data una retta r ed un punto P fuori alt, cor e conj stanno per “alterni”, “corrispondendi essa, per P passa una ed una sola parallela ad r. ti” e “coniugati”; per gli angoli che non sono in alcuna di queste relazioni abbiamo usato il simbolo “=” Prova: Si consideri la Figura 6.8, a sinistra. Da P quando sono uguali e il simbolo “⊘” quando risultano si costruisca la perpendicolare t ad r e quindi si cosupplementari (vedere il successivo Teorema 6.1). struisca la retta s perpendicolare a t e passante per P . 170 CAPITOLO 6. GEOMETRIA EUCLIDEA α α′ δ δ′ γ γ′ β β′ α = conj ⊘ alt = ⊘ ⊘ cor α′ conj = alt ⊘ ⊘ = cor ⊘ δ ⊘ alt = conj ⊘ cor = ⊘ δ′ alt ⊘ conj = cor ⊘ ⊘ = γ = ⊘ ⊘ cor = conj ⊘ alt γ′ ⊘ = cor ⊘ conj = alt ⊘ β ⊘ cor = ⊘ ⊘ alt = conj β′ cor ⊘ ⊘ = alt ⊘ conj = Tabella 6.1: Corrispondenza tra angoli s P S′ P S s′ t C r b Q R A B Figura 6.8: Rette parallele Per il teorema precedente, le rette r ed s sono parallele. Supponiamo allora che esista un’altra parallela s′ ad r passante per P . Le due rette s, s′ formano un angolo non nullo (altrimenti coinciderebbero) e quinb è minore di di la somma degli angoli S ′ PbQ e RQP due retti. Per definizione, allora, s′ non può essere parallela ad r. La costruzione della retta s si può semplificare molto rispetto al metodo suggerito dalla dimostrazione del teorema. Al solito, questo richiede la conoscenza di proprietà che ancora non abbiamo né visto né tanto meno dimostrato, anche se lo faremo più avanti. La dimostrazione del teorema, invece, correttamente usa solo nozioni che già sono state introdotte e provate. Facendo riferimento alla Figura 6.8, a destra, si ha: Algoritmo 6.3 (Parallela ad r passante per P ) Ingresso: la retta r e il punto P fuori di essa; Uscita: la retta s passante per P e parallela ad r; 1. si considera un punto A qualsiasi sulla retta r; 2. con centro in A e raggio AP si traccia un arco di circonferenza che interseca r in B; 3. con centro in B e in P e stesso raggio si tracciano due archi che si incontrano in C; 4. la retta P C è parallela ad r. Come è noto, le possibili alternative al precedente teorema hanno dato origine alle Geometrie non Euclidee. Se supponiamo che per P passino infinite rette parallele ad r si ottiene la Geometria Iperbolica di Lobaĉevsky e Bólyai ; se invece si suppone che per P non passi alcuna retta parallela ad r si ottiene la Geometria Ellittica di Beltrami e Riemann. Lasciamo al lettore il compito di provare che anche la perpendicolare alla retta r passante per P è unica. Se tale perpendicolare interseca r nel punto Q, si definisce distanza di P da r la lunghezza del segmento P Q; Q si dice il piede della perpendicolare. Invitiamo inoltre il lettore a scrivere l’algoritmo per la costruzione della perpendicolare ad r passante per P , quando P non sta sulla retta; il caso in cui P ≡ A sta su r è stato visto nella Nota 6.2. La Figura ?? suggerisce il metodo classico: con centro in P si traccia un arco di circonferenza che incontra r in X ed Y . Il punto di mezzo Q del segmento XY è il piede della perpendicolare cercata. Dati tre punti non allineati A, B, C, la parte di piano comune ai tre semipiani determinati dalle rette AB, BC, CA che contengono il terzo punto, si dice triangolo. I tre punti A, B, C si dicono i vertici, i tre segmenti AB, BC, CA si dicono i lati del triangolo e i tre angoli che contengono il triangolo si dicono gli angoli del triangolo. Il triangolo è la più semplice di una serie di figure geometriche di notevole importanza. Sia A0 , A1 , . . . , An una sequenza di n punti distinti del piano; la sequenza di segmenti A0 A1 , A1 A2 , . . . , An−1 An si dice poligonale; se An coincide con A0 la poligonale si dice più propriamente poligono di n lati. Per estensione, si dice poligono anche la parte di piano racchiusa dalla poligonale. La definizione di vertice, lato ed angolo della poligonale e del poligono sono analoghe alle stesse definizione date per il triangolo, che risulta semplicemente essere un poligono di tre lati. Se ogni lato Ai Ai+1 del poligono è tale che la retta Ai Ai+1 lascia da una stessa parte tutti gli altri vertici del poligono, allora questo si dice convesso. Si dimostra che la seguente definizione è equivalente: un poligono è convesso se, presi comunque due pun- 171 6.2. PERPENDICOLARITÀ E PARALLELISMO ti che gli appartengono, il segmento che li unisce è formato tutto di punti appartenenti al poligono stesso. Per definizione, infatti, P e Q appartengono a tutti i semipiani determinati dai lati e contenenti gli altri vertici del poligono; vi appartengono pertanto anche tutti i punti del segmento P Q. Un poligono che non sia convesso si dice concavo. In quest’ultimo caso, può succedere che due lati si intersechino, cioè abbiano un punto in comune diverso da ciascuno dei vertici; il poligono si dice allora intrecciato. Al variare del numero dei lati (e degli angoli) i poligoni prendono il nome di triangoli, quadrilateri, pentagoni, esagoni, e cosı̀ via. Un poligono che abbia tutti i lati e tutti gli angoli uguali si dice regolare; per questi poligoni si veda la Sezione 6.8. A5 A1 A4 A1 A3 A0 A6 A2 A0 ≡ A5 A2 A7 A4 A3 Figura 6.9: Poligonale e poligono I triangoli sono i poligoni più semplici e tutti i triangoli sono poligoni convessi; per essi vale il seguente risultato: Teorema 6.3 In ogni triangolo ciascun lato è minore della somma degli altri due e maggiore della loro differenza. A′ B′ C A B D Figura 6.10: Gli angoli di un triangolo Questa costanza della somma dei tre angoli di un triangolo risulterà importante in molte applicazioni; ad esempio, se chiamiamo angolo esterno l’angolo che il prolungamento di un lato forma con il lato successivo, si ha il seguente: Teorema 6.5 In un triangolo ogni angolo esterno è uguale alla somma dei due angoli non adiacenti. Prova: Se nel triangolo ABC della Figura 6.10 prob è il supplemenlunghiamo il lato AB, l’angolo C BD b tare di ABC. Ma per il teorema precedente, anche b + ACB b è supplementare di ABC b per la somma B AC b b b cui abbiamo: C BD = B AC + ACB. D E C Prova: Siano AB, CD, EF i tre lati di un triangolo; se AB > CD + EF e facciamo coincidere A con C A B e B con E, i punti D ed F non possono incontrarsi e quindi non può esistere nessun triangolo con tali Figura 6.11: Somma degli angoli interni tre lati. Si osservi che se AB = CD + EF , allora D ed F verrebbero a coincidere in un punto di AB, e Tutti i poligoni hanno costante la somma dei loro quindi il triangolo degenera in un semplice segmento. Se d’altra parte fosse AB < CD − EF si avrebbe angoli interni: CD > AB + EF , e questo è proibito dalla prima Teorema 6.6 Sia dato un poligono di n lati; allora parte del teorema. la somma dei suoi angoli interni è uguale ad n − 2 E’ interessante osservare il seguente “invariante” angoli piatti. dei triangoli: Teorema 6.4 La somma dei tre angoli di un Prova: Si consideri la Figura 6.11 e fissato un vertice A del poligono, lo si unisca a tutti gli altri vertici, triangolo è uguale a due angoli retti. escluso i due vertici adiacenti ai quali è già unito da Prova: Sia ABC un qualsiasi triangolo (si veda la due lati. Si ottiene cosı̀ una divisione del poligono in Figura 6.10) e costruiamo per C la parallela ad AB. n − 2 triangoli, ognuno dei quali ha un angolo piatto b e B AC b sono uguali perché alterni come somma dei suoi angoli interni. Poiché la somma Gli angoli A′ CA b e ABC. b Quindi, la degli angoli interni del poligono è uguale alla sominterni, e lo stesso vale per B ′ CB b somma dei tre angoli del triangolo è uguale a A′ CA+ ma degli angoli interni di questi triangoli, il teorema ′b b ACB + B CB, che è un angolo piatto. risulta dimostrato. 172 CAPITOLO 6. GEOMETRIA EUCLIDEA Per i quadrilateri, cioè per i poligoni a quattro mo visto tanto per i segmenti quanto per gli angoli. lati, esiste una nomenclatura nota fin dalle scuole Quello che si fa, è di traslare una figura sull’altra, in modo da far coincidere certi punti, e osservare che anelementari: che tutti gli altri coincidono; se questo non avviene, Definizione 6.3 Un quadrilatero che abbia due lati la due figure non sono congruenti. Talvolta, oltre alla opposti paralleli si dice un trapezio. Un quadrilatero traslazione, occorre operare un ribaltamento delle fiche abbia le due coppie di lati opposti paralleli si dice gure; questo deve avvenire nello spazio, ma di regola un parallelogramma. Un quadrilatero che abbia tutti questa invasione della terza dimensione non è consigli angoli uguali si dice un rettangolo. Un quadriderata fuori legge. Con il criterio di sovrapponibilità latero che abbia tutti i lati uguali si dice un rombo. in mente, possiamo dare un teorema che potrebbe Un quadrilatero che abbia tutti i lati e tutti gli angoli anche essere preso come definizione: uguali si dice un quadrato. I segmenti che uniscono vertici opposti di un quadrilatero si dicono le sue Lemma 6.9 Due triangoli sono uguali se e solo se diagonali. hanno i tre lati e i tre angoli ordinatamente uguali. Vale il seguente, importante risultato: Prova: I due triangoli possono essere sovrapposti, Teorema 6.7 Un quadrilatero è un parallelogramma o direttamente o tramite una rotazione nello spazio, se e solo e le due coppie di angoli opposti sono uguali. come richiesto ad esempio dai triangoli della Figura 6.13. Il viceversa è del tutto ovvio. D A C B C′ C A B B′ A′ Figura 6.13: Triangoli congruenti Figura 6.12: Un parallelogramma Prova: Se ABCD è un parallelogramma, gli angoli b e in D b sono corrispondenti e quindi supplementain A b eC b sono supplementari e quindi ri; anche gli angoli D b b b = B. b ViceverA = C. Analogamente si dimostra D sa, per il teorema precedente la somma degli angoli interni di un quadrilatero è uguale a quattro angoli b=C b eB b = D, b si ha che A b+D b e retti; quindi se A b b B + C sono uguali a due angoli retti. Questo significa che AB è parallelo a DC. In modo analogo, si trova che AD è parallelo a BC e quindi il quadrilatero è un parallelogramma. Come semplice conseguenza si ha: Corollario 6.8 Il rettangolo e il quadrato sono parallelogrammi. Vedremo più avanti che un quadrilatero è un parallelogramma se e solo se i lati opposti sono uguali. Questo ci dirà che anche un rombo è un parallelogramma e ci darà altre proprietà dei rettangoli e dei quadrati. 6.3 Congruenza e similitudine Normalmente, la verifica di queste sei uguaglianze è troppo pesante; come ora vedremo, bastano tre opportune uguaglianze per assicurare la congruenza di due triangoli. I tre teoremi seguenti sono noti pertanto come “criteri di congruenza dei triangoli”, e costituiscono la base di gran parte della geometria dei triangoli. Teorema 6.10 (I criterio di congruenza) Due triangoli che abbiano uguali due lati e l’angolo tra essi compreso sono congruenti. Prova: Con riferimento alla Figura 6.13, si abbia b = B′A c′ C ′ . Se AB = A′ B ′ , AC = A′ C ′ e B AC ′ portiamo A a coincidere con A e B con B ′ , per le precedenti uguaglianze anche C deve coincidere con C ′ , eventualmente dopo aver fatto ruotare il triangolo nello spazio. Ma se B e C coincidono con B ′ e C ′ , il segmento BC coincide con B ′ C ′ e anche gli angoli in B e in C devono essere uguali agli angoli in B ′ e C ′ . Questo assicura che i due triangoli sono congruenti. Analogamente si dimostra il secondo criterio: Teorema 6.11 (II criterio di congruenza) Due Il concetto di congruenza per le figure geometriche triangoli che abbiano uguali un lato e i due angoli ad coincide con quello di sovrapponibilità, come abbia- esso adiacenti sono congruenti. 173 6.3. CONGRUENZA E SIMILITUDINE Prova: Sempre con riferimento alla Figura 6.13, sia AB = A′ B ′ e portiamo i due lati a sovrapporsi. Poiché l’angolo in A è uguale all’angolo in A′ , il lato AC viene a sovrapporsi (anche se non necessariamente a coincidere) con A′ C ′ . Allo stesso modo, essendo b = B c′ , i segmenti BC e B ′ C ′ si sovrappongono, B anche se non coincidono. Ma i due lati AC e BC si incontrano in C, che per la costruzione effettuata si deve trovare anche sulle rette A′ B ′ e A′ C ′ . Poiché due rette non parallele si incontrano in un solo punto, allora C e C ′ devono coincidere. Questo implica la congruenza dei due triangoli. C A M B Figura 6.14: Triangolo isoscele Per arrivare a dimostrare il terzo criterio di conla mediana. Merita un po’ più di enfasi il seguente gruenza, occorre introdurre alcuni concetti, nuovi ma risultato: importanti: Definizione 6.4 Un triangolo con tutti e tre i lati Corollario 6.13 Un triangolo è equilatero se e solo uguali si dice equilatero. Un triangolo con i tre lati se i suoi tre◦ angoli sono uguali (e, di conseguenza, tutti diversi si dice scaleno. Un triangolo che abbia misurano 60 ciascuno). due lati uguali (e il terzo eventualmente diverso) si dice isoscele; in tal caso, i due lati uguali si dicono lati obliqui, mentre il terzo lato si dice la base. I segmenti che uniscono ciascun vertice al punto medio del lato opposto si dicono le mediane del triangolo. Se dal vertice A costruiamo la perpendicolare al lato opposto BC e H è il piede di tale perpendicolare, il segmento AH si dice l’altezza del triangolo relativa al lato BC. In modo analogo si definiscono le altezze relative ai lati AB e AC. Si ha allora il seguente: Prova: Sia ABC un triangolo equilatero; se consideriamo AB come base di un triangolo isoscele, l’angolo in A risulta uguale all’angolo in B; se consideriamo BC come base, l’angolo in B risulta uguale all’angolo in C. Per la proprietà transitiva dell’uguaglianza i tre angoli sono tutti uguali e la loro misura discende dal Teorema 6.4. In viceversa si dimostra in modo del tutto analogo. Siamo ora in grado di dimostrare: Teorema 6.14 (III criterio di congruenza) Due triangoli che abbiano tutti e tre i lati uguali Teorema 6.12 Un triangolo è isoscele se e solo se i sono congruenti. due angoli adiacenti alla base sono uguali. Prova: Con riferimento alla Figura 6.14, sia CM Prova: Facciamo ora riferimento alla Figura 6.15. ′ ′ il segmento che si ottiene dividendo a metà l’angolo Portiamo AB a coincidere con A B e supponiamo ′ b b in C, di modo che ACM = M CB. I due triangoli che, cosı̀ facendo, C non venga a coincidere con C. ′ ′ ACM e M CB sono congruenti per il primo criterio: I due triangoli ACC e BCC sono isosceli per co′ ′ ′ ′ AC = CB perché il triangolo è isoscele, CM è a struzione e per ipotesi (AC = A C e BC = B C ) e b = M CB b per costruzione. Quindi quindi hanno gli angoli alla base uguali. Tuttavia, se comune ed ACM c′ c′ in particolare l’angolo in A è uguale all’angolo in B. la disposizione è quella della figura: AC C > B C C e ′ ′ ′ b b c Viceversa, supponiamo che gli angoli adiacenti al lato ACC < B CC = B C C, il che è assurdo. Ci possono ′ AB siano uguali. Questo vuol dire che sono acuti e essere altre disposizioni dei punti C e C , ma in modo quindi, se da C tracciamo l’altezza relativa ad AB, del tutto analogo si arriva sempre a una conclusione ′ questa cade in un punto M compreso tra A e B. Si assurda. Quindi, deve essere C ≡ C . considerino allora i triangoli AM C e M BC; i due be angoli in M sono retti e quindi uguali, gli angoli A C′ C b sono uguali per ipotesi e questo implica che l’angolo B b è uguale ad M CB. b ACM I due triangoli sono allora congruenti per il secondo criterio (CM è in comune) e, in particolare, CA = CB; quindi il triangolo è isoscele. A ≡ A′ B ≡ B′ Come conseguenza di questa dimostrazione, si può cC = osservare che, in un triangolo isoscele, AM c Figura 6.15: Terzo criterio di congruenza B M C, che quindi risultano retti; perciò CM è l’altezza del triangolo. Inoltre, AM = M B, e CM è anche 174 CAPITOLO 6. GEOMETRIA EUCLIDEA Teorema 6.15 Un quadrilatero è un parallelogramma se e soltanto se le due coppie di lati opposti sono formate da segmenti uguali. ¢¢ A¢ ¢ ¢ B¢ H ¢ C¢ K ¢ ¢ D¢ ¢ E¢ ¢ ¢ ¢r Prova: Se ABCD è un parallelogramma, considerando le rette parallele AB e CD tagliate dalla trab = B DC b perché angoli altersversale DB, si ha ABD ni interni. In modo analogo, partendo dalle parallele b = DBC. b AD e BC si ha ADB Allora i due triangoli ABD e BCD sono congruenti per il primo criterio e perciò si ha AB = DC e AD = BC. Viceversa, supponiamo che sia AB = DC e AD = BC; i due triangoli ABD e BCD sono ora uguali per il terzo crib = B DC b terio di congruenza e quindi abbiamo ABD b b e ADB = DBC; questo implica che AB e DC sono paralleli, come lo sono AD e BC. Un immediato corollario di questo teorema è che ogni rombo è un parallelogramma. Nella dimostrazione del teorema abbiamo usato la diagonale DB; potevamo usare anche l’altra diagonale AC e arrivare allo stesso risultato. Pertanto, una seconda conseguenza è: Corollario 6.16 Ogni diagonale divide un parallelogramma in due triangoli uguali. Uno dei primi risultati “astratti” ottenuti nella Geometria è stato, quasi sicuramente, il teorema di Talete, che ora vedremo. Talete si interessava alle proporzioni e indubbiamente osservò la proprietà enunciata dal suo teorema, ma, altrettanto indubbiamente, non ne dette alcuna dimostrazione come ora si intende e come, un paio di secoli dopo di lui, intendevano i Greci. A quell’epoca, la necessità di una prova rigorosa in Matematica non era avvertita e una verifica sperimentale era più che sufficiente. Ciò non toglie che l’intuizione di Talete non fosse giusta e, a quel che si dice, egli stesso la adoperò, quando gli capitò di recarsi in Egitto, per calcolare con esattezza l’altezza delle piramidi, operazione ritenuta impossibile prima di lui. Definizione 6.5 Si dice fascio di rette l’insieme di tutte le rette che passano per un punto, detto il centro del fascio, oppure l’insieme di tutte le rette parallele a una retta assegnata, detta la direzione del fascio. Teorema 6.17 (di Talete) Sia dato un fascio di rette parallele e si considerino due trasversali r ed s a tale fascio (v. Figura 6.16); queste trasversali sono pertanto tagliate in segmenti dalle rette parallele; allora, a segmenti proporzionali tagliati su r corrispondono segmenti nella stessa proporzione tagliati su s, e viceversa. Prova: A onor di Talete, la dimostrazione di questo teorema non è affatto ovvia e richiede un’impo- BB B A′ B ′ B H BB ′ B K′ B C′ B B B D′ B B E′ B B sB Figura 6.16: Teorema di Talete stazione che tenga conto della definizione di numero reale, concetto che, al tempo di Talete, nemmeno esisteva! Si comincia osservando che a segmenti uguali su r corrispondono segmenti uguali su s. Sia AB = BC; se si tirano le perpendicolari al fascio AH e BK, i due triangoli ABH e CBK sono uguab = H BA b e li, essendo AB = BC per ipotesi, K CB b = C BK b come angoli corrispondenti. PortiaB AH mo ora le perpendicolari A′ H ′ e B ′ K ′ : questo implica che AA′ H ′ H e BB ′ K ′ K sono parallelogrammi e quindi A′ H ′ = AH = BK = B ′ K ′ . Da questo deriva che i triangoli A′ H ′ B ′ e B ′ K ′ C ′ sono congruenti, ancora per il primo criterio di conc′ B ′ = K ′ B c′ C ′ perché corrispondenti, gruenza (H ′ A c′ = K c′ perché retti). Finalmente, questo ci dice H ′ ′ A B = B ′ C ′ . Supponiamo ora (seconda parte della dimostrazione) che due segmenti, ad esempio AB e CD, stiano tra di loro in un rapporto razionale m/n. Questo significa che dividendo AB in n parti uguali e CD in m parti uguali, queste parti hanno tutte la stessa lunghezza. Possiamo applicare allora la prima parte della dimostrazione immaginando che ogni parte sia individuata dal taglio di r ed s con rette parallele del fascio. Questo implica che A′ B ′ e C ′ D′ stanno ancora nel rapporto m/n, essendo le parti tagliate in s tutte uguali tra di loro. La terza parte della dimostrazione riguarda il caso in cui i due segmenti, diciamo ancora AB e CD non siano tra loro in un rapporto razionale. Se z è tale rapporto, possiamo pensare a due successioni (di Cauchy) di numeri razionali che approssimano z per difetto e per eccesso. Considerando segmenti che approssimano CD secondo i rapporti di tali sequenze con AB, per la seconda parte della dimostrazione si ottengono segmenti che approssimano C ′ D′ secondo gli stessi rapporti con il segmento A′ B ′ . Questo ci dice che anche il rapporto tra A′ B ′ e C ′ D′ deve essere z. 175 6.3. CONGRUENZA E SIMILITUDINE A Talete bastò sfruttare la prima parte del teorema per misurare l’altezza della piramide. Secondo Plutarco, aspettò che la propria ombra avesse una lunghezza pari alla sua altezza e segnò il punto in cui arrivava l’ombra della punta della piramide. Sfruttando poi il fatto che la base della piramide era quadrata e le sue misure potevano essere prese direttamente, non gli fu difficile calcolare l’altezza esatta. Questo metodo è noto in generale come “principio dei triangoli simili”, e in effetti il teorema di Talete costituisce la base della teoria geometrica della similitudine, che fra poco vedremo. Prima, però, osserviamo che esiste anche un teorema inverso a quello di Talete: Teorema 6.18 Sia dato un fascio di rette, delle quali non si sappia se sono parallele. Se, prese comunque due trasversali r ed s si ha che a segmenti proporzionali staccati su r corrispondono segmenti nella stessa proporzione staccati su s, allora le rette del fascio sono parallele tra di loro. Prova: Se nel fascio esistesse una retta non parallela alle altre, chiamiamo A la sua intersezione con la retta r. Per A facciamo passare la parallela al fascio che incontrerà s nel punto A′′ diverso da A′ . Per il teorema di Talete, i segmenti con vertice in A′′ hanno le stesse proporzioni con gli altri segmenti determinate dai corrispondenti segmenti con vertice in A. Ma questa è la stessa proprietà di cui devono godere i segmenti con vertice in A′ e quindi A′′ e A′ devono coincidere. Questo vuol dire che la retta originale per A deve coincidere con quella costruita, cioè risulta in effetti parallela alle altre rette del fascio. Come per la congruenza, la verifica della loro similitudine può essere semplificata rispetto a ciò che comporterebbe la definizione. Queste semplificazioni sono stabilite dai tre criteri di similitudine dei triangoli, abbastanza analoghi ai tre criteri di congruenza. C ¢@ ¢ @ C′ @D C ′′¢ ¢@ ¢@ @ @ @ ¢ ¢ @ @ @ ¢ ¢ @ @ @ ¢ ¢ @ @ @ ¢ @ ¢ @ @ A B ′′ B A′ B′ Figura 6.17: Triangoli simili Teorema 6.20 (I criterio di similitudine) Due triangoli che abbiano due coppie di lati in proporzione e l’angolo fra essi compreso uguale, sono simili tra di loro. Prova: Con riferimento alla Figurs 6.17, siano ABC e A′ B ′ C ′ due triangoli per i quali AB : A′ B ′ = b = A c′ . Prendiamo sul segmento AC : A′ C ′ e A ′′ AB un punto B (che potrebbe anche seguire B) tale che AB ′′ = A′ B ′ e da B ′′ costruiamo la parallela B ′′ C ′′ a BC. Il teorema di Talete ci dice che AB : AB ′′ = AC : AC ′′ , e quindi, per l’unicità del quarto proporzionale deve essere AC ′′ = A′ C ′ . I due E’ importante un’altra conseguenza del Teorema di triangoli AB ′′ C ′′ e A′ B ′ C ′ sono quindi uguali per il Talete: b=B c′′ = B c′ primo criterio di congruenza e perciò B ′′ ′′ ′ b c c e C = C = C . Infine, portando la parallela C D Corollario 6.19 Se r ed s sono due rette parallele, ad AB si ha C ′′ D = B ′′ B, essendo B ′′ BDC ′′ un allora tutti i punti di r hanno la medesima distanza parallelogramma, e dal teorema di Talete si deduce da retta s. AC : AC ′′ = BC : BC ′′ . Questa equivale alla pro′ ′ ′ ′ Ha senso allora definire la distanza di due rette paral- porzione AC : A C = BC : B C , il che prova che lele r ed s come la distanza di un qualsiasi punto p anche il terzo lato è nella stessa proporzione degli altri due. di una delle due rette dall’altra retta. Finalmente, diamo la seguente: Anche il secondo criterio di similitudine è analogo al secondo criterio di congruenza: Definizione 6.6 Due poligoni con k lati si dicono simili se i lati sono ordinatamente nella stessa Teorema 6.21 (II criterio di similitudine) Due proporzione e se gli angoli che essi formano sono triangoli che abbiano due coppie di angoli uguali ordinatamente uguali. sono simili (a meno di una eventuale rotazione intorno a un lato). Osserviamo esplicitamente che le due condizioni non possono, in generale, essere ridotte; questo è dimo- Prova: Naturalmente, se due coppie di angoli sostrato dall’esempio del quadrato e del rombo (che no uguali, anche la terza coppia è tale; inoltre, non hanno i lati in proporzione, ma gli angoli diversi) e ha senso parlare di proporzionalità di due soli ladall’esempio del rettangolo e del quadrato (che hanno ti. Con riferimento alla Figura 6.17, siano ABC e b=A c′ , B b=B c′ e, di congli stessi angoli, ma non i lati in proporzione). Il caso A′ B ′ C ′ due triangoli con A ′ b c più importante e interessante è quello dei triangoli. seguenza, C = C . Riportiamo su AB il punto B ′′ 176 CAPITOLO 6. GEOMETRIA EUCLIDEA di modo che sia AB ′′ = A′ B ′ e costruiamo la parallela B ′′ C ′′ a BC. I due triangoli AB ′′ C ′′ e A′ B ′ C ′ sono uguali per il secondo criterio di congruenza e quindi AC ′′ = A′ C ′ e B ′′ C ′′ = B ′ C ′ . Per il teorema di Talete abbiamo AB : AB ′′ = AC : AC ′′ , cioè AB : A′ B ′ = AC : A′ C ′ . In modo analogo, oppure costruendo la parallela C ′′ D ad AB, si provano le altre proporzioni, che si riducono a AB : A′ B ′ = AC : A′ C ′ = BC : B ′ C ′ per la proprietà transitiva. C Q ­ QQ ­ Q ­ Q Q ­ Q ­ Q Q ­ Q ­ Q A H B Figura 6.18: Triangolo rettangolo Infine, in analogia al terzo criterio di congruenza: Teorema 6.22 (III criterio di similitudine) Se Prova: Facendo riferimento alla Figura 6.18, i due triangoli hanno i tre lati in proporzione, allora due triangoli ABC e ACH sono simili per il seconsono simili (a meno di una rotazione intorno a uno do criterio di similitudine in quanto l’angolo in A è dei lati). comune e gli angoli in C e in H sono retti. Quindi AH : AC = AC : AB, il che prova il primo punto. Prova: Con riferimento alla Figura 6.17, siano ABC Anche i due triangoli AHC e CHB sono simili in e A′ B ′ C ′ due triangoli tali che AB : A′ B ′ = AC : quanto entrambi simili ad ABC, e quindi vale la proA′ C ′ = BC : B ′ C ′ . Si consideri su AB il punto B ′′ porzione AH : CH = CH : HB, e questo dimostra il tale che AB ′′ = A′ B ′ e su AC il punto C ′′ tale che secondo punto. AC ′′ = A′ C ′ . Per l’inverso del teorema di Talete, Come vedremo, il celeberrimo teorema di Pitagora B ′′ C ′′ deve essere parallelo a BC, e costruendo C ′′ D parallelo ad AB si trova, come in precedenza, che è una conseguenza, pressoché immediata, del primo deve essere B ′′ C ′′ = B ′ C ′ . I due triangoli AB ′′ C ′′ e teorema di Euclide. A′ B ′ C ′ sono pertanto congruenti per il terzo criterio. b=A c′ Ma ora è immediato osservare che deve essere A La misura delle superfici ′′ ′ c′ ′ ′′ ′′ ′′ b c b c ABC = AB C = A B C e ACB = AC B = 6.4 ′ c′ ′ A C B , il che prova che i due triangoli sono simili. Ciò che intuitivamente chiamiamo l’estensione di Sfruttando questi criteri, Talete non avrebbe avuto una superficie può essere misurata se fissiamo un’opla necessità di aspettare che la sua ombra fosse lunga portuna unità di misura. Se u è il segmento che abtanto quanto lui era alto, ma in qualsiasi momento biamo assunto come unità di misura di lunghezza, avrebbe potuto usare il fattore di proporzionalità da- convenzionalmente stabiliamo di usare come unità di to dal rapporto della sua altezza e la lunghezza della misura di superficie l’estensione di un quadrato di lasua ombra. Anzi, avrebbe potuto approfittare del to u. Naturalmente, non possiamo pensare che, data momento in cui i raggi del sole erano perpendicolari una superficie qualsiasi, si riesca a trovare il modo a un lato della piramide, perché in quel momento i di sovrapporle tanti quadrati u × u da ricoprirla perconti sarebbero stati più semplici. Se capisco bene la fettamente. Come per le lunghezze e gli angoli, è descrizione che fu data del calcolo di Talete, sembra opportuno definire multipli e sottomultipli, in modo che questi aspettasse il giorno e l’ora in cui la sua da poter associare ad una superficie qualsiasi un cerombra misurava quanto la sua altezza e il sole risul- to numero di quadrati unità di misura, ma, se ne è tava perpendicolare a un lato della piramide. Santa il caso, anche una certa quantità di sottomultipli. Se la superficie è grande, potrà essere inoltre convenienPazienza! La più famosa applicazione del teoria della te usare qualche multiplo dell’unità di misura (vedi similitudine è costituita dai due teoremi di Euclide: Sezione 6.1). Con questo in mente, dimostriamo il seguente teorema che è alla base della teoria della Teorema 6.23 (Teoremi di Euclide) Sia ABC misura: un triangolo rettangolo e sia CH l’altezza relativa Teorema 6.24 Se un rettangolo ha i lati di dimenall’ipotenusa; allora: sioni a, b ∈ R+ rispetto all’unità di lunghezza u, alprimo teorema di Euclide: ciascun cateto è me- lora la superficie del rettangolo misura ab rispetto aldio proporzionale tra la proiezione di quel cateto l’unità di misura delle superfici, cioè il quadrato di sull’ipotenusa e l’ipotenusa stessa; dimensioni u2 = u × u. secondo teorema di Euclide: l’altezza relativa al- Prova: La prova, come di regola succede per le prol’ipotenusa è medio proporzionale fra le due prietà che chiamano in causa i numeri reali, si divide proiezioni dei cateti sull’ipotenusa. in più parti, quattro nel caso attuale. Primo caso: 177 6.4. LA MISURA DELLE SUPERFICI siano a, b ∈ N; allora, dividiamo il lato di misura a in a parti, ciascuna di lunghezza u, e il lato che misura b in b parti, e tiriamo le parallele all’altro lato passanti per tali punti di divisione: si ottengono cosı̀ esattamente ab quadrati unitari, e questo prova l’asserto. Secondo caso: siano a, b ∈ Q e supponiamo a = m/n e b = p/q (le due frazioni possono essere ridotte ai minimi termini, ma la cosa non è strettamente necessaria). Dividiamo u in nq parti uguali, di modo che il quadrato unitario viene a contenere n2 q 2 quadretti. Tirando al solito le parallele ai lati dai punti di divisione, si ottengono mq parti dal primo lato e pn parti dal secondo. Gli mqnp quadratini cosı̀ ottenuti vanno divisi per gli n2 q 2 quadretti dell’unità di misura; si ottiene quindi mqnp/n2 q 2 = mp/nq = ab. La terza parte riguarda il caso a ∈ Q e b ∈ R: non si può più agire come prima, ma si prendono due sequenze di Cauchy di numeri razionali {si }i∈N e {ti }i∈N che approssimano, per difetto e per eccesso, il numero b. Per a e gli si , come per a e i ti , si può procedere analogamente a quanto fatto nel secondo caso e si ottengono misure {asi }i∈N e {ati }i∈N che determinano la misura ab. Infine, se entrambe le misure a, b sono numeri reali, si procede in modo simile prendendo successioni di Cauchy che approssimano, per eccesso e per difetto, le due quantità a, b ∈ R. za tra gli altri due lati paralleli, allora l’area del parallelogramma vale ah. Prova: Nella Figura 6.19, sia E il punto di incontro di AB con la perpendicolare da C al lato DC; sia poi DF perpendicolare ad AB. I due triangoli AF D e BEC sono congruenti per il secondo criterio e quindi ABCD è equivalente al rettangolo F ECD, la cui area è proprio bh. C A′ A B′ B D C′ H Figura 6.20: Area del triangolo Naturalmente, l’area del triangolo è di importanza non trascurabile: Teorema 6.26 Sia dato un triangolo ABC, sia AB = b un suo lato e CH = h l’altezza relativa a tale lato; allora l’area del triangolo è bh/2. Di solito, la misura della superficie di una figura si Prova: Si consideri la Figura 6.20. Sia D il punto mediano dell’altezza e da D tiriamo la parallela al ladice area e si dà la seguente definizione: to AB fino ad incontrare i lati AC e BC nei punti A′ e Definizione 6.7 Due figure si dicono equivalenti se B ′ , rispettivamente. Su tale retta si consideri il punhanno la stessa area. Si dicono invece equiscompoto C ′ tale che B ′ C ′ = A′ B ′ . Per il teorema di Talete nibili se sono scomponibili nello stesso numero finito è anche CB ′ = BB ′ e A′ C = AA′ = BC ′ . Quindi di parti congruenti. i due triangoli A′ B ′ C e BC ′ B ′ sono congruenti per Chiaramente, due figure equiscomponibili hanno la il primo criterio. In particolare, BC ′ risulta parallestessa area. L’equiscomponibilità è un metodo for- lo ad AC; quindi il triangolo ABC è equivalente al te per trovare la misura della superficie delle figu- parallelogramma ABC ′ A′ la cui area è bh/2. re, e non sempre risulta sufficiente, come capita nel La Figura 6.21 mostra come l’area del trapezio sia ben noto problema della quadratura del cerchio, e data dalla formula (a + b)h/2 e quella del rombo da cioè trovare un quadrato equivalente a un cerchio ab/2; il lettore è invitato a specificare i dettagli deldato: questo problema richiede un’altra impostazio- le dimostrazioni, che costituiscono un buon esercizio, ne che vedremo più avanti. Per i poligoni, l’equi- anche se molto semplice, di ragionamento geometrico. scomponibilità è il concetto adeguato al calcolo delle aree. a b b a D C a b Figura 6.21: Area del trapezio e del rombo A C B E Figura 6.19: Area del parallelogramma Teorema 6.25 Sia ABCD un parallelogramma e sia a = AB = CD un lato. Se h è la distan- Vogliamo osservare che i due teoremi di Euclide si possono formulare in termini di figure equivalenti: 1. il quadrato costruito su un cateto è equivalente al rettangolo che ha per lati l’ipotenusa e la proiezioni del cateto sull’ipotenusa; 178 CAPITOLO 6. GEOMETRIA EUCLIDEA 2. il quadrato costruito sull’altezza relativa all’ipo- centrale ha lato b − a, la differenza dei due cateti; tenusa è equivalente al rettangolo che ha per lati pertanto, l’area del quadrato grande è: le proiezioni dei cateti sull’ipotenusa. ab c2 = 4 + (b − a)2 2 b c b c a a c b a c b a Figura 6.22: Teorema di Pitagora Sulla stessa linea di questi teoremi c’è il fondamentale: Teorema 6.27 (di Pitagora) Un triangolo è rettangolo se e solo se il quadrato costruito sull’ipotenusa è equivalente alla somma dei quadrati costruiti sui cateti. e semplificando si trova c2 = a2 + b2 . Una semplice applicazione del primo teorema di Euclide dà una terza dimostrazione del teorema di Pitagora. Come si vede dalla Figura 6.24, il quadrato costruito sul cateto AC è equivalente al rettangolo ADKH e il quadrato costruito sul cateto BC è equivalente al rettangolo HKEB. Già nel 1928 il matematica inglese Loomis ha pubblicato un libro nel quale raccoglie oltre centocinquanta dimostrazioni del Teorema di Pitagora. C Prova: Esistono moltissime dimostrazioni di questo teorema. Una delle più belle fa diretto riferimento all’equiscomponibilità. I due quadrati della figura sono cosı̀ formati: il primo da quattro triangoli rettangoli A H B congruenti e dai quadrati dei due cateti; il secondo dagli stessi quattro triangoli e dal quadrato dell’ipotenusa. Per differenza, si ha immediatamente il teorema. Viceversa, supponiamo che i tre lati a, b, c di un triangolo siano tali che a2 + b2 = c2 ; costruiamo il quadrato di lato a + b come nel primo disegno della D K E figura: i quattro triangoli sono congruenti per il primo criterio e quindi sia c′ la lunghezza di ciascuno dei due segmenti obliqui. Costruiamo ora il secondo quaFigura 6.24: Pitagora ed Euclide drato della figura, nella quale il lato obliquo risulta essere di lunghezza c′ per la prima parte del teorema; Il teorema di Pitagora era noto agli Egizi, almeno questo però implica a2 + b2 = c′2 , cioè c2 = c′2 . Es- nel caso delle misure (3, 4, 5) dei lati, come s’è visto sendo c, c′ positivi questo significa c = c′ e perciò il nella costruzione delle rette perpendicolari. Le tertriangolo originale era rettangolo. ne di numeri naturali (a, b, c) tali che a2 + b2 = c2 si dicono terne Pitagoriche e il lettore può direttamente verificare che tali sono (5, 12, 13) e (8, 15, 17), oltre naturalmente alla citata (3, 4, 5). Se abbiamo una terna Pitagorica e moltiplichiamo i tre numeri per uno stesso valore, otteniamo ancora una terna Pitagorica, come (6, 8, 10). In realtà, si vede immeb−a diatamente che i tre numeri a, b, c sono a due a due primi tra loro, oppure hanno tutti e tre un fattore comune. Infatti, se ad esempio a, b avessero un fattore a a comune k, allora sarebbe a = kr e b = ks e quindi c c2 = k 2 r2 + k 2 s2 = k 2 (r2 + s2 ), cosı̀ che k risulterebbe anche un divisore di c. Le terne Pitagoriche per Figura 6.23: Pitagora per differenza le quali a, b, c non hanno fattori comuni si dicono primitive. E’ possibile trovare tante terne Pitagoriche Un’altra bella dimostrazione richiede l’uso di un quante si vogliono: po’ di Algebra; si consideri la Figura 6.23. Il quadrato 179 6.4. LA MISURA DELLE SUPERFICI Teorema 6.28 Dati due qualsiasi numeri interi ABC. Si ha pertanto la proporzione AC : AF = m, n con m > n, la terna costituita dei numeri AB : BF . Vale allora il seguente: a = m2 − n2 , b = 2mn, c = m2 + n2 è Pitagorica. Teorema 6.30 Se ℓ è la misura del lato obliquo nel Prova: Basta eseguire semplici calcoli: triangolo armonico, allora la misura della base è √ ℓ( 5 − 1)/2. a2 + b2 = (m2 − n2 )2 + 4m2 n2 = Prova: Se poniamo AF = AB = x e BF = CB − = m4 + 2m2 n2 + n4 = (m2 + n2 )2 CF = ℓ − x nella precedente proporzione, otteniamo ℓ : x = x : (ℓ − x). Questo equivale all’equazione √ che danno il risultato desiderato. x2 +ℓx−ℓ2 = 0 che ha come soluzioni ℓ(−1± 5)/2; la Lasciamo al lettore la dimostrazione del fatto che soluzione col segno − è negativa e quindi deve essere se m ed n sono primi tra loro, allora la terna Pitago- scartata (una lunghezza non può essere negativa) e rica che si ottiene è primitiva. Questo dimostra che le quindi segue l’asserto del teorema. √ terne Pitagoriche “diverse” sono infinite. Meno semIl numero ( √ 5 − 1)/2 ≈ 0.6180339887, o meglio, plice è dimostrare che quelle cosı̀ ottenute sono tutte 5 + 1)/2 ≈ 1.6180339887, è detto il suo inverso ( le terne Pitagoriche possibili e questo noi qui non lo rapporto armonico o rapporto aureo e si indica con vedremo. la lettera greca φ. Abbiamo già incontrato questa Dal teorema di Pitagora discendono infinite conquantità a proposito dei numeri di Fibonacci, nella seguenze importanti. Qui ci limitiamo a ricordare Sezione 4.3; esiste infatti una stretta connessione tra quelle che interessano direttamente alcuni particolari questi due concetti. Dato un segmento AB è facile triangoli. costruire un segmento CD che sia in rapporto φ con Teorema 6.29 Se ℓ è la misura del lato√di un qua- AB e che si dice costituirne la sezione aurea. drato, allora la sua diagonale misure ℓ 2. Se ℓ è la misura del lato la sua Algoritmo 6.4 (Sezione aurea) √ di un triangolo equilatero, √ Ingresso: un segmento AB di lunghezza ℓ. altezza misura ℓ 3/2 e la sua area ℓ2 3/4. Uscita: un segmento CD di lunghezza ℓ/φ. Prova: Due lati consecutivi del quadrato e la diago1. si riporti due volte consecutive il segmento AB su nale d costituiscono un √ triangolo rettangolo, per cui √ una retta r; siano A′ B ′ e B ′ B ′′ i due segmenti; si ha d = ℓ2 + ℓ2 = ℓ 2. Analogamente, se ABC è un triangolo equilatero, esso risulta anche un trian2. da B ′′ si costruisca la perpendicolare ad r e su di golo isoscele. Dalla Figura 6.14, posto h = CM , si questa, a partire da B ′′ , si riporti un segmento p √ ha h = ℓ2 + ℓ2 /4 = ℓ 3/2. La formula per l’area B ′′ C di lunghezza ℓ; si ha eseguendo ℓh/2. 3. si√unisca A′ con C (il segmento A′ C ha lunghezza Un caso interessante è il seguente. Si consideri un ℓ 5); triangolo isoscele che abbia l’angolo opposto alla base di 36◦ , come nella Figura 6.25. Questo significa 4. a partire da A′ , si riporti un segmento A′ D = che ogni angolo alla base vale (180◦ − 36◦ )/2 = 72◦ . AB √ su AC (il segmento DC ha come lunghezza Tale triangolo viene detto triangolo armonico per la ( 5 − 1)ℓ); proprietà che vedremo. 5. si divida a metà, nel punto M , il segmento CD; uno qualsiasi C √ dei due segmenti DM e CM ha lunghezza ℓ( 5 − 1)/2 = ℓ/φ. 36◦ Nota 6.3 F A B Figura 6.25: Il triangolo armonico Da A portiamo la bisettrice AF all’angolo in A; b = F AC b = 36◦ e AFbB = 72◦ . I triangoli quindi B AF AF C e ABF sono isosceli e quest’ultimo è simile ad I Greci consideravano particolarmente armonioso il rapporto aureo; se si costruisce un rettangolo di dimensioni AB = ℓ e BC = ℓ/φ, e si riporta l’altezza AD sulla base AB, il rettangolo EBCF è di nuovo tale che EB = BC/φ. La costruzione si può ripetere all’infinito, come mostrato nella Figura 6.26. Si osservi infatti che, per costruzione, è AE = AB/φ e quindi vale la proporzione AB : AD = AD : EB in quanto EB = AB − AE, e questo significa AD : EB = AB : AE = φ. E’ interessante la curva che si ottiene dai quarti di circonferenza che uniscono vertici opposti e detta spirale armonica. Si dice che i 180 CAPITOLO 6. GEOMETRIA EUCLIDEA F D r C ¡ A A E templi greci fossero costruiti in modo da conformarsi alla sezione aurea e il rapporto armonico fu (sembra) molto utilizzato da colui che è considerato il maggiore artista greco, e cioè Fidia; la lettera φ è presa infatti dall’iniziale del suo nome. Curiosamente, il rapporto tra due numeri consecutivi della successione di Fibonacci tende a diventare uguale a φ; ad esempio, 55/34 = 1.618, e l’n-esimo numero si può scrivere √ come (φn − (−1/φ)n )/ 5: provare per credere, ma il risultato è esatto (v. Teorema 4.11). Il numero φ ha colpito anche la fantasia dei moderni, ed è famoso il Modulor, il canone inventato da Le Corbusier e basato sul rapporto aureo; il famoso architetto lo propose per costruire edifici e oggetti “a misura d’uomo”. Per ulteriori informazioni si legga il libro di Mario Livio “La sezione aurea” edito in Italia da Rizzoli (2003). Luoghi geometrici ¡ M @ @ @ @ B B Figura 6.26: La spirale armonica 6.5 ¡ ¡ P ¡@ ¡ @ Figura 6.27: Asse di un segmento AM P e M BP sono congruenti per il primo criterio. Infatti, AM = BM per costruzione, P M è in comune e gli angoli in M sono uguali perché retti. Quindi AP = P B e il punto P appartiene all’asse. Viceversa, prendiamo un punto P tale che P A = P B (cioè stia sull’asse) e uniamolo ad M , punto medio di AB. Questa volta i due triangoli AM P e M P B sono congruenti per il terzo criterio, essendo AP = P B per ipotesi, AM = BM per costruzione e P M in comune. cP = B M cP , che pertanto risultano retti. Quindi AM In conclusione, P si trova sulla retta r perpendicolare ad AB. Duale del concetto di asse di un segmento è il concetto di bisettrice di due rette: Definizione 6.9 Date due rette [che si intersecano], si dice bisettrice delle due rette il luogo dei punti da esse equidistanti. Abbiamo messo tra parentesi quadre il fatto che le rette si intersechino; se non lo fanno, se cioè sono parallele, il concetto di bisettrice ancora sussiste, ma in tal caso la bisettrice si riduce alla retta, parallela alle rette date e passante a metà distanza tra le due. Il lettore troverà utile l’esercizio di dimostrare rigorosamente questo fatto. Se invece le due rette si incontrano: Una figura è costituita da un insieme di punti; ad esempio, un triangolo è la parte finita del piano delimitata da tre rette, a due a due non parallele. Talvolta, la proprietà che definisce i punti di una figura è particolarmente semplice e suggestiva: si parla allora di tali figure come di luoghi geometrici o luoghi di punti. L’esempio più semplice è senz’altro l’asse di un segmento: Teorema 6.32 La bisettrice di una coppia di rette incidenti in O è costituita da due rette passanti per Definizione 6.8 Dato un segmento AB, si dice as- O, perpendicolari tra loro, che tagliano a metà gli se di tale segmento l’insieme (il luogo) dei punti che angoli formati dalle rette date. hanno la stessa distanza da A e da B. Prova: Sia P un punto della retta tale che Chiaramente, il punto di mezzo M del segmen- AOP b = B OP b ed uniamo P alle due rette r ed s to appartiene all’asse, ed è facile vedere che l’asse con le perpendicolari P A e P B. I due triangoli BOP è semplicemente una retta: e OAP sono congruenti per il secondo criterio: il lato b b b Teorema 6.31 L’asse del segmento AB è la retta OP è in comune, AOP = B OP per costruzione e A b b b perpendicolare ad AB che passa per il suo punto di e B retti. Quindi abbiamo anche AP O = B P O e P A = P B, cioè P appartiene alla bisettrice. Per il mezzo M . viceversa, se P è tale che P A = P B, P O è in comub e in B b sono retti, per il teorema Prova: Si consideri la Figura 6.27. Sia r la perpen- ne e gli angoli in A dicolare per M ad AB; se il punto P sta su r e lo di Pitagora è anche AO = BO, onde i due triangouniamo con A e con B, vediamo che i due triangoli li P OA e P OB sono congruenti per il terzo criterio. 181 6.5. LUOGHI GEOMETRICI H C b′ HH s HHA ©© © H © ¢¢ HH © © H ¢ H ©© b HH ¢ © © H PA H ©© O HH A © HH AA ©© © HH r ©© B © © N W X M Y A B Figura 6.31: Baricentro Figura 6.28: Bisettrici di due rette incidenti b = B OP b e quindi P appartiene In particolare, AOP b alla retta che divide in due l’angolo AOB. Lo stesso ′ ragionamento vale per la retta b . Infine, i quattro angoli formati da b e b′ sono uguali tra loro come b + AOb b ′) e somma di angoli uguali (ad esempio, P OA quindi sono angoli retti. Dato un angolo, per bisettrice dell’angolo si intende la semiretta compresa nell’angolo, e si ignorano le altre tre semirette. 1. gli assi dei tre lati si incontrano in un punto, detto il circumcentro o circocentro del triangolo; 2. le bisettrici dei tre angoli si incontrano in un punto, detto l’incentro del triangolo; 3. le altezze relative ai tre lati si incontrano in un punto detto ortocentro del triangolo; 4. le mediane dei tre lati si incontrano in un punto detto il baricentro del triangolo. Prova: (1) Nella Figura 6.29, gli assi dei lati AB e BC si incontrano in un punto D che, per costruzione, è equidistante da tutti e tre i vertici; quindi, tale punto deve appartenere anche all’asse di CA. (2) Analogamente, nella stessa figura, le bisettrici deb e C b si incontrano in un punto E che, N gli angoli A per costruzione, è equidistante da tutti e tre i laE ti, e quindi deve appartenere anche alla bisettrice D b (3) Con riferimento alla Figura 6.30, si codi B. struiscano le rette per A, B, C parallele, rispettivamente, ai lati BC, AC, AB del triangolo. Esse deA M B terminano il triangolo P QR e considerati i paralleFigura 6.29: Incentro e circocentro logrammi ABP C, BCQA, ARBC, si trova che i lati P Q, QR, P R sono il doppio di AB, BC, CA. Pertanto, le altezze AHA , BHB , CHC sono gli assi dei lati Q C P QR, RP, P Q, che si incontrano in un punto H per H A il primo asserto. (4) Infine, facendo riferimento alla HB Figura 6.31, siano M, N, P i punti di mezzo dei lati del triangolo ABC. Sia W il punto di incontro delle due mediane BN ed AM e si considerino i segmenti M N ed XY , dove X ed Y sono i punti mediani di A B HC AW e BW . Per il Teorema di Talete, M N = XY ed entrambi sono metà di AB. I due triangoli W M N e W XY sono uguali, avendo uguali i tre angoli ed i lati M N ed XY . Questo significa che W divide sia BN che AM in due parti, di cui una è doppia dell’altra. R Si esegua la stessa costruzione relativa alle mediane Figura 6.30: Ortocentro AM e CP : si trova che il punto di intersezione W ′ le divide in due parti, di cui una è doppia dell’alAssi e bisettrici sono importanti nei triangoli, dove tra. Questo però significa che M W ′ = M W , essendo abbiamo il seguente risultato: entrambi un terzo di AM , e quindi W ′ = W . C Teorema 6.33 Sia ABC un triangolo; allora: E’ allora immediato il seguente: 182 CAPITOLO 6. GEOMETRIA EUCLIDEA Corollario 6.34 Il baricentro di un triangolo divide la circonferenza, che rimane tutta dalla stessa parte ciascuna delle tre mediane in due parti, di cui una è rispetto ad r. Viceversa, sia s una retta per P non perpendicolare ad OP . Tiriamo da O la perpendidoppia dell’altra. colare ad s, che incontrerà s in un punto M ; per il Eulero osservò che l’ortocentro, il baricentro e il cir- teorema di Pitagora OM < OP e quindi M è intercumcentro sono allineati; lasciamo però da parte la no alla circonferenza. Se P ′ è il punto su s tale che dimostrazione di questa curiosa proprietà. P ′ M = M P (ma dalla parte opposta di P rispetto ad Sicuramente, il luogo geometrico più importante è M ), abbiamo P ′ O = P O e quindi P ′ sta sulla circoncostituito dalla circonferenza: ferenza. Quindi la retta s incontra la circonferenza in ′ Definizione 6.10 Si dice circonferenza di raggio r il almeno due punti P e P e non la lascia tutta dalla luogo dei punti che hanno distanza r da un punto fis- stessa parte. Quindi r è unica. sato O, detto centro della circonferenza. Si dice cerchio di raggio r il luogo dei punti che hanno distanza minore o uguale ad r da un punto O detto centro del cerchio. Ogni segmento (di lunghezza r) che unisce il centro del cerchio o della circonferenza al bordo del cerchio o alla circonferenze si dice raggio. Due raggi distinti che giacciono sulla stessa retta costituiscono un diametro, la cui lunghezza è pertanto 2r. Naturalmente, una circonferenza determina un cerchio, costituito da tutti i punti interni alla circonferenza, e viceversa un cerchio determina una circonferenza, data dai punti del suo bordo o contorno. E’ bene tuttavia usare la terminologia appropriata per non creare confusione o ambiguità; ad esempio, la misura della circonferenza è una misura lineare, mentre la misura del cerchio è una misura di superficie. P Q O r Figura 6.32: Tangente a una circonferenza Teorema 6.35 Sia data una circonferenza di centro O e raggio r, e sia P un punto su di essa. Esiste una e una sola retta r che passa per P e lascia tutta la circonferenza dalla stessa parte. Tale retta risulta perpendicolare al raggio OP e si dice la tangente in P alla circonferenza. Tornando un attimo ai triangoli, si osservi che il circumcentro D è equidistante dai tre vertici del triangolo e quindi se si disegna una circonferenza di centro D e passante per uno dei vertici, essa toccherà anche gli altri due, lasciando il triangolo al suo interno. Questa circonferenza risulta circoscritta al triangolo, ed è per questo che il circumcentro ha tale nome. In modo simile, l’incentro E è equidistante dai tre lati, pertanto se disegniamo una circonferenza di centro E e raggio dato dalla distanza di E da uno qualsiasi dei tre lati del triangolo, questa circonferenza risulta tangente ai tre lati ed è tutta contenuta all’interno del triangolo; si dice che questa è la circonferenza inscritta nel triangolo, ed è per questo che E si dice l’incentro. Altri luoghi geometrici importanti sono le cosiddette coniche: l’ellisse, la parabola e l’iperbole; come si sa, queste curve hanno il nome di coniche perché possono essere ottenute intersecando un cono con un piano. Per cono si intende la figura solida originata da una retta che ruota nello spazio intorno ad un’altra retta ad essa incidente: la retta ruotante si dice la generatrice del cono, mentre la retta fissa è detta l’asse del cono, e il loro punto d’incontro si dice il vertice del cono (si veda anche la Sezione 6.8). Se si considera un piano incidente con l’asse del cono, l’intersezione risulta un’ellisse; nel caso particolare in cui il piano sia perpendicolare all’asse si ottiene una circonferenza, che pertanto deve essere considerata una conica, caso particolare di ellisse. Se il piano è parallelo alla generatrice, la figura che si ottiene è una parabola. Infine, se il piano è parallelo all’asse, si ha un’iperbole. Queste definizioni classiche sono, comunque, meno utili nella pratica delle definizioni di queste curve come luoghi geometrici; come vedremo, le definizioni saranno utilizzate in Geometria Analitica per ottenere l’equazione delle curve. Definizione 6.11 Dati due punti F1 ed F2 , detti Prova: Nella Figura 6.32 si consideri la retta r pas- fuochi, si dice ellisse il luogo geometrico dei punti la sante per P e perpendicolare ad OP . Se prendiamo su cui somma delle distanze da F ed F è costante. 1 2 r un punto Q diverso da P , il triangolo OP Q è retto Come conseguenza di questa definizione, l’ellisse in P e quindi, per il teorema di Pitagora, OQ > OP ; quindi r non ha altri punti in comune, se non P , con (vedi Figura 6.33) risulta essere una figura limitata, 183 6.6. LA GEOMETRIA DELLA CIRCONFERENZA P b b b b b F1 F2 b b bF b b d Figura 6.33: Costruzione dell’ellisse Figura 6.35: Costruzione della parabola cioè racchiusa in una porzione finita del piano, come la circonferenza; in effetti, se i due fuochi coincidono l’ellisse diventa proprio una circonferenza avente F1 = F2 come centro, e per raggio la metà della costante, somma delle distanze dai fuochi. In modo analogo: è la costruzione dell’ellisse, che generalizza il metodo empirico per disegnare una circonferenza, cioè piantare uno spillo nel centro della circonferenza e tenere una matita a distanza fisse collegandola allo spillo con una cordicella. Per l’ellisse, come si vede nella Figurs Definizione 6.12 Dati due punti F1 ed F2 , detti 6.33, fissati due spilli nei fuochi e unitoli con una corfuochi, si dice iperbole il luogo geometrico dei punti dicella di lunghezza uguale alla somma delle distanze, la cui differenza delle distanze da F1 ed F2 è costante. la figura si ottiene facendo scorrere la matita lungo la corda, cosı̀ che questa rimanga sempre distesa. Ancora oggi i giardinieri tracciano i confini delle aiole a forma di cerchio e di ellisse con questi metodi; al posto degli spilli usano paletti e invece di filo utilizzano una corda. Più complessa è la costruzione pratica dell’iperbole e della parabola, che si possono comunque disegnare per punti seguendo le corrispondenti definizioni. Comunque, l’iperbole della Figura 6.34 è Fb1 Fb2 stata costruita per punti in modo analitico, come si imparerà nel prossimo capitolo. 6.6 Figura 6.34: L’iperbole In questo caso (v. Figura 6.34), i punti dell’iperbole possono essere distanti dai fuochi quanto si vuole, purché la differenza rimanga fissata; pertanto, l’iperbole è una figura non limitata. Analogamente non limitata è la parabola: Definizione 6.13 Dato un punto F detto fuoco e una retta d detta direttrice, si dice parabola il luogo dei punti equidistanti da F e da d. Le definizioni possono essere utilizzate per costruire effettivamente le curve. Particolarmente semplice La geometria della circonferenza Le proprietà della circonferenza sono interessanti quanto quelle dei triangoli, e, come questi sono i poligoni che più spesso si incontrano nella pratica, cosı̀ la circonferenza è la curva non poligonale più frequente. Il fatto che possa essere disegnata in modo elementare con il compasso, la rende di facile uso e, d’altra parte, sembra che la Natura si sia ispirata più alle forma rotonde che a quelle poligonali. Una caratteristica importante è costituita dal fatto che la circonferenza è determinata univocamente da tre dei suoi punti. Ciò è stabilito da un teorema e dalla corrispondente costruzione: Teorema 6.36 Dati tre punti non allineati A, B, C esiste una e una sola circonferenza che passi per tali tre punti 184 CAPITOLO 6. GEOMETRIA EUCLIDEA C b b O b b A B Figura 6.36: Circonferenza per tre punti Prova: Si consideri la Figura 6.36. Sia r l’asse del segmento AB e sia s l’asse del segmento BC. Se A, B, C non sono allineati, r ed s non sono paralleli e si incontrano nel punto O. Questo punto ha la stessa distanza da A e da B (trovandosi sull’asse r del relativo segmento) e da B e da C (trovandosi sull’asse s del relativo segmento). Quindi, la circonferenza di centro O e raggio OA = OB = OC passa per i tre punti, ed è unica, avendo centro e raggio determinati. C e D, l’angolo determinato dalle due semirette si dice angolo alla circonferenza. Se un angolo al centro e un angolo alla circonferenza determinano lo stesso arco AB, si dicono corrispondenti; se invece uno determina l’arco AB e l’altro l’arco esplementare, si dicono corrispondenti esplementari. Si osservi che raddoppiando l’angolo al centro anche l’arco circolare corrispondente raddoppia; ciò ci dice che angoli ed archi sono grandezze direttamente proporzionali, e questo fatto, importante di per sé, verrà usato in Trigonometria per definire la misura in radianti degli angoli. P Ob P A Ob Q B A B Figura 6.38: Angoli al centro e alla circonferenza - 1 Le proprietà principali della circonferenza sono leQuesta lunga definizione introduce una serie di congate alla seguente definizione, per la quale si faccia cetti importanti, che vanno ritenuti esattamente, inriferimento alla Figura 6.37. sieme alla definizione di retta tangente. Si ha allora il fondamentale risultato: P O b Teorema 6.37 Sia data una circonferenza di centro b è O e sia P un punto qualsiasi su di essa; se AOB un angolo al centro ed APbB un suo corrispondente angolo alla circonferenza, allora il primo è il doppio del secondo. Prova: Sono da considerare tre casi, a seconda delle posizioni reciproche dei punti. Nel primo caso (Figura 6.37) si osservi che i triangoli AOP e BOP sono A≡C B≡D b = isosceli; per il teorema dell’angolo esterno: QOA b + APbO = 2APbO e QOB b = OBP b + B PbO = OAP Q 2B PbO; sommando membro a membro queste due b = 2APbB. Nel secondo caso uguaglianze si ha: AOB Figura 6.37: Proprietà della circonferenza (Figura 6.38, a sinistra) AOP e BOP sono ancora isosceli; il teorema dell’angolo esterno questa volta dà: Definizione 6.14 Data una circonferenza, si dice b = OPbA + AOP b = 2OPbA AOQ angolo al centro ogni angolo che abbia come vertice il b = OPbB + P BO b = 2OPbB; B OQ centro O della circonferenza. Se le due semirette che formano l’angolo incontrano la circonferenza nei pun- facendo la differenza si ha AOB b = 2APbB. Infine, nel ti A e B, la parte di circonferenza interna all’angolo caso di transizione (Figura 6.38, a destra), il teorema si dice arco circolare interno; l’altra parte si dice arco b = OPbB +P BO b = dell’angolo esterno dà subito AOB circolare esterno o esplementare. La parte di cerchio b 2AP B, essendo isoscele il triangolo BOP . compresa nell’angolo si dice settore circolare e il segCome si capisce dalla dimostrazione, la posizione mento che unisce i due punti A e b è detto corda. Se P è un punto della circonferenza e da esso partono del punto P sulla circonferenza è inessenziale. Cosa due semirette che tagliano la circonferenza nei punti succede allora quando P si avvicina ad A o a B, tanto 185 6.6. LA GEOMETRIA DELLA CIRCONFERENZA da confondersi con tali punti? Quando P tende ad A, la semiretta P B rimane ben identificata, ma cosa accade alla semiretta P A? Si può intuire che essa si trasformi nella tangente passante per A ≡ P e quindi ci possiamo aspettare che il teorema valga anche in questo caso limite. Possiamo comunque stabilire questo fatto con un teorema che consideri la situazione come un problema a sé stante, e non un problema al limite (vedere Figura 6.39 a sinistra): Ob b O A B r A B P Corollario 6.41 Un triangolo inscritto in una semicirconferenza è retto e, viceversa, ogni triangolo rettangolo può essere inscritto in mezza circonferenza. Prova: Se un triangolo è inscritto in mezza circonferenza, allora l’ipotenusa coincide con un diametro; esso determina un angolo al centro di 180◦ , e quindi l’angolo opposto, come corrispondente alla circonferenza, vale 90◦ . Per il viceversa, basta osservare che il circumcentro del triangolo è giusto il punto di mezzo dell’ipotenusa. Questo corollario è alla base di molte considerazioni sui triangoli rettangoli ed è quasi importante come il Teorema di Pitagora. Vediamo, a mo’ di esempio, come questo corollario, abbinato ai teoremi di Euclide, ci permetta di trovare il medio proporzionale tra due segmenti (vedere Figura 6.40): Figura 6.39: Angoli al centro e alla circonferenza - 2 b un angolo al centro e sia Teorema 6.38 Sia B OA b B Ar l’angolo formato dalla retta AB e dalla retta b = tangente alla circonferenza r in A; allora B OA b 2B Ar, che pertanto può essere considerato un angolo alla circonferenza di tipo degenere. P b A M B≡C≡H D Figura 6.40: Costruzione del medio proporzionale b è retto, si ha: B Ar b = Prova: Poiché l’angolo OAr b 90◦ − OAB; il triangolo BAO è isoscele e quindi b b cioè B OA b = 180◦ − 2(90◦ − Algoritmo 6.5 (Medio proporzionale) B OA = 180◦ − 2OAB, Ingresso: Due segmenti AB e CD; b b B Ar) = 2B Ar, che è ciò che volevamo dimostrare. Uscita: Il segmento P H tale che AB : P H = P H : Ci possiamo ora chiedere cosa succede se consi- CD. deriamo l’angolo esplementare (vedere Figura 6.39 a 1. si riportano su una retta i due segmenti in modo destra): che B ≡ C; si ottiene cosı̀ il segmento AD; b b Teorema 6.39 Sia AOB un angolo al centro e AP B 2. dal punto di mezzo M di AD si traccia una un angolo alla circonferenza che insiste sull’arco semicirconferenza di raggio AM ; b b è doppio del esplementare di AOB. Allora AOB 3. dal punto B ≡ C ≡ H si traccia la perpendicolasupplementare di APbB. re ad AD fino ad incontrare la semicirconferenza b l’angolo esplementare di Prova: Sia 360◦ − AOB nel punto P (si osservi che ADP è un triangolo b che insiste sull’arco esplementare AB; per il AOB rettangolo, di cui AB e CD sono le proiezioni b = 2APbB, cioè Teorema 6.37 si ha allora: 360◦ −AOB dei cateti sull’ipotenusa); ◦ b b AOB = 2(180 −AP B) che è proprio la proprietà che 4. il segmento P H è il medio proporzionale cercato volevamo dimostrare. (P H è l’altezza relativa all’ipotenusa). Ricco di applicazioni è anche il seguente: Corollario 6.40 Se un quadrilatero è inscritto in una circonferenza, allora gli angoli opposti sono Teorema 6.42 Sia data una circonferenza e sia P supplementari. un punto fuori di essa. Sia P T una tangente da P alla circonferenza e sia P AB una retta secante la cirProva: Infatti sono angoli alla circonferenza che conferenza che la taglia nei punti A e B. Vale allora insistono su un arco e sul suo esplementare. la proporzione: P A : P T = P T : P B, cioè il segmenUna conseguenza molto importante dei teoremi to di tangente è medio proporzionale tra i segmenti visti è il seguente: staccati su una secante della circonferenza. 186 CAPITOLO 6. GEOMETRIA EUCLIDEA leggermente semplificare e si ottiene una formula interessante quando come secante alla circonferenza si considera la retta OP : T r d A P b P B A′ B′ Figura 6.41: Tangente e secanti dallo stesso punto Prova: Si congiungano (v. Figura 6.41) A e B con T e si considerino i triangoli P AT e P T B; essi sono simili perché hanno l’angolo Pb in comune e gli angoli b e ATbP uguali, poiché entrambi insistono sulABT l’arco AT (quindi anche i terzi angoli sono congruenti). Da questa similitudine discende la proporzione cercata. Questo significa che il prodotto P A · P T è costante e quindi se, come in figura, P A′ B ′ è un’altra secante alla circonferenza, si ha P A?·P B ′ = P A·P B = P T 2 . Poiché il medio proporzionale si sa costruire, questo teorema permette di trovare il punto T di tangenza alla circonferenza di una retta passante per P : Algoritmo 6.6 (Tangenti da un punto esterno) Ingresso: Una circonferenza e un punto P ad essa esterno; Uscita: I punti di tangenza sulla circonferenza delle rette passanti per P ; 1. Si traccia una secante P AB qualsiasi; 2. Si costruisce, come visto in precedenza, il medio proporzionale tra i segmenti P A e P B; sia CH tale segmento; 3. con il compasso, facendo centro in P , si traccia una circonferenza di raggio CH; 4. i punti in cui questa circonferenza taglia quella data sono i punti di tangenza cercati; 5. si uniscono, se si vuole, al punto P . Sia data una circonferenza di centro O. Se P è un punto del piano che non sia il centro della circonferenza, si dice distanza di P dalla circonferenza la lunghezza del segmento P A, dove A è il punto di intersezione della circonferenza con la retta P O. E’ chiaro che se P ≡ O, la distanza è il raggio della circonferenza e che se P si trova sulla circonferenza la distanza è zero. I risultati precedenti si possono Corollario 6.43 Se P è un punto esterno a una circonferenza di raggio r e d è la distanza di P dalla circonferenza, allora la misura t del segmento Pp T che unisce P a uno dei punti di tangenza è: t = d(d + 2r). Prova: Come detto, basta considerare come secante la retta P O. La quantità t2 si dice la potenza del punto P rispetto alla circonferenza. Dalla Figura 6.41, si ha t2 = P A · P B = P A′ · P B ′ . Il problema di determinare la misura della circonferenza e il calcolo dell’area del cerchio assillarono (se cosı̀ si può dire) i matematici antichi, e anche quelli più moderni, diciamo fino al XIX secolo. Il problema consiste nel determinare il valore esatto del numero π, il rapporto tra circonferenza e diametro. Gli Egizi e i Babilonesi si erano accorti che questo rapporto è fisso, cioè indipendente dalla particolare circonferenza o dal particolare cerchio considerato. Essi usavano stime più o meno approssimate: stime grossolane come 3 o molto più accurate come il valore razionale 22/7 = 3.142857 . . .. Immaginando appunto che π fosse un numero razionale, si tentò di trovare un metodo di scomposizione del cerchio che ne dimostrasse l’equivalenza con una figura, della quale si potesse trovare direttamente l’area (problema della quadratura del cerchio). In effetti, la √ cosa avrebbe potuto funzionare anche se π, come 2, fosse stato un numero irrazionale, ma esprimibile per mezzo di radicali. Nonostante infiniti tentativi, nessuno fu capace di quadrare il cerchio, finché, nel 1882, Lindemann riuscı̀ a dimostrare che π è un numero trascendente, cioè non può essere soluzione di un’equazione algebrica (polinomiale) a coefficienti interi. Ciò implica che la quadratura del cerchio (o la rettificazione della circonferenza) è impossibile se si usano solo la riga e il compasso. Infatti, come vedremo studiando la Geometria Analitica, la retta corrisponde ad un’equazione algebrica di primo grado e la circonferenza a una di secondo grado; quindi, ogni problema risolubile con la riga e il compasso corrisponde a un sistema di equazioni algebriche, equivalente a un’unica equazione algebrica, come si può intuire pensando al metodo di sostituzione. La determinazione di π è il problema di base della misurazione di circonferenze e cerchi; infatti, vale il seguente: Teorema 6.44 Sia π il rapporto tra la misura di una circonferenza e il suo diametro; dato un cerchio di raggio r, la sua area misura πr2 , e la circonferenza che lo delimita ha lunghezza 2πr. 187 6.7. POLIGONI REGOLARI E CERCHIO Prova: La misura della circonferenza è ovvia, per la definizione di π. Per l’area, possiamo immaginare di suddividere il cerchio in tanti triangoli isosceli congruenti con il vertice opposto alla base nel centro e gli altri vertici in punti molto vicini della circonferenza, diciamo a distanza a l’uno dall’altro. Se n è il numero di tali triangoli, la lunghezza del perimetro sarà na e questa quantità è assimilabile alla lunghezza della circonferenza 2πr quando n è molto grande. D’altra parte, quando n è molto grande, a è molto piccolo e quindi l’apotema (cioè l’altezza dei vari triangoli) è assimilabile al raggio. Questo vuol dire che l’area di ciascun triangolo è ar/2 e l’area del cerchio sarà assimilabile a: nar/2 = 2πrr/2 = πr2 un suo valore approssimato per difetto e per eccesso. In quanto all’area, è chiaro che l’apotema dei vari poligoni, al crescere di n, si avvicina sempre di più al raggio, e ciò rende conto di quanto affermato nel teorema precedente. Concludiamo questa sezione con la seguente definizione: Definizione 6.15 Si dicono concentriche due o più circonferenze che hanno lo stesso centro. L’area compresa tra due circonferenze concentriche si dice corona circolare. Per differenza, è immediato osservare che l’area di una corona circolare determinata da due circonferenze di raggio R ed r (con R > r) è: A = π(R2 − r2 ). come desiderato. 6.7 Figura 6.42: Area del cerchio Questa dimostrazione, anche se intuitivamente valida, non è certamente molto rigorosa, almeno nella forma in cui l’abbiamo messa. Per cercare di renderla più precisa, si immagini di costruire dei poligoni inscritti e circoscritti alla circonferenza che si vuole misurare (v. Figura 6.42); se questi poligoni hanno lo stesso numero di lati n e facciamo crescere n tanto quanto vogliamo, il perimetro e l’area dei poligoni si avvicineranno alla lunghezza della circonferenza e all’area del cerchio, e differiranno tra di loro sempre meno, fino a che questa differenza non divenga praticamente nulla. Se Pn è il perimetro del poligono circoscritto, pn di quello inscritto e c è la misura della circonferenza, si ha Pn ≥ c ≥ pn e Pn − pn tanto piccolo da essere pressoché 0; nella terminologia delle successioni di Cauchy, esse determinano lo stesso numero reale. Ma Pn e pn possono essere calcolati e questo ci darà una forte caratterizzazione di π, cioè Poligoni regolari e cerchio Riprendiamo ora la definizione di “poligono regolare” data nella Sezione 6.2. Se dai vertici disegniamo le bisettrici agli angoli, queste si intersecano in un punto detto centro del poligono: infatti, tutti i triangoli determinati dai lati e da queste bisettrici devono essere uguali per il secondo criterio di congruenza. Quindi il centro del poligono è equidistante da tutti i vertici, e questo significa che il poligono può essere circoscritto da una circonferenza che ha per raggio la distanza dal centro di ciascun vertice. D’altra parte, i triangoli considerati sono tutti isosceli, avendo gli angoli alla base uguali. Quindi la circonferenza di centro il centro del poligono e raggio la distanza di tale centro dai lati (cioè l’altezza dei triangoli isosceli), è inscritta nel poligono. In altri termini, il poligono è delimitato da una circonferenza inscritta e da una circoscritta; il raggio del cerchio inscritto si dice apotema del poligono ed ha un ruolo molto importante. Teorema 6.45 Il perimetro di un poligono regolare è dato dal prodotto della misura di ciascuno dei suoi lati per il numero dei lati stessi. L’area è data dal perimetro moltiplicato per l’apotema e diviso per 2. Prova: La relazione per il perimetro è ovvia. Per l’area, si divida come visto il poligono in tanti triangoli congruenti; l’area di ciascun triangolo si ottiene moltiplicando il lato per l’apotema e dividendo per 2. Moltiplicando ora questo per il numero dei lati, si ha la formula richiesta. Da questa formula discende l’importanza del concetto di apotema, la cui misura sarà indicata con a. Quando frequentavo le Scuole Elementari, ci insegnavano a trovare l’area di un poligono regolare calcolando l’apotema; questo si trovava moltiplicando il lato ℓ 188 CAPITOLO 6. GEOMETRIA EUCLIDEA per un numero fisso, variabile però da poligono a poE D ligono. Tali numeri erano la mia ossessione, perché non riuscivo a figurarmi come venissero fuori. Solo alla Scuola Media il mistero si cominciò a sciogliere e quella fu per me una bella conquista. La TrigonomeO tria risolve il problema, ma nei casi più semplici sono F C sufficienti considerazioni elementari. Ci proponiamo pertanto di determinare il valore dell’apotema di molti poligoni regolari, esprimendolo in funzione del lato (la cui lunghezza sarà indicata con ℓ) e in funzione A M B del raggio del cerchio circoscritto (la cui lunghezza sarà indicata con r); un minimo di algebra ci perFigura 6.44: Esagono regolare metterà pertanto di calcolare una qualsiasi delle tre quantità a, ℓ, r da ciascuna delle altre. In questa ricerca escluderemo quei poligoni, come l’ettagono (il Teorema 6.48 Per il poligono √ regolare con√sei lati, poligono regolare con sette lati) che richiedono no- l’esagono, abbiamo: a = ℓ 3/2 ed a = r 3/2 ≈ zioni che saranno viste solo nel capitolo relativo alla 0.866 × r. Trigonometria. Cominciamo col caso più semplice: b vale 360◦ /6 = 60◦ e quindi il Prova: L’angolo AOB triangolo ABO è equilatero. Di conseguenza AB = Teorema 6.46 Per il più semplice dei poligoni √ regoOB, cioè ℓ = r e questo conclude la dimostrazione, lari, il triangolo equilatero, si ha: a = ℓ × 3/6 ≈ poiché l’apotema OM è l’altezza di tale triangolo. ℓ × 0.289 ed a = r/2 = r × 0.5. C C D O O A M C B′ B A M B N B M O Figura 6.43: Triangolo e quadrato A Prova: Facendo riferimento alla Figura 6.43, il centro O è anche il punto di incontro delle mediane Figura 6.45: Pentagono e decagono e quindi l’apotema è OM = OC/2 e questo dà la seconda formula. Inoltre, come Il caso del pentagono si affronta meglio se risolvia√ sappiamo, CM è anche l’altezza, per cui CM = ℓ 3/2; applicando ancora mo il problema per il decagono, il poligono regolare la√regola della mediana abbiamo: OM = CM /3 = con dieci lati: ℓ 3/6. Teorema 6.49 Per il poligono regolare con dieci Anche per il quadrato la valutazione è semplice: lati, il decagono, si ha: s √ √ Teorema 6.47 Per il poligono regolare con√quattro 5+1 5+ 5 ≈ 1.539 × ℓ a=ℓ lati, il quadrato, si ha: a = ℓ/2 ed a = r × 2/2 ≈ 2 8 0.707 × r. s √ 5+ 5 Prova: Facendo riferimento alla Figura 6.43, l’aa=r ≈ 0.951 × r potema OM è chiaramente√metà del lato CB.√Inol8 tre, come si sa, OB = OM 2 da cui OM = r 2/2. Prova: Con riferimento alla Figura 6.45 dove AB è il b vale 360◦ /10 = 36◦ lato del decagono, l’angolo AOB Saltiamo per il momento il pentagono e passia- e quindi ABO è il triangolo armonico che conosciamo ad occuparci dell’esagono, un altro caso molto mo. Per quanto visto nel Teorema 6.30 abbiamo: √ semplice: ℓ = r × ( 5 − 1)/2; questo permette di calcolare 189 6.7. POLIGONI REGOLARI E CERCHIO Prova: Facciamo ancora riferimento alla Figura 6.45, immaginando che AC sia il lato del quadrato e AB = ℓ sia quello dell’ottagono. Poiché ON √ è l’apotema del quadrato, abbiamo N B = r − r 2/2 = √ 2 2 2 r(2 − 2)/2 e di conseguenza AB = AN + N B = p √ √ . Quindi AB = ℓ = r 2 − 2 e, vicever(2 − 2)r2p √ 2 2 sa, r = ℓ/ 2 − 2. Ora, da OM = r2 − AM si √ 2 2 trova OM = (2 + 2)r /4 = a2 , da cui si ricava la Siamo ora in grado di risolvere il caso del seconda formula. Poi, essendo a2 = r2 − (ℓ/2)2 , si ha: pentagono: √ ℓ2 ℓ2 3+2 2 2 √ − a2 = = ℓ , Teorema 6.50 Per il poligono regolare con cinque 4 4 2− 2 lati, il pentagono, si ha: espressione equivalente alla prima formula. √ √ s 1+ 5 5+ 5 Per l’ennagono e l’undecagono le cose si fanno più ≈ 0.688 × ℓ a=ℓ 4 10 difficili, ma il lettore potrà affrontare l’utile esercizio √ di trovare le espressioni per l’apotema del dodecagono 1+ 5 (il poligono regolare con 12 lati) partendo dall’esagoa=r ≈ 0.809 × r. 4 no e procedendo in modo analogo a quanto si è fatto Prova: Facendo ancora riferimento alla Figura 6.45, per l’ottagono. il segmento AC rappresenta il lato del pentagono e Abbiamo già osservato che ogni poligono regolare, ON l’apotema. Si prenda B ′ simmetrico di B rispetto oltre ad essere inscritto nella circonferenza di ragb ′ = CB c′ B = 72◦ , si ha B CB b ′ = gio OA, la distanza del centro del poligono da uno ad AC, e poiché C BB ◦ ′ 18 , per cui CBB è simile a BOA. Quindi BB ′ : qualsiasi dei suoi vertici, è anche circoscritto alla cirAB = BC : OB, e poiché BC = AB si ricava: conferenza che ha per centro O e raggio OM , l’apoÃ√ !2 tema dello stesso poligono. Vogliamo ora affrontare √ 5−1 3− 5 1 il calcolo approssimato di π seguendo l’impostazione r= r. BN = 2 2 4 appena accennata. Ci saranno utili due risultati, il primo dei quali già lo conosciamo, almeno in un paio Sottraendo questa quantità da OB = r si ha per l’a- di casi particolari. potema l’espressione desiderata. Per il segmento CN Teorema 6.52 Sia ℓ la misura del lato di un poligosi ottiene allora: no regolare con n lati inscritto in una circonferenza s à √ !2 √ di raggio unitario; allora la misura del lato del po1+ 5 5− 5 2 CN = r2 − r2 ; CN = r . ligono di 2n lati inscritto nella stessa circonferenza 4 8 è: q p Facendo infine il rapporto tra l’apotema già trovato ℓ′ = 2 − 4 − ℓ2 . e il lato AC = 2 CN si trova: Prova: Sia, come nella Figura 6.45, AC = ℓ il la√ s √ √ s to del poligono di n lati inscritto nella circonferenza 1+ 5 a 2 1+ 5 5+ 5 √ = = unitaria di centro O; sarà quindi AB = ℓ′ il lato del ℓ 4 4 10 5− 5 b poligono di 2n lati, essendo OB la bisettrice di AOC. Poiché OAC è un AN = ℓ/2 come desiderato. ptriangolo isoscele, si hap e quindi ON = 1 − ℓ2 /4 e BN = 1 − 1 − ℓ2 /4. L’ottagono, il poligono regolare con 8 lati, ha ri- Poiché l’angolo in M è retto, si ha il valore di BA: spetto al quadrato la stessa relazione che il decagovà s !2 u r r no ha con il pentagono; questa volta, però, proceu 2 2 ℓ ℓ2 ℓ t ′ diamo all’inverso, sfruttando le nostre conoscenze sul + = 2−2 1− ℓ = 1− 1− 4 4 4 quadrato. l’apotema OM applicando il teorema di Pitagora ad √ √ 2 AM O: OM = r2 −r2 ( 5−1)2 /4 = r2 (10+2 5)/16, cioè: s √ 5+ 5 × r. OM = 8 √ √ Sostituendo ora ad r il valore 2ℓ/( 5 − 1) = ℓ( 5 + 1)/2, si ha subito anche la prima espressione. Teorema 6.51 Per l’ottagono si ha: p √ 3+2 2 ≈ 1.207 × ℓ a=ℓ× 2 p √ 2+ 2 a=r× ≈ 0.924 × r 2 e questo dà ℓ′ = p √ 2 − 4 − ℓ2 . Questo teorema si trasforma facilmente in un algoritmo per calcolare il perimetro di un poligono di 2n lati; come sappiamo il quadrato inscritto nella circonferenza di raggio unitario ha come semiperimetro √ 2 2 ≈ 2.828, per cui: 190 CAPITOLO 6. GEOMETRIA EUCLIDEA Algoritmo 6.7 (Valori per difetto di π) Ingresso: Un numero naturale n > 2; Uscita: Il perimetro del poligono regolare con 2n lati; √ 1. si pone ℓ := 2 e j := 2; 2. fino a che risulta j ≤ n si calcola: (a) j := j + 1; p √ (b) ℓ := 2 − 4 − ℓ2 ; lati 4 8 16 32 64 128 256 512 1024 per difetto 2.8284271247 3.0614674589 3.1214451523 3.1365484905 3.1403311570 3.1412772509 3.1415138011 3.1415729404 3.1415877253 per eccesso 4.0 3.3137084990 3.1825978781 3.1517249074 3.1441183852 3.1422236299 3.1417503692 3.1416320807 3.1416025103 3. si esce con p := 2n × ℓ. Per i poligoni circoscritti si ha il seguente: Tabella 6.2: Valori di π per difetto e per eccesso Teorema 6.53 Sia ℓ la misura del lato del poligono regolare di n lati circoscritto alla circonferenza uni- cioè: ! à r taria; allora la misura ℓ′ del lato del poligono con 2n . ℓ 2 2 ℓ ℓ ℓ lati circoscritto alla stessa circonferenza vale: − 1+ = AS = − 1 + 2 4 4 2 p ℓ′ = 4( 1 + ℓ2 /4 − 1)/ℓ Ãr ! . ℓ ℓ2 . = 1+ −1 , 4 2 e questa è la metà del lato del poligono con 2n lati. B T S O A Figura 6.46: Poligono circoscritto Prova: Nella Figura 6.46, sia AT = ℓ/2 metà del lato del poligono di n lati. Sia OS la bisettrib ; i due triangoli BAT e OST sono simili ce di AOT b è l’angoperché l’angolo Tb è comune e l’angolo B AT lo alla circonferenza corrispondente all’angolo al cenb del quale, pertanto, vale la metà. Si ha tro AOB allora la proporzione: OT : AT = T S : BT , cioè OT : AT = (AT − AS) : (OT − OB). D’altra parte, abbiamo AT = ℓ/2 e quindi: OT = q 2 2 OA + AT = p 1 + ℓ2 /4. La proporzione diviene: p p 1 + ℓ2 /4 : ℓ/2 = (ℓ/2 − AS) : ( 1 + ℓ2 /4 − 1). Pertanto: ℓ − AS = 2 Ãr !r ℓ2 ℓ2 . ℓ 1+ 1+ −1 , 4 4 2 Un algoritmo analogo al precedente ci dà allora i valori di π approssimati per eccesso. Nella Tabella 6.2 riportiamo i valori ottenuti fino al poligono con 1024 lati. Si osservi che la media degli ultimi due valori è 3.1415951178 contro un valore effettivo π = 3.1415926536 . . .. Nota 6.4 Il valore di π, come rapporto tra la circonferenza e il diametro, è stato oggetto di curiosità e di ricerca fino dalla più remota antichità. Nella Bibbia si trova il valore 3 e nel papiro di Rhind viene utilizzata una quantità che vale π ≈ 3.1605. L’approssimazione razionale che ha avuto più successo è stata 22/7 ≈ 3.142857 . . ., anche se i cinesi e gli occidentali conoscevano 355/113, che ha ben sette cifre decimali esatte. In effetti, queste approssimazioni hanno spesso carattere empirico, senza essere sostenute da una teoria che permetta di migliorarle o almeno valutare il loro grado di precisione. Il metodo dei poligoni inscritti e circoscritti è stato il primo metodo veramente scientifico e fu inventato da Archimede, che riuscı̀ a portare avanti i conti fino al poligono di 96 lati; la precisione da lui trovata rimase imbattuta fino ai tempi moderni. Verso il 1600, quando nacque la Matematica moderna, i metodi per calcolare π si affinarono con la trigonometria e le serie di potenze. Si verificò allora una specie di corsa per determinare π con sempre maggiore precisione. Leibniz scoprı̀ che: π 1 1 1 1 = 1 − + − + − ···, 4 3 5 7 9 191 6.8. GEOMETRIA DELLO SPAZIO ma computazionalmente questa formula non vale molto. Più successo ebbe John Machin che trovò un metodo per calcolare le prime cento cifre decimali (si veda al capitolo sulla Trigonometria) e i suoi epigoni migliorarono man mano questo record finché, nel 1853, William Shanks arrivò a 707 cifre. Purtroppo, nel 1947 ci si accorse che tali cifre erano sbagliate a partire dalla 528-esima. Con l’avvento dei calcolatori elettronici, la gara ebbe un’altra impennata e nel 1983 si riuscirono a calcolare oltre 16 milioni di cifre decimali. Occorre dire che questo calcolo ha dello straordinario perché non usa la forza bruta, ma utilizza un nuovo metodo, anche se basato su alcune idee di Gauss vecchie di oltre 150 anni. Al calcolatore fu dato questo semplice algoritmo: Algoritmo 6.8 (Media aritmetico/geometrica) Ingresso: Un numero naturale n > 2; Uscita: il numero π con oltre 2n cifre decimali esatte; √ 1. si pone a := 1, x := 1, b := 2/2, c := 1/4; 2. fino a che risulta j ≤ n + 1 si calcola: √ (a) y := a, a := (a + b)/2, b := b × y; (b) c := c − x × (a − y)2 , x := 2 × x; (c) si scrive in uscita il valore di (a+b)2 /(4×c); tridimensionale; secondo, per il lettore, interpretare correttamente ciò che è stato disegnato. Ancora più difficile è possedere e/o sviluppare un’appropriata intuizione spaziale per poter affrontare e risolvere problemi tridimensionali; scultori e architetti sono in questo molto bravi, ma spesso la gente ha difficoltà a raffigurarsi mentalmente cosa succede nello spazio. Naturalmente, esercitarsi con la geometria può giovare ad accrescere il nostro senso spaziale. In accordo con gli assiomi generali, due punti nello spazio determinano una retta, proprio come sul piano. Per avere un piano α, occorre che siano assegnati tre punti non allineati, il che equivale ad avere una retta e un punto fuori di essa, oppure due rette incidenti in un punto. Ad esempio (v. Figura 6.47), se i tre punti non allineati sono A, B, C, si possono anche avere il punto A e la retta BC, oppure la coppia di rette AB, BC. Una domanda che può imbarazzare, se fatta fuori di questo contesto, è la seguente: abbiamo visto che tre punti non allineati determinano nel piano una e una sola circonferenza; allora, tre punti non allineati nello spazio, quante circonferenze determinano? Si osservi che, ad ogni iterazione, a rappresenta la media aritmetica e c la media geometrica di a e b; per questo il metodo è detto della media aritmetico/geometrica. Il programma ha l’incredibile proprietà di raddoppiare, ad ogni iterazione, il numero delle cifre esatte del risultato: 3.140579250522168248311331268975823311773 3.141592646213542282149344431982695774314 3.141592653589793238279512774801863974381 3.141592653589793238462643383279502884197 3.141592653589793238462643383279502884197 Questa tabella contiene le prime cinque iterazioni (l’ultima è data per controllo) e per arrivare al risultato desiderato furono sufficienti 25 iterazioni. Naturalmente, la parte pesante del programma è data dalle routine per eseguire le operazioni con la necessaria precisione; escluso questo, il risultato è più un problema di gestione della memoria che d’altro. 6.8 Geometria dello spazio Il problema della geometria dello spazio è costituito dalla difficoltà che tutti abbiamo a rappresentare sia mentalmente, sia figurativamente gli oggetti a tre dimensioni. Ciò che possiamo disegnare su un foglio è solamente una proiezione della realtà spaziale e ciò pone un doppio problema: primo, per il disegnatore, trovare una proiezione che non nasconda, ma anzi metta in evidenza i punti nevralgici di una situazione C b b b α B A Figura 6.47: Piani e angolo diedro Quando abbiamo un piano, esso definisce due semispazi, cosı̀ come una retta sul piano definisce due semipiani e un punto su una retta due semirette. Due piani che si intersecano, si intersecano lungo una retta, e quindi dividono lo spazio in quattro parti, ognuna delle quali è detta un diedro o angolo diedro, per analogia con gli angoli del piano (v. Figura 6.47). Normalmente, per assegnare un diedro, si assegnano i due semipiani che lo definiscono e che hanno origine nella retta di intersezione, detta spigolo del diedro. Come gli angoli, i diedri formano una classe di grandezze e su tale aspetto torneremo più avanti. Ovviamente, due piani che non si intersecano si dicono paralleli; purtroppo, come per le rette nel piano, questa non può essere una definizione valida, poiché implica una procedura infinita per accorgersi che i due piani non si incontrano mai. Occorre allora trovare un metodo finito e questo, come ora vedremo, non è del tutto banale. 192 CAPITOLO 6. GEOMETRIA EUCLIDEA Q b s r b b Q′ P s′ α Figura 6.48: Posizione di due rette Cominciamo col definire la posizione reciproca di due rette nello spazio (vedere Figura ??). Questo può esser fatto costruttivamente e in termini finiti mediante il seguente: Algoritmo 6.9 (Posizione di due rette) Ingresso: due rette r, s nello spazio. Uscita: La posizione reciproca di r ed s. α e di una retta r. Questa volta procediamo discorsivamente, lasciando al lettore il compito di riportare ad un algoritmo quanto ora diremo. Prima di tutto è facile vedere se r giace su α prendendo due punti distinti P, Q della retta e verificando se si trovano su α. Se r non giace su α, si prende P su α (e non su r) e si determina il piano β passante per r e per P . Ora, sia s la retta di intersezione tra α e β; si hanno due possibilità verificabili direttamente, in quanto r, s sono complanari: • (caso della retta r1 nella Figura 6.49) r ed s sono parallele: allora r è parallela al piano α; infatti, se r incontrasse α in Q, le due rette r e P Q determinerebbero un piano e questo dovrebbe coincidere con quello considerato (determinato da r e P ); • (caso della retta r2 nella Figura 6.49) r ed s sono incidenti in Q: allora r ed α si incontrano nel punto Q, che si dice il piede di r su α. 1. si prende un punto P su s; 2. se P giace su r, allora r ed s sono incidenti in P e quindi sono coincidenti o complanari; si esce; r 3. altrimenti, si considera il piano α determinato da r e da P ; t β 4. si prende un punto Q su s diverso da P ; 6. se Q non si trova su α, allora le due rette non hanno punti in comune e si dicono sghembe; β r2 b P u s γ Figura 6.50: Posizione reciproca di due piani r1 s α Q 5. se Q giace su α, allora le rette sono complanari. Il Teorema condparallel permette di stabilire se sono coincidenti, incidenti o parallele; si esce; b Q α Figura 6.49: Rette incidenti Nella Figura 6.48 sono schematizzati i due casi principali: r ed s sono sghembe, mentre r ed s′ sono parallele. Può essere utile ricordare che la distanza tra due rette è la minima distanza tra i punti di una retta e i punti dell’altra. Ora, il secondo passo consiste nel determinare le posizioni reciproche di un piano Questo ci fa capire che se la retta r è parallela al piano α, e consideriamo un qualsiasi piano β contenente r, allora se α, β si intersecano nella retta s, questa risulta parallela ad r. Il lettore è invitato a dare una dimostrazione formale di questo fatto, che ci serve per il terzo passo, cioè per definire la posizione reciproca di due piani. Siano dati due piani α, β e si consideri un terzo piano γ le cui intersezioni con α, β siano le due rette r, s. Se r, s si intersecano in un punto P , allora P appartiene tanto ad α che a β e quindi i due piani si intersecano. Se invece r, s sono parallele (il che può essere verificato, dato che sono complanari in γ), esse potrebbero essere tali semplicemente perché abbiamo preso γ parallela all’intersezione di α e β. Consideriamo allora un piano δ che abbia intersezione con α, β, γ, e consideriamo 193 6.8. GEOMETRIA DELLO SPAZIO Torniamo ora ai diedri. Se r è lo spigolo dei due semipiani α, β che determinano il diedro, si consideri uno qualsiasi dei piani perpendicolari ad r e siano s, t le rette di intersezione con α, β; l’angolo formato dalle semirette s, t che giacciono sui semipiani si dice la sezione normale del diedro e si prende come misura del diedro stesso. Naturalmente, a questo punto, i diedri possono essere considerati grandezze, esattamente come gli angoli. La definizione della somma, dei multipli e dei sottomultipli è ovvia e si parla di diedri acuti, ottusi, convessi, complementari e supplementari proprio come si fa per gli angoli. E’ naturale allora, come sul piano, definire due piani come Teorema 6.54 Sia data una retta p insieme ad un perpendicolari quando formano quattro diedri uguali. punto P su di essa; il luogo delle perpendicolari a p Si prendano ora n rette parallele nello spain P è un piano passante per P . zio; siano r1 , r2 , . . . , rn in quest’ordine e consideriamo gli n piani determinati dalle coppie r1 r2 , r2 r3 , . . . , rn−1 rn , rn r1 . Se ciascuno di questi piap ni lascia tutte le altre rette da una stessa parte dello Q spazio, la zona a comune tra tutti gli n semispazi, si dice prisma indefinito (convesso). Se tagliamo questa α figura con due piani paralleli α, β, la zona del prisma indefinito compresa tra questi piani si dice prisma S (convesso). Le rette di intersezione tra α e β e i piani P s del prisma indefinito determinano due poligoni uguaT li, che si dicono le basi del prisma. I parallelogrammi R t determinati da due rette parallele consecutive e dalle r basi si dicono le facce laterali del prisma. La distanza tra i due piani α e β si dice l’altezza. A seconda che la base sia un triangolo, un quadrilatero, un pentagono, etc., il prisma si dice triangolare, quadranFigura 6.51: Piano perpendicolare a una retta golare, pentagonale, etc.. Se i due piani α e β sono perpendicolari alle rette r1 , . . . , rn , il prisma si dice Prova: Le perpendicolari a p passanti per P sono retto. determinate sui piani passanti per p; ad ogni piano corrisponde una retta perpendicolare a p per P , come sappiamo dalla Geometria del piano. Due di queste α rette, r, s, essendo incidenti in P , determinano un piano α che vogliamo dimostrare essere il luogo cercato. Siano Q, Q′ due punti di p equidistanti da P , ed R, S due punti su r, s rispettivamente. Dalle ipotesi b = Q′ RS, b si ha QR = Q′ R, QS = Q′ S e quindi QRS essendo uguali i due triangoli QRS e Q′ RS. Sia T l’intersezione della retta RS con t, una generica retta r1 r2 r3 passante per P e giacente sul piano α. Dall’uguaglianza dei triangoli QRT, Q′ RT si ha QT = Q′ T e β quindi P T è l’asse di QQ′ nel piano QQ′ T , cioè t è perpendicolare ad r. D’altra parte, se una retta passa per P ma non si trova su α, è facile vedere che essa non può essere perpendicolare ad r, e ciò conclude la prova. le rette t, u di intersezione di δ con α, β. Nella Figura 6.50 non abbiamo di proposito indicato il piano δ, la cui disposizione è però del tutto chiara tramite le rette t ed u. Se t, u si incontrano in Q, di nuovo tale punto sta sia in α sia in β, che pertanto si intersecano. Ma se t, u sono parallele, allora α e β devono essere paralleli. Se infatti si intersecassero nella retta v, questa dovrebbe essere parallela tanto ad r che a t (o, se si preferisce, tanto ad s che ad u) che però, per costruzione, non sono parallele tra di loro. Stabiliti i criteri di parallelismo, si può passare alla perpendicolarità. Questo teorema permette di parlare del piano α perpendicolare alla retta r in un punto P di questa; viceversa, dato un piano α e un suo punto P , è definita la retta perpendicolare ad α passante per P , detto piede della perpendicolare. Figura 6.52: Prisma indefinito e definito I prismi sono le figure tridimensionali più semplici. Per essi si definiscono tre misure, che risultano importanti nelle applicazioni: 194 • la superficie laterale: è la somma delle aree delle facce laterali del prisma; se p è il perimetro della base ed h è l’altezza del prisma, si ha: Sℓ = ph; • la superficie totale: é la somma della superficie laterale e dell’area delle due basi; se ciascuna di queste vale S, si ha: St = Sℓ + 2S; • il volume: è la misura dello spazio occupato dalla figura e vale: V = Sh. Mentre le misure di superficie si rifanno a concetti già introdotti per la Geometria piana, il volume è un concetto nuovo. Il volume di un solido è una grandezza, e pertanto ci si aspetta che il volume dell’unione di due figure sia la somma dei singoli volumi, e cosı̀ via per tutte le altre proprietà delle grandezze. L’unità di misura è definita come il cubo che ha per lato l’unità di misura delle lunghezze. Si noti che un cubo è un prisma retto a base quadrata, la cui altezza è uguale a ciascuno dei lati di base. Occorrerebbero qui dimostrazioni analoghe a quelle fatte a suo tempo per la misura delle aree, ma ne risparmiamo il lettore (e noi stessi!). Naturalmente, la relazione tra figure solide “avere lo stesso volume” è una relazione di equivalenza, e si dice appunto equivalenza tra solidi. Si danno diverse regole per determinare quando due figure sono equivalenti; la più semplice, che discende da quanto appena detto, è che due figure solide sono equivalenti se sono equiscomponibili. Tuttavia, la regola più importante è costituita dal seguente principio, che Archimede già conosceva, ma che Cavalieri teorizzò e usò in modo sistematico: Principio 6.16 (di Cavalieri) Due figure solide che, tagliate con piani paralleli a un piano fisso, generano figure piane equivalenti, sono equivalenti. Questo principio è stato antesignano del calcolo integrale; esso diviene intuitivamente accettabile se pensiamo a una pila di fogli di carta: comunque li spostiamo, lasciandoli paralleli a sé stessi, determinano lo stesso volume, anche se la forma complessiva cambia radicalmente. Applicando il principio di Cavalieri a un prisma, si dimostra immediatamente che esso è equivalente a un prisma retto che abbia la stessa base e la stessa altezza; da questo si passa ad un prisma retto con la stessa altezza e con la base quadrata, equivalente al poligono originale. A questo punto il volume è proprio V = Sh, come si voleva. In particolare, un cubo di lato (ed altezza) a ha volume V = a3 ; inoltre, Sℓ = 4a2 e St = 6a2 . Consideriamo ora un punto O ed n semirette che partano da O, nell’ordine r1 , r2 , . . . , rn . Se gli n piani r1 r2 , r2 r3 , . . . , rn−1 rn , rn r1 sono tali che ognuno di essi lascia da una stessa parte dello spazio le altre CAPITOLO 6. GEOMETRIA EUCLIDEA n−2 semirette, la parte di spazio comune a tutti questi semispazi si dice piramide indefinita (convessa) di vertice O. Se la tagliamo con un piano α, la parte di piramide indefinita compresa tra α ed O si dice piramide. La distanza di O da α si dice l’altezza della piramide. Ognuno dei triangoli di vertice O si dice una faccia laterale, e il poligono determinato da α si dice la base della piramide. In funzione di n si hanno piramidi triangolari, quadrangolari, pentagonali, etc.. Se il poligono di base è un poligono regolare, la piramide si dice regolare; se la base può essere circoscritta a una circonferenza di centro K e la retta OK risulta perpendicolare ad α, la piramide si dice retta. O r1 r3 r2 α Figura 6.53: Angoloide e piramide Le misure relative alle piramidi sono: • la superficie laterale: è la somma delle aree delle facce laterali; se la piramide è retta ed r è il raggio della circonferenza√inscritta nel poligono di base, si ha: Sℓ = p r2 + h2 /2, se p è il perimetro della base; • la superficie totale: è la somma della superficie laterale e dell’area della base: St = Sℓ + S; • il volume: è dato dalla formula V = Sh/3. Anche in questo caso, la misura delle superfici è un esercizio, risolubile di volta in volta con le regole viste per la geometria piana. Il volume, invece, presenta qualche difficoltà, ma fin dall’antichità si sa che: Teorema 6.55 Il volume di una piramide è un terzo del volume di un prisma che abbia la stessa base e la stessa altezza. Prova: Consideriamo una piramide triangolare (Figura 6.54), in quanto l’estensione ad una base qualsiasi è banale. Data la piramide OABC, si costruiscano i segmenti BB ′ e CC ′ paralleli e della stessa lunghezza di OA. La figura solida ABCOB ′ C ′ è 6.8. GEOMETRIA DELLO SPAZIO C′ OX X Q C@QXXX ¡C XXX B ′ ¡ C @Q C X X¡ C @ QQ C C @ Q C C C @ QQ C C C @ C Q C C Q @ C C Q C @ C Q C QC @ CX QC C XX X ¡C A XXX@ C ¡ X@ X @C X¡ B Figura 6.54: Il volume della piramide un prisma triangolare di volume Sh, se S è l’area del triangolo ABC. Se uniamo B con C ′ , la figura solida BOB ′ C ′ è una piramide di vertice B, base OB ′ C ′ uguale ad ABC e altezza h; essa è perciò equivalente ad OABC. D’altra parte, le piramidi OBB ′ C ′ e OBCC ′ sono uguali avendo la stessa altezza e uguale superficie di base. Il prisma, di conseguenza, risulta diviso in tre piramidi equivalenti. 195 no poligoni regolari uguali, e sono uguali anche tutti i diedri e tutti gli angoloidi che lo compongono. Già Platone nel Timeo mostra che di tali poliedri ne esistono solo 5, e per questo i poliedri regolari sono detti anche solidi platonici. Il ragionamento è semplice: se gli angoloidi devono essere tutti uguali, basta prenderne in considerazione uno solo. Le sue facce sono formate da almeno tre poligoni, che possono essere triangoli equilateri, quadrati, pentagoni regolari, etc.. Se le facce sono triangoli equilateri, ogni loro angolo è di 60◦ , e quindi l’angoloide può essere formato da 3, 4 o 5 facce. Infatti, 6 triangoli equilateri darebbero un angolo giro e l’angoloide degenererebbe in un piano, come si era visto con l’osservazione precedente. Se le facce sono quadrati, l’angolo è di 90◦ e l’angoloide ne può contenere solo 3, poiché già 4 arrivano a 360◦ . Se le facce sono pentagoni, ogni angolo è 108◦ e di nuovo l’angoloide ne può contenere solo 3. Con altri poligoni regolari (a partire dagli esagoni che hanno l’angolo di 120◦ ) tre facce superano i 360◦ , e quindi è impossibile formare un angoloide. Fin qui si è solo dimostrata la possibilità di esistenza di 5 poliedri regolari; per dimostrarne l’effettiva realtà basta ora costruirli: • per il triangolo e l’angoloide a tre facce, il poliedro regolare è il tetraedro, o piramide triangolaLa parte di spazio compresa nella zona convessa re; il tetraedro ha in tutto 4 facce, 6 spigoli e 4 della piramide indefinita si dice propriamente un anvertici (o angoloidi); goloide; la misura degli angoloidi è troppo complessa perché la si possa prendere seriamente in considera• per il triangolo e l’angoloide a 4 facce, si zione. Due facce consecutive dell’angoloide formano ha l’ottaedro, o doppia piramide quadrata; un diedro, e quindi un angoloide con k facce determil’ottaedro ha 8 facce, 12 spigoli e 6 vertici; na k diedri. Anche questi possono non presentare una struttura omogenea, dato che le loro sezioni normali • per il triangolo e l’angoloide a 5 facce, si ha corrispondono a piani che sono disposti irregolarmenl’icosaedro; esso ha 20 facce (e da questo deriva te uno rispetto all’altro. Un’osservazione importante il suo nome), 32 spigoli e 12 vertici; riguarda invece gli angoli che ogni coppia di semirette, partenti dal vertice O, forma sul piano della faccia • per il quadrato e l’angoloide a tre facce, si ha corrispondente. Prendiamo un piano α passante per l’esaedro o cubo; esso ha 6 facce, 12 spigoli e 8 O e che non interseca l’angoloide (se non in O stesso); vertici; consideriamo uno degli spigoli dell’angoloide e imma• per il pentagono e l’angoloide a tre facce, si ha giniamo di tagliarlo lungo tale spigolo. Ruotiamo ora il dodecaedro, una specie di pallone da calcio tutte le facce dell’angoloide intorno ad O in modo spigoloso; esso ha 12 facce, 30 spigoli e 20 vertici. da portarle (consecutivamente) sul piano α; in corrispondenza dello spigolo tagliato, avremo un angolo Se con f, s, v indichiamo il numero delle facce, degli “vuoto”, che è la differenza fra un angolo giro e la spigoli e dei vertici di un poliedro, vale sempre la somma dei vari angoli dell’angoloide. In questo moformula di Cartesio-Eulero: f + v = s + 2. do vediamo che la somma degli angoli di un angoloide ◦ è minore di 360 . Nota 6.5 I poliedri regolari sono facilmente coQuesta osservazione ha notevole importanza quanstruibili a partire dal loro sviluppo piano, che qui diado si studiano i poliedri regolari. In generale, un pomo schematicamente per il tetraedro (Figura 6.55) e il cubo (Figura 6.56. liedro è una figura solida delimitata da un numero finito di facce costituite da poligoni piani. Rientrano Conservo ancora il “quaderno di bella” della terza mein questa definizione sia i prismi, sia le piramidi, ma dia nel quale sono riportate le costruzioni di geomefin dall’antichità ci si è chiesti se esistono, e quanti tria dello spazio che la Prof. Del Francia ci faceva sono, i poliedri regolari, cioè i poliedri le cui facce sopreparare a latere dei compiti a casa. Con aghi, fili, 196 CAPITOLO 6. GEOMETRIA EUCLIDEA A3 A A2 D B Tali poliedri sono noti come poliedri archimedei, ma qui noi terminiamo la nostra nota. C C D A1 B Figura 6.55: Tetraedro e suo sviluppo D A D C A B g c g c r r Figura 6.57: Cilindro e cono C B Figura 6.56: Esaedro (cubo) e suo sviluppo stecchini e cartoncino Bristol ci sono ancora costruzioni non del tutto banali. Il lettore, da parte sua, è invitato a costruire almeno i cinque poliedri regolari a partire dal loro sviluppo piano. Queste poliedri furono anche detti figure cosmiche per una presunta corrispondenza con gli elementi costitutivi dell’universo. Può essere curioso leggere la seguente dimostrazione “mistica” del fatto che i poliedri regolari devono essere cinque, non di più né di meno. Il brano si trova nel libro del celebre matematico Luca Pacioli “De Divina Proportione” (1496 – 98) e precede la dimostrazione matematica vista; i disegni dei poliedri riportati dal Pacioli sono di Leonardo da Vinci: “Onde li decti sono chiamati regulari perché sono de lati e angoli e basi equali, e l’uno dall’altro apunto se contiene como se mostrerà e conrespondono a li 5 corpi semplici in natura, cioè terra, aqua, aire, fuoco e quinta essentia cioè virtù celeste che tutti gli altri sustenta in suo essere. E sı̀ como questi corpi semplici sono bastanti e sufficienti in natura, altramente serı̀a arguire Idio superfluo overo diminuto al bisogno naturale, la qual cosa è absurda, como afferma il filosofo che Idio e la natura non opera invano cioè non manca al bisogno e non excede quello.” I solidi platonici sono i più regolari dei poliedri, ma ve ne sono altri, ancora altamente simmetrici, ma con le facce formate da poligoni regolari di vario tipo. Dalle figure poliedriche è facile passare alle figure rotonde. Il cilindro indefinito è il luogo dei punti che hanno distanza minore o uguale a un certo valore r (detto il raggio del cilindro) da una retta assegnata c. Tagliando questa figura con due piani paralleli (vedere Figura 6.57), si ottiene un cilindro, che si dice retto se i due piani sono perpendicolari alla retta c. La distanza h fra questi due piani è l’altezza del cilindro. Come è noto, si ha: Sℓ = 2πrh, St = 2πr2 + 2πrh, V = πr2 h. Il cilindro può essere immaginato come generato da una retta g (detta appunto generatrice) che ruota intorno alla retta c a distanza r da questa. Ciò permette di cogliere l’analogia con la figura successiva, il cono. Data una retta c e una retta g incidente con c in un punto O, il cono indefinito è la figura che si ottiene ruotando g intorno a c in modo che il punto O rimanga fisso. Se tagliamo il cono indefinito con un piano α incidente con c (v. Figura 6.57), lo spazio interno compreso tra O e il piano α si dice cono, che è in particolare retto se α è perpendicolare a c. In generale, la base di un cono cosı̀ definito è un’ellisse, ma la base di un cono retto è un cerchio; si dice apotema la distanza a del vertice O da uno qualsiasi dei punti della circonferenza di base, mentre l’altezza è la distanza h di O dalla base stessa. Per il cono retto, si ha chiaramente: p p a = r 2 + h2 h = a2 − r2 Sℓ = πra, St = πra + πr2 , V = πr2 h/3. 197 6.8. GEOMETRIA DELLO SPAZIO La formula del volume è certo la più interessante, e si dimostra approssimando il cono con una piramide la cui base è un poligono iscritto o circoscritto alla circonferenza di base del cono. Poiché, analogamente, un cilindro può essere approssimato con prismi, la formula deriva dal Teorema 6.55. Il solido rotondo per eccellenza è la sfera; essa può essere definita come il luogo dei punti dello spazio che hanno distanza minore o uguale ad r (il raggio della sfera) da un punto assegnato O, detto il centro. La sfera, però, si può vedere anche come il solido ottenuto dalla rotazione di una semicirconferenza intorno alla retta determinata dai suoi estremi. Nota 6.6 E’ bene insistere sul fatto che molti solidi rotondi possono essere ottenuti per rotazione, poiché, come il lettore vedrà studiando Analisi Matematica all’Università, esistono semplici metodi del calcolo integrale per valutare superficie e volume di solidi di rotazione. Anche storicamente, è opportuno ricordare, un antesignano del calcolo integrale fu Keplero: nel 1615 scrisse il libro Stereometria Doliorum, dove, studiando come calcolare superficie e volume delle botti, in qualche modo e con vari errori, anticipa considerazioni proprie del calcolo integrale. Naturalmente, sia Keplero, sia Cavalieri, furono a loro volta anticipati di circa 18 secoli da Archimede, come ora vedremo. Prova: Si faccia riferimento alla Figura 6.58 nella quale cilindro, semisfera e cono sono stati tagliati con un piano α parallelo alla base del cilindro e del cono. Se riusciamo a dimostrare che la corona circolare di raggio AB (relativa alla scodella) è equivalente al cerchio di raggio CD (relativo al cono), per il Principio di Cavalieri avremo dimostrato il nostro asserto. Se poniamo OC = CD = c e BC = s, per il Teorema di Pitagora si ha: s2 = r2 − c2 , e quindi l’area della corona circolare è: πr2 − πs2 = πr2 − π(r2 − c2 ) = πc2 . Ma questa è l’area del cerchio di raggio CD. La conseguenza è pressoché immediata: Teorema 6.57 Il volume V di una sfera di raggio r è: V = 4πr3 /3. Prova: Sempre con riferimento alla Figura 6.58, il volume del cilindro è Vc = πr2 ·r = πr3 , e quello della scodella, essendo uguale a quello del cono, è un terzo di questo: Vs = πr3 /3. Il volume della semisfera si ottiene per differenza: V /2 = Vc − Vs = 2πr3 /3, e questo è il risultato desiderato. Concludiamo con la formula per il calcolo della superficie della sfera; anche questa fu dimostrata per la prima volta da Archimede con un ragionamento che anticipa i metodi del calcolo differenziale e integrale: Teorema 6.58 La superficie di una sfera di raggio r è quattro volte la superficie di un suo cerchio massimo, cioè S = 4πr2 . A B D b C O Figura 6.58: Volume della sfera Il calcolo del volume di una sfera si basa sul seguente lemma; si dice che Archimede volle che sulla sua tomba fosse incisa la Figura 6.58, sulla quale si basa la sua dimostrazione. Per fissare la terminologia, se abbiamo un cilindro retto di raggio r ed altezza ancora r, in esso possiamo inserire una semisfera di raggio r; la figura solida che si ottiene scavando la semisfera dal cono si dice scodella. Prova: Suddividiamo la superficie della sfera in tanti piccoli poligoni (arrotondati) di dimensione arbitraria Si , non necessariamente uguale per tutti, e uniamo i punti di questi poligoni con il centro O della sfera. Otteniamo cosı̀ delle piramidi di base Si e altezza r, cioè di volume Vi = Si r/3. Il volume V della sfera è dato dalla somma di tutte queste piramidi, cioè dalla somma dei Vi . Mettendo in evidenza r/3 in tale somma e osservando che la somma di tutti gli Si dà proprio S, si ha la relazione: V = Sr/3, ovvero, per il teorema precedente: 4πr3 /3 = Sr/3, e da questa si ricava subito S. Il lettore è stato avvertito che le piramidi hanno la base arrotondata, in quanto la superficie segue quella della sfera; cosı̀ come sta, pertanto, il ragionamento è solo approssimativo. Lo si può rendere esatto considerando poligoni che tagliano e poligoni che sono tangenti alla sfera, mantenendo i lati delle varie basi. Al diminuire di Si , queste basi sono sempre più vicine Lemma 6.56 Il volume della scodella di raggio r è tra di loro. Lasciamo al lettore il godimento di comuguale al volume di un cono che ha r sia come altezza, pletare il ragionamento che, d’altra parte, abbiamo già impostato altre volte. sia come raggio della circonferenza di base. 198 CAPITOLO 6. GEOMETRIA EUCLIDEA Capitolo 7 Le altre Geometrie Il titolo di questo capitolo vuol fare riferimento esplicito al fatto che nella Matematica moderna non esiste soltanto la Geometria Euclidea, l’unica ad essere considerata nell’antichità e fino al 1600, ma vanno considerate altre geometrie, che si sono sviluppate e hanno assunto una propria identità e una propria rilevanza, contribuendo in vario modo all’ampliamento delle nostre conoscenze e al miglioramento della nostra capacità ad affrontare e a risolvere i problemi. Oggi possiamo dire che i primi passi verso le “altre” geometrie furono fatti nel Rinascimento, quando pittori praticanti e speculatori teorici studiarono la prospettiva, dando inizio alla Geometria Proiettiva e alla Geometria Descrittiva. Tuttavia, le proiezioni erano note fin dai tempi antichi, almeno nel caso classico delle coniche, per cui la prospettiva fu fatta rientrare nelle Geometria Euclidea. Fu nella prima metà del 1600 che Fermat, Cartesio e Desargues posero le basi per lo sviluppo di geometrie alternative. I primi due fondarono la Geometria Analitica; questa voleva essere un modo diverso di vedere la Geometria Euclidea, ma i suoi metodi, algebrici anziché sintetici, di fatto cambiarono l’idea stessa di geometria. Desargues, poi, con la nuova idea dei punti all’infinito, praticamente introduceva enti diversi da quelli delle Geometria di Euclide. Tradizionalmente, la geometria aveva sempre usato metodi sintetici, cioè basati sulla costruzione di figure, riconducendo addirittura a questo metodo la risoluzione dei problemi algebrici, come il calcolo delle radici di un’equazione. Fermat e Cartesio rivoltarono questo modo di procedere, riportando i problemi geometrici a problemi algebrici. Da allora si sono sempre avuti due modi di vedere la geometria, talvolta in contrapposizione, talaltra in simbiosi. Cosı̀ la Geometria Proiettiva ha una versione sintetica, che studia geometricamente le proiettività, e una versione analitica, dedicata alla caratterizzazione algebrica delle coniche e delle quadriche (l’equivalente delle coniche in tre dimensioni). A cavallo del 1800, Monge sistematizzò la Geometria Descrittiva e pochi anni dopo si svilupparono le Geometrie non Euclide, dovute a Lobačeskij e Bólyai. La formalizzazione di tutte queste nuove geometria fu all’inizio di tipo sintetico, ma le generalizzazioni di Riemann erano di natura analitica. Le curve furono di fatto sostituite da equazioni, e le proprietà delle prime si studiarono attraverso le proprietà analitiche delle seconde, dando cosı̀ origine alla Geometria Algebrica. Analogamente, la Topologia nacque alla metà del 1800 come studio geometrico-sintetico delle proprietà dei corpi che si mantengono per trasformazioni continue: un palloncino si può trasformare in un cubo o in un cilindro, se lo premiamo, ma non in una ciambella, a meno che non lo rompiamo. Ma la continuità richiede uno studio locale, cioè di cosa succede intorno a un punto. Se c’è del materiale intorno a un punto, non possiamo toglierlo se non facendo uno strappo, e questa non è più una trasformazione continua, anche nel senso intuitivo del termine. Ciò portò ad una impostazione analitica della Topologia, che si trasformò nello studio degli spazi di Hausdorf e degli spazi metrici. Questi si basano sui concetti di intorno e di limite, che noi vedremo più avanti in modo accurato nel caso importantissimo del calcolo differenziale e integrale. Infatti, gli insiemi R, R2 , R3 che tratteremo sono casi particolari di spazi di Hausdorf e di spazi metrici, e si dicono di solito spazi Euclidei. Ovviamente, non potremo vedere tutte queste diverse geometrie. Ci dilungheremo un po’ di più sulla Geometria Analitica, daremo una rapida occhiata storica alle Geometrie non Euclidee e cercheremo di dare un’idea, vaga ma sperabilmente non peregrina, della Geometria Proiettiva, della Geometria Descrittiva e della Topologia. 7.1 Coordinate Cartesiane Ufficialmente, la Geometria Analitica è stata introdotta da Cartesio nel 1637 con la pubblicazione di “La Geometrie”, una delle tre appendici al “Discours de la méthode”. Oggi sappiamo che Cartesio era stato anticipato da Fermat, che però non aveva pubblicato i propri studi, come era solito fare. Da un punto di vista storico, questa invenzione è stata di fondamentale 199 200 CAPITOLO 7. LE ALTRE GEOMETRIE importanza. Fino ad allora la regina della Matematica era sempre stata la Geometria, tanto che l’Algebra era appena agli inizi con la sua notazione “sincopata” e, di fatto, le dimostrazioni che oggi eseguiamo per via algebrica erano regolarmente riportate alla Geometria. Cosı̀, la soluzione delle equazioni era effettuata per via geometrica e Galileo, quando volle dire che lo studio della natura deve essere affrontato con metodi matematici, affermò che “la Natura è scritta in caratteri di triangoli, quadrati, cerchi, . . . ”, ignorando di fatto i numeri. La stessa notazione arabica o posizionale, portata in Europa all’inizio del 1200, aveva avuto rilevanza solo nel mondo commerciale e finanziario, mentre nell’ambito scientifico ed accademico si era conservata la numerazione romana. Cartesio e Fermat, con l’introduzione della Geometria Analitica, dimostrarono che tutto ciò che si fa con la Geometria si può fare anche con l’Algebra e con il calcolo, cosı̀ che queste discipline non hanno più un ruolo subordinato, ma possono vantare pari dignità della Geometria. E in effetti, pochi anni dopo, esplose, con Newton e Leibniz, il nuovo grande filone del calcolo differenziale, che difficilmente sarebbe potuto nascere e svilupparsi senza il cambiamento di mentalità portato dalla Geometria Analitica di Cartesio. A′ O U A 1 u.m. Figura 7.1: Rappresentazione Cartesiana dei punti: A è positivo, A′ è negativo L’osservazione di base consiste nel considerare la corrispondenza biunivoca che lega i punti di una retta con i numeri reali. Può essere curioso e interessante ricordare che né Cartesio né Fermat considerarono la parte negativa della retta, secondo l’uso del tempo che non riconosceva validità alle quantità negative (v. Sezione 3.1). Se su una retta r fissiamo un punto O, detto origine, e scegliamo, una volta per tutte, un verso o orientamento sulla retta e una unità di misura, cioè un segmento la cui lunghezza diciamo unitaria per definizione, allora: 1. ad ogni punto A della retta facciamo corrispondere il numero che è la misura (secondo l’unità scelta) del segmento OA, con la convenzione che il numero è positivo se A si trova dopo O seguendo il verso stabilito, ed è invece negativo se A si trova prima di O; tale misura è detta la coordinata o ascissa di A; 2. ad ogni numero reale a facciamo corrispondere un punto A sulla retta di modo che OA = |a| ed A sia collocato prima o dopo l’origine O (in accordo al verso prefissato) a seconda che a sia negativo o positivo. L’esistenza di una corrispondenza biunivoca tra punti della retta e numeri reali era nota fin dall’antichità e, come s’è visto, i Greci (probabilmente Pitagora) erano stati costretti a introdurre i numeri irrazionali quando si erano accorti che esistono grandezze tra loro incommensurabili. Merito di Cartesio fu quello di estendere la corrispondenza al piano e allo spazio e di far vedere come si potessero esprimere i concetti della geometria in questo ambiente in cui ogni punto ha una sua individuazione numerica. Un’osservazione di primaria importanza è la seguente. Se abbiamo due punti A e B sulla retta ed a e b sono, rispettivamente, i numeri reali corrispondenti ai due punti, allora la distanza AB è data dal valore assoluto della differenza fra a e b, cioè AB = |a − b|. Questa formula vale sia che a e b siano entrambi positivi, entrambi negativi o siano di segno opposto. La distanza tra A e B è la lunghezza del segmento AB; il lettore osserverà anche che il punto medio del segmento AB ha come ordinata (a+b)/2, cioè la semisomma delle ordinate di A e B. Occorre anche considerare il fatto che la differenza b−a è positiva se B segue A nel verso prefissato, mentre è negativa in caso contrario; quindi b − a ci dà un’informazione in più rispetto alla semplice distanza. Un sistema di coordinate cartesiane nel piano è costituito da due rette incidenti in un punto O, detto origine, sulle quali è stato fissato un verso di orientamento e una unità di misura, non necessariamente la stessa per le due rette. Queste sono dette assi di riferimento o semplicemente assi. Si consideri quella delle due rette che si sovrapponga all’altra (coincidendo anche per l’orientamento) con una rotazione in senso antiorario inferiore a 180◦ ; tale retta si dice asse delle ascisse o asse delle x. L’altra si dice asse delle ordinate o asse delle y. Normalmente, si considerano assi fra loro perpendicolari, con l’asse delle x disegnato orizzontalmente e col verso da sinistra verso destra. L’asse delle y, allora, è una retta verticale orientata dal basso verso l’alto. Questo si dice propriamente un sistema di coordinate cartesiane ortogonali, ed è quello riportato nella Figura 7.2 e che considereremo costantemente nel seguito. Un punto A del piano è individuato dalle sue coordinate: si tracciano per A le parallele ai due assi; la parallela all’asse y incontra l’asse x in un punto A′ , e la parallela all’asse x incontra l’asse y in un punto A′′ . La coordinata xA di A′ rispetto all’unità di misura fissata sull’asse delle x si dice l’ascissa del punto A; la coordinata yA di A′′ rispetto all’unità di misura fissata sull’asse y si dice l’ordinata di A. La coppia di numeri reali (xA , yA ) identifica univocamente 201 7.1. COORDINATE CARTESIANE 100 II I B 80 B ′′ y 60 40 ′′ A C A 20 x O III ′ A B ′ -3 -2 -1 O 1 -20 IV 2 3 4 -40 Figura 7.3: Curve molto allungate Figura 7.2: Riferimento Cartesiano il punto A e si scrive A ≡ (xA , yA ); i due numeri si chiamano le coordinate di A. I punti che hanno tutte e due le coordinate positive si dicono appartenere al I quadrante; il II quadrante è costituito dai punti con ascissa negativa e ordinata positiva; il III quadrante comprende i punti con entrambe le coordinate negative e, infine, i punti con ascissa positiva e ordinata negativa appartengono al IV quadrante. L’idea delle coordinate cartesiane ortogonali, con la stessa unità di misura tanto sull’asse delle x quanto su quello delle y, è arbitraria e può essere abbandonata non appena altre convenzioni possano rivelarsi più convenienti. Prima fra tutte, può cadere la convenzione di usare un’unica unità di misura; spesso è molto piú opportuno utilizzare una certa unità sull’asse x e un’altra, più grande o più piccola, sull’asse y. Anticipando cose che vedremo più avanti, ma che sono del tutto ovvie, se dobbiamo rappresentare una retta d’andamento molto ripido, o una parabola molto stretta, conviene adoprare un’unità di misura sull’asse delle y molto più piccola dell’altra, cosı̀ che su un’area abbastanza ristretta si possano vedere porzioni non trascurabili delle curve; nella Figura 7.3 vediamo la retta y = 40x e la parabola y = 10x2 che sono ragionevolmente rappresentate, avendo scelto l’unità di misura sulle y venti volte minore di quella sulle x. Naturalmente, la scelta deve essere del tipo opposto se la curva è molto piatta. Queste variazioni sulle unità di misura sono molto comuni e di solito non creano problemi di comprensione, anzi aiutano a capire meglio la natura della curva (basta fare attenzione!). Molto meno utilizzati sono i riferimenti non ortogonali. Nella Figura 7.4 abbiamo un caso del genere, nel quale il punto P ha coordinate (−1, 3) e il punto Q ha coordinate (3, 2). Come si vede, le coordinate vengono prese tracciando, da un punto, le parallele y P b 3 Q b 2 1 O -1 x 1 2 3 4 5 Figura 7.4: Assi non ortogonali ai due assi e considerando poi il punto di intersezione con l’altro asse. In questa figura abbiamo supposto, di nuovo, che l’unità di misura sia la stessa per i due assi, ma nulla osta a che le due unità siano diverse. La misurazione delle coordinate sui due assi avviene, in tutti i casi considerati finora, in modo lineare; questo significa che un punto P è a distanza 1, 2, 3, . . . dall’origine O se la misura del segmento OP è 1, 2, 3, . . . volte quella dell’unità di misura. Nella pratica, si sogliono talvolta usare sistemi di coordinate in scale diverse da quella lineare. Ad esempio, sull’asse delle y si può usare una scala quadratica, il che significa che la misura valutata sull’asse y deve essere considerata come il quadrato dell’effettivo valore della seconda coordinata. Nella Figura 7.5 abbiamo rappresentato la parabola y = x2 in scala quadratica per le y: come si vede, la curva si riduce a una coppia di semirette che escono dall’origine. In effetti, l’uso delle scale non lineari è proprio questo: se la curva non è una retta, scegliendo in modo opportuno la scala dell’asse delle y la curva si trasforma in una retta, semplificandone la rappresentazione e lo studio pratico. Cosı̀ una scala esponenziale riduce a una retta la funzione esponenziale e una scala logaritmica riduce a una retta la funzione logaritmica 202 CAPITOLO 7. LE ALTRE GEOMETRIE 16 della somma degli altri due, o uguale, se i tre punti sono allineati. Questa proprietà si dice disuguaglianza 9 triangolare. Queste tre proprietà sono caratteristiche della di4 stanza e possono essere prese come assiomi di una teoria: si consideri un insieme M sul quale sia defini1 ta una funzione d : M × M → R per la quale valgano le tre proprietà; allora d può essere assunta come -4 -3 -2 -1 2 3 4 O 1 “distanza tra due elementi di M (che, convenzionalmente, vengono detti “punti”), e la coppia (M, d) si dice uno spazio metrico. I teoremi che si deducono in Figura 7.5: Una parabola in scala quadratica questa teoria valgono, in particolare, in R, R2 , R3 e in generale in Rn . La teoria degli spazi metrici fa parte (si veda la Sezione 8.5). Difficilmente si trovano rap- della Topologia, alla quale accenneremo brevemente presentazioni di curve su scale entrambi non lineari, un po’ più avanti. ma il loro utilizzo non è vietato, se questo può portare a qualche semplificazione. L’equazione della retta Di fondamentale importanza è saper trovare la di- 7.2 stanza tra due punti. Sia A ≡ (xA , yA ) e B ≡ (xB , yB ) (si veda la Figura 7.2). Se si tracciano le Un punto, come s’è visto, è individuato da una coppia parallele agli assi passanti per A e per B, si deter- di numeri reali. Una curva è un insieme di punti sul mina AB considerando il triangolo rettangolo ACB. piano, di solito un insieme composto di infiniti eleLa distanza AC è semplicemente la distanza tra A′ e menti, come si può immaginare pensando a una retta B ′ che, come sappiamo, è |xB − xA |; analogamente, o a una circonferenza. L’idea di Cartesio fu di defiCB = A′′ B ′′ = |yB − yA |. Quando si eleva al qua- nire una curva per mezzo di una equazione nelle vadrato un valore assoluto, esso può essere ignorato, e riabili x ed y: un punto appartiene alla curva quando sostituendo a x ed y le sue coordinate si ottiene un’uquindi si ha: guaglianza, mentre non appartiene alla curva in caso 2 contrario. Ad esempio, data l’equazione 3x − 2y = 0, AB = (xB − xA )2 + (yB − yA )2 secondo questo criterio il punto (2, 3) appartiene alla p curva (qualunque essa possa essere), mentre il punto AB = (xB − xA )2 + (yB − yA )2 (1, 1) non vi appartiene. dove la radice quadrata è presa in senso aritmetico per salvaguardare il fatto che la lunghezza di un segmento è sempre una quantità positiva. Si invita il B lettore a scrivere il semplicissimo algoritmo che, date B ′′ le coordinate dei punti A e B, trova la loro distanza. La distanza tra due punti A e B si può indicare con C ′′ C la notazione d(A, B) e si osserva che essa gode delle tre seguenti proprietà: B0 A′′ 1. d(A, B) ≥ 0, e si ha d(A, B) = 0 se e solo se C0 A A = B; 2. d(A, B) = d(B, A); O A′ C′ B′ 3. d(A, B) ≤ d(A, C) + d(C, B). la prima proprietà discende dalla definizione stessa: la radice quadrata è zero se e solo se il suo argomento è zero; questo è la somma di due quantità non negative e pertanto è zero se e soltanto se entrambe sono 0; ma questo succede se e solo se xA = xB e yA = yB , cioè i due punti coincidono. La seconda proprietà è veramente ovvia, mentre la terza si rifà a una proprietà vista nella Geometria Euclidea. I tre punti A, B, C determinano un triangolo, e la disuguaglianza dice semplicemente che un lato è minore Figura 7.6: Tre punti allineati Sicuramente, la curva più semplice è la retta. Secondo la Geometria, fissati due punti distinti A e B esiste una e una sola retta che passa per tutti e due; in altre parole, la retta è determinata dai due punti. Siano allora A ≡ (xA , yA ) e B ≡ (xB , yB ) due punti distinti e vediamo sotto quali condizioni un generico punto C ≡ (x, y) appartiene alla retta AB, cioè è collineare con A e con B. Come si vede nella Figura 7.6, 203 7.2. L’EQUAZIONE DELLA RETTA C è collineare con A e con B se e solo se i due triangoli AC0 C e AB0 B sono simili, in quanto l’angolo in A deve essere lo stesso per i segmenti AC e AB. Si ha allora la seguente proporzione tra i cateti dei due triangoli: AC0 : AB0 = CC0 : BB0 2. allora, se yA = yB (a) allora (punti coincidenti) si avverte che i due punti coincidono e pertanto la retta è indeterminata; (b) altrimenti, (retta verticale) si pone a := 1, b := 0, c := −xA e si esce; ovvero (senza valori assoluti!): y − yA x − xA = . xB − xA yB − yA (7.1) 3. altrimenti, se yA 6= yB (a) allora (retta orizzontale) si pone a := 0, b := 1, c := −yB e si esce; Questa è l’equazione della retta passante per i due (b) altrimenti (caso generale) si pone a := yA − punti assegnati e non coincidenti; si osservi che se yB , b := xB − xA , c := xA yB − xB yA e si è fosse A ≡ B, cioè xA = xB e yA = yB , la proporzione finito. non avrebbe senso. Tuttavia, il rapporto perde senso anche quando xA = xB oppure yA = yB . Il primo Un aspetto molto interessante, e curioso, della Geocaso corrisponde a una retta parallela all’asse y, e il metria Analitica è che spesso, per non dire sempre, secondo a una retta parallela all’asse x. In questi casi le formule generali valgono anche nei casi particolal’equazione della retta è: ri. Qui, ad esempio, se xA = xB e yA 6= yB , il x = xA e y = yA ; (7.2) calcolo del punto 3b. ci dà a = yA − yB , b = 0, c = xB yA −xA yB = xA (yB −yA ); se dividiamo questi queste equazioni sono soddisfatte da ogni valore di tre valori per yA − yB (il che non cambia l’equazione y la prima, e da ogni valore di x la seconda, il che della retta, come si è osservato) troviamo a = 1, b = 0 conferma la nostra intuizione su come devono essere e c = −xA , come abbiamo posto nel caso particolare. fatte queste rette. Lo stesso succede per yA = yB e xA 6= xB , mentre se Eseguendo qualche calcolo sull’equazione (7.1), si anche xA = xB si trova a = b = c = 0. Questo sugtrova facilmente: gerisce un algoritmo, equivalente al precedente, ma alquanto più semplice: (yA − yB )x + (xB − xA )y − xB yA + xA yB = 0 Algoritmo 7.2 che ha la forma ax + by + c = 0. Questa si dice la for- Ingresso: le coordinate (xA , yA ), (xB , yB ) di due punti ma canonica della retta ed è la forma generale che può A e B; assumere tale equazione, come si vede considerando Uscita: i tre coefficienti a, b, c della retta. anche le due formule (7.2). Essendo ax + by + c = 0 1. Si pone a := yA − yB , b := xB − xA , c := xA yB − un’equazione, la si può moltiplicare o dividere per una xB yA ; quantità diversa da zero senza cambiare l’insieme dei punti che ne sono soluzione. Questo fatto lo si sfrutta 2. se (a = 0)∧(b = 0)∧(c = 0) allora si avverte che spesso per semplificare i valori di a, b, c o evidenziare i due punti coincidono, altrimenti si esce con i casi particolari, come quando abbiamo a = 1 o b = 1. valori di a, b, c. Per completare il ragionamento, se consideriamo una qualsiasi equazione lineare nelle due incognite x ed y, Supponiamo che nell’equazione di una retta ax + essa sicuramente rappresenta una retta: facendo al- by + c = 0 sia b 6= 0, cioè supponiamo che la retta l’inverso i ragionamenti di prima, si vede come, presi non sia parallela all’asse delle y. L’equazione si può comunque tre punti che verificano l’equazione, essi ri- scrivere allora y = −ax/b − c/b e ponendo m = −a/b sultano collineari. Infatti, i triangoli che si ottengono e q = −c/b si ha la forma canonica: hanno lati in proporzione, quindi sono simili e sono y = mx + q. uguali gli angoli in A dei triangoli AC0 C e AB0 B. Tutte queste considerazioni portano a scrivere il seguente algoritmo per determinare l’equazione della Se arriviamo a questa stessa forma partendo dall’equazione (7.1), troviamo: retta che passa per due punti assegnati: Algoritmo 7.1 (Retta per due punti) Ingresso: le coordinate (xA , yA ), (xB , yB ) di due punti A e B; cioè: Uscita: i tre coefficienti a, b, c della retta. 1. se xA = xB (probabilmente retta verticale) y= m= xB yA − xA yB yB − yA x+ xB − xA xB − xA yB − yA xB − xA q= xB yA − xA yB . xB − xA 204 CAPITOLO 7. LE ALTRE GEOMETRIE Il significato di q è semplice: ponendo x = 0 si ha A y = q, cioè q è l’ordinata del punto di intersezione della retta con l’asse y; per questo q si dice l’intercetta della retta. In quanto ad m, come si vede dalla Figura 7.6, è il rapporto tra il cateto opposto e il cateto r adiacente all’angolo in A del triangolo ACB; come si sa dalla trigonometria (e quindi qui stiamo un po’ C anticipando cose che vedremo più avanti), questa è la P B tangente dell’angolo che la retta forma con l’asse delle ascisse, ed m si dice la pendenza della retta: essa x0 − δ x0 x0 + δ O misura l’inclinazione della retta rispetto all’asse delle ascisse, crescendo man mano che cresce l’inclinazione. Nel caso che abbiamo escluso, di una retta parallela Figura 7.7: Rette perpendicolari all’asse delle ordinate, si dice che la pendenza è infinita. L’intercetta è 0 se e solo se la retta passa per l’origine. Si ha quindi il seguente risultato: a′ x + b′ y + c′ = 0, cioè dalla soluzione del sistema: ½ Teorema 7.1 Una retta passa per l’origine se e solo ax + by + c = 0 se ha un’equazione della forma ax + by = 0. a′ x + b′ y + c′ = 0. Abbiamo cosı̀ introdotto due forme canoniche per la la retta. La forma ax + by + c = 0 è l’espressione Come s’è visto nel capitolo dedicato all’Algebra, ′ ′ soluzione esiste ed è unica se e solo se ab − a b = 6 0, più generale dell’equazione della retta e comprende ′ ′ ab′ = a′ b, cioè vale la proanche le rette parallele ad uno degli assi cartesiani. cioè ab 6= a b. ′ Se invece ′ due possibilità: i) L’altra forma, y = mx + q non permette di rappre- porzione: a : a = b : b , si hanno ′ lo stesso rapporto vale per c, c , e allora l’equazione è sentare le rette parallele all’asse delle y, ma ha due indeterminata (ha infinite soluzioni), o ii) il rapporto vantaggi: esplicita il valore della y in funzione della ′ tra c e c è diverso e allora l’equazione è impossibile x e mette bene in evidenza le caratteristiche “fisiche” della retta, cioè la sua pendenza rispetto all’asse x (non ha alcuna soluzione). Geometricamente, questa e l’intersezione con l’asse y. Per questo, nella prati- è la condizione di parallelismo, mentre il primo caca si tende ad usare di più la seconda forma, anche so riguarda la coincidenza delle due rette, che hanno se meno generale, ragionando poi in modo specifico infiniti punti a comune. La corrispondenza tra intersezioni di curve e soper le rette parallele all’asse y. Pertanto, è bene esluzione di sistemi di equazioni è l’idea fondamentale sere pronti a passare da una forma canonica all’altra della Geometria Analitica e, come abbiamo fatto per quando sia necessario o conveniente. le rette, la ritroveremo molto spesso, sia nella teoria I risultati precedenti permettono di affrontare il che nella pratica. Come ora vedremo, faremo ricorso problema del parallelismo tra rette. Date due retallo stesso concetto nello studio della perpendicola′ ′ ′ te ax + by + c = 0 e a x + b y + c = 0, esse sorità tra rette, un problema un po’ più complesso del no parallele se e solo se le loro pendenze coincidono, parallelismo. Cominciamo col considerare una retta r ′ ′ cioè se e solo se −a/b = −a /b , ovvero se vale la qualsiasi e un punto P su di essa, e cerchiamo di tro′ ′ proporzione a : a = b : b . Se si ha addirittura vare l’equazione della perpendicolare ad r passante ′ ′ ′ a : a = b : b = c : c , allora esiste un coefficiente di per P . Nel caso che r sia parallela all’asse x o all’as′ ′ ′ proporzionalità k per cui a = ka, b = kb, c = kc; dise y, la soluzione è banale: se P ≡ (x , y ) sta sulla 0 0 videndo tutto per k si trova che le due rette in effetti retta e questa è parallela all’asse x, la sua equazione sono la stessa (coincidono) e non solo sono parallele. Ad esempio, data la retta x + 2y − 3 = 0, la retta è y = y0 e la sua perpendicolare è x = x0 , dovendo 2x + 4y = 0 risulta ad essa parallela (passante per essere parallela all’asse y. Ovviamente le cose si inl’origine), mentre la retta 2x + 4y − 6 = 0 è proprio vertono, ma le rette restano le stesse, se si parte da una retta parallela all’asse y. Consideriamo allora il coincidente. Un altro modo per affrontare il problema del pa- caso in cui r ha equazione y = mx + q, con m 6= 0; si rallelismo è riferirsi alla definizione di rette parallele ha allora: come di rette che non hanno punti in comune. Poiché Teorema 7.2 La retta perpendicolare alla retta r di un punto (x0 , y0 ) appartiene alla retta ax+by +c = 0 equazione y = mx + q (m 6= 0) passante per il punto se e solo se è una soluzione di questa equazione, cioè P ≡ (x , y ) di r ha equazione: y−y = −(x−x )/m. 0 0 0 0 se ax0 + by0 + c = 0 è una proposizione vera, il punto Prova: Con riferimento alla Figura 7.7, sulla retta di intersezione di due rette è costituito dalla soluzione comune alle due equazioni ax + by + c = 0 e r consideriamo due punti B, C di ascissa x0 − δ e 205 7.2. L’EQUAZIONE DELLA RETTA x0 + δ; si ha pertanto: B ≡ (x0 − δ, mx0 − mδ + q) = (x0 − δ, y0 − mδ) e C ≡ (x0 + δ, mx0 + mδ + q) = (x0 + δ, y0 + mδ); per il teorema di Pitagora essi hanno la stessa distanza da P . Come sappiamo, la perpendicolare ad r in P è l’asse del segmento BC e quindi un generico punto A ≡ (x, y) sta su tale perpendicolare se e solo se le sue distanze da B e da C sono uguali. Abbiamo infatti: 2 AB = (x − x0 + δ)2 + (y − y0 + mδ)2 = (x − x0 )2 + +2δ(x − x0 ) + δ 2 + (y − y0 )2 + 2mδ(y − y0 ) + m2 δ 2 2 AC = (x − x0 − δ)2 + (y − y0 − mδ)2 = (x − x0 )2 − Teoricamente, a questo punto, potremmo trovare la formula della distanza di un punto P qualsiasi da una retta di cui sia nota l’equazione ax + by + c = 0. Infatti, il teorema precedente dà modo di trovare l’equazione della perpendicolare da P alla retta e quindi, facendo il sistema delle due equazioni, il punto di intersezione H, che è la proiezione di P sulla retta. La lunghezza del segmento P H è poi la distanza cercata. Un metodo un po’ più indiretto, ma che richiede meno conti, può essere il seguente: Teorema 7.5 Sia r la retta di equazione ax+by+c = 0 e sia P ≡ (x0 , y0 ) un punto qualsiasi; allora la distanza di P da r è dato dalla formula: −2δ(x − x0 ) + δ 2 + (y − y0 )2 − 2mδ(y − y0 ) + m2 δ 2 . d= Uguagliando e semplificando si ottiene 4mδ(y −y0 ) = −4δ(x − x0 ) e quindi: y=− x0 + my0 1 x+ . m m Si osservi che, come deve essere, questa espressione non dipende da δ, cioè dai punti B e C considerati. |ax0 + bx0 + c| √ . a2 + b2 y r P B Al variare del punto P sulla retta r cambia l’intercetta della perpendicolare (poiché dipende da x0 ), ma non cambia il coefficiente angolare, che rimane fisso, uguale a −1/m; si ha quindi questo importantissimo corollario: H A x O Corollario 7.3 Se una retta r ha equazione y = mx + q, (m 6= 0), ogni retta perpendicolare ad r ha Figura 7.8: Distanza di un punto da una retta 1 equazione y = − m x + q ′ . Più in generale, se la retta r ha equazione ax+by+c = 0, ogni sua perpendicolare Prova: Se la retta r è perpendicolare ad uno degli ha equazione bx − ay + c′ = 0. assi, il risultato è banale. Altrimenti abbiamo a 6= 0 Prova: Per le rette r che non siano perpendicolari e b 6= 0. Il punto A, proiezione verticale del punto P ad uno degli assi, sappiamo che m = −a/b e quindi sulla retta r, ha coordinate (x0 , −(ax0 +c)/b) e quindi −1/m = b/a. Altrimenti abbiamo a = 0 oppure b = 0 il segmento P A ha lunghezza |y0 − (ax0 + c)/b| = (ma non entrambi) e questo si riflette sui coefficienti |(ax0 + by0 + c)/b|. Analogamente, si trova P B = delle rette perpendicolari secondo la discussione fatta |(ax0 + by0 + c)/a|. Ora si osservi che P A · P B = P H · AB, doppia area del triangolo rettangolo ABP . prima del teorema precedente. Applicando il teorema di Pitagora si ha: Questa caratterizzazione delle rette perpendicolari q permette di risolvere il problema di scrivere l’equazio- AB = P A2 + P B 2 = pa2 + b2 |(ax +by +c)|/|ab| 0 0 ne della retta perpendicolare ad r che passa per un punto assegnato, sia esso sulla retta o fuori di essa: e quindi P H = P A · P B/AB, cioè: Teorema 7.4 Sia ax + by + c = 0 l’equazione di una (ax0 + bx0 + c)2 |ab| √ PH = retta r e sia P ≡ (x0 , y0 ) un punto qualsiasi; l’equa|ab| a2 + b2 |(ax0 + by0 + c)| zione della retta per P perpendicolare ad r è allora a(y − y0 ) = b(x − x0 ). e questo ci dà immediatamente il risultato cercato. Prova: Una generica retta perpendicolare ad r ha equazione bx − ay + c′ = 0; affinché passi per P dobbiamo avere bx0 − ay0 + c′ = 0, cioè c′ = ay0 − bx0 . Sostituendo questo valore nell’equazione della retta si ha la formula desiderata. Dati tre punti, essi determinano univocamente un triangolo; il perimetro si trova semplicemente calcolando le reciproche distanze dei tre punti. Per l’area, la situazione è abbastanza più complicata, ma esiste una formula molto semplice: 206 CAPITOLO 7. LE ALTRE GEOMETRIE Teorema 7.6 Siano A ≡ (xA , yA ), B ≡ (xB , yB ), C ≡ (xC , yC ) tre punti non allineati del piano; l’area del triangolo ABC è data da: A= Corollario 7.7 Tre punti A, B, C sono allineati se e solo se il determinante (7.3) vale 0. 1 |xA yB +yA xC +xB yC −xA yC −yA xB −yB xC |. 2 Prova: In modo arbitrario possiamo scegliere AB come base del triangolo; la retta per A e per B è, come sappiamo: 7.3 La parabola Come abbiamo osservato, il concetto fondamentale della Geometria Analitica è trovare la corrispondenza tra curve ed equazioni, il che giustifica lo studio della Geometria (le curve) per mezzo dell’Algebra (le e quindi l’altezza del triangolo è data dalla distanza equazioni). Abbiamo discusso come le equazioni di di C da questa retta, cioè: primo grado in x ed y identifichino le rette e vicever¯ ¯ sa, per cui ha interesse studiare cosa succede quando ¯ xC −xA C −yA ¯ ¯ xB −xA − yyB si abbandoni l’ipotesi di linearità in x e/o in y. Stra−yA ¯ = h= q namente, le curve più semplici dopo le rette risultano 1 1 (xB −xA )2 + (yB −yA )2 essere le parabole, che abbiamo introdotto fra i luoghi geometrici. Dimostreremo che le parabole con la ¯x − x ¯ (xB − xA )(yB − yA ) yC − yA ¯ ¯ C A . direttrice parallela all’asse x sono tutte e sole le curve =¯ − ¯p xB − xA yB − yA (xB − xA )2 + (yB − yA )2 definite da un’equazione del tipo y = ax2 + bx + c, Il denominatore è chiaramente la base del triangolo, dove a, b, c sono tre numeri reali qualsiasi (a 6= 0, altrimenti si ritorna al caso della retta). Naturalmente, cioè la lunghezza di AB. Pertanto: possiamo scambiare la x con la y e concludere che 1 le parabole con la direttrice parallela all’asse y sono A = |(xC − xA )(yB − yA ) − (yC − yA )(xB − xA )| 2 tutte e sole le curve di equazione x = ay 2 + by + c (a 6= 0). Si può anche dimostrare (ma qui non lo fareche sviluppato dà la formula cercata. mo) che una parabola di direttrice una retta qualsiasi soddisfa un’equazione completa di secondo grado in Nota 7.1 Chi ci ha seguito nella Nota 5.7 relativa x e in y: ax2 + bxy + cy 2 + dx + ey + f = 0. La ai determinanti delle matrici 3 × 3, osserverà che la parabole non è però l’unica curva a soddisfare un’eformula dell’area si può ottenere prendendo il valore quazione del genere; un importante risultato afferma assoluto del determinante: che tutte le coniche sono definite da una tale equa¯ ¯ ¯ xA yA 1 ¯ zione: parabola, ellisse, iperbole e i casi particolari ¯ ¯ 1¯ xB yB 1 ¯¯ . (7.3) circonferenza e coppia di rette. Ciò che distingue i ¯ 2¯ xC yC 1 ¯ vari tipi di conica è una specifica condizione sui coefIl valore assoluto si giustifica ricordando che l’area de- ficienti dell’equazione. Ma questo verrà visto nei corsi ve essere un numero positivo o, al più, nullo, per le universitari. figure che degenerano in un segmento. Tuttavia, ci Secondo la definizione, una parabola è il luogo dei possiamo chiedere se il puro e semplice determinante punti equidistanti da una retta (la direttrice) e da ha un significato preciso. Ebbene, è proprio cosı̀: se i un punto (il fuoco); dimostriamo allora il seguente tre punti non sono allineati e li consideriamo in senso risultato: x − xA y − yA = xB − xA yB − yA orario, cioè partendo da A incontriamo prima B e poi C quando si ruoti come l’orologio (in senso orario), allora il valore del determinante è negativo. Se, viceversa, si passa da A a B e poi a C nel verso contrario alle lancette dell’orologio (in senso antiorario), il determinante è positivo. Si sviluppi un esempio ponendo A ≡ (0, 0), B ≡ (4, 0) e C ≡ (2, 3): il determinante vale 12, proprio il doppio dell’area del triangolo. Se si scambia B con C, il determinante risulta negativo. Questo fatto curioso è legato al concetto stesso di determinante, e quindi non lo possiamo affrontare qui. Un’ultima osservazione, del tutto ovvia, ci dice che l’area del triangolo è zero se e solo se i tre punti A, B, C sono allineati; pertanto vale il seguente criterio di allineamento: Teorema 7.8 Sia y = d una retta parallela all’asse x che assumiamo come direttrice, e sia F ≡ (x0 , y0 ) un punto, non appartenente alla direttrice, che assumiamo come fuoco. La parabola che essi determinano ha equazione: y= 1 x0 x2 + y02 + d2 x2 − x+ 0 2(y0 − d) (y0 − d) 2(y0 − d) Prova: Sia (x, y) un punto generico della parabola; la sua distanza p dalla direttrice è y−d e la distanza dal fuoco vale (x − x0 )2 + (y − y0 )2 . Uguagliando ed elevando al quadrato si ha: y 2 −2yd+d2 = x2 −2x0 x+ 207 7.3. LA PARABOLA x20 + y 2 − 2y0 y + y02 . Semplificando ed esplicitando la Teorema 7.10 Sia y = ax2 + bx + c (a 6= 0) una parabola; allora il vertice ha coordinate V ≡ y si ottiene la formula desiderata. (−b/2a, (4ac − b2 )/4a) e l’asse ha equazione x = Questo teorema dimostra che ogni parabola del ti−b/2a. po detto ha un’equazione y = ax2 + bx + c, con a 6= 0 perché y0 6= d dal momento che il fuoco non sta sulla Prova: Poiché l’asse passa per il fuoco ed è perpendirettrice. Vediamo ora il viceversa: dicolare all’asse delle x, per il precedente teorema la sue equazione è x = −b/2a. Lo stesso vale per l’a2 Teorema 7.9 Sia y = ax + bx + c, con a 6= 0. scissa del vertice, la cui ordinata è data (come punto Tale equazione rappresenta una parabola di fuoco e di mezzo di F D) da: direttrice: µ ¶ µ ¶ 1 4ac − b2 + 1 4ac − b2 − 1 4ac − b2 −b 4ac − b2 − 1 4ac − b2 − 1 + = . F = , y= . 2 2a 2a 4a 2a 4a 4a Prova: Vediamo algebricamente che i tre parametri a, b, c determinano univocamente le coordinate del fuoco e l’equazione della direttrice. Uguagliando tali parametri ai valori ottenuti nel teorema precedente si ha il sistema: a = 1/(2(y0 − d)) b = −x0 /(y0 − d) c = (x20 + y02 − d2 )/(2(y0 − d)) nelle tre incognite x0 , y0 , d. Pertanto, il teorema risulta vero se e solo se questo sistema ammette un’unica soluzione. Dalla prima equazione si ha: y0 −d = 1/2a e quindi dalla seconda si ricava: −x0 = b(y0 − d), cioè: x0 = −b/2a. Nella terza equazione scriviamo y02 − d2 = (y0 − d)(y0 + d) e sostituiamo i valori noti. Con la prima equazione, si ha il sistema: ½ y0 − d = 1/2a y0 + d = 2c − b2 /2a che si può risolvere per somma e sottrazione. La soluzione dà i valori desiderati. La più semplice delle parabole è y = x2 e il lettore è invitato a disegnarla, insieme al fuoco e alla direttrice. Possono essere importanti i seguenti concetti: Definizione 7.1 Si dice asse di una parabola la retta passante per il fuoco e perpendicolare alla direttrice. Si dice vertice della parabola l’intersezione dell’asse con la parabola stessa. L’asse è, in effetti, un ase di simmetria, cioè se P è un punto della parabola, il simmetrico Q di P rispetto all’asse è anch’esso un punto della parabola. Infatti, Q ha la stessa ordinata di P e quindi la stessa distanza dalla direttrice; inoltre, per definizione di punto simmetrico, l’asse della parabola risulta essere anche l’asse del segmento P Q, e quindi F ha la stessa distanza da P e da Q. Il vertice V è il punto estremo della parabola, nel senso che esso è il punto della parabola più vicino alla direttrice e si trova a metà del segmento F D, se D è il punto di intersezione dell’asse con la direttrice. Si ha allora: A seconda che il fuoco abbia ordinata maggiore o minore della direttrice, la parabola risulta avere la concavità rivolta verso l’alto o verso il basso; questo purché la curva non può tagliare la direttrice, taglio in cui avrebbe distanza zero da questa e distanza positiva dal fuoco. Si ha allora un modo semplice per determinare come è disposta la concavità: Teorema 7.11 La concavità della parabola y = ax2 + bx + c (a 6= 0) è rivolta verso l’alto se e solo se è a > 0. Prova: Secondo il Teorema 7.9 abbiamo: a = 1/2(y0 − d) e quindi a ha lo stesso segno di y0 − d; ma questo è positivo se e solo se y0 > d, cioè se il fuoco è posto al di sopra della direttrice e quindi la concavità è rivolta verso l’alto. Capire da che parte è rivolta la concavità della parabola può aiutare a risolvere vari problemi. Si consideri, ad esempio, il fatto di voler determinare se il punto (x0 , y0 ) è interno o esterno alla parabola y = ax2 + bx + c (a 6= 0), dove per “interno” intendiamo contenuto nella concavità della parabola. Se la concavità è rivolta verso l’alto e ȳ = ax20 + bx0 + c è il valore che la parabola assume in x0 , chiaramente il punto è interno se e solo se y0 > ȳ, cioè y0 > ax20 + bx0 + c. Questo è importante quando si vogliano condurre le tangenti alla parabola da un punto P ≡ (x0 , y0 ) assegnato; la cosa è possibile se e solo se il punto è esterno alla parabola o si trova su di essa. D’altra parte, trovare l’equazione delle tangenti alla parabola passanti per P non è difficile: Teorema 7.12 Sia y = ax2 + bx + c (a 6= 0) una parabola e sia P ≡ (x0 , y0 ) un punto ad essa non interno; allora i coefficienti angolari m delle tangenti alla parabola passanti per P sono le soluzioni dell’equazione: m2 − 2m(2ax0 + b) + b2 + 4ay0 − 4ac = 0. Prova: Una retta generica di coefficiente angolare m passante per P ha equazione y − y0 = m(x − x0 ) 208 e quindi si può far sistema tra questa equazione e quella della parabola: le soluzioni del sistema saranno i punti di intersezione della retta con la parabola. Le tangenti sono caratterizzate dal fatto che i due punti di intersezione in effetti coincidono. Eliminando la y, dal sistema si ottiene l’equazione di secondo grado in x: mx − mx0 + y0 = ax2 + bx + c, cioè: ax2 − (m − b)x + mx0 − y0 + c = 0, che dà le ascisse dei punti di intersezione. Affinché questi coincidano è necessario e sufficiente che il discriminante dell’equazione sia 0, cioè sia: (m − b)2 − 4a(mx0 − y0 + c) = 0. Eseguiti i pochi calcoli necessari, si trova che questa è proprio l’equazione desiderata. Il fatto che siamo partiti da un punto esterno alla parabola ci assicura che le soluzioni dell’equazione esistono senz’altro. Affrontiamo allora il problema da un altro punto di vista e proviamo ad immaginare che questo possa non essere il caso, cioè immaginiamo di non conoscere la posizione di P rispetto alla parabola. Il ragionamento per trovare le tangenti rimane invariato, solo che alla fine non sappiamo se l’equazione del teorema precedente ha soluzioni o meno. Possiamo allora osservare che tale equazione deve avere due soluzioni se il punto P è esterno, una sola soluzione se P si trova sulla parabola (si può tracciare solo la tangente in quel punto), e nessuna soluzione se P è interno. Ma tutto ciò è dato dal discriminante dell’equazione, che vale: (b + 2ax0 )2 − b2 − 4ay0 + 4ac = 4a(ax20 + bx0 + c − y0 ), e si ritrovano esattamente le condizioni già viste. Infatti, perché non vi siano soluzioni (punto interno) a e ax20 + bx0 + c − y0 devono essere discordi, e quindi se a > 0 deve essere ax20 + bx0 + c < y0 , e se a < 0 deve essere ax20 + bx0 + c > y0 . L’ultimo problema che vogliamo risolvere è la determinazione della parabola che passi per certi punti assegnati. Poiché ax2 + bx + c è un polinomio di secondo grado, algebricamente bastano tre valori distinti della x per determinarlo completamente; d’altra parte, geometricamente, la y non può assumere più di due valori uguali, e anche questo si deve riflettere sulle condizioni di esistenza della parabola. In effetti si ha: CAPITOLO 7. LE ALTRE GEOMETRIE sostituendo nell’equazione della parabola i valori dei tre punti si ottiene il sistema: yA = ax2A + bxA + c yB = ax2B + bxB + c yC = ax2C + bxC + c nelle tre incognite a, b, c. Affinché il sistema abbia soluzione, la matrice del sistema deve avere il determinante diverso da 0; ma: ¯ ¯ 2 ¯ ¯ x ¯ 2A xA 1 ¯ ¯ x xB 1 ¯¯ = ¯ B ¯ x2 xC 1 ¯ C = x2A xB + xA x2C + x2B xC − x2A xC − xA x2B − −xB x2C + (xA xB xC − xA xB xC ) = = (xA − xC )xA xB − (xA − xC )xA xC − (xA − xC )x2B + +(xA − xC )xB xC = = (xA xB − xA xC − x2B + xB xC )(xA − xC ) = = (xB − xA )(xC − xB )(xA − xC ). Questa espressione vale 0 se e solo se xA = xB , oppure se xB = xC , oppure xC = xA , ma questo è escluso dall’ipotesi che le ascisse siano due a due distinte. D’altra parte, se fosse yA = yB = yC , sostituendo questi valori nella colonna delle x o delle x2 otterremmo 0, perché tale colonna sarebbe multipla dell’ultima, e quindi avremmo a = 0 e b = 0, contro l’ipotesi che debba essere a 6= 0. 7.4 Circonferenza, iperbole ellisse e Come dimostra il caso della parabola, la definizione di una curva come luogo geometrico aiuta molto nella ricerca dell’equazione che definisce la stessa curva nella Geometria Analitica. La cosa è particolarmente vera nel caso della circonferenza che, come ricordiamo, è il luogo dei punti equidistanti dal centro. Sia allora O ≡ (x0 , y0 ) il centro di una circonferenza e sia r il suo raggio; un punto generico P p ≡ (x, y) della circonferenza deve esser tale che: Teorema 7.13 Siano A ≡ (xA , yA ), B ≡ (xB , yB ), (x − x0 )2 + (y − y0 )2 = r e quindi, elevando al C ≡ (xC , yC ) tre punti del piano tali che xA , xB , xC quadrato, x2 − 2x0 x + x20 + y 2 − 2y0 y + y02 = r2 . siano a due a due distinti e fra yA , yB , yC vi siano Ordinando i termini di questo polinomio di secondo al più due valori uguali; allora esiste una e una sola grado in x e y si ha l’equazione: x2 + y 2 − 2x0 x − parabola y = ax2 +bx+c (a 6= 0) passante per A, B, C. 2y0 y + x20 + y02 − r2 = 0. Si ha allora il seguente: Prova: Intanto, assegnata la parabola le condizioni su A, B, C sono verificate perché ad ogni valore di x corrisponde un unico valore di y e ad ogni valore di y corrispondono al più due valori di x. Viceversa, Teorema 7.14 Un’equazione di 2◦ grado in x e y rappresenta l’equazione di una circonferenza se e solo se ha la forma x2 + y 2 + ax + by + c = 0, con c > (a2 + b2 )/4. 209 7.4. CIRCONFERENZA, ELLISSE E IPERBOLE Prova: Se partiamo da una circonferenza, otteniamo un’equazione del tipo desiderato ponendo a = 2x0 , b = 2y0 , c = x20 + y02 − r2 , ove (x0 , y0 ) sono le coordinate del centro ed r è il raggio; questo dà c = (a2 + b2 )/4 − r2 e quindi la condizione su c è senz’altro verificata. Viceversa, partiamo da un’equazione del tipo descritto nell’enunciato del teorema; definiamo x0 = a/2, y0 = b/2 e consideriamo la quantità r2 = c−(a2 +b2 )/4; per ipotesi, questa quantità è positiva e quindi la possiamo assumere come quadrato del raggio. Ma ora, se consideriamo l’equazione della circonferenza di raggio O ≡ (x0 , y0 ) e raggio r come appena trovati, per la prima parte del teorema arriviamo proprio all’equazione x2 + y 2 + ax + by + c = 0, e quindi l’asserto è provato. Come osservato, moltiplicando un’equazione del tipo della circonferenza per una quantità s 6= 0, l’equazione non cambia e non cambia perciò la curva. Quindi, possiamo dire che un’equazione di secondo grado in x e y rappresenta una circonferenza se e solo se: i) i coefficienti di x2 e y 2 sono uguali; ii) manca il termine in xy; iii) si ha c > (a2 + b2 )/4. Se queste condizioni sono verificate, dividendo tutto per il coefficiente di x2 e y 2 ci si riporta alla forma del teorema precedente e si è quindi in grado di determinare le coordinate del centro e la misura del raggio. Si noti che è particolarmente semplice l’equazione di una circonferenza di centro l’origine e raggio r: x2 + y 2 = r2 ; invece, una circonferenza che passi per l’origine ha equazione x2 + y 2 + ax + by = 0, cioè ha c = 0. Come sappiamo dal Teorema 6.36, dati tre punti non allineati A, B, C, esiste una e una sola circonferenza che passi per tutti e tre. Lo stesso teorema fornisce un metodo per trovare centro e raggio della circonferenza, metodo che potremmo seguire, dato che nella sezione precedente abbiamo imparato a trovare le equazioni degli assi dei segment AB e BC, a calcolare la loro intersezione O e infine a trovare la distanza di O da A (o da B o da C). Tuttavia, possiamo enormemente semplificare tutta questa procedura applicando direttamente un po’ d’Algebra: imponiamo che la circonferenza generica x2 + y 2 + ax + by + c = 0 passi per A ≡ (xA , yA ), B ≡ (xB , yB ) e C ≡ (xC , yC ). Si ottiene il sistema di tre equazioni: 2 2 + axA + byA + c = 0 xA + yA 2 2 xB + yB + axB + byB + c = 0 2 2 + axC + byC + c = 0 xC + yC nelle tre incognite a, b, c. Risolvendo questo sistema, si trovano i parametri a, b, c e quindi l’equazione della circonferenza cercata, dalla quale si hanno le coordinate del centro e la lunghezza del raggio. Nota 7.2 Consideriamo ora il precedente sistema dal punto di vista dei determinanti, come abbiamo imparato nella Nota 5.7. del sistema è: ¯ ¯ xA ¯ ¯ xB ¯ ¯ xC Il determinante della matrice ¯ yA 1 ¯¯ yB 1 ¯¯ , yC 1 ¯ una nostra vecchia conoscenza, incontrata nella Nota 7.3. Il sistema ha una e una sola soluzione se e solo se questo determinante è diverso da zero, ma nella nota abbiamo visto che questo determinante è diverso da zero se e solo se i tre non sono allineati. Poiché è proprio questa l’ipotesi che abbiamo fatto, il sistema ha sempre una soluzione e tale soluzione determina la circonferenza cercata. Il lettore è invitato a trovare la circonferenza che passa per i punti A ≡ (0, 0), B ≡ (10, 0) e C ≡ (8, 4), dopo aver cercato di stabilire ad occhio i valori di a, b, c. Le terne Pitagoriche, viste nel Teorema 6.28 possono tornare utili a tale scopo. Determinare l’equazione di un’ellisse comunque disposta sul piano cartesiano non è del tutto banale; ci accontenteremo pertanto di trovare l’equazione di un’ellisse disposta come in figura, cioè col centro nell’origine degli assi e simmetrica sia rispetto all’asse delle x sia a quello delle y. Se l’ellisse è allungata come nella Figura 6.33, i due fuochi si troveranno sull’asse delle x. Siano (a, 0) e (−a, 0) le coordinate dei punti estremi dell’asse dell’ellisse disposto sull’asse x, e siano (0, b) e (0, −b) gli estremi dell’altro asse (nella figura è a > b, ma potremmo avere a < b senza problemi, solo che la posizione dei fuochi cambia). Con queste condizioni la posizione dei fuochi è determinata. Infatti, per il punto (a, 0) la somma delle distanze dai fuochi F ′ = (f, 0) ed F ′′ = (−f, 0) è a − f + a + f = 2a, e quindi 2a è la costante dell’ellisse. D’altra parte, per il ppunto (0, b) la somma delle distanze dai fuochi è: 2 b2 + f 2 , e questa quantità deve essere uguale a 2a. Dividendo per 2 ed elevando al quadrato si ottiene b2 + f 2 = a2 , e questo √ ci dà il valore delle ascisse dei due fuochi: f = ± a2 − b2 . Con queste premesse, consideriamo un generico punto (x, y) dell’ellisse e calcoliamo la somme delle distanze dai fuochi, che deve essere uguale a 2a: p p (x − f )2 + y 2 + (x + f )2 + y 2 = 2a p p x2 + y 2 + f 2 − 2xf + x2 + y 2 + f 2 + 2xf = 2a. Eleviamo al quadrato sfruttando le nostre conoscenze dei prodotti notevoli e semplificando: p 2x2 + 2y 2 + 2f 2 + 2 (x2 + y 2 + f 2 )2 − 4x2 f 2 = 4a2 p (x2 + y 2 + f 2 )2 − 4x2 f 2 = 2a2 − x2 − y 2 − f 2 . Elevando ancora al quadrato si elimina (x2 +y 2 +f 2 )2 : −4x2 f 2 = 4a4 − 4a2 (x2 + y 2 + f 2 ). 210 CAPITOLO 7. LE ALTRE GEOMETRIE Ora occorre semplificare e scrivere a2 − b2 al posto di f 2 , come abbiamo osservato; si arriva cosı̀ all’espressione x2 b2 = −a2 y 2 + a2 b2 , e infine si divide tutto per a2 b2 dopo aver trasportato a sinistra il monomio con y: x2 y2 + 2 =1 (7.4) 2 a b 6.34, che ha i due fuochi sull’asse delle x, equidistanti dall’origine. Come per l’ellisse si potrebbe considerare l’iperbole con i fuochi sull’asse delle y, ma i risultati sarebbero analoghi. Chiamiamo allora a la distanza del vertice dell’iperbole dall’origine degli assi ed f la distanza dei due fuochi, ancora dall’origine. La costante dell’iperbole è data dalla differenza AF2 − AF1 = a + f − (f − a) = 2a. Per un miQuesta formula determina l’ellisse come curva, cioè sterioso motivo che sarà chiaro alla fine dei conti e è la formula analitica dell’ellisse; p se il valore di x, diche giustificheremo nella prossima nota, introduciaciamo x0 è noto, si ricava y = ± 1 − x20 /a2 , cioè si 2 2 2 mo una costante √ b > 0 tale che b = f − a ; si hanno due valori opposti per la y, come è chiaro dalla ha allora f = a2 + b2 e preso un generico punto figura. Molte altre proprietà possono essere ricavate P ≡ (x, y) sull’iperbole, impostiamo l’equazione reda questa espressione, ma qui ci limiteremo ad alculativa imponendo la condizione sulla differenza delle ne osservazioni. La circonferenza di centro l’origine distanze: e raggio a ha equazione x2 + y 2 = a2 , come già sapp p piamo. Se fissiamo un punto x0 (−a ≤ x0 ≤ a) e P F2 −P F1 = (x + f )2 + y 2 − (x − f )2 + y 2 = 2a. calcoliamo l’ordinata positiva del puntopsulla circonferenza e sull’ellisse, troviamo: yC = a2p− x20 per A questo punto, i conti sono abbastanza analoghi a p la circonferenza, e yE = b 1 − x20 /a2 = ab a2 − x20 . quelli svolti per l’ellisse e quindi lasciamo al lettore Quindi tra i due punti c’è un rapporto b/a costante. tutta la gioia di portarli fino in fondo. Ad un certo √ arbitrario) si Questa osservazione permise a Keplero di calcolare punto (che in realtà può essere del tutto a2 + b2 e questo dovrà sostituire f con l’espressione l’area di un’ellisse. permette di arrivare alla forma finale: Teorema 7.15 Sia data un’ellisse di equazione x2 y2 − =1 (7.5) (7.4), nella quale a e b sono le misure dei semiassi; a2 b2 allora l’area dell’ellisse è A = πab. che fa il paio con quella dell’ellisse. Invitiamo il letProva: Possiamo suddividere l’asse maggiore in pic- tore a disegnare l’iperbole con a = 3, b = 4 e quindi coli segmenti di lunghezza h e, su tali segmenti, co- f = 5. L’iperbole per cui a = b si dice equilatera; ruotanstruire dei rettangoli che permettano di approssimare do un’iperbole equilatera di 45◦ in senso antiorario, si l’area del cerchio e quella dell’ellisse. Se x0 è l’estretrova l’iperbole y = 1/x, cioè xy = 1. Un utile allenamo di uno dei segmenti,p il rettangolo che approssima 2 2 mento consiste nel cercar di risolvere i soliti esercizi, il cerchio avrà area 2h a − x0 ; quindi la somma trovando le tangenti (ad un’iperbole data dall’equadelle aree di tutti questi rettangoli approssimerà l’aP p 2 2 2 zione (7.5)) da un punto assegnato fuori dell’iperbole rea totale del cerchio: AC = 2h a − x0 ≈ πa . stessa, ad esempio dall’origine (ma questo è un caso Operando in modo analogopper l’ellisse, l’area di ciab 2 2 cattivo) oppure dal punto A ≡ (a/2, 0). scun rettangolo sarà 2h a a − x0 , e quindi l’area P bp 2 P p 2 b 2 2 totale è: AE = 2h a a − x0 = a 2h a − x0 , Nota 7.3 Mentre nell’ellisse la costante b ha un in quanto per la proprietà distributiva la costante significato ben preciso, cioè di lunghezza del semiasse b/a si può mettere in evidenza. Ma allora abbiamo minore, nell’iperbole la b sembra un arbitrio il cui AE = ab AC , questo qualunque sia il numero e la diunico scopo è di semplificare la formula finale (7.5). In realtà non è proprio cosı̀. Geometricamente, la mensione dei segmenti usati; la relazione vale perciò nostra iperbole (Figura 6.34) non interseca l’asse anche per le aree calcolate precisamente e pertanto: delle y, e quindi sembra venir meno l’aggancio AE = ab πa2 = πab, come si voleva. che legava la costante b all’ellisse. Tuttavia, se Il problema della lunghezza dell’ellisse (cioè del algebricamente portiamo avanti il sistema tra l’equasuo perimetro) è piuttosto più complicato e richiezione (7.5) e l’asse y di equazione x = 0, si ottiene l’equazione in y: y 2 = −b2 , che chiaramente non ha de l’uso del calcolo integrale; pertanto noi non lo soluzioni reali. Essa ha però le soluzioni complesse affronteremo e rimandiamo la sua soluzione ai corsi y = ±ib, e quindi possiamo affermare (con un po’ di Analisi Matematica, che lo studente potrà seguire di facciatosta matematica) che l’iperbole incontra all’Università. l’asse delle y nei due punti immaginari ±ib. Ecco alLa più complicata delle coniche è senz’altro l’iperlora che abbiamo trovato un significato per la nostra b. bole; pertanto, se è già complesso trovare l’equazione della generica ellisse, a maggior ragione è laborioso cercare quella della generica iperbole. LimitiaLe due rette y = ± ab x, cioè ay ± bx = 0, passanti mo quindi la nostra ricerca all’iperbole della Figura per l’origine, hanno un significato particolare. Con- 7.5. GEOMETRIE NON-EUCLIDEE sideriamo la retta y = bx/a quando x cresce indefinitamente, e confrontiamola con l’iperbole, o meglio col suo ramo positivo. Questo ramo ha equazione: r b2 2 y= x − b2 . a2 La distanza verticale fra le due curve è, per defiizione, la differenza fra le ordinate delle due curve per uno stesso valore dell’ascissa. La distanza verticale non è la stessa cosa della distanza che, in un punto della curva, è la minima distanza dai punti dell’altra curva. Proprio perché la distanza (tout-court) è definita come minimo, essa è più breve della distanza verticale. Se questa, al crescere di x, si avvicina a 0, a maggior ragione si avvicinerà a 0 la distanza. Nel nostro caso la distanza verticale è: r b2 2 b x − b2 . δv (x) = x − a a2 211 mondo stesso, considerato come una semplice immagine riflessa del mondo delle idee. Tutti ricordiamo il mito della caverna, ed è difficile dire se Platone fosse stato influenzato dalla geometria nelle sue concezioni filosofiche, o se ammirasse la geometria perché rifletteva cosı̀ bene la sua filosofia. Euclide, ottant’anni dopo Platone, non fece che sistematizzare e concretizzare in una teoria ciò che Platone aveva intuito e creduto. Di conseguenza, fino al 1800 tutti hanno fermamente creduto che la Geometria Euclidea fosse indubitabile e nessuno ha mai pensato di mettere in dubbio che gli sviluppi della Geometria Euclidea fossero gli unici a descrivere il mondo reale. Questa petizione di principio ha condizionato l’attitudine dei matematici a cogliere aspetti importanti, non solo della geometria, ma anche dell’aritmetica e dell’algebra, discipline che fino al 1600 sono rimaste a quella subordinate, e che, comunque, hanno con essa condiviso l’idea di rappresentare, nel loro complesso, la vera descrizione dei fenomeni naturali legati alle Questa quantità è senz’altro positiva in quanto il mi- forme e ai conteggi. Come vedremo, questa credenza nuendo è maggiore del sottraendo a causa del −b2 . Si fece sı̀ che spiriti brillanti non si accorgessero di strade ampie e interessanti che pure avevano imboccato, può allora scrivere nel modo seguente: ma che ritennero false e fuorvianti. r r a2 b2 2 b2 2 b b b Naturalmente, l’errore era nel manico, e questo lo δv (x) = x − x − 2a = x − x 1 − 2. a a2 a a a x rendeva più subdolo, cosı̀ come oggi probabilmente non vediamo, o siamo portati a trascurare, sviluppi Osserviamo che a è fisso e quindi, quando x cresce che non si accordano con la nostra mentalità, condi2 2 indefinitamente, a /x si avvicina sempre più a 0. zionata da altri pregiudizi che non ci appaiono tali. Quindi δv (x) si riduce a 0, come differenza di quanCome abbiamo ricordato e come tramanda Platarco, tità praticamente uguali. Perciò la retta ay − bx = 0 la geometria era nata con scopi molto pratici: misurimane sempre al di sopra del ramo dell’iperbole, ma rare i terreni, dando modo di ripristinare situazioni di le due curve si avvicinano sempre più. Si dice che fatto cancellate dalle piene del Nilo. I Greci fecero un la retta è un asintoto della curva. In pratica, l’esipasso fondamentale, che però alcuni di loro (risultati stenza di un asintoto indica che una curva cresce in poi i più influenti) portarono troppo lontano. Il pasmodo pressoché lineare quando x va verso l’infinito. so consistette in quel processo di astrazione che portò Non tutte le curve hanno un asintoto: ad esempio, appunto alla formulazione assiomatica di Euclide, che 2 la parabola cresce come x e non linearmente; quein forma meno precisa, ma sostanzialmente identica, sto esclude, per definizione, che la parabola abbia un era noto ai tempi di Platone. Questa forma sembraasintoto. Ritorneremo su questo argomento quando va tanto perfetta che si stabilı̀ dovesse costituire la studieremo il comportamento delle funzioni nella Serealtà stessa, cioè l’essenza riposta dietro l’apparenza zione 8.7; infatti, un asintoto può caratterizzare la dei fenomeni, del reale come ci si presenta. Pertanto, crescita di una funzione e quindi essere utilissimo per filosoficamente, la Geometria Euclidea è la realtà, e capire l’andamento della funzione stessa. nulla ci può essere di vero al di fuori di ciò che si può dedurre con tale scienza. 7.5 Geometrie non-Euclidee La Geometria di Euclide è stata considerata, per circa 2000 anni, l’unica geometria possibile e immaginabile, per il semplice motivo che la si riteneva un modello (veritiero) della realtà. Con considerazioni più filosofiche che matematiche, si riteneva che la Geometria Euclidea descrivesse esattamente il mondo in cui viviamo; anzi, da un punto di vista platonico, la Geometria era l’idea del mondo, quindi più reale del Questa fede aveva soltanto un piccolo neo. Dei dieci punti che abbiamo visto nella sezione [6.1], nessuno trovava niente da ridire sui cinque assiomi di Aristotele e sui primi quattro postulati di Euclide. Il quinto, però, con la sua formulazione abbastanza complicata, di certo più complessa di quella di tutti gli altri, era guardato con sospetto. Nessuno che dubitasse della sua validità, ma esso veniva meno al concetto di semplicità e immediata evidenza che si pensava dovessero avere gli assiomi. Si pensò allora che si potesse intro- 212 durre un altro assioma, più elementare, e dal quale il quinto postulato potesse essere dedotto. Addirittura, molti ritennero che esso potesse essere dedotto dai primi quattro, e perciò potesse essere eliminato dalla formulazione di Euclide. In effetti, possiamo distinguerne tre filoni: • cercare di dimostrare il quinto postulato mediante tutti gli altri; questo avrebbe permesso di eliminarlo, addirittura semplificando la teoria; CAPITOLO 7. LE ALTRE GEOMETRIE C D A B r • cercare di sostituire il quinto postulato con altri Figura 7.9: Il quadrilatero di Saccheri più semplici, anche se equivalenti; questo avrebbe soddisfatto il senso estetico dei matematici, AD = CD per costruzione, e possiamo applicare il senza cambiare nulla della teoria; terzo principio di congruenza. La conclusione è apb = DCA. b Si hanno perciò tre possibilità • negare il quinto postulato per arrivare a qualche punto B DC b e DCA: b conclusione assurda; questo, almeno, avrebbe di- relative agli angoli B DC mostrato che il postulato era necessario, avrebbe 1. sono entrambi retti; respinto il primo dei due precedenti modi di ragionare e avrebbe incanalato le ricerche lungo il 2. sono entrambi acuti; secondo. 3. sono entrambi ottusi. Intorno all’anno 1000, i matematici arabi affrontarono seriamente il problema delle parallele, l’altro no- La Geometria Euclidea assume che sia vera la prima me con cui è nota la questione del quinto postulato di ipotesi. Come s’è visto, la retta CD risulta parallela Euclide. Prima il fisico e matematico Ibn al-Haithan ad r e quindi BD ed AC sono perpendicolari alla stes(latinizzato in Alhazen, poi il poeta e matematico sa CD; questo implica che gli angoli in D e in C sono Omar Khayyam e infine l’astronomo e matematico retti. Se si riuscissero ad escludere le altre due posNasir Eddin al-Tusi studiarono a lungo la faccenda, sibilità, il gioco sarebbe fatto e avremmo dimostrato senza approdare a nulla di definitivo. Certamente, il il postulato delle parallele. più famoso dei tre è Omar Khayyam, la cui opera poeLa cosa non si rivelò affatto semplice e molti cretica è nota in occidente dalle traduzioni ottocentesche dettero di aver dimostrato l’assurdità di 2. e di 3. in inglese e in francese, e l’alone esotico, decadente ed laddove, invece, o s’erano sbagliati oppure avevano epicureo che l’ha circondato, lo ha fatto approdare utilizzato involontariamente qualche teorema equivaanche ai fasti del cinematografo. Come matematico, lente al quinto postulato. Il caso più sconcertante fu è stato forse il primo ad interessarsi in modo sistema- certo quello dell’abate gesuita Girolamo Saccheri. Altico delle equazioni di terzo grado, anche se riteneva l’inizio del 1700 egli riprese il quadrilatero che porta il che non potessero essere risolte per via algebrica, ma suo nome e cercò di ragionare per assurdo. Supponiab e DCA b solo geometricamente come intersezione di coniche. mo, disse, che ad esempio i due angoli B DC Questi matematici arabi introdussero il cosiddet- siano entrambi acuti; vediamo quali conseguenze si to quadrilatero di Saccheri. Questo nome, che natu- possono dedurre da questa ipotesi e se ne troviamo ralmente gli arabi non usavano, sarà giustificato più qualcuna assurda avremo dimostrato che l’ipotesi di tardi; la sua costruzione è mostrata nella figura 7.9. acutezza non può andar bene. Operiamo poi in modo b e DCA b siano entrambi Si prendono due punti distinti A e B su una retta analogo supponendo che B DC r e si tracciano i segmenti AC e BD, perpendicolari ottusi e cosı̀ alla fine avremo la dimostrazione complead r e della medesima lunghezza. Si considera infine ta che l’unica condizione ammissibile la 1., proprio la retta passante per C e D e quindi il quadrilatero quella equivalente al quinto postulato di Euclide. ABDC. Con questo bel programma in mente, Saccheri si E’ facile dimostrare, senza far uso del quinto po- mise al lavoro, e poiché era un buon matematico scob e C DB b sono uguali. prı̀ una serie di teoremi dedotti dall’ipotesi che i due stulato, che i due angoli ACD b e DCA b fossero acuti. Questo era molto Infatti, si comincino a considerare i triangoli ABD angoli B DC e BCA, che sono uguali perché AB è in comune, bello e interessante, ma Saccheri aveva come obiettiAC = BD per costruzione e, ancora per costruzio- vo quello di trovare una conseguenza assurda, e cosı̀ b e C AB b sono uguali in quanto tanto s’arrabattò e tanto scrisse che a un certo punne, gli angoli ABD retti. Pertanto, BC = AD e quindi sono uguali i to si convinse di aver trovato il baco che cercava. A triangoli BDC e ADC; ancora, CD è in comune e quel punto, tutto contento, decise che la Geometria 213 7.5. GEOMETRIE NON-EUCLIDEE Euclidea era proprio quella vera. Purtroppo per lui, l’impostazione ideologica con la quale era partito gli aveva fatto prendere lucciole per lanterne; i teoremi che aveva dimostrato erano tutti validi, ma erano validi in una geometria che supponesse acuti gli angoli b e DCA, b e in ciò che aveva trovato non c’era nulB DC la di assurdo. Come conclude malinconicamente C. B. Boyer: “[Saccheri] . . . perdette il diritto di rivendicare a sé quella che sarebbe stata la più significativa scoperta del XVIII secolo: la geometria non-euclidea. Il suo nome rimase oscuro per un altro secolo, poiché l’importanza della sua opera fu trascurata da coloro che vennero dopo di lui.” L’anno cruciale per le geometrie non-Euclidee fu il 1829, con la pubblicazione del saggio “Sui principi della Geometria” di Nicolaj Lobačevskij e il “Tantamen”, il trattato nel quale Farkas Bólyai riportava in appendice le idee del figlio Janos sulla questione del quinto postulato di Euclide. Lobačevskij era un giovane matematico russo che già da qualche anno si occupava dei fondamenti della geometria e, dopo vari tentativi e vari tentennamenti, aveva, come si suol dire, saltato il fosso operando una vera e prob pria rivoluzione: ipotizzare che i due angoli B DC b e DCA del quadrilatero di Saccheri siano entrambi acuti non è andare contro la realtà, ma è semplicemente un modo diverso di fondare la geometria rispetto all’impostazione di Euclide. I risultati che si ottengono sono assolutamente validi, anche se in un mondo diverso da quello che aveva in mente Euclide. In particolare, nel mondo di Lobačevskij, per un punto esterno a una retta r passano infinite rette “parallele” ad r, cioè che non incontrano mai r, pur prolungate indefinitamente. Un’altra particolarità è che la somma dei tre angoli interni di un triangolo è minore di due angoli retti, invece di essere perfettamente uguale. Naturalmente, le proprietà diverse sono infinite, ma non sono contraddittorie le une con le altre, e i teoremi continuano ad essere “veri”, anche se assai diversi da quelli usuali. Sessant’anni dopo Lobačevskij, Felix Klein chiamò iperbolica questa geometria, contrapponendola a quella Euclidea, che egli definı̀ parabolica. Bólyai aveva in mente una geometria del tutto analoga a quella di Lobačevskij, ma il Tentamen fu reso pubblico soltanto nel 1832. Inoltre, mentre Lobačevskij continuò a sviluppare la sua geometria negli anni successivi e fino alla morte, Bólyai si disinteressò della sua, cosı̀ che il riconoscimento per la scoperta della Geometria non-Euclidea va a tutti gli effetti al matematico russo. Bólyai rimase male dello scarso successo delle sue idee; soprattutto, sembra che rimanesse male dell’indifferenza con cui le accolse il più grande dei matematici, Gauss, che era amico del padre. D’altra parte, Gauss fu sempre restio a rico- noscere pubblicamente i meriti degli altri matematici, e mostrò la stessa indifferenza anche per il lavoro di Lobačevskij. Bisogna dire che, in generale, la scoperta delle Geometrie non-Euclidee non fu considerata, a quei tempi, cosı̀ importante come che la rappresentiamo oggi. La rilevanza della geometria in Matematica era allora molto calata, anche solo rispetto a cent’anni prima, e se le si dava credito da un punto di vista didattico, quasi più nessuno se ne interessava sul versante della ricerca. Questa era presa soprattutto dall’Analisi, che vedeva l’Algebra classica come un proprio strumento, mentre l’Algebra moderna muoveva appena i primi timidi passi. In quanto alla geometria come tale, aspetti speciali quali la Geometria Analitica, la Geometria Proiettiva e Descrittiva avevano attratto l’attenzione dei matematici. Di fatto, le Geometrie non-Euclidee sembrarono più una curiosità che una rivoluzione scientifica. Nel giro di una ottantina di anni, però, si verificarono tre fatti che hanno cambiato radicalmente il nostro atteggiamento nei confronti delle Geometrie non-Euclidee. Il primo fatto è specifico della Matematica e si tratta della prolusione che Riemann lesse quando divenne professore all’Università di Gottinga nel 1854 (aveva 28 anni!). Per rendersi conto dell’importanza di questa prolusione, basterà ricordare che Gauss espresse il suo apprezzamento per il lavoro di Riemann, cosa unica ed eccezionale. La prolusione trattava dei fondamenti della geometria, anche se della geometria considerata dal punto di vista analitico. Riemann generalizzava il concetto di distanza tra due punti che, come sappiamo è espressa dalla formula: d2 (A, B) = (xA − xB )2 + (yA − yb )2 + (zA − zB )2 = = dx2 + dy 2 + dz 2 nello spazio a tre dimensioni. Passando a una combinazione quadratica qualunque: d2 (A, B) = a1,1 (xA −xB )2 +a1,2 (xA −xB )(yA −yB )+ +a1,3 (xA −xB )(zA −zB )+a2,1 (yA −yB )(xA −xB )+· · · = = a1,1 dx2 + a1,2 dx dy + a1,3 dx dz + a2.1 dy dx + · · · si ottiene un concetto di distanza (in termini matematici, una metrica) che conforma lo spazio in infiniti modi possibili. Scegliendo opportunamente i coefficienti a1,1 , a1,2 , a1,3 , . . . si hanno pertanto geometrie diverse, fra le quali la Geometria Euclidea è quella in cui tutti i parametri valgono 0, eccetto a1,1 = a2,2 = a3,3 = 1. Riemann, poi, non legava la distanza alla differenza di coordinate (xA − xB ) o (yA − yB ), ma le lasciava come libere funzioni dei punti A e B coinvolti, purché soddisfacessero certe regole generali: ad esempio, la distanza tra due punti 214 è nulla se e solo se i due punti coincidono; la distanza tra A e B è uguale alla distanza di B da A; e cosı́ via. In questa maniera si può far rientrare la geometria di Lobačevskij in una teoria più generale di geometrie Euclidee e non-Euclidee da studiare con gli stessi strumenti teorici. Il nome di Riemann è rimasto legato a un caso speciale di geometria non-Euclidea, e b cioè quello corrispondente al caso che gli angoli B DC b e DCA del quadrilatero di Saccheri siano entrambi ottusi. In tale geometria, per un punto posto al di fuori di una retta r non passa alcuna retta parallela ad r; inoltre, la somma dei tre angoli di un triangolo è sempre maggiore di due angoli retti. Nella terminologia di Klein, questa è la Geometria Ellittica. L’opera di Riemann (che morı̀ di tisi a soli quarant’anni) ricondusse nell’alveo della Matematica “importante” le Geometrie non-Euclidee, anche se le relegava a un ruolo molto subalterno, ad esempi, interessanti fino a un certo punto, di una teoria ben più generale. Rientrate comunque in ballo, il secondo fatto che giocò a loro favore (e fu probabilmente il fatto più importante) riguarda il rinnovato interesse per la Logica e per i fondamenti della Matematica che prese piede e si sviluppò alla fine del 1800 e all’inizio del 1900. Questo merita la nostra attenzione e cercheremo perciò di raccontarlo con qualche dettaglio. La Geometria Euclidea costituisce sicuramente il primo esempio di sistema assiomatizzato; quando i matematici ripresero ad interessarsi dei fondamenti, la geometria costituı̀ un banco di prova immediato per discutere le idee relative ai processi di assiomatizzazione. L’impianto Euclideo fu analizzato da tutti i possibili punti di vista e, come abbiamo detto, ne furono rilevate inesattezze e carenze, fino ad arrivare alla formulazione di Hilbert, che abbiamo schematizzato nella Sezione 6.1. La possibilità di sviluppare teorie alternative come le Geometrie Euclidee e nonEuclidee fa capire che non esiste un apparato certo di assiomi che tutto comprende, e, cosa ancora più importante, non esiste un insieme vero di assiomi, e quindi non esiste una teoria vera, cioè conforme alla realtà o tale che la realtà le si conformi. Questa è l’idea diametralmente opposta alla concezione antica della Geometria Euclidea, che, come abbiamo osservato all’inizio, era tradizionalmente pensata come vera descrizione della realtà, anzi di realtà vera nell’accezione estrema di Platone. Ogni teoria ha un suo ambito di validità, cioè è vera per quella serie di fenomeni che vanno d’accordo con gli assiomi. In quest’ambito, i teoremi costituiscono risultati veri, ed è ciò che dà senso alla nostra visione matematica del mondo, secondo lo spirito di Galileo. Se usciamo dall’ambito di validità degli assiomi, non possiamo più parlate di adeguatezza tra realtà e teo- CAPITOLO 7. LE ALTRE GEOMETRIE ria, e siamo costretti a cambiare la teoria esplicativa. Tutto ciò è abbastanza evidente, ma c’è un problema molto grave dietro questo modo di vedere le cose. Se impostiamo una teoria dichiarando quali sono gli assiomi e le regole di inferenza (v. Sezione 1.6), fin dove possiamo spingerci con l’arbitrarietà degli assiomi scelti? In altre parole, non possiamo mettere tra gli assiomi che 2+2 = 4 e allo stesso tempo 2+2 = 5, né possiamo tollerare che uno dei due si deduca dall’altro. E’ questo il problema della consistenza di una teoria, e requisito fondamentale per un sistema assiomatico sensato è che esso determini una teoria consistente, cioè priva di contraddizioni. Un metodo per stabilire la consistenza di un sistema è quello di trovarne un modello nella realtà (si veda anche la Sezione 1.6) o almeno in un’altra teoria che riteniamo consistente. Ad esempio, la Geometria Euclidea si considera consistente perché ha come modello la Geometria Analitica, e questa si basa su concetti matematici che consideriamo consistenti, o non contraddittori. Sarebbe allora interessante trovare dei modelli anche per le Geometrie non-Euclidee, poiché questo ci assicurerebbe che esse non contengono contraddizioni, cioè sono teorie valide alla pari della Geometria Euclidea. Vorrei osservare che questo aspetto non era stato considerato né la Lobačeskij né da Bólyai che, a rigore, avrebbero potuto creare delle belle teorie, ma inconsistenti, perché inficiate da qualche contraddizione interna che avrebbero potuto non rilevare. Come si ricorda, questa era la non segreta speranza di Saccheri, che desiderava proprio dimostrare l’inconsistenza delle sue ipotesi assurde relative al quadrilatero della Figura 7.9. Un primo e quasi banale modello fu trovato per la Geometria Ellittica di Riemann. Accontentiamoci di una realtà bidimensionale e consideriamo quanto succede sulla superficie della Terra. I punti sono i punti della superficie di una sfera e le rette sono le circonferenze massime sulla stessa superficie: pensiamo ai meridiani e all’equatore, mentre non sono rette gli altri paralleli. Questa scelta non è casuale, ma è dovuta al fatto che presi due qualsiasi punti (ad esempio, due città) esiste una e una sola circonferenza massima che passa per essi, mentre di altri tipi di circonferenze ne passano infiniti. Questo è proprio quello che ci aspettiamo da oggetti che vogliamo chiamare “rette”, oggetti determinati da due punti e due soltanto. Se ora pensiamo a un meridiano m (cioè, una retta) e ad un punto P fuori di esso, vediamo subito che ogni retta che passa per P incontra sempre e comunque il meridiano m. Infatti, due circonferenze massime non possono non incontrarsi (altrimenti, una almeno non sarebbe massima) e anzi si incontra in due punti, come ogni coppia di meridiani si incontrano al Polo Nord e al Polo Sud. Come abbiamo 215 7.6. GEOMETRIA DESCRITTIVA E PROIETTIVA accennato, in questa geometria la somma degli angoli interni di un triangolo è sempre maggiore di due retti. Prendiamo ad esempio due punti sull’equatore, di modo che la loro distanza sia un quarto della lunghezza dell’equatore stesso; uniamoli tra loro e al Polo Nord. Otteniamo cosı̀ un triangolo, detto sferico perché disegnato sulla superficie di una sfera. Basta un momento di riflessione per capire che i tre angoli del triangolo sono tutti retti, e quindi la loro somma di 270◦ è ben maggiore di 180◦ ! C A C′ B A′ B′ Figura 7.10: Triangoli di Beltrami e di Riemann Più laborioso fu trovare un modello per la Geometria Iperbolica di Lobačevskij. Ci riuscı̀, nella seconda metà del 1800, il matematico italiano Eugenio Beltrami. Anche lui propose un modello bidimensionale, costituito da una superficie. Questa però è assai complicata e si ottiene per rotazione da una curva speciale, detta trattrice, definita nel modo seguente: per ogni punto P sulla trattrice Γ, la tangente a Γ in P incontra l’asse delle x in Q e il segmento P Q ha lunghezza unitaria. Facendo ruotare questa curva intorno all’asse delle ascisse si ottiene una superficie detta pseudosfera ed è la superficie considerata da Beltrami. Questa superficie ha una proprietà importante, ma un po’ difficile da capire: la curvatura in ogni punto è costante ed uguale a −1; questo è il giusto il contrario di ciò che succede nella sfera, che ha anch’essa curvatura costante, ma uguale a +1. Nella sfera, infatti, la curvatura è sempre risolta all’interno, mentre nella pseudosfera è sempre rivolta all’esterno. Questa analogia al contrario fa sı̀ che, definite opportunamente le “rette”, succeda proprio ciò che si vuole nella Geometria Iperbolica: per un punto P fuori della “retta” r passano infinite rette parallele ad r (cioè, che non incontrano mai r). Anche se la cosa è difficile a vedersi, Beltrami dimostrò che in ogni triangolo sulla superficie della pseudosfera la somma degli angoli interni è sempre minore di due retti. Non tentiamo nemmeno di abbozzare le dimostrazioni, fidando nella fiducia del lettore e sulla credibilità di Beltrami che, ai suoi tempi, fu presidente dell’Accademia dei Lincei e Senatore del Regno. I modelli non hanno solo la funzione logica di ras- sicurarci sulla consistenza di una teoria assiomatica; essi hanno anche un valore psicologico non indifferente, poiché ci mostrano una situazione reale (anche se in senso molto matematico e astratto) nella quale gli assiomi, i teoremi, le definizioni e tutto ciò che deriva dalla nostra teoria hanno un riscontro pratico ben chiaro. Si può dire, esagerando forse un po’, che il modello sostanzializza la teoria, rendendola plausibile anche agli scettici. Spesso, come nel caso della Geometria Ellittica, il modello ci mostra come un’idea che pareva assurda (quella delle geometrie nonEuclidee) rientri invece nei canoni della Matematica conosciuta, anzi non sia altro che una situazione ben nota, solo vista da un punto di osservazione diverso. I triangoli sferici, infatti, fanno parte della trigonometria sferica, una disciplina che era stata studiata fin dall’antichità, e in modo assai profondo dopo le grandi scoperte geografiche, essendo legata ai nostri movimenti sulla superficie terrestre, in primo luogo quelli delle navi. A questo punto non ci rimane altro che ricordare il terzo fatto (ultimo, ma non meno importante) che ha portato all’affermazione delle geometrie non-Euclidee: la geometria di Riemann è la Geometria adottata da Einstein nella teoria della relatività. Questa non avrebbe neppure avuto inizio, se le Geometrie non Euclidee non avessero fornito gli strumenti matematici per il suo sviluppo. 7.6 Geometria proiettiva descrittiva 7.7 Topologia 7.8 Gli spazi vettoriali e 216 CAPITOLO 7. LE ALTRE GEOMETRIE Capitolo 8 Trigonometria e Calcolo C. [canticchiando da ubriaco] Che ne dite della mia voce? H. Non vi vedo debuttare all’Opera. C. He, he! Mi chiamo Collins, per mia sfortuna, non Caruso. Sono professore. Insegno all’Università di Chicago e ho fatto una conferenza a New York – sugli integrali. Nel Calcolo Differenziale si dà una funzione e si ottiene il differenziale. Avete afferrato? H. Alla perfezione! C. Davvero?! A. Hitchcock L’altro uomo In questo capitolo conclusivo trattiamo di due argomenti un po’ più avanzati e specialistici, almeno dal punto di vista della Matematica che si insegna nelle Scuole Medie. La Trigonometria è propriamente lo studio dei triangoli, ma le funzioni trigonometriche, seno, coseno, tangente e le loro inverse, hanno una stretta connessione con la funzione esponenziale, come scoprı̀ Eulero, e ciò imparenta Trigonometria e Calcolo Differenziale. Non potremo perciò non prendere in considerazione tali funzioni che sono periodiche e quindi qualitativamente diverse dai polinomi, dalle funzioni razionali fratte, dall’esponenziale e dal logaritmo. La Trigonometria è nata nell’antichità, applicata soprattutto all’astronomia; si è poi affermata nel Medio Evo come ausilio indispensabile alla navigazione, crescendo vieppiù di importanza con le scoperte geografiche del 1400 – 1500 e la conseguente globalizzazione dei viaggi per mare. Le prime tavole trigonometriche prendevano in considerazione la corda sottesa da un arco di circonferenza, e quindi in pratica erano relative al seno. Oltre a seno, coseno, tangente e cotangente, ebbero fortuna altre funzioni, come 1 − cos x, ma oggi non le si considerano molto importanti; la stessa cotangente, essendo semplicemente l’inverso della tangente, tende ad essere relegata in secondo piano. Rimangono importanti tutte le applicazioni della Trigonometria alle misurazioni (triangolazioni), allo studio dei fenomeni oscillatori e pe- riodici, all’analisi armonica (suoni, immagini, colori, compressione, etc.). Il Calcolo Differenziale e Integrale è un po’ alla base di tutta la Matematica moderna. Esso fu inventato (o scoperto) da Newton e da Leibniz nella seconda metà del 1600. Newton accusò Leibniz di avergli rubato l’idea, sfruttando alcune informazioni che gli aveva dato in una lettera. Leibniz negò, rivendicando l’originalità delle proprie idee. Cosı̀ i due rimasero nemici fino alla morte. Gli storici oggi sono pressoché d’accordo che i due pensarono e svilupparono il calcolo differenziale in modo indipendente, con concetti e notazioni equivalenti, ma abbastanza lontane. A parte questa diatriba, nel giro di pochi anni il calcolo differenziale divenne la regina della Matematica e uno stuolo di matematici geniali lo sviluppò tanto da renderlo indispensabile sia alla Matematica sia alla Fisica, come mostrò per primo lo stesso Newton. La crescita del calcolo differenziale durante il 1700 ha qualcosa di prodigioso, e uno dei maggiori scienziati che contribuı̀ a questo exploit fu certamente Eulero. Nella prima metà del 1800 i matematici, e primo fra tutti Cauchy, diedero una sistemazione ai risultati precedenti, arrivando a un’impostazione che è praticamente quella che oggi conosciamo. Tuttavia, il concetto di funzione e quello di integrale si rivelarono particolarmente delicati, e occorre arrivare alla fine del 1800 e all’inizio del 1900 per trovarne una caratterizzazione soddisfacente (Peano, Lebesgue). Noi, bisogna dire, saremo costretti a seguire un’impostazione abbastanza intuitiva, ma speriamo che sia sufficiente a far capire i concetti principali e a permettere di utilizzarli a livello elementare. 8.1 Le funzioni trigonometriche Scopo della trigonometria è la misurazione dei triangoli, cioè il calcolo dei valori delle varie misure di un triangolo: lati, angoli, altezze, mediane e cosı̀ via, a partire da dati noti, di solito i tre lati, due lati e l’angolo tra essi compreso, o un lato e i due angoli ad esso adiacenti. Come sappiamo, questi dati determi- 217 218 CAPITOLO 8. TRIGONOMETRIA E CALCOLO nano tutti gli altri in modo univoco, ma la geometria euclidea non dà molto aiuto per valutare le quantità non note. Proprio a questa mancanza vuol rimediare la trigonometria che, inizialmente, aveva soprattutto scopi pratici e veniva usata nella navigazione, nella topografia, nella balistica e nell’astronomia. Le prime tavole trigonometriche, costruite dagli Arabi, servivano proprio per questi scopi: il citato al-Khuwarizmi, nell’800 D.C. contribuı̀ alla realizzazione delle prime tavole dei seni e nel XIII secolo il re Alfonso di Castiglia fece preparare le prime tavole nautiche dell’Occidente: con grande scandalo in tutta Europa, affidò tale compito a un gruppo di matematici arabi ed ebrei, che a quel tempo erano i migliori. Gran parte del lavoro dei matematici applicati del 1700 e del 1800 fu la compilazione di carte nautiche di tutto il mondo e di tabelle di puntamento per le artiglierie. Comunque, dal 1700 con Eulero, fu riconosciuta la stretta connessione tra la funzione esponenziale e le funzioni trigonometriche, che cosı̀ entrarono a far parte della matematica teorica e successivamente, come è noto, divennero parte preponderante nello studio dell’elettricità, del magnetismo e di tutti i fenomeni oscillatori. misura dell’arco, si ha pertanto la proporzione: A B α O P U C Figura 8.1: Il cerchio goniometrico Il cerchio di raggio 1 è detto cerchio goniometrico; di solito lo si rappresenta col centro nell’origine di un sistema di assi cartesiani ortogonali. Gli angoli sono rappresentati come angoli al centro e, di regola, una delle due semirette che definiscono l’angolo è fatta coincidere con la semiretta positiva dell’asse delle x, mentre l’altra semiretta determina l’angolo secondo una rotazione in senso antiorario (si veda la Figura 8.1). Ora si può osservare che l’arco U A è direttamente proporzionale all’angolo α. Questo permette di sostituire la misura in gradi di α con la misura di U A. Detta G(α) la misura in gradi di α ed R(α) la G(α) : 360◦ = R(α) : 2π, essendo 2π la misura dell’intera circonferenza, corrispondente all’angolo di 360◦ . La quantità R(α) si chiama la misura in radianti di α e quindi si hanno le semplici formule di conversione: R(α) = πG(α) 180 e G(α) = 180R(α) . π Questo significa che, per definizione, un radiante è la misura dell’angolo che sottende un arco di lunghezza 1 nel cerchio goniometrico. La sua misura in gradi è: G(α) = 180◦ ≈ 57◦ 17′ 44′′ 81/100. π Altre misure importanti sono: 18◦ = π rad 10 30◦ = π rad 6 45◦ = π rad 4 π π rad 90◦ = rad. 3 2 La misura in radianti è, in un certo senso, la misura “naturale” degli angoli. Essa infatti non dipende da suddivisioni arbitrarie, quali la misurazione del grado come 360a parte dell’angolo giro; dipende solo dalla misura degli archi, e quindi del raggio del cerchio, che abbiamo fissato ad 1 per semplicità. Per questo, la misurazione in radianti è la più usata nella letteratura scientifica ed è indispensabile nel trattamento analitico delle funzioni trigonometriche. Sia ancora α un angolo, sia A l’intersezione con il cerchio goniometrico e sia P la proiezione di A sull’asse OU ; infine, sia B l’intersezione con la retta OA della perpendicolare ad OU in U . Si hanno le seguenti definizioni: 60◦ = Definizione 8.1 Si dice seno dell’angolo α, e si indica con sin(α) (dal latino “sinus”), la misura (con segno) del segmento AP . Si dice coseno dell’angolo α, e si indica con cos(α), la misura (con segno) del segmento OP . Infine, si dice tangente dell’angolo α, e si indica con tan(α), la misura (con segno) del segmento U B. Al variare di α tra 0◦ e 360◦ (cioè tra 0 rad e 2π rad) il seno e il coseno possono assumere solo valori compresi tra 1 e −1. La tangente, invece, assume valori sempre più alti man mano che da 0◦ si va verso i 90◦ ; per α = 90◦ il valore della tangente non risulta definito e lo si considera uguale a infinito. Quando si superano i 90◦ , la tangente viene ad assumere valori negativi, prima molto alti in valore assoluto, poi sempre più vicini a 0. I valori della tangente ritornano ad essere positivi quando si superano i 180◦ , ma 219 8.1. LE FUNZIONI TRIGONOMETRICHE a 270◦ la tangente è di nuovo non definita. Si hanno sono espresse nel sistema decimale anziché in quello pertanto i seguenti valori: sessagesimale. Alla base del calcolo delle funzioni trigonometriche sin(0◦ ) = 0 sin(90◦ ) = 1 sin(180◦ ) = 0 vi sono i due seguenti teoremi, che permettono di riportare i conteggi a quelli relativi a una sola funzione, sin(270◦ ) = −1 sin(360◦ ) = 0 ad esempio il seno. cos(0◦ ) = 1 cos(90◦ ) = 0 ◦ ◦ cos(270 ) = 0 ◦ tan(0 ) = 0 cos(180◦ ) = −1 cos(360 ) = 1. ◦ tan(90 ) = ∞ tan(180◦ ) = 0 Teorema 8.1 Per ogni angolo α vale la seguente identità: sin2 (α) + cos2 (α) = 1. Prova: Se l’angolo α è compreso tra 0◦ e 90◦ , applicando il teorema di Pitagora al triangolo OP A della Aumentando ulteriormente l’angolo, i valori del seno Figura 8.1, si ha AP 2 + OP 2 = OA2 , cioè proprio la e del coseno tornano a ripetersi ogni 360◦ o 2π ra- relazione cercata. Lasciamo al lettore la verifica di dianti. Le due funzioni, pertanto, sono periodiche di questa identità in tutti gli altri casi. periodo 360◦ o 2π radianti. Si scrive (k ∈ Z): Questa relazione, valida per ogni valore di α, si dice ◦ ◦ sin(α) = sin(α + k360 ) cos(α) = cos(α + k360 ); l’identità trigonometrica fondamentale; da essa derivano gran parte delle proprietà della trigonometria. Per quello che riguarda la tangente, si ha: sin(α) = sin(α + 2kπ) cos(α) = cos(α + 2kπ). tan(270◦ ) = ∞ tan(360◦ ) = 0 La tangente, invece, torna a ripetersi ogni 180◦ o πrad; è pertanto periodica di periodo 180◦ o πrad: tan(α) = tan(α + k180◦ ) tan(α) = tan(α + kπ). La seguente tabella riassume il segno delle funzioni trigonometriche di quadrante in quadrante: sin cos tan I + + + II + − − III − − + IV − + − Teorema 8.2 Qualunque sia l’angolo α: tan(α) = sin(α) . cos(α) Prova: Anche in questo caso possiamo limitarci agli angoli compresi tra 0◦ e 90◦ . Sempre con riferimento alla Figura 8.1, osserviamo che i due triangoli OP A e OU B sono simili; pertanto vale la proporzione AP : OP = BU : OU . Ricordando che, per definizione, OU = 1, questa è esattamente la relazione cercata. Nella Figura 8.1, l’angolo in A del triangolo OAP è chiaramente il complementare di α; da questo si deducono immediatamente le formule dell’angolo Per trovare il valore del seno e del coseno di un complementare: angolo, è conveniente riportare l’angolo a uno equisin(90◦ − α) = cos(α) cos(90◦ − α) = sin(α) valente compreso tra 0◦ e 360◦ o tra 0 rad e 2π rad. Analogamente, per la tangente si riporta l’angolo a 1 uno equivalente compreso tra 0◦ e 180◦ o tra 0rad e tan(90◦ − α) = = cot(α), tan(α) πrad. Per questo, le tavole contengono solo i valori di seno, coseno e tangente per tali angoli, spesso ad- dove cot(α) indica la funzione cotangente che è dedirittura limitatamente ai valori tra 0◦ e 45◦ (ovvero finita come l’inverso della tangente; useremo questa tra 0 rad e π/4 rad), per i motivi che vedremo un po’ funzione solo il minimo indispensabile. Queste forpiù avanti (Tabella 8.1). Il calcolatore dà i valori per mule, in realtà, valgono per tutti i valori di α, anche qualsiasi α, ma al suo interno riporta tutto all’inter- quando α > 90◦ ; ad esempio, se 90◦ < α < 180◦ , si vallo fra 0◦ e 360◦ (180◦ ) o tra 0 rad e 2π (o π) rad ha sin(90◦ − α) = sin(β) dove β < 0, ovvero 270◦ < effettuando la riduzione: β < 360◦ . I due triangoli OAP e OCQ sono uguali e questo dimostra che | sin(90◦ − α)| = | cos(α)|; α mod 360 ovvero α mod 2π d’altra parte, i segni sono entrambi negativi e questo conclude il ragionamento. In modo analogo si può (α mod 180 ovvero α mod π). procedere negli altri casi, cioè quando l’angolo α è Di solito, un tasto permette di scegliere se fare i conti compreso negli altri quadranti e/o quando si parte in gradi o in radianti, e talvolta è presente una ter- dal coseno. za modalità, quella dei gradi decimali, nei quali l’anUn aspetto importante di queste formule è il fatto golo retto corrisponde a 100◦ e le frazioni di grado che esse permettono di ridurre il calcolo delle funzioni 220 CAPITOLO 8. TRIGONOMETRIA E CALCOLO trigonometriche (e quindi le tavole relative) al solo ottante (0◦ ..45◦ ). Se infatti α > 45◦ , si ha sin(α) = cos(90◦ − α), riportandosi cosı̀ a un angolo del primo ottante. Dalla circonferenza goniometrica è possibile ricavare anche le formule dell’angolo supplementare: conoscendo un cateto e l’angolo opposto a tale cateto. Infine, si calcola anche un cateto in funzione dell’altro, risolvendo le precedenti uguaglianze rispetto all’ipotenusa: sin(180◦ − α) = sin(α) cos(180◦ − α) = − cos(α) ◦ tan(180 − α) = − tan(α). E’ buona norma, per non rischiare di commettere errori grossolani, disegnare il cerchio goniometrico e su di esso l’angolo di interesse: le relazioni precedenti si vedono immediatamente. C C′ BC = sin(α) AB cos(α) B′ B AB = cos(α) BC; sin(α) queste relazioni giustificano l’introduzione della tangente, in quanto esse sono equivalenti a: BC = tan(α)AB e AB = BC . tan(α) In qualche caso, queste formule permettono di ottenere il valore del seno e del coseno di certi angoli particolari. Se α = 45◦ ovvero α = π/4, il triangolo rettangolo è metà √ di un quadrato, cioè se AB = ℓ, allora AC = ℓ 2, quindi: √ sin(45◦ ) = cos(45◦ ) = AB/AC = 2/2 α A e tan(45◦ ) = sin(45◦ ) = 1. cos(45◦ ) Figura 8.2: Calcolo dei lati Se α = 30◦ , il triangolo è metà di un triangolo √ equilatero e quindi se AC = ℓ risulta AB = 3ℓ/2 e Il teorema di Pitagora permette di calcolare i tre BC = ℓ/2; di conseguenza: lati di un triangolo rettangolo quando ne siano noti sin(30◦ ) = BC/AC = 1/2 solo due; non ci dice niente, però, sugli angoli, né ci permette di calcolare i lati quando se ne conosca uno √ cos(30◦ ) = AB/AC = 3/2 solo e si conosca invece un angolo diverso da quello √ retto. La trigonometria risolve immediatamente que1 2 3 sin(30◦ ) ◦ sti problemi. Si abbia, come in Figura 8.2, il trian= √ = . tan(30 ) = ◦ cos(30 ) 2 3 3 golo rettangolo ABC e se ne conosca l’angolo α. Se prendiamo il punto C ′ in modo che AC ′ = 1, si ha Dalla formula per l’angolo complementare si ha per definizione C ′ B ′ = sin(α) e AB ′ = cos(α). Dalla allora: similitudine dei triangoli ABC e AB ′ C ′ si hanno le √ seguenti proporzioni: sin(60◦ ) = 3/2 cos(60◦ ) = 1/2 AC ′ : AC = B ′ C ′ : BC e AC ′ : AC = AB ′ : AB 1 : AC = sin(α) : BC e 1 : AC = cos(α) : AB. √ 3 √ sin(60◦ ) =2 = 3. tan(60 ) = ◦ cos(60 ) 2 ◦ Un altro angolo per il quale è facile calcolare i vaQueste permettono di calcolare due lati qualsiasi lori del seno e del coseno è 18◦ . Si consideri il trianquando se ne conosca il terzo. In particolare, quando golo armonico definito nella Sezione 6.4; se tracciasi conosca l’ipotenusa si ha: mo l’altezza CH e consideriamo il lato AC = 1, si ha AH = sin(18◦ ) e CH = cos(18◦ ). Questo dà BC = AC sin(α) e AB = AC cos(α) immediatamente: √ che si enunciano cosı̀: la misura di un cateto è data 5−1 ◦ ◦ sin(18 ) = cos(72 ) = ≈ 0.30901699 . . . . dal prodotto dell’ipotenusa per il coseno dell’angolo 4 adiacente o per il seno dell’angolo opposto. Naturalmente, invertendo queste formule si può calcola- Dall’identità trigonometrica fondamentale si ricava re l’ipotenusa di un triangolo rettangolo conoscen- allora: s do uno qualsiasi dei cateti e l’angolo compreso tra √ lo stesso cateto e l’ipotenusa. Applicando le formule 5+ 5 ◦ ◦ cos(18 ) = sin(72 ) = ≈ 0.95105655 . . . dell’angolo complementare, l’ipotenusa si trova anche 8 221 8.2. LE FORMULE DI SOMMA E SOTTRAZIONE e infine: Oggi, con i nostri calcolatori a disposizione, il problema sembra non più porsi, ma, ci dobbiamo chiedere, √ √ 2( 5 − 1) ◦ come riescono gli elaboratori a fare i calcoli necessari? tan(18 ) = p √ In realtà esistono vari metodi sviluppati dall’analisi 2 5+ 5 matematica, ma le basi sono fornite da alcune forPer completezza ricordiamo che accanto alle tre mule di importanza veramente fondamentale e che funzioni fondamentali della Trigonometria molte al- sono conosciute già da alcuni secoli. Cominciamo col tre sono state introdotte per risolvere specifici pro- dimostrare il seguente risultato: blemi. Oggi sono piuttosto cadute in disuso, ma talvolta capita ancora di incontrarle. Accanto alla già citata cotangente, inversa della tangente, meritano B di essere ricordate la secante e la cosecante, inverse rispettivamente del coseno e del seno: p √ 2 5+ 5 ◦ . tan(72 ) = √ √ 2( 5 − 1) csc α = 1 sin α sec α = 1 . cos α Sono invece importanti le inverse composizionali di seno, coseno e tangente: A C • arcsin(x) si legge: “l’arco del seno di x” e indica l’angolo il cui seno vale x (nella Figura 8.1, è l’arco U A nei confronti del segmento x = AP ); • arccos(x) si legge: “l’arco del coseno di x” e indica l’angolo il cui coseno vale x (nella Figura 8.1, è l’arco U A nei confronti del segmento x = OP ); • arctan(x) si legge: “l’arco della tangente di x” e indica l’angolo la cui tangente vale x (nella Figura 8.1, è l’arco U A nei confronti del segmento x = U B). Pertanto si ha: β α O X R Q P U Figura 8.3: Somma dei seni Teorema 8.3 Siano α e β due angoli tali che α+β ≤ 90◦ ; allora: sin(α + β) = sin(α) cos(β) + cos(α) sin(β). sin(arcsin x) = arcsin(sin x) = x b Prova: Si consideri la Figura 8.3 in cui α = U OA b e β = AOB, per cui sin(α + β) = BQ. Se BX è cos(arccos x) = arccos(cos x) = x perpendicolare ad OA, si ha OX = cos(β) e BX = tan(arctan x) = arctan(tan x) = x. sin(β). Per le formule sui triangoli rettangoli si ha Nella nostra trattazione elementare non ci occupere- XP = OX sin(α) = sin(α) cos(β) = CQ. Ora, i due triangoli rettangoli OQR e RXB sono simili, poiché mo molto di queste funzioni, se non in contesti √ ovb b vi come: “qual è l’angolo che ha per √ seno 2/2?”, ORQ = X RB come angoli opposti al vertice, quindi b domanda che ha per risposta: arcsin( 2/2) = 60◦ . RBX = α. Nel triangolo rettangolo BXC si ha ora L’unica eccezione è la funzione arcotangente, che ha BC = BX cos(α) = cos(α) sin(β) e, in conclusione: un ruolo molto importante nel calcolo differenziale sin(α + β) = BQ = CQ + BC = e, soprattutto, nel calcolo integrale; l’incontreremo pertanto in tale contesto. = sin(α) cos(β) + cos(α) sin(β) 8.2 Le formule di somma e sottrazione come si voleva. Lavorando per casi, è possibile far vedere che la condizione α + β ≤ 90◦ può essere fatta cadere e che Il calcolo delle funzioni trigonometriche non è per quindi la formula è valida per ogni valore di α e di β. niente banale; a parte i pochi valori particolari che Seguendo un cammino analogo, si possono dimostrare abbiamo visto nella precedente sezione, sappiamo ve- formule simili relative al coseno e alla differenza α − ramente poco, e questo ci fa capire quanto benemeriti β; qui riteniamo che la dimostrazione precedente sia per i naviganti siano stati coloro che hanno calcolato i sufficiente a dare l’idea generale di come procedere valori di seno e coseno, costruendo le apposite tavole. e ci limitiamo quindi a riportare le quattro formule, 222 CAPITOLO 8. TRIGONOMETRIA E CALCOLO dette di somma e sottrazione: Per dimostrare questa relazione basta partire dalla definizione di tangente e applicare le regole della somma e della sottrazione relative a seno e coseno; ad esempio: sin(α + β) sin(α − β) cos(α + β) cos(α − β) = sin(α) cos(β) + cos(α) sin(β) = sin(α) cos(β) − cos(α) sin(β) = cos(α) cos(β) − sin(α) sin(β) = cos(α) cos(β) + sin(α) sin(β). tan(α + β) = sin(α + β) sin α cos β + cos α sin β = ; cos(α + β) cos α cos β − sin α sin β E’ opportuno ricordare a memoria queste identità che, insieme all’identità fondamentale, costituiscono a questo punto è sufficiente dividere numeratore e dela base di tutta la trigonometria. Esiste una formula nominatore per cos α cos β e si trova immediatamente mnemonica che può aiutare a ricordare le due espresla formula cercata. La duplicazione è allora: sioni per la somma, dalle quali è poi facile ricavare quelle della sottrazione. La frase è: 2 tan α (8.1) tan(2α) = 1 − tan2 α CENTO ROSE MOLTO MENO BELLE. Qui le “E” corrispondono al seno e le “O” al coseno; le prime due parole si riferiscono alla formula per il seno, dove si ha la somma del prodotto sin(α) cos(β) con il prodotto cos(α) sin(β). Le ultime tre parole si riferiscono invece alla formula per il coseno, data dalla sottrazione (“meno”) fra i prodotti cos(α) cos(β) e sin(α) sin(β). Ad esempio, per l’angolo di 15◦ si trova: sin(15◦ ) = sin(45◦ − 30◦ ) = = sin(45◦ ) cos(30◦ ) − cos(45◦ ) sin(30◦ ) = √ √ √ √ √ 2 3 21 6− 2 − = ≈ 0.258819. = 2 2 2 2 4 Analogamente: √ √ 6+ 2 cos(15◦ ) = ≈ 0.965926. 4 e da questa si ricava la formula di bisezione cambiando α in α/2: √ −1 ± 1 + tan2 α α . tan = 2 tan α Per completezza, citiamo la formula di triplicazione per il coseno, che il lettore potrà ricavare sviluppando cos(3α) = cos(2α + α): cos(3α) = 4 cos3 (α) − 3 cos(α). Sapendo risolvere le equazioni di terzo grado (in modo esatto o approssimato), questa formula permette, ad esempio, di calcolare cos(5◦ ) a partire da cos(15◦ ) che abbiamo trovato in precedenza. La formula analoga di triplicazione del seno è: sin(3α) = 3 sin(α) − 4 sin3 (α). Particolarmente importante è il caso α = β, per cui si ha: Ad ogni modo, nella Tavola 8.1 riportiamo il valosin(2α) = 2 sin(α) cos(α) re del seno e del coseno di grado in grado; i seni si leggono direttamente, mentre per leggere i coseni occos(2α) = cos2 (α) − sin2 (α) = corre considerare l’angolo complementare, che si tro2 2 = 2 cos (α) − 1 = 1 − 2 sin (α). va dal lato opposto della tabella. Perciò sin(12◦ ) = che si dicono formule di duplicazione. Se poniamo 0.20791169 = cos(78◦ ). α/2 al posto di α, si ottiene: Nota 8.1 Come si costruisce una tavola come ³α´ ³α´ quella della Tabella 8.1? Oggi la cosa è molto semplice − 1, cos(α) = 1 − 2 sin2 ; cos(α) = 2 cos2 2 2 e basta un programma di poche righe per ottenere una e quindi si hanno le formule di bisezione: r r α 1 + cos(α) 1 − cos(α) α , sin = ± . cos = ± 2 2 2 2 Queste formule permettono di ottenere seno e coseno di angoli sempre più piccoli e, quindi, di angoli che differiscono tra di loro tanto poco quanto si vuole, cioè danno la possibilità di costruire le tavole trigonometriche. Per quanto riguarda la tangente, le formule di somma e sottrazione sono le seguenti: tan(α ± β) = tan α ± tan β . 1 ∓ tan α tan β tabella anche più accurata, con più cifre decimali e, ad esempio, di primo in primo o anche di secondo in secondo. Noi abbiamo utilizzato Maple, un programma di valutazione simbolica, che ci ha permesso di ottenere un’uscita utilizzabile direttamente per queste note. In realtà, le tavole come questa non sono più utilizzate, poiché è più semplice avere a disposizione una piccola calcolatrice portatile, che ci può fornire, con estrema precisione, il valore di qualsiasi funzione trigonometrica per un valore qualunque dell’argomento. Una volta, diciamo fino agli anni 70 del 1900, le tavole erano indispensabili in qualsiasi lavoro tecnico e per l’orientamento; notevoli sforzi si sono spesi per rendere tali tavole prive di errori e semplici da usare. Si narra che, proprio allo scopo di eliminare i numerosi 223 8.2. LE FORMULE DI SOMMA E SOTTRAZIONE sin / cos 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 valore 0 0.01745241 0.03489950 0.05233596 0.06975647 0.08715575 0.10452847 0.12186935 0.13917310 0.15643447 0.17364818 0.19080900 0.20791169 0.22495106 0.24192190 0.25881905 0.27563736 0.29237171 0.30901700 0.32556818 0.34202014 0.35836797 0.37460659 0.39073114 0.40673664 0.42261827 0.43837114 0.45399051 0.46947158 0.48480963 0.50000000 0.51503808 0.52991928 0.54463903 0.55919292 0.57357643 0.58778525 0.60181504 0.61566148 0.62932041 0.64278761 0.65605904 0.66913061 0.68199837 0.69465837 0.70710680 valore 1. 0.99984770 0.99939083 0.99862953 0.99756405 0.99619470 0.99452189 0.99254615 0.99026807 0.98768834 0.98480775 0.98162718 0.97814760 0.97437006 0.97029573 0.96592583 0.96126170 0.95630475 0.95105655 0.94551857 0.93969262 0.93358042 0.92718386 0.92050485 0.91354546 0.90630778 0.89879405 0.89100652 0.88294758 0.87461970 0.86602540 0.85716730 0.84804809 0.83867057 0.82903756 0.81915205 0.80901700 0.79863549 0.78801075 0.77714595 0.76604444 0.75470957 0.74314482 0.73135369 0.71933980 0.70710680 cos / sin 90 89 88 87 86 85 84 83 82 81 80 79 78 77 76 75 74 73 72 71 70 69 68 67 66 65 64 63 62 61 60 59 58 57 56 55 54 53 52 51 50 49 48 47 46 45 Tabella 8.1: Tavola dei seni e dei coseni errori di calcolo delle tavole nautiche, Babbage fosse spinto a progettare e a tentare di realizzare la sua “Macchina Analitica”, il prototipo di tutti i calcolatori programmabili (1835 circa). Volendo immaginare come venivano costruite queste tavole, possiamo cominciare osservando che è possibile, con le nostre conoscenze, trovare seno e coseno di un angolo di 3◦ . Infatti, si ha immediatamente: sin(3◦ ) = sin(18◦ − 15◦ ) = = sin(18◦ ) cos(15◦ ) − cos(18◦ ) sin(15◦ ) = s √ √ √ √ √ √ 5−1 6+ 2 5+ 5 6− 2 − ≈ = 4 4 8 4 ≈ 0.052335956 . . . . Non è difficile, almeno numericamente, trovare ora seno e coseno dell’angolo di 1◦ . Infatti, la formula di triplicazione ci dice: sin(3◦ ) = 3 sin(1◦ ) − 4 sin3 (1◦ ) dove il valore di sin(1◦ ) è ignoto, ma si conosce sin(3◦ ). Questa espressione equivale all’equazione di terzo grado in x = sin(1◦ ): 4x3 − 3x + sin(3◦ ) = 0. Teoricamente, qui si potrebbe applicare la formula risolutiva delle equazioni di terzo grado. Come abbiamo osservato a suo tempo, tale applicazione non è banale per i conti che richiede e che devono essere svolti utilizzando i numeri complessi. Più conveniente è un celebre metodo, dovuto a Newton, che permette di trovare il valore di x con la precisione che si desidera, applicando iterativamente la seguente formula: xi+1 = xi − 4x3i − 3xi + sin(3◦ ) 12x2i − 3 e partendo dal valore x0 = 0. Questo dà x1 = sin(3◦ )/3 ≈ 0.017445318 . . ., che è già preciso fino alla quarta cifra decimale. Applicando ancora la formula precedente, si trova x2 = 0, 0174524064338 . . . contro un valore vero di 0.0174524064373 . . . (errore nella 12-esima cifra decimale!). Se ci si accontenta, come abbiamo fatto nella nostra tavola, di 8 cifre decimali, questa approssimazione va senz’altro bene, e il valore ottenuto si può prendere come base per costruire l’intera tabella. Onde evitare l’accumularsi di errori di arrotondamento, è bene sfruttare i valori che si conoscono con precisione. Cosı̀ per calcolare sin(12◦ ) si useranno i valori relativi a 30◦ e a 18◦ . Per calcolare sin(13◦ ) si dovranno invece sfruttare i valori relativi a 12◦ e ad un grado. Per quanto riguarda primi e secondi, si può partire considerando il caso di 22◦ 30′ come metà dell’angolo di 45◦ : s √ 2− 2 ◦ ′ ≈ 0.38268343. sin(22 30 ) = 4 224 CAPITOLO 8. TRIGONOMETRIA E CALCOLO in quanto si supponeva che (p + q)/2 e (p − q)/2 si facessero a mente, e sulle tavole si trovavano diretQuello trovato è il valore di sin(22◦ 30′ ) con 8 decimali. tamente i logaritmi delle funzioni trigonometriche. Dalla Tabella 8.1 possiamo ricavare un’approssima- Stranamente, questo uso delle formule di prostafezione usando il metodo dell’interpolazione lineare, resi (che cercava di sfruttare al meglio le tavole dei cioè immaginando che la funzione cresca linearmente logaritmi) è esattamente il contrario di quello che esfra i valori relativi a sin(22◦ ) e a sin(23◦ ). Questo se avevano all’origine, prima dell’invenzione dei logaè vero solo in via approssimativa, ma permette di ritmi. Furono infatti le formule di prostaferesi, letcalcolare sin(22◦ 30′ ), o di qualsiasi altro valore del te da destra verso sinistra, a suggerire che potessero seno, compreso tra due valori noti, impostando esistere delle funzioni che trasformassero prodotti e una semplice proporzione. Poiché la differenza ◦ ◦ sin(23 ) − sin(22 ) = 0.01612455 corrisponde a divisioni in somme e sottrazioni, e quindi potessero 60′ , la parte corrispondente a 30′ si ricava da: semplificare l’esecuzione delle operazioni. Esse furono 60′ : 0.01612455 = 30′ : x, quindi x = 0.00806227. utilizzate, in congiunzione con le tavole dei seni e dei Aggiungendo infine questo valore a sin(22◦ ) si trova coseni, proprio a questo scopo, anche se ovviamente sin(22◦ 30′ ) ≈ 0.38266886 con un errore di 15 unità il loro uso era molto più complicato di quello dei losu un milione, il che può essere soddisfacente per la garitmi, che, una volta inventati, le soppiantarono in maggior parte delle applicazioni. questo compito. Con lo stesso spirito e con la stessa tecnica di sommare e sottrarre le formule di somma e sottrazione, Le seguenti formule sono oggi poco più che una si ottengono le formule di Werner: curiosità anche se in passato sono state molto importanti da un punto di vista computazionale: 1 sin α sin β = (cos(α − β) − cos(α + β)) 2 Teorema 8.4 Valgono le seguenti formule, dette di 1 prostaferesi: cos α cos β = (cos(α + β) + cos(α − β)) 2 p−q p+q cos sin p + sin q = 2 sin 1 2 2 sin α cos β = (sin(α + β) + sin(α − β)). 2 p+q p−q sin p − sin q = 2 cos sin Dalle ultime due identità, ponendo α = (n − 1)θ e 2 2 β = θ, si hanno le formule di Simpson: p−q p+q cos cos p + cos q = 2 cos 2 2 sin nθ = 2 cos θ sin(n − 1)θ − sin(n − 2)θ p+q p−q cos p − cos q = −2 sin sin . cos nθ = 2 cos θ sin(n − 1)θ − cos(n − 2)θ. 2 2 Molto probabilmente, le formule più utili nella praProva: Si considerino le due prime formule di somma e sottrazione, relative al seno, e si ponga p = α+β, tica sono quelle che permettono di esprimere sin(α), q = α − β, di modo che risulti α = (p + q)/2 e cos(α) e tan(α) per mezzo della tangente di α/2. Per la tangente, abbiamo già trovato la formula (8.1); β = (p − q)/2. Si ha allora: per il seno e il coseno possiamo dare la seguente p+q p−q p+q p−q sin p = sin cos + cos sin dimostrazione geometrica: 2 2 2 2 Teorema 8.5 Per ogni valore di α si ha: p−q p+q p−q p+q cos − cos sin . sin q = sin 2 2 2 2 α sin α 1 − cos α tan = = . Sommando membro a membro queste due uguaglian2 1 + cos α sin α ze si ha la prima formula; sottraendo membro a memb ; l’anProva: Come nella Figura 8.4, sia α = AOP bro si ha la seconda. Analogamente si ottengono le b b , altre due, usando le due ultime formule di somma e golo OQP , come angolo alla circonferenza di AOP vale α/2 e quindi sono simili i tre triangoli AQP , sottrazione. OU B e AU P . Si ottengono pertanto le proporzioni: Quando andavo al Liceo, ci insegnavano queste forBU : OU = P A : QA = AU : P A, mule perché semplificavano il calcolo della somma e della differenza di due seni o di due coseni, specie e scrivendo al posto di ogni segmento il suo valore, quando si trovavano entro espressioni più complicacioè BU = tan(α/2), OU = 1, P A = sin α, QA = te, come (sin p + sin q)3 . L’elevamento a potenza ri1 + cos α, AU = 1 − cos α, si hanno le due identità. chiedeva l’uso dei logaritmi e quindi poteva essere più Questa dimostrazione che riguarda il caso 0◦ ≤ α ≤ complicato fare 3 log10 (sin p+sin q) piuttosto che fare: 90◦ , si può ora estendere a tutti gli altri angoli. p−q p+q + log10 sin ) 3(log10 2 + log10 sin Si ha allora il seguente corollario: 2 2 Si scende poi a livello più fine usando le formule di bisezione e trisezione. 225 8.3. RISOLUZIONE DEI TRIANGOLI 8.3 P B α/2 α/2 Q O A U Figura 8.4: Calcolo della tan(α/2) Corollario 8.6 Per ogni angolo α valgono le seguenti identità: sin α = 2 tan(α/2) 1 + tan2 (α/2) cos α = 1 − tan2 (α/2) . 1 + tan2 (α/2) Prova: Dal teorema precedente abbiamo: tan2 α 1 − cos α = , 2 1 + cos α che è una semplice equazione lineare in cos α e, risolta, dà il valore annunciato. Per quanto riguarda sin α, basta osservare che sin α = tan α cos α e utilizzare le espressioni già trovate per tali quantità. Uno degli usi più frequenti di queste formule è la risoluzione delle equazioni trigonometriche, cioè equazioni nelle quali compaiono le funzioni trigonometriche di una quantità incognita. Ad esempio, consideriamo l’equazione 2 sin x+cos x = 1. Tutte le equazioni lineari in sin x, cos x e tan x possono essere affrontate sostituendo a queste quantità le loro espressioni in t = tan(x/2): sin α = 2t 1 + t2 cos α = 1 − t2 1 + t2 tan α = 2t . 1 − t2 Nel nostro caso si ha: 4t 1 − t2 + = 1 ossia 2 1+t 1 + t2 4t + 1 − t2 = 1 + t2 . Questa è l’equazione di secondo grado t2 − 2t = 0, che ha le due soluzioni t = 0 e t = 2. Ricordando (cosa che non si deve mai dimenticare) che seno e coseno sono funzioni periodiche di periodo 360◦ o 2π, mentre la tangente è periodica di periodo 180◦ o π, la soluzione t = 0 corrisponde a x/2 = 0 + kπ, ovvero x = 0 + 2kπ. Infatti, per tutti questi valori si ha sin x = 0 e cos x = 1. La soluzione t = 2 corrisponde a x/2 = arctan 2 = 63◦ 26′ 05′′ 816/1000; il seno di x vale esattamente 0.8 e il coseno −0.6; quindi la soluzione generale è x = 126◦ 52′ 11′′ 63/100 + k360◦ . Risoluzione dei triangoli Come abbiamo ricordato, la Geometria Euclidea stabilisce, attraverso i cosiddetti criteri di uguaglianza o di congruenza, quali sono i requisiti minimi perché un triangolo sia perfettamente determinato, ma quasi nulla ci dice di come calcolare le quantità ignote (lati, angoli, altezze, mediane, etc.), basandosi sui valori dei lati e degli angoli che si conoscono. Per questo la Trigonometria ha avuto tanto successo pratico e si è rivelata indispensabile ogniqualvolta dalla determinazione teorica degli elementi di un triangolo, si debba passare alla loro valutazione numerica. Per risoluzione di un triangolo si intende la valutazione numerica degli elementi del triangolo (lati, angoli, altezze, bisettrici, etc.) a partire dagli elementi noti, se questi determinano il triangolo stesso. I triangoli sono alla base di ogni metodo di misurazione delle figure poligonali, cioè delle figure determinate da segmenti di retta, caso al quale ci si può ricondurre in pratica quasi il 100% delle volte. Se abbiamo una stanza un po’ sbilenca o un campo di forma irregolare, si procede alla cosiddetta triangolazione, cioè a scomporre la figura in tanti triangoli, le cui misure saranno poi calcolate mediante la Trigonometria. In più larga scala, un procedimento del tutto analogo si usa in topografia e certi punti del territorio sono marcati per essere usati come punti di riferimento. Cime di monti e colline, edifici pubblici particolari, monumenti, tralicci costruiti appositamente, costituiscono i vertici di triangoli ideali che permettono di misurare con precisione distanze e angolazioni. Oggi, anche i satelliti artificiali, situati in posizioni fisse rispetto alla Terra, permettono triangolazioni di precisione, sfruttate prima nella navigazione marina ed aerea, ed ora anche nel trasporto terrestre con il sistema GPS. Senza la Trigonometria, tutte queste applicazioni non sarebbero possibili. Da un punto di vista matematico, la Trigonometria offre una serie di teoremi che agevolano i calcoli; una volta questi calcoli si eseguivano con l’uso delle tavole; oggi si utilizza una calcolatrice da tasca (se i conti sono pochi) o un elaboratore più grande, ottenendo risultati più accurati e in modo più veloce. D’altra parte, bisogna dire, le formule della Trigonometria sono spesso assai eleganti e tutt’altro che difficili da dimostrare. Pertanto, una volta che ci si sia impadroniti dei concetti di base, la Trigonometria appare una disciplina abbastanza elementare, nella quale la tecnica tende a prevalere sulla scienza. Rimane la bellezza di molti risultati, ai quali ora vogliamo dedicare la nostra attenzione. La Trigonometria adotta, per un generico triangolo, una notazione standard, che occorre conoscere per capire e tenere agevolmente a mente le varie formule. Con riferimento alla Figura 8.5, ricordiamo che i ver- 226 CAPITOLO 8. TRIGONOMETRIA E CALCOLO C γ b a mc α hc β c A B Figura 8.5: La notazione trigonometrica dei triangoli B a C O α D α A Figura 8.6: Il teorema dei seni il cerchio circoscritto al triangolo e tracciato il diab = α in quanto questo anmetro CD, si ha: C DB b golo insiste sullo stesso arco CB dell’angolo C AB. b è retto, in quanto insiD’altra parte, l’angolo C BD ste su una semicirconferenza, e quindi: a = 2R sin α. Se l’angolo α fosse ottuso, la stessa costruzione porb = 180◦ − C AB, b ta ad avere C DB ma come sappiamo sin(α) = sin(180◦ − α), e quindi la relazione a = 2R sin α continua a sussistere. La stessa dimostrazione ci dà b = 2R sin β e c = 2R sin γ, da cui segue il teorema. Conseguenza immediata del Teorema dei seni è il seguente risultato, che permette di trovare facilmente il punto di incontro tra la bisettrice di un angolo e il lato opposto, quando si conoscano le misure dei tre lati. Formuliamo il teorema per l’angolo γ, ma ovviamente esso vale per tutti gli angoli, per i quali è sufficiente ruotare opportunamente le lettere; come vedremo, questa è una bella caratteristica dei risultati della Trigonometria. Teorema 8.8 (delle bisettrici) In un qualsiasi triangolo, la bisettrice di un angolo divide il lato opposto in due segmenti proporzionali ai due lati adiacenti. C tici di un triangolo si indicano con le lettere A, B, C; γ/2 γ/2 la lunghezza di ciascun lato è indicata dalla lettera minuscola corrispondente alla lettera del vertice opa b posto: pertanto BC = a, AC = b, AB = c. Gli angoli si denotano con le lettere greche corrispondenti b β = ABC, b b al loro vertice, cioè α = B AC, γ = B CA. 180◦ − δ δ Le altezze si indicano con ha , hb , hc , dove l’indice rapyc xc A P B presenta il lato su cui cade l’altezza; analogamente, le mediane sono ma , mb , mc . Un ruolo importante Figura 8.7: Teorema delle bisettrici hanno le due circonferenze, quella inscritta e quella circoscritta al triangolo; il centro della circonferenza Prova: Nella Figura 8.7 il teorema afferma: inscritta si indica con I e il suo raggio con r; il centro della circonferenza circoscritta si indica con O e AP : AC = P B : BC; il suo raggio con R. Infine, con S si indica l’area del dal Teorema dei seni, applicato ad AP C, si ha: triangolo, mentre il perimetro si denota con 2p, cioè AC AP sin γ/2 AP 2p = a + b + c; con questo, p indica il semiperimetro = ovvero = , del triangolo. sin γ/2 sin δ AC sin δ Con tali notazioni, cominciamo a dimostrare il primentre applicato a P BC, si ha: mo teorema, che è un po’ la base per la misurazione BC PB dei triangoli. = . sin γ/2 sin(180◦ − δ) Teorema 8.7 (dei seni o di Eulero) In un qualPoiché sin δ = sin(180◦ − δ), la conclusione segue siasi triangolo si ha: immediatamente. b c a Se indichiamo con xc il segmento P B e con yc il = = = 2R. sin α sin β sin γ segmento AP , si ottiene il semplice sistema lineare: ½ Prova: Supponiamo prima di tutto, come nella xc + yc = c Figura 8.6, che α sia un angolo acuto; considerato xc /a = yc /b 227 8.3. RISOLUZIONE DEI TRIANGOLI A c A c b γ β B H β b γ C B C H Figura 8.8: Teorema delle proiezioni Naturalmente, la scelta di chiamare, in un certo ordine, a, b, c i tre lati e α, β, γ i tre angoli, è del tutto arbitraria, eccetto per il fatto che a deve essere il lato opposto ad α, b a β e c a γ. Pertanto devono valere (e si dimostrano, se fosse necessario, allo stesso modo) anche le due relazioni “ruotate”: b2 c2 = a2 + c2 − 2ac cos β = a2 + b2 − 2ab cos γ. Più avanti ci tornerà utile il seguente: e risolto dà: Corollario 8.11 In ogni triangolo si ha: xc = ac a+b yc = bc . a+b Il successivo teorema lega ciascun lato ai due angoli adiacenti; anche in questo caso, si noti la simmetria delle formule, che possono essere ottenute per rotazione l’una dall’altra. Teorema 8.9 (delle proiezioni o di Cotes) In ogni triangolo valgono le relazioni: a = c cos β + b cos γ b = a cos γ + c cos α c = a cos β + b cos α Prova: Se il triangolo è acuto in γ si ha la situazione della Figura 8.8 a sinistra: BH = c cos β e HC = b cos γ, da cui segue la prima relazione, essendo: a = BC = BH + CH. Se il triangolo è ottuso in γ, H cade fuori del segmento BC; tuttavia si ha: BH = c cos β e CH = |b cos γ|, dove il valore assoluto è necessario in quanto cos γ < 0; ma allora BC = BH − CH = c cos β + b cos γ. In modo analogo si provano le altre due relazioni. Veniamo allora al più importante dei teoremi utili alla risoluzione dei triangoli; questo risultato è noto come Teorema di Carnot (o del coseno) e costituisce la generalizzazione del Teorema di Pitagora. Questo infatti si ritrova non appena poniamo α = 90◦ , cioè cos α = 0. Teorema 8.10 (del coseno o di Carnot) In ogni triangolo si ha: a2 = b2 + c2 − 2bc cos α. Prova: Consideriamo le tre relazioni del teorema precedente e moltiplichiamo la prima per a, la seconda per −b e la terza per −c: a2 −b2 −c2 = ac cos β + ab cos γ = −ab cos γ − bc cos α = −ac cos β − bc cos α Sommando membro a membro e semplificando si trova a2 − b2 − c2 = −2bc cos α, che è la relazione che stavamo cercando. cos α = b2 + c2 − a2 . 2bc Di nuovo, valgono le relazioni che si ottengono ruotando tra di loro i lati e gli angoli; si osservi che il teorema di Carnot ci dà modo di risolvere un triangolo quando se ne conoscano due lati (b e c) e l’angolo α tra essi compreso (1◦ criterio di uguaglianza). Il corollario risolve invece il caso del 3◦ criterio, quando si conoscano i tre lati a, b, c. Se sono noti un lato a e i due angoli ad esso adiacenti (2◦ criterio), in realtà sono conosciuti tutti e tre gli angoli; considerando due delle tre identità di Cotes, si ottiene un sistema di due equazioni nelle due incognite b e c. In particolare, se si usano le due ultime identità, si ottiene il sistema: ½ b − c cos α = a cos γ −b cos α + c = a cos β Il determinante di questo sistema vale: ¯ ¯ ¯ 1 − cos α ¯¯ 2 ¯ ¯ = 1 − cos α. ¯ − cos α 1 Questa quantità è zero se e soltanto se cos2 α = 1, cioè α = 0◦ oppure α = 180◦ . Queste sono situazioni che possiamo scoprire a priori, in quanto il triangolo degenera in un segmento. Si conclude pertanto che questo metodo risolve sempre il triangolo. Il calcolo dei lati e degli angoli di un triangolo permette di trovare anche il valore delle altezze e delle mediane che, di fatto, scompongono il triangolo in altri triangoli, addirittura rettangoli nel caso delle altezze. Tuttavia, esistono ancora alcune formule interessanti che permettono di semplificare qualche calcolo ulteriore. Ad esempio, Nepero, oltre a darsi da fare per calcolare i logaritmi, scoprı̀ anche queste formule, che ci saranno di aiuto. Teorema 8.12 (delle tangenti o di Nepero) In ogni triangolo vale la relazione: tan α+β a+b 2 , = a−b tan α−β 2 assieme alle altre due che si ottengono per rotazione. 228 CAPITOLO 8. TRIGONOMETRIA E CALCOLO Prova: Cerchiamo di vedere le formule dei se- e formule analoghe. Sostituendo: ni (Teorema 8.7) come proporzioni; componendo e r r α 2bc − b2 − c2 + a2 (p − b)(p − c) scomponendo si ha: sin = = 2 4bc bc (a + b) : a = (sin α + sin β) : sin α r r α 2bc + b2 + c2 − a2 p(p − a) (a − b) : a = (sin α − sin β) : sin α. cos = = 2 4bc bc Queste proporzioni equivalgono a: e la formula per la tangente discende da queste, quando si esegua la divisione. (a + b) : (a − b) = (sin α + sin β) : (sin α − sin β). Questo teorema, già interessante di per sé, ci dà Le prime due formule di prostaferesi implicano allora: modo di dimostrare il Teorema di Erone, nella mia modesta opinione uno dei più bei teoremi della Geoα−β sin α+β a+b 2 cos 2 metria e forse di tutta la Matematica. Erone di Ales= α−β a−b cos α+β sandria era interessato piuttosto alle applicazioni del2 sin 2 la Matematica e della Fisica che ai risultati teorici. e questa non è altro che la formula di Nepero. Fu inventore di macchine ingegnose, come l’eliopila e Briggs, a cui evidentemente piaceva seguire Nepe- l’odometro, e si interessò soprattutto della soluzione ro, sia per i logaritmi, sia per la Trigonometria, scoprı̀ approssimata dei problemi geometrici. Sembra, in efalcune formule che permettono di esprimere le fun- fetti, che il teorema fosse già noto ad Archimede, ma zioni trigonometriche dei tre angoli di un triangolo non abbiamo documenti in proposito; la dimostrazioin funzione dei soli lati a, b, c, e queste formule sono ne di Erone (geometrica e non trigonometrica) è cosı̀ particolarmente carine quando si faccia intervenire il la più antica che conosciamo. semiperimetro p = (a + b + c)/2, che pertanto fa il Teorema 8.14 (di Erone) In ogni triangolo si ha: suo trionfale ingresso operativo: p S = p(p − a)(p − b)(p − c). Teorema 8.13 (di Briggs) In ogni triangolo si ha: r r Prova: L’altezza relativa al lato c si trova facenα (p − b)(p − c) p(p − a) α do: hc = b sin α e quindi abbiamo: S = (bc sin α)/2. sin = cos = 2 bc 2 bc Usando ora la formula di bisezione, si trova: s α α (p − b)(p − c) α S = bc sin cos . tan = 2 2 2 p(p − a) e possiamo ricorrere alle formule di Briggs del Valgono inoltre le analoghe formule ruotate per gli teorema precedente, ricavando: angoli β, γ. r r (p − b)(p − c) p(p − a) Prova: Si cominci con l’osservare che l’angolo α/2 è . S = bc bc bc senz’altro compreso tra 0◦ e 90◦ , per cui seno, coseno e tangente sono quantità positive. Pertanto, dalle Questa è proprio la formula desiderata. formule di bisezione e dal Corollario 8.11 si ha: Concludiamo queste nostre note sulla Trigonos µ r ¶ 2 2 2 metria con un risultato che permette di calcolare α 1 − cos α 1 b +c −a sin = 1− = il raggio del cerchio inscritto e quello del cerchio 2 2 2 2bc circoscritto: s µ r ¶ Teorema 8.15 In ogni triangolo si ha: b2 + c2 − a2 1 + cos α 1 α 1+ . = cos = 2 2 2 2bc S abc r= R= . Ci sono ora due osservazioni importanti da fare. p 4S Primo: Prova: Con riferimento alla Figura 8.9, l’area del triangolo ABC è equivalente alla somma dei triangoli 2bc − b2 − c2 + a2 = (a + b − c)(a − b + c) ABI, BCI, CAI le cui aree sono cr/2, ar/2, br/2, cioè 2bc + b2 + c2 − a2 = (a + b + c)(−a + b + c) S = pr. Riprendiamo ora, dal teorema precedente, la come si vede eseguendo i conti sulle espressioni di formula S = (bc sin α)/2; dal Teorema dei seni abbiadestra e semplificando; secondo: mo: sin α = a/(2R), che ci dà S = abc/(4R). Questa formula è equivalente a quella cercata. a + b − c = a + b + c − 2c = 2(p − c) 229 8.4. IL CONCETTO DI LIMITE C P B I Q O R A Figura 8.9: Cerchio inscritto e circoscritto 8.4 Il concetto di limite Fin dall’inizio di queste note, abbiamo osservato come sia impossibile considerare in modo effettivo e diretto ciò che fa riferimento alla nostra idea di “infinito”. Ripensando a ciò che abbiamo detto, ci possiamo rendere conto che siamo ricorsi a due tecniche diverse. Una è stata quella della scommessa, introdotta per formalizzare il fatto che l’insieme N dei numeri naturali non è finito. La seconda tecnica è stata quella di Cantor, il quale definisce un insieme infinito come un insieme che possa essere messo in corrispondenza biunivoca con un suo sottoinsieme proprio. L’idea di Cantor è davvero geniale e va bene nel “conteggio” degli insiemi, ma non si presta quando si cerca di ragionare sull’infinitamente vicino o sull’infinitamente lontano. In altre parole, Cantor funziona finché si vogliono “distinguere” gli infiniti elementi dell’insieme, non funziona più quando questi diventano indistinguibili perché troppo vicini o troppo lontani. Il criterio della scommessa è lo stesso che servı̀ a Lucrezio a provare che lo spazio è infinito: recati alla fine dell’Universo e scaglia la tua freccia; se essa va, allora quella non è la vera fine; se non va, c’è qualcosa oltre quella fine. Questo stesso criterio è quello che abbiamo usato per definire i numeri reali, quel qualcosa che possiamo concepire, ma che non esiste in atto, al termine di una sequenza infinita di numeri che, globalmente, stanno sempre più vicini tra di loro. In barba a Zenone abbiamo detto: prendiamo tutte le sequenze i cui elementi siano definitivamente vicini tra di loro e chiamiamo “numero reale” quella cosa indefinita che esse hanno in comune, la nostra sensazione che possiamo idealmente afferrare quel qualcosa che non c’è, ma che, con le nostre scommesse, possiamo portare più in là di qualsiasi limitazione un nostro avversario ci voglia imporre. Sicuramente, quello di limite è uno dei concetti fondamentali della Matematica, legato com’è a tutti i ragionamenti che riguardano la vicinanza (o la lonta- nanza) dei numeri di un insieme, quando questi tendono a diventare sempre più vicini (o più lontani). Questa tendenza coinvolge sempre ragionamenti che riguardano insiemi infiniti di numeri. Preliminari però a quello di limite, vi sono alcuni concetti più semplici, ma di fondamentale importanza per chiarire i discorsi che dovremo fare. In modo alquanto schematico, diamo le seguenti definizioni, che il lettore vorrà assimilare in modo accurato. 1. Si consideri un insieme A ⊆ R, finito o infinito; si dice massimo degli elementi di A, e si scrive max(A), quell’elemento a ∈ A, se esiste, tale che per ogni altro elemento b ∈ A, si abbia a > b. La clausola sull’esistenza è importante, poiché non è detto che tutti gli insiemi A ⊆ R abbiano un elemento massimo. Ad esempio, N ⊆ R, ma N non ha alcun elemento massimo. Non importa nemmeno che A contenga elementi che crescono indefinitamente perché sia privo di massimo. Se consideriamo A = {1 − 1/n}n∈N0 , una successione, è chiaro che al crescere di n gli elementi di A sono sempre più grandi (anche se di pochino), ma nessun elemento di A è “il più grande di tutti”. Infatti, il numero 1, che saremmo forse tentati di considerare alla stregua di massimo, di fatto non sta in A, e quindi non conta. Un insieme finito ha sempre un massimo, ma gli insiemi con un numero infinito di elementi possono averlo o non averlo. Naturalmente, il concetto di minimo è del tutto analogo a quello di massimo, e lasciamo al lettore la soddisfazione di definirlo e di portare avanti considerazioni ed esempi, sulla falsariga dei precedenti. Comunque, A = {1/n}n∈N0 ha 1 come elemento massimo, ma non ammette alcun elemento minimo. 2. Sia A ⊆ R come sopra; un elemento ℓ ∈ R si dice limite superiore per A se ℓ ≥ a, per ogni elemento a ∈ A. In generale, non è detto che ℓ sia un elemento di A, anzi, di solito non lo è. E’ facile vedere che se ℓ è un limite superiore per A ed ℓ ∈ A, allora ℓ è anche il massimo di A. Di limiti superiori per A ne esistono molti e, in effetti, basta che ne esista uno, diciamo pure ℓ, e ne esistono infiniti, tutti gli ℓ′ > ℓ. L’insieme A si dice superiormente limitato se ammette un limite superiore. Ancora una volta, il lettore è chiamato in causa per definire cosa sia un limite inferiore e che significhi, per un insieme, essere inferiormente limitato. Infine, possiamo dire che A è limitato se è tanto superiormente quanto inferiormente limitato, cioè, in altre parole, ammette un limite superiore e un limite inferiore, come si intuisce facilmente. 3. Come s’è visto al primo punto, un insieme A ⊆ R può non avere elemento massimo; ha però sempre un elemento speciale, detto estremo superiore e indicato con sup(A). Per comprendere questo concetto, si consideri un insieme A privo di massimo. Se A non è superiormente limitato, si definisce 230 CAPITOLO 8. TRIGONOMETRIA E CALCOLO sup(A) = +∞, dove il simbolo ∞ si legge infinito e risale al 1500. Altrimenti, si considera l’insieme Ā dei limiti superiori di A, che non è vuoto per l’ipotesi che A sia superiormente limitato. Si osserva ora che Ā ha sempre un elemento minimo ℓ. Infatti, detto A∗ il complementare di Ā in R, la coppia (A∗ , Ā) costituisce una sezione di R, secondo quanto detto nella Sezione 3.5. Per l’assioma di continuità, A∗ ha massimo oppure Ā ha minimo. Sia ℓ tale elemento e vediamo che ℓ non può essere il massimo di A∗ . Se infatti ℓ appartenesse ad A∗ , non sarebbe un limite superiore di A (che sono tutti in Ā). Esiste allora un elemento a ∈ A tale che a > ℓ, e (a + ℓ)/2 è compreso tra a ed ℓ, cioè non è un limite superiore per A ed è maggiore di ℓ contro l’ipotesi che questo fosse il massimo di A∗ . Questo prova che sup(A) esiste sempre: se A ha un massimo allora sup(A) = max(A), altrimenti è comunque il minimo dei limiti superiori, e quindi non sta in A. In modo analogo si definisce l’estremo inferiore di A come il massimo dei limiti inferiori di A. Esiste sempre e si indica con inf(A); se A non è limitato inferiormente si pone inf(A) = −∞. Come esempio si consideri: ha senso però che ǫ sia piccolo, poiché per ǫ grande tutto diviene ovvio. Cosı̀ ha senso che M sia grande, perché se è piccolo tutto diviene troppo facile. Le successioni di Cauchy, che abbiamo introdotto nella Sezione 3.5 per i numeri razionali, possono essere estese ai numeri reali, cambiando opportunamente la Definizione 3.4. La loro importanza è data dal seguente: inf {1/n}n∈N0 = 0 inf {1 − 1/n2 }n∈N0 = 0 sup {1/n}n∈N0 = 1 Teorema 8.16 Una successione è convergente se e solo se è una successione di Cauchy. Prova: Supponiamo che la successione tenda al limite ℓ; questo significa che fissato ǫ > 0 esiste un indice m con la proprietà che per ogni n > m si ha |ℓ − an | < ǫ/2; in particolare è: |ℓ − am+1 | < ǫ/2 e quindi: |am+1 − an | = |am+1 − ℓ + ℓ − an | ≤ ǫ ǫ + +ǫ 2 2 e questo dimostra che vale il criterio di Cauchy con m = m + 1. Viceversa, procediamo in modo formale, seguendo quanto detto nella Sezione 1.8 per la negazione dei predicati. Il criterio di Cauchy si formula: ≤ |am+1 − ℓ| + |ℓ − an | < sup {1 − 1/n2 }n∈N0 = 1. (∀ǫ > 0)(∃m ∈ N) | (∀n > m) : |am − an | < ǫ. Ora è il momento di introdurre, in modo sistematico, il criterio della scommessa, nella forma che abbia- Pertanto, come abbiamo imparato nella Sezione 1.8, mo cominciato a vedere con le successioni di Cauchy la negazione è: (si veda la Sezione 3.5). (∃ǫ > 0) | (∀m ∈ N)(∃n > m) | |am − an | ≥ ǫ. Definizione 8.2 Sia {ak }k∈N una successione assegnata; si dice che la successione converge al numero Analogamente, il fatto che la successione tenda ad ℓ reale ℓ se, fissato un numero reale positivo ǫ [piccolo] si esprime scrivendo: a piacere, esiste un indice m della successione tale (∃ℓ ∈ R) | (∀ǫ > 0)(∃p ∈ N) | (∀n > p) : |ℓ − an | < ǫ. che per ogni indice n > m si ha |an − ℓ| < ǫ. Il numero ℓ si dice limite della successione e si scrive: La negazione è allora: ℓ = lim an . n→∞ (∀ℓ ∈ R)(∃ǫ > 0) | (∀p ∈ N)(∃n > p) | |ℓ − an | ≥ ǫ. Si dice invece che la successione diverge a +∞ (−∞) Poiché questa relazione vale per ogni ℓ, vale in se, fissato un numero M [grande] a piacere, esiste particolare quando ℓ = ap , cioè: un indice m della successione tale che per ogni in(∃ǫ > 0) | (∀p ∈ N)(∃n > p) | |ap − an | ≥ ǫ dice n > m si ha an > M (an < −M ). Si scrive rispettivamente: e questa, come abbiamo visto, altro non è che la negazione della condizione di Cauchy. lim an = +∞ e lim an = −∞. n→∞ n→∞ Particolarmente importanti sono le successioni moLa successione {1/n}n∈N0 converge a 0; la suc- notòne, cioè le successioni che non decrescono o cessione {n}n∈N diverge a +∞ e la successione non crescono mai. Formalmente, una successione {(−1)n }n∈N non converge, né diverge, in quanto {ak }k∈N è monotona non decrescente se ∀n ∈ N si ha: oscilla tra +1 e −1. Osserviamo esplicitamente che an+1 ≥ an . Analoga è la definizione di successione nella precedente definizione abbiamo posto fra paren- monotona non crescente. Osserviamo esplicitamente tesi quadra gli aggettivi “piccolo” e “grande”. Essi che, in Matematica, il termine tecnico “monotono” sono infatti logicamente inutili perché le relazioni de- va pronunciato piano, cioè con l’accento tonico sulla vono valere per ǫ o per M arbitrari; psicologicamente, penultima sillaba. 231 8.4. IL CONCETTO DI LIMITE Teorema 8.17 Una successione monotona ha sem- i suoi elementi possono essere invertiti; questo perpre un limite; se è limitata, il limite è finito, mette di eseguire anche la divisione. In questi casi, altrimenti il limite è infinito. è opportuno vedere come si comporta il limite (per n → ∞), cioè vedere se il limite della somma, della Prova: Consideriamo una successione {ak }k∈N mo- differenza, del prodotto e della divisione di due senotona non decrescente; se non è limitata essa tende quenze è deducibile dai limiti delle due successioni. ovviamente a +∞. Supponiamo allora che sia limi- Nel caso che tali limiti siano finiti (e, nel caso del detata e consideriamo l’insieme M dei numeri reali che nominatore in una divisione, diversi da 0), ciò è già sono maggiori di tutti i suoi elementi an . Se M ha un stato visto nella citata sezione, almeno relativamenelemento più piccolo, lo si chiami ℓ; altrimenti, sia ℓ te alle successioni su Q, ma nulla cambia quando si il più grande dei numeri che non stanno in M . Vedia- passi ad R. Possiamo ridurre a uno specchietto ciò mo che limn→∞ an = ℓ. Sia infatti ǫ > 0 un numero che succede per la somma, supponendo che {ak }k∈N qualsiasi e osserviamo che deve esistere un elemento e {bk }k∈N siano le due successioni e A e B siano i della successione compreso nell’intervallo (ℓ − ǫ, ℓ); se loro limiti: cosı̀ infatti non fosse, ℓ − ǫ/2 dovrebbe stare in M , B = 0 B 6= 0 B = +∞ B = −∞ contro l’ipotesi che M contenga tutti e soli i numeri A = 0 0 B +∞ −∞ maggiori di ℓ (ed eventualmente lo stesso ℓ). Se am è A A + B +∞ −∞ A = 6 0 tale elemento, ogni altro elemento an con n > m deve +∞ +∞ ? A = +∞ +∞ stare in (ℓ − ǫ, ℓ) per la monotonicità della successioA = −∞ −∞ −∞ ? −∞ ne, e quindi si ha ℓ − an < ǫ. Me questo altro non è che la definizione di ℓ come limite della successione. A parte le due strane somme +∞ + (−∞) e −∞ + Naturalmenet, se la successione è non crescente, essa (+∞) che vedremo tra poco, tutte le altre relazioni tende a −∞ oppure ad un limite minore o uguale a sono di facile dimostrazione. Ad esempio, consideriatutti gli elementi della successione. mo il caso in cui A = +∞ e B abbia un valore finito. Le successioni monotone sono particolarmente im- Sia Z l’estremo superiore degli elementi di {bk }k∈N portanti proprio perché hanno sempre un limite, e e per ogni M ∈ R sia m ∈ N l’indice per il quale dimostrare la loro limitatezza equivale a dimostrare per ogni n > m si abbia an > M − Z. Si ha allora che il limite è finito. Si pensi al caso ben noto del- an + bn > (M − Z) + Z = M , e questo dimostra che le approssimazioni per difetto e per eccesso di una la successione {an + bn }n∈N diverge a +∞. Le altre quantità incognita; come si ricorderà, è proprio sfrut- dimostrazioni sono analoghe e le lasciamo al lettore tando questa idea che abbiamo impostato la nostra come puro divertimento. costruzione dei numeri reali, anche se abbiamo di fatI due casi indicati dal punto interrogativo corrito considerato il concetto più ampio di successione di spondono invece a situazioni variabili a seconda dei Cauchy. casi. Si ha infatti: Un altro criterio per la convergenza delle successioni è dato dal seguente: lim (k 2 ) + lim (−k) = +∞ k→∞ Teorema 8.18 (dei carabinieri) Se si hanno tre successioni {ak }k∈N , {bk }k∈N , {ck }k∈N tali che ∀k ∈ N si abbia: ak ≤ bk ≤ ck e per le quali si sappia che: lim ak = lim ck = ℓ k→∞ k→∞ allora si ha anche: limk→∞ bk = ℓ. Prova: La condizione sul limite degli ak e dei ck si scrive come: ℓ − ǫ < ak < ℓ + ǫ e ℓ − ǫ < ck < ℓ + ǫ. Poiché bk è compreso tra ak e ck , si deve avere ℓ − ǫ < bk < ℓ + ǫ e questo prova che ℓ è il limite dei bk . Come abbiamo visto nella Sezione 3.4, le successioni si possono sommare, sottrarre e moltiplicare elemento per elemento, ottenendo nuove successioni, e se una successione ha tutti gli elementi diversi da 0, k→∞ lim (−k 2 ) + lim (k) = −∞ k→∞ k→∞ lim (k 2 + 1) + lim (−k 2 + 1) = 2, k→∞ k→∞ tre risultati completamente differenti e che dipendono solo dalle successioni considerate. Analogamente, se limk→∞ ak = ±∞ e non esiste limk→∞ bk , si hanno situazioni diverse a seconda che la successione {bk }k∈N sia limitata o meno. Nel primo caso si ha: lim (ak + bk ) = ±∞, k→∞ mentre nell’altro caso occorre vedere se {ak }k∈N domina {bk }k∈N (e allora il limite della somma è ancora ±∞), o viceversa, e allora tale limite non esiste. Come esempio si consideri: lim (k 2 + (−1)k k) = +∞ k→∞ 232 CAPITOLO 8. TRIGONOMETRIA E CALCOLO lim ((−1)k k 2 + k) non esiste. k→∞ I due casi (∞ − ∞) e (−∞ + ∞) non sono le uniche situazioni anomale che si trovano calcolando i limiti; se il lettore, come dovrebbe fare, prova a disegnare le tabelline analoghe alla precedente, ma relative alla moltiplicazione e alla divisione, si accorgerà che si presentano altri casi di incertezza, che vanno perciò risolti di volta in volta. Queste situazioni sono note come forme indeterminate dei limiti ed è opportuno che siano ricordate per poter dare un segnale d’allarme ogni volta che se ne incontra una: 0 0 ∞ ∞ Un punto importante di questa definizione è l’aver escluso x0 dai punti dell’intervallo (x0 − δ, x0 + δ) per i quali la condizione va verificata. Questo permette di considerare il limite per x → x0 (x che tende ad x0 ) anche quando f (x0 ) non esiste, non è definita. E’ proprio in casi del genere che il concetto di limite rivela la sua potenza, come ora vedremo. 0·∞ sono i casi più comuni, ma è bene tener presenti anche 0∞ e ∞0 . Vedremo a suo tempo come il Teorema di de L’Hôpital risolva spesso i casi 0/0 e ∞/∞, e quindi, indirettamente, anche 0 · ∞ = 0 · (1/0) = 0/0. Ciò che mi pare suggestivo nel concetto di limite di una successione è il fatto che mi posso facilmente immaginare la successione stessa come una sequenza temporale di punti, che si vanno disponendo sulla retta reale. Quando la successione converge, io vedo i punti accumularsi intorno al punto di convergenza; se invece la successione diverge, vedo i suoi punti scomparire verso l’infinito, positivo o negativo, non importa. Questa immagine mi ha sempre aiutato a capire il concetto di limite e ad assimilare la definizione, che, come s’è visto, non è del tutto elementare. E come ha aiutato me, penso che sia stata d’aiuto a molti altri, anche se ciascuno, naturalmente, tende a formarsi le proprie immagini di aiuto psicologico. Il passaggio dal limite di una successione a quello di una funzione, quando il suo argomento tende a un valore specifico x0 , si fa riprendendo proprio questa immagine, sia idealmente sia praticamente. Si dice che una funzione f (x) tende a un valore ℓ nel punto x0 (appartenente o meno al dominio di f ), e si scrive: limx→x0 f (x) = ℓ, se e solo se ogni successione {b xk }k∈N tale che limk→∞ x bk = x0 abbia ℓ come limite delle sue immagini, cioè: limk→∞ f (b xk ) = ℓ. Purtroppo, le successioni che tendono ad x0 sono infinite, anzi sono addirittura ℵ2 ; da un punto di vista formale, pertanto, si preferisce la seguente definizione, anche se il nostro intuito rimane piuttosto ancorato alla precedente: Definizione 8.3 Data una funzione f : R → R, si dice che f tende ad ℓ per x che tende ad x0 , se e solo se: ∀ǫ > 0, ∃δ ∈ R | ∀x ∈ (x0 − δ, x0 + δ) \ {x0 } si ha |f (x) − ℓ| < ǫ. La funzione f si dice continua nel punto x0 del suo dominio, se e solo se si ha: lim f (x) = f (x0 ). x→x0 Infine, la f è continua nell’intervallo (a, b) se è continua in tutti i punti dell’intervallo. Un punto x0 nel quale la funzione f non sia continua, si dice punto di discontinuità della funzione. O Figura 8.10: Funzione a scalini Originariamente, nel 1600 e in parte del 1700, quando si parlava di funzioni, si intendeva riferirsi alle funzioni continue, cioè alle funzioni il cui grafico poteva essere tracciato in “modo continuo”, senza mai dover ritirare la matita dal foglio. I matematici avevano in mente le funzioni più comuni: i polinomi (soprattutto parabole e cubiche), le coniche, le funzioni trigonometriche, e altre figure, ottenute spesso “fisicamente” dal moto di un corpo e dalla traiettoria di un punto fissato su di esso. Ad esempio, la famosa cicloide si ottiene fissando un punto su una circonferenza e facendo ruotare questa lungo una retta. Ci si accorse presto, però, che erano interessanti anche funzioni più strane. Ad esempio, la funzione y = ⌊x⌋ ha una stupenda forma a scalini, e da essa è derivata la famosa delta di Dirac che vale 1 per x = 0 e vale 0 in tutti gli altri punti. La funzione caratteristica del numeri razionali (si veda Sezione 1.3) vale 1 per ogni x razionale e vale 0 per ogni argomento irrazionale: essa non è continua in alcuno dei suoi punti, ma se per x0 razionale consideriamo solo le successioni di numeri razionali, il limite della successione tende al valore della funzione! D’altra parte, una caso molto semplice e comune di discontinuità è costituito dalle funzioni razionali fratte: nei punti in cui il denominatore si annulla, la funzione non è definita e quindi non può essere continua. Si consideri il semplice esempio y = 1/x, che come sappiamo rappresenta un’iperbole. Nel punto x = 0 la funzione non è definita. In questi casi ha senso considerare il limite quando x → 0 per valori 233 8.4. IL CONCETTO DI LIMITE negativi, cioè crescendo, e il limite quando x → 0 per valori positivi, e quindi decrescendo. Questi due limiti si dicono, rispettivamente, sinistro e destro. E’ facile vedere che: lim x↑0 1 = −∞ e x lim x↓0 1 = +∞, x tipo, disegnando la funzione ci si rende conto che x = 1 è una discontinuità fittizia e la funzione può essere definita ponendo f (1) = −1. Col senno di poi, ci si accorge che l’espressione può essere semplificata: y= x2 x−1 x−1 1 = = − 3x + 2 (x − 1)(x − 2) x−2 dove le notazioni x ↑ 0 ed x ↓ 0+ sono di facile e questo rivela l’arcano. Naturalmente, è bene interpretazione e rappresentano i due tipi di limite. imparare ad accorgersi prima di situazioni del genere. Analogamente, per la funzione S a scalini si ha: Altri casi di discontinuità fittizia sono più interessanti, poiché non sono risolubili in modo formale colim S(x) = 0 e lim S(x) = 1. me il precedente. Tali esempi costituiscono perciò i x↓1 x↑1 cosiddetti limiti notevoli e i principali vanno capiti e Ciò ha portato a distinguere i punti di discontinuità mandati a memoria. Il caso più tipico è il limite della in quattro specie: funzione y = sin(x)/x quando x tende a zero. Qui la frazione non è definita a causa dell’x a denominatore; a 1. si dice discontinuità di 1 specie un punto x0 ma vediamo cosa succede quando x si avvicina a 0, in cui il limite sinistro è diverso dal limite derimanendo però distinto da 0. Si disegni il cerchio gostro, ma entrambi sono finiti. In tal caso, x0 niometrico e immaginiamo di misurare la variabile x determina un salto della funzione, e l’entità del in radianti, come si deve sempre fare nell’analisi delle salto è data dalla differenza dei due limiti. La funzioni trigonometriche: funzione a scalini ha un salto di ampiezza 1 in Dalla Figura 8.1 si ha la disuguaglianza AP ≤ corrispondenza di tutti i numeri interi; AU ≤ U B, che da un punto di vista trigonometri2. si dice discontinuità di 2a specie un punto x0 in co significa: sin(x) ≤ x ≤ tan(x). Dividendo tutto cui esistono limite destro e limite sinistro, ma per sin(x): x almeno uno dei due è infinito. Questo è il caso 1≤ ≤ cos(x). sin(x) dell’iperbole nel punto x0 = 0, ma anche della Quando x ↓ 0 (rimanendo diverso da 0) il Teorema dei funzione y = 1/(1 − x) nel punto x0 = 1; Carabinieri ci dice che x/ sin(x) rimane schiacciato 3. si dice discontinuità di 3a specie un punto x0 in fra 1 e cos(x) → 1, per cui il suo valore deve essere 1: cui uno almeno dei due limiti sinistro e destro non esiste. Ad esempio, la funzione y = sin(1/x) sin(x) x = lim = 1. lim nel punto x0 = 0 non ha nessuno dei due limiti; x↓0 x↓0 sin(x) x essa infatti oscilla tra +1 e −1 senza convergere In modo analogo si procede per il limite quando x ↑ 0, ad alcun valore; e ciò prova il nostro primo limite notevole. 4. si dice discontinuità fittizia un punto x0 per il Il secondo limite che consideriamo sfrutta questo quale la funzione non è definita, ma i limiti sini- primo risultato: vogliamo dimostrare che: stro e destro hanno lo stesso valore ℓ. In questo 1 − cos(x) 1 caso, si può artificialmente definire f (x0 ) = ℓ e, lim = , 2 x→0 chiaramente, la funzione diviene continua in x0 ; x 2 da qui l’appellativo di “fittizia”. nel senso che limite sinistro e destro assumono enI punti x0 di discontinuità fittizia hanno un aspet- trambi questo valore. Per x > 0 dalla formula di to interessante, in quanto dalla forma analitica della bisezione si ha: funzione ci si aspetterebbe un comportamento strano 1 − cos(x) 2 sin2 (x/2) 1 sin2 (x/2) in x0 , mentre poi ci si accorge che, nella realtà, que= = · . x2 x2 2 (x/2)2 sto punto non ha niente di speciale. L’esempio più semplice è costituito dalle funzioni del tipo: Quest’ultimo valore ci riporta al caso precedente e per x → 0 si ha ovviamente sin(x/2)/(x/2) → 1. Pertanto, il limite sinistro della nostra funzione vale 1/2. Lasciamo il lettore a giocare con i valori assoluti cercando di capire dove il denominatore si annulla, per far vedere che anche il limite destro è 1/2. Altri limiti notevoli, come limx→0 tan(x)/x = 1 si si trovano due valori x = 1 ed x = 2, che pertanto rappresentano punti di discontinuità. Ma mentre x = riconducono al limite di sin(x)/x, che perciò è consi2 si vede essere un punto di discontinuità del secondo derato di fondamentale importanza. Nella prossima y= x2 x−1 ; − 3x + 2 234 CAPITOLO 8. TRIGONOMETRIA E CALCOLO sezione, dopo aver introdotto la funzione esponenziale e quella logaritmica, vedremo come anche queste nuove funzioni diano origine a importanti limiti notevoli. Indubbiamente, anche quando sono limitate a certi intervalli, le funzioni continue sono le più simpatiche, proprio perché corrispondono meglio alla nostra intuizione. Alcune loro proprietà sono tanto evidenti che potremmo considerarle senz’altro vere, ma le dimostreremo ora formalmente perché in Matematica, si sa, è bene non fidarsi delle cose ovvie. Teorema 8.21 Sia f (x) una funzione continua nell’intervallo chiuso [a, b] e siano m ed M i valori minimo e massimo che la funzione assume in tale intervallo. Allora, per ogni y ∈ [m, M ] esiste almeno un valore di x tale che f (x) = y. Prova: Basta considerare la funzione continua g(x) = f (x) − y e applicare il teorema precedente. Talvolta può essere conveniente una generalizzazione di questo teorema. Se f (x) è continua nell’intervallo aperto (a, b), può essere che in uno o in entrambi gli Teorema 8.19 (della permanenza del segno) estremi la funzione vada a ±∞. Il teorema continua Se f (x) è una funzione continua nell’intervallo (a, b) a valere purché a minimo e a massimo si sostituiscano ed è definita in x0 ∈ (a, b), allora esiste un intervallo i concetti di estremo inferiore e superiore. (x0 − δ, x0 + δ) in ogni punto x del quale f (x) ha lo steso segno di f (x0 ). Prova: Supponiamo che sia f (x0 ) > 0 e fissiamo ǫ < f (x0 ). L’ipotesi di continuità ci dice che esiste un intervallo (x0 − δ, x0 + δ) nel quale si ha |f (x) − f (x0 )| < ǫ, cioè f (x0 ) − ǫ < f (x) < f (x0 ) + ǫ e, data la scelta di ǫ, questo significa f (x) > 0 per ogni x dell’intervallo. Analogo è il caso in cui sia f (x0 ) < 0. 8.5 Logaritmo ed esponenziale Il concetto di logaritmo è stato introdotto nella Sezione 2.8 come una delle operazioni inverse dell’elevamento a potenza (l’altra operazione inversa è l’estrazione di radice). Pertanto, poiché 23 = 8, il logaritmo in base 2 di 8 è proprio 3; e poiché 34 = 81, si ha log3 81 = 4. L’estensione dei logaritmi a tutti i L’intuizione ci dice che se percorriamo con la penna numeri reali si è operata nella Sezione 3.6, dalla quale una traiettoria continua e a un certo punto passiamo riportiamo le principali proprietà dei logaritmi: da valori positivi a valori negativi (o viceversa), dobbiamo per forza transitare dal valore 0. Formalmente loga (rv) = loga r + loga v abbiamo: loga (r/v) = loga r − loga v loga (r√s ) = s loga r Teorema 8.20 (zeri di una funzione continua) loga s r = 1s loga r Se la funzione f (x) è continua nell’intervallo chiuso loga a = 1 [a, b] ed esistono due punti x1 , x2 ∈ [a, b] tali che loga 1 = 0 f (x1 ) ed f (x2 ) hanno seg