matematica per la scuola media inferiore

Introduzione alla Matematica
La Matematica della Scuola Media
Renzo Sprugnoli
Dipartimento di Sistemi e Informatica
Viale Morgagni, 65 - Firenze (Italia)
27 settembre 2005
2
Indice
Introduzione
5
1 Il linguaggio della Matematica
1.1 Gli insiemi . . . . . . . . . . . . . . . .
1.2 Le relazioni . . . . . . . . . . . . . . .
1.3 Funzioni e operazioni . . . . . . . . . .
1.4 Il contare . . . . . . . . . . . . . . . .
1.5 Rappresentazione dei numeri naturali .
1.6 La nomenclatura della Matematica . .
1.7 Matematica e Logica . . . . . . . . . .
1.8 Predicati . . . . . . . . . . . . . . . . .
2 Aritmetica
2.1 L’addizione . . . . . . .
2.2 Confronto e sottrazione
2.3 Moltiplicazione . . . . .
2.4 Divisione . . . . . . . .
2.5 Divisibilità . . . . . . .
2.6 Numeri primi . . . . . .
2.7 Massimo comun divisore
2.8 Le altre operazioni . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Numeri
3.1 I numeri interi . . . . . . . . .
3.2 I numeri razionali . . . . . . . .
3.3 I numeri decimali . . . . . . . .
3.4 I numeri reali . . . . . . . . . .
3.5 La costruzione dei numeri reali
3.6 Potenze, radici, logaritmi . . .
3.7 Espressioni e proporzioni . . . .
3.8 Matematica finanziaria . . . . .
4 Matematiche finite
4.1 Calcolo combinatorio . . . .
4.2 Permutazioni . . . . . . . .
4.3 Problemi combinatori . . .
4.4 Strutture dati . . . . . . . .
4.5 Il modello delle parole . . .
4.6 Il calcolo delle proposizioni
4.7 Calcolo delle probabilità . .
4.8 Distribuzioni . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
11
14
17
20
24
28
31
35
.
.
.
.
.
.
.
.
39
39
42
45
49
51
55
58
61
.
.
.
.
.
.
.
.
65
65
68
72
77
81
86
90
95
.
.
.
.
.
.
.
.
99
99
103
106
111
115
118
122
126
4
5 Algebra
5.1 Calcolo letterale . . . . . . .
5.2 I polinomi . . . . . . . . . . .
5.3 Risoluzione delle equazioni . .
5.4 Sistemi di equazioni . . . . .
5.5 Disequazioni . . . . . . . . . .
5.6 Numeri complessi . . . . . . .
5.7 Equazioni di grado superiore
5.8 Algebra astratta . . . . . . .
INDICE
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
133
133
136
140
143
147
151
155
158
6 Geometria Euclidea
6.1 Le basi della Geometria . . . . .
6.2 Perpendicolarità e parallelismo .
6.3 Congruenza e similitudine . . . .
6.4 La misura delle superfici . . . . .
6.5 Luoghi geometrici . . . . . . . . .
6.6 La geometria della circonferenza
6.7 Poligoni regolari e cerchio . . . .
6.8 Geometria dello spazio . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
163
163
168
172
176
180
183
187
191
7 Le altre Geometrie
7.1 Coordinate Cartesiane . . . . . .
7.2 L’equazione della retta . . . . . .
7.3 La parabola . . . . . . . . . . . .
7.4 Circonferenza, ellisse e iperbole .
7.5 Geometrie non-Euclidee . . . . .
7.6 Geometria descrittiva e proiettiva
7.7 Topologia . . . . . . . . . . . . .
7.8 Gli spazi vettoriali . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
199
199
202
206
208
211
215
215
215
8 Trigonometria e Calcolo
8.1 Le funzioni trigonometriche . . . .
8.2 Le formule di somma e sottrazione
8.3 Risoluzione dei triangoli . . . . . .
8.4 Il concetto di limite . . . . . . . . .
8.5 Logaritmo ed esponenziale . . . . .
8.6 Il calcolo differenziale . . . . . . .
8.7 Lo studio delle funzioni . . . . . .
8.8 Il calcolo integrale . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
217
217
221
225
229
234
238
244
249
.
.
.
.
.
.
.
.
Introduzione
noscenze umanistiche, quali la storia, la filosofia e la
stessa letteratura.
Si pensi, per fare qualche esempio, alla determinazione dell’età dei reperti archeologici con il metodo del carbonio, allo studio statistico dell’evoluzione
di una lingua, ai modelli matematici dell’equilibrio
biologico di un determinato ambiente, alle strutture spaziali delle molecole, alle grammatiche formali
per comprendere la struttura di un linguaggio. Oggi,
poi, la diffusione pervasiva degli elaboratori elettronici richiede un’impostazione mentale e un bagaglio di
conoscenze di natura tecnologica e astratta, se non
si vuole rimanere utenti puramente passivi di macchine che inglobano in sé, nei loro programmi, conoscenze logiche e matematiche molto profonde. E
se queste macchine ci risparmiano lavoro di routine
e la necessità di dover eseguire calcoli tanto numerosi quanto banali, non ci esimono dal conoscere i
loro principi operativi (algoritmi e programmi) pena
una sudditanza, psicologica ed economica, da chi è in
grado di controllare queste macchine e quindi la parte di mondo, sempre più grande, che queste macchine
controllano.
Queste ed altre considerazioni ci spingono a tentare
di riunire in un unico testo, di dimensioni abbastanza
ridotte, le conoscenze di cui uno studente dovrebbe
essere padrone alla fine dei suoi studi elementari e
medi, e che quindi costituiscono il bagaglio di nozioni
con cui affrontare gli studi universitari. Da un punto di vista puramente pratico, perciò, è qui raccolta
tutta la Matematica che serve per l’accesso a un Corso di Laurea di tipo scientifico o tecnologico di una
nostra Università, sia per poter seguire utilmente gli
insegnamenti del primo anno, sia per superare i test
per l’accertamento dei debiti formativi in Matematica, attualmente previsti. Questo testo ha l’ambizione
di poter colmare le eventuali lacune degli studenti che
intendono iscriversi al primo anno di Università.
AVVERTENZA
Queste note devono ancora essere messe a
punto. L’autore è consapevole del fatto che
esse contengono errori di forma e di sostanza.
I lettori sono invitati a segnalare tutto ciò che
ritengono scorretto o comunque da modificare, togliere e aggiungere. Di tali segnalazioni
l’autore ringrazia anticipatamente.
c R. Sprugnoli, 2002.
°
1. La conoscenza della Matematica è diventata
un’esigenza fondamentale del mondo moderno, dove
la scienza e la tecnica costituiscono una parte importante della cultura di ciascuna persona, che incontra, ad ogni passo, riferimenti precisi ai concetti
matematici. Intorno al 1600, Galileo aveva puntualizzato l’inizio del pensiero moderno affermando che
la natura è un libro scritto in termini matematici, e
pertanto la Matematica è lo strumento fondamentale
per la conoscenza della natura. Con questo spirito si
è sviluppata la scienza moderna, che ha fatto della
Matematica un punto di riferimento e un ideale da
perseguire. Ma mentre nel 1700 e nel 1800 la scienza
e la tecnica erano appannaggio di una stretta minoranza di persone, con il 1900 la base si è enormemente
allargata ed ora, all’inizio del terzo millennio, le persone che hanno la necessità di usare la Matematica
per il proprio lavoro sono diventate la maggioranza.
Spesso la conoscenza della parte tecnica della Matematica è limitata alle nozioni che si apprendono alle
scuole elementari e medie, sia inferiori che superiori;
comunque, queste conoscenze formano la base indispensabile per acquisire le tecniche più evolute che si
insegnano nelle Università. Il sapere matematico è
un sapere unitario, che non permette frammentazioni, e una lacuna in un qualsiasi settore, l’aritmetica,
l’algebra o la geometria, costituisce di fatto una mancanza in tutte le altre parti della Matematica. Per
questo la cosiddetta “Matematica elementare” è una
base di conoscenza dalla quale è difficile prescindere
se si vuole avere accesso alle conoscenze del mondo
scientifico e tecnologico, mondo che sempre più invade anche i campi tradizionalmente riservati alle co-
—
2. La Matematica non è solo una serie di nozioni
tecniche che permettono di risolvere problemi pratici, ma è anche, e soprattutto, un modo di pensare e
un atteggiamento culturale. Per i Greci, che queste
cose le avevano inventate, non c’era distinzione tra la
Matematica (la Geometria) e la Filosofia. Talete e
5
6
Pitagora prima, Platone e Aristotele poi videro nella
Matematica la forma perfetta del sapere; solo Socrate
sembra non conformarsi a questa idea, ma sulla porta d’ingresso dell’Accademia platonica stava scritto
“Nessuno entri che non conosca la Geometria”. Il ragionamento, nella vita di tutti i giorni come nella filosofia più astratta, segue un modello che è quello della
Matematica, quello che la Matematica ha portato a
un rigore assoluto.
La necessità, il gusto della dimostrazione rigorosa
si apprendono pienamente con la Matematica; questa
dà anche i limiti di applicabilità del metodo deduttivo, che, ad esempio, non può entrare in un regressus ad infinitum, ma deve fondarsi su qualcosa che
diamo per buono e per certo: ed è proprio la Matematica che ci fa capire come questo qualcosa di fondante abbia un senso o lo acquisti in un sistema di
assiomi che si autosostengono. E anche senza arrivare a queste finezze che confinano con la filosofia,
la Matematica ci dà la forma mentis necessaria ad
affrontare, in modo rigoroso, tanto lo studio della natura quanto quello dell’uomo. Per questo motivo ho
voluto inserire in queste pagine la dimostrazione di
tutti i teoremi enunciati: le eccezioni credo si contino
sulle dita di una mano; e ho cercato di essere semplice e chiaro e allo stesso tempo rigoroso. Questo
è più di quanto si faccia normalmente nella scuola,
che spesso (secondo me sbagliando) si accontenta di
enunciare risultati da usare per risolvere gli esercizi
ed essere promossi alla classe successiva. Il senso e
l’amore del ragionamento vanno cosı̀ a sperdersi e la
Matematica diviene una sequenza di nozioni, da applicare quando necessario, invece di un fatto culturale
che forma la mentalità delle persone e fa da riferimento nell’affrontare la realtà che ci circonda (anche se
mia moglie sostiene che è meglio cosı̀!) Analogamente, va coltivato il gusto delle definizioni precise, che
puntualizzano idee e concetti, spesso piuttosto vaghi
nel loro uso quotidiano, e quindi a rischio di diventare ambigui quando si cerchi di portarli alle estreme
conseguenze, procedimento utile tutte le volte che si
voglia criticare un atteggiamento o un’impostazione,
facendo vedere le estreme conseguenze (negative) a
cui potrebbe condurre. E, nello stesso spirito, ho cercato anche di introdurre vari concetti dei fondamenti
della Matematica, attraverso i quali spero di chiarire
cosa si intende per “teoria”, sia nella Matematica, sia
in qualsiasi altro settore del sapere umano.
INDICE
parte e di Apollonio dall’altra. Indubbiamente, questo fu favorito da una inadeguata rappresentazione
dei numeri e dalla mancanza di un’Algebra formalizzata. Quando però, dopo Viète, Fermat e Cartesio,
l’Algebra (nel senso lato che oggi vi farebbe comprendere anche l’Analisi) prese il sopravvento, un tradimento fu perpetrato nei confronti di tutta la Matematica. La Geometria contemplava due metodologie
distinte, anche se utilizzate indifferentemente: la dimostrazione astratta e la costruzione geometrica. Ad
esempio, la prova che gli angoli alla base di un triangolo isoscele sono uguali (Teorema 6.12) è puramente
astratta e fa riferimento solo a costatazioni di fatto
e a risultati già noti. Il teorema di Pitagora, invece,
nella prova per mezzo del primo teorema di Euclide
(osservazione dopo il Teorema 6.27) fa uso di una costruzione, senza la quale la dimostrazione fallirebbe.
Allorché l’Algebra si impose alla Geometria, quest’ultima tipologia di dimostrazione fu relegata in secondo
piano e, quando possibile, evitata.
La dimostrazione astratta è, idealmente, atemporale. Si svolge nel tempo, come tutte le faccende umane, ma questo sembra e vuol essere più un accidente
che una parte intrinseca della prova. Si fanno certe valutazioni che “valgono” indipendentemente dal
momento in cui le facciamo; usiamo assiomi o teoremi già dimostrati, che vengono prima “logicamente”,
ma che ci rifiutiamo di considerare veri temporalmente prima del teorema che stiamo dimostrando e che
ne fa uso. In altre parole, un teorema deve valere indipendentemente dal tempo, sia del momento in cui
è stato dimostrato (il che sembra ovvio), ma anche
a prescindere da azioni che debbono essere eseguite
per dimostrarlo, e questo è un po’ meno ovvio. La costruzione geometrica, invece, non può prescindere dal
tempo: prima si fanno certe cose e poi se ne fanno altre, che non si sarebbero potute fare se non avessimo
completato quelle precedenti.
L’idea di una Matematica statica, del pensare che
“la Matematica è quella che è” risulta, proprio nel suo
essere vagamente blasfema, un qualcosa di attraente,
e più volte è stata riecheggiata da vari matematici, come il “Dio creò i numeri e il resto fu fatto dall’uomo”
di Frege e di Platone. E’ anche, però, una concezione vecchia che fa della Matematica uno strumento di
studio, cioè di indagine di una natura scritta in caratteri matematici, piuttosto che di una Matematica
volta a operare nel mondo e quindi a provare interessi per i procedimenti e non solo pei teoremi. D’altra
—
parte, gli antichi avevano già chiara questa differenza
3. Fino al 1600 la Matematica è stata essenzial- ed è nota l’affermazione di Proclo sulla Geometria,
mente Geometria. Se si escludono Pitagora e i suoi nella quale “si distinguono problemi e teoremi; i priseguaci di tutti i tempi, che ritenevano il numero co- mi contengono la generazione delle figure, i secondi
stituire l’essenza dell’Universo, tutta la Matematica dimostrano le proprietà delle figure.”
ruotava intorno alla Geometria, di Euclide da una
In effetti, i procedimenti o, come è più adeguato
7
INDICE
oggi dire, gli algoritmi sono da 300 anni relegati al
ruolo secondario di “Matematica applicata”, considerata spesso uno o più gradini inferiore alla “Matematica Pura”. Ad esempio, il metodo di Gauss per
la risoluzione dei sistemi lineari, di natura puramente algoritmica, è pressoché ignorato nei testi di Matematica e “relegato” in quelli di Calcolo Numerico.
Ognuno ricorda come l’unico algoritmo menzionato
dai programmi della scuola è quello di Euclide per il
calcolo del massimo comun divisore, ma nessuno lo
impara, perchè docenti e studenti preferiscono altri
metodi.
Oggi, però, l’affermarsi dell’Informatica ha riportato l’interesse per le soluzioni costruttive dei problemi, cioè per gli algoritmi, che costituiscono proprio la base teorica della programmazione. Gli algoritmi, tuttavia, non sono semplicemente un modo
astratto per arrivare a programmare un elaboratore; essi sono una metodologia per affrontare problemi
di qualsiasi natura e, quindi, per farne uno studio e
darne una soluzione rigorosa, analoga ad un teorema, anche se concettualmente diversa. Gli algoritmi
hanno influenzato anche parte della logica e stanno
prendendo piede in molte parti della Matematica (si
pensi al classico caso delle basi di Groebner). Cosı̀
le due metodologie antiche della Geometria classica,
quella deduttivo-astratta e quella costruttiva, stanno
avvicinandosi di nuovo. In questo testo ho cercato di
seguire tale linea, anche se il risultato è a mio parere
ancora molto parziale poiché, con mentalità tuttora
vecchia, non riesco ad amalgamarle, e continuo a vedere il teorema come la fase di controllo della verità
di un risultato e l’algoritmo come il metodo di risoluzione pratica di un problema, che basa la propria
validità su un opportuno teorema.
—
4. C’è, credo, una differenza fondamentale tra lo
studio delle materie umanistiche e quello delle discipline scientifiche. Lo studio delle prime si svolge,
idealmente, dal particolare al generale, mentre l’apprendimento delle seconde passa dal generale al particolare. Se, ad esempio, voglio capire che cos’è lo
Sturm und Drang, è essenziale che io legga almeno
le opere principali degli autori che si rifanno a quel
movimento letterario. Solo prendendo atto delle somiglianze e delle differenze che esistono tra i vari autori, delle idee e delle emozioni che ciascuno di loro
esprime o cerca di esprimere, mi posso fare un’idea
generale di cosa sia lo Sturm und Drang. Spesso è utile leggere quello che è stato scritto sullo Sturm und
Drang: un esperto professionista è capace di mettere in evidenza aspetti che abbiamo appena intuito o
che non abbiamo afferrato nella loro importanza; un
critico geniale può esprimere un punto di vista illuminante o originale. Tutto questo ci aiuta a formarci
un’idea personale precisa, cioè a capire che cosa sia lo
Sturm und Drang. Naturalmente, se leggiamo i commenti “al posto” delle opere originali, abbreviamo il
percorso, ma invece di idee personali avremo acquisito le idee dei commentatori; questo è negativo, anche
se talvolta fa parte del gioco.
Al contrario, lo studio delle discipline scientifiche
(che voglio nettamente distinguere dalla “scoperta
scientifica”, di cui dirò più avanti) parte da considerazioni e soluzioni generali di classi di problemi.
Infatti, sarebbe una perdita di tempo enorme cominciare ad esaminare soluzioni particolari di problemi
specifici per poter poi indurre un metodo globale di
soluzione di tutti i problemi della classe considerata. Se si può “dimostrare” che tutti i problemi di
una certa classe hanno una determinata soluzione, si
studia tale soluzione e poi si verifica se si è capito
andando ad utilizzare quella soluzione nei problemi
specifici. Questa impostazione vale non solo nel prosaico campo della soluzione pratica dei problemi (la
tecnica), ma anche per l’apprendimento dei concetti,
che si cerca di dare sempre nella forma più generale possibile, discutendo poi come si specializzino in
idee particolari e casi speciali. Di nuovo, diventa un
esercizio utile alla comprensione quello di passare dal
generale allo specifico.
Questo dà a molti l’impressione che la scienza sia
dogmatica e che invece di favorire la formazione delle
idee, inquadri la mente a seguire certe strade preordinate senza sviluppare un apparato critico appropriato. Ciò, ammettiamolo, può esser vero a un livello
molto basso, ma non credo sia diverso dallo studiare
la letteratura in un manuale di critica, che presenta
le idee dell’autore come verità apodittiche da imparare più o meno a memoria. In realtà, la Matematica,
anche negli aspetti più tecnici, fornisce sempre metodi alternativi di soluzione, stimola a cercare strade
diverse, invoglia a dimostrare che una soluzione è migliore di altre, almeno nella situazione considerata.
Di volta in volta, sta all’intuito, alla bravura e alle
conoscenze del solutore trovare la strada più conveniente per affrontare il problema. Proviamo ad esempio a trovare le soluzioni dell’equazione x2 −x−2 = 0:
avete cinque minuti di tempo a disposizione. . . .. Sono passati i cinque minuti; vediamo qual è stata la
vostra soluzione:
1. avete applicato la formula classica, calcolando il
discriminante ∆ = 1 + 8 = 9 e ottenendo x =
2 e x = −1. Bene, conoscete ed apprezzate la
tecnica della Matematica, ma la vostra tendenza
è quella di prendere le formule come verità da
non discutere;
2. visto che i coefficienti sono semplici, avete visto
ad occhio, o dopo un po’ di riflessione, che x2 −
8
INDICE
x − 2 = (x + 1)(x − 2) e quindi le soluzioni sono
2 e −1. Avete un buon intuito matematico e
fra più strade possibili sapete scegliere quella più
appropriata al problema;
ovvio o banale o chiaro è una conseguenza diretta di
regole o proprietà che sono state appena citate o che
fanno parte delle basi più semplici della Matematica,
quelle cioè che il lettore non deve ignorare. Quindi, se
costui
non riesce a capire, è perché non sta ponendo
3. avete ragionato cosı̀: x2 −x−2 = x2 +x−2x−2 =
attenzione a ciò che legge oppure ha qualche lacuna,
x(x + 1) − 2(x + 1) = (x − 2)(x + 1). Altre
che è opportuno venga rimossa. Purtroppo, c’è anstrade analoghe sono possibili, ma una soluzione
che un uso scorretto dell’“ovvietà”, quando l’autore
di questo tipo rivela una notevole predisposizione
vuole nascondere qualche zona d’ombra del suo lavoper la Matematica;
ro (e questo ha a che fare con l’etica professionale),
4. non avete nemmeno tentato di risolvere l’equa- oppure quando l’autore ha preso un abbaglio. Spero,
zione e siete passati a leggere queste conside- in queste note, di non essere caduto in simili scorrazioni: avete un atteggiamento troppo pigro e rettezze, cercando di avvertire quando un punto può
se non lo correggete le materie scientifiche non presentare qualche problema.
fanno per voi.
Ma, ci si può chiedere, non è forse vero che tutta
E’ impossibile studiare la Matematica semplicemente leggendo un testo. I libri di divulgazione matematica agiscono “contro” l’apprendimento della Matematica. Possono fornire una serie di concetti, ma
questi rimarranno solo in superficie e, dopo la lettura,
ci si trova spesso al punto di prima. Per studiare la
Matematica occorre leggere, munirsi di carta e penna
(qualcuno preferisce la matita, ma va bene lo stesso)
e svolgere per proprio conto i calcoli e gli esercizi. Se
non si fa cosı̀, si perde tempo e basta. Lo sforzo personale non può essere sostituito da alcun testo, per
chiaro che possa essere. Studiare seriamente cento
pagine di Matematica equivale a studiare un intero
scaffale di libri di una materia letteraria. Chi cerca
strade più brevi va incontro a un sicuro fallimento, a
meno che non sia un genio: non si sa mai.
Oggi esistono programmi sull’elaboratore, quali
Mathematica e Maple, che riescono a svolgere quasi
tutta la Matematica conosciuta: se avete perso tempo a cercare la soluzione della precedente equazione,
a suo tempo questi programmi vi saranno di enorme utilità, ma prima dovrete esservi formate solide
basi. Se non avete nemmeno tentato di risolvere l’equazione (caso 4) è inutile che tentiate di utilizzarli:
nessuna macchina si può sostituire a voi nel capire
e nello svolgere i concetti. O meglio, forse può, ma
allora è lei che pensa, e non voi. Non è la stessa cosa.
—
5. I testi e gli articoli di Matematica sembrano
abbondare di avverbi come “ovviamente”, “chiaramente” e di espressioni quali “è banale dimostrare
che”, “si vede subito che”, e cosı̀ via. Poiché anche
in queste note non potremo evitare tali modi di dire,
è bene si capisca il loro senso, che parrebbe introdurre un aspetto troppo personale (per taluni una cosa
può essere chiara, per altri molto meno) nel mondo
oggettivo della Matematica. In realtà tali espressioni
hanno un significato “abbastanza” preciso, e cioè vogliono significare questo: ciò che è dichiarato essere
la Matematica è conseguenza di una serie ristretta di
assiomi, ai quali vengono applicate regole di deduzione che man mano ci dimostrano tutti i teoremi ai
quali siamo interessati? Nella Sezione ?? parleremo
esplicitamente di questo aspetto, detto metodo assiomatico, e la risposta sı̀ a questa domanda ci dice allora
che tutto nella Matematica dovrebbe essere ovvio e
banale, visto che assiomi e regole di deduzione non
possono [ovviamente] essere ignorati e tutto il resto
è conseguenza diretta di quelli. Anche se c’è qualcosa di vero in tutto questo, e si può pensare ad una
macchina che, da sola, sviluppasse tutta la Matematica, [s]fortunatamente le cose non stanno proprio cosı̀.
Vogliamo dare alcune motivazioni di questo fatto:
1) La derivazione meccanica di tutti i settori della
Matematica (a parte le difficoltà intrinseche, di tempo e di spazio, che comporterebbe) ci darebbe una visione piatta della Matematica stessa. Con questo voglio dire che ogni teorema avrebbe la stessa rilevanza
di tutti gli altri e in effetti non sapremmo quali risultati, fra gli infiniti risultati che avremmo ottenuto, ci
può servire più degli altri per risolvere un certo problema; anzi, addirittura, non sapremmo come e dove
andare a cercarlo. Questa argomentazione ci mostra
un punto importante della Matematica umana: noi
procediamo per problemi, non per catene deduttive;
per noi certi problemi sono importanti, altri meno.
Noi costruiamo modelli della realtà e siamo interessati a sviluppare le teorie matematiche che stanno
dietro a tali modelli; procediamo, cioè, in modo utilitaristico, non nel senso materialista del termine, ma
nel senso che cerchiamo risultati utili alla nostra conoscenza. Quindi operiamo delle scelte e tali scelte
dipendono da noi, non dalla consequenzialità della
Matematica. Da questo punto di vista, più utile sarebbe una macchina alla quale potesse essere dato
l’enunciato di un possibile teorema e quella ci dicesse se è vero oppure no. Questo si riesce a fare in
molti settori ben delineati, ma rimane al momento il
problema di una macchina dimostratrice universale.
INDICE
9
Forse un giorno verrà realizzata, ma per ora si stanno risultato e cerca vari mezzi per convencersi che esso
solo sviluppando teorie matematiche su macchine del è valido. Tali mezzi vanno dal proprio intuito alla
sperimentazione in casi particolari, dalla discussione
genere.
2) Se il precedente è un criterio di opportunità, con i colleghi alla simulazione sul calcolatore, e tanesiste anche un criterio logico per preferire o repu- ti altri marchingegni fra i quali ci può ben stare la
tare necessario un approccio umano alla Matemati- dimostrazione formale. Qualcuno, a questo propoca. Gödel ha dimostrato che le nostre formalizzazioni sito, ha sostenuto e sostiene che la formalizzazione
della Matematica non possono essere complete, inten- matematica è un sovrappiù, e quando una cosa è vedendo con questo che non ci possono permettere di ra tutti si possono convincere (a loro modo) che tale
dimostrare tutti i risultati “veri”. In altre parole, la essa è. Questo però è del tutto irrazionale e, cosa
macchina che pur potesse derivare tutta la Matemati- più importante, io non ci credo. Riconosco che ogni
ca a partire dagli assiomi, non riuscirebbe comunque matematico si possa convincere della validità di un
ad arrivare a dimostrare tutte le verità della Mate- teorema nel modo che crede più opportuno; il fatto,
matica stessa. Alcune di esse (in realtà, infinite) ri- però, è che non deve crederci lui solo, specie se è un
marrebbero fuori. Non sappiamo se l’uomo sarebbe risultato al quale è arrivato per primo, ma deve concapace di fare di meglio, né sappiamo se sia già riu- vincere anche gli altri che le cose stanno come lui crescito a fare qualcosa di più, ma naturalmente vale la de. Ecco allora che la dimostrazione diviene il mezzo
pena di tentare, anzi sarebbe eticamente scorretto se comunicativo per eccellenza, nella Matematica come
in tutta la scienza, poiché è in grado di darci ragioni
non lo tentassimo.
obiettive, o anche semplicemente intersoggettive (per
3) Esiste, infine, anche un criterio estetico. Ogni chi non crede all’universalità della scienza) per essere
teorema ha più dimostrazioni; la macchina che ab- convinti che una certa affermazione è vera. Questo è
biamo ipotizzato genererebbe tutte le prove possibili, il ruolo semantico fondamentale della dimostrazione
rendendo ancora più difficile il nostro eventuale lavoro matematica e la giustificazione dell’esistenza dei libri
di ricerca dei teoremi interessanti, che apparirebbero, di Matematica nella forma che essi hanno. E’ questa
con tutti gli altri, innumerevoli volte. In effetti, ogni credenza, assieme al citato aspetto estetico delle didimostrazione umana ha un proprio carattere (se si mostrazioni, che creano ciò che abbiamo chiamato il
preferisce, non ho obiezioni ad affermare che siamo “gusto della dimostrazione”, non acquisendo il quale
noi a darglielo), e alcune ci appaiono ovvie e scon- penso che si perda molto del fascino della Matematate nel senso detto, altre sono interessanti o geniali tica. Essa allora diviene semplice strumento tecnico,
per l’impostazione adottata o il metodo utilizzato, al- semmai difficile da usare, e/o fonte di curiosità, meno
tre ancora rivelano connessioni inusitate con aspetti vicine alla scienza che all’enigmistica (disciplina che
diversi, che semmai nulla hanno a che fare con l’argo- personalmente non disprezzo affatto).
mento trattato. Queste due ultime categorie sono le
dimostrazioni che preferiamo, sono quelle che danno
—
soddisfazione e meritano alla Matematica l’appellativo di Arte. Il Mathematical Intelligencer, una rivista
6. Concludo questa non breve introduzione con alscientifica, nel 1998 ha indetto una specie di votazione cune osservazioni su come è stata scritta questa serie
per le più belle dimostrazioni della storia della Mate- di appunti di Matematica, che naturalmente risenmatica. Ha vinto la prova di Eulero per eiπ = −1 (un tono del mio modo di vedere la materia, le mie varie
risultato che purtroppo trascende l’ambito di queste idiosincrasie e i pallini che ho acquisito con la frequennote). Questo mostra come l’aspetto estetico (un’e- tazione della materia del mio lavoro, e cioè l’Informastetica un po’ sui generis, se si vuole) abbia un ruolo tica. Va da sé che non mi permetterei mai di scrivere
non indifferente nell’arido mondo della Matematica. un libro sulla Matematica seria, dove i colleghi maQueste considerazioni si legano a un altro aspetto
che amo mettere in rilievo, e cioè la differenza tra
un libro di Matematica e la soluzione matematica dei
problemi. Qui intendo per problema una qualsiasi
questione di Matematica, dall’esercizio didattico ai
grandi temi della ricerca matematica (d’altra parte,
per chi affronta per la prima volta un esercizio, esso
è un tema di “ricerca”, l’unica differenza essendo che
esso è già stato risolto da qualcuno). La “scoperta”
matematica non avviene mai (o quasi mai) nel modo
razionale in cui si espongono i risultati; piuttosto, il
matematico intuisce, o immagina, o si figura un certo
tematici sono ben più esperti e bravi di me: io mi
posso limitare a scrivere delle semplici note su quelle
parti della Matematica che tutti (e quindi, anche io)
dovrebbero sapere.
Note: Ho inserito nel testo un bel po’ di note che,
spero, non siano del tutto peregrine. La loro natura è
piuttosto varia: alcune sono note di approfondimento
del materiale esposto nella sezione; altre sono considerazioni di carattere storico; alcune sono curiosità o
divagazioni sul tema; altre infine sono anticipazioni
o rimandi che non potevano essere inserite nel testo
vero e proprio. Questo dovrebbe essere intelligibile
10
INDICE
anche senza le note; in altre parole, se un lettore tra- per verificare i risultati dei programmi realizzati.
lascia (ad esempio ad una prima lettura, ammesso che
voglia leggere queste cose due volte) le note, dovrebbe riuscire a seguire tutti gli argomenti senza perdere
nulla di essenziale alla comprensione. Spero che le
note (questo è almeno il compito che io intendo loro
affidare) soddisfino qualche curiosità e, soprattutto,
ne sollevino molte altre, invogliando cosı̀ il lettore a
proseguire questi studi, per i quali potrà utilmente
ricorrere a testi universitari specifici, che incontrerà
andando avanti negli studi.
Punto decimale: La virgola che separa la parte
intera di un numero dalla sua parte decimale costituisce una mia piccola idiosincrasia. Di fronte alla
scrittura (5, 32) è spesso difficile rendersi conto (specie nello stampato, quando gli spazi sono ridotti al
minimo indispensabile) se siamo di fronte al numero decimale cinque virgola trentadue o alla coppia di
numeri interi 5 e 32. Per questo, preferisco alla virgola il punto decimale della notazione anglosassone,
della quale ovviamente rifiuto l’uso della virgola per
indicare i raggruppamenti in migliaia, milioni, etc.:
a questo scopo userò un punto situato in alto. Pertanto, senza ambiguità, scrivere (51, 328) indicherà
la coppia di numeri 51 e 328; scrivere (51.328) vorrà
significare il numero decimale 51 punto 328; scrivere
infine (51. 328) denoterà il numero intero cinquantuno
mila trecentoventotto.
Esercizi: Come ho avuto modo di affermare, lo
studio della Matematica si deve fare con carte e penna
o matita, e soprattutto si devono risolvere problemi,
poiché solo la pratica ci rende familiari con i metodi
di risoluzione che la Matematica ci fornisce. Questo
testo è privo di esercizi, e ciò è una grave lacuna. E’
mia intenzione rimediare con un testo di esercizi, in
parte anche svolti. Però, siccome ho le mie idee su
come impostare un tale testo, per il momento la cosa
è ancora in fieri e non so immaginare quando potrà
essere realizzato. In queste note, spesso suggerisco di
scrivere programmi sull’elaboratore che realizzano o
simulano certi risultati: poiché naturalmente penso
ai futuri studenti di Informatica, questi sono esercizi
pressoché indispensabili. Visto che oggi l’Informatica
ha pervaso un po’ tutte le materie, gli stessi esercizi
penso possano essere utili anche agli altri, che avranno cosı̀ occasione per imparare un po’ di programmazione. Il linguaggio da usare è indifferente: il Pascal
va tanto bene quanto il C; oggi il C++ e il Java sono più à la page ed introducono alla programmazione
ad oggetti. Chi mai avesse a disposizione il Maple o
Mathematica, può utilizzarli come linguaggi di programmazione a tutti gli effetti, anche se tanti degli
esercizi sono già funzioni predefinite in tali linguaggi;
il trucco sta nel programmare ignorando (o facendo
finta di ignorare) tali funzioni e, semmai, utilizzarle
Capitolo 1
Il linguaggio della Matematica
fra di essi senza averne una coscienza esplicita. Cosı̀
diciamo che “tutti gli uomini hanno un naso”, aggregando in un’unica classe tutte le persone (passate, presenti e future), e allo stesso tempo separando
quella che è una semplice parte di una persona, cioè
il naso.
Se l’ipotiposi del sentimento personale prostergando i prolegomeni della subcoscienza fosse capace di reintegrare il proprio soggettivismo alla
genesi delle concomitanze, allora io rappresenterei l’autoprasi della sintomatica contemporanea che non sarebbe altro che la trasmificazione
esopolomaniaca. Che bel talento, eh? Ma io
non ci tengo né ci tesi mai . . .
E. Petrolini “Gastone”
1.1
Gli insiemi
La Matematica costituisce un vero e proprio linguaggio. Esso serve per esprimere proposizioni che riguardano quantità o relazioni. La forma più elementare
di quantità è il numero e la forma più elementare di
relazione è il confronto tra numeri. I numeri hanno
avuto origine con il contare e al contare è collegato
anche il confronto, per cui il numero cinque è inferiore
al sette perché contando si arriva prima al cinque che
al sette. Altre quantità, come la lunghezza o il peso,
sono state acquisite dall’uomo molto presto e con esse
è nato il concetto di misura. Il confronto fra numeri
è stato poi generalizzato al concetto di relazione tra
quanttà diverse: in questo modo sono state definite
relazioni come quella che lega l’altezza del sole al passare del tempo, o quella che vogliamo instaurare tra
il peso o la lunghezza di un oggetto e il suo costo.
Prima di parlare di numero, occorre che ci intendiamo su cosa vogliamo e possiamo contare. La nostra
mente concepisce la realtà secondo due metodi apparentemente contrapposti. Il primo tende a comporre
vari oggetti in una entità unica, come quando pensiamo al “salotto” come all’aggregazione tra una stanza,
mobili quali divano, poltrone e tavoli, e suppellettili quali quadri, soprammobili, ecc. Il secondo tende
a scomporre un individuo in varie parti, ad esempio
quando pensiamo a una persona come composta di
una testa, un tronco, due braccia e due gambe. Questi due modi di vedere la realtà, detti rispettivamente
aggregazione e separazione, non sono nettamente distinti l’uno dall’altro e noi ci muoviamo mentalmente
11
Per intenderci, ogni volta che saremo di fronte a
processi di aggregazione o di separazione, distingueremo tra un individuo, considerato come un tutto
unico e che chiameremo insieme, dalle parti in cui lo
immaginiamo separato, che diremo elementi. In tal
modo, vedremo il salotto come un insieme composto
dagli elementi “stanza”, “divano”, ecc., e gli elementi “testa”, “tronco” e via di seguito come costituenti
l’insieme “persona”. Gli insiemi e gli elementi sono
i primi concetti che si incontrano nella Matematica.
Volendo astrarre dalla loro natura specifica, useremo una notazione neutra, accettata ormai in tutte
le parti della Matematica. Gli elementi si denotano
con le prime lettere minuscole dell’alfabeto latino e
gli insiemi con le lettere maiuscole. Per dire che un
insieme A è composto dagli elementi a, b, c, d, si scrive
A = {a, b, c, d}, dove le parentesi graffe corrispondono
a ciò che abbiamo chiamato aggregazione e le virgole
alla separazione. L’ellissi “. . . ” serve a denotare elementi che non si vogliono o non si possono specificare,
come quando scriveremo A = {a, b, c, . . . , z}.
Naturalmente, le convenzioni notazionali appena
date hanno senso per insiemi generici; per insiemi
specifici potremo adottare notazioni specifiche, disturbando lettere speciali, in grassetto o in gotico
o dall’alfabeto greco, e simboli con significato particolare. Ad esempio, l’insieme dei numeri naturali,
quelli con i quali contiamo (lo zero compreso), sarà
indicato con N = {0, 1, 2, 3, . . .}, dove l’ellissi, questa volta, indica che non vogliamo scrivere i restanti
elementi (perché li conosciamo) e che non possiamo
riportarli tutti, in quanto non sono in numero finito.
I simboli 0, 1, 2, 3, etc. hanno un significato convenzionale, accettato quasi universalmente: nei testi
scritti in cirillico, arabo, cinese o giapponese, i numeri sono ormai scritti con le nostre dieci cifre arabiche,
12
CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA
da sinistra verso destra.
A
B
A
B
Per indicare il fatto che un certo elemento a appartiene ad un insieme A, si scrive a ∈ A e “∈” si dice
simbolo di appartenenza; la sua negazione è a 6∈ A.
Se P è l’insieme dei numeri pari, 10 ∈ P e 15 6∈ P.
A∪B
A∩B
Siano A e B due insiemi tali che ogni elemento di B
sia anche elemento di A: si dice che B è un sottoinsieA
B
A
B
me di A e si scrive B ⊆ A; se poi A contiene almeno
un elemento che non sta in B, allora B è un sottoinsieme proprio di A e si scrive B ⊂ A. Ad esempio,
P ⊂ N, dato che ogni numero pari è un numero, ma
esistono numeri che non sono pari. Due insiemi A e
A\B
A△B
B sono uguali, e si scrive A = B, se ogni elemento
di A è anche elemento di B e, viceversa, ogni elemento di B è anche elemento di A. In altre parole,
Figura 1.1: Diagramma di Venn
A = B significa che A ⊆ B e, contemporaneamente,
B ⊆ A. Spesse volte, per dimostrare che due insiemi
sono uguali, si applica questa osservazione, provando
che ogni elemento del primo appartiene al secondo, e legge “tale che”. Le seguenti tre operazioni tra insiemi ricorrono con estrema frequenza in tutte le parti
viceversa.
della Matematica:
E’ bene rendersi conto perfettamente della differenza fra il concetto di appartenenza e quello di “conte• Unione: l’unione di due insiemi A e B si scrive
nuto”: il primo mette in relazione un elemento con
A ∪ B ed è l’insieme composto dagli elementi che
un insieme, il secondo mette in relazione due insiemi.
stanno in A, stanno in B oppure stanno in tutti
Si sia certi di capire il seguente esempio: dato l’ine due gli insiemi;
sieme A = {a, b, c, d}, si consideri l’elemento b ∈ A e
si definisca B = {b}. In altre parole, B è l’insieme
• Intersezione: l’intersezione di due insiemi A e B
composto dal solo elemento b. Come insieme, si ha
si scrive A ∩ B ed è l’insieme degli elementi che
B ⊂ A, ma non hanno senso nessuna delle scritture
stanno contemporaneamente in A e in B;
b ⊂ A e B ∈ A. Infine, ricordiamo che se B ⊂ A
(B ⊆ A), si può scrivere in modo equivalente A ⊇ B
• Differenza: la differenza tra due insiemi A e B
(A ⊃ B), che si legge “A contiene (propriamente) B”
si scrive A\B ed è l’insieme degli elementi che
e si dice che A è un soprainsieme di B.
stanno in A, ma non appartengono a B.
Un insieme privo di elementi, come l’“insieme degli unicorni” si dice un insieme vuoto. Se pensiamo
all’“insieme dei triangoli con quattro lati”, ci rendiamo conto che di insiemi vuoti ne esiste uno solo, quello privo di qualsiasi elemento. L’insieme vuoto si indica con ∅. Si considera che l’insieme vuoto sia contenuto in (sia un sottoinsieme di) ogni altro insieme, e
quindi sia un sottoinsieme improprio di sé stesso. Per
completezza, ricordiamo che un insieme può essere
definito elencando tutti i suoi elementi, come quando
poniamo A = {1, 2, 3, 4, 6, 12}, e si dice che l’insieme
è definito per estensione. Alternativamente, possiamo definire un insieme come composto di tutti e soli
gli elementi che soddisfano una certa proprietà; ad
esempio, possiamo porre B = {divisori di 12}, dove
le parentesi graffe si leggono ancora “l’insieme dei”;
in questo caso A = B, ma si dice che B è definito per
intensione (attenzione, questa parola si scrive con la
lettera “s”!). In modo più formale, si dovrebbe scrivere B = {x | x divide 12} e si legge “l’insieme degli
elementi x tali che x divide 12”. Si osservi che x è
una variabile di comodo e che la barra verticale si
Due insiemi A e B si dicono disgiunti se la loro intersezione è l’insieme vuoto, cioè A∩B = ∅. L’unione
disgiunta degli insiemi A, B si denota A ⊎ B, e corrisponde all’unione di A e di B quando questi siano
disgiunti, o siano stati resi tali marcando in modo
diverso i loro elementi cosı̀ da renderli distinguibili.
Infine, la differenza simmetrica fra i due insiemi A, B
è definita dalla relazione: A△B = (A \ B) ∪ (B \ A).
Le operazioni tra insiemi si intuiscono facilmente
se ci aiutiamo graficamente con i ben noti diagrammi di Venn: in tali diagrammi un insieme è rappresentato dai punti di un cerchio e quindi, disponendo
opportunamente due o più cerchi, si può visualizzare
l’effetto di una qualsiasi operazione tra insiemi. Nella Figura 1.1 abbiamo evidenziato in grigio le quattro
operazioni introdotte.
I diagrammi di Venn permettono anche di dare
una prova grafica alle proprietà delle operazioni; ad
esempio, si vede immediatamente che:
A△B = (A ∪ B) \ (A ∩ B),
1.1. GLI INSIEMI
13
come d’altra parte si scopre facilmente la proprietà l’intersezione. Le proprietà di idempotenza, ugualdistributiva dell’unione rispetto all’intersezione:
mente, non hanno corrispondenza nei numeri, ma ci
dicono che, al contrario di questi, operando con un
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).
solo insieme non possiamo ottenere molto di più. Le
regole che coinvolgono il complemento ci informano
A
B
A
B
che questo ha qualcosa delle proprietà dell’opposto o
dell’inverso nei numeri, cioè l’operazione che da 4 ci
porta a −4 (opposto) oppure a 1/4 (inverso). Prima di tutto, l’opposto dell’opposto ci dà il numero
di partenza, come ce lo dà l’inverso dell’inverso: cosı̀
agisce anche il complemento. L’analogia esiste anche
C
C
con le regole a + (−a) = 0 e a × (1/a) = 1, ma qui,
anche identificando 0 con ∅ e 1 con U , le regole sono
A ∪ (B ∩ C)
(A ∪ B) ∩ (A ∪ C)
più stringenti, ed è come avessimo a × (−a) = 1 e
a + (1/a) = 0, il che ben sappiamo non essere vero.
Infine, in P(U ) valgono le celebri regole di De MorIn modo analogo il lettore è invitato a “dimostra- gan); costui era un matematico inglese della prima
re” la proprietà distributiva dell’intersezione rispetto metà del 1800, che anticipò alcune idee di Boole sulla
all’unione, cioè:
logica formale; insegnò ad Ada Byron, la figlia del
poeta, che fu cosı̀ brava da aiutare Charles BabbaA ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C).
ge nell’uso della Macchina Analitica, tanto da essere
considerata la prima programmatrice della storia (cirSpesso, si fissa un particolare insieme U , detto inca 1840). Le regole di De Morgan legano tra di loro
sieme universo, e si considerano tutti i suoi sottoinsietutte e tre le operazioni definite su P(U ); possono esmi, che costituiscono il cosiddetto insieme delle parti
sere facilmente verificate con l’uso dei diagrammi di
di U e si denota con P(U ). Chiaramente, U ∈ P(U )
Venn, ma invitiamo il lettore a riflettere un po’ sul
e ∅ ∈ P(U ), e per ogni A ⊆ U si definisce il comloro significato per cercare di capirlo senza l’aiuto di
plemento di A (in U ) come la differenza A = U \ A;
un disegno. Le regole non sono banali e può essere
ovviamente, U = ∅ e ∅ = U : in generale A = A. Le un esercizio utile quello di raffigurarci mentalmente
tre operazioni di unione, intersezione e complemento, il loro senso.
definite in P(U ), godono di una serie di proprietà,
che elenchiamo nella Tabella 1.1: esse si dicono proNota 1.1
Quella che abbiamo considerato è
prietà dell’Algebra Booleana e le ritroveremo anche
un’impostazione intuitiva della teoria degli insiemi.
più avanti. Il lettore è invitato a dimostrare queste
Dopo la sua introduzione da parte di Boole, Frege e
proprietà con il metodo dei diagrammi di Venn.
Cantor, il concetto di insieme venne variamente criticato e ci si accorse presto che tutta la teoria non poPossiamo dire due parole su questo elenco di regole.
teva essere lasciata all’intuizione, ma doveva rientrare
Esse assomigliano, ma non coincidono, con le regole
nei canoni di un formalismo che, proprio in quell’edelle operazioni numeriche, che tutti conosciamo. Ad
poca, si stava affermando e che, in un qualche moesempio, la proprietà commutativa è la stessa, mendo abbastanza miserevole, cercheremo di esporre nelle
tre la proprietà distributiva sembra più ampia e vaprossime sezioni. Uno dei colpi di maglio che furono
le tanto per l’unione rispetto all’intersezione, quanto
sferrati contro l’impostazione intuitiva della teoria denel caso opposto; per i numeri, possiamo distribuigli insiemi è certamente il paradosso di Russell, che il
re il prodotto rispetto alla somma, ma non vicevermatematico e logico inglese propose nel 1902. Ecco cosa. Questa analogia ha portato, specie all’inizio della
me ragionò Russell. Il concetto di insieme sembra postoria della teoria degli insiemi, a parlare dell’unione
ter schematizzare quella capacità di aggregazione che
la mente umana possiede e sulla quale si basa parte
come della “somma” tra insiemi e dell’intersezione
della nostra conoscenza. Quindi possiamo aggregacome del “prodotto”. In effetti, se A e B sono due
re oggetti in insiemi, ma anche insiemi in insiemi di
insiemi disgiunti, rispettivamente con m ed n elemeninsiemi, e cosı̀ via, all’infinito. Possiamo addirittura
ti, la loro unione A ∪ B = A ⊎ B contiene esattamente
pensare all’insieme G di tutti gli insiemi. Questo inm + n elementi. Tuttavia, l’analogia finisce qui, dato
sieme globale gode di una strana proprietà: esso deve
che A ∩ B = ∅ e, in generale, A ∩ B ha meno elementi
contenere sé stesso come elemento, in quanto contiedel solo A o del solo B.
ne tutti gli insiemi. Generalmente, un insieme non
Caratteristica degli insiemi è la proprietà di assorcontiene sé stesso come elemento, ma G non è certo
bimento: A ∩ B è contenuto in A, per cui, se poi agl’unico insieme con tale proprietà. Ad esempio, “L’ingiungiamo tutto A, quello che otteniamo è proprio A;
sieme di tutti gli insiemi che possono essere definiti
con meno di venti parole italiane”, è un insieme deficosı̀ A ∪ B contiene A, e quindi ritorniamo ad A dopo
14
CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA
commutativa
associativa
distributiva
assorbimento
idempotenza
complemento
identità
zero
doppia negazione
de Morgan
A∪B =B∪A
A∩B =B∩A
A ∪ (B ∪ C) = (A ∪ B) ∪ C
A ∩ (B ∩ C) = (A ∩ B) ∩ C
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
A ∪ (B ∩ A) = A
A ∩ (B ∪ A) = A
A∪A=A
A∩A=A
A∩A=∅
A∪A=U
A∪∅=A
A∩U =A
A∪U =U
A∩∅=∅
A=A
A∪B =A∩B
A∩B =A∪B
Tabella 1.1: Le regole dell’Algebra Booleana
nito per intensione che contiene sé stesso, proprio per
come l’abbiamo definito. Allora, gli insiemi si suddividono in due grandi classi: l’insieme P degli insiemi che
contengono sé stessi, e l’insieme N di tutti gli altri. Ci
chiediamo (cioè, si chiese Russell): l’insieme N dove si
trova, in P o in N ? Se N stesse in N , sarebbe allora
un elemento di sé stesso, ma ciò contraddice la sua
definizione. Supponiamo allora che N stia in P ; ma
per definizione di P , N dovrebbe contenere sé stesso,
e siamo di nuovo in contraddizione. Non ci sono però
altre possibilità, e siamo giunto a un paradosso.
Lo stesso Russell, con Whitehead, sviluppoò una
teoria assiomatica degli insiemi che permettesse di
evitare questo ed altri paradossi. Un’altra importante
assiomatizzazione è dovuta a Fraenkel e Zermelo.
Ma noi, detto questo, ci dobbiamo arrestare. Avvertiamo solo che queste teorie rendono conto del
concetto di numero cardinale (che vedremo) e di
numero ordinale, che invece non vedremo. Questi
ultimi “numeri” vogliono generalizzare all’infinito
la categoria grammaticale di primo, secondo, terzo,
etc.; naturalmente, le cose si complicano e ce ne
possiamo rendere facilmente conto pensando di
scrivere l’insieme (ordinato) dei numeri naturali,
seguito da un’altra serie di numeri naturali. In questo
insieme, qual è il numero d’ordine del secondo 1?
1.2
Le relazioni
Gli insiemi, anche con la distinzione tra il tutto e i
singoli elementi, non esauriscono il nostro modo di
concepire il mondo; un altro aspetto essenziale è dato dalle relazioni reciproche tra gli insiemi e tra gli
elementi. A ben guardare, tra questi oggetti abbiamo già introdotto almeno due relazioni: quella di appartenenza, che associa elementi ed insiemi, e quella
di “contenuto”, che invece mette in relazione insiemi con insiemi. Se poi allarghiamo il nostro campo
visuale a tutta la Matematica, vediamo che fra i numeri esistono le relazioni di uguaglianza, di minoranza, di maggioranza, di divisibilità e tante altre. Nella
Geometria abbiamo la congruenza, la similitudine e
l’equivalenza tra figure. E se passiamo al mondo che
ci circonda, ci rendiamo conto che di fatto viviamo in
un universo di relazioni tra persone, fra gruppi, fra
nazioni, fra oggetti, e cosı̀ via. La parentela e l’amicizia tra persone, l’alleanza e il confinamento tra
stati, l’esser sopra, sotto, dentro o fuori tra oggetti,
sono relazioni con le quali abbiamo a che fare in ogni
istante.
Volendo formalizzare, almeno un po’, la nostra idea
di “relazione”, possiamo cominciare restringendo il
nostro interesse alle cosiddette relazioni binarie, quelle che cioè coinvolgono solo due insiemi di elementi o,
se si vuole, mettono in connessione due soli elementi, che possono far parte o meno dello stesso insieme.
Ad esempio, spesso si parla di “gruppi di amici”, intendendo che la relazione coinvolga più persone contemporaneamente; tuttavia, in questo caso, è facile
immaginare che l’amicizia di gruppo sia il risultato
di una serie di amicizie tra coppie di persone, e di tre
amici A, B, C si possa dire che formano un gruppo di
amici se A è amico di B, B di C e C di A. Talvolta
questa riduzione è più difficile, ma immaginiamo che
la si possa fare, oppure immaginiamo di non interessarci ad altri tipi di relazione. Una relazione binaria
può essere data in due maniere diverse:
1. elencando puntigliosamente tutte le coppie di
elementi che sono in relazione, cioè dando una
definizione per estensione. La relazione di amicizia tra persone o di alleanza tra stati non può
essere data che in questo modo;
2. dando una regola che permetta di stabilire, senza
ambiguità, quando due elementi sono in relazione. Due stati sono confinanti se hanno un tratto
di confine in comune, a prescindere da qualsiasi
elencazione. Siamo di fronte a una definizione
per intensione.
L’elencazione, con un po’ di buona volontà, può essere assimilata a una regola, o legge, e quindi spesso
si dice che una relazione è data da una legge che permette di associare gli elementi in relazione tra di loro,
15
1.2. LE RELAZIONI
e quindi ci fornisce anche un criterio per dire quando
due elementi non sono in relazione. Intuitivamente,
avere un criterio per definire una relazione sembra
essere il modo più naturale di impostare il problema, e sarà questo metodo intensionale che seguiremo
nella presente sezione per esporre i principali tipi di
relazione che si trovano nella Matematica. Tuttavia,
prima di far questo, vogliamo ricordare la definizione
matematica di relazione, che invece fa riferimento all’idea di estensione. Se A e B sono due insiemi (fra i
quali vogliamo definire una relazione), si chiama prodotto cartesiano di A e B, e si indica con A × B,
l’insieme di tutte le coppie ordinate (a, b) dove a ∈ A
e b ∈ B. Ad esempio, se A è l’insieme di due elementi
A = {maglia, camicia} e B è l’insieme di tre elementi
B = {bianca, azzurra, fantasia}, il prodotto A × B è
costituito dalle sei coppie:
(maglia, bianca)
(camicia, bianca)
(maglia, azzurra) (camicia, azzurra)
(maglia, fantasia) (camicia, fantasia).
E’ bene distinguere chiaramente il concetto di coppia
(ordinata) da quello di “insieme di due elementi”: la
coppia (a, b) è diversa dalla coppia (b, a), anche se a
e b appartengono allo stesso insieme; infatti, l’ordine
degli elementi è essenziale. Viceversa, i due insiemi
{a, b} e {b, a} sono lo stesso insieme, composto dai
due elementi a e b, indipendentemente dall’ordine con
cui essi sono scritti.
Il nome di “prodotto cartesiano” deriva dalla Geometria Analitica, dove il piano cartesiano è costituito
da tutte le possibili coppie di numeri reali, e quindi è
proprio R × R. E’ facile vedere che se A e B sono due
insiemi che contengono, rispettivamente, m ed n elementi, il loro prodotto cartesiano A×B contiene proprio m×n coppie distinte, il che, se si vuole, giustifica
il nome di “prodotto“ per questa operazione.
Accettato questo concetto, che associa gli elementi
di A con quelli di B in tutti i modi possibili, la definizione di relazione è semplice: si dice relazione o
corrispondenza tra A e B un qualsiasi sottoinsieme
del prodotto cartesiano A × B. Il sottoinsieme determina le coppie di elementi in relazione tra di loro; le
coppie che non appartengono al sottoinsieme, quindi,
sono formate da elementi che non sono in relazione
tra di loro. L’esempio precedente può essere illuminante: il mio guardaroba di maglie e camicie è una
relazione che lega questi oggetti a possibili colorazioni: la relazione è data dal fatto che tali oggetti sono
miei e non di qualcun altro (il guardaroba di un’altra persona costituirà un’altra relazione). Se ho due
maglie, una bianca e una azzurra, e due camicie, una
bianca e una fantasia tipo hawaiano, si vede immediatamente come il mio guardaroba sia un sottoinsieme
di A × B.
Nota 1.2
Aver insistito sulle relazioni binarie, è
solo una semplificazione espositiva. Il prodotto cartesiano può essere esteso a un numero qualsiasi di insiemi: A1 × A2 × · · · × An è l’insieme delle n-uple
ordinate (a1 , a2 , . . . , an ) composte con a1 ∈ A1 , a2 ∈
A2 , . . . , an ∈ An . Come per le coppie, anche per le terne, le quadruple, . . ., le n-uple l’ordine degli elementi
è essenziale, e ciò distingue queste entità dagli insiemi
di 3, 4, . . . , n elementi. Quando i vari insiemi sono di
fatto lo stesso insieme A, si scrive A3 per A × A × A, e
via di seguito. Una relazione o corrispondenza n-aria
fra gli insiemi A1 , A2 , . . . , An è un sottoinsieme D del
prodotto cartesiano A1 × A2 × · · · × An e gli elementi
a1 , a2 , . . . , an si dicono in relazione o in corrispondenza tra di loro se la n-upla ordinata da loro composta
appartiene a D.
Le relazioni cosı̀ definite sono un concetto veramente
basilare del nostro modo di concepire il mondo che
ci circonda, tanto è vero che oggi costituiscono le
strutture di riferimento per la modellazione della
realtà operata, in Informatica, dalle Basi di Dati.
Quando si vogliono gestire le informazioni di un’Azienda, si costruisce la base di dati che rappresenta
il Sistema Informativo Aziendale. Tale base di dati
non è altro che l’insieme delle relazioni che legano
tra di loro le informazioni di tutta l’azienda (Modello
Relazionale). Ad esempio, semplificando al massimo,
una delle relazioni può essere un sottoinsieme R del
prodotto N × C × D × Q × S, dove N è l’insieme
dei nomi propri, C quello dei cognomi, D quello delle
date di nascita, Q quello delle qualifiche e S quello
degli stipendi annuali. La quintupla (Luigi, Rossi,
04/12/1975, D8, 32000), se appartiene ad R significa
che il Sig. Luigi Rossi, nato il 4 Dicembre del 1975, ha
la qualifica D8 (qualunque cosa ciò voglia significare)
e guadagna 32 mila e all’anno. E’ interessante
osservare come le relazioni, che costituiscono la base
dei dati, e le associazioni fra le relazioni (cioè, le
relazioni tra relazioni) permettano una modellazione operazionale di realtà complesse come quelle di
aziende private e enti pubblici di qualsiasi dimensione.
Alcune relazioni hanno un ruolo molto importante nella Matematica; citiamo le relazioni di equivalenza e di ordine tra elementi dello stesso insieme,
e le funzioni tra elementi di insiemi (spesso) diversi.
Su queste relazioni vogliamo ora entrare in maggiori
dettagli. L’uguaglianza (tra numeri, tra figure o tra
oggetti qualsiasi, non ha importanza) è una relazione
che tutti conosciamo; essa fa parte di un gruppo di relazioni caratterizzate da alcune proprietà e che è noto
col nome di “relazioni di equivalenza”. Formalmente,
una relazione di equivalenza è una relazione tra gli
elementi dello stesso insieme A (e, quindi, è un sottoinsieme di coppie appartenenti ad A × A = A2 ) che
gode delle seguenti proprietà:
1. proprietà riflessiva: ogni elemento a ∈ A è in
relazione con sé stesso;
16
CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA
2. proprietà simmetrica: se un elemento a ∈ A è in
relazione con un elemento b ∈ A, allora anche b
è in relazione con a;
3. proprietà transitiva: se un elemento a ∈ A è in
relazione con b ∈ A e questo, a sua volta, è in
relazione con c ∈ A, allora anche a è in relazione
con c.
La prima proprietà sembra ovvia, ma non lo è poi
tanto, visto che molte relazioni come “a è diverso
da b” non ne godono affatto. L’uguaglianza, la congruenza, la similitudine e l’equiscomponibilità tra figure sono relazioni di equivalenza. Un esempio meno
ovvio lo si ha considerando le espressioni aritmetiche
(ad esempio, formate da numeri e le operazioni di
somma e sottrazione, come si studiano in IV elementare) e dire che sono equivalenti se e solo se hanno
lo stesso valore. Ogni espressione è equivalente a sé
stessa; se 2 + 3 = 1 + 4 allora 1 + 4 = 2 + 3 e, infine,
se è anche 1 + 4 = 7 − 2, allora 2 + 3 = 7 − 2.
Nota 1.3
Sia definita su A una relazione che goda delle proprietà simmetrica e transitiva. Se a, b ∈ A
sono due elementi in relazione tra di loro, cioè a è in
relazione con b, per la proprietà simmetrica è anche
b in relazione con a. Per la proprietà transitiva,
applicata a questi due casi, si ha che a è in relazione
con sé stesso. Deve allora valere la proprietà riflessiva.
Ci possiamo chiedere: se, come sembra da questo
ragionamento, la proprietà riflessiva consegue dalle
altre due, perché l’abbiamo inserita esplicitamente
nella definizione? In realtà il ragionamento vale solo
se a è in relazione con almeno un altro elemento,
diverso da lui o no. Ma se nell’insieme esiste un
elemento che non è in relazione con nessun altro
elemento (nemmeno sé stesso) l’argomento viene a
cadere e la proprietè riflessiva non vale più nella
globalità dell’insieme.
Avere una relazione di equivalenza R su un insieme
A è la stessa cosa che avere una suddivisione di A in
tanti sottoinsiemi che sono a due a due disgiunti tra di
loro; è cioè come se l’insieme A fosse tagliato a fette.
Infatti, se a ∈ A, indichiamo con Ea la classe di tutti
gli elementi di A che sono in relazione con a; spesso,
in modo suggestivo, si usa la notazione [a] per Ea , che
mette bene in evidenza il ruolo di a. Comunque, se Eb
è la classe di equivalenza di un altro elemento b ∈ A,
abbiamo Ea = Eb oppure Ea ∩ Eb = ∅. Infatti, se a
è in relazione con b, ogni elemento c equivalente ad
a è anche equivalente a b per la proprietà transitiva,
e viceversa, per cui Ea = Eb . Se invece b non è
in relazione con a, nessun elemento c può essere in
relazione tanto con a quanto con b, perché altrimenti
a e b sarebbero in relazione tra loro: quindi Ea ∩
Eb = ∅. D’altra parte, ogni elemento di A sta in
una classe di equivalenza, la sua, per la proprietà
riflessiva, cosı̀ che le classi di equivalenza ricoprono
tutto A. L’insieme delle classi di equivalenza degli
elementi di A rispetto alla relazione d’equivalenza R
si dice l’insieme quoziente di A modulo R e si indica
con la notazione A/R.
Si noti che è vera anche la proprietà inversa. Supponiamo che A sia diviso in tanti sottoinsiemi che:
i) sono tra loro a due a due disgiunti; ii) ricoprono
tutto A. Si dice che gli insiemi formano una partizione di A e se definiamo che due elementi a, b ∈ A
sono in relazione se e solo se appartengono allo stesso
sottoinsieme, vediamo che tale relazione è di equivalenza. Per questo basta dimostrare che valgono le tre
proprietà caratteristiche:
1. la relazione è riflessiva perché ogni elemento
si trova in un sottoinsieme (proprietà di ricoprimento ii)) e quindi è in relazione con sé
stesso;
2. se a è nello stesso sottoinsieme di b, vale anche
il viceversa e quindi la proprietà simmetrica è
verificata;
3. se a è nello stesso sottoinsieme di b, e questi di
c, essendo i sottoinsiemi disgiunti o coincidenti, a deve essere nello stesso sottoinsieme di c
(proprietà transitiva).
Questo fatto è spesso utile per ragionare in termini
di classi di equivalenza piuttosto che in termini dei
singoli elementi. Vedremo più casi di questo genere, ma qui, per fare un esempio preso dalla vita di
tutti i giorni, pensiamo al modo diverso con cui un
cliente e un’azienda vedono i prodotti da acquistare o
vendere, rispettivamente. Il cliente è interessato, per
esempio, a un’autovettura ben determinata, l’azienda
lavora invece per classi e, in fase di produzione, essa
produce un certo numero di vetture di un dato tipo,
indipendentemente dai desideri del singolo cliente, se
non per ciò che riguarda eventuali analisi di mercato.
Solo recentemente, almeno nel settore degli autoveicoli, si è passati a una produzione più personalizzata.
Naturalmente, la tipologia delle macchine prodotte è
una partizione di tale insieme e la corrispondente relazione di equivalenza è: “la macchina a è dello stesso
tipo della macchina b”. Se non fosse per il numero del
motore, le due macchine sarebbero indistinguibili.
Un’altra importante relazione è costituita dall’ordinamento. Sia A il solito insieme; si dice che gli
elementi di A sono ordinati in senso stretto secondo
una certa relazione, o che tale relazione è una relazione d’ordine stretto per A, se valgono le seguenti tre
proprietà:
1. proprietà antiriflessiva: nessun elemento è in
relazione con sé stesso;
17
1.3. FUNZIONI E OPERAZIONI
2. proprietà controsimmetrica: se un elemento a ∈
A è in relazione on b ∈ A, allora b non deve essere
in relazione con a;
3. proprietà transitiva: se un elemento a ∈ A è in
relazione con b ∈ A e questo, a sua volta, è in
relazione con c ∈ A, allora anche a è in relazione
con c.
S = {a, b, c}
{a, b}
{a, c}
{b, c}
{a}
{b}
{c}
Un esempio significativo è dato dalla relazione tra
numeri a < b. Più spesso, tuttavia, si usa la relazione
d’ordine non stretto, detta semplicemente relazione
d’ordine o relazione d’ordine parziale per le cose che
vedremo. Essa è caratterizzata dalle tre proprietà:
1. proprietà riflessiva: ogni elemento è in relazione
con sé stesso;
2. proprietà antisimmetrica: se un elemento a ∈ A
è in relazione con b ∈ A, e b è in relazione con a,
allora a e b coincidono;
∅
3. proprietà transitiva: se un elemento a ∈ A è in
relazione con b ∈ A e questo, a sua volta, è in
relazione con c ∈ A, allora anche a è in relazione
con c.
Figura 1.2: Diagramma di Hasse
Per avere un riferimento concreto, si pensi alla relazione tra numeri a ≤ b. Tuttavia, è facile vedere che
anche tutti i sottoinsiemi di un insieme dato S, se
considerati con la relazione “contenuto”, godono di
queste stesse proprietà: 1) ogni insieme si può considerare come sottoinsieme di sé stesso; 2) se A ⊆ B e
B ⊆ A, allora A = B; 3) A ⊆ B e B ⊆ C implicano
A ⊆ C, come risulta immediatamente dalla definizione. Ad esempio, se S = {a, b, c}, è facile disporre gli
8 sottoinsiemi di S in un diagramma (come nella Figura 1.2), detto diagramma di Hasse, che evidenzia
le reciproche relazioni di “contenuto”.
Se facciamo una cosa analoga per la relazione “≤”
fra i numeri {1, 2, 3, 4} troviamo un diagramma di
Hasse molto più semplice. In realtà quest’ultima relazione ha una caratteristica particolare: per “≤” fra
numeri vale la proprietà aggiuntiva:
4. dati due elementi qualsiasi, il primo è in relazione
col secondo oppure il secondo è in relazione col
primo.
Chiaramente, questa proprietà non è valida per gli
insiemi {a} e {b, c}, che non hanno nessuna relazione di contenuto fra di loro. Quando questi due tipi
di ordinamento si vogliono distinguere, si dice che
quello fra gli insiemi è un ordinamento parziale, mentre quello tra numeri è un ordinamento totale. Un
esempio ulteriore di ordinamento totale è costituito
dall’ordinamento lessicografico, cioè quello delle parole nel dizionario: date due parole, si confrontano
le prime lettere e se l’iniziale della prima è maggiore
(minore) dell’iniziale della seconda, la prima parola
segue (precede) la seconda. Se le prime due lettere
sono uguali, si confrontano le seconde due, e si va
avanti nello stesso modo finché non si trova la disuguaglianza che decide. Se una parola finisce prima
che si sia arrivati a distinguere i due termini, questa
precede l’altra. Cosı̀ mani < piedi, mani < manto,
mani < manica.
Un esempio, invece, di ordinamento parziale è il
seguente. Si consideri un numero, diciamo 30, e l’insieme di tutti i suoi divisori: {1, 2, 3, 5, 6, 12, 15, 30};
diciamo che il divisore d1 precede il divisore d2 se e
solo se d1 divide d2 . Cosı̀ 5 precede 10, 3 precede 15,
ma nulla possiamo dire di 2 e 15. Il lettore è invitato
a verificare che questo è un ordinamento parziale, sia
nell’esempio del 30 sia in generale, per ogni numero
naturale n. E’ anche invitato a disegnare il diagramma di Hasse per n = 30 e a confrontarlo con quello
della Figura 1.2.
1.3
Funzioni e operazioni
Il tipo più importante di relazione o corrispondenza è
certamente costituito dalle funzioni. Una corrispondenza tra due insiemi A e B, cioè un sottoinsieme
F ⊆ A × B, si dice una funzione se e solo se ad ogni
elemento di A corrisponde uno e un solo elemento di
B. Come si sa, espressioni come y = 3x + 2 oppure
y = x2 − 4x + 1 rappresentano due funzioni perché,
assegnato un valore ad x (la variabile indipendente),
il valore di y (la variabile dipendente) è univocamente
determinato. In generale si scrive y = F (x), anche
18
CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA
se propriamente si dovrebbe scrivere (x, y) ∈ F . La
corrispondenza tra A e B può essere di natura qualsiasi e non necessariamente numerica. Un’azienda che
produce scarpe è interessata alla produzione mensile: si tratta di una funzione nella quale, come corrispondente di ogni mese, si ha un numero, ma questo
numero non soddisfa necessariamente ad alcuna formula analitica analoga a quelle viste in precedenza.
Cosı̀, la data di nascita e l’indirizzo di residenza sono
funzione della singola persona, come lo sono il nome e
il cognome. Invece, la data di nascita non è funzione
del nome e del cognome, in quanto possono esistere due Giovanni Russo nati uno il 14 Aprile 1957 e
l’altro il 21 Settembre 1961.
su questo ritorneremo più avanti.
La terminologia relativa alle funzioni è alquanto
complicata, ma è essenziale in tutta la Matematica.
Intanto, una generica funzione f dell’insieme A nell’insieme B si indica con la notazione: f : A → B,
f
oppure A → B; nel caso che f sia biunivoca, ciò si
mette in evidenza scrivendo: f : A ↔ B o anche
f
A ↔ B. L’insieme A si dice dominio oppure insieme
di partenza della funzione e B si dice il rango o codominio o insieme di arrivo; l’insieme degli elementi di
B che sono corrispondenti di almeno un elemento di
A si dice l’immagine di A in B e si indica con f (A);
in generale, come s’è visto, f (A) ⊆ B, e se f (A) = B
si dice che la funzione è surgettiva. Se b ∈ B è il
corrispondente di a ∈ A secondo f , cioè (a, b) ∈ f ,
si dice che b è l’immagine di a secondo f e si scrive:
b = f (a).
Se abbiamo una corrispondenza D ⊆ A × B, cioè
un insieme di coppie (a, b) ∈ D con a ∈ A e b ∈
B, è sempre possibile invertire tale corrispondenza
cambiando l’ordine degli elementi, cioè considerando
le coppie (b, a) tali che (a, b) ∈ D. Quella che cosı̀ si
ottiene è una corrispondenza tra B ed A che si dice
l’inversa di D e pertanto si indica con D−1 ⊆ B × A.
Formalmente:
Una funzione che faccia corrispondere ad elementi
diversi di A elementi diversi di B si dice iniettiva.
Le funzioni iniettive sono particolarmente simpatiche
perché sono “invertibili”, cioè possiamo partire dagli
elementi di B e stabilire, per ciascuno, se esiste e
qual è l’elemento di A che lo ha come corrispondente;
infatti, o l’elemento b ∈ B non è determinato da alcun
elemento di A oppure è determinato da uno solo. Ad
esempio, y = 2x è una funzione iniettiva perchè ad x
diversi corrispondono valori di y diversi; gli y, però,
non possono essere negativi. Pertanto, se partiamo
da un y ≤ 0, sappiamo che esso non è determinato
D−1 = {(b, a) ∈ B × A | (a, b) ∈ D ⊆ A × B}.
da alcun valore di x; se però y > 0, esiste senz’altro
un valore di x tale che y = 2x ; tale valore è dato da
Quando la corrispondenza è una funzione, non è detx = log2 y, cioè il logaritmo in base 2 di y (si veda al
to che la sua inversa sia ancora una funzione; questo
Capitolo 3).
accade solo se a elementi distinti di A corrispondono
Ancora più simpatiche sono le funzioni iniettive che elementi distinti di B, di modo che nella corrisponper ogni b ∈ B hanno il corrispondente in A, cioè le denza inversa esista un’unica coppia che abbia come
funzioni che sono anche surgettive: queste funzioni primo elemento b ∈ B. In altre parole, la corrisponsi dicono biunivoche (o corrispondenze biunivoche) ed denza inversa di una funzione è anch’essa una funziohanno un ruolo fondamentale in tutta la Matematica. ne se e solo se f è iniettiva. Se b = f (a), si scrive
Esse si possono definire come quelle corrispondenze anche a = f −1 (b) ed a si dice l’immagine inversa di
che ad ogni elemento di A associano uno e un solo b.
elemento di B e, viceversa, ad ogni elemento di B
Se f : A → B e g : B → C si può considerare la
associano uno e un solo elemento di A. Si osservi funzione h : A → C definita nel modo seguente: si
che se due insiemi A e B sono finiti, hanno cioè un parte da un qualsiasi elemento a ∈ A e si trova il corrinumero finito di elementi, e fra di essi esiste una corri- spondente di a in B secondo f , cioè si trova b = f (a).
spondenza biunivoca, allora essi devono contenere lo Da questo elemento b si passa, tramite la g, all’elestesso numero di elementi: infatti, per la definizione, mento c = g(b) e si definisce questo come immagine di
è possibile associare ad ogni elemento a ∈ A un unico a secondo h. Questa corrispondenza h si dice la comb ∈ B, e nessuno degli elementi di B rimane fuori. posizione delle due funzioni f e g e si scrive di solito
Questo, come vedremo nella prossima sezione, sta a h = f ◦ g, di modo che h(a) = (f ◦ g)(a) = g(f (a)),
fondamento dei numeri naturali, i numeri con i quali qualunque sia a ∈ A. Una osservazione importansi conta. E’ bene comunque avvertire che l’importan- te è che se f è una funzione biunivoca ed f −1 è la
za delle corrispondenze biunivoche non è limitata agli sua funzione inversa, allora f −1 (f (a)) = a per ogni
insiemi finiti. Ad esempio, la corrispondenza p = 2n a ∈ A, cioè f ◦ f −1 è la funzione identica su A, cioè
tra i numeri naturali N e i numeri pari P è chiara- la funzione che ad ogni elemento fa corrispondere sé
mente biunivoca e la sua inversa è n = p/2, che ha stesso. Spesso, tale funzione si indica con I ed f −1 si
senso perché p è pari. Questo ci dice che i numeri pari dice l’inversa composizionale di f .
sono tanti quanti sono tutti i numeri, il che appare
Un insieme interessante di funzioni è costituito dai
assurdo poiché P è propriamente contenuto in N. Ma predicati. Un predicato su un insieme A è una fun-
1.3. FUNZIONI E OPERAZIONI
zione p : A → {0, 1}. Ad esempio, la funzione
p : N → {0, 1} definita da:
½
p(n) = 1
se n è pari
p(n) = 0
se n è dispari
è un predicato. L’importanza dei predicati (su A)
sta nel fatto che essi costituiscono un meccanismo
matematico per parlare delle proprietà degli elementi
di A; nell’esempio, la proprietà è: “il numero n è
pari”. Di regola, si interpreta 1 come “vero” e 0 come
“falso”, cosı̀ che p(10) = 1 significa “il numero 10 è
pari”, mentre p(51) = 0 vuol dire “il numero 51 non
è pari”.
Dato un insieme S e l’insieme P(S) delle sue parti,
i predicati su S corrispondono ai sottoinsiemi di S.
Se infatti A ⊆ S, il predicato χA : S → {0, 1} definito
da:
½
χA (x) = 1
se x ∈ A
χA (x) = 0
se x 6∈ A
19
in particolare, per i predicati su A si scrive 2A , dove il “2” sta a significare l’insieme di due elementi
B = {0, 1}. Vista la corrispondenza tra i predicati su A e i sottoinsiemi di A, spesso si indica con la
stessa notazione 2A l’insieme delle parti di A, cioè
P(A). Ritorneremo in diverse occasioni sulle cose
appena dette, quando parleremo di cardinalità (si veda la Sezione 1.4), di calcolo combinatorio (vedere la
Sezione 4.1), di calcolo delle proposizioni (nella Sezione 4.6); ma questi concetti sono pervasivi di tutta
la Matematica.
Un caso particolarmente importante di funzione è
dato dalle operazioni; si consideri ad esempio la somma tra numeri naturali; essa associa ai numeri 3 e 5 il
numero 8; si scrive 3+5 = 8 e pertanto siamo di fronte a una funzione che chiameremo S e che ha come
dominio il prodotto cartesiano N × N, cioè le coppie
di numeri naturali, e per codominio lo stesso N. Si
scrive pertanto: S : N × N → N, ed m + n al posto
di S(m, n). La stessa cosa si può dire del prodotto
P : N × N → N, ove P (n, m) = n × m. Si osservi
invece che la differenza e la divisione non sono funzioni nel senso detto: infatti, alla coppia (3, 5) non
corrisponde alcun numero naturale 3 − 5, né alcun
numero naturale 3/5. In effetti, i numeri interi, cioè
i numeri con il segno, sono stati introdotti per rendere la sottrazione una funzione, cioè un’operazione
sempre eseguibile, e i numeri razionali per rendere la
divisione una funzione. Purtroppo, in quest’ultima
operazione, come si sa, c’è un caso che non si risolve,
e cioè la divisione per zero; a parte questo, nei numeri
razionali è sempre possible fare a/b.
Le operazioni non hanno sempre necessariamente
due argomenti come le quattro operazioni di base,
cioè addizione, sottrazione, moltiplicazione e divisione. Esistono operazioni con un solo argomento, come
la radice quadrata, il cambiamento di segno o il valore assoluto. Si possono inventare operazioni con tre
argomenti come logb (x + y), o anche a quattro come:
ax /by , e cosı̀ via. Allora:
identifica univocamente il sottoinsieme A: il sottoinsieme definisce il predicato e dal predicato si ricava
l’insieme senza alcuna ambiguità. Il predicato χA si
dice la funzione caratteristica di A (in S) e per la precedente osservazione possiamo dire che esistono tanti
sottoinsiemi di S quante sono le possibili funzioni caratteristiche su S. L’insieme vuoto corrisponde alla
funzione caratteristica fatta tutta di 0 (la funzione
costante 0); S, come sottoinsieme di sé stesso, ha come funzione caratteristica quella fatta tutta di 1 (la
funzione costante 1).
Supponiamo che gli insiemi A e B contengano,
rispettivamente, n ed m elementi; poniamo allora
A = {a1 , a2 , . . . , an } e B = {b1 , b2 , . . . , bm }. Una
funzione f : A → B è definita quando assegniamo a
ciascun elemento di A il corrispondente elemento di
B. Cosı̀, ad a1 possiamo assegnare uno qualsiasi degli
m elementi di B; si hanno perciò m possibilità. Ad
a2 possiamo associare ancora uno qualunque degli m
elementi di B, e quindi abbiamo m2 possibili associazioni. Continuando nello stesso modo, vediamo che
anche ad an si possono associare m immagini distinte
• le operazioni con un solo argomento, come |x|, si
e in tutto si hanno m × m × · · · × m = mn distinte
dicono monadiche;
funzioni di A in B. Ad esempio, se A = {a, b, c} e
B = {0, 1}, le funzioni di A in B, cioè in questo caso
• le operazioni con due argomenti, come x + y, si
i predicati su A, sono 23 = 8 e possono essere elendicono binarie o diadiche;
cati usando la notazione funzionale, che riporta nella
• le operazioni con tre argomenti, come logb (x+y)
riga superiore gli elementi di A e in quella inferiore
si dicono ternarie o triadiche;
le rispettive immagini:
µ
¶ µ
¶ µ
¶ µ
¶
a b c
a b c
a b c
a b c
e cosı̀ via. Il numero di argomenti di una operazione
0 0 0
0 0 1
0 1 0
0 1 1
si dice la sua arietà o adicità.
µ
¶ µ
¶ µ
¶ µ
¶
La notazione delle operazioni si è sviluppata dal
a b c
a b c
a b c
a b c
1500 ad oggi in modo abbastanza caotico; essa con1 0 0
1 0 1
1 1 0
1 1 1
tinua ad evolversi perché alcune parti della MatemaDa queste osservazioni discende la notazione B A tica usano ancora notazioni ad hoc, scelte in manieper indicare l’insieme di tutte le funzioni di A in B; ra piuttosto casuale, dettate spesso da considerazioni
20
CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA
estetiche piuttosto che razionali. Per le operazioni
monadiche due sembrano essere i tipi di notazione
più ragionevoli; di gran lunga da preferire è la notazione prefissa o funzionale, nella quale il segno di
operazione precede l’argomento; cosı̀ la negazione è
−x, la negazione logica ¬p e si scrive cos(x) per il
coseno di x e ln(x) per il logaritmo naturale. Meno
usata è la notazione postfissa, come n! per il fattoriale, e la fantasia dei matematici si è sbizzarrita
a
√
cercare segni e disposizioni più originali: x indica
la radice quadrata, |x| il valore assoluto, ex l’esponenziale, Ai l’indiciamento, A il complemento, e chi
più ne ha, più ne metta. Per le operazioni diadiche
la forma più usata è quella infissa: a + b, a/b, A ∪ B
e via di seguito; molto usata è anche in questo caso la notazione prefissa o funzionale, adottata come
standard nei linguaggi di programmazione, fatta eccezione per le operazioni di base: MCD(m, n). Ma
anche per le √
operazioni binarie
¡ ¢lo sfoggio di fantasia
è notevole: n x, logb (x), an , nk , e tante altre. Fortunatamente, infine, per le operazioni con più di due
argomenti, la notazione funzionale è canonica, anche
perché è difficile trovare una notazione più compatta.
Le operazioni possono godere (o non godere) di
particolari proprietà e possono possedere (o non possedere) particolari elementi che le caratterizzano.
Diamo qui un elenco delle principali proprietà e dei
più importanti elementi speciali, supponendo che le
operazioni siano definite su un insieme A:
dono di questa proprietà nei confronti dell’altra
operazione;
5. un’operazione binaria x ⊙ y è distributiva rispetto a un’altra operazione binaria x ⋄ y se
per ogni terna di elementi x, y, z ∈ A si ha:
x⊙(y⋄z) = (x⊙y)⋄(x⊙z); come si sa, il prodotto
è distributivo rispetto alla somma e alla sottrazione; l’unione e l’intersezione sono distributive
una rispetto all’altra;
6. un’operazione binaria x ⊙ y è idempotente se per
ogni elemento x ∈ A si ha x ⊙ x = x. L’operazione di Massimo Comun Divisore è idempotente perché MCD(n, n) = n; nessuna delle quattro
operazioni di base è tale.
7. data un’operazione binaria x ⊙ y, si dice che un
elemento e ∈ A è una identità per l’operazione se
e ⊙ x = x ⊙ e = x, per ogni elemento x ∈ A. Lo 0
è l’identità per la somma e l’1 lo è per il prodotto.
Poiché si ha x − 0 = x, ma 0 − x = −x, lo 0 non è
identità per la sottrazione; talvolta, per mettere
in evidenza la prima uguaglianza, si dice che 0 è
un’identità destra per la sottrazione;
8. data un’operazione binaria x ⊙ y, si dice che un
elemento z ∈ A è uno zero per l’operazione se si
ha z ⊙ x = x ⊙ z = z, per ogni elemento x ∈ A.
Lo 0 è uno zero per la moltiplicazione e uno zero
sinistro per la divisione;
1. un’operazione binaria x ⊙ y è chiusa se, qualunque siano gli elementi x, y ∈ A, il risultato dell’o- 1.4
Il contare
perazione è ancora un elemento di A. La somma
e il prodotto in N sono operazioni chiuse, mentre Una delle attività di base dell’uomo è il contare. Connon lo sono la sottrazione e la differenza; come tare significa associare agli elementi di un insieme una
s’è detto, né 3 − 5, né 3/5 sono numeri naturali; successione di parole convenzionali: uno, due, tre,
quattro, . . .. Il numero degli elementi di un insieme
2. un’operazione binaria x⊙y è commutativa se per
è il nome al quale si arriva quando tutti gli elemenogni coppia di elementi x, y ∈ A si ha x⊙y = y ⊙
ti sono stati esauriti. Idealmente, e talvolta anche
x. Addizione e moltiplicazione sono operazioni
praticamente, man mano che contiamo spostiamo gli
commutative; sottrazione e divisione non lo sono;
elementi dell’insieme in un altro insieme, in modo da
3. un’operazione binaria x ⊙ y è associativa se distinguere quelli già considerati da quelli che ancora
per ogni terna di elementi x, y, z ∈ A si ha devono essere contati. In tal modo non si fanno con(x ⊙ y) ⊙ z = x ⊙ (y ⊙ z), cioè l’ordine di ese- fusioni e si determina facilmente quando il conteggio
cuzione dell’operazione non è essenziale (si noti è terminato.
In questa maniera, noi instauriamo una corrisponche la proprietà commutativa si riferisce all’ordine degli elementi; la proprietà associativa al- denza biunivoca tra gli elementi da contare e i numel’ordine delle operazioni). Di nuovo, addizione e ri: come abbiamo osservato nella sezione precedente,
moltiplicazione sono esempi positivi, sottrazione è proprio l‘esistenza di una corrispondenza biunivoca
che ci permette di dire che gli oggetti di un insieme
e divisione negativi;
sono tanti quanti gli elementi di un altro insieme. Ora
4. un’operazione binaria x ⊙ y gode della proprietà possiamo dire anche qualcosa di più: se due insiemi
di assorbimento rispetto all’operazione x ⋄ y se si hanno lo stesso numero di elementi, allora è possibiha: x ⊙ (y ⋄ x) = x qualunque siano i due ele- le trovare tra di essi una corrispondenza biunivoca.
menti x, y ∈ A. Come abbiamo visto, le due ope- Infatti, dire che hanno lo stesso numero di elemenrazioni di unione ed intersezione tra insiemi go- ti significa che esiste una corrispondenza biunivoca
21
1.4. IL CONTARE
tra ciascun insieme e l’insieme dei numeri che hanno
permesso di contarli; se facciamo corrispondere gli
elementi contati dallo stesso numero, abbiamo la corrispondenza biunivoca cercata. Non è detto che essa
sia la sola, ma ci basta di essere convinti che: due insiemi (finiti) hanno lo stesso numero di elementi se e
solo se esiste tra di essi una corrispondenza biunivoca.
I numeri che servono per contare si dicono numeri
naturali: zero, uno, due, tre, quattro, . . .. Osserviamo esplicitamente che lo zero conta gli elementi
dell’insieme vuoto (quante caramelle ci sono in un
sacchetto vuoto?) e pertanto va considerato come
uno dei numeri naturali. L’insieme dei numeri naturali si indica con N. Essi costituiscono uno dei mattoni fondamentali della Matematica, anzi, come ha
dimostrato Peano (1858 – 1932) tutta la Matematica
che conosciamo può essere fondata su una assiomatizzazione dei numeri naturali. Vedremo più avanti
qualcosa a questo proposito, anche se tali argomenti vanno un po’ oltre l’impostazione elementare che
vogliono avere queste note.
Nota 1.4
Il resto della sezione è costituito da
questa lunga nota, nella quale vogliamo riportare l’impostazione moderna del “contare”, che ha permesso di
superare, in modo costruttivo e rigoroso, la barriera
del “finito” nel ragionamento matematico. Le idee di
base di tale impostazione sono dovute al matematico
George Cantor (1845 – 1918), nato a San Pietroburgo da una famiglia danese, ma vissuto in Germania
dall’età di undici anni; la sua opera fu inizialmente
osteggiata, tanto da acuire la sua innata debolezza
psicologica e da costringerlo a passare buona parte
della vita in manicomio, dove morı̀.
Cantor partı̀ dal concetto intuitivo di insieme, come
anche noi l’abbiamo visto, e dal concetto di corrispondenza biunivoca, che permette di associare gli elementi di due insiemi diversi: egli chiamò equipotenti due
insiemi A e B tra i quali è possibile istituire una corrispondenza biunivoca; si scrive allora A ∼
= B. Abbiamo
già osservato che, per gli insiemi finiti, questo significa proprio che gli insiemi hanno lo stesso numero di
elementi. Tuttavia, ciò che ha di interessante l’impostazione di Cantor è questo: il concetto di equipotenza
non si basa su un’indefinita idea di numero data a priori, ma solo sui concetti di insieme e di corrispondenza
che sono sicuramente a un livello più basso di quello di
numero. Infatti, tali concetti fanno riferimento, anche
se in modo completamente astratto, a idee singolari,
come a singoli oggetti (elementi) o a loro raggruppamenti in insiemi singolari o ad associazioni specifiche
tra insiemi. Viceversa, l’idea di numero ha a che vedere con un’astrazione a livello superiore: il numero 4
si riferisce a tutti gli insiemi che hanno 4 elementi, e
sarebbe assurdo che ci riferissimo a certi insiemi di 4
elementi (quelli ad esempio di cui abbiamo esperienza
diretta) e non ad altri. Quello che vogliamo è proprio
questo: che il numero 4 conti anche insiemi che non
conosciamo o con i quali mai avremo a che fare, come
i 4 cavalieri dell’Apocalisse o i 4 angoli dell’Universo
al di là di tutte le galassie conosciute. La definizione
di numero cardinale proposta da Cantor, e che ora vedremo, cerca di cogliere proprio questo ulteriore livello
di astrazione
E’ facile vedere che la relazione di equipotenza è in
effetti una relazione di equivalenza. La proprietà riflessiva vale in quanto la funzione identica, cioè la funzione I : A → A definita da I(a) = a qualunque
sia a ∈ A, è certamente biunivoca; ciò significa che
A∼
= A. Se f : A ↔ B è una corrispondenza biunivoca
tra A e B, abbiamo già osservato come la sua inversa
f −1 : B ↔ A sia anch’essa biunivoca; vale pertanto la
proprietà simmetrica: A ∼
= B implica B ∼
= A. Infine,
se A ∼
=B eB∼
= C, esistono due corrispondenze biunivoche f : A ↔ B e g : B ↔ C; la loro composizione
è una funzione biunivoca fra A e C, il che significa
A∼
= C, e ciò dimostra la proprietà transitiva. Come
ormai sappiamo, dato un insieme A, la sua classe di
equivalenza [A] è costituita da tutti gli insiemi equipotenti ad A. Definiamo allora la cardinalità o potenza
di un insieme A la classe [A] di tutti gli insiemi ad
esso equipotenti. Tale classe si indica con card(A).
Leggendo o ascoltando questa definizione si ha spesso
la sensazione del gioco di parole; ma non è cosı̀ e anzi
è bene capirne il senso veramente profondo. Riunire in un unico insieme (o classe) tutti gli insiemi con
4 elementi (cioè equipotenti a un qualsiasi insieme di
4 elementi) è un’operazione concettuale che possiamo
fare agevolmente (anzi, troppo agevolmente, tanto da
arrivare facilmente a qualche paradosso, come osservò
Russell alcuni anni dopo la formulazione di Cantor)
e che dà un senso a quello che prima dicevamo sul
concetto di numero. Questa classe contiene insiemi i
più disparati e che, per la stessa definizione, possiamo anche non conoscere o non immaginare; ciò che li
caratterizza è solo il numero dei loro elementi, quella
corrispondenza biunivoca che ci dice: sı̀, questo insieme è equipotente a quello assegnato o considerato.
Ecco allora che la classe è identificata e (in realtà, dal
punto di vista in cui ci siamo messi) identifica il numero di elementi dei suoi insiemi. Ora, la proprietà
che abbiamo osservato, e cioè che esiste una corrispondenza biunivoca tra due insiemi se e solo se essi hanno lo stesso numero di elementi, non è più qualcosa
da intuire o da dimostrare: è giusto la definizione di
cardinalità e quindi di numero.
Possiamo ora definire alcune operazioni sulle cardinalità. Prima di tutto, date due cardinalità card(A) e
card(B), la loro somma è definita come la cardinalità
dell’unione disgiunta A ⊎ B, cioè:
card(A) + card(B) = card(A ⊎ B).
Ciò è fatto generalizzando quello che avviene tra gli
insiemi finiti; il numero degli elementi di A ∪ B non
coincide con la somma degli elementi di A con quelli
di B, basta che A e B abbiano qualche elemento in
comune, cioè non siano disgiunti. L’unione disgiunta,
invece, funziona bene e corrisponde al nostro concetto
22
CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA
intuitivo di somma: mettere assieme gli elementi dei
due insiemi senza confondere gli uni con gli altri.
Anche la moltiplicazione è definita generalizzando il
caso degli insiemi finiti. Quando abbiamo introdotto
il prodotto cartesiano A × B, abbiamo osservato che il
numero delle coppie che si formano è dato da m × n,
se m ed n sono il numero degli elementi di A e di B.
Si definisce allora:
card(A) × card(B) = card(A × B),
cioè, il prodotto di due cardinalità è dato dalla cardinalità del prodotto cartesiano di due insiemi, uno
appartenente a card(A) e l’altro a card(B) (in concreto, possiamo prendere gli stessi insiemi A e B).
E’ bene osservare che le definizioni che stiamo dando,
non dipendono dagli insiemi A e B usati; sfruttando la corrispondenza biunivoca che è implicita nella
definizione di cardinalità, si dimostra che, cambiando
insiemi, non si cambia il risultato. Il lettore, al solito,
è invitato a provare formalmente queste affermazioni.
L’ultima operazione è l’elevamento a potenza. Abbiamo visto che il numero delle possibili funzioni da un
insieme A (finito e con n elementi) a un insieme B
(finito e con m elementi) è dato da mn . Definiamo
allora:
card(B)card(A) = card(B A ),
cioè come la cardinalità dell’insieme delle funzioni da
A in B.
Il termine “cardinalità”, pur riferendosi all’espressione classica di numero cardinale che designa i numeri
naturali, ha l’ambizione di inglobare un concetto più
generale che comprenda anche gli insiemi infiniti. Una
definizione precisa di insieme infinito non è banale; intuitivamente, possiamo dire che se da un insieme togliamo man mano un elemento, allora, nel caso di un
insieme finito, prima o poi rimarremo senza elementi
(cioè, l’insieme si riduce a ∅); viceversa, se l’insieme è
infinito potremo andare avanti in tale processo senza
mai ridurci a ∅.
Queste idee portarono Cantor a proporre questa costruzione; sia A un insieme infinito secondo la precedente intuizione; prendiamo un elemento a0 ∈ A e togliamolo da A ottenendo A \ {a0 }; poiché A è infinito,
A\{a0 } non è vuoto, e quindi possiamo scegliere un altro elemento a1 ∈ A \ {a0 } e considerare A \ {a0 , a1 }.
Anche questo insieme non è vuoto, e quindi possiamo scegliere un nuovo elemento a2 ∈ A \ {a0 , a1 }.
Cosı̀ procedendo, si ottiene una successione infinita
{a0 , a1 , a2 , . . .} contenuta in A e composta da elementi tutti distinti. Tale sequenza è equipotente ad N
poiché la banale corrispondenza biunivoca è ai ↔ i,
per ogni i ∈ N. Allora, possiamo dire che un insieme
è infinito se e solo se contiene un sottoinsieme equipotente ad N, l’insieme dei numeri naturali. Questa
può essere assunta come definizione di insieme infinito,
poiché (sempre da un punto di vista intuitivo) è chiaro
che da un insieme finito non si potrà mai estrarre una
successione infinita di elementi distinti.
Questa definizione è, quindi, ragionevole e osserviamo
subito che essa ci suggerisce due considerazioni notevoli: primo, l’insieme N viene ad assumere il ruolo
molto importante di “pietra di paragone”, in quanto ogni altro insieme verrà classificato finito o infinito
solo per confronto con N; questo consacra N come insieme infinito per eccellenza, quello di cui si può dire:
ecco un insieme infinito di cui siam certi di quello che
è. Vorrei ricordare che l’essere N infinito si basa su un
criterio di “scommessa”: vuoi scommettere che se tu
dici un numero, io son capace a dirne uno più grande? E sappiamo bene che se l’avversario dice un n
qualsiasi, noi possiamo dire n + 1.
Il secondo fatto notevole è che, dalla definizione, discende che N è, in un certo senso, il più piccolo degli
insiemi infiniti, in quanto ogni altro insieme infinito
A viene a contenere un sottoinsieme che è l’immagine di N, quella successione {a0 , a1 , a2 , . . .} che siamo
riusciti a cavarne fuori. Certo, può succedere che la
successione esaurisca tutto A, ma la cosa non cambia,
perché allora A sarà equipotente ad N.
Data questa minimalità di N, Cantor propose di assegnare un simbolo speciale alla sua cardinalità, che
è la più piccola delle cardinalità degli insiemi infiniti.
A questo punto non sappiamo se esistono altre cardinalità di insiemi infiniti, ma ci proponiamo in seguito
di dimostrare che questo è proprio il caso. Allora, per
il momento, chiamiamo ℵ0 (Alef con zero, dove Alef
è la prima lettera dell’alfabeto ebraico) la cardinalità
di N e diciamo transfinite le cardinalità degli insiemi
infiniti: per ribadire quanto detto, ciò che sappiamo
al momento attuale della nostra esposizione è che ℵ0
è l’unica o la più piccola della cardinalità transfinite. Un insieme si dice numerabile se è equipotente ad
N, cioè ha cardinalità ℵ0 , che pertanto si dice anche
cardinalità del numerabile.
Viene qui naturale fare un esempio: consideriamo P,
l’insieme dei numeri pari; chiaramente P ⊂ N e P è
infinito: come si conciliano le due cose? In realtà il
problema ha una semplice soluzione: ad ogni numero
naturale k associamo il numero pari 2k; otteniamo cosı̀
la successione {a0 , a1 , a2 , . . .} dove ak = 2k e quindi:
P è infinito e P è in corrispondenza biunivoca con N,
anche se è propriamente contenuto in tale insieme. Ma
non aveva detto Aristotele che una parte è minore del
tutto? Qui, una parte propria, P, è equipotente al tutto. Duecentocinquanta anni prima di Cantor, Galileo
aveva osservato che esiste una corrispondenza biunivoca tra i numeri naturali e i quadrati perfetti, che si
rarefanno sempre di più al crescere di n. Da questo,
però, non era riuscito a dedurre altro che “non solamente non si possa dire di un infinito esser maggiore
di un altro infinito, ma né anco che e’ sia maggiore di
un infinito”. Cantor fece vedere che le cose non stanno nemmeno cosı̀ e che, in questo campo, Aristotele si
sbagliava.
Egli dimostrò addirittura che un insieme è infinito se e
solo se è equipotente a una sua parte propria. La prova
è quasi banale: se l’insieme A è infinito, estraiamone
23
1.4. IL CONTARE
la successione S = {a0 , a1 , a2 , . . .} e sia B l’insieme
(eventualmente vuoto) degli elementi che rimangono,
cioè sia A = S ⊎ B. Consideriamo ora A′ = A \ {a0 }
e vediamo che A e A′ sono equipotenti. L’ovvia corrispondenza biunivoca è la seguente: ad ogni elemento
di B (in A) facciamo corrispondere sé stesso in A′ e ad
ogni elemento ak della successione facciamo corrispondere ak+1 . Ma A′ ⊂ A (propriamente) e la prima parte
della prova è fatta. Viceversa, se A è finito e A′ ⊂ A,
sappiamo che A′ ha meno elementi di A e i due insiemi
non possono essere messi in corrispondenza biunivoca
tra di loro.
Abbiamo cosı̀ una seconda caratterizzazione degli insiemi infiniti, che ci rende conto di varie anomalie che
essi hanno nei confronti dei più usuali insiemi finiti.
Una tale proprietà, tuttavia, potrebbe indurci a pensare che sia possibile mettere in corrispondenza biunivoca due insiemi infiniti qualsiasi: se un insieme è
equipotente a un suo sottoinsieme, possiamo immaginare l’insieme “più piccolo” come sottoinsieme di
quello “più grande” e cercare una corrispondenza biunivoca (analoga a quella appena vista) per dimostrare questo fatto. Una serie di risultati sembrerebbe
confermare tale ipotesi:
1. se ad un insieme infinito A si aggiunge un insieme finito B = {b1 , b2 , . . . , bk }, quello che si
ottiene è un insieme equipotente ad A. Sia
S = {a0 , a1 , a2 , . . .} la solita successione tratta da A e sia D = A \ S. La corrispondenza
biunivoca che ad ogni elemento di D fa corrispondere sé stesso e per la quale: a0 ↔ b1 , a1 ↔
b2 , . . . , ak−1 ↔ bk , ak ↔ a0 , . . . , ak+h ↔ ah , . . .,
prova la nostra affermazione. Se l’insieme A
è numerabile, in termini di cardinalità, questo
risultato si esprime con la formula: ℵ0 + k = ℵ0 ;
2. se A e B sono due insiemi numerabili, allora
A ⊎ B è equipotente ad A. Dire che A è numerabile significa che gli elementi di A sono ordinabili in una successione A = {a0 , a1 , a2 , . . .} per
la quale k ↔ ak , per ogni k ∈ N. Analogamente B = {b0 , b1 , b2 , . . .}. Allora la corrispondenza
biunivoca tra A ⊎ B ed N è (per ogni k ∈ N): se
k = 2h è pari k ↔ ah , e se k = 2h + 1 è dispari
k ↔ bh . Questo fatto si esprime con la formula:
ℵ0 + ℵ0 = ℵ0 ;
3. se A e B sono due insiemi numerabili, allora il
loro prodotto cartesiano A×B è anch’esso numerabile. Siano A e B come prima e disponiamo gli
elementi di A × B in una matrice infinita come
nella Figura 1.3. Il cammino segnato è la corrispondenza biunivoca tra A × B ed N. Questo
fatto si esprime con la formula: ℵ0 × ℵ0 = ℵ0 .
Ma allora, ci chiediamo, esistono davvero cardinalità
transfinite più grandi di ℵ0 ? Apparentemente, dai tre
casi precedenti, sembra che con le normali operazioni
non si esca fuori del campo del numerabile. Ma Cantor dimostrò che di cardinalità transfinite ne esistono
quante se ne vuole.
(a0 , b0 )
↓
(a0 , b1 )
(a0 , b2 )
↓
(a0 , b3 )
(a1 , b0 )
↑
(a1 , b1 )
→
←
(a1 , b2 )
←
→
(a1 , b3 )
→
→
(a2 , b0 )
↓
(a2 , b1 )
↓
(a2 , b2 )
(a2 , b3 )
→
(a3 , b0 )
↑
(a3 , b1 )
↑
(a3 , b2 )
↑
(a3 , b3 )
→
Figura 1.3: Scorrimento di una matrice infinita
Teorema 1.1 (di Cantor) Sia A un insieme qualsiasi e sia P(A) l’insieme di tutti i sottoinsiemi
(le parti) di A; allora, la cardinalità di P(A) è
strettamente maggiore della cardinalità di A.
Prova: La dimostrazione è un classico della Matematica e consiste nel far vedere che: 1) A è equipotente ad un sottoinsieme di P(A), cioè che card(A) ≤
card(P(A)); 2) che P(A) non è equipotente ad A,
e quindi card(A) 6= card(P(A)), cioè card(A) <
card(P(A)). La prima parte della dimostrazione è ovvia, poiché ogni elemento a ∈ A si fa corrispondere
al sottoinsieme {a} ∈ P(A). Per la seconda parte,
supponiamo che esista una corrispondenza biunivoca
ψ tra A e P(A), cioè ψ(a) ⊆ A, per ogni a ∈ A.
Dato a ∈ A, ψ(a) potrà contenere a oppure no; ad
esempio, se ψ(a′ ) = ∅ allora a′ 6∈ ψ(a′ ); se invece
ψ(a′′ ) = A, allora certamente a′′ ∈ ψ(a′′ ). Possiamo
quindi dividere gli elementi di A in due sottoinsiemi:
P = {x ∈ A | x ∈ ψ(x)}, gli elementi “positivi”,
ed N = {x ∈ A | x 6∈ ψ(x)}, gli elementi“negativi”.
Poiché si suppone che ψ sia biunivoca, deve esistere
un elemento b ∈ A tale che ψ(b) = N , e quindi dovrà essere b ∈ N oppure b 6∈ N . Ma se b ∈ N , per
definizione di N deve essere b 6∈ ψ(b) = N , il che è
chiaramente assurdo. D’altra parte, se fosse b 6∈ N ,
cioè b 6∈ ψ(b), per la definizione di N dovremmo avere
b ∈ N , il che è di nuovo assurdo. Ma questi sono gli
unici casi possibili, e quindi ψ non può esistere.
Il lettore avrà notato l’analogia di questo ragionamento con il paradosso di Russell, ma questa volta
l’argomentazione è corretta e la conclusione del teorema è vera. Questo risultato permette di “costruire”
insiemi di cardinalità grande quanto si vuole. Si parte
con N che ha cardinalità ℵ0 e si considera l’insieme
delle parti di N, cioè N1 = P(N). La cardinalità di N1
è strettamente maggiore di quella di N e si indica con
ℵ1 (questo spiega finalmente la presenza dello strano
indice). Si prende poi N2 = P(N1 ) la cui cardinalità
è ℵ2 > ℵ1 , e cosı̀ si può continuare quanto si vuole.
Vedremo, quando avremo introdotto i numeri reali,
che la loro cardinalità è strettamente maggiore di ℵ0 .
Tale cardinalità si indica con c e si dice la cardinalità
del continuo. Si dimostra che c = ℵ1 > ℵ0 e ci si può
porre la domanda se esistono insiemi di cardinalità
compresa tra ℵ0 e ℵ1 (o, in generale, tra ℵn e ℵn+1 ).
Abbastanza stranamente, nel 1963, Paul Cohen ha
24
CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA
dimostrato che non si può dimostrare né che una tale
cardinalità intermedia esista, né che non esista.
1.5
Rappresentazione dei numeri naturali
Il concetto di “contare”, come s’è visto, si esprime nel
linguaggio naturale mediante una serie di nomi convenzionali: uno, due, tre, quattro, . . . . Le regole per
la formazione dei nomi dei numeri sono abbastanza
semplici e permettono di esprimere una grande quantità di numeri come cento miliardi o settanta miliardi
di miliardi. Tuttavia, diventa estremamente difficile
dare nomi a numeri molto grandi come ad esempio al
prodotto dei primi cento numeri 1 × 2 × 3 × · · · × 100
che vale esattamente:
9332621544394415268169923885626670049071
5968264381621468592963895217599993229915
6089414639761565182862536979208272237582
51185210916864000000000000000000000000.
Inoltre, i nomi usuali tendono a diventare presto molto lunghi e per esprimere 7. 546. 732. 449 bisogna dire:
“sette miliardi, cinquecento quarantasei milioni, settecento trentadue mila, quattrocento quarantanove”,
un nome lungo 85 lettere, più del triplo del celebre
“precipitevolissimevolmente”. Queste considerazioni
hanno fatto sı̀ che molto presto si siano sviluppati
metodi formali per la rappresentazione dei numeri,
attraverso simboli opportuni o ricorrendo alle lettere
dell’alfabeto. A tutti è nota la numerazione romana,
che aveva l’inconveniente di essere inadeguata per i
numeri molto alti e nessuno si sognerebbe mai di tentare di scrivere il risultato del precedente prodotto in
quella notazione; già per esprimere 12. 000 si doveva
scrivere XIIM e a scrivere milioni non ci si pensava
nemmeno. Inoltre, la numerazione romana aveva il
difetto di usare ogni simbolo con un significato univoco: X indica il 10 sia nell’espressione LXXI quanto
in MCCCXXIV, quanto infine in XCIV (questa notazione “in sottrazione” fu introdotta solo nel Rinascimento; i Romani scrivevano LXXXXIIII). Questo
limita molto l’espressività della notazione, se si confronta con la nostra, dove la cifra 6 indica sei unità se
sta da sola, ma indica sessanta in 63, seicento in 1647
e sei milioni nel numero che prima abbiamo espresso in italiano. Nell’antichità, apparentemente, solo i
Babilonesi avevano sviluppato una notazione analoga
alla nostra, anche se, misteriosamente, avevano scelto
come base di riferimento il 60 invece del 10, che a noi
sembra cosı̀ naturale.
In effetti, la scelta della base 10 non è cosı̀ universale come ci può apparire. Essa è legata, quasi
sicuramente, al fatto che abbiamo dieci dita, ma per
la stessa ragione si conoscono numerazioni in base 5
(si considera una sola mano; la V dei romani rappresentava la mano aperta) e in base 20 (mani e piedi),
come è ben noto dal modo francese di esprimere 80:
“quatre-vingt”, e 90: “quatre-vingt dix”. La nostra
notazione viene dal mondo arabo occidentale, e perciò
le 10 cifre che usiamo si dicono cifre arabiche. A loro
volta, gli arabi avevano importato la loro notazione
dall’India verso l’800 d.C., e dal mondo arabo prima
Gherardo da Cremona e poi Leonardo Fibonacci l’avevano diffusa in Europa verso il 1200. Tuttavia, fino
al 1600 la notazione arabica rimase limitata al mondo del commercio e della finanza, mentre nel mondo accademico e scientifico continuò a dominare la
notazione romana.
La possibilità di esprimere in modo (abbastanza)
sintetico anche numeri molto grandi non è però l’unico merito, o il principale, della notazione arabica:
quello che la rende insostituibile è il fatto che essa
permette di eseguire le operazioni di base (addizione, sottrazione, moltiplicazione, divisione e confronto) direttamente sulla rappresentazione dei numeri.
Nell’antichità, contare e fare di conto erano operazioni avulse l’una dall’altra, almeno dal punto di vista
tecnico. Contare consisteva nell’assegnare un nome
convenzionale (o un simbolo) a una quantità di interesse; tale nome o simbolo non era però utilizzato
per fare le somme, per le quali si ricorreva a strumenti come l’abaco o, in mancanza di meglio, a pietruzze o sassolini disposti su varie righe. Ricordiamo, a
questo proposito, che la nostra parola “calcolo” deriva appunto dal termine latino “calculus” che significa “sassolino”. Leonardo Fibonacci nella sua opera
“Liber Abaci” non solo introduce la notazione arabica, ma mostra come con essa sia possibile effettuare le quattro operazioni fondamentali, grosso modo
con le regole che ancor oggi impariamo nelle prime
classi delle scuole elementari e che costituiscono il
nostro “saper far di conto”. Fibonacci chiamò algorismi (dal nome del matematico arabo al-Khuwarizmi,
morto verso l’850 d.C.) queste regole e per secoli l’espressione “apprendere gli algorismi” ha significato
“imparare a far di conto”.
Nota 1.5
Come abbiamo accennato, la notazione
arabica fu “snobbata” dal mondo accademico e scientifico fino al 1600, in quanto il calcolo (detto logistica
e contrapposto all’Aritmetica) era considerato una
disciplina pratica e non liberale, cioè facente parte
del Trivio (Grammatica, Dialettica, Retorica) o del
Quadrivio (Aritmetica, Geometria, Musica, Astronomia). Questo rallentò indubbiamente lo sviluppo
della scienza legata agli aspetti algebrico-formali.
Cosı̀ non era raro trovare notevoli scienziati che,
letteralmente, non sapevano fare i conti. Lo stesso
Galileo non aveva molta dimestichezza con il calcolo,
anche se aveva inventato uno speciale compasso per
1.5. RAPPRESENTAZIONE DEI NUMERI NATURALI
l’esecuzione di conti approssimati. Le sue opere fanno
scarsi riferimenti ai numeri, e in questo differiscono
in modo straordinario dai lavori di Newton, che
è di poco posteriore, essendo nato l’anno stesso
della morte di Galileo (a sua volta questi, guarda
caso, era nato l’anno in cui morı̀ Michelangelo).
Galileo non si sognò mai di dire che la Natura fosse
un libro scritto in caratteri numerici (a lui poco
familiari), ma dichiarò anzi che tale libro era “scritto
in forma di triangoli, quadrati, cerchi” e altre figure
geometriche. All’opposto, commercianti e banchieri
del 1200 capirono subito l’importanza dell’opera di
Fibonacci, e la supremazia in Europa della Toscana in
questi settori fu in parte dovuta alla superiorità degli
“algorismi” sugli altri metodi di calcolo. Quando,
nella prima metà del 1300 “aveva in Firenze circa
XXV M d’uomini da portare armi da XV in LXX
anni,” riferisce Giovanni Villani nella “Nuova Cronica”, “I garzoni che stavano ad apprendere l’abaco
e l’algorismi in VI scole [erano] da M in MCC. E
quelli che stavano ad apprendere gramatica e loica in
IIII grandi scuole da DL in DC.” Quindi, i ragazzi
avviati a diventare contabili (come diremmo oggi)
erano il doppio di quelli avviati alle lettere o alle leggi.
La notazione arabica è una notazione posizionale
basata sul numero 10. Le dieci cifre arabiche 0, 1, 2,
3, 4, 5, 6, 7, 8, 9 assumono un valore diverso a seconda
della posizione che hanno nel numero. A partire da
destra, la prima è la cifra delle unità, poi c’è quella
delle decine, delle centinaia, delle migliaia e cosı̀ via.
Per essere esatti, se il numero n è rappresentato dalla
sequenza di cifre dr dr−1 . . . d1 d0 , allora il suo valore
è:
n = 10r × dr + 10r−1 × dr−1 + · · · + 10 × d1 + d0 .
Ad esempio, 3223 = 3 × 103 + 2 × 102 + 2 × 10 + 3.
La notazione decimale dei numeri ci è ormai diventata tanto familiare che non ne avvertiamo più l’aspetto di artificio, legato al fatto che abbiamo 10 dita.
Probabilmente, se come Paperino avessimo quattro
dita per mano, la base più naturale sarebbe stata 8.
Ma allora, ci possiamo chiedere, esiste una notazione
veramente naturale per i numeri? L’unica che può
rivendicare una qualifica del genere è la notazione
ad aste o a stecchini, cioè la notazione che rappresenta il numero n con n aste (o stecchini o qualsiasi
altro simbolo) disposte una dietro l’altra: il numero 7 sarebbe |||||||. In questa notazione, detta anche
numerazione primitiva, abbiamo veramente un accordo, cioè una corrispondenza biunivoca evidente, fra
ciò che vogliamo contare (seggiole, teste o stelle) e il
modo di rappresentare tale conteggio: ogni oggetto
un’asta, e viceversa.
Gli inconvenienti di questa notazione sono la lunghezza e l’illeggibilità. Provate a scrivere anche solo
25
157 e fatelo leggere a qualcuno che non sappia quale numero avete scritto, e vi accorgerete dell’utilità
della nostra rappresentazione decimale. Qual è allora il processo che sta dietro a tale notazione? Anche
questo lo abbiamo imparato alle scuole elementari.
Cominciamo col ricordare che esiste una notazione
convenzionale per i numeri piccoli: ad una sola asta
| associamo la cifra 1, a due aste || la cifra 2, e cosı̀
via fino a nove aste |||||||||, cui associamo la cifra 9.
Quando di aste non ve ne sono, indichiamo questo
fatto con la cifra 0.
Nota 1.6
Come abbiamo accennato, i Babilonesi
svilupparono una notazione posizionale, ancorché
basata sul numero 60. Purtroppo, la cifra 0 non
veniva considerata, di modo che 23 poteva indicare
tanto il numero 23 quanto il 203 o il 2003, e si doveva
capire dal contesto quale fosse l’interpretazione
corretta. Ciò rendeva questa notazione inutilizzabile
per eseguire i calcoli, e fu proprio su questo punto
che i Babilonesi fallirono. Quando fu riscoperto, lo
zero venne rappresentato da un tondino; si passò poi
a un semplice punto, e solo in seguito si è arrivati
all’attuale simbolo. Gli arabi usavano per lo zero
il nome “sifr”, che significa vuoto. Il termine fu
tradotto in latino con il termine zephyrum e da
questo sono derivate le parole “zero” e “cifra”.
Ecco allora che presentiamo il nostro primo
algoritmo:
Algoritmo 1.1 (Rappresentazione decimale)
Ingresso: Un numero n scritto nella notazione ad
aste;
Uscita: La rappresentazione decimale di n.
1. sia S l’insieme contenente le aste che rappresentano n;
2. se S è vuoto, rappresentiamo n con la cifra 0 e
usciamo;
3. altrimenti sia L una lista vuota;
4. se l’insieme S contiene meno di 10 aste, poniamo in testa ad L la cifra corrispondente al numero di aste di S; si esce e la sequenza ordinata delle cifre che si trovano in L è la rappresentazione
decimale del numero n;
5. altrimenti, raggruppiamo in sottoinsiemi di 10
aste tutte le aste di S;
6. se, arrivati alla fine dell’operazione di raggruppamento, è rimasto un gruppetto di k aste (k <
10) mettiamo in testa alla lista L la cifra corrispondente al numero k; se invece non è rimasto
nessun gruppetto, mettiamo la cifra 0 in testa ad
L;
26
CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA
7. eliminiamo l’eventuale gruppetto di k aste rimasto; estraiamo da ciascuno dei gruppi di 10 aste
un’unica asta e, con queste, formiamo un nuovo
insieme che chiamiamo ancora S;
8. si torna al punto 4.
Per il numero 34, il raggruppamento produce:
||||||||||
| {z }
||||||||||
| {z }
||||||||||
| {z }
||||,
La sequenza dei resti, letta da destra verso sinistra,
3245, dà la rappresentazione del numero in base 7.
Per le basi maggiori di 10, le cifre ulteriori si indicano
con le lettere dell’alfabeto: A = 10, B = 11, C = 12,
etc. Ad esempio, se si vuole esprimere 148710 in base
12 si ha:
1
4 8
2 8
4
1
7 1
1
7
1
2
2 3 1
0 3 1
3 1
2
0 1
0 0
2
per cui la prima cifra da porre in L è 4. L’estrazione
delle aste dai gruppi dà ||| e quindi la cifra 3 viene Questa volta la sequenza dei resti è 10, 3, 11, e quindi
posta in testa ad L che diviene (3, 4). A questo pun- 1487 = A3B .
10
12
to si è finito e in L si legge il numero 34, come c’era
da aspettarsi. Il lettore è invitato a immaginare quale
Nota 1.7
Nel caso che la base sia 2, le divisioni
semplificazione apporterebbe al precedente algoritmo
si fanno ad occhio e il resto è ovviamente 0 oppure 1
a seconda che il numero sia pari o dispari. L’impostal’idea di generalizzare il concetto di “raggruppare in
zione è allora la seguente e il numero in base 2 si legge
sottoinsiemi di 10 aste” per intendere che tale ragdal basso verso l’alto: 17810 = 101100102 :
gruppamento possa essere fatto (virtualmente) anche
quando le aste sono meno di 10.
178 0
Il metodo realizzato dall’algoritmo è del tutto ge89 1
nerale e chiaramente univoco; permette perciò di
44 0
formulare un risultato molto importante:
22 0
11
5
2
1
0
Teorema 1.2 Se dr dr−1 . . . d1 d0 è la rappresentazione decimale di un numero naturale n, allora tale
rappresentazione è unica.
L’algoritmo 1.1 ha un’importanza molto superiore alla sua apparente banalità, come cercheremo di
mettere ora in evidenza. La base 10, come s’è detto,
è in larga parte arbitraria; potremmo usare la base
7 e avere una diversa rappresentazione dei numeri.
In questo caso, ad esempio, dovremmo utilizzare 7
cifre, diciamo 0, 1, 2, 3, 4, 5, 6, e un numero come 3245 avrebbe per significato: 3 × 73 + 2 × 72 +
4 × 7 + 5 = 1029 + 98 + 28 + 5 = 1160. Si scrive anche 32457 = 116010 , se si vogliono mettere in
evidenza le basi ed evitare possibili confusioni. Analogamente, in base 2 si usano le sole cifre 0,1, dette
bit (in inglese: “BInary digIT”, cifre binarie), e un
numero come 10110112 ha come valore in base 10:
1 × 26 + 0 × 25 + 1 × 24 + 1 × 23 + 0 × 22 + 1 × 2 + 1 =
64 + 16 + 8 + 2 + 1 = 91. Queste osservazioni permettono di capire il significato di un numero scritto
in una base qualsiasi.
Viceversa, se vogliamo scrivere un numero come
1160 in base 7, basta procedere come stabilito dall’Algoritmo 1.1, utilizzando il 7 al posto del 10. In
pratica, il metodo si dice delle divisioni successive e
si imposta, appunto, come una serie di divisioni:
1 1
4
6 0 7
6
1
4 0
5
6 5
2 5
4
7
2 3
2
7
3 7
3 0
1
1
0
1
Anche la conversione inversa può essere resa più veloce
impostandola nel modo seguente: a partire da destra,
si scrivono, sotto ogni cifra del numero binario di partenza, le potenze di due a partire da 20 = 1. Questo
si fa raddoppiando ad occhio ogni volta il numero precedente (cioè, quello sulla destra). Alla fine, si sommano, sempre a mente, i numeri che stanno sotto i bit
uguali ad 1.
1
128
0
64
1
32
1
16
0
8
0
4
1
2
0
1
In questo caso si ha 128 + 32 + 16 + 2 = 178, come si
sapeva.
Una domanda abbastanza naturale a questo punto
è: quant’è lunga la rappresentazione di un numero
n?
Più precisamente, quante cifre servono per
rappresentare il numero n nella base b? Per la regola
posizionale, servono k + 1 cifre se il numero è compreso tra bk e bk+1 , cioè se abbiamo: bk ≤ n < bk+1 .
Passando ai logaritmi in base b (siamo in una nota!)
si ottiene: k ≤ logb (n) < k + 1; poiché k è un
numero intero, si ha k = ⌊logb (n)⌋, dove questa
notazione significa: “Prendi la parte intera di . . .”.
Aggiungendo 1, si ottiene il risultato generale: il
numero di cifre necessarie a scrivere il numero n nella
base b è ⌊logb (n)⌋ + 1. Spesso e volentieri, quando
si usa un elaboratore, occorre passare rapidamente
dalla base 2 alla base 10, o viceversa. Se non si
deve essere molto precisi, e ci si accontenta del solo
1.5. RAPPRESENTAZIONE DEI NUMERI NATURALI
ordine di grandezza, siano k2 e k10 il numero di
cifre necessario a scrivere il numero n in base 2 e in
base 10. Dall’approssimazione classica 210 ≈ 103 si
ha la semplice proporzione: k2 : k10 = 10 : 3, che
permette il calcolo veloce di k2 conoscendo k10 , e
viceversa. Ad esempio, nella rappresentazione interna
dell’elaboratore, di solito si riescono a rappresentare
i numeri fino a 2128 ; dalla precedente proporzione si
ricava che tale numero corrisponde, grosso modo, a
1038 .
La numerazione posizionale con base fissa, sia che
questa venga scelta come 10, sia che si preferisca 2,
8 o 12, è in effetti il metodo più semplice di rappresentare i numeri e permette di eseguire direttamente
le operazioni elementari. Tuttavia, si possono concepire numerazioni posizionali con una base composta,
e nella realtà esistono ancora oggi (e più ne esistevano nel passato) numerazioni di questo tipo. La più
utilizzata nella pratica è la numerazione dei giorni,
per la quale un anno si compone di 12 mesi, un mese di (circa) 30 giorni, un giorno di 24 ore, un’ora
di 60 minuti e un minuto di 60 secondi. Limitandoci ai giorni, la scrittura 5d 14h 35′ 18′′ si legge: cinque
giorni, quattordici ore, trentacinque minuti e diciotto secondi. Cosı̀ come nella base 10 ogni cifra deve
essere compresa nel rango 0 ÷ 9, qui ogni indicazione
di ora deve essere compresa tra 0 e 23, ogni indicazione di minuto e di secondo deve rientrare nel rango
0÷59; la base composta si scrive pertanto (24, 60, 60),
quando ci si limiti ai giorni, e (12, 31, 24, 60, 60) oppure (365, 24, 60, 60) quando la si voglia estendere a
tutto l’anno.
In questa ottica, 4d 36h 154′ 78′′ è apparentemente
una scrittura priva di senso, analoga al numero 2013
in base 2. Tuttavia, conviene dare un senso a tale
notazione, interpretando le varie quantità in funzione
del corrispondente valore della base. Ciò, come vedremo, è molto conveniente per eseguire le operazioni
e avviene nel modo seguente, procedendo da destra
verso sinistra:
27
1.1 permette, conoscendo i numeri che definiscono la
base composta, di trovare la rappresentazione di una
quantità data come numero di secondi (o di minuti o
di ore) interpretati come stecchini od aste. Naturalmente, le suddivisioni in gruppi non avvengono più
tutte nella stessa maniera, ma in funzione delle componenti della base: cosı̀ i secondi vengono riuniti in
gruppi di 60, i minuti ancora in gruppi di 60, ma le
ore in gruppi di 24.
In questo caso, le abbreviazioni d, h per giorno ed
ora non vengono dall’inglese day e hour, ma dal latino
dies ed hora, il che potrà tranquillizzare più di una
persona. I minuti primi e i minuti secondi sono un’espressione antica, nella quale “minuto” sta appunto
per “piccolo”, cioè suddivisione piccola dell’ora; l’uso
ha poi portato a chiamare i primi semplicemente minuti e i secondi secondi (spero si voglia apprezzare il
bisticcio). La notazione con gli esponenti è tipograficamente un po’ ostica; cosı̀ dal quotidiano apprendo
che Gilberto Simoni ha vinto la tappa di ieri del Giro d’Italia in 4h46′ 43′′ ; negli orari, ferroviari e non,
la partenza è annunciata alle 15:46, evitando giustamente il punto o la virgola decimale, visto che questi
numeri decimali non sono. Anche gli orologi digitali
e i calcolatori elettronici hanno adottato questa notazione con i due punti, riferendola costantemente alle
ore del giorno. Mi capita anche di vedere 18:37:58
per 18h 37′ 58′′ e, costretti dagli orari, perfino gli anglosassoni oggi accettano di scrivere 15:46 invece di
3:46 p.m., arrivando a pronunciare “fifteen hundred
forty six”. Dove si andrà a finire?
Analoghe considerazioni valgono per la notazione relativa agli angoli, dove la base composta è
(360, 60, 60), con l’ulteriore precisazione che non si
possono superare i 360◦ , corrispondenti a un angolo giro completo. Un angolo è dato in gradi compresi tra 0 e 359 (si ripetono poi ciclicamente); un
grado è composto di 60 primi e un primo di 60 secondi. Cosı̀ 1000◦ 324′ 97′′ è una brutta rappresentazione di un angolo di 285◦ 25′ 37′′ , come il lettore
avrà la compiacenza di verificare con quattro calcoli
elementari.
• 78′′ si interpreta come 1 minuto e 18′′ , visto
che un minuto corrisponde a 60 secondi; queIl sistema metrico decimale, prodotto dall’Illumisto minuto va a incrementare i 154′ portandoli a nismo del 1700 e messo in atto dalla Rivoluzione
155′ ;
Francese, ha in pratica lasciato alle basi composte
soltanto il computo del tempo e la misurazione de′
′
′
• 155 si interpreta come 2 ore (cioè, 120 ) e 35 ; le gli angoli. Nel mondo anglosassone, più restio ad
h
due ore vanno ad incrementare le 36 portandole accettare le novità venute dalla Francia, fino al 14
a 38h ;
Gennaio del 1971 la sterlina si divideva in 20 scellini
• 38h si interpreta come 1 giorno (cioè, 24h ) più (ma la ghinea valeva 21 scellini), e lo scellino in 12
14h ; questo giorno incrementa di 1 il numero pence (plurale, questo, di penny, anche se tre monete da un penny erano “three pennies”); la base era
complessivo dei giorni.
quindi (∞, 20, 12) o anche (20, 12) e lo straniero era
In definitiva, abbiamo 4d 36h 154′ 78′′ = 5d 14h 35′ 18′′ e guardato in modo supercilioso se si imbrogliava anquesta è la rappresentazione standard. L’Algoritmo che un po’. Ancora oggi, le unità di misura lineare,
28
CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA
e di conseguenza le misure di superficie e di volume,
non si rifanno alla base 10: il pollice (2.54 cm) ha come multipli il piede, composto di 12 pollici, la yarda,
formata da 3 piedi, e il miglio, che di yarde ne conta
esattamente 1760. Come sottomultipli del pollice si
usano il mezzo pollice, il quarto, l’ottavo e anche il
sedicesimo di pollice, il che porta in ballo, del tutto
inaspettatamente, la base 2. Facco grazia al lettore
delle misure di peso (oncia, libbra, etc.) e di quelle
di volume (quarto, pinta e gallone).
1.6
La nomenclatura della Matematica
Gli insiemi e i numeri, di cui abbiamo parlato, sono
sicuramente concetti che appartengono alla Matematica, anche se non è chiaro perché il concetto di “mandorla” non ne debba far parte. Si pensa, in genere,
che concetti troppo specifici, come appunto quello di
mandorla, non possano portare a conclusioni generali: o la mandorla è vista come elemento di un insieme,
e allora il concetto di insieme viene a inglobare quello
di mandorla, oppure vogliamo contare le mandorle, e
allora dobbiamo proprio astrarre dal fatto di contare mandorle, e di nuovo l’interesse per tale concetto
viene a cadere. Ma allora, ci chiediamo, quanto deve
essere generale un concetto per poter appartenere alla Matematica? Questo è difficile a dirsi e se si pensa
che per secoli la rappresentazione arabica dei numeri
non è stata presa in considerazione dalla Matematica
accademica, ci si rende conto come la demarcazione
sia estremamente labile. Diciamo che un concetto o,
meglio, una serie di concetti fanno parte della Matematica quando si riesce a creare una teoria che li
comprende. Che cos’è allora una teoria?
La misurazione dei campi potrebbe, oggi come oggi, difficilmente essere considerata una parte, perfino
importante, della Matematica: il suo grado di generalità sembra alquanto basso se confrontato, ad esempio, con la Fisica nucleare, l’astronomia o la ricerca
operativa. In effetti la Geometria (cioè la misurazione
dei terreni) è uno dei più classici esempi di teoria matematica. Partendo dalla considerazione delle figure
dei campi, i geometri dell’antichità hanno individuato
alcuni concetti che costituiscono la base di ogni altro
concetto geometrico. Per far questo hanno cercato di
dare una definizione di triangolo e di rettangolo, ma
queste implicano una definizione di angolo e di lato, e
quindi la definizione di segmento e di semiretta, e cosı̀
via. Questo processo che ci porta a concetti sempre
più generali non può continuare all’infinito, ma dobbiamo interromperlo da qualche parte. Fu deciso di
interromperlo ai concetti di punto, retta, piano, spazio e alle loro reciproche disposizioni. Ciò significa
che non possiamo (e non vogliamo) definire che cosa
è un punto, che cosa è una retta o che cosa vuol dire
che un punto si trova su una retta. Ma allora, come
possiamo sapere che cosa sono questi oggetti e queste
relazioni?
Gli antichi (ad esempio Euclide) avevano dato una
risposta a livello di intuizione: i concetti primitivi,
cioè non definiti e non definibili, sono astrazioni estreme di concetti evidenti e, come tali, noi li accettiamo
per buoni. La realtà, di cui sono astrazione, ci assicura della loro “esistenza” e della validità delle loro
proprietà. In questa ottica, una retta può essere infinitamente lunga e infinitamente smilza, anche se nella realtà non è cosı̀: le proprietà sono intuite quando
operiamo l’atto di pensare di restringere sempre più
una retta reale e di farla continuare oltre ogni limite
fisico. In ogni modo, ai concetti di base della teoria
rimane legata una “realtà” che permette di applicare
al mondo che ci circonda i risultati della teoria stessa.
Cosı̀, nella visione antica, la Geometria, oltre ad essere una teoria, è uno strumento pratico, ed è proprio
questo aggancio al mondo reale che rende una teoria “vera”: se scoprissimo qualche divario tra teoria e
pratica, la teoria non andrebbe più bene e dovrebbe
essere abbandonata.
Questa dipendenza della teoria dalla pratica ha fatto molto pensare i matematici, che non erano soddisfatti proprio per niente. Cosı̀, durante il 1800 hanno
cambiato le carte in tavola, invertendo completamente il vecchio punto di vista: non è la realtà che determina o convalida una teoria, ma questa è un’entità
autonoma che, semmai, trova un suo modello nella
realtà, o almeno in quella parte della realtà che ha
il buon gusto di adeguarsi alla teoria. Cosa significa
questo per la Geometria? Significa che punto, retta,
piano e spazio non sono astrazioni della realtà, ma
sono dei puri nomi o simboli, le cui reciproche relazioni sono definite negli assiomi della teoria. Gli assiomi,
cioè le verità che nella concezione antica erano stabiliti dalla realtà e accettate come tali, ora sono concepiti come proprietà che regolano le relazioni reciproche
fra i simboli della teoria. In questo senso, gli assiomi potrebbero essere del tutto arbitrari; esiste però
un’ovvia limitazione: essi non si possono contraddire
tra di loro, né portare a contraddizioni interne alla
teoria. Cosı̀, in altre parole, non deve mai succedere che si dimostri una certa affermazione insieme alla
sua contraria. La mancanza di contraddizioni si dice
coerenza della teoria.
Nota 1.8
Aristotele dava significati distinti alle
parole “assioma” e “postulato” (si veda al Capitolo
6 sulla Geometria Euclidea). Gli assiomi, o ‘nozioni
comuni’, sono affermazioni evidenti di per sé e comuni
a tutte le scienze (ad esempio: se due oggetti sono
uguali ad un terzo, allora sono anche uguali tra di
loro). I postulati sono invece verità specifiche della
1.6. LA NOMENCLATURA DELLA MATEMATICA
29
direttamente. La coerenza della teoria di Peano ci
dice che tutte le affermazioni che possiamo dimostrare sono vere nel senso detto: vorremmo anche che,
viceversa, tutte le affermazioni vere potessero essere
dimostrate. Qui entra in ballo la completezza e ci
farebbe piacere dimostrare che la teoria di Peano è
completa, cosa che potrebbe essere ragionevolmente
vera, visto che i Matematici sono riusciti a costruire
(quasi) tutta la Matematica conosciuta partendo da
quegli assiomi. Qui, però, viene il difficile, poiché si
tratta di dimostrare qualcosa di generale sulla teoria agendo dall’interno della teoria stessa. Nel 1928,
il logico e Matematico austriaco Kurt Gödel riuscı̀ a
dimostrare (proprio dall’interno della teoria) che gli
assiomi di Peano non sono completi, cioè che esistono
affermazioni vere, ma indimostrabili. Non solo, ma
egli fece vedere che qualunque teoria che comprenda
gli assiomi di Peano (e quindi voglia assiomatizzare
l’Aritmetica e la Matematica) è di per sé non comIn un certo senso, la coerenza di una teoria si rife- pleta. In altre parole, la nostra speranza di poter
risce al nostro desiderio che, all’interno della teoria, dimostrare tutto ciò che è vero nella Matematica è
non si riescano a dimostrare “troppe” affermazioni, un sogno destinato comunque a fallire.
cosı̀ tante da includere anche la negazione di un teoreUn aspetto, infine, forse meno importante ma cerma già dimostrato vero. All’opposto, desidereremmo
to
interessante, è costituito dall’indipendenza dei vari
anche che la teoria non fosse troppo ristretta da non
assiomi
di una teoria. Un assioma si dice indipenpermetterci di dimostrare affermazioni che sappiamo
dente
dagli
altri considerati, se, togliendolo dalla foressere vere e che vorremmo fossero incluse nell’ambito
mulazione
della
teoria, questa perde una parte dei
della teoria. Se i nostri assiomi sono troppo specifici o
le regole con cui effettuiamo i nostri ragionamenti non suoi teoremi. Questa affermazione può essere messa
sono abbastanza potenti, rischiamo di non arrivare a in positivo dicendo che un assioma dipende dagli altri
dimostrare fatti che, invece, per la nostra esperien- assiomi della teoria, se esso può essere dimostrato a
za o anche solo per la nostra volontà, dovrebbero far partire da quelli (e pertanto non è un vero assioma).
parte della teoria che stiamo sviluppando. Una teo- Fondare una teoria su assiomi indipendenti vuol dire
ria (coerente) nella quale si possono dimostrare tutti riuscira a svilupparla con un numero minimo di coni teoremi che sono “veri” si dice completa. Quindi, cetti “dati per buoni”; questo rientra in quel gusto
in altre parole, una teoria ideale o perfetta è una estetico che i matematici hanno per la loro scienza e
teoria coerente e completa, nel senso preciso che in del quale parlavamo già nella Premessa.
disciplina che stiamo studiando; la loro evidenza è
subordinata al fatto che si abbia idea della disciplina
in questione. Ad esempio, un postulato della Geometria Euclidea è: “Tutti gli angoli retti sono uguali”,
il che è sı̀ apparentemente vero, ma occorre che si
sappia che cos’è un angolo retto. Il famoso postulato
“Per un punto P esterno a una retta r passa una
e una sola retta parallela ad r” (dato da Euclide
in tutt’altra forma; si veda ancora il capitolo sulla
Geometria Euclidea) non è stato mai considerato
troppo evidente e, come è noto, ha dato origine alle
Geometrie non Euclidee, teorie che sono coerenti (se
ne danno semplici modelli nella nostra realtà forse
Euclidea), ma nelle quali è “evidente” che per P
possono passare infinite rette parallele ad r, o anche
nessuna. Oggi la distinzione tra assioma e postulato
è caduta e si usano indifferentemente i due termini
per indicare gli elementi di base di una teoria.
una tale teoria si riescono a dimostrare tutte e sole le
affermazioni vere.
Possiamo forse essere più precisi facendo un esempio importante. Nella Nota 2.8 vedremo l’assiomatizzazione dell’Aritmetica proposta da Peano; in realtà,
essa è molto di più, poiché può essere presa come
base dell’assiomatizzazione di tutta la Matematica.
Che essa sia coerente, è ragionevole pensarlo, dato
che gli assiomi sembrano adattarsi bene alle proprietà
dei numeri naturali che essi vogliono descrivere; ci
aspettiamo pertanto che tutti i teoremi che in essa
riusciamo a dimostrare siano veri. Dire che un’affermazione è “vera” significa qui che essa è verificata
nel mondo della Matematica, reale o ideale che esso
sia. Ma come possiamo dire che un’affermazione è vera in questo senso? Le affermazioni della Matematica
(ma basta considerare quelle dell’Aritmetica) coinvolgono in generale un numero infinito di oggetti (cioè,
di numeri) e quindi è impensabile poterli “verificare”
Ma cosa significa “dimostrare”? Il senso comune ci
fornisce alcune regole che ci permettono di stabilire se
una frase è conseguenza logica di un’altra frase, come
“Se non ti metti le scarpe, andrai scalzo”. L’esperienza ce ne fornisce altre di tipo più specifico, come: “Se
non ti metti la maglia, prenderai un raffreddore”. Come si vede, le prime regole prescindono dal contenuto
particolare della frase e si basano su una riformulazione dello stesso concetto: non mettersi le scarpe o
andare scalzi significano la stessa cosa. Queste regole
possono sembrare ovvietà, ma spesso si rivelano più
utili di quanto non ci si aspetterebbe: esse sono le comuni regole della logica e tutti i ragionamenti, sia in
Matematica sia nella vita di tutti i giorni, ne fanno
largo uso. Il secondo tipo di regole è specifico dell’argomento che si sta trattando, cioè della teoria che
stiamo elaborando: la frase precedente sul raffreddore fa parte (con un po’ di fantasia) della Medicina
e non della Matematica, ma si possono fare esempi
30
CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA
come “Se A, B, C sono tre punti su una retta ed A
è compreso tra B e C, allora la distanza di A da B
è minore della distanza di B da C”. Le regole di
deduzione specifiche di una teoria si dicono regole di
inferenza della teoria e, assieme agli assiomi, costituiscono la base della teoria stessa. Sviluppare una
teoria significa dedurre le conseguenze possibili degli
assiomi usando le regole della logica e le regole di inferenza. Nella prossima sezione vedremo le tecniche
più importanti che ricorrono nelle dimostrazioni della
Matematica.
Che gli assiomi siano coerenti tra di loro è, di solito,
facile a vedersi; più difficile è capire se, procedendo
nello sviluppo della teoria, non si arriverà mai a qualche contraddizione. Un metodo consiste nel cercare
nella realtà un modello della teoria, cioè una parte
della realtà che soddisfi gli assiomi della teoria. Se
abbiamo fiducia nella coerenza della realtà (che cioè
questa non cada in contraddizione con sé stessa), questo adeguarsi del modello alla teoria ci può rassicurare sulla coerenza di quest’ultima. Riassumendo, una
teoria è costituita:
parola “teorema” è oggi un termine generico che indica tutte le conseguenze possibili degli assiomi. Nella
pratica, si lascia il nome di “teorema” ai risultati veramente importanti, e si preferisce usare i seguenti
termini in situazioni più specifiche:
• osservazione e proposizione: allargando un
po’ il concetto di “affermazione singolare” questi
nomi indicano risultati di semplice verifica, cioè
dimostrabili senza sforzi, in maniera elementare
e di solito non interessante;
• lemma: indica un teorema che non è un risultato importante di per sé, ma che serve a semplificare la dimostrazione di uno o più risultati
interessanti (che probabilmente saranno definiti
“teoremi”);
• corollario: si riferisce a un teorema che è una
immediata conseguenza di un altro teorema appena dimostrato. La dimostrazione di un corollario si riduce spesso a una o due righe e, talvolta,
si può omettere addirittura.
• da un insieme di assiomi, che consideriamo veNon tutte le affermazioni che riteniamo vere possori per definizione e che legano tra di loro i vari no essere dimostrate; come abbiamo osservato, questo
concetti di base della teoria stessa, definendoli fatto è intrinseco alle teorie formali e non possiamo
implicitamente;
che prenderne atto. Tuttavia, di fronte a un’affermazione che ha resistito all’attacco di generazioni di
• da un insieme di regole di inferenza, cioè di mematematici, i quali hanno miseramente fallito, ma che
todi di ragionamento specifici della teoria che
ci sembra vera per varie ragioni (la sensatezza, l’especi permettono di passare dagli assiomi ad alrienza, le prove effettuate, la ricerche mediante l’uso
tre affermazioni vere, sempre più profonde e che
di calcolatori elettronici), non possiamo sapere se: 1)
costituiscono il corpo della teoria.
stiamo sbagliando e l’affermazione è in realtà falsa;
2) siamo imbranati e nono siamo riusciti a trovare la
Partendo dagli assiomi e lavorando con le regole di
strada giusta per la dimostrazione, che perciò verrà
inferenza e le regole comuni della logica si ottengofuori fra qualche annetto; 3) siamo davvero sfortunati
no nuove affermazioni vere che si dicono teoremi. La
e ci siamo imbattuti in una proposizione pevista dal
forma generale di un teorema è: “Se è vero un certo
teorema di incompletezza di Gödel. Si usa per questa
insieme di affermazioni A1 , A2 , . . . , Ar , allora è vera
situazione il termine:
l’affermazione B”; si dice che A1 , A2 , . . . , Ar costituiscono le ipotesi del teorema e che B è la tesi. Se il
• congettura: si riferisce ad affermazioni che
teorema risulta vero, si dice anche che A1 , A2 , . . . , Ar
pensiamo essere vere, ma per le quali non
sono condizioni sufficienti per B, o che B è condizione
conosciamo (ancora) alcuna dimostrazione.
necessaria per A1 , A2 , . . . , Ar . Talvolta un teorema si
esprime nella forma più sintetica dell’implicazione “A
Come esempio della terminologia introdotta, conimplica B”. Alcuni teoremi assumono la forma “A è sideriamo la seguente sequenza di dimostrazioni. Covero se e solo se tale è B”; questo equivale ai due minciamo con l’osservare che se sommiamo i primi
teoremi “A implica B” e “B implica A”, e cioè “A è due numeri dispari 1 e 3 otteniamo 4 = 22 . Sommancondizione necessaria e sufficiente per B”. In questo do i primi tre dispari si ha 1 + 3 + 5 = 9 = 32 , e se
caso la forma sintetica è “A se e solo se B”, e si dice sommiamo i primi quattro otteniamo proprio 42 . E’
una doppia implicazione.
possibile dimostrare che la somma dei primi n numeri
I teoremi sono sempre affermazioni di carattere ge- dispari è proprio n2 ? Prima di tutto dimostriamo il
nerale; ad esempio, “52 + 19 = 71” è un’affermazione seguente:
deducibile dagli assiomi dell’aritmetica. Tuttavia, essa non verrà mai considerata un teorema, ma sempli- Lemma 1.3 I primi n numeri dispari sono
cemente una affermazione singolare della teoria. La 1, 3, . . . , 2n − 1.
1.7. MATEMATICA E LOGICA
Prova: Se escludiamo lo 0, i primi n numeri sono 1, 2, . . . , n e quindi i primi n numeri pari sono
2, 4, . . . , 2n. I primi n numeri dispari sono quelli che
precedono i primi n numeri pari e quindi sono proprio
1, 3, . . . , 2n − 1.
Questo risultato ci serve ora a dimostrare:
Teorema 1.4 La somma dei primi n numeri dispari
vale:
1 + 3 + · · · + (2n − 1) = n2 .
Prova: Posto S = 1 + 3 + · · · + (2n − 1), si ha anche
S = (2n − 1) + · · · + 3 + 1. Sommando le coppie
di elementi corrispondenti si ha: 2S = 2n + 2n +
· · · + 2n + 2n = 2n2 , essendo la somma composta di
n termini tutti uguali a 2n. Dividendo per 2 si ha il
risultato desiderato.
Questo è il nostro teorema importante che ha come
conseguenza immediata:
Corollario 1.5 La media dei primi n numeri dispari
è uguale ad n.
Prova: Essendo n i numeri, la media è S/n =
n2 /n = n.
Ricordiamo infine che la forma canonica o normale
di un oggetto matematico è un’espressione che denota quell’oggetto in una maniera standard, secondo
opportune convenzioni, ed è adatta a semplificare le
elaborazioni relative a quell’oggetto. Ad esempio, la
forma canonica di un’equazione di secondo grado è
ax2 + bx + c = 0, e da questa forma si deducono le
eventuali soluzioni. La forma normale di una retta
(non perpendicolare all’asse delle x) è y = mx + b,
dove m è la pendenza e b è l’intercetta, cioè il valore dell’intersezione con l’asse delle y. Tuttavia, in
particolari contesti, si considera come forma canonica
della retta ax + by + c = 0 e quando si voglia trovare
l’intersezione di due rette si preferisce una terza forma canonica, e cioè ax + by = c, che vale anche per
le rette perpendicolari all’asse delle x.
1.7
Matematica e Logica
Il ragionamento matematico è un caso particolare del
ragionamento logico e, più in generale, le teorie matematiche sono parte delle teorie logiche. Spesso, oggi, si tende ad identificare Matematica e Logica, perché quest’ultima può essere formalizzata in una teoria
matematica. Dal nostro punto di vista, volutamente
elementare, questa identità interessa come curiosità,
piuttosto che come situazione effettiva. Tuttavia, non
possiamo ignorare le grandi e importanti connessioni che legano Matematica e Logica. In particolare,
è bene mettere in evidenza quelle parti, o almeno
31
quei concetti della Logica che hanno un immediato
riscontro nella Matematica.
La teoria logica più elementare è senza dubbio il
Calcolo proposizionale o Logica delle proposizioni. Inventata da Boole (1815 – 1864) alla metà del 1800,
e sviluppata dai matematici inglesi di quel periodo,
questa teoria tratta in modo del tutto generale delle
proposizioni, ove informalmente con questo termine
si intende ogni affermazione che possa essere vera o
falsa. Questo esclude dalla teoria le domande e le
esclamazioni, ma comprende quasi tutto il discorso
comune. Per questo la sua connessione con la Matematica è forte e deve essere conosciuta. Gli esempi
che faremo sono presi dalla lingua parlata, ma cercheremo di dare anche significativi agganci alle proposizioni della matematica, in particolare ai teoremi.
Nel Capitolo 4 dedicheremo la Sezione 4.6 al calcolo
delle proposizioni; per il momento ci accontentiamo
di introdurre i concetti e le tecniche principali.
Le proposizioni che si prendono in considerazione
devono sempre essere ben determinate; cosı̀ la frase
“domani è domenica” suppone che si stia ragionando in un preciso giorno e che quindi la frase sia vera
(siamo di sabato) o falsa (siamo in qualche altro giorno della settimana); va cioè esclusa l’idea che la frase
possa dipendere dal giorno in cui è stata pronunciata.
Le frasi con quest’ultimo intendimento, che prevedono una variabilità del discorso in funzione di quale
giorno della settimana è oggi, non sono proposizioni,
ma nella terminologia della Logica si dicono predicati
e hanno una propria teoria, alla quale accenneremo
nella Sezione 1.8. Analogamente, la frase “Carlo è
andato a Roma” presuppone che sia perfettamente
individuato il Carlo di cui si parla, e “questo è un
coltello” faccia riferimento a un oggetto ben definito,
che può essere o non essere un coltello.
La negazione di una proposizione è un’altra proposizione, che risulta vera o falsa a seconda che quella
originaria fosse falsa o vera. Ovviamente, se il Carlo di cui parliamo è andato a Roma, la proposizione
“Carlo non è andato a Roma” è una proposizione falsa. Ciò può essere espresso sinteticamente per mezzo
della tabella di verità che esprime, in funzione dei
possibili valori di verità di p, il valore di verità della
negazione ¬p; assumendo come convenzione che 1 indichi il valore “vero” e 0 il valore “falso”, la tabella
è:
p ¬p
0 1
1 0
La congiunzione di due proposizioni è la proposizione che si ottiene interponendo la congiunzione “e”
fra le due proposizioni; ad esempio “Carlo è andato
a Roma e si è iscritto all’Università”. La congiunzione è vera se e solo se risultano vere entrambe le
32
CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA
con p → q. Questa è la forma dei teoremi della Matematica, ma naturalmente la lingua comune è piena
di implicazioni: “Se vai da Carlo [allora] riportagli il
suo libro”. La doppia implicazione si esprime “. . . se e
solo se . . . ”, è assai comune in Matematica, molto meno nei discorsi di tutti i giorni, dove, creando sovente
più di qualche ambiguità, si preferisce esprimersi con
semplici implicazioni: “Pagherò se mi conviene” di
solito significa “Pagherò se e solo se mi conviene”,
anche se, letteralmente, chi ha pronunciato la frase
non ha detto “se pagherò allora mi conviene”, ma si
è limitato a dire: “se mi conviene allora pagherò.” La
notazione per la doppia implicazione è p ↔ q.
La verità o falsità di una implicazione è un problema non del tutto banale. Normalmente, come si
è detto, se “p → q” è un’implicazione, p si dice l’ipotesi e q la tesi. Se l’ipotesi è vera e ragioniamo in
modo corretto, vogliamo che sia vera anche la tesi,
anzi non possa essere falsa. Se la tesi risulta falsa,
significa semplicemente che abbiamo sbagliato la deTale formalismo, che qui è appena accennato, ma
duzione, cioè siamo di fronte a una non-implicazione.
che svilupperemo nel Capitolo 4, serve almeno a dare
Secondo la tradizione, questa regola si dice modus poun’espressione semplice ad antichi principi:
nens e si enuncia: se p è vera e “p implica q” è vera,
allora
è vera q:
• principio del terzo escluso (tertium non datur): la proposizione p è vera o falsa, cioè p = 1
((p ∧ (p → q)) → q.
oppure p = 0. Questo principio, per noi, fa parte
della stessa definizione di proposizione;
D’altra parte, se una deduzione è corretta, ma la te-
proposizioni che la compongono. La disgiunzione di
due proposizioni si ottiene interponendo tra di esse
la congiunzione “oppure” con significato disgiuntivo,
cioè che la verità di una proposizione non esclude la
verità dell’altra. Un esempio significativo è “mangerò
il dolce oppure [mangerò] la frutta”, volendo intendere che comincerò a mangiare uno dei due e poi, se
avrò ancora fame, mangerò anche l’altro (conoscendomi, avrei potuto dire “mangerò il dolce e la frutta”,
ma un po’ di ritegno non guasta mai). La disgiunzione è vera quando almeno una delle due proposizioni
di partenza è vera, o sono vere tutt’e due, come illustrato nell’esempio. Le rispettive tabelle di verità
sono:
p q p∧q
p q p∨q
0 0
0
0 0
0
0
1
0 1
0 1
0
1
1 0
1 0
1 1
1 1
1
1
• principio di non contraddizione: la verità si è manifestamente falsa, dobbiamo concludere che
di p esclude la verità di ¬p, e viceversa, cioè l’ipotesi era falsa. Nella logica aristotelica questo si
p ∧ ¬p = 0. La congiunzione di p e della sua dice modus tollens e si formalizza:
negazione è sempre una proposizione falsa, cioè
((p → q) ∧ ¬q) → ¬p.
è una contraddizione.
Questo è ragionevole, ma quando l’ipotesi è falCome avremo modo di ribadire più volte, nella Logica
sa, cosa ci possiamo aspettare? Se l’ipotesi è falsa,
e nella Matematica moderne, questi principi non si
supporla vera è un controsenso o una contraddizione,
reputano più validi in senso assoluto.
e da una contraddizione possiamo ricavare tutto ciò
Boole dimostrò che i tre modi di connettere le proche vogliamo, cioè possiamo ricavare tanto tesi false
posizioni (e il loro nome tecnico è appunto connettivi
quanto tesi vere. Quindi, in conclusione, l’implicalogici) sono sufficienti a generare tutti i possibili lezione sarà vera qualunque sia la verità o falsità della
gami tra proposizioni, e noi lo vedremo nella sezione
tesi.
dedicata al calcolo delle proposizioni. Esistono tuttavia altri connettivi logici importanti. L’esclusione
Nota 1.9
Questo punto non è intuitivo poiché
fra due proposizioni si ottiene, come la disgiunzione,
tendiamo a rifiutare l’idea che se partiamo da
mettendole insieme con la congiunzione “oppure”, ma
un’ipotesi falsa ragionando bene possiamo arrivare
tanto a conclusioni vere che false. Ma l’implicazione
il significato di questa deve essere esclusivo, cioè l’un
p → q indica la correttezza della deduzione, e quindi
caso deve escludere l’altro; cosı̀ possiamo dire: “Non
dal
vero non possiamo dedurre il falso, ma dal falso
abbiamo molto tempo: passiamo dal supermercato o
possiamo
dedurre tutto ciò che vogliamo. Si narra
andiamo dal commercialista” intendendo che se facche ad una conferenza Bertrand Russell (1872 – 1970)
ciamo una cosa non potremo fare l’altra. L’esclusiocercasse di spiegare questo punto. Uno dei presenti,
ne, pertanto, è vera se e solo se una sola tra le due
allora, lo sfidò a dimostrare dall’ipotesi falsa 1 = 2
proposizioni è vera; essa si indica con la notazione
che lui, Russell, e la Regina di Inghilterra erano la
p ⊕ q.
stessa persona. Russell non ci stette a pensar molto
L’implicazione si esprime di solito con “se . . . , ale propose il seguente ragionamento: “Io sono una
lora . . . ”, dove le ellissi stanno ad indicare le due
persona”; “La Regina d’Inghilterra è una persona”;
“quindi io e la Regina di Inghilterra siamo due
proposizioni da collegare; simbolicamente, si denota
1.7. MATEMATICA E LOGICA
persone”, “Ma se 1 = 2, allora queste due persone
sono una persona sola”; “In conclusione, io e la
Regina d’Inghilterra siamo la stessa persona”. L’aneddoto è probabilmente inventato, ma illustra bene
come l’ipotesi falsa serva a cambiare le carte in tavola pur rimanendo nell’ambito della corretta deduzione.
Possiamo mettere le cose in modo un po’ diverso.
Quando diciamo “se piove apro l’ombrello”, possiamo
dire, con lo stesso significato, “Non piove oppure apro
l’ombrello”. Analogamente, “Se ti affretti arriverai in
tempo alla stazione” si può dire: “Non ti affretti oppure arriverai in tempo alla stazione”. Questo significa che “p implica q” è equivalente alla disgiunzione
fra la negazione dell’ipotesi da una parte, e la tesi
dall’altra. Il proverbio “Chi non risica non rosica”
significa “se non rischi non ottieni niente”, il che si
può anche dire “o rischi oppure non ottieni nulla”. E
“chi dorme non piglia pesci” vale come “o sei sveglio
oppure non pigli pesci”, e si potrebbe continuare con
un’interessante carrellata sui più noti proverbi. La
conclusione è che l’implicazione p → q equivale alla
disgiunzione ¬p ∨ q.
Un aspetto importante di questa constatazione riguarda il fatto che la disgiunzione è vera anche quando tutte e due le proposizioni coinvolte sono vere.
Pertanto, nell’esempio di “chi dorme non piglia pesci”
si può verificare, come tutti sappiamo per esperienza,
che uno sia sveglio, ma non riesca a prendere pesci.
In effetti, quello che il proverbio assicura è che per
poter prendere pesci bisogna essere svegli, ma questo
fatto, di per sé, non assicura che i pesci li prenderemo
davvero. Questo significa che la proposizione inversa
“chi non piglia pesci, dorme” non è necessariamente vera, cioè non è deducibile dal proverbio. Il mio
esempio favorito è un altro proverbio: “Fortunato in
amor non giochi a carte” che significa “Se sei fortunato in amore, sarai sfortunato alle carte”. Talvolta
il proverbio si usa per consolare chi perde al gioco,
suggerendo che questo fatto voglia dire che la persona è fortunata in amore. Ma il proverbio non afferma
questo, come si capisce con un attimo di riflessione; se
poi lo parafrasiamo come “O sei sfortunato in amore
oppure sei sfortunato al gioco”, si intende bene che
una persona, ahimè, può essere sfortunata tanto in
amore quanto al gioco.
Il seguente schema fa il punto su una terminologia
che va conosciuta:
p
→
q
implicazione diretta
¬p → ¬q implicazione inversa
Se
q
→
p
implicazione contraria
¬q → ¬p implicazione contropositiva
la verità di una implicazione non comporta la verità
della sua contraria, comporta però la verità della cosiddetta contropositiva, cioè la proposizione che dalla
negazione della tesi fa discendere la negazione del-
33
l’ipotesi. Esemplificando, possiamo osservare che è
la stessa cosa dire “Se sei fortunato in amore, sarai
sfortunato al gioco” oppure “Se sei fortunato al gioco, allora sarai sfortunato in amore”. O anche “Se
dormi non pigli pesci” o “Se pigli pesci allora non
dormi”. In altre parole, una implicazione e la sua
contropositiva sono proposizioni equivalenti e una è
vera se e solo se è vera l’altra, cioè p → q risulta vera se e solo se tale risulta ¬q → ¬p. Questo viene
sfruttato ampiamente in Matematica dove, spesso, si
usa dimostrare la proposizione contropositiva invece
di dimostrare direttamente un teorema. Questo tipo
di prova viene di solito introdotto cosı̀: “Supponiamo
per assurdo che la tesi sia falsa” e prosegue tentando di dimostrare che è vera la negazione dell’ipotesi.
Talvolta, del tutto impropriamente, questa tecnica è
detta “dimostrazione per assurdo”, che in realtà è
tutta un’altra cosa e la vedremo un po’ più avanti.
Facciamo un semplice esempio di dimostrazione
nella quale, invece di provare l’asserto del teorema,
dimostriamo la proposizione contropositiva:
Teorema 1.6 Se il numero intero positivo n non è
un quadrato perfetto ed n = p × q, allora il quadrato
di uno dei fattori è minore di n e il quadrato dell’altro
fattore è maggiore di n.
Prova: Intanto, non può essere p2 = n o q 2 = n, altrimenti n sarebbe un quadrato perfetto. Allora deve
essere p 6= q. Se supponiamo falsa la conclusione del
teorema, allora i due quadrati p2 e q 2 devono essere
tutti e due minori o maggiori di n. Nel primo caso però abbiamo p2 × q 2 < n2 , cioè p × q < n e in
modo analogo nel secondo p × q > n, contro l’ipotesi
p × q = n.
Spesso, come s’è ricordato, questo tipo di dimostrazione è detto “per assurdo”, ma le vere dimostrazioni
per assurdo hanno uno schema un po’ più complicato. Per dimostrare l’implicazione p → q si suppone
che valga p e che q sia falsa, cioè sia vera la sua negazione. In altre parole, si parte immaginando vera
la proposizione p ∧ ¬q e da essa si cerca di ottenere
una contraddizione o assurdità, che è quello che dà il
nome al modello di dimostrazione. Una contraddizione è semplicemente una proposizione senz’altro falsa,
cioè la negazione di un assioma A o di un teorema
T che abbiamo già dimostrato essere vero. Cosı̀ facendo sappiamo che p ∧ ¬q deve essere falsa, perché
altrimenti avremmo la dimostrazione che l’assioma A
o il teorema T sono tanto veri che falsi, cioè la nostra
teoria (la Matematica) non è coerente, il che sarebbe
un tantino grave. Ma se p ∧ ¬q è falsa, allora o p è
falsa oppure, se p è vera, ¬q è falsa, cioè q è vera. Ma
questo, per la discussione fatta in precedenza, vuol
dire proprio che p implica q, cioè che p → q è vera.
Una celebre e antichissima dimostrazione per assur-
34
CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA
√
do è la prova che 2 non è un numero razionale; si 3n(n + 1) = 6h; si ha allora m3 − m = 6k + 6h =
veda, per questo, il Teorema 3.18. Se indichiamo con 6(k+h), cioè m3 −m è divisibile per 6. Ecco l’assurdo:
quindi m non può esistere e V deve essere vuoto.
r l’assioma A o il teorema T , lo schema è:
Conclusione, la proprietà vale per ogni n ∈ N.
(r ∧ ((p ∧ ¬q) → ¬r)) → (p → q).
Infine, un ultimo schema di dimostrazione che vogliamo ricordare è il seguente. Cominciamo con l’osservare che ogni sottoinsieme di N possiede un elemento minimo, cioè più piccolo di tutti gli altri. Spesso e volentieri non ha un massimo, come l’insieme dei
numeri pari o quello delle potenze del 3, ma un minimo ce l’ha sempre. Supponiamo allora di voler dimostrare che una certa proprietà vale per tutti i numeri
naturali; questo, in altre parole, significa che l’insieme V dei numeri naturali che non godono di quella
proprietà è vuoto. Immaginiamo allora che V non
sia vuoto e che quindi contenga un elemento minimo
m. Cerchiamo ora di dimostrare due cose: primo, che
per 0 la proprietà è valida. Questo prova che m > 0 e
quindi che se poniamo m = n + 1, per n la proprietà
deve essere valida. Come seconda cosa cerchiamo di
dimostrare che se la proprietà è vera per il numero n,
allora deve essere vera anche per n + 1, cioè per m.
Se ci riusciamo siamo giunti ad un assurdo, e quindi
l’ipotesi che V non sia vuoto è errata. Ma V = ∅ vuol
dire che la proprietà è valida per tutti i valori di N,
che è proprio quello che volevamo.
Un esempio potrà essere illuminante. Dimostriamo
la proposizione: per ogni valore di n ∈ N, n3 − n è
divisibile per 6. Il lettore può divertirsi a calcolare
n3 − n per 0, 1, 2, 3, 4 e verificare che la proprietà vale; ma, ci chiediamo, è davvero valida per ogni n ∈ N?
Certo, se tentiamo per uno specifico valore, diciamo
n = 364, troviamo che davvero 3643 −364 = 48228180
è divisibile per 6, ma chi ci dice che non esista un numero (semmai grandissimo) per cui la verifica fallisce?
Procediamo allora come s’è visto:
Teorema 1.7 Qualunque sia il numero naturale n ∈
N, la quantità n3 − n è divisibile per 6.
Prova: Supponiamo che esista qualche numero n
per cui n3 − n non è divisibile per 6 e chiamiamo V
l’insieme di questi numeri. Per le prove effettuate, i
numeri da 0 a 4 non stanno in V , e quindi sia m 6= 0
il più piccolo elemento di V . Se n è il numero che
precede m, n 6∈ V e dobbiamo avere n3 − n = 6k, per
qualche k ∈ N. Consideriamo m = n+1 e calcoliamo:
m3 −m = (n+1)3 −(n+1) = n3 +3n2 +3n+1−n−1 =
= n3 − n + 3(n2 + n) = 6k + 3n(n + 1).
Osserviamo ora che 3n(n + 1) è un numero senz’altro
divisibile per 6, poiché il fattore 3 è presente in modo
esplicito e, sicuramente, uno dei numeri n o n + 1 è
pari (se non è pari n, deve esserlo n + 1). Poniamo
Nota 1.10
Questo tipo di dimostrazione è molto
importante, anche se noi ne limiteremo l’uso al minimo
indispensabile. La tecnica viene detta dimostrazione
per induzione matematica e spesso si formula nella seguente maniera. Sia P (n) una proprietà che dipende
dal numero naturale n. Se P (0) è vera e possiamo
dimostrare che dalla verità di P (n), con n un generico numero naturale, discende la verità di P (n + 1),
allora P (n) è vera per ogni n ∈ N. Il procedimento
che abbiamo visto sopra è la dimostrazione di questo
principio di induzione matematica. Infatti, abbiamo
verificato che il minimo numero m che non verifica
la proprietà non può esistere. Intuitivamente, il senso
del principio è il seguente: se verifichiamo direttamente che P (0) è vera, dal fatto che P (n) implica P (n+1)
possiamo dedurre che anche P (1) è vera. In modo analogo, da P (1) discende la verità di P (2), e cosı̀ via per
ogni valore di n.
Il principio di induzione è molto usato in tante parti
della Matematica, dove si rivela un potente metodo di
dimostrazione. Tuttavia, esso ha una serie di inconvenienti, il primo dei quale è che per poterlo applicare
occorre già conoscere la soluzione del problema che
vogliamo affrontare. Ad esempio, di fronte alla quantità n3 − n, occorre già sapere che essa è divisibile per
6, se vogliamo dimostrare tale fatto per induzione. In
altre parole, il principio funziona da verifica, ma non
è un metodo costruttivo, cioè un metodo che ci faccia
capire come si è arrivati alla soluzione del problema.
Da questo punto di vista, il principio di induzione è
antieducativo e proprio per questo ne limiteremo l’uso, anche se si tratta di un metodo validissimo di dimostrazione. Ci si deve rendere conto che, di regola,
è molto più facile verificare una certa proprietà che
scoprirla; il principio di induzione ci dà una prova di
quella proprietà, ma nulla ci dice su come affrontare
la ricerca di proprietà analoghe. Noi lo considereremo
una specie di “ultima spiaggia” a cui ricorrere quando
proprio non c’è altro da fare.
Per chiudere questa nota in modo poco serio, vediamo
come l’applicazione del principio di induzione richieda
qualche cautela. Chi ha mai contato il numero delle
foglie di un albero? Ebbene, ora dimostreremo che
(qualunque sia tale numero) tutti gli alberi hanno la
stessa quantità di foglie! Il nostro ragionamento parte
con una base P (1), cioè con un insieme costituito
da un unico albero: tale albero ha un certo numero
di foglie, che ovviamente è lo stesso per tutti gli
alberi dell’insieme, cioè lui. Supponiamo allora di
aver dimostrato che tutti gli insiemi di n alberi sono
costituiti da alberi con la stessa quantità di foglie e
prendiamo un insieme A composto di n + 1 alberi. Se
da A togliamo un albero a, rimaniamo con un insieme
di n alberi che, per l’ipotesi di induzione, hanno
35
1.8. PREDICATI
tutti lo stesso numero di foglie. Rimettiamo a in A e
togliamo ora un albero b diverso da a. Abbiamo un
altro insieme di n alberi e, di nuovo, tutti debbono
avere lo stesso numero di foglie. Quindi, anche a ha
lo stesso numero di foglie di tutti gli altri, e quindi
gli n + 1 alberi di A hanno tutti la stessa quantità
di foglie. La conclusione, ora, è la straordinaria
affermazione fatta in precedenza. Dove abbiamo
sbagliato?
1.8
Predicati
Una teoria ben più vasta del calcolo proposizionale è il cosiddetto calcolo dei predicati. A suo tempo abbiamo definito un predicato come una funzione
p : A → {0, 1}, dove A è un insieme qualsiasi. Abbiamo fatto anche esempi significativi, ma veniamo
ora a spiegare qual è l’aggancio fra predicati e proposizioni. Un esempio semplice di predicato su N è
“n ≥ 5”; se indichiamo con p(n) tale predicato, si ha
p(10) = 1 e p(2) = 0, poiché p(10) è la proposizione vera “10 ≥ 5, mentre p(2) è la proposizione falsa
“2 ≥ 5”. Questo ci fa intendere che un predicato si
trasforma in una proposizione ogni volta che specifichiamo l’elemento di A che funge da argomento del
predicato stesso. L’insieme A può anche essere il prodotto cartesiano di vari insiemi; se A = B × C, un
predicato p : B × C → {0, 1} è un predicato binario
p(x, y) che diviene una proposizione (e quindi assume
uno dei due valori 0 = falso oppure 1 = vero) quando
assegniamo ad x uno specifico elemento b ∈ B e ad y
uno specifico elemento c ∈ C. Secondo la terminologia classica, x ed y si dicono le variabili, nel senso che
il loro valore può “variare” nel dominio del predicato
(B e C nel caso presente, A in precedenza). Quindi,
p(b, c) è una proposizione, ma p(b, y) e p(x, c) sono
predicati monadici, il primo su C e il secondo su B.
In modo analogo, si parla di predicati ternari o triadici, quaternari, e cosı̀ via. A causa di questa relazione
tra proposizioni e predicati, questi ultimi si dicono
forme proposizionali o anche forme enunciative; noi
preferiremo sempre il termine “predicato”.
Nota 1.11
Il problema della soddisfacibilità di un predicato k-ario p(x1 , x2 , . . . , xk ) su
A1 × A2 × · · · × Ak è quello di scoprire (se esistono)
k valori a1 ∈ A1 , a2 ∈ A2 , . . . , ak ∈ Ak che rendono
vero il predicato, tali cioè che p(a1 , a2 , . . . , ak ) = 1.
Anche se gli insiemi A1 , A2 , . . . , Ak sono finiti, e
quindi il problema è senz’altro risolubile, la sua
complessità è esponenziale, cioè cresce in modo tale,
al crescere di k, che nessun calcolatore, per veloce
che sia, è in grado di arrivare alla soluzione in tempi
ragionevoli. Tecnicamente, un problema del genere
è detto di complessità NP (si veda anche la Nota
4.4). In particolare, la soddisfacibilità è un problema
NP completo, tale cioè che se potesse essere risolto
in modo “veloce” (cioè in tempo polinomiale nel
numero dei suoi argomenti k) dimostrerebbe che tutta
una classe di problemi di complessità NP avrebbero
anch’essi una soluzione veloce. Questo sarebbe molto
importante per l’informatica che trova nei problemi
NP una classe di problemi ostica, particolarmente
difficile ad essere risolta in tempi di calcolo ragionevoli, diciamo in qualche giorno, se questo vi pare poco.
La natura dei predicati può essere la più varia. E’
un predicato la frase p(x) = “Il signor x è nato a
Scandicci”. Il mio amico Carlo è nato a Lastra a
Signa, per cui p(Carlo) = 0, mentre mio cugino Luigi
è nato proprio a Scandicci, per cui p(Luigi) = 1. In
Matematica, siamo di solito interessati a predicati di
tipo numerico, tipo p(n) =“Il numero n3 − n, per
n ∈ N, è divisibile per 6” oppure q(x) = “Il numero
reale x è tale ch x2 + 1 = 0”. Ogni equazione è in
effetti un predicato, come x2 + x − 2 = 0; ogni valore
che rende vero questo predicato si dice una soluzione
o radice dell’equazione (si veda la Sezione 5.2); in
questo specifico esempio, le soluzioni sono x = 1 ed
x = −2, come si verifica facilmente facendo i calcoli
o risolvendo l’equazione. Se una equazione è vera
qualunque sia il valore assunto dalla sue variabili, essa
si dice più propriamente una identità. Un classico
esempio di identità è dato dalla regola della differenza
dei quadrati, ovvero del prodotto di una somma per
la differenza, a secondo del punto di vista da cui si
legge:
x2 − y 2 = (x + y)(x − y).
Quello di assegnare un valore specifico ad ognuna
delle variabili non è il solo modo per trasformare un
predicato in una proposizione. A proposito del precedente predicato su n ∈ N, abbiamo già visto che è
vera la proposizione: “per ogni valore di n ∈ N, il numero n3 −n è divisibile per 6”. Naturalmente, proprio
il fatto che sia vera ci assicura che questa è una proposizione; se osserviamo bene, ci rendiamo conto che
il predicato originale si è trasformato in una proposizione perché vogliamo considerare che cosa succede
“per ogni valore di n ∈ N”. In modo analogo, se consideriamo la frase: “Per ogni numero reale x si ha
x2 + 1 > 0” basata sul predicato: “x2 + 1 > 0”. La
frase è vera perché x2 ≥ 0, qualunque sia x ∈ R, e
quindi aggiungendo 1 si ha la disuguaglianza asserita. L’espressione: “per ogni n ∈ N” oppure “per ogni
x ∈ R” si dice quantificazione universale e l’espressione stessa si scrive in modo compatto: “∀n ∈ N”
e “∀x ∈ R”. Il simbolo “∀” si dice quantificatore
universale e si legge sempre “per ogni” o “qualunque
sia”. Le proposizioni vere di questo tipo si dicono
“verità generali”; abbiamo visto come il principio di
36
CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA
induzione matematica sia un metodo per dimostrare
verità generali sui numeri naturali.
Talvolta è impossibile dimostrare verità generali,
anche semplicemente perché non sono vere; ad esempio, non è vero che “(∀x ∈ R) x2 + x − 2 = 0”, visto
che per x = 0 si avrebbe −2 = 0, il che è ovviamente
falso. In queste situazioni, può già essere utile dimostrare una verità esistenziale, cioè che esiste almeno
un numero reale x tale che “x2 + x − 2 = 0”. Come
si sa (e come vedremo col Teorema 5.10), ciò è assicurato dal fatto che il determinante dell’equazione,
∆ = 1 + 8 = 9, è non negativo, per cui possiamo
concludere che: “esiste almeno un numero x ∈ R per
cui x2 + x − 2 = 0”. L’espressione: “esiste almeno un x ∈ R” si dice quantificazione esistenziale e
si abbrevia scrivendo: “∃x ∈ R”; il simbolo “∃” si
dice quantificatore esistenziale e si legge “esiste almeno uno”; talvolta, in modo familiare, si legge semplicemente “esiste”. Naturalmente, per ogni predicato
p(x), se è vero “(∀x ∈ A) p(x)” ed A non si riduce all’insieme vuoto, allora in particolare è vero che
“(∃x ∈ A) | p(x)”, dove il simbolo “—” si legge “tale
che” e può essere spesso sottinteso.
Ci possono essere occasioni in cui siamo interessati
a una verità esistenziale forte, cioè un predicato che
risulti vero per un unico valore della variabile. Ad
esempio, alcuni giovani dall’animo poetico, si sforzano di dimostrare che la ragazza del momento è l’unica
donna che amano; alcuni matematici sono interessati al fatto che una certa equazione abbia un’unica
radice compresa tra 0 ed 1 (ognuno ha i suoi problemi). Il quantificatore “esiste uno ed un solo elemento x ∈ A” si abbrevia talvolta con l’espressione:
“∃!x ∈ A”. Tuttavia, si è restii ad assegnargli un nome specifico, poiché può essere parafrasato in vario
modo, come ad esempio: “esiste almeno un elemento
x ∈ A tale che p(x) = 1, e se x1 , x2 ∈ A sono tali
che p(x1 ) = p(x2 ) = 1, allora è x1 = x2 ”. Questo dimostra che non è necessario introdurre esplicitamente
questo ulteriore quantificatore.
I due quantificatori “∀” e “∃” sono, in un certo
senso che ora vedremo, uno l’inverso dell’altro. E’
chiaro che non esiste alcun numero reale x che sia
contemporaneamente minore di 5 e maggiore di 10.
Se allora p(x) =“x ∈ R è minore di 5” e q(x) =“x ∈ R
è maggiore di 10”, l’affermazione appena enunciata si
può formalizzare scrivendo:
La precedente proposizione diviene pertanto:
(∀x ∈ R) ¬(p(x) ∧ q(x))
che si legge: qualunque sia il numero reale x, non può
essere vero che x < 5 e, allo stesso tempo, x > 10
(naturalmente, la negazione di a < b è a ≥ b!). Questo passaggio ci convince, ed ora possiamo procedere
applicando la regola di De Morgan. Si ha cosı̀:
(∀x ∈ R) (¬p(x) ∨ ¬q(x))
che si legge: per ogni numero reale x si ha x ≥ 5
oppure x ≤ 10. Anche questo passaggio suona bene
e ci permette di renderci conto della validità della
regola enunciata. Essa va di pari passo con la duale:
• La negazione del quantificatore universale applicato a un predicato equivale al quantificatore
esistenziale della negazione del predicato stesso.
Continuando l’esempio precedente, possiamo osservare che: “Non è vero che per ogni numero reale x,
si ha che x è minore di 5 oppure che x è maggiore di
10”; infatti, i numeri 7 ed 8 (insieme agli infiniti altri
compresi tra 5 e 10) non sono né minori di 5, né maggiori di 10. La formulazione di questa proposizione
è:
¬(∀x ∈ R) (p(x) ∨ q(x)).
Da questa si passa a:
(∃x ∈ R) | ¬(p(x) ∨ q(x))
cioè: esiste almeno un numero reale x per il quale non
è vero che x < 5 oppure x > 10 (naturalmente, vanno
ancora bene gli esempi di prima). Infine si passa a:
(∃x ∈ R) | (¬p(x) ∧ ¬q(x));
questo significa: esiste almeno un numero reale x per
il quale x ≥ 5 e, allo stesso tempo, x ≤ 10. Questo,
ovviamente, è proprio vero!
I matematici, spesso, sembrano insistere un po’
troppo sulla “esistenza” di certi oggetti matematici, come ad esempio soluzioni di equazioni, elementi
particolari, etc.. In realtà, questo atteggiamento è
giustificato dal fatto che, se qualcosa non esiste, si
arriva a evidenti paradossi quando si ragioni come se
invece esistesse. L’esempio classico è il seguente: sia
N il più grande dei numeri naturali; se consideriamo
¬(∃x ∈ R) | (p(x) ∧ q(x)).
N 2 si deve avere N 2 ≤ N , dato che N non è superaTrasformiamo questa proposizione usando la seguente to da nessun altro naturale. Semplificando, abbiamo
N ≤ 1, cioè N = 0 oppure N = 1. Poiché 1 > 0,
regola:
abbiamo dimostrato che 1 è il più grande dei numeri
• La negazione del quantificatore esistenziale ap- naturali!
plicato a un predicato equivale al quantificatore
Esiste un’evidente asimmetria tra le verità geneuniversale della negazione del predicato stesso.
rali e quelle esistenziali. Per dimostrare infatti che
37
1.8. PREDICATI
un’affermazione di quest’ultimo tipo non è vera occorre far vedere che essa non è verificata da alcun
elemento dell’insieme S considerato, il che potrebbe
richiedere anche un tempo infinito, se infiniti sono
gli elementi di S. Viceversa, per dimostrare la non
validità di un’affermazione generale basta fornire un
esempio in cui essa non vale. Tale esempio costituisce
un controesempio dell’affermazione e assume il ruolo
di una vera e propria dimostrazione, ancorché negativa. Ricordiamo che da questa osservazione deriva il
concetto di falsicabilità, su cui Popper costruisce la
sua filosofia della scienza.
Per dare un’idea più matematica dei predicati, vorrei cercare di esporre un semplice ma importante
esempio di struttura algebrica. Con questo termine
si intende un insieme S sul quale sono definite una
o più operazioni, secondo quanto visto nella Sezione
1.3. Rispetto a tali operazioni l’insieme può godere
di alcune proprietà che permettono di caratterizzare
il significato della struttura. I numeri, con le quattro
operazioni elementari sono un esempio di struttura
algebrica e tale concetto serve a generalizzare le proprietà degli insiemi numerici rendendole indipendenti
dal concetto stesso di numero. In effetti, le strutture algebriche costituiscono l’argomento fondamentale
dell’Algebra Astratta, detta anche Algebra Moderna, perché si è sviluppata negli ultimi centocinquanta anni. Ritorneremo sopra a questo argomento nel
Capitolo 5 sull’Algebra; per il momento limitiamoci
ad introdurre alcuni concetti sia validi di per sé, sia
a mo’ di esempio dell’idea di predicato che stiamo
discutendo.
L’esempio più semplice di struttura algebrica è costituito certamente dal monoide, un insieme S con
un’operazione diadica indicata con un puntino (o la
semplice giustapposizione), detta prodotto, rispetto
alla quale S è chiuso, gode della proprietà associativa
e dell’esistenza di una identità. Formalmente, il monoide si indica con la coppia (S, ·) e le sue proprietà
si riassumono cosı̀:
1. ∀x, y ∈ S, il prodotto x · y sta in S;
2. ∀x, y, z ∈ S, si ha (x · y) · z = x · (y · z);
3. ∃e ∈ S tale che ∀x ∈ S si ha e · x = x · e = x.
E’ abbastanza naturale sentirsi sconfortati quando
ci si trovi davanti per la prima volta a una definizione del genere. Ma bisogna abituarsi poiché le strutture algebriche sono sempre definite in questo modo;
e bisogna andare oltre l’aspetto formale e cercare di
costruirsi un’idea più concreta cercando esempi significativi. A loro volta, tali esempi permettono di
indurre proprietà della struttura algebrica che ce la
fanno conoscere in modo più approfondito. La cosa a cui bisogna stare attenti è di non confondere le
proprietà specifiche dell’esempio con proprietà generali della struttura: per questo è sempre opportuna
dare dimostrazioni formali ed astratte delle proprietà
interessanti.
L’esempio più semplice di monoide è costituito
dai numeri naturali con l’operazione di somma, cioè
(N, +); le sue proprietà sono quelle stesse della somma e l’identità è il numero 0. In effetti, questo è un
monoide un po’ particolare, poiché per la somma vale
anche la proprietà commutativa, cioè:
∀x, y ∈ S si ha x · y = y · x.
Non è però difficile trovare esempi nei quali la proprietà commutativa non vale. Se A = {a1 , a2 , . . . , ak }
è un insieme di simboli (o lettere, per cui A si dice anche alfabeto), chiamiamo A∗ l’insieme delle parole (o
stringhe) su A, cioè le sequenze finite di simboli di A;
fra le parole mettiamo anche la parola vuota, cioè la
sequenza priva di simboli. La concatenazione di due
parole w1 , w2 ∈ A∗ è la sequenza formata dai simboli
di w1 seguiti da quelli di w2 . L’insieme A∗ con questa
operazione è un monoide (non commutativo). Infatti,
la concatenazione di due parole è ancora una parola
(chiusura) e la concatenazione di tre parole, comunque la si esegua w1 · (w2 · w3 ) oppure (w1 · w2 ) · w3
dà sempre la parola formata dai simboli di w1 , seguiti da quelli di w2 , seguiti da quelli di w3 . Infine,
concatenando la parola vuota a un’altra parola, sia
che la si metta a sinistra, sia che la si metta a destra,
quest’ultima parola non cambia.
Un terzo esempio di monoide è costituito da
(N0 , ×), cioè l’insieme dei numeri naturali (senza
lo zero) con l’operazione di moltiplicazione. Questi
esempi cosı̀ diversi ci fanno capire (o almeno intuire)
l’importanza delle strutture algebriche: ragionando
in astratto sulla struttura si ottengono proprietà che
valgono per tutti i monoidi, indipendentemente dalla
loro natura specifica. Questo, speriamo, sarà ancora più chiaro quando, nella Sezione 5.8, faremo vari
esempi di tali dimostrazioni.
Nota 1.12
Se si pensa alla notazione a stecchini
e ai numeri naturali come a sequenze di aste, ci si accorge che i due monoidi (N, +) e (A∗ , ·) non hanno poi
natura tanto diversa, ed N altro non è che A∗ quando A = {|}. La commutatività in N è semplicemente
dovuta al fatto che l’alfabeto si riduce a un solo elemento. D’altra parte, è spesso importante considerare
sequenze di simboli che formalizzano espressioni e formule. Ad esempio, l’Aritmetica tratta sequenze del
tipo “3+(12/4)”, l’Algebra ha a che fare con sequenze
come “3x2 − 5x − 8 = 0” e la logica formale considera sequenze come “(p ∨ ¬q) ∧ r”, ognuna costruita su
un dato insieme di simboli. La manipolazione di tali sequenze è un lavoro effettuato usando l’operazione
di concatenazione e la sua inversa, cioè l’estrazione di
38
CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA
una sottosequenza da una sequenza data. Se si vuole, l’Algebra e la Logica formale sono semplicemente
l’elaborazione di simboli mediante regole di trasformazione. Questo punto di vista si è rivelato fondamentale
per la Logica ed è l’impostazione che usano gli elaboratori elettronici per ogni applicazione non numerica.
Proprio grazie agli elaboratori attuali si ritiene ovvia la corrispondenza tra numeri e simboli (si pensi
alla codifica ASCII per i caratteri), ma tale corrispondenza, cambiando sequenze di simboli in sequenze di
numeri, non sempre è appropriata agli scopi che soprattutto la Logica si prefigge. Più interessante sarebbe trovare una corrispondenza tra parole e numeri
tale che ad ogni parola corrispondesse un numero ben
preciso. Se l’alfabeto A contiene k simboli, possiamo
pensare a w ∈ A∗ come a un numero scritto in base
k + 1 (spiegare perché non si può pensare ai numeri in
base k). Purtroppo, in Logica si deve poter disporre
di un alfabeto (potenzialmente) infinito, per rappresentare le proposizioni e le variabili. In questo caso, il
trucco precedente non funziona più. Verso la fine degli
anni 1920, Gödel pensò a questa corrispondenza. Sia
A = {a1 , a2 , . . .} l’insieme infinito dei possibili simboli
e sia w = ai1 ai2 . . . ain una parola non vuota su A. Se
pi indica l’i-esimo numero primo a partire da 2 (cioè
p1 = 2, p2 = 3, p3 = 5, p4 = 7, p5 = 11, etc.), allora il
numero naturale corrispondente a w è dato da:
G(w) = pi11 pi22 . . . pinn .
Ad esempio, se A = {a, b, c, d, . . .}, la parola bacca è
rappresentata da:
22 × 31 × 53 × 73 × 111 = 5. 659. 500.
Il numero è piuttosto alto, ma quello che interessa
non è la manipolazione effettiva di questi numeri,
quanto piuttosto la possibilità di trovare funzioni numeriche che, in principio, agiscano come le operazioni
sulle parole; questo, infatti, permette di simulare le
operazioni sulle parole o sulle espressioni per mezzo
di operazioni aritmetiche, le cui proprietà noi meglio
conosciamo. Il lettore volenteroso si può impegnare
a trovare funzioni che calcolano la lunghezza di una
parola (vista come numero), la concatenazione di due
parole (viste come numeri), il fatto che una parola
(numero) sia contenuta in un’altra (un altro numero),
e cosı́ via. Naturalmente, la prima cosa da fare è di
definire due funzioni per trasformare una parola in
un numero, e viceversa.
Una struttura algebrica un po’ più complessa del
monoide, ma anche molto più importante, è il gruppo. Anche in questo caso, abbiamo un insieme G e
un’operazione “·”, ma oltre alle proprietà di chiusura,
associatività ed esistenza dell’identità, si richiede che
ogni elemento abbia un inverso, cioè:
4. ∀x ∈ G, esiste y ∈ G tale che x · y = y · x = e.
Un elemento y che goda di tale proprietà si scrive
x−1 e si dimostra che è unico. Supponiamo infatti
che anche z sia un inverso di x; si ha allora:
z = z · e = z · (x · y) = (z · x) · y = e · y = y,
dove si sono applicate varie regole dei gruppi, in particolare la proprietà associativa e quella dell’identità.
Questo, osserviamo, è un teorema generale dei gruppi, valido, cioè, per ogni gruppo, indipendentemente
dalla natura particolare dei suoi elementi.
A questo punto, però, ci arrestiamo e rimandiamo
il lettore a ciò che diremo nella Sezione 5.8 o, meglio
ancora, ai testi universitari sull’Algebra Astratta.
Capitolo 2
Aritmetica
Legati ai numeri primi ci sono fondamentali concetti
come quello di divisibilità e di massimo comun divisore che, definiti dai Greci, si sono andati sempre più
sviluppando, e le loro problematiche si incontrano e
si scontrano, oggi, con quelle dei moderni elaboratori. Ad esempio, il problema della scomposizione di
un numero in fattori primi si è rivelato essere uno dei
problemi “intrattabili” per eccellenza, cioè uno dei
problemi per i quali non si conosce (e probabilmente
non è nemmeno possibile conoscere) una soluzione in
G. Rodari “Filastrocche in cielo e in terra”
tempi ragionevoli (ovviamente, quando il numero è
L’Aritmetica è la scienza dei numeri, più propria- abbastanza grande) perfino con i calcolatori più pomente dei numeri naturali N = {0, 1, 2, 3, . . .}, ed è tenti che esistono oggi o potranno esistere nel prosperciò strettamente connessa al concetto di “conta- simo futuro. Questo, per il momento, ha permesso
re”, visto nel capitolo precedente. Oggi, l’Aritmetica di utilizzare la scomposizione dei numeri nei moderè indissolubilmente associata alle operazioni elemen- ni metodi di cifratura per la trasmissione sicura di
tari, ed è con queste che si affronta lo studio dell’Arit- informazioni riservate nelle reti di calcolatori.
metica, non appena ci siamo impadroniti dei numeri
attraverso il contare. Non sempre è stato cosı̀, anzi,
fino al 1600 il saper fare di conto (detto anche “logi- 2.1
L’addizione
stica”) era considerata un’attività volgare, riservata
a commercianti e banchieri piuttosto che a scienziati Certamente l’operazione più semplice e naturale è
e filosofi. Questi, invece, erano dotti nell’Aritmeti- quella di sommare due numeri. L’antico pastore col
ca, inclusa come s’è detto nel Quadrivio, intesa come suo gregge di 57 pecore, alla fine dell’inverno, quanscienza che studia le proprietà dei numeri naturali. do trovava che erano nati 14 agnellini, era interessato
In questo senso, l’Aritmetica è nata in Grecia, e i a sapere di essere diventato proprietario di ben 71
Pitagorici consideravano i numeri come l’essenza del animali. Con numeri cosı̀ piccoli, la somma si può rimondo. Con Platone e Euclide la Geometria prese condurre al contare: il pastore poteva prima contare
il sopravvento, ma negli “Elementi” Euclide dedica le vecchie pecore (o ricordare quante fossero, incidentre libri all’Aritmetica. In particolare, i numeri pri- do delle tacche su un osso o un tronco), arrivare cosı̀
mi hanno sempre attratto matematici professionisti e a 57, e poi continuare a contare gli agnelli appena nadilettanti per le loro proprietà, spesso tra il meravi- ti: cinquantotto, cinquantanove, e via di seguito fino
glioso e l’incredibile, sempre comunque imprevedibili. a 71. Non sono rari reperti archeologici, risalenti anCi sono state persone che hanno dedicato la propria che a trentamila anni fa, costituiti da ossa di animali,
vita allo studio dei numeri primi, alla loro elencazio- sulle quali sono incise tacche con l’evidente scopo di
ne, nella vana ricerca di regolarità, di leggi e di regole registrare conteggi: queste tacche sono la prima rappresentazione pratica di ciò che abbiamo chiamato la
specifiche.
Bisogna dire che la curiosità per i numeri primi notazione ad aste.
è comune a tutta l’umanità e non è solo appannagQuando i numeri cominciano a superare il centinagio della cultura occidentale, derivata da quella gre- io, la conta diretta e la notazione ad aste diventano
ca. Oltre ai grandi matematici arabi, il celeberrimo inadeguate, ed è per questo che si sono cercati meto“teorema cinese dei resti” ci dice come anche nella di più veloci per eseguire la somma, come l’abaco o
lontana Cina (si parla del 1200) l’interesse fosse vivo. l’uso sapiente dei ciottoli. Questi, come le biglie delMa cosa era successo?
Che l’Uno e lo Zero
seduti vicini,
uno qua l’altro là
formavano un gran Dieci:
nientemeno, un’autorità!
Da quel giorno lo Zero
fu molto rispettato,
anzi da tutti i numeri
ricercato e corteggiato.
39
40
l’abaco, sono disposti su più linee, ognuna preposta a
rappresentare le unità, le decine, le centinaia e cosı̀ di
seguito. Tale modo di disporre ciottoli o biglie prefigura la nostra notazione, ma, come s’è visto, non ci si
è resi conto, fino a tempi relativamente recenti, come
la scrittura potesse essere direttamente utilizzata per
fare i conti.
Nella notazione posizionale, l’idea fondamentale è
che le unità si sommano alle unità, le decine alle decine, le centinaia alle centinaia, e cosı̀ via. Questo
funziona bene se facciamo 125 + 342, e il risultato è
proprio 467. Quando però tentiamo lo stesso metodo
su 347 + 158, ci troviamo subito di fronte alla difficoltà che 7 + 8, la somma delle unità, ci dà un valore
maggiore di 9 che quindi non è rappresentabile con
un’unica cifra. Tuttavia, si osserva, se prendiamo la
cifra delle unità di 7 + 8 = 15, cioè 5, la decina in
più può andare a incrementare il numero totale delle
decine della somma, cioè 4 + 5, che diventa 4 + 5 + 1.
Questo è il concetto di riporto, che ci è ormai familiare e che spiega come comportarci ogni volta che
una somma di unità, di decine, di centinaia, etc., ci
porta fuori del proprio ambito. Il riporto è la parte
che va al di là del gruppo di appartenenza delle cifre considerate, e quindi va ad aggiungersi alla cifra
della successiva potenza del 10: da unità a decine,
da queste a centinaia, e cosı̀ via. Nel nostro esempio,
4 + 5 + 1 = 10, e di nuovo dobbiamo considerare lo
0 come cifra della somma (delle decine, questa volta)
e l’1 come il riporto verso le centinaia. Qui, infine,
abbiamo 3 + 1 + 1 = 5, e quindi 505 è il risultato
corretto. Naturalmente, il gioco del riporto spiega
perché, nel caso che avessimo avuto riporto con la cifra di valore più alto (in questo caso, delle centinaia)
avremmo dovuto scrivere il riporto stesso come cifra
della successiva potenza del 10, delle migliaia nell’esempio. Cosı̀, 735 + 517 dà : 5 + 7 = 12, 2 come cifra
delle unità e 1 come riporto; 3 + 1 + 1 = 5, che è la
cifra delle decine; 7 + 5 = 12, cosı̀ che 2 è la cifra delle
centinaia e il riporto 1 diviene la cifra delle migliaia, anche se nei due numeri di partenza la cifra delle
migliaia era assente.
L’impostazione pratica della somma prevede di
scrivere i due numeri da sommare uno sotto l’altro, allineati a destra. Questo fa sı̀ che cifre omologhe, cioè
che si riferiscono alla stessa potenza del 10, si trovino
una sotto l’altra. E’ cosı̀ più agevole eseguire le somme parziali procedendo da destra verso sinistra. Per
rendere spedito il calcolo, è bene sapere a memoria
il risultato della somma di tutte le coppie possibili di cifre decimali, che riportiamo nella Tabella 2.1.
L’uso della tabella è ben noto: quando il risultato è
un’unica cifra, questa è la cifra da trascrivere nella
somma e non si ha alcun riporto (o, se si preferisce,
il riporto è 0); quando il risultato è costituito da due
CAPITOLO 2. ARITMETICA
9
8
7
6
5
4
3
2
1
0
9 10
8 9
7 8
6 7
5 6
4 5
3 4
2 3
1 2
0 1
0 1
11
10
9
8
7
6
5
4
3
2
2
12
11
10
9
8
7
6
5
4
3
3
13
12
11
10
9
8
7
6
5
4
4
14
13
12
11
10
9
8
7
6
5
5
15
14
13
12
11
10
9
8
7
6
6
16
15
14
13
12
11
10
9
8
7
7
17
16
15
14
13
12
11
10
9
8
8
18
17
16
15
14
13
12
11
10
9
9
Tabella 2.1: La tavola della somma
cifre, quella delle unità va trascritta nella somma, e
quella delle decine rappresenta il riporto da sommare
alle due cifre successive più a sinistra. In termini più
formali abbiamo il seguente algoritmo per eseguire
l’addizione:
Algoritmo 2.1 (Addizione di numeri decimali)
Ingresso: due numeri n = dr dr−1 . . . d1 d0 ed
m = cs cs−1 . . . c1 c0 scritti in notazione decimale;
Uscita: la somma n + m = bt bt−1 . . . b1 b0 .
1. se r < s scambiamo tra di loro i due numeri n
ed m;
2. se s < r, aggiungiamo alla sinistra di m esattamente r − s cifre 0. Questo non cambia il valore di m avendo aggiunto 0 × 10r + 0 × 10r−1 +
· · · + 0 × 10r−s+1 = 0. Questa operazione corrisponde all’allineamento a destra dei due numeri,
ma in questo modo possiamo assumere che i due
numeri abbiano la stessa lunghezza;
3. si pone p := 0, dove p indica il riporto;
4. Procedendo da destra verso sinistra,
ponendo successivamente j := 0, 1, . . . , r:
cioè
(a) poniamo v := dj + cj secondo quanto
riportato nella Tabella 2.1;
(b) poniamo v := v + p. Poiché il riporto p
può valere solo 0 oppure 1, questa somma
richiede, al più, di conoscere il successivo
dei numeri da 0 a 18;
(c) si pone bj uguale alla cifra delle unità di v
e si assegna al riporto p la cifra delle decine
di v (che sarà 0 oppure 1);
(d) si incrementa j e se risulta j ≤ r si cicla
tornando al punto 4a.;
41
2.1. L’ADDIZIONE
5. se il riporto p è zero, si pone t := r e la somma
è finita; altrimenti (p = 1) si pone br+1 := 1,
t := r + 1 e la somma è finita.
4
3
2
1
0
4
3
2
1
0
0
10
4
3
2
1
1
11
10
4
3
2
2
12
11
10
4
3
3
13
12
11
10
4
4
Il lettore si può divertire a riformulare questo algoritmo in modo da prevedere tutte le azioni svolte da
un operatore umano, come l’allineamento a destra e
le operazioni da fare quando si siano esaurite le cifre
del numero più corto. Abbiamo evitato questi passi
Tabella 2.2: La somma in base 5
estendendo le cifre del numero corto con una serie opportuna di zeri, un trucco che si usa sui calcolatori,
la stessa quantità di aste, gli insiemi rimangono
ma che non viene insegnato agli scolari.
uguali.
Si osservi che, di proposito, abbiamo utilizzato una
nomenclatura esatta, ma un po’ vaga; ora è bene Queste proprietà formali della somma sono molto
utili anche nella pratica; ad esempio, per sommare
ricordare la terminologia ufficiale.
68 + 14 + 32, ci si rende conto che 68 + 32 = 100,
Definizione 2.1 L’operazione definita dal preceden- e quindi il risultato è 114. Formalmente, occorrono i
te algoritmo si dice propriamente addizione e il suo seguenti passaggi, ma noi li eseguiamo ormai in modo
risultato è detto somma o totale. I numeri che si meccanico:
sommano si dicono addendi o termini.
(68 + 14) + 32 = 68 + (14 + 32) = 68 + (32 + 14) =
Quest’ultimo nome è un po’ ambiguo, poiché si parla
= (68 + 32) + 14 = 100 + 14 = 114.
anche di “termini di un’espressione”, di “termini di
una successione”, e cosı̀ via, però è del tutto approIl richiamo alla notazione ad aste ci vuol far capire
priato. La parola “addendo” si usa soprattutto per che queste proprietà non dipendono in alcun modo
enfatizzare il fatto che l’operazione che si sta conside- dalla notazione adottata, sia essa decimale od altra,
rando è proprio un’addizione. Di solito è tollerato l’a- ma sono intrinseche ai numeri come tali. Le ritrobuso di termine “operazione di somma”, ma è meglio veremo pertanto in vari capitoli, tra i quali quello
evitarlo, quando sia possibile (cioè quasi sempre).
dell’Algebra, dove si trattano le proprietà formali dei
La notazione ad aste, molto più di quella decimale, numeri, ignorando la loro rappresentazione, nascosta
è utile per dimostrare:
di proposito con l’uso delle lettere.
Naturalmente, l’Algoritmo 2.1 non è limitato, al• la proprietà commutativa dell’addizione: a + b =
meno nello spirito, ai soli numeri decimali; esso vale
b + a. Mettere in fila a aste e poi aggiungerne
per una qualsiasi base, purché si cambi opportunaaltre b è lo stesso che mettere b aste e aggiungerne
mente la Tabella 2.1. Ad esempio, per la base 5 si
a. In altri termini, a + b aste possono essere
usa la Tabella 2.2, dove tutti i numeri sono scritti in
immaginate anche come b + a aste;
quella base, per cui 125 = 710 , come ognuno s’aspetta
• la proprietà associativa: a + (b + c) = (a + b) + c. quando si sommi 3 con 4. I numeri di due cifre, come
Con le aste, comunque si proceda, si arriva alla appunto 12, stanno ad indicare un risultato (la cifra
delle unità) e un riporto (la cifra delle decine, che qui
fine con a + b + c aste;
sarebbe meglio dire delle cinquine).
• l’elemento neutro, o identità, per l’addizione è
Può essere un buon esercizio partire con due nu0: 0 + a = a + 0 = a. Aggiungere 0 aste vuol meri decimali, ad esempio 732 e 473, convertirli in
dire non cambiare proprio niente in un insieme base 5 mediante il metodo delle divisioni successive
di aste già predisposto, sia pur esso vuoto (cioè, (v. Sezione 1.5) ed eseguire la loro somma usando la
0 + 0 = 0).
Tabella 2.2. Si trova 73210 = 104125 e 47310 = 33435 ;
i due numeri vanno allineati a destra, e la somma si
• la proprietà dissociativa: se a = b + c allora
imposta in questo modo:
a + d = b + c + d; nella notazione ad aste, questo
significa che un gruppo di aste può essere “dis1 1 1
sociato” in due (o più) gruppi senza cambiare
1 0 4 1 2 +
il risultato finale; formalmente, questa proprietà
3 3 4 3 =
si può far discendere da quella associativa, ma
1 4 3 1 0
nella pratica è comodo distinguerla;
Abbiamo evidenziato i riporti, come si fa quando
• la proprietà di eliminazione: se a + c = b + c si impara a fare la somma e a questo punto basta riallora a = b; questo vuol dire che se abbiamo convertire il risultato 143105 = 120510 per controllare
due insiemi uguali di aste e da entrambi togliamo che l’operazione è ben fatta.
42
CAPITOLO 2. ARITMETICA
Il caso più semplice si ha quando la base è 2; non
serve nemmeno scrivere esplicitamente la tabella, visto che 0 + 0 = 0, 0 + 1 = 1 + 0 = 1 e 1 + 1 = 0
con riporto di 1. Quando il riporto 1 si aggiunge a
una somma parziale 1 + 1 si ha come risultato 1 e un
nuovo riporto unitario. Con queste cinque regole si
provi ad eseguire 90 + 57 = 147; procedendo come
sopra si ha:
1
1
1
1 0
1
0 0
1
1 1
1 1
1 0
0 1 0
0 0 1
0 1 1
+
=
e di nuovo lasciamo che il lettore si eserciti nella conversione tra basi diverse per controllare che il risultato è corretto e non lo stiamo ingannando con un
gioco di cifre.
Ma l’Algoritmo 2.1 funziona bene, con pochi accorgimenti in più, anche quando abbiamo di fronte
una base composta. Un esempio sarà sufficiente a
capire come si opera. Si considerino due angoli di
32◦ 47′ 54′′ e 18◦ 23′ 8′′ ; la somma si imposta allineando a destra sia le quantità, sia le loro parti omogenee
ed eseguendo poi le singole somme:
32◦
18◦
50◦
47′
23′
70′
54′′
8′′
62′′
+
=
Ora teniamo conto di quanto detto nella Sezione 1.5
per i numeri scritti fuori dei limiti della base composta; partendo da destra, 62′′ corrispondono ad 1′ 2′′ ,
cosı̀ che 1′ va a sommarsi agli altri 70′ . Ora, 71′ corrispondono a 1◦ 11′ , e il grado si somma agli altri 50◦ .
Il risultato finale è pertanto 51◦ 11′ 2′′ . Come si vede,
il riporto avviene ora passando dai secondi ai primi e
da questi ai gradi; infatti, secondi, primi e gradi sono le vere cifre della notazione e son loro che devono
rientrare nei limiti della base composta (360, 60, 60).
All’interno dei secondi, dei primi e dei gradi la somma avviene regolarmente, poiché in essi rispettiamo
la notazione decimale. Nessuno ci vieterebbe di usare
per le tre parti una base diversa da 10, ed eseguire
le somme di conseguenza; l’elaboratore elettronico,
ad esempio, rappresenta tutto in binario. Ma quest’ultima, ulteriore complicazione lasciamola perdere
e accontentiamoci di aver capito come si opera quando la notazione all’interno delle varie “cifre” è quella
decimale.
2.2
Confronto e sottrazione
Un’altra operazione elementare è il confronto tra numeri; il risultato non è questa volta un numero, come
per l’addizione, ma un valore di verità, cioè vero o
falso. Ad esempio, 5 = 3 è falso, mentre 3 < 5 è
vero. Di regola si considerano sei tipi di confronto
che si spiegano bene in termini di conteggio o nella
notazione ad aste:
• n = m (n è uguale ad m): i due numeri n ed m
sono uguali se sono indicati con lo stesso nome
ovvero se le loro rappresentazioni ad aste sono
lunghe uguali, quindi se c’è una corrispondenza biunivoca tra le aste che rappresentano i due
numeri;
• n 6= m (n è diverso da m): i due numeri non sono
uguali, cioè sono indicati da nomi diversi ovvero
la lunghezza delle loro rappresentazioni ad aste
sono differenti;
• n < m (n è minore di m): il nome di n precede il nome di m nel conteggio, ovvero c’è una
corrispondenza biunivoca tra le aste di n e un
sottoinsieme proprio delle aste di m (questo significa che la rappresentazione ad aste di n è più
corta di quella di m);
• n ≤ m (n è minore o uguale ad m): i due numeri
sono uguali (n = m) oppure n è minore di m,
secondo le precedenti specifiche;
• n > m (n è maggiore di m): il nome di n segue il nome di m nel conteggio, ovvero c’è una
corrispondenza biunivoca tra le aste di m e un
sottoinsieme proprio delle aste di n (questo significa che la rappresentazione ad aste di n è più
corta di quella di m);
• n ≥ m (n è maggiore o uguale ad m): i due
numeri sono uguali (n = m) oppure n è maggiore
di m, secondo le precedenti specifiche.
Nota 2.1
I concetti di “uguale” e “diverso” sono
tanto elementari che una loro definizione appare
assurda o fuorviante, perché cerca di spiegare cose
semplici con argomenti complessi. A ben guardare,
la nostra definizione di uguaglianza tra numeri è
riportata all’uguaglianza verbale (il che può avere
abbastanza senso) o ad una corrispondenza biunivoca.
Quest’ultima impostazione, come s’è visto, ha un
senso molto profondo e permette di ragionare di
“uguaglianza” anche per quantità non finite. Per tali
quantità, una impostazione puramente nominalista
non dà alcun risultato.
Dovrebbe essere chiaro dalla precedente elencazione che, in realtà, i confronti si riducono a due soli:
n = m ed n < m. Per gli altri si ha:
• n 6= m: non è vero che n = m;
• n > m: m < n;
2.2. CONFRONTO E SOTTRAZIONE
• n ≤ m: non è vero che n > m;
• n ≥ m: non è vero che n < m.
Come abbiamo visto per la somma, la notazione ad
aste è utile per dimostrare certe proprietà dei numeri relativamente ai confronti; formuliamo le seguenti
proprietà per la relazione “≤”, ma esse valgono anche per “<”, “≥”, “>” e “=”. Per la relazione “6=”
valgono le prime due, ma non vale la terza, come il
lettore dimostrerà con un controesempio, cioè fornendo quattro numeri a, b, c, d per i quali si ha a 6= b e
c 6= d, ma risulta a + c = b + d:
• proprietà di eliminazione: se a + c ≤ b + c allora
a ≤ b; se abbiamo due gruppi di aste, il primo
con un numero di aste non superiore al secondo,
ed eliminiamo dai due gruppi lo stesso numero
di aste, il primo rimane con un numero di aste
non superiore al secondo;
• proprietà di aggiunzione: se a ≤ b allora a + c ≤
b+c; questa è la proprietà inversa della precedente e si “dimostra” allo stesso modo rifacendosi
alla notazione ad aste;
43
1. se r < s, cioè le cifre di n sono in numero minore
delle cifre di m, si esce con il risultato “vero”;
2. altrimenti, se r > s, cioè se m ha più cifre di n,
si esce col risultato “falso”;
3. altrimenti (in questo caso r = s, i due numeri
hanno lo stesso numero di cifre), si pone j := r
e si procede da sinistra verso destra:
(a) se dj < cj si esce col risultato “vero”, poiché la cifra di 10j in n è minore di quella
in m e le cifre delle potenze superiori sono
uguali (se ce ne sono);
(b) altrimenti, se dj > cj si esce col risultato
“falso”;
(c) altrimenti (dj = cj ) si decrementa j di uno
e se è ancora maggiore o uguale a 0 si cicla
tornando al punto 3a.
4. se si arriva a questo punto (uscendo dal ciclo 3.)
significa che tutte le cifre di n sono ordinatamente uguali alle cifre di m, cioè n = m, e quindi si
esce col risultato “falso”.
Il lettore che abbia provato a scrivere l’algoritmo
• proprietà di monotonia: se a ≤ b e c ≤ d allora
per
m = n o che abbia seguito l’algoritmo precedente,
a + c ≤ b + d; se mettiamo insieme gruppi piccosi
sarà
certamente accorto che, cosı̀ come stanno, queli di aste otteniamo gruppi piccoli; se mettiamo
sti
algoritmi
sono errati. Infatti, ad esempio, già nel
insieme gruppi grandi, otteniamo gruppi grandi.
passo 1. ci si chiede se r < s: ma questo è proprio lo
Per portare questi confronti nel campo della rap- scopo dell’algoritmo! Lo stesso succede quando, per
presentazione decimale possiamo procedere con un controllare la condizione A), ci chiediamo se r = s,
teorema e con un algoritmo. Il teorema riguarda il laddove l’algoritmo vuol proprio servire a controllare
caso dell’uguaglianza e dal teorema discende un’ov- l’uguaglianza di due numeri. Come si risolve questo
via procedura, la cui formulazione lasciamo al piacere problema? La soluzione è semplice se trasformiamo
del lettore. L’algoritmo che diamo si riferisce invece questi algoritmi in algoritmi ricorsivi, cioè in procedure che, giunte a dover stabilire se r < s, o r = s,
al confronto n < m.
richiamano sé stesse per effettuare tale controllo.
Teorema 2.1 Siano n, m ∈ N; allora n = m se
Ha senso una cosa del genere, oppure ci trascina in
e solo se le rappresentazioni decimali di m ed n un circolo vizioso in cui l’algoritmo richiama sé stesso
coincidono.
infinite volte senza riuscire a trovare alcun risultato
definitivo? In realtà tutto procede in modo molto
Prova: Come abbiamo visto nella Sezione 1.5, la semplice, poiché la lunghezza di un numero è di regorappresentazione decimale di un numero è unica, e la molto inferiore al suo valore: bisogna escludere da
quindi le rappresentazioni coincidono se e solo se i questa regola i numeri 0 ed 1, ma per essi vedremo
numeri sono lo stesso.
tra un momento. Ad esempio, supponiamo di doNaturalmente, per controllare che le rappresentazio- ver confrontare un numero di 1274 cifre con uno di
ni di n ed m sono uguali occorre: A) stabilire se 853, cioè due numeri piuttosto grandi. Per effettuare
le lunghezze delle due rappresentazioni coincidono; tale confronto dobbiamo pertanto confrontare queste
B) se ciò è vero, stabilire se le cifre decimali sono lunghezze (r = 1273 ed s = 852, visto che gli indici
partono da 0). L’uso ricorsivo dell’algoritmo implica
ordinatamente uguali.
di dover valutare le lunghezze di questi due numeri,
che sono 4 e 3 rispettivamente (in effetti, il nuovo r è
Algoritmo 2.2 (Stabilire se n è minore di m)
Ingresso: Due numeri n, m ∈ N con la loro rap- 3 e il nuovo s è 2, ancora per la storia degli indici).
A questo punto, però, possiamo osservare che il
presentazione decimale n = dr dr−1 . . . d1 d0 ed m =
confronto fra cifre può essere codificato in una tabelcs cs−1 . . . c1 c0 ; dr 6= 0, cs 6= 0.
Uscita: “vero” se n < m, “falso” altrimenti.
la, analoga a quella dell’addizione, ma che per ogni
44
CAPITOLO 2. ARITMETICA
9
8
7
6
5
4
3
2
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
1
1
2
0
0
0
0
0
0
0
1
1
1
3
0
0
0
0
0
0
1
1
1
1
4
0
0
0
0
0
1
1
1
1
1
5
0
0
0
0
1
1
1
1
1
1
6
0
0
0
1
1
1
1
1
1
1
7
0
0
1
1
1
1
1
1
1
1
8
0
1
1
1
1
1
1
1
1
1
9
l’effettuabilità della sottrazione; fatto questo, la
giustificazione della proprietà è del tutto analoga
alla .precedente.
L’esecuzione della sottrazione avviene con un ben
noto algoritmo, nel quale il punto più complesso è
costituito dal prestito, cioè l’analogo del riporto nell’addizione. Purtroppo, il concetto di prestito è un
po’ più complicato: infatti il riporto agisce sulla cifra immediatamente a sinistra del punto in cui si è
verificato. Invece, il prestito può coinvolgere una cifra più lontana, quando nel mezzo ci siano degli 0.
D’altra parte, come si sa, da chi non ha niente come
lo 0 non si possono ottenere prestiti. Nel seguente
Tabella 2.3: La tavola del confronto per ‘minore’
algoritmo si usa la Tabella 2.1 che già conosciamo
dall’addizione. In realtà, il suo uso avviene all’inconcoppia di cifre (d, d′ ) ci dà 1 per “vero” se d < d′ , trario secondo quanto stabilito dalla Definizione 2.2:
e 0 per “falso” in caso contrario; si veda la Tabella per vedere quanto vale a − b occorre cercare nella riga
2.3. Questa tabella, molto meno interessante di quel- di b il valore a e quindi leggere il risultato nella base
la della somma, si ricorda però molto più facilmente e, della colonna corrispondente.
di solito, non viene data esplicitamente, come invece
abbiamo fatto noi ora, presi da un raptus di “amore Algoritmo 2.3 (Sottrazione)
Ingresso: Due numeri n, m ∈ N con m ≤ n e la
di completezza”.
Legata al concetto di confronto, c’è la seconda loro rappresentazione decimale n = dr dr−1 . . . d1 d0
ed m = cs cs−1 . . . c1 c0 ;
operazione di base dell’aritmetica: la sottrazione:
Uscita: la rappresentazione della differenza p = n −
Definizione 2.2 Dati due numeri n ed m tali che m = b b
r r−1 . . . b1 b0
m ≤ n, si dice differenza di m da n, e si indica con
n − m, il numero p tale che n = m + p. Il numero n
1. si procede da destra verso sinistra ponendo
si dice il minuendo mentre il numero m si chiama il
successivamente j := 0, 1, . . . , r;
sottraendo. L’operazione che permette di calcolare la
(a) se dj ≥ cj si pone bj = dj − cj secondo
differenza si dice sottrazione.
quanto riportato nella Tabella 2.1 e si va al
Da questa definizione discende che la sottrazione
passo 1f.;
è l’operazione inversa dell’addizione. Per questo mo(b) altrimenti (dj < cj ) sia k il primo indice
tivo, le proprietà di eliminazione e di aggiunzione,
maggiore di j tale che dk 6= 0 (per l’ipotesi
viste per la somma in relazione ai confronti, valgono,
che sia n ≥ m tale indice esiste senz’altro);
all’inverso, per la sottrazione, e invitiamo il lettore a
(c) si pone dk := dk − 1 (si effettua il prestito);
formularle in modo esplicito. La proprietà di monotonia, invece, non vale più e, anche in questo caso,
(d) per ogni indice h compreso tra k + 1 e j (se
il lettore è invitato a fornire qualche controesempio.
ce ne sono) si pone dh := 9 (era dh = 0);
Due nuove proprietà, che possono essere chiamate di
(e) si pone bj := (10 + dj ) − cj , secondo la
antimonotonia, risultano importanti; la prima è limiTabella 2.1;
tata a “≤” e “<”, la seconda è limitata a “≥” e a
(f ) si incrementa j e se è ancora j ≤ r si
“>”, :
riprende il ciclo al punto 1a.;
• se a ≤ b, c ≤ d e d ≤ a, allora a − d ≤ b − c; si os2. se, come può succedere, cr = 0 si eliminano le
servi che le condizioni date implicano c ≤ b, per
cifre iniziali br , br−1 , . . . , bh che siano 0 (e sia
cui le due sottrazioni sono entrambe valide; la
invece bh−1 6= 0).
giustificazione è abbastanza ovvia: se abbiamo
due insiemi di aste, il primo con un numero di
Dal significato della rappresentazione posizionale
aste non superiore al secondo, e dal primo togliadiscende
la giustificazione del prestito, che si spiemo tante o più aste di quante non ne togliamo
ga
meglio
con un esempio: se dobbiamo eseguire
al secondo, questo rimane con un numero di aste
1003−8,
la
prima azione da compiere è eseguire 3−8,
non inferiore al primo;
che non si può fare. D’altra parte, il prestito non
• se a ≥ b, c ≥ d, a ≥ d e b ≥ c, allora a − d ≥ b − c; può essere ottenuto né dalle decine né dalle centinaqui dobbiamo avere condizioni che ci assicurino ia; ottenerlo dalle migliaia vuol dire in effetti eseguire
45
2.3. MOLTIPLICAZIONE
proprio 1003 − 8. Ci si rende conto, allora, che un
prestito da 1000 può esser visto come un prestito da
990 + 10: il 10 si porta alle unità e il 990 rappresenta
le 9 decine e le 9 centinaia che abbiamo sostituito agli
0 preesistenti. L’impostazione tradizionale è:
0
9
9
10
1
0 0
0
9 9
3
8
5
−
=
e lo 0 iniziale si toglie per ottenere la rappresentazione
consueta.
Anche per il confronto e la sottrazione, pensare ad
una base diversa da 10 non crea grossi problemi. Il
confronto rimane inalterato, ed equivarrebbe ad un
insulto per il lettore riscrivere la Tabella 2.3 nel caso della base 5. La sottrazione, invece, prevede di
utilizzare la tabella della somma all’inverso e quindi,
se vogliamo sottrarre due numeri scritti in base 5, è
bene avere sott’occhio la Tabella 2.2. La parte interessante è fornita dal gioco del prestito che va seguito
attentamente. Utilizzando ancora i numero 732 e 473
(liberando il lettore dal tedio di altre conversioni) la
sottrazione si imposta cosı̀:
10
1
0
3
2
4
3
0
10
10
1
4
1
2
3
4
−
=
Partendo da destra ci accorgiamo che da 14′′ non
possono essere sottratti 26′′ ; si prende allora 1′ in
prestito dai 12′ del minuendo; questi sono ridotti ad
11′ , ma i secondi crescono a 74′′ , in quanto 1′ = 60′′ .
Abbiamo allora 74 − 26 = 48 come risultato per i secondi. Passando ai primi, non possiamo togliere 32′
dagli 11′ rimasti; si chiede un grado in prestito dai
28◦ del minuendo e si passa a 71′ , cioè 60 + 11. La
differenza 71 − 32 = 39 ci aggiusta il risultato per i
primi e quindi non rimane che sottrarre dai 27◦ rimasti gli 8◦ del sottraendo. Si ha cosı̀ il risultato finale
19◦ 39′ 48′′ . Il lettore può utilmente provare con altri
angoli o passare ad ore, minuti e secondi, per un più
diretto aggancio con la realtà di tutti i giorni. Quando si passa ai mesi e agli anni i calcoli si complicano
assai a causa della variabilità della lunghezza dei mesi e dell’intercalarsi degli anni bisestili. Il lettore può
provare a calcolare la propria età in numero di giorni
vissuti, basandosi sul giorno corrente e sulla data di
nascita e non trascurando i 29 di Febbraio che gli è
capitato di incontrare lungo la vita.
Concludiamo ricordando un altro metodo per eseguire la sottrazione. Fissiamo ad m + 1 il numero
delle cifre decimali con cui rappresentare i numeri,
cosı̀ che n = dm dm−1 . . . d1 d0 con le cifre più a sinistra eventualmente 0. Si dice complemento a 9 di n il
numero n̄ = cm cm−1 . . . c1 c0 definito da cj = 9 − dj ,
per ogni indice 0 ≤ j ≤ m. Si dice invece complemento a 10 di n il numero n
b = n̄ + 1. Lasciamo al
lettore la dimostrazione di questo fatto, dove p è un
numero naturale qualsiasi:
Ogni cifra che effettua un prestito va considerata come diminuita di 1; cosı̀ la cifra 1, seconda da destra,
diviene 0 e, dopo il prestito da 4, dà 10−4 = 1. Ora il
p+n
b − 10m+1 = p − n.
4 diviene 3 e 3 − 3 = 0. Anche in questo caso il lettoQuesto ci dà il metodo alternativo per eseguire la
re verificherà la correttezza del risultato mostrando
che 20145 = 25910 e 259 = 732 − 473 nella nostra sottrazione. Sia m = 5 cosı̀ che 1003 = 001003 e 8 =
000008, di modo che il complemento a 9 sia 999992 e
tradizionale base 10.
Non possiamo tralasciare un esempio in base 2, al- il complemento a 10: 999993. Eseguendo la somma:
meno come omaggio a sua maestà l’Elaboratore Elet0 0 1 0 0 3 +
tronico, campione di stenaritmia. La differenza tra
9 9 9 9 9 8 =
49 e 42 si calcola cosı̀:
(1) 0 0 0 9 9 5
1
1 1
1 0
0 0
1
10
0 0
1 0
0 1
1
0
1
1
1
0
1
−
=
dove il gioco del prestito è ben messo in evidenza.
Il risultato ignora i primi 0 e corrisponde al nostro
numero 7, come deve essere.
Aver capito il meccanismo del prestito significa
aver capito la sottrazione, anche nel caso dei numeri
scritti in una base composta. Facciamo un esempio
utilizzando ancora gli angoli e la notazione in gradi.
Si debba eseguire:
28◦
7◦
12′
32′
14′′
26′′
−
=
si trova il risultato che ci aspettavamo. L’elaboratore preferisce questo metodo, anche se naturalmente
trasposto alla base 2.
2.3
Moltiplicazione
La moltiplicazione altro non è che una sequenza di
somme; ad esempio, 5 × 4, che si può leggere “5 per
4 volte”, rappresenta la somma del numero 5 per 4
volte, cioè 5 × 4 = 5 + 5 + 5 + 5. Analogamente,
7 × 5 = 7 + 7 + 7 + 7 + 7 e scopo dell’operazione
di moltiplicazione è quello di abbreviare il calcolo di
queste somme ripetute. Ricordiamo che, tecnicamente, il termine “moltiplicazione” indica l’operazione,
46
CAPITOLO 2. ARITMETICA
mentre con prodotto ci si riferisce al risultato ottenuto; spesso si tende a usare queste due parole come
sinonimi, ma è bene che si impari a fare la distinzione per intendersi senza ambiguità. Il primo dei due
numeri da moltiplicare si dice moltiplicando, mentre
il secondo si chiama moltiplicatore; quando non sia
necessario distinguere tra i due, si usa il termine più
generico, ma perfettamente appropriato, di fattore.
Quindi, riassumendo, il prodotto è il risultato dell’operazione di moltiplicazione svolta tra due (o più)
fattori.
La proprietà associativa della somma permette di
eseguire il prodotto raggruppando in modo qualsiasi
i vari addendi; cosı̀ 7 × 5 = (7 + 7 + 7) + (7 + 7) =
7 × 3 + 7 × 2, cioè si ha: a × b = a × b1 + a × b2 purché
sia b = b1 + b2 . Questo si può scrivere:
a × b1 + a × b2 = a × (b1 + b2 ),
e questa si chiama la proprietà distributiva del prodotto rispetto alla somma. Un po’ meno ovvia è la
proprietà commutativa, che cioè sia a × b = b × a;
infatti, non è affatto evidente che a sommato a sé
stesso per b volte sia la stessa cosa che b sommato a
sé stesso per a volte. Tuttavia, se rappresentiamo il
numero 7 come una colonna di 7 palline, 7 × 5 vuol
dire mettere di seguito 5 colonne, ognuna formata di
7 palline. Otteniamo cosı̀ un rettangolo di palline e se
lo leggiamo in ordine di riga, ci accorgiamo che esso
è composto di 7 righe di 5 palline ognuna. Invertendo il ruolo tra righe e colonne, questo significa che
le stesse palline possono essere contate da 5 × 7, cioè
5 × 7 = 7 × 5.
e e e e e e e
e e e e e e e
e e e e e e e
e e e e e e e
e e e e e e e
Lo stesso tipo di difficoltà rilevato per la proprietà
commutativa, si trova quando vogliamo renderci conto della proprietà associativa, cioè la proprietà secondo la quale l’ordine di esecuzione di più moltiplicazioni consecutive non cambia il prodotto finale. Formalmente, questo si esprime con l’identità
a × (b × c) = (a × b) × c. In questo caso può aiutare la visione spaziale del risultato. Prendiamo una
colonna di a palline; come s’è visto, a × b corrisponde
a un rettangolo di palline; ora, (a × b) × c vuol dire ripetere questo rettangolo per c volte; questo si fa bene
sovrapponendo i c rettangoli su c strati; si ha cosı̀ un
parallelepipedo contenente a × b × c palline. Quando
si considera a × (b × c), dobbiamo prima eseguire il
prodotto b×c: partendo da una fila con c palline e replicandola b volte, otteniamo un rettangolo con b × c
palline; immaginiamo di disporlo verticalmente nello
spazio e replichiamolo a volte; otteniamo ancora un
parallelepipedo composto da a×b×c palline, e quindi
con lo stesso numero di palline di quello ottenuto in
precedenza. L’uguaglianza è cosı̀ provata. Naturalmente, vale anche una proprietà dissociativa, per la
quale al prodotto a × b possiamo sostituire a × c × d
se b = c × d.
Per quanto riguarda moltiplicazione e confronti, si
hanno proprietà analoghe a quelle della somma e che
si possono dimostrare proprio a partire da quelle:
• per tutte e sei le relazioni vale la proprietà di
aggiunzione: se a R b e c 6= 0, allora ac R bc;
• per tutte e sei le relazioni vale la proprietà di
eliminazione: se ac R bc e c 6= 0, allora a R b;
• per le cinque relazioni “≤”, “<”, “≥”, “>” e “=”
vale la proprietà di monotonia: se a R b e c R d,
allora ac R bd (con a, b, c, d 6= 0).
Partendo da queste proprietà possiamo cercare un
metodo per eseguire la moltiplicazione a partire dalla notazione posizionale dei numeri. Procediamo
Da questo modo di concepire il prodotto (che è per gradi, formulando via via alcune osservazioni.
poi del tutto naturale) seguono alcune proprietà re- La prima osservazione costituisce un vero e proprio
lative a fattori particolari quali lo 0 e l’1. Intanto, lemma:
1 × a = a deriva dal fatto che ripetere 1 per a volte ci fa chiaramente ottenere a. Si noti che questo è Lemma 2.2 Per moltiplicare un numero per 10 è
diverso da a × 1 che significa ripetere a per una sola sufficiente aggiungere uno 0 in fondo a destra alla
volta, e ottenere comunque a. Quello che sorprende sua rappresentazione decimale.
nella moltiplicazione è proprio il fatto che valga la
proprietà commutativa a × b = b × a, quando l’inter- Prova: Se n è il numero considerato, sia:
pretazione che diamo dei due fattori è completamente
n = dr dr−1 . . . d1 d0 =
diversa: di numero puro il moltiplicando e di “ripetitore” il moltiplicatore. Anche nel caso di un fattore
= dr × 10r + dr−1 × 10r−1 + · · · + d1 × 10 + d0 ;
0 questa diversità è evidente: 0 × a significa ripetere
0 per a volte, laddove a × 0 vuol dire ripetere a per per le proprietà associativa e distribuita si ha allora:
0 volte. Comunque, il risultato è sempre zero, cioè
10×n = dr ×10r+1 +dr−1 ×10r +· · ·+d1 ×100+d0 ×10
a × 0 = 0 × a = 0.
47
2.3. MOLTIPLICAZIONE
e quindi la rappresentazione di 10 × n è proprio
dr dr−1 . . . d1 d0 0 come si voleva.
Naturalmente, questo lemma si può estendere al
caso di moltiplicazione per 100, 1000 e cosı̀ via: basta aggiungere alla rappresentazione decimale di n
l’appropriato numero di 0, cioè quanti ne compaiono nell’altro fattore. La seconda osservazione è tanto
semplice che la possiamo fare in modo discorsivo: se
i due fattori di una moltiplicazione sono semplici cifre decimali, allora il prodotto è minore di 100, cioè
contiene al più due cifre decimali. D’altra parte, come ben si sa, il valore massimo è 9 × 9 = 81. Più
complessa è la terza osservazione:
Lemma 2.3 Se n è un numero qualsiasi ed m è rappresentato da un’unica cifra m = c, allora ogni cifra
di n × c è unicamente determinata dalla corrispondente cifra di n e dall’eventuale riporto del prodotto
di c con la precedente cifra di n.
Prova: Sia al solito dr dr−1 . . . d1 d0 la rappresentazione decimale di n; abbiamo allora:
9
8
7
6
5
4
3
2
1
1
18
16
14
12
10
8
6
4
2
2
27
24
21
18
15
12
9
6
3
3
36
32
28
24
20
16
12
8
4
4
45
40
35
30
25
20
15
10
5
5
54
48
42
36
30
24
18
12
6
6
63
56
49
42
35
28
21
14
7
7
72
64
56
48
40
32
24
6
8
8
81
72
63
54
45
36
27
18
9
9
Tabella 2.4: La Tavola Pitagorica
(b) sia sj la cifra delle unità di v; questa è la
j-esima cifra del risultato;
(c) sia k la cifra delle decine di v; questo è il
nuovo riporto;
(d) si riprende dall’inizio del ciclo;
3. Se k 6= 0 si pone sr+1 := k, mentre se k = 0 il
valore di sr+1 è nullo.
n×c=
dr ×c×10r +dr−1 ×c×10r−1 +· · ·+d1 ×c×10+d0 ×c.
La precedente osservazione ci assicura che d0 ×c ≤ 81,
e quindi tale prodotto determina la cifra delle unità
e può avere un riporto che influenzerà la cifra delle
decine; sia k tale riporto. La cifra delle decine si
calcola facendo d1 × c + k; questo valore non supera
81 + 8 = 89 e quindi genera al più un riporto verso
la cifra delle centinaia, ma non oltre. Si noti che
anche questa volta il riporto può essere al massimo 8.
Procedendo in modo analogo per le cifre successive,
si dimostra quanto affermato dal lemma.
Questo lemma porta a un algoritmo che stabilisce operativamente cosa dobbiamo fare per eseguire
la moltiplicazione fra un moltiplicando generico e un
moltiplicatore costituito da una sola cifra decimale.
Algoritmo 2.4 (Moltiplicazione per una cifra)
Ingresso: Un moltiplicando n = dr dr−1 . . . d1 d0
e un moltiplicatore m costituito da un’unica cifra c.
Uscita: La rappresentazione decimale del prodotto
n × m = sr+1 sr sr−1 . . . s1 s0 .
1. Si pone k := 0 come riporto iniziale;
2. Procedendo da destra verso sinistra,
ponendo j := 0, 1, . . . , r:
9
8
7
6
5
4
3
2
1
cioè
(a) sia v := dj × c + k, dove il valore di dj × c
risulta dalla Tabella 2.4, la ben nota Tavola
Pitagorica;
Sapendo moltiplicare n per un numero composto
da una sola cifra, il Lemma 2.3 ci permette ora di
moltiplicare due numeri qualsiasi. Infatti, sia m =
dr dr−1 . . . d1 d0 e si consideri n × m = n × dr × 10r +
n × dr−1 × 10r−1 + · · · + n × d1 × 10 + n × d0 . Qui,
n × d0 è il prodotto di n per la cifra delle unità d0 , e
questo può essere eseguito con l’algoritmo precedente;
n × d1 × 10 è il prodotto di n per la cifra delle decine
(e anche questo lo sappiamo fare) con uno zero in
fondo, e cosı̀ via fino a n × dr , che deve essere seguito
da r zeri. A questo punto, basta fare le somme di
tutti questi prodotti parziali. Questo è il principio
che tutti conosciamo, come conosciamo l’algoritmo e
la costruzione che servono ad eseguire comodamente
il prodotto nel suo complesso:
Algoritmo 2.5 (Moltiplicazione)
Ingresso: il moltiplicando n e il moltiplicatore m =
dr dr−1 . . . d1 d0 ;
Uscita: La rappresentazione decimale di n × m.
1. si scrive il moltiplicando n, il simbolo del prodotto “×” e, accanto o sotto, il moltiplicatore
m. Si scrive una linea di divisione dei fattori
dai risultati parziali e dal prodotto;
2. procedendo da destra verso sinistra, si considerano le varie cifre (j := 0, 1, . . . , r) del
moltiplicatore;
(a) si moltiplica n per dj e si aggiungono j zeri
alla fine;
48
CAPITOLO 2. ARITMETICA
(b) si aggiunge il prodotto cosı̀ ottenuto ai risultati parziali, allineandolo a destra con quelli
già presenti (se ce ne sono);
(c) si incrementa j e se non si è superato r si
cicla tornando al passo 2a.;
3. si scrive una linea di separazione che chiude i
risultati parziali cosı̀ ottenuti;
4. si esegue la somma dei risultati parziali,
ottenendo il prodotto finale.
Ad esempio, per moltiplicare 732 per 263 si procede
nel modo seguente:
× 263
732
2196
43920
146400
192516
Spesso, al posto degli zeri finali si preferisce operare
una scalatura dei prodotti n × dj , ma ovviamente il
significato e il risultato sono gli stessi.
Nota 2.2
La Tavola Pitagorica è stata la croce
di tanti scolari. D’altra parte, essa costituisce il perno
dell’esecuzione della moltiplicazione e, come tale, va
saputa a memoria, anche oggi che cosı̀ spesso demandiamo a calcolatori elettronici la maggior parte dei
nostri conti. La tavola serve per eseguire il prodotto
anche secondo un’impostazione che nei tempi passati ha avuto molto successo; se, ad esempio, vogliamo
calcolare 27 × 184, l’operazione si imposta cosı̀:
1
7
2
8
7
0
4
6
5
2
2
0
6
1
0
8
8
0
4
8
6
9
Si noti che ogni quadrato contiene il prodotto di due
cifre, cioè proprio il risultato dato dalla Tavola Pitagorica. Procedendo da destra verso sinistra, si eseguono le somme per diagonale alto/sinistra verso basso/destra e il risultato 4968 si legge facilmente. Questo metodo evita l’uso dell’algoritmo classico di moltiplicazione e riduce tutto alla Tavola Pitagorica. Ciò
lo rende abbastanza simpatico, l’unica difficoltà essendo l’esecuzione delle somme per diagonale, almeno
ai primi tentativi. Il lettore è invitato a formulare
l’algoritmo per realizzare questo metodo.
Quasi non fa uso della Tavola Pitagorica la tecnica
detta dei “contadini russi”. Scritti uno accanto all’altro moltiplicatore e moltiplicando, al di sotto si
scrivono rispettivamente la metà del primo (ignorando punto decimale e resto) e il doppio del secondo. Si
va avanti cosı̀ fino a che il moltiplicatore non è ridotto
ad 1, e si sommano infine i vari “doppi” del moltiplicando che corrispondono a valori dispari delle “metà”
del moltiplicatore. Ecco come si sviluppa il calcolo di
25 × 347:
25
12
6
3
1
347
(694)
(1388)
2776
5552
8675
12 è pari
6 è pari
Conviene prendere sempre come moltiplicatore il fattore più piccolo. Si dà per scontato che si sappia calcolare senza difficoltà il doppio di un numero, senza
usare la Tavola Pitagorica. La somma finale è inevitabile ed è opportuno aver cancellato bene i termini
da ignorare per non incorrere in facili errori. Perché
questo metodo funziona? Se convertiamo il moltiplicatore 25 in binario, si ottiene 11001, dove gli 1 corrispondono alle potenze di 2 da considerare per formare il 25 = 24 + 23 + 20 (si veda la Sezione 1.5).
Allora, 25 × 347 = 24 × 347 + 23 × 347 + 347 e questo è proprio ciò che si è fatto applicando il metodo
dei contadini russi. Costoro, c’è da scommeterci, non
immaginavano nemmeno che la loro tecnica di moltiplicazione sarebbe stata adottata dagli odierni elaboratori. Nel sistema binario la moltiplicazione per 2
(cioè il raddoppio) e la divisione per 2 (cioè il dimezzamento) sono operazioni particolarmente facili. Poiché
210 = 102 , raddoppiare un numero binario significa
aggiungergli uno 0 in fondo: il doppio di 510 = 1012
è 10102 = 1010 . Analogamente, dimezzare un numero vuol dire togliergli l’ultima cifra. Fra l’altro,
questa rappresenta il resto ella divisione: la metà di
2110 = 101012 è 10102 = 1010 con il resto di 1; la metà
di 2810 = 111002 è 11102 = 1410 con resto 0. Ecco allora come si imposta il prodotto di 2510 = 110012 per
2710 = 110112 :
11001
1100
110
11
1
11011
(110110)
(1101100)
11011000
110110000
resto 0
resto 0
A questo punto, dobbiamo sommare i “doppi” corrispondenti al resto 1; sappiamo fare la somma di due
addendi alla volta e quindi il risultato è dato da:
11011
11011000
11110011
110110000
1010100011
+
=
+
=
La conversione finale mostra che questo numero binario significa 675, il risultato corretto. A onor del
49
2.4. DIVISIONE
vero, se eseguiamo la moltiplicazione tra numeri binari secondo la tecnica consueta esposta per la base 10,
otteniamo gli stessi risultati parziali del metodo dei
contadini russi: basta osservare che, usando 25 come
moltiplicatore, ogni 0 non dà niente da sommare, e
ogni 1 dà lo stesso moltiplicando, scalato del numero opportuno di posizioni, cioè con la coda di 0 che
gli compete. La somma dei risultati parziali, infine, è
proprio quella appena eseguita. Volendo filosofeggiare, si vede cosı̀ come, qualche volta, strade diverse si
riuniscano per formare un unico, grande viale.
Questi metodi per eseguire la moltiplicazione, comunque, vanno bene solamente per numeri relativamente
piccoli, diciamo qualche decina di cifre binarie. Oggi,
però, come vedremo nel prossimo capitolo, la tecnica
richiede il prodotto di numeri espressi da qualche
centinaio di cifre binarie. Fortunatamente, esiste
almeno un metodo che permette di effettuare le
moltiplicazioni in modo molto più veloce, basato
sulla tecnica detta della trasformata veloce di Fourier
(FFT = Fast Fourier Transform), della cui esistenza
informiamo il lettore, ma il cui trattamento lasciamo
ai testi universitari.
Concludiamo accennando alla moltiplicazione dei
numeri scritti in una base composta. In effetti, non
moltiplicheremo due numeri del genere, ma ci limiteremo a moltiplicare un angolo per un numero
scritto in base 10. Ad esempio, cerchiamo il triplo
di 28◦ 32′ 54′′ ; moltiplicando separatamente per 3 le
tre componenti, si ha 84◦ 96′ 162′′ e a questo punto
scriviamo correttamente questa quantità: 162′′ sono 2′ 42′′ , e quindi i 2′ si aggiungono ai 96′ presenti.
Ora, 98′ sono 1◦ 38′ e il grado si aggiunge agli 84◦ già
trovati. In conclusione, il prodotto vale 85◦ 38′ 42′′ .
2.4
Divisione
Come la moltiplicazione è un’operazione che abbrevia
l’esecuzione di somme successive della stessa quantità, cosı̀ la divisione abbrevia la sottrazione da un
quantità data di un certo valore, tante volte quanto ciò risulti fattibile. Con un semplice esempio, la
divisione di 19 per 5 corrisponde a sottrarre da 19
il numero 5 tante volte quanto sia possibile. Cosı̀,
19 − 5 = 14, 14 − 5 = 9, 9 − 5 = 4 e a questo punto
non è lecito sottrarre ulteriormente 5 dalla differenza ottenuta, cioè 4. Poiché abbiamo potuto sottrarre
per tre volte il 5 dal 19, il numero 3 costituisce il risultato della divisione. Talvolta si dice che il 5 sta 3
volte nel 19.
La terminologia legata alla divisione è la seguente:
risultato si dice quoziente della divisione e il numero
che rimane dopo aver effettuato tutte le sottrazioni
(cioè il 4) vien detto resto o modulo. Se il resto di
una divisione è zero, si dice che la divisione è esatta,
o anche che il divisore sta nel dividendo. Infine, dati
due numeri n, m ∈ N si dice che n è divisibile per m,
o che n è multiplo di m, o che m divide n, o anche
che m è un divisore o un fattore di n, se esiste un
numero q ∈ N tale che n = m × q.
Da questa definizione consegue che il resto della
divisione è sempre strettamente minore del divisore, altrimenti si potrebbe eseguire almeno un’altra
sottrazione. Il concetto di divisione esatta innesca
un importante capitolo della Matematica: quello della divisibilità. Esso merita una speciale attenzione e
verrà compiutamente trattato più avanti. Il fatto che
n sia un multiplo di m (o che m sia un divisore di n) si
può esprimere affermando che il resto della divisione
di n per m è zero, cioè n = m × q + 0. Talvolta, per
indicare questo concetto, si scrive m|n ovvero m[n.
Lo 0 si considera divisibile per ogni numero naturale
m, in quanto soddisfa la definizione precedente con
q = 0.
Quella che abbiamo definito è talvolta detta divisione intera per mettere in evidenza che sono coinvolti solo numeri interi e mai numeri con il punto decimale, che, fra l’altro, finora non abbiamo nemmeno
introdotto. Il quoziente tra 19 e 5 è, come s’è visto,
3 e non 3.8, un numero che ancora non conosciamo
ufficialmente. Se n, m ∈ N, il quoziente si indica con
n/m, anche se talvolta si trovano le notazioni n//m
oppure n div m, per distinguere la divisione intera
dalla divisione decimale. Se q è il quoziente della divisione di n per m, ed r ne è il resto, si ha chiaramente
n = m × q + r, con 0 ≤ r < m. Infatti, m × q ha l’effetto opposto delle differenze successive e ristabilisce,
a parte il resto r, il dividendo; questo lo si ottiene poi
in modo esatto aggiungendo r.
Naturalmente, l’operazione di divisione non si esegue effettuando una dopo l’altra le sottrazioni necessarie: se il risultato fosse anche solo dell’ordine
delle migliaia, occorrerebbero ore ed ore per portare a termine un’operazione. Anche in questo caso si
può sfruttare la rappresentazione decimale dei numeri. Bisogna tuttavia essere coscienti del fatto che la
divisione è l’operazione più difficoltosa fra le quattro
operazioni di base. Daremo ora il ben noto algoritmo
per eseguire la divisione, ma vedremo come almeno
un passo rimane abbastanza oscuro e arbitrario, ancorché del tutto corretto. Questo parzialmente giustifica coloro che si trovano in difficoltà nel fare le
divisioni, specie quelle a più cifre.
Definizione 2.3 Il numero sul quale si effettua la Algoritmo 2.6 (La divisione)
divisione (il 19 nell’esempio) si dice il dividendo; il Ingresso: il dividendo n e il divisore m;
numero da sottrarre (cioè il 5) si chiama divisore. Il Uscita: il quoziente q e il resto r della divisione.
50
1. se n < m si pone q := 0, r := n e l’operazione è
terminata;
CAPITOLO 2. ARITMETICA
trovare come scoprirlo, senza perdere troppo tempo.
Questo fatto rende la divisione a due cifre uno scoglio fra i più complessi della matematica applicata,
2. altrimenti, siano n = nt nt−1 . . . n1 n0 ed m = oggi superato grazie all’uso massiccio dei calcolatori
ms ms−1 . . . m1 m0 le rappresentazioni decimali da tasca.
dei due numeri; deve essere t ≥ s dato che è
Un esempio di come si imposta la divisione può torn ≥ m;
nare utile; per maggiore chiarezza, abbiamo riportato
3. si considerano le prime s + 1 cifre di n, cioè esplicitamente le sottrazioni, anche se di regola viene
nt nt−1 . . . nt−s+1 nt−s = n′ e si confrontano con insegnato come evitare tale passaggio:
m; se n′ ≥ m si prosegue al passo successivo,
1 7 4 4 8 2 8
altrimenti si aggiunge ad n′ la cifra successiva di
1 6 8
6 2 3
n, ponendo ora n′ := nt nt−1 . . . nt−s nt−s−1 . Si
6 4
osservi che in questo caso è certamente n′ > m,
5 6
visto che n′ ha una cifra in più rispetto ad m;
8 8
4. sia k il massimo numero intero tale che m × k ≤
8 4
n′ . Tale numero è ≤ 9: infatti, per come si è
4
proceduto al punto precedente abbiamo n′ < 10 ×
Per le divisioni molto complesse, come per esempio
m e quindi k = n′ /m < 10. Quindi k è una cifra
.
.
.
e rappresenta la cifra decimale più a sinistra del 347 586 344 812 diviso per 1758, può essere conveniente scriversi, da una parte, la tabella dei multipli
quoziente q;
del divisore, cosı̀ da averla sempre sott’occhio e sco5. si esegue la sottrazione n′ − k × m = prire immediatamente quante volte il 1758 sta nella
pv pv−1 . . . p1 p0 , come rappresentazione decimale; parte considerata del dividendo.
La divisione per 2 si dovrebbe saper eseguire a men6. per ognuna delle cifre nj del dividendo non consite
o, almeno, senza dover impostare l’operazione coderate al passo 3. e procedendo da sinistra verso
me
nel caso generale. Le divisioni per 10, 100, 1000,
destra:
. . . , si fanno togliendo l’ultima cifra, le ultime due
(a) si aggiunge tale cifra nj a destra di cifre, le ultime tre, e cosı̀ via; le cifre tolte costituipv pv−1 . . . p1 p0 e questo numero lo si asse- scono il resto della divisione. Le divisioni per 4 si
gna ad n′ (si dice che si abbassa la cifra fanno bene dividendo due volte per 2; cosı̀, 147/4 si
nj );
esegue dimezzando 147 in 73 e poi questo in 36. Ana(b) si trova il massimo numero k per cui k × logamente, le divisioni per 8 richiedono di dimezzare
m < n′ (qui possiamo anche avere k = 0 se per tre volte. Le divisioni per 5 si fanno raddoppiann′ < m, eventualità da escludere al punto do il dividendo e poi dividendo per 10, cioè togliendo
4.; anche questa volta, k è un’unica cifra e l’ultima cifra. Infine, ricordarsi sempre che la divicostituisce la cifra successiva del quoziente); sione per 0 non ha senso (l’operazione è impossibile),
mentre la divisione per 1 dà sempre come quoziente
(c) si esegue la sottrazione n′ − k × m = il dividendo stesso.
pv pv−1 . . . p1 p0 , e, se ci sono altre cifre nel
Per quanto concerne divisione e confronti, possiadividendo n si cicla tornando al passo 6a.;
mo limitarci a riprendere dalla moltiplicazione la pro7. la sequenza delle cifre k ottenute ai passi 4. e prietà di eliminazione: se c è un numero diverso da
6b. costituisce il quoziente q; l’ultima differenza 0 e si ha ac R bc, allora possiamo dividere per c ed
ottenere a R b. La relazione R è una qualsiasi delle
pv pv−1 . . . p1 p0 è il resto r della divisione.
sei relazioni di base “≤”, “<”, “≥”, “>”, “=” e “6=”.
Come si vede, questo è l’algoritmo più complicato
Il resto della divisione intera ha un ruolo fondamenper ora incontrato; inoltre, come si diceva, c’è un pun- tale in Aritmetica e, di fatto, in tutta la Matematica.
to difficile costituito dai passi 4. e 6b. (che sono del Pertanto, e’ importante la seguente:
tutto analoghi): dati n′ ed m, come si trova k? cioè,
come si stabilisce quante volte m sta in n′ ? Quando Definizione 2.4 Il resto o modulo della divisione si
m è costituito da un’unica cifra, la Tavola Pitagorica, indica con la notazione n mod m, e se due numeri n1
usata all’inverso di come la si usa nella moltiplicazio- ed n2 hanno lo stesso resto nella divisione per m, si
ne, fa al nostro scopo, ma quando m è fatto di più scrive n1 ≡ n2 (mod m), che si legge: “n1 è concifre, è solo l’intuito matematico, l’esperienza o la for- gruo ad n2 , modulo m”. L’operazione che ci fa pasza bruta del provare che ci possono aiutare. E’ chiaro sare da un numero n ∈ N al resto n mod m si dice
che il valore di k è ben determinato, ma il difficile è riduzione modulo m.
51
2.5. DIVISIBILITÀ
Ad esempio, abbiamo 19 ≡ 14 (mod 5).
Dati due qualsiasi numeri n1 , n2 ∈ N, e fissato un
numero m ∈ N, possiamo sempre dire se n1 è congruo,
o non è congruo, ad n2 , modulo m: basta eseguire la
divisione e calcolare i due resti, cosı̀ che n1 ≡ n2
(mod m) se e soltanto se n1 mod m = n2 mod m.
Questo significa che abbiamo definito una relazione
su N, cioè una regola per correlare (o non correlare)
due qualsiasi numeri naturali. La cosa curiosa è che
questa relazione, detta di congruenza, gode delle stesse proprietà formali dell’uguaglianza: 1) la proprietà
riflessiva: ogni numero è congruente con sé stesso (infatti, il resto della divisione per m non può cambiare);
2) la proprietà simmetrica: se un numero n1 è congruo ad n2 , anche n2 è congruo ad n1 (infatti, si tratta
ancora dell’uguaglianza dei due resti); 3) la proprietà
transitiva: se n1 è congruo ad n2 , e questo è congruo
ad n3 , allora il numero n1 è congruo ad n3 (infatti,
i tre numeri hanno lo stesso resto nella divisione per
m). Si tratta quindi di una relazione di equivalenza
e, per quanto detto a suo tempo, possiamo mettere
assieme tutti i numeri che hanno lo stesso resto nella divisione per il numero fissato m. Ad esempio, se
m = 3 si hanno tre classi di equivalenza:
• numeri con resto 0: [0] = {0, 3, 6, 9, . . .};
• numeri con resto 1: [1] = {1, 4, 7, 10, . . .};
• numeri con resto 2: [2] = {2, 5, 8, 11, . . .}.
Non vi possono essere altri casi e gli insiemi cosı̀ ottenuti si dicono classi di resti. Ogni classe, infatti, è
individuata dal resto r che i suoi elementi hanno nella divisione per m. Fissato m, esistono esattamente
m classi, ciascuna corrispondente a uno dei possibili
resti 0, 1, . . . , m − 1. Per m = 2 le due classi sono
costituite, rispettivamente, dai numeri pari e dispari.
L’insieme delle classe di resti modulo m si indica con
la notazione Zm .
Di solito, per semplificare le notazioni, si scrive
semplicemente r invece di [r] e Zm = {0, 1, . . . , m−1}.
Le operazioni di addizione e di moltiplicazione su N
inducono operazioni analoghe su Zm :
Lasciando perdere, per ragioni di semplicità, la divisione, si chiama Aritmetica modulare di base m
l’insieme Zm con le operazioni dette. Il calcolatore elettronico rappresenta i numeri naturali con una
quantità fissa di bit, cioè di cifre binarie; di solito sono 16 o 32, cosı̀ che l’aritmetica del calcolatore è in
realtà un’aritmetica modulare, in cui m = 216 oppure m = 232 . Poiché 216 = 65536, questo significa che
27438 + 49512 = 11414 e 1000 × 100 = 34464; il programmatore ben conosce queste limitazioni e adotta
i necessari accorgimenti se un programma richiede
l’uso di numeri che possono superare m.
La somma, a causa dei riporti che si propagano
da destra verso sinistra, va eseguita sequenzialmente in questa direzione, di modo che, più sono i bit
usati nella rappresentazione dei numeri, più tempo
l’operazione richiede. All’inizio della storia degli elaboratori, pertanto, furono proposte tecniche di rappresentazione che, sfruttando comunque l’aritmetica modulare, potessero accelerare le operazioni, rendendole eseguibili in modo più parallelo, cioè senza un uso massiccio dei riporti. Se fissiamo k numeri (m1 , m2 , . . . , mk ), a due a due primi tra loro, possiamo rappresentare univocamente un numero
naturale a < M = m1 × m2 × · · · × mk mediante
una k-upla (a1 , a2 , . . . , ak ), dove ai ≡ a (mod mi ),
per i = 1, 2, . . . , k. Per le proprietà del modulo, se
b = (b1 , b2 , . . . , bk ) si ha:
a+b
a×b
= (a1 + b1 , a2 + b2 , . . . , ak + bk )
= (a1 × b1 , a2 × b2 , . . . , ak × bk )
dove ogni operazione è eseguita modulo mi ; il vantaggio è che le k operazioni sono indipendenti l’una
dall’altra e quindi possono essere eseguite in parallelo, accelerando cosı̀ il calcolo. Prendiamo ad esempio
m1 = 32 e m2 = 27, di modo che M = 32 × 27 = 864,
il numero 100 è rappresentato dalla coppia (4, 19) e
il numero 8 da (8, 8). Per esempio, si ha:
(20, 23) + (24, 20)
(14, 14) × (8, 13)
=
=
(12, 14)
(16, 20)
Il problema, a questo punto, è risalire da una coppia (o, in generale, da una k-upla) al numero che
a + b = a + b (mod m)
a × b = a × b (mod m). essa rappresenta; il lettore è invitato (per non dire
sfidato) a trovare i numeri naturali che hanno daQueste operazioni godono (più o meno) delle stesse to origine ai due esempi precedenti. Su questo punto
proprietà formali dell’addizione e delle moltiplicazio- (anche se non solo su questo) sono falliti questi strani
ne in N: chiusura, commutatività, associatività, di- calcolatori.
stributività. Inoltre, per ogni elemento r ∈ Zm , la
classe m − r agisce da opposto, poiché r + (m − r) =
Divisibilità
m = 0 (mod m), e quindi possiamo definire la 2.5
sottrazione in Zm :
Alcune proprietà dei numeri relative alla divisibilità
sono tanto importanti che è opportuno partire proa − b = a + (m − b),
prio da esse per parlare più diffusamente di questo
e questo è qualcosa di nuovo rispetto ad N.
concetto.
52
CAPITOLO 2. ARITMETICA
Teorema 2.4 Siano a, b due numeri naturali; allora: Prova: Consideriamo il caso del 9 e dimostriamo
qualcosa di più forte, e cioè che: la somma delle cifre
• se a e b sono divisibili per m, allora anche a + b decimali di un numero n ha lo stesso resto di n nella
e a − b (se a ≥ b) sono divisibili per m;
divisione per 9. Sia infatti n = ds ds−1 . . . d1 d0 la rappresentazione decimale di n. Per la regola posizionale
• se a è divisibile per m, allora a × b è divisibile
abbiamo:
per m; se poi anche b è divisibile per m, allora
a × b è divisibile per m2 ;
n = 10s × d + 10s−1 × d
+ · · · + 10 × d + d .
s
s−1
1
0
• se a è divisibile per m e b è divisibile per n, allora La somma delle cifre di n è σ = d +d +· · ·+d +d
s
s−1
1
0
a × b è divisibile per m × n.
e quindi:
n−σ =
Prova: Dire che a è divisibile per m significa che
esiste un numero naturale q tale che a = m × q; ana- (10s −1)×d +(10s−1 −1)×d
s
s−1 +· · ·+99×d2 +9×d1 .
logamente, esiste r ∈ N tale che b = m×r. Per la proprietà distributiva del prodotto rispetto alla somma Gli addendi di questa somma sono tutti divisibili per
9 e quindi n − σ = 9 × k per qualche k. Questo ci dice
si ha:
che n e σ hanno lo stesso resto nella divisione per 9.
a + b = (m × q) + (m × r) = m × (q + r)
Da ciò segue che n è divisibile per 9 se e solo se tale è
σ. Il risultato si estende ora immediatamente al caso
e questo significa che a + b è divisibile per m. Nello del numero 3.
stesso modo si dimostrano le altre proprietà.
Osserviamo esplicitamente che se σ > 9, si può calL’esecuzione della divisione è il metodo generale colare la somma σ ′ delle cifre di σ, che deve ancora
per determinare se un numero m divide o meno un godere della stessa proprietà. Applicando eventualaltro numero n (con n > m). Tuttavia, nella pratica, mente più volte questo procedimento, si arriva sempre
si possono dare alcuni criteri per stabilire ad occhio se a un valore compreso tra 0 e nove. Su questa proun numero n ∈ N è divisibile per un numero piccolo prietà, e sull’aritmetica modulare in base 9, si fonda
assegnato. Sono facili i criteri di divisibilità per 2, la famosa prova del nove. Sia ad esempio m × p = n e
3, 4, 5, 6, 8, 9, 10, 11, 12; più difficili e perciò non si voglia controllare che il risultato n della moltiplicapraticati sono i criteri per il 7 e per i numeri più zione sia esatto. Dividendo per 9 si ha: n = 9×a+rn ,
grandi, eccetto qualche caso particolare come 16, 25, m = 9×b+rm , p = 9×c+rp . Eseguendo il prodotto si
50, 100 e cosı̀ via.
trova m×p = 81×b×c+9×b×rp +9×c×rm +rm ×rp .
I primi tre addendi sono divisibili per 9 e quindi il reTeorema 2.5 Un numero n ∈ N è divisibile per 2 se sto della divisione di m × p per 9 deve essere uguale
e solo se la sua ultima cifra è tale; n è divisibile per al resto r della divisione di rm × rp per 9, e questo
4 se e solo se le sue due ultime cifre sono tali; n è r deve coincidere con rn . La prova del nove della
divisibile per 8 se e solo se le sue tre ultime cifre sono moltiplicazione consiste nel valutare r ed rn : se sotali.
no diversi, sicuramente la moltiplicazione è errata; se
sono uguali c’è una buona probabilità (non la certezProva: Se d è l’ultima cifra decimale di n, si ha za) che sia stata eseguita correttamente. Ad esemn = 10×k+d; poichè 10×k è certamente divisibile per pio, 25 × 37 = 925 e si ha rm = 7, rp = 1, quindi
2, n sarà tale se e solo se tale è d. Lo stesso argomento r = 7 che coincide con rn = 7. Si osservi però che
è valido per 4, quando si scriva n = 100 × k + h ed se avessimo ottenuto come risultato 952 (effettuando
h rappresenta il numero dato dalle due ultime cifre per errore il classico “rovescione”) la prova del nove
di n. Infine, per 8 si procede in modo analogo dopo avrebbe comunque dato un risultato positivo!
aver scritto n = 1000 × k + h, essendo questa volta h
il numero costituito dalle ultime tre cifre decimali di Teorema 2.7 Un numero n ∈ N è divisibile per 5 se
n.
e solo se tale è la sua ultima cifra decimale (cioè, se
e solo se termina per 0 o per 5); è divisibile per 10
Un numero si dice pari se e solo se è divisibile per 2;
se e solo se termina per 0.
dispari altrimenti. Lo 0 è pertanto un numero pari.
Il criterio dato dal teorema precedente ci permette
Prova: Analoga al caso del criterio di divisibilità
di stabilire se un numero è pari o dispari guardando
per 2.
semplicemente la sua cifra finale.
Naturalmente, da questo criterio discendono i
Teorema 2.6 Un numero è divisibile per 3 o per 9 se criteri di divisibilità per 25, 50, 100 e cosı̀ via.
e solo se tale risulta la somma delle sue cifre decimali. Analogamente, si ha il seguente risultato:
2.5. DIVISIBILITÀ
53
Corollario 2.8 Un numero n ∈ N è divisibile per 6 primo se è divisibile soltanto per sé stesso e per l’use e solo se è divisibile sia per 2 che per 3; è divisibile nità. Un numero che non sia primo si dice composto.
Il numero 1 è convenzionalmente considerato primo.
per 12 se e solo se è divisibile sia per 3 che per 4.
Diamo infine, senza dimostrazione che ormai dovrebbe essere alla portata del lettore, il seguente
criterio:
Teorema 2.9 Un numero n ∈ N è divisibile per 11
se e solo se: detta d la somma delle sue cifre di posto
dispari e p la somma delle sue cifre di posto pari, si
ha che la differenza:
|d − p| = (d − p) se d ≥ p, (p − d) altrimenti
è divisibile per 11.
Se indichiamo con Dm l’insieme dei divisori del numero m, dire che m ed n sono primi tra loro significa
che Dm ∩ Dn = {1}. Ad esempio, 24 e 35 sono primi tra loro, in quanto D24 = {1, 2, 3, 4, 6, 8, 12, 24}
e D35 = {1, 5, 7, 35}. Poiché lo 0 è divisibile per
qualsiasi altro numero, non lo si considera affatto
nel concetto di coprimalità. Si osservi infine che
Z∗12 = {1, 5, 7, 11} e Z∗15 = {1, 2, 4, 7, 8, 11, 13, 14};
quindi φ(12) = 4 e φ(15) = 8. Se due numeri sono
primi tra loro, non è detto che siano primi; l’esempio
più semplice è dato dai numeri 4 e 9. Viceversa, come
vedremo, se due numeri sono primi, essi sono anche
primi tra di loro. I numeri primi verranno trattati
più compiutamente nella prossima sezione.
La funzione toziente è molto importante nella teoria dei numeri e merita qualche considerazione, anche
se del tutto elementare. Dimostriamo il seguente:
Ad esempio, con questo criterio si vede subito che
83413 e 3465 sono entrambi divisibili per 11.
I criteri che abbiamo presentato dipendono dalla
base con cui i numeri sono scritti; pertanto, non ci
possiamo aspettare che essi siano ancora validi per
i numeri scritti in base 7 o in base 2. Ad esempio,
Teorema 2.10 Siano p, q due numeri primi; si ha
poiché in base 2 si ha 210 = 102 , un numero scritto in
allora:
base 2 è pari se e solo se termina per 0. Analogamen1. φ(p)
= p−1
te, sarà divisibile per 4 se termina per 00, divisibile
2. φ(pq)
= (p − 1)(q − 1)
per 8 se termina con 000, e cosı̀ via. Come esercizio,
3. φ(pk )
= pk − pk−1
il lettore è invitato a dimostrare che un numero bik h
4. φ(p q ) = (pk − pk−1 )(q h − q h−1 )
nario è divisibile per 3 se e solo se vale il criterio del
Teorema 2.9. Trasposto al caso corrente, esso signifi- Prova: 1. e 3. sono casi particolari di 2. e 4.
ca: siano d e p le somme delle cifre di posto dispari e
1. Si considerino i p numeri da 0 a p − 1; quando p
di posto pari; il numero è divisibile per 3 se e solo se
è primo, tutti questi numeri, eccetto lo 0, sono
|d − p| è divisibile per 3. Si provi con 1365.
primi
con p.
I criteri di divisibilità fanno parte della stenaritmia, cioè quell’insieme di regole che permettono di
2. Si considerino i pq numeri da 0 a pq − 1; ci sono
accelerare i conteggi. A parte il matematico profesq multipli di p: 0, p, 2p, . . . , (q − 1)p, e p multipli
sionista (che però per principio preferisce non fare i
di q: 0, q, 2q, . . . , (p − 1)q. Questi numeri sono
conti) sapere se un numero è divisibile per 2, 3, 4,
gli unici a non essere primi con pq e sono tutti
5 e cosı̀ via risulta utile quando si paga alla romana
distinti tra di loro, eccetto lo 0, che si trova in
o si debbono suddividere certe risorse tra un numero
entrambe le sequenze. Pertanto si ha:
di persone. Oggi si fanno i conti con i calcolatori,
φ(pq) = pq − p − q + 1 = (p − 1)(q − 1).
sia quelli grandi, sia quelli da tasca, ma saper destreggiarsi mentalmente tra i numeri è utile (anche i
3. Fra i pk numeri da 0 a pk − 1, solo quelli dicalcolatori, se impostati male, sbagliano) e salutare
visibili per p non sono primi con pk ; essi sono:
(un po’ di ginnastica al cervello non fa mai male).
0, p, 2p, . . . , pk − p = p(pk−1 − 1), cioè sono pk−1
Comunque più importanti sono altri concetti legati
in tutto. Da questo segue la formula.
alla divisibilità, come i numeri primi tra loro (che vedremo tra un istante), i numeri primi e il massimo
4. Il ragionamento è analogo a quello del punto 2.
comun divisore, che invece saranno introdotti nelle
Fra i pk q h numeri compresi tra 0 e pk q h − 1, non
sezioni successive.
sono primi con pk q h tutti e soli i multipli di p
e i multipli di q; ma i primi sono pk−1 q h e i seDefinizione 2.5 Due numeri si dicono primi tra locondi pk q h−1 , che vanno perciò esclusi dal totale
ro o coprimi se non hanno divisori comuni, eccetto
di pk q h numeri. In questo modo, però, abbiamo
l’1. Se m ∈ N è un numero diverso da 0, si inditolto due volte i multipli di pq, che sono in tutca con Z∗m l’insieme dei numeri minori di m e primi
to pk−1 q h−1 e devono essere di nuovo inclusi nel
∗
con m; la cardinalità di Zm si indica con φ(m) e la
totale:
funzione φ : N → N cosı̀ definita si dice la funzione
φ(pk q h ) = pk q h − pk−1 q h − pk q h−1 + pk−1 q h−1
toziente di Eulero. Infine, un numero p ∈ N si dice
54
CAPITOLO 2. ARITMETICA
e questa è la formula desiderata.
Queste formule permettono di calcolare la funzione φ(n) senza dover cercare esplicitamente i numeri
primi con n, come abbiamo dovuto fare dopo la Definizione 2.5; il lettore può ora verificare che i valori là
trovati son quelli che si calcolano col precedente teorema e non avrà difficoltà a valutare φ(72) e φ(100),
o anche φ(1. 000. 000). Nei primi due casi, lo invitiamo a scrivere esplicitamente gli elementi di D72 e di
D100 .
Ma quanto vale φ(30)? Poiché 30 = 2 × 3 × 5, il
teorema non si può utilizzare; la sua dimostrazione,
però, fornisce il metodo per risolvere il problema generale. Si consideri il numero n = pqr, dove p, q, r
sono numeri primi; il metodo usato nella dimostrazione del teorema si dice principio di inclusione ed
esclusione e possiamo ora applicarlo in questo modo:
• i numeri minori di n sono in tutto pqr e da questa
quantità partiamo;
• dal numero precedente dobbiamo escludere i
multipli di p (che sono qr), i multipli di q (che
sono pr) e i multipli di r (che sono pq), e si ha
pertanto pqr − pq − qr − rp;
• in questo modo, però, abbiamo escluso due volte
i multipli di pq (che sono r), i multipli di qr (che
sono p) e i multipli di rp (che sono q); essi devono
essere inclusi di nuovo, ottenendo cosı̀ pqr − pq −
qr − rp + p + q + r;
• ci accorgiamo ora che lo 0 (che deve essere escluso e che è l’unico multiplo di pqr), è stato prima
incluso, poi escluso 3 volte e quindi incluso 3
volte ancora; quindi va escluso di nuovo.
In conclusione, si ha:
φ(pqr) = pqr − pq − qr − rp + p + q + r − 1 =
= (p − 1)(q − 1)(r − 1),
e il lettore verificherà direttamente che φ(30) =
1 × 2 × 4 = 8, trovando esplicitamente D30 =
{1, 7, 11, 13, 17, 19, 23, 29}.
Nota 2.3
Questa tecnica fa vedere che il toziente
è una funzione moltiplicativa; con tale termine si indica una funzione f : N → N per la quale vale la seguente
proprietà. Sia n = pk1 1 pk2 2 · · · pkuu la decomposizione in
fattori primi (si veda la sezione successiva); allora:
f (n) = f (pk1 1 pk2 2 · · · pkuu ) = f (pk1 1 )f (pk2 2 ) · · · f (pkuu ).
Naturalmente, dobbiamo sapere quanto vale la f sulle
potenze di un numero primo, ma per il toziente sappiamo che φ(pk ) = pk −pk−1 , qualunque sia k, e quindi
la funzione risulta completamente definita.
Un’osservazione interessante è la seguente: siano
x, y ∈ Z∗m e consideriamo il loro prodotto xy; poiché né
x né y hanno un divisore comune con m, nemmeno xy
può averne. Ad essere rigorosi, questo fatto discende
dal Corollario 2.12 che ancora dobbiamo dimostrare;
tuttavia, siamo in una nota e possiamo permetterci
qualche libertà. Prendiamo ora il resto r della divisione di xy per m, cioè sia xy = km + r. Se r avesse
un fattore comune con m, tale fattore potrebbe essere
messo in evidenza nel membro destro e, ancora per
il futuro Corollario 2.12, xy dovrebbe essere divisibile
per tale fattore, cosa che abbiamo già escluso. Con
ciò abbiamo dimostrato che l’operazione x ∗ y = xy
(mod m) è chiusa. Ad esempio, in Z∗15 si ha 4∗7 = 13,
7 ∗ 8 = 11, 11 ∗ 13 = 8, 8 ∗ 8 = 82 = 4 e cosı̀ via. Valgono ovviamente le proprietà associativa e commutativa,
in quanto tali proprietà valgono per la moltiplicazione
usuale, sulla quale x ∗ y si basa. L’1 agisce da identità
e ogni elemento ha il suo inverso: 2 ∗ 8 = 1, 4 ∗ 4 = 1,
7 ∗ 13 = 1, 11 ∗ 11 = 1, 14 ∗ 14 = 1, di modo che 2
e 8, 7 e 13 sono l’inverso l’uno dell’altro, mentre 4,
11, 14 hanno come inverso sé stessi. Siamo quindi di
fronte a un gruppo (v. Sezione [1.8]). I matematici
si sono dati da fare per studiare questi strani gruppi
∗
, ∗) e ne hanno trovato tante proprietà. Inaspet(Zm
tatamente, alla metà degli anni 1970, Rivest mostrò
come questi gruppi potessero essere utili per assicurare la privatezza dei messaggi, ad esempio durante la
loro trasmissione in una rete pubblica come Internet.
Essi infatti permettono di cifrare i messaggi in modo
particolarmente efficace.
Il metodo si basa su questa proprietà, già dimostrata
da Eulero 200 anni prima: per ogni elemento x ∈ Z∗m
si ha xφ(m) = 1, cioè in Z: xφ(m) ≡ 1 (mod m).
Il lettore è invitato a verificare questa proprietà su
Z∗15 , ma la dimostrazione (che vedremo parlando di
Algebra Astrattanella Sezione 5.8) ci assicura che la
regola vale in generale. Quello che interessa è questo:
moltiplicando i due membri dell’uguaglianza per x si
ha: xφ(m)+1 = x. Se abbiamo due numeri p ed s,
tali che ps = kφ(m) + 1, possiamo procedere a cifrare e decifrare un messaggio con la seguente tecnica.
Sia x il messaggio, interpretato come numero; questo è sempre possibile poiché possiamo, ad esempio,
interpretare ogni lettera come cifra in un sistema di
numerazione in base 21 (vedere la Sezione 1.5). Prendiamo xp ∈ Z∗m come codifica cifrata del messaggio e
usiamo l’altro numero s per decifrarlo; in effetti si ha:
(xp )s = xps = xkφ(m)+1 = x(xφ(m) )k = x1k = x
(tutte le operazioni sono fatte modulo m) e quindi abbiamo ottenuto il messaggio di partenza, decifrando il messaggio cifrato. Naturalmente, affinché
il marchingegno funzioni si devono verificare certe
condizioni:
1. il numero s sia segreto, conosciuto solo da chi
deve ricevere il messaggio, altrimenti addio privatezza. Viceversa, il numero p deve essere pubblico, noto a tutti, in modo da poter essere usato
55
2.6. NUMERI PRIMI
da chiunque voglia mandare un messaggio a chi
conosce s;
3. Si cancellano dalla lista L tutti i multipli di p, p
escluso;
2. dalla conoscenza di p e di m non si possa risalire
a φ(m), altrimenti dal fatto che ps = kφ(m) + 1
si potrebbe conoscere s e “rompere” il codice;
4. Si considera il primo numero della lista
successivo a p che non sia stato cancellato;
3. sia facile (almeno per un calcolatore) eseguire le
potenze xp ed (xp )s modulo m.
5. Se tale numero esiste, lo si assegna a p e si torna
al punto 3.
La prima condizione è una questione personale di
chi conosce s: poiché lo conosce solo lui, starà a lui
non rivelarlo a nessun altro. La seconda condizione
sembra assurda, perché m deve essere noto a tutti
per poter fare le operazioni modulo m, e da m si deve
poter risalire a φ(m). In realtà, questo è il punto
interessante del metodo, ma ci ritorneremo sopra un
po’ più avanti, non appena avremo approfondito il
concetto di numero primo, per il momento, diamola
per buona. La terza condizione, invece, è semplice:
per calcolare xp (mod m) non si deve calcolare xp
e poi ridurre modulo m, il che comporterebbe la
manipolazione di numeri enormi. Conviene piuttosto
ridurre modulo m ad ogni operazione. E’ questo uno
dei casi in cui la tecnica dei contadini russi risulta
particolarmente utile, come mostra un semplice
esempio. Si voglia calcolare 513 (mod 7); valutiamo
le potenze raddoppiando ogni volta l’esponente:
52 = 4, 54 = (52 )2 = 42 = 2, 58 = (54 )2 = 22 = 4,
tutto modulo 7. A questo punto sarebbe inutile
calcolare 516 , ma usiamo piuttosto le potenze trovate
per calcolare 513 : 512 = 58 × 54 = 4 × 2 = 1, e infine
513 = 512 × 5 = 1 × 5 = 5. Si noti che φ(7) = 6,
e quindi questa è anche una verifica del precedente
risultato di Eulero. Nella realtà, come vedremo, sono
coinvolti numeri con oltre 200 cifre decimali, ma,
fortunatamente, i conti non devono essere fatti a
mano e i bravi calcolatori pensano loro a tutto.
6. Altrimenti, avendo esaurito la scansione della lista L, si è finito ed L contiene i numeri primi
desiderati.
2.6
Numeri primi
Ad esempio, per i numeri da 1 a 25, si comincia
con la lista:
(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17,
18, 19, 20, 21, 22, 23, 24, 25)
dove abbiamo marcato il valore di p. Cancelliamo i
multipli di 2:
(1, 2, 3, 4 , 5, 6 , 7, 8 , 9, 10 , 11, 12 , 13, 14 , 15,
16 , 17, 18 , 19, 20 , 21, 22 , 23, 24 , 25).
Il nuovo valore di p è 3 e se ne cancellano i multipli
rimasti:
(1, 2, 3, 5, 7, 9 , 11, 13, 15 , 17, 19, 21 , 23, 25).
A questo punto il successivo valore di p è 5, e il suo
unico multiplo nella lista L è 25. Tolto anche lui,
abbiamo:
L = (1, 2, 3, 5, 7, 11, 13, 17, 19, 23);
i numeri rimasti non hanno multipli in L, e quindi
questo è l’insieme dei numeri primi minori o uguali a
25.
La determinazione del fatto che un numero sia primo o composto può essere fatta senza costruire in
modo esplicito una tabella di numeri primi. Si osservi che se un numero p è composto, cioè p = n×m con
n ed m diversi da 1, allora uno dei due fattori deve
√
essere minore o uguale a ⌊ p⌋. Infatti, se avessimo
√
√
m > ⌊ p⌋ e n > ⌊ p⌋, sarebbe anche m × n > p (si
veda il Teorema 1.6). Si ha allora il seguente metodo:
I numeri primi rappresentano sicuramente uno dei più
antichi e misteriosi concetti della Matematica. Sono
primi i numeri 2, 3, 5, 7, 11, 13, 17. Sono composti
tutti i numeri pari, eccetto il 2, nonché 9, 15, 21, etc.
Se si esclude il 2, tutti i numeri primi sono dispari.
Un elenco di tutti i numeri primi minori o uguali a
un assegnato numero n si può ottenere con il seguente algoritmo, noto fin dall’antichità come crivello di Algoritmo 2.8 (Numero primo o composto?)
Eratostene:
Ingresso: Un numero n ∈ N.
Uscita:
“Primo” se n è un numero primo,
Algoritmo 2.7 (Crivello di Eratostene)
“Composto” altrimenti.
Ingresso: un numero n ∈ N maggiore di 2;
Uscita: l’elenco dei numeri primi minori o uguali ad
1. Si pone p := 2;
n.
2. Se n è divisibile per p, allora il numero n non è
1. Si dispongono in una lista L tutti i numeri da 2
primo e si esce dopo aver scritto “Composto”;
fino ad n.
3. Altrimenti (p non divide n) si considera il
2. Si pone p := 2;
numero primo successivo a p;
56
CAPITOLO 2. ARITMETICA
4. Detto ancora p tale numero primo, se p2 > n il la scomposizione in fattori primi è da seguire con
numero n non ha divisori e quindi si esce dopo attenzione:
aver scritto “Primo”;
Algoritmo 2.9 (Scomposiz. in fattori primi)
5. Altrimenti (p2 ≤ n) si torna la punto 2.
Ingresso: Un numero n ∈ N;
Uscita: La sua scomposizione in fattori primi.
Come esempio, si consideri n = 317. I numeri primi
con cui provare la divisibilità sono 2, 3, 5, 7, 11, 13,
1. si pone m := n, p := 2 e si inizializza L come
17, in quanto 192 = 361 > 317. Nessuno di questi
lista vuota;
numeri primi divide 317, e quindi si può concludere
che 317 è un numero primo.
2. se m è divisibile per p allora:
Per un numero composto n ha senso trovare la sua
scomposizione in fattori primi, cioè l’insieme dei nu(a) si aggiunge p alla lista L;
meri primi p1 , p2 , . . . , pk tali che n = p1 ×p2 ×· · ·×pk .
(b) si divide m per p e il quoziente diviene il
Naturalmente, anche un numero primo p ha una
nuovo valore di m;
scomposizione che si riduce al solo fattore p. Convenzionalmente, la scomposizione di un numero si
(c) se m = 1 allora l’algoritmo è terminato; L
scrive n = pk11 pk22 . . . pkuu dove p1 , p2 , . . . pu sono nucontiene la lista ordinata dei fattori primi
meri primi distinti; ki si dice la molteplicità di pi .
di n;
Un’osservazione importante è il seguente:
(d) altrimenti (m 6= 1) si riprende il ciclo dal
punto 2.
Teorema 2.11 Se n ∈ N è un numero naturale qualsiasi, allora la sua scomposizione in fattori primi è
3. altrimenti, cioè se m non è divisibile per p:
unica, a parte l’ordine con cui i vari fattori sono
considerati.
(a) si considera il numero primo successivo a
Prova: Supponiamo che n abbia due scomposizioni
p;
pk11 pk22 . . . pkuu e q1h1 q2h2 . . . qshs . Alcuni fattori possono
(b) si chiama ancora p tale numero primo;
essere uguali, per cui dividiamo entrambe le scompo(c) se p2 > n allora l’algoritmo è finito: si agsizioni per tali fattori. Si ottengono cosı̀ due scompo′
giunge m alla lista L che viene a contenere
sizioni di un numero n che non hanno fattori comuni.
l’elenco ordinato dei fattori primi di n;
Vogliamo dimostrare che n′ = 1. Se cosı̀ non è, sia
p un fattore della prima scomposizione, per cui si ha
(d) altrimenti (p2 ≤ n) si riprende dal punto 2.
n′ = p × t. D’altra parte p non può dividere nessuno
dei q dell’altra scomposizione, che sono tutti primi,
Il passo 3a non è particolarmente semplice, poiper cui si deve avere n′ = p × t′ + r, con 0 < r < p. ché richiede di sapere già quali sono i numeri primi;
Uguagliando le due espressioni si ha p × t = p × t′ + r, per questo si sostituisce in pratica con l’istruzione:
cioè p × (t − t′ ) = r. Ora, se t = t′ si ricava r = 0
(a’) si pone p := p + 2; cioè si considerano tutti i
contro l’ipotesi su r; se viceversa t > t′ (in quanto numeri dispari; ciò rallenta un po’ l’esecuzione, ma
non ha senso che sia t < t′ ), allora abbiamo che p è non lede la correttezza dell’algoritmo. Si osservi inolun fattore di r, contro l’ipotesi che r sia minore di p. tre che il punto 3c. prende in considerazione anche
Quindi l’ipotesi delle due scomposizioni è assurda, a l’eventualità che n possa essere un numero primo.
meno che non sia n′ = 1, ma questo, di fatto, significa
Nella lista L il numero primo p compare k volte, se
che le due scomposizioni di n erano uguali.
k è la molteplicità di p in n. Ad esempio, il numero
Vale la pena di scrivere esplicitamente il seguente
fatto:
Corollario 2.12 Se p è un numero primo che divide
il prodotto m × n, allora p deve dividere m o n.
Prova: Se p divide m × n, deve comparire nella sua
scomposizione in fattori primi. Se non compare né
in quella di n, nè in quella di m, per l’unicità della
scomposizione, non può comparire nemmeno nel loro
prodotto.
792 dà luogo alla seguente computazione:
792
396
198
99
33
11
1
2
2
2
3
3
11
Si scrive 792 = 23 ×32 ×11; il fattore 2 ha molteplicità
Poiché un certo numero primo p può divide- 3, il fattore 3 ha molteplicità 2 e il fattore 11 ha
re n più di una volta, l’algoritmo di ricerca del- molteplicità 1.
57
2.6. NUMERI PRIMI
Nota 2.4
Se n persone si volessero scambiare tra
loro messaggi mantenendone la privatezza, è facile vedere che occorrerebbero n(n−1)/2 chiavi di ciframento
diverse, una per ogni coppia di utenti. Cosı̀, un milione di persone richiederebbero 500 miliardi di chiavi
distinte. Più ragionevole è il metodo seguente: ogni
persona ha una chiave pubblica di ciframento P , nota
a tutti, e una chiave di deciframento segreta S, nota
a lui solo. Se qualcuno gli deve spedire un messaggio M , lo codifica con la chiave pubblica ottenendo
un messaggio cifrato P (M ), ed è questo che spedisce.
Chiunque lo intercetti, non conoscendo la chiave di deciframento S non lo potrà leggere in chiaro; solo chi lo
deve ricevere, applicando a P (M ) la chiave S otterrà
S(P (M )) = M . Questo metodo richiede solamente
due milioni di chiavi (un milione di P e un milione di
S) per il nostro milione di persone, e questo è un bel
risparmio.
Per trovare praticamente le chiavi, si fissano due numeri primi x ed y piuttosto grandi, diciamo con 100
cifre decimali; fortunatamente, esistono metodi abbastanza veloci per determinare se un numero è primo o
composto senza dover fare tutte le prove di divisibilità.
Si pone poi m = xy di modo che φ(m) = (x−1)(y−1);
si osservi che m è un numero di 200 cifre decimali. I
due fattori x ed y sono tenuti segreti, mentre m è
reso pubblico. I metodi conosciuti per trovare la decomposizione in fattori primi di m sono riconducibili
tutti al metodo esaustivo di cercare sistematicamente
i divisori mediante il precedente algoritmo; questo metodo, applicato a un numero grande come m richiede
qualche centinaio di anni di lavoro del più potente calcolatore attuale. Ciò dà la sicurezza che, in pratica, la
scomposizione m = xy non verrà mai trovata, poiché
non c’è alcuna certezza nel cercarla. A questo punto si
procede cosı̀: se un utente U chiede di poter usufruire
del servizio (ad esempio su Internet), il sistema o l’ente
preposto a queste cose estrae a caso un numero primo
p, diverso da x ed y e dai numeri già assegnati. Anche
p è un numero di circa 100 cifre decimali, cosı̀ che se ne
possano trovare in abbondanza. Viene poi determinato un numero s (non necessariamente primo) tale che
ps ≡ 1 (mod φ(m)), cioè ps = kφ(m) + 1 per qualche numero intero k. Il numero p viene reso pubblico
e inserito nell’elenco delle chiavi pubbliche associato
al nome dell’utente U ; il numero s viene comunicato
ad U e costituisce la sua chiave segreta.
Quando un utente V vuole spedire ad U un messaggio
M , cerca nell’elenco (una specie di elenco telefonico elettronico delle chiavi pubbliche) il numero
p corrispondente ad U . Trasforma il messaggio M
in una sequenza di numeri di 200 cifre ciascuno
M1 , M2 , . . . , Mr ; applica ad ogni numero la chiave
pubblica ottenendo M1p , M2p , . . . , Mrp e spedisce il
messaggio cosı̀ codificato (ogni numero Mi deve
essere un numero minore di m e viene trasformato in
un altro numero minore di m). Il ricevente U applica
la chiave s a ciascuno dei numeri ricevuti, ottenendo
(M1p )s = M1 , (M2p )s = M2 , . . . , (Mrp )s = Mr , per
quanto detto. Ma questa è la sequenza di partenza
che, letta in lettere invece che in cifre, è il messaggio
in chiaro che doveva ricevere. Questo è quanto e, se U
non rivela il suo numero s, il metodo è praticamente al
sicuro da ogni tentativo di “rottura”. Naturalmente,
i conti da eseguire richiedono l’uso di un calcolatore, ma tutto questo è, in realtà, fatto per il calcolatore!
I numeri primi sono molti all’inizio, ma vanno poi
diradandosi poiché cresce la probabilità di trovare divisori. Tuttavia, è facile vedere che esistono numeri
primi grandi quanto si vuole. Si ha infatti il seguente
risultato:
Teorema 2.13 (di Euclide) Esistono infiniti numeri primi.
Prova: Supponiamo per assurdo che il numero dei
numeri primi sia finito e che quindi esistano solo k
numeri primi p1 , p2 , . . . , pk . Si consideri il numero
n = p1 × p2 × · · · × pk + 1. Questo numero n non
può essere divisibile né per p1 , né per p2 , . . . , né per
pk , poiché la corrispondente divisione darà sempre
1 come resto. Allora n è un numero primo, contro
l’ipotesi che p1 , p2 , . . . , pk fossero tutti e soli i numeri
primi.
Nota 2.5
La precedente dimostrazione, che i numeri primi sono infiniti, è considerata una delle più
belle della Matematica (figuriamoci le altre, si potrebbe dire!), classificandosi al terzo posto nel sondaggio promosso dal Mathematical Intelligencer nel
1988. In generale i numeri primi sono uno degli argomenti più interessanti (e misteriosi) della Matematica,
tanto da affascinare moltitudini di ricercatori professionisti e dilettanti. Sono state compilate tavole di
numeri primi e, con i moderni calcolatori, ci si è divertiti a scoprire numeri primi sempre più grandi; attualmente, a quanto mi risulta, il record è costituito
.
.
da 213 466 917 − 1, un numero composto da 4. 053. 946
cifre decimali, ma le cose cambiano da un momento all’altro. Non esistono formule che permettano di
trovare tutti e soli i numeri primi; curiosamente, già
Eulero aveva scoperto espressioni che producono molti
numeri primi; ad esempio, n2 + n + 41 genera numeri
primi per n = 0, 1, 2, . . . , 39, come il lettore curioso e
interessato può verificare, ad esempio utilizzando un
semplice programma su un elaboratore.
I numeri primi sono una fonte inesauribile di misteri
matematici, cioè di proposizioni che, per quanto ne
sappiamo, sono vere, ma che nessuno è mai stato in
grado di dimostrare. La congettura più famosa è quasi
certamente quella di Goldbach: ogni numero pari è la
somma di due primi. Ad esempio, 100 = 11+89, e con
il calcolatore si è riusciti a verificare questa congettura fino a numeri grandissimi; non esistono tuttavia
dimostrazioni che essa sia vera in generale. Goldbach era un matematico russo che verso il 1750 scrisse
ad Eulero proponendogli la sua congettura e invitandolo a darne una dimostrazione; ma questa fu una
58
CAPITOLO 2. ARITMETICA
delle poche cose che Eulero non riuscı̀ a fare. Oggi,
la congettura di Goldbach è diventata nota al grande pubblico grazie al libro di Apostolos Doxiadis “Lo
zio Petros e la Congettura di Goldbach”, un libro interessante sia per gli agganci alla Matematica, sia, e
soprattutto, per la ricerca psicologica sui personaggi
dello zio e del nipote.
Un’altra famosa congettura è legata ai cosiddetti primi gemelli: esistono coppie di numeri primi separati
soltanto da due unità, o, se si preferisce, costituite da
due dispari contigui. Esempi semplici sono 3 e 5, 5 e
7, 11 e 13, 17 e 19, e cosı̀ via. I numeri di ciascuna
coppia si dicono appunto gemelli e, pur rarefacendosi,
se ne continuano a trovare man mano che si considerano numeri sempre più grandi. Prima del miliardo ne
esistono 3. 424. 506, cosı̀ che è stata proposta la congettura che di primi gemelli ne esistano infiniti. Anche questa congettura è rimasta tale,perché nessuno
ne ha mai dato una dimostrazione, nonostante che i
matematici si siano accaniti a cercarne una prova.
Come s’è detto, man mano che si va avanti con numeri sempre più grandi, i numeri primi diminuiscono
di frequenza. Ad esempio, il numero di numeri primi
compresi tra 1 ed un milione, calcolati di centomila in
centomila è:
0
9592
1
8392
2
8013
3
7863
4
7678
5
7560
6
7445
7
7408
8
7323
9
7224
Una domanda che viene abbastanza naturale (almeno ai matematici) è quella relativa alla frequenza dei
numeri primi. La precedente tabella è abbastanza significativa, ma possiamo dire qualcosa di più quantitativo? Tecnicamente, si parla della densità dei numeri
primi e, per essere più precisi, consideriamo un numero n ∈ N qualsiasi e chiediamoci: quanti sono i numeri
primi che precedono n? Questa quantità si indica con
la notazione π(n), cioè π : N → N è la funzione che ad
ogni n ∈ N associa il numero di numeri primi minori
o uguali ad n. Per n piccolo, il calcolo è facile e si
vede subito che π(10) = 4 e π(20) = 8; già trovare che
π(100) vale 25 richiede un bel po’ di lavoro, a meno
di non avere a disposizione un elenco di numeri primi.
Dalla tabellina precedente si ha π(100. 000) = 9592 e,
facendo le somme, π(1. 000. 000) = 78. 498. Purtroppo,
come abbiamo detto, i numeri primi non sembrano godere di alcun senso della regolarità e il calcolo di π(n)
si basa sul banale conteggio di un primo dopo l’altro.
Nonostante questo, i matematici non si sono arresi e
già alla fine del 1700 Gauss (sembra all’età di 14 anni)
ipotizzò la formula:
π(n) ≈
n
.
ln n
Ci volle un secolo prima che, nel 1896, due altri matematici, de la Vallée Poussin e Hadamard riuscissero a
dimostrare questa formula, indipendentemente l’uno
dall’altro.
Si tratta di una formula asintotica, cioè di una
formula che, quando n è piccolo, può non essere
molto buona, ma l’errore relativo (v. Sezione 3.7)
fra il valore vero e quello approssimato va calando
al crescere di n. Ad esempio, la formula precedente
dà per n = 100. 000 il valore 8686, con un errore di
oltre il 10% sul valore vero. Ma per n = 1. 000. 000
si ottiene 72. 382 e l’errore si è già ridotto all’8.4%.
E questi, naturalmente, di fronte all’infinito, sono
numeri ancora molto piccini! Si veda la Sezione 8.8
per qualche specifica ulteriore.
2.7
Massimo comun divisore
Per definizione, un numero primo p ha due soli divisori: 1 e p stesso. In generale, è facile calcolare il
numero di divisori di un numero n ∈ N quando se ne
conosca la scomposizione in fattori primi:
Teorema 2.14 Se n ∈ N ha scomposizione in fattori
primi n = pr11 × pr22 × · · · × prkk , con p1 , p2 , . . . , pk
numeri primi distinti, allora il numero dei divisori di
n è:
(r1 + 1)(r2 + 1) · · · (rk + 1).
Prova: Un divisore m di n deve avere gli stessi
divisori primi di n; quindi, relativamente al fattore
primo p1 , dovrà avere un fattore p01 (cioè, in effetti,
m non sarà divisibile per p1 ), oppure un fattore p11 ,
oppure p21 , . . . , oppure pr11 , per un totale di r1 + 1
possibilità. La stessa cosa vale per p2 , . . . , pk , e da
questo segue la formula data.
Ad esempio, il numero 792 = 23 × 32 × 11 avrà
(3 + 1)(2 + 1)(1 + 1) = 24 divisori. Esplicitamente,
essi sono:
{1, 2, 3, 4, 6, 8, 9, 11, 12, 18, 22, 24, 33, 36, 44,
66, 72, 88, 99, 132, 198, 264, 396, 792}.
Il teorema può essere seguito meglio con un caso più
semplice come n = 12 = 22 × 3, che deve avere (2 +
1)(1 + 1) = 6 divisori. I fattori con 2 e con 3 sono:
{1 = 20 , 2 = 21 , 4 = 22 } e {1 = 30 , 3 = 31 } e danno
le sei possibilità:
1×1=1 1×3=3 2×1=2
2 × 3 = 6 4 × 1 = 4 4 × 3 = 12.
Nota 2.6
I Pitagorici furono molto interessati
al concetto di divisibilità. Definirono perfetto un
numero che fosse la somma di tutti i suoi divisori, eccetto ovviamente sé stesso. L’esempio più semplice è
6 = 1+2+3, ma perfetto è anche 28 = 1+2+4+7+14
e quindi seguono 496 = 24 × 31, 8128 = 26 × 127 e
33550336 = 212 × 8191; non si sa se i numeri perfetti
siano infiniti. Un concetto analogamente sviluppato
59
2.7. MASSIMO COMUN DIVISORE
dai Pitagorici fu quello di numeri amicabili. Consideriamo tutti i divisori di 220 = 22 × 5 × 11; come
s’è visto essi sono 12 e cioè 1, 2, 4, 5, 10, 11, 20, 22,
44, 55, 110, 220. Se sommiamo tutti questi numeri
eccetto il 220, troviamo 284. Procedendo nello stesso
modo per questo numero 284 = 22 × 71, troviamo
5 divisori propri: 1, 2, 4, 71, 142 e la loro somma
è 220. Abbiamo ritrovato il numero di partenza e
per questo 220 e 284 si dicono amicabili, ognuno
essendo la somma dei divisori propri dell’altro. I
Pitagorici probabilmente conoscevano questa sola
coppia, che è la più piccola possibile. I matematici
arabi al-Farı̄sı̄ e al-Banna scoprirono le coppie 17296
– 18416 e 9. 363. 584 – 9. 437. 056, che più tardi furono
riscoperte da Cartesio e da Fermat. Nel 1700, Eulero
scoprı̀ una trentina di nuove coppie, me nel 1866 un
ragazzo italiano di 16 anni, un certo B. N. I. Paganini
(nessuna parentela col violinista) trovò la coppia
(1184, 1210), la più piccola dopo (220, 284), ma che
era sfuggita a tutti, perfino a Eulero. Oggi, con
l’aiuto dei calcolatori elettronici, se ne conoscono una
quantità enorme, tutte formate da due numeri pari o
da due numeri dispari. Nessuno sa se esistono coppie
di numeri amicabili formate da un numero pari e uno
dispari.
Prendiamo ora due numeri n, m
consideriamo i loro divisori:
∈
N e
Questo metodo dà MCD(12, 30) = MCD(22 × 3, 2 ×
3×5) = 2×3 = 6 e MCD(792, 220) = MCD(23 ×32 ×
11, 22 × 5 × 11) = 22 × 11 = 44. Sicuramente questo
metodo è molto più efficiente dell’applicazione diretta
della definizione, che richiede la costruzione delle liste
di tutti i divisori di m ed n. Tuttavia, la necessità
di eseguire la scomposizione in fattori primi, rende il
teorema di non facile applicazione quando i numeri
coinvolti sono piuttosto grandi. Allora, fin dall’antichità, è stato proposto un algoritmo che rende estremamente facile il calcolo del massimo comun divisore
anche di numeri grandi. Cominciamo con l’osservare
una semplice conseguenza del teorema precedente:
Corollario 2.16 Dati due numeri m, n ∈ N, se n è
un divisore di m (in particolare, se n = m), allora
MCD(m, n) = n.
L’algoritmo si basa sul fatto che MCD(m, n) =
MCD(m − n, n) se m > n. Infatti, se s è il massimo
comun divisore cercato, si ha m = s × k e n = s × h;
quindi m − n = s × (k − h), cioè s divide m − n.
Se m − n è ancora maggiore di n, continuando si ha
MCD(m, n) = MCD(m − 2 × n, n), e cosı̀ via fino a
MCD(m − d × n, n) quando sia m − d × n < n. Ma
questo significa che d è il quoziente della divisione di
m per n e m − d × n è semplicemente il resto della
stessa divisione. Ecco allora il celebre:
Definizione 2.6 Si dice Massimo Comun Divisore
di m ed n, e si indica con MCD(m, n), o anche Algoritmo 2.10 (Algoritmo di Euclide)
semplicemente con (m, n), il più grande dei divisori Ingresso: due numeri m, n ∈ N;
comuni ad m ed n.
Uscita: il MCD(m, n).
Si osservi che, nel peggiore dei casi, m ed n hanno
almeno il fattore comune 1. Ad esempio, abbiamo
MCD(12, 30) = 6; infatti, 30 = 2 × 3 × 5 ha 8 divisori
che sono (1, 2, 3, 5, 6, 10, 15, 30); confrontandoli con i
divisori di 12 dati sopra, si trova che il divisore comune più grande è proprio 6. Il seguente teorema dà
un modo abbastanza pratico per calcolare il massimo
comun divisore di due numeri:
1. Se m = n l’algoritmo termina e il massimo
comun divisore è n;
2. Se m < n, si scambiano tra di loro m ed n (cosı̀
d’ora in avanti possiamo supporre che sia m >
n);
Teorema 2.15 Dati due numeri m, n ∈ N, il
MCD(m, n) si trova considerando il prodotto dei divisori primi comuni ad m ed n, presi col minimo esponente che compare nelle due scomposizioni in fattori
primi.
3. Sia r il resto della divisione di m per n;
Prova: Sia s = MCD(m, n); i fattori primi di s devono ovviamente essere a comune tra m ed n. Inoltre, se
p è un fattore primo comune, e k è l’esponente minore
con cui p compare nella scomposizione di m ed n, pk
deve dividere s. Infatti, un esponente più piccolo di
k non darebbe il valore massimo di s e un esponente
più grande di k farebbe sı̀ che s non dividerebbe più
quello fra m ed n corrispondente all’esponente più
piccolo per p.
5. Altrimenti (0 < r < n), si cambiano i nomi:
n diviene il nuovo m, r diviene il nuovo n e si
torna al punto 3.
4. Se r = 0, allora n è un divisore di m e per il corollario precedente l’algoritmo termina col valore
del MCD in n;
Si noti che l’algoritmo termina sempre: siccome m
ed n vanno continuamente a diminuire pur rimanendo
positivi, nel peggiore dei casi arriveremo ad avere n =
1; al passaggio successivo il resto della divisione di m
per 1 sarà senz’altro 0 e l’algoritmo finirà. La ricerca
60
CAPITOLO 2. ARITMETICA
di MCD(792, 220) si imposta cosı̀:
792
220
132
88
= 3 × 220
= 1 × 132
= 1 × 88
= 2 × 44.
+
+
+
132
88
44
Nota 2.7
Il più delle volte, l’algoritmo di Euclide
è ignorato dalla Scuola Media, e per trovare il MCD
gli si preferisce il Teorema 2.15. Per i numeri piccoli,
quando la scomposizione in fattori primi si può fare
più o meno ad occhio, tale metodo è più semplice,
anche perché la maggior parte dei nostri studenti ha
difficoltà a fare le divisioni con più di una cifra, richieste dall’algoritmo di Euclide. Purtroppo, quando
i numeri crescono, la scomposizione in fattori primi
diviene un’operazione molto complessa, e non si conoscono modi per accelerare la ricerca esaustiva di un
fattore dopo l’altro, ricerca che richiede un numero di
prove molto elevato (e tali prove, ohimè, sono divisioni
a più cifre!). In effetti, dato il numero n, la ricerca del
√
primo fattore, se non è piccolo, richiede n/2 divisioni (Algoritmo 2.9), che per n nell’ordine di 10 miliardi
è già circa 50. 000.
Per vedere cosa succede con l’algoritmo di Euclide,
e fare un confronto, possiamo chiederci quali numeri innescano il processo più laborioso per trovare il
MCD. Nell’esempio di MCD(792, 220), la prima divisione, che ha dato quoziente 3, ha ridotto drasticamente le dimensioni dei numeri coi quali continuare
l’algoritmo, che sono diventati 220 e 132. Più alto è
il quoziente, più netta è la riduzione; quindi, il quoziente 1 dà la minima riduzione dei numeri. Ma avere
quoziente 1 per due numeri m, n (m > n) significa
m = 1 × n + r, cioè m = n + r. In altre parole, il più
grande dei due numeri è la somma dell’altro (che lo
sostituerà al passo successivo) e del resto, che sostituerà n. Questa stessa proprietà dovrà verificarsi al
passo successivo, cioè dovremo avere n = r + s, e cosı̀
via, fino a che non ci saremo ridotti ad 1.
Si definisce sequenza di Fibonacci una sequenza di numeri F0 , F1 , F2 , F3 , . . . tale che F0 = 0, F1 = 1 e ogni
altro numero è dato dalla somma dei due precedenti,
cioè Fn = Fn−1 + Fn−2 . Gli Fk si dicono numeri di
Fibonacci e i primi dieci sono:
n
Fn
0
0
1
1
2
1
3
2
4
3
5
5
6
8
7
13
8
21
9
34
Il lettore può calcolare i valori successivi, cominciando
con F10 = 55. Per verificare quanto detto, basta ora
prendere due numeri consecutivi di questa sequenza e
cercare il loro MCD; ad esempio, per 55 e 34 si ha:
55
34
21
13
8
5
3
2
=
=
=
=
=
=
=
=
1 × 34
1 × 21
1 × 13
1×8
1×5
1×3
1×2
2 × 1.
+
+
+
+
+
+
+
21
13
8
5
3
2
1
Si osservi che sull’ultimo quoziente non si può migliorare e che, per costruzione, due numeri di Fibonacci
consecutivi sono primi tra loro. Per rendersi conto che
queste 8 divisioni costituiscono davvero un massimo,
si provi a calcolare MCD(55, 33) e MCD(55, 35) con
lo stesso algoritmo. Ad ogni modo, questo prova che
dati due numeri m, n (m > n) e trovato quell’Fk tale
che Fk > m, la ricerca del MCD(m, n) col metodo di
Euclide richiederà meno di k divisioni (in effetti, meno
di k − 1).
I numeri di Fibonacci sembrano crescere in modo abbastanza contenuto; ma questa è solo l’apparenza dei
primi termini della sequenza. In realtà essi crescono
molto rapidamente ed F50 = 12. 586. 269. 025, come si
può trovare facilmente con un calcolatore o applicando
la formula (che dimostreremo più avanti nella Sezione
4.3):
õ
√ ¶k !
√ ¶k µ
1
1− 5
1+ 5
Fk = √
;
−
2
2
5
per quanto incredibile, questa formula produce
numeri interi! In conclusione, tutto questo significa
che, per trovare il MCD di due numeri dell’ordine
di 10 miliardi, l’algoritmo di Euclide richiede al più
50 divisioni, già un bel po’ di meno della semplice
ricerca del primo divisore di uno dei due numeri!
Una importante definizione è la seguente:
Teorema 2.17 Due numeri n, m ∈ N hanno
MCD(m, n) = 1 se e solo se sono primi tra loro.
Prova: Per definizione di Massimo Comun Divisore,
MCD(m, n) = 1 significa che i due numeri non hanno
divisori comuni diversi dall’unità, cioè sono primi tra
loro.
Le proprietà formali del massimo comun divisore,
visto come operazione tra numeri naturali, sono le
seguenti:
commutativa
associativa
idempotenza
identità
zero
MCD(m, n) = MCD(n, m)
MCD(m, MCD(n, p)) =
= MCD(MCD(m, n), p)
MCD(n, n) = n
MCD(n, 0) = n
MCD(n, 1) = 1
Assieme al massimo comun divisore, si è soliti considerare anche il minimo comune multiplo di due numeri m, n ∈ N, definito come il più piccolo dei multipli comuni ad m ed n, e si indica con la notazione
mcm(m, n). In analogia a quanto fatto per il massimo
comun divisore, si dimostra che:
Teorema 2.18 Il minimo comune multiplo di due
numeri m, n ∈ N si trova considerando, nella scomposizione di m ed n in fattori primi, il prodotto
61
2.8. LE ALTRE OPERAZIONI
dei fattori primi comuni e non comuni, presi con questa notazione si scrive: max{x ∈ N | P (x)} per inil maggiore degli esponenti che compaiono nelle due dicare il massimo numero naturale per cui vale la proscomposizioni.
prietà P (x). Analoga notazione si usa per il minimo,
ed à facile vedere come esempio che 15 = min{x ∈
La dimostrazione è analoga a quella vista per il N | x2 > 200}.
massimo comun divisore e la lasciamo perciò al letQueste operazioni ci permettono di osservare che,
tore. Dal teorema segue la seguente proprietà, an- da un punto di vista logico, le uniche operazioni che
ch’essa usata spesso per il calcolo del minimo comune sarebbe necessario introdurre sono il confronto e l’admultiplo:
dizione, tutte le altre essendo definibili in termini di
queste. Abbiamo appena visto come min e max siano
m×n
mcm(m, n) =
.
dipendenti dal solo confronto; per le altre operazioni
MCD(m, n)
abbiamo:
Anche le proprietà formali del minimo comune multin−m
= max{x ∈ N | m + x ≤ n}
plo sono simili a quelle del massimo comun divisore:
n⊖m
= min{x ∈ N | m + x ≥ n}
proprietà commutativa, associativa e di idempotenza.
n×m
= m + m + · · · + m (n volte)
Si ha invece:
n/m
= max{x ∈ N | m × x ≤ n}
mcm(n, 0) = 0
mcm(n, 1) = n.
Infine, vogliamo osservare che per le operazioni di
MCD e mcm valgono le proprietà distributiva e di assorbimento, che lasciamo alla delizia del lettore, sia
per la formulazione, sia per una eventuale dimostrazione. Confrontando queste proprietà con quelle viste per gli insiemi (Sezione 1.1) e quelle che vedremo
(Sezione 4.6) per il calcolo delle proposizioni, non si
può non essere colpiti dalla fortissima analogia. Siamo infatti di fronte ad esempi diversi di una struttura algebrica particolare, nota come Algebra Booleana. Ritorneremo su questi fatti più avanti, quando
parleremo un po’ di Algebra Astratta (Sezione 5.8.
2.8
Le altre operazioni
Le quattro operazioni fondamentali sono la base del
calcolo e, come vedremo, non solo del calcolo dei numeri naturali, ma di tutti gli insiemi numerici che
man mano introdurremo. Tuttavia, esse non costituiscono, assieme al confronto, la totalità delle operazioni e, anzi, molte altre possono essere definite a partire
da quelle; in questa sezione introdurremo le principali
operazioni che si incontrano nella pratica. Prima di
tutto, basate sul confronto, ci sono le operazioni di
minimo e di massimo:
½
a se a ≤ b
min(a, b) =
b altrimenti
max(a, b) =
½
a se a ≥ b
b altrimenti.
n mod m
= n − (n/m) × m.
Si osservi che con queste definizioni 3 − 5 non è definito mentre 3⊖5 = 0. Quest’ultima operazione si usa
quando è necessario far sı̀ che la sottrazione sia un’operazione su N, nel senso della Sezione 1.3, e quindi
sia definita per ogni possibile valore di m ed n.
Un’altra operazione che si basa sul principio di abbreviare l’iterazione di un’operazione elementare è
l’elevamento a potenza. Con la notazione nm si indica il prodotto di n per sé stesso per m volte, cioè:
nm = n×n×· · ·×n per m volte. Con questo si suppone m ≥ 2, ma, come per la moltiplicazione, possiamo
estendere la definizione ad m = 0 ed m = 1. Ricordando che nell’espressione nm il numero n si dice la
base e il numero m si dice l’esponente, si ha:
½ 0
n
= 1
nm+1 = n × nm m ≥ 0.
Ad esempio, per n = 5 si ha: 50 = 1, 51 = 50 × 5 =
1 × 5 = 5, 52 = 51 × 5 = 5 × 5 = 25, e via di seguito. Questo fa vedere la convenienza di avere n0 = 1.
Questa regola vale anche per n = 0, cioè si ha: 00 = 1,
01 = 0 × 00 = 0 × 1 = 0, e cosı̀ di seguito. Il fatto che
sia 00 = 1 è alquanto controintuitivo, ma è in accordo con altre definizioni e con argomenti dell’Analisi
Matematica, in cui si dimostra che limx→0 xx = 1,
come lo studente vedrà nei corsi universitari. Per il
resto, dalla definizione discendono alcune importanti
(e ben note) proprietà delle potenze:
Teorema 2.19 Se n, m, p ∈ N, si hanno le seguenti
identità:
a) nm+p = nm np
c) (nm )p = nm×p
b) nm−p = nm /np (m ≥ p)
d) np × mp = (n × m)p .
E’ ovvio osservare, ed è altrettanto semplice dimostrare, che valgono le proprietà della Tabella 2.5. La
proprietà associativa permette di scrivere min(a, b, c) Prova: Si consideri nm np = (n × n × · · · × n) ×
e max(a, b, c) al posto di una delle più complicate (n × n × · · · × n), dove il fattore n è ripetuto m volte
espressioni date nella tabella. Come estensione di entro le prime parentesi e p volte entro le seconde.
62
commutativa
associativa
distributiva
assorbimento
idempotenza
identità
zero
CAPITOLO 2. ARITMETICA
min(a, b) = min(b, a)
min(min(a, b), c) = min(a, min(b, c))
min(a, max(b, c)) = max(min(a, b), min(a, c))
min(a, max(a, b)) = a
min(a, a) = a
max(a, b) = max(b, a)
max(max(a, b), c) = max(a, max(b, c))
max(a, min(b, c)) = min(max(a, b), max(a, c))
max(a, min(a, b)) = a
max(a, a) = a
max(a, 0) = a
min(a, 0) = 0
Tabella 2.5: Proprietà del minimo e del massimo
Per la proprietà associativa del prodotto le parentesi
possono esser tolte e quindi il fattore n è ripetuto
m + p volte. La dimostrazione delle altre proprietà si
effettua in modo del tutto analogo e, per l’ultima, si
fa uso anche della proprietà commutativa per riunire
(o separare) i fattori n ed m.
famoso l’aneddoto che si racconta sul mitico inventore del gioco degli scacchi. Al re che gli chiedeva
cosa volesse come ricompensa per la sua invenzione,
chiese tanto grano quanto se ne poteva ottenere associando un chicco alla prima casella della scacchiera,
due chicchi alla seconda, quattro alla terza, otto alla
quarta, e cosı̀ via, raddoppiando ogni volta il numeE’ un utile esercizio quello di provare ad esprimere,
ro di chicchi. L’ingenuo sovrano acconsentı̀, senza
con proprie parole per evitare la citazione di formule,
rendersi conto che il numero totale di chicchi sareble quattro proprietà di questo teorema.
be stato 1 + 2 + · · · + 262 + 263 ≈ 1.84 × 1019 ben
Nonostante il fatto che, per definizione, una potendi più di quanto grano sia mai stato prodotto sulza sia l’abbreviazione di una sequenza di moltiplicala terra. Probabilmente, l’inventore degli scacchi fu
zioni, non esiste un algoritmo specifico per il calcodecapitato per aver voluto fare troppo il furbo.
lo delle potenze, come invece abbiamo visto per la
E’ bene dare la seguente:
moltiplicazione, che ha un proprio algoritmo, pressoché indipendente da quello dell’addizione, di cui Definizione 2.7 Un numero naturale p ∈ N si dice
è pure un’abbreviazione. Per potenze con esponen- una potenza m-esima perfetta se esiste un numero
te piccolo, diciamo 2 o 3, il metodo di calcolo più naturale n tale che p = nm . In tal caso, si dice anche
conveniente è l’esecuzione delle relative moltiplica- che n è la radice m-esima perfetta di p e che m è il
zioni; cosı̀ 53 = 5 × 5 × 5 = 25 × 5 = 125. Per logaritmo in base n di p, e si scrive rispettivamente
√
esponenti più grandi si può adottare il metodo dei n = m
p ed m = logn p.
contadini russi, analogo a quello visto per la moltiplicazione (vedere anche la Nota 2.3). Ad esempio, In generale, le potenze con esponente 2 si dicono meper calcolare 54 conviene calcolare 52 = 25 e quindi glio quadrati e le potenze con esponente 3 si dicono
54 = (52 )2 = 252 = 625; e cosı̀ si procede per espo- cubi; ad esempio, 0, 1, 4, 9, 16, 25 sono quadrati pernenti che siano potenze di 2. Più in generale, per cal- fetti, mentre 0, 1, 8, 27, 64 sono cubi perfetti. Anacolare 513 si osserva che 13 può essere espresso come logamente, le radici seconde si dicono radici quadrate
radici terze radici cubiche. Essendo 64 = 43 , si
somma di potenze di 2: 13 = 8 + 4 + 1 e quindi 513 = e le√
3
ha 64 = 4 e log4 64 = 3; cosı̀, da 81 = 34 si deduce
58+4+1 = 58 × 54 × 51 . Procedendo come visto prima, √
4
81 = 3 e log3 81 = 4. Le radici e i logaritmi sono le
abbiamo 52 = 25, 54 = 625, 58 = 6252 = 390. 625.
13
.
.
.
.
operazioni
inverse delle potenze; per definizione, se n
Quindi 5 = 390 625 × 625 × 5 = 1 220 703 125. In
è
una
potenza
p-esima perfetta, cioè n = mp ; allora
altri termini, come per la moltiplicazione, disposti ac√
p
log n
p
canto base ed esponente, si eseguono successivamen- si ha ( n) = n e m m = n.
Le principali proprietà delle radici e dei logaritte i quadrati a partire dalla prima, e si calcolano le
mi
derivano da quelle delle potenze e descritte nel
metà a partire dal secondo. Si fa poi il prodotto dei
Teorema
2.19. Per le radici p-esime abbiamo:
quadrati corrispondenti alle metà di valore dispari:
√
Teorema 2.20 Se m ed n sono potenze perfette
5 13
opportune, si ha:
25
6 √
q
625
3 √
√
√
√
√
p √
p
p
p
q
.
m
×
n
=
m
×
n
n = p×q n.
390 625
1
Come ci si accorge facilmente, le potenze crescono ra- Prova: La prima proprietà deriva dalla d) del Teopidamente al crescere dell’esponente. Già con la base rema 2.19, se m ed n sono potenze p-esime perfette;
2, 220 supera il milione e 230 supera il miliardo. E’ elevando alla potenza p-esima, il membro sinistro dà
63
2.8. LE ALTRE OPERAZIONI
√
√
m×n e il membro destro dà ( p m)p ×( p n)p = m×n.
La seconda proprietà, in modo analogo, si deduce
dalla c) dello stesso Teorema 2.19.
Per i logaritmi si ottiene:
Teorema 2.21 Se i numeri naturali a, b sono potenze perfette della stessa base n, diciamo a = nm e
b = np , allora logn a × b = logn a + logn b.
Prova: Per la proprietà a) del Teorema 2.19, si ha:
logn (a × b) = logn (nm × np ) =
= logn nm+p = m + p = logn a + logn b
come si desiderava.
Anche se hanno senso solo per le potenze perfette,
si possono dare definizioni opportune di radici e di
logaritmi per tutti i numeri naturali. Dato un numero
naturale p ∈ N, si dicono radici m-esime di p per
difetto e per eccesso le quantità:
√
⌊ m p⌋ = max{x ∈ N | xm ≤ p}
√
⌈ m p⌉ = min{x ∈ N | xm ≥ p}
Analogamente, si dicono logaritmi in base n di p per
difetto e per eccesso:
⌊logn p⌋ =
⌈logn p⌉ =
max{x ∈ N | nx ≤ p}
min{x ∈ N | nx ≥ p}
Se p è una potenza m-esima perfetta, le due approssimazioni coincidono con la radice m-esima e col logaritmo in base n. Anticipando cose che dovremmo dire
più avanti, dato un numero reale r qualsiasi, con la
notazione ⌊r⌋ si indica il massimo numero intero che
sia minore o uguale ad r, e con la notazione ⌈r⌉ si indica il minimo numero intero maggiore o uguale ad r.
Queste operazioni hanno, in inglese, nomi fantasiosi
che, tradotti in italiano, suonano a dir poco inusitati;
la prima si dice pavimento di r (in inglese, “floor of
r”) e la seconda soffitto di r (in inglese, “ceiling of
r”).
Un’ultima operazione di abbreviazione è il fattoriale: si dice fattoriale del numero n ∈ N il prodotto di tutti i naturali da 1 fino ad n. Ad esempio,
4! = 1 × 2 × 3 × 4 = 24. Una definizione ricorsiva
permette di introdurre anche il valore di 0!:
½
0!
= 1
(n + 1)! = (n + 1) × n!
Cosı̀, 4! = 4 × 3! = 4 × 3 × 2! = 4 × 3 × 2 × 1! =
4 × 3 × 2 × 1 × 0! = 4 × 3 × 2 × 1 = 24. Come
nel caso di 00 , definire 0! = 1 sembra controintuitivo,
ma in realtà è consistente col resto della definizione
e con altre impostazioni dello stesso concetto, come
ad esempio la funzione Gamma Γ(x). Come vedremo,
l’operazione di fattoriale si incontra comunemente nel
calcolo combinatorio e nel calcolo delle probabilità.
Nota 2.8
L’Aritmetica, cioè la teoria dei numeri
naturali, è la base di tutta la Matematica, che può
essere costruita a partire dalle proprietà dei naturali. Come vedremo concretamente, i numeri interi e
quelli razionali, i numeri reali e quelli complessi sono costruzioni che si fondano sui numeri naturali e le
loro operazioni sono estensione delle analoghe operazioni fra naturali, delle quali mantengono le proprietà
principali. D’altra parte, le proprietà dei naturali si
basano sulle quattro operazioni elementari e il confronto; la definizione delle altre operazioni parte da
quelle e si basa su due semplici principi: i) sia priva di
ambiguità, e 2) permetta di arrivare al risultato in un
tempo finito. Questo modo di porre le cose può essere
formalizzato in una teoria, secondo quanto visto nel
primo capitolo.
Questo modo di concepire la Matematica si dice aritmetizzazione e sembra che l’idea risalga a Ohm, che
la introdusse in un suo libro del 1832. Verso il 1860
si cominciarono ad avere le prime definizioni formali dei numeri reali (noi ne vedremo una nel prossimo
capitolo) e questo dette un enorme impulso al processo di aritmetizzazione, che si propose di dare una
teoria completa dell’Aritmetica, dalla quele si potesse partire per aritmetizzare tutta la Matematica. La
più famosa formulazione della teoria dell’Aritmetica
è senz’altro quella del matematico torinese Giuseppe
Peano (1858 – 1932), uno dei grandi logici vissuti a
cavallo tra ’800 e ’900. Egli introduce tre enti fondamentali: “numero”, “zero” e “successore” che, secondo il concetto moderno di teoria assiomatica, non
sono definiti, ma che sono completamente determinati
dalle proprietà specificate negli assiomi. Naturalmente, noi possiamo immaginare che questi tre termini si
riferiscano a ciò che comunemente intendiamo per numero, per zero e per successore (di un numero), ma
questo può aiutare la nostra comprensione, non certo
la costruzione logica che intendiamo affrontare, cioè
lo sviluppo dell’Aritmetica e di tutta la Matematica.
Ecco comunque i cinque assiomi:
1. zero è un numero;
2. ogni numero ha un successore;
3. zero non è successore di alcun numero;
4. se i successori di due numeri sono uguali, allora
anche i numeri sono uguali;
5. se un’affermazione è vera per zero, e supposta
vera per un numero risulta vera anche per il suo
successore, allora essa è vera per ogni numero.
Quest’ultimo assioma altro non è se non il principio di
induzione, il quale, secondo Peano, è il modo naturale
per dimostrare le proprietà dei numeri naturali.
Normalmente, i tre enti si denotano con i simboli
N, 0, ′ , e si introducono le abbreviazioni: 0′ = 1, 0′′ =
1′ = 2, 0′′′ = 1′′ = 2′ = 3, e cosı̀ via. La somma si
definisce allora mediante la ricorsione:
½
n+0
= n
n + m′ = (n + m)′
64
CAPITOLO 2. ARITMETICA
Questo significa che se il secondo argomento è zero, la
somma si riduce al primo argomento; se non è zero,
allora è il successore di qualche numero m, e la somma
è il successore della somma di n ed m. Occorre capire
bene questo punto che sembra definire la somma in
termini di sé stessa, cioè mordendosi illegalmente la
coda. In realtà, come già c’è capitato di osservare, m è
“minore” del suo successore e la riduzione del secondo
argomento porta inevitabilmente a ridursi al caso m =
0, che finalmente è trattabile con la prima regola. In
altre parole, il ripiegarsi su sé stessa è solo apparente
o provvisorio e la ricorsione a un certo punto termina,
rendendo buona la definizione. Supponiamo di voler
eseguire 3 + 2; poiché 2 non è zero, esso è il successore
di un numero; per definizione è 2 = 1′ e quindi si ha:
3 + 2 = 3 + 1′ = (3 + 1)′ . Ancora, 1 non è zero e
perciò è il successore di un numero; per definizione
sappiamo 1 = 0′ e quindi (3 + 1)′ = (3 + 0′ )′ = (3 +
0)′′ . Finalmente, il secondo argomento è zero e di
conseguenza: 3 + 2 = (3 + 0)′′ = 3′′ = 4′ = 5.
Se dovessimo fare cosı̀ per eseguire ogni somma, la
Matematica non avrebbe proceduto oltre questa definizione. Il senso di questa è di farci capire come,
concettualmente, l’operazione di successore sia sufficiente per introdurre la somma. Quello che importa è
comprendere la semplificazione logica di questo modo
di procedere.
Il processo non termina con la definizione dell’operazione; occorre ora dimostrare che la somma, cosı̀ definita, gode delle proprietà commutativa e associativa,
e ammette 0 come identità. Per fare ciò risulta essenziale il principio di induzione, che pertanto a buon
diritto è stato inserito tra gli assiomi. Naturalmente,
si va avanti con lo stesso spirito, e la moltiplicazione
è definita ricorsivamente cosı̀:
½
n×0
= 0
n × m′ = n × m + n
dove si sfrutta la somma, ormai acquisita. Non
possiamo sviluppare qui, partendo dagli assiomi di
Peano, tutta l’Aritmetica, e men che mai tutta la
Matematica; il lettore interessato potrà utilmente
approfondire l’argomento dando altre definizioni
per le varie operazioni conosciute e tentando la
dimostrazione delle loro proprietà.
Concludiamo introducendo una speciale notazione
(più che una nuova operazione). Capita spesso di dover eseguire somme con molti addendi: quando facciamo la spesa al supermercato o quando tiriamo le
somme del bilancio personale alla fine del mese. Se indichiamo con c1 , c2 , . . . , cn il costo dei singoli prodotti
acquistati o con v1 , v2 , . . . , vm le spese effettuate, interessa calcolare le somme c1 + c2 + · · · + cn ovvero
v1 + v2 + · · · + vm . Una comoda notazione è:
n
X
i=1
ci = c1 + c2 + · · · + cn
m
X
i=1
vi = v1 + v2 + · · · + vm .
P
Qui, il simbolo , che è una sigma maiuscola stilizzata, si dice simbolo di somma. La prima somma, ad
esempio, si legge: “somma per i che va da 1 ad n dei
ci ”. In generale avremo:
n
X
i=k
ci = ck + ck+1 + · · · + cn
dove k ed n sono gli estremi della somma ed i è la
variabile di somma che assume i propri valori da k
fino ad n. Si suppone che n ≥ k e se k = n la somma
si riduce al solo elemento ck ; si conviene inoltre che
quando k ≥ n la somma sia 0. Gli elementi che si
sommano costituiscono un vettore, cioè un insieme di
valori presi in un certo ordine e ciascuno distinto da
un proprio indice. Cosı̀,
P5se v1 = 8, v2 = 7, v3 = 8,
v4 = 6, v5 = 7, si ha:
i=1 vi = 36. Si osservi che,
per le proprietà della somma, abbiamo:
n
X
i=m
ci =
p
X
ci +
i=m
n
X
i=m
n
X
ci
se
i=p+1
rci = r
n
X
m≤p<n
ci ;
i=m
infatti, la prima è la proprietà associativa e la seconda
è la proprietà distributiva. La proprietà commutativa
scambia la posizione dei vari addendi, cioè scombussola il vettore, e pertanto si usa solo in situazioni
particolari.
Capitolo 3
Numeri
. . . chi è abituato a sbrigare le proprie faccende
col regolo calcolatore non può ormai prendere
sul serio una buona metà delle asserzioni umane. Il regolo calcolatore consta di due sistemi di
numeri e di lineette combinati con straordinaria
accortezza: due tavolette scorrevoli verniciate di
bianco, a sezione trapezoidale piatta, mediante il quale si risolvono i più intricati problemi,
senza sciupare inutilmente un solo pensiero. . .
Quando si possiede un regolo calcolatore, e arriva qualcuno con grandi affermazioni e grandi
sentimenti, si dice: “Un attimo, prego, prima
calcoliamo il limite d’errore e il valore probabile
di tutto ciò!”
R. Musil “L’uomo senza qualità”
3.1
I numeri interi
I numeri naturali, nonostante le difficoltà presentate
dalla loro definizione, hanno un aggancio immediato
con la realtà, in quanto servono a contare. Le frazioni, che vedremo più avanti in questo capitolo, hanno
anch’esse un rapporto preciso con la realtà e fin dall’antichità è stato chiaro cosa significasse mezza mela
o tre quarti di focaccia. Invece, i numeri negativi hanno rappresentato per lungo tempo un concetto strano,
poco comprensibile e, quindi, spesso bandito dalle acque limpide della Matematica. Oggi, l’esempio delle
temperature o della contabilità, con i soldi a credito (numeri positivi) o a debito (numeri negativi), ci
è tanto familiare che stentiamo a credere che fino a
300 anni fa il segno − non fosse accettato come qualcosa di ovviamente utile, ma fosse ricacciato come
ambiguo o, addirittura, come un attributo diabolico.
Comunque, in molte persone perdura ancora l’idea
che qualcosa di satanico sia intrinseco nella “regola
dei segni”, per la quale meno per meno fa più.
La necessità di introdurre i numeri negativi sorge
dal desiderio di poter eseguire una differenza come
3 − 5, che con i numeri naturali non ha senso: come è infatti possibile prendere cinque caramelle da
un insieme di tre? L’interpretazione insiemistica dei
numeri esclude questa possibilità ed è proprio questo
65
che gli antichi avevano in mente, pur senza aver dato una definizione formalizzata di cardinalità. Alla
metà del 1500, il matematico olandese Stevin (1487
– 1567) chiamava “numeri absurdi” i numeri negativi, che pure si era visto essere utili nella risoluzione
delle equazioni. Per i Greci i numeri erano legati alla
misura delle grandezze (specie dei segmenti) e anche
per loro pensare a misure negative era praticamente
assurdo. Tuttavia, a posteriori, si è visto come avere
3 e e spenderne 5 significa avere un debito di 2 e;
e se la temperatura è a 3◦ sopra lo 0 e scende di 5◦ ,
allora si troverà a 2◦ sotto zero. Ma tutto questo è
venuto dopo l’accettazione dei numeri negativi.
Formalmente, un numero intero è 0 oppure un numero naturale preceduto da uno dei segni + o −; i
numeri preceduti da + si dicono interi positivi; quelli preceduti dal segno − si dicono interi negativi. Il
numero privato del segno si dice valore assoluto dell’intero, ed è pertanto un numero naturale; il valore
assoluto si indica ponendo il numero intero tra barre;
cosı̀ | + 6| = 6, | − 5| = 5 e |0| = 0. I due segni +, −
si dicono opposti tra di loro; convenzionalmente, il
segno positivo si tende a sottintendere, cosa che cercheremo di non fare in questa sezione per distinguere
chiaramente i numeri interi positivi dai numeri naturali, anche se la regola è che i loro insiemi vengano
identificati, regola che naturalmente adotteremo anche noi. Si osservi la seguente definizione che talvolta
torna utile:

 +1 se a è positivo
0 se a è zero
sgn(a) =

−1 se a è negativo.
Il significato dei segni +, − è definito dal loro
comportamento nelle usuali operazioni:
Definizione 3.1 Siano a, b due numeri interi; si definisce somma di a e b e si indica con a + b, il numero
intero cosı̀ ottenuto: a) se a, b sono entrambi positivi, la loro somma è il numero positivo che si ottiene
sommando i valori assoluti dei due numeri; b) se a, b
sono entrambi negativi, la loro somma è il numero
negativo che ha per valore assoluto la somma dei valori assoluti di a e di b; c) se a, b sono discordi (cioè,
66
CAPITOLO 3. NUMERI
esatta) ed n − 1. Prima di tutto, la divisione opera sempre con un divisore positivo, quindi se questo
risulta negativo, gli si cambia il segno, cambiandolo contemporaneamente anche al dividendo. Se ora
a ∈ Z e b > 0 sono i due numeri da dividere, il quoziente è dato dal numero q tale che a = b × q + r, con
0 ≤ r < b. Pertanto (−14) : (+5) = −3 con resto 1,
L’opposto di un numero a si indica con −a ed è il che è la stessa cosa di (+14) : (−5).
numero intero che ha lo stesso valore assoluto di a,
Questo modo di concepire i numeri interi è quello
ma segno opposto a quello di a. Quindi −(+7) = −7 e classico usato nelle Scuole Medie e quello che si ritro−(−5) = +5. La sottrazione a−b è, per definizione, la va nella struttura logica degli elaboratori elettronici,
somma di a con l’opposto di b. L’insieme dei numeri dove il segno è costituito da un bit, 0 per positivo e
interi si indica con Z, dal tedesco Zahl = numero.
1 per negativo. Tuttavia, l’impostazione matematica
Il prodotto di due numeri interi a, b è il numero più rigorosa ed elegante è completamente diversa e,
intero a × b (o semplicemente a · b, oppure ab) che ha come vedremo, spiega automaticamente la regola dei
come valore assoluto il prodotto dei valori assoluti di segni.
a e di b, e come segno quello stabilito dalla cosiddetta
Il problema generale che ci poniamo è quello di
regola dei segni:
estendere l’insieme numerico di partenza S (in questo
caso, i numeri naturali N) in modo da ottenere un
a\b + −
nuovo insieme T che:
+ + −
1. permetta di definire le quattro operazioni ele− − +
mentari e i confronti, mantenendo le stesse proprietà di S ed eventualmente acquisendone di
Perché questa regola dei segni? Perché, soprattutnuove;
to, meno per meno fa più, come di solito si esprihanno uno segno positivo e l’altro negativo) la loro
somma ha come segno lo stesso segno del numero che
ha valore assoluto più alto e come valore assoluto la
differenza tra il più grande e il più piccolo dei due valori assoluti (se a, b hanno segno opposto ma uguale
valore assoluto si ha a + b = 0).
me la regola più misteriosa? Il fatto fondamentale è questo, che vogliamo conservare ai numeri interi le principali proprietà formali, già viste per i numeri naturali e le relative operazioni. Cosı̀, è facile vedere che per l’addizione valgono ancora le proprietà commutativa ed associativa, e lo 0 fa da identità. Per la moltiplicazione, vogliamo che proprietà
commutativa, associativa e distributiva siano valide. Consideriamo allora, come esempio, il prodotto
(+3) × ((+2) + (−2)); se prima eseguiamo la somma abbiamo (+3) × 0 = 0, poiché 0 deve operare
da zero, cioè annullare il prodotto. D’altra parte, se
vale la proprietà distributiva, l’espressione diviene:
(+3) × (+2) + (+3) × (−2) e deve essere 0 per quanto
appena detto. Poiché abbiamo identificato gli interi
positivi con i naturali, si ha (+3) × (+2) = 3 × 2 = 6.
Si ha pertanto 6 + (+3) × (−2) = 0, e sommando
−6 ai due membri: (+3) × (−2) = −6; questo spiega la regola “più per meno uguale meno”, e in modo
analogo si trova che “meno per più uguale meno”.
A questo punto abbiamo: (−3) × ((+2) + (−2)) =
(−3) × 0 = 0 ancora per la proprietà distributiva,
e quindi (−3) × (+2) + (−3) × (−2) deve dare 0.
Ma ora sappiamo che (−3) × (+2) = −6 e quindi
(−3) × (−2) = −(−6) = 6, cioè è giocoforza accettare
la regola che “meno per meno fa più”.
Infine, per la divisione, abbiamo una regola molto complicata (certo più complicata di quella della
divisione fra naturali) per rispettare la regola fondamentale del resto, cioè che nella divisione per n il resto deve essere un numero compreso tra 0 (divisione
2. contenga propriamente S, nel senso che si possa
definire un sottoinsieme T ′ ⊂ T “identificabile”
con S, tale cioè che esista una corrispondenza
biunivoca ϕ tra T ′ ed S per cui se s, s′ ∈ S danno come risultato s∗ rispetto a una qualsiasi delle
quattro operazioni o ad un confronto (nel qual
caso s∗ = 0/1) allora i corrispondenti elementi
ϕ(s), ϕ(s′ ) ∈ T ′ diano come risultato della stessa operazione o dello stesso confronto proprio il
corrispondente ϕ(s∗ ).
Quest’ultima proprietà si dice tecnicamente di isomorfismo e si dice anche che S e T ′ sono isomorfi.
Nel caso in questione, i numeri interi che vogliamo
costruire, devono godere di tutte le proprietà dei numeri naturali più il fatto che la sottrazione sia sempre
definita. Come si sa (ma che qui, prima della costruzione, dobbiamo far finta di non sapere) sono gli interi
positivi, compreso lo 0, che si identificano con i numeri naturali. Formalmente, c’è da dimostrare che
Z+ ed N sono isomorfi.
Il metodo seguito per estendere un insieme numerico è in sostanza sempre lo stesso. Tanto la costruzione
di Z da N, quanto la costruzione dei numeri razionali
da Z, quanto ancora la costruzione dei numeri reali
dai razionali, seguono uno schema ben preciso. Vediamolo allora in generale. Sia, come sopra, S l’insieme
numerico di partenza e si voglia costruire l’insieme
esteso T :
1. si definisce un insieme U basandoci sugli
elementi di S;
3.1. I NUMERI INTERI
67
2. si definisce su U una relazione di equivalenza e (c, d) ∼ (e, f ) cioè c + f = d + e, sommando mem“∼”;
bro a membro si ha a + d + c + f = b + c + d + e,
ovvero a + f = b + e che vuol dire (a, b) ∼ (e, f ). Pos3. si definiscono su U le quattro operazioni e i siamo allora dividere N × N in classi di equivalenza,
confronti;
e si dice numero intero ciascuna delle classi ottenu4. si dimostra che sono compatibili con la relazio- te. Nell’interpretazione vista, (a, b) e la sua classe di
ne “∼”, cioè elementi equivalenti danno risultati equivalenza identificano il numero a − b poiché tutte
le coppie hanno la stessa differenza. Se a > b questa
equivalenti;
dà un numero positivo, se a = b si ha lo 0 e se a < b
5. si definisce T come l’insieme quoziente di U si ha un numero negativo.
modulo “∼”;
Definiamo ora la somma (a, b) + (c, d) = (a +
c,
b
+ d): affinché questa definizione abbia senso non
6. si definisce un opportuno sottoinsieme T ′ ⊂ T e
deve
dipendere dalle particolari coppie scelte. Ma
si dimostra che T ′ è isomorfo ad S.
se (a, b) ∼ (a′ , b′ ) e (c, d) ∼ (c′ , d′ ) e si esegue
L’insieme U è un insieme di comodo, che ingloba la (a′ , b′ ) + (c′ , d′ ) = (a′ + c′ , b′ + d′ ), vediamo che
nostra idea di estensione, ad esempio che sia sempre (a′ +c′ , b′ +d′ ) ∼ (a+c, b+d). Infatti abbiamo per ipodefinita la sottrazione. La costruzione di U è di regola tesi a+b′ = a′ +b e c+d′ = c′ +d e sommando membro
pleonastica e si ottiene un insieme troppo grande; per a membro: a + b′ + c + d′ = a′ + b + c′ + d che definisce
questo si definisce la relazione di equivalenza che per- proprio l’equivalenza tra le due somme. Può essemette di ridurre gli elementi a quelli essenziali. Gli re divertente dimostrare ora tutte le proprietà della
elementi sono in effetti classi di equivalenza: questa somma (commutatività, associatività e identità dello
è una delle difficoltà concettuali maggiori, poiché le 0), ma ci limitiamo a far vedere che se (a, b) è positivo,
prime volte ci risulta ostico accettare che un numero (c, d) è negativo e il valore assoluto di (a, b) è maggioè una classe di equivalenza. D’altra parte, questo è re di quello di (c, d), allora il risultato della somma è
proprio ciò che si fa con le frazioni (anche se non lo si |(a, b)| − |(c, d)|. Infatti, abbiamo (a, b) ∼ (a − b, 0)
dice in questi termini) dove 3/5, 6/10 e 33/55 sono se a > b, e (c, d) ∼ (0, d − c) se c < d. Quindi
lo stesso numero razionale.
(a, b) + (c, d) = (a − b, 0) + (0, d − c) = (a − b, d − c),
Il fatto che un numero sia una classe di equivalenza ma questo numero rappresenta proprio la differenza
impone di dimostrare che le operazioni e i confronti dei due valori assoluti. Si noti infine che l’opposto di
sono indipendenti dai particolari elementi di U usati (a, b) è (b, a), per cui la differenza si definisce molto
per la loro esecuzione. Questo dà piena validità al- semplicemente:
la costruzione di T . Infine, bisogna far vedere che T
(a, b) − (c, d) = (a, b) + (d, c).
estende S e quindi, fra le classi di U , dobbiamo iden′
tificare quelle che costituiscono l’immagine T di S e
Il confronto fra due coppie si fa definendo:
dobbiamo far vedere che le operazioni e i confronti in
S e in T ′ danno proprio gli stessi risultati.
(a, b) ≤ (c, d) se e solo se a + d ≤ b + c,
Per la costruzione di Z si comincia col considerare le coppie di numeri naturali (a, b) ∈ N × N, che il cioè estendendo la relazione di equivalenza; a destra
lettore è bene immagini di interpretare come a − b, abbiamo un confronto tra numeri naturali, e quindi
anche (e soprattutto) quando a < b. Naturalmen- sappiamo come funziona. Anche questa definizione
te, questo è logicamente scorretto perché non si sa ha un senso abbastanza ovvio se guardiamo alla noancora ufficialmente cosa sia a − b proprio quando stra interpretazione; infatti, a − b ≤ c − d significa
a < b, ma l’idea ci permette di entrare nello spirito proprio a + d ≤ b + c. Facciamo ora vedere che la
di questa impostazione. Si dice che due coppie so- relazione cosı̀ definita è una relazione d’ordine che
no equivalenti, e si scrive (a, b) ∼ (c, d) se e solo se estende la relazione “≤” fra i numeri naturali. La proa + d = b + c; questa è un’uguaglianza tra numeri prietà riflessiva è ovvia, poiché (a, b) ≤ (a, b) significa
naturali, e quindi sappiamo cosa significa. Nell’inter- a + b ≤ a + b. Per l’antisimmetria, se (a, b) ≤ (c, d) si
pretazione suggerita, due coppie sono equivalenti se ha a + d ≤ b + c, e se (c, d) ≤ (a, b) si ha b + c ≤ a + d;
e solo se hanno la stessa differenza: a − b = c − d, da queste sono relazioni su N, insieme in cui la procui a + d = b + c, ma osserviamo di nuovo che questo prietà antisimmetrica vale, per cui a + d = b + c,
avrà senso solo a posteriori. E’ facile vedere che la cioè (a, b) = (c, d). Infine, per la proprietà transitiva,
relazione definita è proprio di equivalenza: proprietà se (a, b) ≤ (c, d) si ha a + d ≤ b + c e se (c, d) ≤ (e, f )
riflessiva (a, b) ∼ (a, b) ovvia perché a+b = a+b; pro- si ha c + f ≤ d + e; sommando membro a membro
prietà simmetrica: se (a, b) ∼ (c, d), cioè a+d = b+c, si ha a + c + d + f ≤ b + c + d + e e semplificando
allora c + b = a + d che significa (c, d) ∼ (a, b); pro- a+f ≤ b+e, cioè (a, b) ≤ (e, f ). Lasciamo al lettore il
prietà transitiva: se (a, b) ∼ (c, d) cioè a + d = b + c compito di far vedere che se restringiamo il confronto
68
CAPITOLO 3. NUMERI
a elementi positivi (quelli che corrispondono con N)
il confronto dà gli stessi risultati che dà in N.
Il prodotto è definito da:
che produce un Do, si ha ancora un Do, ma un’ottava
più bassa. Gli altri rapporti sono: 9/8 per il Re, 5/4
per il Mi, 4/3 per il Fa, 3/2 per il Sol, 5/3 per il La
e 15/8 per il Si:
(a, b) × (c, d) = (ac + bd, ad + bc).
Questa regola non è poi tanto misteriosa; se (a, b)
rappresenta a − b e (c, d) rappresenta c − d, allora
il loro prodotto deve rappresentare (a − b)(c − d) =
ac − ad − bc + bd, e quindi basta separare gli addendi
positivi da quelli negativi per ottenere la formula del
prodotto. Anche per questa operazione, le proprietà
formali valgono integralmente, ma lasciamo la loro
verifica alla pazienza del lettore volenteroso. Veniamo invece alla regola dei segni, che più ci interessa.
Cominciamo con l’osservare che ogni numero positivo ha, fra le coppie che lo definiscono, una del tipo
(n, 0), mentre ogni numero negativo ne ha una del
tipo (0, n). Se consideriamo i quattro casi possibili,
abbiamo:
(n, 0) × (m, 0)
(n, 0) × (0, m)
(0, n) × (m, 0)
(0, n) × (0, m)
= (nm, 0)
= (0, nm)
= (0, nm)
= (nm, 0)
positivo
negativo
negativo
positivo.
Purtroppo, la divisione è un’operazione piuttosto
complicata, e qui la lasciamo perdere.
3.2
I numeri razionali
L’idea di numero frazionario è molto antica e, bisogna dire, anche molto naturale, al contrario del concetto di numeri negativo che si è affermato soltanto
nel 1600 e non senza notevoli difficoltà. Le frazioni
scaturiscono direttamente dalla realtà: come ci sono
2 mele o 10 arance, cosı̀ c’è mezza mela, un quarto di
pollo o un ottavo di torta. Storicamente, le frazioni
con numeratore unitario, come 1/2, 1/3 o 1/12, hanno avuto un ruolo privilegiato fino al 1600, quando si
impose la notazione decimale con il punto o la virgola di separazione. Gli Egizi usavano solo tali frazioni,
con l’eccezione di 2/3, per cui per esprimere 3/5 dovevano scrivere 1/2 + 1/10, e per esprimere 4/5 si
rifacevano a 1/2 + 1/5 + 1/10. Questo uso, come s’è
detto, si protrasse per tutto il Medio Evo, e anche in
seguito. Invitiamo il lettore a scrivere un algoritmo
che trasformi una frazione nella somma di frazioni
con il numeratore unitario.
Nella Matematica Greca le frazioni avevano un ruolo molto importante e su di esse era in pratica basata
la teoria delle proporzioni, che a lungo dominò la Geometria e l’Aritmetica, fin da quando Pitagora aveva
scoperto i rapporti armonici, cioè i rapporti che regolano la lunghezza delle corde per produrre, vibrando,
le varie note: raddoppiando la lunghezza della corda
Do Re
Mi Fa
Sol
La
Si
Do
Nota 3.1
Questi rapporti corrispondono alla cosiddetta scala naturale, che è un po’ diversa dalla scala
pitagorica nella quale il Mi ha rapporto 81/64, il La
27/16 e il Si 243/128. Queste differenze dipendono dal
fatto che, verosimilmente, il nostro orecchio percepisce
una certa nota se la frequenza del suono è compresa in
un dato intervallo e non solo quando tale frequenza ha
un valore preciso. Entrambe le scale sono approssimazioni che, comunque, appartengono a questi supposti
intervalli. Quale è allora il loro valore centrale? Per
determinarlo possiamo fare tre ipotesi:
• le note si ripetono di ottava in ottava; si passa da
un’ottava all’altra raddoppiando la frequenza;
• per motivi fisiologici, educativi e convenzionali
riusciamo a distinguere 12 note in ciascuna ottava, cosı̀ come riusciamo a distinguere un numero finito di colori dall’insieme infinito delle
lunghezze d’onda luminose;
• il rapporto r tra due note consecutive è costante (natura non facit saltus), contrariamente a quanto si suppone nelle scale naturale e
pitagorica.
Se poniamo uguale ad 1 la frequenza del Do in una
qualsiasi ottava, la nota successiva (che propriamente
è il Do diesis o il Re bemolle) avrà frequenza 1 · r = r,
la nota successiva, cioè il Re, avrà frequenza r2 , e cosı̀
via, fino al Do dell’ottava successiva, che avrà frequenza r12 . Ma questa frequenza, per la prima ipotesi for12
mulata,
√ è uguale a due e quindi si ha r = 2, cioè
12
2 ≈ 1.059463. Questi nuovi rapporti, costituiti
r=
in effetti da numeri irrazionali (si veda più avanti in
questo capitolo), formano la cosiddetta scala temperata. Trascurando le note intermedie, date dai diesis
e dai bemolle delle note corrispondenti agli intervalli
maggiori, si ha la seguente tabellina:
nota
Do
Re
Mi
Fa
Sol
La
Si
Do
scala
pitagorica
1
1.125
1.266
1.333
1.500
1.688
1.898
2
scala
naturale
1
1.125
1.250
1.333
1.500
1.667
1.875
2
scala
temperata
1
1.122
1.260
1.334
1.498
1.682
1.888
2
3.2. I NUMERI RAZIONALI
69
cioè, semplificando, mn′ = m′ n. Questa è una uguaglianza tra numeri interi, e quindi sappiamo come gestirla. Purtroppo il ragionamento che ci ha portato a
questa uguaglianza è basato sul nulla, in quanto sono
Inizialmente, i Greci credevano che presi comunque proprio le regole di comportamento delle frazioni che
due segmenti (o due grandezze omogenee) fosse sem- ci mancano. Il trucco (se di trucco si puó parlare)
pre possibile trovare un loro sottomultiplo comune: se è allora proprio quello di assumere i nostri desideri
questo era 1/n del primo segmento e 1/m del secon- come punto di partenza:
do, il secondo risulta m/n del primo (e il primo n/m
del secondo). I filosofi rimasero sconcertati quando Definizione 3.2 Date due frazioni m/n ed m′ /n′ , si
Pitagora dimostrò che questo non è sempre vero. Ve- dice che esse sono equivalenti se e solo se mn′ = m′ n,
dremo più avanti come stanno le cose, ma, nonostan- e in tal caso scriveremo m/n ∼ m′ /n′ .
te questo risultato negativo, le frazioni rimasero al
Il nome è giustificato dal seguente teorema:
centro del concetto di misura delle grandezze.
Da questa tabella si vede come le approssimazioni
pitagoriche siano migliori di quelle “naturali”.
Nota 3.2
La costruzione formale dei numeri
razionali segue fedelmente la loro introduzione pratica
tradizionale. Questo è l’unico caso in cui ció avviene,
e aiuterà la fantasia del lettore a capire bene anche
le altre costruzioni in cui, come nel caso dei numeri
interi, la costruzione matematica e l’impostazione
pratica differiscono. In effetti, la costruzione matematica dei razionali introduce coppie appartenenti
all’insieme Z × N0 , fra le quali è definita la relazione
di equivalenza (a, b) ∼ (c, d) se e solo se ad = bc. Ma
allora, nella coppia (a, b) ri riconosce sotto mentite
spoglie la frazione a/b e il trucco è subito svelato. Con
queste definizioni, si applicano tutte le considerazioni
viste nella Sezione 3.1 e relative all’estensione degli
insiemi numerici.
Teorema 3.1 La relazione m/n ∼ m′ /n′ è una
relazione di equivalenza.
Prova: La proprietà riflessiva afferma che ogni frazione deve essere equivalente a sé stessa; qui dovremmo avere m/n ∼ m/n, ma in effetti questo significa
mn = mn, il che è senz’altro vero. La proprietà simmetrica parte supponendo che sia m/n ∼ m′ /n′ , cioè
mn′ = m′ n; da questo dovremmo dedurre m′ /n′ ∼
m/n, cioè m′ n = mn′ , che però è valido grazie alla proprietà simmetrica dell’uguaglianza. Infine, se
supponiamo m/n ∼ m′ /n′ ed m′ /n′ ∼ m′′ /n′′ , cioè
mn′ = m′ n e m′ n′′ = m′′ n′ , possiamo moltiplicare
queste due uguaglianze membro a membro e ottenere
mn′ m′ n′′ = m′ nm′′ n′ . Semplificando, per la proprietà di eliminazione del prodotto (v. Sezione 2.3),
si ha mn′′ = m′′ n, il che vuol dire m/n ∼ m′′ /n′′ , e
Formalmente, una frazione è il rapporto di due nuquesta è proprio la proprietà transitiva.
meri interi, il primo detto numeratore e il secondo
denominatore, con quest’ultimo diverso da zero. Ad
Useremo il seguente risultato:
esempio, sono frazioni 3/5, −7/6, 5/(−8), −3/(−1).
′
′
Convenzionalmente, non si considerano le frazioni che Teorema 3.2 Due frazioni m/n e m /n sono equi′
siano il rapporto di due numeri negativi, che, per la valenti se e solo se esistono due numeri interi k, k
′ ′
′ ′
regola dei segni, è uguale a un opportuno rappor- tali che mk = m k e nk = n k .
to tra numeri positivi. In modo analogo, le frazioni
Se le due frazioni sono equivalenti si ha
con numeratore positivo e denominatore negativo si Prova:
′
′
mn
=
m
n,
ma è anche nn′ = n′ n e quindi possiamo
considerano uguali a quelle analoghe con numerato′
′
re negativo e denominatore positivo. In altre parole, porre k = n′ e k = n. Viceversa, supponiamo che
in
mentre il numeratore è un numero intero qualunque, esistano k, k con la proprietà detta; moltiplicando
croce le due uguaglianze si ha: mkn′ k ′ = m′ k ′ nk;
il denominatore è un intero strettamente positivo.
non nullo kk ′ può essere eliminaIl problema che nasce in modo naturale con le fra- il fattore comune
′
′
zioni è quello della loro uguaglianza. Sappiamo tutti to e quindi mn = m n, e questo significa che le due
frazioni
sono
equivalenti.
per esperienza che mezza mela è la stessa quantità di
due quarti di mela, cioè 1/2 = 2/4, e quindi la rappresentazione delle frazioni non è unica. A livello intuitivo, vorremmo che per le frazioni valesse la stessa
regola che conosciamo per i numeri interi, cioè che due
frazioni uguali rimangono tali se le moltiplichiamo o
le dividiamo per la stessa quantità diversa da zero.
Ad esempio, se m/n = m′ /n′ , vorremmo che questa rimanesse un’uguaglianza quando moltiplichiamo
tutto per nn′ ; questo ci darebbe mnn′ /n = m′ nn′ /n,
Se abbiamo due frazioni equivalenti e facciamo la
scomposizione in fattori primi di numeratori e denominatori, possiamo semplificare i fattori comuni;
si ottengono cosı̀ frazioni identiche, nel senso che
coincidono tanto i numeratori che i denominatori.
Teorema 3.3 Siano m/n ed m′ /n′ due frazioni equivalenti; esiste allora un’unica frazione r/s equivalente
alle due frazioni date e tale che MCD(r, s) = 1.
70
Prova: Consideriamo m/n ed eliminiamo eventuali
fattori primi comuni a numeratore e denominatore
ottenendo cosı̀ la frazione r/s tale che MCD(r, s) = 1.
La semplificazione ci assicura che m/n ed r/s sono
frazioni equivalenti e quindi esistono due interi h, h′
tali che mh = rh′ ed nh = sh′ . D’altra parte, per
l’equivalenza delle frazioni assegnate, devono esiste
k, k ′ tali che mk = m′ k ′ ed nk = n′ k ′ . Poiché, dalla
divisione fra naturali, si ha m = rh′ /h ed n = sh′ /h,
sostituendo si ottiene: rh′ k/h = m′ k ′ , cioè rh′ k =
m′ hk ′ , e analogamente sh′ k/h = n′ k ′ , cioè sh′ k =
n′ hk ′ . Ma questo significa che r/s è equivalente anche
ad m′ /n′ . Quindi frazioni equivalenti si riducono alla
stessa frazione r/s, con MCD(r, s) = 1. Vediamo
ora che tale frazione è unica. Se ne esistesse un’altra
r′ /s′ , essa dovrebbe comunque essere equivalente ad
r/s e quindi avremo rs′ = r′ s. Poiché r non divide
s, r dovrà dividere r′ , cioè r′ = kr; questo porta
a rs′ = rks, cioè s′ = ks; in altre parole, r′ /s′ è
la frazione kr/ks; ma dall’ipotesi MCD(r′ , s′ ) = 1
deriva k = 1 e quindi r/s = r′ /s′ .
Le frazioni r/s tali che MCD(r, s) = 1 si dicono ridotte ai minimi termini; poiché rappresentano
il modo più semplice di scrivere una frazione della
propria classe di equivalenza, costituiscono un punto
di riferimento preciso e spesso è conveniente rifarsi
direttamente a loro.
Secondo una vecchia classificazione, le frazioni si
dividono in proprie, improprie ed apparenti. Le frazioni proprie sono quelle in cui il numeratore è inferiore al denominatore; queste sono le vere frazioni,
nel senso che corrispondono a una parte propria del
tutto, come 1/3, 2/5 o 7/10. Frazioni come 7/5 o
9/2 indicano quantità maggiori del tutto, e pertanto si dicono “improprie”; esse possono essere espresse come un numero intero più una frazione propria:
7/5 = 1 + 2/5 e 9/2 = 4 + 1/2; queste espressioni si
ottengono eseguendo la divisione intera fra numeratore e denominatore e poi considerando il resto come
frazione propria. Infine, una frazione come 6/3 è solo
tale in apparenza ed eseguendo la riduzione ai minimi termini si trova come sia equivalente al numero
intero 2. Da questo punto di vista, l’insieme delle frazioni è più esteso dell’insieme dei numeri interi, che
corrispondono solamente alle frazioni apparenti. Vedremo fra poco come si estende e si formalizza tale
osservazione.
Quel che ora ci preoccupa è: come si eseguono le
operazioni fra frazioni e come si confrontano due frazioni? Abbiamo visto come il confronto e le operazioni siano aspetti essenziali dei numeri naturali e dei
numeri interi; vogliamo che sia cosı̀ anche per le frazioni. Consideriamo come emblematici il confronto e
l’operazione di addizione. Se dobbiamo sommare 1/4
e 2/5 ci troviamo in imbarazzo perché sembra di voler
CAPITOLO 3. NUMERI
sommare una mela con due pere: infatti, 1/4 di torta
è una certa quantità che possiamo immaginare come una bella fetta; 2/5 di torta li vediamo come due
fette, ma ciascuna un po’ più piccola della fetta corrispondente a 1/4. Allora, l’imbarazzo è quello di dover
sommare fette grosse con fette piccole. Per vedere le
cose da un altro punto di vista, se dovessimo sommare 1/4 e 2/4, l’operazione non risulterebbe difficile,
perché le fette sono della stessa grandezza e il risultato sarebbe 3/4 senza dubbio. Allora è importante
il seguente procedimento:
Algoritmo 3.1 (Stesso denominatore)
Ingresso: due frazioni m/n ed m′ /n′ ;
Uscita: due frazioni r/s ed r′ /s, equivalenti a quelle
date, ma con lo stesso denominatore s;
1. si pone s := mcm(n, n′ );
2. si pone r := m × s/n;
3. si pone r′ := m′ × s/n;
4. si esce con le due frazioni r/s ed r′ /s.
La dimostrazione che r/s ∼ m/n è immediata; infatti, per costruzione, abbiamo r/s = ms/ns e questa
frazione è chiaramente equivalente ad m/n. Lo stesso
vale per r′ /s ∼ m′ /n′ .
Sapendo riportare due frazioni a un denominatore
comune, scatta l’osservazione fatta in precedenza:
Algoritmo 3.2 (Confronto tra frazioni)
Ingresso: due frazioni m/n ed m′ /n′ ;
Uscita: “Maggiore”, “Uguale” o “Minore” a seconda
che tale sia m/n nei confronti m′ /n′ ;
1. si pone s := mcm(n, n′ ) e si considerano le due
frazioni r/s ed r′ /s equivalenti ad m/n ed m′ /n′ ,
secondo il precedente algoritmo;
2. se r < r′ allora si esce con “Minore”;
3. altrimenti, se r
“Maggiore”;
>
r′ allora si esce con
4. altrimenti (r = r′ ) si esce con “Uguale”.
Essendo i denominatori uguali, cioè avendo ridotto le
fette della torta a “fettine” delle stesse dimensioni, il
numeratore regola il confronto, secondo l’ovvio criterio che la frazione con il maggior numero di fettine è
quella più grande. In modo analogo si procede per la
somma:
Algoritmo 3.3 (Somma di due frazioni)
Ingresso: due frazioni m/n ed m′ /n′ ;
Uscita: la somma m/n + m′ /n′ ;
1. si pone s := mcm(n, n′ ) e si considerano le due
frazioni r/s ed r′ /s equivalenti ad m/n ed m′ /n′ ;
3.2. I NUMERI RAZIONALI
2. si esce col risultato (r + r′ )/s.
71
Teorema 3.4 Siano m/n ed m′ /n′ due frazioni tali
che m/n < m′ /n′ . Allora, per ogni altra frazione
µ/ν ∼ m/n e µ′ /ν ′ ∼ m′ /n′ , si ha µ/ν < µ′ /ν ′ .
La differenza si esegue come l’addizione, per cui non
diamo l’algoritmo in modo esplicito. Il prodotto
segue la logica delle parti, propria del concetto di Prova: Siano r/s ed r′ /s′ le due frazioni di partenza
frazione. Ad esempio, (2/3) × (3/5) significa:
ridotte ai minimi termini. Questo significa m = rk,
n = sk, m′ = r′ h ed n′ = s′ h. Supponiamo anche
• dividere un oggetto in 5 parti e prenderne 3;
che le frazioni siano positive (negli altri casi la proavanti nello stesso modo); la
• di quello che si ottiene, dividere in 3 parti e va è banale o si porta
′
′
condizione
m/n
<
m
/n
equivale a mn′ < m′ n. Per
prenderne 2.
le uguaglianze viste si ha allora: rks′ h < skr′ h, cioè
Ma dividere prima in 5 parti e poi in 3 è come divi- rs′ < sr′ il che significa r/s < r′ /s′ . Poiché il ragiodere l’oggetto in 15 parti; fatto questo, si prendono 2 namento si può invertire, vediamo che m/n < m′ /n′
parti per ognuna delle 3 parti considerate nella prima equivale ad r/s < r′ /s′ . Ma questo si può ripetere ansuddivisione: in definitiva, si prendono 6 parti delle che per µ/ν e µ′ /ν ′ , che si riducono alle stesse frazioni
r/s ed r′ /s′ . Quindi la disuguaglianza si trasferisce a
15 della divisione. In generale, abbiamo:
tutte le frazioni equivalenti ad m/n ed m′ /n′ , come
m m′
mm′
si voleva.
× ′ =
.
n
n
nn′
Questo teorema ha una dimostrazione noiosa, ma è
Se anche le due frazioni sono ridotte ai minimi ter- importante perché ci permette di capire come la defimini, può accadere che il prodotto non lo sia: questo nizione di confronto data in precedenza non dipenda
perché ci possono essere fattori a comune tra m ed n′ dalla particolare frazione con cui stiamo lavorando,
oppure tra n ed m′ . Può essere allora conveniente ese- ma valga per tutte le frazioni ad essa equivalenti. La
guire una semplificazione prima della moltiplicazione, stessa proprietà vale per la somma:
come ad esempio in:
Teorema 3.5 Siano m/n ed m′ /n′ due frazioni; se
8
4 8
32
20
r/s ∼ m/n e r′ /s′ ∼ m′ /n′ , allora m/n + m′ /n′ ∼
×
= × =
.
7
15
7 3
21
r/s + r′ /s′ .
Concludiamo con la divisione; l’operazione, come Prova:
Se r/s ∼ m/n, si ha rn = ms e se
si sa, è l’inversa della moltiplicazione, e quindi si ha: r′ /s′ ∼ m′ /n′ è anche r′ n′ = m′ s′ . Moltiplicando
la prima uguaglianza per n′ s′ e la seconda per ns,
m m′
m
n′
mn′
: ′ =
× ′ =
.
si ottiene rnn′ s′ = msn′ s′ e nsr′ n′ = nsm′ s′ . Somn n
n
m
nm′
mando membro a membro si ha rnn′ s′ + nsr′ n′ =
Se le due frazioni di partenza sono equivalenti, cioè msn′ s′ +nsm′ s′ , cioè (rs′ +r′ s)nn′ = (mn′ +m′ n)ss′ .
mn′ = m′ n, il loro rapporto è 1, come ci si può Ma questo significa:
aspettare.
rs′ + r′ s
mn′ + m′ n
r r′
m m′
La relazione di equivalenza m/n ∼ m′ /n′ ci per∼
o
+
∼
+ ′
ss′
nn′
s s′
n
n
mette di raggruppare insieme frazioni equivalenti,
cioè frazioni che hanno lo stesso significato, come 1/2
che è giusto quello che si voleva.
e 2/4. Abbiamo anche visto come si fanno i confronti
Questo tipo di dimostrazione può essere esteso al
e come si eseguono le operazioni fra frazioni. Formalmente, potremmo considerarci a posto, ma in realtà prodotto, alla differenza e alla divisione. I dettagli
il lettore si sarà sentito a disagio per un motivo mol- interessano abbastanza poco, ma quello che vogliamo
to profondo: quando ad esempio confrontiamo 2/3 e sottolineare è come, in tutti i casi, frazioni equivalenti
3/5 e, portandoli allo stesso denominatore, confron- si comportino nello stesso modo. C’è quindi qualcosa
tiamo di fatto 10/15 e 9/15, ci chiediamo: se fossimo in più della semplice somiglianza formale fra frazioni
partiti da due frazioni equivalenti a 2/3 e 3/5, ad equivalenti: c’è addirittura lo stesso significato, nel
esempio 20/30 e 27/45, saremmo comunque arrivati senso di comportamento nei confronti delle operazioalla stessa conclusione, e cioè che la prima è maggiore ni. Questo è il vero motivo (e non certo la sola nostra
della seconda? Propriamente, per confrontare 20/30 intuizione) che ci porta ad identificare in un concete 27/45 dobbiamo riportare tutto allo stesso deno- to unico tutte le frazioni equivalenti. Pertanto, da
minatore 90, e cioè a 60/90 e 54/90: vediamo che questo momento in avanti, come si fa di regola, non
il primo è ancora maggiore, ma come assicurarci che diremo più che due frazioni sono equivalenti, ma adquesto vale per tutte le infinite frazioni equivalenti a dirittura uguali, e useremo il segno = invece del segno
2/3 e 3/5? Vale il seguente:
∼.
72
CAPITOLO 3. NUMERI
Definizione 3.3 Un numero razionale è la classe di oggi. Fino al 1600 non si ebbe idea della rappretutte le frazioni fra loro equivalenti. L’insieme dei sentazione decimale delle frazioni, se si eccettuano i
numeri razionali si indica con Q.
Babilonesi, che anche in questo furono precursori di
concezioni moderne. Come le cifre prima del punto
Anche se ormai ci dovremmo essere abituati, questa decimale indicano multipli di potenze del 10, cosı̀ le
è una definizione ben strana, visto che afferma cosı̀ cifre dopo il punto decimale denotano multipli di pocategoricamente che una classe (cioè un insieme) è tenze di 1/10. Pertanto 154.327 sta a rappresentare
un numero. Ma ormai sappiamo che la Matematica il numero:
è ricca di queste apparenti incongruenze e le consi2
7
3
derazioni e le prove precedenti ci assicurano che il
+ 2 + 3;
1 × 102 + 5 × 10 + 4 +
10
10
10
confronto e le quattro operazioni sono ben definite
in Q, perché non dipendono dal particolare elemen- come si sa, la prima cifra dopo il punto indica i decito scelto per eseguire il confronto o l’operazione. Di mi, la seconda i centesimi, la terza i millesimi, e cosı̀
fatto, il senso della definizione è proprio questo: è in- via all’infinito, anche quando mancano nomi specifici
differente considerare una qualsiasi delle frazioni che di riferimento; tuttavia, tutti sappiamo cosa signifistanno in una certa classe; il risultato di un confronto ca 3/1035 e quale posto la cifra 3 occuperebbe in un
o di un’operazione sarà sempre lo stesso, cioè sarà in- numero di cui tale frazione facesse parte.
dipendente da quel particolare valore che scegliamo,
Partendo da una frazione specifica, ad esempio
o siamo costretti a scegliere, all’interno della classe. 24/7, il numero decimale ad esso corrispondente si
Spesso, come si sa, si preferisce avere a che fare con trova eseguendo la divisione decimale, o, secondo l’ule frazioni ridotte ai minimi termini, ma si tratta solo so, la divisione tout-court, quando si chiami, come
di una questione di convenienza, data dal fatto che già detto, divisione intera la divisione che produce un
una frazione ridotta ai minimi termini ha il numera- quoziente intero e un resto. L’esecuzione della divitore e il denominatore più piccoli fra le frazioni equi- sione avviene in modo analogo a quanto visto nell’alvalenti, cioè nella stessa classe. Cosı̀ preferiamo 2/3 goritmo della divisione intera, solo che quando sono
a 52/78 o a 4354/6531, ma se confrontiamo quest’ul- esaurite le cifre della parte intera del dividendo, si
tima frazione con 1/2, troviamo che essa è maggiore, mette il punto decimale al quoziente e si continua,
esattamente come lo è 2/3.
abbassando o calando le cifre decimali del dividendo
Concludiamo dimostrando una delle proprietà im- (se ce ne sono) o la cifra 0, quando quelle manchino o
portanti dei numeri razionali. I numeri interi costi- siano esaurite. Qui riportiamo la divisione di 24 per
tuiscono un insieme numerico discreto, tale cioè che 7:
tra due interi consecutivi, diciamo 5 e 6, esiste un
7
2 4
“vuoto”, ovvero un intervallo nel quale non esistono
3
0
3.
4 2 6 5 7 1
numeri interi. Per i razionali questo non è vero, e vale
2
0
invece:
6 0
Teorema 3.6 (di densità) Se q1 < q2 sono due
4 0
numeri razionali qualsiasi, esiste sempre un numero
5 0
q ∈ Q tale che q1 < q < q2 .
1 0
3
Prova:
Basta considerare la semisomma q =
(q1 + q2 )/2, che gode chiaramente della proprietà Teorema 3.7 Se due frazioni m/n ed m′ /n′ sodesiderata.
no equivalenti, allora esse corrispondono allo stesso
numero decimale.
Come vedremo nella Sezione 3.5, i numeri reali hanno una propriet ancora più forte, detta continuità. Prova: Come osservato a suo tempo, un rapporto
La proprietà dei razionali appena dimostrata si dice non cambia se moltiplichiamo o dividiamo dividendo
invece densità e si esprime con la frase: “i numeri e divisore per una stessa quantità diversa da 0. Ma se
razionali sono densi”.
r/s è la frazione ridotta ai minimi termini equivalente
3.3
I numeri decimali
ad m/n, tale sarà anche per m′ /n′ . Quindi m/n,
m′ /n′ e r/s devono dare lo stesso risultato quando si
divide numeratore per denominatore onde ottenere il
corrispondente numero decimale.
Come s’è detto, le frazioni hanno un’origine antichisLa divisione potrebbe continuare, determinando
sima, dovuta alla loro natura intuitiva e fondamentalmente pratica. Curiosamente, gli Egizi rappresenta- spesso (come nel caso dell’esempio precedente) uno
vano le frazioni in modo analogo a quanto facciamo sviluppo infinito del numero decimale:
3.3. I NUMERI DECIMALI
Teorema 3.8 Sia m/n una frazione e sia r/s ∼
m/n la stessa frazione ridotta ai minimi termini. Se
il denominatore s contiene solo i fattori 2 e 5, allora
la frazione corrisponde a un numero decimale finito.
73
insieme; e vale anche per l’insieme C dei numeri complessi che noi tratteremo solo superficialmente, e che
verrà approfondito nei corsi universitari. Fissiamo
allora uno di questi insiemi e chiamiamo “successione numerica” una regola che ad ogni elemento di N
Prova: Sia s = 2i 5j , con i e j eventualmente 0,
associa uno ed uno solo degli elementi dell’insieme
ma non entrambi. Sia k il massimo tra i e j, e
numerico fissato. Ad esempio, se la regola associa a 0
moltiplichiamo r ed s per 2k−i 5k−j . Allora si ha:
lo stesso numero 0, ad 1 il numero 2, a 2 il numero 4,
k−i
k−j
k−i
k−j
a 3 il 6, e cosı̀ via, ciò che otteniamo è la successione
r×2
×5
r×2
×5
r
=
=
dei numeri pari.
s
2k × 5k
10k
Formalmente , una successione è una funzione f :
e questo, come sappiamo, è un numero decimale con N → K, dove K è un opportuno insieme numerik cifre dopo il punto decimale.
co. Convenzionalmente, l’immagine f (k) si scrive fk
3
e
l’intera successione si denota come {fk }k∈N . La
Come esempio consideriamo 77/250 = 77/(2 × 5 ) =
2
3
3
successione:
77 × 2 /(2 × 5 ) = 308/1000 = 0.308.
L’importante caso alternativo è il seguente:
x0 = 0, x1 = 1, x2 = 4, x3 = 9, x4 = 16, x5 = 25, . . .
Teorema 3.9 Sia m/n una frazione e sia r/s ∼
m/n la stessa frazione ridotta ai minimi termini. rappresenta chiaramente la successione dei quadrati,
Se s contiene fattori diversi da 2 e da 5, allora la il cui elemento generico sarà scritto xk = k 2 e la
frazione corrisponde a un numero decimale periodico. successione nel suo insieme {xk }k∈N = {n2k }k∈N . Un
altro esempio è dato dalla successione:
Prova: Si immagini di effettuare la divisione decimale fra r ed s; come visto, ad ogni passaggio dob1
2
3
4
x0 = 0, x1 = , x2 = , x3 = , x4 = , . . .
biamo stabilire quante volte s sta in un numero che
2
3
4
5
termina per 0; questo è divisibile per s soltanto se s
contiene fattori 2, 5 e nessun altro. Quindi, s non il cui elemento generico è xk = k/(k + 1), cioè, glosarà mai un divisore dei numeri con i quali viene con- balmente, {xk }k∈N = {k/(k + 1)k }k∈N . Una succesfrontato, ma ciò significa che il numero decimale che sione molto famosa, e che abbiamo già incontrato, è
man mano si ottiene non può essere finito. D’altra quella di Fibonacci (vedere Nota 2.7):
parte, i possibili resti che si hanno nella divisione soF0 = 0, F1 = 1, F2 = 1, F3 = 2, F4 = 3, F5 = 5,
no solo 1, 2, . . . , s−1, quindi dopo al più s−1 passaggi
si avrà la ripetizione di un resto; da quel momento in
F6 = 8, F7 = 13, . . .
poi i resti si ripeteranno nello stesso ordine e quindi
il numero sarà periodico.
nella quale ogni elemento (a partire da F2 ) è dato dalL’esempio precedente della frazione 24/7 è signifi- la somma dei due che lo precedono. Possiamo definire
cativo; quando si ottiene il resto 3, che già si era avu- anche successioni arbitrarie, scegliendo casualmente i
to, la divisione continuerà con i resti 2, 6, 4, . . . corri- vari elementi; in questo caso, però, non possiamo daspondenti alle cifre del quoziente 4, 2, 8, . . .. Quindi, re una formula esplicita per calcolare il generico eleil periodo è costituito dalle cifre 428571, che si ripe- mento xk . Generalmente, si incontrano successioni
teranno un numero infinito di volte. Secondo l’uso, il definite con regole abbastanza semplici e chi ha espeperiodo si denota soprallineando le cifre che lo com- rienza di Excel, un programma di foglio elettronico,
pongono, e pertanto scriveremo 24/7 = 3.428571, cosı̀ sa che dando all’elaboratore i primi elementi di una
come 1/3 = 0.3, 7/11 = 0.63 e 39/22 = 1.772. Il let- successione, quello cercherà di “indurre” gli elementi
tore curioso può divertirsi a trovare (e a confrontare) successivi ipotizzando una regola di formazione che
il periodo delle frazioni 1/7, 2/7, 3/7, 4/7, 5/7 e 6/7. sia “abbastanza” semplice.
Il concetto che ora vogliamo introdurre è molto imQuando siamo interessati soltanto ai primi elemenportante e riguarda le cosiddette successioni numeri- ti di una successione (x1 , x2 , . . . , xr ), tale sequenza
che. Intuitivamente, una successione è una sequenza finita è detta più propriamente progressione. Qui ci
ordinata di numeri nella quale si distinguono un pri- occuperemo di due tipi particolari di progressione. Si
mo elemento, un secondo elemento, e cosı̀ via. Questo dice progressione aritmetica di ragione q una progresnon spiega granché, per cui cerchiamo di essere più sione il cui primo elemento è un numero qualsiasi x0 e
precisi. Consideriamo un insieme numerico; abbiamo ogni altro elemento è ottenuto aggiungendo q a quelgià introdotto N, Z e Q, e su di questi ci baseremo. lo precedente. Pertanto, x1 = x0 + q, x2 = x0 + 2q,
Tuttavia, in seguito, introdurremo l’insieme dei nu- x3 = x0 + 3q e cosı̀ via fino ad xr = x0 + rq. La promeri reali R e ciò che diremo ora vale anche per tale gressione aritmetica più semplice è (0, 1, . . . , r), nella
74
CAPITOLO 3. NUMERI
S
S
2S
=
x0
= x0 + rq
= 2x0 + rq
+
x0 + q
+ x0 + (r − 1)q
+
2x0 + rq
+ ···
+ ···
+ ···
+ x0 + (r − 1)q
+
x0 + q
+
2x0 + rq
+
+
+
x0 + rq
x0
2x0 + rq
Tabella 3.1: Somma di una progressione aritmetica
quale x0 = 0 e q = 1. Una progressione aritmetica di ragione 3 è (5, 8, 11, . . . , 44) e si può considerare aritmetica anche una progressione costante come
(5, 5, . . . , 5), dove x0 = 5 e q = 0.
Il risultato più importante relativo alle progressioni
aritmetiche riguarda la somma di tutti i suoi elementi:
metodo ingenuo di far la somma di tutti gli elementi,
l’altro sfruttando la formula del corollario. Discuta
poi quale dei due algoritmi è da preferire.
Il secondo tipo di progressione che vogliamo considerare è quello delle progressioni geometriche: queste
Teorema 3.10 Sia (x0 , x0 + q, x0 + 2q, . . . , x0 + rq) sono definite dalle regole: x0 = 1 e xj+1 = qxj , cioè,
una progressione aritmetica; detta S la somma dei a parte x0 , ogni altro elemento della progressione è il
prodotto dell’elemento precedente per una quantità q,
suoi elementi, si ha:
detta la ragione della progressione. Questo significa:
x0 + xr
r(r + 1)q
=
(r + 1).
S = x0 (r + 1) +
x0 = 1, x1 = q, x2 = q 2 , . . . , xr = q r .
2
2
Nel seguito considereremo valori di q > 0; osserviamo esplicitamente che se q > 1 allora gli elementi
della progressione vanno crescendo e diventano sempre più grandi al crescere di r. Viceversa, se q < 1 la
progressione va decrescendo e i suoi elementi si avvicinano sempre di pù a 0. Invitiamo fin d’ora il lettore a modificare (dimostrandole) le formule successive
nell’ipotesi che sia x0 = a 6= 0, e quindi xj = aq j .
La quantità più interessante è ancora la somma di
Un caso particolarmente importante corrisponde tutti gli elementi della progressione; il risultato è il
alla progressione (0, 1, 2, . . . , r):
seguente:
Prova:
Scriviamo gli elementi della progressione da sinistra a destra e poi, al di sotto, da destra a sinistra. Si ha allora la situazione della Tabella 3.1. Sommando termine a termine, nell’ultima riga abbiamo la somma di r + 1 termini tutti uguali a 2x0 + rq = x0 + xr , per cui si trova:
2S = (r + 1)(2x0 + rq) = (x0 + xr )(r + 1). Ricavando
S, si ha la formula desiderata.
Corollario 3.11 La somma dei primi r numeri Teorema 3.12 Sia (1, q, q 2 , . . . , q r ) una progressiointeri positivi vale:
ne geometrica di ragione q 6= 1; allora:
1 + 2 + ··· + r =
r(r + 1)
.
2
Prova: Basta porre x0 = 0, xr = r e q = 1 nelle
formule del teorema precedente.
Nota 3.3
Gauss (1777 – 1855) è considerato uno
dei più grandi matematici mai esistiti, essendosi interessato di tutti i rami della Matematica e ottenendo
ovunque fondamentali risultati. Si dice che quando
frequentava la scuola elementare, un giorno il maestro
desse alla classe il compito di trovare la somma dei
primi cento numeri. Sperava cosı̀ di avere un po’ di
tranquillità per potersi dedicare a qualche propria
occupazione. Ma dopo appena due minuti Gauss si
alzò affermando di aver già risolto il problema. Il
maestro, incredulo, gli chiese il risultato, che era naturalmente quello esatto: 5050. Gauss aveva intuito
la formula data nel corollario e aveva semplicemente
calcolato il prodotto 100 × 101/2 = 50 × 101 = 5050.
Il lettore è invitato a scrivere due algoritmi per la
somma dei primi r numeri interi: uno applicando il
S = 1 + q + q2 + · · · + qr =
q r+1 − 1
.
q−1
Prova: Consideriamo il prodotto qS = q + q 2 + q 3 +
· · · + q r+1 e la differenza qS − S; in questa i termini
q, q 2 , . . . , q r si eliminano l’un l’altro e, in conclusione, non rimane che qS − S = q r+1 − 1. Ricavando
S da questa equazione si ottiene proprio l’identità
desiderata.
Si osservi che abbiamo escluso il caso q = 1; la
somma sarebbe banale, ma la formula del teorema
porterebbe alla forma indeterminata 0/0. Nel caso
q = 2, la somma 1 + 2 + 4 + · · · + 128, cioè da 1 a 27 ,
dà 28 − 1 = 255. Si osservi anche il caso in cui q < 1;
ad esempio, ponendo q = 1/2 si ha per r = 10:
1+
1
1/2048 − 1
1 1
+ + ··· +
=
=
2 4
1024
1/2 − 1
=
1 − 1/2048
1
=2−
.
1 − 1/2
1024
75
3.3. I NUMERI DECIMALI
Questo numero differisce per meno di un millesimo da
2. Che succede se passiamo ora ad r = 20, o addirittura ad r = 100? La differenza da 2 diventa sempre
più piccola. Questa osservazione ci verrà molto utile
nelle considerazioni successive.
Come abbiamo osservato, ogni frazione corrisponde a un numero decimale, necessariamente finito (se
il denominatore contiene solo potenze del 2 e del 5)
o periodico. Vogliamo ora affrontare il problema opposto: dato un numero decimale finito o periodico, è
vero che questo corrisponde a una frazione, cioè a un
numero razionale? La risposta sarà sı̀, e vedremo anche qual è l’algoritmo che, dato il numero decimale,
permette di trovare la frazione equivalente.
Intanto, la cosa è semplice per i numeri decimali
finiti. Cominciamo col dimostrare il seguente teorema
sulla divisione per 10:
Teorema 3.13 Se la rappresentazione decimale del
numero a è dr dr−1 . . . d1 d0 .c1 c2 . . ., allora la rappresentazione di a/10 è dr dr−1 . . . d1 .d0 c1 c2 . . ., cioè
a/10 si ottiene spostando il punto decimale di una
posizione a sinistra.
1
=
10
=
µ
1
1
1+
+ . . . + r−1
10
10
¶
=
1 1 − 1/10r
1
1
= −
.
10 1 − 1/10
9 9 × 10r
Possiamo osservare che quando r è 10 o 20, questa
quantità è molto vicina a 1/9 e, anzi, man mano che
r cresce, la vicinanza a 1/9 è sempre più marcata,
nel senso che la differenza 1/(9 × 10r ) è praticamente nulla. Se allora consideriamo il numero periodico
1
+ 1012 + 1013 + · · · e lo vediamo come la som0.1 = 10
ma di infiniti termini, possiamo immaginare che esso
divenga 1/9 in quanto la r è infinitamente grande: la
differenza 1/(9 × 10r ) deve diventare 0. Questo ragionamento è plausibile e ha solo l’inconveniente di
tirare in ballo quantità infinite: un numero infinito
di termini del tipo 1/10r , un r che diviene infinito,
un errore che tende ad essere infinitamente piccolo.
Ha senso tutto questo? In effetti sı̀, e la riprova sta
nel semplice fatto che se partiamo da 1/9 ed eseguiamo la divisione, troviamo appunto 0.111 . . . = 0.1.
La conclusione è quindi 0.1 = 1/9, nel senso preciso
che l’uguaglianza si può leggere tanto da sinistra verso destra, quanto da destra verso sinistra. Possiamo
allora generalizzare questo ragionamento:
Prova: Per le proprietà della notazione posizionale,
a/10 vale:
´
1 ³
c1
dr × 10r + · · · + d1 × 10 + d0 +
+ ··· =
Lemma 3.15 Sia (1, q, q 2 , q 3 , q 4 , . . .) una successio10
10
ne di infiniti termini in cui ognuno è ottenuto moltic1
d0
plicando per q < 1 il precedente. La somma S di tutti
r−1
+
+ ···
= dr × 10
+ · · · + d1 +
10 102
gli elementi della successione è allora S = 1/(1 − q).
e questo, riportato alla notazione decimale, ci dà il
Prova: Naturalmente, non sappiamo eseguire una
risultato cercato.
somma con infiniti termini; arrestiamo allora la sucNaturalmente, la stessa proprietà vale per le divi- cessione al termine q r , ottenendo cosı̀ una progressiosioni per 100, 1000 e cosı̀ via; pertanto un corollario ne geometrica di ragione q.Il Teorema [3.11] ci dice
del teorema è:
che la somma Sr (l’indice r serve a ricordarci che ci
siamo
fermati al termine q r ) è:
Corollario 3.14 Se un numero decimale finito ha
k cifre dopo il punto decimale, diciamo a =
1 − q r+1
1
q r+1
dr dr−1 . . . d1 d0 .c1 . . . ck , allora a è equivalente alla
Sr =
=
−
.
1−q
1−q 1−q
frazione:
dr dr−1 . . . d1 d0 c1 . . . ck
.
10k
Essendo q < 1, la quantità q r+1 diviene sempre
più piccola al crescere di r e tale, perciò, è anche
r+1
Quindi, la semplice regola per trasformare a in una q /(1 − q). Man mano quindi che consideriamo
frazione è: togliere il punto decimale e dividere per più termini della successione, la differenza di Sr da
10k , se k è il numero delle cifre di a dopo il punto 1/(1 − q) si avvicina a 0 e, in conclusione, possiamo
decimale. Pertanto 5.7 = 57/10 e ci possono essere assumere che, per la successione completa, si abbia
S = 1/(1 − q).
semplificazioni come in 8.375 = 8375/1000 = 67/8.
Per affrontare il caso dei numeri decimali non fiSe q = 1/2 come nella sezione precedente, e pensianiti, e quindi periodici, è opportuno partire conside- mo a sommare 1+1/2+1/4+· · ·, intuitivamente comrando progressioni geometriche con ragione q minore prendiamo che la somma totale deve essere 2; questo
di 1. Prendiamo il caso q = 1/10 che è quello che ci è in accordo con la formula S = 1/(1 − 1/2) = 2. Nel
interessa e cerchiamo la somma della progressione:
caso q = 1/10 abbiamo 1+1/10+1/100+· · · = 10/9 =
1, 1. Ma quello che più ci interessa è il seguente
1
1
1
1
+
+ 3 + ··· + r =
risultato:
10 102
10
10
a=
76
CAPITOLO 3. NUMERI
Corollario 3.16 Sia r ∈ N, r ≥ 1; allora vale Nell’esempio abbiamo:
l’uguaglianza:
1
1
0.57999 . . . = 0.57 +
+
+ ··· =
1
1
1
1
1000 10000
+
+
+
·
·
·
=
,
10r
102r
103r
10r − 1
1
= 0.57 + 0.01 = 0.58.
= 0.57 +
100
cioè la somma è uguale a una frazione il cui numeratore è 1 e il cui denominatore è costituito da r cifre Questa proprietà ci dice che i numeri con periodo 9 sotutte uguali a 9.
no dei doppioni, e quindi possono essere (anzi, devono
essere) ignorati. Da questo momento in avanti, quanProva: Basta applicare il lemma precedente:
do parleremo di rappresentazione decimale dei numeri, escluderemo, esplicitamente o implicitamente,
1
1
1
+ 2r + 3r + · · · =
quelle che presentano il periodo 9.
r
10
10
10
Un altro passo può ora essere fatto considerando
¶
µ
1
1
1
un numero con una parte intera diversa da 0. Sia
= r 1 + r + 2r + · · · =
a = dh dh−1 . . . d1 d0 .c1 c2 . . . cr il numero decimale pe10
10
10
riodico che vogliamo considerare; per quanto visto,
r
1
1
1
10
= r
=
;
abbiamo:
10 1 − 1/10r
10r 10r − 1
c1 c2 . . . cr
=
a = dh dh−1 . . . d1 d0 +
questa espressione si semplifica dando quella deside10r − 1
rata.
dh . . . d1 d0 × 10r + c1 c2 . . . cr − dh . . . d1 d0
Questo corollario ci dice che il numero periodi=
.
10r − 1
co 0.01 equivale alla frazione 1/99 essendo 0.01 =
1/100 + 1/10000 + · · ·. L’estensione a un numero del La quantità dh dh−1 . . . d1 d0 × 10r + c1 c2 . . . cr è semplicemente la sequenza delle cifre che compongono a,
tipo 0.c1 c2 . . . cr è immediata:
senza il punto decimale e senza la soprallineatura del
0.c1 c2 . . . cr =
periodo; pertanto possiamo dire che a equivale a una
frazione cosı̀ composta:
c1 c2 . . . cr
c1 c2 . . . cr
c1 c2 . . . cr
=
+
+
+ ··· =
r
2r
3r
10
10
10
• il numeratore si ottiene sottraendo le cifre della
c1 c2 . . . cr
parte intera dal numero composto di tutte le cifre
=
10r − 1
di a senza punto decimale e soprallineatura;
cioè, il numero periodico 0.c1 c2 . . . cr equivale a una
• il denominatore è il numero composta da tante
frazione il cui numeratore è costituito dalle cifre
cifre 9 quante sono le cifre del periodo.
c1 , c2 , . . . , cr e il cui denominatore è il numero composto di r cifre 9. Quindi, 0.324 = 324/999 = 12/37,
L’ultimo passo è ora quello di considerare un nucome si può verificare direttamente eseguendo la di- mero periodico nella sua forma più generale, con una
visione. Un’altra conseguenza del precedente corol- parte intera dh dh−1 . . . d1 d0 , un antiperiodo (cioè la
lario riguarda un’anomalia della notazione decima- parte che segue il punto decimale, ma precede il pele, e cioè i numeri che presentano il periodo 9, come riodo) p1 p2 . . . ps , e un periodo c1 c2 . . . cr . Ma se s
0.579999. . .. Precisamente si ha:
sono le cifre dell’antiperiodo, abbiamo:
Corollario 3.17 Un numero decimale che abbia come periodo 9 è equivalente a un numero decimale
finito.
Prova:
Se il periodo inizia dalla r-esima cifra
decimale, esso vale:
=
9
10r−1
9
9
9
+ r+1 + r+2 + · · · =
10r
10
10
µ
¶
1
1
9
1
1
+
+ · · · = r−1 · = r−1
10 102
10
9
10
a=
dh dh−1 . . . d1 d0 p1 p2 . . . ps
+
10s
´
c1 c2 . . . cr
1 ³ c1 c2 . . . cr
+
+
·
·
·
=
10s
10r
102r
c1 c2 . . . cr
dh dh−1 . . . d1 d0 p1 p2 . . . ps
+ s r
=
=
10s
10 (10 − 1)
+
= (dh . . . d1 d0 p1 p2 . . . ps × 10r + c1 c2 . . . cr −
−dh . . . d1 d0 p1 p2 . . . ps )/(10s (10r − 1)).
Di nuovo, dh dh−1 . . . d1 d0 p1 p2 . . . ps × 10r + c1 c2 . . . cr
dove abbiamo applicato il corollario precedente. Que- è il numero composto da tutte le cifre di a senza il
sta quantità, sommata alla parte non periodica, dà un punto decimale e la soprallineatura. Possiamo perciò
chiudere questa sezione con il classico:
numero decimale finito.
77
3.4. I NUMERI REALI
Algoritmo 3.4 (Conversione in frazione)
Ingresso: a = dh dh−1 . . . d1 d0 .p1 p2 . . . ps c1 c2 . . . cr ,
dove s può anche essere 0;
Uscita: La frazione equivalente ad a, ridotta ai
minimi termini.
1. si assegna a t il numero naturale costituito da
tutte le cifre di a, senza punto decimale e senza
soprallineatura, cioè:
t := dh dh−1 . . . d1 d0 p1 p2 . . . ps c1 c2 . . . cr ;
2. si assegna ad f il numero naturale costituito dalle cifre della parte intera e dell’eventuale
antiperiodo di a, cioè:
f := dh dh−1 . . . d1 d0 p1 p2 . . . ps ;
3. ν := t − f ;
4. si assegna a δ il numero costituito da r cifre 9
(tante quante sono le cifre del periodo), seguite
da s cifre 0 (tanta quante sono le cifre dell’antiperiodo; se s = 0 l’antiperiodo manca e le cifre
0 non vengono generate);
5. µ := MCD(ν, δ);
6. se µ 6= 1, poniamo ν := ν/µ e δ := δ/µ;
7. i numeri ν e δ costituiscono il numeratore e il
denominatore della frazione corrispondente ad a
e ridotta ai minimi termini.
3.4
I numeri reali
Il teorema e l’algoritmo che hanno concluso la precedente sezione sono di fondamentale importanza per
approfondire il nostro concetto di numero. Poiché le
frazioni corrispondono ai numeri decimali finiti o periodici, i numeri razionali (cioè le stesse frazioni) non
possono esaurire tutti i numeri pensabili. E’ del tutto ovvio che esistono numeri decimali infiniti che non
sono periodici, come:
ξ = 2.131133111333111133331 . . .
e infiniti altri se ne possono concepire sullo stesso
schema o su schemi analoghi. Per i Greci, che non
avevano una notazione decimale analoga alla nostra,
le cose non erano cosı̀ semplici. Essi rappresentavano
i numeri come segmenti: fissato un segmento come
unità di misura, un numero era semplicemente il rapporto tra un segmento e l’unità di misura, cioè la
sua lunghezza. A lungo essi credettero che fosse sempre possibile trovare un sottomultiplo comune tra il
segmento e l’unità di misura. Questo equivale a dire che se questo sottomultiplo è la n-esima parte del
segmento e la m-esima parte dell’unità di misura, la
misura del segmento è il numero razionale n/m. L’esistenza di un sottomutiplo comune era cosı̀ intuitiva
che fino ai tempi di Pitagora si pensò che le cose non
potessero stare che in questo modo: si diceva che tutte le lunghezze sono commensurabili. Fu dunque uno
shock intellettuale notevole quando qualcuno (un discepolo di Pitagora, se non Pitagora stesso) dimostrò
che esistono lunghezze incommensurabili, cioè per le
quali non esiste alcun sottomultiplo comune con il
segmento fissato come unità di misura, per quanto
piccolo possiamo immaginare tale sottomultiplo. Le
grandezze che provocarono questa rivoluzione furono
il lato e la diagonale del quadrato
√ e questo, nei nostri
termini, vuol dire che il numero 2 non è un numero
razionale. I Pitagorici erano riuniti in una setta dalle
regole molto rigide e non divulgavano i loro segreti.
Si racconta che a rivelare la scoperta delle grandezze incommensurabili fu Ippaso di Metaponto, che poi
abbandonò la setta. I suoi ex compagni, com’era l’uso
in questi casi, gli eressero una stele funeraria per dire
che per loro Ippaso era morto. Qui diamo la classica
dimostrazione per assurdo, notando che essa vale per
la radice quadrata di un qualsiasi numero che non sia
un quadrato perfetto:
√
2 non è un numero
Teorema 3.18 Il numero
razionale.
√
Prova: Supponiamo per assurdo che 2 sia un numero
razionale, e cioè esista una frazione m/n =
√
2, che possiamo supporre ridotta ai minimi termini. Elevando al quadrato si ha: m2 /n2 = 2, cioè
m2 = 2n2 . Il fattore 2, presente a destra, deve essere
presente anche a sinistra, cioè m deve essere divisibile
per 2, diciamo m = 2k. L’identità diventa 4k 2 = 2n2 ,
ovvero 2k 2 = n2 . Questo significa, però, che 2 deve
essere anche un fattore di n, il che contraddice l’ipotesi che m/n fosse ridotta ai minimi termini, cioè che
m√
ed n fossero primi tra di loro. √L’ipotesi che fosse 2 = m/n è quindi assurda e 2 non può essere
razionale.
Nota 3.4
I numeri reali sono più numerosi dei numeri naturali. Questa affermazione può essere considerata banale se si osserva, come s’è fatto, che N ⊂ R;
è meno banale se si ritorna alla teoria di Cantor e al
fatto che la frase significa: non esiste alcuna corrispondenza biunivoca tra N ed R. Questo è vero, come
fra poco vedremo, ma la dimostrazione non è affatto
banale.
Intanto, abbiamo introdotto, dopo N, gli insiemi numerici Z e Q, ma è facile vedere che essi sono numerabili. La dimostrazione è in pratica già stata effettuata
nel primo capitolo, ma può tornare utile rivederla nel
caso specifico. Se consideriamo Z come l’unione di numeri positivi e negativi, cioè l’unione disgiunta di due
78
CAPITOLO 3. NUMERI
insiemi numerabili, possiamo scrivere esplicitamente
la corrispondenza biunivoca con N:
0 ↔ 0,
4 ↔ −2,
1 ↔ 1,
5 ↔ 3,
2 ↔ −1,
6 ↔ −3,
3 ↔ 2,
.
...
Anche Q può essere visto come il prodotto cartesiano
Z × N0 , cioè di due insiemi numerabili; la corrispondenza biunivoca, limitata a Q+ è la seguente, derivata
da quella schematizzata nella Figura 1.3:
1/1
↓
1/2
1/3
↓
1/4
2/1
↑
2/2
→
←
2/3
←
→
2/4
→
→
3/1
↓
3/2
↓
3/3
3/4
→
→
4/1
↑
4/2
↑
4/3
↑
4/4
E’ facile vedere che la corrispondenza funziona, a maggior ragione per il fatto che le frazioni sono “di più”
dei numeri razionali.
Quando si arriva ai numeri reali le cose si complicano,
ma Cantor riuscı̀ a dimostrare che la cardinalità di R
è maggiore di ℵ0 con una prova che costituisce un’altra pietra miliare nella tecnica matematica. Essa è
nota come diagonalizzazione di Cantor ed è stata più
volte utilizzata per dimostrare risultati importanti in
vari settori della Matematica e della Logica formale.
Vediamo in che cosa consiste e come si dimostra che
c > ℵ0 .
Intanto, una semplice dimostrazione geometrica permette di stabilire che un qualsiasi segmento è equipotente a tutta la retta, cioè, in termini numerici, che un
intervallo aperto (a, b) è in corrispondenza biunivoca
con R.
A
P
B
Y
X
C
r
X
′
C
′
Y
′
Sia r la retta e, spezzato il segmento AB di modo
che A, B, C siano equidistanti dal punto P ed A, B
giacciano sulla parallela ad r passante per P , è facile vedere che la proiezione da P (che ad X, Y fa
corrispondere X ′ , Y ′ ) è una corrispondenza biunivoca. Allora, è sufficiente dimostrare che l’insieme dei
numeri reali nell’intervallo [0, 1) (immaginiamo che lo
0 sia presente; questo semplifica il ragionamento e non
cambia sostanzialmente la corrispondenza che abbiamo visto) ha cardinalità maggiore di N0 perché la tesi
c > ℵ0 sia provata. Supponiamo che tale corrispondenza esista e scriviamola, esprimendo i numeri reali
in forma decimale:
1
2
3
4
···
↔
↔
↔
↔
↔
0.d1,1 d1,2 d1,3 d1,4 . . .
0.d2,1 d2,2 d2,3 d2,4 . . .
0.d3,1 d3,2 d3,3 d3,4 . . .
0.d4,1 d4,2 d4,3 d4,4 . . .
···
Nell’intervallo [0, 1) i numeri hanno tutti la forma
0.d1 d2 d3 . . . e quindi di,j indica la j-esima cifra del
numero reale corrispondente al numero naturale i. In
questo elenco devono essere compresi tutti i numeri
dell’intervallo, altrimenti la corrispondenza non sarebbe biunivoca. Costruiamo ora un numero reale
x = 0.x1 x2 x3 . . . con la seguente regola: xi deve essere
diverso da di,i e da 9. Il numero x sta nell’intervallo
[0, 1) ed è un numero decimale legale visto che, per costruzione, non può avere periodo 9. Quindi deve essere
uno dei numeri dell’elenco. Tuttavia, non può essere
il corrispondente di 1 perché x1 6= d1,1 ; non può essere
il corrispondente di 2 perché x2 6= d2,2 , e cosı̀ via, non
può essere il corrispondente di n perché xn 6= dn,n .
Quindi x non si trova nell’elenco, il che è assurdo e
prova che la corrispondenza biunivoca ipotizzata non
può esistere. Conclusione: c > ℵ0 .
Come detto nella Sezione 1.4, si sa che c = ℵ1 , cioè i
numeri reali sono tanti quanti i sottoinsiemi di N. Il
fatto che i numeri reali siano cosı̀ numerosi ha molte interessanti applicazioni. Ad esempio, gli elementi
dell’insieme R\Q si dicono numeri irrazionali, e poiché
Q è numerabile, ne consegue che i numeri irrazionali
hanno cardinalità c, cioè sono più numerosi dei razionali. Un’altra categoria di numeri che è facile contare
è costituita dai numeri algebrici: questi sono definiti
come le soluzioni reali delle equazioni algebriche, cioè
delle equazioni polinomiali a coefficienti razionali, ovvero a coefficienti interi, poiché a queste ci si riduce
sempre dalle prime moltiplicando per il denominatore comune (v. Sezione 5.2 per varie affermazioni che
stiamo facendo in questa Nota). Tutti i numeri razionali m/n sono algebrici, in quanto soluzione del√
l’equazione nx − m = 0. Anche tutte le radici k m
sono numeri algebrici se k, m ∈ N; sono infatti soluzione dell’equazione di grado k: xk − m = 0. Sono
numeri algebrici anche le espressioni più complicate
che comprendono radicali
di numeri razionali, come
p
p
√
√
3
(3 + 5/2 − 4 7)/ 2 − 5 2 e anche numeri che non
sappiamo esprimere come radicali. E’ noto infatti che
le equazioni di grado superiore al quarto non sono in
generale risolubili per radicali. Quindi, i numeri algebrici sono tantissimi; tuttavia, ogni equazione di grado
k ha al più k soluzioni reali e possiamo procedere in
questa maniera per dimostrare che i numeri algebrici
sono una quantità numerabile.
Cominciamo con l’osservare che le equazioni algebriche di primo grado sono numerabili: esse hanno la
forma ax + b = 0 e quindi sono tante quante le possibili coppie ordinate (a, b) di numeri interi, che però già
sappiamo essere numerabili. Perciò, i numeri algebrici
79
3.4. I NUMERI REALI
di primo grado (cioè le soluzioni delle corrispondenti
equazioni algebriche) sono numerabili. Passando alle
equazioni di secondo grado, come ax2 +bx+c = 0 possiamo immaginarle come coppie (a, bx + c) di numeri
e di equazioni algebriche di primo grado. Quindi anch’esse sono numerabili e poiché i numeri algebrici di
secondo grado sono al più il doppio delle corrispondenti equazioni, anch’essi costituiscono un insieme numerabile. Aggiunto al precedente, come sappiamo fin dal
primo capitolo, ci dà ancora un insieme numerabile.
Possiamo allora ripetere il ragionamento per le equazioni algebriche di terzo grado ax3 + bx2 + cx + d = 0,
viste come coppie (a, bx2 + cx + d), e provare che i
numeri algebrici di primo, secondo e terzo grado sono
una quantità numerabile. Procedendo nella stessa maniera si arriva alla conclusione preannunciata, e cioè
che tutti i numeri algebrici costituiscono un insieme
numerabile.
I numeri non algebrici si dicono trascendenti e
possiamo ora affermare che essi costituiscono un
insieme di cardinalità c. E’ stato dimostrato che
π = 3.14159 . . ., il rapporto tra la circonferenza e il
diametro di un cerchio, ed e = 2.71828 . . ., la base dei
logaritmi naturali, sono numeri trascendenti. Anche
tante altre proprietà di questi numeri sono ben note,
ma noi, naturalmente, qui ci dobbiamo fermare.
Se tentiamo di forzare la nostra logica finita per
indulgere, come spesso si fa, a considerazioni che
coinvolgono l’infinito, possiamo dare la seguente:
Pseudodefinizione: si intende per numero pseudoreale un numero intero D, seguito da un punto,
detto punto decimale, seguito da infinite cifre decimali che non siano definitivamente tutte uguali a
9.
Per l’uso del punto decimale si veda il punto 6 dell’Introduzione. Come abbiamo appena detto, “definitivamente” significa “da un certo momento in poi”,
senza ulteriore specificazione del punto del quale si
parla. Abbiamo già visto che senso ha la condizione
sul 9; notiamo invece esplicitamente che non si vieta che le cifre possano essere definitivamente tutte
uguali a 0: questa situazione corrisponde ai numeri
decimali finiti. Il punto debole di questa definizione,
ciò che la rende una semplice pseudodefinizione, è il
tentativo di voler attualizzare il concetto di infinito,
parlando di “infinite cifre” dopo il punto decimale.
Questo non ha molto senso e dobbiamo preferire una
definizione che faccia uso solo dell’aspetto potenziale dell’infinito. Ad esempio, si potrebbe modificare
la pseudodefinizione e parlare di una corrispondenza
(nel senso del primo Capitolo) che associa ad ogni
posizione decimale (cioè dopo il punto) una cifra ben
definita. Cosı̀, associando ad ogni posizione la cifra 5, e definendo la parte intera come 3, si ha il
numero 3.555 . . ., corrispondente al numero razionale
3.5 = 32/9. Associando invece alle cifre di posto p
(p numero primo) la cifra 2 e a quelle di posto p non
primo la cifra 3 (la parte intera sia 1) , si ottiene il numero 1.22232323332 . . ., irrazionale perché i numeri
primi non presentano alcun tipo di periodicità.
Questa impostazione, però, presenta diversi inconvenienti. Ad esempio, lega la definizione a una specifica base, il 10, il che è chiaramente limitativo, se non
addirittura scorretto. Ci obbliga a cercare associazioni che funzionano cifra per cifra: questo può essere
molto complicato come nel caso del numero ξ visto
in precedenza (provare per credere), o molto limitativo, come per il numero 0.12345678910111213 . . .. Ad
onor del vero, se non ci leghiamo a regole che funzionano cifra per cifra, questo metodo permette di
definire i numeri reali computabili, come sono trattati nella teoria della Computabilità. Purtroppo, questi
numeri hanno la cardinalità del numerabile e quindi
non comprendono tutti i numeri reali.
Nota 3.5
La notazione decimale dei numeri reali
estende quella dei numeri razionali, vista nella sezione
precedente. Ma mentre tutti i numeri razionali hanno
anche una rappresentazione finita, data dalla frazione
corrispondente, ciò non succede per i numeri irrazionali. Come abbiamo visto, possono esistere regole (o
leggi) di carattere finito che determinano la successione delle cifre decimali; altre volte esistono regole (o
leggi o algoritmi) che determinano tante cifre
√ decimali quante se ne vogliono, come succede per 2 e per π
(si vedano le Sezioni 3.6 e 6.7). Si pone allora il problema di dare la migliore rappresentazione finita di un
numero reale. Di solito, sulla carta o nella memoria
di un elaboratore, si lavora con un certo numero di
cifre (la precisione); per semplicit‘a d’esempio, supponiamo di fare i nostri conti con quattro cifre decimali.
Questo significa che dobbiamo ignorare la quinta cifra
e le cifre successive, creando un’approssimazione della
quantità considerata. Se semplicemente troncassimo il
numero alla quarta cifra, avremmo dei problemi man
mano che si procede con i conti. Tali approssimazioni per difetto, infatti, tenderebbero ad accumularsi,
creando errori sempre più consistenti. Si operano allora approssimazioni per difetto e per eccesso secondo
una regola precisa:
1. se la quinta cifra decimale è 0, 1, 2, 3, 4, il
numero viene troncato alla quarta cifra;
2. se la quinta cifra decimale è 5, 6, 7, 8, 9, la quarta
cifra viene incrementata di 1 (ciò si può riflettere
anche sulle cifre precedenti).
In questo modo, avremo il 50% di approssimazioni per
difetto, secondo il caso 1, e il 50% per eccesso, secondo
il caso 2. Ad esempio:
3.14159 . . .
3.14153 . . .
3.14197 . . .
→
→
→
3.1416
3.1415
3.1420
In questo modo, gli 0 finali diventano significativi;
continuando l’esempio, il numero 3.142 indica il
80
CAPITOLO 3. NUMERI
numero razionale finito 3.142, mentre 3.1420 indica
l’approssimazione di un numero (razionale o reale)
con almeno quattro cifre decimali. Queste regole si
ritrovano in Fisica; se una costante è specificata come
4.2, vuol dire che di essa si conosce una sola cifra
decimale: Se è specificata come 4.2000, significa che si
conoscono quattro cifre decimali e si sa che le ultime
tre sono 000 (o anche 1999, e la cifra successiva è
alta, 8 o 9 pur non essendo ancora nota).
Vedremo nella prossima sezione una costruzione
sensata dei numeri reali e giustificheremo il fatto che
tale costruzione è consistente con la pseudodefinizione
appena data. Qui, analogamente a quanto abbiamo
fatto per i numeri naturali, dedichiamo un po’ di tempo alla rappresentazione dei numeri reali e alla loro
conversione da una base all’altra. Dato un numero
decimale dk dk−1 . . . d1 d0 .c1 c2 c3 . . ., rappresentazione
e conversione della parte intera dk dk−1 . . . d1 d0 sono
già state considerate e quindi possiamo limitarci alla
parte decimale 0.c1 c2 c3 . . .. Come per la parte intera,
il caso più semplice si ha partendo con un numero
0.c′1 c′2 c′3 . . . scritto in base b e cercandone la conversione in base 10. Anche questa volta basta applicare la regola posizionale, cioè il fatto che il numero
considerato è, per definizione:
A sinistra abbiamo ottenuto un numero (in base
b) la cui parte intera è c′1 e la cui parte decimale è 0.c′2 c′3 . . .. Questo deve corrispondere al valore di destra, e in particolare la parte intera di
b × 0.c1 c2 c3 . . . deve coincidere con c′1 . In altre parole, la cifra b-aria c′1 è data dalla parte intera del
prodotto b × 0.c1 c2 c3 . . .. Iterando questo processo, si
ottengono via via le altre cifre c′2 , c′3 , . . .. Tutto ciò è
descritto dal seguente:
Algoritmo 3.5 (Conversione in base b)
Ingresso: un numero decimale C = 0.c1 c2 c3 . . . e due
numeri naturali b, n > 0;
Uscita: le prime n cifre del numero equivalente C ′ =
0.c′1 c′2 c′3 . . . in base b;
1. si pone i := 1;;
2. si pone c′i uguale alla parte intera di b × C;
3. si ridefinisce C come la parte decimale dello
stesso prodotto b × C;
4. si incrementa i di 1;
5. se i ≤ n si torna al passo 2., altrimenti si è
finito.
Questo algoritmo, naturalmente, funziona qualunque sia il numero n, determinando n cifre del risultato; occorre stare attenti al numero delle cifre di C
+
+
+ ···.
0.c′1 c′2 c′3 . . . =
b
per non correre il rischio di perdere precisione a causa
E’ quindi sufficiente eseguire i vari conti; ad esempio, delle varie moltiplicazioni. In effetti, se C è razionale, si può utilizzare la frazione equivalente, invece del
per 0.6427 si ha:
valore decimale. Consideriamo, come primo esempio,
6
4
2
la trasformazione di 0.944 in base 7; si procede cosı̀:
0.642 = + 2 + 3 = 0.944606413.
7 7
7
0.944 × 7 = 6.608
Può essere questo il momento di osservare che la
0.608 × 7 = 4.256
proprietà dei numeri razionali di corrispondere ai nu0.256 × 7 = 1.792
meri decimali finiti o periodici, non è limitata alla
0.792 × 7 = 5.544
base 10, ma vale in generale, come si capisce dalle di0.554 × 7 = 3.808
mostrazioni delle sezioni precedenti: basta sostituire
···
la base b alla base 10. La finitezza può essere interpretata come la presenza di un periodo 0, e questo Si ha pertanto 0.94410 = 0.64153 . . .7 , e dallo svilupci fa capire che un numero finito in una base b può po ottenuto si capisce facilmente che si otterrà un
essere un numero periodico in un’altra base b′ , e vi- numero periodico. La frazione 1/3 in base 5 si scrive:
ceversa. Qui abbiamo visto che 0.642, finito in base
1/3 × 5 = 5/3 = 1 + 2/3
7, diviene periodico in base 10. Nessuna meraviglia.
2/3 × 5 = 10/3 = 2 + 1/3
Per la conversione inversa, osserviamo quanto se1/3 × 5 = 5/3 = 1 + 2/3
gue; sia 0.c1 c2 c3 . . . un numero decimale (in base
···
10) e sia 0.c′1 c′2 c′3 . . . il suo equivalente in una base
b qualsiasi. Avremo pertanto:
La prima frazione propria che si ripete, innesca il
calcolo di un periodo, e quindi si ha:
c′1
c′2
c′3
+ 2 + 3 + · · · = 0.c1 c2 c3 . . . .
b
b
b
1
= 0.310 = 0.135 .
3
Moltiplicando ora i due membri per b:
c′1
c′1 +
c′2
b2
c′3
b3
c′2
c′
+ 23 + · · · = b × 0.c1 c2 c3 . . . .
b
b
Il lettore è invitato a fare altri esempi e, in particolare, ad usare la base 2, per capire bene cosa fa
3.5. LA COSTRUZIONE DEI NUMERI REALI
81
proporre costruzioni di R che fossero concettualmente semplici, ma rigorose da un punto di vista formale. Tutte queste proposte, per ciò che si è detto,
coinvolgono oggetti matematici “infiniti”, cioè strutture contenenti un numero infinito di numeri razionali. Emblematico, a questo proposito, è il metodo delle
sezioni di Dedekind, nel quale un numero reale è l’insieme di tutti i numeri razionali che gli sono minori
(o uguali); questo, automaticamente, definisce anche
l’insieme dei numeri razionali che gli sono maggiori,
e questi due insiemi costituiscono √
una sezione di Q.
• dalla mantissa 1100010011001 . . ., con un nu- Ad esempio, il numero irrazionale 2 è dato da:
mero di bit legato all’hardware e alle istruzioni
+
2
dell’elaboratore (spesso 32, 64 o più);
Q−
0 ∪ {q ∈ Q | q < 2};
un elaboratore elettronico. All’interno di questo, un
numero come 12.3 è rappresentato nel modo seguente. Prima di tutto, l’elaboratore converte il numero
in binario secondo il precedente algoritmo, ottenendo
1100.01001. In secondo luogo, divide questo numero
per un’opportuna potenza di 2, in modo da portare l’1 più a sinistra come prima cifra dopo il punto decimale. Nell’esempio corrente, dividendo per 24
si ha 0.1100010011001. Il numero è univocamente
rappresentato:
• dall’esponente 4 cui occorre elevare il 2 per naturalmente, l’uguaglianza può essere considerata
riportare la mantissa all’effettivo valore del soltanto se il numero reale da definire è, di fatto, un
numero.
numero razionale.
Il metodo delle sezioni è abbastanza intuitivo; se,
Si osservi che tanto la mantissa quanto l’esponente come facevano i Greci e facciamo anche noi nella Geopossono essere negativi; il numero scritto come coppia metria Analitica, pensiamo ad R come ad una retta,
(mantissa, esponente) si dice normalizzato.
un numero reale r è individuato dalle due semirette in
cui il punto corrispondente ad r divide la retta stessa. Questo implica la scelta sulla retta di un punto di
3.5 La costruzione dei numeri origine, di un verso (positivo) e di una unità di misura, seconda la quale r risulta la misura del segmento
reali
determinato dal punto e dall’origine fissata. In effetNelle sezioni precedenti abbiamo visto come i numeri ti, i Greci identificavano il concetto di numero reale
interi possano essere “costruiti” a partire dai nume- con quello della misura (in particolare, la misura delri naturali, e come i numeri razionali si costruiscano le lunghezze), e da ciò derivava la loro idiosincrasia
dai numeri interi. Le due costruzioni si assomiglia- per i numeri negativi. Nel metodo delle sezioni, dono abbastanza: 1) si considerano coppie di elementi vremmo immaginare la retta come costituita solo dai
dell’insieme numerico di partenza; 2) su tali coppie si punti razionali, sui quali fondare poi i numeri reali.
definisce una relazione di equivalenza; 3) si definisco- Per questo, l’impostazione geometrica lascia perplesno le quattro operazioni di base e il confronto in modo si ed è meglio affrontare il problema da un punto di
da essere compatibili con la relazione di equivalenza; vista puramente numerico, come di fatto fa il metodo
4) si osserva infine che un sottoinsieme dell’insieme delle sezioni.
cosı̀ costruito è identificabile con (è isomorfo a) l’inD’altra parte, il metodo delle sezioni non sembra
sieme di partenza. Quest’ultima affermazione signi- avere un aggancio pratico consistente. Se vogliamo
fica che, effettuata l’identificazione, il risultato delle “usare” un numero reale (per sommarlo, confrontarlo,
operazioni e dei confronti è lo stesso, sia nell’insieme etc.) la sua sezione è ben poco utile, anzi ci impaccia
di partenza, sia nel sottoinsieme dell’insieme definito. perché introduce troppi numeri razionali, la maggioQueste costruzioni avvengono in termini finiti, cioè ranza dei quali nulla hanno a che vedere col numero
tutte le definizioni coinvolte operano su espressioni stesso. Ad esempio, i numeri −3,√1/2 e 127/343 apfinite, ovvero le coppie che sono gli oggetti costituti- partengono tutti alla sezione di 2, ma
√ questo non
vi dell’insieme costruito. Questo, in modo intuitivo, ci è molto utile quando lavoriamo con 2. Preferiagiustifica il fatto che tanto Z quanto Q non vanno al mo pertanto un altro metodo che ci pare più consono
di là del numerabile.
ad un uso effettivo e che, comunque, mantiene quelPur ribadendo un procedimento già visto nella Se- la dote di intuibilità che caratterizza il metodo delle
zione 3.1, la costruzione dei numeri reali non può es- sezioni. Alla fine di questa sezione, comunque, risere altrettanto semplice. Come abbiamo osservato torneremo a considerare il metodo delle sezioni (ci si
nella Nota 3.4, la loro cardinalità è maggiore del nu- perdoni il bisticcio).
merabile, e questo significa che una costruzione “fiRiprendiamo il concetto di sequenza o successione
nita”, fatta di coppie o di terne di numeri razionali, già introdotta nella Sezione 3.3. Formalmente, posnon è ragionevolmente possibile. A partire dalla se- siamo specificare che in questa sezione considerereconda metà del 1800, i matematici hanno cercato di mo solo successioni di numeri razionali, cioè funzioni
82
CAPITOLO 3. NUMERI
a : N → Q, per le quali si usa scrivere ak invece di
a(k), come per le altre funzioni. Spesso, una successione si indica con la notazione {ak }k∈N e possiamo
dare la seguente:
infatti il nostro avversario virtuale fissa ǫ = 1/1000,
ci basta considerare l’elemento 2.131 (m = 3) e osservare che ogni altro elemento è minore di 2.132,
per essere sicuri che le differenze |an − a3 | sono tutte
minori
di ǫ. Se poi costui fissasse come ǫ un miDefinizione 3.4 Una successione (di numeri raziolionesimo,
è sufficiente prendere l’elemento 2.131133
nali) {ak }k∈N si dice di Cauchy se assegnato un nu(m
=
6),
per
assicurarsi che tutti i successivi elementi
mero razionale positivo ǫ (piccolo quanto si vuole),
sono
a
distanza
minore di ǫ da questo am . Quindi, la
è possibile determinare un indice m ∈ N tale che,
successione
è
di
Cauchy.
qualunque sia n > m, si abbia |an − am | < ǫ.
Questa definizione è, riconosciamolo, abbastanza
astrusa e non è banale capirla di primo acchito. Cerchiamo allora di spiegare informalmente il suo significato per arrivare ad afferrarne, infine, il senso logico.
Una successione di Cauchy è, nelle nostre intenzioni,
una sequenza di numeri razionali i cui valori si vanno
concentrando sempre di più. Questo significa due cose: primo, che questi numeri razionali si avvicinano
tra di loro man mano che l’indice della successione
cresce, e secondo che tutti (almeno da un certo punto
in poi) rimangono tra di loro a una distanza limitata.
Purtroppo, queste due condizioni coinvolgono un numero infinito di elementi della successione: quelli che
vanno “da un certo punto in poi”, e questo è difficile
da tenere sotto controllo con i nostri mezzi disgraziatamente finiti. Abbiamo già trovato questa difficoltà
quando abbiamo voluto esprimere il concetto che i
numeri naturali sono infiniti (v. Nota nella Sezione
1.4); abbiamo allora introdotto il criterio della scommessa, un metodo per parlare di infinito potenziale
che ci evita l’introduzione, surrettizia o meno, dell’infinito in atto. Intuitivamente, il restringersi e il
limitarsi dei valori della successione significa che la
distanza fra due elementi qualsiasi (purché abbastanza avanti nella sequenza) diviene sempre più piccola. Facciamo perciò la seguente scommessa contro un
ipotetico avversario: la successione è data e siamo
sicuri che essa è di Cauchy; se il nostro avversario
sceglie un numero (chiamiamolo ǫ), piccolo quanto
vuole, un millesimo, un milionesimo o anche un miliardesimo, noi siamo capaci di trovare una posizione
nella nostra successione (diciamo, m), tale che tutti
gli elementi successivi differiscono da am per meno di
ǫ. E’ chiaro che se ci riusciamo per valori piccoli di ǫ,
a maggior ragione ci riusciamo per valori grandi. Pertanto, la specifica “piccolo quanto si vuole” non ha
funzione logica, ma solo psicologica e potrebbe essere
cancellata (l’abbiamo messa, almeno, tra parentesi!).
Facciamo un semplice esempio; si consideri la
successione:
2 2.1
2.131133
2.13
2.131
2.1311331
2.1311
2.13113
2.13113311
...
la cui legge di formazione dovrebbe essere chiara. Essa è formata da numeri decimali finiti, cioè da elementi di Q, e il criterio della scommessa funziona bene. Se
Nota 3.6
I primi elementi della successione possono essere scelti anche a caso e presentare ampie variazioni. Ciò vuol dire, semplicemente, che dobbiamo
spostare in avanti il nostro indice m che ci assicura
la vincita della scommessa. L’importante è che, da
un certo momento in poi (cioè dopo m), si verifichi e
si possa accertare la vicinanza di tutti gli an ad am .
Come si dice, vogliamo che la differenza |am − an | sia
minore dell’ǫ avversario definitivamente, cioè per tutti
gli infiniti valori di n maggiori di m.
Vogliamo anche osservare che gli elementi della successione possono andare crescendo, come nell’esempio
precedente, ma possono anche decrescere o oscillare:
l’unica condizione essenziale è che non si allontanino
più di ǫ da am . Naturalmente, il criterio della scommessa ha senso se possiamo “dimostrare” che esso vale
realmente. Per questo è essenziale conoscere la regola
(o legge) di formazione della successione. In situazioni come quella dell’esempio, ci si accorge, o si sa,
che la prima parte del numero rimane invariata e ad
ogni passo si aggiunge un decimale ulteriore. Questa è la ben nota regola del valori per difetto di una
certa quantità, e analoga è la regola del valori per
eccesso. Più avanti vedremo di generalizzare queste
regole, ma il loro significato è ben noto, e son proprio esse a permetterci di valutare un numero reale
(che per ora, ricordiamo, non abbiamo ancora definito
propriamente).
Un punto delicato è il seguente. Si potrebbe pensare che se gli elementi di una successione si avvicinano sempre di più l’uno all’altro, allora la successione
sia sicuramente di Cauchy. In altre parole, più formalmente, si potrebbe sostituire al criterio di Cauchy la condizione che per ogni n > m si debba avere
|an+1 − an | < ǫ, una condizione che potrebbe essere
più semplice da verificare. Purtroppo, questo non è
vero, come si prova col semplice esempio che stiamo
per fare, e la condizione di Cauchy va espressa come l’abbiamo definita, senza ulteriori semplificazioni.
L’esempio concerne i numeri armonici, cioè i numeri
definiti dalla relazione:
Hn = 1 +
1
1
1
+ + ... + ;
2
3
n
i primi elementi sono H1 = 1, H2 = 3/2, H3 = 11/6,
H4 = 25/12, e cosı̀ via.; convenzionalmente, si pone
H0 = 0. Gli elementi della successione {Hk }k∈N si
avvicinano sempre di più, dal momento che Hn+1 −
Hn = 1/(n + 1), ma dimostriamo che essa cresce oltre
ogni limite:
3.5. LA COSTRUZIONE DEI NUMERI REALI
Teorema 3.19 Se H2k è il 2k -esimo numero armonico, allora H2k > 1 + k/2 e quindi la successione dei
numeri armonici non è limitata.
83
ad r, cosı̀ che possiamo affermare che la successione “definisce” r; sfrutteremo tra poco questa proprietà intuitiva. Prima di tutto, facciamo vedere che
esiste almeno un numero pseudoreale r con la proProva: Consideriamo ad esempio:
prietà desiderata. Si consideri ǫ = 10−(k+1) e sia am
l’elemento della successione di Cauchy per il quale
1 1
1
1
1
1
1
+ + + + + +
H8 = H 23 = 1 +
|am − an | < 10−(k+1) , qualunque sia n > m. Que2
6 {z 7
8}
|{z}
|3 {z 4} |5
sto significa che an coincide con am per tutte le cifre
decimali (oltre ovviamente alla parte intera) fino ale sommiamo i 2k−1 elementi compresi tra 1/(2k−1 +1) la k-esima compresa. Definiamo, in questo modo, la
e 1/2k . Si tratta ovviamente di 2k−1 termini, ognuno
parte intera e le prime k cifre di r. A questo punto si
dei quali è maggiore di 1/2k . La loro somma è pertanha |an − r| < 10−k e quindi il criterio della scommesto maggiore di 1/2, e quindi, oltre all’1 iniziale, H2k
volta che il nostro avversario
è composto di k gruppi, ognuno dei quali vale almeno sa si può applicare ogni
−k
abbia
posto
ǫ
=
10
.
Che poi tale r sia unico, di1/2. Da questo discende l’affermazione del teorema.
scende dall’osservazione che se r′ 6= r godesse delle
stesse proprietà, dovrebbe esistere un indice k per il
I numeri armonici costituiscono una successione quale la k-esima cifra dopo il punto decimale relativa
importante e perciò avremo modo di incontrarli di ad r è diversa dalla k-esima cifra di r ′ . Si ha allora
nuovo in queste note.
|r − r′ | > 10−(k+1) . D’altra parte, per definizione,
posto ǫ = 10−(k+1) , esistono due indici m ed m′ per
i quali si ha |r − an | < ǫ e |r′ − an | < ǫ, qualunque
A questo punto, possiamo cercare di aiutare la no- sia n maggiore del più grande fra m ed m′ . Poiché
stra intuizione portando avanti, e distinguendo accu- il valore assoluto di una somma è sempre minore o
ratamente, sia un discorso rigoroso sulla natura dei uguale alla somma dei valori assoluti, segue:
numeri reali, sia un discorso meno rigoroso, ma più
suggestivo, su come possiamo pensare a tali nume|r − r′ | = |r − an − (r′ − an )| ≤
ri. Riprendiamo il concetto di numero pseudoreale
≤ |r − an | + |r′ − an | < ǫ + ǫ < 10−k .
introdotto nella precedente sezione. Come osservato
per ξ = 2.131133 . . ., aggiungere una cifra decima- Questa disuguaglianza contraddice quanto avevamo
le alla volta ci permette di ottenere una successione trovato in precedenze, rivelando che l’esistenza di due
di Cauchy che definisce il numero per difetto. Pos- valori distinti r ed r′ non è possibile.
siamo immaginare altre successioni di Cauchy, come
A questo punto, possiamo essere ragionevolmente
la sequenza delle approssimazioni (decimali) per eccesso, e vedremo più avanti il caso del calcolo della convinti che ogni successione di Cauchy determina
radice quadrata col metodo di Newton e il calcolo un numero (pseudo)reale; come osservato, il viceverdi π col metodo della media aritmetico/geometrica. sa è ovvio e quindi l’identificazione dei due concetti
Comunque, i metodi di questo genere portano a par- si presenta del tutto naturale (almeno per un mateticolari successioni di Cauchy, quelle appunto in cui ǫ matico). Dobbiamo però superare un ultimo ostacoè esplicitamente suggerito essere della forma 10−m e lo: ogni successione di Cauchy determina un unico
gli elementi della successione aumentano di una o più pseudoreale, ma a questo possono corrispondere più
cifre decimali alla volta. Tanto vale, allora, definire successioni; ad esempio, una successione di valori per
le successioni di Cauchy in termini generali e rigorosi difetto e una per eccesso. Definiamo allora:
e usarle poi per la definizione dei numeri reali come
Definizione 3.5 Due
successioni
di
Cauchy
la vedremo tra breve.
{ak }k∈N e {bk }k∈N si dicono equivalenti se per ogni
Per sottolineare meglio il rapporto tra le succesǫ razionale positivo, esiste un indice m tale che per
sioni di Cauchy e la pseudodefinizione precedente,
ogni n > m si abbia: |an − bn | < ǫ.
insistiamo dimostrando il seguente:
Pseudoteorema: Per ogni successione di Cauchy
Si osservi prima di tutto che, a differenza di quanto
{ak }k∈N esiste uno ed un solo numero pseudoreale r abbiamo fatto nella prova del precedente pseudoteotale che, fissato un qualsiasi numero razionale ǫ po- rema, la differenza an −bn è fatta tra numeri razionali,
sitivo, esiste almeno un indice m tale che, qualunque e quindi ha perfettamente senso. La definizione è insia l’indice n > m, si ha che an differisce da r per tuitivamente chiara: due successioni sono equivalenti
meno di ǫ.
se si avvicinano sempre di più quando le confrontiamo
Prova: Si osservi che lo pseudoteorema è un mo- termine a termine. Anche qui applichiamo strategido complicato di dire che gli elementi della successio- camente il criterio della scommessa: le due successione si accumulano definitivamente sempre più vicino ni si avvicinano se, fissato ǫ piccolo ad arbitrio dal
84
CAPITOLO 3. NUMERI
nostro avversario, riusciamo a stabilire che ogni differenza |an − bn | è definitivamente minore di tale ǫ.
Questo è evidente, ad esempio, quando si considerano le approssimazioni per difetto e per eccesso di un
numero reale. Il punto importante è, comunque, che
siamo di fronte a una relazione di equivalenza, come
il nome suggerisce:
poiché operazioni e confronto sono parte essenziale
della nostra idea intuitiva di numero. Cominciamo
con la somma: dati due numeri reali r ed s come
classi di equivalenza [{ak }k∈N ] e [{bk }k∈N ], la loro
somma è definita come r + s = [{ak + bk }k∈N ]. Affinché questa definizione abbia senso, occorre dimostrare
tre cose:
• la proprietà riflessiva si riduce a |an − an | = 0 <
ǫ, il che è banale;
1. che la sequenza {ak + bk }k∈N è una successione
di Cauchy, altrimenti saremmo fuori dell’ambito
dei numeri reali come li abbiamo appena definiti;
• la propietà simmetrica è anch’essa ovvia poiché
|an − bn | = |bn − an | e se l’uno è minore di ǫ, tale
è anche l’altro;
• la proprietà transitiva è un po’ più complessa;
siano {ak }k∈N , {bk }k∈N e {ck }k∈N tre successioni tali che la prima sia equivalente alla seconda e
questa alla terza. Fissato ǫ, cerchiamo un indice
m per cui |an − bn | < ǫ/2 (per ogni n > m) e
un indice m′ per cui |bn − cn | < ǫ/2 (per ogni
n > m′ ). Se ora M è il più grande fra m ed m′ ,
per ogni n > M si ha:
|an − cn | = |an − bn + bn − cn | ≤
2. che la definizione di somma è indipendente dalle successioni scelte a rappresentare la classe,
altrimenti la somma non sarebbe compatibile
con la relazione d’equivalenza e l’operazione non
sarebbe più sotto controllo;
3. che se r ed s corrispondono a due numeri razionali r′ ed s′ allora la somma r + s come classe d’equivalenza di successioni di Cauchy coincide con il numero razionale r′ + s′ ; questo permette di concludere che i numeri reali sono davvero un’estensione dei numeri razionali che già
conosciamo.
ǫ
ǫ
+ = ǫ,
2 2
Fissato ǫ > 0 dal nostro avversario, siano m e p i
valori
per cui, rispettivamente, si ha |am − an | < ǫ/2
e questo ci dà l’equivalenza tra la prima e la terza
per
ogni
n > m, e |bp − bn | < ǫ/2 per ogni n > p.
successione.
Poniamo M al valore del più alto fra m e p, cosı̀ che
Possiamo finalmente dare la vera definizione:
si ha:
|(aM + bM ) − (an + bn )| ≤
Definizione 3.6 Si dicono numeri reali le classi di
equivalenza delle successioni di Cauchy secondo la
ǫ
ǫ
≤ |aM − an | + |bM − bn | < + = ǫ.
precedente relazione.
2 2
≤ |an − bn | + |bn − cn | <
Intuitivamente, supponiamo che una successione
di Cauchy determini un numero pseudoreale r e che
un’altra successione, equivalente alla prima, determini un altro numero pseudoreale r′ . Per l’equivalenza
delle successioni deve essere r = r′ e quindi tutte le
successioni di una classe determinano lo stesso numero pseudoreale. Astraendo, possiamo finalmente lasciar perdere i numeri psudoreali, che essendo “pseudo” ci sono ora di impaccio e basta, e consideriamo,
secondo la definizione, un numero reale come la classe di tutte le sequenze di Cauchy equivalenti tra di
loro. Se una persona riesce a superare lo shock derivato dal fatto che un numero reale è una classe di
successioni di Cauchy, si rende conto che la definizione è perfettamente corretta, formalmente accettabile
e semanticamente utile e ineccepibile.
Come abbiamo osservato fin dal principio, la definizione di numero reale non conclude il nostro lavoro:
occorre ora far vedere che anche le quattro operazioni
di base e il confronto sono compatibili con tale definizione ed estendono le analoghe operazioni sui razionali. In mancanza di questo, tutto verrebbe a cadere,
Per dimostrare che la somma è indipendente dalle
particolari successioni {ak }k∈N e {bk }k∈N che abbiamo considerato, sia {a′k }k∈N equivalente a {ak }k∈N ,
e {b′k }k∈N equivalente a {bk }k∈N . Fissato un ǫ > 0
arbitrario, siano m ed m′ tali che |a′n − an | < ǫ/2 per
ogni n > m, e |b′n − bn | < ǫ/2 per ogni n > m′ ; per
ogni n più grande del maggiore tra m ed m′ si ha
allora:
|an +bn −(a′n +b′n )| ≤ |an −a′n |+|bn −b′n | <
ǫ ǫ
+ =ǫ
2 2
che prova l’equivalenza della somma delle diverse successioni. Infine, se r ed s sono razionali, esiste fra le
successioni della classe di equivalenza di r la successione costante i cui elementi sono tutti uguali ad r′ ,
il razionale che identifichiamo con il numero reale r.
La stessa cosa vale per s se anch’esso è razionale. Si
vede allora facilmente che la somma di r ed s come
numeri reali, data dalla successione costante r′ + s′
viene ad essere identificata proprio con il numero razionale r′ + s′ . (Consigliamo di seguire almeno due
volte questo ragionamento).
85
3.5. LA COSTRUZIONE DEI NUMERI REALI
Esattamente nello stesso modo si procede per la
differenza. Per quanto riguarda il confronto, un ovvio risultato è che dati due numeri reali r ed s per
mezzo di due successioni di Cauchy {ak }k∈N per r e
{bk }k∈N per s, essi sono uguali se e solo se definiscono la (o appartengono alla) stessa classe di equivalenza. Analogamente semplice è osservare che r > s
oppure r < s se e solo se la successione delle differenze [{ak − bk }k∈N ] è definitivamente composta di
elementi positivi oppure è definitivamente composta
di elementi negativi.
La moltiplicazione richiede un ragionamento più
delicato. Siano r ed s due numeri reali definiti come sopra e si consideri il prodotto definito da rs =
[{ak bk }k∈N ]. Per la limitatezza delle due successioni
di Cauchy prese a rappresentare r ed s, esistono due
numeri razionali, chiamiamoli a e b, che sono maggiori (in valore assoluto) rispettivamente di tutti gli elementi di {ak }k∈N e di tutti gli elementi di {bk }k∈N .
Fissato ǫ positivo (ma comunque piccolo) sia m l’indice corrispondente alla relazione |am − an | < ǫ/(2b)
(per ogni n > m) e p l’indice per cui |bp −bn | < ǫ/(2a)
(per ogni n > p). Sia ora M il più grande fra m e p;
per ogni n > M si ha allora:
|aM bM − an bn | = |aM bM − an bM + an bM − an bn | =
= |(aM − an )bM + an (bM − bn )| ≤
≤ |aM − an | |bM | + |an | |bM − bn | <
ǫ
ǫ
b+a
= ǫ.
2b
2a
Questo dimostra che la successione che definisce il
prodotto di r per s è una successione di Cauchy, quindi non rimane che provare come la definizione sia indipendente dalle due successioni scelte. A questo punto il lettore dovrebbe aver capito come si procede in
modo formale e quindi ci rifiutiamo di procedere oltre
con sviluppi in buona parte scontati. Lo stesso lettore, invece, è vivamente consigliato di riprendere foglio
e matita (se per caso li avesse riposti: male, male!) e
impegnarsi a portare avanti tutti i passaggi necessari. Se poi r ed s sono razionali, la compatibilità dei
risultati è di nuovo ovvia.
Per quanto riguarda la divisione, conviene prima
definire l’operazione per il calcolo dell’inverso, cioè
s−1 = 1/s, e quindi osservare che r/s = rs−1 . Anche
per l’inverso dobbiamo dimostrare tutti e tre le condizioni viste per la somma. Se il numero reale s 6= 0
è definito dalla classe [{ak }k∈N ], dobbiamo supporre (senza per questo venir meno alla generalità dei
nostri ragionamenti) che tutti gli elementi della successione siano diversi da 0; ha allora senso definire la
successione {1/ak }k∈N e assumerne la classe di equivalenza come il numero reale s−1 . Ci limiteremo ora
a dimostrare la prima condizione, e cioè che la nuova
successione non esce dall’ambito delle successioni di
Cauchy; lasciamo poi che il lettore si cimenti a dimostrare che la definizione è indipendente dalla successione scelta e che essa è compatibile con l’operazione
di inverso nei numeri razionali.
Sia a 6= 0 un numero razionale maggiore, in valore
assoluto, a tutti i numeri della successione {ak }k∈N ;
tale numero esiste per la limitatezza della successione.
Fissato ǫ > 0 a piacere, determiniamo un indice m
per il quale |am − an | < a2 ǫ per tutti gli n > m; si ha
allora:
¯ ¯
¯
¯
¯ 1
1 ¯¯ ¯¯ am − an ¯¯ |am − an |
a2 ǫ
¯
=
≤
−
<
=ǫ
¯ am
an ¯ ¯ am an ¯
a2
a2
e questo conclude il nostro lavoro.
Le successioni di Cauchy, come abbiamo appena
visto, costituiscono un metodo, astratto ma effettivo, di definire i numeri reali. Il nostro insistere sulle
approssimazioni per difetto e per eccesso non riveste
un aspetto casuale: spesso, la determinazione di un
numero reale eseguita valutando un numero sempre
maggiore di cifre decimali (anche una alla volta) può
essere una procedura effettiva ed anche efficiente. Altre volte, il numero è “isolato” valutando un intervallo di numeri razionali che lo contiene, e ad ogni passo l’intervallo viene dimezzato: si hanno cosı̀ ancora
approssimazioni per difetto e per eccesso, ma invece
di determinare una cifra decimale, si determina una
cifra binaria dopo l’altra; in definitiva, non c’è poi
una grande differenza. Come abbiamo detto, accanto
a questi metodi ne esistono altri che permettono di
valutare più cifre alla volta: capito il procedimento,
in linea di principio tutti i metodi vanno bene, ma si
possono avere comportamenti molto diversi dal punto
di vista dell’efficienza del calcolo.
L’idea di poter identificare l’insieme dei numeri reali R con la retta della Geometria, ha portato alle√seguenti considerazioni. Si torni per un attimo a 2,
che non è razionale per il Teorema 3.18. Possiamo
allora dividere l’insieme Q in due parti disgiunte:
+
2
Q< = Q−
0 ∪ {q ∈ Q | q < 2}
Q> = {q ∈ Q+ | q 2 > 2}.
Chiaramente, Q< ∪ Q> = Q e Q< ∩ Q> = ∅; d’altra
parte, per il citato teorema, Q< non ha alcun elemento massimo e Q> non ha alcun elemento minimo.
Questo ricorda un po’ la proprietà degli interi di essere “discreti”, anche se il buco fra Q< e Q> è per
cosı́ dire infinitesimo, e non vasto come quello tra 5
e 6. Nella retta R della Geometria tali buchi proprio
non esistono e quindi, se vogliamo che R possa essere
identificato con R, dobbiamo escludere che si verifichi
un fenomeno come quello dei razionali.
Per essere più specifici, definiamo sezione di Q ogni
coppia (Q1 , Q2 ) tale che: i. (∀q1 ∈ Q1 ) e (∀q2 ∈ Q2 )
86
CAPITOLO 3. NUMERI
si abbia q1 < q2 ; ii. Q1 ∪ Q2 = Q; iii. Q1 ∩ Q2 = ∅.
Come abbiamo accennato all’inizio di questa sezione,
il metodo di Dedekind definisce i numeri reali come
sezioni dell’insieme dei numeri razionali; in particolare, una sezione (Q1 , Q2 ) di Q corrisponde a un numero razionale se Q1 ha elemento massimo (oppure se
Q2 ha elemento minimo, ma convenzionalmente questo caso non si considera). Di conseguenza, i numeri
irrazionali corrispondono alle sezioni di Q in cui Q1
non ha massimo e Q2 non ha minimo. Se ora, in modo analogo a quanto fatto per Q, definiamo le sezioni
in R, quest’ultimo caso non si deve verificare, per non
creare quella sorta di buco che si diceva, e ciò si pone
come assioma:
Assioma (di continuità) Sia (R1 , R2 ) una sezione di R. Allora R1 ha un elemento massimo oppure
R2 ha un elemento
minimo.
√
−
2
Nel caso di 2, definendo
√ R1 = R ∪{x ∈ R | x ≤
2}, allora R1 possiede 2 come elemento massimo,
mentre definendo R1 = R− ∪ {x ∈ R | x2 < 2} si
fa sı̀ che R2 venga a contenere l’elemento massimo
√
2. L’assioma afferma che non vi possono essere altri
√
modi per dividere R nel punto corrispondente a 2.
Questo concetto di continuità ha un ruolo molto
importante nel concetto di limite, e lo ritroveremo
appunto quando affronteremo tale argomento nella
Sezione 8.4. Ad esso è legato il concetto di intervallo:
Definizione 3.7 Si dice intervallo di estremi a, b ∈
R l’insieme di tutti i numeri reali x tali che a ≤ x ≤
b. Propriamente, questo si dice un intervallo chiuso,
in quanto comprende i suoi estremi, e si indica con
la notazione [a, b]. Si dice invece intervallo aperto
l’insieme dei numeri reali x tali che a < x < b, che
non comprende perciò gli estremi a e b; tale intervallo
si indica con (a, b). Si usano anche intervalli misti
come [a, b), chiuso a sinistra e aperto a destra, e (a, b]
aperto a sinistra e chiuso a destra.
3.6
Potenze, radici, logaritmi
I numeri reali sono l’ambiente ideale per parlare di
potenze e, quindi, delle loro operazioni inverse, le radici e i logaritmi. Abbiamo già introdotto queste operazioni per i numeri naturali, e come questi si sono
estesi agli interi, ai razionali e ai reali, cosı̀ lo stesso
tipo di estensione deve essere fatta per le potenze. Intanto, la base di partenza rimane la stessa e se r ∈ R,
n ∈ N, si definisce:
½ 0
r =1
rn+1 = r · rn .
se q è un numero razionale, q = n/m, cosa vuol dire
rq = rn/m ? E se infine s è un numero reale, ha senso
una potenza come rs , e, se ha senso, qual è il suo
valore?
Cominciamo con i numeri interi, dei quali ci interessano i negativi, visto che i positivi coincidono
con i naturali e le potenze con tali esponenti sono
state definite un attimo fa. Per i numeri reali vale
la stessa regola vista per i naturali: rm+n = rm rn ;
la dimostrazione è esattamente la stessa. Naturalmente, se estendiamo le potenze agli esponenti negativi, vogliamo che questa regola continui a valere, altrimenti dovremmo considerare proprietà diverse per due operazioni che, invece, vorremmo vedere
come una sola. Pertanto vogliamo che sia: rm r−m =
rm+(−m) = r0 = 1; ma questo significa che r−m è
l’inverso di rm , cioè, in termini di numeri reali, deve
essere r−m = 1/rm . Questa è una buona definizione
e conferma cose che già ci sono note: abbiamo visto
che per i numeri naturali abbiamo k m−n = k m /k n se
m ≥ n; interpretando k come numero reale, questo
significa k m−n = k m (1/k n ), proprio la regola appena
vista, anche se limitata a k ∈ N ed m ≥ n. Questo è
molto confortante.
Visto il successo con i numeri negativi, poniamoci
il problema di definire cosa significa rm/n , cominciando col supporre m, n > 0. Anche qui ricordiamo che
per i numeri naturali vale la regola (k m )n = k mn ,
che naturalmente vogliamo conservare. Dovrà essere allora (rm/n )n = rnm/n = rm , e in particolare
(r1/n )n = r1 = r. Questa condizione ci fa venire in
mente come, per definizione, il numero che elevato
alla potenza n-esima ci dà r è ciò che si chiama la√radice n-esima di r: ma allora deve essere r1/n = n r.
Per i numeri naturali eravamo condizionati dal fatto che r doveva essere una potenza n-esima perfetta.
Qui, tra i numeri reali, questa condizione non è più
necessaria e ogni numero reale positivo può essere visto come potenza n-esima perfetta, come vedremo ora
con un esempio. E’ bene osservare esplicitamente che
la cosa non è vera per i numeri reali negativi; −4 non
può essere un quadrato perfetto, poiché il quadrato
di un numero reale è sempre una quantità positiva.
Allora vediamo che 2, come numero reale, è un cubo
perfetto, cioè è il cubo di un qualche numero reale.
Applichiamo quanto detto nella sezione precedente:
si comincia
con l’osservare che 13 < 2 < 23 e quindi
√
3
1 < 2 < 2, il che ci dà una prima
approssimazione
√
per difetto e per eccesso di 3 2. Possiamo migliorare l’approssimazione provando successivamente per
1.1, 1.2, 1.3, . . . ; si trova facilmente anche a mano
1.13 = 1.331, 1.23 = 1.728, 1.33 = 2.197. Qui
√ ci posMa se l’esponente non è un numero naturale, ci chie- siamo arrestare e abbiamo trovato 1.2 < 3 2 < 1.3.
diamo, possiamo dare un significato alla potenza? Ad Cerchiamo di migliorare ancora trovando l’approssiesempio, se k < 0 è un intero, cosa significa rk ? E mazione a meno di un centesimo; osservando dai de-
87
3.6. POTENZE, RADICI, LOGARITMI
√
cimali che 3 2 è più vicina a 1.3 che a 1.2, proviamo
a partire da 1.25, 1.26, . . . . Anche questa volta si
3
3
ha subito
√1.25 = 1.953125, 1.26 = 2.000376, per cui
1.25 < 3 2 < 1.26. Come si vede dal cubo, 1.26 è
un’approssimazione già molto
√ buona e infatti con un
qualsiasi calcolatore si trova 3 2 ≈√1.2599210498, cioè
l’errore che si commette ponendo 3 2 = 1.26 è minore
di un decimillesimo.
A questo punto possiamo definire ogni potenza che
ha come esponente un numero razionale
n/m; si ha
√ n
n/m
1/m n
m
infatti:
r
=
(r
)
=
(
r)
=
(rn )1/m =
√
m
rn . Poiché m è un intero positivo ed n è un intero qualsiasi, entrambe le operazioni di elevamento a potenza e di radice sono ben definite. Osserviamopesplicitamente che se n è negativo, si ha:
rn/m = m 1/r|n| .
L’ultimo passo consiste nel definire rs quando s sia
un numero reale qualsiasi, cioè, in pratica, sia un numero irrazionale. Intanto, se s è negativo, per essere
coerenti con quanto affermato fin ora, dobbiamo porre: rs = 1/r|s| . Supponiamo allora che s sia positivo e consideriamo due successioni {s′i }i∈N e {s′′i }i∈N
di numeri razionali (la prima crescente e la seconda decrescente) che determinano s, cioè lo approssimano per difetto e per eccesso. Sappiamo calcolare
′
′′
rsi e rsi e quindi possiamo ottenere approssimazioni per difetto e per eccesso di rs , la cui differenza
′
′′
′
′′
′
rsi − rsi = rsi (1 − rsi −si ) diviene piccola quanto si
vuole al crescere di i: infatti, per ipotesi, la differen′′
′
za s′′i − s′i tende a diventare 0 e quindi rsi −si tende
a diventare 1. In questa maniera, rs risulta definito
come numero reale.
Calcoliamo, come esempio, π π ; come prima approssimazione abbiamo π 3 < π π < π 4 e questi numeri li
sappiamo calcolare. Poi abbiamo π 3.1 < π π < π 3.2 e
possiamo calcolare anche queste limitazioni in quanto
3.1 e 3.2 sono numeri razionali: qui non ci dobbiamo
preoccupare della difficoltà di tali calcoli; quello che
ci interessa è l’aspetto teorico dell’approssimazione e
non il tempo impiegato ad ottenerla; questo fa parte
della complessità degli algoritmi e, tradizionalmente,
si chiama “stenaritmia”. Come già detto, andando
avanti calcoleremo π 3.14 < π π < π 3.15 , e cosı̀ via,
restringendo sempre di più l’intervallo che comprende π π . Nella Tabella 3.2 riportiamo i primi passi,
ricordando che si ha π π ≈ 36.4621596072.
Le proprietà formali delle potenze, pur cosı̀ estese, rimangono quelle già viste per i numeri naturali,
senza più il vincolo delle potenze perfette:
rs rt
(rs )t
r0
r1
0s
=
=
=
=
=
rs+t
rst
1
r
0
ma
rs /rt
rs v s
1s
−1
r
00
=
=
=
=
=
rs−t
(rv)s
1
1/r
1
Qui, ricordiamo, le basi r e v sono numeri reali po-
sitivi, mentre gli esponenti s e t sono numeri reali
qualsiasi, anche negativi. Abbiamo
avuto modo di
√
osservare come (−3)1/2 = −3 non ha significato
dal momento che nessun numero elevato al quadrato può dare un numero negativo come −3. Quindi,
in generale, non possiamo prendere in considerazione potenze reali di numeri negativi. Questo naturalmente non vuol dire che, in casi particolari, non
abbiano senso anche tali potenze. Infatti, mentre r2k
(k ∈ N) è sempre positivo, r2k+1 ha lo stesso segno di r e quindi sono definite
√ le radici dispari di
numeri negativi. Ad esempio, 3√
−8 = −2, in quanto
= −3; ma, in
(−2)3 = (−2)(−2)(−2) = −8, e 5 −243
√
4
−16
(attenzione!
modo altrettanto
ovvio,
non
esiste
√
scrivere 4 −16 = −4 è uno strafalcione che è opportuno evitare per scansare sacrosante rappresaglie da
parte del docente).
√
Dalla precedente definizione r1/m = m r, si√ha
un’ovvia estensione a tutti i numeri reali: r1/s = s r,
che definisce completamente il concetto di radice
come operazione inversa dell’elevamento a potenza,
quando questa regola si legga da destra verso sinistra. Si hanno allora le seguenti proprietà, conseguenza diretta della definizione e delle proprietà delle
potenze:
√
√
√
st
s
r t r = r1/s r1/t = r(s+t)/st =
rs+t
p
√
√
√
√
√
t s
s
s
s
ts
r
r √v =
rv
r =
√
s
s
1 = 1
0 = 0 (s 6= 0).
La radice che si trova più di frequente è naturalmente la radice quadrata e per questo si sono
√ sviluppati algoritmi che permettono il calcolo di r in modo diretto e senza incorrere nelle lungaggini di trovare
per tentativi un
√ decimale dopo l’altro, come si è fatto
per calcolare 3 2. L’algoritmo che viene insegnato è
laborioso, ma effettivo:
Algoritmo 3.6 (La radice quadrata)
Ingresso: un numero reale s = dr dr−1 . . . d1 d0 .c1 c2 . . .
e un numero naturale k;
√
Uscita: la rappresentazione decimale di s con k
cifre decimali;
1. a partire dal punto decimale, si divide la parte
intera di s in blocchi di due cifre; la parte decimale è anch’essa divisa in k blocchi, utilizzando 2k cifre decimali, aggiungendo eventualmente
alcuni 0 per raggiungere tale numero;
2. sia a il valore del primo blocco a sinistra, cioè
a = dr oppure a = dr dr−1 ; si pone come prima
cifra del risultato, fr/2 , la massima cifra f tale
che f 2 ≤ a;
3. sia ∆ la differenza a − f 2 ;
4. per ogni ulteriore blocco in cui sia stato suddiviso
s:
88
CAPITOLO 3. NUMERI
π3
π 3.1
π 3.14
π 3.141
π 3.1415
π 3.14159
≈
≈
≈
≈
≈
≈
31.00628
34.76679
36.39574
36.43743
36.45829
36.46204
<
<
<
<
<
<
ππ
ππ
ππ
ππ
ππ
ππ
<
<
<
<
<
<
97.40909
38.98339
36.81477
36.47916
36.46246
36.46246
≈
≈
≈
≈
≈
≈
π4
π 3.2
π 3.15
π 3.142
π 3.1416
π 3.14160
Tabella 3.2: Calcolo di π π
(a) si considerano le cifre della radice x0 = 1:
µ
¶
fr/2 fr/2−1 . . . fj finora ottenute e si
2
3
1
chiama a il doppio del numero da esse
1+
= = 1.5
x1 =
2
1
2
µ
¶
rappresentato;
1 3
17
2
x
=
=
+
= 1.41666
2
(b) si abbassa il blocco corrente, nel senso che
2 µ 2 3/2
¶12
a ∆ si aggiungono le due cifre del blocco
2
577
1 17
+
=
= 1.4142156
x3 =
considerato: ∆ := 100 × ∆ + 10 × dℓ + dℓ−1 ;
2 12 17/12
408
(c) si cerca la massima cifra f tale che (10 × Come si vede, già dopo 3 iterazioni il valore ottenuto
a + f ) × f ≤ ∆; tale cifra si aggiunge come è abbastanza buono; la quarta iterazione dà 12 cifre
cifra ulteriore del risultato;
decimali esatte, e cosı̀ via. Naturalmente, ci accor(d) se ci sono altri blocchi da elaborare, si cicla giamo che il valore ottenuto è buono quando la differenza dal valore ottenuto all’iterazione precedente è
tornando al punto 4a);
trascurabile.
5. si mette il punto decimale dopo la r/2-esima cifra
Il lettore è fortemente invitato a formulare l’algoritdel risultato, e si esce.
mo che realizza questo metodo e a scrivere e provare
un programma sull’elaboratore. Il metodo può essere
L’impostazione dell’operazione
è quella della Figu- adottato anche al calcolo delle altre radici, ma per
√
ra 3.1, dove si cerca 200 con 3 cifre decimali. L’al- questo rimandiamo all’esposizione generale del megoritmo risale a Fibonacci, ma il metodo più semplice todo di Newton come si trova nei testi di Calcolo
3
ed interessante per trovare la radice quadrata di un Numerico. Invitiamo però il lettore a calcolare √
2
numero risale ai Babilonesi, anche se oggi è di soli- mediante la formula iterativa:
to citato come metodo di√Newton. Sia r un numero
¶
µ
1
r
reale e si voglia calcolare r; se x0 è un’approssimaxn+1 =
2xn + 2
3
xn
zione di tale radice, è immediato dimostrare questa
proprietà:
dove r = 2 e x0 = 1.
Naturalmente, una espressione aritmetica può conTeorema 3.20 Sia r un numero
reale positivo
√
√ e sia tenere una o più radici; se queste si trovano a denox0 un’approssimazione
di √r. Se x0 < r √allora
√
minatore di una frazione, è preferibile eliminarle con
r/x0 > r, mentre se x0 > r allora r/x0 < r.
una tecnica che è detta
√ di razionalizzazione. Si consi√
Prova: √Si consideri il caso x0 < r; se fosse anche deri ad esempio 1/ 3, che risulta di difficile calcolo;
√
se moltiplichiamo numeratore e denominatore per 3
r/x0 < r, moltiplicando
√ √ membro a membro, avremmo: x0 · r/x0 < r · r, cioè r < r, il che è assurdo. si ottiene:
√
√
Analogamente si procede nell’altro caso.
3
1.732
1· 3
1
√ =√ √ =
≈
≈ 0.577,
Stando
3
3
3
3· 3
√ cosı̀ le cose, qualunque sia l’approssimazione
x0 di r, se eseguiamo la media: x1 = (x0 + r/x
√0 )/2, una forma molto più ragionevole. Se a denominatore
questa sarà un’approssimazione migliore a r di
c’è una somma o una differenza di radicali quadratici
quanto non lo fosse x0 . Possiamo ora applicare iteraconviene procedere in questo modo:
tivamente il metodo ad x1 e ottenere un’approssima√
√
zione ancora migliore, e cosı̀ di seguito. Il merito di
2
2( 6 + 2)
√
√ = √
√ √
√ =
Newton è stato quello di dimostrare che questo algo6− 2
( 6 + 2)( 6 − 2)
ritmo trova
√ velocemente approssimazioni molto accu√
√
√
√
rate
6+ 2
2( 6 + 2)
√di r. Vediamo infatti come si possa determina=
.
=
re 2 ≈ 1.414213562 partendo dall’approssimazione
6−2
2
89
3.6. POTENZE, RADICI, LOGARITMI
√
2
1
1
0 0.
0
9
0
6
4
2
1
1
0 0
0
8
1
1
0
1
9
2
6
5
0 0
0
9
0
6
3
0
6
4
5
8
0 0
1
2
2
2
2
4
4
8
8
8
. 1 4 2
× 4 = 9 6
1 × 1 = 2 8
2 4 × 4 = 1
2 8 2 × 2 =
1
1
5
2 9 6
6 5 6
4
0 0
6 4
3 6
Figura 3.1: La radice quadrata
Lasciamo al lettore, come esercizio, la razionalizzazione di:
1
√ ,
3+ 2
1
1
√
√ , √
,
3
5− 3+ 2
5
√
√
√
3
25 + 3 10 + 3 4
1
√ =
√
.
3
3
5− 32
Ma questa espressione è proprio il quadrato del membro sinistro. Poiché le due quantità sono entrambe
positive, l’uguaglianza è verificata.
√
Questa formula è particolarmente interessante
quando a2 − b è un quadrato perfetto; in tal caso,
infatti, le radici quadrate interne scompaiono e il radicale doppio di sinistra si trasforma nella somma (o
nella differenza) di due radicali semplici. L’esempio
Non è raro incontrare espressioni che richiedono il
precedente è significativo:p
poiché 62 − 20 = 16 = 42 ,
p
calcolo di radici p
di altre espressioni composte da radi√
√
la formula del teorema dà 6 − 20 = (6 + 4)/2−
√
ci; ad esempio, 6 −√ 20 = 1.2360679777 . . .. Se si p
(6 − 4)/2 = 5 − 1, il che dimostra che la coinconsidera la quantità 5 − 1, molto più semplice (sia
cidenza
dei decimali non è limitata alle sole prime
da portarsi dietro sia da calcolare), si può osservacifre.
re che anch’essa vale 1.2360679777 . . . e ci chiediamo
se le due espressioni sono davvero uguali o se sono
Nota 3.7
Verificare che due numeri reali hanno
soltanto molto simili, ma, proseguendo col calcolo di
alcune
cifre
iniziali
uguali, non significa e non prova
altri decimali, si trovi poi una discrepanza. E’ questo
che
i
due
numeri
siano
uguali. Per far ciò occorre una
il problema dei cosiddetti radicali doppi, argomento
vera dimostrazione, come quella derivante dal teoremolto bello e molto amato dal mitico matematico inma precedente. Un semplice esempio
√ contrario è dato
√
diano Srinavasa Ramanujan. Per i radicali quadratici
dalla falsa uguaglianza π = 2 + 3; se ci si limita
vale il seguente risultato:
alle prime due cifre decimali si ha: 1.41 + 1.73 = 3.14,
p
√
ma già la terza cifra è diversa. La frazione 355/113
Teorema 3.21 Sia data l’espressione a ± b con
vale 3.14159292 e le prime sette cifre coincidono√con
2
a, b > 0; se a > b allora vale l’identità:
quelle di π. Ancora più eclatante è il caso di 2 e
della frazione 665857/470832, frazione che il lettore
s
s
√
√
q
industrioso avrà già
√
a + a2 − b
a − a2 − b
√ incontrato applicando il Teorema
a± b=
±
.
3.20 al calcolo di 2. Il calcolatore dà per entrambi il
2
2
Prova:
Si osservi prima di tutto che a >
√
a2 − b. Se eleviamo al quadrato il secondo membro
dell’uguaglianza nell’enunciato, si ottiene:
√
√
a + a2 − b a − a2 − b
+
±
2
2
s
√
√
a + a2 − b a − a2 − b
=
±2
2
2
r
√
a2 − (a2 − b)
= a ± b.
=a±2
4
valore 1.41421356237, ma naturalmente, nonostante
questa identità, i due numeri
non possono coincidere,
√
poiché come sappiamo 2 non è un numero razionale.
Come abbiamo avuto già modo di osservare, l’elevamento a potenza ab = c ha due operazioni inverse:
se si conoscono c e b, per ricavare a si esegue l’estrazione di radice, che abbiamo visto essere una semplice estensione dell’elevamento a potenza. Possiamo però anche conoscere a e c e cercare l’esponente
b: questa operazione si chiama calcolo del logaritmo. Quindi, per definizione, il logaritmo in base a
90
CAPITOLO 3. NUMERI
di c è l’esponente b al quale occorre elevare a per ottenere c; questa quantità si scrive: b = loga c. Se
sappiamo fare le potenze, possiamo trovare qualsiasi logaritmo applicando il metodo delle approssimazioni successive. Ad esempio, calcoliamo il log2 10;
poiché 23 < 10 < 24 , si ha 3 < log2 10 < 4. Dal
momento che 23 è più vicino a 10 di quanto non
lo sia 24 , partiamo da 3.1 e calcoliamo le varie potenze: 23.1 = 8.574, 23.2 = 9.189, 23.3 = 9.849,
23.4 = 10.556, e quindi 3.3 < log2 10 < 3.4. Ancora, 23.3 è più vicino a 10 di 23.4 , e cosı̀ abbiamo:
23.31 = 9.917, 23.32 = 9.986, 23.33 = 10.056, per cui
3.32 < log2 10 < 3.33. Cosı̀ procedendo si può trovare
il valore approssimato log2 10 ≈ 3.32192809.
Le regole fondamentali dei logaritmi sono le
seguenti:
loga (rv)
loga (r/v)
loga (r√s )
loga s r
loga a
loga 1
=
=
=
=
=
=
loga r + loga v
loga r − loga v
s loga r
1
s loga r
1
0
Inoltre, è importante la seguente proprietà che permette di cambiare la base di un logaritmo, operazione
abbastanza frequente:
Teorema 3.22 Vale la seguente identità:
loga b = 1/ logb a.
Prova: Sia x = loga b; per definizione è b = ax e se
si prende il logaritmo in base b dei due membri si ha:
logb b = logb ax = x logb a. Ma logb b = 1 e se diamo
ad x il suo valore si ha: 1 = (loga b)(logb a), da cui
deriva immediatamente la formula desiderata.
Ad esempio, si calcola: log10 2 = 1/ log2 10 =
1/3.32192809 . . . = 0.301029995 . . ..
L’utilità dei logaritmi è legata alle loro proprietà:
le moltiplicazioni sono ridotte ad addizioni, le divisioni a sottrazioni, le potenze a moltiplicazioni e le
radici a divisioni. Oggi, con l’uso intensivo dei calcolatori elettronici di ogni dimensione, non ci rendiamo
conto delle difficoltà pratiche dei calcoli. Molti studenti, oggi, non conoscono neppure le tabelline (cioè
la Tavola Pitagorica) e non sanno eseguire le divisioni. Se vogliamo estrarre la radice quinta di 1639,
il calcolatore ci dà immediatamente 4.39456397, ma
nel 1600 o nel 1800, applicando i metodi che abbiamo visto, sarebbe occorsa una giornata di duro lavoro
per arrivare ad ottenere cinque o sei decimali. I logaritmi permettono di risolvere il problema in pochi
minuti. Su una
√ tavola si trova log10 1639 = 3.21458
e quindi log10 5 1639 = 3.21458/5 = 0.64292 e, ancora dalla tavola, si ricava: 100.64292 = 4.3946, il che è
sufficiente per la maggior parte delle applicazioni. In
questo esempio abbiamo immaginato di usare tavole
dei logaritmi in base 10 con 5 cifre decimali; in effetti
queste erano le tavole di uso più comune, ma ne sono
esistite anche con 15 o 20 decimali.
I logaritmi furono inventati dal matematico scozzese John Napier (Giovanni Nepero era il suo nome latinizzato) verso la fine del 1500 e le sue tabelle a 14 decimali, con relativo manuale d’uso, furono pubblicate nel 1614, dopo 20 anni di laboriosi
calcoli (si veda anche il Capitolo 8). I logaritmi di
Napier erano, grosso modo, ciò che oggi chiamiamo
logaritmi naturali, cioè i logaritmi nella particolare
base e = 2.7182818284 . . ., sul cui significato avremo
molto da dire più avanti. Immediatamente, l’opera di
Napier venne apprezzata, utilizzata e imitata. Henry
Briggs, dopo aver discusso con Napier nel 1615, introdusse i logaritmi decimali (cioè in base 10), che da
allora divennero quelli più popolari ed utilizzati nella
pratica. Fino all’introduzione dei calcolatori elettronici da tasca verso il 1970, i logaritmi decimali sono
rimasti lo strumento più largamente usato nei calcoli
di precisione, battuto per i calcoli approssimati solo
dal regolo calcolatore, uno strumento meccanico derivato proprio dai logaritmi. In effetti, una tavola di
logaritmi era maneggevole e alla portata economica
di tutti; già il regolo calcolatore, come strumento di
calcolo, era più costoso e, come s’è detto, meno preciso, per cui era usato solo per calcoli veloci, come
il puntamento delle armi o la misurazione dei terreni
sul posto. Meno maneggevoli e molto più care erano
le macchine calcolatrici meccaniche: inventate da Pascal verso il 1640, estese alla moltiplicazione da Leibniz, erano pesanti e ingombranti, e quindi adatte solo
ai conti che potevano esser fatti in un ufficio o in uno
studio. Per questo, molti altri strumenti di calcolo
furono proposti, come il già citato celebre compasso, inventato e commercializzato da Galileo intorno
al 1600.
3.7
Espressioni e proporzioni
La rappresentazione di un conto, come 3 + 5 oppure
14 × (424 − 35/5), si suol chiamare una espressione
aritmetica. L’ordine di esecuzione delle operazioni è
regolato da alcune norme convenzionali:
1. le operazioni si eseguono da sinistra verso destra,
ma moltiplicazione e divisione hanno la precedenza su somma e sottrazione. Quindi 5 − 2 + 1
vale 4, ma 5−2×2 vale 1 poiché il prodotto 2×2
si esegue prima della sottrazione;
2. le parentesi possono essere usate per modificare
questo ordine. Pertanto (5−2)×2 dà come valore
6, poiché la sottrazione viene eseguita prima del
prodotto.
3.7. ESPRESSIONI E PROPORZIONI
Operando in questa maniera, il risultato di un’espressione aritmetica è determinato univocamente e due
persone (o anche una persona e un elaboratore elettronico) devono ottenere lo stesso valore se partono
con la medesima espressione. Alla Scuola Media si
insegna ad usare vari tipi di parentesi: le parentesi
tonde sono quelle a più basso livello; per raggruppare espressioni che già contengono parentesi tonde si
usano le parentesi quadre; e infine, a livello più alto
si usano le parentesi graffe. In realtà, nella pratica,
si tende ad usare solamente le parentesi tonde, eventualmente di dimensione crescente man mano che si
sale di livello. E’ molto raro l’utilizzo di parentesi
quadre e graffe all’interno delle espressioni aritmetiche: a queste parentesi viene di solito dato un significato diverso e che non ha niente a che fare con
il raggruppamento dei termini in un’espressione aritmetica. Abbiamo già incontrato le notazioni {a, b, c}
e {x ∈ N | x2 < 200}, che usano le parentesi graffe
per denotare un insieme, sia che lo si voglia definire per estensione o per intensione. C’è stata anche
l’occasione di introdurre le parentesi quadre nella notazione delle liste, ed esistono altri usi più specifici di
queste parentesi. Pertanto, eviteremo di mescolare
le parentesi dando loro lo stesso significato e, per le
espressioni aritmetiche, useremo soltanto le parentesi
tonde.
A voler essere precisi (e in Matematica questo è
proprio il caso) non tutte le espressioni aritmetiche
danno un risultato numerico; ad esempio 4/(5 − 5)
diviene 4/0 e questa è un’operazione che non ha risultato. Infatti, 4/0 starebbe a indicare quel numero
che moltiplicato per 0 dà 4, ma nessun numero gode
di questa proprietà. Poiché nei vari insiemi numerici
che abbiamo visto la divisione per 0 è sempre vietata
per gli stessi motivi, dobbiamo vietarla in generale
nelle espressioni aritmetiche e considerare valide solo
quelle che, al termine della computazione, ci danno
un valore numerico. Definiamo allora una relazione di
equivalenza tra espressioni: due espressioni aritmetiche A e B sono equivalenti se e solo se sono entrambe
valide e danno lo stesso valore numerico come risultato. Il termine “equivalente” è giustificato dal fatto
che tale relazione risulta veramente essere una relazione di equivalenza, e al lettore basterà un momento
di riflessione per rendersi conto della validità delle tre
proprietà riflessiva, simmetrica e transitiva. Può, al
solito, essere un buon esercizio verificare formalmente queste proprietà, ma lasciamo la cosa alla buona
volontà e all’interesse del lettore. Per indicare che
due espressioni aritmetiche A e B sono equivalenti si
scrive A = B che si legge “A uguale a B”; la relazione
di equivalenza si dice propriamente uguaglianza e ci
si riferisce ad A e a B come al membro sinistro e al
membro destro dell’uguaglianza.
91
Questa relazione di equivalenza può essere arricchita da altre proprietà che risulteranno molto
importanti:
Teorema 3.23 Siano A e B due espressioni aritmetiche valide ed equivalenti fra di loro, e sia C
una terza espressione aritmetica valida; si ha allora A + C = B + C, A − C = B − C e A × C = B × C.
Infine, se il valore dell’espressione C è diverso da 0,
si ha anche A/C = B/C.
Prova: Se A e B hanno lo stesso valore numerico,
diciamo n, e C ha valore numerico m, allora A + B
ha valore numerico n + m come lo ha B + C. La
stessa osservazione vale anche negli altri casi; per la
divisione, se C ha valore 0, dividendo A o B per C si
hanno espressioni non valide.
Una semplice osservazione notazionale è la seguente: se le espressioni contengono più di un numero, è
bene scrivere A − (C), (A) × (C) e (A)/(C), usando opportunamente le parentesi per assicurarsi che le
operazioni vengano eseguite nell’ordine giusto. E’ bene anche osservare che somma e sottrazione agiscono
in modo simmetrico: nel caso che A e B siano espressioni equivalenti, se prima si somma e poi si sottrae C
(o viceversa), si torna a due espressioni equivalenti.
Lo stesso succede per moltiplicazione e divisione, se
C non vale 0. Se invece C vale 0, non solo è vero che
da A = B si ricava A × C = B × C, ma questa uguaglianza si ottiene anche quando fosse A 6= B, cioè A
e B non fossero equivalente: infatti, il valore comune
delle due espressioni ottenute sarebbe comunque 0.
Naturalmente, a questo punto non si può più tornare
indietro dividendo per C. Questo, se si vuole, è un
altro argomento per spiegare la necessità di evitare
moltiplicazione e divisioni per 0.
Il teorema precedente può essere esteso nel modo
seguente:
Teorema 3.24 Siano A, B, C, D quattro espressioni
aritmetiche valide tali che A = B e C = D; se se
sommano o si sottraggono tali uguaglianze membro a
membro si hanno ancora espressioni equivalenti, cioè
A + C = B + D e A − C = B − D. Inoltre, se il valore
comune di C e D non è 0, si ha anche A×C = B ×D
e A/C = B/D.
Prova: Per il teorema precedente, da A = B si ricava A + C = B + C e da C = D si ha C + B = D + B,
ovvero B + C = B + D per la proprietà commutativa
della somma; si ha allora A + C = B + D. Per la
sottrazione non vale la proprietà commutativa ed occorre perciò un’osservazione in più: se C = D allora
−C = −D, come si vede immediatamente pensando
al valore comune di C e di D. Allora, da A = B
si ha A − C = B − C e da −C = −D si ricava
92
−C + B = −D + B, cioè B − C = B − D, questa volta per la proprietà commutativa della somma. Per la
moltiplicazione e la divisione si procede in modo analogo, osservando che da C = D discende 1/C = 1/D
purché il valore comune di C e D sia diverso da 0.
CAPITOLO 3. NUMERI
se: 1) ogni antecedente si inverte col proprio conseguente (proprietà dell’invertendo); 2) si permutano
gli estremi e/o i medi (proprietà delle permutando).
Prova: La proporzione originale è equivalente a
ad = bc; è facile osservare che ciascuna delle altre proUn’osservazione importante è la seguente: se A = porzioni è equivalente alla stessa identità. Ad esemB e il valore delle espressioni è diverso da 0, molti- pio, permutando gli estremi si ha: d : b = c : a, il che
plicando questa uguaglianza membro a membro per significa ancora ad = bc.
sé stessa, si ha A2 = B 2 . Tuttavia, da A2 = B 2 non
Due altre proprietà sono utili per risolvere molti
si può dedurre A = B, come prova il controesempio
problemi:
2
2
(−2) = 2 . Il teorema precedente, infatti, afferma
2
2
solo che se A = B e A = B allora (dividendo mem- Teorema 3.27 Si abbiano quattro numeri in proporbro a membro) si ricava A = B; ma questo non è zione a : b = c : d. Allora, la somma (o la differenza)
particolarmente interessante.
degli antecedenti sta alla somma (o alla differenza)
Queste proprietà delle espressioni aritmetiche si ge- dei conseguenti, come ciascun antecedente sta al proneralizzeranno più avanti alle espressioni algebriche; prio conseguente (proprietà del componendo e dello
per il momento ci interessa la loro applicazione alla scomponendo). Equivalentemente, la somma (o la
teoria delle proporzioni.
differenza) del primo e del secondo sta al primo (o al
secondo) come la somma (o la differenza) del terzo e
Definizione 3.8 Una proporzione è l’uguaglianza di del quarto sta al terzo (o al quarto).
due rapporti: a/b = c/d. Quattro numeri a, b, c, d si
Formalmente, il componendo corrispondicono in proporzione se il rapporto dei primi due è Prova:
uguale al rapporto degli ultimi due. Si scrive a : b = de alla proporzione: (a + c) : (b + d) = a : b o
c : d e si legge “a sta a b come c sta a d”. I quattro (a + c) : (b + d) = c : d, mentre la seconda formulanumeri si dicono termini della proporzione; a e d si zione corrisponde a (a + b) : a = (c + d) : c o anche
dicono gli estremi e b e c i medi; a e c si dicono gli (a + b) : b = (c + d) : d. Permutando i medi nella
proporzione di partenza, si ha a : c = b : d e quindi la
antecedenti e b e d i conseguenti.
prima formulazione ci dà (a+b) : (c+d) = b : d e perLa proprietà fondamentale delle proporzioni è data mutando di nuovo i medi: (a + b) : b = (c + d) : d, che
dal seguente:
è la seconda formulazione. Visto che le due formulazioni sono equivalenti, basta dimostrare la validità di
Teorema 3.25 Quattro numeri sono in proporzione
quest’ultima proporzione. Ma essa equivale a:
se e solo se il prodotto dei medi è uguale al prodotto
degli estremi.
a+b
c+d
a
c
=
o
+ 1 = + 1;
b
d
b
d
Prova: Supponiamo che a : b = c : d, cioè a/b =
c/d; ovviamente dobbiamo avere b 6= 0 e d 6= 0, e sottraendo 1 ad entrambi i membri, si ottiene proprio
per il Teorema 3.23 possiamo moltiplicare entrambi i la proporzione di partenza. Una prova analoga vale
membri diquesta uguaglianza per bd e semplificando ovviamente per lo scomponendo.
si ha ad = bc come si voleva. Viceversa, se ad = bc
Una applicazione del componendo si ha nella rie i quattro numeri sono diversi da 0, sempre per il soluzione di questo tipo di problemi: di due numeri
teorema 3.23 possiamo dividere entrambi i membri si sa che il loro rapporto è 3/5 e che la loro somma
per bd 6= 0; si ottiene a/b = c/d, cioè proprio a : b = è 32; quali sono i due numeri? Se chiamiamo i due
c : d.
numeri x ed y, la prima condizione ci dà la propor-
zione x : y = 3 : 5 e quindi la seconda formulazione
del componendo ci dice: (x + y) : x = (3 + 5) : 3,
cioè 32 : x = 8 : 3. Per la proprietà fondamentale,
questo ci permette di scrivere l’uguaglianza 8x = 96;
dividendo i due membri per 8 si ha allora x = 12. La
proporzione di partenza diviene ora 12 : y = 3 : 5 e di
nuovo la proprietà fondamentale ci dà 3y = 60, cioè
y = 20.
La proprietà del componendo si può utilmente
estendere alle catene di rapporti: si dice catena di
Teorema 3.26 Si abbiano quattro numeri in propor- rapporti l’uguaglianza di due o più rapporti. Ad
zione a : b = c : d. Si ottengono nuove proporzioni esempio, costituisce una catena di rapporti la serie
I Greci svilupparono la teoria delle proporzioni basandola su questo teorema, che rimane il fulcro dell’applicazione pratica delle proprietà delle proporzioni. Ad esempio, poiché 2 × 12 = 3 × 8, si ha subito:
2 : 3 = 8 : 12. E’ chiaro che dalla uguaglianza si possono ottenere altre proporzioni, quali 12 : 3 = 8 : 2
oppure 2 : 8 = 3 : 12, e cosı̀ via. Queste variazioni rientrano fra alcune proprietà caratteristiche,
contemplate dalla teoria:
93
3.7. ESPRESSIONI E PROPORZIONI
di tre uguaglianze: 8 : 2 = 12 : 3 = 20 : 5. In
questo caso il componendo assume la forma: in una
catena di rapporti la somma degli antecedenti sta alla
somma dei conseguenti, come ogni antecedente sta al
proprio conseguente. Nell’esempio precedente si ha:
(8 + 12 + 20) : (2 + 3 + 5) = 8 : 2, cioè 40 : 10 = 8 : 2,
che è ovviamente una proporzione, come si verifica
con il teorema fondamentale: 40 × 2 = 10 × 8.
Nella risoluzione dei problemi legati alle proporzioni, come nell’esempio dei due numeri visto in precedenza, si cerca di determinare un termine della proporzione quando se ne conoscano gli altri. La regola
fondamentale delle proporzioni è la panacea universale per tali problemi e la sua applicazione porta facilmente a un risultato positivo. Esiste tuttavia una
nomenclatura precisa, che è opportuno conoscere:
Definizione 3.9 Dati tre numeri a, b, c si dice quarto proporzionale (dopo a, b, c) il numero x tale che:
a : b = c : x. Dati due numeri a, b si dice terzo proporzionale (dopo a, b) il numero x tale che:
a : b = b : x. Infine, dati due numeri a, c si dice
medio proporzionale tra a e c il numero x tale che:
a : x = x : c.
I Greci, come s’è detto, svilupparono la teoria delle
proporzioni, introdussero questi concetti a proposito
della similitudine delle figure (si veda al Capitolo sulla
Geometria Euclidea) e trovarono costruzioni geometriche per “calcolare” il quarto, il terzo e il medio proporzionale di segmenti assegnati; essi, infatti, erano
più bravi con la geometria che col calcolo e si trovavano più a loro agio con i segmenti che con i numeri.
Per noi le cose sono diametralmente opposte, anche
se, a suo tempo, vedremo le costruzioni proposte dai
Greci.
• un confronto: se cioè, dati due oggetti A, B ∈ G,
si possa dire se il primo A è uguale, maggiore o
minore del secondo B;
• una somma: se cioè A, B ∈ G sono due oggetti,
si può trovare in G un oggetto che sia la somma A + B dei due oggetti; naturalmente, tale somma deve godere delle proprietà consuete
della somma tra numeri;
• un prodotto scalare: se cioè A ∈ G ed r è un
numero reale qualsiasi, si può trovare in G un
oggetto che sia r volte l’oggetto A; tale oggetto si
indica con rA. Si deve avere: r(A+B) = rA+rB
e (r + s)A = rA + sA.
Se gli oggetti sono di natura fisica, si parla di grandezza fisica; se sono di natura matematica, si parla
di grandezza matematica. Fra queste, viene naturale pensare ai segmenti e agli angoli, e in effetti studieremo queste grandezze (e altre) nel capitolo sulla
Geometria Euclidea. Fra le classi di grandezze fisiche, ricordiamo gli oggetti pesanti o i conduttori di
elettricità. Ogni classe di grandezze G può essere associata a una misura: si definisce arbitrariamente un
oggetto U ∈ G della classe come unità di misura e si
dice che un oggetto A ∈ G ha misura r = µ(A) se
r è il numero reale tale che A = rU . Nel caso degli
oggetti pesanti, l’unità di misura è il peso di un litro
d’acqua distillata alla temperatura di 4◦ centigradi.
Tale quantità si dice convenzionalmente kilogrammo
o chilogrammo (kg) e il peso di un oggetto pesante è
il rapporto dell’oggetto con tale unità di misura. La
misura deve godere delle due proprietà formali:
µ(rA)
= rµ(A)
µ(A + B) = µ(A) + µ(B).
Teorema 3.28 1) Il quarto proporzionale dopo i numeri a, b, c, è il numero x = bc/a; 2) il terzo proporIl conteggio costituisce una specie di misura per alzionale dopo a, b è il numero: x = b2 /a; 3) il medio
cuni
oggetti, sia del mondo fisico, sia di quello mate√
proporzionale fra i numeri a e c è il numero x = ab. matico (si veda il Capitolo 4); tuttavia, in questo caProva: Come accennato, basta applicare la regola so, il prodotto scalare ha senso solo per r ∈ N. Questo
fondamentale; ad esempio, da a : b = c : x si ha porta a distinguere le grandezze in due categorie:
ax = bc e dividendo i due membri per a (supposto
diverso da 0) per il Teorema 3.23 si trova x = bc/a.
La dimostrazione degli altri punti è simile.
L’ambito naturale di applicazione della teoria delle
proporzioni è costituito dalle grandezze proporzionali. Vediamo allora di ricordare brevemente cosa si
intende per grandezza, un concetto legato al mondo
fisico, anche se trova molti riscontri nella Matematica
tradizionale, specie nella Geometria che, come abbiamo ricordato, è il settore in cui si è originariamente
sviluppata la teoria delle proporzioni.
Una classe di grandezze è un insieme G di oggetti
(di natura fisica o matematica) per i quali è possibile
definire:
• le grandezze continue o analogiche per le quali il
prodotto scalare è definito per ogni r ∈ R;
• le grandezze discrete o digitali per le quali il
prodotto scalare è definito solo per r ∈ N.
La teoria delle proporzioni tratta solamente grandezze continue; tradizionalmente, si dice che due
(classi di) grandezze sono direttamente proporzionali (si pensi al peso di una merce e al suo costo) se
raddoppiando, triplicando, etc. la prima anche la seconda raddoppia, triplica, etc. Analogamente, si dice
che due grandezze sono inversamente proporzionali
se raddoppiando, triplicando, etc. la prima, la seconda diviene la metà, un terzo, etc. Queste espressioni
94
CAPITOLO 3. NUMERI
danno bene l’idea intuitiva di proporzionalità diretta
e inversa, ma formalmente non sono granché; infatti,
se gli “etc.” ci stimolano ad afferrare un concetto di
variabilità che riusciamo intuitivamente a cogliere, in
sostanza non ci dicono niente. Migliore è allora la
seguente:
Definizione 3.10 Due grandezze si dicono direttamente proporzionali quando il rapporto fra ogni valore della prima e il corrispondente valore della seconda
è costante. Si dicono invece inversamente proporzionali se il prodotto di ogni valore della prima per il
corrispondente valore della seconda è costante.
Nel caso del prezzo e del peso, se K è il costo di
una merce al chilogrammo, e al peso W corrisponde
il prezzo P , si avrà: P/W = K, qualunque siano P
e W . Invece, se v è la velocità oraria di un’autovettura che impiega il tempo t a percorrere la distanza
d, si scrive: vt = d. Viceversa, si osservi che, fissata
la velocità v di percorrenza, la distanza percorsa e il
tempo per percorrerla sono grandezze direttamente
proporzionali, e questa osservazione, che si generalizza facilmente, ci fa capire come i due concetti siano
strettamente collegati, e non solo per il nome. D’altra
parte, la precedente definizione rende perfettamente
conto della relazione tra grandezze proporzionali e
proporzioni. Ad esempio, una volta stabilito (o dato per definizione) che il costo di una merce è direttamente proporzionale al suo peso, e supposto che
questa costi 3.5 e al Kg, chiederci quanto vengono a
costare 2.7 Kg della stessa merce vuol dire risolvere
la proporzione: 3.5 : 1 = x : 2.7. Invertendo si ha:
1 : 3.5 = 2.7 : x, e quindi, come abbiamo visto, si
trova: x = 3.5 × 2.7 = 9.45 e. La regola esplicita è:
costo1 : peso1 = costo2 : peso2 .
Quando le grandezze sono inversamente proporzionali, il secondo rapporto va invertito; cosı̀ se una macchina che va a 75 km/h impiega 45 minuti a percorrere una certa distanza, per sapere quanto impiegherebbe se andasse a 90 km/h, la proporzione da impostare
è: 75 × 45 = x × 90, cioè 75 : 90 = x : 45, secondo lo
schema:
velocità1 : tempo1 = tempo2 : velocità2
ovvero:
velocità1 : velocità2 = tempo2 : tempo1
dove si deve notare l’inversione degli indici. In questo
caso troviamo x = 37.5, cioè x = 37′ 30′′ .
Una celebre classe di problemi legati alle grandezze
inversamente proporzionali è costituito dai problemi
relativi al riempimento di una vasca. Ad esempio,
una vasca di capacità ignota ha due rubinetti e uno
scarico; se il primo rubinetto fosse aperto da solo (con
lo scarico chiuso) impiegherebbe 24 minuti per riempire la vasca; il secondo rubinetto, sempre da solo,
riempirebbe la vasca in 30 minuti. Invece lo scarico, se agisse da solo, vuoterebbe la vasca piena in 20
minuti. La domanda è: se si aprono contemporaneamente i due rubinetti e lo scarico, in quanto tempo si
riempie la vasca? Solo i matematici possono inventare
problemi tanto assurdi, ma, una volta posto, il quesito va risolto. Il fatto è che i tempi di riempimento
sono una grandezza inversamente proporzionale alla quantità di acqua immessa nella (o estratta dalla)
vasca, mentre è questa grandezza che si somma o si
sottrae per stabilire quando la vasca si è riempita o
si è svuotata.
Questa inversione di solito imbarazza il solutore,
ed è opportuno ragionare in questo modo: in un minuto il primo rubinetto riempie 1/24 della vasca e il
secondo ne riempie 1/30; lo scarico ne vuota 1/20 e
sono queste le grandezze che si possono sommare e
sottrarre. In un minuto la vasca si riempie per:
1
1
1
5+4−6
1
+
−
=
=
24 30 20
120
40
e quindi occorrono in tutto 40 minuti per il riempimento. Tutto qui. Il lettore può ora risolvere il
problema dei due automobilisti Carlo e Dario: Carlo è in grado di percorrere l’autostrada da A a B in
60 minuti; Dario la percorre in 40 minuti. Se Carlo parte da A e Dario da B, dopo quanto tempo si
incontreranno?
Importante è il seguente concetto:
Definizione 3.11 La percentuale di una quantità q
rispetto a una quantità Q è il rapporto q/Q riportato
a 100.
In altre parole, la percentuale x di q a Q è il quarto
proporzionale: q : Q = x : 100, e quindi per il Teorema 3.28 è: x = 100q/Q. Ad esempio, se un oggetto
costa 60 e e viene scontato di 12 e, in percentuale
lo sconto è dato dalla proporzione: 12 : 60 = x : 100,
cioè x = 1200/60 = 20 per cento (o, come si scrive,
20%). Viceversa, se su un oggetto che costa 70 e
viene operato lo sconto del 15%, tale sconto si calcola risolvendo la proporzione. x : 70 = 15 : 100,
cioè x = 70 × 15/100 = 10.5 e. Naturalmente, una
proporzione risolve anche il caso della percentuale di
pagamento (e non dello sconto); ad esempio, per sapere quanto dobbiamo pagare per acquistare un abito
all’80% del suo costo di 370 e, basta impostare la proporzione: x : 370 = 80 : 100 e scoprire che x = 296
e.
Infine, le percentuali sono spesso usate per valutare
l’errore commesso in una misurazione, in una valutazione o in un conteggio approssimato. Ad esempio, se
95
3.8. MATEMATICA FINANZIARIA
di una persona alta 172 cm diciamo che è alta 170 cm,
quale errore commettiamo? Intanto, si distingue tra
errore assoluto ed errore relativo: l’errore assoluto è
il valore assoluto della differenza fra il valore reale e
quello considerato. Pertanto: Ea = |172 − 170| = 2
cm. Naturalmente, un tale errore su 172 cm è abbastanza sensibile ma non troppo; un errore di 2 cm
su 1 km è trascurabile; un errore di 2 cm su 10 cm è
enorme. Questo ci fa capire che l’errore assoluto, pur
essendo significativo, non ci dà un’idea della rilevanza
dell’errore stesso, cioè non ci dice se il valore approssimato è vicino o lontano dal valore vero. Per questo si
introduce il concetto di errore relativo, definito come
il rapporto tra l’errore assoluto e il valore vero della
quantità considerata. In altre parole: Er = Ea /qv , se
qv è il valore vero della nostra quantità. Nel caso dell’altezza abbiamo Er = 2/172 ≈ 0.0116, e questo ci
fa capire immediatamente che l’errore è abbastanza
modesto. L’errore relativo si esprime spesso in percentuale; questa è semplicemente 100×Er , e la si può
ottenere in modo diretto impostando e risolvendo la
proporzione: Ea : qv = x : 100. Se qa è il valore
approssimato di qv , abbiamo |qv − qa | : qv = x : 100
e a formula si scrive:
100|qv − qa |
= Er %.
qv
Nel caso dell’altezza, l’errore è stato dell’1.16%.
3.8
Matematica finanziaria
Un’applicazione importante delle cose dette è la Matematica finanziaria, largamente usata nel commercio, nelle banche e nella finanza. In effetti, la Matematica finanziaria è un argomento che presenta diversi caratteri interessanti. Intanto, almeno nelle parti
iniziali, è abbastanza elementare da consentire un facile approccio da parte di tutti: le operazioni coinvolte sono le quattro operazioni elementari, le potenze,
le radici e, per alcuni problemi meno comuni, i logaritmi. Questi, guarda caso, non vengono trattati
proprio in quelle scuole nelle quali la Matematica finanziaria costituisce uno dei principali argomenti di
insegnamento. In secondo luogo, la materia ha un
aggancio immediato con il mondo reale e ognuno ha
costantemente a che fare con gli interessi bancari sui
conti correnti, gli investimenti, gli sconti e gli scoperti, con le polizze o le rate dell’assicurazione e del
mutuo, e via discorrendo. In terzo luogo, specie per
quello che ci riguarda, si presta a darci l’abitudine a
fare un po’ di conti e di esercizi su vari argomenti che
abbiamo toccato, quali le conversioni di base, le proporzioni e le percentuali, le potenze e i logaritmi. A
questo proposito, è bene che, leggendo questa sezione,
ci si munisca di un calcolatore da tasca, possibilmente
in grado di eseguire potenze, radici e logaritmi.
Sicuramente, il problema più elementare è quello dell’interesse semplice. Supponiamo di avere una
certa somma, che indicheremo con C; questo ci introduce nella terminologia, piuttosto specifica, della
Matematica finanziaria. Infatti C sta per capitale, ed
è la quantità di denaro di riferimento: quanto possediamo, quanto vogliamo investire o spendere, quanto
possiamo mettere in campo. Se impieghiamo il nostro capitale C, ad esempio depositandolo in banca
sul nostro conto corrente, ci aspettiamo che, nel giro di un anno, esso aumenti. Pensiamo infatti che
la banca ottenga un guadagno finanziando imprese
con i soldi che ha raccolto da noi e da altri cittadini e che pertanto ne darà in parte anche a noi, che
abbiamo partecipato, indirettamente, al loro finanziamento. Per questo concordiamo con la banca (o,
meglio, la banca concorda con noi) un certo tasso di
interesse, indicato di regola con i o con r, cioè la frazione di capitale che costituirà il nostro guadagno.
Tale tasso di interesse è di norma considerato su base
annua e quindi, dopo un anno, noi ritroveremo il nostro capitale C più la quantità rC che è appunto ciò
che il nostro capitale ha fruttato. Di conseguenza, il
nostro capitale sarà:
C ′ = C + rC = C(1 + r).
Il tasso di interesse è dato tradizionalmente in percentuale; pertanto, un tasso del 3% significa r = 0.03.
Ad esempio, se impieghiamo 2000.00 e al 3%, dopo
un anno avremo guadagnato 2000 × 0.03 = 60.00 e e
il nostro capitale sarà 2000 × 1.03 = 2060.00 e. Naturalmente, il vantaggio che ci offre la formula precedente è quello di permetterci una facile soluzione
di problemi inversi. Ad esempio, quale somma devo
impiegare al 4.5% per avere, dopo un anno, 2000.00
e? Questa volta, il capitale C è la nostra incognita
e quindi dalla formula ricaviamo:
C = C ′ /(1 + r)
che ci dà C = 2000/1.045 = 1913.88 e. Analogamente, se vogliamo sapere a quale tasso occorre impiegare
1900.00 e per averne, dopo un anno, 2000.00, dalla
formula otteniamo:
1+r =
C′
C
ovvero
r=
C′
C′ − C
−1=
.
C
C
Nell’esempio, abbiamo r = 100/1900 = 0.0526, e cioè
il tasso deve essere del 5.26%. Questi problemi, nel
gergo commerciale e finanziario, sono noti come problemi di sconto. Supponiamo infatti di dover pagare
2000.00 e fra un anno a un nostro fornitore; trattiamo con lui e quello è disposto, se paghiamo subito, a
farci uno sconto del 4.5%; col ragionamento di sopra
96
CAPITOLO 3. NUMERI
vediamo che ce la possiamo cavare pagando (subito)
1933.88 e, e ciò ci può essere conveniente, se non abbiamo problemi finanziari. Similmente, supponiamo
che, ancora trattando con il fornitore, quello ci dica
che si accontenta di incassare 1900.00 e, se paghiamo subito (forse ha problemi di liquidità). Qual è lo
sconto che è disposto a farci? Come abbiamo visto si
tratta del 5.26%, una bella roba!
Tornando al nostro investimento, se, alla fine dell’anno, ritiriamo il nostro guadagno rC e lasciamo
il capitale C alla banca ancora per un anno, alla
fine del secondo anno avremo un nuovo guadagno
rC e quindi (se ancora non abbiamo speso niente) possiamo considerarci possessori di un capitale
C ′′ = C + rC + rC = (1 + 2r)C. Se si va avanti cosı̀
per n anni, si avrà in tutto il capitale (1+nr)C. Tanti
anni fa, quando ero ragazzo, l’interesse semplice era
presentato proprio cosı̀. Nella realtà, specie al giorno
d’oggi, le cose sono un po’ più complicate. Se mettete
un po’ di denaro in banca all’interesse r, la banca vi
richiede di partecipare alle spese (costo del personale,
delle attrezzature, e cosı̀ via) con una cifra fissa S oppure proporzionale al vostro capitale, diciamo sC. In
quest’ultimo caso, in effetti, il vero tasso di interesse
è per voi r − s; infatti, in fondo all’anno, il vostro
capitale sarà C ′ = C(1 + r) − sC = C(1 + (r − s)),
per cui dovete stare attenti che s sia abbastanza minore di r, se non volete andare a rimetterci. Occorre
ricordare, inoltre, che sul vostro guadagno dovete pagare le tasse, che oggi, inizio del terzo millennio, in
Italia, sono del 12.5%. Questo significa che il vero
tasso di interesse è r − 0, 125r = 0.875r, cosı̀ che, fatti tutti i conti, alla fine dell’anno il vostro capitale
sarà C ′ = C(1 + 0.875r − s), con un tasso di interesse
reale dato da 0.875r − s. E’ bene rendersi conto che
se la banca vi offre un tasso di interesse del 2% e le
spese assommano allo 0.5% del capitale investito, il
tasso reale è:
0.875 × 0.02 − 0.005 = 0.0125 = 1.25%.
Quindi, se dai vostri 2000.00 e pensate di ricavare
un guadagno di 2000 × 0.02 = 40.00 e, scordatevelo
e cominciate a rassegnarvi all’idea di ottenere invece
2000 × 0.0125 = 25.00 e.
Un discorso diverso va fatto se la banca vi trattiene
una cifra fissa S; ve la può trattenere all’inizio o alla
fine del periodo, cioè dell’anno. Se ve la trattiene
all’inizio (in modo anticipato) il vostro capitale finale
sarà C ′ = (C − S)(1 + r) in quanto, di fatto, voi
state impiegando un capitale decurtato delle spese
sostenute. Se invece S vi viene trattenuto alla fine del
periodo (posticipato), avrete C ′′ = C(1 + r) − S. A
parità di S, ovviamente, questa seconda soluzione vi
sarà più favorevole; altrettanto ovviamente, la banca
si trattiene sempre le spese S all’inizio dell’anno. Può
essere un utile ed interessante esercizio vedere, anche
in questo caso, cosa succede introducendo la tassa
governativa del 12.5%.
Il fatto che, convenzionalmente, il tasso di interesse sia considerato su base annua (almeno nel 90% dei
casi) fa sı̀ che occorra ritornare a ciò che abbiamo
detto sulle basi composte, quando si voglia impiegare
un capitale per alcuni mesi o per un certo numero di
giorni. Supponiamo di impiegare 2000.00 e per 9 mesi al tasso del 3% annuo. La cosa migliore è riportare
i mesi o i giorni alla frazione di anno corrispondente,
e quindi ragionare su questo numero, che è diventato un numero decimale. Nell’esempio, 9 mesi sono
9/12 di anno, cioè, eseguendo la divisione, 0.75 parti
di anno. L’interesse r viene ridotto in proporzione:
3 : 1 = x : 0.75, cioè x = 2.25, e il nostro guadagno (sempre al lordo delle spese e delle tasse) sarà
2000 × 0.0225 = 45.00 e. Quando il periodo si conta in giorni, la Matematica finanziaria introduce un
altro livello di complessità: si considera infatti un anno civile, composto convenzionalmente di 365 giorni
(anche se l’anno considerato è bisestile) e un anno
commerciale, ridotto a 360 giorni. Di fatto, le cose
cambiano di poco, ma bisogna essere coscienti di cosa
si sta facendo. Impieghiamo i nostri 2000.00 e per
215 giorni; se si usa l’anno civile, la proporzione è:
3 : 365 = x : 215, e quindi x = 1.7671233, che ci dà
un guadagno di 35.34 e. Se si usa l’anno commerciale, si ha: 3 : 360 = x : 215, cioè x = 1.7916667 con
un guadagno di 35.83 e. Per una qualche misteriosa
ragione, la banche adottano ormai sistematicamente l’anno civile nel trattamento dei conti correnti in
attivo per il cliente.
Quando dagli investimenti di un anno passiamo a
investimenti pluriennali, l’interesse semplice va bene
solo se, alla fine di ogni anno, ritiriamo gli interessi
maturati (le “cedole”) e, quindi, il capitale investito
C rimane costante nel tempo. Spesso però succede
che il capitale venga lasciato a fruttare per diversi
anni senza ritirare alcuna cifra. In questo caso, gli
interessi si accumulano al capitale o, come si dice,
reinvestiamo gli interessi stessi. Questo significa che
in fondo al primo anno, reinvestiamo per intero il
nostro capitale, che è diventato C(1 + r); se il tasso di interesse rimane r, alla fine del secondo anno
abbiamo:
C(1 + r)(1 + r) = C(1 + r)2 .
Continuando cosı̀, dopo n anni il nostro capitale sarà
diventato:
C ′ = C(1 + r)n ;
è questo il concetto, e la formula relativa,
dell’interesse composto, per il quale gli interessi si accumulano mano mano e vanno quindi ad incrementare gli interessi successivi. Quando facevo le Scuole
3.8. MATEMATICA FINANZIARIA
Elementari, all’inizio degli anni 1950, il sussidiario
non mancava di tentare il nostro stupore con questo
problema: sapete, ragazzi, quanto sarebbe diventata oggi una Lira se, al tempo di Giulio Cesare, fosse
stata messa in banca all’interesse composto dell’1%?
A quell’epoca, giravano le lire, ma ora possiamo senz’altro passare all’Euro. La risposta, che ci veniva
fornita senza spiegarci come era stata ottenuta, era:
quasi mezzo miliardo di Lire (o di Euro), una somma
davvero stratosferica. La formula precedente ci dà la
soluzione che allora ci mancava:
1 × (1.01)2000 = 431. 286. 205.72.
97
Più complicato è il caso che siano fissati il capitale
C e il montante M , e si voglia determinare il tasso
di interesse necessario a raggiungere lo scopo in un
numero di anni n assegnato. Ancora dalla formula,
si ha:
p
M = C(1 + r)n ovvero 1 + r = n M/C.
Se C = 10. 000, 00, M = 15. 000, 00 e ed n = 10 anni,
si ha:
r
√
10
10 15000
1.5 = 1.04138,
1+r =
=
10000
Oggi potremmo osservare che, a cinquant’anni di corrispondente a un tasso del 4.138%. E’ addirittura
distanza, saremmo già a:
necessario introdurre ed utilizzare i logaritmi quando
2050
.
.
siano assegnati capitale, montante e tasso d’interesse,
1.01
= 722 464 071.72,
e si voglia determinare il numero n di anni necessari
che mette bene in evidenza la crescita esponenziale a raggiungere il montante M impiegando al tasso r il
(n, il numero di anni, si trova all’esponente) del no- capitale iniziale C. La formula M = C(1 + r)n ci dà:
stro capitale, impiegato all’interesse composto. Viceversa, se avessimo impiegato la Lira o l’Euro iniziale
n = log1+r M/C = log1+r M − log1+r C.
all’interesse semplice, oggi avremmo:
Purtroppo, il calcolatore non dà direttamente il lo1 × (1 + 2050 × 0.01) = 21.50
garitmo in base 1 + r; di solito fornisce il logaritmo
Lire (o Euro), una cifra del tutto insignificante, do- naturale, che però vedremo nel Capitolo 8, e il logavuta alla crescita lineare del capitale: in questo ca- ritmo decimale. Come sappiamo, si ha: log1+r x =
so, il numero degli anni n sta a moltiplicare il tasso log10 x/ log10 (1 + r), e questo riporta tutto al calcolo
.
d’interesse. Proprio per questo modo di crescere, il dei logaritmi decimali. Se abbiamo M = 15 000, 00,
.
′
C
=
10
000,
00
e
ed
r
=
2.50%,
si
ha
M/C
= 1.5,
capitale risultante C dall’interesse composto si dice
log
1.5
=
0.17609126
e
log
1.025
=
0,
01072387,
montante, cioè che monta, che cresce.
10
10
Problemi più concreti riguardano investimenti plu- per cui n = 16.42. Occorrono pertanto 16 anni e
riennali. Anche in questo caso, se astraiamo dalle spe- 42/100 di anno; per riportare questa frazione a giorse e dalle tasse, un capitale di 2000.00 e, impiegato ni secondo l’anno civile, si imposta la proporzione:
42 : 100 = x : 365, e da questa si ricava x ≈ 153.
al 3% annuo per 7 anni, ammonterà a:
Il tempo richiesto è perciò di 16 anni e 153 giorni,
2000 × 1.037 = 2459.75e.
ovvero, se preferiamo, 16 anni e 5 mesi. Tutto arriva
La formula, come nel caso dell’interesse semplice, per- per chi sa aspettare.
L’interesse composto richiede un pizzico d’attenmette di risolvere anche i problemi inversi. Ad esemzione
quando, dalla base annua, lo si voglia portare a
pio, ci possiamo chiedere qual è il capitale C che
una
base
frazionaria, come il semestre, il trimestre, il
dobbiamo impiegare al 2.50% per avere, dopo 10 an.
mese
o
addirittura
il giorno. Ad esempio, un interesse
ni, 20 000, 00 e; la formula ci dice che deve essere
10
annuo
del
4%
non
è un interesse composto semestra20000 = C×1.025 , cioè C = 20000/1.28 = 15623.97
le
del
2%,
come
si
potrebbe pensare e come talvolta
e. Come nel caso dell’interesse semplice, questo può
si
assume
per
semplicità.
Secondo la regola generale,
essere visto come un problema di sconto; nella realtà,
poiché
un
semestre
è
la
metà
di un anno, il capitale
tuttavia, è raro avere pagamenti dilazionati per più di
√ al′
1/2
1+r
la
fine
del
semestre
sarà:
C
=
C(1+r)
=
C
un anno. Ha senso invece porsi come obiettivo quello
√
1
+
r.
Facendo
i
calcoli
nel
caso
e
il
tasso
sarà
1
−
di arrivare ad avere un montante M nel giro di n an√
di
r
=
4%,
si
ha
1
−
1.04
=
0.0198,
cioè
1.98%,
che
ni, impiegando una certa somma a un interesse noto.
è
un
po’
più
basso
del
2%
ipotizzato.
Si
osservi
che,
Allora, la cifra C di partenza si dice il valore attuale
del montante M . Ad esempio, qual è il valore attuale sempre considerando un tasso del 4% su base annua,
di un montante di 10. 000, 00 e scadente fra 5 anni e si ha:
√
78 giorni, al 3%? Usando l’anno civile, 78 giorni cor3
1.04 = 1.316%
base quadrimestrale 1 − √
rispondono a 78/365 = 0.2137 parti di anno, e quindi
4
base trimestrale
1 − √1.04 = 0.985%
dalla formula ricaviamo:
6
base bimestrale
1− √
1.04 = 0.656%
5.2137
12
10000 = C × 1.03
ovvero C = 8571.77e.
base mensile
1 − 1.04 = 0.327%
98
CAPITOLO 3. NUMERI
Chiaramente, il tasso cosı̀ calcolato è sempre inferiore
al tasso “ingenuo” ottenuto dividendo r per la periodicità: infatti gli interessi si accumulano col passare
del tempo. Ad esempio, se comprate dei BOT a tre
mesi, il tasso viene calcolato cosı̀, poiché si suppone
che, finito il periodo, reinvestiate il ricavato.
Affrontiamo, come conclusione di queste note sulla
Matematica Finanziaria, un problema classico e non
del tutto banale. Se volete comprar casa, molto probabilmente avrete necessità di fare un mutuo, cioè di
chiedere soldi in prestito a una Banca per pagare l’attuale proprietario, il notaio, le tasse e quanto altro sia
necessario. Se C è la cifra che desiderate, la Banca
sarà disposta a prestarvelo mettendo un’ipoteca sulla casa e chiedendovi un “ragionevole” interesse. La
Banca vi fornisce la somma C comprensiva delle spese dell’operazione fra voi e la Banca stessa, e voi vi
impegnate a restituire a rate, in un certo periodo di
anni, la somma e gli interessi. Questo significa, prima
di tutto, che la Banca vi fornirà una cifra C ′ < C,
essendo C − C ′ il costo dell’operazione; d’altra parte,
poiché C è comunque la somma che dovete restituire,
c’è il problema del calcolo degli interessi. Poiché restituite la cifra a rate, di solito semestrali, alla prima
rata avrete già accumulato gli interessi dei primi sei
mesi. Alla fine dei secondi sei mesi avrete accumulato
altri interessi da restituire, ma solo sulla cifra precedente diminuita della rata pagata alla fine dei primi
sei mesi. Chiamiamo allora Ck la quantità di danaro
da restituire alla fine del k-esimo periodo di sei mesi;
in particolare, sarà C0 = C il capitale (si fa per dire)
iniziale.
Le modalità di restituzione possono essere varie,
ma di solito si riducono a due: a rate fisse e a rate
variabili. Quest’ultima modalità prevede come regola
un adeguamento del tasso di interesse a quello praticato dalla Banca al momento della rata; ciò implica
un ricalcolo semestrale della rata da pagare, che sarà
più alta se il tasso corrente cresce e sarà più bassa se
il tasso decresce. Più interessante, almeno dal punto
di vista matematico, è l’altro caso; la Banca fissa per
gli anni di restituzione un tasso annuo r (di regola
più alto di quello corrente) e calcola le rate, di importo costante x, secondo tale tasso. Vediamo come
si esegue il calcolo.
Alla fine del primo periodo (che per fissare le idee
e seguendo l’uso stabiliamo essere un semestre), il
capitale iniziale C0 sarà cresciuto secondo il tasso di
interesse a C0 (1 + r/2), ma pagando la rate x ci si
riporta a un nuovo capitale:
³
r´
C1 = C0 1 +
− x.
2
Si riparte cosı̀ per il secondo periodo di sei mesi con
C1 e un ragionamento analogo ci porta a un capitale
da restituire dopo il secondo pagamento pari a:
³
³
³
r´
r´
r ´2
C2 = C1 1 +
−x 1 +
−x = C0 1 +
−x.
2
2
2
Alla fine dei successivi sei mesi il capitale da restituire
sarà:
³
r´
C3 = C2 1 +
−x=
2
³
³
³
r ´2
r´
r ´3
−x 1+
−x 1+
− x.
= C0 1 +
2
2
2
Cosı̀ continuando, alla fine dei 2n periodi semestrali
corrispondenti alla durata del prestito, si arriva a:
³
r´
C2n = C2n−1 1 +
−x=
2
³
³
³
r ´2n
r ´2n−1
r´
= C0 1 +
−x.
−x 1 +
−· · ·−x 1 +
2
2
2
Poiché a questo punto il prestito deve risultare restituito completamente, occorre che sia C2n = 0, e
questo ci permette di calcolare il valore di x. La
precedente equazione si scrive infatti:
³
r ´2n
=
C0 1 +
2
¶
µ³
r ´2n−2
r ´2n−1 ³
+ 1+
+ ··· + 1 .
=x 1+
2
2
L’espressione compresa nelle ultime due parentesi è
una progressione geometrica di ragione 1 + r/2 e
quindi sappiamo come calcolarla:
³
(1 + r/2)2n − 1
r ´2n
=x
C0 1 +
2
1 + r/2 − 1
e da questo si ricava il valore della rata:
x=
C0 (1 + r/2)2n r/2
.
(1 + r/2)2n − 1
Facciamo un esempio, per renderci conto di ciò che
può dare questa formula. Se avete bisogno di 50. 000
e (la Banca, per quanto detto, vi darà un po’ di
meno, trattenendo le sue spese) e riuscite ad avere
un tasso fisso del 6% per restituire il tutto in 15 anni,
la rata sarà:
x=
0.03 × 50000 × 1.0330
≈ 2550.96.
1.0330 − 1
Dovete quindi prepararvi a dare alla banca questa
cifra ogni sei mesi (più di 400 e al mese da risparmiare). Alla fine dei 15 anni avrete restituito più di
76. 528 e, cioè avrete pagato per interessi ben 26. 528
e, ma questo, si sa, fa parte del gioco, anche se ne è
la parte meno piacevole.
Capitolo 4
Matematiche finite
Mi pareva che il calcolo in se stesso servisse
molto poco e non avesse affatto quell’importanza che molti giocatori gli attribuiscono. Essi
se ne stanno seduti davanti a foglietti di carta rigata, segnano i colpi, contano, deducono
le probabilità, fanno calcoli e infine puntano e
perdono come noi, semplici mortali, che giochiamo senza calcoli. In compenso ho tratto
una conclusione che mi pare giusta: realmente,
nel susseguirsi delle probabilità favorevoli c’è, se
non un sistema, un certo quale ordine, il che è,
naturalmente, molto strano.
F. Dostoevskij Il giocatore
Il calcolo combinatorio è la parte della Matematica
che conosco un po’ meglio, poiché è in questo settore, applicato all’Informatica, che lavoro e pubblico i
miei articoli. Per questo motivo, voglio rifarmi alle
parole di un vero matematico per presentare l’argomento. Jean Dieudonné è uno, se non il primo, dei
matematici reali che costituiscono il matematico virtuale Nicolas Bourbaki, la cui opera, a partire dal
1935, è riuscita a sistematizzare grande parte della
Matematica attuale, attraverso il concetto di “struttura” e mediante un formalismo molto spinto. Alla
metà degli anni 1980, Dieudonné ha scritto un libro
di divulgazione matematica che intitolò “Pour l’honneur de l’esprit humaine”; nella presentazione di uno
schema dei vari settori della Matematica moderna,
dedica alla Combinatoria le seguenti parole, che cito
dalla traduzione italiana “L’arte dei numeri” a pagina
143:
“Inizialmente si può dire che ciò che si indica con
questo nome [la Combinatoria] costituiva una parte
della teoria degli insiemi, cioè la teoria degli insiemi
finiti, e i problemi relativi alla valutazione del numero di elementi di insiemi di questo tipo costruiti
mediante procedimenti diversi; alcuni di questi problemi risalgono all’antichità, per esempio il numero
delle coppie di elementi di un insieme di n elementi,
uguale ad n(n − 1)/2; [. . .] un altro esempio [è] il calcolo del numero n! delle permutazioni di un insieme
di n elementi.”
“I metodi collegati a questi problemi sono stati a
99
lungo considerati di scarso interesse da molti matematici, che li collocavano volentieri nel settore che
prende il nome di ‘giochi matematici’, a cui sono
appassionati molti lettori di divulgazione scientifica.
Ma nel volgere di poche dozzine d’anni la situazione è
notevolmente cambiata: ci si è accorti che certi metodi ‘combinatori’ potevano avere importanti applicazioni in settori della Matematica del tutto ‘rispettabili’, come la teoria dei gruppi, la teoria delle algebre
di Lie, la geometria algebrica e la topologia algebrica; sono stati utilizzati con successo perfino in varie
applicazioni della Matematica, tra cui l’Informatica.”
La Combinatoria o Analisi Combinatoria, o anche
Calcolo Combinatorio, è, come dice Dieudonné, lo
studio delle proprietà degli insiemi finiti. Pertanto,
problemi combinatori vengono fuori ogni volta che
consideriamo insiemi e strutture finite, per le quali
essere composte da un numero finito di oggetti è essenziale; vedremo, come esempi, la schedina del totocalcio o il gioco del lotto. Se le partite della schedina
fossero infinite o fossero infiniti i numeri del lotto, tali
giochi non esisterebbero nemmeno oppure nessuno li
prenderebbe in considerazione. Ma, come dice ancora
Dieudonné, l’ambito dell’Analisi Combinatoria è ben
più ampio di quello dei giochi; un’applicazione molto
importante è legata al Calcolo delle Probabilità, almeno nelle impostazioni insiemistica e frequentistica.
Per questo, dedicheremo parte del Capitolo alle nozioni di base del Calcolo delle Probabilità, lasciando
al lettore il problema di approfondire (quando sarà il
momento) quegli aspetti legati alla Teoria della Misura e che possono essere affrontati solo dopo aver
studiato il Calcolo Integrale.
4.1
Calcolo combinatorio
Il problema più semplice dell’analisi combinatoria è
certamente quello di contare gli elementi di un insieme, e su questo abbiamo discusso in abbondanza
al momento opportuno. Vediamo pertanto problemi un po’ più complessi. Sia A = {a1 , a2 , . . . , an }
un insieme di n elementi e consideriamo le possibi-
100
li sequenze di elementi di A, cioè le parole su A,
come abbiamo visto nella Sezione 1.8. Ad esempio, se A = {a, b, c} le sequenze di lunghezza 2 sono [a, a], [a, b], [a, c], [b, a], [b, b], [b, c], [c, a], [c, b], [c, c],
cioè 9 in tutto. E’ facile vedere che le sequenze
di lunghezza 3 sono 27 e quelle di lunghezza 4, 81.
Possiamo anche osservare che le sequenze di elementi di A di lunghezza 1 sono esattamente n, essendo
in corrispondenza biunivoca con gli elementi di A:
[a1 ], [a2 ], . . . , [an ]. L’unica sequenza di lunghezza 0 è
la sequenza vuota [ ] e quindi in generale abbiamo:
CAPITOLO 4. MATEMATICHE FINITE
stinti di A; di nuovo, se A = {a, b, c}, tali sequenze di lunghezza k, dette disposizioni a k a k, per
k = 2 sono: [a, b], [a, c], [b, a], [b, c], [c, a], [c, b], poiché
nessun elemento può essere ripetuto. Dette Dn,k le
disposizioni a k a k, è facile dimostrare:
Teorema 4.2 Se A è un insieme di n elementi, le
disposizioni a k a k di tali elementi sono: Dn,k =
n(n − 1) · · · (n − k + 1).
Prova: Il primo elemento della sequenza può essere
uno qualsiasi degli n elementi dell’insieme. Il secondo elemento può essere uno degli n elementi, escluso
Teorema 4.1 Il numero delle sequenze di lunghezza quello che ha occupato la prima posizione: quindi vi
m degli elementi di un insieme A di cardinalità n è sono n(n − 1) possibili sequenze di 2 elementi, o diesattamente nm .
sposizioni a 2 a 2. Analogamente, il terzo elemento
Prova: I due casi m = 0 ed m = 1 sono stati vi- può essere uno qualsiasi degli n elementi di A eccetsti in precedenza; se m > 1, nella prima posizione to i due che hanno occupato i primi due posti: si
della sequenza possiamo mettere uno qualsiasi degli hanno quindi n(n − 1)(n − 2) disposizioni a 3 a 3.
n elementi; indipendentemente da questa, nella se- Continuando, si ottiene la formula desiderata.
conda posizione possiamo ancora inserire uno degli
E’ chiaro che disposizioni con più di n elementi
n elementi ottenendo cosı̀ n2 sequenze di 2 elementi. non sono possibili; le disposizioni ad n ad n hanno
Come terzo elemento possiamo inserire uno degli n un interesse particolare e si dicono permutazioni. Ad
elementi ottenendo n3 sequenze di 3 elementi, e cosı̀ esempio, le permutazioni di un insieme con 3 elementi
via fino ad m. Naturalmente, questa dimostrazione sono: [a, b, c], [a, c, b], [b, a, c], [b, c, a], [c, a, b], [c, b, a] e
potrebbe espremersi in modo più formale usando il dalla formula si ha D3,3 = 3×2×1 = 6. L’insieme delprincipio di induzione, ma accontentiamoci di quanto le permutazioni di un insieme di n elementi si indica
detto.
con Pn e il numero dei suoi elementi è n(n−1) · · · 2·1;
per
la sua importanza, questo numero che abbiamo
Questo teorema permette di risolvere qualche progià
introdotto
ha una speciale notazione: esso si inblema pratico di tipo elementare. Ad esempio, quante
dica
con
il
simbolo
n! che si legge “n fattoriale”. Un
sono le possibili schedine del Totocalcio? Una schesemplice
esempio
è
costituito dai possibili anagramdina può essere vista come una sequenza di lunghezmi
della
parola
spero;
come sequenza di 5 lettere, si
za 13 dell’insieme {1, X, 2} e quindi il teorema ci dà
hanno
5!
=
120
permutazioni;
di queste, alcune come
13
.
.
come numero complessivo 3 = 1 594 323. Questo
spore,
preso,
perso
hanno
un
senso compiuto; alsignifica che se avessimo a disposizione tanto denatre,
come
eoprs
e
reops
sono
semplici
accostamenti
ro da poter giocare tutto questo milione e mezzo di
di
lettere.
schedine saremmo sicuri di fare un 13 e tredici 12.
Per definizione si ha 1! = 1 e per convenzione si
Naturalmente, il numero 13 è stato scelto in modo da
pone
0! = 1. I fattoriali crescono molto rapidamente,
non rendere conveniente una strategia del genere.
come
si vede dalla seguente tabella:
Questo è un caso molto semplice; talvolta il ragionamento può essere più complesso. Ad esempio, ci
possiamo chiedere quanti sono i possibili sottoinsiemi
di un insieme di n elementi. Usiamo per questo il
concetto di funzione caratteristica, già introdotto nel
Capitolo 1. Ad ogni sottoinsieme possiamo associare
una sequenza di lunghezza n composta da 0 ed 1 con
questa proprietà: se A = {a1 , a2 , . . . , an } e B ⊆ A, il
j-esimo elemento della sequenza corrispondente a B
è 1 se e solo se aj ∈ B (altrimenti, questo elemento
è 0). Ad esempio, se A = {a, b, c, d} e B = {a, c},
abbiamo la sequenza χB = [1, 0, 1, 0], e se B = ∅
abbiamo χB = [0, 0, 0, 0]. Si vede allora che i sottoinsiemi sono tanti quanti queste sequenze, che per
il teorema precedente sono esattamente 2n .
Un problema diverso, anche se analogo, è quello di contare le sequenze ottenute con elementi di-
1!
2!
3!
4!
5!
1
2
6
24
120
6!
7!
8!
9!
10!
720
5040
40320
362880
3628800
Si veda la Sezione 1.5 per il valore esatto di 100!; si
veda anche la nota alla fine di questa sezione per il
valore approssimato di n!.
Il concetto più importante dell’analisi combinatoria
è tuttavia quello di “combinazione”. Sia A un insieme
di n elementi; si dicono combinazioni a k a k degli elementi di A i sottoinsiemi di A contenenti esattamente
k elementi. Ad esempio, se A = {a, b, c}, le combinazioni a 2 a 2 sono i sottoinsiemi {a, b}, {a, c}, {b, c}.
Le combinazioni differiscono dalle disposizioni per il
101
4.1. CALCOLO COMBINATORIO
semplice fatto che le prime non tengono conto dell’ordine; cosı̀ abbiamo le disposizioni [a, b] e [b, a], ma
solo la combinazione {a, b}. Questo ci dà un semplice
metodo per contare quante sono le combinazioni a k
a k di un insieme di n elementi:
Teorema 4.3 Se A è un insieme di n elementi, i
sottoinsiemi di A contenenti esattamente k elementi
sono:
n(n − 1) · · · (n − k + 1)
.
Cn,k =
k!
Prova: Se Cn,k sono le combinazioni che dobbiamo contare, si osservi, come s’è fatto, che ad ogni
combinazione corrispondono più disposizioni; in effetti, da una combinazione si ottengono disposizioni
permutando in tutti i modi possibili gli elementi del
sottoinsieme. Ma se il sottoinsieme ha k elementi,
le sue possibili permutazioni sono k! e quindi si ha:
k!Cn,k = Dn,k . Da questa si ha la formula desiderata,
quando si sostituisca a Dn,k il valore precedentemente
trovato.
I numeri Cn,k si dicono coefficienti binomiali perché legati alle potenze di un binomio, come vedremo nella Sezione 5.1. Esiste una notazione accettata
universalmente:
µ ¶
n
n(n − 1) · · · (n − k + 1)
=
Cn,k =
k!
k
0
1
2
3
4
5
6
0
1
1
1
1
1
1
1
1
2
3
4
5 6
1
2
3
4
5
6
1
3
6
10
15
1
4
10
20
1
5
15
1
6 1
Tabella 4.1: Il triangolo aritmetico
Europa e nel mondo arabo. Sicuramente, i coefficienti binomiali sono le quantità più utilizzate in tutta
la Matematica, in quanto legati alla numerazione dei
sottoinsiemi di un insieme.
Come si costruisce il triangolo aritmetico? Intanto osserviamo che la prima colonna e la diagonale
principale sono composte unicamente da 1:
µ ¶
µ ¶
n
n
=1
∀n ∈ N.
=1
n
0
Infatti, il primo di questi coefficienti binomiali conta
i sottoinsiemi di 0 elementi di un insieme di n elementi, ma tale è solo l’insieme vuoto (anche quando
n = 0). Per il secondo, si osserva invece che l’unico
sottoinsieme di n elementi di un insieme di n elementi
è l’insieme stesso. Detto questo, ogni altro elemenche si legge “n su k”. Un semplice problema consiste to del triangolo è la somma dei due elementi che lo
nel contare quanti ambi e quanti terni esistono nel sovrastano: quello nella riga precedente una posiziogioco del lotto; gli ambi sono i sottoinsiemi di due ne a sinistra e quello, ancora nella riga precedente,
elementi dell’insieme dei primi 90 numeri; i terni sono ma proprio sopra di lui. Questo fatto si può dimoi sottoinsiemi di tre elementi. Quindi gli ambi sono: strare facilmente; qui ne diamo una prova combinatoria, cioè che fa uso della definizione dei coefficienti
µ ¶
90 × 89
90
binomiali come sottoinsiemi. Più avanti ne vedre=
= 4005
2
2×1
mo una dimostrazione algebrica, che cioè fa uso delle
proprietà numeriche dei coefficienti binomiali.
e i terni:
µ ¶
Teorema 4.4 Se n e k sono due interi positivi, si
90
90 × 89 × 88
= 117. 480.
=
ha:
µ ¶ µ
¶ µ
¶
3×2×1
3
n
n−1
n−1
=
+
.
k
k
k−1
Poiché su una ruota (ad esempio, Napoli) vengono
estratti 5 numeri, questi corrispondono a:
Prova: Prima di cominciare la dimostrazione, si sia
µ ¶
µ ¶
certi di aver capito che questa identità corrisponde
5
5
= 10 ambi e a
= 10 terni diversi.
alla proprietà del triangolo aritmetico enunciata più
2
3
sopra. Si consideri allora un insieme A di n elemenI coefficienti binomiali si possono disporre in un ti e se ne isoli un elemento particolare, diciamo a.
triangolo numerico infinito, noto come Triangolo di I sottoinsiemi di ¡A¢ composti di k elementi (che per
Tartaglia o triangolo di Pascal, o, per antonomasia, definizione sono nk ) si dividono in due classi: quelcome triangolo aritmetico (si veda la Tabella 4.1). li che contengono a e quelli che non lo contengono.
Tartaglia lo aveva scoperto nella prima metà del 1500; Sono due classi chiaramente disgiunte e che esauriPascal l’aveva riscoperto intorno al 1650, quando si scono tutti i sottoinsiemi considerati; basta allora diinteressava alle prime ricerche sul calcolo delle pro- mostrare che le loro cardinalità sono proprio quelle
babilità. In realtà, esso era già noto ai cinesi del che formano il membro destro della formula dell’e1200 e se ne possono trovare anticipazioni anche in nunciato. Consideriamo la classe A1 dei sottoinsiemi
102
CAPITOLO 4. MATEMATICHE FINITE
che contengono a e immaginiamo di togliere a da A e denominatore per (n − k)!, si ha:
e da questi sottoinsiemi: ciò che si ottiene sono i sotµ ¶
n
n(n − 1) · · · (n − k + 1)
toinsiemi di k − 1 elementi dell’insieme A \ {a}, un
=
=
k
k!
insieme di n−1 elementi (è facile vedere che sono proprio tutti:
¡ basta
¢ aggiungere di nuovo a); quindi A1
n(n − 1) · · · (n − k + 1) (n − k) · · · 2 · 1
=
=
contiene n−1
k−1 elementi. Per la classe A2 dei sottoink!
(n − k) · · · 2 · 1
siemi che non contengono a, eliminare a da A vuol
n!
dire ottenere i sottoinsiemi di k elementi dell’insieme
¡
¢
(4.1)
=
A \ {a} di n − 1 elementi; questi sono in tutto n−1
,
k!(n
− k)!
k
e il teorema è dimostrato.
e questo permette di esprimere i coefficienti binomiali
in termini del solo fattoriale. Da questo discende la
Nota 4.1
Un problema che avevamo lasciato vo- proprietà di simmetria:
lutamente in sospeso è il seguente: se si ha una parola
formata da n lettere diverse, i suoi anagrammi sono
n!, ma se la parola contiene alcune lettere uguali? Ad
esempio, con non si possono comporre solamente onn
e nno, cioè vi sono in tutto tre possibilità contro le sei
di ahi e di mio. E se volessimo sapere quanti sono gli
anagrammi di abracadabra?. Vale il seguente:
Teorema 4.5 Sia A = {a1 , a2 , . . . , an } un insieme di
n elementi e si considerino k1 repliche di a1 , k2 repliche di a2 , . . . , kn repliche di an . Il numero delle
sequenze distinte che si possono formare utilizzando
tutte queste repliche degli elementi di A è:
(k1 + k2 + · · · + kn )!
.
k1 ! k2 ! · · · kn !
Prova: Cominciamo col distinguere le varie repliche
degli elementi di A, di modo che ci appaiano come elementi distinti. In questo caso le sequenze distinte che
si ottengono sono le permutazioni di tutti gli elementi
(con le loro repliche), cioè sono (k1 + k2 + · · · + kn )!.
Eliminiamo ora la distinzione tra le varie repliche di
a1 ; questo significa che tutte le sequenza distinte perché avevano repliche distinte di a1 nelle stesse posizioni, collassano nella medesima sequenza; ma tali sequenze si distinguono solo per l’ordine assunto dalle
k1 repliche di a1 e quindi sono k1 !. Questo vuol dire che, togliendo la distinzione tra le repliche di a1 ,
si hanno (k1 + k2 + · · · + kn )!/k1 ! sequenze. Procedendo nello stesso modo per le repliche di a2 si passa
a (k1 + k2 + · · · + kn )!/(k1 ! k2 !) sequenze. Alla fine,
naturalmente, si ottiene la formula desiderata.
Nel caso di abracadabra si hanno 5 repliche di a, 2
repliche di b e di r, 1 replica di c e di d; naturalmente,
k1 + k2 + · · · + kn è la lunghezza della parola e quindi
i possibili anagrammi sono:
Teorema 4.6 Per ogni valore di n e k ≤ n si ha:
¶ µ ¶
µ
n
n
.
=
k
n−k
Prova: Passando alla espressione con i fattoriali, si
ha:
¶
µ
n!
n
=
=
n−k
(n − k)!(n − (n − k))!
µ ¶
n
n!
=
=
(n − k)!k!
k
come si voleva.
Questa proprietà
¡ ¢ è interessante perché, ad esempio,
per calcolare 20
17 dalla definizione occorre eseguire 32
prodotti, o addirittura 40 se applichiamo la formula
(4.1). Ma per la simmetria si ha:
µ ¶ µ ¶
20
20 · 19 · 18
20
=
=
= 1140.
3
17
6
Si osservino i seguenti casi particolari:
µ ¶
µ
¶
n
n
=n
=n
1
n−1
¶
µ
µ ¶
n
n(n − 1)
n
.
=
=
n−2
2
2
La dimostrazione algebrica del Teorema 4.4 è ora
semplice, anche se richiede un po’ di attenzione poiché si tratta di aggiungere e togliere fattori da certe
frazioni:
µ
¶ µ
¶
n−1
n−1
(n − 1) · · · (n − k + 1)
+
+
=
(k − 1)!
k−1
k
(n − 1) · · · (n − k + 1)(n − k)
;
k!
moltiplichiamo e dividiamo la prima frazione per k,
la maggior parte dei quali non ha nessun senso ottenendo k! a denominatore. Le due espressioni sono
compiuto.
ora uguali eccetto per un fattore k nella prima e un
fattore (n − k) nella seconda; ma la somma è proprio
n, per cui:
¶
¶ µ
µ
Alcune proprietà dei coefficienti binomiali sono den−1
n−1
=
+
gne d’attenzione. Intanto, moltiplicando numeratore
k
k−1
11!
= 83160,
5! 2! 1! 1! 2!
+
103
4.2. PERMUTAZIONI
(k + n − k)(n − 1) · · · (n − k + 1)
=
=
k!
Un’altra proprietà è:
µ ¶
n
.
k
Teorema 4.7 Per ogni valore di n e k ≤ n si ha:
µ
¶
µ ¶
n
n n−1
=
k k−1
k
Questa formula si prova in modo quasi immediato,
una volta accettata l’approssimazione di Stirling e
pertanto lasciamo la dimostrazione alla buona volontà
del lettore.
4.2
Permutazioni
Prova: Applicando la definizione:
µ ¶
n
n(n − 1) · · · (n − k + 1)
=
=
k
k!
Le permutazioni, che abbiamo introdotto nella precedente sezione, meritano un’attenzione speciale, e ad
esse dedicheremo ora un po’ di spazio. Permutare
gli elementi dell’insieme {a, b, c} o quelli dell’insieme {1, 2, 3} è la stessa cosa, una volta che abbiamo
n (n − 1) · · · (n − k + 1)
=
identificato, ad esempio, a con 1, b con 2 e c con 3.
k
(k − 1)!
Pertanto, d’ora in avanti, salvo avviso contrario, concome desiderato.
sidereremo l’insieme di n elementi Nn = {1, 2, · · · , n}
e
le permutazioni su di esso. La classe di tutte le
Questa formula fornisce un metodo efficiente per calpermutazioni
di tale insieme si indica con Pn ; le percolare i coefficienti binomiali mediante il calcolatore.
mutazioni
stesse
hanno varie notazioni, delle quali è
Si ha infatti:
bene conoscere le tre principali.
Algoritmo 4.1 (Coefficienti binomiali)
Osserviamo prima di tutto che l’aver definito le perIngresso: due numeri naturali n,¡k ¢con n ≥ k;
mutazioni per mezzo delle disposizioni dà immediaUscita: il coefficiente binomiale nk .
tamente un ovvio modo di scriverle: in testa il primo
1. se k > n/2 si pone k := n − k [si applica la elemento scelto, poi il secondo e cosı̀ via. Si ottiene cosı̀ una lista, nella quale l’ordine degli elementi
proprietà di simmetria];
è essenziale, perché indica l’ordine di scelta. Pertan2. se k = 0 si esce col risultato 1;
to, (3, 2, 1) è una permutazione diversa da (2, 1, 3) e
da (1, 3, 2); come si vede, gli elementi si raggruppa3. altrimenti, si pone m := n, h := k ed r := 1 e no tra parentesi tonde, ed in effetti una permutazioquindi:
ne cosı̀ scritta è una n-upla o un vettore, e il modo
di
rappresentarla si dice notazione vettoriale. Le sei
(a) si calcola r := r · m/h;
permutazioni di P3 si denotano:
(b) si diminuiscono m ed h di 1;
(c) se h 6= 0 si cicla tornando al punto 3a;
4. si esce col valore r = Cn,k .
(1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1).
Si osservi che per scrivere sistematicamente tutte
le
permutazioni di Pn si può fissare il primo elemenI coefficienti binomiali che richiedono più temto,
facendolo variare da 1 ad n, e scrivendogli accanto
po per il calcolo
¡2n¢sono i cosiddetti coefficienti bino- tutte le permutazioni degli altri n − 1 elementi, che
miali centrali n ; infatti, per essi la proprietà di
(tenendo presente l’elemento messo in prima posiziosimmetria non fornisce alcun aiuto.
ne) si ottengono esattamente nella stessa maniera. In
Nota 4.2
Verso il 1730 il matematico inglese Ja- questo modo abbiamo scritto le permutazioni di P3 e
mes Stirling trovò una formula approssimata per invitiamo il lettore a fare lo stesso per le 24 permutan!:
³ n ´n
zioni di P4 . La notazione vettoriale è particolarmente
√
n! ≈ 2πn
utile quando si trattano le permutazioni con l’elaboe
dove e = 2.7182818284 . . . è la base dei logaritmi na- ratore, dove i vettori sono una “struttura dati” molto
turali. Ad esempio, per n = 10 il valore vero è quello semplice da definire ed utilizzare. Essa, tuttavia, non
visibile nella precedente tabella sui fattoriali, mentre è la notazione preferita dai matematici.
la formula di Stirling dà: 3. 598. 695.62, con un erroUn attimo di riflessione ci fa capire che una permure dello 0.84%. Purtroppo, la dimostrazione di questa tazione è una funzione di Nn con sé stesso: scegliere
formula famosissima va al di là della struttura elemen- un primo elemento vuol dire associare al numero 1
tare di questo testo. La formula di Stirling ci permet- proprio quell’elemento; scegliere un secondo elemente di trovare un valore approssimato per i coefficienti
to significa associare tale elemento al numero 2, e
binomiali centrali:
cosı̀ di seguito. Abbiamo visto che tutte le funzioni
à !
(2n)!
4n
2n
Nn → Nn sono nn , mentre le permutazioni non sono
≈ √ .
=
n!2
n
proprio tutte le funzioni, poiché le immagini devono
πn
104
essere tutte differenti; questo ci dice che n! ≤ nn (in
effetti, per n > 2 si ha n! < nn ). Ma a quali funzioni
corrispondono le permutazioni? Il fatto che le immagini debbano essere tutte diverse ci dice che siamo
di fronte a funzioni iniettive; poiché poi, per costruzione, una permutazione prende tutti gli elementi del
suo codominio Nn , le funzioni sono anche surgettive.
Concludendo, le permutazioni di Nn sono tutte e sole
le corrispondenze biunivoche di Nn .
Questa è la definizione preferita dai matematici ed
essa ci porta immediatamente a un altro tipo di notazione: la notazione funzionale. Si scrivono i numeri
da 1 ad n su una riga e, sotto ad ognuno di essi, si
scrive l’elemento corrispondente nella permutazione,
cioè l’immagine nella corrispondenza biunivoca. Le 6
permutazioni di P3 sono:
µ
¶ µ
¶ µ
¶
1 2 3
1 2 3
1 2 3
1 2 3
1 3 2
2 1 3
µ
¶ µ
¶ µ
¶
1 2 3
1 2 3
1 2 3
.
2 3 1
3 1 2
3 2 1
Per scrivere le permutazioni, c’è ancora un altro
modo che fa furore in Matematica. Prendiamo l’ultima delle sei permutazioni e partiamo dal numero 1; la
sua immagine è il 3, e l’immagine di questo è ancora
1. Con un modo di dire caratteristico, ciò si esprime
cosı̀: l’1 va nel 3 e il 3 va nell’1. Se prendiamo una
permutazione di P8 :
µ
¶
1 2 3 4 5 6 7 8
5 4 8 6 3 2 1 7
abbiamo una catena più lunga: l’1 va nel 5, il 5 va
nel 3, il 3 va nell’8, l’8 va nel 7, e infine il 7 va (o
torna) nell’1. Una catena siffatta si dice tecnicamente un ciclo, e in questa permutazione ne troviamo un
secondo, composto da 2, 4 e 6. Un ciclo si può ridurre
a un elemento solo, come il 2 nell’ultima permutazione di P3 ; in questo caso l’elemento si dice un punto
fisso della permutazione. Dovrebbe essere chiaro che
una permutazione è composta sempre da un numero
finito di cicli, e due cicli, o contengono gli stessi elementi o sono disgiunti tra di loro. Questo permette
di definire una notazione a cicli per le permutazioni:
ogni ciclo si scrive tra parentesi tonde, a partire dall’elemento più piccolo. La precedente permutazione
di P8 viene denotata come (1 5 3 8 7) (2 4 6) e le
solite permutazioni di P3 sono:
(1)(2)(3), (1)(2 3), (1 2)(3), (1 2 3), (1 3 2), (1 3)(2).
I punti fissi spesso non si scrivono; l’unica eccezione è
la permutazione composta di tutti punti fissi; essa si
scrive semplicemente (1), ignorando gli altri elementi. Si osservi che, per convenzione, la separazione fra
due elementi di un ciclo è data da uno spazio bianco;
CAPITOLO 4. MATEMATICHE FINITE
questo infatti permette di distinguere la permutazione (1 3 2), formata da un unico ciclo, dalla notazione
vettoriale (1, 3, 2) che rappresenta una permutazione
completamente diversa. Con le convenzioni adottate,
scrivere un ciclo con in testa l’elemento più piccolo
e ordinare i cicli secondo il primo elemento, fa sı̀ che
la rappresentazione a cicli di una permutazione sia
unica. E’ bene avvertire, tuttavia, che non sempre
si adotta tale convenzione e capiterà anche a noi di
considerare cicli non disgiunti e/o non ordinati.
Questa lunga premessa notazionale è indispensabile, perché occorre avere ben presenti le tre notazioni
e saper passare agilmente dall’una all’altra. Infatti,
a seconda di come si vuol trattare una permutazione (o un insieme di permutazioni) conviene ricorrere
a una notazione specifica. Veniamo ora ad effettive
proprietà delle permutazioni. In ogni insieme Pn c’è
sempre una permutazione nella quale ogni elemento
ha sé stesso come immagine; questo significa che ogni
elemento è un punto fisso o, nella definizione con le
disposizioni, alla scelta k-esima si prende proprio il
numero k. Questa speciale permutazione si chiama
identità e, come ora vedremo, ha un ruolo particolare. La preferenza dei matematici per l’aspetto funzionale delle permutazioni non è ovviamente dovuta a
qualche ghiribizzo; queste serissime persone agiscono
a ragion veduta e sanno bene che per le funzioni in
generale (e quindi per le permutazioni in particolare) è possibile considerare un’operazione speciale: la
composizione (v. Sezione 1.3).
Si considerino le seguenti permutazioni di P5 :
µ
¶
µ
¶
1 2 3 4 5
1 2 3 4 5
π=
ρ=
.
3 5 2 1 4
4 2 5 1 3
Ricordiamo che la composizione di due funzioni π e
ρ avviene cosı̀: si prende un qualsiasi elemento x nel
dominio di π e se ne considera l’immagine π(x); se
questa appartiene al dominio di ρ, le si applica la
stessa ρ ottenendo ρ(π(x)), che, per definizione, è
l’immagine di x secondo la composizione π ◦ ρ, cioè:
(π ◦ ρ)(x) = ρ(π(x)). Si dice allora composizione o
prodotto di due permutazioni la loro composizione come funzioni. Per le permutazioni in Pn dominio e codominio coincidono, e quindi la composizione è sempre possibile e applicabile a tutti gli elementi. Si ha
pertanto:
µ
¶ µ
¶
1 2 3 4 5
1 2 3 4 5
π◦ρ =
◦
=
3 5 2 1 4
4 2 5 1 3
µ
¶
1 2 3 4 5
=
.
5 3 2 4 1
Infatti, l’immagine di 1 secondo π è 3, e l’immagine
di 3 secondo ρ è 5, di modo che ρ(π(1)) = 5. Per
gli altri elementi si procede in modo analogo. Quella che si ottiene è ancora una permutazione di P5 ,
4.2. PERMUTAZIONI
in quanto, come sappiamo, la composizione di due
corrispondenze biunivoche è ancora biunivoca. L’operazione di composizione è allora chiusa in Pn , e
ci possiamo chiedere di quali altre proprietà essa goda. E’ facile vedere che la composizione è associativa,
cioè che date tre permutazioni di Pn , diciamo π, ρ, σ,
si ha π ◦ (ρ ◦ σ) = (π ◦ ρ) ◦ σ: in effetti, considerato un
qualsiasi elemento k ∈ Nn , comunque si costruisca la
composizione, il risultato finale è sempre σ(ρ(π(k))).
Non vale invece la proprietà commutativa; un unico
esempio, cio‘e un controesempio, è sufficiente a farci
vedere che in generale è π ◦ ρ 6= ρ ◦ π. Prendendo le
due permutazioni di P5 già considerate si ha:
µ
¶ µ
¶
1 2 3 4 5
1 2 3 4 5
ρ◦π =
◦
=
4 2 5 1 3
3 5 2 1 4
105
infiniti; ad esempio, sono tali Z, l’insieme dei numeri
interi con l’operazione di somma; i numeri razionali
positivi Q+ con l’operazione di prodotto; i numeri
reali positivi R+ con la stessa operazione, e cosı̀ via.
Una permutazione che si riduca allo scambio di due
elementi si dice una trasposizione; ad esempio, in P5
una trasposizione è:
µ
¶
1 2 3 4 5
;
1 5 3 4 2
nella notazione a cicli essa si scrive semplicemente
(2 5), in quanto i due elementi che si scambiano formano un ciclo, tutti gli altri sono punti fissi. E’ interessante osservare che un ciclo può sempre essere
immaginato come il risultato (cioè, la composizione)
µ
¶
1 2 3 4 5
di un certo numero di trasposizioni. Ad esempio,
=
6= π ◦ ρ.
1 5 4 3 2
(2 5 3), per cui 2 va in 5 e questi va in 3, può esLa permutazione con tutti punti fissi, che abbia- sere visto come la trasposizione (2 3) composta con
mo chiamato identità, si comporta come tale nella l’altra trasposizione (3 5). Infatti abbiamo:
composizione; infatti, essa manda ogni elemento in
1. il 2 va in 3 e questo va in 5, cioè, nella
sé stesso e quindi lascia invariata la destinazione che
composizione, il 2 va nel 5;
ogni altra permutazione ha assegnato a ciascun ele2. il 3 va nel 2 e poi questo rimane fisso nella
mento, cioè: (1) ◦ π = π ◦ (1) = π. Questo giustifica
seconda trasposizione;
il nome che le abbiamo dato. Ciò che però è più interessante è il fatto che ogni permutazione π abbia un
3. il 5 rimane fisso nella prima trasposizione e poi
inverso, cioè una permutazione, indicata da π −1 , tale
va nel 3.
che π ◦ π −1 = π −1 ◦ π = (1). Si scambino infatti le
due linee che definiscono π nella notazione funzionale Tutti gli altri elementi rimangono fissi, ma l’osservae si riordinino gli elementi in modo da far appari- zione vale in generale, anche se gli altri elementi core in sequenza quelli della linea divenuta superiore, stituiscono cicli per proprio conto (purché non intere cambiando di posizione anche i corrispondenti ele- feriscano con quello considerato). Esiste una regola
menti della linea inferiore. Per la permutazione π già generale per capire da quali trasposizioni è composto
considerata, si ha ad esempio:
un ciclo (a b c . . . m n): basta considerare il prodotto
µ
¶ µ
¶ (a n)(n m) · · · (d c)(c b). A parte la prima trasposi3 5 2 1 4
1 2 3 4 5
π −1 =
=
. zione, nella quale il primo elemento va nell’ultimo,
1 2 3 4 5
4 3 1 5 2
le altre mandano ogni elemento nel precedente. Eseguendo la composizione, a va in n, che va in m, che
Questa nuova permutazione gode della seguente
va . . ., che va in d, che va in c, che va in b: in conproprietà derivata proprio dalla sua costruzione: se π
clusione, a va in b. A questo punto b va in c, il che
manda k in h, allora π −1 manda h in k. Quando si va
è definitivo poiché c non è presente in trasposizioni
a fare la composizione, pertanto, k va in h e e questo
successive. Cosı̀ c va in d, non più coinvolto nelle tratorna in k, cioè è un punto fisso. Ciò accade per ogni
sposizioni successive, e via di seguito. Infine, n va in
k ∈ Nn , e perciò π ◦ π −1 = (1). Analogamente si
a, chiudendo il ciclo, come si voleva.
trova π −1 ◦ π = (1).
Riprendendo come esempio la permutazione di P8
vista
sopra, possiamo scrivere:
Nota 4.3
Queste, come vedremo nella Sezione
5.8, sono le proprietà di gruppo (non commutativo).
I gruppi sono la più importante struttura algebrica
e, storicamente, i gruppi di permutazioni, cioè i
nostri Pn , sono stati i primi considerati all’inizio
del 1800.
Essi costituiscono un importantissimo
esempio di gruppi finiti, cioè contenenti un numero
finito di elementi. Si può addirittura dimostrare che
ogni gruppo finito è un sottogruppo di un gruppo
di permutazioni. Si scoprirono poi anche gruppi
(1 5 3 8 7)(2 4 6) = (1 7)(7 8)(8 3)(3 5)(2 6)(6 4)
e il lettore è invitato caldamente ad eseguire il prodotto delle trasposizioni per verificare che la permutazione ottenuta è proprio quella di partenza. Quando abbiamo un punto fisso, osserviamo che anch’esso
è esprimibile come prodotto di due trasposizioni; ad
esempio, (1) = (1 2)(1 2). Anche 2 rimane fisso in
106
questo prodotto, il che è corretto: se 2 è un punto
fisso di tutta la permutazione, rimane ancora fisso;
se non lo è, queste due trasposizioni non cambiano
nulla e nulla viene modificato in ciò che segue e in
ciò che precede nell’espressione della permutazione.
Abbiamo cosı̀ dimostrato:
Teorema 4.8 Ogni permutazione può essere espressa come prodotto di trasposizioni.
Un altro esempio, che coinvolge anche punti fissi,
è:
(1 4 6 7)(2)(5 9 8) = (1 7)(7 6)(6 4)(2 5)(2 5)(5 8)(8 9).
In realtà, il teorema precedente può essere rafforzato
nel modo seguente. Se a un prodotto di trasposizioni ne aggiungiamo 2 come (a b)(a b) il risultato non
cambia; questo significa che una permutazione può
essere scritta in vario modo come prodotto di trasposizioni; si può però dimostrare (anche se noi non lo
facciamo) il seguente:
Teorema 4.9 Se una permutazione π è esprimibile
come numero pari (dispari) di trasposizione, ogni altra rappresentazione di π contiene un numero pari
(dispari) di trasposizioni.
Una permutazione si dice allora pari o dispari a seconda del numero di trasposizioni con cui può essere
scritta. Poiché il prodotto π ◦ ρ si ottiene semplicemente scrivendo le trasposizioni di π seguite da quelle
di ρ, si ha immediatamente:
Teorema 4.10 Il prodotto di due permutazioni entrambi pari o entrambi dispari è sempre pari; il prodotto di una permutazione pari e una dispari (o
viceversa) è sempre dispari.
Una rappresentazione mediante trasposizioni della
permutazione π contiene, per costruzione, cicli non
disgiunti, cioè cicli nei quali un elemento può comparire più volte. Questo non è vero, come si è osservato,
per la rappresentazione standard. Questa, per certe
permutazioni, può essere composta da soli punti fissi
e trasposizioni; detta π una tale permutazione, se si
esegue il prodotto π◦π = π 2 si trova che: i) i punti fissi rimangono tali; ii) gli elementi di una trasposizione
(a b), moltiplicando questa per sé stessa, divengono
due punti fissi (a)(b). In conclusione, π 2 contiene solo punti fissi, cioè π 2 = (1). Una permutazione che
gode di questa proprietà si dice una involuzione; risulta facile vedere che tutte e sole le involuzioni sono
composte di cicli disgiunti di un solo elemento (punti fissi) e/o di due elementi (trasposizioni). Si provi
ad esempio ad eseguire il quadrato di π ∈ P8 con
π = (1 4)(2 5)(6 8).
CAPITOLO 4. MATEMATICHE FINITE
Nota 4.4
Le permutazioni hanno un ruolo fondamentale in molte parti dell’Informatica. Il problema
dell’ordinamento consiste nel partire da una permutazione qualsiasi π ∈ Pn e trovare un algoritmo (più
veloce possibile) che permetta di rimettere in ordine
gli elementi di π. Il caso in cui il dominio di π sia Nn
non è molto interessante, in quanto la soluzione è lo
stesso Nn . Se invece il dominio di π è, ad esempio,
un insieme di nomi, di numeri qualsiasi o di codici,
il problema ha un interesse pratico effettivo e soluzioni non banali. Si pensi all’anagrafe di un comune,
ai dipendenti di un’azienda, ai codici fiscali dei contribuenti, ai codici dei prodotti di un supermercato.
In questi casi, elenchi disordinati non servono a nulla,
come sono inutili dizionari non ordinati o elenchi telefonici con i nomi messi a caso. Per questo, ordinare un
elenco è considerata un’operazione fondamentale, che
oggi facciamo compiere agli elaboratori. Questi usano
algoritmi molto veloci, e lo studio e la realizzazione di
tali algoritmi costituiscono un problema di base dell’Informatica. Su di essi si sono cimentati scienziati di
primo piano, che hanno proposto algoritmi oggi usati
universalmente, anche se le ricerche in questo settore
continuano senza tregua.
Un altro importante problema in cui intervengono
le permutazioni è quello cosiddetto del commesso
viaggiatore. Un commesso viaggiatore, partendo da
una città X (diciamo, la città in cui abita) deve
visitare le città A1 , A2 , · · · , An , in un ordine che egli
può scegliere, ma che, ovviamente, sia quello che gli
procura meno spese. Il nostro commesso conosce i
costi che gli si presenteranno in ogni tratta Ai Aj e
quindi, teoricamente, potrebbe considerare tutte le
n! possibili permutazioni, far eseguire all’elaboratore
i relativi conteggi, e scegliere infine la permutazione
per lui più conveniente. Purtroppo, il numero di
permutazioni cresce, come s’è visto, in modo troppo
veloce e già per un numero di città piuttosto limitato,
come potrebbe essere 20, il numero di strade da
tentare è dell’ordine di 1019 , un numero enorme
anche per il più veloce dei nostri elaboratori. A
tutt’oggi non si conoscono metodi migliori di quello
(abbastanza ovvio) di tentare tutte le permutazioni
per essere sicuri di trovare il percorso ottimo. Per
questo il problema del commesso viaggiatore costituisce uno dei problemi difficili; tecnicamente, si dice un
problema intrattabile o che fa parte dei problemi NP.
Insieme al problema della scomposizione in fattori
primi, a quello della soddisfacibilità dei predicati
visto nella Nota 1.11 (e a tanti altri) è una delle
bestie nere dell’Informatica.
4.3
Problemi combinatori
I problemi dell’Analisi Combinatoria sono, in generale, problemi di conteggio e, come tali, possono sorgere
in qualsiasi contesto; come s’è detto, si può affermare
che l’Analisi Combinatoria si interessa degli insiemi
107
4.3. PROBLEMI COMBINATORI
finiti, dei quali vuole contare i sottoinsiemi che posseggono una qualche proprietà caratteristica. Le disposizioni e le combinazioni sono esempi elementari,
ma significativi; spesso si ha a che fare con situazioni
particolari, come quando si desidera contare le possibili posizioni delle regine su una scacchiera, disponendole in modo che non si possano reciprocamente
mangiare. In questi casi, il problema specifico viene
generalizzato, e si cerca una formula che dia il numero
di posizioni quando si hanno n regine e una scacchiera di n × n caselle. Quello, che è forse il più antico
dei problemi combinatori, si trova citato in testi egizi
e babilonesi; ha resistito ai secoli ed oggi si ritrova
in forma di filastrocca in tanti paesi. In Italia suona
cosı̀:
Per una strada che mena a Camogli
passava un uomo con sette mogli.
E ogni moglie aveva sette sacche,
e ogni sacca aveva sette gatte,
e ogni gatta sette gattini.
Fra gatti e gatte e sacchi e mogli,
in quanti andavano, dite, a Camogli?
Il lettore può usare i teoremi che abbiamo visto
nella Sezione 3.2, relativamente alle progressioni
geometriche, per risolvere la questione.
Un problema combinatorio molto più interessante
risale a Fibonacci, il quale inventò il seguente quesito:
un contadino possiede una coppia di conigli appena
nati; i conigli diventano fertili dopo un mese, e un
mese è anche il loro periodo di gestazione. Ogni coppia di conigli genera ogni mese (eccetto il primo dopo
la nascita, durante il quale giunge alla maturità sessuale) un’altra coppia di conigli. Pertanto, il contadino, all’inizio del secondo mese, avrà ancora un’unica
coppia, ma all’inizio del terzo mese avrà due coppie.
All’inizio del quarto mese, la prima coppia avrà generato una seconda coppia, e siamo cosı̀ a tre coppie.
Al quinto mese, sia la coppia primigenia, sia la prima coppia generata avranno dei figli; in tal modo,
le coppie saranno diventate cinque. Si chiede quante
coppie di conigli possiederà il nostro contadino dopo
n mesi, nell’ipotesi (abbastanza teorica) che nessun
coniglio muoia, per cause naturali o alimentari?
Sia Fn il numero di coppie di conigli in possesso
del contadino all’inizio dell’n-esimo mese; all’inizio
del successivo egli avrà queste n coppie, più le coppie nate quel mese; ma queste sono esattamente tante
quante le coppie fertili all’n-esimo mese, cioè le coppie
presenti il mese precedente, ovvero Fn−1 . Abbiamo
quindi la relazione Fn+1 = Fn + Fn−1 , che possiamo
considerare assieme alle condizioni iniziali F1 = 1
ed F2 = 1, le coppie di conigli possedute all’inizio
del primo e del secondo mese. Abbiamo già incontrato questa sequenza di numeri e possiamo supporre F0 = 0 mantenendo tutte le caratteristiche viste.
Questa storia giustifica il nome di “numeri di Fibonacci” dato agli elementi della sequenza. La soluzione
del problema di Fibonacci è dato dal seguente:
Teorema 4.11 L’n-esimo numero di Fibonacci vale:
ÃÃ
√ !n !
√ !n Ã
1
1− 5
1+ 5
Fn = √
−
.
2
2
5
Prova: Procedendo per induzione, osserviamo che,
dalla formula, discende subito F0 = 0 e:
Ã
√ !
√
1
1+ 5−1+ 5
F1 = √
= 1.
2
5
Il lettore può continuare e verificare altri valori, ma
questi due sono sufficienti come base del ragionamento. Supponiamo che ci siano valori di n per i quali la
formula del teorema non sia valida; chiamiamo m il
loro valore più piccolo, che deve esistere e deve essere
maggiore di 1 per le verifiche fatte. Per m−1 ed m−2
la formula deve perciò essere valida e proviamo a calcolare Fm−1 + Fm−2 che per la proprietà dei numeri
di Fibonacci deve essere uguale proprio ad Fm :
Fm = Fm−1 + Fm−2 =
Ã
√ !m−1
√ !m−1 Ã
1− 5
1  1+ 5
−
+
=√
2
2
5

Ã
√ !m−2 Ã
√ !m−2
1+ 5
1− 5
=
+
−
2
2
Ã
√ !m−2 Ã
√ !
1+ 5
1  1+ 5
1+
+
=√
2
2
5

Ã
√ !
√ !m−2 Ã
1− 5 
1− 5
.
1+
−
2
2
Ora osserviamo che:
Ã
√ !2
√
√
1+ 5
1+2 5+5
1+ 5
=
=
1+
2
4
2
√
e un’analoga identità vale per 1+(1− 5)/2. Pertanto
si ha:
Fm−1 + Fm−2 =
ÃÃ
√ !m Ã
√ !m !
1+ 5
1
1− 5
=√
= Fm
−
2
2
5
contro l’ipotesi che per Fm non valesse questa formula. Questo dimostra che non esiste un valore di m,
per cui la formula non valga, cioè, in altre parole, la
formula è valida per ogni numero naturale n.
108
Questa dimostrazione, che abbiamo voluto portare avanti secondo la formulazione delle prove per induzione vista nel primo capitolo, mette in evidenza
l’utilità e i limiti dell’induzione. I conti che abbiamo
fatto sono elementari, e quindi ci convincono che la
formula per Fn è proprio quella data dal teorema. Ma
come ha fatto lo scopritore di questa formula a immaginare un’espressione del genere che, all’apparenza, è
notevolmente complessa? In realtà si è arrivati alla
scoperta della formula per tutt’altra via e, come abbiamo già avuto modo di dire, l’induzione non ci aiuta
affatto a scoprire le formule. Si provi, ad esempio, ad
immaginare una formula per Gn , definito dalla relazione Gn = Gn−1 + 2Gn−2 , apparentemente simile a
quella dei numeri di Fibonacci. Anche se imponiamo
le condizioni iniziali G0 = 0 e G1 = 1, la soluzione è
completamente diversa. Essa è riportata in fondo a
questa sezione ed è molto più semplice di quella dei
numeri di Fibonacci. Se il lettore è comunque riuscito a scoprirla dopo aver osservato alcuni elementi
della sequenza, merita i nostri complimenti. Va detto, tuttavia, che esistono metodi del tutto generali
per trovare la soluzione di tutte le sequenze, i cui
elementi sono definiti da ricorrenze del tipo visto.
I conigli di Fibonacci o le mogli che vanno a Camogli ci mostrano che i problemi combinatori possono nascere in qualsiasi contesto. Per semplificarne
l’analisi, e quindi la risoluzione, i matematici hanno
proposto e studiato alcune classi standard di oggetti,
ai quali tentare di ricondurre problemi nati in situazioni diverse. Queste classi, o i loro elementi, sono
detti genericamente oggetti combinatori e su di essi
si concentra l’Analisi Combinatoria; è chiaro che se
un problema qualsiasi può essere ricondotto a uno
equivalente ma che si riferisce a qualche tipo di oggetto combinatorio noto, allora o se ne ha già una
soluzione o si è sulla strada per trovarla, poiché è più
facile trattare oggetti con proprietà ben conosciute,
piuttosto che gli strani insiemi, nei quali era stato
formulato il problema originale. Vedremo più avanti
una serie di oggetti combinatori utilizzati dai matematici; come sempre accade, alcuni sono stati studiati maggiormente, altri un po’ meno; alcuni sono
più ricchi di proprietà, altri più poveri; alcuni hanno maggiormente stimolato la fantasia, altri non sono
stati altrettanto fortunati. Non potremo certo essere
esaurienti in un campo per molti versi assai ricco di
proposte, di alternative e di mode.
Alcune classi di oggetti combinatori si sono affermate in modo speciale, costituendo punti di attrazione tanto da diventare veri e propri paradigmi a cui
ricondurre la dimostrazione di proprietà combinatorie
molto disparate. Per questo motivo, tali classi hanno
assunto il ruolo di modelli combinatori, strutture di
riferimento a cui ricondursi quasi costantemente. La
CAPITOLO 4. MATEMATICHE FINITE
varietà e l’imprevedibilità dei problemi combinatori
fanno sı̀ che anche questi modelli non esauriscano le
possibilità di soluzione da prendere in considerazione, ma di sicuro sono i primi oggetti a cui cercare di
riportare un problema nuovo.
Il modello delle urne. Uno dei modelli combinatori più vecchi e più usati è quello detto delle urne.
Si supponga di avere un certo numero di contenitori, detti convenzionalmente urne, e degli oggetti che,
a seconda dei gusti di chi usa il modello, sono detti
gettoni o palline. Le urne possono essere tutte uguali
(cioè, come si dice, indistinguibili) o possono essere
una distinta dall’altra, ad esempio per mezzo di un
numero di identificazione; analogamente, le palline
possono essere indistinguibili o di diverso colore. Ad
esempio, se le urne sono n e tutte uguali, e le palline
dello stesso colore, possiamo immaginare di mettere
o non mettere una pallina in ciascuna delle urne. Se
ci chiediamo in quanti modi diversi possiamo inserire
una pallina in ciascuna delle urne, otteniamo lo stesso problema del lancio delle monete. All’opposto, se
le urne sono numerate 1, 2, . . . , n e in ciascuna di esse
inseriamo una pallina fra n palline distinte da n colori diversi, otteniamo esattamente le n! permutazioni
che ben conosciamo. Come si vede da questi esempi,
le urne e le palline simulano gli insiemi e gli elementi,
e numerazione e colorazione possono simulare le funzioni. Oggi, quando ormai il linguaggio degli insiemi
è insegnato (quando lo è) fin dalla scuola elementare
ed è diventato abbastanza comune, è spesso più facile ragionare in termini di insiemi, elementi e funzioni
piuttosto che di urne, palline e colori. Per questo motivo il modello delle urne non si usa più molto spesso
e, personalmente, devo dire che non mi è mai stato
particolarmente simpatico.
Ad onor del vero, il modello delle urne serve bene
a introdurre un principio che risulta utile in diversi ragionamenti. In inglese si chiama “pigeon hole
principle”, un nome che, come ora vedremo, è perfettamente appropriato. Il termine principio vuole
mettere in evidenza che si tratta di una verità piuttosto ovvia, anche se di ampia applicazione. Noi lo
possiamo enunciare come un vero e proprio teorema:
Teorema 4.12 (pigeon hole principle) Se supponiamo di avere n urne ed almeno n + 1 palline
da distribuire nelle urne, esiste almeno un’urna che
verrà a contenere più di una pallina.
Prova: Se nessuna urna contenesse più di una pallina, queste potrebbero essere al più n, contro l’ipotesi
fatta.
Naturalmente, il nome inglese del principio fa riferimento al fatto che n + 1 piccioni non possono tutti
avere un proprio buco sotto il tetto, se i buchi a disposizione sono solo n. Alcuni problemi, che sembrano
109
4.3. PROBLEMI COMBINATORI
formidabili, si risolvono facilmente applicando il principio. Ci si può chiedere, ad esempio, se in una città
di 200. 000 abitanti ci sono due donne che hanno lo
stesso numero di capelli (parliamo di donne, poiché
due uomini completamente calvi hanno, in modo banale, lo stesso numero di capelli: zero). Di fronte a
questo problema ci si sente un po’ sconcertati, ma
basta pensare a questo: il numero dei capelli di una
donna può variare da 40 a 50 mila; possiamo allora
immaginare di avere, diciamo, 60 mila urne numerate da 1 a 60. 000, dove il numero k rappresenta k
capelli; ogni donna inserisce una pallina nell’urna designata col numero dei propri capelli. La procedura
è solo ideale, ma ci fa capire che due almeno delle
100. 000 palline, per il principio dei piccioni, devono
finire nella stessa urna. In modo analogo, visto che
in città viaggio spesso in autobus, mi è capitato di
chiedermi se mi è mai successo di viaggiare due volte
sullo stesso mezzo. Ormai ho preso l’autobus per più
di mille volte e l’Azienda dei trasporti pubblici ha al
massimo a disposizione un paio di centinaia di mezzi:
il principio dei piccioni permette di dare una risposta immediata. Ignoro invece se ho preso almeno una
volta ciascuno degli autobus dell’Azienda; su questo
quesito, purtroppo, il principio non ci aiuta.
Numeri figurati. Probabilmente, i più antichi
oggetti combinatori sono i cosiddetti numeri figurati. Tutti sappiamo che 25 è il quadrato di 5 perché
occorrono 25 gettoni per disporli su un quadrato che
abbia per lato 5 gettoni. I numeri quadrati si ottengono appunto in questo modo e, partendo da un
unico gettone, si ottengono gli altri numeri quadrati
procedendo come nella Figura 4.1. Si può osservare che ogni volta si aggiunge un numero dispari di
gettoni: prima 3, poi 5, poi 7 e cosı̀ via. Come ricordiamo, abbiamo dimostrato fin dal primo capitolo che
la somma dei primi n numeri dispari è uguale ad n2 ,
ed ora, se si vuole, abbiamo una prova combinatoria
di tale fatto.
Figura 4.1: Numeri quadrati e numeri triangolari
I Pitagorici, accanto ai numeri quadrati, considerarono i numeri triangolari, pentagonali, esagonali e,
in generale, i numeri poligonali. L’n-esimo numero
triangolare Tn ha una base composta da n gettoni;
sopra ad essa sono disposti n − 1 gettoni, e sopra ancora n − 2, fino a ridursi a un solo gettone. Pertanto
si ha:
n(n + 1)
Tn = 1 + 2 + · · · + n =
2
come abbiamo dimostrato nel Corollario 3.11. Gli
stessi Pitagorici si divertirono a trovare molte proprietà dei numeri triangolari che, bisogna dire, sono
piuttosto curiose. Limitiamoci qui a qualche considerazione elementare. Intanto, è immediato dimostrare
che Tn + Tn−1 = n2 ; una dimostrazione algebrica si
ottiene sostituendo a Tn e Tn−1 il loro valore appena
trovato. Più interessante è dare di questa relazione
una dimostrazione combinatoria, cioè basata sugli oggetti combinatori considerati. Nel nostro caso, basta
dividere un numero quadrato mediante una retta, ad
esempio al di sotto della diagonale che va da sinistra
in alto a destra in basso, e osservare che al di sopra
della retta si hanno Tn gettoni e al di sotto Tn−1 .
Meno immediato è il seguente:
Teorema 4.13 Per ogni numero naturale n si ha:
2
Tn2 − Tn−1
= n3 .
Prova: Questa relazione lega i numeri triangolari ai
numeri cubi, che possiamo considerare numeri figurati in tre dimensioni. La dimostrazione algebrica è
abbastanza immediata:
2
Tn2 − Tn−1
=
=
n2 (n + 1)2 (n − 1)2 n2
n2
−
=
((n+1)2 −(n−1)2 ) =
4
4
4
=
n2
n2
(n + 1 + n − 1)(n + 1 − n + 1) =
· 2n · 2 = n3
4
4
dove abbiamo applicato il prodotto notevole della
differenza di due quadrati.
Un’osservazione importante che conviene fare a
questo punto è la seguente: ogni volta che sappiamo
qualcosa sulla differenza di due elementi consecutivi
di una sequenza, sappiamo automaticamente qualcosa sulle somme della sequenza di tali differenze. Per
essere più precisi, dimostriamo il seguente risultato;
esso è un po’ ridotto rispetto a quello che potremmo
fare, ma è sufficiente ai nostri scopi:
Teorema 4.14 Si abbiano due sequenze {An }n∈N e
{Bn }n∈N con A0 = B0 = 0; allora An − An−1 = Bn
se e solo se An = B1 + B2 + · · · + Bn .
Prova: Supponiamo dapprima che An sia la somma
dei primi n elementi della sequenza {Bn }n∈N ; allora
sarà anche: An−1 = B1 +B2 +· · ·+Bn−1 , e sottraendo
membro a membro questa relazione dalla precedente,
si ha An − An−1 = Bn , cancellandosi tutti gli altri
110
CAPITOLO 4. MATEMATICHE FINITE
elementi. Se, viceversa, An − An−1 = Bn ,, avremo
anche:
An −An−2 = An −An−1 +An−1 −An−2 = Bn +Bn−1 .
Si può andare avanti con An − An−3 = Bn + Bn−1 +
Bn−2 , e cosı̀ via fino ad ottenere:
An − A0 = Bn + Bn−1 + · · · + B1 ,
da cui deriva la conclusione, essendo per ipotesi A0 =
0.
Da questo teorema otteniamo, come immediato corollario, che ogni numero triangolare Tn è dato dalla
Figura 4.2: Numeri pentagonali
radice quadrata della somma di tutti i cubi da 1 fino
ad n. Ad esempio, T5 = 15 ed infatti abbiamo:
Teorema 4.16 L’n-esimo numero pentagonale vale:
p
√
13 + 23 + 33 + 43 + 53 = 225 = 15.
n(3n − 1)
Pn =
.
2
Per quanto riguarda i numeri quadrati, ci limitiamo
a dimostrare il seguente risultato che ha moltissime Prova: Per la scomposizione appena vista, si ha:
applicazioni (si veda ad esempio la Sezione 8.8):
Pn = Tn + 2Tn−1 =
Teorema 4.15 Il valore della somma dei primi n
numeri quadrati è dato da:
n
n(n + 1)
+ n(n − 1) = (2n − 2 + n + 1)
=
2
2
n
X
n(n + 1)(2n + 1) che dà esattamente la formula desiderata.
2
2
2
2
k =
Sn = 1 + 2 + · · · + n =
.
6
k=0
Prova: Procediamo per induzione, verificando che
S0 = 0, S1 = 1 e S2 = 5 sono dati effettivamente
dalla formula proposta. Se questa però non fosse vera
per ogni n ∈ N, esisterebbe un numero m > 2 per il
quale la formula è falsa. Allora, se n = m − 1, per n
la formula deve essere vera e quindi:
Sn+1 = Sn +(n+1)2 =
n(n + 1)(2n + 1)
+(n+1)2 =
6
Nota 4.5
Ragionare sui numeri triangolari, quadrati e pentagonali permette di generalizzare abbastanza agevolmente alcuni risultati e ottenere pro[k]
prietà di questi numeri. Chiamiamo Φn l’n-esimo
[3]
[4]
numero k-gonale, di modo che Φn = Tn , Φn = n2
[5]
[k]
e Φn = Pn ; per costruzione, se disegniamo Φn , per
[k]
disegnare Φn+1 occorre aggiungere k − 2 lati (si veda
la Figura 4.2 relativa ai Pn ); ogni lato ha n + 1 gettoni, ma uno è in comune con il lato successivo, eccetto
l’ultimo. Si ha pertanto la ricorrenza:
[k]
n+1
(n + 1)(n + 2)(2n + 3)
=
(2n2 + 7n + 6) =
.
6
6
Ma questa è la stessa espressione data dal teorema,
quando si consideri n + 1 al posto di n, e ciò dimostra
che anche per n + 1 = m la formula è valida, contro
l’ipotesi fatta.
Dopo i numeri triangolari e quadrati, vengono i
numeri pentagonali, la cui sequenza comincia con
P1 = 1, P2 = 5, P3 = 12, P4 = 22, P5 = 35, come si vede dalla Figura 4.2. Per trovare una formula
che ci dia l’n-esimo numero pentagonale, si osservi
che le due rette tratteggiate dividono i pentagoni in
tre zone: in quella centrale, che comprende gli estremi dei lati opposti al vertice centrale, riconosciamo i
numeri triangolari Tn , mentre nelle due zone laterali
riconosciamo i numeri triangolari Tn−1 .
Si ha pertanto:
Φn+1 = Φ[k]
n + n(k − 2) + 1,
[k]
da mettere insieme alla condizione iniziale Φ1 = 1.
Ci si accorge ora del ruolo fondamentale dei numeri
triangolari: con una decomposizione analoga a quella
dei numeri quadrati e pentagonali, si vede che:
Φ[k]
n = Tn + (k − 3)Tn−1
[k]
che permette di calcolare una formula per ogni Φn :
Teorema 4.17 Il valore dell’n-esimo numero kgonale è dato da:
Φ[k]
n =
kn(n − 1) − 2n(n − 2)
.
2
Prova:
Applichiamo la formula dei numeri
triangolari alla precedente relazione:
Tn + (k − 3)Tn−1 =
n(n − 1)
n(n + 1)
+ (k − 3)
=
2
2
4.4. STRUTTURE DATI
kn(n − 1) − 2n2 + 4n
2
da cui discende la formula desiderata.
=
Esistono altri approcci ai numeri k-gonali, ma noi
possiamo accontentarci di quanto detto fin qui, non
senza aver citato un risultato ottenuto dal solito
Eulero: ogni numero naturale è la somma di al più k
numeri k-gonali, cioè di al più tre numeri triangolari,
di al più quattro numeri quadrati, e cosı̀ via.
111
i dati che potrebbero servire per accertare, al di là di
ogni dubbio, se la persona, non solo è un cliente, ma
è veramente l’individuo che pretende di essere. Questo, però, grazie all’Informatica. Una volta, non poi
tanti anni fa, le cose non andavano cosı̀. Tutto era
semplice se il cliente era conosciuto dal cassiere o da
qualche altro impiegato; ma, in caso contrario, era
necessario far partire una procedura di ricerca che,
attraverso la consultazione di elenchi, la presentazione di documenti, la firma di moduli e ammennicoli
vari permetteva, alla fine, di dire: sı̀, costui è uno
dei clienti della banca, oppure no, si tratta di un millantatore e nulla gli può essere concesso. Lo stesso
problema si presenta in mille occasioni: l’utente di
una biblioteca ha diritto al prestito? un certo farmaco è prodotto o meno dalla casa farmaceutica XYZ?
esiste in Italia un comune che si chiama Cogoleto?
Oggi, poi, il problema si è allargato a dismisura. Un
biologo si chiede se una certa sequenza di aminoacidi
è presente fra i miliardi di aminoacidi che formano
l’elica del DNA di un crostaceo. Un navigatore di Internet cerca informazioni su Teofilo Folengo, sperando di trovar qualcosa tra i miliardi di dati presenti
nel Web, la tela che tutti ci avvolge.
I numeri poligonali sono i numeri figurati più semplici, ma ne esistono, e se ne possono inventare, molti
altri, fra i quali i numeri stellati hanno ricevuto molta attenzione. Si può anche passare dal piano allo
spazio e immaginare di avere delle palline al posto
dei gettoni; esse possono essere disposte in forma di
piramide con base triangolare, quadrata o esagonale.
Si possono pensare altre costruzioni e si può addirittura immaginare di passare a 4, 5 o m dimensioni; per
queste note, tuttavia, pensiamo di poterci fermare a
questo punto.
Il modello delle urne e i numeri figurati si riferiscono ai più antichi problemi combinatori; oggi si sono
sviluppati altri modelli e altri oggetti, alcuni dei quali sono legati alle strutture dati dell’Informatica. A
In tutti questi casi, il calcolatore è stato fornito, o
questi aspetti dell’Analisi Combinatoria dedicheremo
ha creato lui stesso, un elenco delle informazioni che
le prossime sezioni, naturalmente dopo aver dato la
gli servono: gli utenti della biblioteca, i farmaci della
formula a suo tempo promessa:
ditta XYZ, e cosı̀ via. Questi elenchi possono essere
2n − (−1)n
lunghissimi, contenere anche miliardi di dati diversi,
.
Gn =
e certo l’elaboratore non può consultarli uno dietro
3
l’altro: cosı̀ facendo, anche il calcolatore più veloce
impiegherebbe minuti ed ore a trovare una particola4.4 Strutture dati
re informazione, e nessun utente di queste macchine
L’Informatica ha portato alla ribalta alcuni proble- potenti accetterebbe di aspettare cosı̀ a lungo. Un
mi che la Matematica aveva ignorato o sottovalutato metodo usato dall’elaboratore è derivato da un trucperché sembravano non presentare risvolti teorici ap- co che adoperiamo quando cerchiamo una parola nel
prezzabili. L’esempio più eclatante è costituito dal dizionario o un cognome sull’elenco telefonico: invece
problema della ricerca: dato un insieme S e un ele- di partire dall’inizio, scegliamo ad occhio una pagina
mento x, si vuole sapere se x ∈ S oppure x 6∈ S. Per ragionevolmente vicina a ciò che cerchiamo. Il trucco
un matematico, questo non è neppure un problema; è reso sistematico nel modo seguente. Supponiamo
come abbiamo osservato fin dall’inizio, elementi e in- che le informazioni nell’elenco dell’elaboratore siano
siemi sono entità che non si definiscono nemmeno e ordinate, cosı̀ come lo sono quelle del dizionario o della loro “esistenza” è legata al fatto di poter istituire l’elenco telefonico. Si comincia allora la ricerca dall’etra di esse alcune relazioni che le caratterizzano; una lemento mediano, cioè l’informazione che sta proprio
di queste è proprio l’appartenenza, per cui, dato S e nella posizione di mezzo. Si potrebbe essere fortunadato x, è immediato sapere se x ∈ S, o meno. Tutti ti e trovare al primo colpo ciò che si cerca, ma non
i nostri ragionamenti su elementi e insiemi si basano siamo cosı̀ ottimisti: se l’informazione cercata è misul fatto (anche se non solo su quello) che si possa nore (cioè, viene prima) di quella individuata, allora
dire senza problemi quando x sta o non sta in S.
possiamo escludere dalla ricerca successiva tutta le
Nella pratica, le cose non stanno proprio cosı̀. Se seconda metà dell’elenco; se l’informazione cercata è
una persona si presenta alla cassa di una banca e vuol maggiore (cioè, viene dopo) si escluderà la prima parritirare del denaro, il problema che si presenta al cas- te. In ogni caso, il tentativo successivo sarà limitato
siere è: questa persona è o non è cliente della banca? a una sola metà dell’elenco, e questo fa una bella difOggi, basta digitare sul terminale il nome della perso- ferenza. Tale metodo si dice ricerca binaria e per essa
na e il calcolatore fornisce la risposta, insieme a tutti vale il seguente risultato:
112
CAPITOLO 4. MATEMATICHE FINITE
Teorema 4.18 Sia S un insieme di n elementi, dato combinatori detti alberi binari di ricerca, che qui cacome elenco ordinato; il numero massimo di confronti dono giusto a proposito. Per brevità, spesso diremo
necessari a determinare se un elemento x appartiene “albero binario” per “albero binario di ricerca”.
o non appartiene ad S è log2 (n + 1).
Definizione 4.1 Un albero binario di ricerca è una
Prova: Onde semplificare i conti necessari, limitia- struttura finita cosı̀ fatta: è vuota oppure è costituita
moci a considerare i valori per cui n è 1 meno di una da un nodo etichettato dal quale partono due rami,
potenza di 2, cioè vale 0, 1, 3, 7, 15, 31, . . .. Questi nu- all’estremità dei quali si trovano due alberi binari di
meri hanno la caratteristica che, quando procediamo ricerca, detti rispettivamente il sottoalbero di sinistra
nella ricerca e riduciamo a metà l’elenco, il numero e di destra dell’albero binario.
degli elementi rimasti è ancora dello stesso tipo. Indichiamo allora con Cn il massimo numero di confronti Un nodo etichettato è semplicemente un nodo che
necessari alla ricerca in un elenco di n elementi e po- contiene un’etichetta, cioè un nome o un numero, in
niamo ck = Cn = C2k −1 . Per l’osservazione fatta, ogni caso l’identificazione di un elemento dell’insieme
abbiamo C2k −1 = 1 + C2k−1 −1 , la qual formula si- S. Il primo nodo dell’albero si dice la radice, e le radignifica che il numero totale dei confronti è uguale ad ci dei due sottoalberi di sinistra e di destra si dicono
1 (il confronto effettuato) più il numero di confronti i figli sinistro e destro della radice, alla quale ci si
per la metà rimasta dell’elenco. Questa relazione si riferisce come nodo genitore. Per capire bene il conscrive: ck = 1 + ck−1 e quindi, iterando, si ha:
cetto di albero binario, la cosa migliore è utilizzarlo
e pertanto vedremo ora come si costruisce e come si
ck = 1 + ck−1 = 2 + ck−2 = · · · = k + c0 .
usa. All’uopo, useremo l’insieme S delle parole contenute nella Divina Commedia; si dà per scontato che
Ma c0 = C20 −1 = C0 = 0, poiché se un elenco non ha l’incipit sia conosciuto da tutti. La prima parola nel
elementi (cioè, S = ∅) non c’è bisogno di confronti per viene a costituire l’etichetta della radice:
stabilire che x 6∈ S. In conclusione, abbiamo Cn = k,
dove n = 2k − 1. Ricavando k si ha k = log2 (n + 1),
nel
come si voleva.
¡
@
q¡
@q
Se n è un milione, Cn ≈ 20 e se n vale un miliardo
si ha Cn ≈ 30. Per un potente elaboratore, fare 20 o I due rami che si dipartono da questa radice “punta30 confronti è pressoché immediato, e questo spiega no”, per il momento, a due alberi vuoti che, però, preperché la nostra domanda su Teofilo Folengo ottenga sto, si riempiranno. Per inserire nell’albero la seconda
parola mezzo, si procede cosı̀: si confronta la nuova
una risposta in una frazione di secondo.
La ricerca binaria funziona se l’elenco è ordinato. parola con l’etichetta della radice; poiché mezzo è alPurtroppo, i dati grezzi ben raramente sono ordinati, fabeticamente inferiore, si procede lungo il ramo di
basti pensare alle informazioni su Internet. Il cal- sinistra. L’albero che si trova è vuoto e perciò lo si
colatore, perciò, ha anche il problema di ordinare i sostituisce con un nodo avente mezzo come etichetta:
dati dell’elenco, e questa è un’altra operazione che la
nel
Matematica classica ha sottovalutato. In pratica, n
¡
@
elementi diversi possono assumere una qualsiasi delle
¡
@q
mezzo
n! permutazioni possibili, e ciò rende conto della variabilità del problema. Abbiamo a suo tempo visto
¡
@
q¡
@q
quanto vale 100!, e pensare a 1. 000. 000! è semplicemente assurdo. Questo pone il problema generale del- Per la terza parola del si procede in modo analogo:
l’ordinamento, che è considerato, assieme alla ricerca, confrontata con la radice, essa è minore e quindi si
uno dei problemi di base dell’Informatica.
segue il ramo di sinistra. Qui si trova il nodo con etiSi rifletta un attimo come un elenco non ordina- chetta mezzo, di cui del è minore. Continuando a sito sia praticamente illeggibile, cosı̀ come ogni uscita nistra, si trova l’albero vuoto, che perciò sostituiamo
prodotta dall’elaboratore deve essere ordinata, se vo- con un nodo nuovo etichettato del:
gliamo che serva a qualcosa. Gli informatici hanno
nel
inventato metodi ingegnosi per ordinare velocemente
¡
@
gli insiemi di dati, metodi che non fanno propriamen¡
@q
te parte dell’Analisi Combinatoria; ma questo argomezzo
mento va al di là degli scopi di queste note. Acconten¡
@
¡
@q
tiamoci allora di introdurre un metodo che permette
del
di ottenere ordinamento e ricerca in tempi decisa¡
@
q¡
@q
mente buoni. Questo metodo è legato a certi oggetti
113
4.4. STRUTTURE DATI
L’inserimento di cammin e di di è semplice e basta osservare che di è maggiore di del e quindi verrà posto
alla sua destra. Analogo caso avviene per nostra,
che si colloca alla destra della radice. Nella Figura 4.3 mostriamo il nostro albero dopo l’inserimento
delle prime 15 parole. Ora, la ricerca di un termine avviene con lo stesso criterio dell’inserimento. Si
supponga di voler cercare oscura. Si confronta con
la radice nel e poiché è maggiore si procede col ramo
di destra. Qui troviamo nostra, di cui oscura è ancora maggiore, per cui continuaiamo verso destra. La
parola oscura è invece minore di vita e noi procediamo verso sinistra. Cosı̀ andiamo avanti finché non
recuperiamo oscura. Lo stesso procedimento avrebbe avuto luogo per ricercare oscuro, una parola per il
momento non ancora presente nel nostro albero; naturalmente, però, l’ultimo confronto ci avrebbe portato in un sottoalbero vuoto, il che denota le ricerche
con insuccesso.
La proprietà fondamentale degli alberi binari di ricerca è che, preso un qualsiasi nodo N , il suo sottoalbero di sinistra contiene solo etichette minori di
quella in N , e il suo sottoalbero di destra contiene solo
etichette maggiori. Questo è vero per costruzione e ci
suggerisce che le etichette sono virtualmente ordinate. Il seguente algoritmo ricorsivo produce un elenco
ordinato di tutte le etichette di un albero binario:
Algoritmo 4.2 (Ordinamento)
Ingresso: un albero binario di ricerca;
Uscita: l’elenco ordinato delle etichette dell’albero.
1. se il sottoalbero di sinistra non è vuoto, chiamare
ricorsivamente questo programma per ordinarlo;
2. scrivere nell’elenco l’etichetta della radice di
questo albero;
3. se il sottoalbero di destra non è vuoto, chiamare
ricorsivamente questo programma per ordinarlo.
fr
´Q
´
Q
´
Q
´
Q
Q e
d ´
r´
Qr
Q
´
D Q
´ ¥¥
D
Q
´
D
¥
Q c ´
Q
´
Qr´
D
¥
­J
D
¥
D
¥
­ J
D
¥
­
J
D ­
J ¥
a D­
r
Jr¥ b
Figura 4.4: Un grafo connesso
(x, y) ed (y, x) si scrive una doppia freccia. Un grafo
pesato è un grafo nel quale ad ogni arco è associato
un numero reale non negativo, detto il peso dell’arco.
Nei grafi orientati e pesati, il peso dell’arco (x, y) puó
essere diverso dal peso dell’arco (y, x). Un sottografo
di G è un grafo G′ = (V ′ , A′ ) dove V ′ ⊆ V e A′ ⊆ A.
Se x è un vertice, il grado di x è il numero di archi
che hanno x come vertice. Se il grafo è orientato, si
distingue il grado di ingresso, cioè il numero di archi
che arrivano ad x, dal grado d’uscita, cioè il numero
di archi che partono da x.
La figura riporta il grafo definito da V =
{a, b, c, d, e, f } e composto di 8 archi. Abbiamo già
avuto modo di incontrare grafi; è chiaro che un grafo
è un modo di rappresentare una qualsiasi relazione
simmetrica su un insieme finito V ; in generale, una
relazione su V corrisponde a un grafo orientato. Per
le relazioni di ordine, possiamo limitare gli archi a
quelle coppie (x, y) per le quali x ≤ y e non esiste
alcun altro elemento z tale che x ≤ z ≤ y; in questo caso, prendendo come convenzione che un arco è
sempre diretto dal basso verso l’alto, ritroviamo i diagrammi di Hasse, introdotti nella Sezione 1.2. Una
corrispondenza tra due insiemi A e B può essere rappresentata da un grafo i cui vertici sono gli elementi
di A ⊎ B e i cui archi collegano elementi di A e di B
in corrispondenza tra loro; si tratta di un grafo un
po’ particolare e lo si dice bipartito. La terminologia
relativa ai grafi riflette la loro generalità.
Il concetto di albero binario di ricerca fa parte
di una serie di oggetti combinatori importanti, che
possiamo classificare addirittura come modello.
Il modello dei grafi. La seguente definizione introduce il concetto di “grafo” e di alcune sue
Definizione 4.3 Sia dato un grafo G = (V, A); si
varianti.
dice cammino di G una sequenza finita di vertici di
Definizione 4.2 Un grafo è una coppia G = (V, A), V , diciamo (v0 , v1 , . . . , vh ), per i quali {vi , vi+1 } è un
dove V è un insieme finito di elementi detti vertici o arco di A per i = 0, 1, . . . , h − 1. Un cammino per il
nodi, di solito rappresentati graficamente da punti; se quale v0 = vh si dice un ciclo. Nei grafi orientati può
D è l’insieme dei sottoinsiemi di due elementi di V , si esistere il ciclo formato dal solo arco (v, v), il quale
ha A ⊆ D; ogni {x, y} ∈ A si dice un arco o spigolo, e più propriamente viene detto laccio. Se G è un grafo
si rappresenta con una linea che unisce i due vertici pesato, il peso di un cammino è la somma dei pesi
interessati. Un grafo orientato è una coppia Go = degli archi che lo compongono. Il grafo G si dice con(V, A), dove V è come prima, ed A ⊆ V 2 , di modo nesso se, presi comunque due suoi vertici v, v ′ , esiste
che ogni arco orientato (x, y) ∈ A è rappresentato da almeno un cammino che va da v a v ′ . Dato un vertiuna freccia da x ad y; se sono presenti i due archi ce v, si dice componente connessa di v l’insieme dei
114
CAPITOLO 4. MATEMATICHE FINITE
nel
©
©©
©
©
©©
©©
mezzo
mi
@
@
¡
q¡
di
@
@
che
¡
q¡
nostra
q¡
¡
@
@
del
cammin
¡
q¡
HH
H
¡
q¡
@
@q
@
@q
@
@q
vita
¡
¡
ritrovai
¡
¡
HH
H
@
@q
¡
¡
per
¡
¡
oscura
q¡
¡
@
@
@
@q
@
@q
una
¡
q¡
selva
@
@q
@
@q
Figura 4.3: La parte iniziale dell’albero binario di ricerca della Divina Commedia
vertici v ′ del grafo per i quali esiste un cammino da v
a v ′ ; un grafo connesso ha un’unica componente connessa. Un albero è un grafo connesso e privo di cicli.
Se G è un grafo connesso, un albero di ricoprimento
di G è un sottografo di G che sia un albero contenente tutti i vertici di G. Se G è pesato, un albero
minimo di ricoprimento è un albero di ricoprimento
che abbia peso minimo rispetto a tutti gli altri alberi
di ricoprimento.
che i sottoalberi di sinistra e di destra non possono
essere scambiati tra di loro, cioè, in altre parole, i rami che partono da un nodo hanno un ordine che non
può essere ignorato.
La teoria dei grafi è vastissima e qui non possiamo
dare che una vaga idea di alcune parti molto limitate.
Un problema classico è il seguente: riprendiamo il
grafo connesso della Figura 4.4 e chiediamoci se è
possibile partire da uno dei suoi vertici e disegnarlo
in un unico tratto, senza staccare la matita dal foglio,
L’albero minimo di ricoprimento ha grande impor- e senza ripassare due volte per lo stesso arco. Già
tanza in molte applicazioni dei grafi, poiché rappre- Eulero aveva dimostrato:
senta il modo di raggiungere tutti i vertici del grafo
con un costo, o peso, globalmente minimo. Il con- Teorema 4.19 Sia G = (A, V ) un grafo; è possibile
cetto di albero, presentato in questa maniera, può partire da un vertice v ∈ V e disegnare il grafo con
lasciare abbastanza sconcertati, almeno in un primo un sol tratto di matita (senza staccare la matita dal
momento, e sarebbe forse meglio parlare di “struttu- foglio) e senza ripassare due volte per lo stesso arco
ra arborescente”, ma tant’è. Se fra i nodi di un albe- se e solo se il numero dei vertici di grado dispari è al
ro scegliamo un nodo particolare, questo viene detto più 2 (cioè, è 0 oppure 2).
la radice dell’albero e l’albero, più propriamente, si
Prova: Per poter entrare e uscire da un vertice senza
chiama albero con radice; da un albero con n nodi si
usare lo stesso arco occorre che il grado del vertice
possono derivare n alberi con radice. Come abbiamo
sia 2, o comunque sia pari. Se il grado è dispari, vi
già fatto con gli alberi binari di ricerca, si preferisce
si può entrare ma non uscire, o viceversa. Quindi,
mettere la radice in alto e far crescere l’albero verso
se i vertici di grado dispari sono più di 2, uno di
il basso; è una semplice convenzione, che torna bene
questi nodi bloccherà il disegno (lasciamo al lettore
per il nostro modo di scrivere da sinistra a destra e
la dimostrazione, abbastanza ovvia, che non possono
dall’alto in basso. Nella Figura 4.5 abbiamo riportaesistere grafi con un numero dispari di nodi di grado
to un albero con radice e la sua rappresentazione più
dispari!).
usuale.
Il grafo della Figura 4.4 ha due vertici di grado
La presenza della radice fa sı̀ che, praticamente, gli
archi (detti anche rami) di un albero con radice sia- tre: uno si può usare come vertice di partenza, l’altro
no orientati, esattamente dall’alto verso il basso. Da d’arrivo; con questa considerazione il disegno riesce
questo fatto deriva l’usanza di parlare del grado di un facilmente. Lo stesso Eulero aveva osservato la senodo come del suo grado d’uscita; cosı̀ nell’esempio guente proprietà fondamentale. Un grafo si dice plaprecedente, il grado di a è 4, quello di c è 2 e quello di nare se si può disegnare sul piano senza che i suoi
e è 0. In questo senso, gli alberi binari di ricerca sono archi si incrocino; si chiama faccia di un grafo plaalberi con radice i cui nodi hanno grado 0 oppure 2. nare ogni parte del piano delimitata dagli archi del
Si aggiunge che sono orientati per sottolineare il fatto grafo, cioè da alcuni dei suoi cicli; si considera che la
115
4.5. IL MODELLO DELLE PAROLE
rd
A
A
A
rb
A
Acr
¢
¢
¢
¢
¢r e
¢
¢
¢
r¢f
f
r
©
¢ a
©©
i©
r ©
©©HH
jr
©
©
©
H
kr
HHr
h
r
g
ar
³f
PP
³¡
³
@
@ PP P
³
¡
³³
PPi r
@r
³
¡
r
r
b
c
¢S
¢A
¢ S
¢ A
¢
A
S
¢
¢
S
A
¢
Ar
Sr
r¢
r¢
r
d
e
g
h
j
rk
Figura 4.5: Albero con radice e sua rappresentazione convenzionale
cioè la loro rappresentazione lineare, come stringa di
caratteri, invece che quella grafica. Per costruire un
albero binario, noi partiamo da una delle n! permutazioni di un insieme S di n elementi; è facile tuttavia
rendersi conto che non esistono n! alberi binari diverTeorema 4.20 Sia G = (V, A) un grafo connesso e si. Ad esempio, con n = 3 si hanno 6 permutazioni,
indichiamo con v, a, f il numero dei suoi vertici, dei ma solo 5 alberi binari:
suoi archi e delle sue facce. Si ha allora la relazione
s
s
s
s
s
di Eulero: f + v = a + 2.
@
@
¡
¡
¡@
¡
¡
¡
@
@
@
¡
Prova: Usiamo il principio di induzione matematica
@s @ s
s
s¡
s¡
@s
¡
@
¡
sul numero dei vertici che compongono il grafo. Se
@
¡
@
¡
il grafo si compone di un unico vertice, si hanno due
@
@s
s¡
s¡
@s
possibili situazioni:
parte esterna al grafo costituisca una delle sue facce.
Nel caso della Figura 4.4, si hanno in tutto 6 facce.
Un albero ha un’unica faccia, essendo per definizione
privo di cicli. Si ha allora:
Infatti, l’albero centrale viene generato tanto dalla
permutazione (2, 1, 3) quanto da (2, 3, 1). Si pone alv
s
lora il problema: quanti alberi binari distinti corrispondono alle permutazioni di n elementi? Ragioniamo in questa maniera: consideriamo un albero con
n + 1 nodi; esso sarà composto dalla radice, da un
La prima situazione corrisponde a (v = 1, f = 1, a = sottoalbero di sinistra con k nodi (con k variabile tra
0) e la seconda a (v = 1, f = 2, a = 1) e per entrambe 0 ed n) e un sottoalbero di destra che, di conseguenza,
vale la relazione di Eulero. Si supponga allora che tale conterrà n − k nodi. Sia Ck il numero totale di alberi
relazione valga per v vertici e aggiungiamo un vertice distinti con k nodi; poiché ogni sottoalbero di siniulteriore x. Poiché il grafo deve rimanere connesso, si stra con k nodi può essere associato un sottoalbero
devono aggiungere anche 1 o più archi che partono da di destra con n − k nodi, si hanno in tutto:
o arrivano ad x, mantenendo la planarità del grafo.
n
X
Se se ne aggiunge uno solo, il numero della facce non
C
=
Ck Cn−k
′
′
′
n+1
cambia e si ha (v = v +1, f = f, a = a+1), e quindi
k=0
la relazione di Eulero vale ancora. Se si aggiungono
k archi, questi devono dividere la stessa faccia, quella
alberi binari con n+1 nodi. Questa formula permette
in cui abbiamo inserito x; ma questo genera k − 1
di calcolare uno dietro l’altro il valore dei Cn , partenfacce, che si aggiungono alla precedente e quindi si
do dalla “condizione iniziale” C0 = 1; infatti, esiste
ha (v ′ = v + 1, f = f + k − 1, a′ = a + k), e la
un unico albero con 0 nodi, ed esattamente l’albero
relazione di Eulero vale ancora.
vuoto. Si ha allora:
m
s
v
4.5
Il modello delle parole
Il modello delle parole: Il secondo problema posto
dagli alberi binari di ricerca è la loro linearizzazione,
C1
C2
C3
C4
=
=
=
=
=
C0 C0 = 1 · 1 = 1
C0 C1 + C1 C0 = 1 · 1 + 1 · 1 = 2
C0 C2 + C1 C1 + C2 C0 = 2 + 1 + 2 = 5
C0 C3 + C1 C2 + C2 C1 + C3 C0 =
5 + 2 + 2 + 5 = 14.
116
CAPITOLO 4. MATEMATICHE FINITE
Dopo aver capito bene il gioco degli indici di questa somma di prodotti, il lettore è caldamente invitato a calcolare il valore di C4 ed, eventualmente, di
C5 . E’ possibile dimostrare (ma noi non ci proveremo
nemmeno) che vale la formula generale:
µ ¶
1
2n
Cn =
n+1 n
che però il lettore verificherà con i valori appena calcolati. I numeri Cn si dicono numeri di Catalan, dal
nome del matematico belga che li studiò per primo
alla metà del 1800.
Un’espressione parentesizzata è una sequenza di
parentesi “[” e “]” che si conformi alle usuali regole di
apertura e chiusura. Esiste un’unica espressione con
una sola coppia di parentesi: [ ]; ne esistono due con
due coppie: [[ ]], [ ][ ], e ne esistono 5 con tre coppie:
[[[ ]]], [[ ][ ]], [[ ]][ ], [ ][[ ]], [ ][ ][ ].
Si considera la sequenza vuota come l’unica
espressione con 0 coppie di parentesi. Si ha:
Teorema 4.21 Esistono tanti alberi binari di ricerca
con n nodi quante espressioni parentesizzate con n
coppie di parentesi.
Prova: Consideriamo un albero binario e indichiamo con una coppia di parentesi la sua radice; quindi
inseriamo tra queste due parentesi la rappresentazione del suo sottoalbero di sinistra e alla loro destra
la rappresentazione del suo sottoalbero di destra. La
rappresentazione dell’albero vuoto è la stringa vuota.
Di conseguenza, ad ogni albero binario con n nodi
corrisponde un’espressione parentesizzata con n coppie di parentesi (una per nodo). Ad alberi diversi
corrispondono ovviamente espressioni diverse (la corrispondenza è iniettiva) ed ogni espressione parentesizzata proviene da un albero, in quanto la costruzione si può invertire (la corrispondenza è surgettiva).
In conclusione, la corrispondenza è biunivoca, come
si voleva.
Nella prima metà degli anni 1950, il linguista Noam
Chomski introdusse il concetto di linguaggio formale
nel tentativo di creare uno strumento adatto a modellare il linguaggio naturale. Il suo concetto di grammatica formale (o semplicemente grammatica) è stato
effettivamente usato a tale scopo, ma il maggior successo l’ha avuto in Informatica. Qui, esso è stato
usato per almeno tre scopi fondamentali:
1. come strumento teorico per formulare la teoria
della computabilità, cioè la teoria che cerca di
stabilire quali problemi sono risolubili da un punto di vista computazionale. Le grammatiche di
Chomski di tipo 0 sono una formulazione alternativa alle macchine di Turing, alle funzioni parzialmente ricorsive, al λ-calcolo, agli algoritmi
normali di Markov e alle altre impostazioni della
teoria;
2. come metodo pratico per definire con precisione quelle lingue artificiali che sono i linguaggi di
programmazione. Le grammatiche di tipo 2 sono
correntemente usate sia per dare una formulazione esatta di linguaggi come Pascal, C o Java, sia
per dirigere la loro “traduzione” nel linguaggio
macchina del particolare elaboratore utilizzato
dal programmatore;
3. come strumento per la definizione formale delle
strutture dati usate nei programmi, per lo studio del loro comportamento e, quindi, per la valutazione della loro efficienza nella risoluzione di
determinati problemi.
Questo ultimo è l’argomento che qui particolarmente ci interessa, anche se dovremo limitare
drasticamente le nostre considerazioni.
Prima di addentrarci negli aspetti più formali; cerchiamo di capire, con un semplice esempio non del
tutto banale, qual era l’idea di Chomski. Nella Tabella 4.2 riportiamo una piccola “grammatica formale” che vorrebbe dare una vaga idea di come si possa
definire una frase nominale, qui indicata dal simbolo
hfrasei; le parentesi a punta “h” e “i” sono utilizzate
per delimitare un simbolo che si vuole considerare come unico, anche se composto da lettere e altri segni,
che danno un aiuto mnemonico per capire e ricordare
il significato del simbolo stesso, in questo caso una
“frase nominale”.
Il simbolo “::=” significa “si può pensare come”, e
quindi una frase nominale si può pensare come: un
soggetto, seguito da uno spazio (il simbolo “⊔”), seguito da una copula, seguito da uno spazio, seguito
infine da una sequenza di aggettivi. Questo, semplificando molto, è ciò che ci aspettiamo da una frase
nominale. Il soggetto si può pensare come un nome
proprio hnomei oppure (tale è il significato della barra verticale “|”) un articolo seguito da un sostantivo.
I nomi propri che consideriamo sono solo quattro, ma
potrebbero essere tutti quelli che riusciamo ad immaginare, purché in numero finito. La barra verticale si
usa per creare tante alternative quante si desiderano.
Si noti che una lista di aggettivi è costituita da un
unico aggettivo, oppure da vari aggettivi separati da
virgole (cioè, una sequenza di aggettivi), ma l’ultimo
è separato dagli altri dalla congiunzione E.
Ogni alternativa è detta una produzione, nel senso che il simbolo di sinistra produce i vari simboli
di destra. Partendo da hfrasei, l’applicazione delle
produzioni, da sinistra verso destra, cambia hfrasei
in altre sequenze, generando alla fine una sequenza di
lettere (senza più simboli tra parentesi a punta) che
4.5. IL MODELLO DELLE PAROLE
hfrasei
hsoggettoi
hnomei
harticoloi
hsostantivoi
hfinalei
hcopulai
hseq. agg.i
hlista agg.i
haggettivoi
::=
::=
::=
::=
::=
::=
::=
::=
::=
::=
117
hsoggettoi ⊔ hcopulai ⊔ hseq. agg.i
hnomei | harticoloi ⊔ hsostantivoi
PAOLO | CHIARA | SARA | ANTONIO
IL | LO | LA | I | GLI | LE
RAGAZZhfinalei | SARThfinalei | CAVALLhfinalei
A|E|I|O
E′ | SONO | ERA | ERANO
haggettivoi | hlista agg.i ⊔ E ⊔ haggettivoi
haggettivoi | hlista agg.i, ⊔haggettivoi
BELLhfinalei | BIONDhfinalei | PICCOLhfinalei | ALThfinalei
Tabella 4.2: Una grammatica formale
costituisce un esempio valido di frase nominale. Ecco
un semplice esempio di generazione:
che è davvero sgrammaticata. In realtà, la grammatica formale non tiene conto del contesto, cioè di cosa
sta vicino a ciascun elemento della frase: l’articolo
hfrasei
deve concordare in numero e genere con il sostantivo;
questo determina il numero della copula, e cosı̀ via.
hsoggettoi ⊔ hcopulai ⊔ hseq. agg.i
Per questo, una grammatica del genere si dice libera
dal
contesto. Chomski introdusse anche grammatiharticoloi⊔hsostantivoi⊔hcopulai⊔hseq. agg.i
che contestuali più realistiche, ma dal nostro punto
LA ⊔ hsostantivoi ⊔ hcopulai ⊔ hseq. agg.i
di vista sono troppo complesse e meno interessanti.
La notazione adottata nella Tabella 4.2 si dice BacLA ⊔ SARThfinalei ⊔ hcopulai ⊔ hseq. agg.i
kus Normal Form (BNF) perché inventata da Backus
per adattare le grammatiche di Chomski alla definiLA ⊔ SARTA ⊔ hcopulai ⊔ hseq. agg.i
zione dei linguaggi di programmazione, in particolare
LA ⊔ SARTA ⊔ ERA ⊔ hseq. agg.i
dell’Algol’60. Essa fa capire in modo immediato il
LA ⊔ SARTA ⊔ ERA ⊔ hlista agg. ⊔ E ⊔ haggettivoi significato dei vari simboli, il che è molto utile quando si ha a che fare con decine o centinaia di simboli
LA ⊔ SARTA ⊔ ERA ⊔ haggettivoi ⊔ E ⊔ haggettivoi diversi, come accade in linguaggi abbastanza vasti
LA⊔SARTA⊔ERA⊔PICCOLhfinalei⊔E⊔haggettivoi (anche se relativamente semplici), quali sono quelli
usati nella programmazione. Normalmente, tali simLA ⊔ SARTA ⊔ ERA ⊔ PICCOLA ⊔ E ⊔ haggettivoi
boli si dicono “non terminali” e si indicano con lettere dell’alfabeto greco. Formalmente, una grammatica
LA ⊔ SARTA ⊔ ERA ⊔ PICCOLA ⊔ E ⊔ BIONDhfinalei
libera dal contesto, o anche, con terminologia inglese
abbastanza accettata, context-free è una quadrupla
LA ⊔ SARTA ⊔ ERA ⊔ PICCOLA ⊔ E ⊔ BIONDA
G = (T, N, σ, P) dove:
Questo è l’aspetto generativo della grammatica,
cioè delle produzioni che costituiscono la gramma1. T è l’insieme dei simboli terminali;
tica formale. Tante altre frasi di senso compiuto si
2. N è l’insieme dei simboli non terminali; T ∩ N =
possono generare, come:
∅;
PAOLO ⊔ E′ ⊔ ALTO
3. σ ∈ N è il simbolo iniziale;
I ⊔ RAGAZZI ⊔ SONO ⊔ BIONDI, ⊔ALTI ⊔ E ⊔ BELLI
4. P è un insieme di produzioni: una produzione è
Se leggiamo la derivazione dal basso verso l’alto, abuna coppia (π, x) dove π ∈ N e x ∈ (T ∪N )∗ , cioè
biamo la divisione strutturale della frase, che metx è una parola di T ∪ N , eventualmente vuota.
te in chiaro quale sia il soggetto, quale la copula e
quale o quali gli aggettivi (aspetto strutturale della Supponiamo che w = w1 αw2 sia una parola su T ∪N ,
che α ∈ N e w1 non contenga il simbolo α, cioè l’α
grammatica).
Purtroppo, la grammatica genera anche frasi del indicata sia l’occorrenza più a sinistra di tale simbolo.
Se w′ = w1 yw2 e (α, y) è la i-esima produzione di P,
tipo:
allora si dice che w genera immediatamente w′ e si
scrive w ⊢i w′ o semplicemente w ⊢ w′ , se non si
GLI ⊔ CAVALLE ⊔ ERA ⊔ PICCOLA ⊔ E ⊔ ALTI
118
CAPITOLO 4. MATEMATICHE FINITE
vuol mettere l’accento sulla produzione considerata. è ambigua; 2) le parole di L(G) sono le sequenze di
Si dice poi che w0 genera wn se esistono n − 1 parole 0/1 nelle quali lo 0 è isolato e non si trova né in cima
né in fondo; 3) le parole di L(G) di lunghezza n sono
w1 , w2 , . . . , wn−1 tali che risulti:
contate dall’n-esimo numero di Fibonacci Fn .
w0 ⊢ w1 ⊢ w2 ⊢ · · · ⊢ wn−1 ⊢ wn ;
Accenniamo alla dimostrazione di quest’ultima
proprietà. Sia L(G) il linguaggio generato dalla
questa catena di generazioni si dice la derivazione sigrammatica; la produzione (φ, 1) ci dice che 1 ∈ L(G)
nistra di wn da w0 e si scrive w0 ⊢∗ wn . Si dice
e che quindi ǫ 6∈ L(G), se ǫ è la sequenza vuota; quininfine linguaggio generato dalla grammatica G l’indi L(G) non contiene sequenze di lunghezza 0, e ne
sieme delle parole su T generate dal simbolo iniziale
contiene una sola di lunghezza 1. Ciò corrisponde alle
σ, cioè formalmente:
condizioni iniziali F0 = 0 e F1 = 1 dei numeri di Fibo∗
∗
nacci.
Per quanto riguarda la ricorrenza, osserviamo
L(G) = {w ∈ T | σ ⊢ w}.
che la produzione (φ, φ1) ci dice che una sequenza di
La grammatica G si dice non ambigua se ogni parola lunghezza n che termina con 1 proviene da un’unica
di L(G) può essere generata in uno e un solo modo sequenza di lunghezza n − 1. La produzione (φ, φ01)
da σ attraverso una derivazione sinistra.
ci dice che una sequenza che termina con 01 provieA questo punto un esempio è fortemente richiesto. ne da un’unica sequenza di lunghezza n − 2. Poiché
Sia T = {[, ]}, di modo che i simboli terminali del queste sono le uniche produzioni, tali considerazionostro linguaggio siano le due parentesi; sia poi N = ni corrispondono alla ricorrenza Fn = Fn−1 + Fn−2 ,
{∆} e, di conseguenza, σ = ∆; infine, l’insieme delle e ciò è sufficiente a dimostrare il nostro asserto, che
produzioni sia:
le parole di Fibonacci di lunghezza n sono proprio
contate dell’n-esimo numero di Fibonacci.
P = {(∆, [ ])1 , (∆, [∆])2 , (∆, [ ]∆)3 , (∆, [∆]∆)4 },
dove l’indice sta ad indicare il numero d’ordine del4.6 Il calcolo delle proposizioni
la produzione per semplificare la comprensione del
seguente esempio. Vediamo infatti la derivazione
Il calcolo delle proposizioni è una teoria che tratta del
sinistra della parola [[ ]][ ]:
modo in cui si possono elaborare le espressioni proposizionali per calcolarne il valore di verità e/o per
∆ ⊢4 [∆]∆ ⊢1 [[ ]]∆ ⊢1 [[ ]][ ].
trasformare proposizioni in altre equivalenti. Questo
Si osservi che, quando sono presenti più simboli non calcolo si basa sul concetto di equivalenza tra proterminali uguali, la produzione si deve applicare al posizioni: due proposizioni sono equivalenti quando,
simbolo più a sinistra e da questa regola è nato il ter- scelti comunque i valori di verità delle proposizioni
mine di “derivazione sinistra”. Questa grammatica elementari che le compongono, i valori di verità delnon è ambigua; lasciamo al lettore il non facilissimo le due proposizioni coincidono. Il lettore verificherà
compito di provare questo fatto; suggeriamo di di- che si tratta proprio di una relazione di equivalenza.
mostrare che ogni parola di L(G) ha una e una sola Le proposizioni sono costruite a partire da un certo
decomposizione secondo le produzioni di P. E’ invece numero (non meglio specificato) di proposizioni elefacile osservare che L(G) è composto di tutte e sole mentari p, q, r, . . . e dai tre connettivi logici negazione
le espressioni parentesizzate (eccetto quella vuota), e ¬, congiunzione ∧, disgiunzione ∨, e le parentesi per
quindi G è un metodo formale per definire gli albe- regolare la precedenza delle operazioni.
ri binari di ricerca, nella loro forma linearizzata. Da
La tabella di verità di una proposizione è una taquesta definizione, in effetti, è possibile derivare una bella che, in funzione dei diversi e possibili valori di
serie di proprietà degli alberi binari di ricerca, delle verità delle funzioni elementari, dà il valore di verità
quali, tuttavia, facciamo grazia al lettore. Notiamo della proposizione. Una tabella di verità si costruisolo che questa è una delle tante vie per dimostrare sce a partire dalle tabelle di verità dei tre connetla validità della formula di Catalan.
tivi logici, viste nel Capitolo 1. Possiamo dire che
Concludiamo con due ulteriori grammatiche. La due proposizioni sono equivalenti se e solo se hanno
prima è abbastanza ovvia e fa uso della paro- la stessa tabella di verità. Si consideri ad esempio
la vuota ǫ: T = {a, b, c}, N = {σ} e P = la proposizione: (p ∧ ¬q) ∨ r, e si osservi la Tabella
{(σ, ǫ), (σ, aσ), (σ, bσ), (σ, cσ)}. Lasciamo al lettore 4.3. Sulla sinistra abbiamo riportato tutte le possibili
la dimostrazione, questa volta semplice, del fatto combinazioni dei valori di verità delle tre proposizioche L(G) = {w ∈ T ∗ }. La seconda grammati- ni elementari p, q, r. Nella colonna ¬q si è riportato
ca è meno ovvia: T = {0, 1}, N = {φ}, σ = φ, il valore della negazione di q e, analogamente, nelP = {(φ, 1), (φ, φ1), (φ, φ01)}. In questo caso il let- la colonna p ∨ ¬q abbiamo valutato il risultato della
tore dovrebbe dimostrare che: 1) la grammatica non disgiunzione tra p e la negazione di q. Infine, con
119
4.6. IL CALCOLO DELLE PROPOSIZIONI
p
0
0
0
0
1
1
1
1
q
0
0
1
1
0
0
1
1
r ¬q
0 1
1 1
0 0
1 0
0 1
1 1
0 0
1 0
p ∨ ¬q
1
1
0
0
1
1
1
1
(p ∨ ¬q) ∧ r
0
1
0
0
0
1
0
1
Tabella 4.3: Calcolo di una tabella di verità
vuol dire (¬p ∨ q) ∧ (¬q ∨ p) = (¬p ∧ ¬q) ∨ (¬p ∧ p) ∨
(¬q ∧q)∨(p∧q) = ¬(p∨q)∨(p∧q) = (p∨q) → (p∧q):
il lettore è invitato a costruire le varie tabelle di verità. La proposizione p ⊕ q indica l’esclusione fra p e
q e la sua tabella di verità è giusto la negazione della
doppia implicazione:
p
0
0
1
1
q p⊕q
0
0
1
1
0
1
0
1
la tabella di verità della congiunzione, si è calcolata E’ bene osservare che essa si calcola facendo la somma
l’ultima colonna, che rappresenta proprio la tabella (modulo 2) dei valori di verità di p e q: nel caso che
sia p = q = 1, si ha p + q = 2, ma: 2 mod 2 = 0
di verità della proposizione (p ∨ ¬q) ∧ r.
(vedere Definizione 2.4).
Nota 4.6
Il calcolo combinatorio ci dice che vi
Ciò che è interessante nella Tabella 4.4 è il fatsono 8 possibili combinazioni dei valori 0/1 da asso- to che le regole esposte non solo trasformano una
ciare alle tre proposizioni p, q, r. Esistono vari metodi, proposizione in un’altra proposizione ad essa equiestendibili a 4 o più proposizioni, per scriverle in modo valente, ma date due espressioni equivalenti, cioè con
sistematico.
la stessa tabella di verità, esse permettono di tra1. la colonna di p è costituita da quattro 0 e da sformare l’una nell’altra. Per il momento, limitiaquattro 1; la colonna di q da due 0 e da due moci ad un esempio. Si consideri la proposizione:
1, seguiti da altri due 0 e due 1; la colonna di (¬p ∧ ¬q ∧ r) ∨ (p ∧ ¬q ∧ r) ∨ (p ∧ q ∧ r) e se ne
r è fatta da 0 e 1 in sequenza. Lasciamo per costruisca la tabella di verità: si osserva allora che
esercizio estendere questa regola a quattro o più tale tabella coincide con quella di (p ∨ ¬q) ∧ r. Come
proposizioni;
possiamo trasformare questa in quella? Se riusciamo
2. partendo dalla combinazione composta di tutti in tale impresa, applicando le regole all’inverso (esse
0, si procede cambiando da 0 in 1 l’ultimo 0 pre- sono tutte simmetriche) si ottiene una trasformaziosente nella combinazione. Contemporaneamen- ne di quella in questa: è quindi sufficiente trovare
te, si cambiano in 0 tutti gli 1 che lo seguono una qualsiasi della due trasformazioni. Partiamo da
(se ce ne sono). La validità di questo modo di (p ∨ ¬q) ∧ r e applichiamo la proprietà distributiva;
procedere è più nascosta, ma il metodo funziona! si ha:
3. se leggiamo le combinazioni come numeri in base
(p ∨ ¬q) ∧ r ≡ (p ∧ r) ∨ (¬q ∧ r).
2 (v. alla fine della Sezione 1.5) vediamo apparire tutti i numeri da 0 a 7. In generale, si hanno i
numeri da 0 a 2n − 1 e un po’ di esercizio insegna
come scriverli facilmente uno dopo l’altro.
Qualche prova è sufficiente a capire come procedere.
Per mezzo delle tabelle di verità è possibile dimostrare una serie di proprietà formali del calcolo delle
proposizioni; lasciando al lettore la cura delle verifiche, abbiamo elencato nella Tabella 4.4 le principali
proprietà. Una proposizione che come p ∨ ¬p risulta sempre vera si dice una tautologia; una che come
p ∧ ¬p è sempre falsa, si dice una contraddizione.
Per quanto abbiamo visto nella Sezione 1.7, l’implicazione p → q è equivalente a ¬p ∨ q. Questo
ci dice subito che p → q non è la stessa cosa della sua contraria q → p, che equivale a p ∨ ¬q. Invece, la contropositiva di p → q è ¬q → ¬p, cioè
¬¬q ∨ ¬p = q ∨ ¬p = ¬p ∨ q, quindi coincide proprio
con p → q. La doppia implicazione (p → q) ∧ (q → p)
Questo è un passo notevole, poiché ci ha portato a
una disgiunzione di congiunzioni, proprio come la
proposizione d’arrivo. L’inconveniente è che nella prima disgiunzione manca la q e nella seconda manca la
p. La regola di identità p ∧ 1 = p ci dice che possiamo
inserire degli 1 in ogni congiunzione:
(p ∧ r) ∨ (¬q ∧ r) ≡ (p ∧ 1 ∧ r) ∨ (1 ∧ ¬q ∧ r) ≡
La regola del complemento p ∨ ¬p = 1 ci permette
ora di inserire q e p nei posti giusti:
≡ (p ∧ (q ∨ ¬q) ∧ r) ∨ ((p ∨ ¬p) ∧ ¬q ∧ r) ≡
Di nuovo, la legge distributiva ci permette di tornare
ad una disgiunzione di congiunzioni:
≡ (p∧q ∧r)∨(p∧¬q ∧r)∨(p∧¬q ∧r)∨(¬p∧¬q ∧r) ≡
Naturalmente, le varie applicazioni delle proprietà associativa e commutativa nemmeno si citano: però ci
120
CAPITOLO 4. MATEMATICHE FINITE
commutativa
associativa
distributiva
assorbimento
idempotenza
complemento
identità
zero
doppia negazione
de Morgan
p∨q =q∨p
p∧q =q∧p
p ∨ (q ∨ r) = (p ∨ q) ∨ r
p ∧ (q ∧ r) = (p ∧ q) ∧ r
p ∨ (q ∧ r) = (p ∨ q) ∧ (p ∨ r) p ∧ (q ∨ r) = (p ∧ q) ∨ (p ∧ r)
p ∨ (q ∧ p) = p
p ∧ (q ∨ p) = p
p∨p=p
p∧p=p
p ∨ ¬p = 1
p ∧ ¬p = 0
p∨0=p
p∧1=p
p∨1=1
p∧0=0
¬¬p = p
¬(p ∨ q) = ¬p ∧ ¬q
¬(p ∧ q) = ¬p ∨ ¬q
Tabella 4.4: Le regole del calcolo proposizionale
sono. Ora osserviamo che la due congiunzioni cen- sono falsi (la sua tabella di verità è la negazione della
trali sono la stessa, e la proprietà di idempotenza ci disgiunzione, detta or in inglese, da cui il nome nor).
Per il lemma precedente: p nor q = ¬p ∧ ¬q. Tale
permette di concludere:
lemma sembra molto particolare, ma si può estendere
≡ (p ∧ q ∧ r) ∨ (p ∧ ¬q ∧ r) ∨ (¬p ∧ ¬q ∧ r),
immediatamente, coinvolgendo anche la disgiunzione:
che è quanto volevamo dimostrare.
Questo successo potrebbe essere solo un caso, come potrebbe essere casuale il fatto che in precedenza
siamo riusciti ad esprimere i connettivi dell’implicazione, della doppia implicazione e dell’esclusione mediante i connettivi booleani. Ci poniamo pertanto le
seguenti, fondamentali questioni:
Lemma 4.23 Si consideri un connettivo che abbia
una tabella di verità composta da almeno un 1; allora
tale connettivo è esprimibile mediante i tre connettivi
booleani.
Prova: Si considerino, nella tabella di verità del connettivo, le linee corrispondenti al valore 1; il lemma
precedente ci dà modo di esprimere (mediante nega1. E’ vero che i connettivi booleani permettono zione e congiunzione) il connettivo che avesse quel sodi esprimere tutti i possibili connettivi fra lo 1. La disgiunzione di tutti questi connettivi vale 1
proposizioni?
solo in corrispondenza delle linee per cui il connettivo
è vero, cioè, in altre parole, il connettivo di partenza
2. E’ vero che due proposizioni sono equivalenti
e tale disgiunzione di congiunzioni sono equivalenti.
(hanno la stessa tabella di verità) se e solo se
è possibile trasformare l’una nell’altra mediante
Si riprenda la tabella di verità dell’esclusione; il
le regole della Tabella 4.4?
lemma ci dice:
La risposta ad entrambe le domande è positiva ed ora
cercheremo di darne la dimostrazione. Cominciamo
p ⊕ q = (¬p ∧ q) ∨ (p ∧ ¬q)
con il seguente
il che vuol dire: “(non andremo al supermercato ma
Lemma 4.22 Si consideri un connettivo che abbia andremo dal commercialista) oppure (andremo al suuna tabella di verità composta da un unico 1, men- permercato ma non andremo dal commercialista)”, il
tre tutti gli altri valori sono 0; allora, tale connettivo che è proprio quello che ci aspettiamo. La conclusione
si può esprimere tramite i due connettivi booleani di è allora:
negazione e di congiunzione.
Teorema 4.24 Un qualsiasi connettivo è esprimibile
Prova: Siano p, q, r, . . . le proposizioni elementari mediante i tre connettivi booleani.
su cui è costruito il connettivo. Si osservi che una
congiunzione è vera se e soltanto se risultano vere le Prova: Se la tabella di verità del connettivo consingole proposizioni elementari che la compongono. tiene almeno un 1, vale il lemma precedente. Se non
Se allora si considera la congiunzione delle proposi- contiene alcun 1, il connettivo è una contraddizione.
zioni elementari per cui il connettivo risulta vero e Se ne consideri la negazione; essa ha una tabella tutta
della negazione delle proposizioni per cui risulta fal- composta di 1, per la quale vale ancora il lemma preso, tale congiunzione è vera se e solo se risulta vero il cedente; la negazione di ciò che si ottiene è pertanto
equivalente al connettivo dato.
connettivo, cioè è ad esso equivalente.
Un connettivo molto importante è il cosiddetto
Secondo questo teorema, ogni connettivo è esprinor, definito come vero se e solo se i suoi argomenti mibile in una forma standard, come disgiunzione di
121
4.6. IL CALCOLO DELLE PROPOSIZIONI
tante congiunzioni, ognuna contenente tutte le proposizioni elementari coinvolte (o la loro negazione).
Tale forma si dice la forma canonica disgiuntive della proposizione. Esiste anche una forma canonica
congiuntiva, composta dalla congiunzione di tante disgiunzioni. Non insistiamo oltre su questo punto, ma
vediamo piuttosto come la forma canonica disgiuntiva ci permetta di rispondere alla seconda domanda
che ci eravamo posti.
Teorema 4.25 Data una qualsiasi proposizione
espressa mediante i connettivi booleani, essa può essere trasformata nella sua forma canonica disgiuntiva
mediante le regole della Tabella 4.4.
Prova: Le due proprietà distributive e le leggi di
de Morgan permettono di ridurre ogni proposizione
composta ad una serie di disgiunzioni di congiunzioni. Nelle congiunzioni possono non essere presenti
tutte le proposizioni elementari: mediante l’aggiunta
di 1 = p∨¬p si introducono le proposizioni elementari
mancanti. Si usano di nuovo le proprietà distributive
per riportarci a una disgiunzione di congiunzioni, che
questa volta contengono tutte le proposizioni elementari. Infine, la proprietà di idempotenza permette di
togliere le congiunzioni uguali.
L’esempio precedente illustra in modo semplice
questo teorema, dal quale discende la risposta alla
nostra domanda:
Teorema 4.26 Due proposizioni sono equivalenti se
e solo se possono essere trasformate l’una nell’altra
mediante le regole della Tabella 4.4.
Prova: Siano P e Q le due proposizioni; se si può
trasformare P in Q, allora P e Q sono equivalenti,
poiché ogni regola della Tabella 4.4 conserva l’equivalenza. Viceversa, supponiamo che P e Q siano equivalenti. Per il lemma precedente possiamo trasformare
P e Q nelle loro forme canoniche disgiuntive P1 e Q1 ;
avendo P e Q la stessa tabella di verità, deve essere P1 = Q1 . La trasformazione che da P porta a P1
più la trasformazione inversa da Q1 a Q costituiscono
una trasformazione di P in Q, come si voleva.
I due teoremi meriterebbero diversi commenti; ci
limitiamo ai seguenti due:
1. Per la proprietà espressa dal Teorema 4.24, i tre
connettivi booleani si dicono costituire un insieme universale di connettivi. In realtà i tre connettivi sono sovrabbondanti perché, per le leggi
di de Morgan, si ha: ¬(¬p ∧ ¬q) = ¬¬p ∨ ¬¬q =
p ∨ q e quindi la disgiunzione può essere sostituita da congiunzione e negazione (è vero anche
che la congiunzione può essere sostituita da disgiunzione e negazione; non è vero invece che la
negazione possa essere sostituita dagli atri due
connettivi: provare a dimostrare!). Naturalmente, esistono altri insiemi universali di connettivi:
uno famoso e importante è costituito da negazione e implicazione. Per vederlo, basta dimostrare
che la disgiunzione è esprimibile tramite questi
due connettivi; ma poiché p → q = ¬p ∨ q, abbiamo p ∨ q = (¬p) → q. Ma la cosa più straordinaria è che, nella seconda metà del 1800, il
famoso logico (e geologo e astronomo e mille altre cose) Charles Peirce dimostrò l’esistenza di
connettivi che, da soli, costituiscono un insieme
universale. Uno di questi è p nor q = ¬(p ∨ q),
il nor che abbiamo già introdotto. Un altro è
p nand q = ¬(p ∧ q), il cui nome è coniato dall’inglese and che indica la congiunzione. Si noti
che p nor p = p nand p = ¬p, ma lasciamo al
lettore il piacere di esprimere congiunzione o disgiunzione o implicazione mediante nor e nand.
Forse qui è bene ricordare che Peirce è anche
l’inventore delle tabelle di verità.
2. Il calcolo delle proposizioni, con i suoi teoremi
conclusivi, è un esempio di teoria troppo semplice: praticamente, sappiamo tutto ciò che c’è
da sapere su ogni proposizione. Questo, purtroppo, non succede nella realtà, che è molto più
complicata. Ciò è dovuto alla rigidità del concetto di proposizione; come osservato a suo tempo,
le frasi vere o false in assoluto sono poche e, soprattutto, poco interessanti, in quanto riguardano fatti specifici o convenzioni verbali. Di solito
siamo interessati (specie in Matematica) ad affermazioni molto generali. Ad esempio, asserire
che un certo triangolo rettangolo ha i lati lunghi
3, 4 e 5 m, è asserire un fatto apparentemente accidentale; molto più interessante è il teorema di Pitagora, che ci dice qualcosa su tutti
i triangoli rettangoli. Come abbiamo visto, per
questo esiste una teoria più vasta del calcolo delle proposizioni, cioè il calcolo dei predicati. Nel
calcolo dei predicati, teoremi conclusivi analoghi
ai precedenti proprio non esistono.
Nota 4.7
Il calcolo delle proposizioni si è rivelato
di fondamentale importanza in Informatica. Prima
di tutto, le tabelle di verità permettono di progettare
i calcolatori elettronici. Il principio è il seguente: si
consideri la somma di due bit, che indicheremo con p
e q. La loro somma è data da p ⊕ q e il riporto da
p ∧ q; se si possono realizzare fisicamente i connettivi
booleani (o un qualsiasi altro insieme universale di
connettivi) si possono realizzare anche questi connettivi e quindi ottenere marchingegni che eseguono
la somma (o qualsiasi altra operazione). Un metodo
per realizzare elettricamente i connettivi booleani è
quello di mettere due circuiti in serie (congiunzione)
e in parallelo (disgiunzione), oppure di comandare un
circuito mediante un relé (negazione). Cosı̀ furono
122
CAPITOLO 4. MATEMATICHE FINITE
costruiti i primi calcolatori elettrici; si passò poi a
quelli elettronici, ma i principi rimasero gli stessi,
e sono gli stessi anche oggi quando le operazioni
vengono eseguite tramite circuiti integrati. Il contributo del calcolo delle proposizioni all’Informatica
non si limita a questo: esso governa le condizioni
di esecuzione di un programma, intervenendo nelle
istruzioni condizionali (tipo if e case) e in quelle
iterative (tipo for, while e repeat).
4.7
Calcolo delle probabilità
Il 1600 è stato un secolo interessante da molti punti
di vista. In concomitanza con il nascere della scienza
moderna, si vide, con il consolidarsi dei grandi stati
nazionali, il sorgere di un interesse nuovo dei governi
nei confronti dei cittadini, visti fino ad allora come
semplici oggetti del potere. Già alla fine del 1500 il
sovrano francese Enrico IV (1553 – 1610, re dal 1594
dopo aver giudicato che Parigi valeva bene una messa) aveva affermato “Voglio che ogni paesano abbia il
suo pollo in pentola”. Ma questo atteggiamento paternalistico dei sovrani era motivato da tre esigenze
di razionalizzazione:
1. come far rimpinguare le casse dello stato attraverso le tasse e altri mezzi per spillare soldi ai
cittadini;
2. come gestire i nuovi, grandi eserciti nazionali, al
tramonto delle milizie mercenarie;
le due facce come testa (T ) e croce (C). Se le lanciamo e registriamo le facce che si presentano, possiamo ad esempio avere a = T, b = T, c = C, d = T .
Possiamo gettare un’altra volta le monete e ottenere ora a = C, b = T, c = C, d = C. Se ci chiediamo quante possibili configurazioni diverse si possono
ottenere, un ragionamento che abbiamo già visto e
tipico dell’analisi combinatoria, ci dice che esse sono
24 = 16. Come si sa, e come vedremo, la connessione
tra calcolo delle probabilità e analisi combinatoria è
fortissima. Infatti, se ora vogliamo sapere quante volte possiamo ottenere due teste e due croci, l’analisi
combinatoria ci viene ancora in aiuto. Pensiamo alle quattro monete come a un insieme A = {a, b, c, d}
e a un singolo lancio come a un sottoinsieme di A,
esattamente composto dalle monete che hanno dato
testa: le altre sono determinate di conseguenza. Ad
esempio, il primo dei lanci precedenti è equivalente al
sottoinsieme {a, b, d} e il secondo a {b, d}. E’ chiaro
che, viceversa, il sottoinsieme vuoto corrisponde a un
lancio con tutte croci e il sottoinsieme A a un lancio
con tutte teste. Allora, i lanci con due teste e due
croci corrispondono ai sottoinsiemi di A formati di
due elementi, cioè sono le combinazioni di
¡ 4¢ elementi
a 2 a 2, che, come ora sappiamo, sono 42 = 6. In
altre parole, sulle 16 configurazioni possibili, che si
ottengono lanciando quattro monete, 6 corrispondono a 2 teste e 2 croci. In generale, possiamo dire che,
se abbiamo n monete, le possibili configurazioni otte¡ ¢
nute in un lancio sono 2n ; di queste, ve ne sono nk
che presentano k teste e, di conseguenza, n − k croci.
3. come interagire con la borghesia, sempre più
Di solito, questi problemi si formulano come quesiti
economicamente rilevante, sia nelle attività
sulle
probabilità: quante sono le probabilità che lantradizionali sia nella nascente industria.
ciando quattro monete si ottengano esattamente due
Fu allora inventata una nuova scienza che, trattan- teste e due croci? Il ragionamento di prima ci dice
do della conduzione razionale dello Stato, fu detta che tali probabilità sono 6 su 16. Cerchiamo di formaStatistica.
lizzare un po’ meglio questi concetti: si supponga di
Da quel tempo la Statistica si è evoluta, sia nei voler considerare un certo insieme di eventi, ad esemmetodi di ricerca sia nei campi applicativi; di fatto pio il lancio di monete. Si dicono eventi possibili gli
essa è diventata una metodologia di studio di tut- elementi dell’insieme, talvolta detto insieme univerti i fenomeni, naturali e artificiali, indispensabile alla so. Si noti che il concetto di evento non è definibile;
Fisica, alla Chimica, alla Biologia, alla Medicina e al- con un tipico gioco verbale abbiamo appena cambiato
l’Informatica. La Statistica è una scienza tipicamente l’idea di evento in quella di elemento di un insieme,
sperimentale, che rileva ed elabora dati, e, come tutte concetto che a questo punto ci dovrebbe essere più fale scienze sperimentali, si avvale di una serie di meto- miliare, ancorché esso pure sia stato lasciato, ai suoi
di e di tecniche matematiche, che nel loro insieme e tempi, indefinito. Si isoli ora una classe particolare
nella loro formulazione costituiscono una vera e pro- di eventi nell’insieme considerato, come ad esempio
pria teoria, il cosiddetto calcolo delle probabilità. Ci “i lanci che danno 2 teste e 2 croci”; gli elementi di
proponiamo pertanto di introdurre i primissimi rudi- questa classe si dicono eventi favorevoli. La probabimenti di questa branca della Matematica, e di cercare lità che si verifichi un evento della classe particolare
di capire i rapporti che essa ha con la sua controparte si definisce come il rapporto tra il numero degli evensperimentale, cioè la statistica.
ti favorevoli e il numero degli eventi possibili. Nel
Supponiamo di avere quattro monete, che distin- nostro esempio, la probabilità di avere 2 teste e 2
gueremo con le lettere a, b, c, d; distinguiamo anche croci o, se si preferisce, esattamente due teste sulle 4
123
4.7. CALCOLO DELLE PROBABILITÀ
monete del lancio, è:
π4,2 =
6
= 0.375.
16
Da questa definizione discende che la probabilità π
è sempre un numero compreso tra 0 ed 1: 0 ≤ π ≤ 1.
Se la classe degli eventi favorevoli coincide con l’insieme degli eventi possibili, allora la probabilità è 1;
considerato che un qualsiasi evento possibile è certamente anche un evento favorevole, la probabilità
π = 1 si dice anche certezza. Viceversa, se la classe
degli eventi favorevoli è vuota, il rapporto che ci dà
la probabilità è π = 0; in questo caso, è impossibile che un qualsiasi evento sia favorevole, e quindi la
probabilità π = 0 si dice anche impossibilità.
Fissato l’insieme di tutti gli eventi da considerare,
la divisione in classi dei singoli eventi dipende ovviamente dal problema che stiamo trattando. Se, ad
esempio, gli “eventi” sono gli alunni di una scuola,
possiamo pensare a diverse divisioni: in maschi e femmine, in base al mese di nascita, in base al colore dei
capelli o degli occhi, e cosı̀ via. Gli eventi che appartengono a classi disgiunte si dicono indipendenti tra
di loro; è questo un concetto molto importante, sul
quale ritorneremo tra breve. Il numero di eventi che
appartengono a una certa classe si dice la frequenza
di quella classe. Nell’esempio del lancio delle monete,
la divisione degli eventi (o lanci) in base al numero di
monete che presentano testa, è una divisione in classi
disgiunte. In tal caso si può dare una rappresentazione grafica della distribuzione dei vari eventi nelle diverse classi, disegnando un diagramma nel quale ogni
classe è raffigurata da una colonna, la cui altezza è
proporzionale alla frequenza degli eventi nella classe.
Poiché, come s’è visto, la probabilità è data dal rapporto fra la frequenza e il totale degli eventi possibili,
tali colonne risultano automaticamente proporzionali anche alla probabilità che si verifichi un evento di
quella classe. Se consideriamo il lancio di 8 monete,
la probabilità che in un lancio si ottengano k teste è
data dalla formula:
µ ¶
µ ¶
1 8
1 8
=
.
π8,k = 8
2 k
256 k
Basta prolungare il triangolo aritmetico fino alla riga
n = 8 per ottenere le frequenze di ciascuna classe.
Nella Figura 4.6 abbiamo dato questa rappresentazione, che è detta istogramma. Un istogramma evidenzia visivamente la distribuzione degli eventi nelle
classi che ci interessano, purché queste siano a due
a due disgiunte, cioè corrispondano a classi di eventi tra loro indipendenti. Il concetto di indipendenza
è molto importante e le seguenti regole, che abbiamo già avuto occasione di adoperare, vanno tenute
sempre presenti:
1. la probabilità che si verifichi almeno uno di due
o più classi di eventi indipendenti è dato dalla
somma delle probabilità di ciascuna delle classi;
2. la probabilità che si verifichi una data sequenza di classi di eventi indipendenti è data dal
prodotto delle probabilità delle singole classi.
0
1
2
3
4
5
6
7
8
Figura 4.6: Distribuzione binomiale
Nota 4.8
Il nostro insistere sul fatto che gli eventi non sono altro che elementi di un insieme non è
ovviamente casuale. Riprendendo cose che abbiamo
introdotto proprio all’inizio, l’insieme degli eventi possibili può essere identificato con l’insieme universo U ;
se questo è finito, saranno finiti anche i suoi sottoinsiemi. Una partizione di U (Sezione 1.1) è un modo
per definire una distribuzione degli elementi di U . Se
A ⊂ U , la frequenza di A coincide con card(A), e
quindi si ha:
card(A)
π(A) =
card(U )
come definizione di probabilità. Ad ogni operazione
sull’insieme delle parti di U , cioè P(U ), corrisponde un
assegnamento di probabilità al risultato. Ad esempio,
π(A) = 1 − π(A); se A e B sono disgiunti, si ha π(A ∪
B) = π(A)+π(B) e π(A∩B) = 0, in quanto π(U ) = 1
e π(∅) = 0: qui si ritrovano i concetti di certezza e impossibilità. Purtroppo, se A e B non sono disgiunti,
card(A∩B) può assumere diversi valori, ed esattamente 0 ≤ card(A ∩ B) ≤ min(card(A), card(B)); questo
implica che per le probabilità si abbia:
0 ≤ π(A ∩ B) ≤ min(π(A), π(B)).
Se ne deduce subito, guardando i diagrammi di Venn
della Figura 1.1:
π(A ∪ B) = π(A) + π(B) − π(A ∩ B).
π(A ∩ B) = π(A) + π(B) − π(A ∪ B).
Un’altra proprietà importante è la seguente: sia
P1 , P2 , . . . , Pn , una partizione di U e sia A ⊆ U ; allora
si ha:
π(A) = π(A ∩ P1 ) + π(A ∩ P2 ) + · · · + π(A ∩ Pn ).
124
CAPITOLO 4. MATEMATICHE FINITE
Naturalmente, esistono infinite altre proprietà, ma su
di esse qui non possiamo insistere.
Si voglia risolvere il seguente problema: in una classe
vi sono 12 maschi e 14 femmine; di questi allievi, 16
abitano nel centro della città e 10 vengono dalla periferia. Sapendo che il totale delle femmine e di coloro
che abitano in periferia è di 20 allievi, qual è la probabilità che un maschio abiti in città? Dette M, F e
C, P le due partizioni di U , possiamo indifferentemente ragionare sulle cardinalità o sulle probabilità. L’ultima condizione significa π(F ∪ P ) = 20/26 e quindi
la probabilità che una femmina abiti in periferia è:
π(F ∩ P ) = π(F ) + π(P ) − π(F ∪ P ) =
10
20
4
14
+
−
=
.
26
26
26
26
Da questo segue che π(M ∩ P ), cioè la probabilità che
un maschio abiti in periferia, è:
=
π(M ∩ P ) = π(P ) − π(F ∩ P ) =
10
4
6
−
=
.
26
26
26
Infine, quello che ci interessa è:
π(M ∩ C) = π(M ) − π(M ∩ P ) =
=
6
6
12
−
=
≈ 23.1%.
26
26
26
Questa impostazione dei concetti della probabilità va
bene per gli insiemi finiti, ma non funziona più per
quelli infiniti, quando card(U ) non è un numero naturale. Si consideri ad esempio un quadrato di lato ℓ
nel quale è contenuto un triangolo equilatero con la
base coincidente con uno dei lati del quadrato; si vuol
sapere qual è la probabilità che, preso a caso un punto del quadrato, esso appartenga al triangolo. Il ruolo
della cardinalità è qui preso dall’area che, in qualche
modo, conta il numero di punti contenuti in una figura. L’area del quadrato
è Aq = ℓ2 , mentre l’area
√
del triangolo è At = 3ℓ2 /4 (si veda, più avanti, il
Teorema 6.29); la probabilità cercata è pertanto:
√
√
3 2 1
3
At
ℓ · 2 =
≈ 0.433 = 43.3%.
=
Aq
4
ℓ
4
Questa osservazione, per quanto banale, è alla base
della teoria moderna del calcolo delle probabilità,
che fa parte della più vasta Teoria della Misura, quel
settore della Matematica che si interessa del calcolo
integrale.
Pascal iniziò a interessarsi del triangolo aritmetico
per studiare i giochi che allora si stavano affermando,
sia per divertire i ricchi, sia per cavare soldi alla povera gente per mezzo delle varie lotterie, a carattere
locale e nazionale. Un gioco si dice equo se una puntata x su un evento E viene ricompensata, in caso di
vittoria, con una cifra y inversamente proporzionale
alla probabilità di verificarsi dell’evento E. Ad esempio, sulla roulette la probabilità che la pallina si fermi
su un dato numero n è 1/37 a causa della presenza
dello 0. Il gioco sarebbe equo se, in caso di vittoria, il banco pagasse 37 volte la puntata, cioè la cifra
giocata. Ciò assicurerebbe un equilibrio statistico fra
vincite e perdite, cosı̀ che a lungo andare ci sarebbe
un sostanziale pareggio tra banco e giocatori (almeno
nella loro globabilità, non certo per ogni singolo giocatore). Come è noto la roulette paga solo 36 volte la
posta, congelando le puntate nel caso che la pallina si
fermi sullo 0. Questo rende il gioco non equo; statisticamente, ad ogni giro il banco guadagna, in media,
quasi 1/37 di tutte le giocate; alla fine della giornata
(o della nottata) il vantaggio è enorme e questo costituisce il guadagno del gestore (a parte le tasse di
concessione che deve dare allo Stato). Analogamente,
come abbiamo visto, giocando un ambo su una ruota,
la probabilità di vincere è:
µ ¶.µ ¶
5
90
10
π=
=
.
2
2
4005
Quindi, alla giocata di 1 e, in caso di vincita dovrebbe essere pagati 400.50 e; in effetti, lo Stato paga
242.50 e e il resto va a favore dell’erario. In pratica,
se 10 mila giocatori giocano un ambo puntando 1 e
ciascuno, lo Stato incassa 10. 000 e e paga 6062.50 e
ai 25 vincitori (in media, uno ogni 400). Il guadagno
medio dello stato è pertanto di 3937.50 e.
Occorre ora chiarire qual è il rapporto tra il calcolo delle probabilità e la statistica. Fino a questo
punto abbiamo parlato soprattutto di insiemi, e la
realtà concreta è stata appena accennata, citando il
lancio delle monete, il gioco del lotto e la roulette.
In effetti, abbiamo guardato a questi giochi come a
giochi astratti, senza effettuare dei veri lanci o delle
vere estrazioni. Prendiamo allora 4 monete e, muniti
di santa pazienza, facciamo una serie di lanci, registrando ogni volta su un foglio il numero delle teste
che otteniamo. Fare anche solo 100 lanci è alquanto noioso, e servirebbe meglio ai nostri scopi farne
1000 o 10. 000. Oggi queste cose si fanno col calcolatore, simulando con opportuni programmi il lancio
delle monete, e allora è un attimo simulare centomila o un milione di lanci. Nel 1600 s’era costretti a
procedere a mano e c’era gente che passava la vita
a fare esperimenti del genere; nel 1800 le cose non
erano diverse, come ci informa Dostoevskij. Tutti sono invitati a provare, manualmente e/o al calcolatore,
perché l’esercizio è veramente utile per rendersi conto
delle cose.
Quando diciamo che la probabilità di ottenere testa
nel lancio di una moneta è il 50%, in realtà non abbiamo misurato proprio niente, né tanto meno abbiamo
contato una qualche quantità legata alla moneta o
ai suoi lanci. Ciò che intendiamo, è affermare che
non esiste alcuna ragione plausibile perché testa debba uscire invece di croce. La stessa cosa si può dire
125
4.7. CALCOLO DELLE PROBABILITÀ
quando affermiamo che ogni faccia di un dado uscirà
con probabilità 1/6. Tali probabilità, che assegniamo con un qualche vago criterio di equità, si dicono
probabilità a-priori, e riflettono le nostre aspettative
sul verificarsi (o meno) di certi eventi. Al contrario, quando si effettuano dei lanci, reali o simulati
sull’elaboratore, possiamo contare gli eventi che mano mano si verificano, ottenendo cosı̀ vere frequenze. E’ da queste frequenze che ricaviamo le probabilità, che pertanto si dicono prababilità statistiche o
a-posteriori.
Non è filosoficamente banale tradurre uno nell’altro
i due concetti di probabilità a-priori e a-posteriori.
Nel caso della moneta, se su mille lanci otteniamo
ft = 504 teste ed fc = 496 croci, non ci sentiamo
affatto di rivedere la nostra intuizione che vorrebbe
si verificassero 500 teste e altrettante croci. Ottenere un risultato cosı̀ equo, andrebbe contro il nostro
concetto di casualità, ricordandoci alla larga una sequenza 0, 1, 0, 1, 0, . . ., tutt’altro che casuale. La distribuzione 504/496 ci porta a dire che la probabilità
a-posteriori conferma la probabilità a-priori. L’idea che coltiviamo è proprio questa: al crescere del
numero n dei nostri lanci, i rapporti ft /n e fc /n tendano entrambi ad avvicinarsi ad 1/2, e affibbiamo
l’imaginifico nome di fluttuazioni statistiche alle differenze, che speriamo piccole, fra frequenza statistica
ft o fc e frequenza teorica n/2. Vedremo nella prossima sezione di dare criteri più oggettivi per stabile
se e quando una distribuzione empirica (fatta di probabilità a-posteriori) si conforma a una distribuzione
teorica (composta di probabilità a-priori).
Facciamo un esempio un po’ più articolato. Con
l’aiuto dell’elaboratore, simulando 160. 000 lanci di
quattro monete, ho ottenuto questi risultati:
n. teste
simulaz.
teoria
0
10063
10000
1
39951
40000
2
60060
60000
3
39891
40000
4
10035
10000
è già convincente, ma in Matematica non si possono
fare le cose ad occhio. Esistono dei test (ad esempio,
il cosiddetto test del chi quadro) che ci permettono
di dire quand’è che, ragionevolmente, l’accordo c’è e
quando, invece, possiamo con buona sicurezza asserire che tale accordo non ci sia. Vedremo queste cose
nella prossima sezione, anche se in modo piuttosto
veloce e senza troppi approfondimenti.
Una domanda abbastanza naturale è la seguente:
lanciamo sı̀ le nostre quattro monete, ma qual è il
numero medio di teste che ci aspettiamo di ottenere
in un gran numero di lanci? Cominciamo col considerare una sequenza di dati che indicheremo con
{x1 , x2 , . . . , xn }; si dice media o valor medio o valore
atteso di questi dati il rapporto tra la loro somma e
il loro numero, cioè:
n
1
1X
x = (x1 + x2 + · · · + xn ) =
xj
n
n j=1
P
dove il simbolo
indica la somma di termini omogenei, individuati da un indice, variabile dall’estremo
indicato in pedice fino all’estremo indicato in apice
(vedere la fine della Sezione 2.8). Ad esempio, se in
una stanza vi sono cinque persone di altezza, rispettivamente: 1.72, 1.63, 1.84, 1.80, 1.71, la loro altezza
media è (1.72+1.63+1.84+1.80+1.71)/5 = 8.70/5 =
1.74. Si noti che, nonostante il nome di “valore atteso”, la media non è il valore che ci aspettiamo possa
avere un elemento del nostro insieme, preso a caso;
infatti, nessuna delle persone nella stanza è alta 1.74.
Piuttosto, la media indica il valore che ci permette di
prevedere, col minor errore possibile, il valore di un
elemento qualsiasi della serie considerata.
Talvolta, come nel caso dei nostri lanci, abbiamo
una divisione degli elementi in classi e di ogni classe
abbiamo la frequenza: 0 teste si ottengono con una
sola configurazione, 1 testa con 4 configurazioni, e
cosı̀ via. In altre parole, se si hanno h classi, il valore
x1 è assunto con frequenza f1 , il valore x2 con frequenza f2 , e via di seguito fino al valore xh assunto
con frequenza fh . In tal caso il numero totale di dati
è f1 + f2 + · · · + fh = n e quindi la media è data dalla
formula:
Ph
x1 f1 + x2 f2 + · · · + xh fh
j=1 xj fj
.
x=
= Ph
f1 + f2 + · · · + fh
j=1 fj
L’ultima riga contiene il numero di lanci teorico, cioè
quanti avrebbero dovuto essere i lanci di ciascun tipo se la prova pratica, la simulazione, si conformasse perfettamente alla teoria. Tali valori si ottengono
moltiplicando 160.000, il numero di prove, per la probabilità¡ di¢ ottenere quel certo numero di teste, ovvero
π4,k = k4 /16. In pratica è impossibile che i dati relativi a una simulazione coincidano pari pari con ciò
che prevede la teoria: anzi, quando in un esperimento Nel caso dei lanci si ha:
di statistica ci dà valori troppo vicini a quelli previ1×0+4×1+6×2+4×3+1×4
sti dalla teoria, si può addirittura pensare a qualche
= 2.
x=
1+4+6+4+1
imbroglio, messo in atto per “far tornare” le cose.
D’altra parte, quanto al più si possono discostare i
Nota 4.9
La media non corrisponde nemmeno al
dati sperimentali da quelli teorici affinchè si possa
valore con la massima frequenza, anche se l’esempio
affermare che i primi confermano i secondi (o viceprecedente ci potrebbe far pensare una cosa del geneversa)? Nel nostro caso, un confronto “ad occhio”
re. Ad esempio, all’ultimo appello 13 studenti hanno
126
superato il mio esame: due hanno preso 21, sei hanno
avuto 24, uno solo ha preso 25 e ci sono poi stati tre
28 e un 30. La media (2 × 21 + 6 × 24 + 1 × 25 +
3 × 28 + 1 × 30)/13 = 325/13 = 25, e uno solo degli
studenti ha avuto 25. Il valore della sequenza che ha
la frequenza maggiore, cioè il più gettonato, si dice
la moda; nell’esempio, la moda è costituita dal valore
24. Più importante è però il concetto di mediana. Si
consideri la nostra sequenza di dati (riprendiamo ad
esempio quella dell’altezza delle cinque persone) e la
si ordini in modo tale da mettere i dati stessi con valori mai decrescenti; tale ordinamento si dice sequenza
per rango e la posizione assunta da ogni elemento si
dice il rango di quell’elemento. Per le altezze si ha
(1.63, 1.71, 1.72, 1.80, 1.84). Il valore mediano o mediana della distribuzione è l’elemento centrale di tale
sequenza ordinata. Nell’esempio delle altezze, la mediana vale 1.72; nel caso dei voti è 24, corrispondente
al settimo voto nella disposizione per rango. Se i dati
sono in numero pari, ci sono due elementi centrali; in
tal caso, la mediana è data dalla semisomma di tali
due elementi.
La media considerata si chiama anche aritmetica, per
distinguerla da altri tipi di media che si considerano
talvolta, anche se più raramente. La media geometrica
sostituisce il prodotto alla somma e, di conseguenza,
la radice n-esima alla divisione per n. Formalmente,
se i dati sono a1 , a2 , . . . , an , la loro media geometrica
è definita da:
√
G = n a1 a2 . . . a n ;
CAPITOLO 4. MATEMATICHE FINITE
dei quadrati degli scostamenti dei singoli dati dalla
loro media. Lo scostamento di xj dalla media x è la
differenza (xj − x) e quindi si ha:
σ2 =
(x1 − x)2 + (x2 − x) + · · · + (xn − x)2
=
n
n
=
1X
(xj − x)2 .
n j=1
Il simbolo σ 2 è universalmente usato per indicare la
varianza di una distribuzione; σ, la radice quadrata
della varianza, indica la cosiddetta deviazione standard. Nel caso delle persone nella stanza, le altezza
uguali danno varianza 0, le altezze che crescono uniformemente danno varianza 0.0002 e la distribuzione
di partenza dà 0.0086. In generale, la varianza è zero
se e solo se tutti i dati coincidono col valore medio, e
va crescendo mano mano che i dati se ne discostano.
In altre parole, la varianza è tanto più grande quanto
più i dati tendono ad essere lontani dalla media, cioè
la varianza è un indicatore della dispersione dei dati
intorno al loro valore medio.
4.8
Distribuzioni
Un po’ di buon senso, o l’esperienza, ci fanno intuire
che, lanciando le nostre otto monete, è più probabile
se tutti i dati sono uguali ad a, abbiamo G = a, come ottenere una distribuzione bilanciata, come 4 teste
ci si deve aspettare. La media armonica è un po’ più e 4 croci, piuttosto che una molto sbilanciata, come
8 teste oppure 8 croci. Invece, giocando a carte, alla
complessa e si definisce come:
roulette o al lotto, ci aspettiamo che ogni carta o ogni
−1
−1
−1
H = ((a−1
,
1 + a2 + · · · + an )/n)
numero sia equiprobabile, e anche se qualcuno insiste
cioè come l’inverso della media aritmetica degli nel voler giocare al lotto i numeri che non escono
inversi delle quantità considerate. Si può dimostrare da più tempo, sa razionalmente che tale metodo non
che la media armonica è sempre minore o uguale alla gli sarà più favorevole del giocare del tutto a caso,
media geometrica che, a sua volta, è sempre minore essendo impossibile che le giocate passate possano in
o uguale della media aritmetica A, cioè H ≤ G ≤ A; qualche modo influenzare la prossima estrazione.
l’uguaglianza si ha se e solo se tutti i dati sono uguali.
Si dice che, durante la seconda guerra mondiale,
Il lettore può controllare che con due soli dati a1 = 5 quando ormai la Statistica era una disciplina ben noe a2 = 7 si ha A = 6, G = 5.916 e H = 5.833.
ta, l’esercito americano ordinasse a una ditta di conCome vedremo con l’Algoritmo 6.8, la media geofezioni bel 35. 000 divise in sette misure diverse; e la
metrica fornisce un metodo assai interessante per
.
il calcolo di π, il rapporto tra circonferenza e diametro. ditta consegnò 7 000 divise di ciascuna misura. Fu
cosı̀ che le misure medie non bastarono e quelle piccole e grandi avanzarono in grande quantità. Non so
Se nella nostra stanza avessimo cinque persone come finı̀ la storia, ma oggi qualsiasi negozio di scarpe
tutte alte 1.74, la loro altezza media sarebbe an- ordina molte misure medie (37 – 38 per la donna, 41
cora 1.74; e cosı̀ sarebbe se le persone fossero alte – 42 per l’uomo) e poche misure estreme come un 35
(1.72, 1.73, 1.74, 1.75, 1.76). La vecchia distribuzione o un 41 femminili, un 39 o un 45 maschili. Chi, come
è la meno omogenea, mentre la più omogenea è quella me, calza il 39, sa quante difficoltà si incontrano per
delle persone con la stessa altezza. Questa osserva- trovare un modello di nostro gradimento, proprio per
zione ci dice che la media di una distribuzione non la scarsità delle scarpe di tale numero.
Com’è che ci aspettiamo uniformità da una parte
mette in evidenza come i vari elementi si discostano
dal loro valore medio. Per questo esiste il concetto di (roulette, lotto) e variabilità dall’altra (altezza, nuvarianza : la varianza di una distribuzione è la media mero di scarpe, taglia)? Come dimostra il caso della
127
4.8. DISTRIBUZIONI
ditta americana, le nostre previsioni sono legate all’intuito, all’esperienza o alla mancanza dell’uno e/o
dell’altra. Per questo, la Statistica e il Calcolo delle Probabilità cercano di dare un’impostazione più
scientifica e razionale al nostro modo di affrontare
quella parte della realtà che appare governata dalla
casualità.
Fortunatamente, la natura sembra adeguarsi ad alcuni schemi (non molti, per la verità) che possono essere studiati in modo sistematico: come conclude Dostoevskij, “nel susseguirsi delle probabilità favorevoli
c’è, se non un sistema, un certo qual ordine”. In tal
modo, pur rimanendo impossibile prevedere il singolo
caso (come cerca di fare il giocatore), è abbastanza
facile prevedere in modo accurato l’andamente di un
gran numero di eventi: è questo che aiuta le aziende
di scarpe e di confezioni, che hanno dalla Statistica
indicazioni precise sulle percentuali da produrre per
ciascuna taglia. Se consideriamo il numero di persone che calzano una certa misura di scarpe, otteniamo
la distribuzione dei numeri di scarpa; se misuriamo
l’altezza degli abitanti di Milano e raggruppiamo tali
altezze di centimetro in centimetro, abbiamo la distribuzione dell’altezza dei milanesi; se, come facevano i
giocatori di Dostoevskij, contiamo le volte che viene
estratto ciascun numero della roulette, abbiamo la
distribuzione di tali numeri. Queste sono distribuzioni empiriche, legate alla frequenza dei singoli eventi,
ma è possibile studiare teoricamente tali distribuzioni chiamando in campo il Calcolo delle Probabilità.
Come si diceva, le distribuzioni teoriche alle quali si
conformano la gran parte delle distribuzioni empiriche, sono stranamente poche. Noi, poi, ne introdurremo solo quattro, per semplificarci ancor di più la
vita.
1. Distribuzione uniforme. Lanciando una moneta o un dado, giocando al lotto o alla roulette, ci
aspettiamo che ogni evento (testa o croce, una faccia
da 1 a 6, un numero tra 0 e 36, o un numero tra 1
e 90) abbia la stessa probabilità di verificarsi di ciascun altro evento. La corrispondente distribuzione di
frequenze è perciò costituita da un istogramma con
tutte le colonne della stessa altezza. I giocatori di Dostoevskij avrebbero dovuto trovare che ognuno dei 37
numeri della roulette ha una frequenza d’uscita vicina
a tutti gli altri. Le oscillazioni che si possono riscontrare sono irrisorie di fronte alla frequenza registrata
e possono essere compensate continuando a registrare le uscite successive. Semmai, si pone il problema
di avere un criterio (o test, come si dice tecnicamente) per stabilire se, effettivamente, queste oscillazioni
sono casuali o siano dovute a una possibile “truccatura” dell’apparecchio della roulette. Vedremo più
avanti un possibile test.
Nota 4.10
La distribuzione uniforme ha assunto
un ruolo fondamentale con l’avvento degli elaboratori elettronici. Infatti, per mezzo di essa è possibile
simulare anche le altre distribuzioni. E’ quindi importante avere un metodo efficace per produrre elementi
distribuiti in modo uniforme. In realtà, l’elaboratore
non è assolutamente in grado di produrre eventi casuali, in quanto esso è, per definizione, una macchina
deterministica, cioè prevedibile in tutto quello che fa.
Fortunatamente, la Matematica mette a disposizione
alcune tecniche che permettono di produrre distribuzioni che, pur non essendo casuali, hanno tutti i crismi
della casualità. Vengono pertanto dette distribuzioni pseudocasuali, e possono essere usate benissimo in
luogo della distribuzione uniforme. Si consideri un numero primo p e il gruppo Z∗p composta da φ(p) = p − 1
elementi. Tale gruppo è ciclico, e quindi esistono numeri a, con 0 < a < p che generano tutto il gruppo, cioè {a, a2 , a3 , . . . , ap−1 } sono tutti gli elementi di
Z∗p . Questi elementi, nell’ordine appena detto, anche
se tale ordine è del tutto determinato, posseggono le
caratteristiche delle sequenza casuali, e costituiscono
pertanto una sequenza pseudocasuale. Ad esempio, se
p = 11, le potenze di 7 sono:
7 5 2 3 10 4 6 9 8 1
che, ad occhio, forniscono una permutazione ragionevolmente casuale dei numeri da 1 a 10, cioè gli elementi
di Z∗11 . Se poniamo a = 7 ed s = 1, il calcolo della sequenza può essere impostato semplicemente ponendo,
iterativamente:
s = as mod p
di modo che il calcolo di ogni potenza successiva di
a richiede solo un prodotto e una divisione; da questa formula, questo metodo di generazione viene detto
congruenziale. Se volessimo utilizzare la sequenza per
generare una serie di lanci di una moneta o di un dado, basterebbe ridurre i numeri modulo 2 e modulo
6. Nel caso del dado, bisogna poi aggiungere 1, ma
questo è banale. Le sequenze sono:
moneta
dado
1101000101
2634551432
e ad occhio ci appaiono anch’esse ragionevolmente
casuali.
Naturalmente, p = 11 è solo un esempio, e dopo
10 numeri la sequenza si ripete, di modo che non
possiamo proprio pensare di utilizzarla in applicazioni
che coinvolgono migliaia, o anche milioni, di scelte casuali. Un numero più adeguato è p = 999999999989,
assai vicino a 1012 . In questo modo, il numero
s/1012 è un numero reale compreso tra 0 ed 1, e ciò
serve ad avere una distribuzione uniforme continua;
essa permette di ottenere ciascun numero reale
nell’intervallo [0, 1) (con 12 cifre decimali) con la
stessa probabilità. Questi numeri possono essere
interpretati come probabilità e quindi costituiscono
una buona distribuzione per tutti i problemi pratici
che li debbano utilizzare.
128
CAPITOLO 4. MATEMATICHE FINITE
2. Distribuzione binomiale. Se lanciamo due o
più monete e contiamo il numero di teste e di croci
ottenute, abbiamo visto come non si ottenga più una
distribuzione uniforme, ma entrino in gioco i coefficiente binomiali. La probabilità che gettando n monete si abbiano k teste, e quindi n − k croci, è data
dalla formula:
µ ¶.
n
2n .
πn,k =
k
¡ ¢
Infatti, nk corrisponde agli eventi favorevoli, mentre 2n sono gli eventi possibili. La stessa cosa capita
nel lancio di due o più dadi, anche se in questo caso
la faccenda è più complicata a causa delle sei facce. Prendiamo n dadi, lanciamoli e chiediamoci qual
è la probabilità che escano esattamente k facce col
numero 1. Ognuna delle k facce ha probabilità 1/6
di apparire e poiché i dadi hanno un destino indipendente l’uno dall’altro, la probabilità che appaiano esattamente k facce è (1/6)k . Ricordiamo infatti,
dalla sezione precedente, che le probabilità si moltiplicano quando corrispondono al verificarsi successivo
di eventi indipendenti. Analogamente, la probabilità
che una faccia non presenti il numero 1 è 5/6, e quindi
la probabilità che n − k facce non presentino il nujmero 1 è (5/6)n−k . Infine, occorre valutare in quanti
modi diversi vi siano esattamente k facce 1 fra le n
facce
¡n¢ dei nostri dadi. Ma questo è facile e i modi sono
k , cosı̀ che la probabilità cercata è:
πn,k
due dadi è dato dalle combinazioni: 1 + 4, 2 + 3,
3 + 2 e 4 + 1. Poiché due dadi danno luogo a 36
diverse configurazioni, la probabilità di ottenere 5 è
4/36 = 1/9 ≈ 0.1111 . . ., cioè un po’ più dell’11%. Se
il numero dei dadi cresce, è un interessante problema
combinatorio trovare tutte le possibili configurazioni
che danno un certo numero N . Il problema è uno
dei classici di questa disciplina, studiato fin dai tempi di Eulero e detto il problema delle partizioni di un
intero. Originariamente, il problema consisteva nel
trovare in quanti modi è possibile formare un numero
intero; ad esempio:
4=1+3=2+2=3+1=1+1+2=1+2+1=
= 2 + 1 + 1 = 1 + 1 + 1 + 1.
La configurazione 1 + 3 può essere considerata uguale
alla 3 + 1 e allora il modello cambia. Nel nostro caso,
è richiesto che gli addendi siano un numero fissato
n e il loro valore non ecceda un limite superiore (6
nel caso dei dadi). Non ci possiamo addentrare in
questa materia, ma usando quattro dadi si ottiene
l’istogramma della Figura 4.7, che ci introduce alla
terza delle nostre distribuzioni.
µ ¶ µ ¶k µ ¶n−k
n
1
5
=
=
k
6
6
µ ¶
µ ¶n µ ¶
n 1
5
1 n n−k
5
=
= n
6 k
6
k 5k
dove entrano, appunto, i coefficienti binomiali che
danno il nome a questa distribuzione.
In generale, se un evento ha probabilità p di verificarsi, la probabilità che esso non si verifichi è
q = 1 − p. Nelle monete abbiamo p = q = 1/2,
poiché testa e croce sono alternative. Nel caso del
dado, se l’evento è il comparire di una faccia determinata, la sua probabilità è 1/6; che perciò compaia
uno degli altri numeri è 5/6. Pertanto, la probabilità
che si verifichino k fra gli eventi considerati in una
sequenza di n eventi, è dato dalla formula:
µ ¶
n k n−k
p q
.
πn,k =
k
Figura 4.7: Distribuzione quasi normale
3. Distribuzione normale. La forma a campana della distribuzione in Figura 4.7 è caratteristica di
molti fenomeni naturali. Se misuriamo l’altezza delle
persone o la lunghezza del loro piede; la circonferenza
del tronco degli alberi in una foresta o la velocità delle molecole in un corpo a una certa temperatura; osserveremo sempre la caratteristica forma a campana.
Questa formula generalizza tanto il lancio delle Gauss, il principe dei matematici, studiò teoricamenmonete, quanto quello dei dadi.
te questa distribuzione e la chiamò normale proprio
Quando si gioca a dadi, si può puntare sul nume- perché sembra essere la normale distribuzione dei fero totale che costituisce la somma di tutte le facce nomeni naturali. Egli trovò una formula che descrive
dei dadi tirati. Cosı̀ il verificarsi di 5 nel lancio di la curva e che dipende da due parametri: la media
129
4.8. DISTRIBUZIONI
e la deviazione standard della distribuzione. In altre
parole, la forma della campana cambia a seconda del
valore dei due parametri, alzandosi o ingrossandosi,
pur rimanendo sostanzialmente la stessa. Per curiosità diamo qui la formula, ma per il momento rimane,
appunto, una mera curiosità:
Ã
µ
¶2 !
1
1 x−µ
Nµ,σ (x) = √ exp −
.
2
σ
σ 2π
La media µ corrisponde al punto più alto della curva,
che è simmetrica rispetto alla retta x = µ. Un fatto caratteristico è costituito dalla percentuale degli
eventi che si verificano in certi intervalli:
il 68.27%
il 95.45%
il 99.75%
si pone tra
si pone tra
si pone tra
µ−σ e µ+σ
µ − 2σ e µ + 2σ
µ − 3σ e µ + 3σ;
questo significa che ben 2/3 degli eventi si addensano nella zona che ha distanza pari alla deviazione
standard dalla media e praticamente tutti si trovano a distanza della media per meno di tre volte la
deviazione. Ciò giustifica l’importanza di σ.
può non essere del tutto agevole. Per questo, si
usano molto le tavole numeriche e alcune regole
empiriche divenute standard. Le tavole contengono
i valori di probabilità della distribuzione N0,1 (x),
cioè della distribuzione normale di media 0 e di
deviazione standard 1. Vi sono poi semplici formule
di conversione a qualsiasi Nµ,σ (x). Uno degli approcci
empirici più utilizzati è il seguente. Abbiamo visto,
definendo il concetto di mediana, cosa sia l’ordinamento per rango di una certa distribuzione empirica,
riferita ad n eventi. Sia allora x1 ≤ x2 ≤ · · · ≤ xn
tale ordinamento e poniamo k = n/10. Si dice
che gli elementi x1 ≤ x2 ≤ · · · ≤ xk costituiscono
il primo decile della distribuzione; gli elementi
xk+1 ≤ xk+2 ≤ · · · ≤ x2k il secondo decile, e cosı̀ via.
In altre parole, il primo decile contiene il primo 10%
dei dati nell’ordinamento per rango, e via di seguito
fino al decimo decile, che contiene l’ultimo 10%. Il
valore estremo di un certo decile si dice il valore
del decile. I valori del primo e del nono decile sono
molto usati per indicare convenzionalmente i valori
di “norma” di una distribuzione. Ad esempio, in
auxologia, si riportano in un grafico, per le varie età,
il valore mediano dell’altezza e i valori del primo e
del nono decile. Di “norma” la crescita deve avvenire
costantemente nell’intervallo fra questi due decili,
che rappresenta l’altezza dell’80% della popolazione
a quell’età. Valori al di fuori della “norma”, relativi
perciò al solo 20% della popolazione, possono indicare
qualche disfunzione nel processo di crescita e vanno
considerati con la debita attenzione. Concetti analoghi al decile sono quelli di percentile e di quartile,
che però lasciamo alla buona volontà del lettore,
dato che non presentano alcuna differenza concettuale.
4. Distribuzione di Poisson. Una distribuzione non simmetrica è quella di Poisson, definita in
funzione di un parametro µ, che ne indica la media:
pk = eµ
Figura 4.8: La campana della distribuzione normale
Il carattere generale della distribuzione normale si
suole giustificare con la cosiddetta legge dei grandi
numeri, che vede la distribuzione normale come una
specie di limite al quale tendono tutte le distribuzioni, quando vengano iterate, come abbiamo fatto per il
lancio delle monete. La legge (grosso modo) afferma
che dato un fenomeno, il quale segua una qualsiasi
distribuzione di probabilità, se lo si itera un numero sufficientemente grande di volte e si considera la
distribuzione di probabilità del fenomeno cosı̀ iterato, allora tale distribuzione si può identificare con la
distribuzione normale.
Nota 4.11
Come si può intuire dalla formula di
Gauss, lavorare con la matematica della distribuzione
µk
k!
dove eµ è la funzione esponenziale che introdurremo
ufficialmente nella Sezione 8.5. Questa distribuzione
è discreta, ma assume valori per infiniti k; ben presto,
tuttavia, i pk si riducono praticamente a 0 e le possibilità possono essere considerate in numero finito. La
distribuzione di Poisson è molto frequente e ad essa
si adeguano, ad esempio, le lunghezze degli intervalli
con cui le persone arrivano ad uno sportello (banca,
uffici pubblici, etc.).
Come abbiamo già osservato, quelle viste non sono le uniche distribuzioni degne di nota. A cavallo
dell’anno 1900, l’economista Pareto osservò che molti fenomeni economici seguono una distribuzione caratteristica. Ad esempio, se si mettono in ordine i
contribuenti dal più ricco al più povero e chiamiamo
R il reddito del più ricco, allora il reddito del secondo è (all’incirca) R/2, il reddito del terzo è R/3, e
130
cosı̀ via. Allo stesso modo sembra funzionare la produzione delle industrie e la popolazione delle città.
Qualche anno dopo, il linguista Zipf fece notare che
anche molti fenomeni linguistici, come la frequenza
delle parole in un testo, hanno più o meno la stessa
distribuzione. Essa viene perciò detta di Pareto-Zipf
e si formula nel modo seguente: se r è il rango (cioè
la posizione) che un evento viene ad assumere nell’ordinamento rispetto ad un parametro assegnato ed Rr
è il valore di tale parametro, allora il prodotto rRr è
costante.
Nei fatti, abbastanza analoga alla legge di ParetoZipf è quella cosı̀ detta dell’80/20. Nel caso del reddito, essa afferma che il 20% dei contribuenti si suddividono l’80% del totale dei redditi. Nel caso delle
città, il 20% delle città di un paese riuniscono l’80%
di tutti gli abitanti. E cosı̀ via, dando spesso una valutazione numerica alle ingiustizie di questo mondo.
Noi ci possiamo accontentare di aver ricordato tutto
ciò.
Concludiamo queste note dando una breve spiegazione del metodo del chi quadro. Nella sezione precedente, abbiamo visto una distribuzione empirica relativa al lancio di quattro monete ed essa si dovrebbe
accordare con la distribuzione teorica binomiale. I
dati empirici difficilmente coincidono con i dati teorici, anzi, se coincidessero, si potrebbe avere qualche
sospetto proprio sulla rilevazione dei dati empirici. Al
di là di generiche differenze, com’è possibile dire (ammesso che lo sia) se una certa distribuzione empirica
si conforma a una distribuzione teorica?
Una possibile risposta è data dal test del chi quadro (χ2 ), che vogliamo ora descrivere. Si supponga di
avere una distribuzione empirica discreta, data dalle frequenze f1 , f2 , . . . , fn se n sono le classi in cui il
fenomeno è suddiviso. Sia N = f1 + f2 + · · · + fn il
numero totale dei dati rilevati e supponiamo che ogni
fk sia non inferiore a 5: altrimenti possiamo accorpare più classi in una sola, fino a che questa condizione
non sia soddisfatta. La distribuzione teorica prevederà certe probabilità p1 , p2 , · · · , pn in corrispondenza di ciascuna classe, e quindi possiamo parlare di
frequenze attese se moltiplichiamo ciascuna di queste
probabilità per N , il numero totale di osservazioni.
Tali frequenze attese saranno perciò:
CAPITOLO 4. MATEMATICHE FINITE
Questo ci dice che più alto è il valore del χ2 , più
lontana dalla distribuzione teorica risulta essere la
distribuzione empirica. Il valore del χ2 ottenuto va
confrontato con i valori di una tabella predisposta,
secondo regole che vedremo fra un istante. Se il χ2 è
compreso tra due opportuni valori della tabella potremo dire che distribuzione empirica è in accordo con
la distribuzione teorica. Non si ha accordo, invece, se
il χ2 è maggiore del più grande dei valori indicati.
Nell’esempio precedente abbiamo già calcolato le
frequenze attese della distribuzione teorica, per cui
calcoliamo:
χ2 =
+
(10063 − 10000)2
(39951 − 40000)2
+
+
10000
40000
(60060 − 60000)2
(39891 − 40000)2
+
+
60000
40000
+
(10035 − 10000)2
= 0.9364.
10000
Ottenuto questo valore, vediamo come ci si deve comportare con la tabella del χ2 . Prima di tutto, occorre
stabilire quanti sono i gradi di libertà della nostra distribuzione empirica. Grosso modo, i gradi di libertà
di una distribuzione sono i dati (o i gruppi di dati) che possiamo scegliere in modo arbitrario (libero)
senza cambiare la natura della distribuzione. Questo
è piuttosto vago, ma concretamente, nel nostro caso, abbiamo considerato cinque classi e le frequernze
di tali classi sono libere, eccetto per il fatto che in
tutto abbiamo effettuato 160. 000 prove. Ciò significa che se possiamo scegliere liberamente il valore di
quattro classi, quello della quinta è determinato dalla differenza fra 160. 000 e la somma delle frequenze
delle prime quattro classi. Abbiamo perciò 4 gradi di
libertà.
Nella Tabella 4.5 del χ2 , dobbiamo considerare la
riga corrispondente a 4 gradi di libertà. Cosa significano i valori presenti in tale linea? Nella testata
della tabella troviamo delle probabilità: ad esempio,
nella quarta riga c’è il valore 9.488 in corrispondenza
della probabilità 0.95; questo significa che sperimentando con una distribuzione empirica che si adegua
alla distribuzione teorica considerata, nel 95% dei casi si ottiene un χ2 con valore minore o uguale a 9.488.
e1 = N p1 , e2 = N p2 , · · · en = N pn .
Cosı̀ nel 5% dei casi troviamo χ2 ≤ 0.711. Si noti che
non ha rilevanza quale tipo di distribuzione teorica si
Con queste frequenze attese e quelle osservate
consideri.
calcoliamo la quantità:
E’ chiaro che qualunque sia il valore del χ2 otten
2
X
nuto, esso rientra nel 100% degli esperimenti; ciò si
(fk − ek )
.
χ2 =
può vedere dalla tabella, i cui valori crescono man
ek
k=1
mano che si procede verso la parte destra. Nel caso
Questa quantità è detta appunto “chi quadro” e os- di conformità, bisogna essere molto sfortunati per otserviamo subito che se le frequenze osservate coin- tenere valori altissimi e, di fronte a un χ2 molto elecidessero con le frequenze attese avremmo χ2 = 0. vato saremmo propensi a pensare che qualcosa non
131
4.8. DISTRIBUZIONI
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
20
25
30
35
40
50
75
100
2.5%
0.001
0.051
0.216
0.207
0.831
1.237
1.690
2.180
2.700
3.247
3.816
4.404
5.009
5.629
6.262
9.591
13.12
16.79
20.57
24.43
32.36
52.94
74.22
5%
0.004
0.103
0.352
0.484
1.146
1.635
2.167
2.733
3.325
3.940
4.575
5.226
5.892
6.571
7.261
10.85
14.61
18.49
22.47
26.51
34.76
56.05
77.93
95%
3.842
5.992
7.815
9.488
11.07
12.59
14.07
15.51
16.92
18.31
19.68
21.03
22.36
23.69
25.00
31.41
37.65
43.77
49.80
55.76
67.51
96.22
124.3
97.5%
5.024
7.378
9.348
11.14
12.83
14.45
16.01
17.54
19.02
20.48
21.92
23.34
24.74
26.12
27.49
34.17
40.65
46.98
53.20
59.34
71.42
100.8
129.6
Tabella 4.5: La tabella del χ2
va, piuttosto che ad accettare supinamente il risultato dell’esperimento. D’altra parte è sospetto anche
un valore del χ2 molto vicino a 0 che, come si vede dalla tabella, corrisponde a una piccolissima parte
degli esperimenti.
Vedendo invece la cosa dal punto di vista di chi
non sa se la distribuzione empirica si conforma o meno a quella teorica, possiamo procedere cosı̀: scegliamo due probabilità, una bassa e l’altra abbastanza
alta: spesso si prendono il 5% e il 95%; nella Tabella 4.5 abbiamo considerato anche il 2.5% e il 97.5%.
Se il χ2 ottenuto sperimentalmente è compreso fra
questi valori, allora possiamo ragionevolmente accettare l’ipotesi che la distribuzione empirica si conformi davvero a quella teorica. Se il χ2 supera il valore corrispondente alla probabilità del 95%, saremo
piuttosto dell’opinione di rigettare l’ipotesi, e saremo
tanto più convinti di ciò quanto più alto è il valore
del χ2 . Infine, se il χ2 è minore del valore corrispondente al 5%, dobbiamo sospettare che qualcosa nel
nostro esperimento non va, e c’è qualche vizio logico
o di rilevazione dei dati.
Il nostro 0.9364 è giusto compreso tra 0.711 e 9.488;
quindi la nostra distribuzione empirica si trova nell’intervallo di probabilità corretto per una distribuzione che si adegui a quella binomiale considerata.
Ciò ci fa inclinare ad accettare l’ipotesi che la distribuzione binomiale sia effettivamente la distribuzione
teorica che descrive quella dei nostri lanci.
132
CAPITOLO 4. MATEMATICHE FINITE
Capitolo 5
Algebra
Rischiai di dare lo spettacolo di un prigioniero messo a forza fuori di prigione. Erano le
cinque. Uno dei convitati mi accompagnò fino
alla porta, mi abbracciò, e promise di venirmi
a trovare uscendo di prigione. Doveva fare ancora due o tre mesi. Era l’infelice Galois che
non rividi mai più, perché l’indomani della sua
liberazione venne ucciso in duello.
G. de Nerval “Le mie prigioni”
5.1
Calcolo letterale
L’associazione tra Algebra e calcolo letterale è piuttosto recente e risale alla fine del 1500, nonostante
che fino dall’antichità si siano cercate regole e metodi per la risoluzione di equazioni. Già nel papiro di
Rhind (ca. 1650 a.C.) e su tavolette babilonesi (ancora più vecchie) si trovano problemi di Algebra; ma
furono gli Arabi, dopo l’800 d.C., che dettero i maggiori contributi a questa disciplina. Al-Khuwarizmi
sapeva risolvere le equazioni di secondo grado, e dal
suo libro “Al-jabr wa’l muqābalah” è stato tratto il
termine Algebra. Cosa significhino le parole al-jabr
e al-muqābalah è oscuro; si ritiene che al-jabr indichi
il trasferimento di un termine da un membro all’altro di un’equazione, e al-muqābalah si riferisca alla
cancellazione di termini uguali nei due membri, ma
questa interpretazione non è sicura. Dalla traduzione latina “Liber Algebrae et Almucabala” (che toglie
tutti i dubbi sul significato delle due parole!) fino
al 1600 ci si riferı̀ alla risoluzione delle equazioni come alla “scienza dell’Algebra e dell’Almucabala”, poi
l’Almucabala venne a cadere e l’Algebra è rimasta.
Fino al 1500 la formulazione delle equazioni era
puramente discorsiva e ci si riferisce a quell’Algebra
come all’“Algebra retorica”. Prima del 1500 il francese Chuquet cominciò a introdurre forme abbreviate
e le equazioni si iniziarono a formulare in modo più
convenzionale: la variabile (che oggi diremmo x) era
detta la “cosa”, il suo quadrato x2 era il “censo” e il
suo cubo x3 era il “cubo”. Si usarono anche espressio√
ni simili a formule: 5p : Rm : 15 stava per 5 + −15,
dove p e m era la notazione, detta “italiana”, per
i simboli + e −. Questi ultimi furono introdotti in
Germania verso il 1550 e il segno = fu inventato dall’inglese Recorde più o meno negli stessi anni. Questo
nuovo tipo di notazione fu detto “Algebra sincopata”.
Ma il vero e proprio calcolo letterale è nato, verso la
fine del 1500, col francese Viète e mezzo secolo dopo Cartesio usava già una notazione molto simile a
quella moderna.
Sino al 1600 l’Algebra era concepita come un metodo per la risoluzione di problemi numerici specifici,
o poco più. Poiché non si volevano considerare numeri negativi (che non si capivano) le due equazioni
di secondo grado x2 + ax = b (“il censo più la cosa
uguale a numero”) e x2 = ax + b (“il censo uguale
alla cosa più un numero”) erano considerate diverse
e trattate pertanto con regole risolutive differenti. Le
lettere si imposero prima come incognite e solo successivamente per le costanti (cioè i parametri). Oggi,
il calcolo letterale è alla base di tutta l’Algebra e tutti
gli studenti ne hanno familiarità.
Le lettere (dell’alfabeto latino o greco) hanno in
realtà significati ed accezioni di natura assai diversa,
ma, fortunatamente, la loro trattazione e manipolazione avviene in modo omogeneo. Ricordiamo che
una lettera:
133
1. se indica un simbolo astratto, da non confondere
con indicazioni di numeri o altre entità, si dice
una indeterminata;
2. se indica valori che possono essere assunti da
un insieme prestabilito (ad esempio, un insieme
o un campo numerico) è detta variabile; nella
notazione funzionale y = f (x), x è la variabile
indipendente, y quella dipendente;
3. se indica, in un’equazione, un valore non noto e
che vogliamo determinare, è detta incognita;
4. se indica, in un’equazione, un valore che si suppone noto (e quindi non deve essere determinato,
ma anzi è da usare per trovare il valore della o
delle incognite) si dice un parametro.
134
CAPITOLO 5. ALGEBRA
polinomi si tratti. Quando le indeterminate sono più
In ogni caso, per le lettere valgono sempre le regole
di una, esse si indicano tra parentesi: Z[x, y] oppure
di calcolo che estendono le regole di calcolo dei nuZ[x][y]. Quest’ultima notazione mette in evidenza
meri. Come è ben noto, in Algebra il segno × della
che possiamo prima considerare i polinomi nella
moltiplicazione si sottintende o, al più, si denota con
indeterminata x, e quindi quelli nella indeterminata y
un puntino, cioè invece di a × b si preferisce scrivere
aventi come coefficienti i polinomi di Z[x]. Eseguendo
ab o a · b. Le proprietà commutativa ed associativa
i prodotti si ha ovviamente l’uguaglianza dei due
permettono di scrivere ab(ax(ba)xy) come aaabbxxy,
insiemi.
seguendo la regola generale di disporre le varie lettere in ordine alfabetico. Il prodotto di una lettera
per sé stessa si può abbreviare con la notazione delle
Sui polinomi è possibile definire le operazioni di
potenze e, anche per le lettere, si definisce:
somma e prodotto in modo da estendere la somma
½
e il prodotto tra numeri; prima di tutto diamo la
a0 = 1
seguente:
n+1
n
a
= a·a
Definizione 5.3 La somma di due monomi simili è
Si scriverà pertanto: aaabbxxy = a3 b2 x2 y.
un monomio la cui parte letterale è uguale a quella dei
Definizione 5.1 Si dice monomio il prodotto di un due addendi e il cui coefficiente è la somma algebrinumero per un prodotto di lettere; il numero si dice ca dei coefficienti dei due monomi. Il prodotto di due
coefficiente o parte numerica del monomio, mentre le monomi è un monomio il cui coefficiente è il prodotto
lettere ne costituiscono la parte letterale. Due mono- dei due coefficienti e la cui parte letterale è costituimi si dicono simili se hanno la stessa parte lettera- ta dalle lettere comuni e non comuni dei due monole; se questa non è presente, il monomio si dice una mi, quelle non comuni col proprio esponente e quelle
comuni con esponente uguale alla somma degli espocostante.
nenti. La somma e il prodotto di polinomi estendono
Sono monomi 3a2 b, −5ax2 y, 7, 2.7xyz, ax2 y e il secon- queste regole in modo tale che sia valida la proprietà
do è simile al quarto; un coefficiente 1 è di norma distributiva del prodotto rispetto alla somma.
sottinteso. I monomi costituiscono la base per la
moltiplichiamo i due polinomi x2 −
costruzione delle espressioni letterali, le più semplici Come esempio,
2
delle quali sono i polinomi: si dice polinomio la som- 2x + 1 e x + x − 1; la proprietà distributiva impone
ma di uno o più monomi. Ricordando che si scrive di moltiplicare ogni monomio del primo polinomio per
3ax2 − 2a2 x invece di 3ax2 + (−2a2 x), sono polinomi ogni monomio del secondo; pertanto si ottiene:
a2 + 2ab + b2 , x2 − 3x + 1 e y 5 − 4.
(x2 − 2x + 1)(x2 + x − 1) =
Come abbiamo visto, si scrive a2 per aa; quindi a1
sta per a e a0 per il monomio costante 1. Come si sa,
= x4 + x3 − x2 − 2x3 − 2x2 + 2x + x2 + x − 1.
1
0
a e a non si scrivono mai, e questo ci permette di
A questo punto possiamo sommare i monomi simili
introdurre la seguente:
ed ottenere:
Definizione 5.2 Si dice grado di un monomio la
somma degli esponenti della sua parte letterale; il gra- (x2 − 2x + 1)(x2 + x − 1) = x4 − x3 − 2x2 + 3x − 1.
do di un polinomio è il massimo dei gradi dei suoi
Si osservi (a + b)(a + b) = a2 + ab + ab + b2 = a2 +
monomi.
2ab + b2 . Questo è il più semplice esempio di potenza
Il grado dei monomi nell’esempio precedente è, ri- di un binomio; un binomio è un polinomio con due soli
spettivamente, 3, 4, 0, 3, 4. Il grado di un monomio termini, come x2 y+3wyz, ma possiamo indicarlo concostante è sempre 0 eccetto, convenzionalmente, il venzionalmente come a + b. Dalla regola precedente
grado di 0 che si pone −∞ (meno infinito), cosa che abbiamo: (x2 y+3wyz)2 = x4 y 2 +6wx2 y 2 z+9w2 y 2 z 2 .
tornerà utile in varie occasioni.
Sviluppando i prodotti si ha:
Nota 5.1
Esplicitamente, abbiamo considerato
polinomi i cui coefficienti appartengono ai numeri
reali. Può essere utile trattare anche polinomi a
coefficienti in altri insiemi numerici. Se fissiamo una
lettera x (che in questo caso ha il ruolo di “indeterminata”) l’insieme dei polinomi in x a coefficienti in un
insieme numerico K si indica con K[x]; ad esempio,
x2 − 3x + 1 ∈ Z[x] e 12 x3 − 41 x + 5 ∈ Q[x]. In generale,
considereremo R[x], a meno che non si dichiari esplicitamente il contrario, specificando di quale insieme di
(a + b)0
(a + b)1
(a + b)2
(a + b)3
(a + b)4
=
=
=
=
=
1
a+b
a2 + 2ab + b2
a3 + 3a2 b + 3ab2 + b3
a4 + 4a3 b + 6a2 b2 + 4ab3 + b4
Come si vede, nell’espressione (a + b)n le potenze di
a vanno decrescendo e quelle di b vanno crescendo in
modo tale che in ai bj si abbia i + j = n. I coefficienti
135
5.1. CALCOLO LETTERALE
sono dati dal triangolo di Tartaglia o triangolo di Pascal, nel quale, come sappiamo, ogni elemento è ottenuto sommando il numero che gli sta immediatamente sopra e quello che gli sta sopra, ma alla sinistra: il
lettore è caldamente invitato a dare una dimostrazione per induzione di questa regola, basandosi sul fatto
che (a + b)n+1 = (a + b)(a + b)n , supponendo di conoscere l’espressione per (a + b)n e sviluppando quindi
il prodotto. In generale, si ha il seguente risultato:
Teorema 5.1 Vale la formula:
a
G
ab
a−b
a2
I
H
b
2
ab
F b E
b
A
a−b
C
D
b
J
B
Figura 5.1: Prodotti notevoli per via geometrica
(a + b)n =
Nota 5.2
I Greci, pur con la loro preferenza per
µ ¶
µ ¶
µ
¶
µ ¶
n n 0
n n−1 1
n
n 0 n la Geometria e l’ignoranza per il calcolo letterale, co1 n−1
a b +
a
b +· · ·+
a b
+
a b .
noscevano alcune di queste regole e ne davano una
0
1
n−1
n
Prova: Si consideri l’espansione (a + b)n = (a +
b)(a + b) · · · (a + b) per n volte. Applicando la proprietà distributiva si ottengono tanti termini, ognuno
composto di n fattori a oppure b, cioè del tipo ak bn−k .
Quanti sono i termini di questo tipo? Sono quelli corrispondenti alla scelta di a da k dei fattori (a + b), e
quindi la scelta di b dagli altri n − k fattori. Ma la
scelta dei k fattori a è come la scelta di k elementi
dall’insieme degli n fattori (a + b), e quindi si hanno
Cn,k termini ak bn−k .
Naturalmente, si ha:
(a − b)2
(a − b)3
= a2 − 2ab + b2
= a3 − 3a2 b + 3ab2 − b3
e cosı̀ via, dove si osserva che i segni + e − procedono
in modo alternato.
Le potenze di un binomio sono, a loro volta, un
esempio di prodotto notevole; con questo termine si
indicano identità che è bene ricordare a mente perché permettono di semplificare molti conti. Un caso
molto famoso è fornito dal prodotto di una somma
per una differenza:
(a + b)(a − b) = a2 − b2
che si dimostra ancora eseguendo i conti. Letto da
destra verso sinistra, questo prodotto notevole si dice
anche differenza di due quadrati e fa parte di una
casistica più generale, di cui diamo i primi esempi:
a2 − b2
a3 − b3
a4 − b4
a5 − b5
=
=
=
=
=
(a − b)(a + b)
(a − b)(a2 + ab + b2 )
(a − b)(a + b)(a2 + b2 )
(a − b)(a3 + a2 b + ab2 + b3 )
(a − b)(a4 + a3 b + a2 b2 + ab3 + b4 )
Per le somme di due potenze si ottengono prodotti
solo per esponenti dispari:
a3 + b3
a5 + b5
=
=
(a + b)(a2 − ab + b2 )
(a + b)(a4 − a3 b + a2 b2 − ab3 + b4 )
dimostrazione geometrica (vedere la Figura 5.1). L’identità (a + b)2 = a2 + 2ab + b2 è ovvia, come appare a
sinistra della figura. Il lettore può utilmente costruire
un cubo di lato a + b mettendo assieme un cubo di
lato a, uno di lato b, tre parallelepipedi di dimensioni
a × a × b e tre parallelepipedi di dimensioni a × b × b.
In quanto alla a2 − b2 = (a + b)(a − b) si osservi che,
nella Figura 5.1, togliendo al quadrato ABF G di area
a2 il quadrato BCIJ di area b2 , si ottiene la stessa
scomposizione del rettangolo DEGH, che ha dimensioni (a − b)(a + b). I restanti prodotti notevoli, naturalmente, sono più difficilmente dimostrabili per via
geometrica.
I prodotti notevoli si prestano a introdurre qualche
curiosità, utile a ricordare che certe manipolazioni
sono errate, come abbiamo avvertito parlando delle
espressioni aritmetiche. Tali manipolazioni possono
portare a errori gravissimi nella risoluzione delle
equazioni, come vedremo tra poco. Ecco allora due
dimostrazioni esemplari: la prima ci informa che tutti
i numeri sono uguali; la seconda, più modestamente,
ci fa vedere come 1 sia uguale a 2. Siano a, b ∈ R
due numeri reali diversi tra loro e si chiami c la loro
differenza, cioè a − b = c. Moltiplicando entrambi
i membri per a − b e osservando che (a − b)2 è un
prodotto notevole, si ha a2 + b2 − 2ab = ca − cb.
Questa si scrive anche a2 − ab − ac = ab − b2 − bc
ovvero a(a − b − c) = b(a − b − c) e semplificando
a = b pur avendo supposto i due numeri differenti. La
seconda “dimostrazione” parte invece da due numeri
uguali a = b e li moltiplica per a: a2 = ab. Sottraendo
b2 si ha a2 − b2 = ab − b2 , cioè (a − b)(a + b) = b(a − b).
Ora si può semplificare e ottenere a + b = b, e
poiché s’è supposto a = b si conclude 2b = b ovvero
2 = 1. Il lettore ha subito individuato dove è
stato commesso l’errore, consistente in una indebita divisione per 0. Ci si può sbizzarrire e trovare
analoghe perle; ma, per il momento, qui ci arrestiamo.
Indubbiamente, i polinomi sono le espressioni letterali più semplici, e li studieremo in modo abbastanza approfondito. Altre espressioni importanti e d’uso assai frequente sono i rapporti tra polinomi, detti
136
CAPITOLO 5. ALGEBRA
funzioni razionali fratte:
x4 − 3x3 + x2 − 3x + 5
.
x3 + 2x2 − x + 6
Nota 5.3
Come vedremo nella prossima sezione,
eseguendo la divisione fra numeratore e denominatore, possiamo trasformare ogni funzione razionale
fratta nella somma di un polinomio (il quoziente,
eventualmente 0) e una funzione razionale fratta nella
quale il grado del numeratore è inferiore a quello del
denominatore. Nella Sezione 5.4 vedremo un’ulteriore
semplificazione delle funzioni razionali fratte detta
riduzione a frazioni parziali, che ha un notevole
numero di applicazioni, le più importanti delle quali
riguardano il calcolo integrale (vedere Sezione ??) e
la risoluzione delle ricorrenze (vedere Sezione ??),
argomento, questo, trattato purtroppo qui con pochi
dettagli.
Espressioni√letterali più complesse coinvolgono le
radici, come x2 + 1, che possono apparire tanto al
numeratore che al denominatore di espressioni frazionarie. Come abbiamo osservato nella Sezione ??,
avere un radicale a denominatore di una frazione è
particolarmente noioso e quindi è bene liberarsi di situazioni del genere mediante un’opportuna razionalizzazione. Ci sono problemi connessi all’equivalenza delle espressioni, che vedremo nella Sezione 5.3,
ma le tecniche da adottare sono semplici e legate
ai prodotti notevoli che abbiamo appena visto. Se
il denominatore si riduce a un semplice radicale, la
razionalizzazione è ovvia:
√
1
3x + 1
√
=
3x + 1
3x + 1
√
avendo moltiplicato sopra e sotto per 3x + 1.
Se invece abbiamo la somma o la differenza di due
o più radicali quadratici, la razionalizzazione è legata
alla differenza di due quadrati. In questo
√ esempio,
dobbiamo
moltiplicare
sopra
e
sotto
per
3x + 1 +
√
2x − 3:
√
√
1
3x + 1 + 2x − 3
√
√
=
=
3x − 1 − 2x + 3
3x + 1 − 2x − 3
√
√
3x + 1 − 2x − 3
=
.
x+2
I radicali cubici si affrontano nello stesso modo con
la regola per a3 − b3 :
1
√
√
=
3
3x + 1 − 3 2x − 3
p
p
p
3
(3x + 1)2 + 3 (3x + 1)(2x − 3) + 3 (2x − 3)2
.
=
x+2
5.2
I polinomi
Fra le espressioni letterali hanno un ruolo molto importante i polinomi, che abbiamo introdotto nella sezione precedente. Abbiamo anche visto come si eseguono tre delle operazioni di base: addizione, sottrazione e prodotto. Se K[x] è l’insieme dei polinomi
a coefficienti in un insieme numerico K e nell’indeterminata x, le tre operazioni sono “chiuse” in K[x],
cioè la somma, la differenza e il prodotto di due polinomi in K[x] sono ancora polinomi in K[x] e valgono
le consuete proprietà, elencate nella Tabella 5.1.
Anche il grado di un polinomio è stato introdotto
nella sezione sul calcolo letterale; è bene aver presenti
i seguenti risultati:
Lemma 5.2 Sia gr(p(x)) il grado del polinomio
p(x); allora si ha:
gr(p(x) + q(x))
gr(p(x)q(x))
≤ max(gr(p(x), gr(q(x))
= gr(p(x) + gr(q(x)
Prova: Per definizione i monomi che compaiono in
p(x) + q(x) sono simili ai monomi che compaiono in
p(x) e/o q(x), a meno che, nella somma, due monomi simili, ma con coefficienti uno l’opposto dell’altro, non si eliminino a vicenda. In ogni caso
gr(p(x) + q(x)) non può superare il massimo dei gradi dei due polinomi addendi. Per il prodotto, sia axn
con a 6= 0 il monomio di grado massimo in p(x) e sia
bxm con b 6= 0 il monomio di grado massimo in q(x).
Allora, p(x)q(x) conterrà il monomio abxn+m , essendo ab 6= 0. Tutti gli altri monomi che compongono il
prodotto hanno pertanto grado inferiore ad n + m, e
questo dimostra l’asserto.
Il lettore attento avrà osservato, a questo punto,
l’importanza di aver definito gr(0) = −∞; quello un
po’ meno attento è invitato a calcolare il grado della
somma e del prodotto dei tre polinomi 0, 5, 7x2 +
4x − 1, presi due a due. Si osservi anche la seguente
conseguenza del lemma precedente:
Corollario 5.3 Se due polinomi p(x) e q(x) hanno
grado diverso, allora p(x)+q(x) ha grado esattamente
uguale al più grande dei gradi di p(x) e q(x).
Ma la conseguenza veramente importante del lemma precedente è la seguente proprietà analoga a
quella dei numeri interi:
Teorema 5.4 Se il prodotto di due polinomi
p(x), q(x) è zero, allora almeno uno di essi è il
polinomio 0.
Prova: Se m è il grado di p(x) ed n è quello di q(x),
il grado del prodotto p(x)q(x) è m + n, ma affinché
sia m + n = −∞, uno almeno tra m ed n deve essere
−∞, cioè il corrispondente polinomio deve essere 0.
137
5.2. I POLINOMI
commutativa
associativa
distributiva
identità
zero
p(x) + q(x) = q(x) + p(x)
p(x)q(x) = q(x)p(x)
p(x) + (q(x) + r(x)) = (p(x) + q(x)) + r(x) p(x)(q(x)r(x)) = (p(x)q(x))r(x)
p(x)(q(x) + r(x)) = p(x)q(x) + p(x)r(x)
0 + p(x) = p(x) + 0 = p(x)
1p(x) = p(x)1 = p(x)
0p(x) = p(x)0 = 0
Tabella 5.1: Somma e prodotto di polinomi
Nota 5.4
Invitiamo naturalmente il lettore a
formulare gli algoritmi per l’addizione e la moltiplicazione di due polinomi; quello per la sottrazione è
un banale adattamento dell’algoritmo dell’addizione. Per coloro che hanno un po’ di esperienza di
programmazione, consigliamo l’esercizio di scrivere
esplicitamente, nel linguaggio di programmazione conosciuto, i programmi per le tre operazioni. Si usano,
di solito, due rappresentazioni di un polinomio: la
prima è una coppia costituita da un numero naturale
(un integer) e un vettore di numeri reali (cioè
real); il numero rappresenta il grado e il vettore i
coefficienti dei vari monomi (ricordarsi di non saltare
eventuali coefficienti 0, altrimenti la posizione nel
vettore non corrisponde più al grado del monomio, ed
è impossibile lavorare). La seconda rappresentazione
è a lista, ogni elemento della lista costituito da una
coppia (grado, coefficiente). Se si procede in senso
decrescente, il grado del primo monomio è anche il
grado del polinomio e si possono saltare i monomi con
parte numerica 0; questa volta non ci sono problemi
di interpretazione dei vari monomi, visto che il grado
è scritto in modo esplicito.
Molto più complicata delle altre operazioni è la divisione tra polinomi; questa si può eseguire solo se il
grado del dividendo è maggiore o uguale al grado del
divisore, e alla fine si ottengono un quoziente e un resto, che sono ancora due polinomi. Il resto ha grado
minore del divisore e, se si riduce a 0, la divisione si
dice esatta. La terminologia è analoga a quella per la
divisione tra numeri e se la divisione è esatta si dice
che il divisore sta nel dividendo, o che il divisore divide o è un fattore del dividendo; questo, a sua volta,
è un multiplo del divisore. La procedura per eseguire
la divisione è la seguente:
Algoritmo 5.1 (Divisione tra polinomi)
Ingresso: due polinomi: p(x) il dividendo e d(x) 6= 0
il divisore;
Uscita: quoziente e resto della divisione.
1. se gr(d(x)) > gr(p(x)) si esce con 0 come
quoziente e p(x) come resto;
2. altrimenti, si assegna p(x) ad r(x) e chiamiamo
A il monomio di grado più elevato in d(x);
(a) poniamo in B il monomio di grado più alto in r(x) [per la condizione sui gradi dei
polinomi, gr(B) ≥ gr(A)];
(b) si assegna a C il rapporto fra i due monomi B ed A; inseriamo tale monomio nel
quoziente q(x) e poniamo m(x) = C · d(x)
[m(x) ha pertanto lo stesso grado di r(x) e
i monomi di grado massimo hanno lo stesso
coefficiente];
(c) si pone r(x) := r(x) − m(x) [per le osservazioni precedenti, il grado di r(x) è diminuito
di almeno una unità];
(d) se gr(r(x)) ≥ gr(d(x)) si cicla tornando al
punto 2.;
(e) altrimenti si esce con q(x) come quoziente
ed r(x) come resto della divisione.
Un esempio di divisione con resto chiarirà eventuali dubbi; supponiamo di voler dividere 2x5 + 4x4 −
3x2 + 2x − 1 per x2 − x + 1. L’impostazione è analoga a quella della divisione tra interi ed è bene non
dimenticare i monomi con coefficiente 0 che possono
non comparire esplicitamente nell’espressione dei polinomi. Nella Figura 5.2 è riportata l’intera divisione;
il quoziente vale 2x3 + 6x2 + 4x − 5 e il resto −7x + 4.
Un semplice esercizio è verificare questo risultato eseguendo d(x)q(x) + r(x). Il polinomio che si ottiene
deve essere p(x), il dividendo.
Come la nomenclatura relativa alla divisione tra
polinomi ricalca quella della divisione tra interi, cosı̀
i concetti derivati sono simili e si può introdurre una
nozione di divisibilità tra polinomi con tutti gli annessi e connessi che conosciamo: modulo, polinomio
primo, scomposizione in fattori primi, massimo comun divisore e minimo comune multiplo. Tuttavia,
l’inquadramento di tutti questi concetti richiede una
certa attenzione e l’introduzione di una serie di nuove
definizioni.
Definizione 5.4 Si dice equazione l’uguaglianza fra
due espressioni letterali; se A = B è la rappresentazione di tale uguaglianza, l’espressione letterale A
si dice il membro sinistro dell’equazione, e B si dice il membro destro. Se x, y, . . . , z sono le incognite
che compaiono in un’equazione, una sua soluzione è
138
CAPITOLO 5. ALGEBRA
2x5
2x5
+4x4
−2x4
+6x4
+6x4
3
2x
−2x3
−6x3
+4x3
+4x3
−3x2
+2x −1
−3x2
+6x2
−9x2
−4x2
−5x2
−5x2
+2x −1
+2x
+4x
−2x
+5x
−7x
x2
2x3
−x
+6x2
+1
+4x −5
−1
−1
−5
+4
Figura 5.2: Divisione tra polinomi
un assegnamento a tali lettere di valori specifici che
rendono vera l’uguaglianza. Se un’equazione ha come
soluzione ogni possibile assegnamento alle incognite
dei valori di un insieme numerico K, allora si dice
più propriamente una identità in K. Un’equazione si
dice algebrica se è costituita dall’uguaglianza di due
polinomi. Due equazioni si dicono equivalenti se e solo se hanno le stesse soluzioni. La forma canonica di
un’equazione è un’equazione equivalente a quella data,
ma della forma: espressione algebrica uguale a zero.
Il grado di un’equazione algebrica è il massimo grado
dei monomi che compaiono nella sua forma canonica. Si dice zero o radice di un polinomio una qualsiasi
soluzione dell’equazione che si ottiene uguagliando a
zero quel polinomio.
A(x, y, . . . , z) + C(x, y, . . . , z) = B(x, y, . . . , z) +
C(x, y, . . . , z); sostituendo alle incognite i valori della soluzione si ottiene una uguaglianza
tra due somme di espressioni numeriche uguali,
che sappiamo essere uguali. La stessa cosa vale per il prodotto A(x, y, . . . , z)C(x, y, . . . , z) =
B(x, y, . . . , z)C(x, y, . . . , z),
il quale,
quando
C(x0 , y0 , . . . , z0 ) 6= 0, dà l’uguaglianza di due
prodotti di numeri uguali. Tuttavia, è bene osservare
esplicitamente, che se C(x0 , y0 , . . . , z0 ) = 0, si ottiene
l’uguaglianza 0 = 0 anche se
A(x0 , y0 , . . . , z0 ) 6= B(x0 , y0 , . . . , z0 ),
per cui l’equazione derivata non è equivalente a quella
data.
E’ facile vedere e dimostrare che il concetto di
equazioni equivalenti è effettivamente una relazione
di equivalenza; lasciamo al lettore il compito di sviluppare i dettagli di questa affermazione e osserviamo
invece che l’equivalenza si mantiene con le operazioni
di al-jabr e di al-muqābalah:
Teorema 5.5 Data una qualsiasi equazione,
ottiene un’equazione equivalente se:
Usando la prima delle due regole, ogni equazione
può essere portata in forma normale: basta aggiungere ai due membri l’espressione letterale opposta a
quella che costituisce il membro destro. Una identità
ha come forma normale l’equazione 0 = 0.
Nel caso delle equazioni algebriche, si ha un’ultesi riore specializzazione:
Teorema 5.6 (di Ruffini) Sia p(x) un polinomio;
regola della somma: si aggiunge o si sottrae ad allora un numero a è radice del polinomio se e solo
entrambi i membri dell’equazione la stessa se p(x) è divisibile per (x − a).
espressione letterale;
Prova: Se p(x) = q(x)(x − a), è chiaro che andando
regola del prodotto: si moltiplicano o si dividono a sostituire x con a si trova p(a) = q(a) · 0 = 0. Viceentrambi i membri dell’equazione per la stessa versa, eseguiamo la divisione di p(x) per (x − a); sia
espressione letterale, purché questa sia sempre q(x) il quoziente, mentre il resto, dovendo avere gradiversa da zero.
do inferiore ad (x − a), sarà una costante b. Abbiamo
Prova: Sia K l’insieme numerico sul quale consi- quindi p(x) = q(x)(x − a) + b. Sostituendo a ad x
deriamo l’equazione; siano x, y, . . . , z le incognite che e sfruttando l’ipotesi che a sia una radice di p(x), si
compaiono nei due membri, di modo che l’equazione ha: 0 = q(a) · 0 + b, e questo implica b = 0.
si scriva A(x, y, . . . , z) = B(x, y, . . . , z). Una soluzioConseguenza di questo teorema è che, se conosciane sia x = x0 , y = y0 , . . . , z = z0 , cosı̀ che sia vera la mo le radici di un polinomio, diciamo a , a , . . . , a ,
1 2
k
proposizione
allora possiamo scrivere tale polinomio come (x −
A(x0 , y0 , . . . , z0 ) = B(x0 , y0 , . . . , z0 ).
Se C(x, y, . . . , z) è la quantità che aggiungiamo ai due membri, si ha la nuova equazione
a1 )(x − a2 ) · · · (x − ak ). In realtà, possiamo anche
moltiplicarlo per una costante (diversa da zero) senza
cambiare la validità del risultato. Naturalmente, basta eseguire i prodotti per avere la forma tradizionale.
139
5.2. I POLINOMI
Ad esempio, se le radici sono 1, 2 e 3, il polinomio è
(x − 1)(x − 2)(x − 3) = x3 − 6x2 + 11x − 6.
Il matematico italiano Paolo Ruffini (1765 – 1822)
anticipò Abel nella dimostrazione della irrisolubilità
delle equazioni di 5◦ grado, anche se in modo non del
tutto soddisfacente. Inventò anche una tecnica, detto regola di Ruffini, per dividere un polinomio per il
binomio (x − a) senza eseguire direttamente la divisione secondo il metodo visto. Se ad esempio si vuole
eseguire (x4 −2x2 +x+1)/(x−1), il calcolo si imposta
cosı̀:
1 0 −2 1 1
1 1 −1 0
1
1 1 −1 0 1
La prima riga contiene i coefficienti del dividendo,
dove occorre non dimenticare quelli nulli; il primo
elemento della seconda riga è l’opposto del termine
costante del divisore (x − a). Si abbassa poi nella
terza riga il primo coefficiente e si pone il suo prodotto
per a nella colonna successiva della seconda riga. Si
esegue poi la somma 0 + 1, ottenendo l’1 della terza
riga, e si procede in modo analogo fino alla fine. Nella
terza riga si leggono il quoziente x3 +x2 −x ed il resto,
che in questo caso è 1.
Per quanto riguarda i polinomi e le equazioni algebriche, teoricamente possiamo considerare tre insiemi
distinti: Z[x], Q[x] e R[x]; tuttavia, i primi due sono
associati dal seguente risultato:
Teorema 5.7 Un numero razionale r è radice di un
polinomio in Q[x] se e solo se è radice di un polinomio
in Z[x].
Prova: Poiché Z[x] ⊂ Q[x], se un polinomio in Z[x]
ha come soluzione r, lo stesso polinomio, visto come
appartenente a Q[x], ha ancora r come radice. Viceversa, sia r una radice di p(x) ∈ Q[x] e sia m il
minimo comune multiplo dei denominatori dei coefficienti di p(x); se consideriamo l’equazione p(x) = 0,
abbiamo p(r) = 0 e se moltiplichiamo i due membri
per m 6= 0 si ha mp(r) = 0, cioè r è una radice del
polinomio mp(x) ∈ Z[x].
Si considerano allora due soli insiemi di polinomi:
i polinomi a coefficienti interi (che coincidono, nel
senso visto, con i polinomi a coefficienti razionali) e
i polinomi a coefficienti reali, che sono l’insieme più
ampio. Le proprietà di questi due insiemi sono un po’
diverse e, quindi, quando necessario, li distingueremo
chiaramente per evitare confusioni ed ambiguità.
Definizione 5.5 Un polinomio di K[x] si dice irriducibile su K se non ha alcuna soluzione in
K.
Pertanto, un polinomio di Z[x] è irriducibile se non
ha soluzioni razionali; un polinomio di R[x] è irriducibile se non ha soluzioni reali. Per i polinomi di Z[x]
vale il seguente teorema che permette di verificare
facilmente se esso è o non è irriducibile:
Teorema 5.8 (di Eisenstein) Le soluzioni razionali di un polinomio p(x) ∈ Z[x], p(x) = a0 xn +
a1 xn−1 + · · · + an−1 x + an , se esistono, sono da ricercare tra i numeri razionali il cui denominatore è
un divisore di a0 e il cui numeratore è un divisore di
an .
Prova: Sia m/d l’eventuale soluzione, ridotta ai minimi termini; sostituendo tale valore nell’equazione si
ottiene:
³ m ´n
³ m ´n−1
m
a0
+ a1
+ · · · + an−1 + an = 0
d
d
d
e quindi, moltiplicando tutto per dn 6= 0 si ha:
a0 mn + a1 mn−1 d + · · · + an−1 mdn−1 + an dn = 0.
Portando tutti i termini, eccetto il primo, a destra
dell’equazione, si trova che a0 mn deve avere un fattore d, e poiché d ed m sono per ipotesi primi tra di
loro, d deve essere un divisore di a0 . Analogamente, portando tutti i termini a destra eccetto l’ultimo,
si vede che m deve essere un divisore di an , come si
voleva.
Ad esempio, se il polinomio 27x3 +6x−12 ∈ Z[x] ha
soluzioni razionali, basta cercarle fra le frazioni m/d
dove m ∈ {±1, ±3, ±9, ±27} e d ∈ {1, 2, 3, 4, 6, 12}
(come notato a suo tempo, nelle frazioni il segno può
essere lasciato al solo numeratore). Si tratta di 24
valori diversi e quindi il procedimento può essere alquanto noioso; tuttavia, la soluzione (quando esista)
si trova con un po’ di buona volontà, aiutandosi eventualmente con un calcolatore. Nel caso attuale si trova la soluzione 2/3 e applicando la regola di Ruffini si
ricava 27x3 + 6x − 12 = 9(3x2 + 2x + 2)(x − 2/3), e vedremo nelle prossime sezioni come 3x2 +2x+2 non abbia addirittura soluzioni reali. Comunque, una nuova
applicazione del teorema di Eisenstein con le possibili radici razionali ±1, ±2, ±1/2, ±2/3 mostra subito
che il polinomio non ha altri fattori lineari x − a, con
a ∈ Q.
Per i polinomi di R[x] le cose stanno in modo
alquanto diverso. Nella prima metà del 1800 fu
dimostrato il seguente:
Teorema 5.9 I polinomi irriducibili di R[x] sono:
1. le costanti;
2. i polinomi di primo grado ax + b;
3. i polinomi di secondo grado ax2 + bx + c per i
quali si abbia b2 − 4ac < 0.
140
CAPITOLO 5. ALGEBRA
La prova di questo teorema va, per il momento, al
di là delle nozioni che abbiamo e anche degli scopi
di questi appunti. Comunque, vedremo in una nota
successiva le linee generali della dimostrazione. Sono
quindi irriducibili i polinomi x − 3 e 3x2 + 2x + 2 in
quanto b2 −4ac = 4−4×3×2 = −20. Si può osservare
che il polinomio x2 + 1 è anch’esso irriducibile per
lo stesso criterio; tuttavia, la dimostrazione della sua
irriducibilità è diretta ed immediata. Le sue eventuali
radici sono le soluzioni dell’equazione x2 + 1 = 0, cioè
x2 = −1; ma non esiste alcun numero reale il cui
quadrato valga −1, un numero negativo. A questo
punto possiamo dare la seguente:
Definizione 5.6 I polinomi irriducibili di K[x] si
dicono anche polinomi primi.
Dato un polinomio p(x) ∈ K[x], una sua scomposizione in
fattori irriducibili (primi) è il prodotto p(x) =
aq1 (x)q2 (x) . . . qk (x), dove a ∈ K e i polinomi
q1 (x), q2 (x), . . . , qk (x) sono irriducibili su K. Si dice
massimo comun divisore di due polinomi p(x), q(x) ∈
K[x] un polinomio di grado massimo che divida tanto p(x) quanto q(x). Si dice minimo comune multiplo
un polinomio di grado minimo che sia divisibile tanto
per p(x) che per q(x).
Il lettore avrà notato che nella definizione non si afferma mai che la scomposizione, il massimo comun
divisore e il minimo comune multiplo siano unici: infatti, moltiplicare o dividere per una costante (non
nulla) non cambia le proprietà di un polinomio. Si
dimostra tuttavia (anche se noi non lo faremo) che
questa è l’unica eccezione; in altre parole, scomposizione, MCD e mcm di polinomi sono unici a meno
di costanti moltiplicative. Per il MCD e il mcm valgono le stesse proprietà di calcolo viste per i numeri
naturali: ad esempio, il massimo comun divisore può
essere trovato prendendo i fattori (irriducibili) comuni a p(x) e a q(x) col minimo esponente. Qui si richiede molta attenzione perché la non unicità della
scomposizione può trarre in inganno il principiante e
chi voglia fare le cose con troppa fretta.
5.3
Risoluzione delle equazioni
Secondo le definizioni della sezione precedente, un’equazione algebrica di primo grado ha come forma canonica ax + b = 0. In questo caso (e solo in questo
caso) si preferisce considerare come canonica la forma
ax = b, con a 6= 0. Tale equazione ammette “almeno”
la soluzione x = b/a, che si verifica sostituendo ad x
tale valore e notando che essa si riduce all’uguaglianza b = b, senz’altro vera. A questo punto è chiaro che
questa è l’unica soluzione. Detta infatti r una soluzione diversa, scriviamola nella forma b′ /a, con b′ = ra.
Deve essere b′ 6= b, altrimenti r coinciderebbe con la
prima soluzione; sostituendo b′ /a nell’equazione, si
ha b′ = b, il che è falso.
Se a = 0, l’equazione ax = 0 perde di significato, ma per completezza introduciamo la seguente
terminologia:
1. se a = b = 0, ogni numero reale rende vera l’uguaglianza; questa è pertanto ridotta all’identità
0 = 0 e si dice che l’equazione è indeterminata o
che ammette infinite soluzioni;
2. se a = 0, ma b 6= 0, l’uguaglianza non può
mai essere verificata; si dice allora che l’equazione è impossibile ovvero che non ammette alcuna
soluzione.
Ciò torna utile quando si voglia scrivere un algoritmo
che, partendo da un’equazione che si suppone essere
di primo grado, ne trovi la soluzione:
Algoritmo 5.2 (Equazioni di 1◦ grado)
Ingresso: Un’equazione di primo grado in x;
Uscita: La soluzione x0 , oppure uno dei termini
“Impossibile” o “Indeterminata”.
1. Usando ripetutamente la regola della somma, si
portano a membro sinistro tutti i termini che
contengono x e a membro destro tutti i termini
che non lo contengono;
2. usando la regola della somma di monomi omogenei, si riduce il membro sinistro a un’espressione
del tipo ax; eventualmente, questa espressione si
riduce a zero e si pone allora a := 0;
3. usando le regole della somma, si riduce il
membro destro alla costante b;
4. se a = b = 0, si esce dall’algoritmo dopo aver
scritto “Indeterminata”;
5. altrimenti, se a = 0 ma b 6= 0, si esce
dall’algoritmo dopo aver scritto “Impossibile”;
6. altrimenti, l’equazione ha l’unica soluzione b/a,
determinata dall’applicazione della regola del
prodotto.
Come semplice esempio si consideri l’equazione
3x + 2 − x = 1 + 5x − 2; per il punto 1. dell’algoritmo
abbiamo 3x + 2 − x − 2 − 5x = 1 + 5x − 2 − 5x − 2,
cioè 3x − x − 5x = 1 − 2 − 2. Ora si applica il punto 2.
e si ottiene −3x = −3; questa è l’equazione in forma
canonica e possiamo applicare il passo 6. che dà la
soluzione x0 = −3/(−3) = 1. Naturalmente, andando a sostituire il valore 1 cosı̀ ottenuto nell’equazione
originale si ha: 3 + 2 − 1 = 1 + 5 − 2, cioè 4 = 4, il che
è vero e “verifica” la validità della soluzione trovata.
Più interessante è la risoluzione delle equazioni di
secondo grado, che supponiamo essere già scritte in
forma canonica:
141
5.3. RISOLUZIONE DELLE EQUAZIONI
Ad esempio, data l’equazione 2x2 + x − 6 = 0, si
Teorema 5.10 Sia ax2 + bx + c = 0 un’equazione di
ha ∆ = 1 + 48 = 49 = 72 ; l’equazione quindi ha
secondo grado in forma canonica; essa ammette:
due soluzioni che sono x1 = (−1 + 7)/4 = 3/2 e x2 =
a. due soluzioni se il discriminante ∆ = b2 − 4ac è (−1−7)/4 = −2. Nella pratica, è talvolta conveniente
maggiore di 0; in tal caso le soluzioni sono date la seguente formula ridotta, che si applica quando il
dall’espressione:
coefficiente b è un intero pari, diciamo b = 2b′ . Si ha
allora:
√
−b ± ∆
√
√
x=
;
−2b′ ± 4b′2 − 4ac
−b ± b′2 − ac
2a
x=
=
.
2a
a
b. una soluzione se il discriminante è uguale a 0;
I tre coefficienti a, b, c contengono tutte le informatale soluzione è x = −b/(2a);
zioni relative all’equazione considerata; la formula di
c. nessuna soluzione se ∆ < 0.
Prova: Si consideri il seguente procedimento detto metodo del completamento del quadrato e derivato dalle regole di somma e prodotto della sezione
precedente:
1. si moltiplica per 4a 6= 0: 4a2 x2 + 4abx + 4ac = 0;
2. si somma b2 −4ac ai due membri: 4a2 x2 +4abx+
b2 = b2 − 4ac;
risoluzione ne è un esempio convincente, ma vi sono
altri aspetti che possono essere rivelati da tali parametri. Cominciamo con una proprietà abbastanza
ovvia:
Teorema 5.11 Se l’equazione ax2 + bx + c = 0 ha
due soluzioni reali, allora la somma di tali soluzioni
è −b/a e il loro prodotto vale c/a.
Prova: Dalla formula risolutiva si ha:
√
√
−b − ∆ −b + ∆
b
+
=−
2a
2a
a
3. il membro sinistro è un quadrato: (2ax + b)2 =
e ancora:
b2 − 4ac.
Ã
√ !Ã
√ !
−b − ∆
−b + ∆
b2 − (b2 − 4ac)
c
Si osservi che un quadrato è sempre non negativo e
=
=
2
2
2a
2a
4a
a
quindi se b −4ac = ∆ < 0, l’equazione non può avere
alcuna soluzione (caso c.). Se b2 − 4ac = 0, l’equazione si riduce a 2ax + b = 0; questa è un’equazione di dato che il prodotto dei numeratori è il prodotto di
primo grado che, come si è visto, ha come soluzione una somma per una differenza.
x = −b/(2a) (caso b.). Infine, se ∆ > 0, estraendo la
radice quadrata algebrica si √
hanno le due equazioni
Nota 5.5
Come vedremo nelle prossime sezioni,
√
la distinzione dei tre casi di soluzione di un’equazione
di primo grado 2ax + b = + ∆ e 2ax + b = − ∆,
di 2◦ grado è dovuta semplicemente all’ambito troppo
dalle quali si ricavano i valori delle due soluzioni.
Dal teorema discende un semplice algoritmo:
Algoritmo 5.3 (Soluzione equazioni 2◦ grado)
Ingresso:
I coefficienti a, b, c del polinomio
ax2 + bx + c;
Uscita: Le eventuali soluzioni dell’equazione.
ristretto in cui ci stiamo movendo, cioè i numeri reali.
Quando si passi ai numeri complessi, ogni equazione
di secondo grado ha sempre due soluzioni: nel caso
b) esse coincidono, nel caso c) sono costituite da due
numeri complessi coniugati. La proprietà espressa
dal teorema precedente risulta vera in generale, e la
si dimostra nello stesso modo. Infatti nel caso b) si
ha ∆ = 0 e nel caso c) pur essendo ∆ < 0 i conti fatti
sono ancora validi.
1. si calcola il discriminante ∆ = b2 − 4ac;
2. se ∆ < 0 si scrive “L’equazione non ammette
soluzioni”;
3. altrimenti, se ∆ = 0, si scrive “L’unica
soluzione è:” e si calcola x = −b/(2a);
4. altrimenti (∆ > 0) si calcolano le due soluzioni:
√
−b − ∆
x1 =
2a
√
−b + ∆
x2 =
.
2a
Un’altra proprietà che i coefficienti a, b, c permettono di prevedere facilmente è il segno delle radici. Siano α e β le due radici reali dell’equazione
ax2 +bx+c = 0 che si può anche scrivere x2 + ab x+ ac =
0. Per il Teorema di Ruffini 5.6 questa si può anche
scrivere (x − α)(x − β) = 0; sviluppando il prodotto
si ha: x2 − (α + β)x + αβ = 0. Abbiamo cosı̀ ottenuto, se si vuole, un’altra dimostrazione del teorema precedente, ma vediamo di interpretarla nel modo
seguente:
142
1. se le due soluzioni α, β sono entrambe positive,
allora −(α + β) = b/a è un numero negativo
mentre αβ = c/a è positivo. Si osservi che il
coefficiente di x2 , che dopo la divisione per a è
diventato 1, è sempre positivo;
2. se le due soluzioni α, β sono entrambe negative,
allora −(α + β) = b/a è positivo, come lo è αβ =
c/a; quindi i tre coefficienti 1, b/a, c/a sono tutti
positivi;
3. se le due soluzioni α, β sono discordi, diciamo
α > 0 e β < 0, allora −(α + β) = b/a sarà positivo o negativo a seconda che |α| > |β| oppure
|α| < |β|. Il prodotto αβ = c/a è invece sempre
negativo. Pertanto, se |α| > |β| i tre coefficienti
sono nell’ordine: positivo, negativo, negativo. Se
invece |α| < |β|, i tre coefficienti sono: positivo,
positivo, negativo.
CAPITOLO 5. ALGEBRA
α = 10 e β = 7; oppure, α = 7 e β = 10. La sciamo
al lettore la risoluzione nel caso si conosca la differenza dei numeri e il loro prodotto. Un’osservazione
banale ma importante è la seguente: ogni equazione
di secondo grado è simmetrica rispetto alle sue due
soluzioni, nel senso che esse possono essere scambiate, ma l’equazione rimane la stessa. Nel nostro caso,
trovati α e β, anche scambiando α con β si ottiene
ancora una soluzione. Conclusione: ogni problema
del tipo visto ha due soluzioni.
Un’equazione può essere originata dall’uguaglianza
di due espressioni razionali fratte, o comunque riconducibili a una forma del genere. Applicando le regole
al-jabr e al-muqābalah ci si riduce sempre all’uguaglianza a 0 di un’unica espressione razionale fratta.
Ad esempio:
9x + 13
9
=
+6
x+1
x−2
Naturalmente, se a era inizialmente positivo, i se- dopo facili passaggi dà:
gni dei tre coefficienti nell’equazione di partenza era3(x2 − x − 6)
no proprio gli stessi; se a era negativo, vanno cam= 0.
x2 − x − 2
biati scambiando positivo con negativo. Possiamo
riassumere tutto in una tabellina:
Una frazione si annulla solo quando il numeratore è
zero e, allo stesso tempo, il denominatore è diverα, β > 0
+−+ −+−
so da 0. Quindi, intanto, le soluzioni sono comprese
α, β < 0
+++ −−−
fra quelle dell’equazione ottenuto uguagliando a 0 il
α > 0, β < 0
numeratore. Nel nostro caso sono comprese tra le
|α| > |β|
+−− −++
soluzioni di x2 − x − 6 = 0, cioè x = 3 e x = −2.
|α| < |β|
++− −−+
A questo punto, però, il problema non è concluso,
Se, come si fa di solito, chiamiamo permanenza il fat- poiché occorre verificare che le soluzioni trovate non
to che, passando da un coefficiente al successivo, il annullino il denominatore. Se succede una cosa del
segno non cambia (cioè si ha ++ oppure −−), e va- genere, la soluzione o le soluzioni incriminate vanno
riazione il fatto che il segno cambia (cioè si ha +− tolte dal novero di quelle accettabili. Nel nostro caoppure −+), la precedente discussione e la relativa so, fortunatamente, il denominatore si annulla solo
tabella dimostrano:
per x = 1 e per x = 2, e quindi quelle trovate sono
soluzioni legali.
2
Teorema 5.12 (dei segni di Cartesio) Sia ax +
Non è strano il caso in cui un’equazione presenbx + c = 0 un’equazione di secondo grado con due
ti l’incognita√ sotto un segno di radice; ad esempio,
soluzioni distinte. Ad ogni variazione corrisponde a
l’equazione x + 2 = 3 ha l’ovvia soluzione x = 7,
una soluzione positiva e ogni permanenza a una socome si verifica direttamente. Queste equazioni venluzione negativa. Quando si ha una variazione e una
gono dette irrazionali e il metodo di risoluzione che
permanenza, la prima precede la seconda se la solusubito si presenta alla nostra mente è quello di elezione positiva è maggiore del valore assoluto di quella
vare al quadrato entrambi i membri. Si ha infatti
negativa, mentre la seconda precede la prima in caso
x + 2 = 9, un’equazione lineare la cui facile soluziocontrario.
ne ci dà appunto x = 7, a conferma della validità
I teoremi precedenti permettono di risolvere in mo- della nostra
√ intuizione. Tuttavia, se consideriamo
do elementare problemi del tipo: di due numeri α e β l’esempio x + 2 = x − 4, elevando al quadrato si
si conosce la somma (o la differenza) A e il prodotto ha: x + 2 = x2 − 8x + 16, cioè in forma normale:
B; quali sono i due numeri? Immaginando che α e x2 − 9x + 14 = 0. Le due soluzioni x = 7 ed x = 2,
β siano le due soluzioni di un’equazione di secondo però, hanno un comportamento strano: la x = 7 sogrado, tale equazione deve essere x2 − Ax + B = 0, stituita nell’equazione di partenza ci dà il risultato
se A è la somma α + β. Facciamo un esempio: se la atteso 0 = 0 (e perciò va bene), ma la x = 2 ci dà
somma di due numeri è 17 e il loro prodotto è 70, si 2 = −2, e questo proprio non va. Delle due soluzioni
deve risolvere l’equazione x2 − 17x + 70 = 0, il cui di- trovate, solo una è accettabile. Questo, tuttavia, fa
scriminante è ∆ = 172 +4×70 = 9 = 32 , per cui si ha parte di una situazione generale:
143
5.4. SISTEMI DI EQUAZIONI
x = 12. A questo punto basta verificare che tale
soluzione non è estranea. D) Lasciamo al lettore il
compito di cavarsela quando i radicali sono tre o più,
ma tali casi, per fortuna, si trovano quasi soltanto
negli esercizi dei testi di Matematica.
Prova: L’equazione A(x)k = B(x)k si può scrivere
2. Se uno o più radicali sono a denominatore, bisoanche A(x)k − B(x)k = 0, e per quanto visto sui
gna ricordarsi di escludere, dalle eventuali soluzioni,
prodotti notevoli equivale a:
quelle che annullano il denominatore, secondo la regola generale che ben conosciamo: la divisione per 0
(A(x) − B(x))×
non è un’operazione lecita. Ad esempio, consideriamo
×(A(x)k−1 + A(x)k−2 B(x) + . . . + B(x)k−1 ) = 0.
l’equazione irrazionale:
Un prodotto vale 0 quando uno dei suoi fattori è 0;
1
questo implica che deve essere A(x) − B(x) = 0,
√
+ 1 = x.
1
+x
che dà le stesse soluzioni di A(x) = B(x), oppure
A(x)k−1 + . . . + B(x)k−1 = 0, ma le soluzioni di La regola ci dice che un’eventuale soluzione x = −1
questa equazione (se non coincidono con quelle di dovrà essere rifiutata. Portato il termine 1 a destra,
A(x) = B(x)) sono del tutto estranee all’equazione si ha: 1 = (x − 1)√1 + x, e a questa uguaglianza
di partenza.
applichiamo l’elevamento a potenza. Si ottiene 1 =
Teorema 5.13 Sia A(x) = B(x) un’equazione nella
variabile x; l’equazione A(x)k = B(x)k ha le stesse soluzioni dell’equazione di partenza, più eventuali
altre soluzioni, dette estranee.
Questo giustifica la scoperta della soluzione x = 2
nell’esempio precedente e ci avverte che le soluzioni
estranee devono essere scartate. Il solutore di equazioni irrazionali è avvertito di stare bene attento a
ciò che ottiene applicando meccanicamente la tecnica dell’elevamento a potenza. Tale tecnica, d’altra
parte, è il metodo standard per affrontare le equazioni irrazionali, e non ci rimane che suggerire (o ricordare) alcuni accorgimenti per portare a buon fine
la soluzione di specifiche forme che l’equazione può
assumere.
1. Consideriamo quattro casi interessanti: A) Se
l’equazione presenta un unico radicale, è bene che
esso venga isolato, cosı̀ da costituire un membro dell’equazione, mentre l’altro membro contiene
i termini
√
razionali. Ad esempio, per risolvere x + 2 + 4 = x,
si porta il termine 4 a destra,
√ il che ci riconduce all’equazione già considerata x + 2 = x − 4. B) Se i
radicali (quadratici) sono due e non ci sono termini
razionali, se ne porta uno a membro sinistro e l’altro al√membro √
destro, prima di elevare a potenza.
Cosı̀, x − 6 − 2 − x = 0 ci porta a x − 6 = 2 − x,
cioè x = 4. Purtroppo, andando
nel√
√ a sostituire
l’equazione di partenza, si trova −2 − −2 = 0,
che non ha senso nel campo dei numeri reali. C)
Se invece, oltre ai due radicali, sono presenti termini razionali, questi si portano tutti a membro destro,
mentre i radicali si spostano tutti a sinistra. L’elevamento a potenza, questa volta, non elimina i radicali, ma, nel caso dei radicali quadratici, ne cala
il numero a uno solo, in modo che si può iterare
quanto √già detto in precedenza.
Se ad esempio ab√
x
+
4
−
1
=
x
−
3,
ci
si
porta alla forma
biamo
√
√
x + 4 − x − 3p= 1, e si eleva al quadrato. Si ottiene:
x + 4 − 2 (x + 4)(x − 3) + x − 3 = 1, cioè
p
(x + 4)(x − 3) = x. Dobbiamo di nuovo elevare al
quadrato, ottenendo infine: x2 + x − 12 = x2 , cioè
x3 − x2 − x + 1, cioè x(x2 − x − 1) = 0. Le soluzioni
b dove φ, come
sono allora x = 0, x = φ e x = φ,
√
sappiamo, indica il rapporto armonico ( 5 + 1)/2 e
φb = −1/φ. Nessuna di queste tre soluzioni è −1
e non rimane che provarle nell’equazione originale.
Solo x = φ dà risultato positivo e quindi rappresenta
l’unica soluzione dell’equazione di partenza.
3. Per convenzione, i radicali pari, come le radici quadrate, si considerano in senso aritmetico, cioè
con valore non negativo. Viceversa, i radicali dispari
si considerano in senso algebrico, cioè con lo stesso
segno del√radicando. Ci limitiamo
√ qui al semplice
esempio 3 x3 − 26 − x = 2, cioè 3 x3 − 26 = x + 2,
dopo aver separato la parte razionale da quella irrazionale. Elevando al cubo e semplificando, si ottiene
l’equazione di secondo grado x2 + 2x − 3 = 0, cioè
x = −3 e x = 1. Ora si√tratta di effettuare la verifica;
per x = −3 si ha 3 −27 + 26 = −3 + 2, cioè
√
3
−1 = −1, il che è corretto quando si considerino
le radici algebriche, come s’è convenuto. Per x = 1
la verifica è immediata, e quindi i due valori trovati
sono entrambi radici legali dell’equazione.
5.4
Sistemi di equazioni
E’ abbastanza intuitivo che un problema possa essere
risolto mediante un’unica equazione se c’è un’unica
quantità da determinare. Se le quantità sono due,
una sola equazione, cioè una sola condizione, può non
essere sufficiente a darci le informazioni necessarie a
risolvere il problema. Ad esempio, un amico burlone
può farci una domanda di questo genere: di un numero di due cifre sappiamo che la somma di queste è sei
e se invertiamo la loro posizione il numero aumenta
di 18 unità. Qual è il numero? Pur essendo una domanda tipicamente accademica, o forse proprio per
144
questo, ci sentiamo sfidati a trovare la soluzione. Numeri che soddisfano la prima condizione ce ne sono
diversi, come 15, 24, 33 o 60; e anche 6 se lo vediamo
scritto come 06. Parimenti, di numeri che soddisfano la seconda condizione ce ne sono più d’uno, come
13, 24 o 35. Possiamo allora ricorrere a un metodo
esaustivo: scriviamo separatamente tutti i numeri che
soddisfano ciascuna condizione e osserviamo quali sono (se ce ne sono) quelli che compaiono in tutti e due
gli elenchi. Quando, come in questo caso, i due elenchi sono finiti e siamo sicuri di riuscire a trovare tutti
i numeri che soddisfano ciascuna condizione, questo
può essere un metodo effettivo. Ma, ci chiediamo, c’è
un metodo un po’ più generale e meno sensibile ad
eventuali errori di elencazione?
L’algebra fornisce un metodo di risoluzione che, oggi, ci appare molto naturale, ma che ha richiesto secoli per essere scoperto, e la cui scoperta ha richiesto
l’invenzione di un formalismo che non è per niente
banale, almeno fino a quando non lo si conosca e non
lo si sia capito. Chiamiamo x ed y le due cifre del
numero che stiamo cercando, cioè sia 10x + y tale numero, secondo la consueta notazione posizionale. La
prima condizione si scrive facilmente x+y = 6. Per la
seconda, cominciamo ad osservare che, invertendo le
due cifre, si ha il numero 10y +x, e quindi la condizione si scrive: 10y + x = 10x + y + 18. Se A è l’insieme
delle coppie (x, y) che soddisfano la prima condizione, cosı̀ che, ad esempio, (1, 5) ∈ A e (6, 0) ∈ A, e B
è l’insieme delle coppie (x, y) che soddisfano la seconda condizione, di modo che (1, 3) ∈ B e (2, 4) ∈ B,
le soluzioni che cerchiamo sono A ∩ B. Si dice allora sistema di equazioni in k incognite un insieme di
equazioni nelle quali compaiono esattamente k incognite x, y, . . . , z e che devono diventare proposizioni
vere per i medesimi valori di tali incognite. Una soluzione del sistema è appunto una k-upla di valori
(x = x0 , y = y0 , . . . , z = z0 ) che sostituiti nelle varie equazioni le rendono tutte vere; in altre parole, le
soluzioni del sistema sono gli elementi dell’intersezione delle possibili soluzioni delle varie equazioni che
compongono il sistema. Le equazioni si scrivono una
sotto l’altra, riunite da una parentesi graffa: questa
ha lo scopo di mettere in rilievo il fatto che un’eventuale soluzione deve soddisfare tutte le equazioni; è
pertanto parte essenziale della notazione e non può
essere sottintesa. Nel nostro esempio abbiamo:
½
x+y =6
10y + x = 10x + y + 18.
CAPITOLO 5. ALGEBRA
che lo compongono (nel nostro esempio: 1 × 1 = 1).
Nella sezione presente ci occuperemo soltanto della
soluzione dei sistemi lineari in due e tre incognite.
Un sistema lineare di due equazioni in due
incognite è sempre riducibile alla forma normale:
½
ax + by = c
(5.1)
a′ x + b′ y = c′
mediante le usuali regole di semplificazione. Ad esempio, la seconda delle nostre equazioni dà 9y−9x = 18,
cioè, per il Teorema 5.5, y − x = 2, e quindi il sistema
ha come forma normale:
½
x+y =6
x − y = −2.
Esistono almeno due metodi diretti per risolvere un
sistema ridotto a forma normale:
• per sostituzione: si ricava una delle due incognite da una delle due equazioni (come se l’altra
incognita fosse un semplice numero) e la si sostituisce nell’altra equazione. Questa diviene un’equazione lineare in una sola incognita, e quindi
sappiamo come risolverla. Trovato il valore di
questa incognita, la si sostituisce in una qualsiasi delle due equazioni, ricavando cosı̀ il valore
della prima incognita;
• per somma e sottrazione: moltiplicando le due
equazioni per opportune costanti, si rendono
uguali (od opposti) i coefficienti della x; sottraendo (risp. sommando) membro a membro
le due equazioni, la variabile x scompare e si ottiene un’equazione lineare in y, che si sa risolvere. Agendo in modo analogo sulla y, si ricava il
valore della x.
Applicando il primo metodo, dalla prima equazione
si ottiene y = 6 − x; sostituendo questo valore nella
seconda si ha: x − 6 + x = −2, cioè 2x = 4 che ci
dà x = 2. Sostituendo questo valore in y = 6 − x si
ottiene y = 4, e perciò il numero da indovinare era
24. Applicando il metodo di somma e sottrazione (in
questo caso è il metodo da preferire), sommando si
ottiene 2x = 4, cioè x = 2, e sottraendo 2y = 8, cioè
y = 4, e di nuovo si trova la soluzione 24. Come c’era
da aspettarsi.
In questo esempio, la soluzione esiste ed è unica;
ma, ci chiediamo, è questo sempre il caso o, come per
le equazioni ad una incognita, vi sono anche altre posPoiché, in questo caso, le equazioni che compongono sibilità? Per rispondere a questo quesito, ripartiamo
il sistema sono tutte lineari, il sistema si dice lineare; dalla forma canonica generale e vediamo di trovare
propriamente, si tratta di un sistema lineare di due un’espressione per la (o le) possibili soluzioni, quanequazioni in due incognite. In generale il grado di un do almeno una soluzione esista. Usando il metodo di
sistema è il prodotto dei gradi delle singole equazioni somma e sottrazione, si moltiplicano opportunamente
145
5.4. SISTEMI DI EQUAZIONI
le due equazioni:
½
aa′ x + ba′ y = ca′
aa′ x + ab′ y = ac′
Nota 5.6
½
ab′ x + bb′ y = cb′
ba′ x + bb′ y = bc′
Si sottraggono le due coppie di equazioni e si ottiene
(a′ b − ab′ )y = a′ c − ac′ dalla prima e (ab′ − a′ b)x =
b′ c − cb′ dalla seconda. Quindi la soluzione generale
è:
ac′ − a′ c
b′ c − bc′
y= ′
.
x= ′
′
ab − a b
ab − a′ b
La discussione relativa alle possibili soluzioni è ora
piuttosto semplice. Tutto dipende dall’espressione
ab′ −a′ b che si trova al denominatore; se essa è diversa
da zero la soluzione è unica e perfettamente determinata dalle formule precedenti. Se invece ab′ −a′ b = 0,
la soluzione non è più determinata; questa condizione
equivale a a/a′ = b/b′ , cioè il rapporto dei coefficienti
della x e della y è lo stesso. Può allora succedere che
il rapporto c/c′ ha ancora lo stesso valore, oppure ha
un valore diverso. Nel primo caso le due equazioni
ax + by = c e a′ x + b′ y = c′ sono in effetti la stessa
equazione; quindi ogni soluzione della prima equazione è anche soluzione della seconda, e viceversa. Ma
la prima equazione ha infinite soluzioni perché, assegnato un valore alla x, la y resta determinata di
conseguenza. Il sistema si dice allora indeterminato.
Se invece c/c′ 6= a/a′ , le due equazioni sono incompatibili, in quanto se ax + by è uguale a c non si può
anche avere a′ x + b′ y = c′ ; quindi il sistema è impossibile. Queste considerazioni portano a scrivere il
seguente algoritmo:
Algoritmo 5.4 (Soluzione di un sistema 2 × 2)
Una matrice 2 × 2 è costituita da 4
numeri disposti su 2 righe e 2 colonne:
·
¸
a b
M=
;
a′ b ′
si dice determinante di M e si scrive det(M ) la quantità ab′ − a′ b, ottenuta sottraendo il prodotto degli
elementi della diagonale secondaria da quello degli elementi della diagonale principale. Da un punto di vista
notazionale, una matrice viene delimitata da una coppia di parentesi quadre (o tonde); un determinante è
delimitato da linee verticali analoghe a quelle del valore assoluto. Nel caso del sistema 5.1, la precedente
matrice (ottenuta disponendo in ordine i coefficienti
della variabili nelle due espressioni) si dice la matrice
del sistema e il suo determinante si dice determinante
del sistema. Se, nella matrice del sistema, al posto
della prima colonna sostituiamo i termini noti, si ha
come determinante:
¯
·
¸ ¯
¯ c b ¯
c b
¯
¯ = cb′ − bc′ .
det
=¯ ′
c′ b′
c b′ ¯
Se poi sostituiamo i termini
colonna:
¸ ¯
·
¯ a c
a c
= ¯¯ ′
det
a c′
a′ c′
noti nella seconda
¯
¯
¯ = ac′ − a′ c.
¯
Si hanno allora le seguenti formule di Cramer per la
risoluzione del nostro sistema:
¯
¯
¯
¯
¯ c b ¯
¯ a c ¯
¯
¯ ′
¯
¯
¯ c b′ ¯
¯ a′ c′ ¯
y=
.
x=
det(M )
det(M )
Queste formule, che sembrano complicare, invece che
semplificare, la soluzione del nostro problema, sono
in realtà estendibili a sistemi lineari di n equazioni
in n incognite, e quindi rendono più agevole la
formulazione della soluzione, anche se, spesso, non ne
semplificano la soluzione numerica.
Ingresso: i coefficienti a, b, c e a′ , b′ , c′ delle due
equazioni del sistema;
Uscita: la soluzione del sistema, oppure la parola
Il metodo di somma e sottrazione risulta di solito
“Indeterminato” con la formula delle soluzioni, più simpatico del metodo di sostituzione; questo però
oppure il termine “Impossibile”;
è del tutto generale e può essere esteso a sistemi di
n equazioni in n incognite. Nel caso n = 3 spesso si
1. si calcola il valore ∆ := ab′ − a′ b;
applica un metodo intermedio: si ricava da un’equazione un’incognita in funzione delle altre due e la si
2. Se ∆ 6= 0 allora:
sostituisce nella rimanenti due equazioni, che perciò
(a) si calcola x := (b′ c − bc′ )/∆ e y := (ac′ − vengono a formare un sistema di due equazioni in due
incognite. Questo si risolve per somma e sottrazione e
a′ c)/∆;
(b) si esce scrivendo il valore ottenuto per x e i valori trovati si sostituiscono nella prima equazione
per ricavare il valore dell’ultima incognita. Ad esemper y;
pio, di un numero di tre cifre sappiamo: 1) la somma
3. altrimenti (∆ = 0) si calcola il rapporto r := delle tre cifre è 12; 2) la somma delle prime due cifre
è uguale alla terza; 3) il numero formato dalle prime
a/a′ ;
due cifre è quattro volte la terza cifra. Dette allora
(a) se r 6= c/c′ si esce scrivendo “Impossibile”; x, y, z le tre cifre, si ha il sistema:

(b) altrimenti (r = c/c′ ) si scrive “Indeter x + y + z = 12
minato” e si esce con l’espressione y =
x+y =z

(c − ax)/b.
10x + y = 4z.
146
CAPITOLO 5. ALGEBRA
La seconda equazione ci dà già una determinazione che 6x2 − 7x − 3 = (3x + 1)(2x − 3), e a questo punto
di z in termini di x ed y; sostituendo tale valore di vediamo che la frazione si può scrivere come:
z nelle altre due equazioni si trova un sistema di 2
A
B
x−7
equazioni in 2 incognite:
=
+
,
(3x + 1)(2x − 3)
3x + 1 2x − 3
½
½
x+y =6
2x + 2y = 12
dove A e B sono due numeri reali opportuni. In effet2x − y = 0.
6x − 3y = 0
ti, dimostreremo ora che questa scomposizione, detta
Sommando, si trova 3x = 6, cioè x = 2 e quindi in frazioni parziali, è possibile proprio determinando
y = 4. A questo punto, usando z = x+y è immediato il valore di A e di B. Portando le due frazioni allo
dedurre z = 6, cioè il numero cercato è 246. In questo stesso denominatore si ottiene:
caso la forma normale è:
2Ax − 3A + 3Bx + B
x−7
=
.

(3x + 1)(2x − 3)
(3x + 1)(2x − 3)
 x + y + z = 12
x+y−z =0

Affinché queste due espressioni siano uguali (come
10x + y − 4z = 0.
deve essere) occorre che i due numeratori coincidano,
cioè sia x − 7 = (2A + 3B)x − 3A + B. Essendo x
Nota 5.7
Nell’esempio, la matrice del sistema è:
una
indeterminata, le due espressioni sono uguali se


1 1
1
e solo se coincidono i coefficienti della x e i termini
M =  1 1 −1 
noti. Deve cioè essere:
10 1 −4
½
2A + 3B = 1
e il determinante di una matrice 3 × 3 si trova con la
−3A + B = −7
regola di Sarrus, o
¯
¯
¯
¯
¯
¯
delle diagonali:
¯
a
b
c ¯¯
′
′
′ ¯
a
b
c ¯=
a′′ b′′ c′′ ¯
= ab′ c′′ + bc′ a′′ + ca′ b′′ − cb′ a′′ − ba′ c′′ − ac′ b′′ .
Nel nostro caso il determinante vale: −4 − 10 + 1 −
10 + 4 + 1 = −18. Esso costituisce il denominatore per
applicare le formule di Cramer. Sostituendo la colonna dei termini noti alla prima colonna della matrice
del sistema si trova:
¯
¯
¯ 12 1
1 ¯¯
¯
¯ 0 1 −1 ¯ = −48 + 0 + 0 − 0 − 0 + 12 = −36,
¯
¯
¯ 0 1 −4 ¯
e quindi x = −36/(−18) = 2. Analogamente si
trovano i valori di y e di z, l’elaborazione dei quali
lasciamo al lettore (che sia arrivato fin qui) come
semplice, ma assai utile esercizio.
Un’importante applicazione della risoluzione dei sistemi lineari è costituita dalla semplificazione delle
funzioni razionali fratte. Abbiamo già accennato nella Sezione 5.1 che esse possono sempre essere ridotte
a frazioni il cui numeratore abbia grado inferiore al
denominatore. Se poi questo può essere scomposto
in fattori del tipo ax + b, la frazione si semplifica ulteriormente in somme di funzioni razionali fratte col
denominatore semplice del tipo (ax + b)k . Il metodo
si spiega bene con un esempio, che può essere generalizzato. Si consideri la funzione razionale fratta
(x − 7)/(6x2 − 7x − 3). E’ un semplice esercizio sulla
risoluzione delle equazioni di secondo grado scoprire
e questo è un sistema lineare di due equazioni nelle
due incognite A e B. Possiamo risolverlo per sostituzione, osservando che B = 3A − 7 dalla seconda
equazione. Questo dà 11A = 22 dalla prima equazione, cioè A = 2, e di conseguenza B = −1. Si ha
pertanto:
2
1
x−7
=
−
.
(3x + 1)(2x − 3)
3x + 1 2x − 3
Nota 5.8
In generale, avremo situazioni come:
ux + v
A
B
=
+ ′
(ax + b)(a′ x + b′ )
ax + b
a x + b′
dove ax + b e a′ x + b′ non sono equivalenti, cioè non
esiste alcun numero reale k per cui a′ = ak e b′ = bk.
Procedendo come nell’esempio, si arriva al sistema:
½
Aa′ + Ba = u
Ab′ + Bb = v.
Il determinante di questo sistema vale a′ b − ab′ , che è
0 se e solo se a/a′ = b/b′ , cioè proprio solo nel caso
che abbiamo escluso. Questo ci assicura che il metodo ha sempre successo, purché i binomi a denominatore non siano, di fatto, lo stesso binomio. Il caso
delle funzioni razionali fratte (ux + v)/(ax + b)2 non
può essere risolto né con questo metodo, né con altri.
Analogamente, non possono essere risolte le situazioni
in cui a denominatore ci sia un polinomio di secondo
grado irriducibile, cioè con discriminante minore di
0. Senza entrare in dettagli e dimostrazioni, lasciamo
al lettore la verifica delle due seguenti scomposizioni,
che esemplificano il metodo nei due casi noiosi appena
detti.
147
5.5. DISEQUAZIONI
Quando è presente una potenza k ≥ 2, occorre far
intervenire tutte le potenze minori o uguali a k:
A
B
C
x2 − 7x + 1
=
+
+
.
(x + 1)2 (x − 2)
(x + 1)2
x+1
x−2
Questo porta al sistema:


B+C
A − B + 2C

−2A − 2B + C
=
=
=
1
−7
1
e quindi si ottiene:
−3
2
1
x2 − 7x + 1
=
+
−
.
(x + 1)2 (x − 2)
(x + 1)2
x+1
x−2
Per i polinomi irriducibili occorre un numeratore più
complesso, cioè un binomio di primo grado:
2x2 + x − 5
Ax + B
C
= 2
+
,
(x2 + 1)(x − 2)
x +1
x−2
che porta alla scomposizione:
x+3
1
2x2 + x − 5
= 2
+
,
(x2 + 1)(x − 2)
x +1
x−2
attraverso la soluzione di un sistema di tre equazioni
in tre incognite, che lasciamo alle amorevoli attenzioni
del lettore.
Come sappiamo, il grado di un’equazione algebrica
è il più alto dei gradi dei monomi che lo compongono,
dopo aver effettuato tutte le semplificazioni possibili.
Il grado di un sistema è il prodotto dei gradi delle
equazioni che lo compongono. Come abbiamo visto,
se tutte le equazioni sono lineari, allora il grado del
sistema è 1; se si considerano invece:
½
½ 2
x+y = α
x + y2 = γ
oppure
xy = β
xy = δ
si hanno, rispettivamente, un sistema di secondo e un
sistema di quarto grado. In via del tutto teorica, la
soluzione di uno di questi sistemi può avvenire operando per sostituzione; ad esempio, da x + y = α si
ricava y = α − x e quindi, sostituendo nella seconda,
x2 −αx+β = 0 (vedere anche la Sezione 5.3). In questo modo, si capisce come ogni volta si arrivi ad avere
un’equazione con lo stesso grado di tutto il sistema,
giustificando cosı̀ la definizione stessa di grado.
Talvolta, il metodo di sostituzione è l’unico o il
più appropriato metodo di procedere. In realtà, esiste una bellissima teoria sulla risoluzione dei sistemi
polinomiali, ma non possiamo parlarne qui. Ciò che
invece è importante fare è spingere il solutore ad utilizzare la propria intelligenza e le proprie conoscenze
per cercare metodi indiretti di risoluzione. Ad esempio, per il secondo sistema si può procedere osservando che x2 +2xy +y 2 = γ +2δ e x2 −2xy +y 2 = γ −2δ.
Questo dà il nuovo sistema lineare:
½
√
x + y = ±√γ + 2δ
x − y = ± γ − 2δ
che si può risolvere per somma e sottrazione. La scelta dei segni permette di trovare le quattro soluzioni
previste, purché sia γ+2δ > 0 e γ−2δ > 0; altrimenti,
il numero delle radici reali potrà essere minore.
I sistemi di equazioni che abbiamo considerato prevedono una soluzione in termini di numeri reali o, se i
coefficienti sono interi, in termini di numeri razionali.
Spesso però accade che certi problemi richiedono una
soluzione in numeri interi, come nel celebre caso del
vecchio cammelliere arabo. Costui possiede 17 cammelli e li lascia in eredità ai tre figlioli, specificando
che il primo debba averne la metà, il secondo un terzo
e il terzo (che è un po’ birichino) solamente un nono.
Ma come fare la divisione se, come sembra, i cammelli non possono essere divisi a fette? La soluzione del
Visir, chiamato a risolvere la questione, è più astuta
che matematicamente corretta. In realtà, le equazioni e i sistemi di equazioni per i quali si ricercano solo
soluzioni intere sono stati studiati fin dall’antichità e
vengono detti diofantei, in onore di Diofanto, il matematico greco - alessandrino che li affrontò in modo
sistematico nel III secolo d.C.. Oggi si sa che questi
problemi sono di difficile soluzione e, addirittura, è
impossibile trovarne un metodo generale di risoluzione. Se sono coinvolte n variabili, le possibili soluzioni
sono contenute in Zn , un insieme numerabile, e quindi si potrebbe pensare di provarle sistematicamente
tutte, fino a che una soluzione non salti finalmente
fuori. Questo, però, succede se almeno una soluzione
esiste; purtroppo, si dimostra che è impossibile dimostrare che, per un dato sistema diofanteo, almeno
una soluzione esista. Pertanto, procedendo per tentativi, potremmo andare avanti, andare avanti e non
arrivare mai al termine della verifica. Tecnicamente,
si dice che il problema della soluzione delle equazioni diofantee è indecidibile. Questo è uno dei casi in
cui il principio del terzo escluso e il principio di non
contraddizione non sono più applicabili.
5.5
Disequazioni
Non vi è dubbio che molti problemi si risolvono con
l’uso delle equazioni, specie quando si ricerchino valori precisi o caratteristici. Tuttavia, nella pratica sono molto frequenti i problemi nei quali si cerca un rango di valori che ci permettano una certa
flessibilità, o che comunque abbiano a che fare con
quantità che devono essere maggiori (o minori) di un
148
valore assegnato. Ad esempio, vorremmo sapere a
che ora (al più tardi) dobbiamo partire per arrivare a Roma entro mezzogiorno, sapendo che il traffico non ci permetterà di superare gli 80 km/h. Nel
classico problema del trasporto, un’azienda ha, diciamo, tre stabilimenti di produzione S1 , S2 , S3 , ciascuno dei quali, in un mese, può produrre una quantità
q1 , q2 , q3 di un certo prodotto, compresa tra un minimo e un massimo: mi ≤ qi ≤ Mi , i = 1, 2, 3, legato
agli impianti e al personale. Ha poi n punti vendita V1 , V2 , . . . , Vn che possono smaltire certe quantità
ri , anch’esse comprese tra un minimo e un massimo: ti ≤ ri ≤ Ti , i = 1, 2, . . . , n. Si conosce poi il
costo del trasporto della merce (per unità di prodotto) da ciascuno stabilimento a ciascun punto vendita.
Il problema è quello di determinare le quantità Qi,j
da trasportare dallo stabilimento Si al punto vendita
Vj in modo da soddisfare i vincoli, cioè le condizioni
sulle quantità della produzione e delle vendite, e da
minimizzare i costi di trasporto.
Una disequazione è un’espressione del tipo
A(x, y, . . . , z) ⊳ B(x, y, . . . , z) dove A(x, y, . . . , z) e
B(x, y, . . . , z) sono due espressioni letterali nelle incognite x, y, . . . , z ed ⊳ è uno dei quattro relatori:
<, ≤, >, ≥. Una soluzione della disequazione è un
qualsiasi assegnamento di valori reali alle variabili:
x = x0 , y = y0 , . . . , z = z0 tale che la proposizione A(x0 , y0 , . . . , z0 ) ⊳ B(x0 , y0 , . . . , z0 ) risulti vera. Il
grado di una disequazione è definito in modo analogo al grado di una equazione: ridotta la disequazione alla forma canonica C(x, y, . . . , z) ⊳ 0, il grado
della disequazione è il grado dell’espressione letterale C(x, y, . . . , z). Per arrivare alla forma canonica di
una disequazione, si applicano le regole di al-jabra e
di al-muqābalah, ma con qualche attenzione:
1. se si aggiunge o si toglie ad entrambi i membri di una disequazione la stessa quantità, la
disequazione non cambia;
2. se si moltiplicano o si dividono entrambi i membri di una disequazione per la stessa quantità
maggiore di 0, la disequazione non cambia;
CAPITOLO 5. ALGEBRA
dobbiamo moltiplicare i due membri per l’espressione C(x), dobbiamo dividere il nostro problema in due
sottoproblemi: C(x)A(x) ⊳ C(x)B(x) e C(x) ≥ 0 il
primo, e C(x)B(x) ⊳ C(x)A(x) e C(x) ≤ 0 il secondo. Si tratta, propriamente, di due sistemi di disequazioni, ma come ora vedremo, questo fa parte della
regola generale, secondo la quale ogni disequazione si
risolve mediante lo studio di un opportuno sistema di
disequazioni.
Oggi, problemi analoghi a quello del trasporto nascono in molte modellazioni della realtà, spesso legati alla produzione di beni, alla progettazione ingegneristica ed economica; se le disequazioni sono tutte lineari, si dice che siamo di fronte a un sistema
di programmazione lineare; esistono algoritmi, come
quello famoso del simplesso che permettono di risolvere, con l’aiuto dell’elaboratore, sistemi con migliaia
di incognite e decine di migliaia di disequazioni. Qui,
naturalmente, ci occuperemo di problemi molto più
semplici, ma che sono alla base di questo settore dell’Algebra, talvolta molto interessante e spesso assai
complicato.
Una disequazione lineare nella sola incognita x è di
facile soluzione; la sua forma più generale, una volta
applicate le regole viste sopra, è ax ⊳ b e, applicando
ancora la regola 3, se a > 0 si ha x ⊳ b/a, mentre
se a < 0 si trova b/a ⊳ x. Cosı̀, se la distanza da
Roma a cui ci troviamo è 180 km, il tempo minimo di
percorrenza sarà: 180/80 = 9/4 = 2h 15′ ; se vogliamo
arrivare entro mezzogiorno, dobbiamo partire prima
che manchi un quarto alle dieci. Le soluzioni di una
disequazione si rappresentano in modo convenzionale,
ma suggestivo, disegnando la retta reale e dividendola
secondo i punti di transizione dalle zone di soluzione a
quelle di non-soluzione; queste ultime si denotano con
una linea tratteggiata, mentre le prime si indicano
con una linea continua. Nel nostro esempio abbiamo:
9/4
La risoluzione delle disequazioni di primo grado è
un
passo importante. In pratica ci limiteremo a consi3. se si moltiplicano o si dividono entrambi i memderare
disequazioni di tipo polinomiale o determinate
bri di una disequazione per la stessa quantità
da
espressioni
razionali fratte (con una sola incogniminore di 0, la disequazione cambia senso (cioè,
ta), accennando appena alle disequazioni irrazionali,
se A(x) ⊳ B(x), allora cB(x) ⊳ cA(x)).
comunque riconducibili ai tipi precedenti. Dovendo
La quantità a sommare o a moltiplicare può an- implicitamente considerare anche i sistemi di diseche dipendere da una o più delle variabili x, y, . . . , z, quazioni, ad essi non dedicheremo una trattazione
ma nel caso della moltiplicazione questo introduce particolare.
una nuova disequazione che ci permetta di manteCome vedremo nella prossima sezione sui numeri
nere (o di invertire) il senso della disequazione mo- complessi, un polinomio p(x) ∈ R[x] è sempre scomdificata. Ad esempio, se A(x) ⊳ B(x) e sappiamo ponibile in polinomi di primo e di secondo grado con
che x > 0, allora possiamo cambiare la disequazione discriminante minore di 0 (polinomi irriducibili). In
in xA(x) ⊳ xB(x), se ciò ci conviene. Viceversa, se generale, queste scomposizione non si può ottenere
149
5.5. DISEQUAZIONI
facilmente e richiede la ricerca delle radici del polinomio. Se questo è di secondo grado, sappiamo come
procedere; se è di terzo o di quarto grado, si conoscono tecniche di scomposizione (si veda la Sezione 5.7),
che spesso sono però assai complesse. In generale,
per i polinomi di grado superiore al secondo si usano
metodi numerici per determinare buone approssimazioni delle radici, e anche a questo accenneremo nella
stessa Sezione 5.7, pur essendo la faccenda non del
tutto banale. Pertanto, lo strumento più disponibile
e simpatico (anche se talvolta piuttosto noioso) è dato dal Teorema di Eisenstein, che però funziona solo
se i coefficienti del polinomio sono numeri interi (o
razionali) e almeno una delle radici è razionale. Trovata questa, la regola di Ruffini permette di effettuare
la prima scomposizione e ridurre il polinomio di un
grado, semplificando cosı̀ (si spera) i passi successivi.
Immaginando (con un po’ di buona volontà) di esser riusciti a scomporre in fattori irriducibili il nostro
polinomio, la tecnica da utilizzare è standard e cercheremo ora di esporla; essa si basa su considerazioni
relative a ciascun fattore e per quelli di primo grado l’osservazione precedente sul grafico con la retta
reale è tutto ciò che serve. Per quanto riguarda i polinomi irriducibili di secondo grado, si ha il seguente
risultato:
risulta positiva per valori di x < α e di x > β, mentre
risulta negativa per α < x < β.
Prova: Il prodotto di due fattori risulta positivo se
e solo se i due fattori hanno lo stesso segno; ma x − α
è positivo per x > α e x − β per x > β. Quindi, solo
per α < x < β i due fattori hanno segno discorde.
Utilizzando ancora la retta reale, la seguente figura
rappresenta molto bene la situazione (e può essere
facilmente generalizzata):
α
β
(x − α)
(x − β)
(x − α)(x − β)
dove la terza linea (x − α)(x − β) deriva dalla diretta applicazione della regola dei segni alle due linee
precedenti, quando si ricordi che la linea tratteggiata corrisponde a valori negativi e quella continua a
valori positivi.
La generalizzazione ad espressioni di grado superiore è allora immediata. Supponiamo di avere l’eLemma 5.14 Sia ax2 + bx + c (con a 6= 0) un’e- spressione, già fattorizzata, (x + 1)(x − 1)(x − 2) =
3
2
spressione di 2◦ grado con il discriminante negativo; x − 2x − x + 2; le tre linee corrispondenti ai tre
allora tale espressione, al variare di x, risulta sempre fattori ci dicono subito il risultato:
negativa se a < 0 e sempre positiva se a > 0.
−1
1
2
(x + 1)
Prova: Usiamo qui un’argomentazione che risulterà pienamente giustificata solo quando parleremo
(x − 1)
di continuità (vedere la Sezione 8.4); per il momento
ci dobbiamo basare solo sulla nostra intuizione. Se
(x − 2)
il risultato esposto nell’enunciato non fosse vero, si
avrebbe un valore x0 di x per cui ax20 + bx0 + c < 0
e un valore x1 di x per cui ax21 + bx1 + c > 0. Poiché
a piccole variazioni di x corrispondono piccole variazioni dell’espressione, deve esistere un valore x̄ di x, L’espressione è positiva per −1 < x < 1 poiché risulcompreso tra x0 ed x1 , tale che ax̄2 + bx̄ + c = 0, cioè tano positivi due fattori su tre; è di nuovo positiva
un valore che risulta radice dell’espressione, contro per x > 2 poiché tutti e tre i fattori sono positivi.
l’ipotesi che il discriminante fosse negativo, e quindi L’espressione è invece negativa per x < −1 poiché è
l’espressione senza radici reali.
composta da tre fattori negativi, e per 1 < x < 2 poiché
solo il fattore (x − 3) risulta negativo. La regola
Lasciamo al lettore il compito di estendere queè:
i)
l’espressione è positiva se i fattori negativi sono
sto risultato al caso del discriminante nullo, mentre
in
numero
pari; ii) è negativa se i fattori negativi soci interessa vedere cosa succede se il discriminante è
no
in
numero
dispari. Anche se tutti lo dovrebbero
positivo e quindi esistono due soluzioni α e β dell’e2
sapere,
il
numero
0 è pari!
quazione ax + bx + c = 0. Possiamo allora scrivere
2
Ogni espressione polinomiale dà origine ad una diax +bx+c = a(x−α)(x−β) e supporre che sia a > 0;
il caso a < 0 si tratta in modo del tutto analogo. Si sequazione risolubile con il metodo descritto, purché
sia scomponibile in fattori irriducibili. Ci basterà osha allora:
servare il seguente esempio, che ci permette di deTeorema 5.15 Data l’espressione ax2 + bx + c = scrivere il metodo generale. Il lettore è invitato (cala(x − α)(x − β) con a > 0 e α < β, tale espressione damente) a formalizzare il procedimento in un vero
150
CAPITOLO 5. ALGEBRA
e proprio algoritmo, il che gli permetterà di chiari- dei suoi coefficienti contiene uno o più parametri, cioè
re e di chiarirsi i vari passi necessari. Sia data la quantità non definite da un preciso valore, ma che, a
disequazione:
seconda dei casi, possono assumere valori precisi. Ad
esempio, consideriamo l’equazione di secondo grado:
x4 + 2x3 − x − 2 > 0
x2 − (m + 2)x − (4m + 8) = 0,
e si cerchi di fattorizzare il polinomio di quarto grado.
Il Teorema di Eisenstein ci dice che, se esistono radici per la quale siamo interessati a scoprire per quali
razionali, esse sono comprese tra ±1 e ±2. Provando, valori di m (il parametro), l’equazione ha due sosi vede che x = 1 è proprio una radice, e applicando luzioni reali (come sottoprodotto, scopriremo anche
quando essa ha un’unica soluzione). Naturalmente,
la regola di Ruffini ci si riduce all’espressione:
l’esistenza delle soluzioni è legata al discriminante:
(x − 1)(x3 + 3x2 + 3x + 2) > 0.
∆ = (m + 2)2 + 4(4m + 8) = m2 + 20m + 36.
Confidando ancora nella fortuna e in Eisenstein, si
trova la radice x = −2 e di nuovo si usa Ruffini per Perché si abbiano due soluzioni, deve essere2 ∆ > 0 e
quindi dobbiamo risolvere la disequazione m +20m+
ottenere l’espressione:
36 > 0. La scomposizione in fattori dà: m2 + 20m +
36 = (m+2)(m+18) e, in accordo a quanto detto, due
(x − 1)(x + 2)(x2 + x + 1) > 0.
soluzioni si hanno per m < −18 e m > −2, e il lettore
L’ultima espressione di secondo grado ha discrimi- verificherà che per m = −20 e per m = 0 si hanno
nante negativo e quindi, per il lemma precedente, ha davvero due soluzioni. A questo punto, per m = −18
sempre valore positivo. Basta allora disegnare il gra- e per m = −2 l’equazione di partenza ha un’unica
fico per i fattori (x − 1) e (x + 2) e vedere che la soluzione, e infatti si ha: x2 + 16x + 64 = (x + 8)2 = 0
disequazione di partenza è vera per x < −2 e per e x2 = 0.
Spesso, questa doppia soluzione di equazioni di sex > 1.
Se invece che da un polinomio, abbiamo una dise- condo grado risulta ostica e lo studente, specie le priquazione costituita da un’espressione razionale fratta, me volte, tende a perdere il filo del ragionamento (io
il metodo di risoluzione non cambia, visto che anche lo perdo ancora). Il ragionamento, in realtà, non è
un rapporto è positivo se e solo se numeratore e de- poi troppo complicato e richiede solo un po’ di attennominatore sono concordi. Un esempio deve essere zione. Perciò il consiglio è quello di rileggere tutta
questa tiritera e provare ancora una volta, ad esempio
sufficiente:
con l’equazione x2 − (m + 1)x − (2m + 5) = 0.
x2 + x − 2
(x + 2)(x − 1)
Le disequazioni sono utili anche per la risoluzio=
>0
x2 − 2x
x(x − 2)
ne delle equazioni irrazionali, vista nella Sezione 5.3.
Riprendiamo
l’esempio
considerato in quella occasio√
√
che si risolve col solito diagramma:
x + 4 − x − 3 = 1. Affinché una soluzione
ne:
x0 sia accettabile, deve permettere l’estrazione di en−2
0
1
2
(x + 2)
trambe le radici, cioè deve essere x0 > −4 e x0 > 3,
cioè, in definitiva, x0 > 3. Questa osservazione evita
(x − 1)
di dover controllare la soluzione ottenute eseguendo
i calcoli nell’equazione di partenza; quindi è proprio
x
un metodo da seguire. Osserviamo che, risolvendo
la precedente equazione,
p eravamo arrivati a un’altra
(x − 2)
equazione irrazionale: (x + 4)(x − 3) = x. Se fosse
stata questa la nostra equazione di partenza, il metodo dei grafici ci avrebbe mostrato che le soluzioni accettabili devono stare negli intervalli x < −4 e x > 3.
di modo che la soluzione è data dai tre intervalli x < Questa non è la stessa condizione vista in precedenza
−2, 0 < x < 1 e x > 2. Naturalmente, il lettore e relativa alla vera equazione di partenza. Lo stuè invitato a controllare questi risultati provando con dente prenda questa osservazione come un ulteriore
qualche valore significativo.
avvertimento a non considerare l’equazione, ottenuta
Un problema che si incontra abbastanza spesso, elevando a potenza i due membri, equivalente senz’alspecie nella Geometria Analitica, è quello di deter- tro all’equazione di partenza. Il Teorema 5.13 è un
minare quando un’equazione di secondo grado para- punto troppo importante e non va mai trascurato.
metrica ammette due radici o ne ammette una sola.
In modo analogo, le disequazioni ci permettono di
Un’equazione si dice parametrica quando almeno uno trattare in modo sistematico le equazioni (e le dise-
151
5.6. NUMERI COMPLESSI
quazioni) contenenti qualche valore assoluto. Il valore assoluto di una espressione è uguale all’espressione stessa, se essa è positiva, ed è uguale all’opposto
(cioè all’espressione cambiata di segno) se l’espressione è negativa. Tutto allora si accomoda e diviene
semplice, se operiamo una separazione delle soluzioni, andando a sostituire al valore assoluto l’espressione stessa o il suo opposto. Come spesso succede,
è più complicato esprimere il procedimento che attuarlo nella pratica. Si consideri pertanto l’equazione
|x − 2| = x2 ; quando x > 2 si ha |x − 2| = x − 2 e
quindi l’equazione è equivalente a x − 2 = x2 . Quando, viceversa, x < 2, si ha |x − 2| = −(x − 2) e quindi
l’equazione è equivalente a 2 − x = x2 . In questo modo, la soluzione della nostra equazione è ricondotta
alla soluzione dei due sistemi:
½
½
x − 2 = x2
2 − x = x2
e
x > 2
x < 2.
In modo esplicito osserviamo che il caso x = 2 può,
indifferentemente, essere considerato in proprio, essere inserito in uno dei due sistemi (ad esempio, il primo, ponendo x ≥ 2) o addirittura in tutti e due. La
cosa più semplice è quello di vederlo come terzo caso
e notare che non porta ad alcuna soluzione. Il lettore ora verificherà che il primo sistema non presenta
soluzioni, mentre il secondo dà x = −2 e x = 1.
Questo esposto è un caso molto semplice, ma le cose
non cambiano molto quando si debbano affrontare
equazioni, disequazioni o sistemi più complicati. Una
volta riportato tutto a diversi sistemi (giusto come s’è
visto) la difficoltà è scaricata sulle singole equazioni
e/o sulle singole disequazioni. Ci si riconduce cosı̀ a
cose discusse in questa e nelle precedenti sezioni.
Questa visione ottimistica relativa alla soluzione
di equazioni e di disequazioni può andare incontro
a qualche delusione, specie se un problema richiede
soluzioni in numeri interi. Abbiamo già visto le difficoltà relative ai sistemi diofantei, e qui mi piace dare
come esempio uno dei problemi più belli che io conosca. Fortunatamente, la soluzione non è difficile se la
si imposta in modo razionale.
Due amici matematici, Alberto e Biagio, si incontrano dopo tantissimi anni e si scopre che B. si è
sposato e ha avuto tre figli.
A.: Quanti anni hanno?
B.: Il prodotto delle loro età è 36.
A.: Non mi basta per risolvere il problema,
visto che è un problema quello che mi proponi!
B.: Be’, la somma delle loro età è il numero
civico su questo portone.
A.: Mi spiace, ma non è ancora sufficiente.
B.: Hai ragione, ma devi sapere che il più
grande ha gli occhi azzurri.
A.: Ora sı̀ che mi hai detto tutto!
e gli spiattella le età dei tre figlioli. La domanda ora
si impone: è il lettore in grado di trovare anche lui
queste benedette età?
La soluzione coinvolge soltanto numeri interi e
quindi è facile trovare tutte le terne di numeri
che hanno come prodotto 36; scriviamo, accanto a
ciascuna terna, la somma dei tre numeri:
1
1
1
1
1
2
2
3
+
+
+
+
+
+
+
+
1
2
3
4
6
2
3
3
+
+
+
+
+
+
+
+
36
18
12
9
6
9
6
4
=
=
=
=
=
=
=
=
38
21
16
14
13
13
11
10
Il lettore deve essere convinto che quelle elencate sono tutte e sole le terne possibili; mettendole in modo
che sia a ≤ b ≤ c si ha un metodo sistematico per generarle. Ora osserviamo che se il numero civico (che
noi non conosciamo, ma che Alberto vede) fosse stato 16, la soluzione avrebbe dovuto essere (1, 3, 12).
Il fatto che Alberto avesse qualche dubbio vuol dire
che la somma corrisponde a più soluzioni; ma ciò ci
dice che tale somma è 13, il numero civico misterioso. A questo punto, l’ultima informazione (che esiste
un figlio “più grande”) ci permette di escludere la soluzione (1, 6, 6), nella quale ci sono due gemelli più
grandi, e quindi rispondere (2, 2, 9). Formalmente, il
sistema si scrive:

xyz = 36

x+y+z = k

x > max(y, z)
ma bisogna dire, con buona pace dei matematici formalisti, che questo è di ben poco aiuto alla
soluzione.
5.6
Numeri complessi
Come abbiamo detto, i numeri reali si dividono in
due grandi categorie: i numeri algebrici, che sono i
numeri soluzione delle equazioni algebriche a coefficienti razionali, e i numeri trascendenti, cioè tutti gli
altri. Abbiamo anche visto che i numeri algebrici sono una infinità numerabile, cioè la loro cardinalità è
ℵ0 , mentre i numeri trascendenti hanno la cardinalità
del continuo.√Consideriamo ora un numero algebrico,
ad esempio 2, e denotiamolo con un simbolo particolare, diciamo θ. L’equazione algebrica di cui è
soluzione sarà x2 − 2 = 0, e quindi θ è caratterizzato
dal fatto che θ2 = 2. Prendiamo allora tutti i numeri
152
CAPITOLO 5. ALGEBRA
reali del tipo aθ √
+ b, dove a, b ∈ Q. Questo insieme
si denota con Q[ 2] = Q[θ] e si dice una estensione
algebrica di Q. Il punto interessante è che la somma
(aθ + b) + (a′ θ + b′ ) = (a + a′ )θ + (b + b′ ) rimane
nell’ambito dell’insieme, cioè, come si dice, è chiusa e naturalmente, essendo eseguita su numeri reali,
gode delle varie proprietà di associatività e commutatività. Inoltre, se consideriamo 0 = 0θ + 0 uno dei
nostri numeri, esso si comporta da identità e si ha
(aθ + b) + (−aθ − b) = 0, cioè −aθ − b è l’opposto di
aθ + b.
Ancora più notevole è il prodotto:
′
′
′ 2
′
′
′
(aθ + b) × (a θ + b ) = aa θ + ab θ + a bθ + bb =
= (ab′ + a′ b + aa′ )θ + (aa′ + bb′ ).
Se poi intervengono radici di equazioni di grado superiore al secondo, occorre considerare anche
le po√
tenze intermedie. Ad esempio, se θ = 4 2, allora θ
è la soluzione di x4 − 2 = 0 e quindi le espressioni
da considerare sono del tipo aθ3 + bθ2 + cθ + d. Il
prodotto richiede un’elaborazione più complicata:
(aθ3 + bθ2 + cθ + d)(a′ θ3 + b′ θ2 + c′ θ + d′ ) =
= aa′ θ6 + (ab′ + a′ b)θ5 + (ac′ + bb′ + a′ c)θ4 +
+(ad′ + bc′ + cb′ + da′ )θ3 +
+(bd′ + cc′ + db′ )θ2 + (cd′ + dc′ )θ + dd′ .
= (ab′ + a′ b)θ + (2aa′ + bb′ )
Ora occorre osservare che da θ4 = 2 discende θ5 = 2θ
e
θ6 = 2θ2 , per cui, continuando i calcoli, il prodotto
dato che θ2 = 2. Quindi, anche il prodotto è un’opeviene
a valere:
razione chiusa e, di nuovo, essendo eseguito tra numeri reali, è senz’altro associativo, commutativo e (ad′ + bc′ + cb′ + da′ )θ3 + (2aa′ + bd′ + cc′ + db′ )θ2 +
distributivo rispetto alla somma. Inoltre, scrivendo
1 = 0θ+1, si ha (aθ+b)×1 = aθ+b, cioè 1 fa da iden- +(2ab′ + 2ba′ + cd′ + dc′ )θ + (2ac′ + 2bb′ + 2ca′ + dd′ ).
tità rispetto al prodotto. Ci possiamo allora chiedere
Questa espressione è alquanto complessa, ma non poi
se esiste un inverso di aθ+b: la risposta è affermativa.
più di tanto, e permette anche di calcolare l’inverSia a′ θ + b′ l’eventuale inverso di aθ + b; si deve avere
so di aθ3 + bθ2 + cθ + d come soluzione di un si(aθ+b)×(a′ θ+b′ ) = (ab′ +a′ b)θ+(2aa′ +bb′ ) = 0θ+1,
stema lineare di quattro equazioni nelle quattro incioè ab′ + a′ b = 0 e 2aa′ + bb′ = 1. Questo è un sistecognite a′ , b′ , c′ , d′ : basta uguagliare la precedente
ma lineare di due equazioni nelle due incognite a′ , b′
espressione all’identità 1 = 0θ3 + 0θ2 + 0θ + 1.
e, come sappiamo, ha una e una sola soluzione se il
Di conseguenza, da un punto di vista formale, quedeterminante del sistema è diverso da 0; ma:
sti
insiemi di numeri hanno le stesse proprietà di Q
¯
¯
¯ b a ¯
e
di
R, cioè sono dei campi, più vasti di Q, ma più
2
2
¯
¯
¯ 2a b ¯ = b − 2a
smilzi di R. Anche R, come sappiamo, non è completo rispetto alla soluzione delle equazioni: non è detto
e questa espressione non può mai essere√0, altrimenti che un’equazione a coefficienti in R debba per forza
2
avremmo b2 = 2a2 , cioè 2 = b√
/a2 o 2 = b/a, ed avere una soluzione reale. Ad esempio, x2 +1 = 0 non
essendo a, b ∈ Q sarebbe anche 2 ∈ Q. La soluzione ha soluzioni reali perché ogni numero reale elevato al
del sistema dà:
quadrato dà un numero non negativo, e aggiungendogli 1 si ha sempre un numero maggiore di 0. Come
−a
b
a′ = 2
b′ = 2
,
2
2
prima θ era la soluzione ipotetica di una equazione
b − 2a
b − 2a
irriducibile su Q, chiamiamo ora i l’immaginaria soe questo permette di trovare l’inverso di ogni numero luzione della precedente equazione; deve pertanto esdel tipo aθ + b. Ad esempio, l’inverso di 2θ + 3 si sere i2 + 1 = 0, ovvero i2 = −1. Proprio per questa
trova calcolando:
asserzione, i viene detta l’unità immaginaria e su di
−2
essa possiamo costruire un nuovo campo R[i], che si
′
′
= −2
b = 3;
a =
chiama il campo dei numeri complessi e si indica di√so9−8
lito con C. In analogia a quanto si diceva per Q[ 2],
in effetti, eseguendo il prodotto (2θ + 3)(−2θ + 3) =
gli elementi di C hanno la forma bi + a, che tradizio−4θ2 + 6θ − 6θ + 9 = −4 × 2 + 9 = 1.
nalmente si scrive a + bi, e la somma è ovviamente
Questo stesso
√ procedimento può esser fatto, ad definita da:
esempio, per 5, ma la regola del prodotto diviene:
(aθ + b)(a′ θ + b′ ) = (ab′ + a′ b)θ + (5aa′ + bb′ ).
(a + bi) + (a′ + b′ i) = (a + a′ ) + (b + b′ )i.
Un po’ più complicato può essere considerare la radice Questa volta non conosciamo alcun campo che conθ dell’equazione x2 − x − 1 = 0; in questo caso è tenga C, e quindi dovremmo verificare che le proprietà associativa e commutativa valgono effettivaθ2 = θ + 1 e quindi il prodotto è definito da:
mente. Per la proprietà commutativa, ad esempio,
si ha: (a + bi) + (a′ + b′ i) = (a + a′ ) + (b + b′ )i =
(aθ + b)(a′ θ + b′ ) = (ab′ + a′ b)θ + aa′ θ2 + bb′ =
153
5.6. NUMERI COMPLESSI
(a′ +a)+(b′ +b)i = (a′ +b′ i)+(a+bi), e questo prova termine “immaginario” è, a questo proposito, molto
che anche in C possiamo contare su questa proprietà significativo).
della somma. Naturalmente, 0 + 0i è l’identità e si
scrive semplicemente 0; −a − bi è l’opposto di a + bi
3 + 2i
poiché (a + bi) + (−a − bi) = (a − a) + (b − b)i = 0.
Per il prodotto abbiamo:
−2 + i
′
′
′
′
′
′ 2
(a + bi) · (a + b i) = aa + ab i + ba i + bb i =
= (aa′ − bb′ ) + (ab′ + ba′ )i
essendo per definizione i2 = −1. Anche qui dovremmo verificare le proprietà commutativa, associativa e
distributiva rispetto alla somma. Per la commutatività abbiamo: (a + bi) · (a′ + b′ i) = (aa′ − bb′ ) +
(ab′ + ba′ )i = (a′ + b′ i) · (a + bi), dato che per i numeri reali la proprietà vale. Lasciamo alla pazienza e alla buona volontà del lettore la dimostrazione noiosa (ma che almeno una volta nella vita è bene fare) delle altre due proprietà. Piuttosto, chi è
l’identità rispetto al prodotto? Se (a′ + b′ i) indica
questa presunta identità ed a + bi 6= 0, deve essere
(a + bi) · (a′ + b′ i) = (aa′ − bb′ ) + (ab′ + ba′ )i = a + bi,
cioè aa′ −bb′ = a e ab′ +a′ b = b. Abbiamo qui un sistema lineare di due equazioni nelle due incognite a′ , b′ ;
moltiplicando la prima equazione per b e la seconda
per a si ottiene: aba′ − b2 b′ = ab e aba′ + a2 b′ = ab;
sottraendo membro a membro si ha: (a2 + b2 )b′ = 0.
Ma qui osserviamo che l’ipotesi a+bi 6= 0 implica che
sia a2 + b2 > 0, poiché a2 + b2 è 0 se e solo se sia a
che b valgono 0. Un prodotto in R, d’altra parte, è
0 solo se un fattore è 0 e quindi possiamo concludere
b′ = 0. Sostituendo questo valore in aa′ − bb′ = a (se
a 6= 0) e in ab′ +a′ b = b (se a = 0 e quindi b 6= 0) si ha
a′ = 1. Quindi, come ci si poteva aspettare, l’identità
è 1 + 0i, che di regola si scrive semplicemente 1.
In generale, tutti i numeri complessi della forma
a + 0i si scrivono a e si identificano con i numeri reali: il numero complesso 5 + 0i è da intendersi come
il numero reale 5. I numeri della forma 0 + bi si dicono immaginari e si scrivono nella forma abbreviata
bi. I numeri complessi, nel loro insieme, si possono
rappresentare come i punti del piano con le seguenti
convenzioni: assimiliamo il numero complesso a + bi
alla coppia ordinata (a, b) e quindi facciamo corrispondere il numero complesso a un punto del piano
cartesiano. Propriamente, l’asse delle x diviene l’asse
contenente tutti e soli i numeri reali, e pertanto viene detto l’asse reale. L’asse y invece contiene i punti
corrispondenti ai numeri immaginari e si dice perciò
l’asse immaginario. Nella Figura 5.3 sono riportati
alcuni punti con i corrispondenti numeri complessi;
il piano cartesiano, cosı̀ modificato e interpretato, si
dice piano d’Argand, dal nome del matematico dilettante francese che l’ha introdotto alla fine del 1700 e
che ha permesso di dare una rappresentazione concreta a un concetto ritenuto completamente astratto (il
1−i
−1 − 2i
Figura 5.3: Il piano di Argand
Abbiamo di proposito tralasciato l’ultimo problema sulla struttura algebrica dei numeri complessi:
dato un numero a + bi 6= 0, qual è il suo inverso? Se,
al solito, a′ + b′ i è tale ipotetico inverso, si deve avere
(a + bi) · (a′ + b′ i) = (aa′ − bb′ ) + (ab′ + ba′ )i = 1 + 0i,
il che equivale al sistema:
½
aa′ − bb′ = 1
ba′ + ab′ = 0
nelle due incognite a′ , b′ . Il determinante di questo
sistema è:
¯
¯
¯ a −b ¯
2
2
¯
¯
¯ b a ¯=a +b
che è sempre diverso da 0, nell’ipotesi che sia a +
bi 6= 0. Allora il sistema ha sempre una e una sola
soluzione:
a′ =
a
a2 + b2
b′ =
−b
.
a2 + b2
Ad esempio, dato il numero complesso 2 − 3i, l’in2
3
verso è 13
+ 13
i, come è facile verificare eseguendo il
prodotto:
¶ µ
¶ µ
¶
µ
3
4
9
6
6
2
+ i =
+
+
−
i = 1.
(2−3i)
13 13
13 13
13 13
Gauss, intorno all’anno 1800, riuscı̀ a dimostrare che
“ogni equazione algebrica a coefficienti in C ha in C
almeno una soluzione”, risultato noto come Teorema
fondamentale dell’Algebra. Tale proprietà che, come
sappiamo, non vale né in Q né in R, ci dice che il
campo dei numeri complessi è il campo numerico più
adeguato nel quale si possano trattare le equazioni
algebriche. Abbiamo esplicitamente visto che da Q
si può passare a campi più ampi, se si aggiungono
le radici di equazioni che non hanno soluzioni in Q;
la stessa cosa si può fare in R, e proprio con tale
metodo siamo arrivati a C. Qui la cosa non procede
154
CAPITOLO 5. ALGEBRA
oltre, poiché ogni equazione algebrica ha soluzioni in
C stesso.
Se invece di partire dall’equazione x2 + 1 = 0 fossimo partiti da un’altra equazione irriducibile, ad esempio x2 + 2x + 3 = 0, avremmo ottenuto un campo leggermente diverso, ma isomorfo a C, cioè con le stesse
proprietà di C. Se j è una radice di x2 + 2x + 3, il
prodotto (a + bj) · (a′ + b′ j) sarebbe stato:
aa′ + (ab′ + a′ b)j + bb′ j 2 =
′
′
′
′
= aa + (ab + a b)j + bb (−2j − 3) =
= (aa′ − 3bb′ ) + (ab′ + ba′ − 2bb′ )j,
e questi numeri “complessi” avrebbero comunque
avuto una rappresentazione su un piano analogo a
quello di Argand. Da un altro punto di vista, se applichiamo la formula per la risoluzione delle equazioni
di
p abbiamo ∆√= 4−12
√ secondo
√ = −8
√ e quindi:
√ grado,
∆ = −8 =√ (−1) · 8 = −1 8 = i2 2, e quindi: x = −1 ± i 2, cioè√j è esprimibile in
√C come uno
dei due valori: −1 + i 2 oppure −1 − i 2. √Scelto ad
esempio il primo valore e posto j = −1 + i 2, si ha:
√
√
√
2
2
i = (j + 1)/ 2 =
+
j,
2
2
il che fa vedere come j ed i siano esprimibili uno in
funzione
√ Questo naturalmente non succede
√ dell’altro.
per Q[ 2] e Q[ 3], anche se questi due campi hanno
proprietà formali del tutto simili l’uno all’altro.
Partendo da un polinomio di grado n, se questo ha
una radice α ∈ C, dividendo per x − α si ottiene un
polinomio di grado n − 1. Questo, a sua volta, avrà
una radice che permette di ridurre il grado di 1, e
cosı̀ via. Corollario del Teorema di Gauss è che ogni
equazione algebrica di grado n ha in C esattamente n
soluzioni (alcune delle quali, in particolare, possono
essere uguali tra loro).
I due numeri complessi a + bi e a − bi si dicono
coniugati; nel piano di Argand sono rappresentati da
punti simmetrici rispetto all’asse reale. Elevando al
quadrato si ha:
(a + bi)2 = (a + bi) · (a + bi) = (a2 − b2 ) + 2abi
2
2
2
(a − bi) = (a − b ) − 2abi,
cioè si ottengono ancora due numeri complessi coniugati. Iterando, si ha che coniugate rimangono tutte le
loro potenze. Se z ∈ C, il suo coniugato si indica con
z, e quindi possiamo scrivere: z k = (z k ), qualunque
sia k ∈ N. Si noti poi che un numero complesso z è
uguale al suo coniugato, z = z, se e solo se z ∈ R: infatti, se z = a + 0b, il suo coniugato è a − 0b = a = z,
e se a + bi = a − bi allora è 2bi = 0, cioè b = 0. Si ha
allora il seguente:
Teorema 5.16 Sia p(x) un polinomio a coefficienti reali; allora, se z ∈ C è una radice di p(x), cioè
p(z) = 0, allora anche p(z) = 0.
Prova: Sia p(x) = a0 xn + a1 xn−1 + · · · + an−1 x + an ,
dove a0 , a1 , . . . , an ∈ R. Abbiamo allora a0 z n +
a1 z n−1 + · · · + an−1 z + an = 0 e prendendo il
coniugato:
a0 z n + a1 z n−1 + · · · + an−1 z + an = 0 = 0.
Si applicano ora le regole del coniugato viste sopra e
si ha:
a0 z n + a1 z n−1 + · · · + an−1 z + an = 0.
Ma i coefficienti sono numeri reali e quindi:
a0 z n + a1 z n−1 + · · · + an−1 z + an = 0
il che prova che z è una soluzione dell’equazione
p(x) = 0.
Se p(x) ha come soluzione il numero complesso a +
bi, ha come soluzione anche a−bi, e quindi è divisibile
per x − a − bi e per x − a + bi; di conseguenza è
divisibile per il loro prodotto: (x−a−bi)(x−a+bi) =
(x − a)2 − (ib)2 = x2 − 2ax + a2 + b2 . Ma questo è
un polinomio di secondo grado a coefficienti reali, per
cui abbiamo dimostrato il seguente:
Teorema 5.17 Sia p(x) un polinomio a coefficienti
reali; allora esso è scomponibile in fattori di primo e
di secondo grado in R[x].
In altre parole, questo dimostra che i polinomi irriducibili di R[x] sono soltanto i polinomi di primo e
di secondo grado; naturalmente, per ciò che si è visto
sulla risoluzione delle equazioni di secondo grado:
Corollario 5.18 I polinomi irriducibili di R[x] sono
(oltre alle costanti) tutti i polinomi di primo grado e
i polinomi di secondo grado ax2 + bx + c per i quali
si ha: ∆ = b2 − 4ac < 0. Non vi sono in R[x] altri
polinomi irriducibili.
Un’altra conseguenza del teorema è:
Corollario 5.19 Un polinomio p(x) ∈ R[x] di grado
dispari ha almeno una soluzione reale.
Questo risultato può essere molto utile nella risoluzione delle equazioni a coefficienti reali, specialmente
quelle di terzo grado. Queste, infatti, trovata la radice reale α possono essere ridotte di grado usando
la regola di Ruffini, e tale riduzione porta a un’equazione di secondo grado, le cui soluzioni possono
essere reali (se il discriminante ∆ ≥ 0) o complesse
coniugate per il Teorema 5.16: potranno comunque
essere trovate col Teorema 5.10 oppure col Teorema
5.21 che vedremo nella prossima sezione. Il punto,
allora, è: come si determina la radice reale? Due casi
interessanti sono i seguenti:
5.7. EQUAZIONI DI GRADO SUPERIORE
• l’equazione è reciproca, cioè della forma ax3 +
bx2 +bx+a = 0 oppure ax3 +bx2 −bx−a = 0. Nel
primo caso ha la soluzione x = −1, nel secondo
la soluzione x = 1, come si verifica direttamente;
• se l’equazione ha coefficienti interi e ammette
una radice razionale, questa può essere trovata
col metodo di Eisenstein (Teorema 5.8). Abbiamo proprio visto l’esempio 27x3 + 6x − 12 =
0.
Considerazioni analoghe valgono per le equazioni
di quinto grado.
5.7
Equazioni di grado superiore
Affrontiamo in questa sezione il problema della risoluzione delle equazioni di grado superiore al secondo.
Alcune situazioni particolari possono essere trattate
agevolmente con metodi ad-hoc:
• si dicono biquadratiche le equazioni del tipo ax4 +
bx2 + c = 0. Ponendo y = x2 esse si riducono ad
equazioni di secondo grado che sappiamo
√ risolvere. Se α è una soluzione, si ha x = ± α e quindi
dobbiamo avere α ≥ 0 se vogliamo soluzioni reali. Ad esempio, l’equazione x4 − x2 − 12 = 0 si
trasforma in y 2 − y − 12 = 0, con le soluzioni
y = 4 ed y = −3; questi√valori danno luogo alle
due soluzioni reali x = ± 4 = ±2
√ e alle soluzioni
complesse immaginarie x = ±i 3;
155
il giunto cardanico) non scoprı̀ proprio niente e si divertiva più a fare il medico e il mago che non a fare il
matematico. Il metodo di risoluzione delle equazioni
di terzo grado sembra sia dovuto a Scipione del Ferro,
che in punto di morte lo rivelò a un suo allievo. Le
formule furono più tardi riscoperte da Niccolò Tartaglia che le rivelò a Cardano. Il metodo di risoluzione
delle equazioni di quarto grado fu scoperto da Ludovico Ferrari, segretario di Cardano, al quale le passò.
Nessuno, invece, nonostante ripetuti e approfonditi
studi, riuscı̀ a trovare formule risolutive per le equazioni di grado superiore. Si cominciò allora a pensare che soluzioni generali per tali equazioni potessero
non esistere. Che questo fosse il caso, fu dimostrato
finalmente da Evariste Galois nel 1832, in una nota
scritta la sera prima di morire in duello, all’età di 21
anni. La forma esatta del risultato di Galois è: per
le equazioni algebriche di grado superiore al quarto
non esistono formule risolutive nelle quali compaiano
solamente le quattro operazioni di base e l’estrazione
di radici. Di solito, si abbrevia questa affermazione
dicendo che le equazioni di grado superiore al quarto
non sono risolubili per radicali. Naturalmente, esistono metodi numerici per trovare anche le soluzioni
di queste equazioni, con approssimazioni spinte quanto si vuole: tali metodi verranno accennati in questa
sezione e saranno studiati durante i corsi universitari.
Consideriamo una semplice equazione di secondo
grado, ad esempio x2 + x − 6 = 0; sfruttando il fatto che, per il Teorema 5.11, il prodotto delle radici
deve essere −6 e la loro somma −1, vediamo subito che le soluzioni sono x1 = −3 e x2 = 2. Se ora
operiamo una trasformazione della nostra incognita,
ponendo ad esempio x = X + 1, otteniamo una nuova
equazione:
• si dicono trinomie le equazioni del tipo ax2k +
bxk +c = 0. Analogamente a quanto fatto prima,
si pone y = xk riportandosi a un’equazione di
√
(X + 1)2 + (X + 1) − 6 =
secondo grado; questa volta abbiamo x = ± k y
√
se k è pari, e x = k y se k è dispari. Ad esempio,
6
3
= X 2 + 2X + 1 + X + 1 − 6 = X 2 + 3X − 4.
x − 7x − 8 = 0 si risolve ponendo y = x3 e
trovando
√ y = −1 e y = 8, quindi Questa nuova equazione ha come radici X = −4
√ le due soluzioni
x = 3 −1 = −1 e x = 3 8 = 2;
e X = 1. Potevamo prevedere facilmente questo
• si dicono reciproche le equazioni del tipo axn + risultato, poiché la trasformazione si scrive anche:
bxn−1 + cxn−2 + · · · + cx2 + bx + a = 0 (I specie) X = x − 1 e deve valere anche per la radici, che non
oppure axn +bxn−1 +cxn−2 +· · ·−cx2 −bx−a = 0 sono altro che particolari valori, quelli che rendono
(II specie). Si verifica immediatamente che se α vera l’equazione. Ma allora si deve avere X1 = x1 − 1
è una radice, allora anche 1/α è tale. Abbiamo e X2 = x2 − 1, come infatti si è verificato. Ocvisto il caso n = 3 e per x4 −2x3 + 34 x2 −2x+1 = corre stare attenti a come opera la trasformazione
0, sostituendo, si vede subito che sia 2, sia 1/2 x = X + α: se conosciamo una soluzione x1 dell’equazione di partenza, la soluzione dell’equazione trasono soluzioni.
sformata è X1 = x1 − α; ma se conosciamo X1 , si ha
ovviamente:
x1 = X + α.
Durante il 1500, alcuni matematici italiani scoprirono formule e algoritmi per la risoluzione delle equaLe trasformazioni di questo tipo, dette trasformazioni algebriche di terzo e di quarto grado. Il tutto zioni lineari sono necessarie in Geometria Analitica
è riportato nel libro “Ars Magna” di Gerolamo Car- quando si voglia cambiare sistema di riferimento. In
dano del 1545. Tuttavia, Cardano (al quale si deve Algebra sono utili se semplificano la risoluzione di
156
una equazione. Ad esempio, se riuscissimo ad eseguire una trasformazione che annulla il termine noto,
almeno una soluzione sarebbe X0 = 0, e quindi, se abbiamo operato la trasformazione x = X + α, sapremmo immediatamente che una soluzione dell’equazione
di partenza era x0 = X0 + α = α. Per la regola di
Ruffini, ciò consentirebbe di abbassare di grado l’equazione di partenza, e quindi semplificare il nostro
problema. Purtroppo la cosa non è banale, ma esiste una semplice trasformazione che ci permetterà di
dare una seconda prova della formula risolutiva delle
equazioni di secondo grado e, soprattutto, ci consentirà di risolvere le equazioni di terzo e di quarto grado.
Formuliamo e dimostriamo allora:
CAPITOLO 5. ALGEBRA
Operiamo ora la trasformazione del lemma 5.20 con
n = 2 e ponendo x = X − b/(2a):
µ
b
X−
2a
¶2
b
+
a
µ
¶
b
c
b2 − 4ac
X−
+ = X2−
= 0.
2a
a
4a2
Questo significa:
X2 =
b2 − 4ac
.
4a2
Il denominatore 4a2 è sempre positivo, per cui se b2 −
4ac > 0 si hanno le due soluzioni:
√
b2 − 4ac
X=±
2a
Lemma 5.20 Data l’equazione xn +bxn−1 +cxn−2 +
· · · + d = 0, la trasformazione x = X − b/n annulla il da cui discende la formula operando la trasformazione
coefficiente del termine di grado n − 1 e l’equazione x = X − b/(2a). In modo analogo si procede quando
diviene X n + c′ X n−2 + · · · + d′ = 0.
∆ = 0, mentre se ∆ < 0 le soluzioni per X sono
due valori immaginari opposti; la trasformazione li
Prova: Supporre che il coefficiente di xn sia 1 non
cambia allora in due numeri complessi coniugati:
è restrittivo, perché se fosse a 6= 0 e a 6= 1 potremp
mo dividere tutta l’equazione per a. Eseguendo la
|b2 − 4ac|
b
x=− ±i
trasformazione e applicando la regola del binomio di
2a
2a
Newton, il membro sinistro diviene:
come si voleva.
µ
¶n µ
¶n−1 µ
¶n−2
b
b
b
X−
+b X −
+c X −
+···+d =
Vediamo allora come si risolvono le equazioni di
n
n
n
terzo grado. Usando il teorema sulle trasformazioni,
facciamo scomparire il termine in x2 , per cui possiab n−1 n(n − 1) b2 n−2
n−1
n
+
X
+ · · · + bX
+ mo senz’altro considerare un’equazione della forma
= X −n X
n
2
n2
x3 = px + q; questa si dice l’equazione ridotta delb n−2
n−2
l’equazione originale. Cerchiamo ora le soluzioni del
+b(n − 1) X
+ · · · + cX
+ ··· + d =
n
tipo x = u + v, dove u e v sono due quantità incon−2
n−2
n n − 1 2 n−2 n − 1
gnite.
Questo sembra complicare le cose, ma facendo
b X
+
bX
+cX
+· · ·+d.
=X +
2n
n
i conti e applicando la regola del binomio di Newton
Questa espressione ci dà anche il valore di c′ , e ci per la terza potenza, abbiamo:
potrebbe dare il valore di tutti gli altri coefficienti,
u3 + 3u2 v + 3uv 2 + v 3 = p(u + v) + q
ma questo non è importante come il fatto che sia
n−1
sparito il termine in X
.
u3 + v 3 + (3uv − p)(u + v) = q.
Vediamo allora come questo lemma ci permetta di
dare una dimostrazione alternativa della formula per Qui ora possiamo sfruttare il fatto che u e v sono numeri qualsiasi e li possiamo scegliere con una qualche
la risoluzione delle equazioni di secondo grado:
libertà; ad esempio, possiamo far sı̀ che il termine con
Teorema 5.21 Sia ax2 + bx + c = 0 una qualunque (u + v) scompaia, e per far ciò basta che sia 3uv = p.
equazione di secondo grado in forma canonica. Le Allora (u + v) è una soluzione della nostra equazione
sue soluzioni sono:
se abbiamo contemporaneamente:
√
√
½
2
2
−b + b − 4ac
−b − b − 4ac
uv = p/3
x1 =
x2 =
.
2a
2a
u3 + v 3 = q.
se ∆ > 0 sono distinte. Se ∆ = 0 si ha la soluzione
Ricavando u dalla prima equazione e sostituendolo
x0 = −b/(2a) con molteplicità 2, mentre se ∆ < 0
nella seconda si trova:
l’equazione ha due soluzioni complesse coniugate.
p3
Prova: Dividendo l’equazione per a, essa diventa:
=q
u3 +
27u3
c
b
x2 + x + = 0.
27u6 − 27qu3 + p3 = 0.
a
a
5.7. EQUAZIONI DI GRADO SUPERIORE
Sostituiamo ora U ad u3 ; si ha una semplice
equazione di secondo grado:
157
distanti, y1 e y2 , possiamo immaginare, almeno in linea teorica, di trovare due valori di x, diciamo x1 e
x
2 , tali che y1 = p(x1 ) e y2 = p(x2 ), e questi valori
27U 2 − 27qU + p3 = 0
di x saranno vicini tra di loro. Possiamo disegnare il
grafico della funzione y = p(x) su un foglio di carta
che sappiamo risolvere. Questa equazione si dice la
millimetrata, considerando diversi valori di x, diciarisolvente dell’equazione di terzo grado, e ci dà:
mo x1 , x2 , . . . , xn , e calcolando i corrispondenti valori
r
p
della y, cioè y1 = p(x1 ), y2 = p(x2 ), . . . , yn = p(xn ).
q
p3
q2
27q ± 729q 2 − 108p3
= ±
− .
U=
Lavorando con valori discreti x1 , x2 , . . . , xn , il grafico
54
2
4
27
sarà costituito da punti, ma l’osservazione precedenNaturalmente, se avessimo ricavato u dalla 3uv = te ci fa intuire che possiamo unire i punti ottenuti
p, avremmo ottenuto esattamente la stessa soluzio- cosı̀ da rappresentare, in modo continuo, tutti i valori
ne, per cui possiamo arbitrariamente associare ad u3 di y corrispondenti ai valori di x, almeno nell’interla soluzione con il segno positivo e a v 3 quella con vallo finito che la carta millimetrata ci permette di
il segno negativo. Dalla x = u + v abbiamo infine tabulare.
la sospirata soluzione dell’equazione ridotta di terzo
Le radici dell’equazione corrispondono ai valori delgrado:
la x per cui si ha p(x) = 0, cioè ai punti in cui la curva
s
s
attraversa la base delle nostre computazioni, cioè la
r
r
3
2
3 q
3 q
p
p3
q
q2
linea y = 0; nella figura questi punti sono compresi in
+
−
+
−
− .
x=
2
4
27
2
4
27
due intervalli, il primo che va da −2 a −1, il secondo
che va da 0 ad 1. Questo significa che se a sinistra
Ora, facendo all’indietro la trasformazione che ci ha di una radice il valore di p(x) è positivo, a destra deportato alla forma ridotta, si trova la soluzione del- ve essere negativo, e viceversa. Tale osservazione ci
l’equazione originale, cioè dell’equazione generale di permette di fare un’asserzione fondamentale: se per
terzo grado, da cui siamo partiti.
due valori x1 e x2 con x1 < x2 si ha che p(x1 ) e p(x2 )
Come abbiamo detto, esistono formule risolutive hanno segni opposti, allora deve esistere almeno una
anche per le equazioni di quarto grado, ma non in- radice compresa tra x ed x . Naturalmente, fra x e
1
2
1
tendiamo addentrarci ulteriormente in questa giungla x ce ne potrebbero essere anche 3 o 5 o più, ma que2
di formule. In effetti, il problema della ricerca delle sto non muta il senso dell’osservazione. Si badi bene
soluzioni di un’equazione algebrica, se affrontato op- che dall’osservazione NON discende che se p(x ) e
1
portunamente, non è poi complicato come sembra, p(x ) hanno lo stesso segno, allora non esiste alcu2
purché si abbandoni l’idea di trovare una “formula” na radice compresa tra x e x : basta ricordarsi del
1
2
che esprima tali soluzioni. Può anche essere diverten- valore della contropositiva e della contraria di una
te programmare su un elaboratore il metodo che ora proposizione. Nell’esempio, p(−2) = p(1) = 1, ma
andiamo a descrivere; esso non è certamente il meto- fra −2 e 1 vi sono ben due radici (comunque, in quedo migliore che si conosca, ma certo è il più elemen- sta situazione, le radici possono solo essere in numero
tare e diretto. Per chi non sa usare la programmazio- pari: 0, 2, 4, etc.).
ne, sarà utile fare un po’ di conti a mano, aiutati da
Una volta, il primo passo per trovare le radici conun calcolatore tascabile; anzi, anche chi vuol tentare
sisteva
proprio nel disegnare il grafico di p(x) e deterdi automatizzare il metodo, è bene che cominci con
minare
gli intervalli di separazione delle varie radici,
qualche elaborazione manuale, per cercare di capire
cioè
gli
intervalli [x1 ..x2 ] che isolano ciascuna radice.
fino in fondo cosa si sta facendo.
Questo
procedimento non può essere portato avanti
Prima di tutto, prendiamo il polinomio che deterdall’elaboratore,
ma lo si può simulare in vari modi.
mina l’equazione e usiamolo come formula, cioè come
Ad
esempio,
si
può
valutare p(x) per valori interi di
espressione che, dato un valore specifico della variabix
o
per
valori
che
siano
potenze di 2, restringendo
le x, permette di calcolare il valore y del polinomio nel
2
poi
tali
intervalli
se
nulla
si è riusciti a trovare. Nel
punto x. Ad esempio, dall’equazione x + x − 1 = 0,
2
caso
che
il
polinomio
p(x)
abbia
grado dispari, un inconsideriamo l’espressione y = x + x − 2 che, posto
2
tervallo
di
separazione
si
trova
sempre; infatti, per
x = 1, ci dà il valore y = 1 + 1 − 1 = 1, e posto
2
valori
molto
grandi
in
valore
assoluto,
ma positivi e
invece x = 2 ci dà y = 2 + 2 − 1 = 5. E’ questa la
negativi,
p(x)
deve
assumere
per
forza
valori di senotazione funzionale y = p(x); x si dice la variabile
gno
diverso.
Il
caso
del
grado
pari
è
più
complesso e
indipendente ed y la variabile dipendente. E’ bene
una
tale
equazione
potrebbe
anche
non
avere
alcuna
osservare che se prendiamo due valori vicini tra di
2
radice
reale,
come
succede
a
x
+
1
=
0.
loro, ad esempio x1 = 1 e x2 = 1.01, i corrisponSupponiamo allora di essere riusciti a trovare un
denti valori della y sono ancora vicini tra di loro. E
viceversa, se partiamo da due valori di y non molto intervallo [x1 ..x2 ] che separi (almeno) una radice; per
158
CAPITOLO 5. ALGEBRA
4
3
2
1
-3
-2
-1 0
1
2
Figura 5.4: La parabola y = x2 + x − 1
fissare le idee, immaginiamo che sia p(x1 ) < 0 e
p(x2 ) > 0. Consideriamo ora il punto di mezzo di
tale intervallo, x3 = (x1 + x2 )/2 e calcoliamo p(x3 );
se esso è positivo, allora l’osservazione di partenza ci
dice che una radice deve essere compresa nell’intervallo [x1 ..x3 ], se invece è negativo, la radice sarà in
[x3 ..x2 ]. Qualunque sia l’intervallo, possiamo iterare
il procedimento e restringerci ad intervalli sempre più
piccoli. Se siamo partiti con [x1 ..x2 ] ed x2 = x1 + 1
(come spesso accade), allora x1 è un’approssimazione
per difetto della soluzione, e x2 ne è un’approssimazione per eccesso. Dimezzando l’intervallo ad ogni
iterazione, occorrono dieci iterazioni per avere un intervallo di circa 1/1000, cioè per aver trovato tre cifre
decimali della soluzione. Naturalmente il calcolatore
può eseguire tante iterazioni quante se ne vogliono in
tempi del tutto trascurabili. Ad esempio, cinquanta
iterazioni corrispondono ad un intervallo di lunghezza 2−50 ≈ 10−15 , il che vuol dire avere circa quindici
cifre decimali esatte.
√
tradizionale, si trova essere ( 5 − 1)/2 ≈ 0.618034.
Facendo i conti a mano, può essere preferibile (più
per ragioni psicologiche che altro) determinare una
cifra decimale dopo l’altra. Riprendendo l’esempio
precedente, scoperto l’intervallo di separazione [0..1],
sappiamo che la soluzione avrà la forma 0.d1 d2 d3 . . .
e possiamo scoprire d1 calcolando il polinomio nei
punti 0.1, 0.2, 0.3, . . . , 0.9. In particolare, si trova
p(0.6) = −0.04 e p(0.7) = 0.19, il che restringe l’intervallo a [0.6..0.7]. Si continua, calcolando
p(x) nei punti 0.61, 0.62, . . . , 0.69, per i quali si ha
p(0.61) = −0.0179 e p(0.62) = 0.0044. Si è cosı̀ ottenuto l’intervallo [0.61..0.62] che già ci fa intravedere
il risultato finale.
Questa tecnica “decimale” è probabilmente un po’
più intuitiva, ma richiede un numero maggiore di operazioni per arrivare alla stessa precisione della precedente. Si osservi infatti che per avere la precisione
di un centesimo abbiamo calcolato p(x) in nove punti
diversi, cioè da 0.1 a 0.7 e poi 0.61 e 0.62. Col metodo
binario, 9 operazioni permettono di ridurre l’intervallo a 1/512, cioè a un intervallo più piccolo di oltre 5
volte. Con un po’ di esperienza, si può ottimizzare il metodo; ad esempio, poiché p(0.61) = −0.0179
e p(0.62) = 0.0044, cosı̀ che l’approssimazione a 0 è
migliore per 0.62, è probabile che il decimale successivo sia superiore a 5. Allora, invece di cominciare i
calcoli da 0.611 si può cominciare direttamente con
0.615, e questo porta un bel risparmio. A ben guardare, però, questo accorgimento è un modo diverso
per introdurre dalla finestra il criterio “binario” che
avevamo appena scacciato dalla porta.
Il lettore si sarà accorto che abbiamo già utilizzato questa tecnica in varie occasioni, in particolare nella Sezione 3.6 “Potenze, radici, logaritmi”; in
realtà, esso rappresenta un metodo molto generale.
In situazioni particolari può essere migliorato, come
mostra, nella stessa sezione, il metodo iterativo per
calcolare la radice quadrata. Ciò, tuttavia, non fa
perdere di interesse al metodo. Nei corsi di Calcolo Numerico, all’Università, si studierà il metodo di
Newton, o di Newton-Raphson, che funziona assai
meglio. Qualche volta anche noi, un po’ surrettiziamente, abbiamo avuto modo (e ne avremo ancora) di
citare e di applicare tale metodo. Tornando alla tecnica esposta sopra, il lettore può inventarsi le proprie
equazioni e cercare di trovarne le soluzioni reali; questo sarà un buon esercizio per capire i passi descritti,
scrivere poi un opportuno algoritmo e portarlo infine
sull’elaboratore.
Come esempio (v. Figura 5.4), riprendiamo la precedente equazione e supponiamo di essere riusciti a
determinare l’intervallo [0..1], cioè x1 = 0 e x2 = 1;
corrispondentemente, si ha p(x1 ) = −1 e p(x2 ) = 2.
Calcolando il valore del polinomio per x3 = 1/2, si
trova p(x3 ) = −1/4, e perciò la radice si deve trovare tra 1/2 ed 1. La divisione successiva ci porta
a x4 = 3/4 e si calcola p(3/4) = 0.3125; il nuovo intervallo è [1/2..3/4]. Il passo ulteriore ci dà
x5 = 5/8 e p(5/8) = 0.015; l’intervallo si riduce
a [1/2..5/8]. Il nuovo passo permette di calcolare
x6 = 9/16 e p(9/16) = −0.12, cosı̀ che l’intervallo
è [9/16..5/8] = [0.5625..0.625]. A questo punto il lettore può andare avanti per conto proprio, considerando gli intervalli che man mano ottiene e i cui estremi 5.8
Algebra astratta
costituiscono un’approssimazione per difetto e per eccesso della soluzione. Per controllo, tali estremi van- Abbiamo visto come la parola “algebra” derivi dalno confrontati con la soluzione esatta che, col metodo l’arabo, nel quale sembra indicasse il trasferimento di
5.8. ALGEBRA ASTRATTA
un termine da un membro all’altro di una equazione. Pur cosı̀ specifico, il termine era consono ad una
disciplina incentrata sulla soluzione dei problemi per
mezzo della manipolazione delle espressioni, in questo caso delle equazioni. Con Viète, l’Algebra venne
ad inglobare tutte le manipolazioni formali di simboli, e quindi si contrappose alla Geometria, dominata
dal concetto di figura, e successivamente all’Analisi,
cioè allo studio analitico delle funzioni. Lo studio delle equazioni impose, nella prima metà dell’Ottocento
e, in modo più marcato, nella seconda, l’introduzione di strutture formali atte a comprendere il comportamento delle soluzioni di una data equazione o
di un’intera classe di equazioni. L’esempio più eclatante è costituito dalla permutazioni e dal loro uso,
come struttura di gruppo, nella dimostrazione della
non risolubilità per radicali delle equazioni algebriche di grado superiore al quarto. Ad un certo punto,
queste strutture hanno, per cosı̀ dire, preso la mano agli algebristi, e le loro proprietà si sono rivelate
importanti di per sé e nei confronti di altri settori
della Matematica. Cosı̀ si cominciarono a studiare le
“strutture algebriche” (cioè insiemi muniti di operazioni) in modo indipendente da qualsiasi connessione numerica, come era invece implicito nell’idea di
“risoluzione delle equazioni”. Questo studio è stato
pertanto detto “Algebra astratta” ed oggi è diventato uno dei settori fondamentali della Matematica,
dal quale nessun matematico può prescindere. D’altra parte, i successi ottenuti dall’Algebra astratta in
tanti campi applicativi, dalla cristallografia alla fisica atomica e subatomica, alla biologia, hanno fatto
sı̀ che alcuni suoi concetti siano diventati patrimonio
comune di tutta la scienza.
Alla base dell’Algebra astratta, sta, come abbiamo detto, il concetto di struttura algebrica; si intende
con questa espressione un insieme S, detto il sostegno della struttura, munito di una o più operazioni
(si veda il primo Capitolo), caratterizzate da alcune
proprietà formali, come la chiusura, l’associatività o
la commutatività.
Come abbiamo visto nella Sezione ??, la struttura
algebrica più semplice è il monoide, ma certamente quella più importante è il gruppo. Abbiamo già
incontrato vari esempi di gruppo, ma rivediamo qui
le situazioni più caratteristiche. I numeri interi con
l’operazione di somma, cioè (Z, +), è un gruppo nel
quale e = 0 e l’inverso di x è −x; in questo caso si
preferisce parlare di opposto, piuttosto che di inverso,
ma il concetto è quello. L’insieme dei numeri razionali positivi con l’operazione di moltiplicazione, cioè
(Q+ , ×), nel quale l’identità è 1 e l’inverso di x è x−1 ,
cioè proprio l’inverso in senso tradizionale. Questi sono due esempi di gruppi commutativi o abeliani, visto
che vale anche la proprietà commutativa. Questa non
159
vale invece per le permutazioni Pn su {1, 2, . . . , n} con
l’operazione di composizione, cioè (Pn , ◦), come si è
visto nel Capitolo 4. Storicamente, questo è stato il
primo esempio di gruppo finito e non commutativo, e
fu introdotto da Ruffini e da Abel nei loro studi sulla
non risolubilità per radicali delle equazioni di grado
superiore al quarto. Le rotazioni intorno a un punto e le traslazioni del piano costituiscono un gruppo
quando si consideri l’operazione di composizione, cioè
l’operazione che esegue una trasformazione dopo l’altra. E’ interessante prendere una figura e un punto
sul piano della figura, e considerare poi le rotazioni
che trasformano a figura in sé stessa: si provi con un
quadrato, un rettangolo o un poligono regolare e il
relativo centro. Questo ci fa capire perché il “centro”
si chiama in questo modo.
Nel Capitolo 2 sull’Aritmetica abbiamo trovato altri esempi di gruppo finito: l’insieme Zm dei numeri {0, 1, . . . , m − 1} con l’operazione x ⊕ y = x + y
(mod m), e l’insieme Z∗m , dei numeri minori di m e
primi con m con l’operazione x⊗y = x×y (mod m).
Le proprietà là messe in evidenza non servivano ad
altro se non a dimostrare le proprietà di gruppo di tali strutture. Ritorneremo tra breve su questi esempi,
quando parleremo di gruppi finiti.
Noi non possiamo addentrarci nella meravigliosa
teoria dei gruppi, ma val la pena di dimostrare un
risultato astratto di notevole interesse. Un sottoinsieme H di un gruppo G si dice un sottogruppo di
G se è esso stesso un gruppo con l’operazione definita in G. Questo modo di esprimersi è formalmente
scorretto e dovremmo dire: se H è un sottoinsieme
del sostegno di un gruppo (G, ·) e . . .; naturalmente,
si preferisce la forma più snella. Un semplice esempio di sottogruppo di (Z, +) è dato dai numeri pari,
cioè {. . . , −4, −2, 0, 2, 4, . . .}, che costituisce un sottogruppo di (Z, +). I numeri pari sono i multipli di
2; si vede facilmente che l’insieme dei multipli di k
(k fissato, multipli positivi e negativi) sono un sottogruppo di (Z, +). Se prendiamo una permutazione
π ∈ Pn e tutte le permutazioni che da essa si ottengono eseguendo i prodotti π 2 = π ◦ π, π 3 = π 2 ◦ π,
etc., vediamo subito che esse sono un sottogruppo di
(Pn , ◦). Sia infatti Pπ = {π, π 2 , π 3 , . . .} e osserviamo
prima di tutto che esso è finito; infatti Pπ ⊆ Pn per la
chiusura della composizione, e quindi card(Pπ ) ≤ n!.
Sia ora π r la prima potenza che si ripete; necessariamente, deve essere π r = π, poiché se cosı̀ non fosse
avremmo π r = π s , con s ≥ 1. Ma se π −1 è l’inverso
di π avremmo π −1 ◦ π r = π −1 ◦ π s , cioè π r−1 = π s−1 ,
contro l’ipotesi che π r fosse la prima potenza a ripetersi. Se allora π r = π, componendo ancora con
π −1 si ha π r−1 = I, l’identità, che pertanto appartiene a Pπ . Finalmente, se π i , π j ∈ Pπ , anche il loro prodotto π i ◦ π j = π i+j sta in Pπ ; in particola-
160
CAPITOLO 5. ALGEBRA
re, dato π i , la potenza π r−i−1 è tale che il prodotto
π i ◦ π r−i−1 = π r−1 = I, cioè π i e π r−i−1 sono l’inverso l’una dell’altra. Ciò significa che (Pπ , ◦) è un
sottogruppo di (Pn , ◦). Esso si dice il (sotto)gruppo
ciclico generato da π e si indica con hgi. In P4 il sottogruppo ciclico generato da π = (1234) è costituito
dalle permutazioni:
g2 H, diciamo g2 h e mostriamo che esso sta anche in
g1 H. Usando la precedente espressione per g2 si ha:
hki = {· · · , −2k, −k, 0, k, 2k, · · ·}.
xφ(m) = xkr = (xr )k = 1k = 1,
g2 h = g1 h1 h−1
2 h ∈ g1 H
in quanto h1 h−1
2 h ∈ H per la proprietà di chiusura
in H. Naturalmente, in modo del tutto analogo, si
dimostra che ogni elemento di g1 H sta anche in g2 H
e quindi g1 H = g2 H come si voleva. Di conseguenza,
2
3
4
π = (1234), π = (13)(24), π = (1432), π = I.
gli insiemi gH determinano, al variare di g, una partiConvenzionalmente, si pone π 0 = I e quindi π r−1 = zione di G (a g diversi, si noti, possono corrispondere
π 0 = I. In generale, il minimo numero k per il qua- gH uguali), ogni parte composta dallo stesso numero
le un elemento g ∈ G dia g k = e, si dice periodo di elementi, cioè proprio m. Se le parti sono k, di
deve perciò avere n = mk.
dell’elemento g. Il periodo di π è pertanto r − 1.
Se il gruppo G è infinito, può contenere sottogruppi
Il caso precedente di Pπ , che ha 4 elementi, è un
finiti o infiniti; ad esempio, (Q+
0 , ·) contiene il sotto- esempio di questo risultato. In generale, possiamo
gruppo finito {1, −1} e il sottogruppo infinito com- enunciare il seguente:
posto da tutte le potenze (positive e negative) del
numero 5: {. . . , 5−2 , 5−1 , 50 = 1, 5, 52 , . . .}. Questo Corollario 5.23 Se (G, ·) è un gruppo finito e g ∈
è, in effetti, il sottogruppo ciclico h5i; nel caso in- G, il periodo di g è un divisore di card(G).
finito, il sottogruppo ciclico deve contenere tanto le Prova: Il periodo di g coincide, per quanto detto,
potenze positive quanto quelle negative del suo gene- con il numero di elementi del sottogruppo generato
ratore. Un gruppo (G, ·) si dice ciclico se esiste un da g, e questo è un divisore di card(G).
elemento g ∈ G che genera tutto il gruppo. Ad esemUn esempio importante di questo corollario è dato
pio, (Z, +) è generato dal numero 1; si osservi che in
dai
gruppi (Z∗m , ×), la moltiplicazione intesa modulo
questo caso, essendo la somma l’operazione del grupφ(m) elementi e quindi
po, le potenze sono in realtà i multipli. Il lettore è m. Tali gruppi contengono
∗
invitato a dimostrare che i sottogruppi di un gruppo ogni elemento x ∈ Zm ha come periodo un numero
ciclico sono anch’essi ciclici. Nell’esempio di (Z, +) si che divide φ(m) (diciamo r); si ha pertanto kr =
φ(m), per qualche intero k. Ma allora:
ha:
Una delle più interessanti proprietà dei gruppi finiti
un risultato che abbiamo sfruttato parlando dei
è data dal seguente:
metodi di ciframento a chiave pubblica.
I gruppi sono probabilmente la struttura algebrica
Teorema 5.22 (di Lagrange) Se (G, ·) è un gruppiù
importante, e sono stati studiati in modo molto
po finito ed H è un sottogruppo di G, allora il numeapprofondito.
Inoltre, sul concetto di gruppo si basaro degli elementi di H è un divisore del numero degli
no
altre
strutture
algebriche che si avvicinano magelementi di G.
giormente alle strutture numeriche più familiari. PriProva: Sia n = card(G) ed m = card(H); sia g ∈ G ma di tutto, definiamo cosa si intende per “anello”;
e consideriamo l’insieme gH composto da tutti i pro- si parte da un insieme A e si suppone che in A siano
dotti di g per gli elementi di H; esiste allora una definite due operazioni, indicate convenzionalmente
corrispondenza biunivoca tra H e gH data dalla fun- con “+” (l’addizione) e con “·” (la moltiplicazione),
zione h → gh, ∀h ∈ H. In effetti, essa è surget- quest’ultima scritta spesso con la semplice giustappotiva per definizione e se non fosse iniettiva dovrem- sizione. La struttura algebrica (A, +, ·) si dice anello
mo avere due elementi distinti h1 , h2 ∈ H tali che se (A, +) è un gruppo commutativo, (A, ·) è un mogh1 = gh2 ; se cosı̀ fosse, moltiplichiamo per g −1 ot- noide commutativo e vale la proprietà distributiva del
tenendo g −1 gh1 = g −1 gh2 , cioè eh1 = eh2 e h1 = h2 , prodotto rispetto alla somma, cioè: ∀x, y ∈ A si ha
contro l’ipotesi. D’altra parte, se g1 , g2 sono due ele- x · (y + z) = x · y + x · z. L’esempio più importante
menti di G, gli insiemi g1 H e g2 H o coincidono op- di anello è sicuramente (Z, +, ·), con le usuali operapure sono disgiunti. Supponiamo infatti che g1 H e zioni di somma e prodotto, ma sono anelli anche gli
g2 H non siano disgiunti; hanno allora almeno un ele- altri insiemi numerici (Q, +, ·), (R, +, ·), (C, +, ·). Si
mento in comune, diciamo g1 h1 = g2 h2 (notare che tratta però di casi un po’ particolari, e per questo ne
h1 e h2 possono benissimo essere distinti). Ma questo riparleremo più avanti. Altri anelli importanti sono
significa g2 = g1 h1 h−1
2 , ottenuto moltiplicando i due costituiti dai polinomi, con le operazioni che conomembri per h−1
2 . Prendiamo ora un altro elemento di sciamo; essi si indicano con (Z[x], +, ·), (Q[x], +, ·),
161
5.8. ALGEBRA ASTRATTA
+
0
1
2
3
4
5
0
0
1
2
3
4
5
1
1
2
3
4
5
0
2
2
3
4
5
0
1
3
3
4
5
0
1
2
4
4
5
0
1
2
3
5
5
0
1
2
3
4
·
0
1
2
3
4
5
0
0
0
0
0
0
0
1
0
1
2
3
4
5
2
0
2
4
0
2
4
3
0
3
0
3
0
3
4
0
4
2
0
4
2
5
0
5
4
3
2
1
Tabella 5.2: Somma e prodotto in Z6
e cosı̀ via. Un’altra classe importante di anelli é data dagli (Zm , +, ·), dove, questa volta, la somma e il
prodotto vanno intesi modulo m; poiché questi anelli sono finiti, le operazioni possono essere riassunte
in due tabelline; riportiamo nella Tabella 5.2 il caso
di (Z6 , +, ·) e il lettore è invitato a scrivere almeno
quelle relative ad m = 5.
Un caso particolare di anello è il seguente; sia U un
insieme e sia P = P(U ) l’insieme delle sue parti, cioè
dei suoi sottoinsiemi. In P si consideri l’operazione
di differenza simmetrica A∆B = (A ∪ B) \ (A ∩ B) =
(A \ B) ∪ (B \ A) (v. Capitolo 1); tale operazione è chiusa e associativa, come il lettore vorrà verificare con i diagrammi di Venn. Si ha inoltre:
A∆∅ = ∅∆A = A, qualunque sia A ∈ P, e questo
ci dice che ∅ è l’identità rispetto a ∆. Si ha anche
A∆A = ∅ ed A∆B = B∆A, per cui (P, ∆) è un
gruppo commutativo. Consideriamo ora l’operazione
di intersezione in P; rispetto a tale operazione P è
un monoide e si ha:
A ∩ (B∆C) = (A ∩ B)∆(A ∩ C),
(qualunque esso sia), si ottiene 0 = x · 0. In modo
analogo si prova 0 = 0 · x. Un elemento di A può avere o può non avere un inverso rispetto al prodotto; in
(Z6 , +, ·) gli elementi 1 e 5 hanno un inverso, come
si vede dalla Tabella 5.2, mentre non lo hanno 2, 3
e 4. Gli elementi muniti di inverso si dicono unità
dell’anello; lo 0 non può essere un’unità poiché, come abbiamo appena visto, 0 · x dà sempre 0, mentre
se x fosse l’inverso di 0 si dovrebbe avere 0 · x = 1.
D’altra parte, 1 è per definizione una unità, e questo
ci fa capire che, in un anello, lo 0 e l’1 non possono mai coincidere (eccetto nell’anello banale, quello
composto dal solo elemento 0: riflettere un attimo).
Un elemento che, come 2, 3, 4 in Z6 , dà come prodotto 0 anche quando sia moltiplicato per un numero
diverso da 0, si dice un divisore dello zero: poiché lo
0 non può avere un inverso rispetto alla moltiplicazione, cosı̀ non lo possono avere nemmeno i divisori
dello zero; pertanto, la presenze in un anello di divisori dello zero fa sı̀ che certe semplificazioni, legate a
moltiplicare per l’inverso di un elemento (come siamo
abituati), non si possano fare. Ha allora importanza
il concetto di dominio di integrità, col quale termine
si indica un anello privo di divisori dello zero. Ancora (Z, +, ·), (Z[x], +, ·), (R[x], +, ·) sono domini di
integrità nei quali non tutti gli elementi diversi da 0
sono unità. Ad esempio, in Z solo 1 e −1 sono unità,
mentre in R[x] sono unità tutte le costanti diverse da
0, cioè, in pratica, R \ {0}. Vediamo allora dove si
manifesta l’importanza dei domini di integrità.
Si dice campo o corpo ogni anello nel quale tutti gli
elementi, tranne lo 0, sono unità, cioè ogni elemento
diverso da 0 possiede un inverso (rispetto alla moltiplicazione). Sono campi infiniti (Q, +, ·), (R, +, ·),
(C, +, ·), ma esistono anche molti campi finiti; tutti
gli (Zp , +, ·) (somma e prodotto modulo p), con p numero primo sono campi. Infatti, Zp \ {0} = Z∗p , che
come sappiamo è un gruppo rispetto alla moltiplicazione, il che vuol proprio dire che ogni elemento non
nullo ha un inverso. Il più importante di questi campi è Z2 = {0, 1} (toh! chi si incontra di nuovo!), che
oltre ad essere un campo è anche un anello Booleano.
Col significato 1 =“vero” e 0 =“falso” lo abbiamo già
visto in azione nel calcolo delle proposizioni e dei predicati. I campi sono la struttura algebrica che compendia le proprietà degli insiemi numerici più ampi, e
cioè Q, R, C; da qui la loro fondamentale importanza.
Certi campi si costruiscono a partire dai domini di
integrità, che perciò costituiscono dei quasi-campi:
ancora da verificare con i diagrammi di Venn. La
conclusione è che (P, ∆, ∩) è un anello, detto anello
Booleano. Il lettore è invitato a consultare le Tabelle 1.1, 1.3, 2.5 e la fine della Sezione 2.7 sul Massimo Comun Divisore per trovare altri esempi di anelli
Booleani.
Quando si parla di anelli, l’identità rispetto alla
somma si indica con 0 e quella relativa al prodotto
con 1. Formalmente, si ha x · 0 = 0 · x = 0, qualunque
Teorema 5.24 Sia D un dominio di integrità e sia
sia l’elemento x ∈ A; infatti:
D l’insieme delle coppie di elementi di D il cui secondo elemento non sia 0. La relazione (x, y) ≡ (x′ , y ′ )
x · 0 = x · (0 + 0) = x · 0 + x · 0,
valida se e solo se xy ′ = x′ y, è una relazione di equidove si sono sfruttate le proprietà dell’anello; som- valenza su D. Sia allora [x, y] la classe di equivalenza
mando ora ai due membri estremi l’opposto di x · 0 di (x, y) ed F l’insieme di tali classi di equivalenza;
162
CAPITOLO 5. ALGEBRA
se definiamo su F le operazioni:
[x, y] + [x′ , y ′ ]
[x, y] × [x′ , y ′ ]
=
=
[xy ′ + x′ y, yy ′ ]
[xx′ , yy ′ ]
allora tali operazioni sono indipendenti dagli elementi presi a rappresentare le classi ed (F, +, ×) è un
campo.
Prova: La prova di questo teorema, in realtà, è
già stata fatta quando abbiamo costruito il campo
(Q, +, ·) a partire dal dominio di integrità (Z, +, ·) e
il lettore potrà ripetere i passi là effettuati astraendo dal caso numerico e concentrandosi sulle sole
proprietà formali definite in D, D ed F.
Partendo da (Z[x], +, ·) e da (R[x], +, ·) si costruiscono i due campi delle funzioni razionali fratte su Z e
su R, che si indicano rispettivamente con (Z(x), +, ·)
e (R(x), +, ·). Nella sezione sui numeri complessi abbiamo visto un altro metodo per costruire un tipo
diverso di campi, il più importante dei quali è certamente il campo dei numeri complessi. Esso consiste nell’aggiungere uno (o più) elementi algebrici al
campo, in modo da rispettarne la definizione.
Capitolo 6
Geometria Euclidea
pubblicati testi che rivedevano l’impostazione di Euclide secondo i nuovi criteri, anche se è l’impianto
Euclideo quello che si studia a tutt’oggi.
Mandai il triangolo equilatero a Treviranus. Sapevo che lei avrebbe aggiunto il punto che mancava: il punto che determinava il rombo perfetto, il punto che prefissava il luogo dove un’esatta
morte l’attendeva.
6.1
J. L. Borges Finzioni
Secondo Aristotele la Geometria (cioè la misurazione dei terreni) nacque in Egitto, dove ogni anno,
dopo le inondazioni del Nilo, era necessario ristabilire i confini dei campi, assegnare un nuovo terreno
a chi, eventualmente, avesse perduto il proprio, invaso in modo permanente dalle acque. Anche i Babilonesi coltivarono la Geometria, un po’ per ragioni
analoghe, ma assai di più per il loro interesse all’Astronomia. Tuttavia, nessuno di questi popoli andò
più in là delle considerazioni pratiche ed elementari,
necessarie ai loro intendimenti. Ad esempio, nessuno sentı̀ mai il bisogno di dimostrare alcunché o di
speculare in forma astratta. Lo studio teorico della
Geometria cominciò in Grecia e uno dei precursori fu
Talete (624 – 545 a.C.), il primo dei Sette Savi. Con
i Pitagorici si affermò anche il concetto di dimostrazione e al tempo di Platone (427 – 347 a.C.), che fu
un buon cultore di Geometria, le conoscenze teoriche
erano abbastanza ampie da costituire un corpus di
notevole rispetto. Fu però circa un secolo dopo che
la Geometria trovò la sua sistemazione, in un certo
senso definitiva, con l’opera di Euclide (sec. III a.C.)
“Elementi”. Certo, gli “Elementi” non costituiscono
la fine dello sviluppo della Geometria, che troverà in
Archimede (287 – 212 a.C.) e Apollonio (262 – 180
a.C.) due altri grandi. Le scoperte si sono protratte fino ai nostri giorni, ma quel libro mostrò come si
costruisce una teoria matematica, partendo dagli assiomi e edificando man mano un insieme organico di
conoscenze (teoremi e problemi) logicamente fondati
e perciò incontrovertibili. Gli “Elementi” di Euclide
sono stati forse il libro più letto e più amato dopo la
Bibbia e hanno costituito la base dello studio della
Geometria fino al 1800. Con la revisione della Logica
operata in quel periodo (che portò alla formulazione
delle Geometrie non Euclidee), cominciarono a venir
Le basi della Geometria
Euclide fonda la Geometria su 10 verità, che egli reputa evidenti di per sé, e che quindi non richiedono
alcuna dimostrazione. Egli le divide in 5 assiomi (che,
ricordiamo, secondo Aristotele sono verità generali,
indipendenti dal sapere geometrico) e in 5 postulati (cioè verità specifiche della materia in oggetto, la
Geometria):
Assiomi o nozioni comuni:
163
1. oggetti uguali a uno stesso oggetto sono uguali
tra loro;
2. se oggetti uguali vengono aggiunti ad oggetti
uguali, gli oggetti risultanti sono uguali tra loro;
3. se oggetti uguali vengono sottratti da oggetti
uguali, gli oggetti risultanti sono uguali tra loro;
4. oggetti che si possono sovrapporre e far
coincidere sono uguali tra loro;
5. l’intero è maggiore di ciascuna delle sue parti
proprie.
Postulati:
1. per due punti qualsiasi si può tracciare una retta;
2. ogni segmento si può prolungare indefinitamente;
3. su un piano si può tracciare una circonferenza di
centro e raggio arbitrari;
4. tutti gli angoli retti sono uguali;
5. se due rette formano, con una retta che le interseca, da una stessa parte di questa, due angoli
la cui somma è minore di due angoli retti, allora
le due rette, prolungate all’infinito, si incontrano
proprio da tale parte.
164
CAPITOLO 6. GEOMETRIA EUCLIDEA
Quando Euclide parla di punti, rette e piani, egli
ha in mente precise astrazioni degli analoghi concetti
concreti e crede che tali astrazioni siano non un semplice modello della realtà, ma siano davvero la realtà,
la sostanza rivelata del fenomeno concreto. Quindi,
gli assiomi servono solo ad evitare il regressum ad infinitum che si creerebbe se tentassimo di definire tutti
i concetti, il che richiederebbe di introdurne altri, e
poi ancora altri, e cosı̀ via. Ma, a parte questo, gli
assiomi sono veri in senso semantico, cioè sono veri
nella realtà. Con l’affermarsi della Logica moderna
questa idea è venuta a cadere e gli assiomi della Geometria sono stati rivisitati, per far loro inglobare la
definizione implicita degli enti geometrici (punto, retta, piano) e delle loro reciproche relazioni. Volendo
vedere le cose da un punto di vista un po’ diverso,
mentre nella Geometria di Euclide le figure e le costruzioni geometriche hanno un ruolo fondamentale
nello sviluppo della teoria, nelle formulazioni moderne deve essere possibile derivare tutti i teoremi in modo puramente formale, cioè utilizzando solo i simboli
(e i modi di metterli insieme) definiti dagli assiomi o
che man mano si introducono partendo da quelli.
L’assiomatizzazione più famosa della nuova Geometria è quella di Hilbert, che elenca ben ventitré
postulati. Diamo qui una versione semplificata con
gli assiomi divisi in gruppi:
• Assiomi di incidenza
1. due punti distinti, presi a piacere, appartengono a una retta e a una soltanto;
2. ad ogni retta appartengono almeno due
punti;
3. esistono due punti che non appartengono
alla stessa retta;
8. dati un segmento AB e una semiretta r di
origine C, esiste un unico punto D della
semiretta r tale che AB sia congruente a
CD (e si scrive AB = CD);
9. Se AB = CD ed AB = EF allora CD =
EF ; ogni segmento è congruente a sé stesso;
10. siano dati tre punti A, B, C su una retta,
tali che B giaccia tra A e C, e altri tre punti
D, E, F su un’altra retta, tali che E giaccia
tra D ed F . Se AB = DE e BC = EF ,
allora AC = DF ;
• Assiomi di congruenza tra angoli
b e una semiretta DF ,
11. dato un angolo B AC
esiste un’unica semiretta DE, da una parte
b è congruente
fissata di DF , tale che B AC
b (e si scrive B AC
b = E DF
b ).
a E DF
12. dati tre angoli α, β, γ, se α = β e α = γ,
allora β = γ; ogni angolo è congruente a sé
stesso;
13. dati due triangoli ABC e DEF , si supponga che sia AB = DE, AC = DF e
b = E DF
b . Allora i due triangoli sono
B AC
b = DEF
b
congruenti, cioè BC = EF , ABC
b
b
e ACB = DF E.
• Assioma della parallela
14. data una retta r e un punto P fuori di essa,
per P passa una e una sola parallela ad r.
• Assioma di continuità o di Archimede
15. dati due segmenti AB e CD, esiste sempre
un multiplo di AB che sia maggiore di CD.
Proprio per la sua astrattezza, la formulazione di
Hilbert va bene da un punto di vista sistematico, ma
non certo didattico e fa parte di quella che si chiama
4. se il punto B giace tra A e C, allora A, B, C la Matematica elementare considerata da un punto
sono tre punti distinti di una retta, e B di vista superiore. Essa non sviluppa il cosiddetto
senso geometrico e si preferisce insegnare seguendo
giace tra C ed A;
l’impostazione euclidea, anche se rivista e aggiorna5. dati due qualsiasi punti A e B, si può trovata. Anche noi ci atterremo a questa regola, e vedremo
re un terzo punto C tale che B giaccia tra
soprattutto la Geometria del piano; lasciamo all’ultiA e C;
ma sezione del capitolo quelle nozioni di Geometria
6. dati tre punti su una retta, ne esiste uno e dello spazio che riteniamo possano essere utili: ciò, lo
uno solo che giace tra i restanti due;
riconosciamo, è un difetto, poiché è con questo tipo
7. siano A, B, C tre punti non allineati e sia r di Geometria che si può coltivare il nostro senso spauna retta che non contiene nessuno di que- ziale, tanto utile anche quando si affrontano problemi
sti tre punti. Se r contiene un punto D che di Geometria analitica a più di due dimensioni.
La costruzione della Geometria richiede l’introdugiace tra A e B, allora r deve anche contenere un punto che giaccia tra A e C o tra zione di un certo numero di concetti, derivati dagli
enti primitivi di punto, retta e piano, ma indispensaB e C;
bili per poter progredire fissando la nostra mente sulle
• Assiomi di congruenza tra segmenti
cose importanti e, di conseguenza, lasciando perdere
• Assiomi d’ordine
165
6.1. LE BASI DELLA GEOMETRIA
costruzione di opportune figure; la validità di tali costruzioni è garantita dai teoremi, ma non è raro che
la verità di un teorema sia dimostrata per mezzo di
un’opportuna costruzione. Per questo, la Geometria
euclidea mescola in modo indissolubile le dimostrazioni formali e le costruzioni geometriche; queste ultime sarebbero formalmente proibite nell’impostazione
moderna di Hilbert.
Le costruzioni geometriche vengono effettuate con
due strumenti: la riga non graduata e il compasso. La
riga serve per tracciare la retta che unisce due punti
A
B O
(o, almeno, parte di tale retta); il compasso serve a
tracciare le circonferenze, gli archi di circonferenza e a
Si noti che molti assiomi fanno uso del concetto riportare gli estremi di un segmento. Per questo, si fa
di segmento; questo significa semplicemente che gli centro su uno dei due estremi e si regola il compasso
assiomi non si danno prima dello sviluppo della teo- in modo che l’altra delle sue punte coincida col seconria, ma le due cose procedono in parallelo, con l’unica do estremo. In questa maniera è possibile traslare il
avvertenza che l’uso di un concetto non ne preceda segmento, poiché l’ampiezza o apertura del compasso
la definizione. Questa stessa osservazione vale per il può essere riportata ovunque si voglia, a partire da
concetto di semiretta; data una retta r e un punto un punto prestabilito e/o su una retta assegnata (si
O su di essa, si dice semiretta ciascuno dei due trat- veda il terzo postulato di Euclide). Ciò permette di
ti infiniti che si dipartono da O, detto origine della dare un definizione precisa: due segmenti sono uguasemiretta. In modo analogo, dato un piano π e una li se e solo se, riportando il primo sul secondo (cioè
retta r su di esso, si dice semipiano ciascuna delle puntando su uno dei due estremi) l’altra punta del
parti di piano in cui r divide π. Si dice angolo (v. compasso si può far coincidere col secondo estremo.
Figura 6.1 ciascuna delle parti di piano compresa fra
s
s′
due semirette che hanno l’origine O in comune; tale
C
C′
origine si dice il vertice dell’angolo. Infine, tre punti
si dicono allineati se giacciono su una stessa retta.
le cose meno rilevanti: sono proprio le definizioni che,
operando una scelta, danno uno specifico indirizzo alla strada che vogliamo percorrere. Prima di tutto, si
dice segmento il tratto di retta compreso tra due punti A e B e che appartengono alla retta stessa; i due
punti A e B si dicono estremi del segmento. Il primo postulato di Euclide e il primo assioma di Hilbert
ci dicono che, dati due punti qualsiasi A e B, esiste
sempre il segmento AB.
A
r
r
A
O
B
′
A
r′
B′
Figura 6.2: Traslazione di un angolo
B
s
Figura 6.1: Definizione dell’angolo
Di fondamentale importanza in tutta la Geometria
è il concetto di uguaglianza; qui siamo interessati all’uguaglianza tra segmenti e tra angoli; vedremo più
avanti l’uguaglianza tra poligoni, specie tra triangoli,
concetto estremamente importante in tutta la Geometria euclidea. Come afferma il quarto assioma di
Euclide, i Greci ritenevano uguali due figure che, sovrapposte, vengono a coincidere. In termini moderni,
noi diciamo che l’uguaglianza si conserva per traslazioni e rotazioni. Tuttavia, questa idea intuitiva deve essere specificata meglio e rigorosamente, e ciò ci
permette di introdurre le costruzioni geometriche. I
problemi di Geometria hanno soluzione in termini di
Solo un po’ più complessa è la traslazione di un angolo, che mostriamo nella Figura 6.2. Si supponga di
b e lo si voglia traslare a partire dalavere l’angolo rAs
′
la retta r con vertice in A′ . Con centro in A e raggio
arbitrario si traccia l’arco BC e, con la stessa apertura e centro in A′ , si disegna una circonferenza che
taglia r′ in B ′ . Ora, si apre il compasso con ampiezza BC e facendo centro in B ′ si traccia un arco che
intersechi la precedente circonferenza in C ′ . Unendo,
mediante la retta s′ , i punti A′ e C ′ si ha, per costruc′ s′ è la traslazione dell’angolo
zione, che l’angolo r′ A
di partenza. Osserviamo esplicitamente che l’angolo
potrebbe essere riportato anche dalla parte di sotto,
ottenendo un angolo speculare, ma comunque uguale
a quello di partenza (sarebbe semplicemente ruotato
di un angolo pari all’angolo stesso, a meno che non si
vogliano identificare le due rette r ed r′ .
Dati due segmenti AB e CD, si definisce la loro
somma in questo modo: si prolunga il segmento AB
166
CAPITOLO 6. GEOMETRIA EUCLIDEA
dalla parte di B e si riporta CD su tale semiretta a
partire da B e in modo che D non cada tra A e B:
il segmento AD è la somma richiesta. Il confronto
tra AB e CD si fa riportando CD sulla retta AB a
partire da A e nel verso in cui si trova B: se D cade
tra A e B allora AB è maggiore di CD, altrimenti
(se i due segmenti non sono uguali) AB è minore di
CD. Infine, se CD è minore di AB, la differenza tra
AB e CD si trova procedendo come per il confronto
e considerando infine il segmento DB.
B≡C
A
A≡C
D
D
B
secondo m di CD. La frazione n/m si dice il rapporto fra AB e CD. All’inizio, i Greci pensarono che
due segmenti qualsiasi fossero comunque commensurabili tra di loro, ma poi Pitagora scoprı̀ che il lato
e la diagonale del quadrato non possono essere tali.
Dovettero perciò introdurre il concetto di segmenti
incommensurabili e si disse rapporto fra i segmenti
AB e CD il numero (che oggi diciamo “reale”) che si
ottiene eseguendo il seguente procedimento:
Algoritmo 6.1 (Rapporto fra due segmnti)
Ingresso: due segmenti AB e CD.
Uscita: il rapporto r fra AB e CD.
1. si determina il massimo multiplo r di CD che
sia minore o uguale ad AB;
2. se AB = rCD si esce con r come risultato;
A ≡ A0 A1
A2
A3
A4 B ≡ A5
3. altrimenti, si pone U V = CD, P Q = AB −rCD
e j = 1;
4. si divide U V in dieci parti uguali e sia U ′ V ′ una
di tali parti;
U1
U2
U3
5. si trova il massimo multiplo dj di U ′ V ′ che non
superi P Q;
U4
U5
6. si pone r := r + dj /10j ;
7. se P Q = dj U ′ V ′ si esce con r come risultato;
Figura 6.3: Divisione di un segmento in parti uguali
Nota 6.1
Un segmento AB può essere facilmente
diviso in n parti uguali mediante la costruzione che
mostriamo nella Figura 6.3. Da A disegniamo una
semiretta AP e su di essa riportiamo n repliche consecutive di un segmento arbitrario; siano U1 , U2 , . . . , Un
i secondi vertici di tali segmenti; si unisca Un con
B e si traccino le parallele ad Un B che passano
per ciascuno degli Ui e incontrano il segmento AB
nel punto Ai (i = 1, 2, . . . , n − 1). Posto A0 ≡ A e
An ≡ B, per il Teorema 6.16 di Talete, i vari segmenti
A0 A1 , A1 A2 , . . . , An−1 An sono tutti uguali.
8. altrimenti, si pone U V := U ′ V ′ , P Q := P Q −
dj U ′ V ′ , j := j + 1 e si torna al passo 4.
In modo analogo si definiscono la somma, il confronto e la differenza tra due angoli (v. Figura 6.4).
b e A′ O
c′ B ′ , si trasla quest’ultimo
Dati due angoli AOB
in modo che la semiretta O′ A′ venga a coincidere con
la semiretta OB cosı̀ che O′ B ′ sia dalla parte opposta
b ′ cosı̀ otdi OA rispetto a OB ≡ O′ A′ ; l’angolo AOB
′
′
b +A O
c′ B . Per il confronto e
tenuto è la somma AOB
c′ B ′ in modo da far
la differenza, invece, si trasla A′ O
′ ′
coincidere O A con OA e l’altra semiretta O′ B ′ sia
dalla stessa parte di OB; naturalmente, se ruotando da OA in senso antiorario si trova O′ B ′ prima di
c′ B ′ è minore di AOB,
b mentre
Il segmento AB si dice multiplo secondo m del seg- OB, allora l’angolo A′ O
mento CD se e solo se AB può essere suddiviso in è maggiore in caso contrario (naturalmente, se i due
m parti tutte uguali a CD; in tal caso, si dice an- angoli non sono uguali, e cioè non si sovrappongono
b è
che che CD è un sottomultiplo secondo m di AB. Si esattamente). La differenza è definita quando AOB
scrive AB = mCD o anche CD = AB/m. Due seg- maggiore di A′ O
c′ B ′ , e il risultato è costituito dall’anmenti AB e CD si dicono commensurabili se esistono golo B ′ OB.
b
Naturalmente, i multipli di un angolo si
due numeri interi m ed n tali che AB risulta essere il definiscono di conseguenza.
multiplo secondo n del sottomultiplo secondo m del
Definita cosı̀ come sovrapponibilità l’uguaglianza
segmento CD. Si scrive:
tra segmenti e tra angoli, nonché le operazioni tra tan
li enti, possiamo passare al concetto di misura, stretAB = CD;
m
tamente legato a quello di uguaglianza. Si consideri,
si osservi che in tal caso il multiplo secondo m di AB una volta per tutte, un segmento U V , che indichereè uguale al multiplo secondo n di CD, ovvero il sot- mo genericamente con u e che si dice l’unità di misutomultiplo secondo n di AB è uguale al sottomultiplo ra; si definisce allora come misura del segmento AB
167
6.1. LE BASI DELLA GEOMETRIA
B
B′
A
O
B′
O
O′
B
A
A′
B
O
B′
A
Figura 6.4: Operazioni sugli angoli
analogamente, il primo multiplo è 100 volte l’unità di
misura. Il primo sottomultiplo dell’unità di volume
è 1/1000 dell’unità stessa, e il primo multiplo è 1000
volte più grande. Per ragioni pratiche si considerano anche gli altri multipli e sottomultipli rispetto a
10, ma essi creano abbastanza confusione. Ad esempio, il multiplo secondo 10 dell’unità
√ di superficie è
un quadrato che ha il lato pari a 10u, cioè circa
3.16227766 volte l’unità di lunghezza u. Ho visto
persone di buona cultura tentennare di fronte a un
fatto del genere!
Anche per gli angoli devono valere le consuete proprietà delle misure. Per essi sembra esistere una misura naturale, cioè che non dipende dalla scelta dell’unità di misura. Infatti, l’angolo giro ha una rilevanza
tutta propria, essendo l’angolo più grande che si possa considerare in modo naturale. Certo, possiamo
girare e rigirare intorno al vertice di un angolo quante volte vogliamo, ma si torna sempre a un angolo
compreso tra l’angolo nullo e quello giro. Arbitraria
è invece la suddivisione dell’angolo giro in sottomultipli; seguendo una tradizione risalente ai Babilonesi, l’angolo giro si suddivide in 360 parti, assumendo
una di queste parti come unità di misura standard:
il grado; esso si indica con un circoletto ad esponente
del valore. Quindi, la misura di un angolo giro è di
360◦ , e 180◦ è quella dell’angolo piatto. Essendo 360
il massimo valore della misura di un angolo, multipli
del grado non si prendono in considerazione. Vi sono
invece i sottomultipli che, sempre per tradizione, non
si conformano alla base 10:
(rispetto all’unità di misura u) il rapporto tra AB ed
U V ; la misura del segmento AB si dice anche la sua
lunghezza e spesso si denota con AB, sottintendendo
l’unità di misura, che si suppone fissata.
E’ bene ribadire che il segmento U V è arbitrario e
non esiste un’unità di lunghezza preferibile ad un’altra. Nella pratica si usa il metro definito come la
lunghezza di una certa barra di platino-iridio conservata al Bureau International de Poids et Mesures
di Sèvres. Originariamente, nel 1791, il metro doveva essere la quarantamilionesima parte del meridiano
terrestre, ma la misurazione di questo si è rivelata alquanto aleatoria; oggi si preferisce una definizione più
operativa, che non obblighi a recarsi a Sèvres ogni volta che si debba controllare la precisione di uno strumento di misura. Si definisce allora il metro come la
distanza percorsa dalla luce nel vuoto in un intervallo
1. si dice primo la sessantesima parte del grado e si
di tempo pari a 1/299. 792. 458 secondi. Ricordiamo
indica con un apice dopo il valore;
infatti che, secondo la Fisica, la velocità della luce è
una costante universale; il problema, semmai, è di definire l’unità di tempo, cioè il secondo. Naturalmente,
una volta definita l’unità di misura, sono automati2. si dice secondo la sessantesima parte del primo e
camente determinati i suoi multipli e sottomultipli,
si indica con un doppio apice dopo il valore.
sui quali pertanto non stiamo a insistere.
Stabilita l’unità di lunghezza, le unità di superficie e di volume risultano conseguenza di quella; Un angolo di 22 gradi, 12 primi e mezzo si indica:
anticipando la definizione di quadrato e di cubo:
22◦ 12′ 30′′ . Dopo i secondi, si torna alla suddivisione
decimale, con decimi, centesimi, millesimi, etc. del
1. si dice unità di misura di superficie il quadrato
secondo. Come vedremo quando tratteremo la tri2
di lato u; l’unità stessa si denota come u ;
gonometria, c’è una misura degli angoli meno artifi2. si dice unità di misura di volume il cubo di lato ciosa di questa; essa assume come unità di misura il
radiante, definito come l’angolo che sottende un arco
u; l’unità di misura stessa si denota con u3 .
di circonferenza uguale al raggio della circonferenza
I multipli e sottomultipli si ottengono moltiplican- stessa. Il radiante, quindi, risulta indipendente daldo o dividendo opportunamente le varie dimensioni l’unità di lunghezza usata per la circonferenza, come
del quadrato e del cubo; pertanto il primo sottomul- ci aspettiamo che debba essere. Per il momento, tuttiplo (secondo 10) dell’unità di superficie si ottiene tavia, in questa parte che riguarda la Geometria Eudividendo due lati consecutivi in 10 parti ciascuna, e clidea, limiteremo le nostre considerazioni alla misura
perciò tale sottomultiplo è 1/100 dell’unità di misura; tradizionale in gradi, primi e secondi.
168
6.2
CAPITOLO 6. GEOMETRIA EUCLIDEA
Perpendicolarità e parallelismo
Due concetti molto importanti sono quelli di “rette perpendicolari” e di “rette parallele”; su di essi
si basano moltissimi sviluppi della Geometria Euclidea, che dedica loro due postulati, il quarto e il quinto. Cominciamo col quarto postulato, che può essere
enunciato nel modo seguente: tutti gli angoli retti
sono uguali. Naturalmente, affinché questa affermazione abbia senso, occorre aver definito l’angolo retto;
allora, la seguente definizione ha il duplice scopo di
farci intendere cosa è un angolo retto e quand’è che
due rette sono perpendicolari tra loro:
Definizione 6.1 Se due rette, incontrandosi, formano quattro angoli uguali, si dicono perpendicolari;
ciascuno dei quattro angoli si dice un angolo retto.
Il quarto postulato ci assicura che, qualunque coppia di rette perpendicolari si consideri, gli angoli ottenuti sono non solo uguali tra di loro, ma uguali
a quelli di ogni altra coppia di rette perpendicolari. Questo ci permette di affermare che un angolo
piatto è la somma di due angoli retti e un angolo
giro è la somma di quattro angoli retti. Secondo le
convenzioni introdotte nella precedente sezione sulla
misurazione degli angoli, possiamo dire che un angolo
retto misura 90◦ , come quarta parte dell’angolo giro.
La terminologia relativa agli angoli è ben nota; sia
b l’angolo considerato:
AOB
• piatto: le due semirette OA ed OB sono
allineate, cioè sono l’una il prolungamento
dell’altra;
• giro: le due semirette OA ed OB coincidono;
• convesso: un angolo minore di un angolo piatto;
Nota 6.2
Esistono vari metodi per costruire un
angolo retto; qui diamo per esteso un algoritmo che
sfrutta poco spazio, come mostrato nella parte sinistra
della Figura 6.5:
Algoritmo 6.2 (Angolo retto)
Ingresso: una semiretta di origine A;
Uscita: la semiretta per A perpendicolare alla
semiretta data;
1. se r è la semiretta assegnata, con centro in A
e con raggio arbitrario si disegna un arco di
circonferenza che taglia r in B;
2. con centro in B e con lo stesso raggio di prima
si disegna un arco che taglia il precedente in C;
3. con centro in C e con lo stesso raggio di prima
si disegna un arco che taglia il primo in D;
4. con centro in D e ancora lo stesso raggio si
traccia un arco che taglia il precedente in E;
5. la semiretta per A passante per E è perpendicolare ad r.
La dimostrazione che questa costruzione è corretta è
facile ed è lasciata allo studente dopo che avrà appreso
(se non li conosce già) i teoremi delle prossime sezioni
di questo capitolo. Come talvolta accade, le costruzioni geometriche richiedono conoscenze che non vanno in parallelo con l’esposizione sistematica dei vari
concetti. Un’altra costruzione è mostrata nella parte
destra della Figura 6.5, e il lettore la potrà schematizzare sotto forma di algoritmo come semplice esercizio:
si prolunga la semiretta r oltre A, e con centro in A
e raggio arbitrario si disegna una semicirconferenza
che taglia r e il suo prolungamento in B e in C; con
centro in B e C e raggio superiore al precedente, si
disegnano due archi che si incontrano in D; la retta
che congiunge A con D è perpendicolare ad r.
E
D
• concavo: un angolo maggiore di un angolo piatto;
• acuto: un angolo minore di un angolo retto;
• ottuso: un angolo maggiore di un angolo retto
(ma minore di un angolo giro).
Inoltre, dati due angoli, essi si dicono:
• opposti al vertice se ciascuno di essi è determinato dal prolungamento delle semirette dell’altro;
due angoli opposti al vertice sono uguali;
• complementari: due angoli la cui somma sia
uguale ad un angolo retto;
• supplementari: due angoli la cui somma sia
uguale ad un angolo piatto;
• esplementari: due angoli la cui differenza sia un
angolo piatto.
D
C
r
A
B
r
C
A
B
Figura 6.5: Costruzioni dell’angolo retto
Vale la pena di ricordare, infine, il metodo egizio,
cosı̀ detto perché adottato dagli antichi Egizi (e
non solo da loro) (v. Figura 6.6. A partire da A
si riporta quattro volte un segmento arbitrario P Q,
determinando cosı̀ il punto B. Con centro in A si
traccia un arco di raggio tre volte P Q e con centro
in B un arco di raggio cinque volte P Q. Se C è il
punto di intersezione dei due archi, la retta AC è
perpendicolare ad AB per il Teorema di Pitagora,
che dà: 32 + 42 = 52 .
6.2. PERPENDICOLARITÀ E PARALLELISMO
C
A
P
Q
B
Figura 6.6: Il metodo Egizio
Il concetto di parallelismo è legato al quinto postulato di Euclide e richiede di aver già introdotto la
perpendicolarità e l’angolo retto. Il postulato fa uso,
quando parla di angoli interni, di una terminologia
specifica che bisogna conoscere:
169
Dal quinto postulato si deduce che se r ed s formano con t coppie di angoli la cui somma è uguale a due
retti, esse, anche se prolungate indefinitamente, non
si incontrano mai. Da questa osservazione intuitiva, discende la pseudo-definizione che comunemente
si dà di rette parallele: due rette si dicono parallele se, prolungate indefinitamente, non si incontrano
mai. Questa non può essere una vera definizione, perché prolungando due rette possiamo sı̀ determinare se
esse si incontrano, ma è impossibile stabilire che esse
non si incontrano; infatti, una cosa del genere richiederebbe uno spazio e un tempo infiniti che, di solito, non abbiamo a disposizione. Il senso del quinto
postulato di Euclide, quindi, è di fornire un criterio
“finito” per stabilire se due rette sono o non sono
parallele: si tagliano con una trasversale e si misurano gli angoli; se la somma di due angoli interni è
uguale a due retti, le rette assegnate sono parallele,
altrimenti non lo sono e, in tal caso, dalla somma dei
due angoli sappiamo da quale parte si incontreranno.
Quindi la definizione corretta è: due rette sono parallele se, tagliate con una trasversale, formano angoli
coniugati interni la cui somma è uguale a due angoli
retti. A questo punto possiamo enunciare il famoso e
importante risultato:
Definizione 6.2 Siano r, s una coppia di rette e sia
t una trasversale che le taglia. Gli angoli per i quali
la semiretta della trasversale non incontra l’altra retta della coppia, si dicono esterni; gli altri si dicono
interni. Le coppie di angoli che stanno dalla stessa
parte rispetto a t e dalla stessa parte rispetto ad r ed
s si dicono corrispondenti; essi sono sempre uno interno e uno esterno. Le coppie di angoli che stanno Teorema 6.1 Due rette r ed s sono parallele se e
da parti opposte rispetto a t e da parti opposte rispet- solo se, tagliandole con una trasversale, si verifica
to ad r ed s si dicono alterni; quindi una coppia può una delle seguenti condizioni:
essere costituita da angoli alterni esterni o da angoli
1. angoli alterni (interni o esterni) sono uguali;
alterni interni. Infine, le coppie di angoli che stanno
2. angoli corrispondenti sono uguali;
dalla stessa parte rispetto a t, ma da parti opposte
rispetto ad r ed s si dicono coniugati; anche in que3. angoli coniugati (interni o esterni) sono supplesto caso una coppia può essere costituita da angoli
mentari.
coniugati interni o angoli coniugati esterni.
Prova: Se r ed s sono parallele, per definizione vale la proprietà 3) relativamente agli angoli coniugati
t
interni; i corrispondenti angoli coniugati esterni sono
γ β
r
supplementari agli angoli coniugati interni e quindi
devono essere supplementari tra di loro. Dei due anδ α
goli corrispondenti, uno è uguale e l’altro è supplementare ad uno di due angoli coniugati, e quindi i
′
′
s
δ α
due angoli sono uguali tra loro. La stessa osservaγ′ β′
zione vale per gli angoli alterni, che perciò devono
anch’essi essere uguali tra di loro.
Figura 6.7: Rette parallele tagliate da una trasversale
Le tre condizioni costituiscono altrettanti criteri di
parallelismo e come tali verranno usate ogni volta che
Schematicamente, la situazione può essere rappre- dovremo ragionare su rette parallele. Ad esempio, disentata dalla Figura 6.7, nella quale α, α′ , δ, δ ′ sono mostriamo questa celeberrima conseguenza del quinto
angoli interni e β, β ′ , γ, γ ′ sono angoli esterni. Il qua- postulato:
dro completo è dato dalla Tabella 6.1, nella quale
Teorema 6.2 Data una retta r ed un punto P fuori
alt, cor e conj stanno per “alterni”, “corrispondendi essa, per P passa una ed una sola parallela ad r.
ti” e “coniugati”; per gli angoli che non sono in alcuna di queste relazioni abbiamo usato il simbolo “=” Prova: Si consideri la Figura 6.8, a sinistra. Da P
quando sono uguali e il simbolo “⊘” quando risultano si costruisca la perpendicolare t ad r e quindi si cosupplementari (vedere il successivo Teorema 6.1).
struisca la retta s perpendicolare a t e passante per P .
170
CAPITOLO 6. GEOMETRIA EUCLIDEA
α
α′
δ
δ′
γ
γ′
β
β′
α
=
conj
⊘
alt
=
⊘
⊘
cor
α′
conj
=
alt
⊘
⊘
=
cor
⊘
δ
⊘
alt
=
conj
⊘
cor
=
⊘
δ′
alt
⊘
conj
=
cor
⊘
⊘
=
γ
=
⊘
⊘
cor
=
conj
⊘
alt
γ′
⊘
=
cor
⊘
conj
=
alt
⊘
β
⊘
cor
=
⊘
⊘
alt
=
conj
β′
cor
⊘
⊘
=
alt
⊘
conj
=
Tabella 6.1: Corrispondenza tra angoli
s
P
S′
P
S
s′
t
C
r
b
Q
R
A
B
Figura 6.8: Rette parallele
Per il teorema precedente, le rette r ed s sono parallele. Supponiamo allora che esista un’altra parallela
s′ ad r passante per P . Le due rette s, s′ formano un
angolo non nullo (altrimenti coinciderebbero) e quinb è minore di
di la somma degli angoli S ′ PbQ e RQP
due retti. Per definizione, allora, s′ non può essere
parallela ad r.
La costruzione della retta s si può semplificare molto rispetto al metodo suggerito dalla dimostrazione
del teorema. Al solito, questo richiede la conoscenza
di proprietà che ancora non abbiamo né visto né tanto meno dimostrato, anche se lo faremo più avanti.
La dimostrazione del teorema, invece, correttamente
usa solo nozioni che già sono state introdotte e provate. Facendo riferimento alla Figura 6.8, a destra,
si ha:
Algoritmo 6.3 (Parallela ad r passante per P )
Ingresso: la retta r e il punto P fuori di essa;
Uscita: la retta s passante per P e parallela ad r;
1. si considera un punto A qualsiasi sulla retta r;
2. con centro in A e raggio AP si traccia un arco
di circonferenza che interseca r in B;
3. con centro in B e in P e stesso raggio si
tracciano due archi che si incontrano in C;
4. la retta P C è parallela ad r.
Come è noto, le possibili alternative al precedente
teorema hanno dato origine alle Geometrie non Euclidee. Se supponiamo che per P passino infinite rette
parallele ad r si ottiene la Geometria Iperbolica di
Lobaĉevsky e Bólyai ; se invece si suppone che per
P non passi alcuna retta parallela ad r si ottiene la
Geometria Ellittica di Beltrami e Riemann.
Lasciamo al lettore il compito di provare che anche la perpendicolare alla retta r passante per P è
unica. Se tale perpendicolare interseca r nel punto
Q, si definisce distanza di P da r la lunghezza del
segmento P Q; Q si dice il piede della perpendicolare.
Invitiamo inoltre il lettore a scrivere l’algoritmo per
la costruzione della perpendicolare ad r passante per
P , quando P non sta sulla retta; il caso in cui P ≡ A
sta su r è stato visto nella Nota 6.2. La Figura ??
suggerisce il metodo classico: con centro in P si traccia un arco di circonferenza che incontra r in X ed
Y . Il punto di mezzo Q del segmento XY è il piede
della perpendicolare cercata.
Dati tre punti non allineati A, B, C, la parte di
piano comune ai tre semipiani determinati dalle rette
AB, BC, CA che contengono il terzo punto, si dice
triangolo. I tre punti A, B, C si dicono i vertici, i
tre segmenti AB, BC, CA si dicono i lati del triangolo e i tre angoli che contengono il triangolo si dicono gli angoli del triangolo. Il triangolo è la più
semplice di una serie di figure geometriche di notevole importanza. Sia A0 , A1 , . . . , An una sequenza
di n punti distinti del piano; la sequenza di segmenti A0 A1 , A1 A2 , . . . , An−1 An si dice poligonale; se An
coincide con A0 la poligonale si dice più propriamente poligono di n lati. Per estensione, si dice poligono
anche la parte di piano racchiusa dalla poligonale. La
definizione di vertice, lato ed angolo della poligonale e del poligono sono analoghe alle stesse definizione
date per il triangolo, che risulta semplicemente essere
un poligono di tre lati.
Se ogni lato Ai Ai+1 del poligono è tale che la retta Ai Ai+1 lascia da una stessa parte tutti gli altri
vertici del poligono, allora questo si dice convesso.
Si dimostra che la seguente definizione è equivalente:
un poligono è convesso se, presi comunque due pun-
171
6.2. PERPENDICOLARITÀ E PARALLELISMO
ti che gli appartengono, il segmento che li unisce è
formato tutto di punti appartenenti al poligono stesso. Per definizione, infatti, P e Q appartengono a
tutti i semipiani determinati dai lati e contenenti gli
altri vertici del poligono; vi appartengono pertanto
anche tutti i punti del segmento P Q. Un poligono
che non sia convesso si dice concavo. In quest’ultimo caso, può succedere che due lati si intersechino,
cioè abbiano un punto in comune diverso da ciascuno
dei vertici; il poligono si dice allora intrecciato. Al
variare del numero dei lati (e degli angoli) i poligoni
prendono il nome di triangoli, quadrilateri, pentagoni, esagoni, e cosı̀ via. Un poligono che abbia tutti i
lati e tutti gli angoli uguali si dice regolare; per questi
poligoni si veda la Sezione 6.8.
A5
A1
A4
A1
A3
A0
A6
A2
A0 ≡ A5
A2
A7
A4
A3
Figura 6.9: Poligonale e poligono
I triangoli sono i poligoni più semplici e tutti
i triangoli sono poligoni convessi; per essi vale il
seguente risultato:
Teorema 6.3 In ogni triangolo ciascun lato è minore della somma degli altri due e maggiore della loro
differenza.
A′
B′
C
A
B
D
Figura 6.10: Gli angoli di un triangolo
Questa costanza della somma dei tre angoli di un
triangolo risulterà importante in molte applicazioni; ad esempio, se chiamiamo angolo esterno l’angolo che il prolungamento di un lato forma con il lato
successivo, si ha il seguente:
Teorema 6.5 In un triangolo ogni angolo esterno è
uguale alla somma dei due angoli non adiacenti.
Prova: Se nel triangolo ABC della Figura 6.10 prob è il supplemenlunghiamo il lato AB, l’angolo C BD
b
tare di ABC. Ma per il teorema precedente, anche
b + ACB
b è supplementare di ABC
b per
la somma B AC
b
b
b
cui abbiamo: C BD = B AC + ACB.
D
E
C
Prova: Siano AB, CD, EF i tre lati di un triangolo;
se AB > CD + EF e facciamo coincidere A con C
A
B
e B con E, i punti D ed F non possono incontrarsi
e quindi non può esistere nessun triangolo con tali
Figura 6.11: Somma degli angoli interni
tre lati. Si osservi che se AB = CD + EF , allora D
ed F verrebbero a coincidere in un punto di AB, e
Tutti i poligoni hanno costante la somma dei loro
quindi il triangolo degenera in un semplice segmento.
Se d’altra parte fosse AB < CD − EF si avrebbe angoli interni:
CD > AB + EF , e questo è proibito dalla prima
Teorema 6.6 Sia dato un poligono di n lati; allora
parte del teorema.
la somma dei suoi angoli interni è uguale ad n − 2
E’ interessante osservare il seguente “invariante” angoli piatti.
dei triangoli:
Teorema 6.4 La somma dei tre angoli di un Prova: Si consideri la Figura 6.11 e fissato un vertice A del poligono, lo si unisca a tutti gli altri vertici,
triangolo è uguale a due angoli retti.
escluso i due vertici adiacenti ai quali è già unito da
Prova: Sia ABC un qualsiasi triangolo (si veda la due lati. Si ottiene cosı̀ una divisione del poligono in
Figura 6.10) e costruiamo per C la parallela ad AB. n − 2 triangoli, ognuno dei quali ha un angolo piatto
b e B AC
b sono uguali perché alterni come somma dei suoi angoli interni. Poiché la somma
Gli angoli A′ CA
b e ABC.
b
Quindi, la degli angoli interni del poligono è uguale alla sominterni, e lo stesso vale per B ′ CB
b
somma dei tre angoli del triangolo è uguale a A′ CA+
ma degli angoli interni di questi triangoli, il teorema
′b
b
ACB + B CB, che è un angolo piatto.
risulta dimostrato.
172
CAPITOLO 6. GEOMETRIA EUCLIDEA
Per i quadrilateri, cioè per i poligoni a quattro mo visto tanto per i segmenti quanto per gli angoli.
lati, esiste una nomenclatura nota fin dalle scuole Quello che si fa, è di traslare una figura sull’altra, in
modo da far coincidere certi punti, e osservare che anelementari:
che tutti gli altri coincidono; se questo non avviene,
Definizione 6.3 Un quadrilatero che abbia due lati
la due figure non sono congruenti. Talvolta, oltre alla
opposti paralleli si dice un trapezio. Un quadrilatero
traslazione, occorre operare un ribaltamento delle fiche abbia le due coppie di lati opposti paralleli si dice
gure; questo deve avvenire nello spazio, ma di regola
un parallelogramma. Un quadrilatero che abbia tutti
questa invasione della terza dimensione non è consigli angoli uguali si dice un rettangolo. Un quadriderata fuori legge. Con il criterio di sovrapponibilità
latero che abbia tutti i lati uguali si dice un rombo.
in mente, possiamo dare un teorema che potrebbe
Un quadrilatero che abbia tutti i lati e tutti gli angoli
anche essere preso come definizione:
uguali si dice un quadrato. I segmenti che uniscono vertici opposti di un quadrilatero si dicono le sue Lemma 6.9 Due triangoli sono uguali se e solo se
diagonali.
hanno i tre lati e i tre angoli ordinatamente uguali.
Vale il seguente, importante risultato:
Prova: I due triangoli possono essere sovrapposti,
Teorema 6.7 Un quadrilatero è un parallelogramma o direttamente o tramite una rotazione nello spazio,
se e solo e le due coppie di angoli opposti sono uguali. come richiesto ad esempio dai triangoli della Figura
6.13. Il viceversa è del tutto ovvio.
D
A
C
B
C′
C
A
B B′
A′
Figura 6.13: Triangoli congruenti
Figura 6.12: Un parallelogramma
Prova: Se ABCD è un parallelogramma, gli angoli
b e in D
b sono corrispondenti e quindi supplementain A
b eC
b sono supplementari e quindi
ri; anche gli angoli D
b
b
b = B.
b ViceverA = C. Analogamente si dimostra D
sa, per il teorema precedente la somma degli angoli
interni di un quadrilatero è uguale a quattro angoli
b=C
b eB
b = D,
b si ha che A
b+D
b e
retti; quindi se A
b
b
B + C sono uguali a due angoli retti. Questo significa
che AB è parallelo a DC. In modo analogo, si trova
che AD è parallelo a BC e quindi il quadrilatero è un
parallelogramma.
Come semplice conseguenza si ha:
Corollario 6.8 Il rettangolo e il quadrato sono
parallelogrammi.
Vedremo più avanti che un quadrilatero è un parallelogramma se e solo se i lati opposti sono uguali.
Questo ci dirà che anche un rombo è un parallelogramma e ci darà altre proprietà dei rettangoli e dei
quadrati.
6.3
Congruenza e similitudine
Normalmente, la verifica di queste sei uguaglianze
è troppo pesante; come ora vedremo, bastano tre opportune uguaglianze per assicurare la congruenza di
due triangoli. I tre teoremi seguenti sono noti pertanto come “criteri di congruenza dei triangoli”, e
costituiscono la base di gran parte della geometria
dei triangoli.
Teorema 6.10 (I criterio di congruenza) Due
triangoli che abbiano uguali due lati e l’angolo tra
essi compreso sono congruenti.
Prova: Con riferimento alla Figura 6.13, si abbia
b = B′A
c′ C ′ . Se
AB = A′ B ′ , AC = A′ C ′ e B AC
′
portiamo A a coincidere con A e B con B ′ , per le
precedenti uguaglianze anche C deve coincidere con
C ′ , eventualmente dopo aver fatto ruotare il triangolo
nello spazio. Ma se B e C coincidono con B ′ e C ′ , il
segmento BC coincide con B ′ C ′ e anche gli angoli in
B e in C devono essere uguali agli angoli in B ′ e C ′ .
Questo assicura che i due triangoli sono congruenti.
Analogamente si dimostra il secondo criterio:
Teorema 6.11 (II criterio di congruenza) Due
Il concetto di congruenza per le figure geometriche triangoli che abbiano uguali un lato e i due angoli ad
coincide con quello di sovrapponibilità, come abbia- esso adiacenti sono congruenti.
173
6.3. CONGRUENZA E SIMILITUDINE
Prova: Sempre con riferimento alla Figura 6.13, sia
AB = A′ B ′ e portiamo i due lati a sovrapporsi. Poiché l’angolo in A è uguale all’angolo in A′ , il lato AC
viene a sovrapporsi (anche se non necessariamente
a coincidere) con A′ C ′ . Allo stesso modo, essendo
b = B
c′ , i segmenti BC e B ′ C ′ si sovrappongono,
B
anche se non coincidono. Ma i due lati AC e BC si
incontrano in C, che per la costruzione effettuata si
deve trovare anche sulle rette A′ B ′ e A′ C ′ . Poiché
due rette non parallele si incontrano in un solo punto, allora C e C ′ devono coincidere. Questo implica
la congruenza dei due triangoli.
C
A
M
B
Figura 6.14: Triangolo isoscele
Per arrivare a dimostrare il terzo criterio di conla mediana. Merita un po’ più di enfasi il seguente
gruenza, occorre introdurre alcuni concetti, nuovi ma
risultato:
importanti:
Definizione 6.4 Un triangolo con tutti e tre i lati Corollario 6.13 Un triangolo è equilatero se e solo
uguali si dice equilatero. Un triangolo con i tre lati se i suoi tre◦ angoli sono uguali (e, di conseguenza,
tutti diversi si dice scaleno. Un triangolo che abbia misurano 60 ciascuno).
due lati uguali (e il terzo eventualmente diverso) si
dice isoscele; in tal caso, i due lati uguali si dicono
lati obliqui, mentre il terzo lato si dice la base. I
segmenti che uniscono ciascun vertice al punto medio
del lato opposto si dicono le mediane del triangolo.
Se dal vertice A costruiamo la perpendicolare al lato
opposto BC e H è il piede di tale perpendicolare, il
segmento AH si dice l’altezza del triangolo relativa
al lato BC. In modo analogo si definiscono le altezze
relative ai lati AB e AC.
Si ha allora il seguente:
Prova: Sia ABC un triangolo equilatero; se consideriamo AB come base di un triangolo isoscele, l’angolo
in A risulta uguale all’angolo in B; se consideriamo
BC come base, l’angolo in B risulta uguale all’angolo in C. Per la proprietà transitiva dell’uguaglianza i
tre angoli sono tutti uguali e la loro misura discende
dal Teorema 6.4. In viceversa si dimostra in modo
del tutto analogo.
Siamo ora in grado di dimostrare:
Teorema 6.14 (III criterio di congruenza)
Due triangoli che abbiano tutti e tre i lati uguali
Teorema 6.12 Un triangolo è isoscele se e solo se i
sono congruenti.
due angoli adiacenti alla base sono uguali.
Prova: Con riferimento alla Figura 6.14, sia CM Prova: Facciamo ora riferimento alla Figura 6.15.
′ ′
il segmento che si ottiene dividendo a metà l’angolo Portiamo AB a coincidere con A B e supponiamo
′
b
b
in C, di modo che ACM
= M CB.
I due triangoli che, cosı̀ facendo, C non venga a coincidere con C.
′
′
ACM e M CB sono congruenti per il primo criterio: I due triangoli ACC e BCC sono isosceli per co′ ′
′ ′
AC = CB perché il triangolo è isoscele, CM è a struzione e per ipotesi (AC = A C e BC = B C ) e
b = M CB
b per costruzione. Quindi quindi hanno gli angoli alla base uguali. Tuttavia, se
comune ed ACM
c′
c′
in particolare l’angolo in A è uguale all’angolo in B. la disposizione è quella della figura: AC C > B C C e
′
′
′
b
b
c
Viceversa, supponiamo che gli angoli adiacenti al lato ACC < B CC = B C C, il che è assurdo. Ci possono
′
AB siano uguali. Questo vuol dire che sono acuti e essere altre disposizioni dei punti C e C , ma in modo
quindi, se da C tracciamo l’altezza relativa ad AB, del tutto analogo si arriva sempre a una conclusione
′
questa cade in un punto M compreso tra A e B. Si assurda. Quindi, deve essere C ≡ C .
considerino allora i triangoli AM C e M BC; i due
be
angoli in M sono retti e quindi uguali, gli angoli A
C′ C
b sono uguali per ipotesi e questo implica che l’angolo
B
b è uguale ad M CB.
b
ACM
I due triangoli sono allora
congruenti per il secondo criterio (CM è in comune)
e, in particolare, CA = CB; quindi il triangolo è
isoscele.
A ≡ A′
B ≡ B′
Come conseguenza di questa dimostrazione, si può
cC =
osservare che, in un triangolo isoscele, AM
c
Figura 6.15: Terzo criterio di congruenza
B M C, che quindi risultano retti; perciò CM è l’altezza del triangolo. Inoltre, AM = M B, e CM è anche
174
CAPITOLO 6. GEOMETRIA EUCLIDEA
Teorema 6.15 Un quadrilatero è un parallelogramma se e soltanto se le due coppie di lati opposti sono
formate da segmenti uguali.
¢¢
A¢
¢
¢
B¢ H
¢
C¢ K
¢
¢
D¢
¢
E¢
¢
¢
¢r
Prova: Se ABCD è un parallelogramma, considerando le rette parallele AB e CD tagliate dalla trab = B DC
b perché angoli altersversale DB, si ha ABD
ni interni. In modo analogo, partendo dalle parallele
b = DBC.
b
AD e BC si ha ADB
Allora i due triangoli
ABD e BCD sono congruenti per il primo criterio
e perciò si ha AB = DC e AD = BC. Viceversa,
supponiamo che sia AB = DC e AD = BC; i due
triangoli ABD e BCD sono ora uguali per il terzo crib = B DC
b
terio di congruenza e quindi abbiamo ABD
b
b
e ADB = DBC; questo implica che AB e DC sono
paralleli, come lo sono AD e BC.
Un immediato corollario di questo teorema è che
ogni rombo è un parallelogramma. Nella dimostrazione del teorema abbiamo usato la diagonale DB; potevamo usare anche l’altra diagonale AC e arrivare allo
stesso risultato. Pertanto, una seconda conseguenza
è:
Corollario 6.16 Ogni diagonale divide un parallelogramma in due triangoli uguali.
Uno dei primi risultati “astratti” ottenuti nella
Geometria è stato, quasi sicuramente, il teorema di
Talete, che ora vedremo. Talete si interessava alle proporzioni e indubbiamente osservò la proprietà
enunciata dal suo teorema, ma, altrettanto indubbiamente, non ne dette alcuna dimostrazione come ora si
intende e come, un paio di secoli dopo di lui, intendevano i Greci. A quell’epoca, la necessità di una prova
rigorosa in Matematica non era avvertita e una verifica sperimentale era più che sufficiente. Ciò non toglie
che l’intuizione di Talete non fosse giusta e, a quel che
si dice, egli stesso la adoperò, quando gli capitò di recarsi in Egitto, per calcolare con esattezza l’altezza
delle piramidi, operazione ritenuta impossibile prima
di lui.
Definizione 6.5 Si dice fascio di rette l’insieme di
tutte le rette che passano per un punto, detto il centro
del fascio, oppure l’insieme di tutte le rette parallele
a una retta assegnata, detta la direzione del fascio.
Teorema 6.17 (di Talete) Sia dato un fascio di
rette parallele e si considerino due trasversali r ed
s a tale fascio (v. Figura 6.16); queste trasversali sono pertanto tagliate in segmenti dalle rette parallele;
allora, a segmenti proporzionali tagliati su r corrispondono segmenti nella stessa proporzione tagliati
su s, e viceversa.
Prova: A onor di Talete, la dimostrazione di questo teorema non è affatto ovvia e richiede un’impo-
BB
B A′
B
′ B
H BB ′
B
K′ B C′
B
B
B D′
B
B E′
B
B
sB
Figura 6.16: Teorema di Talete
stazione che tenga conto della definizione di numero reale, concetto che, al tempo di Talete, nemmeno esisteva! Si comincia osservando che a segmenti
uguali su r corrispondono segmenti uguali su s. Sia
AB = BC; se si tirano le perpendicolari al fascio
AH e BK, i due triangoli ABH e CBK sono uguab = H BA
b e
li, essendo AB = BC per ipotesi, K CB
b = C BK
b come angoli corrispondenti. PortiaB AH
mo ora le perpendicolari A′ H ′ e B ′ K ′ : questo implica che AA′ H ′ H e BB ′ K ′ K sono parallelogrammi e quindi A′ H ′ = AH = BK = B ′ K ′ . Da
questo deriva che i triangoli A′ H ′ B ′ e B ′ K ′ C ′ sono congruenti, ancora per il primo criterio di conc′ B ′ = K ′ B
c′ C ′ perché corrispondenti,
gruenza (H ′ A
c′ = K
c′ perché retti). Finalmente, questo ci dice
H
′ ′
A B = B ′ C ′ . Supponiamo ora (seconda parte della
dimostrazione) che due segmenti, ad esempio AB e
CD, stiano tra di loro in un rapporto razionale m/n.
Questo significa che dividendo AB in n parti uguali e CD in m parti uguali, queste parti hanno tutte
la stessa lunghezza. Possiamo applicare allora la prima parte della dimostrazione immaginando che ogni
parte sia individuata dal taglio di r ed s con rette
parallele del fascio. Questo implica che A′ B ′ e C ′ D′
stanno ancora nel rapporto m/n, essendo le parti tagliate in s tutte uguali tra di loro. La terza parte
della dimostrazione riguarda il caso in cui i due segmenti, diciamo ancora AB e CD non siano tra loro in
un rapporto razionale. Se z è tale rapporto, possiamo
pensare a due successioni (di Cauchy) di numeri razionali che approssimano z per difetto e per eccesso.
Considerando segmenti che approssimano CD secondo i rapporti di tali sequenze con AB, per la seconda
parte della dimostrazione si ottengono segmenti che
approssimano C ′ D′ secondo gli stessi rapporti con il
segmento A′ B ′ . Questo ci dice che anche il rapporto
tra A′ B ′ e C ′ D′ deve essere z.
175
6.3. CONGRUENZA E SIMILITUDINE
A Talete bastò sfruttare la prima parte del teorema
per misurare l’altezza della piramide. Secondo Plutarco, aspettò che la propria ombra avesse una lunghezza pari alla sua altezza e segnò il punto in cui arrivava l’ombra della punta della piramide. Sfruttando
poi il fatto che la base della piramide era quadrata
e le sue misure potevano essere prese direttamente,
non gli fu difficile calcolare l’altezza esatta. Questo
metodo è noto in generale come “principio dei triangoli simili”, e in effetti il teorema di Talete costituisce
la base della teoria geometrica della similitudine, che
fra poco vedremo. Prima, però, osserviamo che esiste
anche un teorema inverso a quello di Talete:
Teorema 6.18 Sia dato un fascio di rette, delle quali non si sappia se sono parallele. Se, prese comunque
due trasversali r ed s si ha che a segmenti proporzionali staccati su r corrispondono segmenti nella stessa proporzione staccati su s, allora le rette del fascio
sono parallele tra di loro.
Prova: Se nel fascio esistesse una retta non parallela alle altre, chiamiamo A la sua intersezione con la
retta r. Per A facciamo passare la parallela al fascio
che incontrerà s nel punto A′′ diverso da A′ . Per il
teorema di Talete, i segmenti con vertice in A′′ hanno
le stesse proporzioni con gli altri segmenti determinate dai corrispondenti segmenti con vertice in A. Ma
questa è la stessa proprietà di cui devono godere i
segmenti con vertice in A′ e quindi A′′ e A′ devono
coincidere. Questo vuol dire che la retta originale per
A deve coincidere con quella costruita, cioè risulta in
effetti parallela alle altre rette del fascio.
Come per la congruenza, la verifica della loro similitudine può essere semplificata rispetto a ciò che comporterebbe la definizione. Queste semplificazioni sono stabilite dai tre criteri di similitudine dei triangoli,
abbastanza analoghi ai tre criteri di congruenza.
C
¢@
¢ @
C′
@D
C ′′¢
¢@
¢@
@
@
@
¢
¢
@
@
@
¢
¢
@
@
@
¢
¢
@
@
@
¢
@ ¢
@
@
A
B ′′
B A′
B′
Figura 6.17: Triangoli simili
Teorema 6.20 (I criterio di similitudine) Due
triangoli che abbiano due coppie di lati in proporzione e l’angolo fra essi compreso uguale, sono simili
tra di loro.
Prova: Con riferimento alla Figurs 6.17, siano ABC
e A′ B ′ C ′ due triangoli per i quali AB : A′ B ′ =
b = A
c′ . Prendiamo sul segmento
AC : A′ C ′ e A
′′
AB un punto B (che potrebbe anche seguire B)
tale che AB ′′ = A′ B ′ e da B ′′ costruiamo la parallela B ′′ C ′′ a BC. Il teorema di Talete ci dice che
AB : AB ′′ = AC : AC ′′ , e quindi, per l’unicità del
quarto proporzionale deve essere AC ′′ = A′ C ′ . I due
E’ importante un’altra conseguenza del Teorema di triangoli AB ′′ C ′′ e A′ B ′ C ′ sono quindi uguali per il
Talete:
b=B
c′′ = B
c′
primo criterio di congruenza e perciò B
′′
′′
′
b
c
c
e C = C = C . Infine, portando la parallela C D
Corollario 6.19 Se r ed s sono due rette parallele,
ad AB si ha C ′′ D = B ′′ B, essendo B ′′ BDC ′′ un
allora tutti i punti di r hanno la medesima distanza
parallelogramma, e dal teorema di Talete si deduce
da retta s.
AC : AC ′′ = BC : BC ′′ . Questa equivale alla pro′ ′
′ ′
Ha senso allora definire la distanza di due rette paral- porzione AC : A C = BC : B C , il che prova che
lele r ed s come la distanza di un qualsiasi punto p anche il terzo lato è nella stessa proporzione degli
altri due.
di una delle due rette dall’altra retta.
Finalmente, diamo la seguente:
Anche il secondo criterio di similitudine è analogo
al secondo criterio di congruenza:
Definizione 6.6 Due poligoni con k lati si dicono simili se i lati sono ordinatamente nella stessa Teorema 6.21 (II criterio di similitudine) Due
proporzione e se gli angoli che essi formano sono triangoli che abbiano due coppie di angoli uguali
ordinatamente uguali.
sono simili (a meno di una eventuale rotazione
intorno a un lato).
Osserviamo esplicitamente che le due condizioni non
possono, in generale, essere ridotte; questo è dimo- Prova: Naturalmente, se due coppie di angoli sostrato dall’esempio del quadrato e del rombo (che no uguali, anche la terza coppia è tale; inoltre, non
hanno i lati in proporzione, ma gli angoli diversi) e ha senso parlare di proporzionalità di due soli ladall’esempio del rettangolo e del quadrato (che hanno ti. Con riferimento alla Figura 6.17, siano ABC e
b=A
c′ , B
b=B
c′ e, di congli stessi angoli, ma non i lati in proporzione). Il caso A′ B ′ C ′ due triangoli con A
′
b
c
più importante e interessante è quello dei triangoli. seguenza, C = C . Riportiamo su AB il punto B ′′
176
CAPITOLO 6. GEOMETRIA EUCLIDEA
di modo che sia AB ′′ = A′ B ′ e costruiamo la parallela B ′′ C ′′ a BC. I due triangoli AB ′′ C ′′ e A′ B ′ C ′
sono uguali per il secondo criterio di congruenza e
quindi AC ′′ = A′ C ′ e B ′′ C ′′ = B ′ C ′ . Per il teorema di Talete abbiamo AB : AB ′′ = AC : AC ′′ , cioè
AB : A′ B ′ = AC : A′ C ′ . In modo analogo, oppure
costruendo la parallela C ′′ D ad AB, si provano le altre proporzioni, che si riducono a AB : A′ B ′ = AC :
A′ C ′ = BC : B ′ C ′ per la proprietà transitiva.
C Q
­ QQ
­
Q
­
Q
Q
­
Q
­
Q
Q
­
Q
­
Q
A
H
B
Figura 6.18: Triangolo rettangolo
Infine, in analogia al terzo criterio di congruenza:
Teorema 6.22 (III criterio di similitudine) Se
Prova: Facendo riferimento alla Figura 6.18, i
due triangoli hanno i tre lati in proporzione, allora due triangoli ABC e ACH sono simili per il seconsono simili (a meno di una rotazione intorno a uno do criterio di similitudine in quanto l’angolo in A è
dei lati).
comune e gli angoli in C e in H sono retti. Quindi
AH : AC = AC : AB, il che prova il primo punto.
Prova: Con riferimento alla Figura 6.17, siano ABC Anche i due triangoli AHC e CHB sono simili in
e A′ B ′ C ′ due triangoli tali che AB : A′ B ′ = AC : quanto entrambi simili ad ABC, e quindi vale la proA′ C ′ = BC : B ′ C ′ . Si consideri su AB il punto B ′′ porzione AH : CH = CH : HB, e questo dimostra il
tale che AB ′′ = A′ B ′ e su AC il punto C ′′ tale che secondo punto.
AC ′′ = A′ C ′ . Per l’inverso del teorema di Talete,
Come vedremo, il celeberrimo teorema di Pitagora
B ′′ C ′′ deve essere parallelo a BC, e costruendo C ′′ D
parallelo ad AB si trova, come in precedenza, che è una conseguenza, pressoché immediata, del primo
deve essere B ′′ C ′′ = B ′ C ′ . I due triangoli AB ′′ C ′′ e teorema di Euclide.
A′ B ′ C ′ sono pertanto congruenti per il terzo criterio.
b=A
c′
Ma ora è immediato osservare che deve essere A
La misura delle superfici
′′
′ c′ ′
′′
′′
′′
b
c
b
c
ABC = AB C = A B C e ACB = AC B = 6.4
′ c′ ′
A C B , il che prova che i due triangoli sono simili.
Ciò che intuitivamente chiamiamo l’estensione di
Sfruttando questi criteri, Talete non avrebbe avuto una superficie può essere misurata se fissiamo un’opla necessità di aspettare che la sua ombra fosse lunga portuna unità di misura. Se u è il segmento che abtanto quanto lui era alto, ma in qualsiasi momento biamo assunto come unità di misura di lunghezza,
avrebbe potuto usare il fattore di proporzionalità da- convenzionalmente stabiliamo di usare come unità di
to dal rapporto della sua altezza e la lunghezza della misura di superficie l’estensione di un quadrato di lasua ombra. Anzi, avrebbe potuto approfittare del to u. Naturalmente, non possiamo pensare che, data
momento in cui i raggi del sole erano perpendicolari una superficie qualsiasi, si riesca a trovare il modo
a un lato della piramide, perché in quel momento i di sovrapporle tanti quadrati u × u da ricoprirla perconti sarebbero stati più semplici. Se capisco bene la fettamente. Come per le lunghezze e gli angoli, è
descrizione che fu data del calcolo di Talete, sembra opportuno definire multipli e sottomultipli, in modo
che questi aspettasse il giorno e l’ora in cui la sua da poter associare ad una superficie qualsiasi un cerombra misurava quanto la sua altezza e il sole risul- to numero di quadrati unità di misura, ma, se ne è
tava perpendicolare a un lato della piramide. Santa il caso, anche una certa quantità di sottomultipli. Se
la superficie è grande, potrà essere inoltre convenienPazienza!
La più famosa applicazione del teoria della te usare qualche multiplo dell’unità di misura (vedi
similitudine è costituita dai due teoremi di Euclide: Sezione 6.1). Con questo in mente, dimostriamo il
seguente teorema che è alla base della teoria della
Teorema 6.23 (Teoremi di Euclide) Sia ABC misura:
un triangolo rettangolo e sia CH l’altezza relativa
Teorema 6.24 Se un rettangolo ha i lati di dimenall’ipotenusa; allora:
sioni a, b ∈ R+ rispetto all’unità di lunghezza u, alprimo teorema di Euclide: ciascun cateto è me- lora la superficie del rettangolo misura ab rispetto aldio proporzionale tra la proiezione di quel cateto l’unità di misura delle superfici, cioè il quadrato di
sull’ipotenusa e l’ipotenusa stessa;
dimensioni u2 = u × u.
secondo teorema di Euclide: l’altezza relativa al- Prova: La prova, come di regola succede per le prol’ipotenusa è medio proporzionale fra le due prietà che chiamano in causa i numeri reali, si divide
proiezioni dei cateti sull’ipotenusa.
in più parti, quattro nel caso attuale. Primo caso:
177
6.4. LA MISURA DELLE SUPERFICI
siano a, b ∈ N; allora, dividiamo il lato di misura a in
a parti, ciascuna di lunghezza u, e il lato che misura b
in b parti, e tiriamo le parallele all’altro lato passanti
per tali punti di divisione: si ottengono cosı̀ esattamente ab quadrati unitari, e questo prova l’asserto.
Secondo caso: siano a, b ∈ Q e supponiamo a = m/n
e b = p/q (le due frazioni possono essere ridotte ai
minimi termini, ma la cosa non è strettamente necessaria). Dividiamo u in nq parti uguali, di modo che
il quadrato unitario viene a contenere n2 q 2 quadretti. Tirando al solito le parallele ai lati dai punti di
divisione, si ottengono mq parti dal primo lato e pn
parti dal secondo. Gli mqnp quadratini cosı̀ ottenuti
vanno divisi per gli n2 q 2 quadretti dell’unità di misura; si ottiene quindi mqnp/n2 q 2 = mp/nq = ab. La
terza parte riguarda il caso a ∈ Q e b ∈ R: non si può
più agire come prima, ma si prendono due sequenze
di Cauchy di numeri razionali {si }i∈N e {ti }i∈N che
approssimano, per difetto e per eccesso, il numero b.
Per a e gli si , come per a e i ti , si può procedere
analogamente a quanto fatto nel secondo caso e si ottengono misure {asi }i∈N e {ati }i∈N che determinano
la misura ab. Infine, se entrambe le misure a, b sono
numeri reali, si procede in modo simile prendendo
successioni di Cauchy che approssimano, per eccesso
e per difetto, le due quantità a, b ∈ R.
za tra gli altri due lati paralleli, allora l’area del
parallelogramma vale ah.
Prova: Nella Figura 6.19, sia E il punto di incontro
di AB con la perpendicolare da C al lato DC; sia poi
DF perpendicolare ad AB. I due triangoli AF D e
BEC sono congruenti per il secondo criterio e quindi
ABCD è equivalente al rettangolo F ECD, la cui area
è proprio bh.
C
A′
A
B′
B
D
C′
H
Figura 6.20: Area del triangolo
Naturalmente, l’area del triangolo è di importanza
non trascurabile:
Teorema 6.26 Sia dato un triangolo ABC, sia
AB = b un suo lato e CH = h l’altezza relativa a
tale lato; allora l’area del triangolo è bh/2.
Di solito, la misura della superficie di una figura si Prova: Si consideri la Figura 6.20. Sia D il punto
mediano dell’altezza e da D tiriamo la parallela al ladice area e si dà la seguente definizione:
to AB fino ad incontrare i lati AC e BC nei punti A′ e
Definizione 6.7 Due figure si dicono equivalenti se
B ′ , rispettivamente. Su tale retta si consideri il punhanno la stessa area. Si dicono invece equiscompoto C ′ tale che B ′ C ′ = A′ B ′ . Per il teorema di Talete
nibili se sono scomponibili nello stesso numero finito
è anche CB ′ = BB ′ e A′ C = AA′ = BC ′ . Quindi
di parti congruenti.
i due triangoli A′ B ′ C e BC ′ B ′ sono congruenti per
Chiaramente, due figure equiscomponibili hanno la il primo criterio. In particolare, BC ′ risulta parallestessa area. L’equiscomponibilità è un metodo for- lo ad AC; quindi il triangolo ABC è equivalente al
te per trovare la misura della superficie delle figu- parallelogramma ABC ′ A′ la cui area è bh/2.
re, e non sempre risulta sufficiente, come capita nel
La Figura 6.21 mostra come l’area del trapezio sia
ben noto problema della quadratura del cerchio, e data dalla formula (a + b)h/2 e quella del rombo da
cioè trovare un quadrato equivalente a un cerchio ab/2; il lettore è invitato a specificare i dettagli deldato: questo problema richiede un’altra impostazio- le dimostrazioni, che costituiscono un buon esercizio,
ne che vedremo più avanti. Per i poligoni, l’equi- anche se molto semplice, di ragionamento geometrico.
scomponibilità è il concetto adeguato al calcolo delle
aree.
a
b
b
a
D
C
a
b
Figura 6.21: Area del trapezio e del rombo
A
C
B
E
Figura 6.19: Area del parallelogramma
Teorema 6.25 Sia ABCD un parallelogramma e
sia a = AB = CD un lato. Se h è la distan-
Vogliamo osservare che i due teoremi di Euclide si
possono formulare in termini di figure equivalenti:
1. il quadrato costruito su un cateto è equivalente al rettangolo che ha per lati l’ipotenusa e la
proiezioni del cateto sull’ipotenusa;
178
CAPITOLO 6. GEOMETRIA EUCLIDEA
2. il quadrato costruito sull’altezza relativa all’ipo- centrale ha lato b − a, la differenza dei due cateti;
tenusa è equivalente al rettangolo che ha per lati pertanto, l’area del quadrato grande è:
le proiezioni dei cateti sull’ipotenusa.
ab
c2 = 4 + (b − a)2
2
b
c
b
c
a
a
c
b
a
c
b
a
Figura 6.22: Teorema di Pitagora
Sulla stessa linea di questi teoremi c’è il
fondamentale:
Teorema 6.27 (di Pitagora) Un triangolo è rettangolo se e solo se il quadrato costruito sull’ipotenusa è equivalente alla somma dei quadrati costruiti
sui cateti.
e semplificando si trova c2 = a2 + b2 . Una semplice applicazione del primo teorema di Euclide dà una
terza dimostrazione del teorema di Pitagora. Come si vede dalla Figura 6.24, il quadrato costruito
sul cateto AC è equivalente al rettangolo ADKH e
il quadrato costruito sul cateto BC è equivalente al
rettangolo HKEB. Già nel 1928 il matematica inglese Loomis ha pubblicato un libro nel quale raccoglie oltre centocinquanta dimostrazioni del Teorema
di Pitagora.
C
Prova: Esistono moltissime dimostrazioni di questo
teorema. Una delle più belle fa diretto riferimento all’equiscomponibilità. I due quadrati della figura sono
cosı̀ formati: il primo da quattro triangoli rettangoli
A
H
B
congruenti e dai quadrati dei due cateti; il secondo
dagli stessi quattro triangoli e dal quadrato dell’ipotenusa. Per differenza, si ha immediatamente il teorema. Viceversa, supponiamo che i tre lati a, b, c di
un triangolo siano tali che a2 + b2 = c2 ; costruiamo il
quadrato di lato a + b come nel primo disegno della
D
K
E
figura: i quattro triangoli sono congruenti per il primo criterio e quindi sia c′ la lunghezza di ciascuno dei
due segmenti obliqui. Costruiamo ora il secondo quaFigura 6.24: Pitagora ed Euclide
drato della figura, nella quale il lato obliquo risulta
essere di lunghezza c′ per la prima parte del teorema;
Il teorema di Pitagora era noto agli Egizi, almeno
questo però implica a2 + b2 = c′2 , cioè c2 = c′2 . Es- nel caso delle misure (3, 4, 5) dei lati, come s’è visto
sendo c, c′ positivi questo significa c = c′ e perciò il nella costruzione delle rette perpendicolari. Le tertriangolo originale era rettangolo.
ne di numeri naturali (a, b, c) tali che a2 + b2 = c2
si dicono terne Pitagoriche e il lettore può direttamente verificare che tali sono (5, 12, 13) e (8, 15, 17),
oltre naturalmente alla citata (3, 4, 5). Se abbiamo
una terna Pitagorica e moltiplichiamo i tre numeri
per uno stesso valore, otteniamo ancora una terna
Pitagorica, come (6, 8, 10). In realtà, si vede immeb−a
diatamente che i tre numeri a, b, c sono a due a due
primi tra loro, oppure hanno tutti e tre un fattore comune. Infatti, se ad esempio a, b avessero un fattore
a
a
comune k, allora sarebbe a = kr e b = ks e quindi
c
c2 = k 2 r2 + k 2 s2 = k 2 (r2 + s2 ), cosı̀ che k risulterebbe anche un divisore di c. Le terne Pitagoriche per
Figura 6.23: Pitagora per differenza
le quali a, b, c non hanno fattori comuni si dicono primitive. E’ possibile trovare tante terne Pitagoriche
Un’altra bella dimostrazione richiede l’uso di un quante si vogliono:
po’ di Algebra; si consideri la Figura 6.23. Il quadrato
179
6.4. LA MISURA DELLE SUPERFICI
Teorema 6.28 Dati due qualsiasi numeri interi ABC. Si ha pertanto la proporzione AC : AF =
m, n con m > n, la terna costituita dei numeri AB : BF . Vale allora il seguente:
a = m2 − n2 , b = 2mn, c = m2 + n2 è Pitagorica.
Teorema 6.30 Se ℓ è la misura del lato obliquo nel
Prova: Basta eseguire semplici calcoli:
triangolo
armonico, allora la misura della base è
√
ℓ( 5 − 1)/2.
a2 + b2 = (m2 − n2 )2 + 4m2 n2 =
Prova: Se poniamo AF = AB = x e BF = CB −
= m4 + 2m2 n2 + n4 = (m2 + n2 )2
CF = ℓ − x nella precedente proporzione, otteniamo
ℓ : x = x : (ℓ − x). Questo equivale all’equazione
√
che danno il risultato desiderato.
x2 +ℓx−ℓ2 = 0 che ha come soluzioni ℓ(−1± 5)/2; la
Lasciamo al lettore la dimostrazione del fatto che soluzione col segno − è negativa e quindi deve essere
se m ed n sono primi tra loro, allora la terna Pitago- scartata (una lunghezza non può essere negativa) e
rica che si ottiene è primitiva. Questo dimostra che le quindi segue l’asserto del teorema.
√
terne Pitagoriche “diverse” sono infinite. Meno semIl numero ( √
5 − 1)/2 ≈ 0.6180339887, o meglio,
plice è dimostrare che quelle cosı̀ ottenute sono tutte
5 + 1)/2 ≈ 1.6180339887, è detto
il
suo
inverso
(
le terne Pitagoriche possibili e questo noi qui non lo
rapporto
armonico
o rapporto aureo e si indica con
vedremo.
la
lettera
greca
φ.
Abbiamo già incontrato questa
Dal teorema di Pitagora discendono infinite conquantità
a
proposito
dei numeri di Fibonacci, nella
seguenze importanti. Qui ci limitiamo a ricordare
Sezione
4.3;
esiste
infatti
una stretta connessione tra
quelle che interessano direttamente alcuni particolari
questi
due
concetti.
Dato
un segmento AB è facile
triangoli.
costruire un segmento CD che sia in rapporto φ con
Teorema 6.29 Se ℓ è la misura del lato√di un qua- AB e che si dice costituirne la sezione aurea.
drato, allora la sua diagonale misure ℓ 2. Se ℓ è
la misura del lato
la sua Algoritmo 6.4 (Sezione aurea)
√ di un triangolo equilatero,
√
Ingresso: un segmento AB di lunghezza ℓ.
altezza misura ℓ 3/2 e la sua area ℓ2 3/4.
Uscita: un segmento CD di lunghezza ℓ/φ.
Prova: Due lati consecutivi del quadrato e la diago1. si riporti due volte consecutive il segmento AB su
nale d costituiscono
un √
triangolo rettangolo, per cui
√
una retta r; siano A′ B ′ e B ′ B ′′ i due segmenti;
si ha d = ℓ2 + ℓ2 = ℓ 2. Analogamente, se ABC
è un triangolo equilatero, esso risulta anche un trian2. da B ′′ si costruisca la perpendicolare ad r e su di
golo isoscele.
Dalla
Figura
6.14,
posto
h
=
CM
,
si
questa, a partire da B ′′ , si riporti un segmento
p
√
ha h = ℓ2 + ℓ2 /4 = ℓ 3/2. La formula per l’area
B ′′ C di lunghezza ℓ;
si ha eseguendo ℓh/2.
3. si√unisca A′ con C (il segmento A′ C ha lunghezza
Un caso interessante è il seguente. Si consideri un
ℓ 5);
triangolo isoscele che abbia l’angolo opposto alla base di 36◦ , come nella Figura 6.25. Questo significa
4. a partire da A′ , si riporti un segmento A′ D =
che ogni angolo alla base vale (180◦ − 36◦ )/2 = 72◦ .
AB
√ su AC (il segmento DC ha come lunghezza
Tale triangolo viene detto triangolo armonico per la
( 5 − 1)ℓ);
proprietà che vedremo.
5. si divida a metà, nel punto M , il segmento CD;
uno qualsiasi
C
√ dei due segmenti DM e CM ha
lunghezza ℓ( 5 − 1)/2 = ℓ/φ.
36◦
Nota 6.3
F
A
B
Figura 6.25: Il triangolo armonico
Da A portiamo la bisettrice AF all’angolo in A;
b = F AC
b = 36◦ e AFbB = 72◦ . I triangoli
quindi B AF
AF C e ABF sono isosceli e quest’ultimo è simile ad
I Greci consideravano particolarmente
armonioso il rapporto aureo; se si costruisce un rettangolo di dimensioni AB = ℓ e BC = ℓ/φ, e si riporta
l’altezza AD sulla base AB, il rettangolo EBCF è di
nuovo tale che EB = BC/φ. La costruzione si può
ripetere all’infinito, come mostrato nella Figura 6.26.
Si osservi infatti che, per costruzione, è AE = AB/φ
e quindi vale la proporzione AB : AD = AD : EB
in quanto EB = AB − AE, e questo significa
AD : EB = AB : AE = φ. E’ interessante la curva
che si ottiene dai quarti di circonferenza che uniscono
vertici opposti e detta spirale armonica. Si dice che i
180
CAPITOLO 6. GEOMETRIA EUCLIDEA
F
D
r
C
¡
A
A
E
templi greci fossero costruiti in modo da conformarsi
alla sezione aurea e il rapporto armonico fu (sembra)
molto utilizzato da colui che è considerato il maggiore
artista greco, e cioè Fidia; la lettera φ è presa infatti
dall’iniziale del suo nome. Curiosamente, il rapporto
tra due numeri consecutivi della successione di
Fibonacci tende a diventare uguale a φ; ad esempio,
55/34 = 1.618, e l’n-esimo
numero si può scrivere
√
come (φn − (−1/φ)n )/ 5: provare per credere, ma
il risultato è esatto (v. Teorema 4.11). Il numero φ
ha colpito anche la fantasia dei moderni, ed è famoso
il Modulor, il canone inventato da Le Corbusier e
basato sul rapporto aureo; il famoso architetto lo
propose per costruire edifici e oggetti “a misura
d’uomo”. Per ulteriori informazioni si legga il libro
di Mario Livio “La sezione aurea” edito in Italia da
Rizzoli (2003).
Luoghi geometrici
¡
M
@
@
@
@
B
B
Figura 6.26: La spirale armonica
6.5
¡
¡
P
¡@
¡ @
Figura 6.27: Asse di un segmento
AM P e M BP sono congruenti per il primo criterio.
Infatti, AM = BM per costruzione, P M è in comune e gli angoli in M sono uguali perché retti. Quindi
AP = P B e il punto P appartiene all’asse. Viceversa, prendiamo un punto P tale che P A = P B (cioè
stia sull’asse) e uniamolo ad M , punto medio di AB.
Questa volta i due triangoli AM P e M P B sono congruenti per il terzo criterio, essendo AP = P B per
ipotesi, AM = BM per costruzione e P M in comune.
cP = B M
cP , che pertanto risultano retti.
Quindi AM
In conclusione, P si trova sulla retta r perpendicolare
ad AB.
Duale del concetto di asse di un segmento è il
concetto di bisettrice di due rette:
Definizione 6.9 Date due rette [che si intersecano],
si dice bisettrice delle due rette il luogo dei punti da
esse equidistanti.
Abbiamo messo tra parentesi quadre il fatto che le
rette si intersechino; se non lo fanno, se cioè sono parallele, il concetto di bisettrice ancora sussiste, ma
in tal caso la bisettrice si riduce alla retta, parallela alle rette date e passante a metà distanza tra le
due. Il lettore troverà utile l’esercizio di dimostrare
rigorosamente questo fatto. Se invece le due rette si
incontrano:
Una figura è costituita da un insieme di punti; ad
esempio, un triangolo è la parte finita del piano delimitata da tre rette, a due a due non parallele. Talvolta, la proprietà che definisce i punti di una figura
è particolarmente semplice e suggestiva: si parla allora di tali figure come di luoghi geometrici o luoghi
di punti. L’esempio più semplice è senz’altro l’asse di
un segmento:
Teorema 6.32 La bisettrice di una coppia di rette
incidenti in O è costituita da due rette passanti per
Definizione 6.8 Dato un segmento AB, si dice as- O, perpendicolari tra loro, che tagliano a metà gli
se di tale segmento l’insieme (il luogo) dei punti che angoli formati dalle rette date.
hanno la stessa distanza da A e da B.
Prova:
Sia P un punto della retta tale che
Chiaramente, il punto di mezzo M del segmen- AOP
b = B OP
b ed uniamo P alle due rette r ed s
to appartiene all’asse, ed è facile vedere che l’asse con le perpendicolari P A e P B. I due triangoli BOP
è semplicemente una retta:
e OAP sono congruenti per il secondo criterio: il lato
b
b
b
Teorema 6.31 L’asse del segmento AB è la retta OP è in comune, AOP = B OP per costruzione e A
b
b
b
perpendicolare ad AB che passa per il suo punto di e B retti. Quindi abbiamo anche AP O = B P O e
P A = P B, cioè P appartiene alla bisettrice. Per il
mezzo M .
viceversa, se P è tale che P A = P B, P O è in comub e in B
b sono retti, per il teorema
Prova: Si consideri la Figura 6.27. Sia r la perpen- ne e gli angoli in A
dicolare per M ad AB; se il punto P sta su r e lo di Pitagora è anche AO = BO, onde i due triangouniamo con A e con B, vediamo che i due triangoli li P OA e P OB sono congruenti per il terzo criterio.
181
6.5. LUOGHI GEOMETRICI
H
C
b′
HH
s
HHA
©©
©
H
©
¢¢ HH
©
©
H
¢
H
©©
b
HH
¢
©
©
H
PA
H
©© O
HH
A
©
HH
AA ©©
©
HH
r
©© B
©
©
N
W
X
M
Y
A
B
Figura 6.31: Baricentro
Figura 6.28: Bisettrici di due rette incidenti
b = B OP
b e quindi P appartiene
In particolare, AOP
b
alla retta che divide in due l’angolo AOB.
Lo stesso
′
ragionamento vale per la retta b . Infine, i quattro
angoli formati da b e b′ sono uguali tra loro come
b + AOb
b ′) e
somma di angoli uguali (ad esempio, P OA
quindi sono angoli retti.
Dato un angolo, per bisettrice dell’angolo si intende
la semiretta compresa nell’angolo, e si ignorano le
altre tre semirette.
1. gli assi dei tre lati si incontrano in un punto,
detto il circumcentro o circocentro del triangolo;
2. le bisettrici dei tre angoli si incontrano in un
punto, detto l’incentro del triangolo;
3. le altezze relative ai tre lati si incontrano in un
punto detto ortocentro del triangolo;
4. le mediane dei tre lati si incontrano in un punto
detto il baricentro del triangolo.
Prova: (1) Nella Figura 6.29, gli assi dei lati AB
e BC si incontrano in un punto D che, per costruzione, è equidistante da tutti e tre i vertici; quindi, tale punto deve appartenere anche all’asse di CA.
(2) Analogamente, nella stessa figura, le bisettrici deb e C
b si incontrano in un punto E che,
N
gli angoli A
per costruzione, è equidistante da tutti e tre i laE
ti, e quindi deve appartenere anche alla bisettrice
D
b (3) Con riferimento alla Figura 6.30, si codi B.
struiscano le rette per A, B, C parallele, rispettivamente, ai lati BC, AC, AB del triangolo. Esse deA
M
B
terminano il triangolo P QR e considerati i paralleFigura 6.29: Incentro e circocentro
logrammi ABP C, BCQA, ARBC, si trova che i lati
P Q, QR, P R sono il doppio di AB, BC, CA. Pertanto, le altezze AHA , BHB , CHC sono gli assi dei lati
Q
C
P
QR, RP, P Q, che si incontrano in un punto H per
H
A
il
primo asserto. (4) Infine, facendo riferimento alla
HB
Figura 6.31, siano M, N, P i punti di mezzo dei lati
del triangolo ABC. Sia W il punto di incontro delle
due mediane BN ed AM e si considerino i segmenti
M
N ed XY , dove X ed Y sono i punti mediani di
A
B
HC
AW e BW . Per il Teorema di Talete, M N = XY ed
entrambi sono metà di AB. I due triangoli W M N e
W XY sono uguali, avendo uguali i tre angoli ed i lati
M N ed XY . Questo significa che W divide sia BN
che AM in due parti, di cui una è doppia dell’altra.
R
Si esegua la stessa costruzione relativa alle mediane
Figura 6.30: Ortocentro
AM e CP : si trova che il punto di intersezione W ′
le divide in due parti, di cui una è doppia dell’alAssi e bisettrici sono importanti nei triangoli, dove tra. Questo però significa che M W ′ = M W , essendo
abbiamo il seguente risultato:
entrambi un terzo di AM , e quindi W ′ = W .
C
Teorema 6.33 Sia ABC un triangolo; allora:
E’ allora immediato il seguente:
182
CAPITOLO 6. GEOMETRIA EUCLIDEA
Corollario 6.34 Il baricentro di un triangolo divide la circonferenza, che rimane tutta dalla stessa parte
ciascuna delle tre mediane in due parti, di cui una è rispetto ad r. Viceversa, sia s una retta per P non
perpendicolare ad OP . Tiriamo da O la perpendidoppia dell’altra.
colare ad s, che incontrerà s in un punto M ; per il
Eulero osservò che l’ortocentro, il baricentro e il cir- teorema di Pitagora OM < OP e quindi M è intercumcentro sono allineati; lasciamo però da parte la no alla circonferenza. Se P ′ è il punto su s tale che
dimostrazione di questa curiosa proprietà.
P ′ M = M P (ma dalla parte opposta di P rispetto ad
Sicuramente, il luogo geometrico più importante è M ), abbiamo P ′ O = P O e quindi P ′ sta sulla circoncostituito dalla circonferenza:
ferenza. Quindi la retta s incontra la circonferenza in
′
Definizione 6.10 Si dice circonferenza di raggio r il almeno due punti P e P e non la lascia tutta dalla
luogo dei punti che hanno distanza r da un punto fis- stessa parte. Quindi r è unica.
sato O, detto centro della circonferenza. Si dice cerchio di raggio r il luogo dei punti che hanno distanza
minore o uguale ad r da un punto O detto centro del
cerchio. Ogni segmento (di lunghezza r) che unisce
il centro del cerchio o della circonferenza al bordo del
cerchio o alla circonferenze si dice raggio. Due raggi
distinti che giacciono sulla stessa retta costituiscono
un diametro, la cui lunghezza è pertanto 2r.
Naturalmente, una circonferenza determina un cerchio, costituito da tutti i punti interni alla circonferenza, e viceversa un cerchio determina una circonferenza, data dai punti del suo bordo o contorno. E’
bene tuttavia usare la terminologia appropriata per
non creare confusione o ambiguità; ad esempio, la misura della circonferenza è una misura lineare, mentre
la misura del cerchio è una misura di superficie.
P
Q
O
r
Figura 6.32: Tangente a una circonferenza
Teorema 6.35 Sia data una circonferenza di centro
O e raggio r, e sia P un punto su di essa. Esiste
una e una sola retta r che passa per P e lascia tutta
la circonferenza dalla stessa parte. Tale retta risulta
perpendicolare al raggio OP e si dice la tangente in
P alla circonferenza.
Tornando un attimo ai triangoli, si osservi che il circumcentro D è equidistante dai tre vertici del triangolo e quindi se si disegna una circonferenza di centro
D e passante per uno dei vertici, essa toccherà anche gli altri due, lasciando il triangolo al suo interno.
Questa circonferenza risulta circoscritta al triangolo,
ed è per questo che il circumcentro ha tale nome. In
modo simile, l’incentro E è equidistante dai tre lati,
pertanto se disegniamo una circonferenza di centro
E e raggio dato dalla distanza di E da uno qualsiasi
dei tre lati del triangolo, questa circonferenza risulta
tangente ai tre lati ed è tutta contenuta all’interno
del triangolo; si dice che questa è la circonferenza inscritta nel triangolo, ed è per questo che E si dice
l’incentro.
Altri luoghi geometrici importanti sono le cosiddette coniche: l’ellisse, la parabola e l’iperbole; come
si sa, queste curve hanno il nome di coniche perché
possono essere ottenute intersecando un cono con un
piano. Per cono si intende la figura solida originata
da una retta che ruota nello spazio intorno ad un’altra retta ad essa incidente: la retta ruotante si dice
la generatrice del cono, mentre la retta fissa è detta
l’asse del cono, e il loro punto d’incontro si dice il
vertice del cono (si veda anche la Sezione 6.8). Se si
considera un piano incidente con l’asse del cono, l’intersezione risulta un’ellisse; nel caso particolare in cui
il piano sia perpendicolare all’asse si ottiene una circonferenza, che pertanto deve essere considerata una
conica, caso particolare di ellisse. Se il piano è parallelo alla generatrice, la figura che si ottiene è una
parabola. Infine, se il piano è parallelo all’asse, si ha
un’iperbole.
Queste definizioni classiche sono, comunque, meno
utili nella pratica delle definizioni di queste curve come luoghi geometrici; come vedremo, le definizioni saranno utilizzate in Geometria Analitica per ottenere
l’equazione delle curve.
Definizione 6.11 Dati due punti F1 ed F2 , detti
Prova: Nella Figura 6.32 si consideri la retta r pas- fuochi, si dice ellisse il luogo geometrico dei punti la
sante per P e perpendicolare ad OP . Se prendiamo su cui somma delle distanze da F ed F è costante.
1
2
r un punto Q diverso da P , il triangolo OP Q è retto
Come conseguenza di questa definizione, l’ellisse
in P e quindi, per il teorema di Pitagora, OQ > OP ;
quindi r non ha altri punti in comune, se non P , con (vedi Figura 6.33) risulta essere una figura limitata,
183
6.6. LA GEOMETRIA DELLA CIRCONFERENZA
P
b
b
b
b
b
F1
F2
b
b
bF
b
b
d
Figura 6.33: Costruzione dell’ellisse
Figura 6.35: Costruzione della parabola
cioè racchiusa in una porzione finita del piano, come
la circonferenza; in effetti, se i due fuochi coincidono l’ellisse diventa proprio una circonferenza avente
F1 = F2 come centro, e per raggio la metà della costante, somma delle distanze dai fuochi. In modo
analogo:
è la costruzione dell’ellisse, che generalizza il metodo
empirico per disegnare una circonferenza, cioè piantare uno spillo nel centro della circonferenza e tenere
una matita a distanza fisse collegandola allo spillo con
una cordicella. Per l’ellisse, come si vede nella Figurs
Definizione 6.12 Dati due punti F1 ed F2 , detti 6.33, fissati due spilli nei fuochi e unitoli con una corfuochi, si dice iperbole il luogo geometrico dei punti dicella di lunghezza uguale alla somma delle distanze,
la cui differenza delle distanze da F1 ed F2 è costante. la figura si ottiene facendo scorrere la matita lungo la
corda, cosı̀ che questa rimanga sempre distesa. Ancora oggi i giardinieri tracciano i confini delle aiole
a forma di cerchio e di ellisse con questi metodi; al
posto degli spilli usano paletti e invece di filo utilizzano una corda. Più complessa è la costruzione pratica
dell’iperbole e della parabola, che si possono comunque disegnare per punti seguendo le corrispondenti
definizioni. Comunque, l’iperbole della Figura 6.34 è
Fb1
Fb2
stata costruita per punti in modo analitico, come si
imparerà nel prossimo capitolo.
6.6
Figura 6.34: L’iperbole
In questo caso (v. Figura 6.34), i punti dell’iperbole possono essere distanti dai fuochi quanto si vuole,
purché la differenza rimanga fissata; pertanto, l’iperbole è una figura non limitata. Analogamente non
limitata è la parabola:
Definizione 6.13 Dato un punto F detto fuoco e
una retta d detta direttrice, si dice parabola il luogo
dei punti equidistanti da F e da d.
Le definizioni possono essere utilizzate per costruire effettivamente le curve. Particolarmente semplice
La geometria della circonferenza
Le proprietà della circonferenza sono interessanti
quanto quelle dei triangoli, e, come questi sono i poligoni che più spesso si incontrano nella pratica, cosı̀ la
circonferenza è la curva non poligonale più frequente.
Il fatto che possa essere disegnata in modo elementare
con il compasso, la rende di facile uso e, d’altra parte, sembra che la Natura si sia ispirata più alle forma
rotonde che a quelle poligonali. Una caratteristica
importante è costituita dal fatto che la circonferenza è determinata univocamente da tre dei suoi punti.
Ciò è stabilito da un teorema e dalla corrispondente
costruzione:
Teorema 6.36 Dati tre punti non allineati A, B, C
esiste una e una sola circonferenza che passi per tali
tre punti
184
CAPITOLO 6. GEOMETRIA EUCLIDEA
C
b
b
O
b
b
A
B
Figura 6.36: Circonferenza per tre punti
Prova: Si consideri la Figura 6.36. Sia r l’asse
del segmento AB e sia s l’asse del segmento BC. Se
A, B, C non sono allineati, r ed s non sono paralleli
e si incontrano nel punto O. Questo punto ha la
stessa distanza da A e da B (trovandosi sull’asse r del
relativo segmento) e da B e da C (trovandosi sull’asse
s del relativo segmento). Quindi, la circonferenza di
centro O e raggio OA = OB = OC passa per i tre
punti, ed è unica, avendo centro e raggio determinati.
C e D, l’angolo determinato dalle due semirette si
dice angolo alla circonferenza. Se un angolo al centro
e un angolo alla circonferenza determinano lo stesso arco AB, si dicono corrispondenti; se invece uno
determina l’arco AB e l’altro l’arco esplementare, si
dicono corrispondenti esplementari.
Si osservi che raddoppiando l’angolo al centro anche
l’arco circolare corrispondente raddoppia; ciò ci dice che angoli ed archi sono grandezze direttamente
proporzionali, e questo fatto, importante di per sé,
verrà usato in Trigonometria per definire la misura
in radianti degli angoli.
P
Ob
P
A
Ob
Q
B
A
B
Figura 6.38: Angoli al centro e alla circonferenza - 1
Le proprietà principali della circonferenza sono leQuesta lunga definizione introduce una serie di congate alla seguente definizione, per la quale si faccia
cetti importanti, che vanno ritenuti esattamente, inriferimento alla Figura 6.37.
sieme alla definizione di retta tangente. Si ha allora
il fondamentale risultato:
P
O
b
Teorema 6.37 Sia data una circonferenza di centro
b è
O e sia P un punto qualsiasi su di essa; se AOB
un angolo al centro ed APbB un suo corrispondente
angolo alla circonferenza, allora il primo è il doppio
del secondo.
Prova: Sono da considerare tre casi, a seconda delle
posizioni reciproche dei punti. Nel primo caso (Figura 6.37) si osservi che i triangoli AOP e BOP sono
A≡C
B≡D
b =
isosceli; per il teorema dell’angolo esterno: QOA
b + APbO = 2APbO e QOB
b = OBP
b + B PbO =
OAP
Q
2B PbO; sommando membro a membro queste due
b = 2APbB. Nel secondo caso
uguaglianze si ha: AOB
Figura 6.37: Proprietà della circonferenza
(Figura 6.38, a sinistra) AOP e BOP sono ancora
isosceli; il teorema dell’angolo esterno questa volta
dà:
Definizione 6.14 Data una circonferenza, si dice
b = OPbA + AOP
b = 2OPbA
AOQ
angolo al centro ogni angolo che abbia come vertice il
b = OPbB + P BO
b = 2OPbB;
B OQ
centro O della circonferenza. Se le due semirette che
formano l’angolo incontrano la circonferenza nei pun- facendo la differenza si ha AOB
b = 2APbB. Infine, nel
ti A e B, la parte di circonferenza interna all’angolo caso di transizione (Figura 6.38, a destra), il teorema
si dice arco circolare interno; l’altra parte si dice arco
b = OPbB +P BO
b =
dell’angolo esterno dà subito AOB
circolare esterno o esplementare. La parte di cerchio
b
2AP B, essendo isoscele il triangolo BOP .
compresa nell’angolo si dice settore circolare e il segCome si capisce dalla dimostrazione, la posizione
mento che unisce i due punti A e b è detto corda. Se
P è un punto della circonferenza e da esso partono del punto P sulla circonferenza è inessenziale. Cosa
due semirette che tagliano la circonferenza nei punti succede allora quando P si avvicina ad A o a B, tanto
185
6.6. LA GEOMETRIA DELLA CIRCONFERENZA
da confondersi con tali punti? Quando P tende ad
A, la semiretta P B rimane ben identificata, ma cosa
accade alla semiretta P A? Si può intuire che essa si
trasformi nella tangente passante per A ≡ P e quindi
ci possiamo aspettare che il teorema valga anche in
questo caso limite. Possiamo comunque stabilire questo fatto con un teorema che consideri la situazione
come un problema a sé stante, e non un problema al
limite (vedere Figura 6.39 a sinistra):
Ob
b
O
A
B
r
A
B
P
Corollario 6.41 Un triangolo inscritto in una semicirconferenza è retto e, viceversa, ogni triangolo rettangolo può essere inscritto in mezza
circonferenza.
Prova: Se un triangolo è inscritto in mezza circonferenza, allora l’ipotenusa coincide con un diametro;
esso determina un angolo al centro di 180◦ , e quindi
l’angolo opposto, come corrispondente alla circonferenza, vale 90◦ . Per il viceversa, basta osservare che il
circumcentro del triangolo è giusto il punto di mezzo
dell’ipotenusa.
Questo corollario è alla base di molte considerazioni
sui triangoli rettangoli ed è quasi importante come il
Teorema di Pitagora. Vediamo, a mo’ di esempio, come questo corollario, abbinato ai teoremi di Euclide,
ci permetta di trovare il medio proporzionale tra due
segmenti (vedere Figura 6.40):
Figura 6.39: Angoli al centro e alla circonferenza - 2
b un angolo al centro e sia
Teorema 6.38 Sia B OA
b
B Ar l’angolo formato dalla retta AB e dalla retta
b =
tangente alla circonferenza r in A; allora B OA
b
2B Ar, che pertanto può essere considerato un angolo
alla circonferenza di tipo degenere.
P
b
A
M B≡C≡H D
Figura 6.40: Costruzione del medio proporzionale
b è retto, si ha: B Ar
b =
Prova: Poiché l’angolo OAr
b
90◦ − OAB;
il triangolo BAO è isoscele e quindi
b
b cioè B OA
b = 180◦ − 2(90◦ − Algoritmo 6.5 (Medio proporzionale)
B OA = 180◦ − 2OAB,
Ingresso: Due segmenti AB e CD;
b
b
B Ar) = 2B Ar, che è ciò che volevamo dimostrare.
Uscita: Il segmento P H tale che AB : P H = P H :
Ci possiamo ora chiedere cosa succede se consi- CD.
deriamo l’angolo esplementare (vedere Figura 6.39 a
1. si riportano su una retta i due segmenti in modo
destra):
che B ≡ C; si ottiene cosı̀ il segmento AD;
b
b
Teorema 6.39 Sia AOB un angolo al centro e AP B
2. dal punto di mezzo M di AD si traccia una
un angolo alla circonferenza che insiste sull’arco
semicirconferenza di raggio AM ;
b
b è doppio del
esplementare di AOB.
Allora AOB
3. dal punto B ≡ C ≡ H si traccia la perpendicolasupplementare di APbB.
re ad AD fino ad incontrare la semicirconferenza
b l’angolo esplementare di
Prova: Sia 360◦ − AOB
nel punto P (si osservi che ADP è un triangolo
b che insiste sull’arco esplementare AB; per il
AOB
rettangolo, di cui AB e CD sono le proiezioni
b = 2APbB, cioè
Teorema 6.37 si ha allora: 360◦ −AOB
dei cateti sull’ipotenusa);
◦
b
b
AOB = 2(180 −AP B) che è proprio la proprietà che
4. il segmento P H è il medio proporzionale cercato
volevamo dimostrare.
(P H è l’altezza relativa all’ipotenusa).
Ricco di applicazioni è anche il seguente:
Corollario 6.40 Se un quadrilatero è inscritto in
una circonferenza, allora gli angoli opposti sono
Teorema 6.42 Sia data una circonferenza e sia P
supplementari.
un punto fuori di essa. Sia P T una tangente da P
alla circonferenza e sia P AB una retta secante la cirProva: Infatti sono angoli alla circonferenza che
conferenza che la taglia nei punti A e B. Vale allora
insistono su un arco e sul suo esplementare.
la proporzione: P A : P T = P T : P B, cioè il segmenUna conseguenza molto importante dei teoremi to di tangente è medio proporzionale tra i segmenti
visti è il seguente:
staccati su una secante della circonferenza.
186
CAPITOLO 6. GEOMETRIA EUCLIDEA
leggermente semplificare e si ottiene una formula interessante quando come secante alla circonferenza si
considera la retta OP :
T
r
d
A
P
b
P
B
A′
B′
Figura 6.41: Tangente e secanti dallo stesso punto
Prova: Si congiungano (v. Figura 6.41) A e B con
T e si considerino i triangoli P AT e P T B; essi sono
simili perché hanno l’angolo Pb in comune e gli angoli
b e ATbP uguali, poiché entrambi insistono sulABT
l’arco AT (quindi anche i terzi angoli sono congruenti). Da questa similitudine discende la proporzione
cercata.
Questo significa che il prodotto P A · P T è costante
e quindi se, come in figura, P A′ B ′ è un’altra secante
alla circonferenza, si ha P A?·P B ′ = P A·P B = P T 2 .
Poiché il medio proporzionale si sa costruire, questo
teorema permette di trovare il punto T di tangenza
alla circonferenza di una retta passante per P :
Algoritmo 6.6 (Tangenti da un punto esterno)
Ingresso: Una circonferenza e un punto P ad
essa esterno;
Uscita: I punti di tangenza sulla circonferenza delle
rette passanti per P ;
1. Si traccia una secante P AB qualsiasi;
2. Si costruisce, come visto in precedenza, il medio
proporzionale tra i segmenti P A e P B; sia CH
tale segmento;
3. con il compasso, facendo centro in P , si traccia
una circonferenza di raggio CH;
4. i punti in cui questa circonferenza taglia quella
data sono i punti di tangenza cercati;
5. si uniscono, se si vuole, al punto P .
Sia data una circonferenza di centro O. Se P è
un punto del piano che non sia il centro della circonferenza, si dice distanza di P dalla circonferenza
la lunghezza del segmento P A, dove A è il punto di
intersezione della circonferenza con la retta P O. E’
chiaro che se P ≡ O, la distanza è il raggio della
circonferenza e che se P si trova sulla circonferenza
la distanza è zero. I risultati precedenti si possono
Corollario 6.43 Se P è un punto esterno a una
circonferenza di raggio r e d è la distanza di P
dalla circonferenza, allora la misura t del segmento Pp
T che unisce P a uno dei punti di tangenza è:
t = d(d + 2r).
Prova: Come detto, basta considerare come secante
la retta P O.
La quantità t2 si dice la potenza del punto P rispetto
alla circonferenza. Dalla Figura 6.41, si ha t2 = P A ·
P B = P A′ · P B ′ .
Il problema di determinare la misura della circonferenza e il calcolo dell’area del cerchio assillarono (se
cosı̀ si può dire) i matematici antichi, e anche quelli
più moderni, diciamo fino al XIX secolo. Il problema
consiste nel determinare il valore esatto del numero
π, il rapporto tra circonferenza e diametro. Gli Egizi
e i Babilonesi si erano accorti che questo rapporto è
fisso, cioè indipendente dalla particolare circonferenza o dal particolare cerchio considerato. Essi usavano
stime più o meno approssimate: stime grossolane come 3 o molto più accurate come il valore razionale
22/7 = 3.142857 . . .. Immaginando appunto che π
fosse un numero razionale, si tentò di trovare un metodo di scomposizione del cerchio che ne dimostrasse
l’equivalenza con una figura, della quale si potesse
trovare direttamente l’area (problema della quadratura del cerchio). In effetti, la
√ cosa avrebbe potuto
funzionare anche se π, come 2, fosse stato un numero irrazionale, ma esprimibile per mezzo di radicali. Nonostante infiniti tentativi, nessuno fu capace
di quadrare il cerchio, finché, nel 1882, Lindemann
riuscı̀ a dimostrare che π è un numero trascendente,
cioè non può essere soluzione di un’equazione algebrica (polinomiale) a coefficienti interi. Ciò implica
che la quadratura del cerchio (o la rettificazione della
circonferenza) è impossibile se si usano solo la riga
e il compasso. Infatti, come vedremo studiando la
Geometria Analitica, la retta corrisponde ad un’equazione algebrica di primo grado e la circonferenza
a una di secondo grado; quindi, ogni problema risolubile con la riga e il compasso corrisponde a un
sistema di equazioni algebriche, equivalente a un’unica equazione algebrica, come si può intuire pensando
al metodo di sostituzione.
La determinazione di π è il problema di base della
misurazione di circonferenze e cerchi; infatti, vale il
seguente:
Teorema 6.44 Sia π il rapporto tra la misura di una
circonferenza e il suo diametro; dato un cerchio di
raggio r, la sua area misura πr2 , e la circonferenza
che lo delimita ha lunghezza 2πr.
187
6.7. POLIGONI REGOLARI E CERCHIO
Prova: La misura della circonferenza è ovvia, per
la definizione di π. Per l’area, possiamo immaginare
di suddividere il cerchio in tanti triangoli isosceli congruenti con il vertice opposto alla base nel centro e gli
altri vertici in punti molto vicini della circonferenza,
diciamo a distanza a l’uno dall’altro. Se n è il numero
di tali triangoli, la lunghezza del perimetro sarà na
e questa quantità è assimilabile alla lunghezza della
circonferenza 2πr quando n è molto grande. D’altra
parte, quando n è molto grande, a è molto piccolo
e quindi l’apotema (cioè l’altezza dei vari triangoli)
è assimilabile al raggio. Questo vuol dire che l’area
di ciascun triangolo è ar/2 e l’area del cerchio sarà
assimilabile a:
nar/2 = 2πrr/2 = πr2
un suo valore approssimato per difetto e per eccesso. In quanto all’area, è chiaro che l’apotema dei vari
poligoni, al crescere di n, si avvicina sempre di più
al raggio, e ciò rende conto di quanto affermato nel
teorema precedente.
Concludiamo questa sezione con la seguente
definizione:
Definizione 6.15 Si dicono concentriche due o più
circonferenze che hanno lo stesso centro. L’area
compresa tra due circonferenze concentriche si dice
corona circolare.
Per differenza, è immediato osservare che l’area di
una corona circolare determinata da due circonferenze di raggio R ed r (con R > r) è: A = π(R2 −
r2 ).
come desiderato.
6.7
Figura 6.42: Area del cerchio
Questa dimostrazione, anche se intuitivamente valida, non è certamente molto rigorosa, almeno nella
forma in cui l’abbiamo messa. Per cercare di renderla più precisa, si immagini di costruire dei poligoni
inscritti e circoscritti alla circonferenza che si vuole
misurare (v. Figura 6.42); se questi poligoni hanno
lo stesso numero di lati n e facciamo crescere n tanto quanto vogliamo, il perimetro e l’area dei poligoni
si avvicineranno alla lunghezza della circonferenza e
all’area del cerchio, e differiranno tra di loro sempre
meno, fino a che questa differenza non divenga praticamente nulla. Se Pn è il perimetro del poligono
circoscritto, pn di quello inscritto e c è la misura della circonferenza, si ha Pn ≥ c ≥ pn e Pn − pn tanto
piccolo da essere pressoché 0; nella terminologia delle successioni di Cauchy, esse determinano lo stesso
numero reale. Ma Pn e pn possono essere calcolati e
questo ci darà una forte caratterizzazione di π, cioè
Poligoni regolari e cerchio
Riprendiamo ora la definizione di “poligono regolare” data nella Sezione 6.2. Se dai vertici disegniamo
le bisettrici agli angoli, queste si intersecano in un
punto detto centro del poligono: infatti, tutti i triangoli determinati dai lati e da queste bisettrici devono
essere uguali per il secondo criterio di congruenza.
Quindi il centro del poligono è equidistante da tutti
i vertici, e questo significa che il poligono può essere
circoscritto da una circonferenza che ha per raggio la
distanza dal centro di ciascun vertice. D’altra parte, i triangoli considerati sono tutti isosceli, avendo
gli angoli alla base uguali. Quindi la circonferenza
di centro il centro del poligono e raggio la distanza di tale centro dai lati (cioè l’altezza dei triangoli
isosceli), è inscritta nel poligono. In altri termini, il
poligono è delimitato da una circonferenza inscritta
e da una circoscritta; il raggio del cerchio inscritto
si dice apotema del poligono ed ha un ruolo molto
importante.
Teorema 6.45 Il perimetro di un poligono regolare
è dato dal prodotto della misura di ciascuno dei suoi
lati per il numero dei lati stessi. L’area è data dal
perimetro moltiplicato per l’apotema e diviso per 2.
Prova: La relazione per il perimetro è ovvia. Per
l’area, si divida come visto il poligono in tanti triangoli congruenti; l’area di ciascun triangolo si ottiene
moltiplicando il lato per l’apotema e dividendo per 2.
Moltiplicando ora questo per il numero dei lati, si ha
la formula richiesta.
Da questa formula discende l’importanza del concetto
di apotema, la cui misura sarà indicata con a. Quando frequentavo le Scuole Elementari, ci insegnavano
a trovare l’area di un poligono regolare calcolando
l’apotema; questo si trovava moltiplicando il lato ℓ
188
CAPITOLO 6. GEOMETRIA EUCLIDEA
per un numero fisso, variabile però da poligono a poE
D
ligono. Tali numeri erano la mia ossessione, perché
non riuscivo a figurarmi come venissero fuori. Solo
alla Scuola Media il mistero si cominciò a sciogliere e
quella fu per me una bella conquista. La TrigonomeO
tria risolve il problema, ma nei casi più semplici sono
F
C
sufficienti considerazioni elementari. Ci proponiamo
pertanto di determinare il valore dell’apotema di molti poligoni regolari, esprimendolo in funzione del lato
(la cui lunghezza sarà indicata con ℓ) e in funzione
A
M
B
del raggio del cerchio circoscritto (la cui lunghezza
sarà indicata con r); un minimo di algebra ci perFigura 6.44: Esagono regolare
metterà pertanto di calcolare una qualsiasi delle tre
quantità a, ℓ, r da ciascuna delle altre. In questa ricerca escluderemo quei poligoni, come l’ettagono (il Teorema 6.48 Per il poligono
√ regolare con√sei lati,
poligono regolare con sette lati) che richiedono no- l’esagono, abbiamo: a = ℓ 3/2 ed a = r 3/2 ≈
zioni che saranno viste solo nel capitolo relativo alla 0.866 × r.
Trigonometria. Cominciamo col caso più semplice:
b vale 360◦ /6 = 60◦ e quindi il
Prova: L’angolo AOB
triangolo
ABO
è
equilatero.
Di conseguenza AB =
Teorema 6.46 Per il più semplice dei poligoni
√ regoOB,
cioè
ℓ
=
r
e
questo
conclude
la dimostrazione,
lari, il triangolo equilatero, si ha: a = ℓ × 3/6 ≈
poiché
l’apotema
OM
è
l’altezza
di
tale triangolo.
ℓ × 0.289 ed a = r/2 = r × 0.5.
C
C
D
O
O
A
M
C
B′
B
A
M
B
N
B
M
O
Figura 6.43: Triangolo e quadrato
A
Prova: Facendo riferimento alla Figura 6.43, il
centro O è anche il punto di incontro delle mediane
Figura 6.45: Pentagono e decagono
e quindi l’apotema è OM = OC/2 e questo dà la seconda formula. Inoltre, come
Il caso del pentagono si affronta meglio se risolvia√ sappiamo, CM è anche
l’altezza, per cui CM = ℓ 3/2; applicando ancora mo il problema per il decagono, il poligono regolare
la√regola della mediana abbiamo: OM = CM /3 = con dieci lati:
ℓ 3/6.
Teorema 6.49 Per il poligono regolare con dieci
Anche per il quadrato la valutazione è semplice:
lati, il decagono, si ha:
s
√
√
Teorema 6.47 Per il poligono regolare con√quattro
5+1
5+ 5
≈ 1.539 × ℓ
a=ℓ
lati, il quadrato, si ha: a = ℓ/2 ed a = r × 2/2 ≈
2
8
0.707 × r.
s
√
5+ 5
Prova: Facendo riferimento alla Figura 6.43, l’aa=r
≈ 0.951 × r
potema OM è chiaramente√metà del lato CB.√Inol8
tre, come si sa, OB = OM 2 da cui OM = r 2/2.
Prova: Con riferimento alla Figura 6.45 dove AB è il
b vale 360◦ /10 = 36◦
lato del decagono, l’angolo AOB
Saltiamo per il momento il pentagono e passia- e quindi ABO è il triangolo armonico che conosciamo ad occuparci dell’esagono, un altro caso molto mo. Per quanto
visto nel Teorema 6.30 abbiamo:
√
semplice:
ℓ = r × ( 5 − 1)/2; questo permette di calcolare
189
6.7. POLIGONI REGOLARI E CERCHIO
Prova: Facciamo ancora riferimento alla Figura
6.45, immaginando che AC sia il lato del quadrato
e AB = ℓ sia quello dell’ottagono. Poiché ON
√ è l’apotema del quadrato, abbiamo N B = r − r 2/2 =
√
2
2
2
r(2 − 2)/2 e di conseguenza AB
= AN + N B =
p
√
√
. Quindi AB = ℓ = r 2 − 2 e, vicever(2 − 2)r2p
√
2
2
sa, r = ℓ/ 2 − 2. Ora, da OM = r2 − AM si
√ 2
2
trova OM = (2 + 2)r /4 = a2 , da cui si ricava la
Siamo ora in grado di risolvere il caso del seconda formula. Poi, essendo a2 = r2 − (ℓ/2)2 , si ha:
pentagono:
√
ℓ2
ℓ2
3+2 2 2
√ −
a2 =
=
ℓ ,
Teorema 6.50 Per il poligono regolare con cinque
4
4
2− 2
lati, il pentagono, si ha:
espressione equivalente alla prima formula.
√
√ s
1+ 5 5+ 5
Per l’ennagono e l’undecagono le cose si fanno più
≈ 0.688 × ℓ
a=ℓ
4
10
difficili, ma il lettore potrà affrontare l’utile esercizio
√
di trovare le espressioni per l’apotema del dodecagono
1+ 5
(il poligono regolare con 12 lati) partendo dall’esagoa=r
≈ 0.809 × r.
4
no e procedendo in modo analogo a quanto si è fatto
Prova: Facendo ancora riferimento alla Figura 6.45, per l’ottagono.
il segmento AC rappresenta il lato del pentagono e
Abbiamo già osservato che ogni poligono regolare,
ON l’apotema. Si prenda B ′ simmetrico di B rispetto oltre ad essere inscritto nella circonferenza di ragb ′ = CB
c′ B = 72◦ , si ha B CB
b ′ = gio OA, la distanza del centro del poligono da uno
ad AC, e poiché C BB
◦
′
18 , per cui CBB è simile a BOA. Quindi BB ′ : qualsiasi dei suoi vertici, è anche circoscritto alla cirAB = BC : OB, e poiché BC = AB si ricava:
conferenza che ha per centro O e raggio OM , l’apoÃ√
!2
tema dello stesso poligono. Vogliamo ora affrontare
√
5−1
3− 5
1
il calcolo approssimato di π seguendo l’impostazione
r=
r.
BN =
2
2
4
appena accennata. Ci saranno utili due risultati, il
primo dei quali già lo conosciamo, almeno in un paio
Sottraendo questa quantità da OB = r si ha per l’a- di casi particolari.
potema l’espressione desiderata. Per il segmento CN
Teorema 6.52 Sia ℓ la misura del lato di un poligosi ottiene allora:
no regolare con n lati inscritto in una circonferenza
s
Ã
√ !2
√
di raggio unitario; allora la misura del lato del po1+ 5
5− 5
2
CN = r2 −
r2 ; CN = r
.
ligono di 2n lati inscritto nella stessa circonferenza
4
8
è:
q
p
Facendo infine il rapporto tra l’apotema già trovato
ℓ′ = 2 − 4 − ℓ2 .
e il lato AC = 2 CN si trova:
Prova: Sia, come nella Figura 6.45, AC = ℓ il la√ s
√
√ s
to del poligono di n lati inscritto nella circonferenza
1+ 5
a
2
1+ 5 5+ 5
√ =
=
unitaria di centro O; sarà quindi AB = ℓ′ il lato del
ℓ
4
4
10
5− 5
b
poligono di 2n lati, essendo OB la bisettrice di AOC.
Poiché OAC è un
AN = ℓ/2
come desiderato.
ptriangolo isoscele, si hap
e quindi ON = 1 − ℓ2 /4 e BN = 1 − 1 − ℓ2 /4.
L’ottagono, il poligono regolare con 8 lati, ha ri- Poiché l’angolo in M è retto, si ha il valore di BA:
spetto al quadrato la stessa relazione che il decagovÃ
s
!2
u
r
r
no ha con il pentagono; questa volta, però, proceu
2
2
ℓ
ℓ2
ℓ
t
′
diamo all’inverso, sfruttando le nostre conoscenze sul
+
= 2−2 1−
ℓ =
1− 1−
4
4
4
quadrato.
l’apotema OM applicando il teorema di Pitagora ad
√
√
2
AM O: OM = r2 −r2 ( 5−1)2 /4 = r2 (10+2 5)/16,
cioè:
s
√
5+ 5
× r.
OM =
8
√
√
Sostituendo ora ad r il valore 2ℓ/( 5 − 1) = ℓ( 5 +
1)/2, si ha subito anche la prima espressione.
Teorema 6.51 Per l’ottagono si ha:
p
√
3+2 2
≈ 1.207 × ℓ
a=ℓ×
2
p
√
2+ 2
a=r×
≈ 0.924 × r
2
e questo dà ℓ′ =
p
√
2 − 4 − ℓ2 .
Questo teorema si trasforma facilmente in un algoritmo per calcolare il perimetro di un poligono di
2n lati; come sappiamo il quadrato inscritto nella circonferenza
di raggio unitario ha come semiperimetro
√
2 2 ≈ 2.828, per cui:
190
CAPITOLO 6. GEOMETRIA EUCLIDEA
Algoritmo 6.7 (Valori per difetto di π)
Ingresso: Un numero naturale n > 2;
Uscita: Il perimetro del poligono regolare con 2n lati;
√
1. si pone ℓ := 2 e j := 2;
2. fino a che risulta j ≤ n si calcola:
(a) j := j + 1;
p
√
(b) ℓ := 2 − 4 − ℓ2 ;
lati
4
8
16
32
64
128
256
512
1024
per difetto
2.8284271247
3.0614674589
3.1214451523
3.1365484905
3.1403311570
3.1412772509
3.1415138011
3.1415729404
3.1415877253
per eccesso
4.0
3.3137084990
3.1825978781
3.1517249074
3.1441183852
3.1422236299
3.1417503692
3.1416320807
3.1416025103
3. si esce con p := 2n × ℓ.
Per i poligoni circoscritti si ha il seguente:
Tabella 6.2: Valori di π per difetto e per eccesso
Teorema 6.53 Sia ℓ la misura del lato del poligono
regolare di n lati circoscritto alla circonferenza uni- cioè:
!
Ã
r
taria; allora la misura ℓ′ del lato del poligono con 2n
. ℓ
2
2
ℓ
ℓ
ℓ
lati circoscritto alla stessa circonferenza vale:
− 1+
=
AS = − 1 +
2
4
4
2
p
ℓ′ = 4( 1 + ℓ2 /4 − 1)/ℓ
Ãr
!
. ℓ
ℓ2
.
=
1+
−1
,
4
2
e questa è la metà del lato del poligono con 2n lati.
B
T
S
O
A
Figura 6.46: Poligono circoscritto
Prova: Nella Figura 6.46, sia AT = ℓ/2 metà
del lato del poligono di n lati. Sia OS la bisettrib ; i due triangoli BAT e OST sono simili
ce di AOT
b è l’angoperché l’angolo Tb è comune e l’angolo B AT
lo alla circonferenza corrispondente all’angolo al cenb del quale, pertanto, vale la metà. Si ha
tro AOB
allora la proporzione: OT : AT = T S : BT , cioè
OT : AT = (AT − AS) : (OT − OB). D’altra parte,
abbiamo AT = ℓ/2 e quindi:
OT =
q
2
2
OA + AT =
p
1 + ℓ2 /4.
La proporzione diviene:
p
p
1 + ℓ2 /4 : ℓ/2 = (ℓ/2 − AS) : ( 1 + ℓ2 /4 − 1).
Pertanto:
ℓ
− AS =
2
Ãr
!r
ℓ2
ℓ2 . ℓ
1+
1+
−1
,
4
4
2
Un algoritmo analogo al precedente ci dà allora i
valori di π approssimati per eccesso. Nella Tabella
6.2 riportiamo i valori ottenuti fino al poligono con
1024 lati. Si osservi che la media degli ultimi due
valori è 3.1415951178 contro un valore effettivo π =
3.1415926536 . . ..
Nota 6.4
Il valore di π, come rapporto tra la circonferenza e il diametro, è stato oggetto di curiosità e
di ricerca fino dalla più remota antichità. Nella Bibbia
si trova il valore 3 e nel papiro di Rhind viene utilizzata una quantità che vale π ≈ 3.1605. L’approssimazione razionale che ha avuto più successo è stata
22/7 ≈ 3.142857 . . ., anche se i cinesi e gli occidentali
conoscevano 355/113, che ha ben sette cifre decimali
esatte. In effetti, queste approssimazioni hanno spesso carattere empirico, senza essere sostenute da una
teoria che permetta di migliorarle o almeno valutare
il loro grado di precisione. Il metodo dei poligoni inscritti e circoscritti è stato il primo metodo veramente scientifico e fu inventato da Archimede, che riuscı̀ a
portare avanti i conti fino al poligono di 96 lati; la precisione da lui trovata rimase imbattuta fino ai tempi
moderni.
Verso il 1600, quando nacque la Matematica moderna,
i metodi per calcolare π si affinarono con la trigonometria e le serie di potenze. Si verificò allora una specie di corsa per determinare π con sempre maggiore
precisione. Leibniz scoprı̀ che:
π
1
1
1
1
= 1 − + − + − ···,
4
3
5
7
9
191
6.8. GEOMETRIA DELLO SPAZIO
ma computazionalmente questa formula non vale molto. Più successo ebbe John Machin che trovò un metodo per calcolare le prime cento cifre decimali (si veda
al capitolo sulla Trigonometria) e i suoi epigoni migliorarono man mano questo record finché, nel 1853, William Shanks arrivò a 707 cifre. Purtroppo, nel 1947 ci
si accorse che tali cifre erano sbagliate a partire dalla
528-esima. Con l’avvento dei calcolatori elettronici, la
gara ebbe un’altra impennata e nel 1983 si riuscirono
a calcolare oltre 16 milioni di cifre decimali.
Occorre dire che questo calcolo ha dello straordinario
perché non usa la forza bruta, ma utilizza un nuovo
metodo, anche se basato su alcune idee di Gauss vecchie di oltre 150 anni. Al calcolatore fu dato questo
semplice algoritmo:
Algoritmo 6.8 (Media aritmetico/geometrica)
Ingresso: Un numero naturale n > 2;
Uscita: il numero π con oltre 2n cifre decimali esatte;
√
1. si pone a := 1, x := 1, b := 2/2, c := 1/4;
2. fino a che risulta j ≤ n + 1 si calcola:
√
(a) y := a, a := (a + b)/2, b := b × y;
(b) c := c − x × (a − y)2 , x := 2 × x;
(c) si scrive in uscita il valore di (a+b)2 /(4×c);
tridimensionale; secondo, per il lettore, interpretare correttamente ciò che è stato disegnato. Ancora
più difficile è possedere e/o sviluppare un’appropriata intuizione spaziale per poter affrontare e risolvere problemi tridimensionali; scultori e architetti sono
in questo molto bravi, ma spesso la gente ha difficoltà a raffigurarsi mentalmente cosa succede nello
spazio. Naturalmente, esercitarsi con la geometria
può giovare ad accrescere il nostro senso spaziale.
In accordo con gli assiomi generali, due punti nello
spazio determinano una retta, proprio come sul piano. Per avere un piano α, occorre che siano assegnati
tre punti non allineati, il che equivale ad avere una
retta e un punto fuori di essa, oppure due rette incidenti in un punto. Ad esempio (v. Figura 6.47), se
i tre punti non allineati sono A, B, C, si possono anche avere il punto A e la retta BC, oppure la coppia
di rette AB, BC. Una domanda che può imbarazzare, se fatta fuori di questo contesto, è la seguente:
abbiamo visto che tre punti non allineati determinano nel piano una e una sola circonferenza; allora, tre
punti non allineati nello spazio, quante circonferenze
determinano?
Si osservi che, ad ogni iterazione, a rappresenta la
media aritmetica e c la media geometrica di a e b;
per questo il metodo è detto della media aritmetico/geometrica. Il programma ha l’incredibile proprietà di raddoppiare, ad ogni iterazione, il numero
delle cifre esatte del risultato:
3.140579250522168248311331268975823311773
3.141592646213542282149344431982695774314
3.141592653589793238279512774801863974381
3.141592653589793238462643383279502884197
3.141592653589793238462643383279502884197
Questa tabella contiene le prime cinque iterazioni
(l’ultima è data per controllo) e per arrivare al
risultato desiderato furono sufficienti 25 iterazioni.
Naturalmente, la parte pesante del programma è
data dalle routine per eseguire le operazioni con la
necessaria precisione; escluso questo, il risultato è
più un problema di gestione della memoria che d’altro.
6.8
Geometria dello spazio
Il problema della geometria dello spazio è costituito
dalla difficoltà che tutti abbiamo a rappresentare sia
mentalmente, sia figurativamente gli oggetti a tre dimensioni. Ciò che possiamo disegnare su un foglio è
solamente una proiezione della realtà spaziale e ciò
pone un doppio problema: primo, per il disegnatore, trovare una proiezione che non nasconda, ma anzi
metta in evidenza i punti nevralgici di una situazione
C
b
b
b
α
B
A
Figura 6.47: Piani e angolo diedro
Quando abbiamo un piano, esso definisce due semispazi, cosı̀ come una retta sul piano definisce due
semipiani e un punto su una retta due semirette. Due
piani che si intersecano, si intersecano lungo una retta, e quindi dividono lo spazio in quattro parti, ognuna delle quali è detta un diedro o angolo diedro, per
analogia con gli angoli del piano (v. Figura 6.47).
Normalmente, per assegnare un diedro, si assegnano i due semipiani che lo definiscono e che hanno
origine nella retta di intersezione, detta spigolo del
diedro. Come gli angoli, i diedri formano una classe
di grandezze e su tale aspetto torneremo più avanti.
Ovviamente, due piani che non si intersecano si dicono paralleli; purtroppo, come per le rette nel piano,
questa non può essere una definizione valida, poiché
implica una procedura infinita per accorgersi che i
due piani non si incontrano mai. Occorre allora trovare un metodo finito e questo, come ora vedremo,
non è del tutto banale.
192
CAPITOLO 6. GEOMETRIA EUCLIDEA
Q
b
s
r
b
b
Q′
P
s′
α
Figura 6.48: Posizione di due rette
Cominciamo col definire la posizione reciproca di
due rette nello spazio (vedere Figura ??). Questo
può esser fatto costruttivamente e in termini finiti
mediante il seguente:
Algoritmo 6.9 (Posizione di due rette)
Ingresso: due rette r, s nello spazio.
Uscita: La posizione reciproca di r ed s.
α e di una retta r. Questa volta procediamo discorsivamente, lasciando al lettore il compito di riportare
ad un algoritmo quanto ora diremo. Prima di tutto
è facile vedere se r giace su α prendendo due punti
distinti P, Q della retta e verificando se si trovano su
α. Se r non giace su α, si prende P su α (e non su
r) e si determina il piano β passante per r e per P .
Ora, sia s la retta di intersezione tra α e β; si hanno due possibilità verificabili direttamente, in quanto
r, s sono complanari:
• (caso della retta r1 nella Figura 6.49) r ed s sono
parallele: allora r è parallela al piano α; infatti,
se r incontrasse α in Q, le due rette r e P Q determinerebbero un piano e questo dovrebbe coincidere con quello considerato (determinato da r
e P );
• (caso della retta r2 nella Figura 6.49) r ed s sono
incidenti in Q: allora r ed α si incontrano nel
punto Q, che si dice il piede di r su α.
1. si prende un punto P su s;
2. se P giace su r, allora r ed s sono incidenti in P
e quindi sono coincidenti o complanari; si esce;
r
3. altrimenti, si considera il piano α determinato
da r e da P ;
t
β
4. si prende un punto Q su s diverso da P ;
6. se Q non si trova su α, allora le due rette non
hanno punti in comune e si dicono sghembe;
β
r2
b
P
u
s
γ
Figura 6.50: Posizione reciproca di due piani
r1
s
α
Q
5. se Q giace su α, allora le rette sono complanari.
Il Teorema condparallel permette di stabilire se
sono coincidenti, incidenti o parallele; si esce;
b
Q
α
Figura 6.49: Rette incidenti
Nella Figura 6.48 sono schematizzati i due casi
principali: r ed s sono sghembe, mentre r ed s′ sono
parallele. Può essere utile ricordare che la distanza
tra due rette è la minima distanza tra i punti di una
retta e i punti dell’altra. Ora, il secondo passo consiste nel determinare le posizioni reciproche di un piano
Questo ci fa capire che se la retta r è parallela al
piano α, e consideriamo un qualsiasi piano β contenente r, allora se α, β si intersecano nella retta s,
questa risulta parallela ad r. Il lettore è invitato a
dare una dimostrazione formale di questo fatto, che
ci serve per il terzo passo, cioè per definire la posizione reciproca di due piani. Siano dati due piani
α, β e si consideri un terzo piano γ le cui intersezioni
con α, β siano le due rette r, s. Se r, s si intersecano in un punto P , allora P appartiene tanto ad α
che a β e quindi i due piani si intersecano. Se invece
r, s sono parallele (il che può essere verificato, dato
che sono complanari in γ), esse potrebbero essere tali
semplicemente perché abbiamo preso γ parallela all’intersezione di α e β. Consideriamo allora un piano
δ che abbia intersezione con α, β, γ, e consideriamo
193
6.8. GEOMETRIA DELLO SPAZIO
Torniamo ora ai diedri. Se r è lo spigolo dei due
semipiani α, β che determinano il diedro, si consideri uno qualsiasi dei piani perpendicolari ad r e siano
s, t le rette di intersezione con α, β; l’angolo formato
dalle semirette s, t che giacciono sui semipiani si dice
la sezione normale del diedro e si prende come misura del diedro stesso. Naturalmente, a questo punto,
i diedri possono essere considerati grandezze, esattamente come gli angoli. La definizione della somma,
dei multipli e dei sottomultipli è ovvia e si parla di
diedri acuti, ottusi, convessi, complementari e supplementari proprio come si fa per gli angoli. E’ naturale allora, come sul piano, definire due piani come
Teorema 6.54 Sia data una retta p insieme ad un perpendicolari quando formano quattro diedri uguali.
punto P su di essa; il luogo delle perpendicolari a p
Si prendano ora n rette parallele nello spain P è un piano passante per P .
zio; siano r1 , r2 , . . . , rn in quest’ordine e consideriamo gli n piani determinati dalle coppie
r1 r2 , r2 r3 , . . . , rn−1 rn , rn r1 . Se ciascuno di questi piap
ni lascia tutte le altre rette da una stessa parte dello
Q
spazio, la zona a comune tra tutti gli n semispazi, si
dice prisma indefinito (convesso). Se tagliamo questa
α
figura con due piani paralleli α, β, la zona del prisma
indefinito compresa tra questi piani si dice prisma
S
(convesso). Le rette di intersezione tra α e β e i piani
P
s
del prisma indefinito determinano due poligoni uguaT
li, che si dicono le basi del prisma. I parallelogrammi
R
t
determinati da due rette parallele consecutive e dalle
r
basi si dicono le facce laterali del prisma. La distanza tra i due piani α e β si dice l’altezza. A seconda
che la base sia un triangolo, un quadrilatero, un pentagono, etc., il prisma si dice triangolare, quadranFigura 6.51: Piano perpendicolare a una retta
golare, pentagonale, etc.. Se i due piani α e β sono
perpendicolari
alle rette r1 , . . . , rn , il prisma si dice
Prova: Le perpendicolari a p passanti per P sono
retto.
determinate sui piani passanti per p; ad ogni piano
corrisponde una retta perpendicolare a p per P , come
sappiamo dalla Geometria del piano. Due di queste
α
rette, r, s, essendo incidenti in P , determinano un
piano α che vogliamo dimostrare essere il luogo cercato. Siano Q, Q′ due punti di p equidistanti da P , ed
R, S due punti su r, s rispettivamente. Dalle ipotesi
b = Q′ RS,
b
si ha QR = Q′ R, QS = Q′ S e quindi QRS
essendo uguali i due triangoli QRS e Q′ RS. Sia T
l’intersezione della retta RS con t, una generica retta
r1
r2
r3
passante per P e giacente sul piano α. Dall’uguaglianza dei triangoli QRT, Q′ RT si ha QT = Q′ T e
β
quindi P T è l’asse di QQ′ nel piano QQ′ T , cioè t è
perpendicolare ad r. D’altra parte, se una retta passa
per P ma non si trova su α, è facile vedere che essa
non può essere perpendicolare ad r, e ciò conclude la
prova.
le rette t, u di intersezione di δ con α, β. Nella Figura 6.50 non abbiamo di proposito indicato il piano δ,
la cui disposizione è però del tutto chiara tramite le
rette t ed u. Se t, u si incontrano in Q, di nuovo tale
punto sta sia in α sia in β, che pertanto si intersecano. Ma se t, u sono parallele, allora α e β devono
essere paralleli. Se infatti si intersecassero nella retta
v, questa dovrebbe essere parallela tanto ad r che a t
(o, se si preferisce, tanto ad s che ad u) che però, per
costruzione, non sono parallele tra di loro.
Stabiliti i criteri di parallelismo, si può passare alla
perpendicolarità.
Questo teorema permette di parlare del piano α
perpendicolare alla retta r in un punto P di questa;
viceversa, dato un piano α e un suo punto P , è definita la retta perpendicolare ad α passante per P , detto
piede della perpendicolare.
Figura 6.52: Prisma indefinito e definito
I prismi sono le figure tridimensionali più semplici. Per essi si definiscono tre misure, che risultano
importanti nelle applicazioni:
194
• la superficie laterale: è la somma delle aree delle
facce laterali del prisma; se p è il perimetro della
base ed h è l’altezza del prisma, si ha: Sℓ = ph;
• la superficie totale: é la somma della superficie
laterale e dell’area delle due basi; se ciascuna di
queste vale S, si ha: St = Sℓ + 2S;
• il volume: è la misura dello spazio occupato dalla
figura e vale: V = Sh.
Mentre le misure di superficie si rifanno a concetti
già introdotti per la Geometria piana, il volume è un
concetto nuovo. Il volume di un solido è una grandezza, e pertanto ci si aspetta che il volume dell’unione
di due figure sia la somma dei singoli volumi, e cosı̀
via per tutte le altre proprietà delle grandezze. L’unità di misura è definita come il cubo che ha per lato
l’unità di misura delle lunghezze. Si noti che un cubo è un prisma retto a base quadrata, la cui altezza
è uguale a ciascuno dei lati di base. Occorrerebbero
qui dimostrazioni analoghe a quelle fatte a suo tempo
per la misura delle aree, ma ne risparmiamo il lettore
(e noi stessi!). Naturalmente, la relazione tra figure solide “avere lo stesso volume” è una relazione di
equivalenza, e si dice appunto equivalenza tra solidi.
Si danno diverse regole per determinare quando due
figure sono equivalenti; la più semplice, che discende
da quanto appena detto, è che due figure solide sono equivalenti se sono equiscomponibili. Tuttavia, la
regola più importante è costituita dal seguente principio, che Archimede già conosceva, ma che Cavalieri
teorizzò e usò in modo sistematico:
Principio 6.16 (di Cavalieri) Due figure solide
che, tagliate con piani paralleli a un piano fisso,
generano figure piane equivalenti, sono equivalenti.
Questo principio è stato antesignano del calcolo integrale; esso diviene intuitivamente accettabile se pensiamo a una pila di fogli di carta: comunque li spostiamo, lasciandoli paralleli a sé stessi, determinano lo
stesso volume, anche se la forma complessiva cambia
radicalmente.
Applicando il principio di Cavalieri a un prisma,
si dimostra immediatamente che esso è equivalente a
un prisma retto che abbia la stessa base e la stessa
altezza; da questo si passa ad un prisma retto con
la stessa altezza e con la base quadrata, equivalente
al poligono originale. A questo punto il volume è
proprio V = Sh, come si voleva. In particolare, un
cubo di lato (ed altezza) a ha volume V = a3 ; inoltre,
Sℓ = 4a2 e St = 6a2 .
Consideriamo ora un punto O ed n semirette che
partano da O, nell’ordine r1 , r2 , . . . , rn . Se gli n piani r1 r2 , r2 r3 , . . . , rn−1 rn , rn r1 sono tali che ognuno di
essi lascia da una stessa parte dello spazio le altre
CAPITOLO 6. GEOMETRIA EUCLIDEA
n−2 semirette, la parte di spazio comune a tutti questi semispazi si dice piramide indefinita (convessa) di
vertice O. Se la tagliamo con un piano α, la parte
di piramide indefinita compresa tra α ed O si dice
piramide. La distanza di O da α si dice l’altezza della
piramide. Ognuno dei triangoli di vertice O si dice
una faccia laterale, e il poligono determinato da α si
dice la base della piramide. In funzione di n si hanno piramidi triangolari, quadrangolari, pentagonali,
etc.. Se il poligono di base è un poligono regolare, la
piramide si dice regolare; se la base può essere circoscritta a una circonferenza di centro K e la retta OK
risulta perpendicolare ad α, la piramide si dice retta.
O
r1
r3
r2
α
Figura 6.53: Angoloide e piramide
Le misure relative alle piramidi sono:
• la superficie laterale: è la somma delle aree delle facce laterali; se la piramide è retta ed r è
il raggio della circonferenza√inscritta nel poligono di base, si ha: Sℓ = p r2 + h2 /2, se p è il
perimetro della base;
• la superficie totale: è la somma della superficie
laterale e dell’area della base: St = Sℓ + S;
• il volume: è dato dalla formula V = Sh/3.
Anche in questo caso, la misura delle superfici è un
esercizio, risolubile di volta in volta con le regole viste
per la geometria piana. Il volume, invece, presenta
qualche difficoltà, ma fin dall’antichità si sa che:
Teorema 6.55 Il volume di una piramide è un terzo
del volume di un prisma che abbia la stessa base e la
stessa altezza.
Prova: Consideriamo una piramide triangolare
(Figura 6.54), in quanto l’estensione ad una base
qualsiasi è banale. Data la piramide OABC, si costruiscano i segmenti BB ′ e CC ′ paralleli e della stessa lunghezza di OA. La figura solida ABCOB ′ C ′ è
6.8. GEOMETRIA DELLO SPAZIO
C′
OX
X
Q
C@QXXX
¡C
XXX B ′ ¡
C @Q
C
X
X¡
C @ QQ
C
C
@ Q
C
C
C
@ QQ
C
C
C
@
C
Q C
C
Q
@
C
C
Q
C
@
C
Q
C QC
@
CX
QC
C
XX X
¡C
A
XXX@ C ¡
X@
X
@C
X¡
B
Figura 6.54: Il volume della piramide
un prisma triangolare di volume Sh, se S è l’area del
triangolo ABC. Se uniamo B con C ′ , la figura solida
BOB ′ C ′ è una piramide di vertice B, base OB ′ C ′
uguale ad ABC e altezza h; essa è perciò equivalente ad OABC. D’altra parte, le piramidi OBB ′ C ′ e
OBCC ′ sono uguali avendo la stessa altezza e uguale
superficie di base. Il prisma, di conseguenza, risulta
diviso in tre piramidi equivalenti.
195
no poligoni regolari uguali, e sono uguali anche tutti
i diedri e tutti gli angoloidi che lo compongono. Già
Platone nel Timeo mostra che di tali poliedri ne esistono solo 5, e per questo i poliedri regolari sono detti
anche solidi platonici. Il ragionamento è semplice: se
gli angoloidi devono essere tutti uguali, basta prenderne in considerazione uno solo. Le sue facce sono
formate da almeno tre poligoni, che possono essere
triangoli equilateri, quadrati, pentagoni regolari, etc..
Se le facce sono triangoli equilateri, ogni loro angolo è
di 60◦ , e quindi l’angoloide può essere formato da 3, 4
o 5 facce. Infatti, 6 triangoli equilateri darebbero un
angolo giro e l’angoloide degenererebbe in un piano,
come si era visto con l’osservazione precedente. Se le
facce sono quadrati, l’angolo è di 90◦ e l’angoloide ne
può contenere solo 3, poiché già 4 arrivano a 360◦ .
Se le facce sono pentagoni, ogni angolo è 108◦ e di
nuovo l’angoloide ne può contenere solo 3. Con altri
poligoni regolari (a partire dagli esagoni che hanno
l’angolo di 120◦ ) tre facce superano i 360◦ , e quindi
è impossibile formare un angoloide.
Fin qui si è solo dimostrata la possibilità di esistenza di 5 poliedri regolari; per dimostrarne l’effettiva
realtà basta ora costruirli:
• per il triangolo e l’angoloide a tre facce, il poliedro regolare è il tetraedro, o piramide triangolaLa parte di spazio compresa nella zona convessa
re; il tetraedro ha in tutto 4 facce, 6 spigoli e 4
della piramide indefinita si dice propriamente un anvertici (o angoloidi);
goloide; la misura degli angoloidi è troppo complessa
perché la si possa prendere seriamente in considera• per il triangolo e l’angoloide a 4 facce, si
zione. Due facce consecutive dell’angoloide formano
ha l’ottaedro, o doppia piramide quadrata;
un diedro, e quindi un angoloide con k facce determil’ottaedro ha 8 facce, 12 spigoli e 6 vertici;
na k diedri. Anche questi possono non presentare una
struttura omogenea, dato che le loro sezioni normali
• per il triangolo e l’angoloide a 5 facce, si ha
corrispondono a piani che sono disposti irregolarmenl’icosaedro; esso ha 20 facce (e da questo deriva
te uno rispetto all’altro. Un’osservazione importante
il suo nome), 32 spigoli e 12 vertici;
riguarda invece gli angoli che ogni coppia di semirette, partenti dal vertice O, forma sul piano della faccia
• per il quadrato e l’angoloide a tre facce, si ha
corrispondente. Prendiamo un piano α passante per
l’esaedro o cubo; esso ha 6 facce, 12 spigoli e 8
O e che non interseca l’angoloide (se non in O stesso);
vertici;
consideriamo uno degli spigoli dell’angoloide e imma• per il pentagono e l’angoloide a tre facce, si ha
giniamo di tagliarlo lungo tale spigolo. Ruotiamo ora
il dodecaedro, una specie di pallone da calcio
tutte le facce dell’angoloide intorno ad O in modo
spigoloso; esso ha 12 facce, 30 spigoli e 20 vertici.
da portarle (consecutivamente) sul piano α; in corrispondenza dello spigolo tagliato, avremo un angolo
Se con f, s, v indichiamo il numero delle facce, degli
“vuoto”, che è la differenza fra un angolo giro e la
spigoli e dei vertici di un poliedro, vale sempre la
somma dei vari angoli dell’angoloide. In questo moformula di Cartesio-Eulero: f + v = s + 2.
do vediamo che la somma degli angoli di un angoloide
◦
è minore di 360 .
Nota 6.5
I poliedri regolari sono facilmente coQuesta osservazione ha notevole importanza quanstruibili a partire dal loro sviluppo piano, che qui diado si studiano i poliedri regolari. In generale, un pomo schematicamente per il tetraedro (Figura 6.55) e
il cubo (Figura 6.56.
liedro è una figura solida delimitata da un numero
finito di facce costituite da poligoni piani. Rientrano
Conservo ancora il “quaderno di bella” della terza mein questa definizione sia i prismi, sia le piramidi, ma
dia nel quale sono riportate le costruzioni di geomefin dall’antichità ci si è chiesti se esistono, e quanti
tria dello spazio che la Prof. Del Francia ci faceva
sono, i poliedri regolari, cioè i poliedri le cui facce sopreparare a latere dei compiti a casa. Con aghi, fili,
196
CAPITOLO 6. GEOMETRIA EUCLIDEA
A3
A
A2
D
B
Tali poliedri sono noti come poliedri archimedei, ma
qui noi terminiamo la nostra nota.
C
C
D
A1
B
Figura 6.55: Tetraedro e suo sviluppo
D
A
D
C
A
B
g
c
g
c
r
r
Figura 6.57: Cilindro e cono
C
B
Figura 6.56: Esaedro (cubo) e suo sviluppo
stecchini e cartoncino Bristol ci sono ancora costruzioni non del tutto banali. Il lettore, da parte sua, è
invitato a costruire almeno i cinque poliedri regolari a
partire dal loro sviluppo piano. Queste poliedri furono anche detti figure cosmiche per una presunta corrispondenza con gli elementi costitutivi dell’universo.
Può essere curioso leggere la seguente dimostrazione
“mistica” del fatto che i poliedri regolari devono essere cinque, non di più né di meno. Il brano si trova nel
libro del celebre matematico Luca Pacioli “De Divina
Proportione” (1496 – 98) e precede la dimostrazione
matematica vista; i disegni dei poliedri riportati dal
Pacioli sono di Leonardo da Vinci: “Onde li decti sono
chiamati regulari perché sono de lati e angoli e basi
equali, e l’uno dall’altro apunto se contiene como se
mostrerà e conrespondono a li 5 corpi semplici in natura, cioè terra, aqua, aire, fuoco e quinta essentia
cioè virtù celeste che tutti gli altri sustenta in suo essere. E sı̀ como questi corpi semplici sono bastanti
e sufficienti in natura, altramente serı̀a arguire Idio
superfluo overo diminuto al bisogno naturale, la qual
cosa è absurda, como afferma il filosofo che Idio e la
natura non opera invano cioè non manca al bisogno e
non excede quello.”
I solidi platonici sono i più regolari dei poliedri, ma
ve ne sono altri, ancora altamente simmetrici, ma
con le facce formate da poligoni regolari di vario tipo.
Dalle figure poliedriche è facile passare alle figure
rotonde. Il cilindro indefinito è il luogo dei punti che
hanno distanza minore o uguale a un certo valore r
(detto il raggio del cilindro) da una retta assegnata
c. Tagliando questa figura con due piani paralleli
(vedere Figura 6.57), si ottiene un cilindro, che si
dice retto se i due piani sono perpendicolari alla retta
c. La distanza h fra questi due piani è l’altezza del
cilindro. Come è noto, si ha:
Sℓ = 2πrh,
St = 2πr2 + 2πrh,
V = πr2 h.
Il cilindro può essere immaginato come generato da
una retta g (detta appunto generatrice) che ruota intorno alla retta c a distanza r da questa. Ciò permette di cogliere l’analogia con la figura successiva,
il cono. Data una retta c e una retta g incidente con
c in un punto O, il cono indefinito è la figura che si
ottiene ruotando g intorno a c in modo che il punto
O rimanga fisso. Se tagliamo il cono indefinito con
un piano α incidente con c (v. Figura 6.57), lo spazio
interno compreso tra O e il piano α si dice cono, che
è in particolare retto se α è perpendicolare a c. In
generale, la base di un cono cosı̀ definito è un’ellisse,
ma la base di un cono retto è un cerchio; si dice apotema la distanza a del vertice O da uno qualsiasi dei
punti della circonferenza di base, mentre l’altezza è la
distanza h di O dalla base stessa. Per il cono retto,
si ha chiaramente:
p
p
a = r 2 + h2
h = a2 − r2
Sℓ = πra,
St = πra + πr2 ,
V = πr2 h/3.
197
6.8. GEOMETRIA DELLO SPAZIO
La formula del volume è certo la più interessante, e
si dimostra approssimando il cono con una piramide
la cui base è un poligono iscritto o circoscritto alla
circonferenza di base del cono. Poiché, analogamente,
un cilindro può essere approssimato con prismi, la
formula deriva dal Teorema 6.55.
Il solido rotondo per eccellenza è la sfera; essa può
essere definita come il luogo dei punti dello spazio che
hanno distanza minore o uguale ad r (il raggio della
sfera) da un punto assegnato O, detto il centro. La
sfera, però, si può vedere anche come il solido ottenuto dalla rotazione di una semicirconferenza intorno
alla retta determinata dai suoi estremi.
Nota 6.6
E’ bene insistere sul fatto che molti
solidi rotondi possono essere ottenuti per rotazione,
poiché, come il lettore vedrà studiando Analisi
Matematica all’Università, esistono semplici metodi
del calcolo integrale per valutare superficie e volume
di solidi di rotazione. Anche storicamente, è opportuno ricordare, un antesignano del calcolo integrale
fu Keplero: nel 1615 scrisse il libro Stereometria
Doliorum, dove, studiando come calcolare superficie e
volume delle botti, in qualche modo e con vari errori,
anticipa considerazioni proprie del calcolo integrale.
Naturalmente, sia Keplero, sia Cavalieri, furono a
loro volta anticipati di circa 18 secoli da Archimede,
come ora vedremo.
Prova: Si faccia riferimento alla Figura 6.58 nella
quale cilindro, semisfera e cono sono stati tagliati con
un piano α parallelo alla base del cilindro e del cono.
Se riusciamo a dimostrare che la corona circolare di
raggio AB (relativa alla scodella) è equivalente al cerchio di raggio CD (relativo al cono), per il Principio
di Cavalieri avremo dimostrato il nostro asserto. Se
poniamo OC = CD = c e BC = s, per il Teorema
di Pitagora si ha: s2 = r2 − c2 , e quindi l’area della
corona circolare è:
πr2 − πs2 = πr2 − π(r2 − c2 ) = πc2 .
Ma questa è l’area del cerchio di raggio CD.
La conseguenza è pressoché immediata:
Teorema 6.57 Il volume V di una sfera di raggio r
è: V = 4πr3 /3.
Prova: Sempre con riferimento alla Figura 6.58, il
volume del cilindro è Vc = πr2 ·r = πr3 , e quello della
scodella, essendo uguale a quello del cono, è un terzo
di questo: Vs = πr3 /3. Il volume della semisfera si
ottiene per differenza: V /2 = Vc − Vs = 2πr3 /3, e
questo è il risultato desiderato.
Concludiamo con la formula per il calcolo della superficie della sfera; anche questa fu dimostrata per la
prima volta da Archimede con un ragionamento che
anticipa i metodi del calcolo differenziale e integrale:
Teorema 6.58 La superficie di una sfera di raggio r è quattro volte la superficie di un suo cerchio
massimo, cioè S = 4πr2 .
A
B
D
b
C
O
Figura 6.58: Volume della sfera
Il calcolo del volume di una sfera si basa sul seguente lemma; si dice che Archimede volle che sulla sua
tomba fosse incisa la Figura 6.58, sulla quale si basa
la sua dimostrazione. Per fissare la terminologia, se
abbiamo un cilindro retto di raggio r ed altezza ancora r, in esso possiamo inserire una semisfera di raggio
r; la figura solida che si ottiene scavando la semisfera
dal cono si dice scodella.
Prova: Suddividiamo la superficie della sfera in
tanti piccoli poligoni (arrotondati) di dimensione arbitraria Si , non necessariamente uguale per tutti, e
uniamo i punti di questi poligoni con il centro O della sfera. Otteniamo cosı̀ delle piramidi di base Si e
altezza r, cioè di volume Vi = Si r/3. Il volume V
della sfera è dato dalla somma di tutte queste piramidi, cioè dalla somma dei Vi . Mettendo in evidenza
r/3 in tale somma e osservando che la somma di tutti gli Si dà proprio S, si ha la relazione: V = Sr/3,
ovvero, per il teorema precedente: 4πr3 /3 = Sr/3, e
da questa si ricava subito S.
Il lettore è stato avvertito che le piramidi hanno la
base arrotondata, in quanto la superficie segue quella
della sfera; cosı̀ come sta, pertanto, il ragionamento
è solo approssimativo. Lo si può rendere esatto considerando poligoni che tagliano e poligoni che sono
tangenti alla sfera, mantenendo i lati delle varie basi.
Al diminuire di Si , queste basi sono sempre più vicine
Lemma 6.56 Il volume della scodella di raggio r è tra di loro. Lasciamo al lettore il godimento di comuguale al volume di un cono che ha r sia come altezza, pletare il ragionamento che, d’altra parte, abbiamo
già impostato altre volte.
sia come raggio della circonferenza di base.
198
CAPITOLO 6. GEOMETRIA EUCLIDEA
Capitolo 7
Le altre Geometrie
Il titolo di questo capitolo vuol fare riferimento
esplicito al fatto che nella Matematica moderna non
esiste soltanto la Geometria Euclidea, l’unica ad essere considerata nell’antichità e fino al 1600, ma vanno
considerate altre geometrie, che si sono sviluppate e
hanno assunto una propria identità e una propria rilevanza, contribuendo in vario modo all’ampliamento
delle nostre conoscenze e al miglioramento della nostra capacità ad affrontare e a risolvere i problemi.
Oggi possiamo dire che i primi passi verso le “altre”
geometrie furono fatti nel Rinascimento, quando pittori praticanti e speculatori teorici studiarono la prospettiva, dando inizio alla Geometria Proiettiva e alla
Geometria Descrittiva. Tuttavia, le proiezioni erano
note fin dai tempi antichi, almeno nel caso classico
delle coniche, per cui la prospettiva fu fatta rientrare
nelle Geometria Euclidea.
Fu nella prima metà del 1600 che Fermat, Cartesio
e Desargues posero le basi per lo sviluppo di geometrie alternative. I primi due fondarono la Geometria
Analitica; questa voleva essere un modo diverso di
vedere la Geometria Euclidea, ma i suoi metodi, algebrici anziché sintetici, di fatto cambiarono l’idea
stessa di geometria. Desargues, poi, con la nuova
idea dei punti all’infinito, praticamente introduceva
enti diversi da quelli delle Geometria di Euclide.
Tradizionalmente, la geometria aveva sempre usato
metodi sintetici, cioè basati sulla costruzione di figure, riconducendo addirittura a questo metodo la risoluzione dei problemi algebrici, come il calcolo delle
radici di un’equazione. Fermat e Cartesio rivoltarono
questo modo di procedere, riportando i problemi geometrici a problemi algebrici. Da allora si sono sempre avuti due modi di vedere la geometria, talvolta in
contrapposizione, talaltra in simbiosi. Cosı̀ la Geometria Proiettiva ha una versione sintetica, che studia
geometricamente le proiettività, e una versione analitica, dedicata alla caratterizzazione algebrica delle
coniche e delle quadriche (l’equivalente delle coniche
in tre dimensioni).
A cavallo del 1800, Monge sistematizzò la Geometria Descrittiva e pochi anni dopo si svilupparono le
Geometrie non Euclide, dovute a Lobačeskij e Bólyai.
La formalizzazione di tutte queste nuove geometria fu
all’inizio di tipo sintetico, ma le generalizzazioni di
Riemann erano di natura analitica. Le curve furono
di fatto sostituite da equazioni, e le proprietà delle
prime si studiarono attraverso le proprietà analitiche
delle seconde, dando cosı̀ origine alla Geometria Algebrica. Analogamente, la Topologia nacque alla metà
del 1800 come studio geometrico-sintetico delle proprietà dei corpi che si mantengono per trasformazioni
continue: un palloncino si può trasformare in un cubo o in un cilindro, se lo premiamo, ma non in una
ciambella, a meno che non lo rompiamo. Ma la continuità richiede uno studio locale, cioè di cosa succede
intorno a un punto. Se c’è del materiale intorno a
un punto, non possiamo toglierlo se non facendo uno
strappo, e questa non è più una trasformazione continua, anche nel senso intuitivo del termine. Ciò portò
ad una impostazione analitica della Topologia, che si
trasformò nello studio degli spazi di Hausdorf e degli
spazi metrici. Questi si basano sui concetti di intorno e di limite, che noi vedremo più avanti in modo
accurato nel caso importantissimo del calcolo differenziale e integrale. Infatti, gli insiemi R, R2 , R3 che
tratteremo sono casi particolari di spazi di Hausdorf
e di spazi metrici, e si dicono di solito spazi Euclidei.
Ovviamente, non potremo vedere tutte queste diverse geometrie. Ci dilungheremo un po’ di più sulla Geometria Analitica, daremo una rapida occhiata storica alle Geometrie non Euclidee e cercheremo di dare un’idea, vaga ma sperabilmente non peregrina, della Geometria Proiettiva, della Geometria
Descrittiva e della Topologia.
7.1
Coordinate Cartesiane
Ufficialmente, la Geometria Analitica è stata introdotta da Cartesio nel 1637 con la pubblicazione di “La
Geometrie”, una delle tre appendici al “Discours de
la méthode”. Oggi sappiamo che Cartesio era stato
anticipato da Fermat, che però non aveva pubblicato
i propri studi, come era solito fare. Da un punto di vista storico, questa invenzione è stata di fondamentale
199
200
CAPITOLO 7. LE ALTRE GEOMETRIE
importanza. Fino ad allora la regina della Matematica era sempre stata la Geometria, tanto che l’Algebra
era appena agli inizi con la sua notazione “sincopata”
e, di fatto, le dimostrazioni che oggi eseguiamo per via
algebrica erano regolarmente riportate alla Geometria. Cosı̀, la soluzione delle equazioni era effettuata
per via geometrica e Galileo, quando volle dire che lo
studio della natura deve essere affrontato con metodi
matematici, affermò che “la Natura è scritta in caratteri di triangoli, quadrati, cerchi, . . . ”, ignorando
di fatto i numeri. La stessa notazione arabica o posizionale, portata in Europa all’inizio del 1200, aveva
avuto rilevanza solo nel mondo commerciale e finanziario, mentre nell’ambito scientifico ed accademico
si era conservata la numerazione romana. Cartesio e
Fermat, con l’introduzione della Geometria Analitica,
dimostrarono che tutto ciò che si fa con la Geometria
si può fare anche con l’Algebra e con il calcolo, cosı̀
che queste discipline non hanno più un ruolo subordinato, ma possono vantare pari dignità della Geometria. E in effetti, pochi anni dopo, esplose, con
Newton e Leibniz, il nuovo grande filone del calcolo
differenziale, che difficilmente sarebbe potuto nascere e svilupparsi senza il cambiamento di mentalità
portato dalla Geometria Analitica di Cartesio.
A′
O
U
A
1 u.m.
Figura 7.1: Rappresentazione Cartesiana dei punti:
A è positivo, A′ è negativo
L’osservazione di base consiste nel considerare la
corrispondenza biunivoca che lega i punti di una retta
con i numeri reali. Può essere curioso e interessante
ricordare che né Cartesio né Fermat considerarono la
parte negativa della retta, secondo l’uso del tempo
che non riconosceva validità alle quantità negative
(v. Sezione 3.1). Se su una retta r fissiamo un punto
O, detto origine, e scegliamo, una volta per tutte,
un verso o orientamento sulla retta e una unità di
misura, cioè un segmento la cui lunghezza diciamo
unitaria per definizione, allora:
1. ad ogni punto A della retta facciamo corrispondere il numero che è la misura (secondo l’unità
scelta) del segmento OA, con la convenzione che
il numero è positivo se A si trova dopo O seguendo il verso stabilito, ed è invece negativo se
A si trova prima di O; tale misura è detta la
coordinata o ascissa di A;
2. ad ogni numero reale a facciamo corrispondere
un punto A sulla retta di modo che OA = |a|
ed A sia collocato prima o dopo l’origine O (in
accordo al verso prefissato) a seconda che a sia
negativo o positivo.
L’esistenza di una corrispondenza biunivoca tra
punti della retta e numeri reali era nota fin dall’antichità e, come s’è visto, i Greci (probabilmente Pitagora) erano stati costretti a introdurre i numeri irrazionali quando si erano accorti che esistono grandezze tra loro incommensurabili. Merito di Cartesio
fu quello di estendere la corrispondenza al piano e allo spazio e di far vedere come si potessero esprimere
i concetti della geometria in questo ambiente in cui
ogni punto ha una sua individuazione numerica.
Un’osservazione di primaria importanza è la seguente. Se abbiamo due punti A e B sulla retta ed a e
b sono, rispettivamente, i numeri reali corrispondenti
ai due punti, allora la distanza AB è data dal valore
assoluto della differenza fra a e b, cioè AB = |a − b|.
Questa formula vale sia che a e b siano entrambi positivi, entrambi negativi o siano di segno opposto. La
distanza tra A e B è la lunghezza del segmento AB; il
lettore osserverà anche che il punto medio del segmento AB ha come ordinata (a+b)/2, cioè la semisomma
delle ordinate di A e B. Occorre anche considerare il
fatto che la differenza b−a è positiva se B segue A nel
verso prefissato, mentre è negativa in caso contrario;
quindi b − a ci dà un’informazione in più rispetto alla
semplice distanza.
Un sistema di coordinate cartesiane nel piano è costituito da due rette incidenti in un punto O, detto
origine, sulle quali è stato fissato un verso di orientamento e una unità di misura, non necessariamente
la stessa per le due rette. Queste sono dette assi di
riferimento o semplicemente assi. Si consideri quella
delle due rette che si sovrapponga all’altra (coincidendo anche per l’orientamento) con una rotazione
in senso antiorario inferiore a 180◦ ; tale retta si dice
asse delle ascisse o asse delle x. L’altra si dice asse
delle ordinate o asse delle y. Normalmente, si considerano assi fra loro perpendicolari, con l’asse delle
x disegnato orizzontalmente e col verso da sinistra
verso destra. L’asse delle y, allora, è una retta verticale orientata dal basso verso l’alto. Questo si dice
propriamente un sistema di coordinate cartesiane ortogonali, ed è quello riportato nella Figura 7.2 e che
considereremo costantemente nel seguito.
Un punto A del piano è individuato dalle sue coordinate: si tracciano per A le parallele ai due assi; la
parallela all’asse y incontra l’asse x in un punto A′ ,
e la parallela all’asse x incontra l’asse y in un punto
A′′ . La coordinata xA di A′ rispetto all’unità di misura fissata sull’asse delle x si dice l’ascissa del punto
A; la coordinata yA di A′′ rispetto all’unità di misura
fissata sull’asse y si dice l’ordinata di A. La coppia di numeri reali (xA , yA ) identifica univocamente
201
7.1. COORDINATE CARTESIANE
100
II
I
B
80
B
′′
y
60
40
′′
A
C
A
20
x
O
III
′
A
B
′
-3
-2
-1
O 1
-20
IV
2
3
4
-40
Figura 7.3: Curve molto allungate
Figura 7.2: Riferimento Cartesiano
il punto A e si scrive A ≡ (xA , yA ); i due numeri si
chiamano le coordinate di A. I punti che hanno tutte
e due le coordinate positive si dicono appartenere al
I quadrante; il II quadrante è costituito dai punti con
ascissa negativa e ordinata positiva; il III quadrante
comprende i punti con entrambe le coordinate negative e, infine, i punti con ascissa positiva e ordinata
negativa appartengono al IV quadrante.
L’idea delle coordinate cartesiane ortogonali, con la
stessa unità di misura tanto sull’asse delle x quanto
su quello delle y, è arbitraria e può essere abbandonata non appena altre convenzioni possano rivelarsi
più convenienti. Prima fra tutte, può cadere la convenzione di usare un’unica unità di misura; spesso è
molto piú opportuno utilizzare una certa unità sull’asse x e un’altra, più grande o più piccola, sull’asse y. Anticipando cose che vedremo più avanti, ma
che sono del tutto ovvie, se dobbiamo rappresentare
una retta d’andamento molto ripido, o una parabola
molto stretta, conviene adoprare un’unità di misura sull’asse delle y molto più piccola dell’altra, cosı̀
che su un’area abbastanza ristretta si possano vedere porzioni non trascurabili delle curve; nella Figura
7.3 vediamo la retta y = 40x e la parabola y = 10x2
che sono ragionevolmente rappresentate, avendo scelto l’unità di misura sulle y venti volte minore di quella
sulle x. Naturalmente, la scelta deve essere del tipo
opposto se la curva è molto piatta. Queste variazioni
sulle unità di misura sono molto comuni e di solito non creano problemi di comprensione, anzi aiutano a capire meglio la natura della curva (basta fare
attenzione!).
Molto meno utilizzati sono i riferimenti non ortogonali. Nella Figura 7.4 abbiamo un caso del genere,
nel quale il punto P ha coordinate (−1, 3) e il punto
Q ha coordinate (3, 2). Come si vede, le coordinate
vengono prese tracciando, da un punto, le parallele
y
P
b
3
Q
b
2
1
O
-1
x
1
2
3
4
5
Figura 7.4: Assi non ortogonali
ai due assi e considerando poi il punto di intersezione
con l’altro asse. In questa figura abbiamo supposto,
di nuovo, che l’unità di misura sia la stessa per i due
assi, ma nulla osta a che le due unità siano diverse.
La misurazione delle coordinate sui due assi avviene, in tutti i casi considerati finora, in modo lineare;
questo significa che un punto P è a distanza 1, 2, 3,
. . . dall’origine O se la misura del segmento OP è 1,
2, 3, . . . volte quella dell’unità di misura. Nella pratica, si sogliono talvolta usare sistemi di coordinate
in scale diverse da quella lineare. Ad esempio, sull’asse delle y si può usare una scala quadratica, il che
significa che la misura valutata sull’asse y deve essere considerata come il quadrato dell’effettivo valore
della seconda coordinata. Nella Figura 7.5 abbiamo
rappresentato la parabola y = x2 in scala quadratica
per le y: come si vede, la curva si riduce a una coppia
di semirette che escono dall’origine.
In effetti, l’uso delle scale non lineari è proprio questo: se la curva non è una retta, scegliendo in modo
opportuno la scala dell’asse delle y la curva si trasforma in una retta, semplificandone la rappresentazione
e lo studio pratico. Cosı̀ una scala esponenziale riduce a una retta la funzione esponenziale e una scala
logaritmica riduce a una retta la funzione logaritmica
202
CAPITOLO 7. LE ALTRE GEOMETRIE
16
della somma degli altri due, o uguale, se i tre punti sono allineati. Questa proprietà si dice disuguaglianza
9
triangolare.
Queste tre proprietà sono caratteristiche della di4
stanza e possono essere prese come assiomi di una
teoria: si consideri un insieme M sul quale sia defini1
ta una funzione d : M × M → R per la quale valgano le tre proprietà; allora d può essere assunta come
-4 -3 -2 -1
2
3
4
O 1
“distanza tra due elementi di M (che, convenzionalmente, vengono detti “punti”), e la coppia (M, d) si
dice uno spazio metrico. I teoremi che si deducono in
Figura 7.5: Una parabola in scala quadratica
questa teoria valgono, in particolare, in R, R2 , R3 e in
generale in Rn . La teoria degli spazi metrici fa parte
(si veda la Sezione 8.5). Difficilmente si trovano rap- della Topologia, alla quale accenneremo brevemente
presentazioni di curve su scale entrambi non lineari, un po’ più avanti.
ma il loro utilizzo non è vietato, se questo può portare
a qualche semplificazione.
L’equazione della retta
Di fondamentale importanza è saper trovare la di- 7.2
stanza tra due punti. Sia A ≡ (xA , yA ) e B ≡
(xB , yB ) (si veda la Figura 7.2). Se si tracciano le Un punto, come s’è visto, è individuato da una coppia
parallele agli assi passanti per A e per B, si deter- di numeri reali. Una curva è un insieme di punti sul
mina AB considerando il triangolo rettangolo ACB. piano, di solito un insieme composto di infiniti eleLa distanza AC è semplicemente la distanza tra A′ e menti, come si può immaginare pensando a una retta
B ′ che, come sappiamo, è |xB − xA |; analogamente, o a una circonferenza. L’idea di Cartesio fu di defiCB = A′′ B ′′ = |yB − yA |. Quando si eleva al qua- nire una curva per mezzo di una equazione nelle vadrato un valore assoluto, esso può essere ignorato, e riabili x ed y: un punto appartiene alla curva quando
sostituendo a x ed y le sue coordinate si ottiene un’uquindi si ha:
guaglianza, mentre non appartiene alla curva in caso
2
contrario. Ad esempio, data l’equazione 3x − 2y = 0,
AB = (xB − xA )2 + (yB − yA )2
secondo questo criterio il punto (2, 3) appartiene alla
p
curva (qualunque essa possa essere), mentre il punto
AB = (xB − xA )2 + (yB − yA )2
(1, 1) non vi appartiene.
dove la radice quadrata è presa in senso aritmetico
per salvaguardare il fatto che la lunghezza di un segmento è sempre una quantità positiva. Si invita il
B
lettore a scrivere il semplicissimo algoritmo che, date
B ′′
le coordinate dei punti A e B, trova la loro distanza.
La distanza tra due punti A e B si può indicare con
C ′′
C
la notazione d(A, B) e si osserva che essa gode delle
tre seguenti proprietà:
B0
A′′
1. d(A, B) ≥ 0, e si ha d(A, B) = 0 se e solo se
C0
A
A = B;
2. d(A, B) = d(B, A);
O
A′
C′
B′
3. d(A, B) ≤ d(A, C) + d(C, B).
la prima proprietà discende dalla definizione stessa:
la radice quadrata è zero se e solo se il suo argomento è zero; questo è la somma di due quantità non
negative e pertanto è zero se e soltanto se entrambe
sono 0; ma questo succede se e solo se xA = xB e
yA = yB , cioè i due punti coincidono. La seconda
proprietà è veramente ovvia, mentre la terza si rifà a
una proprietà vista nella Geometria Euclidea. I tre
punti A, B, C determinano un triangolo, e la disuguaglianza dice semplicemente che un lato è minore
Figura 7.6: Tre punti allineati
Sicuramente, la curva più semplice è la retta. Secondo la Geometria, fissati due punti distinti A e B
esiste una e una sola retta che passa per tutti e due;
in altre parole, la retta è determinata dai due punti.
Siano allora A ≡ (xA , yA ) e B ≡ (xB , yB ) due punti
distinti e vediamo sotto quali condizioni un generico
punto C ≡ (x, y) appartiene alla retta AB, cioè è collineare con A e con B. Come si vede nella Figura 7.6,
203
7.2. L’EQUAZIONE DELLA RETTA
C è collineare con A e con B se e solo se i due triangoli AC0 C e AB0 B sono simili, in quanto l’angolo in
A deve essere lo stesso per i segmenti AC e AB. Si
ha allora la seguente proporzione tra i cateti dei due
triangoli:
AC0 : AB0 = CC0 : BB0
2. allora, se yA = yB
(a) allora (punti coincidenti) si avverte che i
due punti coincidono e pertanto la retta è
indeterminata;
(b) altrimenti, (retta verticale) si pone a :=
1, b := 0, c := −xA e si esce;
ovvero (senza valori assoluti!):
y − yA
x − xA
=
.
xB − xA
yB − yA
(7.1)
3. altrimenti, se yA 6= yB
(a) allora (retta orizzontale) si pone a :=
0, b := 1, c := −yB e si esce;
Questa è l’equazione della retta passante per i due
(b) altrimenti (caso generale) si pone a := yA −
punti assegnati e non coincidenti; si osservi che se
yB , b := xB − xA , c := xA yB − xB yA e si è
fosse A ≡ B, cioè xA = xB e yA = yB , la proporzione
finito.
non avrebbe senso. Tuttavia, il rapporto perde senso
anche quando xA = xB oppure yA = yB . Il primo
Un aspetto molto interessante, e curioso, della Geocaso corrisponde a una retta parallela all’asse y, e il
metria Analitica è che spesso, per non dire sempre,
secondo a una retta parallela all’asse x. In questi casi
le formule generali valgono anche nei casi particolal’equazione della retta è:
ri. Qui, ad esempio, se xA = xB e yA 6= yB , il
x = xA e y = yA ;
(7.2) calcolo del punto 3b. ci dà a = yA − yB , b = 0,
c = xB yA −xA yB = xA (yB −yA ); se dividiamo questi
queste equazioni sono soddisfatte da ogni valore di tre valori per yA − yB (il che non cambia l’equazione
y la prima, e da ogni valore di x la seconda, il che della retta, come si è osservato) troviamo a = 1, b = 0
conferma la nostra intuizione su come devono essere e c = −xA , come abbiamo posto nel caso particolare.
fatte queste rette.
Lo stesso succede per yA = yB e xA 6= xB , mentre se
Eseguendo qualche calcolo sull’equazione (7.1), si anche xA = xB si trova a = b = c = 0. Questo sugtrova facilmente:
gerisce un algoritmo, equivalente al precedente, ma
alquanto più semplice:
(yA − yB )x + (xB − xA )y − xB yA + xA yB = 0
Algoritmo 7.2
che ha la forma ax + by + c = 0. Questa si dice la for- Ingresso: le coordinate (xA , yA ), (xB , yB ) di due punti
ma canonica della retta ed è la forma generale che può A e B;
assumere tale equazione, come si vede considerando Uscita: i tre coefficienti a, b, c della retta.
anche le due formule (7.2). Essendo ax + by + c = 0
1. Si pone a := yA − yB , b := xB − xA , c := xA yB −
un’equazione, la si può moltiplicare o dividere per una
xB yA ;
quantità diversa da zero senza cambiare l’insieme dei
punti che ne sono soluzione. Questo fatto lo si sfrutta
2. se (a = 0)∧(b = 0)∧(c = 0) allora si avverte che
spesso per semplificare i valori di a, b, c o evidenziare
i due punti coincidono, altrimenti si esce con i
casi particolari, come quando abbiamo a = 1 o b = 1.
valori di a, b, c.
Per completare il ragionamento, se consideriamo una
qualsiasi equazione lineare nelle due incognite x ed y,
Supponiamo che nell’equazione di una retta ax +
essa sicuramente rappresenta una retta: facendo al- by + c = 0 sia b 6= 0, cioè supponiamo che la retta
l’inverso i ragionamenti di prima, si vede come, presi non sia parallela all’asse delle y. L’equazione si può
comunque tre punti che verificano l’equazione, essi ri- scrivere allora y = −ax/b − c/b e ponendo m = −a/b
sultano collineari. Infatti, i triangoli che si ottengono e q = −c/b si ha la forma canonica:
hanno lati in proporzione, quindi sono simili e sono
y = mx + q.
uguali gli angoli in A dei triangoli AC0 C e AB0 B.
Tutte queste considerazioni portano a scrivere il
seguente algoritmo per determinare l’equazione della Se arriviamo a questa stessa forma partendo
dall’equazione (7.1), troviamo:
retta che passa per due punti assegnati:
Algoritmo 7.1 (Retta per due punti)
Ingresso: le coordinate (xA , yA ), (xB , yB ) di due punti
A e B;
cioè:
Uscita: i tre coefficienti a, b, c della retta.
1. se xA = xB (probabilmente retta verticale)
y=
m=
xB yA − xA yB
yB − yA
x+
xB − xA
xB − xA
yB − yA
xB − xA
q=
xB yA − xA yB
.
xB − xA
204
CAPITOLO 7. LE ALTRE GEOMETRIE
Il significato di q è semplice: ponendo x = 0 si ha
A
y = q, cioè q è l’ordinata del punto di intersezione
della retta con l’asse y; per questo q si dice l’intercetta
della retta. In quanto ad m, come si vede dalla Figura 7.6, è il rapporto tra il cateto opposto e il cateto
r
adiacente all’angolo in A del triangolo ACB; come
si sa dalla trigonometria (e quindi qui stiamo un po’
C
anticipando cose che vedremo più avanti), questa è la
P
B
tangente dell’angolo che la retta forma con l’asse delle ascisse, ed m si dice la pendenza della retta: essa
x0 − δ x0 x0 + δ
O
misura l’inclinazione della retta rispetto all’asse delle
ascisse, crescendo man mano che cresce l’inclinazione.
Nel caso che abbiamo escluso, di una retta parallela
Figura 7.7: Rette perpendicolari
all’asse delle ordinate, si dice che la pendenza è infinita. L’intercetta è 0 se e solo se la retta passa per
l’origine. Si ha quindi il seguente risultato:
a′ x + b′ y + c′ = 0, cioè dalla soluzione del sistema:
½
Teorema 7.1 Una retta passa per l’origine se e solo
ax + by + c = 0
se ha un’equazione della forma ax + by = 0.
a′ x + b′ y + c′ = 0.
Abbiamo cosı̀ introdotto due forme canoniche per
la
la retta. La forma ax + by + c = 0 è l’espressione Come s’è visto nel capitolo dedicato all’Algebra,
′
′
soluzione
esiste
ed
è
unica
se
e
solo
se
ab
−
a
b
=
6
0,
più generale dell’equazione della retta e comprende
′
′
ab′ = a′ b, cioè vale la proanche le rette parallele ad uno degli assi cartesiani. cioè ab 6= a b. ′ Se invece
′
due possibilità: i)
L’altra forma, y = mx + q non permette di rappre- porzione: a : a = b : b , si hanno
′
lo
stesso
rapporto
vale
per
c,
c
,
e
allora
l’equazione è
sentare le rette parallele all’asse delle y, ma ha due
indeterminata
(ha
infinite
soluzioni),
o
ii)
il rapporto
vantaggi: esplicita il valore della y in funzione della
′
tra
c
e
c
è
diverso
e
allora
l’equazione
è
impossibile
x e mette bene in evidenza le caratteristiche “fisiche”
della retta, cioè la sua pendenza rispetto all’asse x (non ha alcuna soluzione). Geometricamente, questa
e l’intersezione con l’asse y. Per questo, nella prati- è la condizione di parallelismo, mentre il primo caca si tende ad usare di più la seconda forma, anche so riguarda la coincidenza delle due rette, che hanno
se meno generale, ragionando poi in modo specifico infiniti punti a comune.
La corrispondenza tra intersezioni di curve e soper le rette parallele all’asse y. Pertanto, è bene esluzione
di sistemi di equazioni è l’idea fondamentale
sere pronti a passare da una forma canonica all’altra
della
Geometria
Analitica e, come abbiamo fatto per
quando sia necessario o conveniente.
le
rette,
la
ritroveremo
molto spesso, sia nella teoria
I risultati precedenti permettono di affrontare il
che
nella
pratica.
Come
ora vedremo, faremo ricorso
problema del parallelismo tra rette. Date due retallo
stesso
concetto
nello
studio della perpendicola′
′
′
te ax + by + c = 0 e a x + b y + c = 0, esse sorità
tra
rette,
un
problema
un po’ più complesso del
no parallele se e solo se le loro pendenze coincidono,
parallelismo.
Cominciamo
col
considerare una retta r
′ ′
cioè se e solo se −a/b = −a /b , ovvero se vale la
qualsiasi
e
un
punto
P
su
di
essa,
e cerchiamo di tro′
′
proporzione a : a = b : b . Se si ha addirittura
vare
l’equazione
della
perpendicolare
ad r passante
′
′
′
a : a = b : b = c : c , allora esiste un coefficiente di
per
P
.
Nel
caso
che
r
sia
parallela
all’asse
x o all’as′
′
′
proporzionalità k per cui a = ka, b = kb, c = kc; dise
y,
la
soluzione
è
banale:
se
P
≡
(x
,
y
)
sta sulla
0
0
videndo tutto per k si trova che le due rette in effetti
retta
e
questa
è
parallela
all’asse
x,
la
sua
equazione
sono la stessa (coincidono) e non solo sono parallele.
Ad esempio, data la retta x + 2y − 3 = 0, la retta è y = y0 e la sua perpendicolare è x = x0 , dovendo
2x + 4y = 0 risulta ad essa parallela (passante per essere parallela all’asse y. Ovviamente le cose si inl’origine), mentre la retta 2x + 4y − 6 = 0 è proprio vertono, ma le rette restano le stesse, se si parte da
una retta parallela all’asse y. Consideriamo allora il
coincidente.
Un altro modo per affrontare il problema del pa- caso in cui r ha equazione y = mx + q, con m 6= 0; si
rallelismo è riferirsi alla definizione di rette parallele ha allora:
come di rette che non hanno punti in comune. Poiché Teorema 7.2 La retta perpendicolare alla retta r di
un punto (x0 , y0 ) appartiene alla retta ax+by +c = 0 equazione y = mx + q (m 6= 0) passante per il punto
se e solo se è una soluzione di questa equazione, cioè P ≡ (x , y ) di r ha equazione: y−y = −(x−x )/m.
0 0
0
0
se ax0 + by0 + c = 0 è una proposizione vera, il punto
Prova: Con riferimento alla Figura 7.7, sulla retta
di intersezione di due rette è costituito dalla soluzione comune alle due equazioni ax + by + c = 0 e r consideriamo due punti B, C di ascissa x0 − δ e
205
7.2. L’EQUAZIONE DELLA RETTA
x0 + δ; si ha pertanto: B ≡ (x0 − δ, mx0 − mδ +
q) = (x0 − δ, y0 − mδ) e C ≡ (x0 + δ, mx0 + mδ +
q) = (x0 + δ, y0 + mδ); per il teorema di Pitagora essi
hanno la stessa distanza da P . Come sappiamo, la
perpendicolare ad r in P è l’asse del segmento BC
e quindi un generico punto A ≡ (x, y) sta su tale
perpendicolare se e solo se le sue distanze da B e da
C sono uguali. Abbiamo infatti:
2
AB = (x − x0 + δ)2 + (y − y0 + mδ)2 = (x − x0 )2 +
+2δ(x − x0 ) + δ 2 + (y − y0 )2 + 2mδ(y − y0 ) + m2 δ 2
2
AC = (x − x0 − δ)2 + (y − y0 − mδ)2 = (x − x0 )2 −
Teoricamente, a questo punto, potremmo trovare
la formula della distanza di un punto P qualsiasi da
una retta di cui sia nota l’equazione ax + by + c = 0.
Infatti, il teorema precedente dà modo di trovare l’equazione della perpendicolare da P alla retta e quindi, facendo il sistema delle due equazioni, il punto di
intersezione H, che è la proiezione di P sulla retta. La
lunghezza del segmento P H è poi la distanza cercata. Un metodo un po’ più indiretto, ma che richiede
meno conti, può essere il seguente:
Teorema 7.5 Sia r la retta di equazione ax+by+c =
0 e sia P ≡ (x0 , y0 ) un punto qualsiasi; allora la
distanza di P da r è dato dalla formula:
−2δ(x − x0 ) + δ 2 + (y − y0 )2 − 2mδ(y − y0 ) + m2 δ 2 .
d=
Uguagliando e semplificando si ottiene 4mδ(y −y0 ) =
−4δ(x − x0 ) e quindi:
y=−
x0 + my0
1
x+
.
m
m
Si osservi che, come deve essere, questa espressione
non dipende da δ, cioè dai punti B e C considerati.
|ax0 + bx0 + c|
√
.
a2 + b2
y
r
P
B
Al variare del punto P sulla retta r cambia l’intercetta della perpendicolare (poiché dipende da x0 ), ma
non cambia il coefficiente angolare, che rimane fisso,
uguale a −1/m; si ha quindi questo importantissimo
corollario:
H
A
x
O
Corollario 7.3 Se una retta r ha equazione y =
mx + q, (m 6= 0), ogni retta perpendicolare ad r ha
Figura 7.8: Distanza di un punto da una retta
1
equazione y = − m
x + q ′ . Più in generale, se la retta
r ha equazione ax+by+c = 0, ogni sua perpendicolare
Prova: Se la retta r è perpendicolare ad uno degli
ha equazione bx − ay + c′ = 0.
assi, il risultato è banale. Altrimenti abbiamo a 6= 0
Prova: Per le rette r che non siano perpendicolari e b 6= 0. Il punto A, proiezione verticale del punto P
ad uno degli assi, sappiamo che m = −a/b e quindi sulla retta r, ha coordinate (x0 , −(ax0 +c)/b) e quindi
−1/m = b/a. Altrimenti abbiamo a = 0 oppure b = 0 il segmento P A ha lunghezza |y0 − (ax0 + c)/b| =
(ma non entrambi) e questo si riflette sui coefficienti |(ax0 + by0 + c)/b|. Analogamente, si trova P B =
delle rette perpendicolari secondo la discussione fatta |(ax0 + by0 + c)/a|. Ora si osservi che P A · P B =
P H · AB, doppia area del triangolo rettangolo ABP .
prima del teorema precedente.
Applicando il teorema di Pitagora si ha:
Questa caratterizzazione delle rette perpendicolari
q
permette di risolvere il problema di scrivere l’equazio- AB = P A2 + P B 2 = pa2 + b2 |(ax +by +c)|/|ab|
0
0
ne della retta perpendicolare ad r che passa per un
punto assegnato, sia esso sulla retta o fuori di essa:
e quindi P H = P A · P B/AB, cioè:
Teorema 7.4 Sia ax + by + c = 0 l’equazione di una
(ax0 + bx0 + c)2
|ab|
√
PH =
retta r e sia P ≡ (x0 , y0 ) un punto qualsiasi; l’equa|ab|
a2 + b2 |(ax0 + by0 + c)|
zione della retta per P perpendicolare ad r è allora
a(y − y0 ) = b(x − x0 ).
e questo ci dà immediatamente il risultato cercato.
Prova: Una generica retta perpendicolare ad r ha
equazione bx − ay + c′ = 0; affinché passi per P dobbiamo avere bx0 − ay0 + c′ = 0, cioè c′ = ay0 − bx0 .
Sostituendo questo valore nell’equazione della retta
si ha la formula desiderata.
Dati tre punti, essi determinano univocamente un
triangolo; il perimetro si trova semplicemente calcolando le reciproche distanze dei tre punti. Per l’area,
la situazione è abbastanza più complicata, ma esiste
una formula molto semplice:
206
CAPITOLO 7. LE ALTRE GEOMETRIE
Teorema 7.6 Siano A ≡ (xA , yA ), B ≡ (xB , yB ),
C ≡ (xC , yC ) tre punti non allineati del piano; l’area
del triangolo ABC è data da:
A=
Corollario 7.7 Tre punti A, B, C sono allineati se e
solo se il determinante (7.3) vale 0.
1
|xA yB +yA xC +xB yC −xA yC −yA xB −yB xC |.
2
Prova: In modo arbitrario possiamo scegliere AB
come base del triangolo; la retta per A e per B è,
come sappiamo:
7.3
La parabola
Come abbiamo osservato, il concetto fondamentale
della Geometria Analitica è trovare la corrispondenza tra curve ed equazioni, il che giustifica lo studio
della Geometria (le curve) per mezzo dell’Algebra (le
e quindi l’altezza del triangolo è data dalla distanza equazioni). Abbiamo discusso come le equazioni di
di C da questa retta, cioè:
primo grado in x ed y identifichino le rette e vicever¯
¯
sa,
per cui ha interesse studiare cosa succede quando
¯ xC −xA
C −yA ¯
¯ xB −xA − yyB
si abbandoni l’ipotesi di linearità in x e/o in y. Stra−yA ¯
=
h= q
namente, le curve più semplici dopo le rette risultano
1
1
(xB −xA )2 + (yB −yA )2
essere le parabole, che abbiamo introdotto fra i luoghi geometrici. Dimostreremo che le parabole con la
¯x − x
¯
(xB − xA )(yB − yA )
yC − yA ¯
¯ C
A
. direttrice parallela all’asse x sono tutte e sole le curve
=¯
−
¯p
xB − xA yB − yA
(xB − xA )2 + (yB − yA )2 definite da un’equazione del tipo y = ax2 + bx + c,
Il denominatore è chiaramente la base del triangolo, dove a, b, c sono tre numeri reali qualsiasi (a 6= 0, altrimenti si ritorna al caso della retta). Naturalmente,
cioè la lunghezza di AB. Pertanto:
possiamo scambiare la x con la y e concludere che
1
le
parabole con la direttrice parallela all’asse y sono
A = |(xC − xA )(yB − yA ) − (yC − yA )(xB − xA )|
2
tutte e sole le curve di equazione x = ay 2 + by + c
(a 6= 0). Si può anche dimostrare (ma qui non lo fareche sviluppato dà la formula cercata.
mo) che una parabola di direttrice una retta qualsiasi
soddisfa un’equazione completa di secondo grado in
Nota 7.1
Chi ci ha seguito nella Nota 5.7 relativa
x e in y: ax2 + bxy + cy 2 + dx + ey + f = 0. La
ai determinanti delle matrici 3 × 3, osserverà che la
parabole non è però l’unica curva a soddisfare un’eformula dell’area si può ottenere prendendo il valore
quazione del genere; un importante risultato afferma
assoluto del determinante:
che tutte le coniche sono definite da una tale equa¯
¯
¯ xA yA 1 ¯
zione: parabola, ellisse, iperbole e i casi particolari
¯
¯
1¯
xB yB 1 ¯¯ .
(7.3) circonferenza e coppia di rette. Ciò che distingue i
¯
2¯
xC yC 1 ¯
vari tipi di conica è una specifica condizione sui coefIl valore assoluto si giustifica ricordando che l’area de- ficienti dell’equazione. Ma questo verrà visto nei corsi
ve essere un numero positivo o, al più, nullo, per le universitari.
figure che degenerano in un segmento. Tuttavia, ci
Secondo la definizione, una parabola è il luogo dei
possiamo chiedere se il puro e semplice determinante punti equidistanti da una retta (la direttrice) e da
ha un significato preciso. Ebbene, è proprio cosı̀: se i un punto (il fuoco); dimostriamo allora il seguente
tre punti non sono allineati e li consideriamo in senso risultato:
x − xA
y − yA
=
xB − xA
yB − yA
orario, cioè partendo da A incontriamo prima B e poi
C quando si ruoti come l’orologio (in senso orario),
allora il valore del determinante è negativo. Se, viceversa, si passa da A a B e poi a C nel verso contrario
alle lancette dell’orologio (in senso antiorario), il determinante è positivo. Si sviluppi un esempio ponendo
A ≡ (0, 0), B ≡ (4, 0) e C ≡ (2, 3): il determinante
vale 12, proprio il doppio dell’area del triangolo. Se
si scambia B con C, il determinante risulta negativo. Questo fatto curioso è legato al concetto stesso
di determinante, e quindi non lo possiamo affrontare
qui. Un’ultima osservazione, del tutto ovvia, ci dice che l’area del triangolo è zero se e solo se i tre
punti A, B, C sono allineati; pertanto vale il seguente
criterio di allineamento:
Teorema 7.8 Sia y = d una retta parallela all’asse
x che assumiamo come direttrice, e sia F ≡ (x0 , y0 )
un punto, non appartenente alla direttrice, che assumiamo come fuoco. La parabola che essi determinano
ha equazione:
y=
1
x0
x2 + y02 + d2
x2 −
x+ 0
2(y0 − d)
(y0 − d)
2(y0 − d)
Prova: Sia (x, y) un punto generico della parabola;
la sua distanza
p dalla direttrice è y−d e la distanza dal
fuoco vale (x − x0 )2 + (y − y0 )2 . Uguagliando ed
elevando al quadrato si ha: y 2 −2yd+d2 = x2 −2x0 x+
207
7.3. LA PARABOLA
x20 + y 2 − 2y0 y + y02 . Semplificando ed esplicitando la Teorema 7.10 Sia y = ax2 + bx + c (a 6= 0)
una parabola; allora il vertice ha coordinate V ≡
y si ottiene la formula desiderata.
(−b/2a, (4ac − b2 )/4a) e l’asse ha equazione x =
Questo teorema dimostra che ogni parabola del ti−b/2a.
po detto ha un’equazione y = ax2 + bx + c, con a 6= 0
perché y0 6= d dal momento che il fuoco non sta sulla Prova: Poiché l’asse passa per il fuoco ed è perpendirettrice. Vediamo ora il viceversa:
dicolare all’asse delle x, per il precedente teorema la
sue equazione è x = −b/2a. Lo stesso vale per l’a2
Teorema 7.9 Sia y = ax + bx + c, con a 6= 0.
scissa del vertice, la cui ordinata è data (come punto
Tale equazione rappresenta una parabola di fuoco e
di mezzo di F D) da:
direttrice:
µ
¶
µ
¶
1 4ac − b2 + 1 4ac − b2 − 1
4ac − b2
−b 4ac − b2 − 1
4ac − b2 − 1
+
=
.
F =
,
y=
.
2
2a
2a
4a
2a
4a
4a
Prova: Vediamo algebricamente che i tre parametri a, b, c determinano univocamente le coordinate del
fuoco e l’equazione della direttrice. Uguagliando tali
parametri ai valori ottenuti nel teorema precedente si
ha il sistema:

 a = 1/(2(y0 − d))
b = −x0 /(y0 − d)

c = (x20 + y02 − d2 )/(2(y0 − d))
nelle tre incognite x0 , y0 , d. Pertanto, il teorema risulta vero se e solo se questo sistema ammette un’unica
soluzione. Dalla prima equazione si ha: y0 −d = 1/2a
e quindi dalla seconda si ricava: −x0 = b(y0 − d),
cioè: x0 = −b/2a. Nella terza equazione scriviamo
y02 − d2 = (y0 − d)(y0 + d) e sostituiamo i valori noti.
Con la prima equazione, si ha il sistema:
½
y0 − d = 1/2a
y0 + d = 2c − b2 /2a
che si può risolvere per somma e sottrazione. La
soluzione dà i valori desiderati.
La più semplice delle parabole è y = x2 e il lettore è invitato a disegnarla, insieme al fuoco e alla direttrice. Possono essere importanti i seguenti
concetti:
Definizione 7.1 Si dice asse di una parabola la retta
passante per il fuoco e perpendicolare alla direttrice.
Si dice vertice della parabola l’intersezione dell’asse
con la parabola stessa.
L’asse è, in effetti, un ase di simmetria, cioè se P è un
punto della parabola, il simmetrico Q di P rispetto
all’asse è anch’esso un punto della parabola. Infatti,
Q ha la stessa ordinata di P e quindi la stessa distanza dalla direttrice; inoltre, per definizione di punto
simmetrico, l’asse della parabola risulta essere anche
l’asse del segmento P Q, e quindi F ha la stessa distanza da P e da Q. Il vertice V è il punto estremo
della parabola, nel senso che esso è il punto della parabola più vicino alla direttrice e si trova a metà del
segmento F D, se D è il punto di intersezione dell’asse
con la direttrice. Si ha allora:
A seconda che il fuoco abbia ordinata maggiore o
minore della direttrice, la parabola risulta avere la
concavità rivolta verso l’alto o verso il basso; questo
purché la curva non può tagliare la direttrice, taglio
in cui avrebbe distanza zero da questa e distanza positiva dal fuoco. Si ha allora un modo semplice per
determinare come è disposta la concavità:
Teorema 7.11 La concavità della parabola y =
ax2 + bx + c (a 6= 0) è rivolta verso l’alto se e solo se
è a > 0.
Prova: Secondo il Teorema 7.9 abbiamo: a =
1/2(y0 − d) e quindi a ha lo stesso segno di y0 − d; ma
questo è positivo se e solo se y0 > d, cioè se il fuoco è
posto al di sopra della direttrice e quindi la concavità
è rivolta verso l’alto.
Capire da che parte è rivolta la concavità della parabola può aiutare a risolvere vari problemi. Si consideri, ad esempio, il fatto di voler determinare se
il punto (x0 , y0 ) è interno o esterno alla parabola
y = ax2 + bx + c (a 6= 0), dove per “interno” intendiamo contenuto nella concavità della parabola. Se
la concavità è rivolta verso l’alto e ȳ = ax20 + bx0 + c
è il valore che la parabola assume in x0 , chiaramente il punto è interno se e solo se y0 > ȳ, cioè
y0 > ax20 + bx0 + c. Questo è importante quando
si vogliano condurre le tangenti alla parabola da un
punto P ≡ (x0 , y0 ) assegnato; la cosa è possibile se e
solo se il punto è esterno alla parabola o si trova su di
essa. D’altra parte, trovare l’equazione delle tangenti
alla parabola passanti per P non è difficile:
Teorema 7.12 Sia y = ax2 + bx + c (a 6= 0) una
parabola e sia P ≡ (x0 , y0 ) un punto ad essa non
interno; allora i coefficienti angolari m delle tangenti alla parabola passanti per P sono le soluzioni
dell’equazione:
m2 − 2m(2ax0 + b) + b2 + 4ay0 − 4ac = 0.
Prova: Una retta generica di coefficiente angolare
m passante per P ha equazione y − y0 = m(x − x0 )
208
e quindi si può far sistema tra questa equazione e
quella della parabola: le soluzioni del sistema saranno
i punti di intersezione della retta con la parabola. Le
tangenti sono caratterizzate dal fatto che i due punti
di intersezione in effetti coincidono. Eliminando la y,
dal sistema si ottiene l’equazione di secondo grado in
x: mx − mx0 + y0 = ax2 + bx + c, cioè: ax2 − (m −
b)x + mx0 − y0 + c = 0, che dà le ascisse dei punti di
intersezione. Affinché questi coincidano è necessario
e sufficiente che il discriminante dell’equazione sia 0,
cioè sia: (m − b)2 − 4a(mx0 − y0 + c) = 0. Eseguiti i
pochi calcoli necessari, si trova che questa è proprio
l’equazione desiderata.
Il fatto che siamo partiti da un punto esterno alla parabola ci assicura che le soluzioni dell’equazione
esistono senz’altro. Affrontiamo allora il problema da
un altro punto di vista e proviamo ad immaginare che
questo possa non essere il caso, cioè immaginiamo di
non conoscere la posizione di P rispetto alla parabola.
Il ragionamento per trovare le tangenti rimane invariato, solo che alla fine non sappiamo se l’equazione
del teorema precedente ha soluzioni o meno. Possiamo allora osservare che tale equazione deve avere
due soluzioni se il punto P è esterno, una sola soluzione se P si trova sulla parabola (si può tracciare
solo la tangente in quel punto), e nessuna soluzione
se P è interno. Ma tutto ciò è dato dal discriminante
dell’equazione, che vale:
(b + 2ax0 )2 − b2 − 4ay0 + 4ac = 4a(ax20 + bx0 + c − y0 ),
e si ritrovano esattamente le condizioni già viste. Infatti, perché non vi siano soluzioni (punto interno) a
e ax20 + bx0 + c − y0 devono essere discordi, e quindi
se a > 0 deve essere ax20 + bx0 + c < y0 , e se a < 0
deve essere ax20 + bx0 + c > y0 .
L’ultimo problema che vogliamo risolvere è la determinazione della parabola che passi per certi punti
assegnati. Poiché ax2 + bx + c è un polinomio di
secondo grado, algebricamente bastano tre valori distinti della x per determinarlo completamente; d’altra parte, geometricamente, la y non può assumere
più di due valori uguali, e anche questo si deve riflettere sulle condizioni di esistenza della parabola. In
effetti si ha:
CAPITOLO 7. LE ALTRE GEOMETRIE
sostituendo nell’equazione della parabola i valori dei
tre punti si ottiene il sistema:

 yA = ax2A + bxA + c
yB = ax2B + bxB + c

yC = ax2C + bxC + c
nelle tre incognite a, b, c. Affinché il sistema abbia soluzione, la matrice del sistema deve avere il
determinante diverso da 0; ma:
¯
¯ 2
¯
¯ x
¯ 2A xA 1 ¯
¯ x
xB 1 ¯¯ =
¯ B
¯ x2 xC 1 ¯
C
= x2A xB + xA x2C + x2B xC − x2A xC − xA x2B −
−xB x2C + (xA xB xC − xA xB xC ) =
= (xA − xC )xA xB − (xA − xC )xA xC − (xA − xC )x2B +
+(xA − xC )xB xC =
= (xA xB − xA xC − x2B + xB xC )(xA − xC ) =
= (xB − xA )(xC − xB )(xA − xC ).
Questa espressione vale 0 se e solo se xA = xB , oppure se xB = xC , oppure xC = xA , ma questo è
escluso dall’ipotesi che le ascisse siano due a due distinte. D’altra parte, se fosse yA = yB = yC , sostituendo questi valori nella colonna delle x o delle x2
otterremmo 0, perché tale colonna sarebbe multipla
dell’ultima, e quindi avremmo a = 0 e b = 0, contro
l’ipotesi che debba essere a 6= 0.
7.4
Circonferenza,
iperbole
ellisse
e
Come dimostra il caso della parabola, la definizione di una curva come luogo geometrico aiuta molto nella ricerca dell’equazione che definisce la stessa
curva nella Geometria Analitica. La cosa è particolarmente vera nel caso della circonferenza che, come ricordiamo, è il luogo dei punti equidistanti dal
centro. Sia allora O ≡ (x0 , y0 ) il centro di una circonferenza e sia r il suo raggio; un punto generico
P
p ≡ (x, y) della circonferenza deve esser tale che:
Teorema 7.13 Siano A ≡ (xA , yA ), B ≡ (xB , yB ),
(x − x0 )2 + (y − y0 )2 = r e quindi, elevando al
C ≡ (xC , yC ) tre punti del piano tali che xA , xB , xC quadrato, x2 − 2x0 x + x20 + y 2 − 2y0 y + y02 = r2 .
siano a due a due distinti e fra yA , yB , yC vi siano Ordinando i termini di questo polinomio di secondo
al più due valori uguali; allora esiste una e una sola grado in x e y si ha l’equazione: x2 + y 2 − 2x0 x −
parabola y = ax2 +bx+c (a 6= 0) passante per A, B, C. 2y0 y + x20 + y02 − r2 = 0. Si ha allora il seguente:
Prova: Intanto, assegnata la parabola le condizioni
su A, B, C sono verificate perché ad ogni valore di x
corrisponde un unico valore di y e ad ogni valore di
y corrispondono al più due valori di x. Viceversa,
Teorema 7.14 Un’equazione di 2◦ grado in x e y
rappresenta l’equazione di una circonferenza se e solo
se ha la forma x2 + y 2 + ax + by + c = 0, con c >
(a2 + b2 )/4.
209
7.4. CIRCONFERENZA, ELLISSE E IPERBOLE
Prova: Se partiamo da una circonferenza, otteniamo
un’equazione del tipo desiderato ponendo a = 2x0 ,
b = 2y0 , c = x20 + y02 − r2 , ove (x0 , y0 ) sono le
coordinate del centro ed r è il raggio; questo dà
c = (a2 + b2 )/4 − r2 e quindi la condizione su c è senz’altro verificata. Viceversa, partiamo da un’equazione del tipo descritto nell’enunciato del teorema; definiamo x0 = a/2, y0 = b/2 e consideriamo la quantità
r2 = c−(a2 +b2 )/4; per ipotesi, questa quantità è positiva e quindi la possiamo assumere come quadrato
del raggio. Ma ora, se consideriamo l’equazione della
circonferenza di raggio O ≡ (x0 , y0 ) e raggio r come
appena trovati, per la prima parte del teorema arriviamo proprio all’equazione x2 + y 2 + ax + by + c = 0,
e quindi l’asserto è provato.
Come osservato, moltiplicando un’equazione del tipo della circonferenza per una quantità s 6= 0, l’equazione non cambia e non cambia perciò la curva. Quindi, possiamo dire che un’equazione di secondo grado
in x e y rappresenta una circonferenza se e solo se: i) i
coefficienti di x2 e y 2 sono uguali; ii) manca il termine
in xy; iii) si ha c > (a2 + b2 )/4. Se queste condizioni
sono verificate, dividendo tutto per il coefficiente di
x2 e y 2 ci si riporta alla forma del teorema precedente e si è quindi in grado di determinare le coordinate
del centro e la misura del raggio. Si noti che è particolarmente semplice l’equazione di una circonferenza
di centro l’origine e raggio r: x2 + y 2 = r2 ; invece,
una circonferenza che passi per l’origine ha equazione
x2 + y 2 + ax + by = 0, cioè ha c = 0.
Come sappiamo dal Teorema 6.36, dati tre punti
non allineati A, B, C, esiste una e una sola circonferenza che passi per tutti e tre. Lo stesso teorema
fornisce un metodo per trovare centro e raggio della circonferenza, metodo che potremmo seguire, dato
che nella sezione precedente abbiamo imparato a trovare le equazioni degli assi dei segment AB e BC, a
calcolare la loro intersezione O e infine a trovare la distanza di O da A (o da B o da C). Tuttavia, possiamo
enormemente semplificare tutta questa procedura applicando direttamente un po’ d’Algebra: imponiamo
che la circonferenza generica x2 + y 2 + ax + by + c = 0
passi per A ≡ (xA , yA ), B ≡ (xB , yB ) e C ≡ (xC , yC ).
Si ottiene il sistema di tre equazioni:
 2
2
+ axA + byA + c = 0
 xA + yA
2
2
xB + yB
+ axB + byB + c = 0
 2
2
+ axC + byC + c = 0
xC + yC
nelle tre incognite a, b, c. Risolvendo questo sistema, si trovano i parametri a, b, c e quindi l’equazione
della circonferenza cercata, dalla quale si hanno le
coordinate del centro e la lunghezza del raggio.
Nota 7.2
Consideriamo ora il precedente sistema
dal punto di vista dei determinanti, come abbiamo
imparato nella Nota 5.7.
del sistema è:
¯
¯ xA
¯
¯ xB
¯
¯ xC
Il determinante della matrice
¯
yA 1 ¯¯
yB 1 ¯¯ ,
yC 1 ¯
una nostra vecchia conoscenza, incontrata nella Nota
7.3. Il sistema ha una e una sola soluzione se e solo se
questo determinante è diverso da zero, ma nella nota
abbiamo visto che questo determinante è diverso da
zero se e solo se i tre non sono allineati. Poiché è
proprio questa l’ipotesi che abbiamo fatto, il sistema
ha sempre una soluzione e tale soluzione determina la
circonferenza cercata. Il lettore è invitato a trovare
la circonferenza che passa per i punti A ≡ (0, 0),
B ≡ (10, 0) e C ≡ (8, 4), dopo aver cercato di stabilire
ad occhio i valori di a, b, c. Le terne Pitagoriche, viste
nel Teorema 6.28 possono tornare utili a tale scopo.
Determinare l’equazione di un’ellisse comunque disposta sul piano cartesiano non è del tutto banale;
ci accontenteremo pertanto di trovare l’equazione di
un’ellisse disposta come in figura, cioè col centro nell’origine degli assi e simmetrica sia rispetto all’asse
delle x sia a quello delle y. Se l’ellisse è allungata
come nella Figura 6.33, i due fuochi si troveranno
sull’asse delle x. Siano (a, 0) e (−a, 0) le coordinate
dei punti estremi dell’asse dell’ellisse disposto sull’asse x, e siano (0, b) e (0, −b) gli estremi dell’altro asse
(nella figura è a > b, ma potremmo avere a < b senza problemi, solo che la posizione dei fuochi cambia).
Con queste condizioni la posizione dei fuochi è determinata. Infatti, per il punto (a, 0) la somma delle
distanze dai fuochi F ′ = (f, 0) ed F ′′ = (−f, 0) è
a − f + a + f = 2a, e quindi 2a è la costante dell’ellisse. D’altra parte, per il
ppunto (0, b) la somma delle
distanze dai fuochi è: 2 b2 + f 2 , e questa quantità
deve essere uguale a 2a. Dividendo per 2 ed elevando
al quadrato si ottiene b2 + f 2 = a2 , e questo
√ ci dà il
valore delle ascisse dei due fuochi: f = ± a2 − b2 .
Con queste premesse, consideriamo un generico
punto (x, y) dell’ellisse e calcoliamo la somme delle
distanze dai fuochi, che deve essere uguale a 2a:
p
p
(x − f )2 + y 2 + (x + f )2 + y 2 = 2a
p
p
x2 + y 2 + f 2 − 2xf + x2 + y 2 + f 2 + 2xf = 2a.
Eleviamo al quadrato sfruttando le nostre conoscenze
dei prodotti notevoli e semplificando:
p
2x2 + 2y 2 + 2f 2 + 2 (x2 + y 2 + f 2 )2 − 4x2 f 2 = 4a2
p
(x2 + y 2 + f 2 )2 − 4x2 f 2 = 2a2 − x2 − y 2 − f 2 .
Elevando ancora al quadrato si elimina (x2 +y 2 +f 2 )2 :
−4x2 f 2 = 4a4 − 4a2 (x2 + y 2 + f 2 ).
210
CAPITOLO 7. LE ALTRE GEOMETRIE
Ora occorre semplificare e scrivere a2 − b2 al posto di
f 2 , come abbiamo osservato; si arriva cosı̀ all’espressione x2 b2 = −a2 y 2 + a2 b2 , e infine si divide tutto per
a2 b2 dopo aver trasportato a sinistra il monomio con
y:
x2
y2
+ 2 =1
(7.4)
2
a
b
6.34, che ha i due fuochi sull’asse delle x, equidistanti dall’origine. Come per l’ellisse si potrebbe considerare l’iperbole con i fuochi sull’asse delle y, ma
i risultati sarebbero analoghi. Chiamiamo allora a
la distanza del vertice dell’iperbole dall’origine degli
assi ed f la distanza dei due fuochi, ancora dall’origine. La costante dell’iperbole è data dalla differenza
AF2 − AF1 = a + f − (f − a) = 2a. Per un miQuesta formula determina l’ellisse come curva, cioè
sterioso motivo che sarà chiaro alla fine dei conti e
è la formula analitica dell’ellisse; p
se il valore di x, diche giustificheremo nella prossima nota, introduciaciamo x0 è noto, si ricava y = ± 1 − x20 /a2 , cioè si
2
2
2
mo una costante
√ b > 0 tale che b = f − a ; si
hanno due valori opposti per la y, come è chiaro dalla
ha allora f = a2 + b2 e preso un generico punto
figura. Molte altre proprietà possono essere ricavate
P ≡ (x, y) sull’iperbole, impostiamo l’equazione reda questa espressione, ma qui ci limiteremo ad alculativa imponendo la condizione sulla differenza delle
ne osservazioni. La circonferenza di centro l’origine
distanze:
e raggio a ha equazione x2 + y 2 = a2 , come già sapp
p
piamo. Se fissiamo un punto x0 (−a ≤ x0 ≤ a) e P F2 −P F1 = (x + f )2 + y 2 − (x − f )2 + y 2 = 2a.
calcoliamo l’ordinata positiva del puntopsulla circonferenza e sull’ellisse, troviamo:
yC = a2p− x20 per A questo punto, i conti sono abbastanza analoghi a
p
la circonferenza, e yE = b 1 − x20 /a2 = ab a2 − x20 . quelli svolti per l’ellisse e quindi lasciamo al lettore
Quindi tra i due punti c’è un rapporto b/a costante. tutta la gioia di portarli fino in fondo. Ad un certo
√ arbitrario) si
Questa osservazione permise a Keplero di calcolare punto (che in realtà può essere del tutto
a2 + b2 e questo
dovrà
sostituire
f
con
l’espressione
l’area di un’ellisse.
permette di arrivare alla forma finale:
Teorema 7.15 Sia data un’ellisse di equazione
x2
y2
−
=1
(7.5)
(7.4), nella quale a e b sono le misure dei semiassi;
a2
b2
allora l’area dell’ellisse è A = πab.
che fa il paio con quella dell’ellisse. Invitiamo il letProva: Possiamo suddividere l’asse maggiore in pic- tore a disegnare l’iperbole con a = 3, b = 4 e quindi
coli segmenti di lunghezza h e, su tali segmenti, co- f = 5.
L’iperbole per cui a = b si dice equilatera; ruotanstruire dei rettangoli che permettano di approssimare
do
un’iperbole equilatera di 45◦ in senso antiorario, si
l’area del cerchio e quella dell’ellisse. Se x0 è l’estretrova
l’iperbole y = 1/x, cioè xy = 1. Un utile allenamo di uno dei segmenti,p
il rettangolo che approssima
2
2
mento
consiste nel cercar di risolvere i soliti esercizi,
il cerchio avrà area 2h a − x0 ; quindi la somma
trovando
le tangenti (ad un’iperbole data dall’equadelle aree di tutti questi rettangoli
approssimerà l’aP p
2
2
2
zione
(7.5))
da un punto assegnato fuori dell’iperbole
rea totale del cerchio: AC =
2h a − x0 ≈ πa .
stessa,
ad
esempio
dall’origine (ma questo è un caso
Operando in modo analogopper l’ellisse, l’area di ciab
2
2
cattivo)
oppure
dal
punto A ≡ (a/2, 0).
scun rettangolo sarà 2h a a − x0 , e quindi l’area
P bp 2
P p 2
b
2
2
totale è: AE =
2h a a − x0 = a
2h a − x0 ,
Nota 7.3
Mentre nell’ellisse la costante b ha un
in quanto per la proprietà distributiva la costante
significato ben preciso, cioè di lunghezza del semiasse
b/a si può mettere in evidenza. Ma allora abbiamo
minore, nell’iperbole la b sembra un arbitrio il cui
AE = ab AC , questo qualunque sia il numero e la diunico scopo è di semplificare la formula finale (7.5).
In realtà non è proprio cosı̀. Geometricamente, la
mensione dei segmenti usati; la relazione vale perciò
nostra iperbole (Figura 6.34) non interseca l’asse
anche per le aree calcolate precisamente e pertanto:
delle y, e quindi sembra venir meno l’aggancio
AE = ab πa2 = πab, come si voleva.
che legava la costante b all’ellisse.
Tuttavia, se
Il problema della lunghezza dell’ellisse (cioè del
algebricamente portiamo avanti il sistema tra l’equasuo perimetro) è piuttosto più complicato e richiezione (7.5) e l’asse y di equazione x = 0, si ottiene
l’equazione in y: y 2 = −b2 , che chiaramente non ha
de l’uso del calcolo integrale; pertanto noi non lo
soluzioni reali. Essa ha però le soluzioni complesse
affronteremo e rimandiamo la sua soluzione ai corsi
y = ±ib, e quindi possiamo affermare (con un po’
di Analisi Matematica, che lo studente potrà seguire
di facciatosta matematica) che l’iperbole incontra
all’Università.
l’asse delle y nei due punti immaginari ±ib. Ecco alLa più complicata delle coniche è senz’altro l’iperlora che abbiamo trovato un significato per la nostra b.
bole; pertanto, se è già complesso trovare l’equazione della generica ellisse, a maggior ragione è laborioso cercare quella della generica iperbole. LimitiaLe due rette y = ± ab x, cioè ay ± bx = 0, passanti
mo quindi la nostra ricerca all’iperbole della Figura per l’origine, hanno un significato particolare. Con-
7.5. GEOMETRIE NON-EUCLIDEE
sideriamo la retta y = bx/a quando x cresce indefinitamente, e confrontiamola con l’iperbole, o meglio
col suo ramo positivo. Questo ramo ha equazione:
r
b2 2
y=
x − b2 .
a2
La distanza verticale fra le due curve è, per defiizione,
la differenza fra le ordinate delle due curve per uno
stesso valore dell’ascissa. La distanza verticale non
è la stessa cosa della distanza che, in un punto della
curva, è la minima distanza dai punti dell’altra curva.
Proprio perché la distanza (tout-court) è definita come minimo, essa è più breve della distanza verticale.
Se questa, al crescere di x, si avvicina a 0, a maggior
ragione si avvicinerà a 0 la distanza. Nel nostro caso
la distanza verticale è:
r
b2 2
b
x − b2 .
δv (x) = x −
a
a2
211
mondo stesso, considerato come una semplice immagine riflessa del mondo delle idee. Tutti ricordiamo il
mito della caverna, ed è difficile dire se Platone fosse
stato influenzato dalla geometria nelle sue concezioni
filosofiche, o se ammirasse la geometria perché rifletteva cosı̀ bene la sua filosofia. Euclide, ottant’anni
dopo Platone, non fece che sistematizzare e concretizzare in una teoria ciò che Platone aveva intuito e
creduto. Di conseguenza, fino al 1800 tutti hanno
fermamente creduto che la Geometria Euclidea fosse indubitabile e nessuno ha mai pensato di mettere
in dubbio che gli sviluppi della Geometria Euclidea
fossero gli unici a descrivere il mondo reale.
Questa petizione di principio ha condizionato l’attitudine dei matematici a cogliere aspetti importanti,
non solo della geometria, ma anche dell’aritmetica e
dell’algebra, discipline che fino al 1600 sono rimaste a
quella subordinate, e che, comunque, hanno con essa
condiviso l’idea di rappresentare, nel loro complesso,
la vera descrizione dei fenomeni naturali legati alle
Questa quantità è senz’altro positiva in quanto il mi- forme e ai conteggi. Come vedremo, questa credenza
nuendo è maggiore del sottraendo a causa del −b2 . Si fece sı̀ che spiriti brillanti non si accorgessero di strade ampie e interessanti che pure avevano imboccato,
può allora scrivere nel modo seguente:
ma che ritennero false e fuorvianti.
r
r
a2
b2 2 b2 2
b
b
b
Naturalmente, l’errore era nel manico, e questo lo
δv (x) = x −
x − 2a = x − x 1 − 2.
a
a2
a
a
a
x
rendeva più subdolo, cosı̀ come oggi probabilmente
non vediamo, o siamo portati a trascurare, sviluppi
Osserviamo che a è fisso e quindi, quando x cresce
che non si accordano con la nostra mentalità, condi2
2
indefinitamente, a /x si avvicina sempre più a 0.
zionata da altri pregiudizi che non ci appaiono tali.
Quindi δv (x) si riduce a 0, come differenza di quanCome abbiamo ricordato e come tramanda Platarco,
tità praticamente uguali. Perciò la retta ay − bx = 0
la geometria era nata con scopi molto pratici: misurimane sempre al di sopra del ramo dell’iperbole, ma
rare i terreni, dando modo di ripristinare situazioni di
le due curve si avvicinano sempre più. Si dice che
fatto cancellate dalle piene del Nilo. I Greci fecero un
la retta è un asintoto della curva. In pratica, l’esipasso fondamentale, che però alcuni di loro (risultati
stenza di un asintoto indica che una curva cresce in
poi i più influenti) portarono troppo lontano. Il pasmodo pressoché lineare quando x va verso l’infinito.
so consistette in quel processo di astrazione che portò
Non tutte le curve hanno un asintoto: ad esempio,
appunto alla formulazione assiomatica di Euclide, che
2
la parabola cresce come x e non linearmente; quein forma meno precisa, ma sostanzialmente identica,
sto esclude, per definizione, che la parabola abbia un
era noto ai tempi di Platone. Questa forma sembraasintoto. Ritorneremo su questo argomento quando
va tanto perfetta che si stabilı̀ dovesse costituire la
studieremo il comportamento delle funzioni nella Serealtà stessa, cioè l’essenza riposta dietro l’apparenza
zione 8.7; infatti, un asintoto può caratterizzare la
dei fenomeni, del reale come ci si presenta. Pertanto,
crescita di una funzione e quindi essere utilissimo per
filosoficamente, la Geometria Euclidea è la realtà, e
capire l’andamento della funzione stessa.
nulla ci può essere di vero al di fuori di ciò che si può
dedurre con tale scienza.
7.5
Geometrie non-Euclidee
La Geometria di Euclide è stata considerata, per circa
2000 anni, l’unica geometria possibile e immaginabile, per il semplice motivo che la si riteneva un modello (veritiero) della realtà. Con considerazioni più
filosofiche che matematiche, si riteneva che la Geometria Euclidea descrivesse esattamente il mondo in
cui viviamo; anzi, da un punto di vista platonico, la
Geometria era l’idea del mondo, quindi più reale del
Questa fede aveva soltanto un piccolo neo. Dei dieci punti che abbiamo visto nella sezione [6.1], nessuno
trovava niente da ridire sui cinque assiomi di Aristotele e sui primi quattro postulati di Euclide. Il quinto,
però, con la sua formulazione abbastanza complicata,
di certo più complessa di quella di tutti gli altri, era
guardato con sospetto. Nessuno che dubitasse della
sua validità, ma esso veniva meno al concetto di semplicità e immediata evidenza che si pensava dovessero
avere gli assiomi. Si pensò allora che si potesse intro-
212
durre un altro assioma, più elementare, e dal quale
il quinto postulato potesse essere dedotto. Addirittura, molti ritennero che esso potesse essere dedotto
dai primi quattro, e perciò potesse essere eliminato
dalla formulazione di Euclide.
In effetti, possiamo distinguerne tre filoni:
• cercare di dimostrare il quinto postulato mediante tutti gli altri; questo avrebbe permesso di
eliminarlo, addirittura semplificando la teoria;
CAPITOLO 7. LE ALTRE GEOMETRIE
C
D
A
B
r
• cercare di sostituire il quinto postulato con altri
Figura 7.9: Il quadrilatero di Saccheri
più semplici, anche se equivalenti; questo avrebbe soddisfatto il senso estetico dei matematici,
AD = CD per costruzione, e possiamo applicare il
senza cambiare nulla della teoria;
terzo principio di congruenza. La conclusione è apb = DCA.
b
Si hanno perciò tre possibilità
• negare il quinto postulato per arrivare a qualche punto B DC
b e DCA:
b
conclusione assurda; questo, almeno, avrebbe di- relative agli angoli B DC
mostrato che il postulato era necessario, avrebbe
1. sono entrambi retti;
respinto il primo dei due precedenti modi di ragionare e avrebbe incanalato le ricerche lungo il
2. sono entrambi acuti;
secondo.
3. sono entrambi ottusi.
Intorno all’anno 1000, i matematici arabi affrontarono seriamente il problema delle parallele, l’altro no- La Geometria Euclidea assume che sia vera la prima
me con cui è nota la questione del quinto postulato di ipotesi. Come s’è visto, la retta CD risulta parallela
Euclide. Prima il fisico e matematico Ibn al-Haithan ad r e quindi BD ed AC sono perpendicolari alla stes(latinizzato in Alhazen, poi il poeta e matematico sa CD; questo implica che gli angoli in D e in C sono
Omar Khayyam e infine l’astronomo e matematico retti. Se si riuscissero ad escludere le altre due posNasir Eddin al-Tusi studiarono a lungo la faccenda, sibilità, il gioco sarebbe fatto e avremmo dimostrato
senza approdare a nulla di definitivo. Certamente, il il postulato delle parallele.
più famoso dei tre è Omar Khayyam, la cui opera poeLa cosa non si rivelò affatto semplice e molti cretica è nota in occidente dalle traduzioni ottocentesche dettero di aver dimostrato l’assurdità di 2. e di 3.
in inglese e in francese, e l’alone esotico, decadente ed laddove, invece, o s’erano sbagliati oppure avevano
epicureo che l’ha circondato, lo ha fatto approdare utilizzato involontariamente qualche teorema equivaanche ai fasti del cinematografo. Come matematico, lente al quinto postulato. Il caso più sconcertante fu
è stato forse il primo ad interessarsi in modo sistema- certo quello dell’abate gesuita Girolamo Saccheri. Altico delle equazioni di terzo grado, anche se riteneva l’inizio del 1700 egli riprese il quadrilatero che porta il
che non potessero essere risolte per via algebrica, ma suo nome e cercò di ragionare per assurdo. Supponiab e DCA
b
solo geometricamente come intersezione di coniche.
mo, disse, che ad esempio i due angoli B DC
Questi matematici arabi introdussero il cosiddet- siano entrambi acuti; vediamo quali conseguenze si
to quadrilatero di Saccheri. Questo nome, che natu- possono dedurre da questa ipotesi e se ne troviamo
ralmente gli arabi non usavano, sarà giustificato più qualcuna assurda avremo dimostrato che l’ipotesi di
tardi; la sua costruzione è mostrata nella figura 7.9. acutezza non può andar bene. Operiamo poi in modo
b e DCA
b siano entrambi
Si prendono due punti distinti A e B su una retta analogo supponendo che B DC
r e si tracciano i segmenti AC e BD, perpendicolari ottusi e cosı̀ alla fine avremo la dimostrazione complead r e della medesima lunghezza. Si considera infine ta che l’unica condizione ammissibile la 1., proprio
la retta passante per C e D e quindi il quadrilatero quella equivalente al quinto postulato di Euclide.
ABDC.
Con questo bel programma in mente, Saccheri si
E’ facile dimostrare, senza far uso del quinto po- mise al lavoro, e poiché era un buon matematico scob e C DB
b sono uguali. prı̀ una serie di teoremi dedotti dall’ipotesi che i due
stulato, che i due angoli ACD
b e DCA
b fossero acuti. Questo era molto
Infatti, si comincino a considerare i triangoli ABD angoli B DC
e BCA, che sono uguali perché AB è in comune, bello e interessante, ma Saccheri aveva come obiettiAC = BD per costruzione e, ancora per costruzio- vo quello di trovare una conseguenza assurda, e cosı̀
b e C AB
b sono uguali in quanto tanto s’arrabattò e tanto scrisse che a un certo punne, gli angoli ABD
retti. Pertanto, BC = AD e quindi sono uguali i to si convinse di aver trovato il baco che cercava. A
triangoli BDC e ADC; ancora, CD è in comune e quel punto, tutto contento, decise che la Geometria
213
7.5. GEOMETRIE NON-EUCLIDEE
Euclidea era proprio quella vera. Purtroppo per lui,
l’impostazione ideologica con la quale era partito gli
aveva fatto prendere lucciole per lanterne; i teoremi
che aveva dimostrato erano tutti validi, ma erano validi in una geometria che supponesse acuti gli angoli
b e DCA,
b e in ciò che aveva trovato non c’era nulB DC
la di assurdo. Come conclude malinconicamente C.
B. Boyer: “[Saccheri] . . . perdette il diritto di rivendicare a sé quella che sarebbe stata la più significativa
scoperta del XVIII secolo: la geometria non-euclidea.
Il suo nome rimase oscuro per un altro secolo, poiché
l’importanza della sua opera fu trascurata da coloro
che vennero dopo di lui.”
L’anno cruciale per le geometrie non-Euclidee fu
il 1829, con la pubblicazione del saggio “Sui principi
della Geometria” di Nicolaj Lobačevskij e il “Tantamen”, il trattato nel quale Farkas Bólyai riportava
in appendice le idee del figlio Janos sulla questione
del quinto postulato di Euclide. Lobačevskij era un
giovane matematico russo che già da qualche anno
si occupava dei fondamenti della geometria e, dopo
vari tentativi e vari tentennamenti, aveva, come si
suol dire, saltato il fosso operando una vera e prob
pria rivoluzione: ipotizzare che i due angoli B DC
b
e DCA del quadrilatero di Saccheri siano entrambi
acuti non è andare contro la realtà, ma è semplicemente un modo diverso di fondare la geometria rispetto all’impostazione di Euclide. I risultati che si
ottengono sono assolutamente validi, anche se in un
mondo diverso da quello che aveva in mente Euclide. In particolare, nel mondo di Lobačevskij, per
un punto esterno a una retta r passano infinite rette
“parallele” ad r, cioè che non incontrano mai r, pur
prolungate indefinitamente. Un’altra particolarità è
che la somma dei tre angoli interni di un triangolo
è minore di due angoli retti, invece di essere perfettamente uguale. Naturalmente, le proprietà diverse
sono infinite, ma non sono contraddittorie le une con
le altre, e i teoremi continuano ad essere “veri”, anche se assai diversi da quelli usuali. Sessant’anni dopo Lobačevskij, Felix Klein chiamò iperbolica questa
geometria, contrapponendola a quella Euclidea, che
egli definı̀ parabolica.
Bólyai aveva in mente una geometria del tutto analoga a quella di Lobačevskij, ma il Tentamen fu reso pubblico soltanto nel 1832. Inoltre, mentre Lobačevskij continuò a sviluppare la sua geometria negli
anni successivi e fino alla morte, Bólyai si disinteressò
della sua, cosı̀ che il riconoscimento per la scoperta
della Geometria non-Euclidea va a tutti gli effetti al
matematico russo. Bólyai rimase male dello scarso
successo delle sue idee; soprattutto, sembra che rimanesse male dell’indifferenza con cui le accolse il
più grande dei matematici, Gauss, che era amico del
padre. D’altra parte, Gauss fu sempre restio a rico-
noscere pubblicamente i meriti degli altri matematici,
e mostrò la stessa indifferenza anche per il lavoro di
Lobačevskij.
Bisogna dire che, in generale, la scoperta delle Geometrie non-Euclidee non fu considerata, a quei tempi,
cosı̀ importante come che la rappresentiamo oggi. La
rilevanza della geometria in Matematica era allora
molto calata, anche solo rispetto a cent’anni prima,
e se le si dava credito da un punto di vista didattico,
quasi più nessuno se ne interessava sul versante della ricerca. Questa era presa soprattutto dall’Analisi,
che vedeva l’Algebra classica come un proprio strumento, mentre l’Algebra moderna muoveva appena
i primi timidi passi. In quanto alla geometria come
tale, aspetti speciali quali la Geometria Analitica, la
Geometria Proiettiva e Descrittiva avevano attratto
l’attenzione dei matematici. Di fatto, le Geometrie
non-Euclidee sembrarono più una curiosità che una
rivoluzione scientifica.
Nel giro di una ottantina di anni, però, si verificarono tre fatti che hanno cambiato radicalmente il
nostro atteggiamento nei confronti delle Geometrie
non-Euclidee. Il primo fatto è specifico della Matematica e si tratta della prolusione che Riemann lesse
quando divenne professore all’Università di Gottinga
nel 1854 (aveva 28 anni!). Per rendersi conto dell’importanza di questa prolusione, basterà ricordare
che Gauss espresse il suo apprezzamento per il lavoro
di Riemann, cosa unica ed eccezionale. La prolusione
trattava dei fondamenti della geometria, anche se della geometria considerata dal punto di vista analitico.
Riemann generalizzava il concetto di distanza tra due
punti che, come sappiamo è espressa dalla formula:
d2 (A, B) = (xA − xB )2 + (yA − yb )2 + (zA − zB )2 =
= dx2 + dy 2 + dz 2
nello spazio a tre dimensioni. Passando a una
combinazione quadratica qualunque:
d2 (A, B) = a1,1 (xA −xB )2 +a1,2 (xA −xB )(yA −yB )+
+a1,3 (xA −xB )(zA −zB )+a2,1 (yA −yB )(xA −xB )+· · · =
= a1,1 dx2 + a1,2 dx dy + a1,3 dx dz + a2.1 dy dx + · · ·
si ottiene un concetto di distanza (in termini matematici, una metrica) che conforma lo spazio in infiniti modi possibili. Scegliendo opportunamente i
coefficienti a1,1 , a1,2 , a1,3 , . . . si hanno pertanto geometrie diverse, fra le quali la Geometria Euclidea
è quella in cui tutti i parametri valgono 0, eccetto
a1,1 = a2,2 = a3,3 = 1. Riemann, poi, non legava
la distanza alla differenza di coordinate (xA − xB )
o (yA − yB ), ma le lasciava come libere funzioni dei
punti A e B coinvolti, purché soddisfacessero certe
regole generali: ad esempio, la distanza tra due punti
214
è nulla se e solo se i due punti coincidono; la distanza
tra A e B è uguale alla distanza di B da A; e cosı́ via.
In questa maniera si può far rientrare la geometria
di Lobačevskij in una teoria più generale di geometrie Euclidee e non-Euclidee da studiare con gli stessi
strumenti teorici. Il nome di Riemann è rimasto legato a un caso speciale di geometria non-Euclidea, e
b
cioè quello corrispondente al caso che gli angoli B DC
b
e DCA del quadrilatero di Saccheri siano entrambi ottusi. In tale geometria, per un punto posto al di fuori
di una retta r non passa alcuna retta parallela ad r;
inoltre, la somma dei tre angoli di un triangolo è sempre maggiore di due angoli retti. Nella terminologia
di Klein, questa è la Geometria Ellittica.
L’opera di Riemann (che morı̀ di tisi a soli quarant’anni) ricondusse nell’alveo della Matematica “importante” le Geometrie non-Euclidee, anche se le relegava a un ruolo molto subalterno, ad esempi, interessanti fino a un certo punto, di una teoria ben
più generale. Rientrate comunque in ballo, il secondo fatto che giocò a loro favore (e fu probabilmente
il fatto più importante) riguarda il rinnovato interesse per la Logica e per i fondamenti della Matematica che prese piede e si sviluppò alla fine del 1800
e all’inizio del 1900. Questo merita la nostra attenzione e cercheremo perciò di raccontarlo con qualche
dettaglio.
La Geometria Euclidea costituisce sicuramente il
primo esempio di sistema assiomatizzato; quando i
matematici ripresero ad interessarsi dei fondamenti,
la geometria costituı̀ un banco di prova immediato
per discutere le idee relative ai processi di assiomatizzazione. L’impianto Euclideo fu analizzato da tutti
i possibili punti di vista e, come abbiamo detto, ne
furono rilevate inesattezze e carenze, fino ad arrivare
alla formulazione di Hilbert, che abbiamo schematizzato nella Sezione 6.1. La possibilità di sviluppare
teorie alternative come le Geometrie Euclidee e nonEuclidee fa capire che non esiste un apparato certo
di assiomi che tutto comprende, e, cosa ancora più
importante, non esiste un insieme vero di assiomi,
e quindi non esiste una teoria vera, cioè conforme
alla realtà o tale che la realtà le si conformi. Questa è l’idea diametralmente opposta alla concezione
antica della Geometria Euclidea, che, come abbiamo
osservato all’inizio, era tradizionalmente pensata come vera descrizione della realtà, anzi di realtà vera
nell’accezione estrema di Platone.
Ogni teoria ha un suo ambito di validità, cioè è vera
per quella serie di fenomeni che vanno d’accordo con
gli assiomi. In quest’ambito, i teoremi costituiscono
risultati veri, ed è ciò che dà senso alla nostra visione
matematica del mondo, secondo lo spirito di Galileo.
Se usciamo dall’ambito di validità degli assiomi, non
possiamo più parlate di adeguatezza tra realtà e teo-
CAPITOLO 7. LE ALTRE GEOMETRIE
ria, e siamo costretti a cambiare la teoria esplicativa.
Tutto ciò è abbastanza evidente, ma c’è un problema molto grave dietro questo modo di vedere le cose.
Se impostiamo una teoria dichiarando quali sono gli
assiomi e le regole di inferenza (v. Sezione 1.6), fin
dove possiamo spingerci con l’arbitrarietà degli assiomi scelti? In altre parole, non possiamo mettere tra
gli assiomi che 2+2 = 4 e allo stesso tempo 2+2 = 5,
né possiamo tollerare che uno dei due si deduca dall’altro. E’ questo il problema della consistenza di
una teoria, e requisito fondamentale per un sistema
assiomatico sensato è che esso determini una teoria
consistente, cioè priva di contraddizioni.
Un metodo per stabilire la consistenza di un sistema è quello di trovarne un modello nella realtà (si
veda anche la Sezione 1.6) o almeno in un’altra teoria che riteniamo consistente. Ad esempio, la Geometria Euclidea si considera consistente perché ha come
modello la Geometria Analitica, e questa si basa su
concetti matematici che consideriamo consistenti, o
non contraddittori. Sarebbe allora interessante trovare dei modelli anche per le Geometrie non-Euclidee,
poiché questo ci assicurerebbe che esse non contengono contraddizioni, cioè sono teorie valide alla pari
della Geometria Euclidea. Vorrei osservare che questo aspetto non era stato considerato né la Lobačeskij
né da Bólyai che, a rigore, avrebbero potuto creare
delle belle teorie, ma inconsistenti, perché inficiate da
qualche contraddizione interna che avrebbero potuto
non rilevare. Come si ricorda, questa era la non segreta speranza di Saccheri, che desiderava proprio dimostrare l’inconsistenza delle sue ipotesi assurde relative
al quadrilatero della Figura 7.9.
Un primo e quasi banale modello fu trovato per
la Geometria Ellittica di Riemann. Accontentiamoci
di una realtà bidimensionale e consideriamo quanto
succede sulla superficie della Terra. I punti sono i
punti della superficie di una sfera e le rette sono le
circonferenze massime sulla stessa superficie: pensiamo ai meridiani e all’equatore, mentre non sono rette
gli altri paralleli. Questa scelta non è casuale, ma
è dovuta al fatto che presi due qualsiasi punti (ad
esempio, due città) esiste una e una sola circonferenza massima che passa per essi, mentre di altri tipi
di circonferenze ne passano infiniti. Questo è proprio
quello che ci aspettiamo da oggetti che vogliamo chiamare “rette”, oggetti determinati da due punti e due
soltanto. Se ora pensiamo a un meridiano m (cioè,
una retta) e ad un punto P fuori di esso, vediamo subito che ogni retta che passa per P incontra sempre
e comunque il meridiano m. Infatti, due circonferenze massime non possono non incontrarsi (altrimenti,
una almeno non sarebbe massima) e anzi si incontra
in due punti, come ogni coppia di meridiani si incontrano al Polo Nord e al Polo Sud. Come abbiamo
215
7.6. GEOMETRIA DESCRITTIVA E PROIETTIVA
accennato, in questa geometria la somma degli angoli interni di un triangolo è sempre maggiore di due
retti. Prendiamo ad esempio due punti sull’equatore, di modo che la loro distanza sia un quarto della
lunghezza dell’equatore stesso; uniamoli tra loro e al
Polo Nord. Otteniamo cosı̀ un triangolo, detto sferico
perché disegnato sulla superficie di una sfera. Basta
un momento di riflessione per capire che i tre angoli
del triangolo sono tutti retti, e quindi la loro somma
di 270◦ è ben maggiore di 180◦ !
C
A
C′
B A′
B′
Figura 7.10: Triangoli di Beltrami e di Riemann
Più laborioso fu trovare un modello per la Geometria Iperbolica di Lobačevskij. Ci riuscı̀, nella seconda metà del 1800, il matematico italiano Eugenio
Beltrami. Anche lui propose un modello bidimensionale, costituito da una superficie. Questa però è assai complicata e si ottiene per rotazione da una curva
speciale, detta trattrice, definita nel modo seguente:
per ogni punto P sulla trattrice Γ, la tangente a Γ
in P incontra l’asse delle x in Q e il segmento P Q
ha lunghezza unitaria. Facendo ruotare questa curva
intorno all’asse delle ascisse si ottiene una superficie
detta pseudosfera ed è la superficie considerata da
Beltrami. Questa superficie ha una proprietà importante, ma un po’ difficile da capire: la curvatura in
ogni punto è costante ed uguale a −1; questo è il giusto il contrario di ciò che succede nella sfera, che ha
anch’essa curvatura costante, ma uguale a +1. Nella
sfera, infatti, la curvatura è sempre risolta all’interno,
mentre nella pseudosfera è sempre rivolta all’esterno.
Questa analogia al contrario fa sı̀ che, definite opportunamente le “rette”, succeda proprio ciò che si
vuole nella Geometria Iperbolica: per un punto P
fuori della “retta” r passano infinite rette parallele
ad r (cioè, che non incontrano mai r). Anche se
la cosa è difficile a vedersi, Beltrami dimostrò che
in ogni triangolo sulla superficie della pseudosfera la
somma degli angoli interni è sempre minore di due
retti. Non tentiamo nemmeno di abbozzare le dimostrazioni, fidando nella fiducia del lettore e sulla credibilità di Beltrami che, ai suoi tempi, fu presidente
dell’Accademia dei Lincei e Senatore del Regno.
I modelli non hanno solo la funzione logica di ras-
sicurarci sulla consistenza di una teoria assiomatica;
essi hanno anche un valore psicologico non indifferente, poiché ci mostrano una situazione reale (anche
se in senso molto matematico e astratto) nella quale
gli assiomi, i teoremi, le definizioni e tutto ciò che
deriva dalla nostra teoria hanno un riscontro pratico
ben chiaro. Si può dire, esagerando forse un po’, che
il modello sostanzializza la teoria, rendendola plausibile anche agli scettici. Spesso, come nel caso della
Geometria Ellittica, il modello ci mostra come un’idea che pareva assurda (quella delle geometrie nonEuclidee) rientri invece nei canoni della Matematica
conosciuta, anzi non sia altro che una situazione ben
nota, solo vista da un punto di osservazione diverso.
I triangoli sferici, infatti, fanno parte della trigonometria sferica, una disciplina che era stata studiata
fin dall’antichità, e in modo assai profondo dopo le
grandi scoperte geografiche, essendo legata ai nostri
movimenti sulla superficie terrestre, in primo luogo
quelli delle navi.
A questo punto non ci rimane altro che ricordare il terzo fatto (ultimo, ma non meno importante) che ha portato all’affermazione delle geometrie
non-Euclidee: la geometria di Riemann è la Geometria adottata da Einstein nella teoria della relatività.
Questa non avrebbe neppure avuto inizio, se le Geometrie non Euclidee non avessero fornito gli strumenti
matematici per il suo sviluppo.
7.6
Geometria
proiettiva
descrittiva
7.7
Topologia
7.8
Gli spazi vettoriali
e
216
CAPITOLO 7. LE ALTRE GEOMETRIE
Capitolo 8
Trigonometria e Calcolo
C. [canticchiando da ubriaco] Che ne dite della
mia voce?
H. Non vi vedo debuttare all’Opera.
C. He, he! Mi chiamo Collins, per mia sfortuna, non Caruso. Sono professore. Insegno
all’Università di Chicago e ho fatto una conferenza a New York – sugli integrali. Nel Calcolo
Differenziale si dà una funzione e si ottiene il
differenziale. Avete afferrato?
H. Alla perfezione!
C. Davvero?!
A. Hitchcock L’altro uomo
In questo capitolo conclusivo trattiamo di due argomenti un po’ più avanzati e specialistici, almeno dal
punto di vista della Matematica che si insegna nelle
Scuole Medie. La Trigonometria è propriamente lo
studio dei triangoli, ma le funzioni trigonometriche,
seno, coseno, tangente e le loro inverse, hanno una
stretta connessione con la funzione esponenziale, come scoprı̀ Eulero, e ciò imparenta Trigonometria e
Calcolo Differenziale. Non potremo perciò non prendere in considerazione tali funzioni che sono periodiche e quindi qualitativamente diverse dai polinomi,
dalle funzioni razionali fratte, dall’esponenziale e dal
logaritmo.
La Trigonometria è nata nell’antichità, applicata
soprattutto all’astronomia; si è poi affermata nel Medio Evo come ausilio indispensabile alla navigazione,
crescendo vieppiù di importanza con le scoperte geografiche del 1400 – 1500 e la conseguente globalizzazione dei viaggi per mare. Le prime tavole trigonometriche prendevano in considerazione la corda sottesa da un arco di circonferenza, e quindi in pratica
erano relative al seno. Oltre a seno, coseno, tangente e cotangente, ebbero fortuna altre funzioni, come
1 − cos x, ma oggi non le si considerano molto importanti; la stessa cotangente, essendo semplicemente l’inverso della tangente, tende ad essere relegata in
secondo piano. Rimangono importanti tutte le applicazioni della Trigonometria alle misurazioni (triangolazioni), allo studio dei fenomeni oscillatori e pe-
riodici, all’analisi armonica (suoni, immagini, colori,
compressione, etc.).
Il Calcolo Differenziale e Integrale è un po’ alla base
di tutta la Matematica moderna. Esso fu inventato (o
scoperto) da Newton e da Leibniz nella seconda metà
del 1600. Newton accusò Leibniz di avergli rubato l’idea, sfruttando alcune informazioni che gli aveva dato
in una lettera. Leibniz negò, rivendicando l’originalità delle proprie idee. Cosı̀ i due rimasero nemici fino
alla morte. Gli storici oggi sono pressoché d’accordo
che i due pensarono e svilupparono il calcolo differenziale in modo indipendente, con concetti e notazioni
equivalenti, ma abbastanza lontane. A parte questa
diatriba, nel giro di pochi anni il calcolo differenziale
divenne la regina della Matematica e uno stuolo di
matematici geniali lo sviluppò tanto da renderlo indispensabile sia alla Matematica sia alla Fisica, come
mostrò per primo lo stesso Newton.
La crescita del calcolo differenziale durante il 1700
ha qualcosa di prodigioso, e uno dei maggiori scienziati che contribuı̀ a questo exploit fu certamente Eulero. Nella prima metà del 1800 i matematici, e primo
fra tutti Cauchy, diedero una sistemazione ai risultati
precedenti, arrivando a un’impostazione che è praticamente quella che oggi conosciamo. Tuttavia, il concetto di funzione e quello di integrale si rivelarono
particolarmente delicati, e occorre arrivare alla fine
del 1800 e all’inizio del 1900 per trovarne una caratterizzazione soddisfacente (Peano, Lebesgue). Noi,
bisogna dire, saremo costretti a seguire un’impostazione abbastanza intuitiva, ma speriamo che sia sufficiente a far capire i concetti principali e a permettere
di utilizzarli a livello elementare.
8.1
Le funzioni trigonometriche
Scopo della trigonometria è la misurazione dei triangoli, cioè il calcolo dei valori delle varie misure di un
triangolo: lati, angoli, altezze, mediane e cosı̀ via, a
partire da dati noti, di solito i tre lati, due lati e l’angolo tra essi compreso, o un lato e i due angoli ad
esso adiacenti. Come sappiamo, questi dati determi-
217
218
CAPITOLO 8. TRIGONOMETRIA E CALCOLO
nano tutti gli altri in modo univoco, ma la geometria
euclidea non dà molto aiuto per valutare le quantità
non note. Proprio a questa mancanza vuol rimediare
la trigonometria che, inizialmente, aveva soprattutto
scopi pratici e veniva usata nella navigazione, nella
topografia, nella balistica e nell’astronomia. Le prime
tavole trigonometriche, costruite dagli Arabi, servivano proprio per questi scopi: il citato al-Khuwarizmi,
nell’800 D.C. contribuı̀ alla realizzazione delle prime
tavole dei seni e nel XIII secolo il re Alfonso di Castiglia fece preparare le prime tavole nautiche dell’Occidente: con grande scandalo in tutta Europa,
affidò tale compito a un gruppo di matematici arabi ed ebrei, che a quel tempo erano i migliori. Gran
parte del lavoro dei matematici applicati del 1700 e
del 1800 fu la compilazione di carte nautiche di tutto
il mondo e di tabelle di puntamento per le artiglierie.
Comunque, dal 1700 con Eulero, fu riconosciuta la
stretta connessione tra la funzione esponenziale e le
funzioni trigonometriche, che cosı̀ entrarono a far parte della matematica teorica e successivamente, come
è noto, divennero parte preponderante nello studio
dell’elettricità, del magnetismo e di tutti i fenomeni
oscillatori.
misura dell’arco, si ha pertanto la proporzione:
A
B
α
O
P
U
C
Figura 8.1: Il cerchio goniometrico
Il cerchio di raggio 1 è detto cerchio goniometrico;
di solito lo si rappresenta col centro nell’origine di un
sistema di assi cartesiani ortogonali. Gli angoli sono
rappresentati come angoli al centro e, di regola, una
delle due semirette che definiscono l’angolo è fatta
coincidere con la semiretta positiva dell’asse delle x,
mentre l’altra semiretta determina l’angolo secondo
una rotazione in senso antiorario (si veda la Figura
8.1). Ora si può osservare che l’arco U A è direttamente proporzionale all’angolo α. Questo permette
di sostituire la misura in gradi di α con la misura di
U A. Detta G(α) la misura in gradi di α ed R(α) la
G(α) : 360◦ = R(α) : 2π,
essendo 2π la misura dell’intera circonferenza, corrispondente all’angolo di 360◦ . La quantità R(α) si
chiama la misura in radianti di α e quindi si hanno
le semplici formule di conversione:
R(α) =
πG(α)
180
e
G(α) =
180R(α)
.
π
Questo significa che, per definizione, un radiante è la
misura dell’angolo che sottende un arco di lunghezza
1 nel cerchio goniometrico. La sua misura in gradi è:
G(α) =
180◦
≈ 57◦ 17′ 44′′ 81/100.
π
Altre misure importanti sono:
18◦ =
π
rad
10
30◦ =
π
rad
6
45◦ =
π
rad
4
π
π
rad
90◦ = rad.
3
2
La misura in radianti è, in un certo senso, la misura
“naturale” degli angoli. Essa infatti non dipende da
suddivisioni arbitrarie, quali la misurazione del grado
come 360a parte dell’angolo giro; dipende solo dalla
misura degli archi, e quindi del raggio del cerchio,
che abbiamo fissato ad 1 per semplicità. Per questo,
la misurazione in radianti è la più usata nella letteratura scientifica ed è indispensabile nel trattamento
analitico delle funzioni trigonometriche.
Sia ancora α un angolo, sia A l’intersezione con il
cerchio goniometrico e sia P la proiezione di A sull’asse OU ; infine, sia B l’intersezione con la retta OA
della perpendicolare ad OU in U . Si hanno le seguenti
definizioni:
60◦ =
Definizione 8.1 Si dice seno dell’angolo α, e si indica con sin(α) (dal latino “sinus”), la misura (con
segno) del segmento AP . Si dice coseno dell’angolo α, e si indica con cos(α), la misura (con segno)
del segmento OP . Infine, si dice tangente dell’angolo α, e si indica con tan(α), la misura (con segno)
del segmento U B.
Al variare di α tra 0◦ e 360◦ (cioè tra 0 rad e 2π
rad) il seno e il coseno possono assumere solo valori
compresi tra 1 e −1. La tangente, invece, assume valori sempre più alti man mano che da 0◦ si va verso i
90◦ ; per α = 90◦ il valore della tangente non risulta
definito e lo si considera uguale a infinito. Quando
si superano i 90◦ , la tangente viene ad assumere valori negativi, prima molto alti in valore assoluto, poi
sempre più vicini a 0. I valori della tangente ritornano ad essere positivi quando si superano i 180◦ , ma
219
8.1. LE FUNZIONI TRIGONOMETRICHE
a 270◦ la tangente è di nuovo non definita. Si hanno sono espresse nel sistema decimale anziché in quello
pertanto i seguenti valori:
sessagesimale.
Alla base del calcolo delle funzioni trigonometriche
sin(0◦ ) = 0 sin(90◦ ) = 1 sin(180◦ ) = 0
vi sono i due seguenti teoremi, che permettono di riportare i conteggi a quelli relativi a una sola funzione,
sin(270◦ ) = −1 sin(360◦ ) = 0
ad esempio il seno.
cos(0◦ ) = 1
cos(90◦ ) = 0
◦
◦
cos(270 ) = 0
◦
tan(0 ) = 0
cos(180◦ ) = −1
cos(360 ) = 1.
◦
tan(90 ) = ∞
tan(180◦ ) = 0
Teorema 8.1 Per ogni angolo α vale la seguente
identità:
sin2 (α) + cos2 (α) = 1.
Prova: Se l’angolo α è compreso tra 0◦ e 90◦ , applicando il teorema di Pitagora al triangolo OP A della
Aumentando ulteriormente l’angolo, i valori del seno Figura 8.1, si ha AP 2 + OP 2 = OA2 , cioè proprio la
e del coseno tornano a ripetersi ogni 360◦ o 2π ra- relazione cercata. Lasciamo al lettore la verifica di
dianti. Le due funzioni, pertanto, sono periodiche di questa identità in tutti gli altri casi.
periodo 360◦ o 2π radianti. Si scrive (k ∈ Z):
Questa relazione, valida per ogni valore di α, si dice
◦
◦
sin(α) = sin(α + k360 ) cos(α) = cos(α + k360 ); l’identità trigonometrica fondamentale; da essa derivano gran parte delle proprietà della trigonometria.
Per quello che riguarda la tangente, si ha:
sin(α) = sin(α + 2kπ) cos(α) = cos(α + 2kπ).
tan(270◦ ) = ∞
tan(360◦ ) = 0
La tangente, invece, torna a ripetersi ogni 180◦ o
πrad; è pertanto periodica di periodo 180◦ o πrad:
tan(α) = tan(α + k180◦ )
tan(α) = tan(α + kπ).
La seguente tabella riassume il segno delle funzioni
trigonometriche di quadrante in quadrante:
sin
cos
tan
I
+
+
+
II
+
−
−
III
−
−
+
IV
−
+
−
Teorema 8.2 Qualunque sia l’angolo α:
tan(α) =
sin(α)
.
cos(α)
Prova: Anche in questo caso possiamo limitarci agli
angoli compresi tra 0◦ e 90◦ . Sempre con riferimento
alla Figura 8.1, osserviamo che i due triangoli OP A e
OU B sono simili; pertanto vale la proporzione AP :
OP = BU : OU . Ricordando che, per definizione,
OU = 1, questa è esattamente la relazione cercata.
Nella Figura 8.1, l’angolo in A del triangolo OAP
è chiaramente il complementare di α; da questo
si deducono immediatamente le formule dell’angolo
Per trovare il valore del seno e del coseno di un complementare:
angolo, è conveniente riportare l’angolo a uno equisin(90◦ − α) = cos(α)
cos(90◦ − α) = sin(α)
valente compreso tra 0◦ e 360◦ o tra 0 rad e 2π rad.
Analogamente, per la tangente si riporta l’angolo a
1
uno equivalente compreso tra 0◦ e 180◦ o tra 0rad e
tan(90◦ − α) =
= cot(α),
tan(α)
πrad. Per questo, le tavole contengono solo i valori
di seno, coseno e tangente per tali angoli, spesso ad- dove cot(α) indica la funzione cotangente che è dedirittura limitatamente ai valori tra 0◦ e 45◦ (ovvero finita come l’inverso della tangente; useremo questa
tra 0 rad e π/4 rad), per i motivi che vedremo un po’ funzione solo il minimo indispensabile. Queste forpiù avanti (Tabella 8.1). Il calcolatore dà i valori per mule, in realtà, valgono per tutti i valori di α, anche
qualsiasi α, ma al suo interno riporta tutto all’inter- quando α > 90◦ ; ad esempio, se 90◦ < α < 180◦ , si
vallo fra 0◦ e 360◦ (180◦ ) o tra 0 rad e 2π (o π) rad ha sin(90◦ − α) = sin(β) dove β < 0, ovvero 270◦ <
effettuando la riduzione:
β < 360◦ . I due triangoli OAP e OCQ sono uguali e questo dimostra che | sin(90◦ − α)| = | cos(α)|;
α mod 360
ovvero
α mod 2π
d’altra parte, i segni sono entrambi negativi e questo
conclude il ragionamento. In modo analogo si può
(α mod 180
ovvero
α mod π).
procedere negli altri casi, cioè quando l’angolo α è
Di solito, un tasto permette di scegliere se fare i conti compreso negli altri quadranti e/o quando si parte
in gradi o in radianti, e talvolta è presente una ter- dal coseno.
za modalità, quella dei gradi decimali, nei quali l’anUn aspetto importante di queste formule è il fatto
golo retto corrisponde a 100◦ e le frazioni di grado che esse permettono di ridurre il calcolo delle funzioni
220
CAPITOLO 8. TRIGONOMETRIA E CALCOLO
trigonometriche (e quindi le tavole relative) al solo
ottante (0◦ ..45◦ ). Se infatti α > 45◦ , si ha sin(α) =
cos(90◦ − α), riportandosi cosı̀ a un angolo del primo
ottante.
Dalla circonferenza goniometrica è possibile ricavare anche le formule dell’angolo supplementare:
conoscendo un cateto e l’angolo opposto a tale cateto. Infine, si calcola anche un cateto in funzione dell’altro, risolvendo le precedenti uguaglianze rispetto
all’ipotenusa:
sin(180◦ − α) = sin(α)
cos(180◦ − α) = − cos(α)
◦
tan(180 − α) = − tan(α).
E’ buona norma, per non rischiare di commettere errori grossolani, disegnare il cerchio goniometrico e su
di esso l’angolo di interesse: le relazioni precedenti si
vedono immediatamente.
C
C′
BC =
sin(α)
AB
cos(α)
B′
B
AB =
cos(α)
BC;
sin(α)
queste relazioni giustificano l’introduzione della
tangente, in quanto esse sono equivalenti a:
BC = tan(α)AB
e AB =
BC
.
tan(α)
In qualche caso, queste formule permettono di ottenere il valore del seno e del coseno di certi angoli
particolari. Se α = 45◦ ovvero α = π/4, il triangolo
rettangolo è metà
√ di un quadrato, cioè se AB = ℓ,
allora AC = ℓ 2, quindi:
√
sin(45◦ ) = cos(45◦ ) = AB/AC = 2/2
α
A
e
tan(45◦ ) =
sin(45◦ )
= 1.
cos(45◦ )
Figura 8.2: Calcolo dei lati
Se α = 30◦ , il triangolo è metà di un triangolo
√ equilatero e quindi se AC = ℓ risulta AB = 3ℓ/2 e
Il teorema di Pitagora permette di calcolare i tre BC = ℓ/2; di conseguenza:
lati di un triangolo rettangolo quando ne siano noti
sin(30◦ ) = BC/AC = 1/2
solo due; non ci dice niente, però, sugli angoli, né ci
permette di calcolare i lati quando se ne conosca uno
√
cos(30◦ ) = AB/AC = 3/2
solo e si conosca invece un angolo diverso da quello
√
retto. La trigonometria risolve immediatamente que1 2
3
sin(30◦ )
◦
sti problemi. Si abbia, come in Figura 8.2, il trian= √ =
.
tan(30 ) =
◦
cos(30 )
2 3
3
golo rettangolo ABC e se ne conosca l’angolo α. Se
prendiamo il punto C ′ in modo che AC ′ = 1, si ha Dalla formula per l’angolo complementare si ha
per definizione C ′ B ′ = sin(α) e AB ′ = cos(α). Dalla allora:
similitudine dei triangoli ABC e AB ′ C ′ si hanno le
√
seguenti proporzioni:
sin(60◦ ) = 3/2
cos(60◦ ) = 1/2
AC ′ : AC = B ′ C ′ : BC e AC ′ : AC = AB ′ : AB
1 : AC = sin(α) : BC
e 1 : AC = cos(α) : AB.
√
3 √
sin(60◦ )
=2
= 3.
tan(60 ) =
◦
cos(60 )
2
◦
Un altro angolo per il quale è facile calcolare i vaQueste permettono di calcolare due lati qualsiasi lori del seno e del coseno è 18◦ . Si consideri il trianquando se ne conosca il terzo. In particolare, quando golo armonico definito nella Sezione 6.4; se tracciasi conosca l’ipotenusa si ha:
mo l’altezza CH e consideriamo il lato AC = 1, si
ha AH = sin(18◦ ) e CH = cos(18◦ ). Questo dà
BC = AC sin(α)
e
AB = AC cos(α)
immediatamente:
√
che si enunciano cosı̀: la misura di un cateto è data
5−1
◦
◦
sin(18 ) = cos(72 ) =
≈ 0.30901699 . . . .
dal prodotto dell’ipotenusa per il coseno dell’angolo
4
adiacente o per il seno dell’angolo opposto. Naturalmente, invertendo queste formule si può calcola- Dall’identità trigonometrica fondamentale si ricava
re l’ipotenusa di un triangolo rettangolo conoscen- allora:
s
do uno qualsiasi dei cateti e l’angolo compreso tra
√
lo stesso cateto e l’ipotenusa. Applicando le formule
5+ 5
◦
◦
cos(18
)
=
sin(72
)
=
≈ 0.95105655 . . .
dell’angolo complementare, l’ipotenusa si trova anche
8
221
8.2. LE FORMULE DI SOMMA E SOTTRAZIONE
e infine:
Oggi, con i nostri calcolatori a disposizione, il problema sembra non più porsi, ma, ci dobbiamo chiedere,
√ √
2( 5 − 1)
◦
come riescono gli elaboratori a fare i calcoli necessari?
tan(18 ) = p
√
In realtà esistono vari metodi sviluppati dall’analisi
2 5+ 5
matematica, ma le basi sono fornite da alcune forPer completezza ricordiamo che accanto alle tre mule di importanza veramente fondamentale e che
funzioni fondamentali della Trigonometria molte al- sono conosciute già da alcuni secoli. Cominciamo col
tre sono state introdotte per risolvere specifici pro- dimostrare il seguente risultato:
blemi. Oggi sono piuttosto cadute in disuso, ma talvolta capita ancora di incontrarle. Accanto alla già
citata cotangente, inversa della tangente, meritano
B
di essere ricordate la secante e la cosecante, inverse
rispettivamente del coseno e del seno:
p
√
2 5+ 5
◦
.
tan(72 ) = √ √
2( 5 − 1)
csc α =
1
sin α
sec α =
1
.
cos α
Sono invece importanti le inverse composizionali di
seno, coseno e tangente:
A
C
• arcsin(x) si legge: “l’arco del seno di x” e indica
l’angolo il cui seno vale x (nella Figura 8.1, è
l’arco U A nei confronti del segmento x = AP );
• arccos(x) si legge: “l’arco del coseno di x” e indica l’angolo il cui coseno vale x (nella Figura 8.1,
è l’arco U A nei confronti del segmento x = OP );
• arctan(x) si legge: “l’arco della tangente di x” e
indica l’angolo la cui tangente vale x (nella Figura 8.1, è l’arco U A nei confronti del segmento
x = U B).
Pertanto si ha:
β
α
O
X
R
Q
P
U
Figura 8.3: Somma dei seni
Teorema 8.3 Siano α e β due angoli tali che α+β ≤
90◦ ; allora:
sin(α + β) = sin(α) cos(β) + cos(α) sin(β).
sin(arcsin x) = arcsin(sin x) = x
b
Prova: Si consideri la Figura 8.3 in cui α = U OA
b
e β = AOB, per cui sin(α + β) = BQ. Se BX è
cos(arccos x) = arccos(cos x) = x
perpendicolare ad OA, si ha OX = cos(β) e BX =
tan(arctan x) = arctan(tan x) = x.
sin(β). Per le formule sui triangoli rettangoli si ha
Nella nostra trattazione elementare non ci occupere- XP = OX sin(α) = sin(α) cos(β) = CQ. Ora, i due
triangoli rettangoli OQR e RXB sono simili, poiché
mo molto di queste funzioni, se non in contesti
√ ovb
b
vi come: “qual è l’angolo che ha per √
seno 2/2?”, ORQ = X RB come angoli opposti al vertice, quindi
b
domanda che ha per risposta: arcsin( 2/2) = 60◦ . RBX = α. Nel triangolo rettangolo BXC si ha ora
L’unica eccezione è la funzione arcotangente, che ha BC = BX cos(α) = cos(α) sin(β) e, in conclusione:
un ruolo molto importante nel calcolo differenziale
sin(α + β) = BQ = CQ + BC =
e, soprattutto, nel calcolo integrale; l’incontreremo
pertanto in tale contesto.
= sin(α) cos(β) + cos(α) sin(β)
8.2
Le formule di somma e
sottrazione
come si voleva.
Lavorando per casi, è possibile far vedere che la
condizione α + β ≤ 90◦ può essere fatta cadere e che
Il calcolo delle funzioni trigonometriche non è per quindi la formula è valida per ogni valore di α e di β.
niente banale; a parte i pochi valori particolari che Seguendo un cammino analogo, si possono dimostrare
abbiamo visto nella precedente sezione, sappiamo ve- formule simili relative al coseno e alla differenza α −
ramente poco, e questo ci fa capire quanto benemeriti β; qui riteniamo che la dimostrazione precedente sia
per i naviganti siano stati coloro che hanno calcolato i sufficiente a dare l’idea generale di come procedere
valori di seno e coseno, costruendo le apposite tavole. e ci limitiamo quindi a riportare le quattro formule,
222
CAPITOLO 8. TRIGONOMETRIA E CALCOLO
dette di somma e sottrazione:
Per dimostrare questa relazione basta partire dalla
definizione di tangente e applicare le regole della somma e della sottrazione relative a seno e coseno; ad
esempio:
sin(α + β)
sin(α − β)
cos(α + β)
cos(α − β)
= sin(α) cos(β) + cos(α) sin(β)
= sin(α) cos(β) − cos(α) sin(β)
= cos(α) cos(β) − sin(α) sin(β)
= cos(α) cos(β) + sin(α) sin(β).
tan(α + β) =
sin(α + β)
sin α cos β + cos α sin β
=
;
cos(α + β)
cos α cos β − sin α sin β
E’ opportuno ricordare a memoria queste identità
che, insieme all’identità fondamentale, costituiscono
a questo punto è sufficiente dividere numeratore e dela base di tutta la trigonometria. Esiste una formula
nominatore per cos α cos β e si trova immediatamente
mnemonica che può aiutare a ricordare le due espresla formula cercata. La duplicazione è allora:
sioni per la somma, dalle quali è poi facile ricavare
quelle della sottrazione. La frase è:
2 tan α
(8.1)
tan(2α) =
1
−
tan2 α
CENTO ROSE MOLTO MENO BELLE.
Qui le “E” corrispondono al seno e le “O” al coseno;
le prime due parole si riferiscono alla formula per il
seno, dove si ha la somma del prodotto sin(α) cos(β)
con il prodotto cos(α) sin(β). Le ultime tre parole si
riferiscono invece alla formula per il coseno, data dalla sottrazione (“meno”) fra i prodotti cos(α) cos(β)
e sin(α) sin(β). Ad esempio, per l’angolo di 15◦ si
trova:
sin(15◦ ) = sin(45◦ − 30◦ ) =
= sin(45◦ ) cos(30◦ ) − cos(45◦ ) sin(30◦ ) =
√
√
√
√ √
2 3
21
6− 2
−
=
≈ 0.258819.
=
2 2
2 2
4
Analogamente:
√
√
6+ 2
cos(15◦ ) =
≈ 0.965926.
4
e da questa si ricava la formula di bisezione
cambiando α in α/2:
√
−1 ± 1 + tan2 α
α
.
tan =
2
tan α
Per completezza, citiamo la formula di triplicazione
per il coseno, che il lettore potrà ricavare sviluppando
cos(3α) = cos(2α + α):
cos(3α) = 4 cos3 (α) − 3 cos(α).
Sapendo risolvere le equazioni di terzo grado (in modo esatto o approssimato), questa formula permette,
ad esempio, di calcolare cos(5◦ ) a partire da cos(15◦ )
che abbiamo trovato in precedenza. La formula
analoga di triplicazione del seno è:
sin(3α) = 3 sin(α) − 4 sin3 (α).
Particolarmente importante è il caso α = β, per
cui si ha:
Ad ogni modo, nella Tavola 8.1 riportiamo il valosin(2α) = 2 sin(α) cos(α)
re del seno e del coseno di grado in grado; i seni si
leggono direttamente, mentre per leggere i coseni occos(2α) = cos2 (α) − sin2 (α) =
corre considerare l’angolo complementare, che si tro2
2
= 2 cos (α) − 1 = 1 − 2 sin (α).
va dal lato opposto della tabella. Perciò sin(12◦ ) =
che si dicono formule di duplicazione. Se poniamo 0.20791169 = cos(78◦ ).
α/2 al posto di α, si ottiene:
Nota 8.1
Come si costruisce una tavola come
³α´
³α´
quella della Tabella 8.1? Oggi la cosa è molto semplice
− 1, cos(α) = 1 − 2 sin2
;
cos(α) = 2 cos2
2
2
e basta un programma di poche righe per ottenere una
e quindi si hanno le formule di bisezione:
r
r
α
1 + cos(α)
1 − cos(α)
α
, sin = ±
.
cos = ±
2
2
2
2
Queste formule permettono di ottenere seno e coseno di angoli sempre più piccoli e, quindi, di angoli che differiscono tra di loro tanto poco quanto si
vuole, cioè danno la possibilità di costruire le tavole
trigonometriche.
Per quanto riguarda la tangente, le formule di
somma e sottrazione sono le seguenti:
tan(α ± β) =
tan α ± tan β
.
1 ∓ tan α tan β
tabella anche più accurata, con più cifre decimali e, ad
esempio, di primo in primo o anche di secondo in secondo. Noi abbiamo utilizzato Maple, un programma
di valutazione simbolica, che ci ha permesso di ottenere un’uscita utilizzabile direttamente per queste note.
In realtà, le tavole come questa non sono più utilizzate, poiché è più semplice avere a disposizione una
piccola calcolatrice portatile, che ci può fornire, con
estrema precisione, il valore di qualsiasi funzione trigonometrica per un valore qualunque dell’argomento.
Una volta, diciamo fino agli anni 70 del 1900, le tavole
erano indispensabili in qualsiasi lavoro tecnico e per
l’orientamento; notevoli sforzi si sono spesi per rendere tali tavole prive di errori e semplici da usare. Si
narra che, proprio allo scopo di eliminare i numerosi
223
8.2. LE FORMULE DI SOMMA E SOTTRAZIONE
sin / cos
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
valore
0
0.01745241
0.03489950
0.05233596
0.06975647
0.08715575
0.10452847
0.12186935
0.13917310
0.15643447
0.17364818
0.19080900
0.20791169
0.22495106
0.24192190
0.25881905
0.27563736
0.29237171
0.30901700
0.32556818
0.34202014
0.35836797
0.37460659
0.39073114
0.40673664
0.42261827
0.43837114
0.45399051
0.46947158
0.48480963
0.50000000
0.51503808
0.52991928
0.54463903
0.55919292
0.57357643
0.58778525
0.60181504
0.61566148
0.62932041
0.64278761
0.65605904
0.66913061
0.68199837
0.69465837
0.70710680
valore
1.
0.99984770
0.99939083
0.99862953
0.99756405
0.99619470
0.99452189
0.99254615
0.99026807
0.98768834
0.98480775
0.98162718
0.97814760
0.97437006
0.97029573
0.96592583
0.96126170
0.95630475
0.95105655
0.94551857
0.93969262
0.93358042
0.92718386
0.92050485
0.91354546
0.90630778
0.89879405
0.89100652
0.88294758
0.87461970
0.86602540
0.85716730
0.84804809
0.83867057
0.82903756
0.81915205
0.80901700
0.79863549
0.78801075
0.77714595
0.76604444
0.75470957
0.74314482
0.73135369
0.71933980
0.70710680
cos / sin
90
89
88
87
86
85
84
83
82
81
80
79
78
77
76
75
74
73
72
71
70
69
68
67
66
65
64
63
62
61
60
59
58
57
56
55
54
53
52
51
50
49
48
47
46
45
Tabella 8.1: Tavola dei seni e dei coseni
errori di calcolo delle tavole nautiche, Babbage fosse spinto a progettare e a tentare di realizzare la sua
“Macchina Analitica”, il prototipo di tutti i calcolatori
programmabili (1835 circa).
Volendo immaginare come venivano costruite queste
tavole, possiamo cominciare osservando che è possibile, con le nostre conoscenze, trovare seno e coseno di
un angolo di 3◦ . Infatti, si ha immediatamente:
sin(3◦ ) = sin(18◦ − 15◦ ) =
= sin(18◦ ) cos(15◦ ) − cos(18◦ ) sin(15◦ ) =
s
√
√
√ √
√
√
5−1 6+ 2
5+ 5 6− 2
−
≈
=
4
4
8
4
≈ 0.052335956 . . . .
Non è difficile, almeno numericamente, trovare ora seno e coseno dell’angolo di 1◦ . Infatti, la formula di
triplicazione ci dice:
sin(3◦ ) = 3 sin(1◦ ) − 4 sin3 (1◦ )
dove il valore di sin(1◦ ) è ignoto, ma si conosce
sin(3◦ ). Questa espressione equivale all’equazione di
terzo grado in x = sin(1◦ ):
4x3 − 3x + sin(3◦ ) = 0.
Teoricamente, qui si potrebbe applicare la formula risolutiva delle equazioni di terzo grado. Come abbiamo
osservato a suo tempo, tale applicazione non è banale per i conti che richiede e che devono essere svolti
utilizzando i numeri complessi. Più conveniente è un
celebre metodo, dovuto a Newton, che permette di
trovare il valore di x con la precisione che si desidera,
applicando iterativamente la seguente formula:
xi+1 = xi −
4x3i − 3xi + sin(3◦ )
12x2i − 3
e partendo dal valore x0 = 0. Questo dà x1 =
sin(3◦ )/3 ≈ 0.017445318 . . ., che è già preciso fino alla
quarta cifra decimale. Applicando ancora la formula
precedente, si trova x2 = 0, 0174524064338 . . . contro un valore vero di 0.0174524064373 . . . (errore nella
12-esima cifra decimale!). Se ci si accontenta, come
abbiamo fatto nella nostra tavola, di 8 cifre decimali,
questa approssimazione va senz’altro bene, e il valore ottenuto si può prendere come base per costruire
l’intera tabella. Onde evitare l’accumularsi di errori
di arrotondamento, è bene sfruttare i valori che si conoscono con precisione. Cosı̀ per calcolare sin(12◦ ) si
useranno i valori relativi a 30◦ e a 18◦ . Per calcolare
sin(13◦ ) si dovranno invece sfruttare i valori relativi a
12◦ e ad un grado.
Per quanto riguarda primi e secondi, si può partire
considerando il caso di 22◦ 30′ come metà dell’angolo
di 45◦ :
s
√
2− 2
◦
′
≈ 0.38268343.
sin(22 30 ) =
4
224
CAPITOLO 8. TRIGONOMETRIA E CALCOLO
in quanto si supponeva che (p + q)/2 e (p − q)/2 si
facessero a mente, e sulle tavole si trovavano diretQuello trovato è il valore di sin(22◦ 30′ ) con 8 decimali. tamente i logaritmi delle funzioni trigonometriche.
Dalla Tabella 8.1 possiamo ricavare un’approssima- Stranamente, questo uso delle formule di prostafezione usando il metodo dell’interpolazione lineare, resi (che cercava di sfruttare al meglio le tavole dei
cioè immaginando che la funzione cresca linearmente logaritmi) è esattamente il contrario di quello che esfra i valori relativi a sin(22◦ ) e a sin(23◦ ). Questo se avevano all’origine, prima dell’invenzione dei logaè vero solo in via approssimativa, ma permette di ritmi. Furono infatti le formule di prostaferesi, letcalcolare sin(22◦ 30′ ), o di qualsiasi altro valore del
te da destra verso sinistra, a suggerire che potessero
seno, compreso tra due valori noti, impostando
esistere delle funzioni che trasformassero prodotti e
una semplice proporzione.
Poiché la differenza
◦
◦
sin(23 ) − sin(22 ) = 0.01612455 corrisponde a divisioni in somme e sottrazioni, e quindi potessero
60′ , la parte corrispondente a 30′ si ricava da: semplificare l’esecuzione delle operazioni. Esse furono
60′ : 0.01612455 = 30′ : x, quindi x = 0.00806227. utilizzate, in congiunzione con le tavole dei seni e dei
Aggiungendo infine questo valore a sin(22◦ ) si trova coseni, proprio a questo scopo, anche se ovviamente
sin(22◦ 30′ ) ≈ 0.38266886 con un errore di 15 unità il loro uso era molto più complicato di quello dei losu un milione, il che può essere soddisfacente per la garitmi, che, una volta inventati, le soppiantarono in
maggior parte delle applicazioni.
questo compito.
Con lo stesso spirito e con la stessa tecnica di sommare
e sottrarre le formule di somma e sottrazione,
Le seguenti formule sono oggi poco più che una
si
ottengono
le formule di Werner:
curiosità anche se in passato sono state molto
importanti da un punto di vista computazionale:
1
sin α sin β = (cos(α − β) − cos(α + β))
2
Teorema 8.4 Valgono le seguenti formule, dette di
1
prostaferesi:
cos α cos β = (cos(α + β) + cos(α − β))
2
p−q
p+q
cos
sin p + sin q = 2 sin
1
2
2
sin α cos β = (sin(α + β) + sin(α − β)).
2
p+q
p−q
sin p − sin q = 2 cos
sin
Dalle
ultime
due
identità, ponendo α = (n − 1)θ e
2
2
β
=
θ,
si
hanno
le
formule
di Simpson:
p−q
p+q
cos
cos p + cos q = 2 cos
2
2
sin nθ = 2 cos θ sin(n − 1)θ − sin(n − 2)θ
p+q
p−q
cos p − cos q = −2 sin
sin
.
cos nθ = 2 cos θ sin(n − 1)θ − cos(n − 2)θ.
2
2
Molto probabilmente, le formule più utili nella praProva: Si considerino le due prime formule di somma e sottrazione, relative al seno, e si ponga p = α+β, tica sono quelle che permettono di esprimere sin(α),
q = α − β, di modo che risulti α = (p + q)/2 e cos(α) e tan(α) per mezzo della tangente di α/2. Per
la tangente, abbiamo già trovato la formula (8.1);
β = (p − q)/2. Si ha allora:
per il seno e il coseno possiamo dare la seguente
p+q
p−q
p+q
p−q
sin p = sin
cos
+ cos
sin
dimostrazione geometrica:
2
2
2
2
Teorema 8.5 Per ogni valore di α si ha:
p−q
p+q
p−q
p+q
cos
− cos
sin
.
sin q = sin
2
2
2
2
α
sin α
1 − cos α
tan =
=
.
Sommando membro a membro queste due uguaglian2
1 + cos α
sin α
ze si ha la prima formula; sottraendo membro a memb ; l’anProva: Come nella Figura 8.4, sia α = AOP
bro si ha la seconda. Analogamente si ottengono le
b
b ,
altre due, usando le due ultime formule di somma e golo OQP , come angolo alla circonferenza di AOP
vale α/2 e quindi sono simili i tre triangoli AQP ,
sottrazione.
OU B e AU P . Si ottengono pertanto le proporzioni:
Quando andavo al Liceo, ci insegnavano queste forBU : OU = P A : QA = AU : P A,
mule perché semplificavano il calcolo della somma e
della differenza di due seni o di due coseni, specie
e scrivendo al posto di ogni segmento il suo valore,
quando si trovavano entro espressioni più complicacioè BU = tan(α/2), OU = 1, P A = sin α, QA =
te, come (sin p + sin q)3 . L’elevamento a potenza ri1 + cos α, AU = 1 − cos α, si hanno le due identità.
chiedeva l’uso dei logaritmi e quindi poteva essere più
Questa dimostrazione che riguarda il caso 0◦ ≤ α ≤
complicato fare 3 log10 (sin p+sin q) piuttosto che fare:
90◦ , si può ora estendere a tutti gli altri angoli.
p−q
p+q
+ log10 sin
)
3(log10 2 + log10 sin
Si ha allora il seguente corollario:
2
2
Si scende poi a livello più fine usando le formule di
bisezione e trisezione.
225
8.3. RISOLUZIONE DEI TRIANGOLI
8.3
P
B
α/2
α/2
Q
O
A
U
Figura 8.4: Calcolo della tan(α/2)
Corollario 8.6 Per ogni angolo α valgono le
seguenti identità:
sin α =
2 tan(α/2)
1 + tan2 (α/2)
cos α =
1 − tan2 (α/2)
.
1 + tan2 (α/2)
Prova: Dal teorema precedente abbiamo:
tan2
α
1 − cos α
=
,
2
1 + cos α
che è una semplice equazione lineare in cos α e, risolta, dà il valore annunciato. Per quanto riguarda sin α,
basta osservare che sin α = tan α cos α e utilizzare le
espressioni già trovate per tali quantità.
Uno degli usi più frequenti di queste formule è la risoluzione delle equazioni trigonometriche, cioè equazioni nelle quali compaiono le funzioni trigonometriche di una quantità incognita. Ad esempio, consideriamo l’equazione 2 sin x+cos x = 1. Tutte le equazioni lineari in sin x, cos x e tan x possono essere affrontate sostituendo a queste quantità le loro espressioni
in t = tan(x/2):
sin α =
2t
1 + t2
cos α =
1 − t2
1 + t2
tan α =
2t
.
1 − t2
Nel nostro caso si ha:
4t
1 − t2
+
= 1 ossia
2
1+t
1 + t2
4t + 1 − t2 = 1 + t2 .
Questa è l’equazione di secondo grado t2 − 2t = 0,
che ha le due soluzioni t = 0 e t = 2. Ricordando
(cosa che non si deve mai dimenticare) che seno e
coseno sono funzioni periodiche di periodo 360◦ o 2π,
mentre la tangente è periodica di periodo 180◦ o π,
la soluzione t = 0 corrisponde a x/2 = 0 + kπ, ovvero
x = 0 + 2kπ. Infatti, per tutti questi valori si ha
sin x = 0 e cos x = 1. La soluzione t = 2 corrisponde
a x/2 = arctan 2 = 63◦ 26′ 05′′ 816/1000; il seno di
x vale esattamente 0.8 e il coseno −0.6; quindi la
soluzione generale è x = 126◦ 52′ 11′′ 63/100 + k360◦ .
Risoluzione dei triangoli
Come abbiamo ricordato, la Geometria Euclidea stabilisce, attraverso i cosiddetti criteri di uguaglianza
o di congruenza, quali sono i requisiti minimi perché un triangolo sia perfettamente determinato, ma
quasi nulla ci dice di come calcolare le quantità ignote (lati, angoli, altezze, mediane, etc.), basandosi sui
valori dei lati e degli angoli che si conoscono. Per
questo la Trigonometria ha avuto tanto successo pratico e si è rivelata indispensabile ogniqualvolta dalla
determinazione teorica degli elementi di un triangolo,
si debba passare alla loro valutazione numerica. Per
risoluzione di un triangolo si intende la valutazione
numerica degli elementi del triangolo (lati, angoli, altezze, bisettrici, etc.) a partire dagli elementi noti, se
questi determinano il triangolo stesso.
I triangoli sono alla base di ogni metodo di misurazione delle figure poligonali, cioè delle figure determinate da segmenti di retta, caso al quale ci si può
ricondurre in pratica quasi il 100% delle volte. Se
abbiamo una stanza un po’ sbilenca o un campo di
forma irregolare, si procede alla cosiddetta triangolazione, cioè a scomporre la figura in tanti triangoli, le
cui misure saranno poi calcolate mediante la Trigonometria. In più larga scala, un procedimento del tutto
analogo si usa in topografia e certi punti del territorio sono marcati per essere usati come punti di riferimento. Cime di monti e colline, edifici pubblici particolari, monumenti, tralicci costruiti appositamente,
costituiscono i vertici di triangoli ideali che permettono di misurare con precisione distanze e angolazioni.
Oggi, anche i satelliti artificiali, situati in posizioni
fisse rispetto alla Terra, permettono triangolazioni di
precisione, sfruttate prima nella navigazione marina
ed aerea, ed ora anche nel trasporto terrestre con il
sistema GPS. Senza la Trigonometria, tutte queste
applicazioni non sarebbero possibili.
Da un punto di vista matematico, la Trigonometria
offre una serie di teoremi che agevolano i calcoli; una
volta questi calcoli si eseguivano con l’uso delle tavole; oggi si utilizza una calcolatrice da tasca (se i conti
sono pochi) o un elaboratore più grande, ottenendo
risultati più accurati e in modo più veloce. D’altra
parte, bisogna dire, le formule della Trigonometria
sono spesso assai eleganti e tutt’altro che difficili da
dimostrare. Pertanto, una volta che ci si sia impadroniti dei concetti di base, la Trigonometria appare
una disciplina abbastanza elementare, nella quale la
tecnica tende a prevalere sulla scienza. Rimane la bellezza di molti risultati, ai quali ora vogliamo dedicare
la nostra attenzione.
La Trigonometria adotta, per un generico triangolo, una notazione standard, che occorre conoscere per
capire e tenere agevolmente a mente le varie formule.
Con riferimento alla Figura 8.5, ricordiamo che i ver-
226
CAPITOLO 8. TRIGONOMETRIA E CALCOLO
C
γ
b
a
mc
α
hc
β
c
A
B
Figura 8.5: La notazione trigonometrica dei triangoli
B
a
C
O
α
D
α
A
Figura 8.6: Il teorema dei seni
il cerchio circoscritto al triangolo e tracciato il diab = α in quanto questo anmetro CD, si ha: C DB
b
golo insiste sullo stesso arco CB dell’angolo C AB.
b è retto, in quanto insiD’altra parte, l’angolo C BD
ste su una semicirconferenza, e quindi: a = 2R sin α.
Se l’angolo α fosse ottuso, la stessa costruzione porb = 180◦ − C AB,
b
ta ad avere C DB
ma come sappiamo sin(α) = sin(180◦ − α), e quindi la relazione
a = 2R sin α continua a sussistere. La stessa dimostrazione ci dà b = 2R sin β e c = 2R sin γ, da cui
segue il teorema.
Conseguenza immediata del Teorema dei seni è il
seguente risultato, che permette di trovare facilmente
il punto di incontro tra la bisettrice di un angolo e
il lato opposto, quando si conoscano le misure dei
tre lati. Formuliamo il teorema per l’angolo γ, ma
ovviamente esso vale per tutti gli angoli, per i quali
è sufficiente ruotare opportunamente le lettere; come
vedremo, questa è una bella caratteristica dei risultati
della Trigonometria.
Teorema 8.8 (delle bisettrici) In un qualsiasi
triangolo, la bisettrice di un angolo divide il lato
opposto in due segmenti proporzionali ai due lati
adiacenti.
C
tici di un triangolo si indicano con le lettere A, B, C;
γ/2 γ/2
la lunghezza di ciascun lato è indicata dalla lettera
minuscola corrispondente alla lettera del vertice opa
b
posto: pertanto BC = a, AC = b, AB = c. Gli angoli si denotano con le lettere greche corrispondenti
b β = ABC,
b
b
al loro vertice, cioè α = B AC,
γ = B CA.
180◦ − δ
δ
Le altezze si indicano con ha , hb , hc , dove l’indice rapyc
xc
A
P
B
presenta il lato su cui cade l’altezza; analogamente,
le mediane sono ma , mb , mc . Un ruolo importante
Figura 8.7: Teorema delle bisettrici
hanno le due circonferenze, quella inscritta e quella
circoscritta al triangolo; il centro della circonferenza
Prova: Nella Figura 8.7 il teorema afferma:
inscritta si indica con I e il suo raggio con r; il centro della circonferenza circoscritta si indica con O e
AP : AC = P B : BC;
il suo raggio con R. Infine, con S si indica l’area del
dal Teorema dei seni, applicato ad AP C, si ha:
triangolo, mentre il perimetro si denota con 2p, cioè
AC
AP
sin γ/2
AP
2p = a + b + c; con questo, p indica il semiperimetro
=
ovvero
=
,
del triangolo.
sin γ/2
sin δ
AC
sin δ
Con tali notazioni, cominciamo a dimostrare il primentre applicato a P BC, si ha:
mo teorema, che è un po’ la base per la misurazione
BC
PB
dei triangoli.
=
.
sin γ/2
sin(180◦ − δ)
Teorema 8.7 (dei seni o di Eulero) In un qualPoiché sin δ = sin(180◦ − δ), la conclusione segue
siasi triangolo si ha:
immediatamente.
b
c
a
Se indichiamo con xc il segmento P B e con yc il
=
=
= 2R.
sin α
sin β
sin γ
segmento AP , si ottiene il semplice sistema lineare:
½
Prova: Supponiamo prima di tutto, come nella
xc + yc = c
Figura 8.6, che α sia un angolo acuto; considerato
xc /a = yc /b
227
8.3. RISOLUZIONE DEI TRIANGOLI
A
c
A
c
b
γ
β
B
H
β
b
γ
C B
C
H
Figura 8.8: Teorema delle proiezioni
Naturalmente, la scelta di chiamare, in un certo
ordine, a, b, c i tre lati e α, β, γ i tre angoli, è del
tutto arbitraria, eccetto per il fatto che a deve essere
il lato opposto ad α, b a β e c a γ. Pertanto devono
valere (e si dimostrano, se fosse necessario, allo stesso
modo) anche le due relazioni “ruotate”:
b2
c2
= a2 + c2 − 2ac cos β
= a2 + b2 − 2ab cos γ.
Più avanti ci tornerà utile il seguente:
e risolto dà:
Corollario 8.11 In ogni triangolo si ha:
xc =
ac
a+b
yc =
bc
.
a+b
Il successivo teorema lega ciascun lato ai due angoli adiacenti; anche in questo caso, si noti la simmetria delle formule, che possono essere ottenute per
rotazione l’una dall’altra.
Teorema 8.9 (delle proiezioni o di Cotes) In
ogni triangolo valgono le relazioni:
a = c cos β + b cos γ
b = a cos γ + c cos α
c = a cos β + b cos α
Prova: Se il triangolo è acuto in γ si ha la situazione della Figura 8.8 a sinistra: BH = c cos β e
HC = b cos γ, da cui segue la prima relazione, essendo: a = BC = BH + CH. Se il triangolo è ottuso in γ, H cade fuori del segmento BC; tuttavia si
ha: BH = c cos β e CH = |b cos γ|, dove il valore
assoluto è necessario in quanto cos γ < 0; ma allora
BC = BH − CH = c cos β + b cos γ. In modo analogo
si provano le altre due relazioni.
Veniamo allora al più importante dei teoremi utili
alla risoluzione dei triangoli; questo risultato è noto
come Teorema di Carnot (o del coseno) e costituisce
la generalizzazione del Teorema di Pitagora. Questo
infatti si ritrova non appena poniamo α = 90◦ , cioè
cos α = 0.
Teorema 8.10 (del coseno o di Carnot) In ogni
triangolo si ha:
a2 = b2 + c2 − 2bc cos α.
Prova:
Consideriamo le tre relazioni del teorema precedente e moltiplichiamo la prima per a, la
seconda per −b e la terza per −c:
a2
−b2
−c2
= ac cos β + ab cos γ
= −ab cos γ − bc cos α
= −ac cos β − bc cos α
Sommando membro a membro e semplificando si trova a2 − b2 − c2 = −2bc cos α, che è la relazione che
stavamo cercando.
cos α =
b2 + c2 − a2
.
2bc
Di nuovo, valgono le relazioni che si ottengono ruotando tra di loro i lati e gli angoli; si osservi che il
teorema di Carnot ci dà modo di risolvere un triangolo quando se ne conoscano due lati (b e c) e l’angolo
α tra essi compreso (1◦ criterio di uguaglianza). Il
corollario risolve invece il caso del 3◦ criterio, quando
si conoscano i tre lati a, b, c. Se sono noti un lato a e
i due angoli ad esso adiacenti (2◦ criterio), in realtà
sono conosciuti tutti e tre gli angoli; considerando
due delle tre identità di Cotes, si ottiene un sistema
di due equazioni nelle due incognite b e c. In particolare, se si usano le due ultime identità, si ottiene il
sistema:
½
b
− c cos α = a cos γ
−b cos α +
c
= a cos β
Il determinante di questo sistema vale:
¯
¯
¯
1
− cos α ¯¯
2
¯
¯ = 1 − cos α.
¯ − cos α
1
Questa quantità è zero se e soltanto se cos2 α = 1,
cioè α = 0◦ oppure α = 180◦ . Queste sono situazioni
che possiamo scoprire a priori, in quanto il triangolo
degenera in un segmento. Si conclude pertanto che
questo metodo risolve sempre il triangolo.
Il calcolo dei lati e degli angoli di un triangolo permette di trovare anche il valore delle altezze e delle mediane che, di fatto, scompongono il triangolo
in altri triangoli, addirittura rettangoli nel caso delle altezze. Tuttavia, esistono ancora alcune formule
interessanti che permettono di semplificare qualche
calcolo ulteriore. Ad esempio, Nepero, oltre a darsi
da fare per calcolare i logaritmi, scoprı̀ anche queste
formule, che ci saranno di aiuto.
Teorema 8.12 (delle tangenti o di Nepero) In
ogni triangolo vale la relazione:
tan α+β
a+b
2
,
=
a−b
tan α−β
2
assieme alle altre due che si ottengono per rotazione.
228
CAPITOLO 8. TRIGONOMETRIA E CALCOLO
Prova:
Cerchiamo di vedere le formule dei se- e formule analoghe. Sostituendo:
ni (Teorema 8.7) come proporzioni; componendo e
r
r
α
2bc − b2 − c2 + a2
(p − b)(p − c)
scomponendo si ha:
sin =
=
2
4bc
bc
(a + b) : a = (sin α + sin β) : sin α
r
r
α
2bc + b2 + c2 − a2
p(p − a)
(a − b) : a = (sin α − sin β) : sin α.
cos =
=
2
4bc
bc
Queste proporzioni equivalgono a:
e la formula per la tangente discende da queste,
quando si esegua la divisione.
(a + b) : (a − b) = (sin α + sin β) : (sin α − sin β).
Questo teorema, già interessante di per sé, ci dà
Le prime due formule di prostaferesi implicano allora: modo di dimostrare il Teorema di Erone, nella mia
modesta opinione uno dei più bei teoremi della Geoα−β
sin α+β
a+b
2 cos 2
metria e forse di tutta la Matematica. Erone di Ales=
α−β
a−b
cos α+β
sandria era interessato piuttosto alle applicazioni del2 sin 2
la Matematica e della Fisica che ai risultati teorici.
e questa non è altro che la formula di Nepero.
Fu inventore di macchine ingegnose, come l’eliopila e
Briggs, a cui evidentemente piaceva seguire Nepe- l’odometro, e si interessò soprattutto della soluzione
ro, sia per i logaritmi, sia per la Trigonometria, scoprı̀ approssimata dei problemi geometrici. Sembra, in efalcune formule che permettono di esprimere le fun- fetti, che il teorema fosse già noto ad Archimede, ma
zioni trigonometriche dei tre angoli di un triangolo non abbiamo documenti in proposito; la dimostrazioin funzione dei soli lati a, b, c, e queste formule sono ne di Erone (geometrica e non trigonometrica) è cosı̀
particolarmente carine quando si faccia intervenire il la più antica che conosciamo.
semiperimetro p = (a + b + c)/2, che pertanto fa il
Teorema 8.14 (di Erone) In ogni triangolo si ha:
suo trionfale ingresso operativo:
p
S = p(p − a)(p − b)(p − c).
Teorema 8.13 (di Briggs) In ogni triangolo si ha:
r
r
Prova: L’altezza relativa al lato c si trova facenα
(p − b)(p − c)
p(p − a)
α
do:
hc = b sin α e quindi abbiamo: S = (bc sin α)/2.
sin =
cos =
2
bc
2
bc
Usando ora la formula di bisezione, si trova:
s
α
α
(p − b)(p − c)
α
S = bc sin cos
.
tan =
2
2
2
p(p − a)
e possiamo ricorrere alle formule di Briggs del
Valgono inoltre le analoghe formule ruotate per gli
teorema precedente, ricavando:
angoli β, γ.
r
r
(p − b)(p − c) p(p − a)
Prova: Si cominci con l’osservare che l’angolo α/2 è
.
S = bc
bc
bc
senz’altro compreso tra 0◦ e 90◦ , per cui seno, coseno
e tangente sono quantità positive. Pertanto, dalle Questa è proprio la formula desiderata.
formule di bisezione e dal Corollario 8.11 si ha:
Concludiamo queste nostre note sulla Trigonos µ
r
¶
2
2
2
metria
con un risultato che permette di calcolare
α
1 − cos α
1
b +c −a
sin =
1−
=
il
raggio
del cerchio inscritto e quello del cerchio
2
2
2
2bc
circoscritto:
s µ
r
¶
Teorema 8.15 In ogni triangolo si ha:
b2 + c2 − a2
1 + cos α
1
α
1+
.
=
cos =
2
2
2
2bc
S
abc
r=
R=
.
Ci sono ora due osservazioni importanti da fare.
p
4S
Primo:
Prova: Con riferimento alla Figura 8.9, l’area del
triangolo ABC è equivalente alla somma dei triangoli
2bc − b2 − c2 + a2 = (a + b − c)(a − b + c)
ABI, BCI, CAI le cui aree sono cr/2, ar/2, br/2, cioè
2bc + b2 + c2 − a2 = (a + b + c)(−a + b + c)
S = pr. Riprendiamo ora, dal teorema precedente, la
come si vede eseguendo i conti sulle espressioni di formula S = (bc sin α)/2; dal Teorema dei seni abbiadestra e semplificando; secondo:
mo: sin α = a/(2R), che ci dà S = abc/(4R). Questa
formula è equivalente a quella cercata.
a + b − c = a + b + c − 2c = 2(p − c)
229
8.4. IL CONCETTO DI LIMITE
C
P
B
I
Q
O
R
A
Figura 8.9: Cerchio inscritto e circoscritto
8.4
Il concetto di limite
Fin dall’inizio di queste note, abbiamo osservato come
sia impossibile considerare in modo effettivo e diretto ciò che fa riferimento alla nostra idea di “infinito”.
Ripensando a ciò che abbiamo detto, ci possiamo rendere conto che siamo ricorsi a due tecniche diverse.
Una è stata quella della scommessa, introdotta per
formalizzare il fatto che l’insieme N dei numeri naturali non è finito. La seconda tecnica è stata quella
di Cantor, il quale definisce un insieme infinito come
un insieme che possa essere messo in corrispondenza biunivoca con un suo sottoinsieme proprio. L’idea
di Cantor è davvero geniale e va bene nel “conteggio” degli insiemi, ma non si presta quando si cerca
di ragionare sull’infinitamente vicino o sull’infinitamente lontano. In altre parole, Cantor funziona finché si vogliono “distinguere” gli infiniti elementi dell’insieme, non funziona più quando questi diventano
indistinguibili perché troppo vicini o troppo lontani.
Il criterio della scommessa è lo stesso che servı̀ a
Lucrezio a provare che lo spazio è infinito: recati alla
fine dell’Universo e scaglia la tua freccia; se essa va,
allora quella non è la vera fine; se non va, c’è qualcosa oltre quella fine. Questo stesso criterio è quello
che abbiamo usato per definire i numeri reali, quel
qualcosa che possiamo concepire, ma che non esiste
in atto, al termine di una sequenza infinita di numeri
che, globalmente, stanno sempre più vicini tra di loro.
In barba a Zenone abbiamo detto: prendiamo tutte
le sequenze i cui elementi siano definitivamente vicini
tra di loro e chiamiamo “numero reale” quella cosa
indefinita che esse hanno in comune, la nostra sensazione che possiamo idealmente afferrare quel qualcosa
che non c’è, ma che, con le nostre scommesse, possiamo portare più in là di qualsiasi limitazione un nostro
avversario ci voglia imporre.
Sicuramente, quello di limite è uno dei concetti fondamentali della Matematica, legato com’è a tutti i
ragionamenti che riguardano la vicinanza (o la lonta-
nanza) dei numeri di un insieme, quando questi tendono a diventare sempre più vicini (o più lontani).
Questa tendenza coinvolge sempre ragionamenti che
riguardano insiemi infiniti di numeri.
Preliminari però a quello di limite, vi sono alcuni
concetti più semplici, ma di fondamentale importanza
per chiarire i discorsi che dovremo fare. In modo
alquanto schematico, diamo le seguenti definizioni,
che il lettore vorrà assimilare in modo accurato.
1. Si consideri un insieme A ⊆ R, finito o infinito; si dice massimo degli elementi di A, e si scrive
max(A), quell’elemento a ∈ A, se esiste, tale che per
ogni altro elemento b ∈ A, si abbia a > b. La clausola sull’esistenza è importante, poiché non è detto che
tutti gli insiemi A ⊆ R abbiano un elemento massimo. Ad esempio, N ⊆ R, ma N non ha alcun elemento
massimo. Non importa nemmeno che A contenga elementi che crescono indefinitamente perché sia privo
di massimo. Se consideriamo A = {1 − 1/n}n∈N0 ,
una successione, è chiaro che al crescere di n gli elementi di A sono sempre più grandi (anche se di pochino), ma nessun elemento di A è “il più grande di
tutti”. Infatti, il numero 1, che saremmo forse tentati
di considerare alla stregua di massimo, di fatto non
sta in A, e quindi non conta. Un insieme finito ha
sempre un massimo, ma gli insiemi con un numero
infinito di elementi possono averlo o non averlo. Naturalmente, il concetto di minimo è del tutto analogo
a quello di massimo, e lasciamo al lettore la soddisfazione di definirlo e di portare avanti considerazioni
ed esempi, sulla falsariga dei precedenti. Comunque,
A = {1/n}n∈N0 ha 1 come elemento massimo, ma
non ammette alcun elemento minimo.
2. Sia A ⊆ R come sopra; un elemento ℓ ∈ R si
dice limite superiore per A se ℓ ≥ a, per ogni elemento
a ∈ A. In generale, non è detto che ℓ sia un elemento
di A, anzi, di solito non lo è. E’ facile vedere che se ℓ
è un limite superiore per A ed ℓ ∈ A, allora ℓ è anche
il massimo di A. Di limiti superiori per A ne esistono
molti e, in effetti, basta che ne esista uno, diciamo
pure ℓ, e ne esistono infiniti, tutti gli ℓ′ > ℓ. L’insieme
A si dice superiormente limitato se ammette un limite
superiore. Ancora una volta, il lettore è chiamato
in causa per definire cosa sia un limite inferiore e
che significhi, per un insieme, essere inferiormente
limitato. Infine, possiamo dire che A è limitato se
è tanto superiormente quanto inferiormente limitato,
cioè, in altre parole, ammette un limite superiore e
un limite inferiore, come si intuisce facilmente.
3. Come s’è visto al primo punto, un insieme
A ⊆ R può non avere elemento massimo; ha però
sempre un elemento speciale, detto estremo superiore e indicato con sup(A). Per comprendere questo
concetto, si consideri un insieme A privo di massimo. Se A non è superiormente limitato, si definisce
230
CAPITOLO 8. TRIGONOMETRIA E CALCOLO
sup(A) = +∞, dove il simbolo ∞ si legge infinito e
risale al 1500. Altrimenti, si considera l’insieme Ā
dei limiti superiori di A, che non è vuoto per l’ipotesi che A sia superiormente limitato. Si osserva ora
che Ā ha sempre un elemento minimo ℓ. Infatti, detto A∗ il complementare di Ā in R, la coppia (A∗ , Ā)
costituisce una sezione di R, secondo quanto detto
nella Sezione 3.5. Per l’assioma di continuità, A∗ ha
massimo oppure Ā ha minimo. Sia ℓ tale elemento e
vediamo che ℓ non può essere il massimo di A∗ . Se
infatti ℓ appartenesse ad A∗ , non sarebbe un limite
superiore di A (che sono tutti in Ā). Esiste allora un
elemento a ∈ A tale che a > ℓ, e (a + ℓ)/2 è compreso tra a ed ℓ, cioè non è un limite superiore per A
ed è maggiore di ℓ contro l’ipotesi che questo fosse il
massimo di A∗ . Questo prova che sup(A) esiste sempre: se A ha un massimo allora sup(A) = max(A),
altrimenti è comunque il minimo dei limiti superiori,
e quindi non sta in A. In modo analogo si definisce
l’estremo inferiore di A come il massimo dei limiti
inferiori di A. Esiste sempre e si indica con inf(A); se
A non è limitato inferiormente si pone inf(A) = −∞.
Come esempio si consideri:
ha senso però che ǫ sia piccolo, poiché per ǫ grande
tutto diviene ovvio. Cosı̀ ha senso che M sia grande,
perché se è piccolo tutto diviene troppo facile.
Le successioni di Cauchy, che abbiamo introdotto nella Sezione 3.5 per i numeri razionali, possono
essere estese ai numeri reali, cambiando opportunamente la Definizione 3.4. La loro importanza è data
dal seguente:
inf {1/n}n∈N0 = 0
inf {1 − 1/n2 }n∈N0 = 0
sup {1/n}n∈N0 = 1
Teorema 8.16 Una successione è convergente se e
solo se è una successione di Cauchy.
Prova: Supponiamo che la successione tenda al limite ℓ; questo significa che fissato ǫ > 0 esiste un
indice m con la proprietà che per ogni n > m si ha
|ℓ − an | < ǫ/2; in particolare è: |ℓ − am+1 | < ǫ/2 e
quindi:
|am+1 − an | = |am+1 − ℓ + ℓ − an | ≤
ǫ
ǫ
+ +ǫ
2 2
e questo dimostra che vale il criterio di Cauchy con
m = m + 1. Viceversa, procediamo in modo formale, seguendo quanto detto nella Sezione 1.8 per
la negazione dei predicati. Il criterio di Cauchy si
formula:
≤ |am+1 − ℓ| + |ℓ − an | <
sup {1 − 1/n2 }n∈N0 = 1.
(∀ǫ > 0)(∃m ∈ N) | (∀n > m) : |am − an | < ǫ.
Ora è il momento di introdurre, in modo sistematico, il criterio della scommessa, nella forma che abbia- Pertanto, come abbiamo imparato nella Sezione 1.8,
mo cominciato a vedere con le successioni di Cauchy la negazione è:
(si veda la Sezione 3.5).
(∃ǫ > 0) | (∀m ∈ N)(∃n > m) | |am − an | ≥ ǫ.
Definizione 8.2 Sia {ak }k∈N una successione assegnata; si dice che la successione converge al numero Analogamente, il fatto che la successione tenda ad ℓ
reale ℓ se, fissato un numero reale positivo ǫ [piccolo] si esprime scrivendo:
a piacere, esiste un indice m della successione tale
(∃ℓ ∈ R) | (∀ǫ > 0)(∃p ∈ N) | (∀n > p) : |ℓ − an | < ǫ.
che per ogni indice n > m si ha |an − ℓ| < ǫ. Il
numero ℓ si dice limite della successione e si scrive: La negazione è allora:
ℓ = lim an .
n→∞
(∀ℓ ∈ R)(∃ǫ > 0) | (∀p ∈ N)(∃n > p) | |ℓ − an | ≥ ǫ.
Si dice invece che la successione diverge a +∞ (−∞) Poiché questa relazione vale per ogni ℓ, vale in
se, fissato un numero M [grande] a piacere, esiste particolare quando ℓ = ap , cioè:
un indice m della successione tale che per ogni in(∃ǫ > 0) | (∀p ∈ N)(∃n > p) | |ap − an | ≥ ǫ
dice n > m si ha an > M (an < −M ). Si scrive
rispettivamente:
e questa, come abbiamo visto, altro non è che la
negazione della condizione di Cauchy.
lim an = +∞ e
lim an = −∞.
n→∞
n→∞
Particolarmente importanti sono le successioni moLa successione {1/n}n∈N0 converge a 0; la suc- notòne, cioè le successioni che non decrescono o
cessione {n}n∈N diverge a +∞ e la successione non crescono mai. Formalmente, una successione
{(−1)n }n∈N non converge, né diverge, in quanto {ak }k∈N è monotona non decrescente se ∀n ∈ N si ha:
oscilla tra +1 e −1. Osserviamo esplicitamente che an+1 ≥ an . Analoga è la definizione di successione
nella precedente definizione abbiamo posto fra paren- monotona non crescente. Osserviamo esplicitamente
tesi quadra gli aggettivi “piccolo” e “grande”. Essi che, in Matematica, il termine tecnico “monotono”
sono infatti logicamente inutili perché le relazioni de- va pronunciato piano, cioè con l’accento tonico sulla
vono valere per ǫ o per M arbitrari; psicologicamente, penultima sillaba.
231
8.4. IL CONCETTO DI LIMITE
Teorema 8.17 Una successione monotona ha sem- i suoi elementi possono essere invertiti; questo perpre un limite; se è limitata, il limite è finito, mette di eseguire anche la divisione. In questi casi,
altrimenti il limite è infinito.
è opportuno vedere come si comporta il limite (per
n → ∞), cioè vedere se il limite della somma, della
Prova: Consideriamo una successione {ak }k∈N mo- differenza, del prodotto e della divisione di due senotona non decrescente; se non è limitata essa tende quenze è deducibile dai limiti delle due successioni.
ovviamente a +∞. Supponiamo allora che sia limi- Nel caso che tali limiti siano finiti (e, nel caso del detata e consideriamo l’insieme M dei numeri reali che nominatore in una divisione, diversi da 0), ciò è già
sono maggiori di tutti i suoi elementi an . Se M ha un stato visto nella citata sezione, almeno relativamenelemento più piccolo, lo si chiami ℓ; altrimenti, sia ℓ te alle successioni su Q, ma nulla cambia quando si
il più grande dei numeri che non stanno in M . Vedia- passi ad R. Possiamo ridurre a uno specchietto ciò
mo che limn→∞ an = ℓ. Sia infatti ǫ > 0 un numero che succede per la somma, supponendo che {ak }k∈N
qualsiasi e osserviamo che deve esistere un elemento e {bk }k∈N siano le due successioni e A e B siano i
della successione compreso nell’intervallo (ℓ − ǫ, ℓ); se loro limiti:
cosı̀ infatti non fosse, ℓ − ǫ/2 dovrebbe stare in M ,
B = 0 B 6= 0 B = +∞ B = −∞
contro l’ipotesi che M contenga tutti e soli i numeri
A
=
0
0
B
+∞
−∞
maggiori di ℓ (ed eventualmente lo stesso ℓ). Se am è
A
A
+
B
+∞
−∞
A
=
6
0
tale elemento, ogni altro elemento an con n > m deve
+∞
+∞
?
A = +∞ +∞
stare in (ℓ − ǫ, ℓ) per la monotonicità della successioA
=
−∞
−∞
−∞
?
−∞
ne, e quindi si ha ℓ − an < ǫ. Me questo altro non è
che la definizione di ℓ come limite della successione.
A parte le due strane somme +∞ + (−∞) e −∞ +
Naturalmenet, se la successione è non crescente, essa
(+∞)
che vedremo tra poco, tutte le altre relazioni
tende a −∞ oppure ad un limite minore o uguale a
sono
di
facile dimostrazione. Ad esempio, consideriatutti gli elementi della successione.
mo il caso in cui A = +∞ e B abbia un valore finito.
Le successioni monotone sono particolarmente im- Sia Z l’estremo superiore degli elementi di {bk }k∈N
portanti proprio perché hanno sempre un limite, e e per ogni M ∈ R sia m ∈ N l’indice per il quale
dimostrare la loro limitatezza equivale a dimostrare per ogni n > m si abbia an > M − Z. Si ha allora
che il limite è finito. Si pensi al caso ben noto del- an + bn > (M − Z) + Z = M , e questo dimostra che
le approssimazioni per difetto e per eccesso di una la successione {an + bn }n∈N diverge a +∞. Le altre
quantità incognita; come si ricorderà, è proprio sfrut- dimostrazioni sono analoghe e le lasciamo al lettore
tando questa idea che abbiamo impostato la nostra come puro divertimento.
costruzione dei numeri reali, anche se abbiamo di fatI due casi indicati dal punto interrogativo corrito considerato il concetto più ampio di successione di spondono invece a situazioni variabili a seconda dei
Cauchy.
casi. Si ha infatti:
Un altro criterio per la convergenza delle
successioni è dato dal seguente:
lim (k 2 ) + lim (−k) = +∞
k→∞
Teorema 8.18 (dei carabinieri) Se si hanno tre
successioni {ak }k∈N , {bk }k∈N , {ck }k∈N tali che ∀k ∈
N si abbia: ak ≤ bk ≤ ck e per le quali si sappia che:
lim ak = lim ck = ℓ
k→∞
k→∞
allora si ha anche: limk→∞ bk = ℓ.
Prova: La condizione sul limite degli ak e dei ck si
scrive come:
ℓ − ǫ < ak < ℓ + ǫ e
ℓ − ǫ < ck < ℓ + ǫ.
Poiché bk è compreso tra ak e ck , si deve avere ℓ − ǫ <
bk < ℓ + ǫ e questo prova che ℓ è il limite dei bk .
Come abbiamo visto nella Sezione 3.4, le successioni si possono sommare, sottrarre e moltiplicare elemento per elemento, ottenendo nuove successioni, e
se una successione ha tutti gli elementi diversi da 0,
k→∞
lim (−k 2 ) + lim (k) = −∞
k→∞
k→∞
lim (k 2 + 1) + lim (−k 2 + 1) = 2,
k→∞
k→∞
tre risultati completamente differenti e che dipendono solo dalle successioni considerate. Analogamente, se limk→∞ ak = ±∞ e non esiste limk→∞ bk , si
hanno situazioni diverse a seconda che la successione
{bk }k∈N sia limitata o meno. Nel primo caso si ha:
lim (ak + bk ) = ±∞,
k→∞
mentre nell’altro caso occorre vedere se {ak }k∈N domina {bk }k∈N (e allora il limite della somma è ancora ±∞), o viceversa, e allora tale limite non esiste.
Come esempio si consideri:
lim (k 2 + (−1)k k) = +∞
k→∞
232
CAPITOLO 8. TRIGONOMETRIA E CALCOLO
lim ((−1)k k 2 + k) non esiste.
k→∞
I due casi (∞ − ∞) e (−∞ + ∞) non sono le uniche
situazioni anomale che si trovano calcolando i limiti;
se il lettore, come dovrebbe fare, prova a disegnare
le tabelline analoghe alla precedente, ma relative alla moltiplicazione e alla divisione, si accorgerà che
si presentano altri casi di incertezza, che vanno perciò risolti di volta in volta. Queste situazioni sono
note come forme indeterminate dei limiti ed è opportuno che siano ricordate per poter dare un segnale
d’allarme ogni volta che se ne incontra una:
0
0
∞
∞
Un punto importante di questa definizione è l’aver
escluso x0 dai punti dell’intervallo (x0 − δ, x0 + δ) per
i quali la condizione va verificata. Questo permette
di considerare il limite per x → x0 (x che tende ad
x0 ) anche quando f (x0 ) non esiste, non è definita.
E’ proprio in casi del genere che il concetto di limite
rivela la sua potenza, come ora vedremo.
0·∞
sono i casi più comuni, ma è bene tener presenti anche
0∞ e ∞0 . Vedremo a suo tempo come il Teorema
di de L’Hôpital risolva spesso i casi 0/0 e ∞/∞, e
quindi, indirettamente, anche 0 · ∞ = 0 · (1/0) = 0/0.
Ciò che mi pare suggestivo nel concetto di limite
di una successione è il fatto che mi posso facilmente
immaginare la successione stessa come una sequenza temporale di punti, che si vanno disponendo sulla
retta reale. Quando la successione converge, io vedo
i punti accumularsi intorno al punto di convergenza; se invece la successione diverge, vedo i suoi punti
scomparire verso l’infinito, positivo o negativo, non
importa. Questa immagine mi ha sempre aiutato a
capire il concetto di limite e ad assimilare la definizione, che, come s’è visto, non è del tutto elementare.
E come ha aiutato me, penso che sia stata d’aiuto a
molti altri, anche se ciascuno, naturalmente, tende a
formarsi le proprie immagini di aiuto psicologico.
Il passaggio dal limite di una successione a quello
di una funzione, quando il suo argomento tende a un
valore specifico x0 , si fa riprendendo proprio questa
immagine, sia idealmente sia praticamente. Si dice
che una funzione f (x) tende a un valore ℓ nel punto
x0 (appartenente o meno al dominio di f ), e si scrive: limx→x0 f (x) = ℓ, se e solo se ogni successione
{b
xk }k∈N tale che limk→∞ x
bk = x0 abbia ℓ come limite delle sue immagini, cioè: limk→∞ f (b
xk ) = ℓ. Purtroppo, le successioni che tendono ad x0 sono infinite,
anzi sono addirittura ℵ2 ; da un punto di vista formale, pertanto, si preferisce la seguente definizione,
anche se il nostro intuito rimane piuttosto ancorato
alla precedente:
Definizione 8.3 Data una funzione f : R → R, si
dice che f tende ad ℓ per x che tende ad x0 , se e solo
se: ∀ǫ > 0, ∃δ ∈ R | ∀x ∈ (x0 − δ, x0 + δ) \ {x0 } si
ha |f (x) − ℓ| < ǫ. La funzione f si dice continua nel
punto x0 del suo dominio, se e solo se si ha:
lim f (x) = f (x0 ).
x→x0
Infine, la f è continua nell’intervallo (a, b) se è continua in tutti i punti dell’intervallo. Un punto x0 nel
quale la funzione f non sia continua, si dice punto di
discontinuità della funzione.
O
Figura 8.10: Funzione a scalini
Originariamente, nel 1600 e in parte del 1700,
quando si parlava di funzioni, si intendeva riferirsi
alle funzioni continue, cioè alle funzioni il cui grafico poteva essere tracciato in “modo continuo”, senza
mai dover ritirare la matita dal foglio. I matematici
avevano in mente le funzioni più comuni: i polinomi
(soprattutto parabole e cubiche), le coniche, le funzioni trigonometriche, e altre figure, ottenute spesso
“fisicamente” dal moto di un corpo e dalla traiettoria
di un punto fissato su di esso. Ad esempio, la famosa
cicloide si ottiene fissando un punto su una circonferenza e facendo ruotare questa lungo una retta. Ci
si accorse presto, però, che erano interessanti anche
funzioni più strane. Ad esempio, la funzione y = ⌊x⌋
ha una stupenda forma a scalini, e da essa è derivata
la famosa delta di Dirac che vale 1 per x = 0 e vale 0
in tutti gli altri punti. La funzione caratteristica del
numeri razionali (si veda Sezione 1.3) vale 1 per ogni
x razionale e vale 0 per ogni argomento irrazionale:
essa non è continua in alcuno dei suoi punti, ma se
per x0 razionale consideriamo solo le successioni di
numeri razionali, il limite della successione tende al
valore della funzione!
D’altra parte, una caso molto semplice e comune
di discontinuità è costituito dalle funzioni razionali
fratte: nei punti in cui il denominatore si annulla, la
funzione non è definita e quindi non può essere continua. Si consideri il semplice esempio y = 1/x, che
come sappiamo rappresenta un’iperbole. Nel punto
x = 0 la funzione non è definita. In questi casi ha
senso considerare il limite quando x → 0 per valori
233
8.4. IL CONCETTO DI LIMITE
negativi, cioè crescendo, e il limite quando x → 0 per
valori positivi, e quindi decrescendo. Questi due limiti si dicono, rispettivamente, sinistro e destro. E’
facile vedere che:
lim
x↑0
1
= −∞ e
x
lim
x↓0
1
= +∞,
x
tipo, disegnando la funzione ci si rende conto che x =
1 è una discontinuità fittizia e la funzione può essere
definita ponendo f (1) = −1. Col senno di poi, ci si
accorge che l’espressione può essere semplificata:
y=
x2
x−1
x−1
1
=
=
− 3x + 2
(x − 1)(x − 2)
x−2
dove le notazioni x ↑ 0 ed x ↓ 0+ sono di facile e questo rivela l’arcano. Naturalmente, è bene
interpretazione e rappresentano i due tipi di limite. imparare ad accorgersi prima di situazioni del genere.
Analogamente, per la funzione S a scalini si ha:
Altri casi di discontinuità fittizia sono più interessanti, poiché non sono risolubili in modo formale colim S(x) = 0 e lim S(x) = 1.
me il precedente. Tali esempi costituiscono perciò i
x↓1
x↑1
cosiddetti limiti notevoli e i principali vanno capiti e
Ciò ha portato a distinguere i punti di discontinuità mandati a memoria. Il caso più tipico è il limite della
in quattro specie:
funzione y = sin(x)/x quando x tende a zero. Qui la
frazione non è definita a causa dell’x a denominatore;
a
1. si dice discontinuità di 1 specie un punto x0
ma vediamo cosa succede quando x si avvicina a 0,
in cui il limite sinistro è diverso dal limite derimanendo però distinto da 0. Si disegni il cerchio gostro, ma entrambi sono finiti. In tal caso, x0
niometrico e immaginiamo di misurare la variabile x
determina un salto della funzione, e l’entità del
in radianti, come si deve sempre fare nell’analisi delle
salto è data dalla differenza dei due limiti. La
funzioni trigonometriche:
funzione a scalini ha un salto di ampiezza 1 in
Dalla Figura 8.1 si ha la disuguaglianza AP ≤
corrispondenza di tutti i numeri interi;
AU ≤ U B, che da un punto di vista trigonometri2. si dice discontinuità di 2a specie un punto x0 in co significa: sin(x) ≤ x ≤ tan(x). Dividendo tutto
cui esistono limite destro e limite sinistro, ma per sin(x):
x
almeno uno dei due è infinito. Questo è il caso
1≤
≤ cos(x).
sin(x)
dell’iperbole nel punto x0 = 0, ma anche della
Quando x ↓ 0 (rimanendo diverso da 0) il Teorema dei
funzione y = 1/(1 − x) nel punto x0 = 1;
Carabinieri
ci dice che x/ sin(x) rimane schiacciato
3. si dice discontinuità di 3a specie un punto x0 in fra 1 e cos(x) → 1, per cui il suo valore deve essere 1:
cui uno almeno dei due limiti sinistro e destro
non esiste. Ad esempio, la funzione y = sin(1/x)
sin(x)
x
= lim
= 1.
lim
nel punto x0 = 0 non ha nessuno dei due limiti;
x↓0
x↓0 sin(x)
x
essa infatti oscilla tra +1 e −1 senza convergere
In modo analogo si procede per il limite quando x ↑ 0,
ad alcun valore;
e ciò prova il nostro primo limite notevole.
4. si dice discontinuità fittizia un punto x0 per il
Il secondo limite che consideriamo sfrutta questo
quale la funzione non è definita, ma i limiti sini- primo risultato: vogliamo dimostrare che:
stro e destro hanno lo stesso valore ℓ. In questo
1 − cos(x)
1
caso, si può artificialmente definire f (x0 ) = ℓ e,
lim
= ,
2
x→0
chiaramente, la funzione diviene continua in x0 ;
x
2
da qui l’appellativo di “fittizia”.
nel senso che limite sinistro e destro assumono enI punti x0 di discontinuità fittizia hanno un aspet- trambi questo valore. Per x > 0 dalla formula di
to interessante, in quanto dalla forma analitica della bisezione si ha:
funzione ci si aspetterebbe un comportamento strano
1 − cos(x)
2 sin2 (x/2)
1 sin2 (x/2)
in x0 , mentre poi ci si accorge che, nella realtà, que=
=
·
.
x2
x2
2
(x/2)2
sto punto non ha niente di speciale. L’esempio più
semplice è costituito dalle funzioni del tipo:
Quest’ultimo valore ci riporta al caso precedente e
per x → 0 si ha ovviamente sin(x/2)/(x/2) → 1.
Pertanto, il limite sinistro della nostra funzione vale
1/2. Lasciamo il lettore a giocare con i valori assoluti
cercando di capire dove il denominatore si annulla, per far vedere che anche il limite destro è 1/2.
Altri limiti notevoli, come limx→0 tan(x)/x = 1 si
si trovano due valori x = 1 ed x = 2, che pertanto
rappresentano punti di discontinuità. Ma mentre x = riconducono al limite di sin(x)/x, che perciò è consi2 si vede essere un punto di discontinuità del secondo derato di fondamentale importanza. Nella prossima
y=
x2
x−1
;
− 3x + 2
234
CAPITOLO 8. TRIGONOMETRIA E CALCOLO
sezione, dopo aver introdotto la funzione esponenziale e quella logaritmica, vedremo come anche queste nuove funzioni diano origine a importanti limiti
notevoli.
Indubbiamente, anche quando sono limitate a certi
intervalli, le funzioni continue sono le più simpatiche,
proprio perché corrispondono meglio alla nostra intuizione. Alcune loro proprietà sono tanto evidenti
che potremmo considerarle senz’altro vere, ma le dimostreremo ora formalmente perché in Matematica,
si sa, è bene non fidarsi delle cose ovvie.
Teorema 8.21 Sia f (x) una funzione continua nell’intervallo chiuso [a, b] e siano m ed M i valori minimo e massimo che la funzione assume in tale intervallo. Allora, per ogni y ∈ [m, M ] esiste almeno
un valore di x tale che f (x) = y.
Prova:
Basta considerare la funzione continua
g(x) = f (x) − y e applicare il teorema precedente.
Talvolta può essere conveniente una generalizzazione
di questo teorema. Se f (x) è continua nell’intervallo
aperto (a, b), può essere che in uno o in entrambi gli
Teorema 8.19 (della permanenza del segno)
estremi la funzione vada a ±∞. Il teorema continua
Se f (x) è una funzione continua nell’intervallo (a, b)
a valere purché a minimo e a massimo si sostituiscano
ed è definita in x0 ∈ (a, b), allora esiste un intervallo
i concetti di estremo inferiore e superiore.
(x0 − δ, x0 + δ) in ogni punto x del quale f (x) ha lo
steso segno di f (x0 ).
Prova: Supponiamo che sia f (x0 ) > 0 e fissiamo
ǫ < f (x0 ). L’ipotesi di continuità ci dice che esiste
un intervallo (x0 − δ, x0 + δ) nel quale si ha |f (x) −
f (x0 )| < ǫ, cioè f (x0 ) − ǫ < f (x) < f (x0 ) + ǫ e, data
la scelta di ǫ, questo significa f (x) > 0 per ogni x
dell’intervallo. Analogo è il caso in cui sia f (x0 ) < 0.
8.5
Logaritmo ed esponenziale
Il concetto di logaritmo è stato introdotto nella Sezione 2.8 come una delle operazioni inverse dell’elevamento a potenza (l’altra operazione inversa è l’estrazione di radice). Pertanto, poiché 23 = 8, il logaritmo in base 2 di 8 è proprio 3; e poiché 34 = 81,
si ha log3 81 = 4. L’estensione dei logaritmi a tutti i
L’intuizione ci dice che se percorriamo con la penna numeri reali si è operata nella Sezione 3.6, dalla quale
una traiettoria continua e a un certo punto passiamo riportiamo le principali proprietà dei logaritmi:
da valori positivi a valori negativi (o viceversa), dobbiamo per forza transitare dal valore 0. Formalmente
loga (rv) = loga r + loga v
abbiamo:
loga (r/v) = loga r − loga v
loga (r√s ) = s loga r
Teorema 8.20 (zeri di una funzione continua)
loga s r = 1s loga r
Se la funzione f (x) è continua nell’intervallo chiuso
loga a = 1
[a, b] ed esistono due punti x1 , x2 ∈ [a, b] tali che
loga 1 = 0
f (x1 ) ed f (x2 ) hanno seg