Appunti File - e-Learning

MATEMATICA 1 – PAS 2014–2015
1.– RELAZIONI BINARIE. FUNZIONI.
1.1.– Relazioni binarie.
Siano A e B due insiemi non vuoti, l’insieme A × B costituito dalle coppie
ordinate di elementi di A e di B
A × B = { (a, b) : a ∈ A, b ∈ B }
è detto prodotto cartesiano di A e B.
Un sottoinsieme S del prodotto A × B viene chiamato relazione binaria
tra A e B; se la coppia (a, b) ∈ S diremo che l’elemento a sta nella relazione
individuata da S con b. Si usa indicare che a sta in una certa relazione (definita
da S) con b, scrivendo aRb e si legge che a sta nelle relazione R con b.
Facciamo dei semplici esempi. Siano A l’insieme dei cittadini italiani e B
l’insieme dei numeri positivi; la relazione sia la seguente: ”a ha, in centimetri,
l’altezza b”. Sia A = B l’insieme di tutti i cittadini europei, la relazione R sia
”a ha la stessa altezza di b”; un’altra semplice relazione sullo stesso insieme è
”a ha la stessa cittadinanza di b”. Ancora su A abbiamo la relazione ”a ha un
peso maggiore o uguale a quello di b”.
Se N è l’insieme dei numeri naturali, possiamo considerare su N × N la
relazione a ≥ b; un’altra relazione su questo stesso insieme è ”a è multiplo di
b”.
Le relazioni presentate negli esempi precedenti hanno differenti proprietà che
è opportuno evidenziare. Consideriamo solamente le relazioni di un insieme con
seé stesso.
La relazione ”a ha la stessa altezza di b” è tale che aRa, cioè ogni persona
ha la stessa altezza di sé stesso; diremo in questo caso che la relazione R è
riflessiva. Inoltre per la stessa relazione abbiamo che aRb implica bRa, cioè
se a ha la stessa altezza di b, allora b ha la stessa altezza di a: chiameremo
questa proprietà simmetria. Ancora, se aRb e bRc, allora aRc: diremo che la
relazione è transitiva.
Se consideriamo la relazione ”a ha un peso maggiore o uguale a quello di b”,
vediamo che non vale la simmetria, mentre valgono le altre due proprietà di riflessività e transitività. Per questa relazione vediamo che al posto della simmetria abbiamo che da aRb e bRa segue che a = b: questa proprietà viene
chiamata antisimmetria.
Una relazione R in un insieme A che sia riflessiva, simmetrica e transitiva
viene chiamata Relazione di equivalenza; una relazione che sia riflessiva,
antisimmetrica e transitiva viene chiamata Relazione d’ordine.
Ovviamente esistono relazioni che non sono né di equivalenza né d’ordine,
per esempio la relazione ”a è padre di b” non è né riflessiva, né simmetrica, né
transitiva.
1
1.2.– Le relazioni di equivalenza.
Sia A un insieme e sia R una relazione di equivalenza su A. Fissato a ∈ A,
consideriamo l’insieme
[a] = { b ∈ A : aRb },
chiamiamo tale insieme classe di equivalenza individuata da a. In questo modo
l’insieme A viene suddiviso in classi di equivalenza. Questa suddivisione è una
partizione, cioè classi di equivalenza divesre sono disgiunte. Infatti, supponiamo
che [a] ∩ [b] 6= ∅, allora esiste c ∈ [a] ∩ [b]; ciò significa che aRc e bRc, ma per la
simmetria cRb e per la transitività aRb, allora [a] = [b].
L’insieme costituito dalle classi di equivalenza viene indicato con A/R e
detto insieme quoziente di A rispetto alla relazione R.
1.3.– Le relazioni d’ordine.
Consideriamo fra gli esempi precedenti le due relazioni su N date da a ≥ b
e ”a è multiplo di b”. È immediato verificare che sono entrambe delle relazioni
d’ordine. Ma c’è una importante caratteristica che le distingue. Se prendiamo
due numeri interi positivi n e m si ha una delle seguenti proprietà:
n ≥ m;
m ≥ n;
n = m;
esprimiamo questo fatto dicendo che due elementi di N sono sempre fra loro
confrontabili nella relazione ≥. Una relazione d’ordine con questa proprietà
viene detta ordine totale o lineare.
Verifichiamo che la relazione d’ordine ”a è multiplo di b” non è totale; prendiamo i due interi 3 e 4: 3 non è multiplo di 4, 4 non è multiplo di 3 e 3 6= 4.
Una relazione d’ordine di questo tipo viene detta di ordine parziale.
1.4– Sul concetto generale di funzione.
Consideriamo una relazione R fra l’insieme A e l’insieme B, avente la seguente
proprietà: per ogni x ∈ A esiste un solo y ∈ B tale che xRy. Una relazione di
questo tipo viene chiamata funzione.
La formulazione piú usuale di funzione è la seguente. Siano A e B due
insiemi, una legge f univoca, cioè che associa a ciascun elemento x di A un solo
elemento y = f (x) di B, si dice funzione da A a B e viene indicata nella forma
f : A → B.
L’insieme A viene chiamato dominio o insieme di definizione della funzione,
B è il codominio o insieme di arrivo di f . L’elemento f (x) ∈ B viene detto
immagine di x tramite f . Se C è un sottoinsieme di A (si indica nel modo
seguente: C ⊂ A), il sottoinsieme di B costituito dalle immagini tramite f di
tutti gli elementi di C viene chiamato immagine di C e indicato con f (C).
2
Semplici esempi sono i seguenti:
1) A è l’insieme dei nati in Italia nell’anno 2000, B = R, e f associa a
ciascuno la propria altezza con approssimazione di un cm.
2) A = B = N e f (n) = 2n, cioè f manda ogni intero naturale nel suo
doppio.
3) A = B = R e f (x) = 3x2 .
4) A = B = R e f (x) = 6x − 8.
Esaminiamo gli esempi precedenti: nel primo esempio è chiaro che ci possono,
anzi ci saranno, due persone aventi la stessa altezza, quindi la funzione f può
associare a due o più persone differenti la stessa altezza.
Nell’esempio 2), interi distinti vengono mandati in interi distinti e l’immagine
f (N) non esaurisce N, ma consiste dei soli numeri pari.
In 3) l’immagine di R è costitutita da tutti i numeri reali maggiori od uguali
a 0 ed f (x) = f (−x) per ogni x ∈ R.
Finalmente, in 4) numeri distinti vanno in numeri distinti ed f (R) = R.
Le precedenti osservazioni ci portano alle definizioni seguenti.
Una funzione f : A → B si dice iniettiva se da x1 6= x2 segue f (x1 ) 6=
f (x2 ), cioè manda elementi distinti in elementi distinti.
Una funzione f : A → B si dice suriettiva se per ogni y ∈ B esiste x ∈ X
tale che f (x) = y.
Una funzione f : A → B che sia iniettiva e suriettiva si dice biiettiva. In
questo caso essa costitutisce una corrispondenza biunivoca fra A e B.
Se f : A → B è biiettiva, ad ogni y ∈ B possiamo far corrispondere l’unico
x ∈ A tale che f (x) = y; in questo modo abbiamo definito una funzione
g : B → A avente le seguenti proprietà:
f [g(y)] = y,
g[f (x)] = x.
Tale funzione g viene detta inversa di f e usualmente indicata con f −1 .
Se f : A → B e g : B → C, in modo del tutto naturale siamo portati a
costruire una funzione da A a C nel modo seguente: x ∈ A viene mandato
in f (x) ∈ B e questo da g viene mandato in g[f (x)]; questa nuova funzione
k : A → C viene detta composta di f e g nell’ordine e indicata con k = g ◦ f .
Se una funzione f : A → B è invertibile, allora la composizione con la sua
inversa produce una funzione da A in A che manda ogni x ∈ A in sé stesso;
tale funzione viene chiamata funzione identità o funzione identica e usualmente
indicata con IdA .
Se componiamo due funzioni f e g iniettive otteniamo ancora una funzione
iniettiva e se componiamo due funzioni f e g biiettive (cioè invertibili) otteniamo
una funzione invertibile. L’inversa di g ◦ f è f −1 ◦ g −1 .
3
2.– I NUMERI INTERI.
2.1.– Gli interi naturali.
Diamo per noto l’insieme N dei numeri naturali, vale a dire i numeri
1, 2, 3, · · · usati nel conteggio di oggetti. Esaminiamo più da vicino questo
insieme, studiando in particolare la operazioni che su di esso possono venire
effettuate.
La prima operazione, e la più naturale, è l’addizione o somma. Dati due
numeri naturali n ed m è ben definito il numero naturale loro somma n + m.
Questa operazione ha le seguenti proprietà:
commutativa: n + m = m + n,
associativa: (n + m) + r = n + (m + r).
La seconda operazione, derivata dall’addizione, è la moltiplicazione o prodotto
che viene cosı̀ definita:
n· m = m+ m + ···+ m.
|
{z
}
n
volte
Le proprietà della moltiplicazione sono:
commutativa: n · m = m · n,
associativa: (n · m) · r = n · (m · r),
esistenza dell’elemento neutro: n · 1 = n.
Notiamo che l’insieme N possiede anche un ordinamento, che come d’uso,
indichiamo coi simboli ≥, ≤, >, <. L’insieme N possiede un primo elemento,
il numero 1.
Se volessimo passare alle operazioni inverse di quelle appena indicate, vediamo che in generale non possono essere effettuate. Con questo intendiamo che
le due equazioni
(1)
n + x = m,
n · x = m,
sono risolubili in N, la prima solo se m > n e la seconda solo se m è un multiplo
di n.
La proprietà caratteristica dell’insieme N viene espressa del seguente principio o postulato di induzione:
Postulato di induzione.- Se S è un sottoinsieme di N avente le seguenti
proprietà:
1 ∈ S,
n∈S ⇒n+1∈S
allora S = N.
4
Vedremo nel seguito l’uso di questo postulato per produrre le dimostrazioni
per induzione.
2.2 – Gli interi relativi.
Ritorniamo al problema iniziale delle equazioni (1). Come primo passo si
pone il problema di estendere N in modo che le limitazioni precedentemente
viste siano completamente (o quasi) eliminate. L’estensione deve essere tale che
sul sottoinsieme N (o, meglio, sul sottoinsieme corrispondente ad N: vedremo
poi la definizione precisa) le nuove operazioni coincidano con quelle precedenti.
Per prima cosa costruiamo un insieme dove la prime delle equazioni (1) sia
sempre risolubile. Indichiamo con N0 l’insieme N ∪ {0} e consideriamo l’insieme
Z delle coppie ordinate
(n, m),
con n, m ∈ N0 ,
e fra queste coppie istituiamo la seguente relazione:
(n, m) si dice equivalente a (n∗ , m∗ )
se n + m∗ = n∗ + m.
Indichiamo col simbolo ∼ tale relazione ed osserviamo che possiede le tre proprietà seguenti:
riflessiva: (n, m) ∼ (n, m),
simmetrica: (n, m) ∼ (n∗ , m∗ ) se e solo se (n∗ , m∗ ) ∼ (n, m),
transitiva: (n, m) ∼ (n∗ , m∗ ) e (n∗ , m∗ ) ∼ (n′ , m′ ) implica (n, m) ∼ (n′ , m′ ).
Una relazione precedente è di equivalenza. La relazione ∼ (come tutte le relazioni di equivalenza) allora divide l’insieme Z in classi di equivalenza fra loro
disgiunte: due coppie di Z sono nella stessa classe se sono equivalenti. La
famiglia delle classi di equivalenza di Z rispetto a ∼, cioè l’insieme quoziente
Z/ ∼, viene indicato con Z.
Definiamo due operazioni su Z nel modo seguente:
addizione: (n, m) + (n∗ , m∗ ) = (n + n∗ , m + m∗ ),
moltiplicazione: (n, m) · (n∗ , m∗ ) = (nn∗ + mm∗ , nm∗ + n∗ m).
È facile verificare che sono entrambe commutative e associative, che esiste
l’elemento neutro per l’addizione, la coppia (0, 0), infatti (n, m) + (0, 0) =
(n, m); esiste l’elemento neutro per la moltiplicazione, la coppia (1, 0), infatti
(n, m) · (1, 0) = (n, m). Inoltre, data la coppia (n, m) vediamo che
(n, m) + (m, n) = (n + m, n + m) ∼ (0, 0),
ne segue che nel nuovo insieme numerico la sottrazione è sempre possibile, che
è quanto volevamo ottenere.
5
Osserviamo un fatto cruciale di semplice verifica:
se (n, m) ∼ (r, s) e (n∗ , m∗ ) ∼ (r∗ , s∗ ), allora
(n, m) + (n∗ , m∗ ) ∼ (r, s) + (r∗ , s∗ ) e (n, m) · (n∗ , m∗ ) ∼ (r, s) · (r∗ , s∗ ).
Questo ci dice che le due operazioni di somma e prodotto sono in realtà definite
su Z/ ∼= Z.
Data una coppia (n, m), se n > m allora essa è equivalente alla coppia
(n − m, 0), se n = m è equivalente a (0, 0), mentre se n < m è equivalente a
(0, m − n). Quindi, poiché ci basta considerare un rappresentante (una coppia)
per ogni classe di equivalenza, possiamo identificare Z con l’insieme delle coppie
aventi almeno un elemento uguale a 0. In particolare, se consideriamo le coppie
(n, 0) vediamo che
(n, 0) + (n∗ , 0) = (n + n∗ , 0),
(n, 0) · (n∗ , 0) = (nn∗ , 0),
cioè si comportano esattamente come gli interi naturali che stanno al primo
posto nella coppia. Allora identificheremo la coppia (n, 0) col numero n e di
conseguenza N risulta essere (isomorfo a) un sottoinsieme di Z.
Poiché (n, 0) + (0, n) ∼ (0, 0), è del tutto naturale indicare la coppia (0, n)
con −n. In conclusione, Z risulta costituito da N, da −N e dallo zero, in altre
parole, i numeri interi positivi, lo zero ed i numeri interi negativi.
Notiamo che anche l’insieme Z possiede un ordinamento, che come d’uso,
indichiamo coi simboli ≥, ≤, >, <. I numeri di N sono ordinati come in precedenza, quelli di −N sono posti in ordine inverso e tutti precedono quelli di N,
mentre lo zero si pone fra i due insiemi:
· · · < −5 < −4 < −3 < −2 < −1 < 0 < 1 < 2 < 3 << 4 < 5 < · · ·
Notiamo che mentre in N ogni sottoinsieme non vuoto ha l’elemento minimo,
ciò non è più vero per Z.
Osserviamo che per la definizione della moltiplicazione delle coppie, se n, m >
0 si ha
(−n)(−m) = (0, n) · (0, m) = (nm, 0) = nm,
quindi il prodotto di due numeri negativi è un numero positivo: meno per
meno fa più!
Con questo ampliamento abbiamo ottenuto l’insieme numerico Z nel quale
la prima della equazioni (1) è sempre risolubile.
2.3.– Massimo comun divisore e minimo comune multiplo. L’algoritmo
Euclideo.
Se a ∈ N0 e b un intero positivo. Allora esiste un unico intero q tale che
a = bq + r,
con 0 ≤ r < b.
6
Il numero q si dirà quoziente della divisione di a mediante b ed r è il resto.
Infatti, dato a, o a = bq per un certo q ( cioè a è multiplo di b o b è un
divisore di a, e scriveremo b|a), o è compreso fra due multipli consecutivi di b:
bq < a < b(q + 1) = bq + b.
Nel primo caso è r = 0, ne secondo caso r = a − bq > 0 e r < b.
Dati a, b ∈ N0 , indichiamo con (a, b) il loro massimo comun divisore.
Come si trova il m.c.d.? Mediante l’Algoritmo Euclideo.
Se a = bq + r, allora (a, b) = (b, r). Infatti, se u|a e u|b, allora u|r. Se v|b e
v|r, allora b = sv e r = tv, quindi
a = bq + r = svq + tv
e v|a. Quindi ogni divisore comune di a e b è anche divisore comune di b e r e
viceversa. Ne segue che (a, b) = (b, r).
Algoritmo Euclideo.
Siano a, b ∈ N0 , con b 6= 0 ( poiché (a, 0) = a). Allora, mediante divisioni
successive, abbiamo:
a = bq1 + r1 ,
0 < r1 < b,
b = r1 q2 + r2 , 0 < r2 < r1 ,
r1 = r2 q3 + r3 , 0 < r3 < r2 ,
···
rn−1 = rn qn+1 + rn+1 ,
rn+1 = 0.
Osserviamo che poiché b > r1 > r2 > · · · > rn > rn+1 , dopo al più b divisioni
otteniamo rn+1 = 0.
Allora per l’osservazione precedente è
(a, b) = (b, r1 ) = (r1 , r” ) = · · · = (rn , 0) = rn ,
quindi il m.c.d. (a, b) è l’ultimo resto non nullo del processo di divisioni
successive.
Le relazioni ottenute in precedenza ci danno anche le seguenti uguaglianze:
r1 = a − q1 b
r2 = b − q2 r1 = b − q2 a + q1 q2 b = −q2 a + (1 + q1 q2 )b,
···
rn = (a, b) = ka + hb
per certi h, k ∈ Z. Abbiamo quindi dimostrato il seguente
7
Teorema 2.3.1 - Se d = (a, b), allora esistono h, k ∈ Z tali che d = ka + hb.
Il minimo comune multiplo (m.c.m.) di due interi a e b non nulli è il
più piccolo intero divisibile sia da a che da b. Ovviamente il prodotto ab è
un multiplo comune dei due numeri ed il m.c.m. si otterrà dividendo questo
prodotto per il più grande divisore comune, cioè per il massimo comun divisore
(a, b). Abbiamo quindi
ab
m.c.m.(a, b) =
.
(a, b)
2.4 – I numeri primi e il Teorema Fondamentale dell’Aritmetica
Rammentiamo qui la definizione di numero primo: p ∈ N, p > 1, si dice
primo se gli unici suoi divisori sono 1 e p.
Uno dei più importanti risultati dell’antichità è il seguente Teorema di Euclide (Proposizione 20, Libro IX degli Elementi di Euclide).
Teorema di Euclide- Esistono infiniti numeri primi [Formulazione originaria: I numeri primi sono più di qualsiasi moltitudine assegnata di numeri
primi].
Dimostrazione di Euclide.- Siano A, B, C i numeri primi assegnati. Dico che
ci sono più primi di A, B, C.
Sia DE il più piccolo numero ”misurato” (cioè multiplo) da A, B, C. Aggiungiamo una unità a DE. Allora EF è primo oppure no.
Se EF è primo, allora A, B, C, EF sono primi e sono più di A, B, C.
Sia EF non primo, allora è misurato da qualche numero primo, sia G. Dico
che G è diverso da A, B, C. Se non lo fosse, allora A, B, C misurano DE e
quindi G misurerà DE. Ma esso misura anche EF , perciò G misurerà anche il
resto DF , l’unità: assurdo.
Quindi G è diverso da A, B, C, per ipotesi è primo e la moltitudine A, B, C, G
è maggiore della moltitudine A, B, C.
[Notiamo che la dimostrazione procede con una forma geometrica: i numeri
sono misure di segmenti. Inoltre considera il caso di una moltitudine iniziale di
tre numeri e mostra che ne esistono quattro: chiaramente il procedimento è del
tutto generale.]
Dimostrazione moderna.- Siano p1 , p2 , · · · , pn numeri primi distinti e sia
k = p1 p2 · · · pn + 1. Se q è un primo che divide k, allora q 6= pi , i = 1, 2, · · · , n,
8
altrimenti q|k e q|p1 p2 · · · pn , quindi q|1: assurdo. Ne segue che q, p1 , p2 , · · · , pn
sono n + 1 primi distinti.
Il lemma seguente costituisce la Proposizione 30 del VII Libro degli Elementi
di Euclide.
che
Lemma 2.4.1 - Se p è primo e p|ab, allora o p|a o p|b.
Dim.- Se p ∤ a, allora (a, p) = 1 e, per il Teorema 2.3.1, esistono h, k ∈ Z tali
ka + hp = 1.
Moltiplicando la precedente uguaglianza per b otteniamo
kab + hpb = b.
Poiché p|ab, è ab = pr e allora
b = kpr + hpb = p(kr + hb),
cioè p|b.
Come immediata conseguenza abbiamo che se p è primo e p|a1 a2 · · · ak , allora
p|ai per un certo i, 1 ≤ i ≤ k.
Siamo ora pronti per enunciare e dimostrare il
Teorema Fondamentale dell’Aritmetica- Ogni intero M ∈ N può essere
scomposto in un unico modo come prodotto di numeri primi.
Dim.- Iniziamo col mostrare per induzione che ogni intero può essere scomposto come prodotto di numeri primi. Sia S l’insieme degli interi aventi questa
proprietà; chiaramente 1 ∈ S e 2 ∈ S. Supponiamo che tutti gli interi 1, 2, · · · , n
siano in S e consideriamo n + 1: se n + 1 è primo, allora ha banalmente la proprietà richiesta, se non è primo significa che possiede un divisore m diverso da
1 e da n + 1 e quindi n + 1 = mr, con m, r ≤ n. Ma avendo supposto che ogni
intero minore o uguale a n è decomponibile in fattori primi, lo sono sia m che r
e quindi anche n + 1. Per il Postulato di induzione S coincide con N.
Supponiamo ora che M abbia due differenti scomposizioni in fattori primi:
M = p1 p2 · · · pr = q1 q2 · · · qs ,
con s ≥ r. Poiché p1 |M , allora, per il lemma precedente, p1 |qk per un certo k,
ma qk è primo, quindi p1 = qk ; senza perdita di generalità possiamo supporre
che k = 1. Consideriamo
M
= p2 · · · pr = q2 · · · qs .
p1
Ripetendo il procedimento r volte e riordinando come prima i qi avremo
1 = qr+1 · · · qs ,
9
assurdo. Allora r = s ed i fattori sono uguali.
Il Teorema fondamentale dell’Aritmetica ci permette di usare la decomposizione degli interi in fattori primi per il calcolo di massimo comun divisore
e minimo comune multiplo. Il massimo comun divisore (a, b) si ottiene considerando le decomposizioni in fattori primi di a e di b, prendendo i fattori
comuni alle due decomposizioni col massimo comune esponente e moltiplicandoli. Per esempio,
845036 = 22 × 173 × 43,
13294 = 2 × 172 × 23,
(845036, 13294) = 2 × 172 = 578.
Invece se vogliamo il m.c.m. dobbiamo prendere tutti i fattori comuni e non col
massimo esponente e moltiplicarli fra di loro; quindi
m.c.m.(845036, 13294) = 22 × 173 × 23 × 43 = 19435828.
3. – I NUMERI RAZIONALI.
Il nuovo passo consiste nel construire un ampliamento di Z nel quale anche
la seconda delle equazioni (1) sia risolubile. La procedura è molto simile a quella
usata per la costruzione di Z.
Consideriamo l’insieme Q delle coppie ordinate di numeri interi relativi, con
la limitazione che il secondo elemento sia non nullo, e le scriviamo subito nella
forma per noi usuale di frazione:
p
,
q
p, q ∈ Z,
q 6= 0.
Anche fra queste coppie istituiamo una relazione di equivalenza nel modo seguente:
p
q
si dice equivalente a
p∗
q∗
se
pq ∗ = p∗ q.
Indichiamo ancora col simbolo ∼ tale relazione; che sia una relazione di equivalenza segue da una semplice verifica. L’insieme quoziente Q/ ∼, cioè l’insieme
delle classi di equivalenza, verrà denotato con Q ed i suoi elementi vengono
chiamati numeri razionali.
Dpbbiamo ora istituire le operazioni fra gli elementi di Q, lasciando la semplice verifica che tali operazioni, come nel caso degli interi relativi, sono in realtà
definite su Q. Definiamo due operazioni su Q ne modo seguente:
p p∗
+ ∗
q
q
p
moltiplicazione:
q
addizione:
pq ∗ + p∗ q
,
qq ∗
p∗
pp∗
· ∗ = ∗.
q
qq
=
Queste due operazioni sono commutative, associative ed entrambe dotate di
elemento neutro: lo zero per l’addizione è ogni coppia del tipo 0q , qualunque sia
10
q, mentre l’unità per la moltiplicazione è ogni coppia della forma pp . Si verifica
molto facilmente che vale la proprietà distributiva del prodotto rispetto alla
somma.
Inoltre, data una coppia pq , la coppia −p
q ne è l’opposta:
p −p
0
+
= .
q
q
q
Analogamente, data pq , con p 6= 0, la coppia
q
p
ne è l’inversa o reciproca:
p q
pq
· = .
q p
pq
Come già detto, l’insieme Q è l’insieme delle classi di equivalenza e ogni suo
elemento può essere rappresentato da una frazione scelta nella classe corrispondente. Osserviamo che i numeri razionali della forma p1 possono essere messi
in corrispondenza biunivoca con gli interi relativi: a p1 corrisponde l’intero p, e
tale corrispondenza conserva le operazioni:
p + p∗
p p∗
+
=
,
1
1
1
p p∗
pp∗
·
=
.
1 1
1
Quindi identificheremo la frazione p1 con l’intero p e, in questo senso, Z risulta
essere un sottoinsieme di Q, o Q risulta essere un ampliamento di Z.
Grazie al fatto che ogni razionale non nullo ha un inverso, ogni equazione
della forma
rx + s = 0, r, s ∈ Q, r 6= 0,
è risolubile e la sua unica soluzione è − rs .
Possiamo quindi concludere queste procedure di ampliamento, avendo ottenuto quello che in termini tecnici si chiama campo, cioè un insieme dove sono
definite due operazioni eseguibili, con le loro inverse, senza limitazioni, eccetto
la divisione per 0, e aventi le due proprietà commutativa e associativa e legate
fra di loro dalla proprietà distributiva.
Anche l’insieme Q possiede un ordinamento totale definito come segue:
se
p, p∗ , q, q ∗ > 0,
p
p∗
< ∗
q
q
se
pq ∗ < p∗ q.
Le frazioni negative si ordinano in verso opposto:
se
p, p∗ , q, q ∗ > 0,
−p
p
p∗
−p∗
=− <− ∗ = ∗
q
q
q
q
se
p
p∗
> ∗.
q
q
Diversamente da quanto accade per Z, dove ogni elemento ha sia un antecedente che un consecutivo, in Q questo non è vero: fra due
razionali esiste
∗
∗
sempre un altro (infiniti!) razionale, per esempio, fra pq e pq∗ , con 0 < pq < pq∗ ,
troviamo la loro media aritmetica:
p
pq ∗ + p∗ q
p∗
<
<
.
q
2qq ∗
q∗
11
Al termine di queste procedure di ampliamento abbiamo tre insiemi numerici: gli interi naturali N, gli interi relativi Z ed i razionali
Q. Abbiamo visto che in Q ogni equazione di primo grado ammette
una e una sola soluzione.
Consideriamo la frazione pq , (p, q ∈ N) ed eseguiamo la divisione p : q. Ad
ogni passo otteniamo un resto r minore di q. Se ad un certo passo r = 0,
otteniamo quella che viene chiamata espressione decimale finita di pq :
p
= A, a1 a2 · · · ak ,
q
dove A ∈ N e 0 ≤ ai ≤ 9, i = 1, · · · , k. Se il resto è sempre non nullo, dopo al
più q divisioni un certo resto r si presenterà per la seconda volta (ricordiamo
che i resti possibili sono in numero di q) e tutti i resti seguenti si ripresenteranno
nello stesso ordine. Quindi abbiamo una espressione decimale periodica
p
= A, a1 a2 · · · ak b1 b2 · · · bn b1 b2 · · · bn · · · b1 b2 · · · bn · · · = A, a1 a2 · · · ak b1 b2 · · · bn .
q
Notiamo che tale espressione non può avere periodo 9, cioè essere della forma
A, a1 a2 · · · ak 9. Infatti in questo caso avremmo ad un certo punto un resto r
tale che r : q = 9 con resto ancora r, cioè
r = 9q +
r
9
⇔
r = 9q ⇔ r : q = 10,
10
10
assurdo.
In conclusione ad ogni numero razionale pq , (p, q ∈ N) positivo si associa una
espressione decimale finita o periodica senza periodo 9.
Viceversa ogni espressione decimale del tipo indicato rappresenta un numero
razionale positivo. Sia
α = A, a1 a2 · · · ak b1 b2 · · · bn ,
allora
10k+n α = Aa1 a2 · · · ak b1 b2 · · · bn , b1 b2 · · · bn ,
10k α = Aa1 a2 · · · ak , b1 b2 · · · bn ,
quindi sottraendo la seconda espressione dalla prima abbiamo
10k (10n − 1)α = 10k · 99
· · · 9} α = Aa1 a2 · · · ak b1 b2 · · · bn − Aa1 a2 · · · ak ,
| {z
nvolte
e finalmente
α=
Aa1 a2 · · · ak b1 b2 · · · bn − Aa1 a2 · · · ak
.
99
· · · 9} ·10k
| {z
nvolte
Ovviamente se abbiamo a che fare con un numero razionale negativo, basta
cambiargli segno, trovarne lo sviluppo decimale e mettere davanti un segno
”meno”.
12
4.– DIVERSE BASI PER I NUMERI.
La scrittura usuale degli interi è posizionale e in base 10. Ciò significa che
se scriviamo
25063
intendiamo quanto segue:
2 · 104 + 5 · 103 + 0 · 102 + 6 · 101 + 3 · 100 .
L’aggettivo posizionale indica che la posizione della cifra a partire da destra ci
dà la potenza di 10 (a partire da 0) che tale cifra moltiplica; decimale perchè
il numero è scomposto come somma di potenze di 10 moltiplicate per una cifra
α ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}.
È evidente che senza l’introduzione dello zero (o qualche simbolo equivalente)
la scrittura posizionale non è possibile.
Quando abbiamo a che fare con numeri razionali (non interi) dobbiamo aggiungere anche le potenze di 10 con esponente negativo. Cosı̀ 31, 47 è
3 · 101 + 1 · 100 + 4 · 10−1 + 7 · 10−2 .
Nota storica.- In Europa il primo ad introdurre la notazione decimale
è stato il Fiammingo Simon Stevin (Bruges 1548– L’Aia 1620), nel libro De
Thiende (Leida 1585), tradotto in francese come La Disme. La notazione usata,
molto pesante, è la seguente
Lo scozzese John Napier (o Nepero, Edimburgo 1550–1617) nel suo Mirifici logarithmorum canonis descriptio (Edimburgo 1614) introduce la moderna
notazione col punto (o virgola).
Il numero 10 che abbiamo usato come base non ha, dal punto di vista strettamente matematico, alcuna specifica proprietà che lo distingua da qualunque
altro numero maggiore di 1. Quindi possiamo scegliere come base ogni altro
numero intero maggiore di 1.
Prendiamo, per esempio, come base 2. Allora abbiamo a disposizione due
cifre 0 e 1. Il numero ”ventitre” si deve allora scomporre come segue:
1 · 24 + 0 · 23 + 1 · 22 + 1 · 21 + 1 · 20 = 10111.
13
Il numero razionale
2+
27
10
diviene
7
1
2
1 0 1
3
=2+ +
=2+ + + +
10
2 10
2 4 8 40
1 0 1
1
1
=2+ + + +
+
2 4 8 16 80
1 0 1
1
0
0
1
3
=2+ + + +
+
+
+
+ 7
2 4 8 16 32 64 128 2 · 5
1
1
1
1
1
2
=2+ + 3 + 4 + 7 + 8 + 9
= 10, 10110011.
2 2
2
2
2
2 · 10
Se prendiamo come base 3, le cifre disponibili sono 0, 1, 2 e, per esempio, il
numero ”quindici” sarà
32 + 2 · 3 = 120.
In un sistema non decimale valgono le stesse regole aritmetiche di quello
decimale, ma si devono usare tavole diverse per l’addizione e la moltiplicazione
(tavola Pitagorica in base differente). Per esempio, nel caso di base 3 abbiamo
per l’addizione
+
1
2
1
2
10
2
10
11
×
1
2
1
1
2
2
2
11
e per la moltiplicazione
5.– I NUMERI REALI E LA RETTA REALE.
5.1 – La continuità della retta.
Consideriamo una retta orientata sulla quale scegliamo un punto O come
origine e un segmento U come unità di misura; su questa retta depositiamo i
numeri interi relativi semplicemente portando verso destra e/o verso sinistra
tanti segmenti consecutivi congruenti ad U quanto è il numero da riportare.
Dopo di che possiamo depositare anche i numeri razionali: per esempio, per
riportare 45 dividiamo il segmento U in 5 parti uguali e ne riportiamo 4.
Quello che otteniamo è la cosiddetta retta razionale.
Ci domandiamo:
abbiamo in questo modo esaurito tutti i punti della retta?
La risposta è negativa. Vediamo perché.
14
Consideriamo un’equazione del tipo
x2 − 2 = 0,
È ben noto fin dall’antichità che non esiste alcun numero razionale il cui quadrato
è 2. La semplice dimostrazione procede come segue. Supponiamo, per assurdo,
che un tale razionale esista e sia pq . Allora
p 2
q
= 2 ⇔ p2 = 2q 2 ,
quindi il fattore 2 è deve apparire con potenza pari in p2 (eventualmente zero)
mentre ha potenza dispari in 2q 2 . Per il Teorema Fondamentale dell’Aritmetica
i due membri dell’uguaglianza devono avere gli stessi fattori primi: abbiamo
quindi una contraddizione.
Se interpretiamo geometricamente il risultato precedente, questo ci dice che
la diagonale di un quadrato è incommensurabile col lato del quadrato stesso.
Ma allora se sulla retta razionale costruiamo il quadrato sul segmento U e col
compasso (astratto!) riportiamo la diagonale sulla retta, la sua estremità destra
cade in un punto che non corrisponde ad alcun numero razionale: la retta
razionale presenta delle lacune!
Questo problema porta alla necessità di un ulteriore ampliamento di Q: la
costruzione dei numeri reali, cioè del campo R. La sua costruzione è di una
complessità sia tecnica che concettuale di livello ben più alto di quelle precedenti
e non verrà qui presentata in dettaglio.
Per fare questo iniziamo col definire con chiarezza cosa si intende per continuità della retta. Per presentare questo postulato procediamo nel modo seguente:
consideriamo una successione I1 , I2 , · · · , In , · · · di intervalli sulla retta razionale
(con ciò intendiamo che gli esttremi di tali intervalli sono punti corrispondenti
a numeri razionali), ciascuno dei quali contenuto nel precedente e tale che la
lunghezza dell’n–esimo intervallo tenda a zero al crescere di n (con questo intendiamo che comunque fissato un numero ε > 0, troviamo un M tale che ogni
intervallo In con n > M ha lunghezza minore di ε). Questa successione si dice
una successione monotona di intervalli. Possiamo ora formulare il
Postulato di continuità .–Per ogni successione monotona di intervalli
esiste uno (e un solo) punto della retta contenuto in tutti gli intervalli.
5.2 – Il campo dei numeri reali.
Possiamo ora dare un’idea della definizione e costruzione dei numeri reali non
razionali, i numeri irrazionali. Abbiamo visto che ogni numero razionale può
essere rappresentato in uno ed un sol modo come un allineamento decimale finito
o periodico (con l’esclusione del periodo 9). Possiamo allora dare la seguente
definizione:
15
Un numero reale è un allineamento decimale, finito o infinito.
Chiameremo irrazionali quei numeri dati da un allineamento decimale
infinito non periodico.
Vediamo come questa definizione si connette col postulato di continuità.
Consideriamo l’allineamento decimale infinito non periodico
A, a1 a2 a3 · · · an · · ·
dove A è un intero positivo e ai ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}. Costruiamo la
seguente successione monotona di intervalli:
I1 = [A, A+1], I2 = [A.a1 , A.(a1 +1)], · · · In = [A.a1 · · · an , A.a1 · · · (an +1)], · · ·
(ovviamente se ai = 9 allora al posto di ai porremo 0 ed aumenteremo di una
unità ai−1 ). Osserviamo che la lunghezza di In è 10−(n−1) . Per il Postulato di
continuità esiste un punto sulla retta comune a tutti gli intervalli, questo punto
individua il numero irrazionale corrispondente all’allineamento decimale assegnato. In questo senso il numero irrazionale è l’allineamento decimale.
Algoritmi di estrazione delle radice quadrata.
Concludiamo questo paragrafo presentando due algoritmi che permettono
di trovare la forma decimale con l’approssimazione che si desidera della radice
quadrata di un numero razionale positivo.
Il primo è un algoritmo iterativo molto semplice. Dato un numero positivo
A, prendiamo un numero positivo arbitrario x0 e definiamo
x1 =
cioè la media aritmetica fra x0 e
A
x0 .
x0 +
A
x0
2
,
In generale definiamo
xn+1 =
xn +
A
xn
2
.
La successione {xn } converge alla radice quadrata di A, infatti detto L il limite
per n → +∞ (limite cha si può facilmente dimostrare che esiste), dalla relazione
precedente otteniamo
L=
L+
2
A
L
,
da cui L2 = A.
Facciamo un semplice esempio: vogliamo ”calcolare” la radice quadrata di
2. Iniziamo prendendo x0 = 2, allora
x1 =
2+
2
2
2
= 1, 5,
x2 =
16
1, 5 +
2
2
1,5
= 1, 4166 · · · .
Abbiamo ottenuto due approssimazioni per eccesso della radice quadrata di 2.
Osserviamo che questo accade sempre, infatti
xn +
2
A
xn
2
=
1 2 A2
[x +
+ 2A] ≥ A ⇔ x4n − 2Ax2n + A2 = (x2n − A)2 ≥ 0,
4 n x2n
e questo è sempre verificato.
Il secondo algoritmo, che va sotto il nome di Rafael Bombelli, passo a passo
produce l’esatta cifra decimale, quindi dà una approssimazione per difetto.
Mostriamo innanzi tutto un esempio e poi passiamo alla dimostrazione.
Vogliamo calcolare le prime cifre decimali della radice quadrata di 1211.
Spezziamo il numero in blocchi di due cifre partendo da destra: 12.11, prendiamo
il più grande intero il cui quadrato sia minore di 12, cioè 3. Sottraiamo il
quadrato di 3 da 12 e accostiamo il secondo blocco, ottenendo 3.11.
Ora raddoppiamo 3 e moltiplichiamo per 10, abbiamo 60, quindi cerchiamo
la più grande cifra A2 tale che (60 + A2 ) × A2 ≤ 311. È A2 = 4 e 64 × 4 = 256.
La cifra 4 è la seconda cifra del numero cercato.
Sottraiamo 265 da 311 ottenendo 55 e, per proseguire, aggiungiamo due zeri:
55, 00.
Ripartiamo da 34, il doppio è 68, moltiplichiamo per 10 e cerchiamo la più
grande cifra A3 tale che (680 + A3 ) × A3 ≤ 5500. Otteniamo 7, quindi le prime
cifre della radice quadrata di 1211 sono 34, 7.
È evidente che possiamo proseguire finché vogliamo.
In questo esempio siamo partiti da un numero intero, ma la stessa procedura
è valida per i numeri razionali, osservando che la suddivisione in blocchi di due
cifre deve partire dalla virgola verso sinistra e verso destra.
Vediamo ora la dimostrazione della validità dell’algoritmo di Bombelli utilizzando, senza perdere di generalità, un numero intero.
Sia
N = αk βk αk−1 βk−1 · · · α0 β0 ,
dove αi e βi sono cifre. Scriviamo N evidenziando le potenze di 100:
N = αk βk · 100k + αk−1 βk−1 · 100k−1 + · · · + α0 β0
e sia Ak ∈ {1, 2, · · · , 9} il più grande intero tale che A2k ≤ αk βk , cioè
A2k ≤ αk βk < (Ak + 1)2 .
Chiaramente Ak è la prima cifra (a sinistra) della radice quadrata di N .
Se Ak−1 è seconda cifra, allora deve essere
(Ak · 10k + Ak−1 · 10k−1 )2 ≤ αk βk · 100k +αk−1 βk−1 · 100k−1
< (Ak · 10k + Ak−1 · 10k−1 + 10k−1 )2 .
17
Quindi, dividendo per 100k−1 e portando A2k · 100 al destra, otteniamo
Ak · 20 · Ak−1 + A2k−1 = Ak−1 (Ak · 20 + Ak−1 ) ≤ (αk βk − A2k ) · 100 + αk−1 βk−1
< (Ak−1 + 1)(Ak · 20 + Ak−1 + 1).
Ne segue che Ak−1 è il più grande intero fra 0 e 9 tale che
Ak−1 (Ak · 20 + Ak−1 ) ≤ (αk βk − A2k ) · 100 + αk−1 βk−1 ,
come previsto dalla procedura di Bombelli.
Nota storica.- Rafael Bombelli (Bologna, 1526 – Roma, 1572), è stato un
matematico e ingegnere. Nella sua formazione entrarono a far parte le questioni
matematiche dibattute in quel tempo: lesse le opere di Girolamo Cardano e seguı̀
la disputa tra Niccolò Tartaglia e un allievo di Scipione Dal Ferro, Antonio Maria
Del Fiore, sulla risoluzione delle equazioni di terzo grado. Ludovico Ferrari
poco più tardi scoprı̀ la formula per la soluzione delle equazioni di quarto grado.
La sua opera fondamentale, L’algebra, è stata pubblicata nel 1572. In questo
libro vengono prese in esame le radici quadrate di numeri negativi e chiamate
”quantità silvestri”, e vengono cosı̀ introdotti quelli che saranno poi chiamati
”numeri comlessi”.
5.3 – Il calcolo dei radicali.
Dato un numero reale non negativo a ed un intero positivo n, esiste uno e
un solo numero reale non negativo b tale che
bn = a.
Il numero b viene detto radice n–esima aritmetica (o positiva) di a e
indicato con
√
n
a.
Se a, b ≥ 0, valgono le seguenti relazioni:
√
√
( n a)m = n am ,
√
√
√
nm
n
ama=
am+n ,
r
1
n 1
= √
,
n
a
a
√
√
√
n
n
n
a b = ab.
La dimostrazione si basa sul fatto che due numeri non negativi sono uguali se
e solo se lo sono le loro potenze n–esime, n > 0. Dimostriamo, per esempio, la
seconda uguaglianza: elevando a potenza nm il primo membro otteniamo
am · an = an+m
che coincide con la potenza nm–esima del secondo membro.
18
Le relazioni precedenti suggeriscono l’uso di un diverso modo di scrittura,
precisamente
√
m
a n := n am .
Allora le precedenti uguaglianze non ricalcano altro che le usuali proprietà delle
potenze intere.
Abbiamo cosı̀ esteso la nozione di potenza dagli esponenti interi relativi agli
esponenti razionali.
Si osservi che tale estensione è valida solo per basi positive!
Come possiamo definire qualcosa come per esempio
3
√
2
?
Procediamo nel modo seguente: prendiamo la rappresentazione decimale di
√
2 = 1, 4142135624 . . .
√
2:
e consideruamo gli intervalli chiusi
[31 , 32 ], [314/10 , 315/10 ], [3141/100 , 3142/100 ], · · · ;
essi costituiscono una successione monotona di intervalli e di conseguenza
indi√
2
viduano uno e un solo numero reale; tale numero è, per definizione, 3 .
6.– CONGRUENZE E CRITERI DI DIVISIBILITÀ.
Consideriamo i resti della divisione per 5 dei numeri interi:
0 = 0 · 5 + 0,
5 = 1 · 5 + 0,
10 = 2 · 5 + 0,
·········
1 = 0 · 5 + 1,
6 = 1 · 5 + 1,
11 = 2 · 5 + 1,
2 = 0 · 5 + 2,
7 = 1 · 5 + 2,
3 = 0 · 5 + 3,
8 = 1 · 5 + 3,
12 = 2 · 5 + 2,
4 = 0 · 5 + 4,
9 = 1 · 5 + 4,
13 = 2 · 5 + 3,
14 = 2 · 5 + 4,
I resti ovviamente si ripetono (deve essere 0 ≤ r ≤ 5); diremo che due numeri
a, b ∈ Z sono congrui modulo 5 se divisi per 5 danno lo stesso resto.
In generale
a, b ∈ Z sono congrui modulo d 6= 0 se divisi per d danno lo stesso resto.
Ciò significa che
a = q1 d + r,
b = q2 d + r,
quindi
a − b = (q1 − q2 )d = nd,
per un certo n ∈ Z. Viceversa, se a − b = nd, allora
a = nd + q2 d + r = (n + q2 )d + r,
19
quindi a e b divisi per d danno lo stesso resto.
Scriveremo
a ≡ b (mod d)
(notazione dovuta a Gauss).
Proprietà delle congruenze:
• 1.) a ≡ a (mod d);
• 2.) a ≡ b (mod d) ⇒ b ≡ a (mod d);
• 3.) a ≡ b (mod d)
e b ≡ c (mod d) ⇒ a ≡ c (mod d).
Quindi la congruenza è una relazione di equivalenza e l’insieme Z viene
suddiviso in d classi di equivalenza, gli elementi di ogni classe sono tutti e soli
gli interi fra loro congrui modulo d.
Si vede facilmente che valgono le seguenti ulteriori proprietà:
a ≡ a′
e b ≡ b ′ ⇒ a ± b ≡ a′ ± b ′
e
ab ≡ a′ b′ (mod d).
Se indichiamo con Zd l’insieme delle classi di congruenza, le proprietà sopra
indicate dicono che (Zd , +) è un gruppo commutativo che possiamo identificare
con {0, 1, 2, · · · , d − 1}.
Utilizziamo le proprietà delle congruenze per ottenere dei criteri di divisibilità.
- Divisibilità per 3 e per 9.
10 ≡ 1 (mod 3 o 9), quindi 10n ≡ 1 (mod 3
rappresentazione decimale
o 9). Sia z ∈ N con
z = a0 + a1 · 10 + a2 · 102 + · · · + an · 10n .
z è divisibile per 3 o 9 se e solo se z ≡ 0 (mod 3
divisione di z per 3 o 9 è lo stesso della divisione di
o 9). Ma il resto della
s = a0 + a1 + a2 + · · · + an .
Possiamo allora concludere che z è divisibile per 3 o 9 se e solo se la somma
delle sue cifre è divisibile per 3 o 9.
Da quanto detto sopra otteniamo facilmente la prova del 9 sia per la moltiplicazione che per la divisione.
Moltiplichiamo z × w, dove
z = a0 + a1 · 10 + a2 · 102 + · · ·+ an · 10n ,
w = b0 + b1 · 10 + a2 · 102 + · · · + bk · 10k ,
e sia il loro prodotto
zw = t = c0 + c1 · 10 + c2 · 102 + · · · + cr · 10r .
20
Sappiamo che
z ≡ (a0 + a1 + a2 + · · · + an ) (mod 9)
e, se sommiamo le cifre di a0 + a1 + a2 + · · · + an , poi quelle risultato ottenuto,
eccetera, fino ad avere una cifra soltanto, sia A, è
z ≡ A (mod 9).
Analogamente avremo
w ≡ B (mod 9),
t ≡ C (mod 9).
Dalle proprietà delle congruenze sappiamo che deve essere
AB ≡ C (mod 9),
o, che è lo stesso, detta Γ la cifra ottenuta sommando reiteratamente le cifre di
AB,
Γ = C.
Ecco allora la ben nota regola:
A
Γ
B
C
e deve essere Γ = C.
Osserviamo che tale prova non garantisce che la moltiplicazione affettuata
sia esatta, ma sicuramente se Γ 6= C la moltiplicazione è errata.
La regola per la divisione senza resto si ricava immediatamente da quella per
la moltiplicazione, infatti se u : s = q, allora s × q = u; quindi nella tabella
S
∆
Q
U
S è la somma reiterata delle cifre del divisore, U di quelle del dividendo, Q del
quoziente e ∆ del prodotto SQ; deve essere ∆ = U .
Nel caso in cui ci sia un resto r, la somma R delle sue cifre va aggiunta a ∆,
ottenendo, dopo riduzione ad una sola cifra, ∆∗ .
- Divisibilità per 7.
10 ≡ 3 (mod 7),
103 ≡ −1 (mod 7),
105 ≡ −2 (mod 7),
107 ≡ 3 (mod 7),
102 ≡ 2 (mod 7),
104 ≡ −3 (mod 7),
106 ≡ 1 (mod 7),
···
21
Allora
z = a0 + a1 · 10 + a2 · 102 + · · · + an · 10n .
è divisibile per 7 se e solo se
r = a0 + 3a1 + 2a2 − a3 − 3a4 − 2a5 + a6 + 3a7 + · · ·
è divisibile per 7
- Divisibilità per 11.
102 ≡ 1 (mod 11),
10 ≡ −1 (mod 11),
103 ≡ −1 (mod 11),
···
Allora tutti i numeri 10 + 1, 102 − 1, 103 + 1 ecc. sono congrui a 0 modulo 11
(sono divisibili per 11). Ne segue che
a1 · 11 + a2 · (102 − 1) + a3 · (103 + 1) · · · = z − [a0 − a1 + a2 − a3 + · · · ] = z − t
è divisibile per 11 o, equivalentemente, che
z ≡ t (mod 11).
quindi z è divisibile per 11 se e solo se t = a0 − a1 + a2 − a3 + · · · è divisibile
per 11.
Sappiamo che ab = 0 se e solo se a = 0 o b = 0. Vale la stessa cosa per le
congruenze? Cioè, è vero che
ab ≡ 0 (mod d) ⇒ a ≡ 0 (mod d) o
b ≡ 0 (mod d) ?
La risposta è negativa: 2 · 3 ≡ 0 (mod 6) ma né 2 né 3 è congruo a 0 modulo 6.
Quando sarà vero? Ricordiamo che ab ≡ 0 (mod d) significa d|ab e sappiamo
che se d è primo allora d|a o d|b, cioè
a ≡ 0 (mod d)
o b ≡ 0 (mod d).
Come conseguenza abbiamo che, se d è primo, allora ab ≡ ac (mod d) se e solo
se b ≡ c (mod d).
Il ”piccolo” teorema di Fermat.
Teorema di Fermat- Se p è un primo non divisore dell’intero a, allora
ap−1 ≡ 1 (mod p).
Dimostrazione.– Consideriamo i multipli di a
m1 = a,
m2 = 2a,
m3 = 3a, · · · , mp−1 = (p − 1)a.
22
Nessuna coppia di questi numeri interi può essere congrua modulo p, poiché in
tal caso p sarebbe un divisore di
ms − mr = (s − r)a,
Allora dovrebbe p dividere s − r, in quanto per ipotesi non divide a; ma s − r <
p, quindi abbiamo l’asserto. Analogamente si conclude che nessuno di questi
numeri può essere congruo a 0. Perciò i numeri m1 , m2 , · · · , mp−1 devono essere
rispettivamente congrui ai numeri 1, 2, 3, · · · , p−1, considerati in un certo ordine.
Ne segue che
m1 m2 · · · mp−1 ≡ 1 · 2 · 3 · · · (p − 1) (mod p),
cioè, posto K = 1 · 2 · 3 · · · (p − 1),
K(ap−1 − 1) ≡ 0 (mod p).
Ma K non è divisibile per p, poiché non lo è nessuno dei suoi fattori; quindi
(ap−1 − 1) deve essere divisibile per p, cioè
ap−1 − 1 ≡ 0 (mod p).
Dato un intero positivo n, indichiamo con ϕ(n) il numero degli interi fra 1
e n, che sono primi con n. Questa funzione è stata introdotta da Eulero ed ha
grande importanza nella teoria dei numeri.
Calcoliamo i valori di ϕ(n), per i primi valori di n:
ϕ(1) = 1,
ϕ(2) = 1,
ϕ(3) = 2,
ϕ(4) = 2,
ϕ(5) = 4,
ϕ(6) = 2,
ϕ(7) = 6,
ϕ(8) = 4,
ϕ(9) = 6,
ϕ(10) = 4,
ϕ(11) = 10,
ϕ(12) = 4.
Osserviamo che se p è primo, allora ϕ(p) = p − 1; se n è composto e la sua
scomposizione in fattori primi è
αr
1 α2
n = pα
1 p2 · · · pr
si ha
ϕ(n) = n 1 −
1
1
1
1−
··· 1−
,
p1
p2
pr
Usando la funzione di Eulero, possiamo generalizzare il teorema di Fermat
nella seguente forma:
Teorema 6.1- Se n è un intero e a è primo con n, allora
aϕ(n) ≡ 1 (mod n).
23
La dimostrazione ricalca fedelmente quella del Teorema di Fermat.
Vediamo una importante applicazione del risultato precedente alla crittografia
a chiave pubblica.
Iniziamo con l’osservare che se n = pq, p e q primi differenti, allora ϕ(n) =
(p − 1)(q − 1). Quindi se (a, n) = 1, abbiamo
a(p−1)(q−1) ≡ 1 (mod pq).
se m è un intero positivo qualsiasi, è allora
am(p−1)(q−1) ≡ 1 (mod n).
Fissati i due primi p e q, sia reso pubblico n = pq, si prenda un intero e primo
con (p−1)(q−1) e sia anch’esso reso pubblico. Sia ora a un numero, per esempio
quello di una carta di credito, primo con n. Costruiamo ae e sia
b ≡ ae (mod n).
Anche se b è reso noto, dobbiamo cercare di ricostruire a. Per fare questo
prendiamo un numero d ∈ {1, 2, . . . , (p − 1)(q − 1)} tale che
de ≡ 1 (mod (p − 1)(q − 1)),
allora è
de = 1 + m(p − 1)(q − 1)
per un certo m e
ade = a1+m(p−1)(q−1) ≡ a (mod n).
Tutto il problema di decrittazione sta nel trovare d, ma questo richiede di trovare
p e q: problema molto complesso se sono numeri grandi. Nel 2009 un gruppo di
ricercatori usando centinaia di calcolatori paralleli sono riusciti a scomporre in
fattori primi un numero di 232 cifre, ma impiegando due anni!
Nota storica.- Pierre de Fermat (Beaumont-de-Lomagne, 17 agosto 1601
- Castres, 12 gennaio 1665) è stato un matematico e magistrato francese. Fu
tra i principali matematici della prima metà del XVII secolo e diede importanti
contributi allo sviluppo della matematica moderna: con il suo metodo per la
individuazione dei massimi e dei minimi delle funzioni precorse gli sviluppi del
calcolo differenziale. Fece ricerche di grande importanza sulla futura teoria dei
numeri, iniziate durante la preparazione di un’edizione della Arithmetica di Diofanto, su cui scrisse note ed osservazioni contenenti numerosi teoremi. Proprio
in una di queste osservazioni ”a margine” enunciò il cosiddetto ultimo teorema
di Fermat (che credeva, molto probabilmente a torto, di aver dimostrato), che
è rimasto indimostrato per più di 300 anni, fino al lavoro di Andrew Wiles nel
1994. Scoprı̀ indipendentemente da Cartesio, i principi fondamentali della geometria analitica e, attraverso la corrispondenza con Blaise Pascal, fu uno dei
fondatori della teoria della probabilità.
24
Leonhard Euler, noto in Italia come Eulero (Basilea, 15 aprile 1707 San
Pietroburgo, 18 settembre 1783), è stato un matematico e fisico svizzero. È
considerato il pi importante matematico dell’Illuminismo e per essere tra i pi
prolifici di tutti i tempi. Ha fornito contributi storicamente cruciali in svariate
aree: analisi infinitesimale, funzioni speciali, meccanica razionale, meccanica
celeste, teoria dei numeri, teoria dei grafi. Sembra che Pierre Simon Laplace
abbia affermato ”Leggete Eulero; egli il maestro di tutti noi”.
Anche se fu prevalentemente un matematico diede importanti contributi alla
fisica e in particolare alla meccanica classica e celeste. Inoltre determinò le orbite
di molte comete.
Eulero tenne contatti con numerosi matematici del suo tempo. Complessivamente esistono 886 pubblicazioni di Eulero. Buona parte della simbologia
matematica tuttora in uso venne introdotta da Eulero, per esempio i per i numeri immaginari, Σ come simbolo per la sommatoria, f (x) per indicare una
funzione. Diffuse l’uso della lettera π per indicare pi–greco.
7.– CALCOLO LETTERALE. POLINOMI.
7.1– Calcolo letterale.
Rammentiamo brevemente cosa si intende per calcolo letterale. Si tratta
di utilizzare espressioni ove accanto a numeri compaiono quantità suscettibili
di assumere differenti valori in un determinato ambito numerico e che vengono
indicate con lettere. Consideriamo innanzi tutto espressioni del tipo
5a2 bc3 x,
1
abx3 y,
2
3a−1 bz, etc.
I numeri 5, 12 e 3 rispettivamente, si diranno coefficienti numerici dell’espressione
letterale. Due di queste espressioni si diranno simili se hanno la stessa parte
letterale, per esempio 5a2 bc3 x e 12 a2 bc3 x sono simili, mentre non lo sono 5a2 bc3 x
e 5a2 bc3 .
Su tali espressioni letterali possono essere effettuate operazioni di somma e
prodotto aventi le usuali proprietà formali: associatività, commutatività e distributività. La somma (differenza) di due espressioni letterali simili è l’espressione
simile ai due addendi ed avente come coefficiente numerico la somma (differenza)
dei due coefficienti numerici. Se due espressioni letterali non sono simili, la loro
somma (differenza) rimane solamente indicata. Per esempio,
1
11 2 3
5a2 bc3 x + a2 bc3 x =
a bc x;
2
2
5a2 bc3 x + 5a2 bc3 rimane solo indicata.
Il prodotto di due espressioni letterali del tipo precedente si effettua moltiplicando i coefficienti numerici e sommano gli esponenti di tutte lettere che
compaiono nelle due espressioni, per esempio
1
5
(5a2 bc3 x) · ( abx3 y) = a3 b2 c3 x4 y.
2
2
25
Il quoziente di due espressioni letterali del tipo precedente si effettua dividendo
i coefficienti numerici e sottraendo gli esponenti del divisore da quelli del dividendo per tutte lettere che compaiono nelle due espressioni, per esempio
1
(5a2 bc3 x) : ( abx3 y) = 10ac3 x−2 y −1 .
2
La proprietà distributiva ci permette di calcolare prodotti del tipo
1
1
1
(5a2 bc3 x + 5a2 bc3 ) · ( abx3 y + 7xy) = (5a2 bc3 x) · ( abx3 y + 7xy) + (5a2 bc3 ) · ( abx3 y + 7xy) =
2
2
2
1
1
2 3
3
2 3
2 3
3
2 3
(5a bc x) · ( abx y) + (5a bc x) · (7xy) + (5a bc ) · ( abx y) + (5a bc ) · (7xy)) =
2
2
5 3 2 3 4
5 3 2 3 3
2 3 2
2 3
a b c x y + 35a bc x y + a b c x y + 35a bc xy.
2
2
7.2– Monomi e polinomi.
Fissiamo ora l’attenzione su una lettera, sia x, e consideriamo una espressione letterale ove x compare con potenza intera positiva, come 5a−1 bx2 . Una
espressione come la precedente si chiama monomio in x di grado 2. In generale, un monomio in x di grado n è una espressione della forma Axn , dove A è
una espressione letterale non contenente x, per esempio
6ax3 ,
−
1 6
x , ecc.
3abc
Due monomi si diranno simili se hanno lo stesso grado in x, per esempio
6ax3
e
[−3abc + 5c]x3
sono monomi simili e la loro somma verrà indicata come
(6a − 3abc + 5c)x3 .
Un polinomio è una somma di monomi di gradi differenti e il grado del
polinomio è il massimo dei gradi dei monomi che lo compongono. Cosı̀ un
polinomio di grado n in x ha la forma
Pn (x) = A0 xn + A1 xn−1 + · · · + An−1 x + an ,
dove i coefficienti Ai sono espressioni letterali non contenenti x. La somma e il
prodotto di polinomi si effettua estendendo in modo ovvio quanto mostrato per
i monomi.
Qualora i coefficinti Ai siano tutti numeri appartenenti a Q o a R diremo
che il polinomio è a coefficieneti razionali o reali rispettivamente.
26
7.3– Divisione fra polinomi.
Se Pn (x) è un polinomio a coefficienti reali di grado n e Sm (x) è un polinomio
a coefficienti reali di grado m, con m ≤ n, allora esistono, e sono unici, due
polinomi a coefficienti reali Qn−m (x) e Rt (x), t < m, tali che
Pn (x) = Qn−m (x)Sm (x) + Rt (x).
Il polinomio Qn−m (x) si dice quoziente della divisione per Sm (x) e Rt (x) resto
della divisione.
Supponiamo che S1 (x) = x − ξ, allora
Pn (x) = (x − ξ)Qn−1 (x) + r.
Poniamo x = ξ: otteniamo Pn (ξ) = r; allora Pn (x) è divisibile per (x − ξ) se e
solo se Pn (ξ) = 0.
Se Pn (x) è divisibile per (x − ξ), il quoziente Qn−1 (x) si può determinare
usando la Regola di Ruffini.
Mostriamo questa regola con un esempio: dividiamo x4 − x3 + 2x2 − x − 1
per (x − 1).
1
1
1
-1 2 -1
1 0
0 2
-1
2
1
Il quoziente è il polinomio Q3 (x) = x3 + 2x + 1.
27
1
0
8.– EQUAZIONI E DISEQUAZIONI.
8.1– Equazioni.
Siano A(x) e B(x) due espressioni (peraltro qualsiasi) contenenti una lettera
x (eventualmente assieme ad altre considerate come parametri) e ci chiediamo
per quali valori di x in un certo insieme numerico E si ha
(e)
A(x) = B(x).
La (e) è una equazione nell’incognita x e ogni valore ξ ∈ E che sostituito in
A e B rende vera l’uguaglianza
A(ξ) = B(ξ)
si dirà soluzione dell’equazione (e).
La (e) potrà non avere soluzioni in E e si dirà impossibile, potrà avere
un numero finito o infinito di soluzioni oppure ogni numero di E potrà essere
soluzione: in quest’ultimo caso si dirà anche che la (e) è una identità in E.
Es.- L’equazione 5x = 3 in Z è impossibile; la stessa equazione in Q ha
l’unica soluzione ξ = 3/5.
L’equazione 10x = 7x ha l’unica soluzione ξ = 0.
2
L’equazione x
√ − 1 = 1 non ha soluzioni in Q; nel campo reale R ha due
soluzioni: ξ = ± 2.
sin x = 1 ha in R le infinite soluzioni ξ = π2 + 2kπ, k ∈ Z.
sin2 x = 1 − cos2 x ha come soluzioni tutti i numeri reali: è quindi una
identità.
Chiameremo equazioni algebriche quelle dove A(x) e B(x) sono espressioni nelle quali si opera su x solamente con le operazioni razionali.
D’ora in avanti considereremo solo equazioni algebriche.
Due equazioni A(x) = B(x) e A′ (x) = B ′ (x) si dicono equivalenti su E se
hanno le stesse soluzioni in E.
L’equazione A′ (x) = B ′ (x) si dice conseguenza di A(x) = B(x) se fra le
sue soluzioni ci sono tutte quelle di A(x) = B(x).
Principi di equivalenza.
Sommando (o sottraendo) ad entrambi i membri di una equazione una stessa
espressione si ottiene un’equazione equivalente.
Questo permette di scrivere ogni equazione nella forma R(x) = 0.
Moltiplicando o dividendo entrambi i membri di una equazione per una stessa
espressione che non si annulla in E, si ottiene una equazione equivalente.
Da questi due principi otteniamo che una equazione algebrica, nell’insieme
E ⊂ R dove esiste, è equivalente ad una equazione della forma Pn (x) = 0, dove
Pn è un polinomio di un certo grado n.
28
8.2– Equazioni polinomiali.
Una equazione polinomiale ha la forma
a0 xn + a1 xn−1 + · · · + an−1 x + an = 0.
L’esistenza ed il numero delle soluzioni dipendono dall’insieme numerico dove
vengono presi i coefficienti e cercate le soluzioni: N, Z, Q, R o C.
Il numero n, grado del polinomio, è detto anche grado dell’equazione (se
a0 6= 0).
Teorema 8.2.1- Se l’equazione polinomiale
a0 xn + a1 xn−1 + · · · + an−1 x + an = 0
ha coefficienti interi (ai ∈ Z), allora ogni soluzione razionale p/q, q ≥ 1,
(p, q) = 1, è tale che p|an e q|a0 .
Dim.- Sia p/q una soluzione razionale, allora
a0
pn
pn−1
p
+
a
+ · · · + an−1 + an = 0
1
qn
q n−1
q
o, moltiplicando per q n ,
a0 pn + a1 qpn−1 + · · · + an−1 q n−1 p + an q n = 0;
quindi
a0 pn = −[a1 qpn−1 +· · ·+an−1 q n−1 p+an q n ] = −q[a1 pn−1 +· · ·+an−1 q n−2 p+an q n−1 ].
Ne segue che q|a0 pn ; ma q non ha fattori comuni con pn , quindi q|a0 .
Analogamente, da
an q n = −p[a0 pn−1 + · · · + an−1 q n−1 ]
segue che p|an .
Poiché i divisori di a0 e an sono in numero finito, cosı̀ sono le possibili
soluzioni razionali. Con una semplice sostituzione si verifica se sono soluzioni
oppure no. Quindi l’equazione
a0 xn + a1 xn−1 + · · · + an−1 x + an = 0
ai ∈ Z, x ∈ Q, si risolve semplicemente mediante un numero finito di verifiche.
Ovviamente tutto questo vale anche se ai ∈ Q: basta moltiplicare per il
denominatore comune e ricondursi a coefficienti interi.
Abbiamo visto nel paragrafo precedente che se Pn (ξ) = 0, cioè ξ è soluzione
dell’equazione Pn (x) = 0, allora
Pn (x) = (x − ξ)Qn−1 (x).
29
Poiché ad ogni divisione per un binomio della forma (x − ξ) otteniamo un
quoziente di un grado più basso, questo può essere fatto al più n volte. In
altri termini l’equazione
Pn (x) = 0
ha al più n soluzioni.
8.3– Equazioni di I, II, III e IV grado.
La generica equazione di primo grado ha la semplice forma
a 6= 0,
ax + b = 0,
a, b ∈ R,
ed è sempre risolubile con la sola soluzione ξ = − ab .
La generica equazione di secondo grado ha la forma
ax2 + bx + c = 0,
a 6= 0,
a, b, c ∈ R.
Per determinarne le (eventuali) soluzioni procediamo col metodo del ”completamento del quadrato”. Moltiplichiamo per 4a e poi sommiamo e sottraiamo
b2 , otteniamo
4a2 x2 + 4abx + b2 − b2 + 4ac = (2ax + b)2 − (b2 − 4ac) = 0.
Se b2 − 4ac < 0 non ci sono soluzioni in R, in quanto l’espressione al primo
membro è sempre maggiore di 0.
Se b2 − 4ac ≥ 0, abbiamo
(2ax + b)2 = b2 − 4ac
e quindi
√
b2 − 4ac
.
2a
Allora se b2 − 4ac > 0, abbiamo due soluzioni distinte
√
√
−b + b2 − 4ac
−b − b2 − 4ac
ξ1 =
,
ξ2 =
;
2a
2a
x=
−b ±
se b2 − 4ac = 0 abbiamo una soluzione ξ = −b
2a di molteplicità due: ciò significa
che
ax2 + bx + c = a(x − ξ)2 .
La generica equazione di terzo grado ha la forma
ax3 + bx2 + cx + d = 0,
a 6= 0,
a, b, c, d ∈ R.
Facciamo un cambiamento di variabile in modo da eliminare il termine di secondo grado. Poniamo x = y − s e sostituiamo nel primo membro ottenendo
ay 3 − 3ay 2 s + 3ays2 − as3 + by 2 − 2bys + bs2 + cy − cs + d
= ay 3 − (3as − b)y 2 + (3as2 − 2bs + c)y − as3 + bs2 − cs + d.
30
b
Scegliendo s = 3a
eliminiamo il termine di secondo grado.
In conclusione, ogno equazione di terzo grado può essere scritta nella forma
x3 − 3px − 2q = 0,
supponiamo p 6= 0, altrimenti la situazione è banale.
È sufficiente determinare una soluzione α, poi dividendo per x− α otteniamo
un polinonio di secondo grado del quale sappiamo trovare le radici.
Per ottenere una soluzione, poniamo x = u + v e p = uv e sostituendo
abbiamo
u3 + v 3 − 2q = 0.
Ma v =
p
u
( u 6= 0 poiché p 6= 0) e allora
u6 − 2qu3 + p3 = 0.
Questa è una equazione di secondo grado in u3 , da cui
q
p
3
u = q + q 2 − p3
è una soluzione. Da v 3 = 2q − u3 otteniamo
q
p
3
v = q − q 2 − p3
e quindi una soluzione dell’equazione è
q
q
p
p
3
3
ξ = q + q 2 − p3 + q − q 2 − p3 .
Osserviamo che nella formula risolutiva, la cosiddetta formula di Cardano, compare una radice quadrata, quindi il radicando q 2 − p3 devrebbe essere non
negativo. Ma ci sono situazioni nelle quali pur essendo il radicando negativo
l’equazione ha tre soluzioni reali, per esempio l’equazione
x3 − 6x + 5 = 0
√
ha come soluzioni x = 1 e x = −1±2 21 , ma i radicali quadratici delle formule
precedenti non esistono.
Come mai? Questa questione ha portato alla introduzione di quelli che oggi
noi chiamiamo numeri complessi. Non tratteremo ora questi problemi.
La generica equazione di quarto grado ha la forma
x4 + bx3 + cx2 + dx + e = 0,
b, c, d, e ∈ R
(abbiamo diviso per il coefficiente del termine di grado 4, che deve essere ovviamente non nullo, altrimenti l’equazione avrebbe un grado inferiore) e la scriviamo nella forma
x4 + bx3 = −cx2 − dx − e.
31
Sommando ad entrambi i membri ( 12 bx)2 otteniamo
1 2 1 2
x2 + bx =
b − c x2 − dx − e.
2
4
Sommiamo ora ad entrambi i membri l’espressione x2 + 12 bx y + 14 y 2 , con y
da determinarsi:
1 2 1 1
x2 + bx + x2 + bx y + y 2
2
2
4
1
1
1
=
b2 + y − c x2 +
by − d x + y 2 − e.
4
2
4
Scegliamo y in modo che il secondo membro sia un quadrato. Ciò porta all’equazione
di terzo grado
1
2
1
1
by − d − 4 b2 + y − c
y 2 − e = 0.
2
4
4
Sia λ una soluzione della precedente equazione cubica. Otteniamo
1
h
bλ − d 1 1 i2 1 2
x2 + bx + λ =
b + λ2 − c x + 1 22
.
2
2
4
2 b + 2λ − 2c
Estraendo le radici si ottengono due equazioni di secondo grado.
Possiamo continuare con procedimenti analoghi e trovare formule risolutive
costruite mediante le operazioni razionali e radicali per equazioni di grado superiore al quarto? La risposta è negativa!
Nota storica.- Girolamo Cardano (Pavia, 24 settembre 1501 Roma, 21
settembre 1576?) è stato un matematico, medico, astrologo e filosofo italiano.
Poliedrica figura del Rinascimento italiano, è noto anche con il nome latino di
Hieronymus Cardanus. Oggi Cardano è noto soprattutto per i suoi contributi
all’algebra. Ha pubblicato le soluzioni dell’equazione cubica e dell’equazione
quartica nella sua maggiore opera matematica, intitolata Ars magna stampata
nel 1545.
Parte della soluzione dell’equazione cubica gli era stata comunicata da Tartaglia;
la soluzione è detta comunque di Cardano-Tartaglia. L’equazione quartica venne
invece risolta da Lodovico Ferrari, uno studente di Cardano. Nella prefazione
dell’Ars Magna vengono accreditati sia Tartaglia che Ferrari. Nei suoi sviluppi
delle soluzioni Cardano occasionalmente si serve dei numeri complessi, ma senza
riconoscerne l’importanza come invece saprà fare Rafael Bombelli.
L’italiano Paolo Ruffini (Velentano 1765 - Modena 1822) diede nel 1799 una
prima incompleta dimostrazione della ipossibilità di trovare formule risolutive
costruite mediante le operazioni razionali per equazioni di grado superiore al
quarto. Poi lo svedese Niels Henrik Abel (Nedstrand 1802 - Froland 1829) nel
1823 diede una dimostrazione completa. Qualche anno più tardi il francese
32
Evariste Galois (Bourg-la-Reine 1811 - Parigi 1832) diede una condizione necessaria e sufficiente affinché una equazione polinomiale possa venire risolta per
radicali.
8.4– Equazioni reciproche.
Vediamo una classe particolari di equazioni polinomiali dette reciproche,
cioè tali che se α è una soluzione, allora lo è anche α1 .
Iniziamo con le equazioni reciproche di terzo grado. Un’equazione della
forma
ax3 + bx2 + bx + a = 0,
è ovviamente reciproca e x = −1 è una soluzione. Allora
ax3 + bx2 + bx + a = a(x3 + 1) + bx(x + 1) =
=a(x + 1)(x2 − x + 1) + bx(x + 1) = (x + 1)[ax2 + (b − a)x + a] = 0
e quindi le altre soluzioni si trovano risolvendo l’equazione di secondo grado
ax2 + (b − a)x + a = 0.
Nel caso di una equazione della forma
ax3 + bx2 − bx − a = 0,
è x = 1 soluzione. Procedendo in modo analogo al caso precedente si trovano
tutte le soluzioni.
Passiamo ora alle equazioni reciproche di quarto grado. Un’equazione della
forma
ax4 + bx3 + cx2 + bx + a = 0, a 6= 0,
è reciproca di quarto grado. Dividendo per x2 (x = 0 non è soluzione!) otteniamo
1
1
a(x2 + 2 ) + b(x + ) + c = 0.
x
x
Poich é x2 + x12 = (x+ x1 )2 −2, posto x+ x1 = t, risolviamo l’equazione quadratica
at2 + bt + c − 2a = 0.
Se t1 e t2 sono le sue soluzioni, passiamo alle due equazioni quadratiche
x+
1
= t1 ,
x
x+
1
= t2 .
x
In generale, un’equazione reciproca di grado dispari della forma
a1 x2n+1 + a2 x2n−1 + · · · + a2 x + a1 = 0
33
ha x = −1 fra le sue soluzioni e conseguentemente può essere abbassata di grado.
Nel caso dell’equazione
a1 x2n+1 + a2 x2n−1 + · · · − a2 x − a1 = 0
una soluzione è x = 1.
Per le equazioni reciproche di grado pari la situazione è più complessa e
la riduzione analoga a quelle del grado 4 viene effettuata mediante l’uso delle
cosiddette formule di Waring che permettono di esprimere espressioni del tipo
(an + bn ) mediante potenze di (a + b). Per esempio,
a4 + b4 = (a + b)4 − 4ab(a + b) − 2a2 b2 .
8.5 – Disequazioni.
Come in precedenza, siano A(x) e B(x) due espressioni e ci chiediamo per
quali valori di x in un certo insieme numerico E si ha
(d)
A(x) < B(x)
(oppure ≤, >, ≥).
La (d) è una disequazione nell’incognita x e ogni valore ξ ∈ E che sostituito
in A e B rende vera la disuguaglianza
A(ξ) < B(ξ)
si dirà soluzione della disequazione (d).
In modo analogo a quanto avviene per le equazioni, la (d) potrà non avere
soluzioni in E e si dirà impossibile.
Es.- La disequazione 5x2 < −3 in R è impossibile.
La disequazione 7x ≤ −5 ha come soluzioni l’insieme {x ∈ R : x ≤ −5/7}.
sin x ≤ 1 ha in R ha come soluzioni tutti i numeri reali.
Principi di equivalenza per le disequazioni.
Come per le equazioni abbiamo dei principi di equivalenza che permettono di
trasformare una disequazione in una equivalente, cioè avente le stesse soluzioni.
Rispetto alle equazioni va fatta attenzione al segno di espressioni che moltiplicano o dividono i due membri di una disequazione.
Sommando (o sottraendo) ad entrambi i membri di una disequazione una
stessa espressione si ottiene una disequazione equivalente.
Questo permette di scrivere ogni disequazione nella forma R(x) < 0.
Moltiplicando o dividendo entrambi i membri di una disequazione per una
stessa espressione positiva in E, si ottiene una equazione equivalente.
Moltiplicando o dividendo entrambi i membri di una disequazione per una
stessa espressione negativa in E e cambiando il verso della diseguaglianza, si
ottiene una disequazione equivalente.
34
8.6– Disequazioni di secondo grado.
La generica disequazione di secondo grado ha la forma
ax2 + bx + c < 0,
(oppure ≤, >, ≥).
Il problema diviene quindi quello di studiare il segno dell’espressione
f (x) = ax2 + bx + c.
Riprendiamo il metodo di completamento del quadrato usato per trovare la
formula risolutiva delle equazioni di II grado.
Moltiplicando per 4a e poi sommando e sottraendo b2 , otteniamo
F (x) := 4a2 x2 + 4abx + b2 − b2 + 4ac = (2ax + b)2 − (b2 − 4ac),
e questa epressione ha lo stesso segno di f (x) se a > 0, ha il segno opposto se
a < 0. Allora se b2 − 4ac < 0, F è positiva per ogni x e quindi f ha segno
costante su R: il segno del coefficiente a.
Se b2 − 4ac = 0, abbiamo
F (x) = (2ax + b)2 ≥ 0,
−b
e quindi f ha il segno di a su R \ { −b
2a } ed è f ( 2a ) = 0.
2
Se (2ax + b) > 0, abbiamo due radici distinte
√
√
−b + b2 − 4ac
−b − b2 − 4ac
ξ1 =
,
ξ2 =
2a
2a
e
f (x) = ax2 + bx + c = a(x − ξ1 )(x − ξ2 ).
In tal caso f ha il segno di a per x < ξ2 e per x > ξ1 , mentre ha il segno opposto
a quello di a nell’intervallo ξ2 < x < ξ1 .
9.– GEOMETRIA ANALITICA.
9.1– Sistemi di coordinate.
Consideriamo la retta reale con indicato un punto origine e l’unità di misura
e, passante per questo punto, tracciamo perpendicolarmente una copia della
retta reale precedente, facendo coincidere i punti origine e con il verso della
seconda ottenuto ruotando in senso antiorario di π/2 quello della prima retta.
Indichiamo con x i valori sulla retta orizzontale e con y quelli sulla retta verticale; otteniamo quello che viene chiamato sistema di coordinate cartesiane
ortogonali nel piano:
35
Come si vede dalla figura precedente, ogni punto P del piano è univocamente
individuato da una coppia ordinata di numeri reali (x, y), x viene chiamato
ascissa di P e y ordinata di P ; scriveremo P ≡ (x, y). Il punto di intersezione
dei due assi ha coordinate (0, 0) e viene detto origine del sistema di coordinate.
Osserviamo che una semplice applicazione del teorema di Pitagora ci permette di calcolare la distanza fra due punti P1 ≡ (x1 , y1 ) e P2 ≡ (x2 , y2 ) nel modo
seguente:
p
|P1 P2 | = (x1 − x2 )2 + (y1 − y2 )2 .
In modo del tutto analogo viene costruito un sistema di coordinate cartesiane
ortogonali nello spazio:
In questo caso ogni punto P dello spazio è univocamente individuato da una
terna ordinata (x, y, z) di numeri reali.
Se in un piano fissiamo un punto origine O e una semiretta orientata da esso
uscente, un punto del piano può essere individuato dalla sua distanza ρ da O e
36
dall’angolo φ di cui deve essere ruotata in senso antiorario la retta data perché
si sovrappongo a P col suo verso positivo. Questo sistema di coordinate viene
chiamato di coordinate polari. La figura seguente mostra tale sistema
e il legame con le coordinate cartesiane è dato dalle relazioni:
(
x = ρ cos φ
y = ρ sin φ
e

p

 ρ = x2 + y 2
x
y
= arcsin p

 φ = arccos p 2
2
2
x +y
x + y2
Nello spazio abbiamo due sistemi di coordinate molto frequentemente usate,
che generalizzano le coordinate polari del piano.
Il sistema di coordinate cilindriche è un sistema di coordinate che estende
il sistema bidimensionale polare aggiungendo una terza coordinata, che misura
l’altezza di un punto dal piano base, in modo simile a quello in cui si introduce la terza dimensione nel piano cartesiano. Se chiamiamo ancora z la terza
coordinata, l’intera terna è (ρ, φ, z):
37
Le tre coordinate cilindriche possono essere convertite in coordinate cartesiane con le formule


 x = ρ cos φ
y = ρ sin φ


z=z
Le coordinate polari possono essere estese in tre dimensioni anche utilizzando
le coordinate sferiche (ρ, θ, φ), in cui ρ è la distanza dal polo, θ è l’angolo formato
con l’asse z, φ è l’angolo formato dalla proiezione sul piano xy, con l’asse x:
Per passare da un sistema sferico ad uno rettangolare si usano le seguenti
uguaglianze:


 x = ρ sin θ cos φ
y = ρ sin θ sin φ


z = ρ cos θ
e per passare da coordinate cartesiane a sferiche:

p

 ρ = x2 + y 2 + z 2



x

 φ = arcsin p y
= arccos p
x2 + y 2
x2 + y 2


px2 + y 2 
z



= arctan
 θ = arccos p 2
z
x + y2 + z 2
38
9.2– Rette e circonferenze.
Nel piano cartesiano consideriamo una retta passante per l’origine e differente dall’asse delle ordinate (caratterizzato dalla equazione x = 0).
Presi due punti P1 ≡ (x1 , y1 ) e P ≡ (x, y) le loro proiezioni X1 e X sull’asse
delle ascisse, dalla similitudine dei triangoli OP1 X1 e OP X deduciamo che
y
y1
=
x
x1
e, posto xy11 = m, otteniamo il legame che deve sussistere fra x e y perché P stia
sulla retta per O e P1 :
y = mx.
Se la retta non passa per l’origine, ma taglia l’asse delle ordinate nel punto di
ordinata q, la sua equazione sarà
y = mx + q.
Questultima equazione, al variare dei parametri m e q rapprenta tutte le rette
del piano, escluse quelle parallele all’asse delle ordinate, la cui equazioni hanno
la forma x = c.
Il numero m che rappresenta l’inclinazione della retta rispetto all’asse delle
ascisse, precisamente la tangente trigonometrica dell’angolo α formato dalla
retta con il semiasse positivo delle ascisse, si chiama coefficiente angolare
della retta, mentre q è l’intercetta all’origine.
Poniamo m = − ab e q = − bc , allora l’equazione della retta assume la forma
ax + by + c = 0,
e, per b = 0, otteniamo anche le rette parallele all’asse delle ordinate. Osserviamo che se a′ = ka, b′ = kb, c′ = kc, l’equazione
a′ x + b ′ y + c′ = 0
rappresenta la stessa retta, quindi abbiamo una rappresentazione con parametri
omogenei.
Due rette, non parallele all’asse delle ordinate, sono fra loro parallele se e
solo se hanno lo stesso coefficiente angolare. cerchiamo ora la condizione di
39
perpendicolarità fra due rette. Accantonato il caso banale di rette parallele ad
uno degli assi coordinati, se la retta per O y = mx forma un angolo α con la
direzione positiva dell’asse delle ascisse, la perpendicolare per O forme un angolo
π
′
2 + α e quindi il suo coefficiente angolare m , cioè la tangente trigonometrica
π
di 2 + α, sarà
1
m′ = − .
m
Date le equazioni di due rette, siano ax + by + c = 0 e a′ x + b′ y + c′ = 0, per
trovare la loro eventuale intersezione dobbiamo risolvere il sistema
(
ax + by + c = 0
a′ x + b′ y + c′ = 0.
Tale sistema ammette una e una sola soluzione se e solo se le due rette non sono
parallele (o coincidenti), quindi se e solo se
a
a′
6= ′ ,
b
b
o, meglio (poiché valida anche se b o b′ sono nulli), se e solo se
ab′ − a′ b 6= 0.
L’espressione ab′ −a′ b è il determinante del sistema. Se il sistema è impossibile
o indeterminato (cioè ammette infinite soluzioni) significa che le due rette sono
rispettivamente o parallele e distinte o coincidenti.
Dato un punto P ≡ (x0 , y0 ), vogliamo determinare l’equazione della retta
per P avente una data inclinazione rispetto all’asse x. Se deve essere parallela
all’asse y, allora la sua equazione è ovviamente x = x0 . Altrimenti, dato il
coefficiente angolare m, la sua equazione ha la forma y = mx + q; dovendo
passare per P , deve essere y0 = mx0 + q; sottraendo questa equazione dalla
precedente otteniamo
y − y0 = m(x − x0 )
e questa è l’equazione della retta cercata.
Siano dati due punti P1 ≡ (x1 , y1 ) e P2 ≡ (x2 , y2 ); vogliamo determinare
l’equazione della retta per P1 e P2 . Se x1 = x2 , è x = x1 ; altrimenti devono
valere entrambe le relazioni
y1 = mx1 + q
y2 = mx2 + q
da cui sottraendo la prima dalla seconda abbiamo
m=
y2 − y1
.
x2 − x1
In base a quanto visto in precedenza, devono valere entrambe le relazioni
y − y1 = m(x − x1 )
y − y2 = m(x − x2 )
40
ed uguagliando il valore di m ottenuto da una delle due equazioni con quello
trovato precedentemente, abbiamo
y − y1
y2 − y1
=
x − x1
x2 − x1
oppure
y − y2
y2 − y1
=
.
x − x2
x2 − x1
Fissiamo ora un punto C ≡ (α, β) ed un numero positivo r; la circonferenza
di centro C e raggio r è il luogo dei punti P ≡ (x, y) del piano aventi distanza
r da C, quindi
(x − α)2 + (y − β)2 = r2 .
Sviluppando la precedente espressione abbiamo
x2 + y 2 − 2αx − 2βy + α2 + β 2 − r2 = 0.
Questo è un polinomio di secondo grado in x e y, con i due quadrati aventi
coefficiente 1, privo del termine rettangolare (cioè in xy), cioè della forma
x2 + y 2 + ax + by + c = 0
2
dove a2 2 + 2b − c > 0. È immediato vedere che ogno polinomio di questo tipo
eguagliato a zero rappresenta l’equazione
di una circonferenza, il cui centro è
q
C ≡ (−a/2, −b/2) e il raggio è r =
a2
2
+
b2
2
− c.
Se le coordinate di un punto P ≡ (x, y) non soddisfano alla equazione
x2 +y 2 +ax+by+c = 0, esse faranno assumere all’espressione a primo membro un
valore positivo oppure negativo: nel primo caso P è interno alla circonferenza,
nel secondo, esterno.
Dati una retta di equazione ax + by + c = 0 e una circonferenza x2 + y 2 +
αx + βy + γ = 0, i loro eventuali punti intersezione si ottengono come soluzioni
del sistema di equazioni
(
ax + by + c = 0
x2 + y 2 + αx + βy + γ = 0
Ovviamente tale sistema, in dipendenza dalle posizioni reciproche di retta e
circonferenza, potrà avere due, una o nessuna soluzione. Si avrà una sola
soluzione (o, meglio, due soluzioni coincidenti) quando la retta risulta tangente
alla circonferenza. Abbiamo quindi immediatamente la condizione di tangenza:
l’equazione di secondo grado ottenuta ricavando x o y dalla prima equazione e
sostituendo nella seconda, deve avere discriminante nullo.
41
In modo analogo, dato un punto P ≡ (x1 , y1 ) esterno alla circonferenza
di equazione x2 + y 2 + αx + βy + γ = 0 per determinare le due rette da P
tangenti alla circonferenza si considera il sistema e si impone che la retta abbia
in comune cun la circonferenza un solo punto, quindi che la relativa equazione di
secondo grado ottenuta dopo sostituzione abbia due soluzioni coincidenti, cioè
discriminante nullo.
Nel paragrafo precedente abbiamo visto un modo differente per rappresentare i punti del piano: le coordinate polari. La circonferenza di centro O
e raggio r > 0 ha in coordinate polari l’equazione ρ = r.
Nota storica.- Il sistema di coordinate cartesiane prende il nome da René
Descartes, latinizzato in Renatus Cartesius e italianizzato in Renato Cartesio
(La Haye en Touraine, 31 marzo 1596 Stoccolma, 11 febbraio 1650). È stato un
filosofo e matematico ed è ritenuto fondatore della filosofia e della matematica
moderna. Cartesio estese la concezione razionalistica di una conoscenza ispirata
alla precisione e certezza delle scienze matematiche, cosı̀ come era stata propugnata da Francesco Bacone, ma formulata e applicata effettivamente solo da
Galileo Galilei, a ogni aspetto del sapere, dando vita a quello che oggi è conosciuto con il nome di razionalismo continentale, una posizione filosofica dominante
in Europa tra il XVII e il XVIII secolo. Nel 1637 pubblicò il Discours sur la
Methode che contiene in appendice il saggio La Géometrie dove viene sviluppata
la geometria analitica.
10.– FUNZIONI.
10.1– Insiemi finiti e infiniti.
Diamo una definizione precisa di cardinalità, o numero di elementi, di un
insieme.
Due insiemi A e B si dicono equipotenti, o aventi la stessa cardinalità, se
esiste una corrispondenza biunivoca, cioè una funzione biiettiva, f fra A e B.
La relazione R di equipotenza è una relazione di equivalenza, infatti è riflessiva:
ARA (basta considerare la funzione identica IdA ); simmetrica: se ARB e f
realizza la corrispondenza biunivoca, usando la funzione inversa f −1 otteniamo
che BRA; transitiva: se ARB e BRC e f e g rispettivamente realizzano le
corrispondenze biunivoche, la funzione composta g◦f produce la corrispondenza
biunivoca fra A e C, quindi ARC.
Le classi di equivalenza generate da questa relazione contengono ciascuna gli
insiemi aventi la stessa cardinaliià.
Siamo, ora, in grado di dare la seguente
Definizione.- Un insieme A si dice finito se esiste un intero N tale che
A è equipotente all’insieme {1, 2, 3, · · · , N }. In tal caso diremo che A ha N
elementi o ha cardinalità N .
Un insieme che non è finito si dice infinito.
42
Diremo che un insieme A ha cardinalità maggiore di B se A non è equipotente a B, ma contiene un insieme equipotente a B.
Il seguente teorema dà la proprietà caratteristica degli insiemi infiniti.
Teorema.- Un insieme A è infinito se e solo se possiede un sottoinsieme
proprio B (cioè non coincidente con A) avente la stessa cardinalità di A.
Tutti gli insiemi infiniti hanno la stessa cardinalità? No, Georg Cantor
ha dimostrato nel 1874 che la cardinalità di R è maggiore di quella di N. Da
questa nasce la possibilità di costruire una scala infinita di insiemi di cardinalità
crescente. Il procedimento è il seguente: dato A si considera la famiglia di tutti
i sottinsiemi di A. Se A è finito ed ha N elementi, tale nuovo insieme ha 2n
elementi. Se A è infinito, si dimostra che l’insieme di tutti i sottoinsiemi di A ha
cardinalità maggiore di quella di A. Iterando questo procedimento costruiamo
una scala di insiemi infiniti con cardinalità sempre maggiore.
Nota storica.- Bernhard Bolzano (1781- 1848), un prete cattolico Boemo,
matematico, logico e filosofo, ha scritto un libro dal titolo ”I paradossi dell’infinito”,
pubblicato postumo nel 1851, nel quale, sia pure con alcune titubanze e imprecisioni, abbozza una ”teoria” degli insiemi infiniti. Ma il vero e riconosciuto
creatore della teoria degli insiemi infiniti o, come si preferisce dire, transfiniti è
Georg Cantor. Nato a S. Pietroburgo nel 1845, studiò in Germania e ottenne
il dottorato a Berlino. Ebbe un posto all’Università di Halle, dove trascorse
l’intera carriera. Morı̀ a Halle nel 1918. Con la sua teoria degli insiemi (Mengenlehre) Cantor creò un nuovo campo di ricerca matematica, in grado di soddisfare le più esigenti domande di rigore logico. Nei suoi lavori, pubblicati dal
1870 al 1883, egli sviluppò una teoria dei numeri cardinali transfiniti basata su
un sistematico trattamento matematico dell’infinito.
10.3– Funzioni reali di variabile reale e loro grafici.
Sia I un intervallo dell’asse reale e consideraimo funzioni f : I → R.
L’insieme dei punti del piano aventi coordinate (x, f (x)) si chiama grafico della
funzione f . Il fatto che f sia una legge univoca significa che per ogni x0 ∈ I la
retta parallela all’asse y, x = x0 interseca il grafico in un solo punto.
Qui di seguito sono presentati i grafici di alcune famiglie di funzioni di primaria importanza.
Le prime sono le cosiddette funzioni potenza, cioè le funzioni
f (x) = xa ,
con x ≥ 0
se
a > 0;
43
con x > 0
se
a≤0:
Abbiamo, poi, le funzioni esponenziali:
f (x) = ax ,
a > 0,
44
x∈R:
e le funzioni logaritmiche:
f (x) = loga x,
a > 0,
a 6= 1,
x>0:
11– CENNI DI TEORIA DELLE PROBABILITÀ.
Supponiamo di effettuare un esperimento i cui possibili esiti sono in numero
finito, per esempio il lancio di una moneta o di un dado. Indichiamo con Ω
l’insieme finito dei possibili esiti; chiameremo evento ogni sottoinsieme di Ω; per
esempio, nel caso del lancio di un dado l’insieme Ω è
Ω = {1, 2, 3, 4, 5, 6}
e un possibile evento è l’uscita di un numero pari, cioè il sottoinsieme E =
{2, 4, 6}.
In assenza di particolari motivi, possiamo ritenere che gli esiti dell’esperimento
siano ugualmente possibili, in tal caso assegnamo ad ogni esito la stessa probabilità; se Ω ha N elementi tale probabilità è uguale a 1/N per ogni evento. Nel
caso del lancio del dado, ogni esito avrà probabilità 1/6.
Più in generale, se Ω = {a1 , a2 , · · · , aN }, ad ai verrà assegnata una probaPN
bilità P (ai ) = pi , in modo che 0 ≤ pi ≤ 1 e i pi = 1.
Per ogni evento E ⊂ Ω, definiamo la sua probabilità come
X
P (E) =
P (ai ).
ai ∈E
Nell’esempio del lancio del dado e di E = {2, 4, 6}, abbiamo P (E) = 3 × 1/6 =
1/2.
Consideriamo l’esperimento del doppio lancio di una moneta (perfetta); se
indichiamo con T l’uscita di ”testa” e con C quella di ”croce”, lo spazio degli
esiti possibili è
Ω = {T T, T C, CT, CC}
e assumendo che gli eventi siano egualmente possibili, abbiamo che ognuno di
essi ha probabilità 1/4. Se vogliamo la probabilità dell’evento ”uscita di almeno
una testa”, cioè di E = {T T, T C, CT }, essa è 3 × 1/4 = 3/4.
45
Supponiamo che tre perssone A, B e C siano in predicato per avere un certo
lavoro. Lo spazio Ω è Ω = {A, B, C}; supponiamo che A e B abbiano la stessa
possibilità di essere assunti, mentre C abbia solo la metà della possibilità degli
altri. Allora
P (A) = P (B) = 2P (C),
e
P (A) + P (B) + P (C) = 1.
Ne segue che 2P (C) + 2P (C) + P (C) = 1, cioè P (C) = 1/5 e P (A) = P (B) =
2/5.
Le probabilità assegnate agli eventi di uno spazio Ω soddisfano le seguenti
proprietà:
1. P (E) ≥ 0 per ogni E ⊂ Ω,
2. P (Ω) = 1,
3. se E ⊂ F ⊂ Ω, allora P (E) ≤ P (F ),
4. se A e B sono sottoinsiemi disgiunti di Ω, P (A ∪ B) = P (A) + P (B),
5. se A e B sono sottoinsiemi di Ω, P (A ∪ B) = P (A) + P (B) − P (A ∩ B),
6. P (Ac ) = 1 − P (A);
dove Ac , il complementare di A rispetto ad Ω, è l’insieme degli elementi di Ω
che non sono in A.
46