MATEMATICA 1 – PAS 2014–2015 1.– RELAZIONI BINARIE. FUNZIONI. 1.1.– Relazioni binarie. Siano A e B due insiemi non vuoti, l’insieme A × B costituito dalle coppie ordinate di elementi di A e di B A × B = { (a, b) : a ∈ A, b ∈ B } è detto prodotto cartesiano di A e B. Un sottoinsieme S del prodotto A × B viene chiamato relazione binaria tra A e B; se la coppia (a, b) ∈ S diremo che l’elemento a sta nella relazione individuata da S con b. Si usa indicare che a sta in una certa relazione (definita da S) con b, scrivendo aRb e si legge che a sta nelle relazione R con b. Facciamo dei semplici esempi. Siano A l’insieme dei cittadini italiani e B l’insieme dei numeri positivi; la relazione sia la seguente: ”a ha, in centimetri, l’altezza b”. Sia A = B l’insieme di tutti i cittadini europei, la relazione R sia ”a ha la stessa altezza di b”; un’altra semplice relazione sullo stesso insieme è ”a ha la stessa cittadinanza di b”. Ancora su A abbiamo la relazione ”a ha un peso maggiore o uguale a quello di b”. Se N è l’insieme dei numeri naturali, possiamo considerare su N × N la relazione a ≥ b; un’altra relazione su questo stesso insieme è ”a è multiplo di b”. Le relazioni presentate negli esempi precedenti hanno differenti proprietà che è opportuno evidenziare. Consideriamo solamente le relazioni di un insieme con seé stesso. La relazione ”a ha la stessa altezza di b” è tale che aRa, cioè ogni persona ha la stessa altezza di sé stesso; diremo in questo caso che la relazione R è riflessiva. Inoltre per la stessa relazione abbiamo che aRb implica bRa, cioè se a ha la stessa altezza di b, allora b ha la stessa altezza di a: chiameremo questa proprietà simmetria. Ancora, se aRb e bRc, allora aRc: diremo che la relazione è transitiva. Se consideriamo la relazione ”a ha un peso maggiore o uguale a quello di b”, vediamo che non vale la simmetria, mentre valgono le altre due proprietà di riflessività e transitività. Per questa relazione vediamo che al posto della simmetria abbiamo che da aRb e bRa segue che a = b: questa proprietà viene chiamata antisimmetria. Una relazione R in un insieme A che sia riflessiva, simmetrica e transitiva viene chiamata Relazione di equivalenza; una relazione che sia riflessiva, antisimmetrica e transitiva viene chiamata Relazione d’ordine. Ovviamente esistono relazioni che non sono né di equivalenza né d’ordine, per esempio la relazione ”a è padre di b” non è né riflessiva, né simmetrica, né transitiva. 1 1.2.– Le relazioni di equivalenza. Sia A un insieme e sia R una relazione di equivalenza su A. Fissato a ∈ A, consideriamo l’insieme [a] = { b ∈ A : aRb }, chiamiamo tale insieme classe di equivalenza individuata da a. In questo modo l’insieme A viene suddiviso in classi di equivalenza. Questa suddivisione è una partizione, cioè classi di equivalenza divesre sono disgiunte. Infatti, supponiamo che [a] ∩ [b] 6= ∅, allora esiste c ∈ [a] ∩ [b]; ciò significa che aRc e bRc, ma per la simmetria cRb e per la transitività aRb, allora [a] = [b]. L’insieme costituito dalle classi di equivalenza viene indicato con A/R e detto insieme quoziente di A rispetto alla relazione R. 1.3.– Le relazioni d’ordine. Consideriamo fra gli esempi precedenti le due relazioni su N date da a ≥ b e ”a è multiplo di b”. È immediato verificare che sono entrambe delle relazioni d’ordine. Ma c’è una importante caratteristica che le distingue. Se prendiamo due numeri interi positivi n e m si ha una delle seguenti proprietà: n ≥ m; m ≥ n; n = m; esprimiamo questo fatto dicendo che due elementi di N sono sempre fra loro confrontabili nella relazione ≥. Una relazione d’ordine con questa proprietà viene detta ordine totale o lineare. Verifichiamo che la relazione d’ordine ”a è multiplo di b” non è totale; prendiamo i due interi 3 e 4: 3 non è multiplo di 4, 4 non è multiplo di 3 e 3 6= 4. Una relazione d’ordine di questo tipo viene detta di ordine parziale. 1.4– Sul concetto generale di funzione. Consideriamo una relazione R fra l’insieme A e l’insieme B, avente la seguente proprietà: per ogni x ∈ A esiste un solo y ∈ B tale che xRy. Una relazione di questo tipo viene chiamata funzione. La formulazione piú usuale di funzione è la seguente. Siano A e B due insiemi, una legge f univoca, cioè che associa a ciascun elemento x di A un solo elemento y = f (x) di B, si dice funzione da A a B e viene indicata nella forma f : A → B. L’insieme A viene chiamato dominio o insieme di definizione della funzione, B è il codominio o insieme di arrivo di f . L’elemento f (x) ∈ B viene detto immagine di x tramite f . Se C è un sottoinsieme di A (si indica nel modo seguente: C ⊂ A), il sottoinsieme di B costituito dalle immagini tramite f di tutti gli elementi di C viene chiamato immagine di C e indicato con f (C). 2 Semplici esempi sono i seguenti: 1) A è l’insieme dei nati in Italia nell’anno 2000, B = R, e f associa a ciascuno la propria altezza con approssimazione di un cm. 2) A = B = N e f (n) = 2n, cioè f manda ogni intero naturale nel suo doppio. 3) A = B = R e f (x) = 3x2 . 4) A = B = R e f (x) = 6x − 8. Esaminiamo gli esempi precedenti: nel primo esempio è chiaro che ci possono, anzi ci saranno, due persone aventi la stessa altezza, quindi la funzione f può associare a due o più persone differenti la stessa altezza. Nell’esempio 2), interi distinti vengono mandati in interi distinti e l’immagine f (N) non esaurisce N, ma consiste dei soli numeri pari. In 3) l’immagine di R è costitutita da tutti i numeri reali maggiori od uguali a 0 ed f (x) = f (−x) per ogni x ∈ R. Finalmente, in 4) numeri distinti vanno in numeri distinti ed f (R) = R. Le precedenti osservazioni ci portano alle definizioni seguenti. Una funzione f : A → B si dice iniettiva se da x1 6= x2 segue f (x1 ) 6= f (x2 ), cioè manda elementi distinti in elementi distinti. Una funzione f : A → B si dice suriettiva se per ogni y ∈ B esiste x ∈ X tale che f (x) = y. Una funzione f : A → B che sia iniettiva e suriettiva si dice biiettiva. In questo caso essa costitutisce una corrispondenza biunivoca fra A e B. Se f : A → B è biiettiva, ad ogni y ∈ B possiamo far corrispondere l’unico x ∈ A tale che f (x) = y; in questo modo abbiamo definito una funzione g : B → A avente le seguenti proprietà: f [g(y)] = y, g[f (x)] = x. Tale funzione g viene detta inversa di f e usualmente indicata con f −1 . Se f : A → B e g : B → C, in modo del tutto naturale siamo portati a costruire una funzione da A a C nel modo seguente: x ∈ A viene mandato in f (x) ∈ B e questo da g viene mandato in g[f (x)]; questa nuova funzione k : A → C viene detta composta di f e g nell’ordine e indicata con k = g ◦ f . Se una funzione f : A → B è invertibile, allora la composizione con la sua inversa produce una funzione da A in A che manda ogni x ∈ A in sé stesso; tale funzione viene chiamata funzione identità o funzione identica e usualmente indicata con IdA . Se componiamo due funzioni f e g iniettive otteniamo ancora una funzione iniettiva e se componiamo due funzioni f e g biiettive (cioè invertibili) otteniamo una funzione invertibile. L’inversa di g ◦ f è f −1 ◦ g −1 . 3 2.– I NUMERI INTERI. 2.1.– Gli interi naturali. Diamo per noto l’insieme N dei numeri naturali, vale a dire i numeri 1, 2, 3, · · · usati nel conteggio di oggetti. Esaminiamo più da vicino questo insieme, studiando in particolare la operazioni che su di esso possono venire effettuate. La prima operazione, e la più naturale, è l’addizione o somma. Dati due numeri naturali n ed m è ben definito il numero naturale loro somma n + m. Questa operazione ha le seguenti proprietà: commutativa: n + m = m + n, associativa: (n + m) + r = n + (m + r). La seconda operazione, derivata dall’addizione, è la moltiplicazione o prodotto che viene cosı̀ definita: n· m = m+ m + ···+ m. | {z } n volte Le proprietà della moltiplicazione sono: commutativa: n · m = m · n, associativa: (n · m) · r = n · (m · r), esistenza dell’elemento neutro: n · 1 = n. Notiamo che l’insieme N possiede anche un ordinamento, che come d’uso, indichiamo coi simboli ≥, ≤, >, <. L’insieme N possiede un primo elemento, il numero 1. Se volessimo passare alle operazioni inverse di quelle appena indicate, vediamo che in generale non possono essere effettuate. Con questo intendiamo che le due equazioni (1) n + x = m, n · x = m, sono risolubili in N, la prima solo se m > n e la seconda solo se m è un multiplo di n. La proprietà caratteristica dell’insieme N viene espressa del seguente principio o postulato di induzione: Postulato di induzione.- Se S è un sottoinsieme di N avente le seguenti proprietà: 1 ∈ S, n∈S ⇒n+1∈S allora S = N. 4 Vedremo nel seguito l’uso di questo postulato per produrre le dimostrazioni per induzione. 2.2 – Gli interi relativi. Ritorniamo al problema iniziale delle equazioni (1). Come primo passo si pone il problema di estendere N in modo che le limitazioni precedentemente viste siano completamente (o quasi) eliminate. L’estensione deve essere tale che sul sottoinsieme N (o, meglio, sul sottoinsieme corrispondente ad N: vedremo poi la definizione precisa) le nuove operazioni coincidano con quelle precedenti. Per prima cosa costruiamo un insieme dove la prime delle equazioni (1) sia sempre risolubile. Indichiamo con N0 l’insieme N ∪ {0} e consideriamo l’insieme Z delle coppie ordinate (n, m), con n, m ∈ N0 , e fra queste coppie istituiamo la seguente relazione: (n, m) si dice equivalente a (n∗ , m∗ ) se n + m∗ = n∗ + m. Indichiamo col simbolo ∼ tale relazione ed osserviamo che possiede le tre proprietà seguenti: riflessiva: (n, m) ∼ (n, m), simmetrica: (n, m) ∼ (n∗ , m∗ ) se e solo se (n∗ , m∗ ) ∼ (n, m), transitiva: (n, m) ∼ (n∗ , m∗ ) e (n∗ , m∗ ) ∼ (n′ , m′ ) implica (n, m) ∼ (n′ , m′ ). Una relazione precedente è di equivalenza. La relazione ∼ (come tutte le relazioni di equivalenza) allora divide l’insieme Z in classi di equivalenza fra loro disgiunte: due coppie di Z sono nella stessa classe se sono equivalenti. La famiglia delle classi di equivalenza di Z rispetto a ∼, cioè l’insieme quoziente Z/ ∼, viene indicato con Z. Definiamo due operazioni su Z nel modo seguente: addizione: (n, m) + (n∗ , m∗ ) = (n + n∗ , m + m∗ ), moltiplicazione: (n, m) · (n∗ , m∗ ) = (nn∗ + mm∗ , nm∗ + n∗ m). È facile verificare che sono entrambe commutative e associative, che esiste l’elemento neutro per l’addizione, la coppia (0, 0), infatti (n, m) + (0, 0) = (n, m); esiste l’elemento neutro per la moltiplicazione, la coppia (1, 0), infatti (n, m) · (1, 0) = (n, m). Inoltre, data la coppia (n, m) vediamo che (n, m) + (m, n) = (n + m, n + m) ∼ (0, 0), ne segue che nel nuovo insieme numerico la sottrazione è sempre possibile, che è quanto volevamo ottenere. 5 Osserviamo un fatto cruciale di semplice verifica: se (n, m) ∼ (r, s) e (n∗ , m∗ ) ∼ (r∗ , s∗ ), allora (n, m) + (n∗ , m∗ ) ∼ (r, s) + (r∗ , s∗ ) e (n, m) · (n∗ , m∗ ) ∼ (r, s) · (r∗ , s∗ ). Questo ci dice che le due operazioni di somma e prodotto sono in realtà definite su Z/ ∼= Z. Data una coppia (n, m), se n > m allora essa è equivalente alla coppia (n − m, 0), se n = m è equivalente a (0, 0), mentre se n < m è equivalente a (0, m − n). Quindi, poiché ci basta considerare un rappresentante (una coppia) per ogni classe di equivalenza, possiamo identificare Z con l’insieme delle coppie aventi almeno un elemento uguale a 0. In particolare, se consideriamo le coppie (n, 0) vediamo che (n, 0) + (n∗ , 0) = (n + n∗ , 0), (n, 0) · (n∗ , 0) = (nn∗ , 0), cioè si comportano esattamente come gli interi naturali che stanno al primo posto nella coppia. Allora identificheremo la coppia (n, 0) col numero n e di conseguenza N risulta essere (isomorfo a) un sottoinsieme di Z. Poiché (n, 0) + (0, n) ∼ (0, 0), è del tutto naturale indicare la coppia (0, n) con −n. In conclusione, Z risulta costituito da N, da −N e dallo zero, in altre parole, i numeri interi positivi, lo zero ed i numeri interi negativi. Notiamo che anche l’insieme Z possiede un ordinamento, che come d’uso, indichiamo coi simboli ≥, ≤, >, <. I numeri di N sono ordinati come in precedenza, quelli di −N sono posti in ordine inverso e tutti precedono quelli di N, mentre lo zero si pone fra i due insiemi: · · · < −5 < −4 < −3 < −2 < −1 < 0 < 1 < 2 < 3 << 4 < 5 < · · · Notiamo che mentre in N ogni sottoinsieme non vuoto ha l’elemento minimo, ciò non è più vero per Z. Osserviamo che per la definizione della moltiplicazione delle coppie, se n, m > 0 si ha (−n)(−m) = (0, n) · (0, m) = (nm, 0) = nm, quindi il prodotto di due numeri negativi è un numero positivo: meno per meno fa più! Con questo ampliamento abbiamo ottenuto l’insieme numerico Z nel quale la prima della equazioni (1) è sempre risolubile. 2.3.– Massimo comun divisore e minimo comune multiplo. L’algoritmo Euclideo. Se a ∈ N0 e b un intero positivo. Allora esiste un unico intero q tale che a = bq + r, con 0 ≤ r < b. 6 Il numero q si dirà quoziente della divisione di a mediante b ed r è il resto. Infatti, dato a, o a = bq per un certo q ( cioè a è multiplo di b o b è un divisore di a, e scriveremo b|a), o è compreso fra due multipli consecutivi di b: bq < a < b(q + 1) = bq + b. Nel primo caso è r = 0, ne secondo caso r = a − bq > 0 e r < b. Dati a, b ∈ N0 , indichiamo con (a, b) il loro massimo comun divisore. Come si trova il m.c.d.? Mediante l’Algoritmo Euclideo. Se a = bq + r, allora (a, b) = (b, r). Infatti, se u|a e u|b, allora u|r. Se v|b e v|r, allora b = sv e r = tv, quindi a = bq + r = svq + tv e v|a. Quindi ogni divisore comune di a e b è anche divisore comune di b e r e viceversa. Ne segue che (a, b) = (b, r). Algoritmo Euclideo. Siano a, b ∈ N0 , con b 6= 0 ( poiché (a, 0) = a). Allora, mediante divisioni successive, abbiamo: a = bq1 + r1 , 0 < r1 < b, b = r1 q2 + r2 , 0 < r2 < r1 , r1 = r2 q3 + r3 , 0 < r3 < r2 , ··· rn−1 = rn qn+1 + rn+1 , rn+1 = 0. Osserviamo che poiché b > r1 > r2 > · · · > rn > rn+1 , dopo al più b divisioni otteniamo rn+1 = 0. Allora per l’osservazione precedente è (a, b) = (b, r1 ) = (r1 , r” ) = · · · = (rn , 0) = rn , quindi il m.c.d. (a, b) è l’ultimo resto non nullo del processo di divisioni successive. Le relazioni ottenute in precedenza ci danno anche le seguenti uguaglianze: r1 = a − q1 b r2 = b − q2 r1 = b − q2 a + q1 q2 b = −q2 a + (1 + q1 q2 )b, ··· rn = (a, b) = ka + hb per certi h, k ∈ Z. Abbiamo quindi dimostrato il seguente 7 Teorema 2.3.1 - Se d = (a, b), allora esistono h, k ∈ Z tali che d = ka + hb. Il minimo comune multiplo (m.c.m.) di due interi a e b non nulli è il più piccolo intero divisibile sia da a che da b. Ovviamente il prodotto ab è un multiplo comune dei due numeri ed il m.c.m. si otterrà dividendo questo prodotto per il più grande divisore comune, cioè per il massimo comun divisore (a, b). Abbiamo quindi ab m.c.m.(a, b) = . (a, b) 2.4 – I numeri primi e il Teorema Fondamentale dell’Aritmetica Rammentiamo qui la definizione di numero primo: p ∈ N, p > 1, si dice primo se gli unici suoi divisori sono 1 e p. Uno dei più importanti risultati dell’antichità è il seguente Teorema di Euclide (Proposizione 20, Libro IX degli Elementi di Euclide). Teorema di Euclide- Esistono infiniti numeri primi [Formulazione originaria: I numeri primi sono più di qualsiasi moltitudine assegnata di numeri primi]. Dimostrazione di Euclide.- Siano A, B, C i numeri primi assegnati. Dico che ci sono più primi di A, B, C. Sia DE il più piccolo numero ”misurato” (cioè multiplo) da A, B, C. Aggiungiamo una unità a DE. Allora EF è primo oppure no. Se EF è primo, allora A, B, C, EF sono primi e sono più di A, B, C. Sia EF non primo, allora è misurato da qualche numero primo, sia G. Dico che G è diverso da A, B, C. Se non lo fosse, allora A, B, C misurano DE e quindi G misurerà DE. Ma esso misura anche EF , perciò G misurerà anche il resto DF , l’unità: assurdo. Quindi G è diverso da A, B, C, per ipotesi è primo e la moltitudine A, B, C, G è maggiore della moltitudine A, B, C. [Notiamo che la dimostrazione procede con una forma geometrica: i numeri sono misure di segmenti. Inoltre considera il caso di una moltitudine iniziale di tre numeri e mostra che ne esistono quattro: chiaramente il procedimento è del tutto generale.] Dimostrazione moderna.- Siano p1 , p2 , · · · , pn numeri primi distinti e sia k = p1 p2 · · · pn + 1. Se q è un primo che divide k, allora q 6= pi , i = 1, 2, · · · , n, 8 altrimenti q|k e q|p1 p2 · · · pn , quindi q|1: assurdo. Ne segue che q, p1 , p2 , · · · , pn sono n + 1 primi distinti. Il lemma seguente costituisce la Proposizione 30 del VII Libro degli Elementi di Euclide. che Lemma 2.4.1 - Se p è primo e p|ab, allora o p|a o p|b. Dim.- Se p ∤ a, allora (a, p) = 1 e, per il Teorema 2.3.1, esistono h, k ∈ Z tali ka + hp = 1. Moltiplicando la precedente uguaglianza per b otteniamo kab + hpb = b. Poiché p|ab, è ab = pr e allora b = kpr + hpb = p(kr + hb), cioè p|b. Come immediata conseguenza abbiamo che se p è primo e p|a1 a2 · · · ak , allora p|ai per un certo i, 1 ≤ i ≤ k. Siamo ora pronti per enunciare e dimostrare il Teorema Fondamentale dell’Aritmetica- Ogni intero M ∈ N può essere scomposto in un unico modo come prodotto di numeri primi. Dim.- Iniziamo col mostrare per induzione che ogni intero può essere scomposto come prodotto di numeri primi. Sia S l’insieme degli interi aventi questa proprietà; chiaramente 1 ∈ S e 2 ∈ S. Supponiamo che tutti gli interi 1, 2, · · · , n siano in S e consideriamo n + 1: se n + 1 è primo, allora ha banalmente la proprietà richiesta, se non è primo significa che possiede un divisore m diverso da 1 e da n + 1 e quindi n + 1 = mr, con m, r ≤ n. Ma avendo supposto che ogni intero minore o uguale a n è decomponibile in fattori primi, lo sono sia m che r e quindi anche n + 1. Per il Postulato di induzione S coincide con N. Supponiamo ora che M abbia due differenti scomposizioni in fattori primi: M = p1 p2 · · · pr = q1 q2 · · · qs , con s ≥ r. Poiché p1 |M , allora, per il lemma precedente, p1 |qk per un certo k, ma qk è primo, quindi p1 = qk ; senza perdita di generalità possiamo supporre che k = 1. Consideriamo M = p2 · · · pr = q2 · · · qs . p1 Ripetendo il procedimento r volte e riordinando come prima i qi avremo 1 = qr+1 · · · qs , 9 assurdo. Allora r = s ed i fattori sono uguali. Il Teorema fondamentale dell’Aritmetica ci permette di usare la decomposizione degli interi in fattori primi per il calcolo di massimo comun divisore e minimo comune multiplo. Il massimo comun divisore (a, b) si ottiene considerando le decomposizioni in fattori primi di a e di b, prendendo i fattori comuni alle due decomposizioni col massimo comune esponente e moltiplicandoli. Per esempio, 845036 = 22 × 173 × 43, 13294 = 2 × 172 × 23, (845036, 13294) = 2 × 172 = 578. Invece se vogliamo il m.c.m. dobbiamo prendere tutti i fattori comuni e non col massimo esponente e moltiplicarli fra di loro; quindi m.c.m.(845036, 13294) = 22 × 173 × 23 × 43 = 19435828. 3. – I NUMERI RAZIONALI. Il nuovo passo consiste nel construire un ampliamento di Z nel quale anche la seconda delle equazioni (1) sia risolubile. La procedura è molto simile a quella usata per la costruzione di Z. Consideriamo l’insieme Q delle coppie ordinate di numeri interi relativi, con la limitazione che il secondo elemento sia non nullo, e le scriviamo subito nella forma per noi usuale di frazione: p , q p, q ∈ Z, q 6= 0. Anche fra queste coppie istituiamo una relazione di equivalenza nel modo seguente: p q si dice equivalente a p∗ q∗ se pq ∗ = p∗ q. Indichiamo ancora col simbolo ∼ tale relazione; che sia una relazione di equivalenza segue da una semplice verifica. L’insieme quoziente Q/ ∼, cioè l’insieme delle classi di equivalenza, verrà denotato con Q ed i suoi elementi vengono chiamati numeri razionali. Dpbbiamo ora istituire le operazioni fra gli elementi di Q, lasciando la semplice verifica che tali operazioni, come nel caso degli interi relativi, sono in realtà definite su Q. Definiamo due operazioni su Q ne modo seguente: p p∗ + ∗ q q p moltiplicazione: q addizione: pq ∗ + p∗ q , qq ∗ p∗ pp∗ · ∗ = ∗. q qq = Queste due operazioni sono commutative, associative ed entrambe dotate di elemento neutro: lo zero per l’addizione è ogni coppia del tipo 0q , qualunque sia 10 q, mentre l’unità per la moltiplicazione è ogni coppia della forma pp . Si verifica molto facilmente che vale la proprietà distributiva del prodotto rispetto alla somma. Inoltre, data una coppia pq , la coppia −p q ne è l’opposta: p −p 0 + = . q q q Analogamente, data pq , con p 6= 0, la coppia q p ne è l’inversa o reciproca: p q pq · = . q p pq Come già detto, l’insieme Q è l’insieme delle classi di equivalenza e ogni suo elemento può essere rappresentato da una frazione scelta nella classe corrispondente. Osserviamo che i numeri razionali della forma p1 possono essere messi in corrispondenza biunivoca con gli interi relativi: a p1 corrisponde l’intero p, e tale corrispondenza conserva le operazioni: p + p∗ p p∗ + = , 1 1 1 p p∗ pp∗ · = . 1 1 1 Quindi identificheremo la frazione p1 con l’intero p e, in questo senso, Z risulta essere un sottoinsieme di Q, o Q risulta essere un ampliamento di Z. Grazie al fatto che ogni razionale non nullo ha un inverso, ogni equazione della forma rx + s = 0, r, s ∈ Q, r 6= 0, è risolubile e la sua unica soluzione è − rs . Possiamo quindi concludere queste procedure di ampliamento, avendo ottenuto quello che in termini tecnici si chiama campo, cioè un insieme dove sono definite due operazioni eseguibili, con le loro inverse, senza limitazioni, eccetto la divisione per 0, e aventi le due proprietà commutativa e associativa e legate fra di loro dalla proprietà distributiva. Anche l’insieme Q possiede un ordinamento totale definito come segue: se p, p∗ , q, q ∗ > 0, p p∗ < ∗ q q se pq ∗ < p∗ q. Le frazioni negative si ordinano in verso opposto: se p, p∗ , q, q ∗ > 0, −p p p∗ −p∗ =− <− ∗ = ∗ q q q q se p p∗ > ∗. q q Diversamente da quanto accade per Z, dove ogni elemento ha sia un antecedente che un consecutivo, in Q questo non è vero: fra due razionali esiste ∗ ∗ sempre un altro (infiniti!) razionale, per esempio, fra pq e pq∗ , con 0 < pq < pq∗ , troviamo la loro media aritmetica: p pq ∗ + p∗ q p∗ < < . q 2qq ∗ q∗ 11 Al termine di queste procedure di ampliamento abbiamo tre insiemi numerici: gli interi naturali N, gli interi relativi Z ed i razionali Q. Abbiamo visto che in Q ogni equazione di primo grado ammette una e una sola soluzione. Consideriamo la frazione pq , (p, q ∈ N) ed eseguiamo la divisione p : q. Ad ogni passo otteniamo un resto r minore di q. Se ad un certo passo r = 0, otteniamo quella che viene chiamata espressione decimale finita di pq : p = A, a1 a2 · · · ak , q dove A ∈ N e 0 ≤ ai ≤ 9, i = 1, · · · , k. Se il resto è sempre non nullo, dopo al più q divisioni un certo resto r si presenterà per la seconda volta (ricordiamo che i resti possibili sono in numero di q) e tutti i resti seguenti si ripresenteranno nello stesso ordine. Quindi abbiamo una espressione decimale periodica p = A, a1 a2 · · · ak b1 b2 · · · bn b1 b2 · · · bn · · · b1 b2 · · · bn · · · = A, a1 a2 · · · ak b1 b2 · · · bn . q Notiamo che tale espressione non può avere periodo 9, cioè essere della forma A, a1 a2 · · · ak 9. Infatti in questo caso avremmo ad un certo punto un resto r tale che r : q = 9 con resto ancora r, cioè r = 9q + r 9 ⇔ r = 9q ⇔ r : q = 10, 10 10 assurdo. In conclusione ad ogni numero razionale pq , (p, q ∈ N) positivo si associa una espressione decimale finita o periodica senza periodo 9. Viceversa ogni espressione decimale del tipo indicato rappresenta un numero razionale positivo. Sia α = A, a1 a2 · · · ak b1 b2 · · · bn , allora 10k+n α = Aa1 a2 · · · ak b1 b2 · · · bn , b1 b2 · · · bn , 10k α = Aa1 a2 · · · ak , b1 b2 · · · bn , quindi sottraendo la seconda espressione dalla prima abbiamo 10k (10n − 1)α = 10k · 99 · · · 9} α = Aa1 a2 · · · ak b1 b2 · · · bn − Aa1 a2 · · · ak , | {z nvolte e finalmente α= Aa1 a2 · · · ak b1 b2 · · · bn − Aa1 a2 · · · ak . 99 · · · 9} ·10k | {z nvolte Ovviamente se abbiamo a che fare con un numero razionale negativo, basta cambiargli segno, trovarne lo sviluppo decimale e mettere davanti un segno ”meno”. 12 4.– DIVERSE BASI PER I NUMERI. La scrittura usuale degli interi è posizionale e in base 10. Ciò significa che se scriviamo 25063 intendiamo quanto segue: 2 · 104 + 5 · 103 + 0 · 102 + 6 · 101 + 3 · 100 . L’aggettivo posizionale indica che la posizione della cifra a partire da destra ci dà la potenza di 10 (a partire da 0) che tale cifra moltiplica; decimale perchè il numero è scomposto come somma di potenze di 10 moltiplicate per una cifra α ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}. È evidente che senza l’introduzione dello zero (o qualche simbolo equivalente) la scrittura posizionale non è possibile. Quando abbiamo a che fare con numeri razionali (non interi) dobbiamo aggiungere anche le potenze di 10 con esponente negativo. Cosı̀ 31, 47 è 3 · 101 + 1 · 100 + 4 · 10−1 + 7 · 10−2 . Nota storica.- In Europa il primo ad introdurre la notazione decimale è stato il Fiammingo Simon Stevin (Bruges 1548– L’Aia 1620), nel libro De Thiende (Leida 1585), tradotto in francese come La Disme. La notazione usata, molto pesante, è la seguente Lo scozzese John Napier (o Nepero, Edimburgo 1550–1617) nel suo Mirifici logarithmorum canonis descriptio (Edimburgo 1614) introduce la moderna notazione col punto (o virgola). Il numero 10 che abbiamo usato come base non ha, dal punto di vista strettamente matematico, alcuna specifica proprietà che lo distingua da qualunque altro numero maggiore di 1. Quindi possiamo scegliere come base ogni altro numero intero maggiore di 1. Prendiamo, per esempio, come base 2. Allora abbiamo a disposizione due cifre 0 e 1. Il numero ”ventitre” si deve allora scomporre come segue: 1 · 24 + 0 · 23 + 1 · 22 + 1 · 21 + 1 · 20 = 10111. 13 Il numero razionale 2+ 27 10 diviene 7 1 2 1 0 1 3 =2+ + =2+ + + + 10 2 10 2 4 8 40 1 0 1 1 1 =2+ + + + + 2 4 8 16 80 1 0 1 1 0 0 1 3 =2+ + + + + + + + 7 2 4 8 16 32 64 128 2 · 5 1 1 1 1 1 2 =2+ + 3 + 4 + 7 + 8 + 9 = 10, 10110011. 2 2 2 2 2 2 · 10 Se prendiamo come base 3, le cifre disponibili sono 0, 1, 2 e, per esempio, il numero ”quindici” sarà 32 + 2 · 3 = 120. In un sistema non decimale valgono le stesse regole aritmetiche di quello decimale, ma si devono usare tavole diverse per l’addizione e la moltiplicazione (tavola Pitagorica in base differente). Per esempio, nel caso di base 3 abbiamo per l’addizione + 1 2 1 2 10 2 10 11 × 1 2 1 1 2 2 2 11 e per la moltiplicazione 5.– I NUMERI REALI E LA RETTA REALE. 5.1 – La continuità della retta. Consideriamo una retta orientata sulla quale scegliamo un punto O come origine e un segmento U come unità di misura; su questa retta depositiamo i numeri interi relativi semplicemente portando verso destra e/o verso sinistra tanti segmenti consecutivi congruenti ad U quanto è il numero da riportare. Dopo di che possiamo depositare anche i numeri razionali: per esempio, per riportare 45 dividiamo il segmento U in 5 parti uguali e ne riportiamo 4. Quello che otteniamo è la cosiddetta retta razionale. Ci domandiamo: abbiamo in questo modo esaurito tutti i punti della retta? La risposta è negativa. Vediamo perché. 14 Consideriamo un’equazione del tipo x2 − 2 = 0, È ben noto fin dall’antichità che non esiste alcun numero razionale il cui quadrato è 2. La semplice dimostrazione procede come segue. Supponiamo, per assurdo, che un tale razionale esista e sia pq . Allora p 2 q = 2 ⇔ p2 = 2q 2 , quindi il fattore 2 è deve apparire con potenza pari in p2 (eventualmente zero) mentre ha potenza dispari in 2q 2 . Per il Teorema Fondamentale dell’Aritmetica i due membri dell’uguaglianza devono avere gli stessi fattori primi: abbiamo quindi una contraddizione. Se interpretiamo geometricamente il risultato precedente, questo ci dice che la diagonale di un quadrato è incommensurabile col lato del quadrato stesso. Ma allora se sulla retta razionale costruiamo il quadrato sul segmento U e col compasso (astratto!) riportiamo la diagonale sulla retta, la sua estremità destra cade in un punto che non corrisponde ad alcun numero razionale: la retta razionale presenta delle lacune! Questo problema porta alla necessità di un ulteriore ampliamento di Q: la costruzione dei numeri reali, cioè del campo R. La sua costruzione è di una complessità sia tecnica che concettuale di livello ben più alto di quelle precedenti e non verrà qui presentata in dettaglio. Per fare questo iniziamo col definire con chiarezza cosa si intende per continuità della retta. Per presentare questo postulato procediamo nel modo seguente: consideriamo una successione I1 , I2 , · · · , In , · · · di intervalli sulla retta razionale (con ciò intendiamo che gli esttremi di tali intervalli sono punti corrispondenti a numeri razionali), ciascuno dei quali contenuto nel precedente e tale che la lunghezza dell’n–esimo intervallo tenda a zero al crescere di n (con questo intendiamo che comunque fissato un numero ε > 0, troviamo un M tale che ogni intervallo In con n > M ha lunghezza minore di ε). Questa successione si dice una successione monotona di intervalli. Possiamo ora formulare il Postulato di continuità .–Per ogni successione monotona di intervalli esiste uno (e un solo) punto della retta contenuto in tutti gli intervalli. 5.2 – Il campo dei numeri reali. Possiamo ora dare un’idea della definizione e costruzione dei numeri reali non razionali, i numeri irrazionali. Abbiamo visto che ogni numero razionale può essere rappresentato in uno ed un sol modo come un allineamento decimale finito o periodico (con l’esclusione del periodo 9). Possiamo allora dare la seguente definizione: 15 Un numero reale è un allineamento decimale, finito o infinito. Chiameremo irrazionali quei numeri dati da un allineamento decimale infinito non periodico. Vediamo come questa definizione si connette col postulato di continuità. Consideriamo l’allineamento decimale infinito non periodico A, a1 a2 a3 · · · an · · · dove A è un intero positivo e ai ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}. Costruiamo la seguente successione monotona di intervalli: I1 = [A, A+1], I2 = [A.a1 , A.(a1 +1)], · · · In = [A.a1 · · · an , A.a1 · · · (an +1)], · · · (ovviamente se ai = 9 allora al posto di ai porremo 0 ed aumenteremo di una unità ai−1 ). Osserviamo che la lunghezza di In è 10−(n−1) . Per il Postulato di continuità esiste un punto sulla retta comune a tutti gli intervalli, questo punto individua il numero irrazionale corrispondente all’allineamento decimale assegnato. In questo senso il numero irrazionale è l’allineamento decimale. Algoritmi di estrazione delle radice quadrata. Concludiamo questo paragrafo presentando due algoritmi che permettono di trovare la forma decimale con l’approssimazione che si desidera della radice quadrata di un numero razionale positivo. Il primo è un algoritmo iterativo molto semplice. Dato un numero positivo A, prendiamo un numero positivo arbitrario x0 e definiamo x1 = cioè la media aritmetica fra x0 e A x0 . x0 + A x0 2 , In generale definiamo xn+1 = xn + A xn 2 . La successione {xn } converge alla radice quadrata di A, infatti detto L il limite per n → +∞ (limite cha si può facilmente dimostrare che esiste), dalla relazione precedente otteniamo L= L+ 2 A L , da cui L2 = A. Facciamo un semplice esempio: vogliamo ”calcolare” la radice quadrata di 2. Iniziamo prendendo x0 = 2, allora x1 = 2+ 2 2 2 = 1, 5, x2 = 16 1, 5 + 2 2 1,5 = 1, 4166 · · · . Abbiamo ottenuto due approssimazioni per eccesso della radice quadrata di 2. Osserviamo che questo accade sempre, infatti xn + 2 A xn 2 = 1 2 A2 [x + + 2A] ≥ A ⇔ x4n − 2Ax2n + A2 = (x2n − A)2 ≥ 0, 4 n x2n e questo è sempre verificato. Il secondo algoritmo, che va sotto il nome di Rafael Bombelli, passo a passo produce l’esatta cifra decimale, quindi dà una approssimazione per difetto. Mostriamo innanzi tutto un esempio e poi passiamo alla dimostrazione. Vogliamo calcolare le prime cifre decimali della radice quadrata di 1211. Spezziamo il numero in blocchi di due cifre partendo da destra: 12.11, prendiamo il più grande intero il cui quadrato sia minore di 12, cioè 3. Sottraiamo il quadrato di 3 da 12 e accostiamo il secondo blocco, ottenendo 3.11. Ora raddoppiamo 3 e moltiplichiamo per 10, abbiamo 60, quindi cerchiamo la più grande cifra A2 tale che (60 + A2 ) × A2 ≤ 311. È A2 = 4 e 64 × 4 = 256. La cifra 4 è la seconda cifra del numero cercato. Sottraiamo 265 da 311 ottenendo 55 e, per proseguire, aggiungiamo due zeri: 55, 00. Ripartiamo da 34, il doppio è 68, moltiplichiamo per 10 e cerchiamo la più grande cifra A3 tale che (680 + A3 ) × A3 ≤ 5500. Otteniamo 7, quindi le prime cifre della radice quadrata di 1211 sono 34, 7. È evidente che possiamo proseguire finché vogliamo. In questo esempio siamo partiti da un numero intero, ma la stessa procedura è valida per i numeri razionali, osservando che la suddivisione in blocchi di due cifre deve partire dalla virgola verso sinistra e verso destra. Vediamo ora la dimostrazione della validità dell’algoritmo di Bombelli utilizzando, senza perdere di generalità, un numero intero. Sia N = αk βk αk−1 βk−1 · · · α0 β0 , dove αi e βi sono cifre. Scriviamo N evidenziando le potenze di 100: N = αk βk · 100k + αk−1 βk−1 · 100k−1 + · · · + α0 β0 e sia Ak ∈ {1, 2, · · · , 9} il più grande intero tale che A2k ≤ αk βk , cioè A2k ≤ αk βk < (Ak + 1)2 . Chiaramente Ak è la prima cifra (a sinistra) della radice quadrata di N . Se Ak−1 è seconda cifra, allora deve essere (Ak · 10k + Ak−1 · 10k−1 )2 ≤ αk βk · 100k +αk−1 βk−1 · 100k−1 < (Ak · 10k + Ak−1 · 10k−1 + 10k−1 )2 . 17 Quindi, dividendo per 100k−1 e portando A2k · 100 al destra, otteniamo Ak · 20 · Ak−1 + A2k−1 = Ak−1 (Ak · 20 + Ak−1 ) ≤ (αk βk − A2k ) · 100 + αk−1 βk−1 < (Ak−1 + 1)(Ak · 20 + Ak−1 + 1). Ne segue che Ak−1 è il più grande intero fra 0 e 9 tale che Ak−1 (Ak · 20 + Ak−1 ) ≤ (αk βk − A2k ) · 100 + αk−1 βk−1 , come previsto dalla procedura di Bombelli. Nota storica.- Rafael Bombelli (Bologna, 1526 – Roma, 1572), è stato un matematico e ingegnere. Nella sua formazione entrarono a far parte le questioni matematiche dibattute in quel tempo: lesse le opere di Girolamo Cardano e seguı̀ la disputa tra Niccolò Tartaglia e un allievo di Scipione Dal Ferro, Antonio Maria Del Fiore, sulla risoluzione delle equazioni di terzo grado. Ludovico Ferrari poco più tardi scoprı̀ la formula per la soluzione delle equazioni di quarto grado. La sua opera fondamentale, L’algebra, è stata pubblicata nel 1572. In questo libro vengono prese in esame le radici quadrate di numeri negativi e chiamate ”quantità silvestri”, e vengono cosı̀ introdotti quelli che saranno poi chiamati ”numeri comlessi”. 5.3 – Il calcolo dei radicali. Dato un numero reale non negativo a ed un intero positivo n, esiste uno e un solo numero reale non negativo b tale che bn = a. Il numero b viene detto radice n–esima aritmetica (o positiva) di a e indicato con √ n a. Se a, b ≥ 0, valgono le seguenti relazioni: √ √ ( n a)m = n am , √ √ √ nm n ama= am+n , r 1 n 1 = √ , n a a √ √ √ n n n a b = ab. La dimostrazione si basa sul fatto che due numeri non negativi sono uguali se e solo se lo sono le loro potenze n–esime, n > 0. Dimostriamo, per esempio, la seconda uguaglianza: elevando a potenza nm il primo membro otteniamo am · an = an+m che coincide con la potenza nm–esima del secondo membro. 18 Le relazioni precedenti suggeriscono l’uso di un diverso modo di scrittura, precisamente √ m a n := n am . Allora le precedenti uguaglianze non ricalcano altro che le usuali proprietà delle potenze intere. Abbiamo cosı̀ esteso la nozione di potenza dagli esponenti interi relativi agli esponenti razionali. Si osservi che tale estensione è valida solo per basi positive! Come possiamo definire qualcosa come per esempio 3 √ 2 ? Procediamo nel modo seguente: prendiamo la rappresentazione decimale di √ 2 = 1, 4142135624 . . . √ 2: e consideruamo gli intervalli chiusi [31 , 32 ], [314/10 , 315/10 ], [3141/100 , 3142/100 ], · · · ; essi costituiscono una successione monotona di intervalli e di conseguenza indi√ 2 viduano uno e un solo numero reale; tale numero è, per definizione, 3 . 6.– CONGRUENZE E CRITERI DI DIVISIBILITÀ. Consideriamo i resti della divisione per 5 dei numeri interi: 0 = 0 · 5 + 0, 5 = 1 · 5 + 0, 10 = 2 · 5 + 0, ········· 1 = 0 · 5 + 1, 6 = 1 · 5 + 1, 11 = 2 · 5 + 1, 2 = 0 · 5 + 2, 7 = 1 · 5 + 2, 3 = 0 · 5 + 3, 8 = 1 · 5 + 3, 12 = 2 · 5 + 2, 4 = 0 · 5 + 4, 9 = 1 · 5 + 4, 13 = 2 · 5 + 3, 14 = 2 · 5 + 4, I resti ovviamente si ripetono (deve essere 0 ≤ r ≤ 5); diremo che due numeri a, b ∈ Z sono congrui modulo 5 se divisi per 5 danno lo stesso resto. In generale a, b ∈ Z sono congrui modulo d 6= 0 se divisi per d danno lo stesso resto. Ciò significa che a = q1 d + r, b = q2 d + r, quindi a − b = (q1 − q2 )d = nd, per un certo n ∈ Z. Viceversa, se a − b = nd, allora a = nd + q2 d + r = (n + q2 )d + r, 19 quindi a e b divisi per d danno lo stesso resto. Scriveremo a ≡ b (mod d) (notazione dovuta a Gauss). Proprietà delle congruenze: • 1.) a ≡ a (mod d); • 2.) a ≡ b (mod d) ⇒ b ≡ a (mod d); • 3.) a ≡ b (mod d) e b ≡ c (mod d) ⇒ a ≡ c (mod d). Quindi la congruenza è una relazione di equivalenza e l’insieme Z viene suddiviso in d classi di equivalenza, gli elementi di ogni classe sono tutti e soli gli interi fra loro congrui modulo d. Si vede facilmente che valgono le seguenti ulteriori proprietà: a ≡ a′ e b ≡ b ′ ⇒ a ± b ≡ a′ ± b ′ e ab ≡ a′ b′ (mod d). Se indichiamo con Zd l’insieme delle classi di congruenza, le proprietà sopra indicate dicono che (Zd , +) è un gruppo commutativo che possiamo identificare con {0, 1, 2, · · · , d − 1}. Utilizziamo le proprietà delle congruenze per ottenere dei criteri di divisibilità. - Divisibilità per 3 e per 9. 10 ≡ 1 (mod 3 o 9), quindi 10n ≡ 1 (mod 3 rappresentazione decimale o 9). Sia z ∈ N con z = a0 + a1 · 10 + a2 · 102 + · · · + an · 10n . z è divisibile per 3 o 9 se e solo se z ≡ 0 (mod 3 divisione di z per 3 o 9 è lo stesso della divisione di o 9). Ma il resto della s = a0 + a1 + a2 + · · · + an . Possiamo allora concludere che z è divisibile per 3 o 9 se e solo se la somma delle sue cifre è divisibile per 3 o 9. Da quanto detto sopra otteniamo facilmente la prova del 9 sia per la moltiplicazione che per la divisione. Moltiplichiamo z × w, dove z = a0 + a1 · 10 + a2 · 102 + · · ·+ an · 10n , w = b0 + b1 · 10 + a2 · 102 + · · · + bk · 10k , e sia il loro prodotto zw = t = c0 + c1 · 10 + c2 · 102 + · · · + cr · 10r . 20 Sappiamo che z ≡ (a0 + a1 + a2 + · · · + an ) (mod 9) e, se sommiamo le cifre di a0 + a1 + a2 + · · · + an , poi quelle risultato ottenuto, eccetera, fino ad avere una cifra soltanto, sia A, è z ≡ A (mod 9). Analogamente avremo w ≡ B (mod 9), t ≡ C (mod 9). Dalle proprietà delle congruenze sappiamo che deve essere AB ≡ C (mod 9), o, che è lo stesso, detta Γ la cifra ottenuta sommando reiteratamente le cifre di AB, Γ = C. Ecco allora la ben nota regola: A Γ B C e deve essere Γ = C. Osserviamo che tale prova non garantisce che la moltiplicazione affettuata sia esatta, ma sicuramente se Γ 6= C la moltiplicazione è errata. La regola per la divisione senza resto si ricava immediatamente da quella per la moltiplicazione, infatti se u : s = q, allora s × q = u; quindi nella tabella S ∆ Q U S è la somma reiterata delle cifre del divisore, U di quelle del dividendo, Q del quoziente e ∆ del prodotto SQ; deve essere ∆ = U . Nel caso in cui ci sia un resto r, la somma R delle sue cifre va aggiunta a ∆, ottenendo, dopo riduzione ad una sola cifra, ∆∗ . - Divisibilità per 7. 10 ≡ 3 (mod 7), 103 ≡ −1 (mod 7), 105 ≡ −2 (mod 7), 107 ≡ 3 (mod 7), 102 ≡ 2 (mod 7), 104 ≡ −3 (mod 7), 106 ≡ 1 (mod 7), ··· 21 Allora z = a0 + a1 · 10 + a2 · 102 + · · · + an · 10n . è divisibile per 7 se e solo se r = a0 + 3a1 + 2a2 − a3 − 3a4 − 2a5 + a6 + 3a7 + · · · è divisibile per 7 - Divisibilità per 11. 102 ≡ 1 (mod 11), 10 ≡ −1 (mod 11), 103 ≡ −1 (mod 11), ··· Allora tutti i numeri 10 + 1, 102 − 1, 103 + 1 ecc. sono congrui a 0 modulo 11 (sono divisibili per 11). Ne segue che a1 · 11 + a2 · (102 − 1) + a3 · (103 + 1) · · · = z − [a0 − a1 + a2 − a3 + · · · ] = z − t è divisibile per 11 o, equivalentemente, che z ≡ t (mod 11). quindi z è divisibile per 11 se e solo se t = a0 − a1 + a2 − a3 + · · · è divisibile per 11. Sappiamo che ab = 0 se e solo se a = 0 o b = 0. Vale la stessa cosa per le congruenze? Cioè, è vero che ab ≡ 0 (mod d) ⇒ a ≡ 0 (mod d) o b ≡ 0 (mod d) ? La risposta è negativa: 2 · 3 ≡ 0 (mod 6) ma né 2 né 3 è congruo a 0 modulo 6. Quando sarà vero? Ricordiamo che ab ≡ 0 (mod d) significa d|ab e sappiamo che se d è primo allora d|a o d|b, cioè a ≡ 0 (mod d) o b ≡ 0 (mod d). Come conseguenza abbiamo che, se d è primo, allora ab ≡ ac (mod d) se e solo se b ≡ c (mod d). Il ”piccolo” teorema di Fermat. Teorema di Fermat- Se p è un primo non divisore dell’intero a, allora ap−1 ≡ 1 (mod p). Dimostrazione.– Consideriamo i multipli di a m1 = a, m2 = 2a, m3 = 3a, · · · , mp−1 = (p − 1)a. 22 Nessuna coppia di questi numeri interi può essere congrua modulo p, poiché in tal caso p sarebbe un divisore di ms − mr = (s − r)a, Allora dovrebbe p dividere s − r, in quanto per ipotesi non divide a; ma s − r < p, quindi abbiamo l’asserto. Analogamente si conclude che nessuno di questi numeri può essere congruo a 0. Perciò i numeri m1 , m2 , · · · , mp−1 devono essere rispettivamente congrui ai numeri 1, 2, 3, · · · , p−1, considerati in un certo ordine. Ne segue che m1 m2 · · · mp−1 ≡ 1 · 2 · 3 · · · (p − 1) (mod p), cioè, posto K = 1 · 2 · 3 · · · (p − 1), K(ap−1 − 1) ≡ 0 (mod p). Ma K non è divisibile per p, poiché non lo è nessuno dei suoi fattori; quindi (ap−1 − 1) deve essere divisibile per p, cioè ap−1 − 1 ≡ 0 (mod p). Dato un intero positivo n, indichiamo con ϕ(n) il numero degli interi fra 1 e n, che sono primi con n. Questa funzione è stata introdotta da Eulero ed ha grande importanza nella teoria dei numeri. Calcoliamo i valori di ϕ(n), per i primi valori di n: ϕ(1) = 1, ϕ(2) = 1, ϕ(3) = 2, ϕ(4) = 2, ϕ(5) = 4, ϕ(6) = 2, ϕ(7) = 6, ϕ(8) = 4, ϕ(9) = 6, ϕ(10) = 4, ϕ(11) = 10, ϕ(12) = 4. Osserviamo che se p è primo, allora ϕ(p) = p − 1; se n è composto e la sua scomposizione in fattori primi è αr 1 α2 n = pα 1 p2 · · · pr si ha ϕ(n) = n 1 − 1 1 1 1− ··· 1− , p1 p2 pr Usando la funzione di Eulero, possiamo generalizzare il teorema di Fermat nella seguente forma: Teorema 6.1- Se n è un intero e a è primo con n, allora aϕ(n) ≡ 1 (mod n). 23 La dimostrazione ricalca fedelmente quella del Teorema di Fermat. Vediamo una importante applicazione del risultato precedente alla crittografia a chiave pubblica. Iniziamo con l’osservare che se n = pq, p e q primi differenti, allora ϕ(n) = (p − 1)(q − 1). Quindi se (a, n) = 1, abbiamo a(p−1)(q−1) ≡ 1 (mod pq). se m è un intero positivo qualsiasi, è allora am(p−1)(q−1) ≡ 1 (mod n). Fissati i due primi p e q, sia reso pubblico n = pq, si prenda un intero e primo con (p−1)(q−1) e sia anch’esso reso pubblico. Sia ora a un numero, per esempio quello di una carta di credito, primo con n. Costruiamo ae e sia b ≡ ae (mod n). Anche se b è reso noto, dobbiamo cercare di ricostruire a. Per fare questo prendiamo un numero d ∈ {1, 2, . . . , (p − 1)(q − 1)} tale che de ≡ 1 (mod (p − 1)(q − 1)), allora è de = 1 + m(p − 1)(q − 1) per un certo m e ade = a1+m(p−1)(q−1) ≡ a (mod n). Tutto il problema di decrittazione sta nel trovare d, ma questo richiede di trovare p e q: problema molto complesso se sono numeri grandi. Nel 2009 un gruppo di ricercatori usando centinaia di calcolatori paralleli sono riusciti a scomporre in fattori primi un numero di 232 cifre, ma impiegando due anni! Nota storica.- Pierre de Fermat (Beaumont-de-Lomagne, 17 agosto 1601 - Castres, 12 gennaio 1665) è stato un matematico e magistrato francese. Fu tra i principali matematici della prima metà del XVII secolo e diede importanti contributi allo sviluppo della matematica moderna: con il suo metodo per la individuazione dei massimi e dei minimi delle funzioni precorse gli sviluppi del calcolo differenziale. Fece ricerche di grande importanza sulla futura teoria dei numeri, iniziate durante la preparazione di un’edizione della Arithmetica di Diofanto, su cui scrisse note ed osservazioni contenenti numerosi teoremi. Proprio in una di queste osservazioni ”a margine” enunciò il cosiddetto ultimo teorema di Fermat (che credeva, molto probabilmente a torto, di aver dimostrato), che è rimasto indimostrato per più di 300 anni, fino al lavoro di Andrew Wiles nel 1994. Scoprı̀ indipendentemente da Cartesio, i principi fondamentali della geometria analitica e, attraverso la corrispondenza con Blaise Pascal, fu uno dei fondatori della teoria della probabilità. 24 Leonhard Euler, noto in Italia come Eulero (Basilea, 15 aprile 1707 San Pietroburgo, 18 settembre 1783), è stato un matematico e fisico svizzero. È considerato il pi importante matematico dell’Illuminismo e per essere tra i pi prolifici di tutti i tempi. Ha fornito contributi storicamente cruciali in svariate aree: analisi infinitesimale, funzioni speciali, meccanica razionale, meccanica celeste, teoria dei numeri, teoria dei grafi. Sembra che Pierre Simon Laplace abbia affermato ”Leggete Eulero; egli il maestro di tutti noi”. Anche se fu prevalentemente un matematico diede importanti contributi alla fisica e in particolare alla meccanica classica e celeste. Inoltre determinò le orbite di molte comete. Eulero tenne contatti con numerosi matematici del suo tempo. Complessivamente esistono 886 pubblicazioni di Eulero. Buona parte della simbologia matematica tuttora in uso venne introdotta da Eulero, per esempio i per i numeri immaginari, Σ come simbolo per la sommatoria, f (x) per indicare una funzione. Diffuse l’uso della lettera π per indicare pi–greco. 7.– CALCOLO LETTERALE. POLINOMI. 7.1– Calcolo letterale. Rammentiamo brevemente cosa si intende per calcolo letterale. Si tratta di utilizzare espressioni ove accanto a numeri compaiono quantità suscettibili di assumere differenti valori in un determinato ambito numerico e che vengono indicate con lettere. Consideriamo innanzi tutto espressioni del tipo 5a2 bc3 x, 1 abx3 y, 2 3a−1 bz, etc. I numeri 5, 12 e 3 rispettivamente, si diranno coefficienti numerici dell’espressione letterale. Due di queste espressioni si diranno simili se hanno la stessa parte letterale, per esempio 5a2 bc3 x e 12 a2 bc3 x sono simili, mentre non lo sono 5a2 bc3 x e 5a2 bc3 . Su tali espressioni letterali possono essere effettuate operazioni di somma e prodotto aventi le usuali proprietà formali: associatività, commutatività e distributività. La somma (differenza) di due espressioni letterali simili è l’espressione simile ai due addendi ed avente come coefficiente numerico la somma (differenza) dei due coefficienti numerici. Se due espressioni letterali non sono simili, la loro somma (differenza) rimane solamente indicata. Per esempio, 1 11 2 3 5a2 bc3 x + a2 bc3 x = a bc x; 2 2 5a2 bc3 x + 5a2 bc3 rimane solo indicata. Il prodotto di due espressioni letterali del tipo precedente si effettua moltiplicando i coefficienti numerici e sommano gli esponenti di tutte lettere che compaiono nelle due espressioni, per esempio 1 5 (5a2 bc3 x) · ( abx3 y) = a3 b2 c3 x4 y. 2 2 25 Il quoziente di due espressioni letterali del tipo precedente si effettua dividendo i coefficienti numerici e sottraendo gli esponenti del divisore da quelli del dividendo per tutte lettere che compaiono nelle due espressioni, per esempio 1 (5a2 bc3 x) : ( abx3 y) = 10ac3 x−2 y −1 . 2 La proprietà distributiva ci permette di calcolare prodotti del tipo 1 1 1 (5a2 bc3 x + 5a2 bc3 ) · ( abx3 y + 7xy) = (5a2 bc3 x) · ( abx3 y + 7xy) + (5a2 bc3 ) · ( abx3 y + 7xy) = 2 2 2 1 1 2 3 3 2 3 2 3 3 2 3 (5a bc x) · ( abx y) + (5a bc x) · (7xy) + (5a bc ) · ( abx y) + (5a bc ) · (7xy)) = 2 2 5 3 2 3 4 5 3 2 3 3 2 3 2 2 3 a b c x y + 35a bc x y + a b c x y + 35a bc xy. 2 2 7.2– Monomi e polinomi. Fissiamo ora l’attenzione su una lettera, sia x, e consideriamo una espressione letterale ove x compare con potenza intera positiva, come 5a−1 bx2 . Una espressione come la precedente si chiama monomio in x di grado 2. In generale, un monomio in x di grado n è una espressione della forma Axn , dove A è una espressione letterale non contenente x, per esempio 6ax3 , − 1 6 x , ecc. 3abc Due monomi si diranno simili se hanno lo stesso grado in x, per esempio 6ax3 e [−3abc + 5c]x3 sono monomi simili e la loro somma verrà indicata come (6a − 3abc + 5c)x3 . Un polinomio è una somma di monomi di gradi differenti e il grado del polinomio è il massimo dei gradi dei monomi che lo compongono. Cosı̀ un polinomio di grado n in x ha la forma Pn (x) = A0 xn + A1 xn−1 + · · · + An−1 x + an , dove i coefficienti Ai sono espressioni letterali non contenenti x. La somma e il prodotto di polinomi si effettua estendendo in modo ovvio quanto mostrato per i monomi. Qualora i coefficinti Ai siano tutti numeri appartenenti a Q o a R diremo che il polinomio è a coefficieneti razionali o reali rispettivamente. 26 7.3– Divisione fra polinomi. Se Pn (x) è un polinomio a coefficienti reali di grado n e Sm (x) è un polinomio a coefficienti reali di grado m, con m ≤ n, allora esistono, e sono unici, due polinomi a coefficienti reali Qn−m (x) e Rt (x), t < m, tali che Pn (x) = Qn−m (x)Sm (x) + Rt (x). Il polinomio Qn−m (x) si dice quoziente della divisione per Sm (x) e Rt (x) resto della divisione. Supponiamo che S1 (x) = x − ξ, allora Pn (x) = (x − ξ)Qn−1 (x) + r. Poniamo x = ξ: otteniamo Pn (ξ) = r; allora Pn (x) è divisibile per (x − ξ) se e solo se Pn (ξ) = 0. Se Pn (x) è divisibile per (x − ξ), il quoziente Qn−1 (x) si può determinare usando la Regola di Ruffini. Mostriamo questa regola con un esempio: dividiamo x4 − x3 + 2x2 − x − 1 per (x − 1). 1 1 1 -1 2 -1 1 0 0 2 -1 2 1 Il quoziente è il polinomio Q3 (x) = x3 + 2x + 1. 27 1 0 8.– EQUAZIONI E DISEQUAZIONI. 8.1– Equazioni. Siano A(x) e B(x) due espressioni (peraltro qualsiasi) contenenti una lettera x (eventualmente assieme ad altre considerate come parametri) e ci chiediamo per quali valori di x in un certo insieme numerico E si ha (e) A(x) = B(x). La (e) è una equazione nell’incognita x e ogni valore ξ ∈ E che sostituito in A e B rende vera l’uguaglianza A(ξ) = B(ξ) si dirà soluzione dell’equazione (e). La (e) potrà non avere soluzioni in E e si dirà impossibile, potrà avere un numero finito o infinito di soluzioni oppure ogni numero di E potrà essere soluzione: in quest’ultimo caso si dirà anche che la (e) è una identità in E. Es.- L’equazione 5x = 3 in Z è impossibile; la stessa equazione in Q ha l’unica soluzione ξ = 3/5. L’equazione 10x = 7x ha l’unica soluzione ξ = 0. 2 L’equazione x √ − 1 = 1 non ha soluzioni in Q; nel campo reale R ha due soluzioni: ξ = ± 2. sin x = 1 ha in R le infinite soluzioni ξ = π2 + 2kπ, k ∈ Z. sin2 x = 1 − cos2 x ha come soluzioni tutti i numeri reali: è quindi una identità. Chiameremo equazioni algebriche quelle dove A(x) e B(x) sono espressioni nelle quali si opera su x solamente con le operazioni razionali. D’ora in avanti considereremo solo equazioni algebriche. Due equazioni A(x) = B(x) e A′ (x) = B ′ (x) si dicono equivalenti su E se hanno le stesse soluzioni in E. L’equazione A′ (x) = B ′ (x) si dice conseguenza di A(x) = B(x) se fra le sue soluzioni ci sono tutte quelle di A(x) = B(x). Principi di equivalenza. Sommando (o sottraendo) ad entrambi i membri di una equazione una stessa espressione si ottiene un’equazione equivalente. Questo permette di scrivere ogni equazione nella forma R(x) = 0. Moltiplicando o dividendo entrambi i membri di una equazione per una stessa espressione che non si annulla in E, si ottiene una equazione equivalente. Da questi due principi otteniamo che una equazione algebrica, nell’insieme E ⊂ R dove esiste, è equivalente ad una equazione della forma Pn (x) = 0, dove Pn è un polinomio di un certo grado n. 28 8.2– Equazioni polinomiali. Una equazione polinomiale ha la forma a0 xn + a1 xn−1 + · · · + an−1 x + an = 0. L’esistenza ed il numero delle soluzioni dipendono dall’insieme numerico dove vengono presi i coefficienti e cercate le soluzioni: N, Z, Q, R o C. Il numero n, grado del polinomio, è detto anche grado dell’equazione (se a0 6= 0). Teorema 8.2.1- Se l’equazione polinomiale a0 xn + a1 xn−1 + · · · + an−1 x + an = 0 ha coefficienti interi (ai ∈ Z), allora ogni soluzione razionale p/q, q ≥ 1, (p, q) = 1, è tale che p|an e q|a0 . Dim.- Sia p/q una soluzione razionale, allora a0 pn pn−1 p + a + · · · + an−1 + an = 0 1 qn q n−1 q o, moltiplicando per q n , a0 pn + a1 qpn−1 + · · · + an−1 q n−1 p + an q n = 0; quindi a0 pn = −[a1 qpn−1 +· · ·+an−1 q n−1 p+an q n ] = −q[a1 pn−1 +· · ·+an−1 q n−2 p+an q n−1 ]. Ne segue che q|a0 pn ; ma q non ha fattori comuni con pn , quindi q|a0 . Analogamente, da an q n = −p[a0 pn−1 + · · · + an−1 q n−1 ] segue che p|an . Poiché i divisori di a0 e an sono in numero finito, cosı̀ sono le possibili soluzioni razionali. Con una semplice sostituzione si verifica se sono soluzioni oppure no. Quindi l’equazione a0 xn + a1 xn−1 + · · · + an−1 x + an = 0 ai ∈ Z, x ∈ Q, si risolve semplicemente mediante un numero finito di verifiche. Ovviamente tutto questo vale anche se ai ∈ Q: basta moltiplicare per il denominatore comune e ricondursi a coefficienti interi. Abbiamo visto nel paragrafo precedente che se Pn (ξ) = 0, cioè ξ è soluzione dell’equazione Pn (x) = 0, allora Pn (x) = (x − ξ)Qn−1 (x). 29 Poiché ad ogni divisione per un binomio della forma (x − ξ) otteniamo un quoziente di un grado più basso, questo può essere fatto al più n volte. In altri termini l’equazione Pn (x) = 0 ha al più n soluzioni. 8.3– Equazioni di I, II, III e IV grado. La generica equazione di primo grado ha la semplice forma a 6= 0, ax + b = 0, a, b ∈ R, ed è sempre risolubile con la sola soluzione ξ = − ab . La generica equazione di secondo grado ha la forma ax2 + bx + c = 0, a 6= 0, a, b, c ∈ R. Per determinarne le (eventuali) soluzioni procediamo col metodo del ”completamento del quadrato”. Moltiplichiamo per 4a e poi sommiamo e sottraiamo b2 , otteniamo 4a2 x2 + 4abx + b2 − b2 + 4ac = (2ax + b)2 − (b2 − 4ac) = 0. Se b2 − 4ac < 0 non ci sono soluzioni in R, in quanto l’espressione al primo membro è sempre maggiore di 0. Se b2 − 4ac ≥ 0, abbiamo (2ax + b)2 = b2 − 4ac e quindi √ b2 − 4ac . 2a Allora se b2 − 4ac > 0, abbiamo due soluzioni distinte √ √ −b + b2 − 4ac −b − b2 − 4ac ξ1 = , ξ2 = ; 2a 2a x= −b ± se b2 − 4ac = 0 abbiamo una soluzione ξ = −b 2a di molteplicità due: ciò significa che ax2 + bx + c = a(x − ξ)2 . La generica equazione di terzo grado ha la forma ax3 + bx2 + cx + d = 0, a 6= 0, a, b, c, d ∈ R. Facciamo un cambiamento di variabile in modo da eliminare il termine di secondo grado. Poniamo x = y − s e sostituiamo nel primo membro ottenendo ay 3 − 3ay 2 s + 3ays2 − as3 + by 2 − 2bys + bs2 + cy − cs + d = ay 3 − (3as − b)y 2 + (3as2 − 2bs + c)y − as3 + bs2 − cs + d. 30 b Scegliendo s = 3a eliminiamo il termine di secondo grado. In conclusione, ogno equazione di terzo grado può essere scritta nella forma x3 − 3px − 2q = 0, supponiamo p 6= 0, altrimenti la situazione è banale. È sufficiente determinare una soluzione α, poi dividendo per x− α otteniamo un polinonio di secondo grado del quale sappiamo trovare le radici. Per ottenere una soluzione, poniamo x = u + v e p = uv e sostituendo abbiamo u3 + v 3 − 2q = 0. Ma v = p u ( u 6= 0 poiché p 6= 0) e allora u6 − 2qu3 + p3 = 0. Questa è una equazione di secondo grado in u3 , da cui q p 3 u = q + q 2 − p3 è una soluzione. Da v 3 = 2q − u3 otteniamo q p 3 v = q − q 2 − p3 e quindi una soluzione dell’equazione è q q p p 3 3 ξ = q + q 2 − p3 + q − q 2 − p3 . Osserviamo che nella formula risolutiva, la cosiddetta formula di Cardano, compare una radice quadrata, quindi il radicando q 2 − p3 devrebbe essere non negativo. Ma ci sono situazioni nelle quali pur essendo il radicando negativo l’equazione ha tre soluzioni reali, per esempio l’equazione x3 − 6x + 5 = 0 √ ha come soluzioni x = 1 e x = −1±2 21 , ma i radicali quadratici delle formule precedenti non esistono. Come mai? Questa questione ha portato alla introduzione di quelli che oggi noi chiamiamo numeri complessi. Non tratteremo ora questi problemi. La generica equazione di quarto grado ha la forma x4 + bx3 + cx2 + dx + e = 0, b, c, d, e ∈ R (abbiamo diviso per il coefficiente del termine di grado 4, che deve essere ovviamente non nullo, altrimenti l’equazione avrebbe un grado inferiore) e la scriviamo nella forma x4 + bx3 = −cx2 − dx − e. 31 Sommando ad entrambi i membri ( 12 bx)2 otteniamo 1 2 1 2 x2 + bx = b − c x2 − dx − e. 2 4 Sommiamo ora ad entrambi i membri l’espressione x2 + 12 bx y + 14 y 2 , con y da determinarsi: 1 2 1 1 x2 + bx + x2 + bx y + y 2 2 2 4 1 1 1 = b2 + y − c x2 + by − d x + y 2 − e. 4 2 4 Scegliamo y in modo che il secondo membro sia un quadrato. Ciò porta all’equazione di terzo grado 1 2 1 1 by − d − 4 b2 + y − c y 2 − e = 0. 2 4 4 Sia λ una soluzione della precedente equazione cubica. Otteniamo 1 h bλ − d 1 1 i2 1 2 x2 + bx + λ = b + λ2 − c x + 1 22 . 2 2 4 2 b + 2λ − 2c Estraendo le radici si ottengono due equazioni di secondo grado. Possiamo continuare con procedimenti analoghi e trovare formule risolutive costruite mediante le operazioni razionali e radicali per equazioni di grado superiore al quarto? La risposta è negativa! Nota storica.- Girolamo Cardano (Pavia, 24 settembre 1501 Roma, 21 settembre 1576?) è stato un matematico, medico, astrologo e filosofo italiano. Poliedrica figura del Rinascimento italiano, è noto anche con il nome latino di Hieronymus Cardanus. Oggi Cardano è noto soprattutto per i suoi contributi all’algebra. Ha pubblicato le soluzioni dell’equazione cubica e dell’equazione quartica nella sua maggiore opera matematica, intitolata Ars magna stampata nel 1545. Parte della soluzione dell’equazione cubica gli era stata comunicata da Tartaglia; la soluzione è detta comunque di Cardano-Tartaglia. L’equazione quartica venne invece risolta da Lodovico Ferrari, uno studente di Cardano. Nella prefazione dell’Ars Magna vengono accreditati sia Tartaglia che Ferrari. Nei suoi sviluppi delle soluzioni Cardano occasionalmente si serve dei numeri complessi, ma senza riconoscerne l’importanza come invece saprà fare Rafael Bombelli. L’italiano Paolo Ruffini (Velentano 1765 - Modena 1822) diede nel 1799 una prima incompleta dimostrazione della ipossibilità di trovare formule risolutive costruite mediante le operazioni razionali per equazioni di grado superiore al quarto. Poi lo svedese Niels Henrik Abel (Nedstrand 1802 - Froland 1829) nel 1823 diede una dimostrazione completa. Qualche anno più tardi il francese 32 Evariste Galois (Bourg-la-Reine 1811 - Parigi 1832) diede una condizione necessaria e sufficiente affinché una equazione polinomiale possa venire risolta per radicali. 8.4– Equazioni reciproche. Vediamo una classe particolari di equazioni polinomiali dette reciproche, cioè tali che se α è una soluzione, allora lo è anche α1 . Iniziamo con le equazioni reciproche di terzo grado. Un’equazione della forma ax3 + bx2 + bx + a = 0, è ovviamente reciproca e x = −1 è una soluzione. Allora ax3 + bx2 + bx + a = a(x3 + 1) + bx(x + 1) = =a(x + 1)(x2 − x + 1) + bx(x + 1) = (x + 1)[ax2 + (b − a)x + a] = 0 e quindi le altre soluzioni si trovano risolvendo l’equazione di secondo grado ax2 + (b − a)x + a = 0. Nel caso di una equazione della forma ax3 + bx2 − bx − a = 0, è x = 1 soluzione. Procedendo in modo analogo al caso precedente si trovano tutte le soluzioni. Passiamo ora alle equazioni reciproche di quarto grado. Un’equazione della forma ax4 + bx3 + cx2 + bx + a = 0, a 6= 0, è reciproca di quarto grado. Dividendo per x2 (x = 0 non è soluzione!) otteniamo 1 1 a(x2 + 2 ) + b(x + ) + c = 0. x x Poich é x2 + x12 = (x+ x1 )2 −2, posto x+ x1 = t, risolviamo l’equazione quadratica at2 + bt + c − 2a = 0. Se t1 e t2 sono le sue soluzioni, passiamo alle due equazioni quadratiche x+ 1 = t1 , x x+ 1 = t2 . x In generale, un’equazione reciproca di grado dispari della forma a1 x2n+1 + a2 x2n−1 + · · · + a2 x + a1 = 0 33 ha x = −1 fra le sue soluzioni e conseguentemente può essere abbassata di grado. Nel caso dell’equazione a1 x2n+1 + a2 x2n−1 + · · · − a2 x − a1 = 0 una soluzione è x = 1. Per le equazioni reciproche di grado pari la situazione è più complessa e la riduzione analoga a quelle del grado 4 viene effettuata mediante l’uso delle cosiddette formule di Waring che permettono di esprimere espressioni del tipo (an + bn ) mediante potenze di (a + b). Per esempio, a4 + b4 = (a + b)4 − 4ab(a + b) − 2a2 b2 . 8.5 – Disequazioni. Come in precedenza, siano A(x) e B(x) due espressioni e ci chiediamo per quali valori di x in un certo insieme numerico E si ha (d) A(x) < B(x) (oppure ≤, >, ≥). La (d) è una disequazione nell’incognita x e ogni valore ξ ∈ E che sostituito in A e B rende vera la disuguaglianza A(ξ) < B(ξ) si dirà soluzione della disequazione (d). In modo analogo a quanto avviene per le equazioni, la (d) potrà non avere soluzioni in E e si dirà impossibile. Es.- La disequazione 5x2 < −3 in R è impossibile. La disequazione 7x ≤ −5 ha come soluzioni l’insieme {x ∈ R : x ≤ −5/7}. sin x ≤ 1 ha in R ha come soluzioni tutti i numeri reali. Principi di equivalenza per le disequazioni. Come per le equazioni abbiamo dei principi di equivalenza che permettono di trasformare una disequazione in una equivalente, cioè avente le stesse soluzioni. Rispetto alle equazioni va fatta attenzione al segno di espressioni che moltiplicano o dividono i due membri di una disequazione. Sommando (o sottraendo) ad entrambi i membri di una disequazione una stessa espressione si ottiene una disequazione equivalente. Questo permette di scrivere ogni disequazione nella forma R(x) < 0. Moltiplicando o dividendo entrambi i membri di una disequazione per una stessa espressione positiva in E, si ottiene una equazione equivalente. Moltiplicando o dividendo entrambi i membri di una disequazione per una stessa espressione negativa in E e cambiando il verso della diseguaglianza, si ottiene una disequazione equivalente. 34 8.6– Disequazioni di secondo grado. La generica disequazione di secondo grado ha la forma ax2 + bx + c < 0, (oppure ≤, >, ≥). Il problema diviene quindi quello di studiare il segno dell’espressione f (x) = ax2 + bx + c. Riprendiamo il metodo di completamento del quadrato usato per trovare la formula risolutiva delle equazioni di II grado. Moltiplicando per 4a e poi sommando e sottraendo b2 , otteniamo F (x) := 4a2 x2 + 4abx + b2 − b2 + 4ac = (2ax + b)2 − (b2 − 4ac), e questa epressione ha lo stesso segno di f (x) se a > 0, ha il segno opposto se a < 0. Allora se b2 − 4ac < 0, F è positiva per ogni x e quindi f ha segno costante su R: il segno del coefficiente a. Se b2 − 4ac = 0, abbiamo F (x) = (2ax + b)2 ≥ 0, −b e quindi f ha il segno di a su R \ { −b 2a } ed è f ( 2a ) = 0. 2 Se (2ax + b) > 0, abbiamo due radici distinte √ √ −b + b2 − 4ac −b − b2 − 4ac ξ1 = , ξ2 = 2a 2a e f (x) = ax2 + bx + c = a(x − ξ1 )(x − ξ2 ). In tal caso f ha il segno di a per x < ξ2 e per x > ξ1 , mentre ha il segno opposto a quello di a nell’intervallo ξ2 < x < ξ1 . 9.– GEOMETRIA ANALITICA. 9.1– Sistemi di coordinate. Consideriamo la retta reale con indicato un punto origine e l’unità di misura e, passante per questo punto, tracciamo perpendicolarmente una copia della retta reale precedente, facendo coincidere i punti origine e con il verso della seconda ottenuto ruotando in senso antiorario di π/2 quello della prima retta. Indichiamo con x i valori sulla retta orizzontale e con y quelli sulla retta verticale; otteniamo quello che viene chiamato sistema di coordinate cartesiane ortogonali nel piano: 35 Come si vede dalla figura precedente, ogni punto P del piano è univocamente individuato da una coppia ordinata di numeri reali (x, y), x viene chiamato ascissa di P e y ordinata di P ; scriveremo P ≡ (x, y). Il punto di intersezione dei due assi ha coordinate (0, 0) e viene detto origine del sistema di coordinate. Osserviamo che una semplice applicazione del teorema di Pitagora ci permette di calcolare la distanza fra due punti P1 ≡ (x1 , y1 ) e P2 ≡ (x2 , y2 ) nel modo seguente: p |P1 P2 | = (x1 − x2 )2 + (y1 − y2 )2 . In modo del tutto analogo viene costruito un sistema di coordinate cartesiane ortogonali nello spazio: In questo caso ogni punto P dello spazio è univocamente individuato da una terna ordinata (x, y, z) di numeri reali. Se in un piano fissiamo un punto origine O e una semiretta orientata da esso uscente, un punto del piano può essere individuato dalla sua distanza ρ da O e 36 dall’angolo φ di cui deve essere ruotata in senso antiorario la retta data perché si sovrappongo a P col suo verso positivo. Questo sistema di coordinate viene chiamato di coordinate polari. La figura seguente mostra tale sistema e il legame con le coordinate cartesiane è dato dalle relazioni: ( x = ρ cos φ y = ρ sin φ e p ρ = x2 + y 2 x y = arcsin p φ = arccos p 2 2 2 x +y x + y2 Nello spazio abbiamo due sistemi di coordinate molto frequentemente usate, che generalizzano le coordinate polari del piano. Il sistema di coordinate cilindriche è un sistema di coordinate che estende il sistema bidimensionale polare aggiungendo una terza coordinata, che misura l’altezza di un punto dal piano base, in modo simile a quello in cui si introduce la terza dimensione nel piano cartesiano. Se chiamiamo ancora z la terza coordinata, l’intera terna è (ρ, φ, z): 37 Le tre coordinate cilindriche possono essere convertite in coordinate cartesiane con le formule x = ρ cos φ y = ρ sin φ z=z Le coordinate polari possono essere estese in tre dimensioni anche utilizzando le coordinate sferiche (ρ, θ, φ), in cui ρ è la distanza dal polo, θ è l’angolo formato con l’asse z, φ è l’angolo formato dalla proiezione sul piano xy, con l’asse x: Per passare da un sistema sferico ad uno rettangolare si usano le seguenti uguaglianze: x = ρ sin θ cos φ y = ρ sin θ sin φ z = ρ cos θ e per passare da coordinate cartesiane a sferiche: p ρ = x2 + y 2 + z 2 x φ = arcsin p y = arccos p x2 + y 2 x2 + y 2 px2 + y 2 z = arctan θ = arccos p 2 z x + y2 + z 2 38 9.2– Rette e circonferenze. Nel piano cartesiano consideriamo una retta passante per l’origine e differente dall’asse delle ordinate (caratterizzato dalla equazione x = 0). Presi due punti P1 ≡ (x1 , y1 ) e P ≡ (x, y) le loro proiezioni X1 e X sull’asse delle ascisse, dalla similitudine dei triangoli OP1 X1 e OP X deduciamo che y y1 = x x1 e, posto xy11 = m, otteniamo il legame che deve sussistere fra x e y perché P stia sulla retta per O e P1 : y = mx. Se la retta non passa per l’origine, ma taglia l’asse delle ordinate nel punto di ordinata q, la sua equazione sarà y = mx + q. Questultima equazione, al variare dei parametri m e q rapprenta tutte le rette del piano, escluse quelle parallele all’asse delle ordinate, la cui equazioni hanno la forma x = c. Il numero m che rappresenta l’inclinazione della retta rispetto all’asse delle ascisse, precisamente la tangente trigonometrica dell’angolo α formato dalla retta con il semiasse positivo delle ascisse, si chiama coefficiente angolare della retta, mentre q è l’intercetta all’origine. Poniamo m = − ab e q = − bc , allora l’equazione della retta assume la forma ax + by + c = 0, e, per b = 0, otteniamo anche le rette parallele all’asse delle ordinate. Osserviamo che se a′ = ka, b′ = kb, c′ = kc, l’equazione a′ x + b ′ y + c′ = 0 rappresenta la stessa retta, quindi abbiamo una rappresentazione con parametri omogenei. Due rette, non parallele all’asse delle ordinate, sono fra loro parallele se e solo se hanno lo stesso coefficiente angolare. cerchiamo ora la condizione di 39 perpendicolarità fra due rette. Accantonato il caso banale di rette parallele ad uno degli assi coordinati, se la retta per O y = mx forma un angolo α con la direzione positiva dell’asse delle ascisse, la perpendicolare per O forme un angolo π ′ 2 + α e quindi il suo coefficiente angolare m , cioè la tangente trigonometrica π di 2 + α, sarà 1 m′ = − . m Date le equazioni di due rette, siano ax + by + c = 0 e a′ x + b′ y + c′ = 0, per trovare la loro eventuale intersezione dobbiamo risolvere il sistema ( ax + by + c = 0 a′ x + b′ y + c′ = 0. Tale sistema ammette una e una sola soluzione se e solo se le due rette non sono parallele (o coincidenti), quindi se e solo se a a′ 6= ′ , b b o, meglio (poiché valida anche se b o b′ sono nulli), se e solo se ab′ − a′ b 6= 0. L’espressione ab′ −a′ b è il determinante del sistema. Se il sistema è impossibile o indeterminato (cioè ammette infinite soluzioni) significa che le due rette sono rispettivamente o parallele e distinte o coincidenti. Dato un punto P ≡ (x0 , y0 ), vogliamo determinare l’equazione della retta per P avente una data inclinazione rispetto all’asse x. Se deve essere parallela all’asse y, allora la sua equazione è ovviamente x = x0 . Altrimenti, dato il coefficiente angolare m, la sua equazione ha la forma y = mx + q; dovendo passare per P , deve essere y0 = mx0 + q; sottraendo questa equazione dalla precedente otteniamo y − y0 = m(x − x0 ) e questa è l’equazione della retta cercata. Siano dati due punti P1 ≡ (x1 , y1 ) e P2 ≡ (x2 , y2 ); vogliamo determinare l’equazione della retta per P1 e P2 . Se x1 = x2 , è x = x1 ; altrimenti devono valere entrambe le relazioni y1 = mx1 + q y2 = mx2 + q da cui sottraendo la prima dalla seconda abbiamo m= y2 − y1 . x2 − x1 In base a quanto visto in precedenza, devono valere entrambe le relazioni y − y1 = m(x − x1 ) y − y2 = m(x − x2 ) 40 ed uguagliando il valore di m ottenuto da una delle due equazioni con quello trovato precedentemente, abbiamo y − y1 y2 − y1 = x − x1 x2 − x1 oppure y − y2 y2 − y1 = . x − x2 x2 − x1 Fissiamo ora un punto C ≡ (α, β) ed un numero positivo r; la circonferenza di centro C e raggio r è il luogo dei punti P ≡ (x, y) del piano aventi distanza r da C, quindi (x − α)2 + (y − β)2 = r2 . Sviluppando la precedente espressione abbiamo x2 + y 2 − 2αx − 2βy + α2 + β 2 − r2 = 0. Questo è un polinomio di secondo grado in x e y, con i due quadrati aventi coefficiente 1, privo del termine rettangolare (cioè in xy), cioè della forma x2 + y 2 + ax + by + c = 0 2 dove a2 2 + 2b − c > 0. È immediato vedere che ogno polinomio di questo tipo eguagliato a zero rappresenta l’equazione di una circonferenza, il cui centro è q C ≡ (−a/2, −b/2) e il raggio è r = a2 2 + b2 2 − c. Se le coordinate di un punto P ≡ (x, y) non soddisfano alla equazione x2 +y 2 +ax+by+c = 0, esse faranno assumere all’espressione a primo membro un valore positivo oppure negativo: nel primo caso P è interno alla circonferenza, nel secondo, esterno. Dati una retta di equazione ax + by + c = 0 e una circonferenza x2 + y 2 + αx + βy + γ = 0, i loro eventuali punti intersezione si ottengono come soluzioni del sistema di equazioni ( ax + by + c = 0 x2 + y 2 + αx + βy + γ = 0 Ovviamente tale sistema, in dipendenza dalle posizioni reciproche di retta e circonferenza, potrà avere due, una o nessuna soluzione. Si avrà una sola soluzione (o, meglio, due soluzioni coincidenti) quando la retta risulta tangente alla circonferenza. Abbiamo quindi immediatamente la condizione di tangenza: l’equazione di secondo grado ottenuta ricavando x o y dalla prima equazione e sostituendo nella seconda, deve avere discriminante nullo. 41 In modo analogo, dato un punto P ≡ (x1 , y1 ) esterno alla circonferenza di equazione x2 + y 2 + αx + βy + γ = 0 per determinare le due rette da P tangenti alla circonferenza si considera il sistema e si impone che la retta abbia in comune cun la circonferenza un solo punto, quindi che la relativa equazione di secondo grado ottenuta dopo sostituzione abbia due soluzioni coincidenti, cioè discriminante nullo. Nel paragrafo precedente abbiamo visto un modo differente per rappresentare i punti del piano: le coordinate polari. La circonferenza di centro O e raggio r > 0 ha in coordinate polari l’equazione ρ = r. Nota storica.- Il sistema di coordinate cartesiane prende il nome da René Descartes, latinizzato in Renatus Cartesius e italianizzato in Renato Cartesio (La Haye en Touraine, 31 marzo 1596 Stoccolma, 11 febbraio 1650). È stato un filosofo e matematico ed è ritenuto fondatore della filosofia e della matematica moderna. Cartesio estese la concezione razionalistica di una conoscenza ispirata alla precisione e certezza delle scienze matematiche, cosı̀ come era stata propugnata da Francesco Bacone, ma formulata e applicata effettivamente solo da Galileo Galilei, a ogni aspetto del sapere, dando vita a quello che oggi è conosciuto con il nome di razionalismo continentale, una posizione filosofica dominante in Europa tra il XVII e il XVIII secolo. Nel 1637 pubblicò il Discours sur la Methode che contiene in appendice il saggio La Géometrie dove viene sviluppata la geometria analitica. 10.– FUNZIONI. 10.1– Insiemi finiti e infiniti. Diamo una definizione precisa di cardinalità, o numero di elementi, di un insieme. Due insiemi A e B si dicono equipotenti, o aventi la stessa cardinalità, se esiste una corrispondenza biunivoca, cioè una funzione biiettiva, f fra A e B. La relazione R di equipotenza è una relazione di equivalenza, infatti è riflessiva: ARA (basta considerare la funzione identica IdA ); simmetrica: se ARB e f realizza la corrispondenza biunivoca, usando la funzione inversa f −1 otteniamo che BRA; transitiva: se ARB e BRC e f e g rispettivamente realizzano le corrispondenze biunivoche, la funzione composta g◦f produce la corrispondenza biunivoca fra A e C, quindi ARC. Le classi di equivalenza generate da questa relazione contengono ciascuna gli insiemi aventi la stessa cardinaliià. Siamo, ora, in grado di dare la seguente Definizione.- Un insieme A si dice finito se esiste un intero N tale che A è equipotente all’insieme {1, 2, 3, · · · , N }. In tal caso diremo che A ha N elementi o ha cardinalità N . Un insieme che non è finito si dice infinito. 42 Diremo che un insieme A ha cardinalità maggiore di B se A non è equipotente a B, ma contiene un insieme equipotente a B. Il seguente teorema dà la proprietà caratteristica degli insiemi infiniti. Teorema.- Un insieme A è infinito se e solo se possiede un sottoinsieme proprio B (cioè non coincidente con A) avente la stessa cardinalità di A. Tutti gli insiemi infiniti hanno la stessa cardinalità? No, Georg Cantor ha dimostrato nel 1874 che la cardinalità di R è maggiore di quella di N. Da questa nasce la possibilità di costruire una scala infinita di insiemi di cardinalità crescente. Il procedimento è il seguente: dato A si considera la famiglia di tutti i sottinsiemi di A. Se A è finito ed ha N elementi, tale nuovo insieme ha 2n elementi. Se A è infinito, si dimostra che l’insieme di tutti i sottoinsiemi di A ha cardinalità maggiore di quella di A. Iterando questo procedimento costruiamo una scala di insiemi infiniti con cardinalità sempre maggiore. Nota storica.- Bernhard Bolzano (1781- 1848), un prete cattolico Boemo, matematico, logico e filosofo, ha scritto un libro dal titolo ”I paradossi dell’infinito”, pubblicato postumo nel 1851, nel quale, sia pure con alcune titubanze e imprecisioni, abbozza una ”teoria” degli insiemi infiniti. Ma il vero e riconosciuto creatore della teoria degli insiemi infiniti o, come si preferisce dire, transfiniti è Georg Cantor. Nato a S. Pietroburgo nel 1845, studiò in Germania e ottenne il dottorato a Berlino. Ebbe un posto all’Università di Halle, dove trascorse l’intera carriera. Morı̀ a Halle nel 1918. Con la sua teoria degli insiemi (Mengenlehre) Cantor creò un nuovo campo di ricerca matematica, in grado di soddisfare le più esigenti domande di rigore logico. Nei suoi lavori, pubblicati dal 1870 al 1883, egli sviluppò una teoria dei numeri cardinali transfiniti basata su un sistematico trattamento matematico dell’infinito. 10.3– Funzioni reali di variabile reale e loro grafici. Sia I un intervallo dell’asse reale e consideraimo funzioni f : I → R. L’insieme dei punti del piano aventi coordinate (x, f (x)) si chiama grafico della funzione f . Il fatto che f sia una legge univoca significa che per ogni x0 ∈ I la retta parallela all’asse y, x = x0 interseca il grafico in un solo punto. Qui di seguito sono presentati i grafici di alcune famiglie di funzioni di primaria importanza. Le prime sono le cosiddette funzioni potenza, cioè le funzioni f (x) = xa , con x ≥ 0 se a > 0; 43 con x > 0 se a≤0: Abbiamo, poi, le funzioni esponenziali: f (x) = ax , a > 0, 44 x∈R: e le funzioni logaritmiche: f (x) = loga x, a > 0, a 6= 1, x>0: 11– CENNI DI TEORIA DELLE PROBABILITÀ. Supponiamo di effettuare un esperimento i cui possibili esiti sono in numero finito, per esempio il lancio di una moneta o di un dado. Indichiamo con Ω l’insieme finito dei possibili esiti; chiameremo evento ogni sottoinsieme di Ω; per esempio, nel caso del lancio di un dado l’insieme Ω è Ω = {1, 2, 3, 4, 5, 6} e un possibile evento è l’uscita di un numero pari, cioè il sottoinsieme E = {2, 4, 6}. In assenza di particolari motivi, possiamo ritenere che gli esiti dell’esperimento siano ugualmente possibili, in tal caso assegnamo ad ogni esito la stessa probabilità; se Ω ha N elementi tale probabilità è uguale a 1/N per ogni evento. Nel caso del lancio del dado, ogni esito avrà probabilità 1/6. Più in generale, se Ω = {a1 , a2 , · · · , aN }, ad ai verrà assegnata una probaPN bilità P (ai ) = pi , in modo che 0 ≤ pi ≤ 1 e i pi = 1. Per ogni evento E ⊂ Ω, definiamo la sua probabilità come X P (E) = P (ai ). ai ∈E Nell’esempio del lancio del dado e di E = {2, 4, 6}, abbiamo P (E) = 3 × 1/6 = 1/2. Consideriamo l’esperimento del doppio lancio di una moneta (perfetta); se indichiamo con T l’uscita di ”testa” e con C quella di ”croce”, lo spazio degli esiti possibili è Ω = {T T, T C, CT, CC} e assumendo che gli eventi siano egualmente possibili, abbiamo che ognuno di essi ha probabilità 1/4. Se vogliamo la probabilità dell’evento ”uscita di almeno una testa”, cioè di E = {T T, T C, CT }, essa è 3 × 1/4 = 3/4. 45 Supponiamo che tre perssone A, B e C siano in predicato per avere un certo lavoro. Lo spazio Ω è Ω = {A, B, C}; supponiamo che A e B abbiano la stessa possibilità di essere assunti, mentre C abbia solo la metà della possibilità degli altri. Allora P (A) = P (B) = 2P (C), e P (A) + P (B) + P (C) = 1. Ne segue che 2P (C) + 2P (C) + P (C) = 1, cioè P (C) = 1/5 e P (A) = P (B) = 2/5. Le probabilità assegnate agli eventi di uno spazio Ω soddisfano le seguenti proprietà: 1. P (E) ≥ 0 per ogni E ⊂ Ω, 2. P (Ω) = 1, 3. se E ⊂ F ⊂ Ω, allora P (E) ≤ P (F ), 4. se A e B sono sottoinsiemi disgiunti di Ω, P (A ∪ B) = P (A) + P (B), 5. se A e B sono sottoinsiemi di Ω, P (A ∪ B) = P (A) + P (B) − P (A ∩ B), 6. P (Ac ) = 1 − P (A); dove Ac , il complementare di A rispetto ad Ω, è l’insieme degli elementi di Ω che non sono in A. 46