Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 Capitolo 3. Teoria e storia delle equazioni di primo grado. 3.1. Metodi di risoluzione. Si tratta del più semplice esempio di equazione, quando si considerino le equazioni in un’incognita. Talvolta si parla di equazioni lineari come sinonimo di equazioni di primo grado. Tali equazioni si possono scrivere nella forma ax + b = 0 ove a e b sono elementi di un anello o di un campo. A seconda del tipo di struttura da cui sono tratti i coefficienti dell’equazione può avvenire che l’equazione abbia o non abbia soluzione, oppure che abbia una o più soluzioni distinte. Facciamo alcuni esempi. Considerato l’anello (o più esplicitamente l’anello ,+, ,-,0,1 ), l’equazione ha soluzione in esso se e solo se a divide b. In tale caso detto c = qu(b,a), cioè il numero intero tale che ac = b, si ha x = -c, dato che a(-c) + b = - (ac) + b = -b + b = 0. In 6 la moltiplicazione è data dalla seguente tavola di Cayley. Si constata immediatamente che la moltiplicazione è commutativa. Se Arthur Cayley (1821-1895) si considera l’equazione 5x = 2, dall’ispezione della tavola si vede che la soluzione è data da x = 4. Si ha dunque 5 4 3 2 1 0 0 0 0 0 0 0 0 5 4 3 2 1 0 1 4 2 0 4 2 0 2 3 0 3 0 3 0 3 2 4 0 2 4 0 4 1 2 3 4 5 0 5 un’unica soluzione. Se si considera 3x = 4, dall’ispezione della tavola si vede che l’equazione non ha soluzione. Invece l’equazione 2x = 4 ha due soluzioni distinte, 2 e 5, pur essendo di primo grado. In un campo in cui ogni elemento diverso da 0 ha un (unico) inverso, l’equazione di primo grado ha sempre soluzione data da x = -( a-1b). Infatti a(-a-1b) + b = -(a(a-1b)) + b = -((aa-1)b) + b = -(1b) + b = -b + b = 0. Si osservi che la ‘formula risolutiva’ utilizzata è applicabile ai corpi (o campi non commutativi), ad esempio ai quaternioni di Hamilton, basta porre attenzione al fatto che si moltiplichi a destra o a sinistra. Vi sono strutture più deboli in cui risolvere l’equazione data, ad esempio in William Rowan Hamilton (1805-1865) , su cui si possono definire le operazioni di addizione e moltiplicazione, ma 97 non è un anello. In tale tipo di struttura Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 l’equazione ax + b = 0 è risolubile solo se b = 0. E’ però possibile risolvere l’equazione ax = b, che dal punto di vista della struttura di anello è equivalente, ma non lo è per i numeri naturali in quanto in l’unico elemento dotato di opposto è 0. Si ha quindi che in l’equazione ax = b è risolubile se e solo se b = 0, caso in cui x = 0, oppure b ≠ 0 e a divide b ed in tal caso detto c il quoziente di b rispetto ad a, x = c è la soluzione. Un altro tipo di struttura in cui è importante risolvere queste equazioni è lo spazio vettoriale su un campo K. E’ da questo contesto che deriva la dizione equazione lineare, che è usata come sinonimo di equazione di primo grado. Stavolta il ruolo dei coefficienti dell’equazione è dissimmetrico: x e b sono vettori, e per mettere in evidenza ciò si scrivono in grassetto corsivo, a uno scalare non nullo, vale a dire un elemento di K. L’equazione diviene ax + b = 0. Si noti che anche 0 è un vettore. La soluzione è ancora x = -a-1b, in quanto a appartiene ad un campo, quindi ammette inverso. Si ha la stessa formula di prima, ma i significati dei simboli sono diversi. La stessa formula si estende poi al caso in cui x e b siano vettori e a una matrice quadrata invertibile, in tal caso si parla di sistema lineare. Ci sono casi più generali di sistemi lineari, in cui la matrice non è quadrata, ma comunque con varie tecniche (Teorema di Rouché e Capelli) ci si può, in certi casi, ridurre alla considerazione di una matrice quadrata. Tutti questi metodi sono legati alla possibilità di eseguire una divisione. Di qui si può concludere che la comparsa in una civiltà dei numeri razionali, è una garanzia che in quella civiltà si sono posti problemi risolubili con equazioni di primo grado e di essi si è trovato un metodo risolutivo. 3.2. Alcuni esempi tratti dai documenti. È molto difficile poter dire chi ha posto, per primo, un problema risolubile con un’equazione di primo grado e chi, per primo, l’ha risolta. Sicuramente nell’antichità non si usavano le scritture simboliche ed anche i metodi di soluzione usati dagli antichi possono apparire ‘strani’. Ma questo, ancora una volta, fa pensare a quanto sia difficile calarsi nella realtà di un popolo antico senza la sovrastruttura della conoscenza odierna. 3.2.1 Il problema 24 del Papiro Rhind. In questo problema si chiede Qual è il valore del mucchio se il mucchio e un settimo del mucchio sono eguali a 19. Il problema è espresso a parole e il testo usa un metodo, largamente caduto in disuso sui testi scolastici, ma che si può trovare ancora oggi applicato da molti, giovani e non, per risolvere problemi pratici. Di fatto qui siamo in quell’ambito che può considerarsi pre-algebra. Se ad esempio devo risolvere il problema indicato potrei pensare che se invece di aggiungere 1/7 del mucchio aggiungessi 1/10 del mucchio (un po’ meno), potrei ottenere un poco meno, diciamo ad 98 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 esempio 15. Se con queste scelte ottengo una soluzione, bene, altrimenti posso considerare una soluzione numerica (approssimata). Da considerazioni analoghe nasce il metodo di falsa posizione, utilizzato da Ahmes. In termini moderni il problema di Ahmes può essere tradotto dall’equazione x + soluzione, sempre in termini moderni, si ottiene da 1 x = 19 . La 7 8 19 133 x = 19, da cui x = 7 ⋅ = . 7 8 8 La soluzione di Ahmes, sfruttando appunto il metodo di falsa posizione, è basata sulla proporzionalità: se x = 7, allora x + 1 133 x = 8 , per cui 7 : x = 8 : 19, da cui 8x = 7 19, da cui x = . 7 8 Si tratta della soluzione in quanto 7 ⋅ 19 19 19 + = 8 ⋅ = 19 . 8 8 8 Lo stesso risultato si può trovare se invece di porre x = 7, si considera una qualunque altra posizione. Ad esempio se x = 10, si avrebbe x + x= 1 80 80 x= : 19 , da cui , quindi 10 : x = 7 7 7 7 133 ⋅190 = . In quei tipi di ragionamenti usati oggi nella pratica, forse visto che se x = 7 si 80 8 ottiene 8, si sarebbe provato con 14 e con 21, trovando rispettivamente 16 e 24. La somma di questi due numeri fa 40 e 19 è abbastanza vicino alla metà di 40, per cui il valore approssimato sarebbe stato la media di 14 e 21, 17,5 ed essendo 19 una metà scarsa di 40, forse il bottegaio avrebbe detto 17. Assunto questo numero come soluzione (numerica), si sarebbe commesso un errore assoluto (per eccesso) dato da 17 − 133 136 − 133 3 133 = ed anche 17 − = 17 − 16,625 = 0,375 . L’errore = 8 8 8 8 relativo è dato da 0,375 : 16,625 = 3 133 3 : = ≅ 0,023 . Come si vede il procedimento numerico, 8 8 133 dettato dal buon senso, non fornisce un numero molto discosto dalla soluzione analitica e con un errore relativo abbastanza piccolo, dell’ordine dei centesimi. Per dire: se il mucchio costasse 10 euro al kg, la differenza tra prezzo da pagare 166,25 e quello stimato 170 euro sarebbe ‘aggiustabile’ con il cosiddetto ‘sconto del caffè’. E’ molto interessante che il soggetto del testo sia il mucchio, una sorta di grandezza, qui usata come quantità, imprecisa, attributo che può applicarsi ad una quantità incognita. Per determinare la soluzione analitica si è fatto uso della proporzionalità (diretta), con la quale si rimane in ambito aritmetico; è uno strumento che doveva essere noto fin dall’antichità. A riprova di questa affermazione l’aneddoto di Talete che dovendo trovare l’altezza della Piramide la determina misurando l’ombra Talete di Mileto (624-547. a.C.) 99 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 dell’edificio e quella di un bastone di lunghezza nota (o della sua persona, secondo un’altra versione dello stesso aneddoto). C’è poi un problema di calcolo delle quantità frazionarie. Gli Egizi avevano messo a punto un insieme finito di unità frazionarie: l’occhio di Horus, dal nome di una loro divinità. Le frazioni che si possono riottenere con questi strumenti non sono tutte. Quindi gli autori di problemi cercano di ridurre a casi ‘semplici’ i problemi con opportune scelte dei dati. Tratto da Erman Di Rienzo: Le frazioni egiziane, http://www.matematicamente.it/storia/frazioni_egiziane_appendici.doc «Il mito dell’occhio di Horus: secondo un’antica leggenda Horus, figlio di Iside e di Osiride, volle vendicare la morte del padre, ucciso dal fratello Seth. Nella lotta Horus perse un occhio le cui parti vennero ritrovate e ricomposte dal dio Toth a meno di una piccola parte. L’occhio di Horus fu considerato un potente amuleto; al simbolo vennero attribuiti poteri magici con significati diversi nei vari campi del sapere. In matematica il simbolo fu scomposto in sei parti e ad esse si fecero corrispondere le sei frazioni unitarie più frequenti, quelle corrispondenti agli inversi delle prime sei potenze di 2: 1/2 (l’olfatto) 1/16 (l’udito) 1/4 (la vista) 1/8 (il pensiero) 1/32 (il gusto) 1/64 (il tatto) La somma delle parti differisce dall’unità di 1/64. Ad ogni parte dell’occhio si fece corrispondere un senso; nell’ordine: il tatto (1/64), il gusto (1/32), l’udito (1/16), il pensiero (1/8), la vista (1/4) e l’olfatto (1/2). La costruzione del simbolo segue una precisa regola. I sensi erano ordinati quindi secondo l’importanza loro attribuita, a seconda cioè dell’energia ‘utilizzata’ per ricevere una particolare sensazione. Tutti i dati ricevuti erano l’alimento della conoscenza.» 3.2.2. Il problema 30 del Papiro Rhind. Tale problema, a parole, chiede di risolvere un’equazione di primo grado che può essere espressa in termini odierni come x+ 2 1 1 x + x + x = 37 3 2 7 La soluzione dell’equazione (oggi) si ottiene raccogliendo a fattor comune x e poi effettuando i calcoli ed infine dividendo 37 per il coefficiente di x: 100 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado x 1+ 2 1 1 + + =37; 3 2 7 soluzione = in x 42 + 28 + 21 + 6 = 37; 42 quanto x 97 = 37; 42 AA. 2009-2010 x = 42 ⋅ 37 1554 = . Si tratta della 97 97 1554 2 1554 1 1554 1 1554 1554 2 ⋅ 518 777 222 + ⋅ + ⋅ + ⋅ = + + + = 97 3 97 2 97 7 97 97 97 97 97 2 ⋅ 3 ⋅ 7 ⋅ 37 + 4 ⋅ 7 ⋅ 37 + 3 ⋅ 7 ⋅ 37 + 2 ⋅ 3 ⋅ 37 42 + 28 + 21 + 6 97 = ⋅ 37 = ⋅ 37 = 37 . 97 97 97 La parte intera di 2 1554 è 16, essendo 16 97 = 1552. Restano . Spesso nel Papiro Rhind un tale 97 97 numero razionale si scrive come somma di unità frazionarie, vale a dire come somma di frazioni aventi per numeratore 1, e con denominatori tra loro diversi. La scelta dei denominatori inoltre non può essere casuale. Se si volesse provare con due soli numeri si avrebbe 1 1 2 + = , da cui il sistema simmetrico di a b 97 a+b = 2 . Questo sistema non può essere risolto nei numeri naturali in quanto a e b a ⋅ b = 97 secondo grado devono essere non nulli, essendo denominatori e non maggiori di 2, le uniche soluzioni sono quindi a = 1 e b = 1, ma questa non va bene dato che si vogliono denominatori distinti ed inoltre 97 è primo quindi non si possono trovare due divisori propri di 97. Se cerchiamo di risolvere il sistema a+b = 2 nei numeri reali, si osserva che queste sono le formule di Viète, quindi si devono cercare a ⋅ b = 97 le soluzioni dell’equazione di secondo grado y2 – 2y + 97 = 0. Tale equazione ha discriminante negativo, quindi non ottengo valori accettabili nel contesto del problema. Però potrebbe esistere un numero naturale positivo h tale che diventerebbe 1 1 2h + = , per cui il sistema a b 97 h a + b = 2h . a ⋅ b = 97 h Come si vede le cose non sono migliorate, tuttavia possiamo tentare di risolvere nei numeri reali il sistema e poi eventualmente scegliere h in modo da avere valori reali. Procedendo come prima si deve risolvere l’equazione di secondo grado y2 -2hy + 97h = 0, il cui discriminante è dato da h2 97h. Perché l’equazione abbia radici reali bisogna che h2 -97h ≥ 0, da cui (h ≤ 0 ∧ h ≤ 97) ∨ (h ≥ 0∧ h ≥ 97). Per le proprietà dell’ordine su accettabile è h ≥ e ricordando che h è un numero naturale non nullo, l’unica 97. Le soluzioni dell’equazione y = h − h 2 − 97 h ∨ y = h + h 2 − 97 h , ed esse forniscono i valori di a e b. 101 sono date da Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 Bisogna ora cercare un valore di h numero naturale tale che la radice sia ancora un numero naturale. Sicuramente h = 97 soddisfa la richiesta, ma questo comporterebbe che a = b = 97, cosa che si è esclusa dall’inizio. I numeri della forma h2 -97h che sono quadrati perfetti sono abbastanza rari, nel senso che tra 98 e 50098 se ne trova solo uno, 2401, come si può vedere con un foglio elettronico, quindi il più piccolo (che è il quadrato di 49!). Si ha quindi 2.4012 - 97 2.401 = 5.764.801 - 232.897 = 5.531.904 = 2.3522 e così trovare le soluzioni a = 2.401-2.352 = 49 e b = 2.401+2.352 = 4.753: si ha pertanto 1 1 1 1 97 + 1 98 2 = = + = + = . Ahmes avrebbe potuto scrivere quindi la 49 4753 49 49 ⋅ 97 49 ⋅ 97 49 ⋅ 97 97 soluzione del suo problema come x = 16 + x = 16 + 1 1 + . La soluzione offerta dal testo antico è 49 4753 1 1 1 + + . Come si vede ben diversa da quella ottenuta mediante il calcolo algebrico 56 679 776 precedente, almeno come forma. Si osserva però che 56 = 7 8, 679 = 7 97 e 776 = 8 97. Si ha quindi 16 + = 1 1 1 16 ⋅ 56 ⋅ 97 + 97 + 8 + 7 + + = = 56 679 776 56 ⋅ 97 16 ⋅ 56 ⋅ 97 + 112 16 ⋅ 56 ⋅ 97 + 2 ⋅ 56 16 ⋅ 97 + 2 1554 . Si ha quindi lo stesso valore, ma con = = = 56 ⋅ 97 56 ⋅ 97 97 97 un’espressione decisamente diversa. Ahmes risolve il problema nel problema trovando quattro numeri naturali a, b, c e h tali che 1 1 1 2h + + = , quindi risolvendo, mediante le tecniche allora disponibili, un’equazione ben più a b c 97 h complessa di quella di partenza. È anche pensabile che abbia risolto il problema in altro modo: cercare tre numeri naturali non nulli a, b e c, tali che 1 1 1 2c + + = . Si tratta comunque di un problema complesso da risolvere; ab 97 a 97b 97c forse aveva a disposizione tavole che gli permettevano di dare velocemente risposta al problema in una di questa forma. Da Di Rienzo (loc.cit.): «Nel testo [Papiro Rhind] sono trattati 87 problemi sulle quattro operazioni, sulle aree, sui volumi, ed altro, ma sopra tutti è trattato il problema delle parti decimali, le cosiddette frazioni egiziane, per la cui soluzione è riportata una tabella che fornisce per ogni intero dispari n compreso tra 3 e 101 la scomposizione in frazioni unitarie della frazione 2/n. Tavola di 2/n del Papiro Rhind: 102 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 2+6 3 + 15 4 + 28 6 + 18 6 + 66 8 + 52 + 104 10 + 30 12 + 51 + 68 12 + 76 + 114 14 + 42 12 + 276 15 + 75 18 + 54 24 + 58 + 174 + 232 20 + 124 + 155 22 + 66 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65 67 30 + 42 24 + 111 + 296 26 + 78 24 + 246 + 328 42 + 86 + 129 + 301 30 + 90 30 + 141 + 470 28 + 196 34 + 102 30 + 318 + 795 30 + 330 38 + 114 36 + 236 + 531 40 + 244 + 610 42 + 126 39 + 195 40 + 335 + 536 AA. 2009-2010 69 71 73 75 77 79 81 83 85 87 89 91 93 95 97 99 101 Le scritture vanno interpretate: non è che, ad esempio 33 = 22+66, ma 46 + 138 40 + 568 + 710 60 + 219 + 292 + 365 50 + 150 44 + 308 60 + 237 + 316 + 790 54 + 162 60 + 332 + 415 + 498 51 + 255 58 + 174 60 + 356 + 534 + 890 70 + 130 62 + 186 60 + 380 + 570 56 + 679 + 776 66 + 198 101 + 202 + 303 + 606 » 2 1 1 = + . 33 22 66 Evidentemente manca nella tavola 97 scritto, coi simboli della tavola, con due numeri, 97 = 49+4.753. Ma forse si tratta di una scelta basata sul fatto che nella tavola non compaiono numeri maggiori di 1.000. Se si volesse, oggi, scomporre il numero 2 come somma di tre unità frazionarie, ritrovando così il 97 risultato di Ahmes, ci si trova dinnanzi un problema assai delicato. Infatti come prima si giungerebbe a scrivere di sesto grado 2 1 1 1 bc + ac + ab = + + = . Di qui si può impostare un sistema algebrico 97 a b c abc bc + ac + ab = 2 , sistema che è impossibile risolvere in quanto chiederebbe abc = 97 l’esistenza di tre numeri non nulli distinti i cui prodotti devono essere minori di 2 e che 97 si possa scrivere come il prodotto di tre numeri naturali, essendo primo. Nel sistema compaiono due delle tre formule di Viète per l’equazione algebrica di terzo grado. Come prima si può lavorare su un parametro aggiuntivo h tale che bc + ac + ab = 2h . abc = 97 h I metodi algebrici consueti possono essere di poco aiuto in quanto si avrebbe un sistema parametrico di sesto grado di 2 equazioni in tre incognite. Visto che si cercano numeri naturali forse vale la pena di utilizzare considerazioni aritmetiche che pur essendo più semplici possono risultare più difficili da applicare in quanto non ottenibili come casi particolari di una procedura generale. Questo esempio, pur votato ad un parziale insuccesso mostra però bene la differenza tra metodo aritmetico e metodo algebrico. 103 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado Dalla prima equazione del sistema AA. 2009-2010 bc + ac + ab = 2h si ha che il numero bc + ac + ab deve essere abc = 97 h pari. Ciò non si ottiene se i tre numeri incogniti sono dispari perché il prodotto di due numeri dispari è dispari e la somma di tre numeri dispari è dispari. Se uno solo dei tre numeri fosse pari, ancora la somma di due numeri pari e di uno dispari sarebbe dispari, quindi si devono essere almeno due numeri pari. Si può supporre, senza perdita di generalità, che a e c siano pari, a = 2a’, c = 2c’ e trattare questo caso. Dovendo effettuare poi il calcolo della somma delle tre frazioni unitarie, si può considerare il fattore 2 presente una sola volta nella espressione del minimo comune denominatore per cui 2 2h 1 1 1 bc' +2a ' c' +a' b = = + + = , modificando di conseguenza il sistema come segue: 97 97h 2a ' b 2c' 2a ' bc' bc' +2 a ' c' +a' b = 2h . Non si procede oltre, è complicato dal dover tenere conto dei numerosi casi. 2a ' b' c'= 97 h L’altra strada indicata porterebbe al sistema 97 + b + a = 2c , quindi all’unica equazione 97 + a + b 97 ab = 97c = 2ab, equazione diofantea di secondo grado, su cui si può lavorare aritmeticamente osservando che la somma dei primi tre termini deve essere pari, ma 97 è dispari, quindi uno solo dei numeri a, b deve essere dispari e l’altro pari. Così supposto, senza perdita di generalità che a = 2a’ + 1 e b = 2b’, si ha 97 + 2a’ + 1 + 2b’ = 2(2a’ + 1)(2b’), quindi 98 + 2a’ + 2b’ = 4b’(2a’ +1). Si ottiene così una ‘riduzione’ considerando 49 + a’ + b’ = 2b’(2a’+1). Ancora una volta considerando la parità del primo membro si procede, per casi. Come si vede, la trattazione è comunque complessa. 3.2.3 Algebra geometrica in Grecia. Tra i testi greci che ci sono pervenuti, quello che ha la maggiore estensione (e completezza) è gli Elementi di Euclide, che raccoglie ed ordina i risultati di 300 anni di studi di altri matematici. Esso dà un buon resoconto dello stato della cultura del suo tempo, delle correnti epistemologiche e filosofiche attive e più ampiamente Euclide di Alessandria (III sec. a.C.) accettate (Platone e Aristotele). In tale opera traspare tutta la problematica sollevata dalla scoperta della incommensurabilità e dai paradossi di Zenone. Zenone di Elea (490-425 a.C.) Nella Scienza greca che ha avuto il ‘sopravvento’ c’è una continua paura dell’infinito e questa si trasforma in un abbandono della categoria della quantità a favore della categoria della qualità. Punto fondamentale di questo atteggiamento è la scelta di sviluppare la Geometria a scapito dell’Aritmetica. D’altronde, con la notazione usata per denotare i 104 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 numeri era ben difficile procedere e sviluppare una teoria algebrica. Questi aspetti verranno ripresi e approfonditi solo tra III e IV sec. d.C. da Diofanto. Secondo Paul Tannery quella che si sviluppò nella Grecia classica può essere definita con il nome di Algebra geometrica, vale a dire di metodi geometrici utilizzabili in piena generalità per risolvere problemi algebrici, a differenza da Paul Tannery (1843-1904) quanto mostrato nei casi precedenti, in cui ciascun problema, risolubile con equazioni porta con sé il metodo per la sua soluzione. Nell’esempio ricavato dalla tavoletta mesopotamica, se invece di 870 il termine noto fosse 871, il procedimento non funzionerebbe. Invece i procedimenti di Algebra geometrica sono indipendenti dai valori numerici specifici. Le tracce di questa Algebra geometrica sono sparse in varie proposizioni del testo di Euclide. Ci sono infatti risultati che vengono dimostrati e che non sembrano avere relazione con altri risultati precedenti e successivi. Secondo i commentatori moderni si tratta di proposizioni che permettono la soluzione di equazioni algebriche, una volta tradotte in termini geometrici. 3.2.4. La Proposizione 43 del Libro I degli Elementi. La Proposizione 43 del Libro I afferma: «In ogni parallelogramma i complementi dei parallelogrammi (posti) intorno alla diagonale sono eguali tra loro». Già questo testo, che pure per secoli è F stato E L a C B x H l’esempio della letteratura scientifico, ha bisogno di essere ‘tradotto’. Nel testo sono presenti disegni che aiutano a spiegare il testo. b Di fatti il termine “complemento” non D A G è definito, ma la presentazione iconica permette di comprendere. dimostrazione è semplice. Il testo di Euclide dice: «Sia DGLF un parallelogramma, FG una sua diagonale ed CE e AH siano parallelogrammi posti intorno a FG, mentre siano BL e BD i cosiddetti complementi; dico che il complemento BL è uguale al complemento BD. Infatti poiché DGLF è un parallelogramma e FG la sua diagonale, il triangolo FDG è eguale al triangolo FLG (Prop. I, 34). Di nuovo CBEF è un parallelogramma e FB è una sua diagonale, il triangolo BFC è uguale al triangolo BEF (id.) E per la stessa ragione, pure il triangolo BAG è eguale al triangolo BGH (id.). Poiché dunque il triangolo CBF è uguale al triangolo BEF ed il triangolo BGH al triangolo BAG, il triangolo BFC insieme col triangolo BAG è eguale al triangolo BEF (noz. com. II); ma anche tutto quanto il triangolo GFD è eguale a tutto il triangolo GLF: il complemento BD che (così) rimane è quindi uguale al rimanente complemento BL (noz. com. III)» 105 La Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 Il testo accompagnato dal disegno chiarisce perfettamente cosa si vuole provare. Si noti che alcuni parallelogrammi vengono indicati da Euclide mediante le lettere che nominano i quattro vertici, altri nominando solo due vertici opposti. 3.2.5 Applicazione della Proposizione I. 43 ad un problema di primo grado ‘quadrato’. Vediamo ora come è possibile applicare questa proposizione per risolvere l’equazione ax = b2. In essa coefficienti ed incognita indicano lunghezze. L’equazione è quindi omogenea. Non come F quella della tavoletta mesopotamica in cui si sottrae un lato ad r un’area. Dal punto di vista algebrico è un’equazione di primo grado, dal b B s A E D a punto di vista geometrico è di secondo grado, dato che è un problema C b sulle aree. Si considera un segmento a di estremi A e B e lo si prolunga di un H segmento b, dalla parte di B, ottenendo il segmento BC. Si costruisce t x G K u la retta per B perpendicolare ad AC e su di essa si individua un punto D tale che i segmenti BD e BC siano congruenti. Per C si manda la retta p parallela a BD. Per D si manda la retta r parallela a AC e per A la retta s parallela a BD. Le due rette p e r essendo parallele alle rette AC e BD, incidenti, sono incidenti in un punto E; le rette r e s essendo parallele alle rette AC e BD, incidenti, sono incidenti in F. Si congiungano i punti F e B con la retta t ( che quindi interseca la retta AC in B). Le rette t e p, essendo parallele a due rette che si intersecano, si intersecano in un punto G. Sia ora u la retta per G parallela a AC. Essa interseca la retta s, in quanto u e s sono rispettivamente parallele alle rette AC e BD che si intersecano. Sia H il punto di intersezione di u e s e sia K il punto di intersezione tra u e la retta BD. Il segmento che ha per estremi BK è la soluzione dell’equazione, in quanto i parallelogrammi (sono rettangoli per costruzione!) BE e BH (con le notazioni di Euclide) sono i complementi posti attorno alla diagonale del parallelogramma EFHG. L’area di questi due parallelogrammi è data rispettivamente da ax e da b2, quindi ax = b2. Il fatto di avere utilizzato rettangoli nella costruzione è determinato dalla semplicità, ma è possibile procedere con parallelogrammi non rettangoli. 3.2.6 Risoluzione dello stesso problema mediante il primo teorema di Euclide. Come è ben noto sia il primo che il secondo Teorema di Euclide … non si trovano sugli Elementi. Forse per un pudore 106 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 dell’autore o forse perché l’autore non se ne è reso conto. Nella Proposizione I.47, più nota col nome di Teorema di Pitagora (diretto) che afferma «Nei triangoli rettangoli il quadrato del lato opposto all’angolo retto è eguale alla somma dei quadrati dei lati che comprendono l’angolo retto» Nella dimostrazione Euclide afferma, facendo riferimento alla figura (qui riportata dal testo con l’aggiunta del punto M non presente H nell’originale): «[…] il triangolo ABD è eguale al triangolo FBC (I.4). Ma il parallelogramma BL è il doppio del triangolo ABD […] , mentre il quadrato GB è il doppio del triangolo FBC […] Ma i doppi di cose uguali sono uguali tra loro (noz. Com. V); è quindi uguale anche il K G A F B M C D L E parallelogramma BL al quadrato GB» In altre parole, il quadrato del cateto AB è equivalente al rettangolo che ha per lati l’ipotenusa BC e la proiezione BM del cateto AB sull’ipotenusa. Questo appunto è noto col nome di primo teorema di Euclide. La soluzione dell’equazione si ottiene ora mediante una semplice costruzione geometrica: Si considera un segmento a di estremi AB. Si determina il punto medio M di AB e si costruisce la D C b A x E M semicirconferenza di diametro AB. Si prolunga AB a B dalla parte di A con un segmento b ottenendo il segmento di estremi AC. Si considera la circonferenza di centro A passante per C e la si interseca con la semicirconferenza precedente ottenendo il punto D. Da D si manda la perpendicolare a AB che interseca tale segmento in E. Il segmento AE è la soluzione della equazione data. Questo metodo richiede che esista l’intersezione tra la circonferenza e la semicirconferenza, cosa che avviene se il segmento b è suvvalente al segmento a. La Proposizione I.43 non ha questa limitazione, essendo possibile la costruzione richiesta in ogni caso, come appunto mostra la figura costruita come applicazione di tale proposizione. 3.2.7. La risoluzione di un problema di primo grado ‘rettangolare’. Ben diversa è la situazione posta dall’equazione 107 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 ax = bc Stavolta non compare un quadrato a secondo membro, per questo motivo possiamo distinguerlo dal problema posto in 2.2.5 con l’appellativo ‘rettangolare’. Tuttavia anche questo problema è ‘geometricamente’ di secondo grado in quanto richiede un confronto tra aree (di rettangoli). E’ ovvio che questo è un caso più generale di quello quadrato, in quanto è possibile scegliere b e c eguali e quindi tornare al caso quadrato. Siano dunque a,b,c e x segmenti, a,b e c noti, x da trovare. Vi sono diverse strade. La prima è applicare la Proposizione I.43 modificando la costruzione vista in 3.2.5, semplicemente considerando sulla retta per B perpendicolare a AC un punto D tale che il segmento BD sia c. Il resto della costruzione rimane inalterato, mediante la costruzione di rette parallele. Euclide usa un’altra strada, introducendo la Proposizione I.44: «Applicare ad una retta data, in un dato angolo rettilineo, un parallelogramma uguale ad un triangolo dato.» Seguiamo la dimostrazione di Euclide, anche per chiarire certi aspetti non consueti nella presentazione della Geometria dei testi odierni: «Siano AB la retta data, C il triangolo dato e D l’angolo rettilineo dato: si deve dunque applicare alla retta data AB in un angolo uguale all’angolo D, un parallelogramma uguale ad un triangolo dato C. Si costruisca nell’angolo EBG che sia eguale all’angolo D, il parallelogramma BEFG uguale al triangolo C (I.42) e lo si ponga in modo da essere BE in linea retta con AB, si prolunghi FG oltre G sino ad H, per A si conduca AH 108 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 parallela all’una o all’altra indifferentemente delle rette BC, EF (I.31 e I.30), e si tracci la congiungente HB. Ora poiché la retta HF cade sulle parallele AH, EF, la somma degli angoli AHF, HFE è eguale a due retti (I.29). la somma degli angoli BHG, GFE è perciò minore di due retti; ma rette che vengano prolungate illimitatamente, a partire da angoli minori di due retti si incontrano (post. V), per cui HB, FE, se prolungate, si incontreranno. Si prolunghino esse e si incontrino in K, per il punto K si conduca KL parallela all’una o all’altra indifferentemente delle rette EA, FH (I.31 e I.30), e si prolunghino HA, GB oltre A, B rispettivamente sino ai punti L, M. Quindi HLKF è un parallelogramma, HK è una sua diagonale, ed AG, ME sono parallelogrammi posti attorno a HK, mentre LB, BF sono i cosiddetti complementi; LB è perciò uguale a BF (I.43). Ma BF è uguale al triangolo C; quindi anche LB è uguale a C (noz.com. I). Dunque, è stato applicato alla retta data AB nell’angolo ABM, che è uguale all’angolo D (noz.com. I), il parallelogramma LB uguale al triangolo dato C.» Questo proposizione, insieme alla I. 42 che afferma «Costruire in un dato angolo rettilineo un parallelogramma uguale ad un triangolo dato», ci insegna a costruire parallelogrammi di data estensione e di angoli e lati assegnati. Non deve confondere la storia del triangolo che compare nell’enunciato. Esso serve per individuare due segmenti, la metà di un lato del triangolo e l’altezza relativa a tale lato. C’è bisogno di questa flessibilità perché l’estensione di un parallelogramma non è individuata dalla lunghezza dei suoi lati, ma entrano anche gli angoli formati dalle coppie di lati adiacenti. Di fatto nelle applicazioni che ci interessano dal punto di vista algebrico, la costruzione che si fa, generalizza quella della Proposizione I.43. La generalità offerta dalla scelta dell’angolo però non interessa. L’importanza di questa Proposizione è che essa introduce la nozione di applicazione delle aree. Anzi come vedremo in altro contesto il termine παραβολ significa appunto applicazione e quella introdotta dalla Proposizione I.44 sarà detta applicazione parabolica, in un certo senso l’applicazione per antonomasia. Il confronto con il testo originale euclideo (in traduzione italiana) ci permette di apprezzare la stretta vicinanza coi metodi dimostrativi di oggi, che di fatto salvo poche eccezioni, derivano in pieno da quelli di Euclide. Il suo testo è organizzato come una catena crescente di conoscenza che parte dall’evidenza degli assiomi (le cosiddette nozioni comuni, di contenuto ‘logico’) e dei postulati (con contenuto geometrico) nonché dalla lampante chiarezza esperienziale dei termini primitivi, per scoprire in base al ragionamento ‘verità’ riposte e meno immediate. C’è infatti il richiamo a proposizioni provate precedentemente e ad assiomi o postulati. Nell’opera composta di tredici Libri ( e che presenta comprende 465 Proposizioni, indicate con tale nome nel testo latino), il primo getta le basi per l’intera opera presentando termini primitivi fondamentali e le nozioni comuni. Sono presenti anche i postulati (5), ma nel prosieguo dell’opera si aggiungeranno in vari capitoli altri postulati ancora, per cui fissare in 5 il numero dei postulati 109 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 sembra riduttivo. L’analisi critica condotta dal 300 a.C. al 1899 (e forse oltre) mostra che Euclide fa uso di altri postulati che non ha esplicitato e spesso le definizioni introdotte (in tutta l’opera 130 esplicitate) richiedono una parte di postulazione che non è esplicita. Per completezza di informazione, anche se questi argomenti potrebbero essere oggetto di altri corsi universitari, si indicano qui, ricopiati dalla traduzione italiana, nozioni comuni e postulati, elementi costitutivi del primo Libro. «Nozione comune 1. Cose che sono uguali ad una terza sono uguali anche tra loro. Nozione comune 2. E se le cose uguali sono addizionate a cose uguali, le totalità sono uguali. Nozione comune 3. E se da cose uguali sono sottratte cose uguali, i resti sono uguali. Nozione comune 7. E cose che coincidono fra loro sono fra loro uguali. Nozione comune 8. Ed il tutto è maggiore della parte.» A queste vengono aggiunte altre quattro, quelle ritenute o spurie o superflue: «4. E se cose uguali sono addizionate a cose disuguali le totalità sono disuguali. 5. E doppi di una stessa cosa sono uguali fra loro. 6. E metà di una stessa cosa sono uguali tra loro. 9. E se cose eguali sono sottratte da cose disuguali, i resti sono disuguali.» La numerazione delle nozioni comuni è diversa nella traduzione italiana e nel testo critico in greco. «Postulato 1. Risulti postulato: che si possa condurre una linea retta da un qualsiasi punto ad ogni altro punto. Postulato 2. E che una retta terminata (= finita) si possa prolungare continuamente in linea retta. Postulato 3. E che si possa descrivere un cerchio con qualsiasi centro ed ogni distanza (= raggio). Postulato 4. E che tutti gli angoli retti siano uguali tra loro. Postulato 5. E che, se una retta venendo a cadere su due rette forma angoli interni e dalla stessa parte minori di due retti (= tali che la loro somma sia minore di due retti), le due rette prolungate illimitatamente verranno ad incontrarsi da quella parte in cui sono gli angoli minori di due retti ( = la cui somma è minore di due retti).» Il primo libro presenta 23 definizioni. Qui se ne offre un piccolo ‘saggio’ per cogliere la differenza concettuale tra vari tipi di definizioni: l’oggetto in sé, l’oggetto in relazione ad altri oggetti, la costruzione che serve ad assegnare un nome ‘tecnico’. Definizione I.1 «Punto è ciò che non ha parti» Definizione I.3 «Estremi di una linea sono punti» Definizione I.10 «Quando una retta innalzata su una [altra] retta forma gli angoli adiacenti uguali fra loro, ciascuno dei due angoli uguali è retto, e la retta innalzata si chiama perpendicolare a quella su cui è innalzata» 3.2.8. La risoluzione di un problema di primo grado ‘rettangolare’ col Teorema di Talete. Si tratta di un teorema che prende il nome da Talete per l’assonanza con la storia narrata nell’aneddoto ricordato prima della misura dell’altezza della Piramide. Come detto in precedenza, data la generalità maggiore dei problemi di primo grado rettangolari, 110 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 mediante la tecnica che ora si mostra si possono risolvere anche i problemi di primo grado quadrati. La soluzione si basa sul fatto che l’eguaglianza ax = bc si può leggere come una proprietà della proporzione a : b = c : x e così facendo si abbandona l’ambito algebrico propriamente detto. Per realizzare geometricamente tale proporzione basta considerare due semirette distinte r e s uscenti da un punto O, sulla semiretta individuare due punti A e C in modo che il segmento di estremi O e A sia a, che il segmento di estremi A e C sia c. A questo punto sulla semiretta s basta scegliere un punto B in modo che il segmento di estremi O e B sia b. Si congiungono i punti A e B con una retta e da C si manda la retta t parallela ad AB. L’intersezione di s con t è il punto X tale che il segmento di estremi B e X è la soluzione del problema posto. La scelta dei punti sulle semirette può essere fatta anche diversamente, ad esempio interpretando la proporzione a : c = b : x. 3.2.9 La ‘Regula infusa’. L’anno 1000 è noto per essere risultato una sorta di svolta nella storia, come la data che segna il passaggio da un medioevo cupo ad uno più aperto alla novità dell’umanesimo nascente. Come tutte le categorie temporali andrebbero mitigate certe affermazioni, dato che sono state fatte dopo, con un’ottica che risentiva delle influenze culturali del tempo in cui è stata fatta. Per la Matematica era un’epoca di rinascita in quanto Muhamed ibn Musa al-Khowarizmi (780-850) prendevano piede in tutto il Mediterraneo le novità introdotte dagli arabi. In particolare si diffondeva, assieme alle armate arabe, il trattato Al-jabr we’l mukabala, scritto da Mohamed ibn Musa al Khowarizmi, nel IX secolo. Ma era un’innovazione di lenta penetrazione. In realtà nella città di Bagdad, era fiorente una cultura protetta dal califfato, in particolare da al-Mamun, califfo dell’epoca che aveva fondato una Casa del Sapere, che aveva chiesto all’Imperatore di Costantinopoli i testi dei filosofi greci e che favoriva lo scambio di merci e cultura tra il Mediterraneo e l’India. Le armate arabe, sotto il comando del califfo, erano penetrate nel Mediterraneo impadronendosi dell’Africa del Nord, della Sicilia e poi della Spagna. Gli Ebrei contribuirono alla diffusione della cultura scientifica araba, anzi attorno all’anno 1000 si può dire che in Spagna i più importanti matematici erano Ebrei. Tra questi Abraham ben Ezra (1092-1167) autore di un testo sull’Aritmetica in cui esprime un metodo per la risoluzione delle equazioni di primo grado che egli attribuisce a Job ben Solomon. 111 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 Tale metodo, nella traduzione latina del testo di ben Ezra, prende il nome di Regula infusa. Un problema che si trova nel trattato citato può essere tradotto in formule, con simboli moderni come l’equazione m(ax + b) + c = 0. Con una sostituzione si pone ax + b = y e l’equazione da risolvere diviene my + c = 0. Questa equazione risolta dà y = − 1 c c e tornando all’equazione di partenza, x = − +b . a m m In questo modo si ottiene effettivamente la soluzione, dato che m − =m − a c +b +b +c = a m c − b + b + c = −c + c = 0 . m La regola può sembrare banale e anche più complessa di quanto non serva, ma l’algebra del tempo era retorica e le trasformazioni algebriche che possono sembrare evidenti oggi, grazie all’abitudine al simbolismo, non erano patrimonio comune. Non è da sottovalutare inoltre la più o meno facile memorizzabilità di un procedimento se espresso, anche in termini sovrabbondanti, mediante frasi rimate o con altri trucchi retorici. L’esempio esplicito proposto da ben Ezra può convincere. Sia data l’equazione 1 1 1 x − x − 4 − x − x − 4 = 20 3 4 3 Questa rientra nel tipo di equazioni proposte perché m = 1 − 1 3 1 2 = ; a = 1 − = ; b = -4 e c = -20. 4 4 3 3 1 1 Ponendo il termine entro parentesi uguale a y, vale a dire y = x − x − 4 , si ha y − y = 20 , da cui, 3 4 calcolata la differenza, y = 80 2 80 e ripristinando il termine originario, x − 4 = , vale a dire 3 3 3 2 92 x= , da cui x = 46. 3 3 1 1 1 Verifichiamo che tale valore è soluzione dell’equazione: 46 − 46 − 4 − 46 − 46 − 4 = 3 4 3 = 42 − 46 23 23 242 − 92 − 69 + 23 + 6 120 − + +1 = = = 20 . 3 2 6 6 6 Dal calcolo algebrico odierno si ricaverebbe 3 2 1 1 x − 4 = 20, da cui x − 3 = 20, quindi x = 23 , 4 3 2 2 vale a dire x = 46. 112 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 Il confronto con il metodo odierno è ingeneroso con la proposta della Regula infusa. In essa è assai interessante l’utilizzo di una (semplice) sostituzione che cambia l’indeterminata e che sicuramente ha preceduto altre più complesse trasformazioni di questo tipo. 3.2.10 La regola di falsa posizione nella matematica araba del Medioevo. Si è vista la regola di falsa posizione nel Papiro di Ahmes. Sul testo Talchîs databile attorno al 1300, il matematico marocchino Ibn al-Banna, noto anche come al-Marrâkuschî (1256 – 1321), propone una variante della regola di falsa posizione. Data l’equazione ax + b = 0 si attribuisce un arbitrario valore h ad x ottenendo un corrispondente valore k: ah + b = k (a questo punto noi scriveremmo b = k – ah, con la disinvoltura che ci proviene da qualche secolo di Algebra, ma si osservi che la scrittura precedente offre l’algoritmo per calcolare k a partire da h, la nostra scrittura quello per calcolare b, che è assegnato a partire da h e k). Se k = 0, è trovata la soluzione: x = h, altrimenti sottraendo le due equazioni si ottiene a(h - x) = k, da cui a = nell’equazione di partenza si ha dapprima x= kx + b(h – kx + b = 0 . Risolvendo l’equazione rispetto a x si ottiene h− x x) = 0, poi (k - b)x = - bh, da cui bh h(ah − k ) h(k − b) − hk hk = = = h− . b−k k −b k −b k −b La formula fornisce la soluzione. Infatti si ha = k . Sostituendo h−x a h− hk ah(k − b) − ahk + b(k − b) +b = = k −b k −b ahk − abh − ahk + bk − b 2 − abh + b(ah + b) − b 2 0 = = = 0. k −b ah + b − b ah Questo metodo risulta utile sia in algebra retorica che in algebra sincopata, un terzo tipo di notazione algebrica, proposto da Diofanto, in cui si schematizzano potenze, operazioni e relazioni con scritture stenografiche. Diofanto scrisse un testo, Aritmetica, di cui abbiamo 6 libri degli originali 13, probabilmente un’opera di compilazione di quanto era noto fino ai suoi giorni. Essa presenta 130 problemi, di cui dà le soluzioni numeriche di quelle con soluzione unica, ed inoltre presenta alcune equazioni indeterminate che oggi sono dette equazioni diofantee. E’ interessante osservare che il testo affronta vari quesiti che richiedono equazioni di secondo 113 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 grado, ma tutte sono risolubili (discriminante positivo o nullo); di queste Diofanto presenta solo le eventuali soluzioni positive. Sfrutta inoltre alcuni sistemi simmetrici di secondo grado. Il merito maggiore di questo testo è di presentare una sorta di notazione per la matematica vicina a quella simbolica, che dagli studiosi viene vista come una proposta originale di Diofanto. Nella sua opera Diofanto scrive, con una certa regolarità, in maniera stenografica - per unità, - (la ‘sigma’ finale minuscola) per indicare l’incognita del problema, per indicare il quadrato dell’incognita (il simbolo all’esponente nei manoscritti è diverso e - qui lo si scrive con gli strumenti disponibili), - per indicare il cubo dell’incognita, - per indicare la quarta potenza dell’incognita. - per la quinta potenza dell’incognita, - per la sesta potenza dell’incognita. Nella scrittura dei polinomi o più generalmente delle espressioni algebriche, Diofanto scrive i coefficienti dei monomi dopo la ‘parte letterale’, usa la giustapposizione come addizione, un segno simile a un simbolo di appartenenza ruotato in senso orario di un angolo retto per indicare il segno di sottrazione (che qui si realizza con un Così quello che oggi scriveremmo come Κ Τ β∆Τ γ ςα ) e il termine greco 2 x3 + 3x 2 − x x4 + 2x +1 per indicare la frazione. si scriverebbe coi simboli di Diofanto come ∆Τ ∆αςβυα . Ritorniamo ora al metodo di falsa posizione. Esso è utile soprattutto se si tratta di risolvere le equazioni non in forma normale e senza ridurle alla forma normale. Ad esempio sia data l’equazione 1 1 x + x = 21 3 4 L’equazione si può scrivere 1 1 x + x − 21 = 0 . Ponendo x = 24 si ha 8 + 6 – 21 = -7. Quindi 3 4 applicando la formula risolutiva, avendosi h = 24; k = -7 e b = -21, si ha x = 24 − − 7 ⋅ 24 168 = 24 + = 24 + 12 = 36 e si verifica immediatamente che 36 è soluzione − 7 + 21 14 dell’equazione data. 114 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 3.2.11. La regola di doppia falsa posizione. Questa regola si trova, tra l’altro, nel Liber Abaci (1202) di Fibonacci, nella Summa (1494) di Pacioli, nel Generale Trattato (1560) di Tartaglia. Recorde in Ground of Niccolò Fontana detto Tartaglia (1500-1557) Luca Pacioli (1445-1517) Robert Recorde (1510-1558) Arts (1542) ne dà una esposizione in versi. La regola ha avuto un lungo periodo di applicazione anche dopo l’introduzione e la diffusione del calcolo simbolico, tanto è vero che veniva raccomandata nel 1884 nei programmi dei licei austriaci. Sia data l’equazione (in termini moderni) ax + b = 0. Si considerano ora due valori di x, h’ e h”, da cui, per sostituzione, si ottiene (*) ah’+b = k’ (**) ah” + b = k”. Si può ipotizzare, senza perdita di generalità, che h’ e h” non siano soluzioni dell’equazione. Sottraendo tra loro le due relazioni (*) e (**) si ottiene (§) a(h’-h”) = k’ – k”. Moltiplicando la (*) per h” e la (**) per h’ si ha ah’h”+bh”= h”k’ ah’h”+bh’ = h’k” Sottraendo membro a membro si ha b(h”-h’) = h”k’-h’k”. Dividendo quest’ultima per la (§) si ricava − b h" k ' −h'k " = x. = −k " a k' Queste trasformazioni algebriche, come prima, possono essere utili per fare sparire eventuali denominatori inopportuni presenti in un’equazione non ridotta in forma normale. 3.3. Equazioni di primo grado a più incognite. La storia della Matematica presenta altri tipi di equazioni di primo grado legate a problemi rivelatisi interessanti e importanti per la ricerca teorica e per le applicazioni pratiche. Si tratta delle equazioni di primo grado con più incognite. Ad esempio: a1x1 + a2x2 +…+ anxn = b. Scritture di questo tipo sono frequenti nell’ambito degli spazi vettoriali in cui con ai si indicano scalari e con xi si indicano i vettori (in tale caso si usa il grassetto o la freccia di soprassegno). La scrittura a primo membro prende il nome di combinazione lineare dei vettori. La situazione può essere più complessa in quanto invece di una sola equazione ve ne possono essere più di una a costituire un sistema. 115 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 In questo ambito è noto un risultato che identifica quando il sistema sia compatibile e come individuare la soluzione. Si tratta del Teorema di Eugène Rouché (1832-1910) e Alfredo Capelli (1855-1910). Dato un sistema lineare esso è risolubile se e solo se il rango della matrice del sistema (matrice incompleta) è eguale al rango della matrice completa formata aggiungendo la colonna dei termini noti. In tale caso individuato nella matrice incompleta un minore di ordine massimo non nullo, si considera il sistema ausiliario formato solo dalle equazioni i cui coefficienti compaiono come righe in tale minore e portando a secondo membro tutti i termini in cui compaiono incognite i cui coefficienti non sono presenti nelle colonne di tale minore. La soluzione del nuovo sistema lineare trovata mediante il Teorema di Cramer dipende dalle incognite che vengono poste a secondo membro con il ruolo di parametri. Gabriel Cramer (1704-1752) In applichiamo tale risultato all’equazione ax + by + cz = d. Si tratta di un ‘sistema’ molto particolare. La matrice incompleta è data da (a b c); la matrice completa è data da (a b c d). Si tratta di due matrici che possono entrambe avere come rango massimo 1. La matrice incompleta ha rango 1 se e solo se almeno uno dei coefficienti dell’equazione è diverso da 0, vale a dire se e solo se esiste l’equazione. Infatti il suo rango sarebbe 0 se e solo se la scrittura precedente fosse 0 = d. Si ha quindi che nel caso di un’equazione effettiva, la matrice incompleta ha rango 1 e quindi anche la matrice completa ha rango 1. Sia ad esempio b ≠ 0. Allora dal Teorema di Rouché e Capelli si ricava il nuovo ‘sistema’ by = - ax – cz + d che risolto fornisce y= 1 (ax − cz + d ). b In questa espressione, il ruolo di x e z è quello di parametro. In tal modo si ottengono infinite soluzioni 1. Infatti scelti arbitrariamente x’ e z’, si ha y '= 1 1 (ax' −cz ' + d ) . Sostituendo nell’equazione b Quando si deve usare l’aggettivo infinito, c’è sempre da porre attenzione, perché è diverso dire che ci sono infinite soluzioni o ci sono soluzioni infinite. Anche la dizione ‘un numero infinito di’ lascia molto perplessi, perché sembra accettare l’esistenza, per contrapposizione, di numeri finiti ed infiniti. Il modo migliore di esprimere è quello di utilizzare infinito come aggettivo di insieme, nella dizione ‘un insieme infinito di’, dato che il concetto di insieme infinito è chiaramente definito. Questo è uno dei motivi per cui sarebbe bene parlare di insieme di soluzioni e non di soluzioni. Così nel caso di un’equazione algebrica di secondo grado (o di grado superiore), in generale non ha senso dire che la soluzione è unica, ma ha senso dire che l’insieme delle soluzioni è unico. 116 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado AA. 2009-2010 1 di partenza si ha ax' +by ' + cz '= ax' +b ⋅ (−ax' −cz ' + d ) + cz '= a x' −a x' −c z ' + d + c z '= d . b L’esempio considerato ha una importante interpretazione geometrica: l’equazione di partenza con tre incognite si può interpretare come l’equazione cartesiana di un piano nello spazio geometrico 3 . Con questa interpretazione è ovvio che, pur essendo un’equazione di primo grado, non ci si può aspettare di avere un’unica soluzione. Inoltre il ruolo di in queste considerazioni può essere svolto da un qualsiasi campo, anzi ponendo attenzione all’ordine delle operazioni, ad un qualunque corpo. Più interessante è individuare le condizioni di risolubilità di questo tipo di equazioni in un anello. Conduciamo l’indagine in , tenendo conto che in altre strutture le cose si complicano. L’equazione ax + by + cz = d da risolvere in può pensarsi come la formalizzazione del quesito di determinare i punti di coordinata intera che appartengono al piano che ha appunto la data equazione. Se due coefficienti a, b e c sono nulli, si ricade in un’equazione di primo grado. In questo caso si considera che almeno due fra tali coefficienti siano non nulli. Se almeno uno dei coefficienti è uguale a 1, ad esempio a, si ricava x = – by – cz +d, quindi dati arbitrari valori a y ed a z, si ricava il corrispondente valore di x, quindi la terna ordinata così individuata è un punto di coordinate intere del piano. Ora può accadere che il piano non abbia punti di questo tipo, oppure ne abbia in un numero finito oppure ne abbia infiniti. Vediamo una condizione per la risolubilità: detto m = MCD(a,b,c) e, dato che m divide sia a, sia b, quanto c, esistono a’, b’ e c’ tali che a = ma’, b = mb’, c = mc’, con MCD(a’,b’,c’) = 1. Si avrebbe, qualunque siano x,y e z in Z, , ax + by + cz = m(a’x + b’y + c’z) = d, quindi, per poter avere soluzioni, m deve dividere d. Se ciò non accade, l’equazione non è risolubile in . Per metterci quindi in condizioni di risolvere l’equazione, si suppone senza perdita di generalità che MCD(a,b,c) = 1. Questo caso si realizza banalmente se uno dei coefficienti è 1. Ricordo che MCD(a,b,c) = MCD(MCD(a,b),c) = MCD(a,MCD(b,c)). Se uno dei tre coefficienti è nullo, ad esempio b, dato che MCD(a,0) = a e MCD(0,c) = c, e quindi si ha che MCD(a,0,c) = MCD(a,c). I coefficienti non sono, in valore assoluto, tutti uguali, dato che in tal caso si avrebbe che il loro MCD sarebbe uguale a ciascuno di loro (a meno di valore assoluto). Si individua il coefficiente non nullo, in valore assoluto, minore. Supponiamo sia esso c, allora si può porre cz = – ax – by + d. A meno di un cambio di segno ad entrambi i membri, si può ritenere c > 0. Dividendo per c e considerando le parti intere dei quozienti si ha, posto a’ = qu(-a,c); b’ = qu(-b,c); d’ = qu(d,c) e 117 Matematiche complementari I – Capitolo 3 Teoria e storia delle equazioni di primo grado a” = re(-a,c); b” = re(-b,c); d” = re(d,c), ove 0 AA. 2009-2010 a”, b”, d” < c, in modo che risulti; -a = a’c + a”, -b = b’c + b” e d = d’c + d”, si ha z = a 'x + b'y + d ' + Se ora si pone z1 = a" b" d" x+ y+ c c c a" b" d" x + y + , da cui -a”x + -b”y + cz1 = d”, ma 0 c c c a”, b”, d” < c. Inoltre MCD(a”,b”,c) = 1, in quanto se fosse MCD(a”,b”,c) = s, allora -a = ca’+a” e -b = cb’+b” sarebbero divisibili per s, poiché lo sarebbero c e a”; c e b”, quindi non sarebbe MCD(a,b,c) = 1. Questo primo passo può essere ripetuto perché sono verificate le condizioni iniziali. Per il principio della discesa finita, si giunge a resto 0, da cui risalendo si trova una variabile in funzione delle altre due e assegnando valori interi alle variabili si giunge ad individuare tutte le possibili soluzioni intere. Per esemplificare si consideri l’equazione 10x - 9y + 6z = 5. Si ha MCD(10,-9,6) = MCD(10,MCD(-9,6)) = MCD(10,3) = 1. Procedendo come detto prima, 6z = -10x + 9y + 5 z = −2 x + y + 2 3 5 2 3 5 x + y + . Posto z1 = x + y + , si ha -2x - 3y + 6z1 = 5, quindi 2x = -3y + 6z1 6 6 6 6 6 6 5. Si ripete il procedimento e si ha x = −2 y + 3 z1 − 3 + 1 1 1 1 y + , quindi si pone x1 = y + , da cui 2 2 2 2 2x1 - y = 1; pertanto y = 2x1 -1; x = –2(2x1 – 1) + 3z1 – 3 + x1 = –3x1 + 3z1 – 1; z = – 2(–3x1+3z1–1) +(2x1 – 1) + z1 = 6x1 – 6z1 +2 + 2x1 – 1 + z1 = 8x1 – 5z1 +1 Si ha quindi x = −3 x1 + 3 z1 − 1 . Per y = 2 x1 − 1 z = 8 x1 − 5 z1 + 1 qualunque coppia ordinata di interi relativi x1,z1 si ottiene una terna ordinata di numeri interi relativi x,y,z che è soluzione dell’equazione proposta. Ad esempio se x1 = 0 e z1 = 2, si ha x = 6 −1 = 5 y = −1 e 10 5 –9 (–1) + 6 (–9) = 50 + 9 – 54 = 5. Ma questo non è un caso. Infatti, z = −10 + 1 = −9 comunque presi x1 e z1, si ha 10(–3x1 + 3z1 – 1) – 9(2x1 – 1) + 6(8x1 – 5z1 + 1) = –30x1 + 30z1 – 10 – 18x1 + 9 + 48x1 – 30z1 + 6 = 5. 118