Armando Bertinetti MATEMATICA E ….L’INFINITO IL FILO DI ARIANNA PER UN LABIRINTO DELLA RAGIONE INDICE #INTRODUZIONE #LA_NASCITA DELLA MATEMATICA E DELLA GEOMETRIA DELL’INFINITO E DELL’INFINITESIMO #ZENONE : INFINITO E CONTINUITA’ ARGOMENTO CONTRO LA PLURALITA’ #NUMERABILITA’ DELL’INSIEME DEI RAZIONALI E DEI REALI 1 #DEMOCRITO E IL VOLUME DELLA PIRAMIDE #ARCHIMEDE CONSIDERAZIONI DI ORDINE INFINITESIMALE: DAL RICORSO AGLI “INDIVISIBILI” COME DEMOCRITO, AL METODO DI ESAUSTIONE COME EUDOSSO #LA_DECADENZA NELLO STUDIO DELL’INFINITO E DELL’INFINITESIMO #PIERRE_DE_FERMAT: METODO PER LA RISOLUZIONE DEI PROBLEMI DI MASSIMO E MINIMO #GALILEO CAVALIERI TORRICELLI : GLI INDIVISIBILI #ISAAC_BARROW #LEIBNIZ_E_NEWTON #De l’HOSPITAL (1661- 1704) GIOVANNI BERNOULLI (1667- 1748) VARIGNON (1654-1722) EULERO (1707- 1783) D’ALEMBERT (1717-1783) #LAGRANGE : FUNZIONE DERIVATA #CAUCHY : A FONDAMENTO DELL'ANALISI MATEMATICA EGLI PONE LA NOZIONE DI“ LIMITE” #BIBLIOGRAFIA 2 #INDICE INTRODUZIONE E’ opinione largamente condivisa che l’insegnamento della Matematica e della Fisica debba essere attuato tramite il metodo dell’ INSEGNAMENTO PER PROBLEMI. Le due categorie principali di problemi a cui ci dobbiamo rapportare sono: I PROBLEMI ESTERNI, che possono riguardare gli aspetti della matematizzazione dei fenomeni naturali e della “realtà concreta in genere”, o che hanno attinenza con problematiche pratiche risolvibili tramite il ricorso a strutture matematiche e tali da consentire di introdurre concetti matematici, e I PROBLEMI INTERNI, che sono quelli che scaturiscono dalla stessa matematica e che possono offrire spunti di richiamo intorno ai principi e al metodo della conoscenza. In entrambi si possono annoverare quelli legati al contesto storico-sociale in cui si sviluppa la conoscenza matematica e scientifica. Un percorso sui fondamenti e sugli elementi storici interni allo sviluppo dei concetti matematici è quello relativo allo sviluppo storico dell’analisi infinitesimale. Un insegnamento astorico dei concetti matematici e scientifici risulterebbe inevitabilmente acritico, poiché sarebbe privato del legame organico tra la cultura umanistica e quella scientifica, con il rischio concreto di caratterizzare le teorie e i concetti come un corpo organico di verità valide al di sopra e al di fuori della storia degli uomini. Proprio per evitare questo rischio occorre procedere attraverso l’analisi filosofica della nascita dei concetti; la storicizzazione delle materie scientifiche obbliga infatti a recuperare un dato essenziale delle stesse, e cioè il loro rapporto con gli uomini, come a dire, con le condizioni economiche, sociali e politiche in cui vengono costruite. I problemi che nascono dai concetti dell’infinitamente grande e dell’infinitamente piccolo si configurano certamente tra quelli che offrono questa possibilità. L’analisi infinitesimale si è formata durante il XVII secolo, ma di essa possiamo trovare elementi presenti nel pensiero antico. Con Democrito e con il metodo di esaustione di Eudosso e Archimede possiamo addirittura individuare un primo approccio al metodo di integrazione ( nel senso che i greci si occuparono del calcolo di aree, volumi e baricentri ), e l’opera di Archimede, pubblicata a Basilea nel 1544, interessò molto tutti i matematici del 600. Anche se si suole affermare che furono Leibniz e Newton i fondatori dell’analisi infinitesimale ( altri ne attribuiscono la nascita a Fermat ) , le basi dell’analisi infinitesimale nascono e maturano nel 600 per una sorta di “spirito dei tempi “ che portarono, in poco più di mezzo secolo, per opera di Keplero, 3 Galileo, Cavalieri, Cartesio, Fermat, Robertval, Pascal, Barrow, Newton, Leibniz e altri ancora, a costruirne l’edificio sulle basi di tutte le precedenti conoscenze della matematica, della geometria e della fisica. I problemi dai quali nacquero i concetti di limite e derivata sono sostanzialmente legati al problema dei massimi e minimi, al problema della tangente e al problema della velocità; nella genesi di tali concetti si devono considerare dunque quattro vie: aritmetica, geometrica, cinematica e quella degli indivisibili. #INDICE LA NASCITA DELLA MATEMATICA E DELLA GEOMETRIA DELL’INFINITO E DELL’INFINITESIMO La nozione di infinito è certo una delle più importanti nella storia del pensiero, e già presso i Greci aveva creato le prime difficoltà, ma la questione si era presentata più come un problema di conoscenza che di calcolo. Le speculazioni di Zenone e di Anassagora sul concetto di infinito e infinitesimo, anche se in esse si possono intravedere i primi passi verso l’analisi e il calcolo, lasciano intendere come la matematica, allora, si configurasse come una parte della filosofia, una parte, appunto, del problema della conoscenza, e bisognerà attendere condizioni sociali e culturali diverse ( sviluppo mercantile, rivoluzione industriale, specializzazione della cultura ) affinché riesca a diventare calcolo, in modo che, pur senza negare o trascurare implicazioni filosofiche, riesca ad essere anche e soprattutto strumento di controllo e di previsione sul mondo fisico. Si può citare, a testimonianza del fatto che allora si trattasse soprattutto di speculazioni filosofiche, il passo di Anassagora in cui dice “La materia è infinitamente estesa e nello stesso tempo infinitamente divisibile. Non solo il grande, ma anche il piccolo va all’infinito. Rispetto al piccolo non vi è ultimo grado di piccolezza, ma vi è sempre un più piccolo, essendo impossibile che ciò che è cessi di esistere per divisione. Così vi è sempre qualcosa di più grande di ciò che è grande; il grande è uguale al piccolo in quantità. Considerata in se stessa, cioè come somma di infinite parti infinitesime, ogni cosa è contemporaneamente piccola e grande”. Per comprendere l’ambito filosofico della matematica, basti ricordare che il termine “matematica” nel suo significato di “insegnamento”, ricevette dai pitagorici il suo particolare riferimento ai numeri. Furono i pitagorici ad associare la realtà ai numeri; essi ritenevano che ogni fenomeno potesse essere spiegato in termini di numero intero( o razionale ). 4 L’uso greco di designare i numeri con le lettere favoriva questa concezione; anche le frazioni erano considerate soltanto come un rapporto tra numeri interi. I numeri assumevano significato geometrico e, per certi versi, anche esoterico proprio nell’ambito delle relazioni che associavano tra loro i numeri e le figure in una sorte di intuizione mistica. Il triangolo sacro, la “Tetractis”, sulla quale i pitagorici prestavano giuramento, è proprio un esempio di questo modo di associare tra loro numeri e figure (triangolo, sfera e i numeri 1, 2, 3, 4, 10 ). 1 2 somma = 10 a partire da ogni vertice. 3 4 Queste convinzioni ebbero molti seguaci e Platone stesso, convinto pitagorico, stabilì che ogni cittadino della sua repubblica ideale imparasse l’aritmetica come forma di istruzione morale. Fu un grave trauma, per i pitagorici, scoprire che la 2 2 non era il rapporto tra due interi. Questa scoperta ebbe un effetto profondo: conducendo all’idea di punto privo di dimensione, creò un contrasto con la concezione che l’atomo, avente dimensione, potesse essere assimilabile al punto, come credevano i pitagorici. Vediamo da dove traggono origine queste discussioni. I primi spunti alle discussioni sulla divisibilità, sulla infinita divisibilità e sulle dimensioni del risultato di tale infinita divisibilità nascono dalla scoperta della famosa contraddizione interna all’aritmetica pitagorica: l’incommensurabilità tra lato e diagonale del quadrato. C AC2 = AB2 + BC2 AC2 = 2( AB2 ) A AC 2 = AB 2 B 5 Ciò detto, si ricava che la 2 2 non è un numero razionale, non è né un intero, né una frazione, infatti : • Se fosse possibile ( se esistesse cioè un tal numero razionale ), sarebbe possibile metterlo sotto forma di frazione r/s con r ed s primi tra loro: • In tal caso si avrebbe 2 r2 s 2 = 2, il che è assurdo, perché se r ed s sono primi tra loro, 2 2 2 lo sono anche r ed s , e quindi r non può essere divisibile per s . 2 2 non è una frazione si conclude che AC ed AB non possono avere sottomultipli Se la comuni, infatti, quando questo succede, si possono ricavare due numeri m ed n per i quali L1 L 2 L1 m si ha = ed allora = ; si può ricavare una frazione, cioè un numero razionale. m n L2 n Tale incommensurabilità condusse i pitagorici a dover ammettere che: un segmento non può essere costituito da un numero finito di punti materiali aventi dimensione poiché, nel caso più sfortunato, se così fosse, due segmenti dovrebbero possedere, come sottomultiplo comune, il “PUNTO” stesso. Prendendo spunto da questa importantissima scoperta, si giunse alla conseguenza inevitabile di PUNTO privo di dimensione e di segmento costituito da un numero infinito di punti. EUCLIDE ( 330 – 260 a.C. ) dirà poi che: “ IL PUNTO E’ CIO’ CHE NON HA PARTE “. Ma come potevano interpretare i matematici greci quel nuovo concetto di infinita divisibilità? Cosa si poteva contrapporre alla concezione del punto monade, entità ultima e indivisibile? Questa crisi venne messa a nudo dalle famose argomentazioni di ZENONE di ELEA ( 490 a.C.); gli argomenti che espone possono essere interpretati come una polemica contro quella concezione pitagorica che cercava di mantenere saldo il concetto di punto monade unitamente a quello della infinita divisibilità. 6 #INDICE ARGOMENTAZIONI DI ZENONE INFINITO E CONTINUITA’ ARGOMENTO CONTRO LA PLURALITA’ Zenone, in tale argomento, dimostra che la infinita divisibilità è inconciliabile con l’idea di punto come entità nulla e pure come entità estesa. Ragiona così: considera un segmento di estremi A e B e, in primo luogo, dimostra che tale segmento è costituito da infinite entità, infatti, essendo A e B due entità distinte, tra esse esisterà un a C che le separa, e, ancora essendo A, B e C distinte, esisteranno altre due entità D ed E che separano C da A e C da B ecc… Poiché tale ragionamento può ripetersi all’infinito, dati due elementi distinti, ne esisteranno infiniti tra essi. Ora sono possibili due ipotesi: 1. che tali entità siano di grandezza nulla. 2. che siano materiali ed abbiano una certa grandezza Nel caso 1. se vado a considerare la lunghezza del segmento, se le entità che lo costituiscono sono nulle, anche se infinite, poiché la somma di infiniti zeri risulta sempre uguale a zero, il segmento sarà nullo. Nel caso 2. invece otterrò un segmento di lunghezza infinita, perché la somma di infinite quantità ( uguali tra loro e diverse da zero ) è di valore infinito. IN QUESTO PARADOSSO SI INTRAVEDE UN GRANDE INTERESSE MATEMATICO, INFATTI VI SI POTREBBE SCORGERE UNA CERTA INTUIZIONE CIRCA LA IMPOSSIBILITA’ DI CONCEPIRE COME “RAGGIUNGIBILI “ LE UNITA’ ULTIME ED INDIVISIBILI, cioè I PUNTI. Ne scaturisce infatti una concezione del punto come ente privo di dimensioni ma che tuttavia non è il nulla. Sembra riconoscere come, proseguendo la divisione di una grandezza, le parti che si ottengono sono sempre più piccole, e che non vi è un termine alla diminuzione. Quindi il punto doveva apparire come una cosa più piccola di qualsiasi altra cosa piccola ad arbitrio, cioè: “INFINITAMENTE PICCOLO”. Quella degli irrazionali fu una scoperta tragica che portò alla ammissione che un segmento doveva essere costituito da infiniti punti. 7 La GEOMETRIA nata per studiare il mondo esterno, cioè “IL REALE”, SI RIVELAVA DIVERSA DAL MONDO ESTERNO. L’ATOMO ha dimensioni, IL PUNTO no! L’atomo e il punto non possono quindi essere la stessa cosa come avevano sostenuto i pitagorici. Il problema si risolse rinunciando alla convinzione che costruire la geometria volesse dire fare una costruzione razionale del reale, e si ammise che la geometria rappresentava una idealizzazione della realtà. D’altronde già PARMENIDE di ELEA ( V secolo a.C. ), maestro di Zenone, affermava che gli enti geometrici non possono definirsi che per astrazione con un procedimento indefinito di idealizzazione, come limite del sensibile. ARGOMENTO DELL’ACHILLE Achille non raggiunge mai la tartaruga che si trova, anche se di poco, dinnanzi a lui. Ragiona così: supponiamo che Achille corra con una velocità n-volte superiore a quella della tartaruga; mentre Achille avrà coperto l’intervallo S che lo separa dall’animale, esso sarà avanzato di di S, ed ancora, mentre Achille percorre questo tratto, la tartaruga avrà percorso 1 n 1 1 di di n n S e così via all’infinito. Dunque Achille non raggiungerà mai la tartaruga, infatti, dice Zenone, il tempo richiesto perché Achille raggiunga la tartaruga è la somma di infiniti tempi e la somma di infiniti tempi è un tempo infinito. Qui bisogna fare attenzione ( è sempre vero che sommando infinite entità si ricava una quantità di valore infinito? ): gli infiniti tempi di cui parla Zenone non sono tutti uguali tra loro, si riducono sempre di più, diventano sempre più piccoli; d’altronde sull’argomento dell’Achille il senso comune dimostra che le cose non vanno come viene detto nel paradosso. Qual è l’errore che lo fa cadere? Il fatto è che non è vero che la somma di infinite quantità è sempre infinita! Facciamo il caso di Achille 10 volte più veloce della tartaruga e le abbia dato un vantaggio di 100 metri: la distanza che Achille deve percorrere ha un valore finito S uguale a: 8 100+10+1+ = 1 1 1 1 1− qn qn = a1( − + + + ….= S = a1 * ) =( per 10 100 1000 1− q 1− q 1− q ∞ termini con q 1 1000 1 100 ) = S∞= a1 = = = ..... 1 9 10 1− q 1− 10 Molto probabilmente lo stesso Zenone arrivò a questo risultato, poiché è probabile che conoscesse la serie geometrica e i numeri periodici. I paradossi di Zenone hanno così creato un vero e proprio disorientamento sui problematici concetti di infinito e di continuo, aprendo su di essi questioni che ne sottolineano l’inafferrabilità: quanti sono i punti di una retta? I punti sono indivisibili? L’infinito è solo in potenza o in atto? Come è possibile il movimento? L’APORIA DEL MOVIMENTO IL RAGIONAMENTO è RIVOLTO A SOSTENERE CHE LA FRECCIA IN MOVIMENTO È IMMOBILE ( E’ Aristotele che ci parla di Zenone ) “Esso deriva dall’assumere che il tempo sia composto di istanti:ché, non concedendo questo, il ragionamento non potrà essere valido” ( Aristotele, Fisica, VI, 9, 239 ). “Se infatti ogni ente – egli dice – nel momento in cui occupa uno spazio eguale a se stesso, o sta in quiete ovvero si muove, essendo comunque il mobile sempre nell’istante, allora il mobile in movimento è immobile” ( Aristotele, Fisica, VI, 3, 239 ). La freccia, scoccata dall’arco, si trova, in ciascun istante in una determinata posizione dello spazio, dato che ciascuna cosa si trova sempre in ciascun momento del tempo in uno spazio uguale ad essa. La freccia che vola è allora ferma nei vari punti dello spazio che attraversa in ciascun dato istante. Il movimento è quindi qualcosa di assurdo; infatti il movimento risulterebbe costituito da una successione di stati di quiete, seppure in istanti infinitamente piccoli. In effetti con questi argomenti Zenone intendeva non tanto e non soltanto negare la possibilità del movimento, ma la sua inconciliabilità con l’ipotesi pitagorica secondo la quale ogni figura geometrica, ad esempio il segmento, sia costituito da punti materiali ed estesi; la conseguenza di questa ipotesi è che le figure geometriche, come in generale tutta la realtà, risultano concepite discontinue, così come discontinua è la successione dei numeri naturali, mediante i quali i pitagorici interpretavano la geometria. 9 Con i paradossi di Zenone si pone la necessità di ammettere che il punto deve essere concepito senza dimensione definita, e che quindi ogni linea deve essere concepita come una successione continua ed infinita di punti. Con i suoi ragionamenti per absurdum, Zenone intende affiancare le tesi parmenidee, secondo le quali il continuo è uno dei predicati essenziali dell’Essere, e così ragionando sulle nozioni di infinito,di continuo, di numero, di tempo o di spazio e di movimento, Zenone pone le basi concettuali non solo dell’analisi filosofica, ( il contrasto tra il continuo e il discontinuo è stato e resterà, nella storia del pensiero, uno dei problemi più difficili e dibattuti, un “astruso labirinto della ragione” ) ma anche dei contenuti delle teorie matematiche successive. Viene sottolineata l’importanza del fatto che “.. gli argomenti di Zenone hanno in un modo o nell’altro costituito la base di quasi tutte le teorie relative allo spazio, al tempo e all’infinito, che sono state avanzate da quell’epoca fino ad oggi “ ( B. Russel – 1872-1970 ). Prendiamo in esame il paradosso del tutto e della parte ed osserviamo come le cose sembrino complicarsi quando si opera con l’infinito. Consideriamo le corrispondenze biunivoche: 1. n 2n n ∈ N+ 2. n n2 n ∈ N+ i numeri pari ed i quadrati dei numeri naturali sono quanti i naturali! La stessa cosa capita quando confrontiamo i punti di due diversi segmenti, oppure i punti di un segmento con quelli di una semiretta: SONO INFINITI EQUIPOTENTI Come si vede il paradosso del tutto e della parte è tale quando si passa al confronto tra quantità infinite. L’assioma:” Il tutto non è equivalente ad una sua parte “è intuitivamente accettabile per quantità finite, e in questo senso, quando nel 1881 De Zolt lo enunciò a proposito del confronto di aree, veniva ripreso il principio affermato da Aristotele “ il tutto è maggiore della parte”. 10 Il paradosso, che si presenta per quantità infinite, venne già esposto da Galileo, in polemica con il principio aristotelico che veniva affermato come valido in assoluto. Il paradosso è tuttavia riconducibile al fatto “linguistico” e scompare definendo opportunamente il significato dei termini: “L’AFFERMAZIONE A è maggiore di B è EQUIVOCA”, perché ha due significati: 1. B è una parte di A. 2. A contiene più elementi di B. Nel caso richiamato in cui A=N+ e B = insieme dei pari, si ha, distinguendo in base ai due significati, da una parte che B A ( B è una parte propria di A ), mentre dall’altra B = A ( Il numero degli elementi di B è uguale a quello di A ). Se esiste una corrispondenza biunivoca fra gli elementi dei due insiemi diciamo che hanno lo stesso numero di elementi e che sono equipotenti. E’ dunque la teoria degli insiemi che ci consente di “risolvere” il paradosso. Il paradosso quindi, pur nel suo significato di “al di là del credibile “ non è una contraddizione, mentre lo è l’antinomia; ne è un esempio l’antinomia di Bertrand Russel : dato l’insieme X, definito come “l’insieme di tutti gli insiemi che non contengono se stessi “ qual è la risposta alla domanda: “ X contiene o no se tesso come elemento? “ I tentativi di dare risposte ai dilemmi dell’infinito e del continuo hanno segnato il corso del pensiero occidentale fino alla prima metà dell’Ottocento, e solo a partire dalla seconda metà, per opera di Georg Cantor ( 1845 – 1918 ), il concetto di infinito attuale entrò con pieno diritto di cittadinanza in matematica, grazie alla sua rigorosa teoria dei numeri cardinali transfiniti, che poneva la parola fine sulla nota e cauta impostazione aristotelica. La stupefacente scoperta di Cantor, su cui si basa tale teoria, è che non tutti gli infiniti sono uguali, ma anzi costituiscono a loro volta una successione infinita. Il primo numero infinito (primo “ cardinale transfinito “), è quello che conta tutti gli elementi dell’insieme dei numeri naturali; questo numero prende il nome di “ALEPH ZERO “. Il numero di punti di una retta ( che si può identificare con il numero dei reali ), è anch’esso infinito, ma Cantor riuscì a dimostrare che questo numero cardinale transfinito è maggiore di aleph zero, mettendo in mostra che l’insieme dei reali non è numerabile. #INDICE NUMERABILITA’ DELL’INSIEME DEI RAZIONALI E NON NUMERABILITA’ DELL’INSIEME DEI REALI L’insieme dei razionali è numerabile. I numeri razionali hanno la stessa infinità dei numeri naturali; per dimostrarlo si può costruire una tabella a doppia entrata nel modo seguente: 11 Ogni riga contiene tutte le frazioni con un denominatore prefissato, in modo da poter scrivere tutte le possibili frazioni; così facendo però, ogni numero razionale viene ripetuto infinite volte; per eliminare le ripetizioni bisogna cancellare tutte le frazioni che non sono ridotte ai minimi termini. Si ordinano quindi le rimanenti seguendo la linea rossa. Viene in questo modo costruito un procedimento che consente di ordinare in una successione con indici interi i numeri razionali. Si constata così che l’insieme dei numeri razionali è numerabile. L’insieme dei reali non è numerabile. Il ragionamento consiste nel partire dall’ipotesi che tutti i reali siano stati numerati in una successione, per poi costruire un numero non compreso nella successione; in tal modo si falsifica l’ipotesi della numerazione dei numeri reali. Nell’applicarlo Cantor considera tutti i numeri reali dell’intervallo 0 – 1 e suppone di averli ordinati in una successione α1, α2, α3, …. con indici interi sotto forma decimale. α1 = a1 a2 a3 …. α2 = b1 b2 b3 …. α3 = c1 c2 c3 …. Dove a1 a2 a3 …., b1 b2 b3 …., c1 c2 c3 …. rappresentano le cifre decimali di α1, α2, α3 .. ; se si rende possibile costruire un numero reale dell’intervallo considerato non compreso tra quelli indicati nella successione, si dimostra che l’insieme dei numeri reali non è numerabile. Operando con un metodo detto “procedimento diagonale” Cantor procede alla costruzione di questo nuovo numero reale 0, a b c.. con l’accorgimento che a ≠ a1 , ……… b ≠ b2 , c ≠ c3 , Detto numero, che non coincide con alcuno di quelli indicati nella successione, è ancora un numero reale, ed è stato costruito cambiando il valore delle cifre che occupano lo stesso posto di a1, b2, c3 , …. lungo la loro successione diagonale. In tal modo il numero differisce da ogni successione α n , perché non può essere uguale al primo della successione poiché differisce da esso per la prima cifra, non può essere uguale al secondo poiché differisce da esso per la seconda cifra,…, non può essere uguale all’n-esimo poiché differisce da esso per l’n-esima cifra. Ora, se i reali non sono numerabili tra zero e uno, non lo sono nemmeno nel loro complesso. Questo risultato dimostra che i numeri reali hanno un’infinità diversa dai numeri naturali, e che, di conseguenza, esiste una gerarchia tra i vari tipi di infinità. L’infinità dei numeri reali, e quelli dei punti di una retta in corrispondenza biunivoca con essi, viene detta “INFINITA’ DEL CONTINUO” ( se nella gerarchia degli infiniti si assegna il primo posto al numerabile, al continuo appartiene almeno il secondo posto; non è stato ancora dimostrato che tra il numerabile e il continuo non esistano altre infinità ). 12 #INDICE DEMOCRITO E IL VOLUME DELLA PIRAMIDE Democrito di Abdera ( 460 – 370 a. C. ) apparteneva alla scuola di Leucippo, discepolo di Zenone; le argomentazioni di Zenone, furono stimolo e suggerimento in molti problemi matematici che Democrito affrontò. Tra questi problemi è nota la questione di se e come abbia determinato il volume della piramide. La formula per calcolarne il volume, presente nella matematica egizia, era già nota da ben quattordici secoli prima di Democrito, ma l’interesse rivolto a tale risultato consiste nel considerare le ipotesi plausibili sul modo con il quale Democrito possa averne ottenuto la dimostrazione. Secondo Archimede, Democrito scoprì che i volumi di un cono e di una piramide sono 1/3 dei volumi del cilindro e del prisma che hanno la stessa base e la stessa altezza, ma sostiene anche che le relative dimostrazioni siano più verosimilmente da attribuire ad Eudosso di Cnido ( 408 ? – 355 ? a. C. ) poiché una rigorosa dimostrazione richiedeva l’applicazione del metodo di esaustione, la cui invenzione , appunto, fu concepita da Eudosso; molti studiosi poi anche ritennero che le sue scoperte si fossero fermate sul piano della sola intuizione, ed altri ancora invece affermano che Democrito abbia elaborato la dimostrazione basandosi su un procedimento di divisioni successive della piramide assegnata. Il criterio intuitivo è riconoscibile nel CRITERIO DI EQUIVALENZA che in un primo tempo Democrito avrebbe stabilito, e che dice: se in due piramidi di ugual base e di uguale altezza due sezioni alla stessa altezza risultano equivalenti, si deve dedurre che le due piramidi possono considerarsi equivalenti in quanto formate dalla somma di un numero infinito, e anche inoltre corrispondente, di sezioni parallele equivalenti. Verificando poi facilmente che un prisma triangolare si poteva dividere in tre piramidi equivalenti, trovò che il volume della piramide risultava la terza parte di quello del prisma. Prendiamo adesso in esame due criteri con i quali Democrito potrebbe aver operato con le suddivisioni: • Un primo criterio consiste nello scomporre la piramide data, a base triangolare, in due prismi e due tetraedri e, progressivamente in modo analogo, ciascuno dei due tetraedri ricavati, ottenendo ancora, per entrambi, due prismi e due tetraedri, per poi iterare il procedimento sui tetraedri che di volta in volta si ottengono insieme a due prismi. Questo criterio presupporrebbe la conoscenza da parte di Democrito della serie geometrica, con l’implicazione di un intuitivo procedimento al limite, “ lim n ∑ i=1 1 i 4 = 1 3 n ∞” . Si prende in considerazione un tetraedro e il prisma con base e altezza uguale a quella del teraedro; sia V il volume del prisma. Si prendono i punti medi di ciascun spigolo del tetraedro e con essi si individuano i prismi KLCEFG e DLGHKE ed i tetraedri EFGA e EHKB. K 13 K I due prismi hanno ciascuno per base triangoli con area ridotta ad un volume quindi pari ad 1 e altezza dimezzata, e 4 1 del volume V del prisma iniziale. Il volume somma di questi 8 1 V. Riapplicando il procedimento ai tetraedri EFGA e EHKB, si 4 ottengono ora due nuovi tetraedri e due nuovi prismi; il volume di questi ultimi risulta quindi 1 1 1 1 di di V, pari cioè a 2 V. Questo viene sommato ad V, e progressivamente pari a 4 4 4 4 1 1 1 verranno sommati tutti gli addendi 3 V, V, …., V che via via si ottengono 4 44 4n iterando il procedimento. Con “ infinite “ iterazioni, questo criterio di suddivisione e di 1 somma di volumi conduce al volume della piramide, pari ad V: 3 1 1 1 1 1 V piramide = ( + 2 + 3 + 4 + ….+ n )V prisma . 4 4 4 4 4 due è quindi pari ad Sapendo che la somma S n dei termini di una progressione geometrica, per n che diventa infinitamente grande, quando la ragione q è in valore assoluto < 1, è: a1 S∞ = , 1− q si ricava V piramide = S∞ = • 1 1 1 11 V prisma = V prisma = V prisma . 1 3 4 43 1− 4 4 Un secondo criterio consiste nell’assimilare la piramide ad una serie di sottilissimi strati sovrapposti, in numero elevatissimo ( infinitamente grande ). Risulta che Democrito abbia preso in considerazione questo criterio, ricorrendo alla necessità del numero elevatissimo per minimizzare la sua preoccupazione, come testimonia Archimede, che, se gli strati fossero stati uguali, avrebbero formato un prisma, e se fossero stati diversi, come dovevano essere, allora la piramide non avrebbe potuto avere la facce lisce; è questo un fatto che rivela come la sua impostazione infinitesimale fosse ancora in una fase embrionale. Il volume della piramide si ricava così dalla somma degli “ infiniti “ strati considerati. Teniamo presente che questo criterio presupporrebbe la conoscenza da parte di Democrito della somma dei primi n quadrati ed il ricorso ad un intuitivo procedimento di limite. 14 • Non si ritiene che, nel procedimento, Democrito possa già aver usato il metodo di esaustione utilizzando i due volumi inscritto e circoscritto, metodo che verrà rigorosamente definito da Eudosso. Altezza h • • • • • • • Si considera una piramide a base quadrata di lato a1 e di altezza h; Si divide l’altezza h in n parti; Si calcolano i lati dei quadrati di base dei prismi della serie e le loro aree: 1. primo prisma : lato = a1 area A1 = a12 n −1 n −1 2. secondo prisma:lato a2; a1 : h = a2 : ( )h da cui a2 = a1( ), A2= n n n −1 2 a12( ) n n−2 n−2 2 3. terzo prisma: lato a3 = a1( ), A3= a12( ) n n 4. ………………. h volume primo prisma: a12 n n −1 2 h volume secondo prisma a12( ) n n h 2 n−2 2 volume terzo prisma a1 ( ) n n ……………………………….. h h h 2 n −1 2 2 n−2 2 Volume piramide: a1 n + a1 ( ) n + a1 ( ) n +………= n n h n 2 (n − 1) 2 (n − 2) 2 1 = a12 n ( 2 + + + ..... + 2 ) = 2 2 n n n n h = a12 n 3 [ n 2 + (n − 1) 2 + (n − 2) 2 + ...... + 12 ] = 2 15 h n(n + 1)(2n + 1) h 1 = a12 n 3 6 n(n + 1)(2n + 1) = a12 6 = nnn h 1 1 1 2 1 2 (1 + )(2 + ) Volume piramide = a1 6 n n = ( per n “molto grande “) 3 a1 h = 3 V prisma . Siamo ancora in un tempo in cui il calcolo infinitesimale viene usato in modo “ spregiudicato “ da chi tendeva a riproporre una interpretazione della geometria ancora empiristica. Scarsa chiarezza sui problemi della infinita divisibilità è testimoniata dal metodo della quadratura del cerchio usato da Antifonte ( v secolo a. C. ) e Brisone ( c. 450 a. C. ), anche se, insieme a Democrito, costituirono, con i loro metodi, il punto di partenza per le analisi successive di Eudosso. Le conclusioni dei loro metodi non risultarono tuttavia altrettanto felici. Illustriamo tali metodi: METODO DI ANTIFONTE: iscrive nel cerchio un poligono regolare di 4 lati, poi di 8, poi di 16……ecc.. lati e, ad un certo punto (?) ritiene che la periferia del cerchio ( la circonferenza ) potesse confondersi con il poligono inscritto. Obiezioni: • Una retta non può incontrare il cerchio in più di due punti. • Il segmento non può confondersi con l’arco. • Il ragionamento è in contrasto con il principio (noto da Zenone in poi ) della infinita divisibilità delle grandezze. METODO DI BRISONE: iscrive e circoscrive poligoni, raddoppia il numero dei lati e, dopo un certo numero di volte, ritiene di riuscire ad ottenere due poligoni le cui aree differiscono di tanto poco che un poligono di area media tra le due può essere assunto come area del cerchio. Obiezione: • Anche Brisone non tiene conto che l’operazione può continuare indefinitamente senza mai arrivare alla coppia di poligoni che lui riteneva di aver raggiunto. Come si è visto, Antifonte ritiene che, all’aumentare dei lati, si possa, ad un certo punto, raggiungere il cerchio. Brisone, con i poligoni inscritti e circoscritti, fa un ulteriore passo avanti, però sfuggiva ancora una volta il punto centrale della infinita divisibilità. Per renderci conto delle difficoltà di questo procedimento, vediamo come lo tratteremmo oggi • Anche noi costruiremmo due poligoni, uno inscritto e l’altro circoscritto, di cui sappiamo calcolare l’area. 16 • Grazie a queste aree costruiremmo due successioni, una crescente e l’altra decrescente. • Dovremmo dare non solo delle successioni geometriche, ma numeriche, e ciò implica la capacità di formalizzare il dato empirico che le aree crescono e decrescono dando una legge precisa di corrispondenza tra l’elemento Sn della successione e il numero intero n che ne indica il posto, in modo da stabilire che una successione è crescente o decrescente se, dati n e n+1, si ha Xn<Xn+1 o Xn>Xn+1 . • Si deve riconoscere che le due successioni formate costituiscono due classi contigue di numeri reali. In tal modo è assicurato che: 1. ogni numero della prima classe è minore di ogni numero della seconda. 2. che l’una non ammette massimo e l’altra minimo. 3. fissato ad arbitrio un ε > 0 piccolo a piacere si può trovare un numero a della prima e un numero b della seconda in modo che b – a < ε . • Devo fissare quindi un criterio di convergenza per le due successioni ( devo cioè conoscere l’operatore limite per dire che una successione converge, ovvero che per n che tende a ∞ la Sn tende a un valore finito. • Infine devo far vedere che lim n ∞ s n = lim n ∞ Sn . Ma ancora tutto questo non mi assicura che sappia calcolare quel limite semplicemente attraverso la conoscenza delle successioni; è comprensibile quindi come nel mondo greco si organizzassero altre vie di calcolo. Eudosso, con il suo metodo, riprende inizialmente la costruzione dei poligoni inscritti e circoscritti, riconosce la differenza via via minore delle aree, ma dimostra poi la parte finale per assurdo. 17 #INDICE ARCHIMEDE CONSIDERAZIONI DI ORDINE INFINITESIMALE DAL RICORSO AGLI “INDIVISIBILI” COME DEMOCRITO AL METODO DI ESAUSTIONE COME EUDOSSO Il “metodo meccanico”di Archimede unisce considerazioni di meccanica ad altre, di ordine infinitesimale, che anticipano il metodo degli “indivisibili” di CAVALIERI, come già si era visto in Democrito. Il presupposto è che ogni figura si considera composta da un numero infinito di elementi infinitamente sottili, linee nel caso di figure piane, e superfici nel caso di solidi. Vediamo un esempio: Archimede dimostrò che l’area del segmento di parabola delimitata dall’arco ABC e da una corda AC perpendicolare all’asse BD è uguale a 4 dell’area del triangolo 3 ABC. CE è tangente alla parabola; FH è uguale a FC, AE è parallelo a BD. Archimede suppone che tanto il segmento di parabola quanto il triangolo ACE siano costituiti da tante sottilissime bacchettine o “ linee” parallele a BD: KL è la generica linea per il segmento parabolico, KN è quella corrispondente del triangolo ACE. Supponendo di avere una bilancia con il fulcro in F e come bracci FH ed FM, Archimede si propone di pesare “ materialmente” i due elementi corrispondenti KL e KN. Poiché i bracci sono disuguali, si avrà equilibrio quando, moltiplicando ciascun peso per il rispettivo braccio, si otterranno prodotti uguali. Fatte queste premesse, Archimede pesa i due 18 elementi KL e KN lasciando KN li dov’è, cioè applicato in M, e trasportando KL sull’altro piatto della bilancia nella posizione K’L’. Per via analitica, per nostra comodità, possiamo proseguire il ragionamento incominciando a dimostrare che M è il punto medio di KN e, quindi, anche il suo centro di gravità, dato che si suppone ogni linea costituita di materiale omogeneo. Inoltre sempre per via analitica si può dimostrare che vale la seguente proporzione: CA : KA = KN : KL. Verifichiamolo: Sia Y = ax2 l’equazione della parabola. L’equazione della tangente, senza fare ricorso all’operatore derivata, in C( x2; a x22) sarà: Y = ax2 → → Y = m( x-x2) + a x22 ax2 –m x +m x2 - a x22 = 0 ∆ = m2 – 4a x2 m + 4a2 x22 ∆ = 0 = ( m – 2a x2 )2 = 0 m = 2a x2 2 → Y = 2a x2 ( x-x2) + ax Y = 2a x2x - a x22 ; Riscrivendo la proporzione CA : KA = KN : KL come CA : KA = (KO+ON) : ( KO-OL), tenendo conto che: KO = CZ = ordinata della parabola in C = a x22 ON = ordinata della tg in N cambiata di segno = - 2a x2x1 + a x22 OL = ordinata della parabola in L = a x12 Si ottiene: 2x2 : ( x2 + x1 ) = (a x22 - 2a x2x1 + a x22 ) : (a x22 - a x12 ) 2 x2 2ax 2 − 2ax1 x 2 = 2 2 x 2 + x1 ax 2 − ax1 2 = 2ax 2 ( x 2 − x) 2 x2 c.v.d. = a ( x 2 − x1 )( x 2 + x1 ) x 2 + x1 Verifichiamo ora che M è il punto medio di KN: calcolo l’ordinata del punto medio di KN: YK = YC = a x22 YN = 2a x2x1 – a x22 YmedioKN = ( YK + YN ) : 2 = ( a x22 + 2a x2x1 - a x22 ) : 2 = a x2x1 Calcolo l’ordinata di M : La retta per BC passa per l’origine degli assi , y = m x , e per il punto C( x2; a x22); per l’appartenenza di C alla retta si ha: a x22 = m x2 , da cui m = a x2 ; l’equazione della retta per BC diventa : y = a x2 x , da cui YM = a x2x1 c.v.d. Procedendo si può dunque riconoscere che: CA : KA = KN : KL, CA : KA = FC : FM e dunque KL : KN = FM : FC; essendo FC = FH discende che KL : KN = FM : FH da cui si ricava proprio la relazione che esprime la condizione di equilibrio: KL * FH = KN * FM. Lo stesso ragionamento si può ripetere per ogni altra coppia di linee corrispondenti, in modo che tutte le linee del triangolo AEC, lasciate al loro posto, fanno equilibrio a tutte quelle del segmento parabolico trasportate in H. C’è quindi ancora l’inconveniente che ogni linea del 19 triangolo è applicata in un punto diverso del segmento FC. Archimede le raggruppa nel 2 centro di gravità X del triangolo AEC, sapendo che è situato a della mediana CF. (CX = 3 2XF ). Quindi tutto il triangolo AEC applicato in X fa equilibrio a tutto il segmento parabolico applicato in H . L’area di AEC è = 4 volte l’area del triangolo ABC. Detta S l’area del segmento parabolico e detta T l’area del triangolo ABC, se ne ricava : S * HF = 4 T* FX, ma HF = 3 FX e quindi S * 3 FX = 4 T* FX da cui: S = 4 T. 3 Anche Archimede si accorge che il risultato è stato ottenuto più attraverso l’analogia che la dimostrazione rigorosa, e così segue altri metodi, in particolare quello di esaustione DEFINIZIONE DEL METODO DI EUDOSSO DETTO METODO DI ESAUSTIONE Il punto centrale del metodo consiste nel dimostrare che lunghezze o aree o volumi devono essere uguali, perché è assurdo (reductio ad absurdum) che la loro differenza sia diversa da zero. La prova si ottiene NON dal confronto diretto delle figure, che non è possibile, ma dal confronto tra classi di altre figure, di lunghezza, area o volume calcolabili, che racchiudono le due date con differenze via via minori. Insomma, dalla costruzione geometrica che EUDOSSO trae dai suoi predecessori, appare chiara la presenza di successioni di figure geometriche, crescenti o decrescenti, convergenti allo stesso limite, ma il passaggio finale, invece di essere ricavato come elemento di separazione e quindi come limite delle due successioni, elimina ulteriori considerazioni sull’infinitesimo procedendo per assurdo ( E’ un approccio di passaggio al limite? E’ una negazione della discussione sull’infinito? ). In un certo senso si può ritenere che influenzi Aristotele anticipando il concetto di infinito potenziale ( che poi ritroveremo in Cauchy ) negando l’infinito attuale ( come si è visto la possibilità dell’infinito attuale viene poi reintrodotta da Cantor ). Aristotele, sotto l’influenza dei metodi di Eudosso, nelle sue considerazioni sul concetto di infinito, fece la distinzione tra infinito potenziale ed attuale, accettando solo la prima tra le due condizioni. In altri termini Aristotele sosteneva che l’infinità non è data in atto, ma solo in potenza nella serie dei numeri naturali e nelle grandezze geometriche, poiché, come per ogni numero può essere sempre pensato un successivo, così le grandezze sono divisibili in parti sempre ulteriormente divisibili. Ogni grandezza geometrica finita può essere infinita per divisione e per addizione, in quanto si può pensare come tale. 20 ARCHIMEDE E LA DETERMINAZIONE IN BASE AL METODO DI ESAUSTIONE DELL’AREA DELLA REGIONE DELIMITATA DA UNA PARABOLA E DA UNA CORDA 1. LA CORDA E’ PERPENDICOLARE ALL’ASSE DELLA PARABOLA Rettangoli circoscritti: la base di ciascun rettangolo è Sia S n la somma delle aree dei rettangoli circoscritti: a a 2 a 2 2 a 2 a 32 a 2 a n2a2 S n = * 2 + * 2 + * 2 + ..... + * 2 n n n n n n n n Sn = a n ascissa a/n 2a/n 3a/n …….. na/n ordinata a2/n2 22a2/ n2 32a2/ n2 …….. n2a2/ n2 a3 a3 1 a3 1 1 2 2 2 * ( 1 2 3 ..... ) * + + + = ( + 1 )( 2 + 1 ) = (1 + )(2 + ) n n n n 3 3 6 n n n n 6 Rettangoli inscritti: la somma delle aree dei rettangoli inscritti; per calcolare tale somma basta Sia s n trascurare l’ultimo addendo relativo alla somma delle aree dei rettangoli circoscritti. a3 1 a3 1 1 s n = 3 * (n − 1)n[2(n − 1) + 1] = (1 − )(2 − ) 6 n n n 6 1 Al crescer di n il termine tende ad annullarsi e si potrebbe concludere che: n 21 1 3 a 3 . per n che tende all’infinito si ottiene: S n - s n = A questo punto, quindi anche senza calcolare alcun limite, si potrebbe dire che questo valore comune è l’area cercata del segmento parabolico, ma questo modo un po’ affrettato, non proprio del rigoroso spirito greco, non parve sufficiente ad Archimede per concludere la dimostrazione. Infatti egli non affermava che la differenza tra le due aree ( S n - s n ) decresce al crescere di n, ma indicava la strada per rendere questa differenza comunque minore di una quantità prefissata ( ε ? ) positiva piccola a piacere, dimostrando che ciò non solo era possibile, ma che 1 3 a 3 . il valore dell’area cercata era proprio Calcolava, potremmo dire noi, “il limite” utilizzando il metodo di esaustione. Archimede mostrava come la differenza tra le due aree a3 a3 a3 1 1 1 1 2 1 1 2 1 1 ( S n - s n )= (1 + )(2 + ) (1 − )(2 − ) = (2 + + + 2 − 2 + + − 2 ) = 6 6 6 n n n n n n n n n n a3 6 a3 = * = 6 n n si potesse rendere minore di una qualsivoglia quantità prefissata positiva piccola a piacere e diceva: se per esempio si vuole che sia a3 n se per esempio si vuole che sia < 1, basta prendere a3 n esempio a = 3 e si vuole che sia divisioni, cioè n = 109. < 1 2 a3 n n basta prendere < 1 : 4 a3 = 27, > a3 n > 2 a3 e così via. Sia per 3 4 a = 108, basta prendere 109 Archimede indicò questo procedimento per ridurre la differenza tra le due aree, specificandolo caso per caso, ma ancora questo non gli sembrò sufficiente per concludere la dimostrazione e mostrò che, indicata con A l’area cercata del segmento di parabola, questa 1 3 a non poteva essere diversa da 3 , utilizzando il metodo di esaustione nel seguente modo: 1 3 a3 a ≠ Se l’area A fosse diversa da 3 ( A 3 ) si possono verificare due casi; PRIMO CASO: a3 a3 A > ; in questo caso A − è positivo. 3 3 22 Per quanto visto nella precedente dimostrazione si può determinare un S n - s n< A − 3 n tale che: 3 a a , per cui S n - A < s n − ; 3 3 la quantità S n - A risulta positiva per costruzione, mentre, la considerazione che 3 sn a a3 1 1 = (1 − )(2 − ) < , 3 6 n n a3 indica per s n − una quantità negativa, conduce all’assurdo che 3 a3 S n - s n ( quantità positiva ) risulta minore di s n − ( quantità negativa ). 3 SECONDO CASO: a3 a3 ; in questo caso - A è positivo. Ancora si può determinare un n tale che A < 3 3 a3 a3 S n - s n< - A , e da qui si ricavare che A - s n < - S n ; ma la quantità A - s n 3 3 risulta positiva per costruzione, mentre, la considerazione che Sn a3 1 1 = (1 + )(2 + ) > 6 n n a3 3 a3 indica per - S n una quantità negativa, conduce all’assurdo che 3 a3 - S n ( quantità negativa ). A - s n ( quantità positiva ) risulta minore di 3 2. LA CORDA NON E’ PERPENDICOLARE ALL’ASSE DELLA PARABOLA 23 S = SOAB – [ SODC + SABCD ] = 12 (d + n)(b − c) ⎤ ⎡2 bn − ⎢ cd + ⎥⎦ 23 2 ⎣3 Analogo è il procedimento utilizzato da Archimede per determinare il volume di un paraboloide: Aiutiamoci sapendo che • L’equazione della parabola meridiana è Z = X2 • L’equazione del paraboloide è Z = X2 + Y2 a ; per i punti di n divisione conduco corde alla parabola meridiana perpendicolari all’asse AD. 2. Si formano così due serie di rettangoli: una contiene la parabola e l’altra vi è contenuta. 3. Ruotando la figura intorno a Z si generano due scaloidi di cilindri coassiali, uno circoscritto e l’altro inscritto nel paraboloide. 4. Il cilindro inferiore ha come raggio del cerchio di base X1; l’area del cerchio sarà πX1 2 = π h (noi riconosciamo questo dato geometrico servendoci del piano cartesiano dove Z = X2 e X1 2 = h ) 5. Il cilindro successivo ha come raggio del cerchio di base X2 l’area del cerchio sarà πX2 2 = π 2h 6. ……e così via. Quindi le basi dei cilindri sono cerchi di area: π h , 2π h , 3π h , …….., n π h . Moltiplicando per l’altezza h comune a tutti si ottiene l’espressione dei volumi degli scaloidi inscritti e circoscritti: 1. Si divide AD = a in n parti uguali di lunghezza h = 24 (n − 1)n 2 (n − 1)n 2 h 2 n −1 2 h =π =π a 2 2n 2n (n + 1)n 2 (n + 1)n 2 h 2 n +1 2 h =π =π a . =π 2 2n 2n s n = π h2 [ 1 + 2 + ………..+ (n-1) ] = π S n = π h2 ( 1 + 2 + ………..+ n) La loro differenza π n a 2 (pari al maggiore dei cilindri ) può rendersi arbitrariamente piccola all’aumentare di n, ed entrambe convergono al valore π 2 a 2 , valore maggiore di s S n. Archimede dimostra proprio che il valore del paraboloide risulta π 2 n minore di a 2 poiché, per n che tende ad un valore infinito, le due grandezze ( volumi degli scaloidi inscritti e circoscritti ) sono uguali dal momento che è assurdo che la loro differenza sia diversa da zero. Così procede Archimede: non introducendo alcun concetto di limite, pur raggiungendo lo stesso risultato operando ancora con il metodo di esaustione. Vediamo come: supponiamo ≠ 0 la differenza tra V e π 2 a 2 , dove per V si intende il volume del paraboloide. Si potrà allora avere: 1. V < π 2 a 2 ; scegliamo allora, sapendo che è possibile, un valore di n tanto grande tale che S n - s n < π 2 a 2 − V ; avremo V - s n < π 2 a 2 − S n dove : V - s n è positivo per costruzione mentre π 2 a 2 − S n è negativo in quanto S n = π n +1 2 π 2 a > a ; 2n 2 la disuguaglianza si presenta così assurda poiché pone una quantità positiva minore di una quantità negativa. 25 2. V > π 2 a 2 ; scegliamo allora un valore di n tanto grande tale che S π avremo S n - V < s n − 2 n π - s n < V − a2 ; 2 a 2 dove : S n - V è positivo per costruzione mentre sn − π 2 a 2 è negativo in quanto s n = π n −1 2 π 2 a < a ; anche in questo caso la 2n 2 disuguaglianza si presenta così assurda poiché pone una quantità positiva minore di una quantità negativa. Mettiamo a confronto il metodo di esaustione con il procedimento che utilizza il concetto di limite delle due successioni per n → ∞ . Secondo la definizione odierna diciamo che l’integrale è il limite comune delle due somme, che abbiamo indicato con S dividendo l’intervallo di integrazione in n parti di lunghezza h = n e s n , per n → ∞ , a : n considerando che per ogni cerchio di base dei cilindri degli scaloidi, indicandone con R il raggio, vale la relazione R2 = x2 + y 2 , che l’area A vale π R2 e che l’altezza di ogni cilindro vale dz, il volume del paraboloide sarà dato da: a a 0 0 V = π ∫ R 2 dz = π ∫ ( x 2 + y 2 )dz = ( ed essendo per il paraboloide Z = x 2 + y 2 ) = π a π π ∫ Zdz = Z 2 0 = a 2 a 2 0 2 Il volume del paraboloide è dunque uguale, come dice Archimede, a cono avente la stessa altezza riferimento deve essere π a a e la stessa base π , dal momento che a 3 del 2 volume del ; infatti l’area di base del cono di a = AD = Z = x2 + y 2 = R2 = DC = raggio del cerchio di base del massimo tra i cilindri ). 26 #INDICE LA DECADENZA NELLO STUDIO DELL’INFINITO E DELL’INFINITESIMO Dopo Archimede si hanno lunghi secoli di decadenza nello studio dell’infinito e dell’infinitesimo. Gli indirizzi di pensiero che prevalsero durante l’impero Romano, lo stoicismo e l’epicureismo, furono praticamente indifferenti nei confronti della matematica e della scienza; anche il “De rerum natura” di Lucrezio, che pur contiene, tra i numerosi elementi descrittivi dei fenomeni naturali, alcune intuizioni di carattere scientifico davvero sorprendenti, ( vale la pena di citare il passo in cui dice “ non vedi come le pietre stesse siano sottoposte alla corrosione del tempo? Non vedi come le eccelse torri si sgretolino e le rupi si riducano in polvere?”e in cui si può ravvisare il concetto di entropia, la trasformazione, che si applica a tutte le cose dell’universo ) è e resta fondamentalmente un’opera poetica, dedicata ad Epicuro con l’intento di divulgarne la filosofia. Tutto l’interesse si rivolse all’etica, mentre l’ispirazione scientifica si affievolì considerevolmente. L’idea aristotelica di un universo diverso dalla terra implicava che diverse fossero pure le sue leggi, non commisurabili a quelle terrestri. Questa distinzione tra l’ordine imperante nell’universo e quello terrestre, e che fu particolarmente suggestiva per i padri della chiesa e per i loro seguaci medioevali, è quella che già si trova in un passo di Isaia del Vecchio Testamento, dove si legge “ …poiché i miei pensieri non sono i vostri pensieri né le vostre vie sono le mie vie, dice l’Eterno. Come i cieli sono alti al di sopra della terra, così sono le mie vie più alte delle vostre vie e i miei pensieri più alti dei vostri pensieri. “ . L’idea poi di un universo limitato nello spazio ( così era per Aristotele ) ben si accordava con la concezione di “creazione”. La finitezza dell’universo era un postulato necessario per il sistema teologico medioevale della chiesa occidentale e rimase indiscusso fino a Giordano Bruno. Il cammino riprende nel rinascimento, ed ecco i punti che presentano maggior interesse in relazione ai concetti di infinito e infinitesimo: • Il metodo degli indivisibili , che nasce dall’analisi approfondita degli studi di Archimede, per la ricerca delle aree e dei volumi, da parte di Luca Valerio, Bonaventura Cavalieri, Torricelli……. • La geometria di Cartesio , che favorisce un momento speculativo autonomo: nasce lo studio degli incrementi di una funzione e il problema della determinazione analitica delle tangenti alla curva in un suo punto, la ricerca dei massimi e dei minimi, supporto indispensabile per gli studi successivi. • Il pensiero di Galileo , nel quale la matematica assume una funzione ausiliaria alla fisica, che si misura con il problema della velocità istantanea e che richiama quello della tangente ad una curva. Stretti legami che potevano intercorrere tra finito e infinito furono poi evidenziati da Torricelli, quando notò che l’area compresa tra un arco infinito di iperbole e il suo asintoto era infinita, mentre il volume del solido generato dalla rotazione dello stesso arco intorno all’asintoto è finito. La necessità di affrontare il problema dell’infinito fu sentita da Pierre de Fermat (1601 – 1665 ), da Blaise Pascal ( 1623-1662 ), poi da Newton, Leibniz…. Tutti operavano con metodi originali, ma la mancanza di un metodo generale, sistematico, ne impediva la diffusione. Di conseguenza, perché le teorie non si insabbiassero, doveva intervenire un fatto nuovo e tale fu il teorema di inversione di Barrow, che verrà richiamato in seguito, anche se già intuito da Galileo e Torricelli. E’ interessante prima però prendere in esame alcune considerazioni sul metodo di Fermat per la ricerca dei massimi e dei minimi, e sui metodi impiegati da Galileo ed da Torricelli per la ricerca dei volumi e delle tangenti. 27 #INDICE PIERRE DE FERMAT METODO PER LA RISOLUZIONE DEI PROBLEMI DI MASSIMO E MINIMO Pierre de Fermat (1601 – 1665 ), magistrato e matematico, scoprì nel 1929 un metodo per la risoluzione dei problemi di massimo e minimo del quale si ha notizia grazie alla memoria scritta nel 1637 ( Methodus ad disquirendam maximam ed minimam ) ed inviata a Padre Mersenne ( teologo e scienziato ), e da questi fatta pervenire a Cartesio. Fermat non dà una chiara giustificazione del metodo né una dimostrazione vera e propria, anche se l’applicazione consente di individuarne una giustificazione logica. Per comprendere il metodo prendiamo in esame il primo dei problemi risolti da Fermat. Il problema consiste nel dividere un segmento di lunghezza b in due parti di lunghezza a e ( b – a ), in modo tale che il prodotto a( b – a ) risulti massimo. Fermat procede con un metodo aritmetico usando una tecnica di risoluzione che stabilisce delle “quasi uguaglianze”, una tecnica che Fermat riprende dal metodo utilizzato da Diofanto ( matematico alessandrino- III sec.) per la risoluzione di problemi. Diofanto sviluppò la teoria delle equazioni algebriche di 1° e 2° grado ed è considerato il fondatore dell’analisi indeterminata ( o diofantea ). Sui problemi di Diofanto si basano le ricerche della teoria dei numeri di Eulero, Fermat, Gauss e Lagrange. Portano il suo nome le equazioni algebriche a coefficienti interi di cui si cercano soluzioni intere. Della sua opera ci sono pervenuti i primi 6 dei 13 libri dell’Aritmetica. L’equazione diofantea più famosa è del tipo un + yn = zn con x,y,z,n ∈ N, n ≥ 2; per n = 2 dà come soluzioni intere le cosiddette terne pitagoriche; nel caso di n > 2 ha dato origine al cosiddetto “ ultimo teorema di Fermat ”. Il metodo utilizzato dunque è di tipo puramente aritmetico – algebrico, e non richiede la costruzione di un grafico di funzione per ricavare da questo il massimo cercato. Vediamolo: Fermat dà ad a un incremento e , in modo da ottenere a + e per il primo segmento, e sottrae l’incremento e al secondo, che diventa ( b – a – e ); il loro prodotto sarà (a + e) [b – ( a + e )]. Aggiungendo nel prodotto a uno dei due numeri un incremento e sottraendolo all’altro numero, se si considera l’espressione del prodotto come una funzione di a, f(a ) = a( b – a ), si potrebbe dire che costruisce la funzione f ( a + e ) = (a + e) [b – ( a + e )]. In seguito opera un confronto, e non un’uguaglianza, tra quelle che possiamo indicare con f ( a + e ) ed f(a ) : (a + e) ( b – a – e ) ⇔ a( b – a ); poi agisce algebricamente sulle due espressioni come se si trattasse di una “quasi uguaglianza”, basandosi su un’osservazione di Pappo di Alessandria ( sec. III ), ripresa poi da Nicola di Oresme ( astronomo, matematico e filosofo francese, 1320 – 1382 ) e nel 1615 da Keplero in “Nova stereometria”: una funzione f(x) è stazionaria nell’intorno di un valore x che la rende massima o minima; come dire che nell’intorno di un massimo o di un minimo le variazioni sono insensibili e quindi se a è un punto di massimo per la funzione f(x) e se e è una quantità piccola, allora f ( a + e ) - f(a ) ≈ 0 . Il segno ≈ non indica una vera e propria equazione, ma una relazione approssimata che Fermat chiama “ finte équation “. Così ottiene: (a + e) ( b – a – e ) - a( b – a ) ≈ 0 , da cui: 28 2 ab – a2 – ae + eb – ae – e2 – ab + a2 = “ quasi “ 0 ⇒ –2 ae + eb – e = “ quasi “ 0 , 2 (dove l’espressione –2 ae + eb – e può essere assimilata all’incremento della variabile dipendente f(a ). )A questo punto : divide l’espressione ottenuta per e , (che può essere assimilata all’incremento della variabile indipendente, ricavando in sostanza il rapporto incrementale: –2 a + b – e); ponendo infine e = 0 ricava –2 a + b ( si potrebbe intravedere un procedimento assimilabile al limite del rapporto incrementale lim e→0 f ( a + e) − f ( a ) = −2a + b ) e afferma che, quando e l’espressione si annulla ( f’(a ) = 0 ), si ricava il valore a = massimo cercata. b /2 che individua la condizione di In effetti Fermat non opera un lim e→0 ; il metodo consiste nell’applicare una serie di passaggi che portano alla soluzione, ma non offre una spiegazione rigorosa del metodo, giustificandolo, in pratica, sulla base della sua efficienza, ma è pur vero che si intravede un percorso avvicinabile al seguente: data la funzione prodotto P = x( l - x ) cerchiamone il massimo; P = x l – x2; P' = dP = dx ( x + h)l − x 2 − 2hx − h 2 − xl + x 2 − 2hx − h 2 + hl = lim h→0 = lim h→o − 2 x − h + l = −2 x + l h h l − 2 x + l = 0 per x = . Ora è lo studio del segno della derivata ad indicarci che, per il valore 2 trovato, abbiamo una condizione di massimo: = lim h→0 Il metodo viene usato da Fermat anche per ricavare la retta tangente alla parabola: 29 Procede da x = y2 ; per x = d si ha: d = y2 = (BC)2 e (d – e) = ( NO’ )2 osservando che: d (CB) 2 (CB ) 2 a2 = > = d − e ( NO' ) 2 ( NO ) 2 (a − e) 2 [ per la similitudine tra i triangoli CBM e ONM dove si ha la proporzione CB NO CB CM a = ⇒ = (= ) ]. Quindi: CM NM NO NM a−e d a2 > d − e ( a − e) 2 ( tutti termini positivi ) de 2 − 2ade > - a2e d ( a − e) 2 de 2 − 2ade ≈ - a2e Trasforma poi l’adeguaglianza > a 2 ( d − e) ⇒ a 2 d − 2aed + de 2 > a 2 d − a 2 e de + a 2 ≈ 2ad . de + a 2 ≈ 2ad nell’uguaglianza a2 = 2ad operando la trasformazione in funzione dell’annullamento dell’addendo de dovuto al suo fattore “piccolissimo “ e. Dividendo per a ricava infine la relazione a = 2d che gli consente di individuare la tangente. Come si vede il metodo funziona! Guido Castelnuovo è del parere che Fermat ricavi i massimi e i minimi proprio risolvendo una equazione del tipo lim h→0 f ( x + h) − f ( x ) , e, come lui, anche altri matematici. h Di parere contrario è Ludovico Geymonat quando afferma che, se è vero che Fermat giunse per primo a prendere in considerazione il rapporto incrementale f ( x + e) − f ( x ) , tuttavia e non giunse mai al concetto di derivata come limite di questo rapporto, e, come lui, anche altri matematici, ma sarebbe ingiusto negare che Fermat abbia dato un contributo fondamentale alla nascita del concetto di derivata. 30 #INDICE GLI INDIVISIBILI GALILEO CAVALIERI TORRICELLI Il metodo degli indivisibili è un’altra pietra miliare nel cammino verso una collocazione definitiva del concetto di infinito in matematica. Vediamo in cosa consiste il metodo degli indivisibili: una superficie piana viene considerata costituita da infinite corde intercettate entro la superficie da un insieme di rette parallele; ogni corda è pensata come un rettangolo di altezza infinitamente piccola e costituisce un INDIVISIBILE. Se due superfici, tagliate da un sistema di rette parallele, intercettano, su ognuna di tali rette, corde uguali, le due superfici sono equivalenti. Il metodo si estende ai solidi:sostituendo piani alle rette, se i piani intercettano superfici equivalenti ( aree uguali ), i due solidi sono equivalenti ( hanno ugual volume ). Galileo divulga il teorema di Luca Valerio Usando il metodo degli indivisibili si dimostra come, sezionando con piani paralleli alla base un cilindro, che ha l’altezza pari al raggio della base, si ottengono sezioni corrispondenti equivalenti della scodella ( semisfera contenuta nel cilindro ) e del cono ( con base e altezza pari a quelle del cilindro ) contenuti nel cilindro ( sezioni aventi la stessa area). AREA della CORONA CIRCOLARE : π (PK)2 – π (NK)2 AREA della SEZIONE DI CONO : π x2 FIG 1 Poiché PK (raggio della sfera ) è = NO, l’area della corona si può scrivere come: π (NO)2 – π (NK)2 = π [(NO)2 – (NK)2] = π x2 ; come si vede, tale espressione è uguale a quella dell’area della sezione di cono. IL TEOREMA PROSEGUE dimostrando che la scodella e il cono hanno uguale volume: per il criterio degli indivisibili si ha infatti che il volume della scodella è uguale a quello del cono. 1 Il volume del cono è noto ed è V cono = πR 3 , e tale sarà anche quello della scodella. 3 Il volume della semisfera è quindi dato da: 31 1 2 4 V cilindro – V scodella = V cilindro – V cono = πR 3 − πR 3 = πR 3 e quello della sfera risulta = πR 3 . 3 3 3 Nel procedimento l’affermazione di carattere intuitivo, e quindi non rigorosa, sta proprio nel dire che due solidi che risultano dalla somma di infinite aree equivalenti di spessore infinitesimo occupano lo stesso volume. Infatti Luca Valerio rende la dimostrazione rigorosa, completandola con il metodo di esaustione. Per rispondere a questa e ad altre obiezioni sugli indivisibili, Cavalieri ne dà una interpretazione cinematica; considera quindi un’area come spazzata dal movimento di un segmento, e un volume da quello di un’area: se le aree sono spazzate da corde uguali, allora sono uguali; se le corde che spazzano le aree non sono uguali, ma le corde corrispondenti conservano un rapporto costante, allora si ha lo stesso rapporto tra le aree. Consideriamo ad esempio l’applicazione di questo principio per il calcolo dell’area dell’ellisse, x2 y2 aiutandoci con l’equazione dell’ellisse, e sia questa 2 + 2 = 1 , e della circonferenza, e sia a b 2 2 2 questa x + y = a . Le rette parallele all’asse y intercettano sulla circonferenza delle corde le cui lunghezze al quadrato, per un generico valore di x, sono espresse da y 2 = a 2 − x 2 , e intercettano sull’ellisse delle corde le cui lunghezze al quadrato risultano pari a x2 b2 y 2 = (1 − 2 )b 2 da cui y 2 = 2 (a 2 − x 2 ) a a Come si può osservare il rapporto tra i FIG. 2 b2 b quadrati delle corde è 2 ; quello tra le corde risulta quindi pari a , si può allora a a concludere che, sulla base di questo procedimento, l’area E dell’ellisse sta all’area C del cerchio come b sta ad a . E : C = b : a . b b E = C ; C = πa 2 ; E = πa 2 ; E = πab a a ( verificare il risultato con il calcolo integrale). EVANGELISTA TORRICELLI Alle origini del calcolo infinitesimale sta il concetto di rapporto incrementale, già toccato da Fermat, al quale è subordinato quello di derivata e differenziale. Torricelli contribuì alla nascita del concetto di derivata proprio prendendo le mosse dal metodo degli indivisibili, e 32 pervenendo al metodo cinematico per condurre tangenti ad una curva, operando sui rapporti incrementali con considerazioni che anticipano i concetti dell’analisi infinitesimale. Il Torricelli inizialmente fu restio ad utilizzare il metodo degli indivisibili, ma in seguito se ne fece promotore convinto. Consideriamo il rettangolo ABCD ed osserviamo le due superfici tratteggiate EC ed EA, risultano equivalenti , essendo i triangoli ABD e BDC uguali, e parimenti i triangoli HED e KED; per differenza quindi EC ed EA, risultano equivalenti. Torricelli chiama ognuna di esse “ semignomone “ divide BE in due segmenti uguali BI e IE, e prende in esame i due semignomoni assottigliati IC ed IA. Suppone questa divisione fatta infinite volte e conclude dicendo “ si arriva ad avere, in cambio dei Semignomoni, una linea BC uguale alla linea BA, dico uguale di quantità, non di lunghezza, poiché, sebbene indivisibili ambedue, sarà la BC tanto più larga della BA, quanto questa è più lunga di FIG. 3 quella”. Si vuole vedere qui l’applicazione di uno dei principi fondamentali della teoria dei limiti: FIG. 4 Detta ε1 la differenza fra AD e la linea mediana del “ semignomone “ DC “,ed ε la differenza tra AE e la linea mediana del “ semignomone “ EC ”, si può dedurre : ( AD - ε )∆y = ( AE - ε1)∆x, poiché si tratta di aree che si ottengono sottraendo e aggiungendo ai semignomoni equivalenti triangoli uguali. e ancora Δy AE − ε 1 = e quindi Δx AD − ε lim ε ,Δx →0 Δy AE = . Δx AD 33 Risulta tuttavia evidente che, senza dover ricorrere al passaggio al limite, per semplice Δy AE similitudine tra triangoli, si ha a priori ; ma non è tanto sul rettangolo e sulla = Δx AD diagonale, pur essendo questa l’idea di partenza, che si può ben cogliere il metodo torricelliano. Il procedimento, opportunamente applicato a casi meno banali, porterà Torricelli ad eseguire delle vere e proprie derivazioni, sia pure in casi particolari di “parabole” di equazione y n = k x m o di “iperboli “ di equazione x m y n = k, con n e m interi e positivi. Senza necessariamente affrontare questi casi particolari si può cogliere il suo pensiero considerando, come propone Pascal Dupont, una funzione y = f(x) , derivabile in un punto x0. Come afferma il Dupont, il metodo sembra permettere di pervenire alla tangente dell’angolo che la tangente geometrica alla curva di equazione y = f(x) in [ x0 , f(x0) ] forma con l’asse X e ne ricostruisce il percorso utilizzando gli strumenti della matematica moderna, senza snaturarne lo spirito informatore. Torricelli considera la tangente in P0 [ x0 , f(x0) ] e osserva che: P0 P’ e P0 P’’ sono “ linee supplementari “, linee cioè che, considerate al modo degli indivisibili come parallelogrammi elementari, avranno eguale quantità, o se si vuole, eguale area elementare. FIG. 5 L’ assunto , che procede dalle supposte caratteristiche sui semignomoni, consente di comprendere come il ricorso a questi quando si associano ad una retta secante P0Q, permette a Torricelli di individuare la tangente in P0 . Per raggiungere gli indivisibili, Torricelli parte dai semignomoni ( l’idea informatrice è l’assottigliamento ) mediante una suddivisione fatta infinite volte. Considera i semigomoni tratteggiati ed osserva che (Ss=sottosecante) Ss : ∆x = y : ∆y Ss ∆y = y ∆x y Δy = (coeff .ang.della sec ante) Δx Ss FIG. 6 34 Ora con il nostro simbolismo e la nostra metodologia diciamo che facciamo tendere Q a P0, cioè ∆x a zero. Noi operiamo considerando il rapporto incrementale e ricaviamo la derivata effettuandone il limite facendo tendere a zero l’incremento ∆x della variabile indipendente. Torricelli non opera effettuando il passaggio al limite, ma procede con una indefinita riduzione dei semignomoni, dando l’impressione di fare tendere a zero l’incremento ∆x. La differenza sostanziale rispetto ai concetti moderni sta nel fatto che quando noi operiamo il lim Δx→0 Δy Δx cioè a cui , consideriamo per esso un valore esterno all’insieme dei valori Δy Δx Δy , un valore Δx si avvicina. Con Torricelli invece il processo di riduzione dei semignomoni si ferma, implicando una accettazione palese di un infinitesimo attuale, un ∆x che non può più essere diviso e che potremmo con lui pensare come un dx indivisibile a cui corrisponderà un dy pure indivisibile. Il metodo di Torricelli, nella prima fase, durante il processo di riduzione del ∆x, concorda con il metodo attuale, ma, mentre per noi tale processo non ha mai termine ed è l’insieme dei Δy Δx che genera la f’( x0 ), per Torricelli il processo si conclude quando ∆x è diventato l’indivisibile dx a cui corrisponde l’indivisibile dy, la sottosecante Ss è diventa la sottotangente St e dy y = dx St il coeff. ang. della tangente . Questo risultato è ovvio se conosciamo il significato geometrico di derivata. Per Torricelli l’interpretazione è la seguente: si raggiunge la tangente quando i semignomoni via via assottigliati diventano due linee di uguale quantità ma non in lunghezza, di area equivalente S t dy = ydx . Torricelli, per le curve che prende in esame, deduce il valore St dy utilizzando il rapporto dx , che per le “iperboli “ di equazione x m y n = k sa calcolare pari a x dy y y x my = = =− . dx S t x S t n x n ; così ottiene: m 35 Dimostriamo adesso che St x = n m FIG. 7 Torricelli considera l’ “ iperbole “ di equazione X m Y n = K con n > m > 0 P1 (x1;y1) e P2 (x2;y2) Q1 MP2 Q2 P NQ Q n e dimostra ( vedi figura sopra ) che > > 1 2 1. R2 R1 P1 M R2 R1 NP2 m Dimostriamo , per cominciare, che Q1 MP2 Q2 n > : R2 R1 P1 M m x2 x2 y 2 −1 −1 x1 ( x 2 − x1 ) y 2 x 2 y 2 − x1 y 2 x1 y 2 Q1 MP2 Q2 = = = = y1 x1 y1 R2 R1 P1 M x1 ( y1 − y 2 ) x1 y1 − x1 y 2 −1 −1 y2 x1 y 2 1) 1 y Ora, ricordando che m ed n sono interi positivi, ponendo ( 1 ) m = h , risulterà h > 1, in y2 1 y y y quanto y1 > y2, da cui 1 > 1, e quindi ( 1 ) m = m 1 > 1 poiché la radice m-esima, con m y2 y2 y2 intero e positivo, di una quantità > di 1, risulta ancora > 1. Si può scrivere ora x2 m x1 m y1 k = h m , inoltre, da x m y n = k si può scrivere x m = n , ed avrò quindi y2 y k n y2 x x x y = da cui si ricava ( 2 ) m = ( 1 ) n o anche ( 2 ) m = h mn ed infine 2 = h n . k x1 x1 x1 y2 n y1 36 Sostituendo 1) nella si Q1 MP2 Q2 R2 R1 P1 M ricava = h n − 1 (h − 1)(h n −1 + h n − 2 + ...h m + h m −1 .. + h 2 + h + 1) h n −1 + h n − 2 + ...h m = = + 1; hm −1 (h − 1)(h m −1 + h m − 2 + ...h 2 + h + 1) h m −1 + h m − 2 + ...h 2 + h + 1 tale espressione, essendo h > 1, ci porta a dire che risulterà > ( maggiore ) di n−m n hm n − m + 1 = ; infatti ( n-m) sono gli addendi del + 1 , a sua volta > ( maggiore ) di m −1 m m m h numeratore ed m sono quelli del denominatore, e, prendendo sempre al numeratore hm al posto di tutti gli addendi,essendo hm più piccolo di ciascuno di essi, otterrò per il numeratore un valore inferiore, mentre, prendendo al denominatore, al posto di tutti i suoi addendi il valore hm-1, che di tutti è più grande, otterrò per il denominatore un valore maggiore; per questo il valore della frazione risulta diminuito. Con analogo procedimento si dimostra che P NQ Q n > 1 2 1. R2 R1 NP2 m Dimostrato questo , Torricelli osserva che: A) Q1MP 2Q2 è equivalente a P2NED e che P1NQ2Q1 è equivalente a P1EDM. A) : ( vedi FIG. 7) Dimostriamo Q2 S MP2 = P2 Q2 P1 M B) ⇒ Q2 S = MP2 x − x1 P2 Q2 ed essendo Q2 S = P2 D ⇒ P2 D = 2 y2 P1 M y 2 − y1 P2NED = P2D*NP2 , ed essendo NP2 = y1 − y 2 , P2NED = x 2 − x1 y 2 ( y1 − y 2 ) = ( x 2 − x1 ) y 2 , y 2 − y1 esattamente come Q1MP 2Q2 = ( x 2 − x1 ) y 2 c.v.d. Dimostriamo B) : ( vedi FIG. 7) P1NQ2Q1 = Q1 MP2Q2 + P1MP2N e P1EDM = P2NED + P1MP2N Ora, poiché è anche Q1 MP2Q2 = P2NED come dimostrato in A), risulta dimostrato che, per somma di superfici equivalenti, P1NQ2Q1 è equivalente a P1EDM. Riprendendo l’assunto di partenza da dimostrare ( Q1 MP2 Q2 n P1 NQ2 Q1 > > ), questo potrà R2 R1 P1 M m R2 R1 NP2 P2 NED P EDM n > > 1 ; ora, poiché i rettangoli a numeratore e a R2 R1 P1 M m R2 R1 NP2 denominatore hanno, in ciascuna frazione, la stessa altezza, dividendo le aree del numeratore e del denominatore per l’uguale valore delle altezze, il valore del rapporto si conserva e risulta scriversi come: 37 uguale a quello delle basi, per cui si ottiene: St Q2 S QS n > > 1 ; facendo tendere P2 aP1 , Q2 OQ1 m OQ2 n . Anche in questa conclusione si può riconoscere un x m procedimento affine all’operazione di limite. tenderà a Q1 e si avrà : = Vediamo anche come si possa riconoscere in embrione il teorema dell’inversione sulle considerazioni di Torricelli in merito ai diagrammi s = s ( t ) e v = v ( t ). Interpreta il diagramma s = s ( t ) come la traiettoria che seguirebbe un proiettile lanciato con velocità vt = 1u , da O nella direzione dell’asse t disposto orizzontalmente ( Vedi FIG. 8 ), essendo S l’asse verticale disposto verso il basso. FIG. 8 La traiettoria, per il noto principio di composizione α dei moti x = vt t e y = 1 2 gt , è una parabola conosciuta. 2 Torricelli cerca poi di determinare la velocità del α proiettile in un punto P ( t,s ): riprendendo le argomentazioni di Galileo, suppone che venga a mancare, in un dato istante, la forza che agisce sul punto nella direzione verso il basso e ammette che il mobile prosegua il suo moto con la velocità che ha acquistato in P. Tale velocità ora non è sconosciuta, ma la sua componente vt parallela all’asse t è nota e vale 1. A questo punto Torricelli immagina di invertire il moto e osserva che il che il segmento PT verrebbe descritto nello stesso tempo PT impiegato a percorrere l’arco OP , concludendone perciò che la velocità in P è = . La RP linea PT è una linea tangente in P alla curva, una tangente non ancora ben individuata, che però deve rispondere alle caratteristiche della composizione vettoriale indicata in figura, dove vt = 1 è nota, e anche la vs = g t è nota: la linea PT deve avere la stessa pendenza di V, e questo consente di ricavare il valore di α. Conoscendo il valore di α non solo si può ricavare il valore di V , velocità nel punto P , ma si può tracciare la tangente in P alla parabola; si osserva così che ad una funzione s = s ( t ) viene associata un’altra funzione v = v ( t ), definita con una analogia cinematica, e viene dimostrato che, per ogni valore di t, la v ( t ) è la tangente dell’angolo che la retta tangente al grafico di s ( t ) forma con l’asse t. La relazione V = tgRPˆ T , come sostiene il Castelnuovo, si può associare alla V = ds , e, come dt tale, può essere considerata un avvicinamento al concetto di derivata. Torricelli avvertì anche il carattere inverso di quadratura ( integrazione ) e costruzione della tangente ( derivazione ). Vediamolo in considerazione del seguente procedimento. 2 Egli considera il moto di un punto con velocità V = ct 38 L’area del rettangolo OAMN è pari a ct2*t = ct3. Nel grafico Torricelli riconosce che lo spazio percorso nel tempo t, somma degli indivisibili di base dt e di altezza v(t), corrisponde all’area sottesa dalla curva, che sa essere un terzo dell’area del rettangolo OAMN ( l’area sottesa dalla curva è data dall’area del rettangolo 2 1 diminuita dell’area del segmento di parabola (ct 3 − ct 3 = ct 3 ) , e ottiene così la funzione 3 3 S= 1 3 ct 3 Sul diagramma del quale, naturalmente, sa tracciare le rette tangenti, dal momento che era partito già conoscendo la v = v ( t ) data esplicitamente. In pratica Torricelli sa “derivare” soltanto quelle funzioni che ha ottenuto per “integrazione” t t 1 ( per noi : ∫ vdt = c ∫ t 2 dt = ct 3 ), ma si può dire che intuisce e si avvicina al “ teorema 0 0 3 fondamentale del calcolo infinitesimale”. Questo teorema aleggiava già anche in Galileo e vediamo in che termini. Galileo disegna in un diagramma cartesiano il grafico della funzione V = gt ed osserva che lo spazio S descritto dal punto mobile nel tempo t è uguale a quello che percorrerebbe un altro punto il quale si muovesse di moto uniforme nello stesso tempo t con la velocità che il primo punto ha nell’istante , 2 t cioè con velocità V = g , per cui lo spazio percorso 2 1 2 t è dato da: S = g t = gt . Questa però rappresenta 2 2 anche l’area del triangolo POH , cioè l’integrale t t 0 0 1 ∫ vdt = ∫ gtdt = 2 gt 2 . In seguito, come si è visto, fu poi Torricelli a costruire il diagramma v = v ( t ), e a stabilire che lo spazio percorso tra t1 e t2 è misurato dall’area compresa sotto la curva tra i punti di ascissa t1 e t2 . 39 #INDICE ISAAC BARROW Il vero inizio del calcolo infinitesimale moderno è fissato nel teorema di inversione delle operazioni di integrazione e di derivazione. All’origine di questo teorema ci sono i nomi di Torricelli, come abbiamo visto, e di Isaac Barrow. Dell’opera fondamentale di Barrow “ Lectiones opticae ed geometricae”, prendiamo in esame, tra le trasformazioni di curve descritte, quelle nelle quali si vuole intravedere il teorema dell’inversione. Barrow ( 1630-1677 ), maestro di Newton, pur conoscendo la geometria analitica di Cartesio, forse per rigore e purezza di metodo, non se ne serve, ma, date le difficoltà di lettura dell’opera nella sua veste originale, nel riferimento che segue si presenta questo tipo di trasformazioni sul piano cartesiano, per consentire una esemplificazione più diretta dei concetti. Barrow fa vedere delle trasformazioni di curve nelle quali il legame di corrispondenza, per punti, tra una funzione e l’altra è caratterizzato dalle tangenti nei punti della funzione data: lo fa vedere, in generale, dimostrando che, presa una y = f(x), e ( vedi fig. seguente ), dato TN Y = /y , TP è tangente al grafico della Y = F(x). Consideriamo una curva (funzione) crescente ( una y = f(x) che noi rappresentiamo su un riferimento cartesiano con l’asse delle y rivolto verso il basso ) e la curva (funzione) x trasformata, una Y = F(x) (= f(x)dx ) che rappresentiamo sul riferimento cartesiano con ∫ 0 l’asse Y rivolto verso l’alto. Barrow, disegna le due curve (vedi grafico seguente) , operando la corrispondenza in base al procedimento dimostrativo che , Y F(x ) Y (Q) TN 1 preso TN = /y ( /Y = /y ), TP è tangente al grafico della Y = F (x). Considera infatti che: preso un x’ < x (ascisse di P’e P ), risulta RQ:TN =PQ:Y RQ:TN =(Y - Y’ ):Y Y (Y-Y’) RQ = /y RQ : /y = (Y-Y’):Y (P') (R) Dimostra che RQ = (Area( M1N’NM)/y , (Y-Y’) /y che noi [ è dalla sua espressione riconosciamo l’uguaglianza, in quanto x Y Area( M1N’NM) = Q Y' X' N' ∫ f ( x)dx = F (x) x1 X N X x x1 = F(x) – F(x’) = Y – Y’ ] , ed essendo: Area( M1N’NM)/y < Area( M2N’NM)/y , risulterà RQ < Area( M2N’NM)/y, y (x-x’) RQ < /y RQ < (x-x’) = P’Q y M1 Analogamente, se fosse x < x’ si avrebbe QR > QP’. Se ne conclude che la retta PT è tangente perché tutti i suoi punti, tranne P, y sono esterni rispetto alla curva. La dimostrazione non utilizza ovviamente gli operatori derivata e integrale e viene portata a conclusione indipendentemente da questi concetti; procede cioè da una f(x) data e costruisce M2 M f( x ) 40 la corrispondente F(x) in modo che il coefficiente angolare della tangente in ogni suo punto di ascissa XP sia uguale all’ordinata dell’altra f(XP). In termini attuali, “derivando” F(x), punto per punto, si costruisce la corrispondente f(x) e, ( tramite la costruzione descritta ) “integrando“, si procede da f(x) per ricavare la corrispondente F(x). [ F(x) è l’integrale di f(x) ed f(x) è la derivata di F(x) ] Quindi anche Barrow,come già Torricelli, , non sottolinea tutte le implicazioni contenute in queste trasformazioni, perché non sostituisce all’ente geometrico “ tangente “, l’ente analitico corrispondente “ derivata”. Riconosciamo la proprietà della corrispondenza con un esempio ; (vedi grafico seguente) Y= 2x + 3 ln[2/(x+2)] F(x ) ~1,92 consideriamo la Y = F ( x) = 2 x + 3 ln 2 = x+2 1 ; il coefficiente angolare x+2 alla F(x), per esempio in x =1, diventerà l’ordinata di f(x=1); calcoliamolo, in questo caso, tramite la derivata: 2x + 1 1 F’(x) = 2 + 0 -3(x+2) = 2 ( x + 2) x + 2 2 x + 3 ln 2 − 3 ln (Q) P ~0,78 R X' T Y' F’(1)=1, quindi, in x=1 , la f(x) sarà = 1; possiamo già vedere che l’espressione della derivata è quella della corrispondente Y P' 0 (P') (R) N' Q N f(x) = X 2x + 1 x +2 ; y 1/2 y= (2x + 1)/(x + 2) Data f(x) ricaviamoF(x): M1 1 M2 M f( x ) F(x) = = ∫ x 0 ∫ x f(x)dx = 0 ∫ x 0 2x + 4 – 3 dx = x +2 2x + 1 dx = x +2 ∫ x 0 3 ⎞ ⎛ ⎜2– ⎟ dx = + 2 x ⎝ ⎠ ⎛ 2 ⎞ = 2x + 3log ⎜ ⎟ ⎝x +2⎠ Ogni y della f(x) sarà pari alla derivata, calcolata in x, della Y = F(x). Vediamo ancora la corrispondenza riferita ad alcuni punti, prendendo come Y = F(x) una 2 curva notevole più semplice, ovvero la y = x , la cui corrispondente risulta esserey=2x. Y Dai calcoli che seguono si otterrà sempre, in generale, = TN; calcoliamo il coefficiente y 1 angolare della tangente ad F(x), per esempio, in x = , x = 1 , x = 2 , x = 3; senza ricorrere 2 alla derivata, mettendo cioè a sistema l’equazione della F(x) di volta in volta con la retta 41 1 1 ; ), (1;1), (2;4), (3;9) e imponendo il 2 4 ∆ = 0 all’equazione risolvente il sistema noi possiamo ricavare i valori dei coefficienti angolari, e di conseguenza le coordinate dei punti della f(x) corrispondente : generica passante per i punti della F(x) di coordinate( mx =1/2 = 1 = f(x = 1 ) 2 ; mx =1 = 2 = f(x = 2) ; mx =2 = 4 = f(x = 4) ; mx =3 = 6 = f(x = 6). I punti calcolati per la corrispondente f(x) sono allineati ed identificano la funzione f(x)=2x, che è appunto la funzione derivata di F(x). 42 Il criterio fondamentale del metodo di Barrow per l’identificazione delle tangenti consiste però nel considerare il cosiddetto triangolo caratteristico di ipotenusa ds e di cateti dx e dy, quello cioè costituito da una porzione “infinitamente”piccola di tangente e da porzioni “infinitamente” piccole delle parallele all’asse delle ascisse ed all’asse delle ordinate; in tal modo Barrow , riconosce la similitudine esistente tra questo triangolo infinitesimo ed il triangolo(vedi fig. seguente) PP’T e calcola la sottotangente St con la quale può costruire la tangente. 43 #INDICE LEIBNIZ E NEWTON Due pietre miliari nella storia dell’analisi infinitesimale e specialmente nella storia del concetto di derivata sono il “Tractatus” di Newton ( scritto nel 1665/6, pubblicato nel 1704 ) e la memoria “ Nova Methodus “di Leibniz (scritta nel 1675 e pubblicata nel 1684 ). Senza affrontare la grande questione della polemica sorta tra Leibniz e Newton su chi fosse l’inventore del calcolo infinitesimale, esaminiamo alcune delle argomentazioni contenute nei loro scritti, aiutandoci anche con il nostro simbolismo per interpretarne il pensiero relativamente ai concetti fondamentali. Il concetto di funzione venne introdotto da Leibniz solo nel 1692 e fino ad allora il concetto di linea venne utilizzato più in generale, ma poiché nella sua memoria Leibniz utilizza delle linee alle quali associa dei numeri, utilizziamo, per le considerazioni seguenti, il concetto di funzione. Leibniz considera una funzione V = v ( x ): e dice “sia dx un segmento arbitrario e dv un segmento che sta a dx come v sta a BX”. Leibniz, che non conosce il concetto di derivata, si avvicina al metodo di Fermat, usando l’incremento dx preso arbitrariamente al posto dell’incremento e usato da Fermat, ma non si intravede il concetto di derivata come limite del rapporto incrementale ( che proprio non viene considerato ), che, pur con qualche riserva, si poteva ritenere presente in Fermat. In Leibniz c’è il differenziale di v ( x ), che indica con dv, che infatti non viene definito come il prodotto della derivata v’ ( x ) per l’incremento dx della variabile indipendente, ma come un segmento che sta a dx come v sta a BX. Questa definizione ci consente di riconoscere la coincidenza tra i due concetti di differenziale, quello attuale e quello di Leibniz, ma, mentre quello attuale prevede che, prima del concetto di differenziale, ci sia quello di derivata, per Leibniz anche senza il concetto di derivata si può parlare di differenziale. Noi diamo una legge di corrispondenza y = f ( x ) tra la variabile indipendente x e la variabile dipendente y e da qui riconosciamo la curva tramite il diagramma della funzione, mentre Leibniz dà prima la curva generica, su questa considera subito il differenziale come prodotto di dell’incremento della variabile indipendente dx ( preso arbitrariamente ) per il 44 coefficiente della retta tangente. In base a questo assunto la definizione del differenziale appare una un po’ ambigua , poiché viene definito in due modi non propriamente coincidenti: 1. dv è il prodotto di dx per il coefficiente angolare della retta tangente. 2. dv è l’incremento della v in corrispondenza dell’incremento arbitrario dx della x . La definizione 2. coinciderebbe con la 1. esclusivamente se il dv venisse preso sulla retta tangente o nel caso particolare che la v (x ) fosse una funzione lineare, altrimenti noi sappiamo che i due valori di dv risultano, in base alle due definizioni, diversi, come la figura seguente mette in chiaro: Il concetto base di Leibniz è che la retta tangente esiste per ipotesi e chiarisce che “ trovare la tangente è condurre una retta che congiunge due punti aventi una distanza infinitamente piccola ”. ANCHE IN QUESTA DEFINIZIONE SI PUO’ RISCONTRARE L’ASSENZA DEL CONCETTO DI POSIZIONE LIMITE DELLA RETTA TANGENTE ( per noi una retta che congiunge due punti di una curva, per quanto presi ad una distanza infinitamente piccola, è e resta pur sempre una secante ). In ogni caso, Leibniz, pur avendo definito il differenziale per mezzo della retta tangente, calcola il differenziale di molte funzione senza con ciò aver costruito la retta tangente. Se a priori esiste la retta tangente, calcola il differenziale e poi, tramite questo costruisce la retta tangente. Costituiti i differenziali dv , dw , dy , dz , delle funzioni v ( x ), w ( x ), y ( x ), z ( x ), fornisce le seguenti relazioni nelle quali afferma che 1. Se a è una costante, sarà da = 0 e d( ax )= adx, 2. Se y = v , sarà dy = dv, 3. d (z – y + w + x ) = dz – dy + dw + dx, 4. d ( vx ) = xdv + vdx, v ydv − vdy 5. d = . y y2 senza darne dimostrazione, dicendo che “ la dimostrazione di tutte le regole esposte, sarà facile per chi è versato in questi studi…” Leibniz prosegue poi con una accurata analisi dei segni concludendo : “ ..e poiché le stesse ordinate v ora crescono ed ora decrescono, dv sarà una quantità talora positiva e talora negativa “. Viene poi affermato che è dv = 0 nei punti di massimo e di 45 minimo e “ se dv è infinito rispetto all’asse x , allora la tangente è perpendicolare all’asse x ; se dv e dx sono uguali, la tangente forma un angolo semiretto con l’asse x “, ecc. La memoria presenta poi in conclusione la risoluzione di una vera e propria equazione differenziale, che nasce dalla ricerca di curve che hanno sottotangenti costanti. E’ con questa memoria di Leibniz, come sostengono il Dupont e il Castelnuovo, che fa ingresso nella scienza il concetto di differenziale, una notazione che, pur non essendo ancora sufficientemente precisa, è frutto, prima ancora che di un processo logico, di una geniale intuizione. Newton, nel “ Tractatus de quadratura curvarum “, fonda la sua analisi infinitesimale sul concetto di “Flussione “ , concetto che gli storici della matematica interpretano come velocità, anche se Newton non ne dà mai una esatta definizione. L’interpretazione nasce da quanto Newton afferma nel Tractatus, dove si legge: “ .. le linee vengono descritte per moto continuo di punti; le superfici per moto di linee;…i tempi per flusso continuo …… considerando che quantità generate, crescendo in tempi uguali, risultano maggiori o minori secondo la velocità maggiore o minore con cui crescono “ e chiama “ flussioni queste velocità di accrescimento, e fluenti le quantità generate “. In queste considerazioni pare di intendere che,come il tempo, il punto, il moto sono idee primitive, così sia da intendere anche l’idea di velocità di accrescimento; ma è forse la velocità un’idea primitiva? . Ma ecco ancora una ulteriore ambiguità: se , come si è detto, Newton chiama flussioni queste velocità di accrescimento, e fluenti le quantità generate, poi, a corredo del concetto espresso, aggiunge che ”..le flussioni si possono considerare, con approssimazione infinitamente grande, come gli incrementi delle fluenti, generate durante intervalli uguali di tempo piccoli a piacere “. La contraddizione tra le due proposizioni è dunque di carattere dimensionale: la fluente è un’area generata dal moto di una linea, la flussione quindi, intesa come velocità di accrescimento, è una grandezza fisica con le dimensioni di una lunghezza diviso un tempo, mentre intesa come incremento è un’area! Newton considera in sostanza delle quantità variabili in funzione di un parametro temporale, le << fluenti >>, ed in funzione di queste ( diremmo noi in funzione delle loro derivate prime ) le << flussioni >>. L’integrazione si può avvicinare al problema particolare di conoscere la fluente, una volta nota la flussione. Secondo Dupont la flussione di Newton non è la nostra velocità, definita come limite del rapporto incrementale, ma una sorta di concetto primitivo che Newton non definisce esplicitamente, forse perché non calcola specifiche flussioni, ma dei rapporti di flussioni, proponendo e risolvendo problemi che richiedono il rapporto di flussioni. Anche nel n. III del Tractatus, dove Newton si pone il problema del calcolo della flussione della quantità x n , che esprime dicendo “ La quantità x fluisca uniformemente e sia da trovarsi la flussione della quantità x n …nel tempo in cui la quantità x fluendo diventa ( x + h ), la quantità x n diventa ( x + h ) n “, calcola un rapporto di due flussioni, x ( t ) e [ x ( t ) ] n , calcola cioè il rapporto di due incrementi , trovando che il rapporto delle flussioni di x e di x n è : 1 nx n −1 Sistematicamente Newton per calcolare una flussione calcola il rapporto di due flussioni ed opera poi in modo che una di queste flussioni sia uguale all’unità. 46 L’altro metodo con cui opera Newton, il metodo delle prime e ultime ragioni, quello illustrato nel “ Philosophiae Naturalis Principia matematica “ ( 1687 ), rappresenta un punto cardine nella storia del concetto di limite; Newton spiega che le cose trattate circa le linee curve e le superfici in esse comprese potevano anche essere dimostrate, pur con lunghe dimostrazioni per assurdo, secondo l’usanza dei vecchi geometri ( Eudosso , Archimede ), alla quale subentrò il metodo degli indivisibili, con il quale, dice Newton “ ..le dimostrazioni sono rese più brevi, ma l’ipotesi degli indivisibili è ardua, ed ho preferito ridurre le dimostrazioni alle prime e ultime somme e ragioni ( rapporti ) di quantità evanescenti e nascenti, ossia ai limiti delle somme e ragioni …..per ultime ragioni delle quantità evanescenti si deve intendere il rapporto delle quantità non prima di diventare nulle e non dopo, ma quello col quale si annullano….si può anche obiettare che, se vengono date le ultime ragioni delle quantità evanescenti, saranno date anche le ultime grandezze. Questa obiezione però si basa su una falsa ipotesi. Le ultime ragioni con cui quelle quantità si annullano non sono in realtà le ragioni delle ultime quantità, ma i limiti ai quali le ragioni delle quantità decrescenti si avvicinano sempre, illimitatamente, e ai quali si possono avvicinare per più di qualunque differenza data, e che però, non possono mai superare, né toccare, prima che le quantità siano diminuite all’infinito”. Superato l’ “arduo “ concetto degli indivisibili, Newton avvicina in modo significativo l’esatto concetto di limite ( che sarà raggiunto poi da CAUCHY solo ben 150 anni dopo ), e pur non dandone una rigorosa sistemazione, ne ha piena consapevolezza dal punto di vista operativo e strumentale. Riassumendo, Newton, nel Tractatus, operando tramite una concezione meccanica della geometria, considera l’equazione F ( x , y ) di una curva come una relazione che regola le variazioni delle grandezze fluenti x ed y, grandezze cinematiche correlate dall’equazione data; le flussioni, si possono associare a delle velocità istantanee, e sono delle variabili che, tramite il loro rapporto, consentono di determinare la tangente alla curva data, ricavabili differenziando la funzione secondo opportune regole. Nei Principia Newton supera, con il metodo delle prime e ultime ragioni, questa concezione e la sostituisce con l’idea di limite, sia pur soltanto su un piano intuitivo. Resta ancora da aggiungere che, a parte le differenze concettuali, le regole di differenziazione sono matematicamente analoghe a quelle di Leibniz. Un’altra importante novità nell’uso che Newton fa degli sviluppi in serie nell’ambito del problema generale delle quadrature. Newton riesce a ricavare lo sviluppo in serie di tutte le funzioni conosciute e ne fa la chiave per ridurre il problema all’integrazione delle potenze. Newton accoglie il risultato della proposizione 59 dell’ “Arithmetica Infinitorum “ di Wallis ( 1655 ) che afferma che, se x è l’ascissa di una curva, se m e n sono due numeri e se m n x sono le ordinate innalzate ad angolo retto, allora l’area della figura sarà : m+n n x n n+m Inoltre accoglie, sempre dal Wallis ( proposizione 108 e altre ) la regola che, se l’ordinata è costituita da due o più ordinate unite insieme dai segni + e - , anche l’area sarà allora costituita da due o più aree congiunte insieme rispettivamente dai segni + e - . La terza regola, per Newton, consiste nel ridurre le frazioni, i radicali, le radici affette da esponente in serie convergenti, quando non è possibile trovare altrimenti le quadrature, e poi procedere operando con le due regole precedenti. Con Leibniz la chiave per risolvere i problemi delle tangenti è la differenziazione, che consente anche di impostare quello delle equazioni differenziali, mentre con Newton si ha il ricorso agli sviluppi in serie per risolvere lo stesso problema generale. 47 #INDICE De l’ HOSPITAL (1661- 1704) GIOVANNI BERNOULLI (1667- 1748) VARIGNON (1654-1722) EULERO (1707- 1783) D’ALEMBERT (1717-1783) Al marchese Guglielmo Francesco de l’Hospital, si deve attribuire il merito di aver pubblicato nel 1695 una prima sistematica esposizione del calcolo differenziale, l’“Analyse des infiniments petits “, un’opera didattica di sistemazione e divulgazione, utilizzando lezioni ed appunti ricevuti da Giovanni Bernoulli, e che contribuì in modo significativo al trionfo dell’algoritmo di Leibniz su quello di Newton. Grande contributo invece al Metodo di Newton lo si trova invece nel “Traité des fluxions “( 1749 ). Agli inizi del 700 diversi furono, dei grandi matematici del tempo, i modi di operare e di contribuire alla costruzione dell’analisi infinitesimale. De l’Hospital, Bernoulli, Varignon, Eulero, d’Alembert, per citarne alcuni tra i maggiormente importanti, operarono in modo molto disinvolto con gli infinitesimi e gli infiniti, e sempre e solo parlando di differenziali e mai di derivate, anche se viene presa in considerazione la dy funzione , alla quale però non viene assegnato alcun nome. dx Tuttavia, anche se i fondamenti dell’analisi infinitesimale non sono compiutamente sicuri, sicuri sono i risultati, e pertanto i fondamenti sono affidabili. Per comprendere la varietà degli approcci, riportiamo qui alcune definizioni. De l’Hospital considera, nella sez. I dell’ Analyse des infiniments petits , una variabile indipendente x e delle variabili dipendenti y, z, …., e dà la seguente definizione: << La porzione infinitamente piccola della quale una quantità variabile aumenta o diminuisce con continuità, sia detta “ differenza “>> e indica tali differenze con dx, dy, dz, …. Per Varignon ( Precisazioni sull’analisi degli infinitamente piccoli – 1725 ) << ..la differenza, o differenziale, di una quantità è l’accrescimento o la diminuzione istantanea del proprio valore >>. In queste definizioni tutti i differenziali vengono trattati allo stesso modo: la distinzione tra il differenziale della variabile indipendente x ed i differenziali delle funzioni y, z, …, non è specificata; tanto per la x che per la y, z, …, si parla di porzioni infinitamente piccole o di accrescimenti o diminuzioni istantanee, ma cosa questo davvero significhi non viene specificato. Punti di vista variegati si presentano anche di fronte alla questione: dx è nullo o no?(dx = 0?). Per de l’Hospital e Varignon dx e dy sono quantità infinitamente piccole, o anche semplicemente piccole, ma la questione si pone nei termini : “in determinate situazioni possono essere considerate nulle? “. Con de l’Hospital (Analyse) <<ci si chiede se due quantità si possano prendere indifferentemente l’una per l’altra quando differiscano tra loro di una quantità infinitesima >>, mentre Varignon più decisamente afferma che la cosa può essere fatta: << Tutte le quantità che non sono aumentate o diminuite se non di una parte infinitesima in relazione alla loro totalità, possono essere prese in considerazione allo stesso modo di come erano prima di questo cambiamento: mutatio indefinite parva, mutatio nulla >>; dx non è nullo, ma a + dx può essere preso uguale ad a. Ad esempio nella regola di differenziazione del prodotto x y , de l’Hospital parte da x y, passa a ( x + dx )( y + dy ) = x y + xdy + ydx + dxdy e quindi a x y + d(x y), dove risulta che d(x y) = xdy + ydx + dxdy; dimostra poi che dxdy è una quantità infinitamente piccola rispetto a xdy + ydx, e lo fa in questo modo: (per esempio nel confronto con ydx ) divide dxdy per ydx ed dxdy dy ottiene , mette in evidenza che il rapporto si riduce a e dice << ..si trova da una parte ydx y 48 la y ( denominatore ) e dall’altra dy ( numeratore ) che ne è il differenziale, e per conseguenza infinitamente minore di y .. >> e conclude che la quantità dxdy può essere trascurata nell’espressione del differenziale che quindi si riduce a : d(x y) = xdy + ydx. Per Varignon, invece, dxdy è nullo per ipotesi! Vediamo ora come Eulero opera con gli infinitamente piccoli. Leonardo Eulero, nativo di Basilea e discepolo di Giovanni Bernoulli, fu uno dei più grandi e fecondi matematici di ogni tempo. Nell’ambito dell’analisi infinitesimale Eulero occupa una posizione originale, per aver considerato gli infinitamente piccoli come degli zeri assoluti. Vediamone l’impostazione nel seguente esempio ( Institutiones Calculi Differentialis – Series I, vol. X ): 2 2 data la funzione y = x , sia dato a x l’incremento ω; la y subisce l’incremento 2xω + ω [ y = x2 ; ( x + ω )2 = x2 + 2xω + ω2 ]; il rapporto degli incrementi, 2 xω + ω 2 2x + ω , è il rapporto che troviamo tra 2x + ω ed 1. Eulero sente che il 1 ω rapporto si avvicina a 2x, ma a questo valore può pervenire solo se e quando si ha ω = 0; nell’espressione del rapporto incrementale di Eulero, con ω = 0, si ha il numeratore = 0 e il 0 denominatore pure = 0; tale rapporto risulta , ma per Eulero vale 2x! Mentre noi operiamo 0 tramite un passaggio al limite, Eulero pone invece semplicemente ω = 0, anche se, quando afferma << .. è chiaro che il rapporto 2x + ω ad 1, a meno dell’incremento ω, tende al rapporto 2x ad 1 >> si ha quasi l’impressione che concepisca il concetto di limite, sebbene = non siano del tutto chiariti i fondamenti del calcolo. E’ con d’Alembert che troviamo finalmente prima il limite e poi la differenziazione; prendiamo in esame questo suo modo di procedere con l’esempio che lui stesso ci porge. 2 Data la parabola di equazione y = ax ( vedi Fig. seguente ), cerchiamo la tangente MQ di questa parabola nel punto M ( x, y ). 49 Ragionando come se il problema avesse già la soluzione, immaginiamo una ordinata pm qualsiasi ad una distanza qualsiasi da PM. Risulta evidente dalla figura che: MP MP mO z a 2 = = = > ( da y = ax si ha infatti: pm 2 = a ( x + Pp); essendo PQ PR MO u 2 y + z pm = y + z , si ha ( y + z ) 2 = a ( x + u ) , da cui y 2 + 2 yz + z 2 = ax + au ; eliminando y 2 a primo membro e ax a secondo membro, in quanto y 2 = ax , si ottiene 2 yz + z 2 = au , da cui z a z (2 y + z ) = au , ed infine: = . u 2y + z a MP mO Da un parte si ha che è il limite del rapporto , e così dall’altra si ha pure che 2y + z PQ MO mO z è identicamente il limite del rapporto , per z → 0 ( è il rapporto incrementale, che, per MO u dy noi, per z → 0 diventa ). dx Dunque MP = y ; PQ = 2x. Infatti: a MP y a 1 2 y 2 (+ zy ) 2y2 ; = PQ ; > > PQ < e, per z → 0 , = ; PQ PQ 2 y (+ z ) PQ 2 y 2 (+ zy ) a a 2ax essendo y2 = ax, si ottiene PQ = , da cui infine PQ = 2x. a Invece, tramite il calcolo differenziale, da ax=y2 , si ottiene adx = 2ydy, da cui dy a = , dx 2 y dy z è : << Il limite del rapporto di z ad u ( ), dove questo limite si trova dx u a ponendo z = 0 nella frazione >>. 2y + z Ma d’Alembert non accetta il criterio che pone z = 0 ed u = 0, come disinvoltamente avrebbe fatto Eulero, affermando che : 0 << …nel porre z = 0 ed u = 0 non c’è dell’assurdo, dal momento che può essere uguale a 0 tutto ciò che si vuole;….. nonostante il limite del rapporto di z ad u si trovi quando z è = 0 ed u = 0 , non è in senso vero e proprio il rapporto di z = 0 ad u = 0, dal momento che questo non ne presenterebbe un’idea chiara, dicendo nulla di più del fatto che è un rapporto di cui i due termini sono entrambi nulli. ( Invero ) Questo limite è la quantità che il rapporto z approssima sempre di più, supponendo che z ed u siano entrambi reali e man mano u decrescenti, potendo avvicinare tanto più da vicino questo rapporto quanto si vuole. Niente è più chiaro di questa idea…. ….Si può quindi considerare l’analisi infinitesimale sotto due punti di vista differenti, considerando le quantità infinitamente piccole o come quantità effettive, o come quantità assolutamente nulle.>>. cosicché 50 #INDICE LAGRANGE CAUCHY BOLZANO CANTOR Con Lagrange ( Torino-1736 –1813) abbiamo per la prima volta l’uso della parola FUNZIONE DERIVATA Giuseppe Luigi Lagrange fu, con Eulero uno dei più grandi matematici del settecento. Prima di Lagrange non si “derivava”, ma si “differenziava”, si considerava cioè la funzione dy dx , rapporto dei differenziali ( il differenziale della funzione diviso il differenziale della variabile indipendente ). Leibniz lavorava con i differenziali, quantità infinitamente piccole, Eulero considerava i medesimi come quantità nulle delle quali però si possono fare i rapporti. Lagrange, che diffida dei differenziali, procede così: prendiamo il caso semplice f(x) = x 2 ; Lagrange introduce un metodo che si basa sullo 2 2 2 sviluppo in serie della funzione: f(x) = x = (x – x' ) + 2 x' (x – x' ) + (x') e perciò: 2 2 f(x) = (x') + 2 x'(x – x' ) + (x – x' ) . Accrescimento Si vede in questa una anticipazione dello sviluppo in serie di Taylor : 2 (x – x 0) f(x) = f(x 0) + (x – x 0) f ' (x 0) + f '' (x 0) + .·····. 2 Per definizione sarà f ' ( x' ) = 2 x' , e quindi f ' ( x) = 2 x , oppure con altra simbologia: (x + h) 2 = x 2 + 2xh + h 2 f ' (x) = 2x . Enunciamo la definizione di Lagrange (1772). “La funzione derivata è il coefficiente dell’accrescimento della variabile nel primo termine dell’accrescimento della funzione sviluppata in una serie ordinata secondo le potenze crescenti dell’accrescimento della variabile.” Quindi, nel nostro esempio, 2x è il coefficiente di h, e 2 perciò 2x è la derivata di x . ( Metodo anche sfiorato da Newton ). n n n Analogamente, se per esempio si ha f (x) = x , si ricava (x + h) = x + n x E perciò f ' (x) = n x n–1 n–1 ⎛ n ⎞ n–2 ⎛ n ⎞ n–3 ; f '' (x) = 2 ⎜ ⎟ x ; f ''' (x) = 6 ⎜ ⎟ x ⎝2⎠ ⎝3⎠ Con Cauchy opereremo invece con il limite : lim h→0 2xh + h h .···. + h n etc .····. 2 = 2x . 51 Enunciamo la definizione di Cauchy (1843). “ La funzione derivata è il limite del rapporto tra gli accrescimenti infinitamente piccoli e simultanei della funzione e della variabile”. La soluzione sostanzialmente definitiva del paradosso di Zenone viene fornita da #INDICE CAUCHY(1789 – 1857). A FONDAMENTO DELL'ANALISI MATEMATICA EGLI PONE LA NOZIONE DI “ LIMITE” In relazione al paradosso succitato i tempi t1, t1+t2, t1+t2+t3, ...... sono tutti tempi finiti; per quanto si proceda nel considerare somme successive di questo tipo, si dimostra che esiste un tempo T0 tale che le singole somme si mantengono sempre inferiori ad esso, ma, prefissato un tempuscolo arbitrariamente piccolo, finiscono per risultare e mantenersi maggiori di T0 - ; cioè si può vedere che finiscono per avvicinarsi quanto si vuole a T0. T0 è quindi il tempo che occorre ad Achille Cauchy introduce, insomma, in modo rigoroso in matematica l' infinito potenziale: egli considera sempre quantità finite, ma precisa il significato di quantità limiti, potenzialmente avvicinabili a piacere ancora sempre da processi costituiti da un numero finito di passi, ma tali da ammettere, dopo un numero n qualsiasi di tali passi, ancora la possibilità di continuare. La sua posizione ci sembra quindi di netto rifiuto dell'infinito attuale, cioè della possibilità di prendere in esame insiemi costituiti effettivamente da infiniti elementi con caratteristiche individuali ben precise ( con la nozione di limite Cauchy definisce la funzione DERIVATA, sostanzialmente perfezionando la definizione di Lagrange ). Stessa posizione viene espressa da Bolzano ( Bernard Johan Nepomuk Bolzano, sacerdote matematico di origine italiana, nacque a Praga. 1781 – 1848 ) quando dice che “ molti matematici si sono spinti troppo in là accettando ora un infinitamente grande, ora un infinitamente piccolo, in casi in cui, secondo la mia intima convinzione, non esiste né l’uno né l’altro. Ciononostante, un “calcolo dell’infinito correttamente condotto” può essere fatto; così pure è possibile un calcolo dell’infinitamente piccolo”. Lo scenario concettuale sull’infinito viene poi a modificarsi ed a completarsi per opera di Georg Cantor, il grande matematico di Pietroburgo, che introdusse in matematica, come abbiamo visto, il concetto di infinito attuale con la sua rigorosa teoria dei numeri transfiniti, con la stupefacente scoperta che gli “ infiniti “ non sono tutti uguali, ma anzi costituiscono a loro volta una successione infinita. 52 #INDICE BIBLIOGRAFIA Morris Kline – Storia del pensiero matematico – Einaudi Richard Courant e Herbert Robbins - Che cos’è la matematica ? – Bollati Boringhieri Lucio Lombardo Radice / Lina Mancini Proia – Il metodo matematico – Principato Pascal Dupont – Storia del concetto di derivata – Cortina Giornale di Fisica – vol. 31 ( 1990 ) – ed. Compositori Bologna. 53