Diario del corso di Analisi matematica - III anno accademico 2012-13 prof. Gabriele Anzellotti Università di Trento Dipartimento di Matematica 9 ottobre 2012 Il presente ‘diario del corso’ contiene una sintesi delle lezioni svolte. Viene aggiornato prima possibile dopo ogni lezione. Le lezioni messe in rete rimangono nella sostanza non modificate, anche se accade frequentemente che vengano fatte correzioni e piccoli aggiustamenti successivi, non sempre segnalati. Il Diario ha una funzione di supporto e la sua lettura non può sostituire la partecipazione alle lezioni. 1 Lezione − lunedı̀ 17 settembre 2012 10.30 - 12.30 (2 ore) Introduzione alla Teoria della Misura e dell’Integrazione. 1.1 Argomenti del corso, testi e riferimenti suggeriti, prerequisiti Il corso di Analisi III è dedicato a sviluppare i seguenti argomenti: 1. Lunghezza, area, volume di sottoinsiemi dello spazio euclideo 3-dimensionale. 2. Calcolo integrale per funzioni di più variabili, integrali su curve e superfici, estensioni del Teorema Fondamentale del Calcolo in Rn . 3. Successioni e serie di funzioni, in particolare serie di Fourier trigonometriche e problema del passaggio al limite sotto il segno di integrale. 4. Teoria della Misura, con particolare riferimento alla Misura di Lebesgue e alla Misura di Hausdorff. Integrale rispetto a una misura, teoremi di convergenza e spazi di funzioni misurabili. Gli argomenti trattati a lezione saranno riportati nel presente Diario, ma è consigliabile avere anche dei testi di riferimento sui quali studiare. Per quanto riguarda gli argomenti 1, 2, 3, si suggerisce di procurarsi un testo di analisi matematica del secondo anno. Un testo ragionevole è Analisi matematica 2 di Enrico Giusti - Editore Bollati Boringhieri - Terza edizione 2003. Di questo testo consigliamo in particolare i capitoli: 12. Il Calcolo integrale in più variabili, 13. Successioni e serie di funzioni, 14. Serie di Fourier, 16. Forme differenziali. Per quanto riguarda l’argomento 4, si consiglia di scaricare il testo in formato pdf del libro Modern Real Analysis di William P. Ziemer, che è liberamente disponibile nelle pagine personali dell’autore nel sito http://www.indiana.edu/˜mathwz/PRbook.pdf della Indiana University. Altri riferimenti su questioni specifiche saranno dati durante il corso e riportati nel Diario. Le prove scritte di esame e le prove in itinere riguarderanno principalmente il calcolo di integrali, lunghezze, aree, volumi. Un’idea del tipo di quesiti richiesti si può avere guardando le prove di esame 2010/11 http:// www.science.unitn.it/˜anzellot/scrittianalisi1011.htm e le prove in itinere 2011/12 (che sono contenute nel diario 2011/12 http://www.science.unitn.it/˜anzellot/analisi1112.htm). Nell’anno accademico 2012/13 potranno però aversi delle variazioni. Nelle lezioni tenute dal dottor Altavilla saranno svolti diversi esercizi e ne saranno suggeriti molti altri. Ricordiamo che vi sono numerosi siti web nei quali si trovano esercizi svolti di calcolo integrale in più variabili e ne indichiamo due: Politecnico di 1 Torino http://calvino.polito.it/˜terzafac/Corsi/analisi2/materiale.html; Paul Dawkins Lamar University http://tutorial.math.lamar.edu/Classes/CalcIII/CalcIII.aspx. Infine, può essere utile anche un libro di esercizi di analisi per il secondo anno; fra i molti, ai nostri fini essenzialmente equivalenti, ricordiamo quello di Enrico Giusti, che accompagna il testo di lezioni citato sopra. Nel presente corso saranno utilizzati i concetti e le tecniche introdotti nei corsi di Analisi 1, Analisi 2, Geometria 1, Geometria 2. In particolare: i numeri reali R e la topologia della retta; gli spazi vettoriali Rn e le nozioni di sottospazio vettoriale, base, applicazione lineare e matrice ad essa associata rispetto a basi assegnate; il prodotto scalare standard in Rn , la norma e la distanza euclidea, il teorema di diagonalizzazione degli operatori simmetrici; la nozione di spazio metrico, di insieme aperto, insieme chiuso, insieme compatto, successione convergente, funzione continua; il calcolo differenziale in una e più variabili; le curve, superfici e sottovarietà regolari in Rn ; l’integrale di Riemann e il teorema fondamentale del calcolo per funzioni di una variabile. Le conoscenze fondamentali di analisi e geometria appena indicate sono date per note e in questo corso saranno solo brevemente richiamate, quando necessario, per stabilire le notazioni. Per iniziare a seguire questo corso non è però necessario ricordare a memoria tutte le definizioni, gli enunciati e le dimostrazioni che si sono incontrati nei corsi del primo anno! è sufficiente averne un’idea intuitiva ed è importante avere un luogo di riferimento dove si possano rapidamente ritrovare nel dettaglio che a seconda dei casi è necessario. Il corso di Analisi III fornisce molte buone occasioni per riprendere in mente e sistemare gli argomenti studiati nel primo anno, argomenti che forse non sono stati tutti acquisiti a sufficienza dagli studenti e che comunque, inevitabilmente, saranno stati in parte dimenticati. Pertanto al termine del presente corso ci si attende che le teorie studiate nel primo anno, pur non essendo specifico oggetto dell’esame, siano padroneggiate adeguatamente dagli studenti, per quanto riguarda il loro utilizzo negli argomenti specifici di Analisi III. 1.2 Lunghezza e area in una prospettiva storica. Due enunciati del Teorema di Pitagora Se oggi chiediamo a qualcuno di misurare (la lunghezza di) un bastoncino, costui probabilmente prenderà un metro, ossia una riga o un nastro graduato, e lo metterà accanto al bastoncino, avendo cura di porre una estremità del bastoncino in corrispondenza con l’inizio del metro, dove si trova segnato il numero 0 (zero); poi leggerà il numero che si trova sul metro in corrispondenza con l’altra estremità. Questo numero sarà la risposta. Se chiediamo poi di dirci l’area di un foglio rettangolare, questa persona misurerà le lunghezze di due lati del foglio, ortogonali tra loro, e moltiplicherà tra loro questi due numeri. L’area è per noi il numero che si ottiene come prodotto delle lunghezze dei lati. Naturalmente si possono usare strumenti molto più sofisticati per la misura della lunghezza e in ogni caso vi saranno delle incertezze e degli errori nelle misure, ma tutto ciò non interessa in questa sede, il punto è che la misura (lunghezza, area) per noi è un numero. Per distinguere i numeri che esprimono lunghezze dai numeri che esprimono aree, si usa scrivere per chiarezza accanto ai primi il simbolo ‘m’ (che sta per ‘metro’, l’unità di misura delle lunghezze), e si usa invece scrivere accanto ai secondi il simbolo ‘m2 ’ (che sta per ‘metro quadrato’, l’unità di misura dell’area). Precisiamo subito che non c’è alcuna differenza fra i numeri che esprimono lunghezze, aree o misure di tempo o di temperatura, come invece si sente talvolta dire... sempre gli stessi numeri sono. Quello che è diverso è la nostra intenzione, nell’usarli, di indicare misure di grandezze diverse. Tale intenzione può essere opportuno palesarla − i fisici ci tengono sempre molto, e hanno le loro ragioni1 − e si aggiunge cosı̀ il simbolo dell’unità di misura. La lunghezza e l’area non si sono sempre misurate in questo modo. Per cominciare il metro è stato introdotto soltanto alla fine del settecento e soprattutto, il modo di pensare alla lunghezza e all’area è stato radicalmente diverso nella matematica greca antica. Per comprendere questa differenza possiamo confrontare due enunciati del teorema di Pitagora, un enunciato moderno che si trova comunemente nei libri o in rete e l’enunciato che si trova negli Elementi di Euclide, Libro I, n.47 2 . Euclide vive a cavallo del 300 a.C., ma il teorema di Pitagora, in qualche forma, si ritiene sia di almeno un secolo precedente . Teorema 1.2.1 Teorema di Pitagora - enunciato corrente moderno. In un triangolo rettangolo l’area del quadrato costruito sull’ipotenusa è equivalente alla somma delle aree dei quadrati costruiti sui due cateti. In altre parole: dato un triangolo rettangolo di lati a, b e c, dove c è l’ipotenusa (ossia c è il lato opposto all’angolo retto), si ha a2 + b2 = c2 1I matematici invece in genere non ci tengono, e hanno anche loro le loro ragioni. riferimento all’edizione critica e traduzione di Fabio Acerbi, Bompiani 2007 2 Faremo 2 Teorema 1.2.2 Teorema di Pitagora negli ‘Elementi’ di Euclide. Nei triangoli rettangoli il quadrato sul lato (ipotenusa) che sottende l’angolo retto è uguale ai quadrati sui lati (cateti) che comprendono l’angolo retto. Nella formulazione di Euclide ovviamente non compaiono formule e non c’è neppure la parola ‘area’. Si dice invece direttamente che il quadrato (costruito) sul lato che sottende l’angolo retto (noi abbiamo aggiunto il nome ‘ipotenusa’) è uguale ai quadrati sugli altri due lati. Il Teorema di Pitagora antico non è una uguaglianza fra numeri, è invece una uguaglianza tra figure: da una parte il quadrato costruito sull’ipotenusa, dall’altra parte i due quadrati costruiti sui cateti, presi insieme. La dimostrazione di Euclide procede suddividendo il quadrato sui cateti in due parti e facendo vedere che ciascuna di esse è uguale a uno dei quadrati sui cateti. La prova si basa sulla proposizione, mostrata da Euclide al numero 35 del Libro I, che due parallelogrammi con un lato in comune e i lati opposti su una stessa retta sono uguali. Qui è importante capire il significato che ha il termine uguali: due figure sono uguali se ciascuna di esse si può suddividere in uno stesso numero finito di parti, in modo che ogni parte della prima figura sia sovrapponibile esattamente a una e una sola parte della seconda figura. In linguaggio posteriore, noi preferiamo dire che due figure con questa proprietà sono equiscomponibili e diciamo che sono quindi equivalenti. In ogni caso, le figure vengono comparate senza ricorrere a un numero per misurarne l’estensione. Vediamo nella prossima sezione come questo punto di vista viene utilizzato dai Greci per sviluppare una teoria generale delle grandezze. 1.3 Grandezze e proporzioni nella matematica greca. Archimede e la sfera. Nella matematica greca fu sviluppata una teoria delle grandezze astratte e delle proporzioni fra le grandezze, la cui esposizione classica si trova nel Libro V degli Elementi di Euclide. I segmenti, oggetti astratti del piano euclideo, sono un esempio tipico di grandezza. I segmenti possono essere trasportati nel piano con le isometrie, o moti euclidei). Grazie a questa operazione, i segmenti si possono confrontare, mettendoli su una stessa retta con un estremo in comune in un punto P e l’altro estremo nella stessa semiretta rispetto a P. Due segmenti si possono anche sommare, riportandoli consecutivamente su di una retta e ottenendo un terzo segmento, e si possono sottrarre, il minore dal maggiore. Il perimetro di un poligono è quel segmento che si ottiene sommando i lati del poligono stesso. Anche le figure, ad esempio i triangoli e i poligoni, si possono trasportare, sovrapporre, confrontare. Se non si possono confrontare direttamente, si possono suddividere in parti e si possono confrontare le parti, come si è detto nella sezione precedente. Le figure sono un altro esempio tipico di grandezza. In generale, due grandezze omogenee si possono confrontare e si può dire se sono uguali o quale delle due è maggiore. Due grandezze omogenee si possono sommare fra loro e una grandezza A si dice essere ‘misurata’ da un’altra grandezza B, se A è uguale alla somma di B con se stessa un certo numero di volte (in linguaggio moderno diremmo che A è un multiplo di B e scriveremmo A = kB per qualche numero naturale k). Due grandezze A, B si dicono fra loro commensurabili quando sono ‘misurate’ da (ossia sono multiple di) una stessa grandezza C, ad esempio A = kC e B = pC, e in tal caso si dice che A sta a B come k sta a p, oppure che A e B stanno fra loro nel rapporto k : p, ovvero A : B = k : p. In linguaggio moderno, nella situazione appena detta si direbbe che il rapporto tra A e B è k p , pensando quest’ultima frazione come un numero razionale, ma questo era impensabile nella matematica greca: i concetti di frazione e di numero razionale e le relative notazioni e operazioni, nonché le notazioni algebriche, non erano stati sviluppati. Si seppe molto presto (Scuola pitagorica, intorno al quinto secolo a.C.) che ci sono grandezze omogenee tra loro non commensurabili, ad esempio la diagonale e il lato di un quadrato, e si trovò comunque il modo, attribuito a Eudosso di Cnido, circa 370 a.C. e pure descritto nel V Libro degli Elementi, di considerare proporzioni che coinvolgono grandezze tra loro incommensurabili, pur non avendo a disposizione il concetto di numero reale. Si comprende da questo l’importanza della teoria delle proporzioni per la matematica e come linguaggio per la scienza, durata fin quando i numeri decimali, le frazioni e l’algebra non la soppiantarono alcuni secoli fa (a scuola invece le proporzioni sono rimaste più a lungo...). Utilizzando metodi ‘meccanici’ ingegnosi, che abbiamo solo da poco tempo compreso grazie al ritrovamento di preziosi palinsesti, e utilizzando sottili metodi di dimostrazione, Archimede (morto nel 212 a.C.) ottenne straordinari risultati sulla misura di grandezze: mostrò che il cerchio è uguale a un triangolo che ha come base la circonferenza e come altezza il raggio; confrontando il cerchio con poligoni regolari, ottenne alcune buone approssimazioni del rapporto tra la circonferenza e il diametro; mostrò che la sfera solida sta al cilindro equilatero solido circoscritto come due sta a tre; mostrò che la superficie della sfera è uguale alla superficie laterale di tale cilindro. Su questi risultati la teoria della misura si ferma essenzialmente fino al secolo XVII. 3 2 Lezione − giovedı̀ 20 settembre 2012 10.30 - 12.30 (2 ore) Introduzione al punto di vista moderno sulla misura 2.1 Notazioni per oggetti in R2 Cominciamo con lo stabilire le notazioni che useremo per alcuni oggetti che si trovano negli spazi Rn , già ben noti agli studenti dai corsi di Geometria e di Analisi Matematica 2. Per semplicità e chiarezza parleremo di R2 , ma con notazioni che si estendono naturalmente e facilmente a Rn . Come è uso, per l’insieme delle coppie ordinate di numeri reali useremo la notazione R2 = R × R = (x, y) x, y ∈ R Di questo insieme R2 useremo la consueta rappresentazione cartesiana, che si ottiene fissando su un piano (geometrico o fisico) due rette orientate (assi) ortogonali, sulle quali è data una unità di lunghezza, e associando a ogni elemento (x, y) di R2 il punto P che ha coordinate (x, y) rispetto al sistema di riferimento fissato. Spesso identificheremo l’elemento (x, y) con il punto P, riteniamo senza creare difficoltà, e useremo il termine piano per riferirci all’insieme R2 . Inoltre, spesso chiameremo vettori gli elementi di R2 e potremo rappresentare un vettore (x, y) con una freccia che parte dal punto O dove si intersecano gli assi (origine, o vettore nullo) e arriva al punto P = (x, y). Per indicare un elemento di R2 useremo anche la notazione x = (x1 , x2 ), che ha il vantaggio di estendersi naturalmente a ogni dimensione. Nel piano R2 consideriamo le solite operazioni di somma u + v = (u1 , u2 ) + (v1 , v2 ) := (u1 + v1 , u2 + v2 ) ∀u = (u1 , u2 ) ∈ R2 , ∀v = (v1 , v2 ) ∈ R2 e di prodotto di una coppia per un numero reale ∀t, ∈ R , ∀u = (u1 , u2 ) ∈ R2 tu = t(u1 , u2 ) := (tu1 ,tu2 ) con le quali l’insieme R2 diviene uno spazio vettoriale su R. Ricordiamo che l’insieme dei due vettori e1 := (1, 0) , e2 := (0, 1) è una base di R2 , che chiameremo base standard. Ricordiamo anche che la funzione g : R2 × R2 →R che alla coppia (u, v) associa il numero g(u, v) := u1 v1 + u2 v2 è un prodotto scalare su R2 (si veda anche la successiva sezione 3.3), che chiameremo prodotto scalare standard e, a seconda dei contesti e della comodità grafica, denoteremo anche u · v, oppure (u, v)R2 o semplicemente (u, v). Nonostante la potenziale confusione con la notazione per una coppia di vettori e con la notazione per un intervallo aperto di numeri reali, non dovrebbero sorgere problemi. Al prodotto scalare standard si associa la norma standard su R2 q q kuk := (u, u)R2 = u21 + u22 che si denoterà anche semplicemente |u|. Nella rappresentazione grafica del piano R2 , la norma di un vettore u è la lunghezza della freccia che lo rappresenta, ossia la distanza del punto dall’origine. La distanza (euclidea) standard d(u, v) tra due elementi u, v di R2 è definita come la norma del vettore differenza d(u, v) := |u − v| = |v − u|. Avremo spesso la necessità di considerare due tipi di insiemi speciali: • gli intervalli due dimensionali, detti anche rettangoli, ossia gli insiemi I = I1 × I2 che sono il prodotto cartesiano di intervalli uno-dimensionali; • le palle (aperte), in due dimensioni dette anche cerchi aperti, ossia gli insiemi del tipo q Br (x) := {y ∈ R2 d(x, y) < r} = {y ∈ R2 (x1 − y1 )2 + (x2 − y2 )2 < r} dove il punto x e il numero positivo r si chiamano rispettivamente centro e raggio della palla. Esercizio 2.1.1 i) Scegliere quattro numeri reali a1 , b1 , a2 , b2 e disegnare l’intervallo (a1 , b2 ) × (a2 , b2 ). Scrivere le coordinate dei quattro vertici dell’intervallo. Descrivere i quattro lati dell’intervallo, sia con un opportuno sistema di equazioni e disequazioni, sia con una opportuna parametrizzazione. ii) Descrivere il quadrato aperto più grande tra quelli che sono contenuti nella palla aperta di centro x = (1, 3) e raggio r = 2. iii) Generalizzare le definizioni di intervallo e palla a 3 e 4 dimensioni e generalizzare gli esercizi i) e ii). 4 2.2 Misura come funzione di insieme - cosa ci aspettiamo da una buona nozione di ‘misura’. Nella matematica dell’antica Grecia le grandezze (omogenee) si misuravano l’una con l’altra e due grandezze dello stesso tipo potevano avere tra loro rapporti espressi da numeri naturali, oppure essere incommensurabili. Fissata una grandezza come unità di misura, le altre si potevano esprimere in rapporto a questa. Con lo sviluppo della notazione decimale posizionale dei numeri, delle frazioni, del calcolo con i numeri e con le lettere, e inoltre con l’emergere di grandezze per le quali era poco praticabile o impensabile fare direttamente il confronto e la somma, si affermò l’idea di ‘misura’ come di un numero, ottenuto con certi criteri e procedure, e con riferimento a certe ‘unità di misura’. Oggi in matematica, dato un insieme X qualsiasi e denotato con P(X) l’insieme delle parti di X, si chiama genericamente misura su X una funzione m : F →B dove F ⊂ P(X) è una famiglia di sottoinsiemi di X, e l’insieme B, in cui la misura prende i suoi valori, può essere di diversi tipi: nella gran parte del corso prenderemo B = [0, +∞], ossia considereremo misure a valori positivi o infinito, ma sono interessanti e largamente usate anche misure a valori reali o complessi e misure a valori in spazi vettoriali, anche di dimensione infinita (ad esempio in meccanica quantistica si considerano misure a valori nello spazio degli operatori autoaggiunti in uno spazio di Hilbert). Una misura m come sopra, e la famiglia F su cui m è definita, avranno in genere alcune proprietà, che potranno collegare la misura con altre strutture (topologiche, metriche, algebriche) presenti sull’insieme X. Vedremo gradualmente nelle prossime lezioni diversi esempi che chiariranno e preciseranno queste prime affermazioni. Nel seguito di questa sezione inizieremo a pensare informalmente a misure sugli spazi Rn , che catturino le idee intuitive e classiche di lunghezza, area, volume, e ci chiederemo che proprietà vorremmo avere per tali misure − vedremo poi nel seguito del corso cosa sarà possibile dimostrare e sotto quali condizioni. Per semplicità ragioneremo ora sull’area in R2 . Per la lunghezza in R e per il volume in R3 si avranno situazioni analoghe e la generalizzazione a Rn sarà del tutto naturale seguendo l’analogia formale e utilizzando qualche opportuna rappresentazione, anche se non possiamo ‘vedere’ cosa accade in più di tre dimensioni. Una misura, la chiameremo m, che catturi l’idea di area nel piano, la vorremmo definita su tutti i sottoinsiemi del piano e a valori positivi, zero o infinito: m : P(R2 )→[0, +∞] (1) La misura di un segmento S ad esempio dovrà essere zero e la misura di tutto il piano dovrà essere +∞. Ci aspettiamo poi che la misura di un rettangolo R = (a1 , b1 ) × (a2 , b2 ) si ottenga come ‘base per altezza’: m((a1 , b1 ) × (a2 , b2 )) = (b1 − a1 )(b2 − a2 ) (2) Ci aspettiamo inoltre che la misura sia invariante per traslazioni , ossia: m(T (E)) = m(E) , per ogni traslazione T (3) e per trasformazioni ortogonali, ossia: m(U(E)) = m(E) , per ogni trasformazione ortogonale U (4) dove ricordiamo che le trasformazioni ortogonali sono le applicazioni lineari U : R2 →R2 che conservano il prodotto scalare e la distanza standard: (U(v),U(w))R2 = (v, w)R2 ∀v, w ∈ R2 Osserviamo che la proprietà (3) collega la misura con la struttura lineare (o meglio affine) di R2 e indica una ‘compatibilità’ tra le due. Le proprietà (2) e (4) indicano la compatibilità della misura con la struttura ortogonale, e quindi con la struttura metrica. Oltre a queste proprietà appena dette, la misura ne dovrà avere altre che si descrivono in termini soltanto della relazione di inclusione tra insiemi e delle operazioni di unione e intersezione. Per quanto possano parere scontate, queste ultime sono in effetti le proprietà fondamentali che caratterizzano il concetto di misura e, come vedremo, consentono di generalizzarlo a spazi qualsiasi. 5 Monotonia della misura: m(E) ≤ m(F) ∀E ⊂ F , (5) Subadditività: ∀E, F ⊂ R2 (6) ∀E, F ⊂ R2 tali che E ∩ F = 0/ (7) m(E ∪ F) ≤ m(F) + m(F) , Additività: m(E ∪ F) = m(F) + m(F) , Si vede subito che le (5) e (6) insieme sono equivalenti a m(A) ≤ m(F) + m(F) ∀A, E, F ⊂ R2 tali che A ⊂ E ∪ F , (8) e nel seguito troveremo comodo usare questo tipo di monotonia e subadditività combinata. Si vede anche subito che da (6) segue l’analoga proprietà nel caso di tre insiemi: m (E1 ∪ E2 ∪ E3 ) = m E1 ∪ E2 ∪ E3 ≤ m E1 ∪ E2 + m(E3 ) ≤ m(E1 ) + m(E2 ) + m(E3 ) e per induzione si ottiene poi la subadditività finita della misura: m( k [ k )Ek ≤ ∑ m(Ek ) i=1 , ∀Ei ⊂ R2 (9) i=1 Analogamente, da (7) si ottiene l’additività finita per insiemi a due a due disgiunti: m( k [ i=1 k )Ek = ∑ m(Ek ) , ∀Ei ⊂ R2 tali che Ei ∩ E j = 0/ ∀i 6= j (10) i=1 Purtroppo, come vedremo, non è possibile trovare una misura nel piano, che sia invariante per traslazioni e additiva per tutte le coppie di sottoinsiemi disgiunti! Questo è un fatto non difficile da dimostrare, ma delicato, che usa in modo cruciale l’assioma della scelta (si veda ad esempio http://en.wikipedia.org/ wiki/Vitali_set, http://goo.gl/w54N) e ad esso è sostanzialmente equivalente. Dal momento che con l’assioma della scelta si dimostrano tante cose del tutto ragionevoli, ce lo teniamo volentieri per buono anche se di conseguenza dobbiamo rinunciare all’additività su tutte le coppie di insiemi disgiunti. Tuttavia, come vedremo, la via d’uscita da questo problema è ottima: riusciremo comunque a trovare una misura (la misura di Lebesgue) che ha tutte le caratteristiche volute e che è additiva (anzi: numerabilmente additiva in una classe M molto ampia di insiemi, che comprende ad esempio tutti gli insiemi aperti e gli insiemi chiusi del piano, che chiameremo insiemi m-misurabili. Osserviamo che l’additività e la subadditività ci interessano anche nel caso di una unione di infiniti insiemi. 1 1 , j ], dove j = 1, 2, ..., è l’intervallo (0, 1] e l’additività Ad esempio l’unione degli infiniti intervalli E j = ( j+1 funziona benissimo. Occorrerà però limitare il ‘grado’ di infinito delle famiglie di insiemi di cui si fa l’unione. Infatti: si pensi che un quadrato Q del piano si può vedere come l’unione di tutti gli insiemi costituiti ciascuno da un solo punto del quadrato, i quali sono ovviamente a due a due disgiunti Q= [ {x} x∈Q se valesse l’additività anche in questo caso, ne seguirebbe che la misura di Q, che è un numero positivo, sarebbe uguale a una somma di zeri. Ma una somma di zeri, per quanto numerosi, è difficile sostenere che sia un numero positivo3 . D’altra parte il caso che ci interessa è quello di una successione di insiemi, ossia di una famiglia numerabile di insiemi, e vedremo che limitandoci a richiedere l’additività in questo caso, che chiameremo additività numerabile, tutto funzionerà. Presenteremo nelle prossime lezioni una teoria sistematica e per ora diamo un esempio interessante, che utilizzeremo in vario modo nel seguito. 3 Agli inizi del Calcolo si facevano ragionamenti di questo tipo con gli infinitesimi. Tali ragionamenti già allora sembravano poco consistenti e furono dismessi con lo sviluppo del rigore nel corso dell’Ottocento. La situazione è simile a quella di uno dei paradossi di Zenone, che cito molto liberamente: un grano di miglio cadendo non fa rumore, quindi non si sente rumore facendone cadere insieme 2, 3, 4 ecc. , ma quando si arriva a un sacco di miglio, questo cadendo fa rumore! 6 2.3 Insieme di Cantor . Costruiremo una successione di aperti Ek contenuti nell’intervallo [0, 1], che poi toglieremo dall’intervallo stesso per ottenere l’insieme di Cantor C, si confronti con l’esempio 10.19 di G.Greco - Calcolo Differenziale e integrale, volume I. Definiamo per cominciare l’aperto E1 , il lettore segua il discorso con un disegno, come l’intervallo aperto centrale che si ottiene dividendo l’intervallo [0, 1] in tre parti uguali; in altre parole: 1 2 , 3 3 E1 = Consideriamo poi i due segmenti S1 = [0, 31 ) e S2 = ( 23 , 1] che si ottengono togliendo E1 da [0, 1]; dividiamo ciascuno di tali segmenti in tre intervalli uguali, e in ciascuno di questi prendiamo l’intervallo aperto centrale. Facciamo l’unione di questi due intervalli centrali e otteniamo l’insieme E2 := 1 2 7 8 ∪ , , 9 9 9 9 Per continuare la costruzione togliamo E1 ∪ E2 da [0, 1] e troviamo quattro intervalli. In ciascuno di essi prendiamo il terzo centrale e di questi facciamo l’unione E3 := 1 2 7 8 18 19 25 26 , ∪ , ∪ , ∪ , 27 27 27 27 27 27 27 27 Proseguendo ulteriormente, costruiamo insiemi Ek , ognuno dei quali è unione di 2k−1 intervalli disgiunti, ciascuno di lunghezza 3−k . Pertanto, detta λ la misura di lunghezza che vorremmo avere definita sulle parti di R, avremo, per additività: 2k−1 λ(Ek ) = k 3 Se consideriamo infine l’aperto [ E := Ek k∈N poiché anche gli insiemi Ek sono due a due disgiunti, per l’additività numerabile avremo ∞ λ(E) = 1 ∞ 2 1 1 ∑ λ(Ek ) = 3 ∑ ( 3 )k = 3 · 1 − 2 k=1 k=0 =1 3 A questo punto chiamiamo insieme di Cantor l’insieme C := [0, 1]/E e osserviamo che per l’additività della misura λ abbiamo λ(C)+λ(E) = λ1 ([0, 1]) = 1, da cui segue λ1 (C) = 0. Pur essendo un insieme di misura nulla, l’insieme di Cantor, come vedremo, ha la stessa cardinalità di R, che è maggiore della cardinalità di N. A partire dall’insieme di Cantor si può costruire una funzione u : [0, 1]→[0, 1] detta funzione di Cantor o anche funzione di Cantor-Vitali, che ha le seguenti proprietà: i) u è monotona crescente; ii) u è continua; iii) u è derivabile in ogni punto dell’aperto E definito sopra e ha derivata zero in tutti i punti di E. La funzione di Cantor-Vitali è un po’ imbarazzante (o impressionante): riesce a salire da zero a 1 ‘senza farsi vedere’... se uno guarda un punto a caso dell’intervallo di definizione troverà che non sta crescendo... la derivata è quasi sempre zero. Si suggerisce di provare per esercizio a costruire questa funzione. Per ulteriori informazioni si rimanda a http://en.wikipedia.org/wiki/Cantor_function(la pagina inglese è leggermente più completa di quella italiana) e ad altre fonti facilmente reperibili in rete. 7 3 Lezione − venerdı̀ 21 settembre 2012 10.30 - 12.30 (2 ore) Prime definizioni del concetto di integrale 3.1 Area e volume nel Seicento prima del Calcolo Anche in seguito alla pubblicazione a stampa dell’opera allora conosciuta di Archimede, avvenuta a Basilea nel 1543, tra la fine del Cinquecento e l’inizio del Seicento, in particolare in Italia, si svilupparono gli studi sul volume dei solidi, sul calcolo del centro di massa di un solido e sul calcolo dell’area di figure sottese al grafico di una funzione. L’argomento attirava molta attenzione e anche Johannes Kepler e Galileo Galilei diedero contributi, non però di speciale importanza: Keplero scrive nel 1615 un trattato sul volume delle botti per il vino e Galileo scrive intorno al 1600 un trattato sul centro di gravità, che sarà pubblicato soltanto molto più tardi come appendice al Discorsi e dimostrazioni matematiche sopra due nuove scienze. Importanti contributi furono dati invece da Bonaventura Cavalieri, che intorno al 1630 ebbe l’idea di determinare l’area di una figura piana o solida attraverso le sezioni della figura con la famiglia di tutte le rette parallele a una retta data, o con la famiglia di tutti i piani paralleli a un piano dato. Con questa idea, che ritroveremo e utilizzeremo in diverse forme nella teoria dell’integrazione, ad esempio nelle formule di riduzione per gli integrali multipli (o Teorema di Fubini) e che va sotto il nome di metodo degli indivisibili, Cavalieri ottenne il seguente risultato, che enunciamo in linguaggio moderno: Principio di Cavalieri Siano A, B due sottoinsiemi dello spazio euclideo e sia F la famiglia di tutti i piani paralleli a un piano dato. i) Se per ogni piano P ∈ F gli insiemi A ∩ P e B ∩ P sono uguali, allora anche A e B sono uguali; ii) se per ogni piano P ∈ F gli insiemi A ∩ P e B ∩ P stanno in un certo rapporto, allora anche A e B stanno nello stesso rapporto. Cavalieri diede tale enunciato come Teorema, ma la sua dimostrazione non soddisfaceva i matematici più rigorosi del tempo, che ne criticarono il fondamento. In ogni modo, con questa tecnica Cavalieri ottenne molti risultati nuovi sul volume dei solidi e ottenne anche una importante formula di quadratura per l’area sottesa dal grafico delle funzioni y = xn , la cui dimostrazione fu migliorata e completata da altri matematici del tempo come come Pierre de Fermat, René Descartes, Gilles de Roberval. Enunciamo anche questo risultato con linguaggio moderno. Teorema 3.1.1 L’area sottesa dal grafico della funzione y = xn nell’intervallo [0, a], dove a è un numero Z a an+1 an+1 . In altre parole xn dx = . positivo, è n+1 n+1 0 In quello stesso momento, dopo la pubblicazione della Géometrie di Descartes, i matematici erano molto interessati anche al cosiddetto problema delle tangenti, ossia il problema di determinare l’equazione della retta tangente a una curva di equazione data. A questo problema furono date diverse soluzioni da Descartes, Fermat, Roberval, Evangelista Torricelli, in particolare anche per le curve di equazione y = xn . In questo contesto di ricerche, verso la metà del secolo XVII, diversi matematici, in particolare James Gregory (che aveva studiato a Padova con Stefano Degli Angeli, allievo di Cavalieri), Isaac Barrow, Isaac Newton, si xn+1 resero conto in vario modo di un fatto interessante: la funzione , che esprime l’area sotto il grafico n+1 n n di x nell’intervallo [0, a], nel punto di ascissa x = a ha pendenza a , ossia (ci permettiamo di usare un linguaggio che allora non era noto, ma sarebbe stato inventato poco dopo): Z x d t n dt = xn (11) dx 0 In altri termini si ha F 0 (x) = xn Z x , dove si è introdotta la notazione F(x) = 0 t n dt per la funzione integrale della funzione y = xn . Questo risultato altro non è che il Teorema Fondamentale del Calcolo per le funzioni del tipo y = xn , da cui si può ottenere il Teorema Fondamentale del Calcolo per i polinomi. Da qui alle serie di potenze il passo non era cosı̀ lungo . . . il terreno era pronto per la nascita del Calcolo differenziale e integrale, che si ebbe nella seconda metà del secolo XVII grazie a Isaac Newton e Gottfried Wilhelm Leibniz. Le nozioni di derivata e integrale introdotte da Newton e Leibniz furono potentissimi strumenti sia per il calcolo, sia per pensare e descrivere il mondo fisico e, nonostante le incertezze dovute alla vaghezza 8 dei fondamenti e dei ragionamenti con gli infinitesimi e gli infiniti, consentirono ai matematici del Settecento (la famiglia Bernoulli, Euler, D’Alembert, Lagrange . . . ) di ottenere risultati strabilianti. Ma gradualmente, anche a causa delle contraddizioni in cui cadevano talvolta anche i matematici più insigni, emerse la necessità di rendere più chiari i fondamenti e più rigorose le dimostrazioni del Calcolo e di pervenire a una Analisi Matematica su cui non vi fossero più dubbi. All’inizio dell’Ottocento questa tendenza crebbe di importanza e portò man mano a una revisione e fondazione dei concetti di limite, continuità, derivata, integrale, serie, che furono appoggiati su una teoria dei numeri reali, a sua volta costruita a partire dall’aritmetica, dai numeri naturali e dalla teoria degli insiemi, la quale ebbe infine una sistemazione assiomatica con lo sviluppo della logica all’inizio del secolo XX. Uno fra i primi momenti importanti di questo processo furono le Lezioni di Analisi di Augustin Louis Cauchy all’École Politéchnique di Parigi, nelle quali si trova in particolare la prima definizione di integrale per una classe di funzioni, le funzioni continue su un intervallo chiuso e limitato (Résumé des Leçons données à l’École Royale Polytecnique sur le calcul infinitésimal 1823 - Ouvres Compl. 2 serie IV, lez. 21 p. 122-127 http://gallica.bnf.fr/ark:/12148/bpt6k90196z/f125n6.capture). 3.2 L’integrale di Cauchy Sia [a, b] un intervallo chiuso e limitato di numeri reali e sia data una funzione f : [a, b]→R . Per ogni numero naturale n ∈ N consideriamo il numero n S( f , n) := ∑ f (x j )(x j − x j−1 ) (12) j=1 dove xj = a+ j b−a n ∀ j = 0, 1, . . . n b−a . n Il numero S( f , n) si chiama somma di Cauchy relativa alla funzione f e alla partizione {x0 , x1 , . . . x j , . . . xn } dell’intervallo [a, b]. Cauchy dimostrò4 il seguente Osserviamo che x0 = a e xn = b e che gli intervalli [x j−1 , x j ] hanno tutti la stessa lunghezza Teorema 3.2.1 Integrale secondo Cauchy Per ogni funzione continua f : [a, b]→R esiste il lim S( f , n) (13) n→+∞ Z b Il valore del limite (27) viene chiamato integrale della funzione f sull’intervallo [a, b] e si denota f (x)dx a o anche semplicemente Rb a f. Dimostrazione. Diamo qui uno schema della dimostrazione del Teorema precedente e suggeriamo agli studenti di completare i dettagli, poiché è un eccellente esercizio, che consente di mettere alla prova competenze fondamentali di analisi, che dovrebbero essere state sviluppate nel primo anno di studi, e di ripassare alcuni importanti fatti di base sugli spazi metrici e sulle funzioni continue. Per comodità raccogliamo tali fatti nella successiva sezione 3.3. Passo 1. Si osserva che l’intervallo chiuso e limitato [a, b] è un insieme compatto (Teorema 3.3.7 di Bolzano-Weierstrass. Passo 2. La funzione f , che (per ipotesi) è continua [a, b] , è anche uniformemente continua su [a, b] (Teorema 3.3.10). Passo 3. Grazie alla uniforme continuità di f , con un po’ di lavoro si riesce a vedere che la successione S( f , n) è una successione di Cauchy, come in (25). Passo 4. Poiché la successione S( f , n) è di Cauchy, grazie alla completezza dello spazio metrico dei numeri reali (si veda l’esercizio 3.3.16 e la proposizione che viene poco dopo l’esercizio), il limite (27) esiste e la dimostrazione è conclusa. È opportuno fare diverse osservazioni. 4 In effetti la dimostrazione che si trova nell’opera citata non è totalmente chiara nell’uso e nella precisa distinzione dei concetti di continuità e di continuità uniforme, ma la cosa a nostri fini è irrilevante. 9 Osservazione 3.2.2 Le somme di Cauchy si possono costruire anche in altri modi più generali. Ad esempio per ogni n ∈ N si può considerare una partizione {x0 , x1 , . . . x j , . . . xn } , dove a = x0 < x1 < x2 < . . . x j−1 < x j < . . . xn = b (14) costituita da punti non necessariamente equidistanti. Anche in questo caso si può dimostrare che il limite (27) esiste, purché le partizioni scelte soddisfino alla condizione lim max |x j − x j−1 | = 0 n→+∞ (15) j la quale garantisce che i punti delle partizioni si infittiscano dappertutto nell’intervallo [a, b]. Si può dimostrare, con le stesse idee precedenti, che il limite (27) esiste anche se nelle somme di Cauchy a ciascuno dei valori f (x j ) si sostituisce un valore f (ξ j ) calcolato in un punto qualsiasi ξ j ∈ [x j−1 , x j ]. Osservazione 3.2.3 Si dimostra immediatamente che l’integrale definito nel Teorema 3.2.1 è un funzionale lineare sullo spazio vettoriale C0 ([a, b]), ossia Z b Z b ( f + g) = a Z b f+ a Z b g Z b tf = t e a a f ∀t ∈ R ∀ f , g ∈ C0 ([a, b]) (16) a Basta infatti osservare che S( f , n) è lineare rispetto a f per ogni n fissato e passare al limite per n che va all’infinito. Analogamente si vede che l’integrale è monotono (o positivo): Z b a f ≤ Z b g ∀ f , g ∈ C0 ([a, b]) tali che f ≤g (17) a Inoltre si mostra facilmente che se c ∈ [a, b], allora Z b Z c f= a Z b f+ a f c Osservazione 3.2.4 La nozione di integrale introdotta da Cauchy si estende immediatamente a funzioni che sono continue a tratti su un intervallo [a, b], ossia che sono continue su ciascuno degli intervalli [tk−1 ,tk ] di una partizione fissata t0 ,t1 , . . .tn di [a, b]: basta infatti sommare gli integrali in ciascuno dei sotto-intervalli. L’integrale si può estendere inoltre a funzioni non limitate o definite su un intervallo non limitato [c, d], prendendo il limite, se esiste, degli integrali su sottointervalli chiusi e limitati che invadono l’intervallo [c, d]. Non si riescono però a integrare funzioni con infiniti punti di discontinuità. 3.3 Richiami su spazi metrici, funzioni continue, norme, prodotto scalare. In questa sezione raccogliamo per comodità del lettore alcune definizioni, notazioni e teoremi che abbiamo citato nella sezione precedente e che useremo in diversi momenti del corso. Cogliamo anche l’occasione per suggerire alcuni esercizi che intendono aiutare gli studenti ad approfondire questioni che troveremo più avanti nel corso. Definizione 3.3.1 Sia X un insieme. Ricordiamo che si dice distanza su X una funzione d : X × X→R tale che ∀x, y ∈ X si ha i) d(x, y) ≥ 0; ii) d(x, y) = d(y, x); iii) d(x, y) ≤ d(x, z) + d(y, z); iv) d(x, y) = 0 ⇒ x = y. Un insieme X con una distanza d si chiama spazio metrico. Ricordiamo che: se d è una distanza su X, x ∈ X e r > 0 , allora l’insieme Br (x) = {y ∈ X d(x, y) < r} si chiama palla (aperta) di centro x e raggio r rispetto alla distanza d. Ricordiamo anche che un sottoinsieme A di X si dice aperto, se per ogni x ∈ X esiste un numero r > 0 tale che Br (x) ⊂ A; un sottoinsieme F si dice chiuso se il suo complementare F c := X \ F è un insieme aperto. La famiglia degli aperti di uno spazio metrico è una topologia, che si dice indotta dalla distanza. Già nella sezione 2.1 abbiamo visto la distanza euclidea standard nel piano e le palle aperte rispetto a questa distanza. Vediamo ora qualche generalizzazione e altri esempi. Negli spazi vettoriali sono di particolare interesse le distanze invarianti per traslazioni. Distanze di questo tipo si ottengono tipicamente partendo da una norma. 10 Definizione 3.3.2 Si dice norma su uno spazio vettoriale reale V una funzione || || : V →R || || : u 7→ ||u|| ; tale che i) ||u|| ≥ 0 ii) ||tu|| = |t| · ||u|| iii) ||u + v|| ≤ ||u|| + ||v|| iv) ||u|| = 0 comunque preso u in V ; comunque presi u in V e t in R (la norma è positivamente omogenea); comunque presi u, v in V (la norma è subadditiva); se e solo se x = y. Uno spazio V sul quale sia data una norma si chiama spazio normato. Si vede immediatamente che, se || || è una norma su V , allora la funzione d(u, w) = ||u − w|| è una distanza, che si dice indotta dalla norma. Tale distanza è invariante per traslazioni, ossia d(u, w) = d(u + a, w + a) ∀u, w, a ∈ V Esercizio 3.3.3 Trovare una distanza in R2 tale che le palle rispetto ad essa siano intervalli 2-dimensionali (gli intervalli sono definiti nella sezione 2.1). Esercizio 3.3.4 Sia [a, b] un intervallo chiuso e limitato in R. Si mostri che le funzioni definite sotto sono norme sullo spazio vettoriale C0 ([a, b]). k f k∞ = max | f (x)| (18) [a,b] k f k1 = k f k2 = Z b | f (x)|dx (19) a b Z | f (x)|2 dx 12 (20) a Un’importante famiglia di norme si ottiene dai prodotti scalari. Ricordiamo che Definizione 3.3.5 Un prodotto scalare g su uno spazio vettoriale reale V è una funzione g : V × V →R tale che5 i) g è lineare in ciascuna delle variabili, tenendo l’altra fissata (g è una funzione bilineare); ii) g(u, w) = g(w, u) iii) g(u, u) ≥ 0 iv) g(u, u) = 0 comunque presi u, w vettori di V (g è una funzione simmetrica); per ogni vettore u di V ; ⇒ u = 0. Si vede facilmente che (verificare per esercizio): Se g è un prodotto scalare su V , allora le funzioni p ||u||g := g(u, u) ; dg (u, w) = ||u − w||g sono rispettivamente una norma e una distanza su V , che si dicono associate al prodotto scalare g. Esercizio 3.3.6 Mostrare che, prese due norme qualsiasi k k] e k k[ su Rn , esistono due numeri positivi a, b tali che kwk] ≤ akwk[ ≤ bkwk] ∀w ∈ Rn e che, di conseguenza, tutte le topologie indotte da una norma su Rn sono tra loro equivalenti. 5 Alcuni autori non includono la proprietà iv) nella definizione e, se iv) è pure verificata, dicono che il prodotto scalare è ‘definito positivo’; in questa sede, per semplicità, includeremo iv) nella definizione e per noi tutti i prodotti scalari saranno ‘definiti positivi’. 11 Vediamo ora alcuni risultati che riguardano la compattezza, una proprietà topologica di speciale importanza per l’analisi matematica. Ricordiamo che un sottoinsieme K di uno spazio metrico (X, d) si dice compatto se per ogni successione {x j } di elementi di K esistono una sottosuccessione {x j p } e un elemento y di K tali che lim x j p = y ossia lim d(x j p , y) = 0 p→+∞ p→+∞ Ricordiamo anche il seguente ben noto teorema Teorema 3.3.7 Teorema di Bolzano-Weierstrass. Un sottoinsieme di Rn è compatto (rispetto alla topologia indotta dalla distanza euclidea standard) se e solo se è chiuso e limitato. Per la dimostrazione in dimensione 1 rimandiamo al libro di G.Greco citato nella prima lezione. Il caso n-dimensionale si ottiene immediatamente dal caso 1-dimensionale estraendo via via sottosuccessioni per le quali converge la prima coordinata, poi la seconda, etc . . . . Definizione 3.3.8 Siano dati due spazi metrici X e Y con le distanze dX e dY . Ricordiamo che una funzione f : X → Y si dice continua in un punto a ∈ X se ∀ε>0 ∃δ>0 : dX (a, x) < δ ⇒ dY ( f (a), f (x)) < ε (21) La funzione f si dice continua su un sottoinsieme E ⊂ X se è continua in ciascun punto di E. La funzione f si dice uniformemente continua su X se ∀ε>0 ∃δ>0 : ∀a, b ∈ X dX (a, b) < δ ⇒ dY ( f (a), f (b)) < ε (22) La funzione f si dice uniformemente continua su un sottoinsieme E ⊂ X se la restrizione di f a E è uniformemente continua su E considerato come sottospazio metrico di X. È evidente che una funzione f uniformemente continua su E è anche continua su E, e non vale invece l’implicazione opposta. √ Esercizio 3.3.9 Mostrare che le funzioni x, sin x, x sono uniformemente continue sul loro insieme di definizione, mentre la funzione x2 non è uniformemente continua su R e la funzione 1/x non è uniformemente continua sull’intervallo (0, 1). Teorema 3.3.10 Siano X e Y spazi metrici e sia f : X → Y . Se E ⊂ X è un insieme compatto e f è continua su E, allora f è uniformemente continua su E. Dimostrazione. (Per assurdo) Supponiamo che la tesi del teorema sia falsa. Allora vale la negazione della (22): ∃ ε > 0 : ∀ δ > 0 ∃u, v ∈ E : distX (u, v) < δ ⇒ distY ( f (u), f (v)) ≥ ε (23) e in particolare ne segue che esiste un ε > 0 tale che, per ogni n ∈ N, esistono un e vn in E per i quali valgono entrambe: 1 (i) dX (un , vn ) < , (ii) dY ( f (un ), f (vn )) ≥ ε n Poiché E è compatto, esiste una sottosuccessione unk che converge a un punto u ∈ E, ossia dX (unk , u) → 0 per k → ∞. Ne segue che anche vnk converge a u, infatti dX (u, vnk ) ≤ dX (u, unk ) + dX (unk , vnk ) → 0. Poiché f è continua su E, entrambe le successioni f (unk ) e f (vnk ) convergono a f (u) e questo implica che dY ( f (unk ), f (vnk )) → 0, che contraddice la (ii). Cosı̀ la prova è conclusa. Dal teorema segue in particolare che ogni funzione continua su un intervallo chiuso e limitato di R è uniformemente continua. Classi naturali di funzioni uniformemente continue si ottengono richiedendo la proprietà che la distanza fra le immagini di ogni coppia punti sia controllata da una funzione della distanza tra i punti. Il caso più semplice è il seguente. 12 Definizione 3.3.11 Siano X e Y spazi metrici. Una funzione f : X → Y si dice Lipschitz-continua o semplicemente lipschitziana se ∃L≥0 : ∀a, b ∈ X dY ( f (u), f (v)) ≤ LdX (u, v). (24) Se vale la (24) allora si dice che il numero L è una costante di Lipschitz per la funzione f . Si vede facilmente (dimostrarlo per esercizio) che l’insieme delle costanti di Lipschitz di una funzione f ha minimo. Questo minimo si denota talvolta Lip( f ). Una funzione f : X → Y si dice lipschitziana su un sottoinsieme E ⊂ X se la restrizione di f a E è lipschitziana su E considerato come sottospazio metrico di X. Esercizio 3.3.12 Se f è lipschitziana su uno spazio metrico X allora è immediato che f è uniformemente continua su X. Esistono invece funzioni uniformemente continue su X che non sono lipschitziane su X . Trovare un esempio nel caso X = [0, 1]. Esercizio 3.3.13 Sia I è un intervallo in R e sia f : I → R continua e derivabile su I. Se f 0 è limitata su I allora f è lipschitziana su I e precisamente si ha Lip( f ) = supI | f 0 | Una conseguenza immediata dell’esercizio precedente è che le funzioni sin x, cos x, arctan x sono lipschitziane su R, con costante di Lipschitz uguale a 1. Concludiamo i richiami con la nozione di completezza di uno spazio metrico. Definizione 3.3.14 Sia X uno spazio metrico con una distanza d. Una successione (xn ) a valori in X si dice di Cauchy se ∀ε > 0 ∃k ∈ N : p, r > k ⇒ d(x p , xr ) < ε (25) Ricordiamo che una successione (xn ) a valori in X converge (o è convergente) se esiste un elemento y ∈ X tale che lim xn = y, ossia d(xn , y) → 0. n→∞ È immediato che se una successione in X converge, allora è di Cauchy. Non è vero invece in generale che se una successione è di Cauchy allora essa è convergente, ma vi sono spazi nei quali ciò accade sempre. Definizione 3.3.15 Uno spazio metrico nel quale ogni successione di Cauchy converge si dice completo. Esercizio 3.3.16 (i) Mostrare che gli spazi Rn sono completi rispetto alla distanza euclidea. (ii) Mostrare che l’intervallo aperto (0, 1) e l’insieme Q dei numeri razionali, con la metrica indotta da R, non sono spazi metrici completi. Esercizio 3.3.17 Mostrare che ogni successione di Cauchy è limitata, ossia esiste una palla Br (x) che contiene tutti gli elementi della successione. Il seguente semplice risultato, insieme all’esercizio precedente e al teorema di Bolzano-Weierstrass, dimostra che gli spazi Rn sono completi. Proposizione 3.3.18 Se una successione di Cauchy (xn ) in X ha una sottosuccessione (xnk ) convergente, allora (xn ) converge. Dimostrazione. Chiamiamo y ∈ X il limite della sottosuccessione (xnk ). Sia ε > 0 e sia k corrispondente a ε come in (25). Poiché lim nk = ∞ e lim d(xnk , y) = 0 si può trovare un s ∈ N tale che k→∞ k→∞ ns ≥ k d(xns , y) < ε e Per ogni p ≥ k si ha allora d(x p , y) ≤ d(x p , xns ) + d(xns , y) < 2ε e la prova è conclusa. 13 3.4 L’integrale di Cauchy per funzioni di due variabili e le formule di riduzione Siano dati due intervalli 1-dimensionali [a, b] e [c, d] e consideriamo l’intervallo 2-dimensionale E = [a, b] × [c, d]. Sia poi f : E→R una funzione continua. Vogliamo definire l’integrale di f su E usando la stessa idea con cui nella sezione precedente abbiamo definito l’integrale per le funzioni di una variabile. A questo fine, comunque presi n, k ∈ N, consideriamo le partizioni (il lettore faccia un disegno...): xi = a + i b−a n ∀i = 0, 1, . . . n yj = a+ j ; c−d k ∀ j = 0, 1, . . . k che si ottengono dividendo [a, b] in n parti uguali e [c, d] in k parti uguali, e consideriamo la somma di Cauchy n k S( f , n, k) := ∑ ∑ f (xi , y j )m(Ri j ) (26) i=1 j=1 b−a d −c dove Ri j = [xi − xi−1 ] × [y j − y j−1 ] e m(Ri j ) = è l’area del rettangolo Ri j . Ciascun termine · n k della somma (26) è il volume di un parallelepipedo che ha come base il rettangolino Ri j e come altezza il valore della funzione in uno dei vertici del rettangolino stesso. Con le stesse idee indicate nella sezione precedente si può dimostrare anche il seguente Teorema 3.4.1 Per ogni funzione continua f : E→R esiste il lim S( f , n, n) (27) n→+∞ Z f (x)dxdy Il valore del limite (27) viene chiamato integrale della funzione f sull’insieme E e si denota o anche semplicemente E R E f. Grazie alla uniforme continuità di f su E si può anche dimostrare che lim lim S( f , n, k) = lim S( f , n, n) = lim lim S( f , n, k) k→+∞ n→+∞ n→+∞ n→+∞ k→+∞ (28) Usando la (26), l’ultimo limite doppio a destra nella formula precedente si può riscrivere come segue n lim lim S( f , n, k) = lim lim n→+∞ k→+∞ n lim n→+∞ n→+∞ k→+∞ k ∑ i=1 lim ∑ k→+∞ j=1 f (xi , y j ) d −c k ! n→+∞ ∑ ∑ f (xi , y j ) i=1 j=1 n b−a = lim ∑ n→+∞ n i=1 n lim k ∑ H(xi ) i=1 b−a = n b−a d −c · = n k Z d c b−a f (xi , y)dy = n Z b H(x)dx a Z d dove nel penultimo passaggio si è posto H(x) = f (x, y)dy e nel terz’ultimo passaggio si è usata la c definizione di integrale secondo Cauchy della funzione H(x) (che è continua su [a, b]), ossia il fatto che k ∑ f (xi , y j ) k→+∞ lim j=1 d −c = k Z d c f (xi , y)dy per ogni i = 1, 2, . . . n fissato. Un risultato analogo vale per il doppio limite a sinistra nella (28) e complessivamente si ottiene cosı̀ Z Z b Z d Z d Z b f (x, y)dxdy = f (x, y)dy dx = f (x, y)dx dy (29) E a c c a Le formule (29) si chiamano formule di riduzione per gli integrali di funzioni di due variabili e sono un importante strumento per il calcolo e per la teoria. Ne vedremo diverse generalizzazioni e applicazioni. 14 4 Lezione − lunedı̀ 24 settembre 2012 10.30 - 12.30 (2 ore) Primi esercizi sugli integrali 4.1 Primi esercizi sugli integrali di funzioni di due variabili e sul volume dei solidi Ricordiamo che se X è un insieme ed E è un sottoinsieme di X, si dice funzione caratteristica di E la funzione 1 se x ∈ E ϕE : X→R , ϕE (x) = 0 se x ∈ /E Scriviamo ora in una forma generale la formula di riduzione per gli integrali di funzioni di due variabili, che è stata illustrata nella lezione precedente nel caso di funzioni definite su un rettangolo6 . Formula di riduzione per gli integrali doppi. Sia f : R2 →R una funzione integrabile (il termine sarà precisato assai più avanti), allora si ha Z Z Z Z Z f (x, y)dxdy = f (x, y)dy dx = f (x, y)dx dy (30) R2 Rx Ry Ry Rx Noi costruiremo la nostra teoria dell’integrazione in modo che la misura k-dimensionale mk di un insieme misurabile E ⊂ Rk sia uguale all’integrale della sua funzione caratteristica ϕE Z mk (E) = E ϕE dmk Pertanto la (30), nel caso particolare in cui si integri una funzione caratteristica f = ϕE diventa Z Z Z Z ϕEx (y)dy dx = lunghezza(Ex )dx area(E) = ϕE (x, y)dxdy = R2 Ry Rx (31) Rx dove: per ogni a ∈ R, Ea := {y ∈ R (a, y) ∈ E} è la sezione dell’insieme E con la retta di equazione x = a; si è scritto area(E) in vece di m2 (E) e lunghezza(Ex ) in vece di m1 (Ex ). Formule analoghe alle precedenti valgono in R3 e in Rn e le consideriamo tutte quante come una versione moderna del Principio di Cavalieri. Come esempio scriviamo esplicitamente alcune formule di riduzione in dimensione 3. Formule di riduzione per gli integrali tripli. Sia f : R3 →R una funzione integrabile, allora si ha ! Z Z Z Z Z R3 f (x, y, z)dxdy = f (x, y, z)dz dxdy = R2xy Rz Z Rx Z Z Ry f (x, y, z)dydz dx = f (x, y, z)dz dy dx = Rx R2yz Rz L’ordine in cui si integra successivamente nelle tre variabili x, y, z può essere scelto arbitrariamente. In diverse situazioni è necessario valutare quale ordine sia il più comodo e, come vedremo, si possono ottenere interessanti informazioni uguagliando le integrazioni ripetute in ordine diverso. Svolgiamo ora alcuni esercizi per illustrare il significato e l’uso delle formule di riduzione. Esercizio 4.1.1 Sia a > 0. Il cerchio di raggio a e centro l’origine è l’insieme Ba = {(x, y) ∈ R2 x2 + y2 ≤ a2 } Per il Principio di Cavalieri (o meglio, per il Teorma di Fubini), l’area di Ba è √ ! Z Z Z a Z a2 −x2 ϕBa (x, y)dy dx = area(Ba ) = ϕBa (x, y)dxdy = √ R2 −a − a2 −x2 a p 2 a2 − x2 dx −a 6 Anche se questa formula sarà enunciata precisamente come Teorema di Fubini e dimostrata soltanto verso la fine del corso, la possiamo utilizzare fiduciosamente nei casi che verranno proposti come esercizio. 15 Con la sostituzione x = t e poi con la sostituzione t = sin u si ottiene a Z a p a2 − x2 dx = 2a2 Z −a π 2 cos2 udu 0 e l’ultimo integrale si può calcolare ad esempio ricordando che cos(2x) = cos2 x − sin2 x = 2 cos2 x − 1, oppure per parti (scrivendo cos2 x = cos x · cos x). Si ottiene cosı̀ π 1 1 1 π area(Ba ) = 4a2 [ x − sin x cos x]02 = 4a2 · · = a2 π 2 2 2 2 Esercizio 4.1.2 Vogliamo calcolare l’integrale π 2 Z cosn (x)dx 0 che si incontra nel calcolo del volume della palla n-dimensionale. Cominciamo da un caso particolare e cerchiamo la primitiva della funzione cos4 x. Proponiamo due strade. Ecco la prima: Z Z cos4 xdx = cos2 x(1 − sin2 x)dx = Z cos2 xdx − 1 2 Z sin(2x)dx = etc... Ed ecco la seconda, per parti: Z cos4 xdx = Z cos3 x cos xdx = Possiamo cosı̀ calcolare Z π 2 1 3 cos3 x sin x + 4 4 cos4 (x)dx = 0 Z cos2 xdx 3 π 16 Vediamo ora il caso generale. Posto Z cosn xdx In = si ha, integrando per parti e ricordando che sin2 x = 1 − cos2 x Z In = n−1 cos n−1 x cos xdx = cos sin x + (n − 1) Z cosn−2 x sin2 xdx = cosn−1 sin x + (n − 1)In−2 − (n − 1)In da cui si ottiene la formula ricorsiva In = 1 n−1 cosn−1 sin x + In−2 n n Si osservi che per n = 2 e n = 4 si ritrovano i casi particolari visti sopra. In modo analogo, il calcolo si lascia come esercizio, si ottiene la primitiva della funzione sinn x Z 1 n−1 sin xdx = − sinn−1 cos x + n n n Z sinn−2 xdx Esercizio 4.1.3 Calcoliamo la misura della palla n-dimensionale di raggio 1 in Rn . Come vedremo, e come si intuisce, il volume della palla n-dimensionale di raggio R si ottiene moltiplicando per Rn il volume della palla di raggio 1. Per n = 3, affettando ad esempio con i piani z = t si ha Z 1 vol3 (B1 ) = 2 0 area(Et )dt dove Et = {(x, y) ∈ R2xy (x, y, z) ∈ E} = {(x, y) ∈ R2xy x2 + y2 ≤ 1 − t 2 } Abbiamo quindi Z 1 vol3 (B1 ) = 2 0 4 π(1 − t2 )dt = π 3 16 Calcoliamo ora la misura 4-dimensionale della palla di raggio 1 in R4 . In modo analogo al caso precedente si ha Z 1 vol4 (B1 ) = 2 vol3 (Et )dt 0 dove Et = {(x, y, z) ∈ R3xyz (x, y, z, w) ∈ E} = {(x, y, z) ∈ R3xyz x2 + y2 + z2 ≤ 1 − t 2 } Abbiamo quindi vol4 (B1 ) = 2 Z 1 4 3 π(1 − t2 ) 2 dt 0 3 Con la sostituzione t = sinu e ricordando l’esercizio precedente si trova infine 8 vol4 (B1 ) = π 3 Z π 2 8 3 π2 cos4 udu = π · π = 3 16 2 0 Si lascia per esercizio di calcolare la misura delle palle di dimensione 5 e 6 e di trovare una formula generale per le palle di dimesione n (ci sono formule differenziate per n pari e n dispari, si trovano ad esempio sul libro Analisi matematica 2 di Enrico Giusti. Esercizio 4.1.4 Si consideri il triangolo T in R2 di vertici (0, 0), (1, 3), (4, 0). Si calcolino i seguenti integrali Z Z 1 1 xdxdy , ydxdy area(T ) T area(T ) T Come vedremo meglio nella prossima lezione, questi integrali danno le coordinate del baricentro del triangolo T . Ecco infine tre esercizi, non svolti a lezione, che sono stati assegnati nella prima provetta di Analisi Matematica III dell’anno accademico 2011-12. Di questi esercizi è riportata la risoluzione, ma si consiglia agli studenti di leggerla solamente dopo aver affrontato gli esercizi autonomamente. Esercizio 4.1.5 Calcolare l’integrale Z xydxdy E dove E = (x, y) ∈ R2 0 ≤ y ≤ −x2 + 2x . Si vede subito che il grafico della funzione y = −x2 + 2x = x(−x + 2) sta sopra l’asse x nell’intervallo (0, 2). Si ha quindi Z Z 2 Z −x2 +2x Z 1 2 8 xydxdy = xdx ydy = x(−x2 + 2x)2 = 2 0 15 E 0 0 Esercizio 4.1.6 Calcolare il baricentro dell’insieme A = C \ F dove C = (x, y) ∈ R2 1 ≤ x2 + y2 ≤ 4 , F = (x, y) ∈ R2 x < 0, y < 0 L’area dell’insieme A è area(A) = 43 (4π − π) = xG = 1 area(A) 9π 4 . Z xdxdy = A La coordinata xG del baricentro è 4 3π Z 2 1 ρ2 dρ Z π − π2 cos θdθ = 28 27π e yG = xG per ragioni di simmetria. Esercizio 4.1.7 Si calcoli il volume dell’insieme U di R3 che si ottiene come intersezione della palla di raggio 1 e centro l’origine con il semispazio z ≥ 1 + x. √ La sezione del piano z = x + 1 con la palla unitaria è un cerchio che ha distanza 22 dall’origine (si disegni la sezione di U con il piano xz) quindi, ruotando opportunamente l’insieme U, si ottiene la parte di palla √ unitaria e centro l’origine che sta sopra la quota z = 22 . Affettando ora rispetto alla variabile z si ottiene il volume cercato: Z 1 √ π z3 1 vol(U) = √2 π(1 − z2 )dz = π[z − ] √2 = (8 − 5 2) 3 2 12 2 17 5 Lezione − giovedı̀ 27 settembre 2012 14.30 - 16.30 (2 ore) Esercizi 5.1 Centro di massa. Consideriamo due punti P1 = (x1 , y1 ) e P2 = (x2 , y2 ) in R2 e pensiamo a un sistema di masse costituito da due masse m1 , m2 collocate rispettivamente nei punti P1 e P2 . Si chiama centro di massa, o baricentro, del sistema il punto G = (xG , yG ) definito da xG = m1 x1 + m2 x2 m1 + m2 ; yG = m1 y1 + m2 y2 m1 + m2 (32) Il centro di massa G è caratterizzato dalla proprietà che: per qualsiasi vettore u del piano, è nullo il momento totale M, rispetto al punto G , delle due forze: F1 = m1 v, applicata in P1 , e F2 = m2 v, applicata in P2 . Per vedere questo basta ricordare che il momento di una forza F, applicata in un punto P1 , rispetto a un punto generico P = (x, y) è M = (P1 − P) × F, dove si usa la notazione 1 v w1 v × w := det (33) v2 w2 per il prodotto vettoriale di due vettori v e w7 . Si ha pertanto che il momento totale M delle forze F1 = m1 u, F2 = m2 u come sopra, rispetto a un punto generico P = (x, y) è M = (P1 − P0 ) × F1 + (P2 − P0 ) × F2 = (P1 − P0 ) × m1 u + (P2 − P0 )e1 × m2 u che per la bilinearità del determinante rispetto alle colonnne (o alle righe) diventa M = (P1 − P0 )m1 + (P2 − P0 )m2 × u Se si vuole che M si annulli per qualsiasi u, ciò deve valere in particolare quando u = (1, 0) e da questo si ottiene facilmente la formula per yG ; inoltre deve valere quando u = (0, 1), e da questo si ottiene la formula per xG . Osserviamo che combinando le formule per xG e yG si può scrivere l’equazione vettoriale m1 P1 + m2 P2 m1 + m2 G= (34) che si può interpretare come una media pesata dei due punti (vettori) P1 e P2 . Si vede subito che il punto G: - appartiene al segmento di estremi P1 e P2 ; - è il punto medio del segmento se le masse sono uguali; - sta più vicino al punto dove si trova la massa maggiore; - si avvicina sempre più a questo punto quanto più grande è il rapporto fra le due masse. Se sono date masse m1 , ...mk poste nei punti P1 , ..., Pk il centro di massa del sistema, definito dalla stessa proprietà caratteristica detta sopra, è m1 P1 + ... + mk Pk G= (35) m1 + ... + mk In dimensione 3 si ha una definizione del tutto analoga. Nel caso di una distribuzione di massa di cui sia data la densità8 ρ : R2 →R, dove ρ(x, y) ≥ 0 è una funzione integrabile, il centro di massa è il punto G = (xG , yG ), dove xG = 1 M Z R2 ; xρ(x, y)dxdy e yG = 1 M Z R2 yρ(x, y)dxdy (36) Z M= R2 ρ(x, y)dxdy) 7 Il prodotto vettoriale di due vettori che si trovano sul piano xy è un vettore diretto lungo l’asse z, che si può scrivere come un numero reale moltiplicato per il vettore unitario dell’asse z; per semplicità prendiamo tale numero reale come prodotto vettoriale dei due vettori v e w nel piano xy. R 8 Ossia, per ogni insieme (misurabile) E ⊂ R2 , la massa che si trova in E è data dall’integrale E ρ(x, y)dxdy. 18 è la massa totale della distribuzione. Un caso speciale importante, che corrisponde all’idea fisica di un corpo omogeneo di densità costante, è quello in cui ρ = ϕE è la funzione caratteristica di un insieme E. In tal caso il centro di massa della distribuzione dipende soltanto da E, si chiama baricentro di E e si scrive Z Z Z 1 1 GE = (xE , yE ) = Pdxdy := xdxdy, ydxdy (37) area(E) E area(E) E E dove abbiamo denotato con un solo integrale vettoriale i due integrali delle componenti del vettore P = (x, y). La definizione si estende a sottoinsiemi di Rn per ogni n. 5.2 Esercizi sul baricentro di un insieme. Esercizio 5.2.1 Si trovi il baricentro di un cono circolare retto di altezza h e raggio di base r. Esercizio 5.2.2 Si trovi il baricentro di un settore circolare di ampiezza α in un cerchio di raggio R. Esercizio 5.2.3 Si trovino il volume e il baricentro dei due sottoinsiemi di una palla di raggio R che vengono separati da un piano posto a distanza h < R dal centro della palla. Esercizio 5.2.4 i) Siano E ed F due insiemi nel piano o nello spazio. Si provi a dimostrare che GE∪F = vol(E)GE + vol(F)GF vol(E) + vol(F) e si enuncino le proprietà dell’integrale che occorre avere per fare la dimostrazione (poi le dimostreremo). ii) La formula appena scritta consente anche di trovare il baricentro di un insieme C = A \ B ottenuto sottraendo da un insieme A un suo sottoinsieme B. In particolare si trovi il baricentro di un tronco di cono di altezza h e raggi r1 , r2 , con r1 < r2 , utilizzando la formula per il baricentro di un cono trovata nell’esercizio 5.2.1. Esercizio 5.2.5 Si dimostri che il baricentro di un triangolo di vertici P0 , P1 , P2 , inteso come in(37) è uguale al baricentro di tre masse uguali poste nei vertici. Se non si riesce a fare una dimostrazione generale, si cerchi comunque di mostrare l’enunciato per classi di triangoli le più ampie possibile. Esercizio 5.2.6 Si trovi il baricentro dell’insieme x y z T = {(x, y, z) ∈ R3 x > 0, y > 0, z > 0, + + ≤ 1} a b c e si congetturi una formula generale per il baricentro di un tetraedro. Esercizio 5.2.7 i) Se T : R2 →R2 è una traslazione, allora si dimostra facilmente (si prenda nota delle proprietà dell’area o dell’integrale che eventualmente occorrono) che per ogni triangolo E in R2 il traslato del baricentro di E è uguale al baricentro dell’insieme traslato T (E). i) Sia L : R2 →R2 una trasformazione lineare e si dimostri che L(GE ) = GL(E) . Se non si riesce a fare una dimostrazione generale, si cerchi comunque di mostrare l’enunciato per classi di triangoli e per classi di trasformazioni lineari le più ampie possibile, individuando quali strade si potrebbero usare e quali enunciati parziali o intermedi potrebbero essere utili. 5.3 Esercizi sugli integrali di funzioni di due e tre variabili. 1 dxdy A y Z Esercizio 5.3.1 Calcolare l’integrale dove yzex Z Esercizio 5.3.2 Calcolare l’integrale E dove E è il semicilindro p x 2 + y2 A = {(x, y) y ≥ x2 , x ≥ y2 }. dxdydz {(x, y, z) x2 + y2 ≤ R2 , y ≥ 0 , 0 ≤ z ≤ b}. 19 6 Lezione − venerdı̀ 28 settembre 2012 8.30 - 10.30 (2 ore) Coordinate affini, coordinate polari 6.1 Cambiamento della misura per trasformazioni lineari Abbiamo già dichiarato nella sezione 2.2 che l’area, il volume e in generale la misura k dimensionale che costruiremo in Rk dovranno essere invarianti per traslazioni e rotazioni. Ci aspettiamo invece che la misura di un insieme f (E), dove f : Rk →Rk è una trasformazione lineare generale, sia diversa dalla misura di E, infatti, se consideriamo ad esempio l’applicazione lineare f : R→R definita da f (x) = cx, dove c è un numero reale fissato, si vede immediatamente che, per ogni intervallo [a, b] ⊂ R, l’immagine f ([a, b]) è un intervallo di estremi f (a) e f (b) e quindi m( f ([a, b])) = |c|m([a, b]) . Vediamo cioè che l’applicazione f trasforma la misura di un fattore di dilatazione |c|. Se |c| > 1, l’applicazione aumenta la misura; se |c| = 1, l’applicazione non cambia la misura (in effetti è una isometria); se 0 ≤ c < 1, la misura diminuisce e nel sotto-caso c = 0 l’applicazione f manda addirittura tutta la retta nel punto 0 che ha misura nulla. Un altro esempio semplice da considerare è il seguente Esempio 6.1.1 Sia G : R2 →R2 l’applicazione lineare definita da x1 a1 G G e1 7−→ a1 e1 , e2 7−→ a2 e2 ossia G: 7−→ x2 0 0 a2 x1 x2 (38) dove e1 , e2 sono i vettori della base standard e a1 , a2 sono numeri reali. Si vede subito che la mappa G manda il quadrato standard Q = [0, 1] × [0, 1] in un rettangolo di area |a1 a2 | e si comprende (la dimostrazione si vedrà più avanti) che il numero c = |a1 a2 | è anche il fattore di dilatazione dell’area che vale per tutti i sottoinsiemi del piano. Vediamo un esempio appena più generale. Esempio 6.1.2 Sia H : R2 →R2 l’applicazione lineare definita da x1 a11 H H e1 7−→ a11 e1 , e2 7−→ a12 e1 + a22 e2 ossia H: 7−→ x2 0 a12 a22 x1 x2 (39) dove a11 , a12 , a22 sono numeri reali. La mappa H (fare un disegno) manda il quadrato standard Q = [0, 1] × [0, 1] nel parallelogramma generato dai vettori H(e1 ), H(e2 ), il quale ha area (definita elementarmente) uguale a |a11 a22 | . Anche in questo caso si comprende che il numero c = |a11 a22 | è il fattore di cambiamento dell’area che vale per tutti i sottoinsiemi del piano. Per una trasformazione lineare generale si ha il seguente teorema. Teorema 6.1.3 Sia L : Rk →Rk una applicazione lineare. Allora si ha m(L(E)) = | det L| · m(E) per ogni E ⊂ Rk (40) Dimostreremo più avanti questo teorema in due passi: con il primo passo vedremo che esiste un numero c ≥ 0 tale che m(L(E)) = c · m(E) , ∀E ⊂ Rk ; (41) il secondo passo consisterà invece nel mostrare che c = | det L| e per ottenere questo basterà esibire un insieme F ⊂ Rk tale che m(L(F)) = | det L|m(F) . Anche se non possiamo dimostrare i passi suddetti prima di aver costruito i fondamenti della teoria della misura, possiamo subito comprenderne le idee essenziali. L’idea del primo passo è che (a causa dell’invarianza della misura rispetto alle traslazioni) tutti i rettangoli con i lati paralleli agli assi si trasformano con uno stesso fattore c ; ma allora (a causa dell’additività) anche gli insiemi che sono unione disgiunta di rettangoli si trasformano con lo stesso fattore c ; e questo deve allora valere per tutti gli insiemi che si approssimano con tali ‘plurirettangoli’, e cioè tutti i sottoinsiemi del piano. Il secondo passo si può dimostrare in diversi modi. Diamo ora una idea di uno di questi modi, poi più avanti seguiremo una via diversa. Osserviamo per cominciare che in dimensione due ogni applicazione lineare L del piano in sé si può scrivere come composizione di applicazioni che hanno matrice triangolare superiore o inferiore (dimostrarlo per esercizio...). Come si è visto nell’esempio 6.1.2, per ciascuna di tali applicazioni vale la (41), che quindi vale per la loro composizione. In dimensione k > 2 si può comunque mostrare che ogni applicazione lineare L si può scrivere come composizione di applicazioni lineari dei tre tipi seguenti: i) con matrice diagonale; ii) permutazioni delle coordinate; iii) applicazioni del tipo: H e1 7−→ e1 + αe2 , H e2 7−→ e2 , , 20 H e3 7−→ e3 , ... H ek 7−→ ek che sono triangolari nel piano generato da e1 , e2 e lasciano identiche le altre componenti dei vettori. Per le applicazioni di ciascuno di questi tipi si vede facilmente il passo 2 e vale quindi la (41). Ma allora la (41) deve valere anche per la loro composizione. 6.2 Coordinate affini Chiamiamo rette vettoriali i sottospazi vettoriali di dimensione 1 e chiamiamo piani vettoriali i sottospazi vettoriali di dimensione due in Rn . Se V è un sottospazio vettoriale di Rn di dimensione k, ogni traslato di V , ossia ogni insieme del tipo W = V + P0 , si dice sottospazio affine k-dimensionale di Rn . Il sottospazio vettoriale V si chiama direzione di W . I sottospazi affini di dimensione 1 e 2 si chiamano rette e piani in Rn . I sottospazi affini k dimensionali si dicono anche k-piani. Siano P0 e P1 due punti in Rk , con P0 6= P1 L’applicazione γ : R −→ Rk , γ : t 7−→ P0 + t(P1 − P0 ) (42) è iniettiva e ha come immagine la retta r che passa per i punti P0 e P1 . Osserviamo che γ(0) = P0 , γ(1) = P1 e l’intervallo [0, 1] viene mandato nel segmento di estremi P0 e P1 . Diciamo che γ è una parametrizzazione affine della retta r e il numero t si può pensare come una coordinata affine sulla retta r. Osserviamo che la parametrizzazione manda il punto 21 nel punto medio del segmento di estremi P0 e P1 . Sia ora n ≥ 2 e siano P0 , P1 e P2 tre punti in Rn , non allineati (ossia tali che i vettori b1 = P1 − P0 e b2 = P2 − P0 siano linearmente indipendenti). Il piano che passa per i tre punti è P0 + V dove V è il sottospazio vettoriale generato da b1 , b2 . L’applicazione ψ : R2 −→ Rk , ψ : (u1 , u2 ) 7−→ P0 + u1 (P1 − P0 ) + u2 (P2 − P0 ) (43) è iniettiva e ha come immagine il piano W . Se chiamiamo simplesso 2-dimensionale standard in R2 il triangolo T2 in R2 di vertici 0, e1 , e2 , allora la parametrizzazione ψ manda T2 nel triangolo E di vertici P0 , P1 e P2 . Inoltre ψ manda il quadrato standard [0, 1] × [0, 1] nel parallelogramma (unico) che ha i punti P0 , P1 e P2 fra i suoi vertici. Diciamo che γ è una parametrizzazione affine del piano W e la coppia di numeri (u1 , u2 ) si può pensare come un sistema di coordinate affini sul piano W . Osserviamo che se chiamiamo e1 + e2 G := il baricentro dei tre punti 0, e1 , e2 , allora ψ(G) è il baricentro dei tre punti P0 , P1 e P2 . 3 Analoghe parametrizzazioni si possono dare per un k-piano in Rn , dove n ≥ k, identificato da k + 1 punti P0 , P1 , . . . , Pk . 6.3 Applicazioni differenziabili definite su sottoinsiemi in Rk a valori in Rn In questa sezione stabiliremo termini e notazioni relativi alle applicazioni differenziabili definite su sottoinsiemi di Rk e a valori in Rn . Scriveremo i risultati per dimensioni k, n generiche, ma il lettore è invitato a riscrivere le formule e a costruirsi esempi e visualizzazioni nei casi 1 ≤ k ≤ n ≤ 3, che sono di più immediato interesse e saranno quelli più comuni anche negli esercizi. Denotiamo con u = (u1 , ..., uk ) i punti di Rk e con e1 , ..., ek la base standard di Rk . Denotiamo inoltre con x = (x1 , ..., xn ) i punti di Rn e con ε1 , ..., εn la base standard in Rn . Sia A un aperto in Rk e consideriamo una funzione ψ : A→Rn . Per ogni u ∈ A scriviamo ψ(u) = (ψ1 (u), ..., ψn (u)) = ψ1 (u)ε1 + ... + ψn (u)εn dove le funzioni ψi : A→R sono le componenti di ψ. La funzione ψ è continua in un punto u ∈ A se e solo se tutte le componenti ψi sono continue in quel punto. La funzione ψ si dice di classe C1 (A) se e solo se tutte le componenti ψi sono funzioni classe C1 (A), ossia hanno tutte le derivate parziali in tutti i punti di A e le funzioni derivate parziali sono continue su A. Induttivamente, una funzione si dice poi di classe Cr (A), dove r ∈ N, se tutte le sue derivate esistono in ogni punto di A e sono di classe Cr−1 (A). Infine una funzione è di classe C∞ se è di classe Cr per ogni r ∈ N. 21 Nel caso in cui 1 = k ≤ n e ψ è continua, allora diremo che ψ è una curva parametrizzata. Se 2 = k ≤ n e ψ è continua, allora diremo che ψ è una superficie parametrizzata. Nella maggior parte dei casi noi considereremo curve e superfici parametrizzate che sono di classe C1 o C1 a tratti e saranno spesso, ma non necessariamente iniettive. Un altro caso di interesse è quello di funzioni lipschitziane. Vedremo più avanti diversi esempi. Ricordiamo che una funzione di n variabili a valori in Rn si può interpretare in due modi significativamente diversi. Un modo, che si usa in particolare se la funzione è un diffeomorfismo tra aperti di Rn , è quello di vederla come un sistema di coordinate: nella sezione precedente abbiamo visto le parametrizzazioni affini del piano, vedremo più avanti le coordinate polari e le coordinate sferiche, nonché altri sistemi di coordinate che introdurremo ad hoc per risolvere problemi specifici. Un altro modo è quello di vedere una funzione F : E→Rn , dove E ⊂ Rn , come un campo di vettori su E, dove E non è detto sia un aperto e può essere ad esempio una sottovarietà di dimensione minore di n. In questo punto di vista, se x ∈ E, per rappresentare il vettore F(x) spesso si pensa o si disegna una freccia che parte dal punto x ∈ E e arriva nel punto x + F(x). Questo corrisponde all’idea che F(x) è un vettore applicato nel punto x e appartiene in effetti a una copia di Rn che ha l’origine nel punto x. Una funzione ψ : A→Rn si dice differenziabile nel punto u ∈ A, se esiste una funzione lineare L : Rk → Rn tale che E(u) ψ(u) = ψ(u) + L(u − u) + E(u) ; lim =0 u→u |u − u| In tal caso, la funzione lineare L si chiama differenziale di ψ nel punto u e noi la denoteremo dψ(u) . I vettori w che stanno nel dominio Rk di L si devono pensare come vettori tangenti all’aperto A nel punto u (con un linguaggio un po’ antico, ma significativo, ancora usato in fisica o in meccanica, tali vettori si dicono anche vettori applicati nel punto u). Tali vettori tangenti sono le possibili velocità (nel punto u) delle curve differenziabili a valori in A che passano per u e sono anche i possibili vettori rispetto ai quali fare la ∂ψ (u) della funzione ψ nel punto u, definita da: derivata direzionale ∂w ∂ψ ψ(u + tw) − ψ(u) (u) := lim t→0 ∂w t Dalla definizione di differenziale di ψ in u si vede subito che per ogni w ∈ Rk si ha ∂ψ ∂ψ1 ∂ψn (u) = (u), . . . , (u) dψ(u) (w) = ∂w ∂w ∂w Ricordiamo che le derivate parziali rispetto ai vettori della base standard ei si denotano comunemente Si scrive pertanto dψ(u) (ei ) = ∂ψ (u) = ∂ui ∂ψ1 (u), ∂ui ... ∂ψ . ∂ui ∂ψn (u) ∂ui Per un generico vettore w = w1 e1 + · · · + wk ek ∈ Rk , scrivendo ora in colonna le coordinate dei vettori in Rk e Rn , abbiamo quindi: ∂ψ1 ∂ψ1 ∂ψ1 . . . ∂uk ∂u1 ∂u2 w1 ∂ψ2 ∂ψ ∂ψ ∂ψ2 ∂ψ2 dψ(u) (w) = w1 1 (u) + ...wk k (u) = ∂u1 ∂u2 . . . ∂uk · ... . ∂u ∂u .. .. .. wk . ... . ∂ψn ∂ψn ∂ψn . . . ∂u ∂u ∂u 1 2 k dove tutte le derivate parziali sono calcolate nel punto u. La matrice n × k delle derivate parziali di ψ in u rappresenta il differenziale dψ(u) rispetto alle basi standard di Rk e Rn e si chiama matrice jacobiana di ψ in u; noi la denoteremo Dψ(u) . 22 Ricordiamo che se una funzione ψ è di classe C1 (A), allora è differenziabile in ogni punto di A e ricordiamo che invece la sola esistenza delle derivate parziali di una funzione in un punto non implica la differenziabilità in quel punto. Ricordiamo anche il Teorema 6.3.1 del diffeomorfismo locale. Sia A un aperto di Rn , e sia ψ : A→Rn di classe C1 . Supponiamo inoltre che il differenziale dψ(u) nel punto u ∈ A sia iniettivo, allora esiste un intorno G di u tale che ψ|G è un diffeomorfismo tra G e ψ(G). Per la dimostrazione si rimanda agli appunti di Analisi II del prof. Gabriele Greco. 6.4 Intervalli in R Per completezza raccogliamo qui le notazioni che usiamo per gli intervalli in R. Siano a, b ∈ R con a < b. Per gli intervalli in R useremo le notazioni: (a, b) = {x ∈ R a < x < b} [a, b] = {x ∈ R a ≤ x ≤ b} [a, b) = {x ∈ R a ≤ x < b} (a, b] = {x ∈ R a < x ≤ b} (−∞, b] = {x ∈ R x ≤ b} [a, +∞) = {x ∈ R a ≤ x} (a, +∞) = {x ∈ R a < x} (−∞, b) = {x ∈ R x < b} (−∞, +∞) = R Gli intervalli non limitati da una parte si chiamano anche semirette. 6.5 Coordinate polari Consideriamo la funzione ψ : (0, +∞) × R → R2 definita da ψ : (ρ, θ) 7→ (ρ cos θ, ρ sin θ) che si descrive anche come x y ∀ρ ∈ (0, +∞) , ∀θ ∈ R = ρ cos θ = ρ sin θ (44) (45) È immediato che ψ è una funzione di classe C1 e anzi C∞ e che l’immagine di ψ è uguale al piano R2 privato dell’origine. Per comprendere il comportamento della mappa ψ la lettrice è invitata a fare alcuni disegni della situazione. Ad esempio, conviene tracciare le curve che si ottengono restringendo la funzione ψ alle semirette θ = θ0 : si vede cosı̀ che al variare di ρ da 0 a +∞, il punto ψ(ρ, θ0 ) percorre una semiretta uscente dall’origine che forma un angolo θ0 con la semiretta positiva dell’asse x. Inoltre si vede che per ρ = ρ0 , al variare di θ in R, il punto ψ(ρ0 , θ) percorre infinite volte la circonferenza di raggio ρ0 . Restringendo opportunamente il dominio di ψ si ottiene un diffeomorfismo: Proposizione 6.5.1 Considerati gli aperti A = (0, +∞) × (0, 2π) ⊂ R2 ; Ω = R2 − {(x, y) ∈ R2 x ≥ 0, y = 0} la mappa ψ ristretta a A è un diffeomorfismo di classe C1 tra A e Ω. Dimostrazione. Si vede subito che Ω = ψ(A) e che ψ ritretta ad A è iniettiva. Osserviamo che la matrice jacobiana Dψ(ρ, θ) è ∂x ∂x ∂ρ ∂θ cos θ −ρ sin θ (46) = sin θ ρ cos θ ∂y ∂y ∂ρ ∂θ In particolare, per ogni punto (ρ, θ) di A, si ha det(Dψ(ρ,θ) ) = ρ > 0 e da questo segue che anche il differenziale dψ(ρ,θ) : R2 → R2 è invertibile. In questa situazione, per il teorema 6.3.1 del diffeomorfismo locale, si ha che la funzione ψ è un diffeomorfismo di un opportuno intorno di (ρ, θ) su un intorno di (x, y) = ψ(ρ, θ). In particolare dunque ψ−1 è di classe C1 in un intorno del punto (x, y). Poiché questo vale per ogni punto (x, y) ∈ Ω, la funzione inversa ψ−1 : Ω → A è di classe C1 (Ω) e in conclusione ψ : A → Ω è un diffeomorfismo, come si voleva dimostrare. La mappa ψ ristretta all’aperto A si chiama sistema di coordinate polari nel piano. 23 Anticipiamo qui ulteriori considerazione sulle coordinate polari, svolte in realtà nella lezione di giovedı̀ 4 ottobre. Per comprendere meglio le coordinate polari, studiamo come si comportano intorno a un punto generico. Consideriamo allora un punto fissato P0 = (ρ0 , θ0 ) ∈ A (il lettore può fare un disegno ad esempio prendendo ρ0 = 3 e θ0 = 43 π) e poniamo M0 := ψ(P0 ) ∈ R2xy . Chiamiamo inoltre L0 il differenziale di ψ nel punto P0 . Per capire come agisce la mappa ψ, vedremo ora come essa trasforma le curve che passano per il punto P0 . Per prima cosa consideriamo una curva parametrizzata α : I→A , dove I = (−δ, δ) è un intorno di 0 in R, definita da α(t) := P0 + te1 ossia α(t) = (ρ0 , θ0 ) + (t, 0) = (ρ0 + t, θ0 ) Ricordiamo che denotiamo e1 , e2 i vettori della base standard in nel piano ρθ . Si vede subito che α(0) = P0 e che la curva α percorre un segmento della retta di equazione θ = θ0 , parallela all’asse ρ. La velocità della curva α nel punto P0 è α0 (0) = e1 . Consideriamo ora la curva σ : I→R2xy definita da σ(t) := ψ(α(t)) , ossia la trasformata della curva α attraverso ψ. La curva σ passa per il punto M0 e percorre un segmento della semiretta che congiunge l’origine con il punto M0 nel piano xy . Denotiamo b1 := σ0 (o) la velocità della curva σ nel punto M0 . Per la definizione di derivata parziale (o per il teorema di derivazione di una funzione composta in più variabili, come si preferisce), si ha b1 = ∂ψ (ρ0 , θ0 ) = L0 (e1 ) ∂ρ In modo analogo si può considerare una curva β, parallela all’asse θ che passa per P0 e ottenere la derivata parziale di ψ rispetto a θ nel punto P0 : b2 := ∂ψ (ρ0 , θ0 ) = L0 (e2 ) ∂θ Ricordando la definizione (44) della mappa ψ si vede subito che b1 = (cos θ0 , sin θ0 ) b2 = (−ρ0 sin θ0 , ρ0 cos θ0 ) ; (si faccia il disegno nel caso già indicato di ρ0 = 3 e θ0 = 43 π) e si osserva che valgono le seguenti: |b1 | = 1 ; |b2 | = ρ0 ; b1 · b2 = 0 dove l’ultima relazione ci dice che i vettori b1 e b2 sono ortogonali. Insomma vediamo che il differenziale L0 di ψ nel punto P0 trasforma i vettori della base standard in due vettori b1 e b2 tra loro ortogonali e di lunghezza rispettivamente 1 e ρ0 . Pertanto L0 trasforma il quadrato standard di lati e1 e2 , cha ha area unitaria, nel rettangolo di lati b1 b2 , che ha area ρ0 . Dunque il fattore con cui la mappa lineare L0 trasforma l’area è ρ0 , che è proprio il determinante di L0 (il modulo non è rilevante, perché si tratta di un numero positivo). Poiché la mappa L0 approssima bene la mappa ψ ‘vicino’ al punto P0 , in queste vicinanze anche ψ trasforma l’area di un fattore ρ0 . 24 7 Lezione − Lunedı̀ 1 ottobre 2012 10.30 - 12.30 (2 ore) Cambiamento di variabile negli integrali 7.1 Primi esempi di curve parametrizzate Definizione 7.1.1 Una curva parametrizzata in uno spazio metrico E è una funzione continua γ : I→E, dove I è un intervallo in R. Noi siamo interessati in particolare alle curve negli spazi Rn e agli integrali lungo (su) tali curve. Vediamo in questa sezione qualche primo esempio di curve. L’integrazione sulle curve sarà sviluppata gradualmente. Esempio 7.1.2 La curva parametrizzata γ : [0, 4π] → R2 che descriviamo anche , x y γ(t) = (R cost, R sint) (47) = R cost = R sint ha come immagine la circonferenza di raggio R e centro O nel piano e questa circonferenza viene ‘percorsa’ due volte (il punto (R, 0) viene in effetti raggiunto tre volte). La curva è di classe C∞ . Dall’esempio si vede bene come sia necessario distinguere tra l’immagine S = γ(I), che è un sottoinsieme di R2 , e la funzione γ : I → Rn , che dice come l’insieme S viene percorso. Qualche volta si usa però il termine ‘curva’ anche per indicare l’insieme S, e la funzione γ si chiama ‘parametrizzazione’ di S. Altri chiamano S ‘sostegno’ della curva γ. Nonostante questa confusione che si ha comunemente nel linguaggio, con un po’ di attenzione non sorgono equivoci. Esercizio 7.1.3 Mostrare che la curva γ definita in (47), ristretta all’intervallo aperto I = (a, a + 2π), dove a è un numero reale fissato arbitrariamente, è iniettiva ed è un omeomorfismo da I sull’insieme costituito dalla circonferenza meno il punto P = (cos a, sin a). Esercizio 7.1.4 Si descriva una curva parametrizzata iniettiva a valori in R2 , la cui immagine sia l’ellisse di centro 0 e di semiassi a e b. Esercizio 7.1.5 Disegnare il sostegno della curva α(t) = (R cost, R cost) ; t ∈R e visualizzare mentalmente il movimento del punto α(t) al variare del parametro t. Si osservi che la curva è di classe C∞ . Esercizio 7.1.6 Si descriva una curva parametrizzata iniettiva di classe C1 a valori in R2 , la cui immagine sia la frontiera del quadrato [0, 1] × [0, 1]. Esercizio 7.1.7 Si scriva esplicitamente una funzione γ definita su un opportuno intervallo I a valori in R2 , iniettiva e di classe C1 , che descriva la cicloide, ossia la traiettoria di un punto P che si trova sul bordo di un cerchio di raggio R, collocato in un piano xy, al rotolare del cerchio stesso sopra l’asse x. [Suggeriamo di pensare che il cerchio si trovi all’inizio del rotolamento col centro nel punto (0, R) e con il punto P in corrispondenza dell’origine (0, 0). Suggeriamo inoltre di prendere come parametro del rotolamento l’angolo θ in radianti. Dopo un giro completo, cioè per il valore θ = 2π del parametro, il centro del cerchio sarà nel punto (2πR, R) e il punto P si troverà di nuovo sull’asse x, in corrispondenza del punto (2πR, 0). Vediamo anche un esempio di curva nello spazio 3-dimensionale. . . Esempio 7.1.8 La curva γ : R → R3 , γ(t) = (R cost, R sint,t) (48) si dice elica cilindrica di raggio R. Disegnare l’insieme γ([−π, 4π]). Si riesce con mezzi elementari a dire quanto è lunga questa curva? 25 . . . e un esempio di curva nello spazio 1-dimensionale . . . Esempio 7.1.9 La curva h:R→R , h(t) = sin 2t , t ∈ [0, π] (49) si muove sulla retta e ha come immagine l’intervallo [−1, 1]. Quanto è lunga questa curva? Vediamo che la curva parte da 0 quando t = 0, poi si muove fino al punto 1 (per t = π4 ), torna indietro fino a −1 (per t = 3π 4 ) e infine arriva al punto 0 quando t = π. Nel complesso la curva h percorre due volte il segmento [−1, 1] e la sua lunghezza (la lunghezza del cammino, non del sostegno) è 4. Osserviamo che questa lunghezza si ottiene calcolando l’integrale Z π lunghezza(h) = |h0 (t)|dt 0 e la stessa formula evidentemente si può usare per calcolare la lunghezza di una curva a valori in R di classe C1 che abbia un numero finito di massimi e minimi: la lunghezza del cammino totale è infatti la somma dei valori assoluti delle differenze tra ogni minimo (o massimo) e il massimo (o minimo) successivo e basta usare il teorema fondamentale del calcolo per trovare la formula appena indicata. Osservazione 7.1.10 Occorre fare attenzione a non confondere tra di loro il cammino in R descritto dalla funzione h dell’esempio precedente e il cammino in R2 γ : [0, π] → R2 , γ(t) = (t, h(t)) (50) che percorre il grafico {(x, y) ∈ R2 x ∈ [0, π] , y = h(x)} della funzione h. Evidentemente la lunghezza del cammino che percorre il grafico di h è maggiore della lunghezza del cammino di h in R. Ricordiamo che una definizione di lunghezza del grafico (si rimanda al libro citato di G. Greco) si è vista nel corso di Analisi 1: Z πq Z πq 0 2 1 + |h (t)| = 1 + 4| cos 2t|2 0 0 Ricordiamo che l’ultimo integrale sappiamo che esiste, possiamo approssimarlo, possiamo trovare delle q formule che lo esprimono in termini di altri integrali, ma la primitiva di 1 + 4| cos 2t|2 non è esprimibile in termini di funzioni elementari. Studieremo più avanti in generale la questione di come definire la lunghezza di una curva e di come calcolarla. 7.2 Formula di integrazione per sostituzione In questa sezione ricorderemo come dalla formula per la derivata di una funzione composta e dal Teorema Fondamentale del Calcolo si ottiene una formula di cambiamento di variabile per gli integrali in dimensione 1. Questo approccio non si generalizza a dimensioni maggiori o uguali di 2. Nella prossima sezione vedremo una diversa dimostrazione della formula di cambiamento di variabile in dimensione 1, la cui idea si può generalizzare al caso di mappe da Rn in Rn e anche da Rk in Rn . Descriveremo schematicamente tale generalizzazione nell’ultima sezione. Sia I = [a, b] un intervallo in R e consideriamo una funzione g : [a, b]→R di classe C1 ([a, b]) e iniettiva, che possiamo pensare come una curva parametrizzata a valori in R. Poiché g è continua, l’immagine H = g(I) della funzione g è un insieme compatto e connesso e quindi è un intervallo chiuso e limitato: H = [c, d]. Poiché g è iniettiva e continua, deve essere monotona: crescente con la derivata g0 (t) ≥ 0 ∀t ∈ [a, b] , oppure decrescente, con la derivata g0 (t) ≤ 0 ∀t ∈ [a, b] . Nel primo caso si avrà g(a) = c , g(b) = d e nel secondo caso si avrà g(a) = d , g(b) = c . In entrambi i casi può capitare che la derivata di g si annulli in un certo insieme di punti; di conseguenza la funzione inversa di g, che è necessariamente continua, non è detto sia differenziabile in tutti i punti di [c, d], in particolare non è detto che g sia un diffeomorfismo. Consideriamo ora una funzione continua f : [c, d]→R e sia F : [c, d]→[c, d] una funzione primitiva di f , ossia tale che F 0 (x) = f (x) . Evidentemente la funzione F è di classe C1 su [a, b] e anche la funzione composta F ◦ g : [a, b]→R lo è. La derivata di tale funzione composta in un punto t ∈ [a, b] è [F ◦ g]0 (t) = F 0 (g(t))g0 (t) = f (g(t))g0 (t) 26 Nel caso in cui g sia crescente, utilizzando il Teorema Fondamentale del Calcolo, abbiamo quindi Z f (g(t))g0 (t)dt = Z b I f (g(t))g0 (t)dt = Z b a [F ◦ g]0 (t)dt = a = [F ◦ g](b) − [F ◦ g](a) = F(g(b)) − F(g(a) = Z g(b) Z d f (x)dx = g(a) Z f (x)dx = c f (x)dx (51) H dove a destra abbiamo un integrale nella variabile x e a sinistra un integrale nella nuova variabile t, nel quale compaiono la funzione f (g(t)), ossia la funzione f espressa nella nuova variabile, e la funzione g0 (t) che tiene conto dello ‘stiramento’ della lunghezza nel passaggio da una variabile all’altra; approfondiremo questa idea poco più avanti in questa sezione. Nel caso in cui g sia decrescente, e quindi g(a) > g(b), in modo analogo otteniamo: Z f (g(t))g0 (t)dt = I Z b Z f (g(t))g0 (t)dt = − F(g(b)) − F(g(a) = − a d f (x)dx = − c Z f (x)dx (52) H e le (51) e (52), qualunque sia il segno di g0 , si possono condensare nella Z Z f (g(t))|g0 (t)|dt = f (x)dx I (53) g(I) La formula precedente sarà chiamata cambiamento di variabile nell’integrale (in dimensione uno). Se poi si ricorda la definizione di integrale orientato (si veda ad esempio G.Greco. Calcolo Differenziale e integrale, volume I, cap 10): R se a < b Z b [a,b] f (x)dx f (x)dx = (54) R a − [b,a] f (x)dx se a > b le (51) e (51), qualunque sia il segno di g0 , si possono condensare nell’unica formula Z b f (g(t))g0 (t)dt = Z g(b) f (x)dx a (55) g(a) Quest’ultima formula sarà chiamata cambiamento di variabile nell’integrale orientato (in dimensione uno). Vedremo nelle prossime due sezioni che entrambe le (53) e (55) si possono generalizzare a dimensioni maggiori di uno, ma non con il metodo di dimostrazione fin qui seguito. Un caso particolare importante della (53) si ha nel caso in cui f (x) = 1 per ogni x: Z |g0 (t)|dt = I ossia Z Z dx g(I) |g0 (t)|dt = lungh(g(I)) (56) I Detto in parole: la lunghezza dell’immagine di I è uguale all’integrale su I di |g0 (t)|. Ricordando la definizione di derivata, abbiamo quindi lungh g Br (t) |g0 (t)| = lim r→0 lungh Br (t) dove Br (t) = [t − r , t + r] , e questo mostra bene il significato del numero |g(t)| come fattore di dilatazione (o restringimento) della lunghezza causato dal cambiamento di variabile g intorno al punto t. 27 7.3 Cambiamento di variabile negli integrali in dimensione 1 Nella sezione precedente abbiamo ottenuto la formula di cambiamento di variabile (53) utilizzando la formula per la derivata della funzione composta e il Teorema Fondamentale del Calcolo. In questa sezione ritroveremo la stessa formula di cambiamento di variabile utilizzando un altro approccio. A questo fine sia g : [a, b]→R di classe C1 ([a, b]) , tale che g0 > 0, g(a) = c , g(b) = d e sia f : [c, d]→R una funzione continua. Ricordando la definizione di integrale di Cauchy e l’osservazione 3.2.2, abbiamo che n Z d f (x)dx = lim n→∞ c ∑ f (η j )(x j − x j−1 ) j=1 dove: 1. per ogni n ∈ N, {x0 , x1 , . . . x j , . . . xn } è una partizione dell’intervallo [a, b] 2. per ogni j = 1, ...n η j ∈ [x j−1 , x j ] 3. le partizioni soddisfano alla condizione di ‘infittirsi’ quanto si vuole al tendere di n all’infinito: lim max |x j − x j−1 | = 0 n→∞ (57) j Grazie al teorema del valor medio di Lagrange, per ogni n ∈ N e ogni j = 1, ..., n possiamo scrivere x j − x j−1 = g0 (ξ j )(t j − t j−1 ) dove t j = g−1 (x j ) e ξ j sta fra t j e t j−1 . Se scegliamo η j = g(ξ j ) abbiamo n n ∑ f (η j )(x j − x j−1 ) = j=1 ∑ f (g(t j ))g0 (ξ j )(t j − t j−1 ) j=1 A questo punto aggiungiamo una ipotesi, che semplifica tecnicamente la situazione senza oscurare il ragionamento e che alla fine, volendo, si potrà rimuovere: supponiamo che g0 ≥ δ > 0 su [a, b]. Dunque g è un diffeomorfismo e la derivata di g−1 è limitata da un numero M; quindi (t j − t j−1 ) ≤ M(x j − x j−1 ) e da (57) segue che lim max |t j − t j−1 | = 0 (58) n→∞ j Abbiamo pertanto Z d f (x)dx = lim c n→∞ n Z b j=1 a ∑ [( f ◦ g)g0 ](ξ j )(t j − t j−1 ) = [ f ◦ g](t)g0 (t)dt che è proprio la formula di cambiamento di variabile (53) nel caso di g0 > 0 (il caso g0 < 0 si tratta allo stesso modo). 7.4 Cambiamento di variabile negli integrali in dimensione n In questa sezione, per analogia con il caso 1-dimensionale, enunceremo una formula per il cambiamento di variabile negli integrali in Rn , utilizzando termini al momento non ancora definiti, che saranno precisati più avanti nel corso. Riteniamo che comunque il significato della formula sarà sufficientemente chiaro per poterla già utilizzare come importante strumento di calcolo. Teorema 7.4.1 Cambiamento di variabile negli integrali in Rn . Siano A e Ω aperti di Rn . Sia ψ : A→Ω un diffeomorfismo e sia f : Ω→R una funzione integrabile9 . Allora si ha Z Z f (ψ(u))Jψ (u)du = f (x)dx (59) A ψ(A) dove Jψ (u) = | det Dψ(u)| 9 I termini in corsivo nell’enunciato saranno definiti più avanti, quando svilupperemo la teoria della misura e dell’integrazione, in particolare la misura di Lebesgue. 28 Inoltre, per ogni insieme misurabile E ⊂ A si ha Z Jψ (u)du = m(ψ(E)) (60) E dove m è la misura n-dimensionale in Rn . Occorre fare diverse osservazioni. Osservazione 7.4.2 Il numero Jψ (u) = | det Dψ(u)| è il fattore con cui il differenziale dψ(u) : Rn →Rn cambia il volume n-dimensionale e quindi lo pensiamo come il fattore con cui la mappa ψ cambia il volume di insiemi infinitesimi intorno al punto u. Nel caso della dimensione n = 1 si ha Jψ (u) = |ψ0 (u)| e la (59) coincide con (53). Osservazione 7.4.3 La (59) vale anche se ψ è solamente iniettiva, senza richiedere che ψ sia un diffeomorfismo. Se poi la funzione ψ non è neppure iniettiva, vale comunque una formula analoga alla (59), in cui si tiene conto di quante volte la funzione ψ assume ogni valore x ∈ ψ(A). Precisamente: si introduce la funzione molteplicità di ψ, definita per ogni x ∈ ψ(A) come segue: N( f , x) = Card {u ∈ A ψ(u) = x} (61) dove Card(B) è il numero degli elementi di B, se B è un insieme finito, e vale +∞ se B non è finito; dopodiché si può mostrare che Z Z f (ψ(u))Jψ (u)du = N( f , x) f (x)dx A (62) ψ(A) Z Z Jψ (u)du = E N( f , x)dx (63) ψ(E) Può essere utile scrivere la funzione molteplicità e verifica re la validità della (62) per le curve presentate negli esempi 7.1.2 e 7.1.5. Osservazione 7.4.4 Abbiamo detto sopra che la formula di cambiamento di variabile (59) in dimensione 1 è la formula di cambiamento di variabile (53) per l’integrale non orientato. In dimensione 1 abbbiamo però anche un integrale orientato e la corrispondente formula (55) di cambiamento di variabile. Sorge quindi naturale la domanda: c’è anche in dimensione n un integrale orientato? c’è un cambiamento di variabile orientato n-dimensionale? Vedremo che la risposta è affermativa: gli integrali orientati n-dimensionali saranno gli integrali delle cosiddette forme differenziali. Osservazione 7.4.5 Vedremo più avanti che le formule (59) e (60) si estendono, formalmente identiche, al caso di mappe ψ : A→Rn , dove A è un aperto in Rk e k ≤ n , pur di definire opportunamente il fattore Jψ (u) di trasfomazione dell’area. Se k < n tali mappe ψ si interpretano come superfici parametrizzate e la formula generalizzata viene spesso chiamata formula dell’area. 29 8 Lezione − Giovedı̀ 4 ottobre 2012 14.30 - 16.30 (2 ore) Esercizi su coordinate polari. Introduzione agli integrali lungo le curve. Alcune osservazioni che sono state fatte sulle coordinate polari nella lezione del 4 ottobre si trovano in questo diario alla fine dell’ultima sezione della lezione del 28 setttembre, a pagina 24. 8.1 Calcolo di un’area in coordinate polari Vediamo un esempio di curva in coordinate polari e in coordinate cartesiane. Poi calcoleremo l’area di un insieme, utilizzando le coordinate polari. Esempio 8.1.1 Spirale di Archimede. La spirale di Archimede è la curva nel piano che viene percorsa da un punto P, vincolato a stare su una semiretta r di origine O, il quale si muove lungo la semiretta stessa con velocità uniforme a partire da O, mentre la semiretta ruota con velocità angolare uniforme intorno al punto O. Se pensiamo che il punto O sia l’origine di un sistema di assi cartesiani xy, che la semiretta al tempo t = 0 sia il semiasse x positivo e che la rotazione sia antioraria, allora le coordinate polari (ρ, θ) del punto P, all’istante t sono ρ(t) = ct , θ(t) = ωt (64) dove c > 0 è la velocità del punto lungo la retta r e ω > 0 è la velocità angolare della retta intorno all’ origine. Quindi le coordinate cartesiane del punto P sono x(t) = ρ(t) cos(θ(t)) = c · t · cos(ωt) , y(t) = ρ(t) sin(θ(t)) = c · t · sin(ωt) (65) La curva parametrizzata γ : [0, +∞)→R2 , dove γ(t) = (x(t), y(t)) è il modello matematico della spirale di Archimede. Esercizio 8.1.2 Consideriamo la curva parametrizzata σ : [0, π]→R2 definita da x(t) = a cost ; y(t) = a sint ; t ∈ [0, π] che percorre un arco di spirale di Archimede. Si trovi l’area dell’insieme F racchiuso dall’immagine della curva σ e dal segmento dell’asse x di estremi (0, 0) e (−1, 0) . Per calcolare l’area di F, consideriamo l’insieme E = {(ρ, θ) ∈ R2 0 ≤ θ ≤ π , 0 ≤ ρ ≤ aθ} e osserviamo che la mappa ψ delle coordinate polari (44) è biiettiva tra gli insiemi E ed F. Per la (60) abbiamo allora che Z Z Z π Z aθ Z π 1 1 2 2 a θ dθ = a2 π3 area(F) = area(ψ(E)) = Jψ (ρ, θ)dρdθ = ρdρdθ = ρdρ dθ = 6 E E 0 0 0 2 8.2 Introduzione all’integrale di una forma differenziale lungo una curva Le considerazioni generali e i primi esempi svolti in questa lezione sono inglobati nella lezione di Lunedı̀ 8 ottobre. 30