Diario del corso di Analisi matematica - III

Diario del corso di
Analisi matematica - III
anno accademico 2012-13
prof. Gabriele Anzellotti
Università di Trento
Dipartimento di Matematica
9 ottobre 2012
Il presente ‘diario del corso’ contiene una sintesi delle lezioni svolte. Viene aggiornato prima possibile dopo ogni
lezione. Le lezioni messe in rete rimangono nella sostanza non modificate, anche se accade frequentemente che vengano
fatte correzioni e piccoli aggiustamenti successivi, non sempre segnalati. Il Diario ha una funzione di supporto e la sua
lettura non può sostituire la partecipazione alle lezioni.
1
Lezione − lunedı̀ 17 settembre 2012
10.30 - 12.30 (2 ore)
Introduzione alla Teoria della Misura e dell’Integrazione.
1.1 Argomenti del corso, testi e riferimenti suggeriti, prerequisiti
Il corso di Analisi III è dedicato a sviluppare i seguenti argomenti:
1. Lunghezza, area, volume di sottoinsiemi dello spazio euclideo 3-dimensionale.
2. Calcolo integrale per funzioni di più variabili, integrali su curve e superfici, estensioni del Teorema
Fondamentale del Calcolo in Rn .
3. Successioni e serie di funzioni, in particolare serie di Fourier trigonometriche e problema del passaggio al limite sotto il segno di integrale.
4. Teoria della Misura, con particolare riferimento alla Misura di Lebesgue e alla Misura di Hausdorff.
Integrale rispetto a una misura, teoremi di convergenza e spazi di funzioni misurabili.
Gli argomenti trattati a lezione saranno riportati nel presente Diario, ma è consigliabile avere anche dei testi
di riferimento sui quali studiare. Per quanto riguarda gli argomenti 1, 2, 3, si suggerisce di procurarsi un
testo di analisi matematica del secondo anno. Un testo ragionevole è Analisi matematica 2 di Enrico Giusti
- Editore Bollati Boringhieri - Terza edizione 2003. Di questo testo consigliamo in particolare i capitoli:
12. Il Calcolo integrale in più variabili, 13. Successioni e serie di funzioni, 14. Serie di Fourier, 16. Forme
differenziali. Per quanto riguarda l’argomento 4, si consiglia di scaricare il testo in formato pdf del libro
Modern Real Analysis di William P. Ziemer, che è liberamente disponibile nelle pagine personali dell’autore nel sito http://www.indiana.edu/˜mathwz/PRbook.pdf della Indiana University. Altri riferimenti
su questioni specifiche saranno dati durante il corso e riportati nel Diario.
Le prove scritte di esame e le prove in itinere riguarderanno principalmente il calcolo di integrali, lunghezze,
aree, volumi. Un’idea del tipo di quesiti richiesti si può avere guardando le prove di esame 2010/11 http://
www.science.unitn.it/˜anzellot/scrittianalisi1011.htm e le prove in itinere 2011/12 (che sono
contenute nel diario 2011/12 http://www.science.unitn.it/˜anzellot/analisi1112.htm). Nell’anno accademico 2012/13 potranno però aversi delle variazioni. Nelle lezioni tenute dal dottor Altavilla
saranno svolti diversi esercizi e ne saranno suggeriti molti altri. Ricordiamo che vi sono numerosi siti web
nei quali si trovano esercizi svolti di calcolo integrale in più variabili e ne indichiamo due: Politecnico di
1
Torino http://calvino.polito.it/˜terzafac/Corsi/analisi2/materiale.html; Paul Dawkins Lamar University http://tutorial.math.lamar.edu/Classes/CalcIII/CalcIII.aspx. Infine, può
essere utile anche un libro di esercizi di analisi per il secondo anno; fra i molti, ai nostri fini essenzialmente
equivalenti, ricordiamo quello di Enrico Giusti, che accompagna il testo di lezioni citato sopra.
Nel presente corso saranno utilizzati i concetti e le tecniche introdotti nei corsi di Analisi 1, Analisi 2,
Geometria 1, Geometria 2. In particolare: i numeri reali R e la topologia della retta; gli spazi vettoriali
Rn e le nozioni di sottospazio vettoriale, base, applicazione lineare e matrice ad essa associata rispetto a
basi assegnate; il prodotto scalare standard in Rn , la norma e la distanza euclidea, il teorema di diagonalizzazione degli operatori simmetrici; la nozione di spazio metrico, di insieme aperto, insieme chiuso,
insieme compatto, successione convergente, funzione continua; il calcolo differenziale in una e più variabili; le curve, superfici e sottovarietà regolari in Rn ; l’integrale di Riemann e il teorema fondamentale del
calcolo per funzioni di una variabile. Le conoscenze fondamentali di analisi e geometria appena indicate
sono date per note e in questo corso saranno solo brevemente richiamate, quando necessario, per stabilire le
notazioni. Per iniziare a seguire questo corso non è però necessario ricordare a memoria tutte le definizioni,
gli enunciati e le dimostrazioni che si sono incontrati nei corsi del primo anno! è sufficiente averne un’idea
intuitiva ed è importante avere un luogo di riferimento dove si possano rapidamente ritrovare nel dettaglio
che a seconda dei casi è necessario. Il corso di Analisi III fornisce molte buone occasioni per riprendere in
mente e sistemare gli argomenti studiati nel primo anno, argomenti che forse non sono stati tutti acquisiti
a sufficienza dagli studenti e che comunque, inevitabilmente, saranno stati in parte dimenticati. Pertanto
al termine del presente corso ci si attende che le teorie studiate nel primo anno, pur non essendo specifico
oggetto dell’esame, siano padroneggiate adeguatamente dagli studenti, per quanto riguarda il loro utilizzo
negli argomenti specifici di Analisi III.
1.2 Lunghezza e area in una prospettiva storica. Due enunciati del Teorema di Pitagora
Se oggi chiediamo a qualcuno di misurare (la lunghezza di) un bastoncino, costui probabilmente prenderà
un metro, ossia una riga o un nastro graduato, e lo metterà accanto al bastoncino, avendo cura di porre una
estremità del bastoncino in corrispondenza con l’inizio del metro, dove si trova segnato il numero 0 (zero);
poi leggerà il numero che si trova sul metro in corrispondenza con l’altra estremità. Questo numero sarà la
risposta. Se chiediamo poi di dirci l’area di un foglio rettangolare, questa persona misurerà le lunghezze di
due lati del foglio, ortogonali tra loro, e moltiplicherà tra loro questi due numeri. L’area è per noi il numero
che si ottiene come prodotto delle lunghezze dei lati. Naturalmente si possono usare strumenti molto più
sofisticati per la misura della lunghezza e in ogni caso vi saranno delle incertezze e degli errori nelle misure,
ma tutto ciò non interessa in questa sede, il punto è che la misura (lunghezza, area) per noi è un numero.
Per distinguere i numeri che esprimono lunghezze dai numeri che esprimono aree, si usa scrivere per
chiarezza accanto ai primi il simbolo ‘m’ (che sta per ‘metro’, l’unità di misura delle lunghezze), e si
usa invece scrivere accanto ai secondi il simbolo ‘m2 ’ (che sta per ‘metro quadrato’, l’unità di misura
dell’area). Precisiamo subito che non c’è alcuna differenza fra i numeri che esprimono lunghezze, aree o
misure di tempo o di temperatura, come invece si sente talvolta dire... sempre gli stessi numeri sono. Quello
che è diverso è la nostra intenzione, nell’usarli, di indicare misure di grandezze diverse. Tale intenzione
può essere opportuno palesarla − i fisici ci tengono sempre molto, e hanno le loro ragioni1 − e si aggiunge
cosı̀ il simbolo dell’unità di misura.
La lunghezza e l’area non si sono sempre misurate in questo modo. Per cominciare il metro è stato introdotto
soltanto alla fine del settecento e soprattutto, il modo di pensare alla lunghezza e all’area è stato radicalmente diverso nella matematica greca antica. Per comprendere questa differenza possiamo confrontare due
enunciati del teorema di Pitagora, un enunciato moderno che si trova comunemente nei libri o in rete e
l’enunciato che si trova negli Elementi di Euclide, Libro I, n.47 2 . Euclide vive a cavallo del 300 a.C., ma il
teorema di Pitagora, in qualche forma, si ritiene sia di almeno un secolo precedente .
Teorema 1.2.1 Teorema di Pitagora - enunciato corrente moderno. In un triangolo rettangolo l’area del
quadrato costruito sull’ipotenusa è equivalente alla somma delle aree dei quadrati costruiti sui due cateti.
In altre parole: dato un triangolo rettangolo di lati a, b e c, dove c è l’ipotenusa (ossia c è il lato opposto
all’angolo retto), si ha
a2 + b2 = c2
1I
matematici invece in genere non ci tengono, e hanno anche loro le loro ragioni.
riferimento all’edizione critica e traduzione di Fabio Acerbi, Bompiani 2007
2 Faremo
2
Teorema 1.2.2 Teorema di Pitagora negli ‘Elementi’ di Euclide. Nei triangoli rettangoli il quadrato sul
lato (ipotenusa) che sottende l’angolo retto è uguale ai quadrati sui lati (cateti) che comprendono l’angolo
retto.
Nella formulazione di Euclide ovviamente non compaiono formule e non c’è neppure la parola ‘area’. Si
dice invece direttamente che il quadrato (costruito) sul lato che sottende l’angolo retto (noi abbiamo aggiunto il nome ‘ipotenusa’) è uguale ai quadrati sugli altri due lati. Il Teorema di Pitagora antico non è
una uguaglianza fra numeri, è invece una uguaglianza tra figure: da una parte il quadrato costruito sull’ipotenusa, dall’altra parte i due quadrati costruiti sui cateti, presi insieme. La dimostrazione di Euclide
procede suddividendo il quadrato sui cateti in due parti e facendo vedere che ciascuna di esse è uguale a
uno dei quadrati sui cateti. La prova si basa sulla proposizione, mostrata da Euclide al numero 35 del Libro
I, che due parallelogrammi con un lato in comune e i lati opposti su una stessa retta sono uguali. Qui è
importante capire il significato che ha il termine uguali: due figure sono uguali se ciascuna di esse si può
suddividere in uno stesso numero finito di parti, in modo che ogni parte della prima figura sia sovrapponibile esattamente a una e una sola parte della seconda figura. In linguaggio posteriore, noi preferiamo dire
che due figure con questa proprietà sono equiscomponibili e diciamo che sono quindi equivalenti. In ogni
caso, le figure vengono comparate senza ricorrere a un numero per misurarne l’estensione. Vediamo nella
prossima sezione come questo punto di vista viene utilizzato dai Greci per sviluppare una teoria generale
delle grandezze.
1.3
Grandezze e proporzioni nella matematica greca. Archimede e la sfera.
Nella matematica greca fu sviluppata una teoria delle grandezze astratte e delle proporzioni fra le grandezze,
la cui esposizione classica si trova nel Libro V degli Elementi di Euclide. I segmenti, oggetti astratti del
piano euclideo, sono un esempio tipico di grandezza. I segmenti possono essere trasportati nel piano con
le isometrie, o moti euclidei). Grazie a questa operazione, i segmenti si possono confrontare, mettendoli su
una stessa retta con un estremo in comune in un punto P e l’altro estremo nella stessa semiretta rispetto a
P. Due segmenti si possono anche sommare, riportandoli consecutivamente su di una retta e ottenendo un
terzo segmento, e si possono sottrarre, il minore dal maggiore. Il perimetro di un poligono è quel segmento
che si ottiene sommando i lati del poligono stesso. Anche le figure, ad esempio i triangoli e i poligoni,
si possono trasportare, sovrapporre, confrontare. Se non si possono confrontare direttamente, si possono
suddividere in parti e si possono confrontare le parti, come si è detto nella sezione precedente. Le figure
sono un altro esempio tipico di grandezza. In generale, due grandezze omogenee si possono confrontare e
si può dire se sono uguali o quale delle due è maggiore. Due grandezze omogenee si possono sommare fra
loro e una grandezza A si dice essere ‘misurata’ da un’altra grandezza B, se A è uguale alla somma di B con
se stessa un certo numero di volte (in linguaggio moderno diremmo che A è un multiplo di B e scriveremmo
A = kB per qualche numero naturale k). Due grandezze A, B si dicono fra loro commensurabili quando
sono ‘misurate’ da (ossia sono multiple di) una stessa grandezza C, ad esempio A = kC e B = pC, e in
tal caso si dice che A sta a B come k sta a p, oppure che A e B stanno fra loro nel rapporto k : p, ovvero
A : B = k : p. In linguaggio moderno, nella situazione appena detta si direbbe che il rapporto tra A e B è
k
p , pensando quest’ultima frazione come un numero razionale, ma questo era impensabile nella matematica
greca: i concetti di frazione e di numero razionale e le relative notazioni e operazioni, nonché le notazioni
algebriche, non erano stati sviluppati.
Si seppe molto presto (Scuola pitagorica, intorno al quinto secolo a.C.) che ci sono grandezze omogenee
tra loro non commensurabili, ad esempio la diagonale e il lato di un quadrato, e si trovò comunque il modo,
attribuito a Eudosso di Cnido, circa 370 a.C. e pure descritto nel V Libro degli Elementi, di considerare proporzioni che coinvolgono grandezze tra loro incommensurabili, pur non avendo a disposizione il concetto di
numero reale. Si comprende da questo l’importanza della teoria delle proporzioni per la matematica e come
linguaggio per la scienza, durata fin quando i numeri decimali, le frazioni e l’algebra non la soppiantarono
alcuni secoli fa (a scuola invece le proporzioni sono rimaste più a lungo...).
Utilizzando metodi ‘meccanici’ ingegnosi, che abbiamo solo da poco tempo compreso grazie al ritrovamento di preziosi palinsesti, e utilizzando sottili metodi di dimostrazione, Archimede (morto nel 212 a.C.)
ottenne straordinari risultati sulla misura di grandezze: mostrò che il cerchio è uguale a un triangolo che ha
come base la circonferenza e come altezza il raggio; confrontando il cerchio con poligoni regolari, ottenne
alcune buone approssimazioni del rapporto tra la circonferenza e il diametro; mostrò che la sfera solida sta
al cilindro equilatero solido circoscritto come due sta a tre; mostrò che la superficie della sfera è uguale alla
superficie laterale di tale cilindro. Su questi risultati la teoria della misura si ferma essenzialmente fino al
secolo XVII.
3
2
Lezione − giovedı̀ 20 settembre 2012
10.30 - 12.30 (2 ore)
Introduzione al punto di vista moderno sulla misura
2.1 Notazioni per oggetti in R2
Cominciamo con lo stabilire le notazioni che useremo per alcuni oggetti che si trovano negli spazi Rn , già
ben noti agli studenti dai corsi di Geometria e di Analisi Matematica 2. Per semplicità e chiarezza parleremo
di R2 , ma con notazioni che si estendono naturalmente e facilmente a Rn .
Come è uso, per l’insieme delle coppie ordinate di numeri reali useremo la notazione
R2 = R × R = (x, y) x, y ∈ R
Di questo insieme R2 useremo la consueta rappresentazione cartesiana, che si ottiene fissando su un piano
(geometrico o fisico) due rette orientate (assi) ortogonali, sulle quali è data una unità di lunghezza, e associando a ogni elemento (x, y) di R2 il punto P che ha coordinate (x, y) rispetto al sistema di riferimento
fissato. Spesso identificheremo l’elemento (x, y) con il punto P, riteniamo senza creare difficoltà, e useremo
il termine piano per riferirci all’insieme R2 . Inoltre, spesso chiameremo vettori gli elementi di R2 e potremo
rappresentare un vettore (x, y) con una freccia che parte dal punto O dove si intersecano gli assi (origine,
o vettore nullo) e arriva al punto P = (x, y). Per indicare un elemento di R2 useremo anche la notazione
x = (x1 , x2 ), che ha il vantaggio di estendersi naturalmente a ogni dimensione. Nel piano R2 consideriamo
le solite operazioni di somma
u + v = (u1 , u2 ) + (v1 , v2 ) := (u1 + v1 , u2 + v2 )
∀u = (u1 , u2 ) ∈ R2 , ∀v = (v1 , v2 ) ∈ R2
e di prodotto di una coppia per un numero reale
∀t, ∈ R , ∀u = (u1 , u2 ) ∈ R2
tu = t(u1 , u2 ) := (tu1 ,tu2 )
con le quali l’insieme R2 diviene uno spazio vettoriale su R. Ricordiamo che l’insieme dei due vettori
e1 := (1, 0)
,
e2 := (0, 1)
è una base di R2 , che chiameremo base standard. Ricordiamo anche che la funzione g : R2 × R2 →R che
alla coppia (u, v) associa il numero
g(u, v) := u1 v1 + u2 v2
è un prodotto scalare su R2 (si veda anche la successiva sezione 3.3), che chiameremo prodotto scalare
standard e, a seconda dei contesti e della comodità grafica, denoteremo anche u · v, oppure (u, v)R2 o semplicemente (u, v). Nonostante la potenziale confusione con la notazione per una coppia di vettori e con la
notazione per un intervallo aperto di numeri reali, non dovrebbero sorgere problemi. Al prodotto scalare
standard si associa la norma standard su R2
q
q
kuk := (u, u)R2 = u21 + u22
che si denoterà anche semplicemente |u|. Nella rappresentazione grafica del piano R2 , la norma di un vettore
u è la lunghezza della freccia che lo rappresenta, ossia la distanza del punto dall’origine. La distanza
(euclidea) standard d(u, v) tra due elementi u, v di R2 è definita come la norma del vettore differenza
d(u, v) := |u − v| = |v − u|. Avremo spesso la necessità di considerare due tipi di insiemi speciali:
• gli intervalli due dimensionali, detti anche rettangoli, ossia gli insiemi I = I1 × I2 che sono il prodotto
cartesiano di intervalli uno-dimensionali;
• le palle (aperte), in due dimensioni dette anche cerchi aperti, ossia gli insiemi del tipo
q
Br (x) := {y ∈ R2 d(x, y) < r} = {y ∈ R2 (x1 − y1 )2 + (x2 − y2 )2 < r}
dove il punto x e il numero positivo r si chiamano rispettivamente centro e raggio della palla.
Esercizio 2.1.1 i) Scegliere quattro numeri reali a1 , b1 , a2 , b2 e disegnare l’intervallo (a1 , b2 ) × (a2 , b2 ).
Scrivere le coordinate dei quattro vertici dell’intervallo. Descrivere i quattro lati dell’intervallo, sia con un
opportuno sistema di equazioni e disequazioni, sia con una opportuna parametrizzazione.
ii) Descrivere il quadrato aperto più grande tra quelli che sono contenuti nella palla aperta di centro x = (1, 3)
e raggio r = 2.
iii) Generalizzare le definizioni di intervallo e palla a 3 e 4 dimensioni e generalizzare gli esercizi i) e ii).
4
2.2 Misura come funzione di insieme - cosa ci aspettiamo da una buona nozione di ‘misura’.
Nella matematica dell’antica Grecia le grandezze (omogenee) si misuravano l’una con l’altra e due grandezze
dello stesso tipo potevano avere tra loro rapporti espressi da numeri naturali, oppure essere incommensurabili. Fissata una grandezza come unità di misura, le altre si potevano esprimere in rapporto a questa.
Con lo sviluppo della notazione decimale posizionale dei numeri, delle frazioni, del calcolo con i numeri
e con le lettere, e inoltre con l’emergere di grandezze per le quali era poco praticabile o impensabile fare
direttamente il confronto e la somma, si affermò l’idea di ‘misura’ come di un numero, ottenuto con certi
criteri e procedure, e con riferimento a certe ‘unità di misura’.
Oggi in matematica, dato un insieme X qualsiasi e denotato con P(X) l’insieme delle parti di X, si chiama
genericamente misura su X una funzione
m : F →B
dove F ⊂ P(X) è una famiglia di sottoinsiemi di X, e l’insieme B, in cui la misura prende i suoi valori,
può essere di diversi tipi: nella gran parte del corso prenderemo B = [0, +∞], ossia considereremo misure
a valori positivi o infinito, ma sono interessanti e largamente usate anche misure a valori reali o complessi
e misure a valori in spazi vettoriali, anche di dimensione infinita (ad esempio in meccanica quantistica si
considerano misure a valori nello spazio degli operatori autoaggiunti in uno spazio di Hilbert).
Una misura m come sopra, e la famiglia F su cui m è definita, avranno in genere alcune proprietà, che
potranno collegare la misura con altre strutture (topologiche, metriche, algebriche) presenti sull’insieme X.
Vedremo gradualmente nelle prossime lezioni diversi esempi che chiariranno e preciseranno queste prime
affermazioni. Nel seguito di questa sezione inizieremo a pensare informalmente a misure sugli spazi Rn ,
che catturino le idee intuitive e classiche di lunghezza, area, volume, e ci chiederemo che proprietà vorremmo avere per tali misure − vedremo poi nel seguito del corso cosa sarà possibile dimostrare e sotto quali
condizioni. Per semplicità ragioneremo ora sull’area in R2 . Per la lunghezza in R e per il volume in R3 si
avranno situazioni analoghe e la generalizzazione a Rn sarà del tutto naturale seguendo l’analogia formale
e utilizzando qualche opportuna rappresentazione, anche se non possiamo ‘vedere’ cosa accade in più di tre
dimensioni.
Una misura, la chiameremo m, che catturi l’idea di area nel piano, la vorremmo definita su tutti i sottoinsiemi
del piano e a valori positivi, zero o infinito:
m : P(R2 )→[0, +∞]
(1)
La misura di un segmento S ad esempio dovrà essere zero e la misura di tutto il piano dovrà essere +∞.
Ci aspettiamo poi che la misura di un rettangolo R = (a1 , b1 ) × (a2 , b2 ) si ottenga come ‘base per altezza’:
m((a1 , b1 ) × (a2 , b2 )) = (b1 − a1 )(b2 − a2 )
(2)
Ci aspettiamo inoltre che la misura sia invariante per traslazioni , ossia:
m(T (E)) = m(E)
,
per ogni traslazione T
(3)
e per trasformazioni ortogonali, ossia:
m(U(E)) = m(E) ,
per ogni trasformazione ortogonale U
(4)
dove ricordiamo che le trasformazioni ortogonali sono le applicazioni lineari U : R2 →R2 che conservano il
prodotto scalare e la distanza standard:
(U(v),U(w))R2 = (v, w)R2
∀v, w ∈ R2
Osserviamo che la proprietà (3) collega la misura con la struttura lineare (o meglio affine) di R2 e indica una
‘compatibilità’ tra le due. Le proprietà (2) e (4) indicano la compatibilità della misura con la struttura ortogonale, e quindi con la struttura metrica. Oltre a queste proprietà appena dette, la misura ne dovrà avere altre
che si descrivono in termini soltanto della relazione di inclusione tra insiemi e delle operazioni di unione
e intersezione. Per quanto possano parere scontate, queste ultime sono in effetti le proprietà fondamentali
che caratterizzano il concetto di misura e, come vedremo, consentono di generalizzarlo a spazi qualsiasi.
5
Monotonia della misura:
m(E) ≤ m(F)
∀E ⊂ F
,
(5)
Subadditività:
∀E, F ⊂ R2
(6)
∀E, F ⊂ R2 tali che E ∩ F = 0/
(7)
m(E ∪ F) ≤ m(F) + m(F)
,
Additività:
m(E ∪ F) = m(F) + m(F)
,
Si vede subito che le (5) e (6) insieme sono equivalenti a
m(A) ≤ m(F) + m(F)
∀A, E, F ⊂ R2 tali che A ⊂ E ∪ F
,
(8)
e nel seguito troveremo comodo usare questo tipo di monotonia e subadditività combinata. Si vede anche
subito che da (6) segue l’analoga proprietà nel caso di tre insiemi:
m (E1 ∪ E2 ∪ E3 ) = m E1 ∪ E2 ∪ E3 ≤ m E1 ∪ E2 + m(E3 ) ≤ m(E1 ) + m(E2 ) + m(E3 )
e per induzione si ottiene poi la subadditività finita della misura:
m(
k
[
k
)Ek ≤ ∑ m(Ek )
i=1
,
∀Ei ⊂ R2
(9)
i=1
Analogamente, da (7) si ottiene l’additività finita per insiemi a due a due disgiunti:
m(
k
[
i=1
k
)Ek = ∑ m(Ek )
,
∀Ei ⊂ R2 tali che Ei ∩ E j = 0/ ∀i 6= j
(10)
i=1
Purtroppo, come vedremo, non è possibile trovare una misura nel piano, che sia invariante per traslazioni
e additiva per tutte le coppie di sottoinsiemi disgiunti! Questo è un fatto non difficile da dimostrare, ma
delicato, che usa in modo cruciale l’assioma della scelta (si veda ad esempio http://en.wikipedia.org/
wiki/Vitali_set, http://goo.gl/w54N) e ad esso è sostanzialmente equivalente. Dal momento che
con l’assioma della scelta si dimostrano tante cose del tutto ragionevoli, ce lo teniamo volentieri per buono
anche se di conseguenza dobbiamo rinunciare all’additività su tutte le coppie di insiemi disgiunti. Tuttavia,
come vedremo, la via d’uscita da questo problema è ottima: riusciremo comunque a trovare una misura (la
misura di Lebesgue) che ha tutte le caratteristiche volute e che è additiva (anzi: numerabilmente additiva in
una classe M molto ampia di insiemi, che comprende ad esempio tutti gli insiemi aperti e gli insiemi chiusi
del piano, che chiameremo insiemi m-misurabili.
Osserviamo che l’additività e la subadditività ci interessano anche nel caso di una unione di infiniti insiemi.
1 1
, j ], dove j = 1, 2, ..., è l’intervallo (0, 1] e l’additività
Ad esempio l’unione degli infiniti intervalli E j = ( j+1
funziona benissimo. Occorrerà però limitare il ‘grado’ di infinito delle famiglie di insiemi di cui si fa
l’unione. Infatti: si pensi che un quadrato Q del piano si può vedere come l’unione di tutti gli insiemi
costituiti ciascuno da un solo punto del quadrato, i quali sono ovviamente a due a due disgiunti
Q=
[
{x}
x∈Q
se valesse l’additività anche in questo caso, ne seguirebbe che la misura di Q, che è un numero positivo,
sarebbe uguale a una somma di zeri. Ma una somma di zeri, per quanto numerosi, è difficile sostenere che
sia un numero positivo3 . D’altra parte il caso che ci interessa è quello di una successione di insiemi, ossia
di una famiglia numerabile di insiemi, e vedremo che limitandoci a richiedere l’additività in questo caso,
che chiameremo additività numerabile, tutto funzionerà. Presenteremo nelle prossime lezioni una teoria
sistematica e per ora diamo un esempio interessante, che utilizzeremo in vario modo nel seguito.
3 Agli
inizi del Calcolo si facevano ragionamenti di questo tipo con gli infinitesimi. Tali ragionamenti già allora sembravano poco
consistenti e furono dismessi con lo sviluppo del rigore nel corso dell’Ottocento. La situazione è simile a quella di uno dei paradossi di
Zenone, che cito molto liberamente: un grano di miglio cadendo non fa rumore, quindi non si sente rumore facendone cadere insieme
2, 3, 4 ecc. , ma quando si arriva a un sacco di miglio, questo cadendo fa rumore!
6
2.3
Insieme di Cantor
.
Costruiremo una successione di aperti Ek contenuti nell’intervallo [0, 1], che poi toglieremo dall’intervallo
stesso per ottenere l’insieme di Cantor C, si confronti con l’esempio 10.19 di G.Greco - Calcolo Differenziale e integrale, volume I. Definiamo per cominciare l’aperto E1 , il lettore segua il discorso con un disegno,
come l’intervallo aperto centrale che si ottiene dividendo l’intervallo [0, 1] in tre parti uguali; in altre parole:
1 2
,
3 3
E1 =
Consideriamo poi i due segmenti S1 = [0, 31 ) e S2 = ( 23 , 1] che si ottengono togliendo E1 da [0, 1]; dividiamo ciascuno di tali segmenti in tre intervalli uguali, e in ciascuno di questi prendiamo l’intervallo aperto
centrale. Facciamo l’unione di questi due intervalli centrali e otteniamo l’insieme
E2 :=
1 2 7 8
∪ ,
,
9 9
9 9
Per continuare la costruzione togliamo E1 ∪ E2 da [0, 1] e troviamo quattro intervalli. In ciascuno di essi
prendiamo il terzo centrale e di questi facciamo l’unione
E3 :=
1 2 7 8 18 19 25 26 ,
∪
,
∪
,
∪
,
27 27
27 27
27 27
27 27
Proseguendo ulteriormente, costruiamo insiemi Ek , ognuno dei quali è unione di 2k−1 intervalli disgiunti,
ciascuno di lunghezza 3−k . Pertanto, detta λ la misura di lunghezza che vorremmo avere definita sulle parti
di R, avremo, per additività:
2k−1
λ(Ek ) = k
3
Se consideriamo infine l’aperto
[
E :=
Ek
k∈N
poiché anche gli insiemi Ek sono due a due disgiunti, per l’additività numerabile avremo
∞
λ(E) =
1
∞
2
1
1
∑ λ(Ek ) = 3 ∑ ( 3 )k = 3 · 1 − 2
k=1
k=0
=1
3
A questo punto chiamiamo insieme di Cantor l’insieme
C := [0, 1]/E
e osserviamo che per l’additività della misura λ abbiamo λ(C)+λ(E) = λ1 ([0, 1]) = 1, da cui segue λ1 (C) =
0. Pur essendo un insieme di misura nulla, l’insieme di Cantor, come vedremo, ha la stessa cardinalità di
R, che è maggiore della cardinalità di N. A partire dall’insieme di Cantor si può costruire una funzione
u : [0, 1]→[0, 1]
detta funzione di Cantor o anche funzione di Cantor-Vitali, che ha le seguenti proprietà:
i)
u è monotona crescente;
ii) u è continua;
iii) u è derivabile in ogni punto dell’aperto E definito sopra e ha derivata zero in tutti i punti di E.
La funzione di Cantor-Vitali è un po’ imbarazzante (o impressionante): riesce a salire da zero a 1 ‘senza
farsi vedere’... se uno guarda un punto a caso dell’intervallo di definizione troverà che non sta crescendo...
la derivata è quasi sempre zero. Si suggerisce di provare per esercizio a costruire questa funzione. Per ulteriori informazioni si rimanda a http://en.wikipedia.org/wiki/Cantor_function(la pagina inglese è
leggermente più completa di quella italiana) e ad altre fonti facilmente reperibili in rete.
7
3
Lezione − venerdı̀ 21 settembre 2012
10.30 - 12.30 (2 ore)
Prime definizioni del concetto di integrale
3.1 Area e volume nel Seicento prima del Calcolo
Anche in seguito alla pubblicazione a stampa dell’opera allora conosciuta di Archimede, avvenuta a Basilea
nel 1543, tra la fine del Cinquecento e l’inizio del Seicento, in particolare in Italia, si svilupparono gli studi
sul volume dei solidi, sul calcolo del centro di massa di un solido e sul calcolo dell’area di figure sottese al
grafico di una funzione. L’argomento attirava molta attenzione e anche Johannes Kepler e Galileo Galilei
diedero contributi, non però di speciale importanza: Keplero scrive nel 1615 un trattato sul volume delle
botti per il vino e Galileo scrive intorno al 1600 un trattato sul centro di gravità, che sarà pubblicato soltanto
molto più tardi come appendice al Discorsi e dimostrazioni matematiche sopra due nuove scienze. Importanti contributi furono dati invece da Bonaventura Cavalieri, che intorno al 1630 ebbe l’idea di determinare
l’area di una figura piana o solida attraverso le sezioni della figura con la famiglia di tutte le rette parallele
a una retta data, o con la famiglia di tutti i piani paralleli a un piano dato. Con questa idea, che ritroveremo
e utilizzeremo in diverse forme nella teoria dell’integrazione, ad esempio nelle formule di riduzione per gli
integrali multipli (o Teorema di Fubini) e che va sotto il nome di metodo degli indivisibili, Cavalieri ottenne
il seguente risultato, che enunciamo in linguaggio moderno:
Principio di Cavalieri Siano A, B due sottoinsiemi dello spazio euclideo e sia F la famiglia di tutti i piani
paralleli a un piano dato. i) Se per ogni piano P ∈ F gli insiemi A ∩ P e B ∩ P sono uguali, allora anche
A e B sono uguali; ii) se per ogni piano P ∈ F gli insiemi A ∩ P e B ∩ P stanno in un certo rapporto, allora
anche A e B stanno nello stesso rapporto.
Cavalieri diede tale enunciato come Teorema, ma la sua dimostrazione non soddisfaceva i matematici più
rigorosi del tempo, che ne criticarono il fondamento. In ogni modo, con questa tecnica Cavalieri ottenne
molti risultati nuovi sul volume dei solidi e ottenne anche una importante formula di quadratura per l’area
sottesa dal grafico delle funzioni y = xn , la cui dimostrazione fu migliorata e completata da altri matematici
del tempo come come Pierre de Fermat, René Descartes, Gilles de Roberval. Enunciamo anche questo
risultato con linguaggio moderno.
Teorema 3.1.1 L’area sottesa dal grafico della funzione y = xn nell’intervallo [0, a], dove a è un numero
Z a
an+1
an+1
. In altre parole
xn dx =
.
positivo, è
n+1
n+1
0
In quello stesso momento, dopo la pubblicazione della Géometrie di Descartes, i matematici erano molto
interessati anche al cosiddetto problema delle tangenti, ossia il problema di determinare l’equazione della
retta tangente a una curva di equazione data. A questo problema furono date diverse soluzioni da Descartes,
Fermat, Roberval, Evangelista Torricelli, in particolare anche per le curve di equazione y = xn . In questo
contesto di ricerche, verso la metà del secolo XVII, diversi matematici, in particolare James Gregory (che
aveva studiato a Padova con Stefano Degli Angeli, allievo di Cavalieri), Isaac Barrow, Isaac Newton, si
xn+1
resero conto in vario modo di un fatto interessante: la funzione
, che esprime l’area sotto il grafico
n+1
n
n
di x nell’intervallo [0, a], nel punto di ascissa x = a ha pendenza a , ossia (ci permettiamo di usare un
linguaggio che allora non era noto, ma sarebbe stato inventato poco dopo):
Z x
d
t n dt = xn
(11)
dx 0
In altri termini si ha
F 0 (x) = xn
Z x
, dove si è introdotta la notazione F(x) =
0
t n dt per la funzione integrale
della funzione y = xn . Questo risultato altro non è che il Teorema Fondamentale del Calcolo per le funzioni
del tipo y = xn , da cui si può ottenere il Teorema Fondamentale del Calcolo per i polinomi. Da qui alle
serie di potenze il passo non era cosı̀ lungo . . . il terreno era pronto per la nascita del Calcolo differenziale
e integrale, che si ebbe nella seconda metà del secolo XVII grazie a Isaac Newton e Gottfried Wilhelm
Leibniz.
Le nozioni di derivata e integrale introdotte da Newton e Leibniz furono potentissimi strumenti sia per
il calcolo, sia per pensare e descrivere il mondo fisico e, nonostante le incertezze dovute alla vaghezza
8
dei fondamenti e dei ragionamenti con gli infinitesimi e gli infiniti, consentirono ai matematici del Settecento (la famiglia Bernoulli, Euler, D’Alembert, Lagrange . . . ) di ottenere risultati strabilianti. Ma
gradualmente, anche a causa delle contraddizioni in cui cadevano talvolta anche i matematici più insigni, emerse la necessità di rendere più chiari i fondamenti e più rigorose le dimostrazioni del Calcolo e di pervenire a una Analisi Matematica su cui non vi fossero più dubbi. All’inizio dell’Ottocento
questa tendenza crebbe di importanza e portò man mano a una revisione e fondazione dei concetti di
limite, continuità, derivata, integrale, serie, che furono appoggiati su una teoria dei numeri reali, a sua
volta costruita a partire dall’aritmetica, dai numeri naturali e dalla teoria degli insiemi, la quale ebbe infine una sistemazione assiomatica con lo sviluppo della logica all’inizio del secolo XX. Uno fra i primi
momenti importanti di questo processo furono le Lezioni di Analisi di Augustin Louis Cauchy all’École
Politéchnique di Parigi, nelle quali si trova in particolare la prima definizione di integrale per una classe
di funzioni, le funzioni continue su un intervallo chiuso e limitato (Résumé des Leçons données à l’École
Royale Polytecnique sur le calcul infinitésimal 1823 - Ouvres Compl. 2 serie IV, lez. 21 p. 122-127
http://gallica.bnf.fr/ark:/12148/bpt6k90196z/f125n6.capture).
3.2 L’integrale di Cauchy
Sia [a, b] un intervallo chiuso e limitato di numeri reali e sia data una funzione f : [a, b]→R . Per ogni
numero naturale n ∈ N consideriamo il numero
n
S( f , n) :=
∑ f (x j )(x j − x j−1 )
(12)
j=1
dove
xj = a+ j
b−a
n
∀ j = 0, 1, . . . n
b−a
.
n
Il numero S( f , n) si chiama somma di Cauchy relativa alla funzione f e alla partizione {x0 , x1 , . . . x j , . . . xn }
dell’intervallo [a, b]. Cauchy dimostrò4 il seguente
Osserviamo che x0 = a e xn = b e che gli intervalli [x j−1 , x j ] hanno tutti la stessa lunghezza
Teorema 3.2.1 Integrale secondo Cauchy Per ogni funzione continua f : [a, b]→R esiste il
lim S( f , n)
(13)
n→+∞
Z b
Il valore del limite (27) viene chiamato integrale della funzione f sull’intervallo [a, b] e si denota
f (x)dx
a
o anche semplicemente
Rb
a
f.
Dimostrazione. Diamo qui uno schema della dimostrazione del Teorema precedente e suggeriamo agli studenti di completare i dettagli, poiché è un eccellente esercizio, che consente di mettere alla prova competenze fondamentali di analisi, che dovrebbero essere state sviluppate nel primo anno di studi, e di ripassare
alcuni importanti fatti di base sugli spazi metrici e sulle funzioni continue. Per comodità raccogliamo tali
fatti nella successiva sezione 3.3.
Passo 1. Si osserva che l’intervallo chiuso e limitato [a, b] è un insieme compatto (Teorema 3.3.7 di
Bolzano-Weierstrass.
Passo 2. La funzione f , che (per ipotesi) è continua [a, b] , è anche uniformemente continua su [a, b]
(Teorema 3.3.10).
Passo 3. Grazie alla uniforme continuità di f , con un po’ di lavoro si riesce a vedere che la successione
S( f , n) è una successione di Cauchy, come in (25).
Passo 4. Poiché la successione S( f , n) è di Cauchy, grazie alla completezza dello spazio metrico dei
numeri reali (si veda l’esercizio 3.3.16 e la proposizione che viene poco dopo l’esercizio), il limite (27)
esiste e la dimostrazione è conclusa.
È opportuno fare diverse osservazioni.
4 In effetti la dimostrazione che si trova nell’opera citata non è totalmente chiara nell’uso e nella precisa distinzione dei concetti di
continuità e di continuità uniforme, ma la cosa a nostri fini è irrilevante.
9
Osservazione 3.2.2 Le somme di Cauchy si possono costruire anche in altri modi più generali. Ad esempio
per ogni n ∈ N si può considerare una partizione {x0 , x1 , . . . x j , . . . xn } , dove
a = x0 < x1 < x2 < . . . x j−1 < x j < . . . xn = b
(14)
costituita da punti non necessariamente equidistanti. Anche in questo caso si può dimostrare che il limite
(27) esiste, purché le partizioni scelte soddisfino alla condizione
lim max |x j − x j−1 | = 0
n→+∞
(15)
j
la quale garantisce che i punti delle partizioni si infittiscano dappertutto nell’intervallo [a, b]. Si può dimostrare, con le stesse idee precedenti, che il limite (27) esiste anche se nelle somme di Cauchy a ciascuno
dei valori f (x j ) si sostituisce un valore f (ξ j ) calcolato in un punto qualsiasi ξ j ∈ [x j−1 , x j ].
Osservazione 3.2.3 Si dimostra immediatamente che l’integrale definito nel Teorema 3.2.1 è un funzionale
lineare sullo spazio vettoriale C0 ([a, b]), ossia
Z b
Z b
( f + g) =
a
Z b
f+
a
Z b
g
Z b
tf = t
e
a
a
f
∀t ∈ R ∀ f , g ∈ C0 ([a, b])
(16)
a
Basta infatti osservare che S( f , n) è lineare rispetto a f per ogni n fissato e passare al limite per n che va
all’infinito. Analogamente si vede che l’integrale è monotono (o positivo):
Z b
a
f ≤
Z b
g
∀ f , g ∈ C0 ([a, b])
tali che
f ≤g
(17)
a
Inoltre si mostra facilmente che se c ∈ [a, b], allora
Z b
Z c
f=
a
Z b
f+
a
f
c
Osservazione 3.2.4 La nozione di integrale introdotta da Cauchy si estende immediatamente a funzioni che
sono continue a tratti su un intervallo [a, b], ossia che sono continue su ciascuno degli intervalli [tk−1 ,tk ] di
una partizione fissata t0 ,t1 , . . .tn di [a, b]: basta infatti sommare gli integrali in ciascuno dei sotto-intervalli.
L’integrale si può estendere inoltre a funzioni non limitate o definite su un intervallo non limitato [c, d],
prendendo il limite, se esiste, degli integrali su sottointervalli chiusi e limitati che invadono l’intervallo
[c, d]. Non si riescono però a integrare funzioni con infiniti punti di discontinuità.
3.3 Richiami su spazi metrici, funzioni continue, norme, prodotto scalare.
In questa sezione raccogliamo per comodità del lettore alcune definizioni, notazioni e teoremi che abbiamo
citato nella sezione precedente e che useremo in diversi momenti del corso. Cogliamo anche l’occasione
per suggerire alcuni esercizi che intendono aiutare gli studenti ad approfondire questioni che troveremo più
avanti nel corso.
Definizione 3.3.1 Sia X un insieme. Ricordiamo che si dice distanza su X una funzione d : X × X→R tale
che ∀x, y ∈ X si ha
i) d(x, y) ≥ 0;
ii) d(x, y) = d(y, x);
iii) d(x, y) ≤ d(x, z) + d(y, z);
iv) d(x, y) = 0 ⇒ x = y.
Un insieme X con una distanza d si chiama spazio metrico.
Ricordiamo che: se d è una distanza su X, x ∈ X e r > 0 , allora l’insieme Br (x) = {y ∈ X d(x, y) < r} si
chiama palla (aperta) di centro x e raggio r rispetto alla distanza d. Ricordiamo anche che un sottoinsieme
A di X si dice aperto, se per ogni x ∈ X esiste un numero r > 0 tale che Br (x) ⊂ A; un sottoinsieme F si
dice chiuso se il suo complementare F c := X \ F è un insieme aperto. La famiglia degli aperti di uno spazio
metrico è una topologia, che si dice indotta dalla distanza.
Già nella sezione 2.1 abbiamo visto la distanza euclidea standard nel piano e le palle aperte rispetto a questa
distanza. Vediamo ora qualche generalizzazione e altri esempi. Negli spazi vettoriali sono di particolare
interesse le distanze invarianti per traslazioni. Distanze di questo tipo si ottengono tipicamente partendo da
una norma.
10
Definizione 3.3.2 Si dice norma su uno spazio vettoriale reale V una funzione
|| || : V →R
|| || : u 7→ ||u||
;
tale che
i)
||u|| ≥ 0
ii)
||tu|| = |t| · ||u||
iii)
||u + v|| ≤ ||u|| + ||v||
iv)
||u|| = 0
comunque preso u in V ;
comunque presi u in V e t in R
(la norma è positivamente omogenea);
comunque presi u, v in V
(la norma è subadditiva);
se e solo se x = y.
Uno spazio V sul quale sia data una norma si chiama spazio normato.
Si vede immediatamente che, se || || è una norma su V , allora la funzione
d(u, w) = ||u − w||
è una distanza, che si dice indotta dalla norma. Tale distanza è invariante per traslazioni, ossia
d(u, w) = d(u + a, w + a)
∀u, w, a ∈ V
Esercizio 3.3.3 Trovare una distanza in R2 tale che le palle rispetto ad essa siano intervalli 2-dimensionali
(gli intervalli sono definiti nella sezione 2.1).
Esercizio 3.3.4 Sia [a, b] un intervallo chiuso e limitato in R. Si mostri che le funzioni definite sotto sono
norme sullo spazio vettoriale C0 ([a, b]).
k f k∞ = max | f (x)|
(18)
[a,b]
k f k1 =
k f k2 =
Z b
| f (x)|dx
(19)
a
b
Z
| f (x)|2 dx
12
(20)
a
Un’importante famiglia di norme si ottiene dai prodotti scalari. Ricordiamo che
Definizione 3.3.5 Un prodotto scalare g su uno spazio vettoriale reale V è una funzione g : V × V →R
tale che5
i)
g è lineare in ciascuna delle variabili, tenendo l’altra fissata (g è una funzione bilineare);
ii)
g(u, w) = g(w, u)
iii)
g(u, u) ≥ 0
iv)
g(u, u) = 0
comunque presi u, w vettori di V (g è una funzione simmetrica);
per ogni vettore u di V ;
⇒
u = 0.
Si vede facilmente che (verificare per esercizio): Se g è un prodotto scalare su V , allora le funzioni
p
||u||g := g(u, u)
;
dg (u, w) = ||u − w||g
sono rispettivamente una norma e una distanza su V , che si dicono associate al prodotto scalare g.
Esercizio 3.3.6 Mostrare che, prese due norme qualsiasi k k] e k k[ su Rn , esistono due numeri positivi a,
b tali che
kwk] ≤ akwk[ ≤ bkwk]
∀w ∈ Rn
e che, di conseguenza, tutte le topologie indotte da una norma su Rn sono tra loro equivalenti.
5 Alcuni autori non includono la proprietà iv) nella definizione e, se iv) è pure verificata, dicono che il prodotto scalare è ‘definito
positivo’; in questa sede, per semplicità, includeremo iv) nella definizione e per noi tutti i prodotti scalari saranno ‘definiti positivi’.
11
Vediamo ora alcuni risultati che riguardano la compattezza, una proprietà topologica di speciale importanza
per l’analisi matematica. Ricordiamo che un sottoinsieme K di uno spazio metrico (X, d) si dice compatto
se per ogni successione {x j } di elementi di K esistono una sottosuccessione {x j p } e un elemento y di K tali
che
lim x j p = y
ossia
lim d(x j p , y) = 0
p→+∞
p→+∞
Ricordiamo anche il seguente ben noto teorema
Teorema 3.3.7 Teorema di Bolzano-Weierstrass.
Un sottoinsieme di Rn è compatto (rispetto alla topologia indotta dalla distanza euclidea standard) se e
solo se è chiuso e limitato.
Per la dimostrazione in dimensione 1 rimandiamo al libro di G.Greco citato nella prima lezione. Il caso
n-dimensionale si ottiene immediatamente dal caso 1-dimensionale estraendo via via sottosuccessioni per
le quali converge la prima coordinata, poi la seconda, etc . . . .
Definizione 3.3.8 Siano dati due spazi metrici X e Y con le distanze dX e dY . Ricordiamo che una funzione
f : X → Y si dice continua in un punto a ∈ X se
∀ε>0 ∃δ>0
:
dX (a, x) < δ ⇒ dY ( f (a), f (x)) < ε
(21)
La funzione f si dice continua su un sottoinsieme E ⊂ X se è continua in ciascun punto di E.
La funzione f si dice uniformemente continua su X se
∀ε>0 ∃δ>0
:
∀a, b ∈ X
dX (a, b) < δ
⇒
dY ( f (a), f (b)) < ε
(22)
La funzione f si dice uniformemente continua su un sottoinsieme E ⊂ X se la restrizione di f a E è
uniformemente continua su E considerato come sottospazio metrico di X.
È evidente che una funzione f uniformemente continua su E è anche continua su E, e non vale invece
l’implicazione opposta.
√
Esercizio 3.3.9 Mostrare che le funzioni x, sin x, x sono uniformemente continue sul loro insieme di
definizione, mentre la funzione x2 non è uniformemente continua su R e la funzione 1/x non è uniformemente continua sull’intervallo (0, 1).
Teorema 3.3.10 Siano X e Y spazi metrici e sia f : X → Y . Se E ⊂ X è un insieme compatto e f è continua
su E, allora f è uniformemente continua su E.
Dimostrazione. (Per assurdo) Supponiamo che la tesi del teorema sia falsa. Allora vale la negazione della
(22):
∃ ε > 0 : ∀ δ > 0 ∃u, v ∈ E : distX (u, v) < δ ⇒ distY ( f (u), f (v)) ≥ ε
(23)
e in particolare ne segue che esiste un ε > 0 tale che, per ogni n ∈ N, esistono un e vn in E per i quali valgono
entrambe:
1
(i)
dX (un , vn ) <
, (ii)
dY ( f (un ), f (vn )) ≥ ε
n
Poiché E è compatto, esiste una sottosuccessione unk che converge a un punto u ∈ E, ossia dX (unk , u) → 0
per k → ∞. Ne segue che anche vnk converge a u, infatti
dX (u, vnk ) ≤ dX (u, unk ) + dX (unk , vnk )
→ 0.
Poiché f è continua su E, entrambe le successioni f (unk ) e f (vnk ) convergono a f (u) e questo implica che
dY ( f (unk ), f (vnk )) → 0, che contraddice la (ii). Cosı̀ la prova è conclusa.
Dal teorema segue in particolare che ogni funzione continua su un intervallo chiuso e limitato di R è uniformemente continua.
Classi naturali di funzioni uniformemente continue si ottengono richiedendo la proprietà che la distanza
fra le immagini di ogni coppia punti sia controllata da una funzione della distanza tra i punti. Il caso più
semplice è il seguente.
12
Definizione 3.3.11 Siano X e Y spazi metrici. Una funzione f : X → Y si dice Lipschitz-continua o
semplicemente lipschitziana se
∃L≥0
:
∀a, b ∈ X
dY ( f (u), f (v)) ≤ LdX (u, v).
(24)
Se vale la (24) allora si dice che il numero L è una costante di Lipschitz per la funzione f . Si vede facilmente (dimostrarlo per esercizio) che l’insieme delle costanti di Lipschitz di una funzione f ha minimo.
Questo minimo si denota talvolta Lip( f ). Una funzione f : X → Y si dice lipschitziana su un sottoinsieme
E ⊂ X se la restrizione di f a E è lipschitziana su E considerato come sottospazio metrico di X.
Esercizio 3.3.12 Se f è lipschitziana su uno spazio metrico X allora è immediato che f è uniformemente
continua su X. Esistono invece funzioni uniformemente continue su X che non sono lipschitziane su X .
Trovare un esempio nel caso X = [0, 1].
Esercizio 3.3.13 Sia I è un intervallo in R e sia f : I → R continua e derivabile su I. Se f 0 è limitata su I
allora f è lipschitziana su I e precisamente si ha Lip( f ) = supI | f 0 |
Una conseguenza immediata dell’esercizio precedente è che le funzioni sin x, cos x, arctan x sono lipschitziane su R, con costante di Lipschitz uguale a 1.
Concludiamo i richiami con la nozione di completezza di uno spazio metrico.
Definizione 3.3.14 Sia X uno spazio metrico con una distanza d. Una successione (xn ) a valori in X si dice
di Cauchy se
∀ε > 0 ∃k ∈ N : p, r > k ⇒ d(x p , xr ) < ε
(25)
Ricordiamo che una successione (xn ) a valori in X converge (o è convergente) se esiste un elemento y ∈ X
tale che lim xn = y, ossia d(xn , y) → 0.
n→∞
È immediato che se una successione in X converge, allora è di Cauchy. Non è vero invece in generale che
se una successione è di Cauchy allora essa è convergente, ma vi sono spazi nei quali ciò accade sempre.
Definizione 3.3.15 Uno spazio metrico nel quale ogni successione di Cauchy converge si dice completo.
Esercizio 3.3.16 (i) Mostrare che gli spazi Rn sono completi rispetto alla distanza euclidea.
(ii) Mostrare che l’intervallo aperto (0, 1) e l’insieme Q dei numeri razionali, con la metrica indotta da R,
non sono spazi metrici completi.
Esercizio 3.3.17 Mostrare che ogni successione di Cauchy è limitata, ossia esiste una palla Br (x) che
contiene tutti gli elementi della successione.
Il seguente semplice risultato, insieme all’esercizio precedente e al teorema di Bolzano-Weierstrass, dimostra che gli spazi Rn sono completi.
Proposizione 3.3.18 Se una successione di Cauchy (xn ) in X ha una sottosuccessione (xnk ) convergente,
allora (xn ) converge.
Dimostrazione. Chiamiamo y ∈ X il limite della sottosuccessione (xnk ). Sia ε > 0 e sia k corrispondente a
ε come in (25). Poiché lim nk = ∞ e lim d(xnk , y) = 0 si può trovare un s ∈ N tale che
k→∞
k→∞
ns ≥ k
d(xns , y) < ε
e
Per ogni p ≥ k si ha allora
d(x p , y) ≤ d(x p , xns ) + d(xns , y) < 2ε
e la prova è conclusa.
13
3.4 L’integrale di Cauchy per funzioni di due variabili e le formule di riduzione
Siano dati due intervalli 1-dimensionali [a, b] e [c, d] e consideriamo l’intervallo 2-dimensionale
E = [a, b] × [c, d]. Sia poi f : E→R una funzione continua. Vogliamo definire l’integrale di f su E usando
la stessa idea con cui nella sezione precedente abbiamo definito l’integrale per le funzioni di una variabile.
A questo fine, comunque presi n, k ∈ N, consideriamo le partizioni (il lettore faccia un disegno...):
xi = a + i
b−a
n
∀i = 0, 1, . . . n
yj = a+ j
;
c−d
k
∀ j = 0, 1, . . . k
che si ottengono dividendo [a, b] in n parti uguali e [c, d] in k parti uguali, e consideriamo la somma di
Cauchy
n
k
S( f , n, k) := ∑ ∑ f (xi , y j )m(Ri j )
(26)
i=1 j=1
b−a d −c
dove Ri j = [xi − xi−1 ] × [y j − y j−1 ] e m(Ri j ) =
è l’area del rettangolo Ri j . Ciascun termine
·
n
k
della somma (26) è il volume di un parallelepipedo che ha come base il rettangolino Ri j e come altezza
il valore della funzione in uno dei vertici del rettangolino stesso. Con le stesse idee indicate nella sezione
precedente si può dimostrare anche il seguente
Teorema 3.4.1 Per ogni funzione continua f : E→R esiste il
lim S( f , n, n)
(27)
n→+∞
Z
f (x)dxdy
Il valore del limite (27) viene chiamato integrale della funzione f sull’insieme E e si denota
o anche semplicemente
E
R
E
f.
Grazie alla uniforme continuità di f su E si può anche dimostrare che
lim lim S( f , n, k) = lim S( f , n, n) = lim lim S( f , n, k)
k→+∞ n→+∞
n→+∞
n→+∞ k→+∞
(28)
Usando la (26), l’ultimo limite doppio a destra nella formula precedente si può riscrivere come segue
n
lim lim S( f , n, k) = lim lim
n→+∞ k→+∞
n
lim
n→+∞
n→+∞ k→+∞
k
∑
i=1
lim
∑
k→+∞ j=1
f (xi , y j )
d −c
k
!
n→+∞
∑ ∑ f (xi , y j )
i=1 j=1
n
b−a
= lim ∑
n→+∞
n
i=1
n
lim
k
∑ H(xi )
i=1
b−a
=
n
b−a d −c
·
=
n
k
Z
d
c
b−a
f (xi , y)dy
=
n
Z b
H(x)dx
a
Z d
dove nel penultimo passaggio si è posto H(x) =
f (x, y)dy e nel terz’ultimo passaggio si è usata la
c
definizione di integrale secondo Cauchy della funzione H(x) (che è continua su [a, b]), ossia il fatto che
k
∑ f (xi , y j )
k→+∞
lim
j=1
d −c
=
k
Z d
c
f (xi , y)dy
per ogni i = 1, 2, . . . n fissato. Un risultato analogo vale per il doppio limite a sinistra nella (28) e
complessivamente si ottiene cosı̀
Z
Z b Z d
Z d Z b
f (x, y)dxdy =
f (x, y)dy dx =
f (x, y)dx dy
(29)
E
a
c
c
a
Le formule (29) si chiamano formule di riduzione per gli integrali di funzioni di due variabili e sono un
importante strumento per il calcolo e per la teoria. Ne vedremo diverse generalizzazioni e applicazioni.
14
4
Lezione − lunedı̀ 24 settembre 2012
10.30 - 12.30 (2 ore)
Primi esercizi sugli integrali
4.1 Primi esercizi sugli integrali di funzioni di due variabili e sul volume dei solidi
Ricordiamo che se X è un insieme ed E è un sottoinsieme di X, si dice funzione caratteristica di E la
funzione
1 se x ∈ E
ϕE : X→R
,
ϕE (x) =
0 se x ∈
/E
Scriviamo ora in una forma generale la formula di riduzione per gli integrali di funzioni di due variabili,
che è stata illustrata nella lezione precedente nel caso di funzioni definite su un rettangolo6 .
Formula di riduzione per gli integrali doppi. Sia f : R2 →R una funzione integrabile (il termine sarà
precisato assai più avanti), allora si ha
Z
Z Z
Z Z
f (x, y)dxdy =
f (x, y)dy dx =
f (x, y)dx dy
(30)
R2
Rx
Ry
Ry
Rx
Noi costruiremo la nostra teoria dell’integrazione in modo che la misura k-dimensionale mk di un insieme
misurabile E ⊂ Rk sia uguale all’integrale della sua funzione caratteristica ϕE
Z
mk (E) =
E
ϕE dmk
Pertanto la (30), nel caso particolare in cui si integri una funzione caratteristica f = ϕE diventa
Z
Z
Z Z
ϕEx (y)dy dx =
lunghezza(Ex )dx
area(E) =
ϕE (x, y)dxdy =
R2
Ry
Rx
(31)
Rx
dove: per ogni a ∈ R, Ea := {y ∈ R (a, y) ∈ E} è la sezione dell’insieme E con la retta di equazione x = a;
si è scritto area(E) in vece di m2 (E) e lunghezza(Ex ) in vece di m1 (Ex ).
Formule analoghe alle precedenti valgono in R3 e in Rn e le consideriamo tutte quante come una versione
moderna del Principio di Cavalieri. Come esempio scriviamo esplicitamente alcune formule di riduzione in
dimensione 3.
Formule di riduzione per gli integrali tripli. Sia f : R3 →R una funzione integrabile, allora si ha
!
Z
Z Z
Z
Z
R3
f (x, y, z)dxdy =
f (x, y, z)dz dxdy =
R2xy
Rz
Z
Rx
Z
Z
Ry
f (x, y, z)dydz dx =
f (x, y, z)dz dy dx
=
Rx
R2yz
Rz
L’ordine in cui si integra successivamente nelle tre variabili x, y, z può essere scelto arbitrariamente. In diverse situazioni è necessario valutare quale ordine sia il più comodo e, come vedremo, si possono ottenere
interessanti informazioni uguagliando le integrazioni ripetute in ordine diverso.
Svolgiamo ora alcuni esercizi per illustrare il significato e l’uso delle formule di riduzione.
Esercizio 4.1.1 Sia a > 0. Il cerchio di raggio a e centro l’origine è l’insieme
Ba = {(x, y) ∈ R2 x2 + y2 ≤ a2 }
Per il Principio di Cavalieri (o meglio, per il Teorma di Fubini), l’area di Ba è
√
!
Z
Z
Z a Z a2 −x2
ϕBa (x, y)dy dx =
area(Ba ) =
ϕBa (x, y)dxdy =
√
R2
−a
−
a2 −x2
a
p
2 a2 − x2 dx
−a
6 Anche se questa formula sarà enunciata precisamente come Teorema di Fubini e dimostrata soltanto verso la fine del corso, la
possiamo utilizzare fiduciosamente nei casi che verranno proposti come esercizio.
15
Con la sostituzione
x
= t e poi con la sostituzione t = sin u si ottiene
a
Z a p
a2 − x2 dx = 2a2
Z
−a
π
2
cos2 udu
0
e l’ultimo integrale si può calcolare ad esempio ricordando che cos(2x) = cos2 x − sin2 x = 2 cos2 x − 1,
oppure per parti (scrivendo cos2 x = cos x · cos x). Si ottiene cosı̀
π
1
1
1 π
area(Ba ) = 4a2 [ x − sin x cos x]02 = 4a2 · · = a2 π
2
2
2 2
Esercizio 4.1.2 Vogliamo calcolare l’integrale
π
2
Z
cosn (x)dx
0
che si incontra nel calcolo del volume della palla n-dimensionale. Cominciamo da un caso particolare e
cerchiamo la primitiva della funzione cos4 x. Proponiamo due strade. Ecco la prima:
Z
Z
cos4 xdx =
cos2 x(1 − sin2 x)dx =
Z
cos2 xdx −
1
2
Z
sin(2x)dx = etc...
Ed ecco la seconda, per parti:
Z
cos4 xdx =
Z
cos3 x cos xdx =
Possiamo cosı̀ calcolare
Z
π
2
1
3
cos3 x sin x +
4
4
cos4 (x)dx =
0
Z
cos2 xdx
3
π
16
Vediamo ora il caso generale. Posto
Z
cosn xdx
In =
si ha, integrando per parti e ricordando che sin2 x = 1 − cos2 x
Z
In =
n−1
cos
n−1
x cos xdx = cos
sin x + (n − 1)
Z
cosn−2 x sin2 xdx = cosn−1 sin x + (n − 1)In−2 − (n − 1)In
da cui si ottiene la formula ricorsiva
In =
1
n−1
cosn−1 sin x +
In−2
n
n
Si osservi che per n = 2 e n = 4 si ritrovano i casi particolari visti sopra. In modo analogo, il calcolo si
lascia come esercizio, si ottiene la primitiva della funzione sinn x
Z
1
n−1
sin xdx = − sinn−1 cos x +
n
n
n
Z
sinn−2 xdx
Esercizio 4.1.3 Calcoliamo la misura della palla n-dimensionale di raggio 1 in Rn . Come vedremo, e come
si intuisce, il volume della palla n-dimensionale di raggio R si ottiene moltiplicando per Rn il volume della
palla di raggio 1.
Per n = 3, affettando ad esempio con i piani z = t si ha
Z 1
vol3 (B1 ) = 2
0
area(Et )dt
dove
Et = {(x, y) ∈ R2xy (x, y, z) ∈ E} = {(x, y) ∈ R2xy x2 + y2 ≤ 1 − t 2 }
Abbiamo quindi
Z 1
vol3 (B1 ) = 2
0
4
π(1 − t2 )dt = π
3
16
Calcoliamo ora la misura 4-dimensionale della palla di raggio 1 in R4 . In modo analogo al caso precedente
si ha
Z
1
vol4 (B1 ) = 2
vol3 (Et )dt
0
dove
Et = {(x, y, z) ∈ R3xyz (x, y, z, w) ∈ E} = {(x, y, z) ∈ R3xyz x2 + y2 + z2 ≤ 1 − t 2 }
Abbiamo quindi
vol4 (B1 ) = 2
Z 1
4
3
π(1 − t2 ) 2 dt
0 3
Con la sostituzione t = sinu e ricordando l’esercizio precedente si trova infine
8
vol4 (B1 ) = π
3
Z
π
2
8
3
π2
cos4 udu = π · π =
3 16
2
0
Si lascia per esercizio di calcolare la misura delle palle di dimensione 5 e 6 e di trovare una formula generale
per le palle di dimesione n (ci sono formule differenziate per n pari e n dispari, si trovano ad esempio sul
libro Analisi matematica 2 di Enrico Giusti.
Esercizio 4.1.4 Si consideri il triangolo T in R2 di vertici (0, 0), (1, 3), (4, 0). Si calcolino i seguenti
integrali
Z
Z
1
1
xdxdy
,
ydxdy
area(T ) T
area(T ) T
Come vedremo meglio nella prossima lezione, questi integrali danno le coordinate del baricentro del
triangolo T .
Ecco infine tre esercizi, non svolti a lezione, che sono stati assegnati nella prima provetta di Analisi Matematica III dell’anno accademico 2011-12. Di questi esercizi è riportata la risoluzione, ma si consiglia agli
studenti di leggerla solamente dopo aver affrontato gli esercizi autonomamente.
Esercizio 4.1.5 Calcolare l’integrale
Z
xydxdy
E
dove E = (x, y) ∈ R2 0 ≤ y ≤ −x2 + 2x .
Si vede subito che il grafico della funzione y = −x2 + 2x = x(−x + 2) sta sopra l’asse x nell’intervallo (0, 2).
Si ha quindi
Z
Z 2
Z −x2 +2x
Z
1 2
8
xydxdy =
xdx
ydy =
x(−x2 + 2x)2 =
2 0
15
E
0
0
Esercizio 4.1.6 Calcolare il baricentro dell’insieme A = C \ F dove
C = (x, y) ∈ R2 1 ≤ x2 + y2 ≤ 4
,
F = (x, y) ∈ R2 x < 0, y < 0
L’area dell’insieme A è area(A) = 43 (4π − π) =
xG =
1
area(A)
9π
4 .
Z
xdxdy =
A
La coordinata xG del baricentro è
4
3π
Z 2
1
ρ2 dρ
Z π
− π2
cos θdθ =
28
27π
e yG = xG per ragioni di simmetria.
Esercizio 4.1.7 Si calcoli il volume dell’insieme U di R3 che si ottiene come intersezione della palla di
raggio 1 e centro l’origine con il semispazio z ≥ 1 + x.
√
La sezione del piano z = x + 1 con la palla unitaria è un cerchio che ha distanza 22 dall’origine (si disegni
la sezione di U con il piano xz) quindi, ruotando opportunamente
l’insieme U, si ottiene la parte di palla
√
unitaria e centro l’origine che sta sopra la quota z = 22 . Affettando ora rispetto alla variabile z si ottiene il
volume cercato:
Z 1
√ π
z3 1
vol(U) = √2 π(1 − z2 )dz = π[z − ] √2 = (8 − 5 2)
3 2
12
2
17
5
Lezione − giovedı̀ 27 settembre 2012
14.30 - 16.30 (2 ore)
Esercizi
5.1 Centro di massa.
Consideriamo due punti P1 = (x1 , y1 ) e P2 = (x2 , y2 ) in R2 e pensiamo a un sistema di masse costituito da
due masse m1 , m2 collocate rispettivamente nei punti P1 e P2 . Si chiama centro di massa, o baricentro, del
sistema il punto G = (xG , yG ) definito da
xG =
m1 x1 + m2 x2
m1 + m2
;
yG =
m1 y1 + m2 y2
m1 + m2
(32)
Il centro di massa G è caratterizzato dalla proprietà che: per qualsiasi vettore u del piano, è nullo il momento
totale M, rispetto al punto G , delle due forze: F1 = m1 v, applicata in P1 , e F2 = m2 v, applicata in P2 . Per
vedere questo basta ricordare che il momento di una forza F, applicata in un punto P1 , rispetto a un punto
generico P = (x, y) è M = (P1 − P) × F, dove si usa la notazione
1
v w1
v × w := det
(33)
v2 w2
per il prodotto vettoriale di due vettori v e w7 . Si ha pertanto che il momento totale M delle forze F1 = m1 u,
F2 = m2 u come sopra, rispetto a un punto generico P = (x, y) è
M = (P1 − P0 ) × F1 + (P2 − P0 ) × F2 = (P1 − P0 ) × m1 u + (P2 − P0 )e1 × m2 u
che per la bilinearità del determinante rispetto alle colonnne (o alle righe) diventa
M = (P1 − P0 )m1 + (P2 − P0 )m2 × u
Se si vuole che M si annulli per qualsiasi u, ciò deve valere in particolare quando u = (1, 0) e da questo si
ottiene facilmente la formula per yG ; inoltre deve valere quando u = (0, 1), e da questo si ottiene la formula
per xG .
Osserviamo che combinando le formule per xG e yG si può scrivere l’equazione vettoriale
m1 P1 + m2 P2
m1 + m2
G=
(34)
che si può interpretare come una media pesata dei due punti (vettori) P1 e P2 . Si vede subito che il punto G:
- appartiene al segmento di estremi P1 e P2 ;
- è il punto medio del segmento se le masse sono uguali;
- sta più vicino al punto dove si trova la massa maggiore;
- si avvicina sempre più a questo punto quanto più grande è il rapporto fra le due masse.
Se sono date masse m1 , ...mk poste nei punti P1 , ..., Pk il centro di massa del sistema, definito dalla stessa
proprietà caratteristica detta sopra, è
m1 P1 + ... + mk Pk
G=
(35)
m1 + ... + mk
In dimensione 3 si ha una definizione del tutto analoga.
Nel caso di una distribuzione di massa di cui sia data la densità8 ρ : R2 →R, dove ρ(x, y) ≥ 0 è una funzione
integrabile, il centro di massa è il punto G = (xG , yG ), dove
xG =
1
M
Z
R2
;
xρ(x, y)dxdy
e
yG =
1
M
Z
R2
yρ(x, y)dxdy
(36)
Z
M=
R2
ρ(x, y)dxdy)
7 Il prodotto vettoriale di due vettori che si trovano sul piano xy è un vettore diretto lungo l’asse z, che si può scrivere come un
numero reale moltiplicato per il vettore unitario dell’asse z; per semplicità prendiamo tale numero reale come prodotto vettoriale dei
due vettori v e w nel piano xy.
R
8 Ossia, per ogni insieme (misurabile) E ⊂ R2 , la massa che si trova in E è data dall’integrale
E ρ(x, y)dxdy.
18
è la massa totale della distribuzione.
Un caso speciale importante, che corrisponde all’idea fisica di un corpo omogeneo di densità costante,
è quello in cui ρ = ϕE è la funzione caratteristica di un insieme E. In tal caso il centro di massa della
distribuzione dipende soltanto da E, si chiama baricentro di E e si scrive
Z
Z
Z
1
1
GE = (xE , yE ) =
Pdxdy :=
xdxdy, ydxdy
(37)
area(E) E
area(E) E
E
dove abbiamo denotato con un solo integrale vettoriale i due integrali delle componenti del vettore P =
(x, y). La definizione si estende a sottoinsiemi di Rn per ogni n.
5.2 Esercizi sul baricentro di un insieme.
Esercizio 5.2.1 Si trovi il baricentro di un cono circolare retto di altezza h e raggio di base r.
Esercizio 5.2.2 Si trovi il baricentro di un settore circolare di ampiezza α in un cerchio di raggio R.
Esercizio 5.2.3 Si trovino il volume e il baricentro dei due sottoinsiemi di una palla di raggio R che vengono
separati da un piano posto a distanza h < R dal centro della palla.
Esercizio 5.2.4 i) Siano E ed F due insiemi nel piano o nello spazio. Si provi a dimostrare che
GE∪F =
vol(E)GE + vol(F)GF
vol(E) + vol(F)
e si enuncino le proprietà dell’integrale che occorre avere per fare la dimostrazione (poi le dimostreremo).
ii) La formula appena scritta consente anche di trovare il baricentro di un insieme C = A \ B ottenuto
sottraendo da un insieme A un suo sottoinsieme B. In particolare si trovi il baricentro di un tronco di
cono di altezza h e raggi r1 , r2 , con r1 < r2 , utilizzando la formula per il baricentro di un cono trovata
nell’esercizio 5.2.1.
Esercizio 5.2.5 Si dimostri che il baricentro di un triangolo di vertici P0 , P1 , P2 , inteso come in(37) è
uguale al baricentro di tre masse uguali poste nei vertici. Se non si riesce a fare una dimostrazione generale,
si cerchi comunque di mostrare l’enunciato per classi di triangoli le più ampie possibile.
Esercizio 5.2.6 Si trovi il baricentro dell’insieme
x y z
T = {(x, y, z) ∈ R3 x > 0, y > 0, z > 0, + + ≤ 1}
a b c
e si congetturi una formula generale per il baricentro di un tetraedro.
Esercizio 5.2.7 i) Se T : R2 →R2 è una traslazione, allora si dimostra facilmente (si prenda nota delle
proprietà dell’area o dell’integrale che eventualmente occorrono) che per ogni triangolo E in R2 il traslato
del baricentro di E è uguale al baricentro dell’insieme traslato T (E).
i) Sia L : R2 →R2 una trasformazione lineare e si dimostri che L(GE ) = GL(E) . Se non si riesce a fare una
dimostrazione generale, si cerchi comunque di mostrare l’enunciato per classi di triangoli e per classi di
trasformazioni lineari le più ampie possibile, individuando quali strade si potrebbero usare e quali enunciati
parziali o intermedi potrebbero essere utili.
5.3 Esercizi sugli integrali di funzioni di due e tre variabili.
1
dxdy
A y
Z
Esercizio 5.3.1 Calcolare l’integrale
dove
yzex
Z
Esercizio 5.3.2 Calcolare l’integrale
E
dove E è il semicilindro
p
x 2 + y2
A = {(x, y) y ≥ x2 , x ≥ y2 }.
dxdydz
{(x, y, z) x2 + y2 ≤ R2 , y ≥ 0 , 0 ≤ z ≤ b}.
19
6
Lezione − venerdı̀ 28 settembre 2012
8.30 - 10.30 (2 ore)
Coordinate affini, coordinate polari
6.1 Cambiamento della misura per trasformazioni lineari
Abbiamo già dichiarato nella sezione 2.2 che l’area, il volume e in generale la misura k dimensionale che
costruiremo in Rk dovranno essere invarianti per traslazioni e rotazioni. Ci aspettiamo invece che la misura
di un insieme f (E), dove f : Rk →Rk è una trasformazione lineare generale, sia diversa dalla misura di
E, infatti, se consideriamo ad esempio l’applicazione lineare f : R→R definita da f (x) = cx, dove c è un
numero reale fissato, si vede immediatamente che, per ogni intervallo [a, b] ⊂ R, l’immagine f ([a, b]) è un
intervallo di estremi f (a) e f (b) e quindi m( f ([a, b])) = |c|m([a, b]) . Vediamo cioè che l’applicazione f
trasforma la misura di un fattore di dilatazione |c|. Se |c| > 1, l’applicazione aumenta la misura; se |c| = 1,
l’applicazione non cambia la misura (in effetti è una isometria); se 0 ≤ c < 1, la misura diminuisce e nel
sotto-caso c = 0 l’applicazione f manda addirittura tutta la retta nel punto 0 che ha misura nulla. Un altro
esempio semplice da considerare è il seguente
Esempio 6.1.1 Sia G : R2 →R2 l’applicazione lineare definita da
x1
a1
G
G
e1 7−→ a1 e1 , e2 7−→ a2 e2
ossia
G:
7−→
x2
0
0
a2
x1
x2
(38)
dove e1 , e2 sono i vettori della base standard e a1 , a2 sono numeri reali. Si vede subito che la mappa
G manda il quadrato standard Q = [0, 1] × [0, 1] in un rettangolo di area |a1 a2 | e si comprende (la dimostrazione si vedrà più avanti) che il numero c = |a1 a2 | è anche il fattore di dilatazione dell’area che vale
per tutti i sottoinsiemi del piano. Vediamo un esempio appena più generale.
Esempio 6.1.2 Sia H : R2 →R2 l’applicazione lineare definita da
x1
a11
H
H
e1 7−→ a11 e1 , e2 7−→ a12 e1 + a22 e2
ossia
H:
7−→
x2
0
a12
a22
x1
x2
(39)
dove a11 , a12 , a22 sono numeri reali. La mappa H (fare un disegno) manda il quadrato standard
Q = [0, 1] × [0, 1] nel parallelogramma generato dai vettori H(e1 ), H(e2 ), il quale ha area (definita elementarmente) uguale a |a11 a22 | . Anche in questo caso si comprende che il numero c = |a11 a22 | è il fattore
di cambiamento dell’area che vale per tutti i sottoinsiemi del piano.
Per una trasformazione lineare generale si ha il seguente teorema.
Teorema 6.1.3 Sia L : Rk →Rk una applicazione lineare. Allora si ha
m(L(E)) = | det L| · m(E)
per ogni E ⊂ Rk
(40)
Dimostreremo più avanti questo teorema in due passi: con il primo passo vedremo che esiste un numero
c ≥ 0 tale che
m(L(E)) = c · m(E)
,
∀E ⊂ Rk ;
(41)
il secondo passo consisterà invece nel mostrare che c = | det L| e per ottenere questo basterà esibire un
insieme F ⊂ Rk tale che m(L(F)) = | det L|m(F) . Anche se non possiamo dimostrare i passi suddetti prima
di aver costruito i fondamenti della teoria della misura, possiamo subito comprenderne le idee essenziali.
L’idea del primo passo è che (a causa dell’invarianza della misura rispetto alle traslazioni) tutti i rettangoli
con i lati paralleli agli assi si trasformano con uno stesso fattore c ; ma allora (a causa dell’additività) anche
gli insiemi che sono unione disgiunta di rettangoli si trasformano con lo stesso fattore c ; e questo deve
allora valere per tutti gli insiemi che si approssimano con tali ‘plurirettangoli’, e cioè tutti i sottoinsiemi del
piano. Il secondo passo si può dimostrare in diversi modi. Diamo ora una idea di uno di questi modi, poi
più avanti seguiremo una via diversa. Osserviamo per cominciare che in dimensione due ogni applicazione
lineare L del piano in sé si può scrivere come composizione di applicazioni che hanno matrice triangolare
superiore o inferiore (dimostrarlo per esercizio...). Come si è visto nell’esempio 6.1.2, per ciascuna di tali
applicazioni vale la (41), che quindi vale per la loro composizione. In dimensione k > 2 si può comunque
mostrare che ogni applicazione lineare L si può scrivere come composizione di applicazioni lineari dei tre
tipi seguenti: i) con matrice diagonale; ii) permutazioni delle coordinate; iii) applicazioni del tipo:
H
e1 7−→ e1 + αe2
,
H
e2 7−→ e2 ,
,
20
H
e3 7−→ e3 ,
...
H
ek 7−→ ek
che sono triangolari nel piano generato da e1 , e2 e lasciano identiche le altre componenti dei vettori. Per le
applicazioni di ciascuno di questi tipi si vede facilmente il passo 2 e vale quindi la (41). Ma allora la (41)
deve valere anche per la loro composizione.
6.2 Coordinate affini
Chiamiamo rette vettoriali i sottospazi vettoriali di dimensione 1 e chiamiamo piani vettoriali i sottospazi
vettoriali di dimensione due in Rn . Se V è un sottospazio vettoriale di Rn di dimensione k, ogni traslato di
V , ossia ogni insieme del tipo W = V + P0 , si dice sottospazio affine k-dimensionale di Rn . Il sottospazio
vettoriale V si chiama direzione di W . I sottospazi affini di dimensione 1 e 2 si chiamano rette e piani in
Rn . I sottospazi affini k dimensionali si dicono anche k-piani.
Siano P0 e P1 due punti in Rk , con P0 6= P1 L’applicazione
γ : R −→ Rk
,
γ : t 7−→ P0 + t(P1 − P0 )
(42)
è iniettiva e ha come immagine la retta r che passa per i punti P0 e P1 . Osserviamo che γ(0) = P0 ,
γ(1) = P1 e l’intervallo [0, 1] viene mandato nel segmento di estremi P0 e P1 . Diciamo che γ è una
parametrizzazione affine della retta r e il numero t si può pensare come una coordinata affine sulla retta
r. Osserviamo che la parametrizzazione manda il punto 21 nel punto medio del segmento di estremi P0 e P1 .
Sia ora n ≥ 2 e siano P0 , P1 e P2 tre punti in Rn , non allineati (ossia tali che i vettori b1 = P1 − P0
e b2 = P2 − P0 siano linearmente indipendenti). Il piano che passa per i tre punti è P0 + V dove V è il
sottospazio vettoriale generato da b1 , b2 . L’applicazione
ψ : R2 −→ Rk
,
ψ : (u1 , u2 ) 7−→ P0 + u1 (P1 − P0 ) + u2 (P2 − P0 )
(43)
è iniettiva e ha come immagine il piano W . Se chiamiamo simplesso 2-dimensionale standard in R2 il
triangolo T2 in R2 di vertici 0, e1 , e2 , allora la parametrizzazione ψ manda T2 nel triangolo E di vertici P0 ,
P1 e P2 . Inoltre ψ manda il quadrato standard [0, 1] × [0, 1] nel parallelogramma (unico) che ha i punti P0 ,
P1 e P2 fra i suoi vertici. Diciamo che γ è una parametrizzazione affine del piano W e la coppia di numeri
(u1 , u2 ) si può pensare come un sistema di coordinate affini sul piano W . Osserviamo che se chiamiamo
e1 + e2
G :=
il baricentro dei tre punti 0, e1 , e2 , allora ψ(G) è il baricentro dei tre punti P0 , P1 e P2 .
3
Analoghe parametrizzazioni si possono dare per un k-piano in Rn , dove n ≥ k, identificato da k + 1 punti
P0 , P1 , . . . , Pk .
6.3 Applicazioni differenziabili definite su sottoinsiemi in Rk a valori in Rn
In questa sezione stabiliremo termini e notazioni relativi alle applicazioni differenziabili definite su sottoinsiemi di Rk e a valori in Rn . Scriveremo i risultati per dimensioni k, n generiche, ma il lettore è invitato a
riscrivere le formule e a costruirsi esempi e visualizzazioni nei casi 1 ≤ k ≤ n ≤ 3, che sono di più immediato interesse e saranno quelli più comuni anche negli esercizi.
Denotiamo con u = (u1 , ..., uk ) i punti di Rk e con e1 , ..., ek la base standard di Rk . Denotiamo inoltre con
x = (x1 , ..., xn ) i punti di Rn e con ε1 , ..., εn la base standard in Rn .
Sia A un aperto in Rk e consideriamo una funzione ψ : A→Rn . Per ogni u ∈ A scriviamo
ψ(u) = (ψ1 (u), ..., ψn (u)) = ψ1 (u)ε1 +
...
+ ψn (u)εn
dove le funzioni ψi : A→R sono le componenti di ψ. La funzione ψ è continua in un punto u ∈ A se e
solo se tutte le componenti ψi sono continue in quel punto. La funzione ψ si dice di classe C1 (A) se e solo
se tutte le componenti ψi sono funzioni classe C1 (A), ossia hanno tutte le derivate parziali in tutti i punti
di A e le funzioni derivate parziali sono continue su A. Induttivamente, una funzione si dice poi di classe
Cr (A), dove r ∈ N, se tutte le sue derivate esistono in ogni punto di A e sono di classe Cr−1 (A). Infine una
funzione è di classe C∞ se è di classe Cr per ogni r ∈ N.
21
Nel caso in cui 1 = k ≤ n e ψ è continua, allora diremo che ψ è una curva parametrizzata. Se 2 = k ≤ n
e ψ è continua, allora diremo che ψ è una superficie parametrizzata. Nella maggior parte dei casi noi considereremo curve e superfici parametrizzate che sono di classe C1 o C1 a tratti e saranno spesso, ma non
necessariamente iniettive. Un altro caso di interesse è quello di funzioni lipschitziane. Vedremo più avanti
diversi esempi.
Ricordiamo che una funzione di n variabili a valori in Rn si può interpretare in due modi significativamente
diversi. Un modo, che si usa in particolare se la funzione è un diffeomorfismo tra aperti di Rn , è quello di
vederla come un sistema di coordinate: nella sezione precedente abbiamo visto le parametrizzazioni affini
del piano, vedremo più avanti le coordinate polari e le coordinate sferiche, nonché altri sistemi di coordinate
che introdurremo ad hoc per risolvere problemi specifici. Un altro modo è quello di vedere una funzione
F : E→Rn , dove E ⊂ Rn , come un campo di vettori su E, dove E non è detto sia un aperto e può essere ad
esempio una sottovarietà di dimensione minore di n. In questo punto di vista, se x ∈ E, per rappresentare il
vettore F(x) spesso si pensa o si disegna una freccia che parte dal punto x ∈ E e arriva nel punto x + F(x).
Questo corrisponde all’idea che F(x) è un vettore applicato nel punto x e appartiene in effetti a una copia
di Rn che ha l’origine nel punto x.
Una funzione ψ : A→Rn si dice differenziabile nel punto u ∈ A, se esiste una funzione lineare L : Rk → Rn
tale che
E(u)
ψ(u) = ψ(u) + L(u − u) + E(u)
;
lim
=0
u→u |u − u|
In tal caso, la funzione lineare L si chiama differenziale di ψ nel punto u e noi la denoteremo dψ(u) .
I vettori w che stanno nel dominio Rk di L si devono pensare come vettori tangenti all’aperto A nel punto
u (con un linguaggio un po’ antico, ma significativo, ancora usato in fisica o in meccanica, tali vettori si
dicono anche vettori applicati nel punto u). Tali vettori tangenti sono le possibili velocità (nel punto u) delle
curve differenziabili a valori in A che passano per u e sono anche i possibili vettori rispetto ai quali fare la
∂ψ
(u) della funzione ψ nel punto u, definita da:
derivata direzionale
∂w
∂ψ
ψ(u + tw) − ψ(u)
(u) := lim
t→0
∂w
t
Dalla definizione di differenziale di ψ in u si vede subito che per ogni w ∈ Rk si ha
∂ψ
∂ψ1
∂ψn
(u) =
(u), . . . ,
(u)
dψ(u) (w) =
∂w
∂w
∂w
Ricordiamo che le derivate parziali rispetto ai vettori della base standard ei si denotano comunemente
Si scrive pertanto
dψ(u) (ei ) =
∂ψ
(u) =
∂ui
∂ψ1
(u),
∂ui
...
∂ψ
.
∂ui
∂ψn
(u)
∂ui
Per un generico vettore w = w1 e1 + · · · + wk ek ∈ Rk , scrivendo ora in colonna le coordinate dei vettori in Rk
e Rn , abbiamo quindi:


∂ψ1
∂ψ1
∂ψ1
.
.
.
∂uk 
 ∂u1 ∂u2




w1


∂ψ2  
∂ψ
∂ψ
 ∂ψ2 ∂ψ2

dψ(u) (w) = w1 1 (u) + ...wk k (u) =  ∂u1 ∂u2 . . . ∂uk  ·  ... 
 .

∂u
∂u
..
.. 
 ..
wk
.
...
. 

∂ψn
∂ψn
∂ψn
. . . ∂u
∂u
∂u
1
2
k
dove tutte le derivate parziali sono calcolate nel punto u. La matrice n × k delle derivate parziali di ψ in u
rappresenta il differenziale dψ(u) rispetto alle basi standard di Rk e Rn e si chiama matrice jacobiana di ψ
in u; noi la denoteremo Dψ(u) .
22
Ricordiamo che se una funzione ψ è di classe C1 (A), allora è differenziabile in ogni punto di A e ricordiamo
che invece la sola esistenza delle derivate parziali di una funzione in un punto non implica la differenziabilità
in quel punto. Ricordiamo anche il
Teorema 6.3.1 del diffeomorfismo locale. Sia A un aperto di Rn , e sia ψ : A→Rn di classe C1 . Supponiamo inoltre che il differenziale dψ(u) nel punto u ∈ A sia iniettivo, allora esiste un intorno G di u tale che
ψ|G è un diffeomorfismo tra G e ψ(G).
Per la dimostrazione si rimanda agli appunti di Analisi II del prof. Gabriele Greco.
6.4 Intervalli in R
Per completezza raccogliamo qui le notazioni che usiamo per gli intervalli in R. Siano a, b ∈ R con a < b.
Per gli intervalli in R useremo le notazioni:
(a, b) = {x ∈ R a < x < b}
[a, b] = {x ∈ R a ≤ x ≤ b}
[a, b) = {x ∈ R a ≤ x < b}
(a, b] = {x ∈ R a < x ≤ b}
(−∞, b] = {x ∈ R x ≤ b}
[a, +∞) = {x ∈ R a ≤ x}
(a, +∞) = {x ∈ R a < x}
(−∞, b) = {x ∈ R x < b}
(−∞, +∞) = R
Gli intervalli non limitati da una parte si chiamano anche semirette.
6.5 Coordinate polari
Consideriamo la funzione ψ : (0, +∞) × R → R2 definita da
ψ : (ρ, θ) 7→ (ρ cos θ, ρ sin θ)
che si descrive anche come
x
y
∀ρ ∈ (0, +∞) , ∀θ ∈ R
= ρ cos θ
= ρ sin θ
(44)
(45)
È immediato che ψ è una funzione di classe C1 e anzi C∞ e che l’immagine di ψ è uguale al piano R2 privato
dell’origine. Per comprendere il comportamento della mappa ψ la lettrice è invitata a fare alcuni disegni
della situazione. Ad esempio, conviene tracciare le curve che si ottengono restringendo la funzione ψ alle
semirette θ = θ0 : si vede cosı̀ che al variare di ρ da 0 a +∞, il punto ψ(ρ, θ0 ) percorre una semiretta uscente
dall’origine che forma un angolo θ0 con la semiretta positiva dell’asse x. Inoltre si vede che per ρ = ρ0 ,
al variare di θ in R, il punto ψ(ρ0 , θ) percorre infinite volte la circonferenza di raggio ρ0 . Restringendo
opportunamente il dominio di ψ si ottiene un diffeomorfismo:
Proposizione 6.5.1 Considerati gli aperti
A = (0, +∞) × (0, 2π) ⊂ R2
;
Ω = R2 − {(x, y) ∈ R2 x ≥ 0, y = 0}
la mappa ψ ristretta a A è un diffeomorfismo di classe C1 tra A e Ω.
Dimostrazione. Si vede subito che Ω = ψ(A) e che ψ ritretta ad A è iniettiva. Osserviamo che la matrice
jacobiana Dψ(ρ, θ) è


∂x
∂x
∂ρ
∂θ
cos θ −ρ sin θ


(46)

=
sin θ ρ cos θ
∂y
∂y
∂ρ
∂θ
In particolare, per ogni punto (ρ, θ) di A, si ha det(Dψ(ρ,θ) ) = ρ > 0 e da questo segue che anche il differenziale dψ(ρ,θ) : R2 → R2 è invertibile. In questa situazione, per il teorema 6.3.1 del diffeomorfismo locale, si
ha che la funzione ψ è un diffeomorfismo di un opportuno intorno di (ρ, θ) su un intorno di (x, y) = ψ(ρ, θ).
In particolare dunque ψ−1 è di classe C1 in un intorno del punto (x, y). Poiché questo vale per ogni punto
(x, y) ∈ Ω, la funzione inversa ψ−1 : Ω → A è di classe C1 (Ω) e in conclusione ψ : A → Ω è un diffeomorfismo, come si voleva dimostrare.
La mappa ψ ristretta all’aperto A si chiama sistema di coordinate polari nel piano.
23
Anticipiamo qui ulteriori considerazione sulle coordinate polari, svolte in realtà nella lezione di giovedı̀ 4 ottobre.
Per comprendere meglio le coordinate polari, studiamo come si comportano intorno a un punto generico.
Consideriamo allora un punto fissato P0 = (ρ0 , θ0 ) ∈ A (il lettore può fare un disegno ad esempio prendendo
ρ0 = 3 e θ0 = 43 π) e poniamo M0 := ψ(P0 ) ∈ R2xy . Chiamiamo inoltre L0 il differenziale di ψ nel punto P0 .
Per capire come agisce la mappa ψ, vedremo ora come essa trasforma le curve che passano per il punto P0 .
Per prima cosa consideriamo una curva parametrizzata α : I→A , dove I = (−δ, δ) è un intorno di 0 in R,
definita da
α(t) := P0 + te1
ossia
α(t) = (ρ0 , θ0 ) + (t, 0) = (ρ0 + t, θ0 )
Ricordiamo che denotiamo e1 , e2 i vettori della base standard in nel piano ρθ . Si vede subito che α(0) =
P0 e che la curva α percorre un segmento della retta di equazione θ = θ0 , parallela all’asse ρ. La velocità
della curva α nel punto P0 è α0 (0) = e1 .
Consideriamo ora la curva σ : I→R2xy definita da σ(t) := ψ(α(t)) , ossia la trasformata della curva α
attraverso ψ. La curva σ passa per il punto M0 e percorre un segmento della semiretta che congiunge
l’origine con il punto M0 nel piano xy . Denotiamo b1 := σ0 (o) la velocità della curva σ nel punto
M0 . Per la definizione di derivata parziale (o per il teorema di derivazione di una funzione composta in più
variabili, come si preferisce), si ha
b1 =
∂ψ
(ρ0 , θ0 ) = L0 (e1 )
∂ρ
In modo analogo si può considerare una curva β, parallela all’asse θ che passa per P0 e ottenere la derivata
parziale di ψ rispetto a θ nel punto P0 :
b2 :=
∂ψ
(ρ0 , θ0 ) = L0 (e2 )
∂θ
Ricordando la definizione (44) della mappa ψ si vede subito che
b1 = (cos θ0 , sin θ0 )
b2 = (−ρ0 sin θ0 , ρ0 cos θ0 )
;
(si faccia il disegno nel caso già indicato di ρ0 = 3 e θ0 = 43 π) e si osserva che valgono le seguenti:
|b1 | = 1
; |b2 | = ρ0
;
b1 · b2 = 0
dove l’ultima relazione ci dice che i vettori b1 e b2 sono ortogonali. Insomma vediamo che il differenziale
L0 di ψ nel punto P0 trasforma i vettori della base standard in due vettori b1 e b2 tra loro ortogonali e
di lunghezza rispettivamente 1 e ρ0 . Pertanto L0 trasforma il quadrato standard di lati e1 e2 , cha ha area
unitaria, nel rettangolo di lati b1 b2 , che ha area ρ0 . Dunque il fattore con cui la mappa lineare L0 trasforma
l’area è ρ0 , che è proprio il determinante di L0 (il modulo non è rilevante, perché si tratta di un numero
positivo). Poiché la mappa L0 approssima bene la mappa ψ ‘vicino’ al punto P0 , in queste vicinanze anche
ψ trasforma l’area di un fattore ρ0 .
24
7
Lezione − Lunedı̀ 1 ottobre 2012
10.30 - 12.30 (2 ore)
Cambiamento di variabile negli integrali
7.1 Primi esempi di curve parametrizzate
Definizione 7.1.1 Una curva parametrizzata in uno spazio metrico E è una funzione continua γ : I→E,
dove I è un intervallo in R.
Noi siamo interessati in particolare alle curve negli spazi Rn e agli integrali lungo (su) tali curve. Vediamo
in questa sezione qualche primo esempio di curve. L’integrazione sulle curve sarà sviluppata gradualmente.
Esempio 7.1.2 La curva parametrizzata
γ : [0, 4π] → R2
che descriviamo anche
,
x
y
γ(t) = (R cost, R sint)
(47)
= R cost
= R sint
ha come immagine la circonferenza di raggio R e centro O nel piano e questa circonferenza viene ‘percorsa’
due volte (il punto (R, 0) viene in effetti raggiunto tre volte). La curva è di classe C∞ .
Dall’esempio si vede bene come sia necessario distinguere tra l’immagine S = γ(I), che è un sottoinsieme
di R2 , e la funzione γ : I → Rn , che dice come l’insieme S viene percorso. Qualche volta si usa però il
termine ‘curva’ anche per indicare l’insieme S, e la funzione γ si chiama ‘parametrizzazione’ di S. Altri
chiamano S ‘sostegno’ della curva γ. Nonostante questa confusione che si ha comunemente nel linguaggio,
con un po’ di attenzione non sorgono equivoci.
Esercizio 7.1.3 Mostrare che la curva γ definita in (47), ristretta all’intervallo aperto I = (a, a + 2π), dove
a è un numero reale fissato arbitrariamente, è iniettiva ed è un omeomorfismo da I sull’insieme costituito
dalla circonferenza meno il punto P = (cos a, sin a).
Esercizio 7.1.4 Si descriva una curva parametrizzata iniettiva a valori in R2 , la cui immagine sia l’ellisse
di centro 0 e di semiassi a e b.
Esercizio 7.1.5 Disegnare il sostegno della curva
α(t) = (R cost, R cost)
;
t ∈R
e visualizzare mentalmente il movimento del punto α(t) al variare del parametro t. Si osservi che la curva
è di classe C∞ .
Esercizio 7.1.6 Si descriva una curva parametrizzata iniettiva di classe C1 a valori in R2 , la cui immagine
sia la frontiera del quadrato [0, 1] × [0, 1].
Esercizio 7.1.7 Si scriva esplicitamente una funzione γ definita su un opportuno intervallo I a valori in R2 ,
iniettiva e di classe C1 , che descriva la cicloide, ossia la traiettoria di un punto P che si trova sul bordo di
un cerchio di raggio R, collocato in un piano xy, al rotolare del cerchio stesso sopra l’asse x. [Suggeriamo
di pensare che il cerchio si trovi all’inizio del rotolamento col centro nel punto (0, R) e con il punto P
in corrispondenza dell’origine (0, 0). Suggeriamo inoltre di prendere come parametro del rotolamento
l’angolo θ in radianti. Dopo un giro completo, cioè per il valore θ = 2π del parametro, il centro del cerchio
sarà nel punto (2πR, R) e il punto P si troverà di nuovo sull’asse x, in corrispondenza del punto (2πR, 0).
Vediamo anche un esempio di curva nello spazio 3-dimensionale. . .
Esempio 7.1.8 La curva
γ : R → R3
,
γ(t) = (R cost, R sint,t)
(48)
si dice elica cilindrica di raggio R. Disegnare l’insieme γ([−π, 4π]). Si riesce con mezzi elementari a dire
quanto è lunga questa curva?
25
. . . e un esempio di curva nello spazio 1-dimensionale . . .
Esempio 7.1.9 La curva
h:R→R
,
h(t) = sin 2t
,
t ∈ [0, π]
(49)
si muove sulla retta e ha come immagine l’intervallo [−1, 1]. Quanto è lunga questa curva? Vediamo che la
curva parte da 0 quando t = 0, poi si muove fino al punto 1 (per t = π4 ), torna indietro fino a −1 (per t = 3π
4 )
e infine arriva al punto 0 quando t = π. Nel complesso la curva h percorre due volte il segmento [−1, 1] e
la sua lunghezza (la lunghezza del cammino, non del sostegno) è 4. Osserviamo che questa lunghezza si
ottiene calcolando l’integrale
Z
π
lunghezza(h) =
|h0 (t)|dt
0
e la stessa formula evidentemente si può usare per calcolare la lunghezza di una curva a valori in R di classe
C1 che abbia un numero finito di massimi e minimi: la lunghezza del cammino totale è infatti la somma
dei valori assoluti delle differenze tra ogni minimo (o massimo) e il massimo (o minimo) successivo e basta
usare il teorema fondamentale del calcolo per trovare la formula appena indicata.
Osservazione 7.1.10 Occorre fare attenzione a non confondere tra di loro il cammino in R descritto dalla
funzione h dell’esempio precedente e il cammino in R2
γ : [0, π] → R2
,
γ(t) = (t, h(t))
(50)
che percorre il grafico {(x, y) ∈ R2 x ∈ [0, π] , y = h(x)} della funzione h. Evidentemente la lunghezza
del cammino che percorre il grafico di h è maggiore della lunghezza del cammino di h in R. Ricordiamo
che una definizione di lunghezza del grafico (si rimanda al libro citato di G. Greco) si è vista nel corso di
Analisi 1:
Z πq
Z πq
0
2
1 + |h (t)| =
1 + 4| cos 2t|2
0
0
Ricordiamo che l’ultimo integrale sappiamo che esiste, possiamo approssimarlo,
possiamo trovare delle
q
formule che lo esprimono in termini di altri integrali, ma la primitiva di 1 + 4| cos 2t|2 non è esprimibile
in termini di funzioni elementari.
Studieremo più avanti in generale la questione di come definire la lunghezza di una curva e di come
calcolarla.
7.2 Formula di integrazione per sostituzione
In questa sezione ricorderemo come dalla formula per la derivata di una funzione composta e dal Teorema
Fondamentale del Calcolo si ottiene una formula di cambiamento di variabile per gli integrali in dimensione
1. Questo approccio non si generalizza a dimensioni maggiori o uguali di 2. Nella prossima sezione vedremo una diversa dimostrazione della formula di cambiamento di variabile in dimensione 1, la cui idea si
può generalizzare al caso di mappe da Rn in Rn e anche da Rk in Rn . Descriveremo schematicamente tale
generalizzazione nell’ultima sezione.
Sia I = [a, b] un intervallo in R e consideriamo una funzione g : [a, b]→R di classe C1 ([a, b]) e iniettiva, che possiamo pensare come una curva parametrizzata a valori in R. Poiché g è continua, l’immagine H = g(I) della funzione g è un insieme compatto e connesso e quindi è un intervallo chiuso e
limitato: H = [c, d]. Poiché g è iniettiva e continua, deve essere monotona: crescente con la derivata
g0 (t) ≥ 0 ∀t ∈ [a, b] , oppure decrescente, con la derivata g0 (t) ≤ 0 ∀t ∈ [a, b] . Nel primo caso si avrà
g(a) = c , g(b) = d e nel secondo caso si avrà g(a) = d , g(b) = c . In entrambi i casi può capitare
che la derivata di g si annulli in un certo insieme di punti; di conseguenza la funzione inversa di g, che è
necessariamente continua, non è detto sia differenziabile in tutti i punti di [c, d], in particolare non è detto
che g sia un diffeomorfismo.
Consideriamo ora una funzione continua f : [c, d]→R e sia F : [c, d]→[c, d] una funzione primitiva di f ,
ossia tale che F 0 (x) = f (x) . Evidentemente la funzione F è di classe C1 su [a, b] e anche la funzione
composta F ◦ g : [a, b]→R lo è. La derivata di tale funzione composta in un punto t ∈ [a, b] è
[F ◦ g]0 (t) = F 0 (g(t))g0 (t) = f (g(t))g0 (t)
26
Nel caso in cui g sia crescente, utilizzando il Teorema Fondamentale del Calcolo, abbiamo quindi
Z
f (g(t))g0 (t)dt =
Z b
I
f (g(t))g0 (t)dt =
Z b
a
[F ◦ g]0 (t)dt =
a
= [F ◦ g](b) − [F ◦ g](a) = F(g(b)) − F(g(a) =
Z g(b)
Z d
f (x)dx =
g(a)
Z
f (x)dx =
c
f (x)dx
(51)
H
dove a destra abbiamo un integrale nella variabile x e a sinistra un integrale nella nuova variabile t, nel
quale compaiono la funzione f (g(t)), ossia la funzione f espressa nella nuova variabile, e la funzione g0 (t)
che tiene conto dello ‘stiramento’ della lunghezza nel passaggio da una variabile all’altra; approfondiremo
questa idea poco più avanti in questa sezione.
Nel caso in cui g sia decrescente, e quindi g(a) > g(b), in modo analogo otteniamo:
Z
f (g(t))g0 (t)dt =
I
Z b
Z
f (g(t))g0 (t)dt = − F(g(b)) − F(g(a) = −
a
d
f (x)dx = −
c
Z
f (x)dx (52)
H
e le (51) e (52), qualunque sia il segno di g0 , si possono condensare nella
Z
Z
f (g(t))|g0 (t)|dt =
f (x)dx
I
(53)
g(I)
La formula precedente sarà chiamata cambiamento di variabile nell’integrale (in dimensione uno).
Se poi si ricorda la definizione di integrale orientato (si veda ad esempio G.Greco. Calcolo Differenziale e
integrale, volume I, cap 10):
 R
se a < b
Z b
 [a,b] f (x)dx
f (x)dx =
(54)
 R
a
− [b,a] f (x)dx se a > b
le (51) e (51), qualunque sia il segno di g0 , si possono condensare nell’unica formula
Z b
f (g(t))g0 (t)dt =
Z g(b)
f (x)dx
a
(55)
g(a)
Quest’ultima formula sarà chiamata cambiamento di variabile nell’integrale orientato (in dimensione uno).
Vedremo nelle prossime due sezioni che entrambe le (53) e (55) si possono generalizzare a dimensioni
maggiori di uno, ma non con il metodo di dimostrazione fin qui seguito.
Un caso particolare importante della (53) si ha nel caso in cui f (x) = 1 per ogni x:
Z
|g0 (t)|dt =
I
ossia
Z
Z
dx
g(I)
|g0 (t)|dt = lungh(g(I))
(56)
I
Detto in parole: la lunghezza dell’immagine di I è uguale all’integrale su I di |g0 (t)|. Ricordando la
definizione di derivata, abbiamo quindi
lungh g Br (t)
|g0 (t)| = lim
r→0
lungh Br (t)
dove Br (t) = [t − r , t + r] , e questo mostra bene il significato del numero |g(t)| come fattore di dilatazione
(o restringimento) della lunghezza causato dal cambiamento di variabile g intorno al punto t.
27
7.3 Cambiamento di variabile negli integrali in dimensione 1
Nella sezione precedente abbiamo ottenuto la formula di cambiamento di variabile (53) utilizzando la formula per la derivata della funzione composta e il Teorema Fondamentale del Calcolo. In questa sezione
ritroveremo la stessa formula di cambiamento di variabile utilizzando un altro approccio. A questo fine sia
g : [a, b]→R di classe C1 ([a, b]) , tale che g0 > 0, g(a) = c , g(b) = d e sia f : [c, d]→R una funzione
continua. Ricordando la definizione di integrale di Cauchy e l’osservazione 3.2.2, abbiamo che
n
Z d
f (x)dx = lim
n→∞
c
∑ f (η j )(x j − x j−1 )
j=1
dove:
1. per ogni n ∈ N, {x0 , x1 , . . . x j , . . . xn } è una partizione dell’intervallo [a, b]
2. per ogni j = 1, ...n η j ∈ [x j−1 , x j ]
3. le partizioni soddisfano alla condizione di ‘infittirsi’ quanto si vuole al tendere di n all’infinito:
lim max |x j − x j−1 | = 0
n→∞
(57)
j
Grazie al teorema del valor medio di Lagrange, per ogni n ∈ N e ogni j = 1, ..., n possiamo scrivere
x j − x j−1 = g0 (ξ j )(t j − t j−1 )
dove t j = g−1 (x j ) e ξ j sta fra t j e t j−1 . Se scegliamo η j = g(ξ j ) abbiamo
n
n
∑ f (η j )(x j − x j−1 )
=
j=1
∑ f (g(t j ))g0 (ξ j )(t j − t j−1 )
j=1
A questo punto aggiungiamo una ipotesi, che semplifica tecnicamente la situazione senza oscurare il ragionamento e che alla fine, volendo, si potrà rimuovere: supponiamo che g0 ≥ δ > 0 su [a, b]. Dunque g è
un diffeomorfismo e la derivata di g−1 è limitata da un numero M; quindi (t j − t j−1 ) ≤ M(x j − x j−1 ) e da
(57) segue che
lim max |t j − t j−1 | = 0
(58)
n→∞
j
Abbiamo pertanto
Z d
f (x)dx = lim
c
n→∞
n
Z b
j=1
a
∑ [( f ◦ g)g0 ](ξ j )(t j − t j−1 ) =
[ f ◦ g](t)g0 (t)dt
che è proprio la formula di cambiamento di variabile (53) nel caso di g0 > 0 (il caso g0 < 0 si tratta allo
stesso modo).
7.4 Cambiamento di variabile negli integrali in dimensione n
In questa sezione, per analogia con il caso 1-dimensionale, enunceremo una formula per il cambiamento
di variabile negli integrali in Rn , utilizzando termini al momento non ancora definiti, che saranno precisati
più avanti nel corso. Riteniamo che comunque il significato della formula sarà sufficientemente chiaro per
poterla già utilizzare come importante strumento di calcolo.
Teorema 7.4.1 Cambiamento di variabile negli integrali in Rn .
Siano A e Ω aperti di Rn . Sia ψ : A→Ω un diffeomorfismo e sia f : Ω→R una funzione integrabile9 .
Allora si ha
Z
Z
f (ψ(u))Jψ (u)du =
f (x)dx
(59)
A
ψ(A)
dove
Jψ (u) = | det Dψ(u)|
9 I termini in corsivo nell’enunciato saranno definiti più avanti, quando svilupperemo la teoria della misura e dell’integrazione, in
particolare la misura di Lebesgue.
28
Inoltre, per ogni insieme misurabile E ⊂ A si ha
Z
Jψ (u)du = m(ψ(E))
(60)
E
dove m è la misura n-dimensionale in Rn .
Occorre fare diverse osservazioni.
Osservazione 7.4.2 Il numero Jψ (u) = | det Dψ(u)| è il fattore con cui il differenziale dψ(u) : Rn →Rn
cambia il volume n-dimensionale e quindi lo pensiamo come il fattore con cui la mappa ψ cambia il volume
di insiemi infinitesimi intorno al punto u. Nel caso della dimensione n = 1 si ha Jψ (u) = |ψ0 (u)| e la (59)
coincide con (53).
Osservazione 7.4.3 La (59) vale anche se ψ è solamente iniettiva, senza richiedere che ψ sia un diffeomorfismo. Se poi la funzione ψ non è neppure iniettiva, vale comunque una formula analoga alla (59), in
cui si tiene conto di quante volte la funzione ψ assume ogni valore x ∈ ψ(A). Precisamente: si introduce la
funzione molteplicità di ψ, definita per ogni x ∈ ψ(A) come segue:
N( f , x) = Card {u ∈ A ψ(u) = x}
(61)
dove Card(B) è il numero degli elementi di B, se B è un insieme finito, e vale +∞ se B non è finito;
dopodiché si può mostrare che
Z
Z
f (ψ(u))Jψ (u)du =
N( f , x) f (x)dx
A
(62)
ψ(A)
Z
Z
Jψ (u)du =
E
N( f , x)dx
(63)
ψ(E)
Può essere utile scrivere la funzione molteplicità e verifica re la validità della (62) per le curve presentate
negli esempi 7.1.2 e 7.1.5.
Osservazione 7.4.4 Abbiamo detto sopra che la formula di cambiamento di variabile (59) in dimensione 1
è la formula di cambiamento di variabile (53) per l’integrale non orientato. In dimensione 1 abbbiamo però
anche un integrale orientato e la corrispondente formula (55) di cambiamento di variabile. Sorge quindi
naturale la domanda: c’è anche in dimensione n un integrale orientato? c’è un cambiamento di variabile
orientato n-dimensionale? Vedremo che la risposta è affermativa: gli integrali orientati n-dimensionali
saranno gli integrali delle cosiddette forme differenziali.
Osservazione 7.4.5 Vedremo più avanti che le formule (59) e (60) si estendono, formalmente identiche, al
caso di mappe ψ : A→Rn , dove A è un aperto in Rk e k ≤ n , pur di definire opportunamente il fattore
Jψ (u) di trasfomazione dell’area. Se k < n tali mappe ψ si interpretano come superfici parametrizzate
e la formula generalizzata viene spesso chiamata formula dell’area.
29
8
Lezione − Giovedı̀ 4 ottobre 2012
14.30 - 16.30 (2 ore)
Esercizi su coordinate polari. Introduzione agli integrali lungo le curve.
Alcune osservazioni che sono state fatte sulle coordinate polari nella lezione del 4 ottobre si trovano in questo diario
alla fine dell’ultima sezione della lezione del 28 setttembre, a pagina 24.
8.1 Calcolo di un’area in coordinate polari
Vediamo un esempio di curva in coordinate polari e in coordinate cartesiane. Poi calcoleremo l’area di un
insieme, utilizzando le coordinate polari.
Esempio 8.1.1 Spirale di Archimede. La spirale di Archimede è la curva nel piano che viene percorsa da
un punto P, vincolato a stare su una semiretta r di origine O, il quale si muove lungo la semiretta stessa con
velocità uniforme a partire da O, mentre la semiretta ruota con velocità angolare uniforme intorno al punto
O. Se pensiamo che il punto O sia l’origine di un sistema di assi cartesiani xy, che la semiretta al tempo
t = 0 sia il semiasse x positivo e che la rotazione sia antioraria, allora le coordinate polari (ρ, θ) del punto
P, all’istante t sono
ρ(t) = ct
,
θ(t) = ωt
(64)
dove c > 0 è la velocità del punto lungo la retta r e ω > 0 è la velocità angolare della retta intorno all’
origine. Quindi le coordinate cartesiane del punto P sono
x(t) = ρ(t) cos(θ(t)) = c · t · cos(ωt)
,
y(t) = ρ(t) sin(θ(t)) = c · t · sin(ωt)
(65)
La curva parametrizzata γ : [0, +∞)→R2 , dove γ(t) = (x(t), y(t)) è il modello matematico della spirale
di Archimede.
Esercizio 8.1.2 Consideriamo la curva parametrizzata σ : [0, π]→R2 definita da
x(t) = a cost
;
y(t) = a sint
;
t ∈ [0, π]
che percorre un arco di spirale di Archimede. Si trovi l’area dell’insieme F racchiuso dall’immagine della
curva σ e dal segmento dell’asse x di estremi (0, 0) e (−1, 0) .
Per calcolare l’area di F, consideriamo l’insieme
E = {(ρ, θ) ∈ R2 0 ≤ θ ≤ π , 0 ≤ ρ ≤ aθ}
e osserviamo che la mappa ψ delle coordinate polari (44) è biiettiva tra gli insiemi E ed F. Per la (60)
abbiamo allora che
Z
Z
Z π Z aθ
Z π
1
1 2 2
a θ dθ = a2 π3
area(F) = area(ψ(E)) = Jψ (ρ, θ)dρdθ = ρdρdθ =
ρdρ dθ =
6
E
E
0
0
0 2
8.2 Introduzione all’integrale di una forma differenziale lungo una curva
Le considerazioni generali e i primi esempi svolti in questa lezione sono inglobati nella lezione di Lunedı̀ 8
ottobre.
30