Registro delle lezioni di Analisi Matematica I Università di Firenze - Facoltà di Ingegneria Corso di Laurea in Ingegneria Informatica A.A. 2000/2001 - Prof. Massimo Furi Avvertenza: sono riportati nei dettagli soltanto quei concetti svolti a lezione la cui impostazione differisce da quella dei testi di riferimento (Spiegel e Ayres). 1 - Lun. 18/9/00 Concetto (euristico) di insieme. Esempi. Vari modi per rappresentare un insieme. Unione e intersezione di due insiemi. Sottoinsiemi di un insieme. Insieme vuoto. Complementare di un insieme (rispetto ad un universo assegnato). Leggi di De Morgan. Differenza tra due insiemi. Cenni sull’unione e sull’intersezione di infiniti insiemi. 2 - Lun. 18/9/00 Richiami sui numeri naturali (N), interi (Z), razionali (Q) e reali (R). Primi cenni sui numeri complessi (C). Cenni sul concetto di operazione binaria. Esempi di intervalli in R. Richiami sulle proprietà fondamentali dei numeri reali. Richiami sul significato dei simboli di minore e di minore o uguale. Il valore assoluto di un numero. Esercizi assegnati [Spiegel, cap. 1]: 2, 3, 4, 5, 6, 9. 3 - Mar. 19/9/00 Proprietà fondamentali del valore assoluto: |ab| = |a||b|; |a + b| ≤ |a| + |b|. Ulteriore proprietà del valore assoluto: | |b| − |a| | ≤ |a − b|. Distanza tra due punti a, b ∈ R: |b − a|. Potenza ad esponente naturale di un numero reale. Potenza ad esponente intero. Radice n-esima aritmetica di un numero positivo. Potenza ad esponente razionale. Cenni sulle potenze ad esponente reale. Proprietà fondamentali delle potenze: ax ay = ax+y ; (ax )y = axy ; ax bx = (ab)x . Ulteriori proprietà delle potenze: ax /ay = ax−y ; (a/b)x = ax /bx . 4 - Mar. 19/9/00 Definizione di logaritmo di un numero b > 0 in base a > 0, a 6= 1 (loga b). Proprietà fondamentali dei logaritmi: loga(bc) = loga b+loga c; loga b logb c = loga c. Ulteriori proprietà dei logaritmi: loga bc = c loga b; loga (b/c) = loga b − loga c. Definizione di intervallo (è un sottoinsieme di R con la proprietà che se ci stanno due punti, ci stanno anche tutti i punti intermedi). 1 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Osservazione. L’insieme vuoto e l’insieme costituito da un sol punto sono intervalli (si chiamano intervalli banali). L’insieme R dei numeri reali è un intervallo (non banale). Intervalli limitati e non limitati. Intervalli aperti. Intervalli chiusi. Intervalli né aperti né chiusi (chiusi a sinistra e aperti a destra, aperti a sinistra e chiusi a destra). Osservazione. L’intersezione di due intervalli è un intervallo (eventualmente vuoto o costituito da un sol punto). Insiemi numerabili (sono quelli che si possono mettere in corrispondenza biunivoca con i numeri naturali). Cenni sulla numerabilità dei razionali. Cenni sulla non numerabilità dei reali. Intorni di un punto. Intorni forati di un punto. Punti di accumulazione. Definizione. L’insieme dei punti di accumulazione di un insieme A ⊂ R si denota con A0 e si chiama derivato di A. I punti di A che non sono di accumulazione si dicono isolati. Definizione. Un insieme si dice chiuso se contiene tutti i suoi punti di accumulazione. Ossia, A è chiuso se A ⊃ A0 . Esercizi assegnati [Spiegel, cap. 1]: 11, 12, 13, 18, 20. 5 - Mer. 20/9/00 Maggioranti e minoranti di un insieme. Insiemi limitati superiormente [inferiormente]. Insiemi limitati. Proprietà di Archimede. Massimo [minimo] di un insieme. Estremo superiore [inferiore] di un insieme. Proprietà di Dedekind dei numeri reali (ogni insieme limitato superiormente [inferiormente] ammette estremo superiore [inferiore]). Definizione. Un sottoinsieme A di R si dice compatto se è limitato e chiuso. Osservazione. L’insieme Q dei razionali non gode della proprietà di Dedekind. Si può provare, infatti, che in Q l’insieme {x ∈ Q : x > 0, x2 < 2} non ammette estremo √ superiore (in R l’estremo superiore è 2). 6 - Mer. 20/9/00 Principio di Bolzano-Weierstrass. Ogni sottoinsieme limitato e infinito di R ammette almeno un punto di accumulazione. Numeri algebrici e numeri trascendenti. Principio di induzione. Introduzione ai numeri complessi. Parte reale e parte immaginaria di un numero complesso. Coniugato di un numero complesso. Esercizi assegnati [Spiegel, cap. 1]: 21, 24, 26. 2 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 7 - Gio. 21/9/00 Piano complesso. Modulo e argomento di un numero complesso. Forma trigonometrica dei numeri complessi. Teorema. Il prodotto di due numeri complessi ha per modulo il prodotto dei moduli e per argomento la somma degli argomenti. Esercizio. Dedurre dal teorema precedente che il modulo del rapporto di due numeri complessi è il rapporto dei moduli e l’argomento è la differenza degli argomenti. Osservazione. In generale arctang(b/a) non coincide con l’argomento di a + ib (a meno che la parte reale non sia positiva). Formula di De Moivre per la potenza n-esima di un numero complesso. Formula di De Moivre per la radice n-esima di un numero complesso. Richiami sui polinomi. Polinomi a coefficienti complessi. Teorema Fondamentale dell’Algebra. In campo complesso ogni polinomio di grado positivo ammette almeno una radice. 8 - Gio. 21/9/00 Concetto di funzione (o applicazione) tra due insiemi (è una legge, f : X → Y , che ad ogni elemento x di un insieme X, detto dominio di f , associa un unico elemento f (x) di un insieme Y , detto codominio). Funzioni reali (quando il codominio è un sottoinsieme dei reali, che per semplicità supporremo coincidere con R). Funzioni reali di variabile reale (sono funzioni reali il cui dominio è un sottoinsieme dei reali). Funzioni iniettive (f : X → Y è iniettiva se per ogni y ∈ Y esiste al più un x ∈ X tale che f (x) = y o, equivalentemente, se da x1 , x2 ∈ X, x1 6= x2 segue f (x1 ) 6= f (x2 ) ). Funzioni suriettive (f : X → Y è suriettiva se per ogni y ∈ Y esiste almeno un x ∈ X tale che f (x) = y ). Per indicare che f associa ad un generico elemento x ∈ X l’elemento f (x) ∈ Y , talvolta si usa la notazione f : x 7→ f (x). Ad esempio, la funzione f : R → R definita da f (x) = x2 si denota anche f : x 7→ x2 . Esercizi assegnati [Spiegel, cap. 1]: 27, 28, 29, 30, 31. 9 - Ven. 22/9/00 Esercizio. Provare che la somma di un numero razionale e di un numero irrazionale è un numero irrazionale. 3 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Funzioni biiettive, dette anche corrispondenze biunivoche (sono le funzioni sia iniettive sia suriettive). Maggiorante (o limitazione superiore) di una funzione reale (non necessariamente di variabile reale). Minorante di una funzione reale. Funzioni limitate superiormente [inferiormente]. Funzioni limitate. Estremo superiore [inferiore] di una funzione reale. Massimo [minimo] assoluto di una funzione reale. Punto di massimo [minimo] assoluto di una funzione reale (è un elemento del dominio in cui la funzione assume il suo valore massimo). 10 - Ven. 22/9/00 Il grafico di una funzione f : X → Y è l’insieme delle coppie ordinate (x, y) che soddisfano la relazione y = f (x), detta equazione del grafico. Osservazione. Il grafico di una funzione reale di variabile reale può essere pensato come un sottoinsieme del piano cartesiano. È una vecchia consuetudine definire una funzione scrivendone l’equazione del grafico; ossia, scrivendo l’equazione y = f (x) a cui devono soddisfare le coppie (x, y) del grafico di f . Ad esempio, per denotare la funzione che ad ogni x ∈ R associa x2 si può scrivere y = x2 . L’immagine di una funzione f : X → Y è l’insieme costituito dagli elementi y ∈ Y per i quali esiste un x ∈ X tale che y = f (x). Tale insieme si chiama anche immagine di X tramite f e si denota con uno dei seguenti simboli: Im(f ), f (X). Più in generale, dato un sottoinsieme A di X, l’immagine di A (tramite f ) è l’insieme f (A) = {y ∈ Y : y = f (x) per almeno un x ∈ A} . Osservazione. Una funzione è suriettiva se e solo se la sua immagine coincide col suo codominio. Restrizione di una funzione ad un sottoinsieme del dominio (data f : X → Y e dato un sottoinsieme A di X, se si pensa f definita soltanto per gli elementi di A, si dice f è stata ristretta ad A). Osservazione. Il grafico della restrizione ad un insieme A di una funzione f : X → Y è un sottoinsieme del grafico di f . Più precisamente, è l’insieme delle coppie (x, y) del grafico di f che hanno x ∈ A. Definizione. Data una funzione iniettiva f : X → Y , la sua funzione inversa, denotata f −1 : Im(f ) → X, è quella legge che ad ogni y dell’immagine di f associa l’unico elemento x ∈ X tale che f (x) = y. 4 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Osservazione. L’immagine [il dominio] di una funzione inversa coincide col dominio [l’immagine] della funzione che viene invertita. Richiami sui polinomi di una e di due variabili. Equazioni algebriche (sono equazioni che si ottengono uguagliando a zero un polinomio). Definizione. Una funzione f (reale di variabile reale) si dice algebrica se esiste un polinomio di due variabili P (x, y) con la proprietà che ogni coppia (x, y) del grafico di f verifica l’equazione algebrica P (x, y) = 0 (si dice che f è una funzione implicita dell’equazione P (x, y) = 0). Le funzioni (reali di variabile reale) non algebriche si dicono trascendenti. Esercizio. Provare che le funzioni polinomiali sono algebriche. Funzioni razionali (si ottengono facendo il rapporto di due polinomi). Osservazione. I polinomi sono funzioni razionali. Esercizio. Provare che le funzioni razionali sono algebriche. Funzioni irrazionali (sono le funzioni algebriche non razionali). Esercizio. Provare che la funzione √ x è algebrica (irrazionale). Esercizi assegnati [Spiegel, cap. 2]: 1, 2, 3. 11 - Lun. 25/9/00 Una panoramica sulle principali funzioni trascendenti (funzioni esponenziali, logaritmiche, trigonometriche, trigonometriche inverse, iperboliche, iperboliche inverse). Definizione. La parte intera di un numero x ∈ R, denotata con [x] o con int x, è il più grande intero minore o uguale ad x (i.e. [x] := max Z ∩ (−∞, x] ). Definizione. Una funzione reale di variabile reale f : A → R si dice crescente [decrescente ] se da x1 , x2 ∈ A e x1 < x2 segue f (x1 ) ≤ f (x2 ) [f (x1 ) ≥ f (x2 )]. Se l’ultima disuguaglianza vale in senso stretto, allora si dice che la funzione è strettamente crescente [strettamente decrescente ]. Le funzioni crescenti o decrescenti si dicono monotòne (l’accento tonico cade sull’ultima sillaba). Se una funzione monotona è addirittura strettamente crescente o strettamente decrescente, allora si chiama strettamente monotona. Osservazione. Le funzioni strettamente monotone sono iniettive, pertanto invertibili. Osservazione. L’inversa di una funzione strettamente crescente [decrescente] è strettamente crescente [decrescente]. 5 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 12 - Lun. 25/9/00 Definizione. Sia f : A → R una funzione reale di variabile reale e sia x0 un punto di accumulazione per il dominio A di f (non occorre che x0 appartenga ad A). Si dice che f (x) tende ad un numero reale l per x che tende ad x0 , e si scrive f (x) → l per x → x0 , se per ogni ² > 0 esiste δ > 0 tale che da 0 < |x − x0 | < δ e x ∈ A segue |f (x) − l| < ². Notazione. Per indicare che f (x) → l per x → x0 si usa anche dire che il limite per x che tende ad x0 di f (x) è uguale a l, e si scrive lim f (x) = l. x→x0 Teorema (fondamentale dei limiti finiti). Siano f, g: A → R due funzioni reali di variabile reale e sia x0 un punto di accumulazione per A. Se f (x) → a e g(x) → b per x → x0 , allora (per x → x0 ), si ha: 1) f (x) + g(x) → a + b; 2) f (x)g(x) → ab; 3) f (x)/g(x) → a/b, nell’ipotesi b 6= 0. Ipotesi semplificativa. Da ora in avanti, a meno che non sia altrimenti specificato, per motivi di semplicità supporremo che i punti del dominio di ogni funzione (reale di variabile reale) che prenderemo in considerazione siano anche di accumulazione per il dominio stesso. Ciò è vero, ad esempio, se una funzione è definita in un intervallo non banale (o, più in generale, in un insieme costituito dall’unione, finita o infinita, di intervalli non banali). Definizione. Una funzione reale di variabile reale f : A → R si dice continua in un punto x0 ∈ A se lim f (x) = f (x0 ). x→x0 In caso contrario f è detta discontinua in x0 , o che ha una discontinuità in x0 . Se f è continua in ogni punto del suo dominio A, allora si dice semplicemente che è una funzione continua. Osserviamo che la suddetta definizione (basata sul concetto di limite) è ben posta perché abbiamo supposto (come ipotesi semplificativa) che ogni punto x0 del dominio A di f sia anche di accumulazione. È importante inoltre notare che, sempre in base alla suddetta definizione, non ha senso affermare che una funzione è discontinua (o continua) in un punto in cui non è definita. Esercizio. Provare che la funzione f (x) = x è continua. Dal teorema fondamentale dei limiti segue immediatamente il seguente 6 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Corollario. Una funzione ottenuta tramite somma, prodotto e quoziente di funzioni continue è una funzione continua. Si osservi che in virtù del suddetto Corollario si può affermare che le funzioni razionali, essendo rapporto di polinomi, sono continue (compresa la funzione f (x) = 1/x, anche se in alcuni testi di analisi matematica si asserisce il contrario). Esercizi assegnati [Spiegel, cap. 2]: 5, 6. 13 - Mar. 26/9/00 Teorema. Le funzioni esponenziali, logaritmiche, trigonometriche, trigonometriche inverse, iperboliche e iperboliche inverse sono continue. Osserviamo che se x0 non è un punto di accumulazione per il dominio A di una funzione f : A → R, allora non ha senso parlare di limite per x che tende ad x0 di f (x). Pertanto, nel caso che x0 sia un punto isolato per A, la definizione di continuità che abbiamo precedentemente dato, essendo basata sul concetto di limite, è priva di significato. Per vari motivi che non stiamo a menzionare, è conveniente assumere, per definizione, che ogni funzione sia continua nei punti isolati del suo dominio. Ciò è in accordo con la seguente nuova definizione di continuità (valida per ogni punto del dominio): Definizione. Una funzione f : A → R si dice continua in un punto x0 ∈ A se per ogni ² > 0 esiste δ > 0 tale che da |x − x0 | < δ e x ∈ A segue |f (x) − f (x0 )| < ². Esempio. Il dominio della funzione f (x) = √ cos x − 1 è costituito soltanto da punti isolati (i punti in cui cos x = 1). Pertanto, f è continua. Esercizio. Provare che se una funzione è continua in un insieme A, allora è continua anche la sua restrizione ad un qualunque sottoinsieme di A. Definizione. Siano f : A → R e g: B → R due funzioni reali di variabile reale. La composizione di f con g, denotata g◦f , è quell’applicazione (detta anche funzione composta) che ad ogni x ∈ A tale che f (x) ∈ B associa il numero g(f (x)). Il dominio della funzione composta g◦f è il sottoinsieme f −1 (B) = {x ∈ A : f (x) ∈ B} di A, detto immagine inversa (o retroimmagine, o preimmagine) di B (tramite f ). Teorema. Siano f : A → R e g: B → R due funzioni reali di variabile reale. Se f è continua in x0 ∈ A e g è continua in y0 = f (x0 ) ∈ B, allora g◦f è continua in x0 . 7 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Tenendo conto che, per definizione, una funzione è continua quando lo è in ogni punto del suo dominio, dal precedente teorema segue immediatamente il seguente Corollario. La composizione di due funzioni continue è una funzione continua. 14 - Mar. 26/9/00 Esercizio. Sia A un sottoinsieme limitato superiormente di R. Provare che almeno una delle due seguenti affermazioni risulta verificata: 1) supA ∈ A (e quindi supA = maxA); 2) supA è un punto di accumulazione per A. Suggerimento. Osservare che se si fissa un intorno (supA − r, supA + r) di supA, allora supA−r non è un maggiorante per A, mentre supA+r lo è. Di conseguenza, se la proprietà 1) non è verificata, il suddetto intorno deve contenere almeno un elemento di A distinto da supA. Esercizio. Sia A un sottoinsieme limitato e chiuso di R. Provare che A ammette massimo e minimo. Suggerimento. Dedurre dall’esercizio precedente che supA ∈ A. Procedere in modo analogo con infA. Primo Teorema di Weierstrass. Sia f : A → R una funzione continua in un sottoinsieme limitato e chiuso A ⊂ R. Allora l’immagine di f è un insieme limitato e chiuso. In particolare f ammette massimo e minimo assoluti. Esempi (relativi alle ipotesi del Primo Teorema di Weierstrass). La funzione f (x) = x2 è continua nell’intervallo chiuso [0, +∞) ma non ha massimo. La funzione f (x) = x è continua nell’intervallo limitato (0, 1) ma (in tale intervallo) non ha né massimo, né minimo. La funzione f (x) = x − [x] nell’intervallo chiuso e limitato [0, 1] non ha massimo. Secondo Teorema di Weierstrass. Sia f : J → R una funzione continua in un intervallo J ⊂ R. Allora l’immagine di f è un intervallo. In particolare, se f assume valori sia positivi sia negativi, esiste un punto del dominio in cui si annulla (quindi l’equazione f (x) = 0 ammette almeno una soluzione). Esempi (relativi alle ipotesi del Secondo Teorema di Weierstrass). La funzione f (x) = 1/x è continua nell’insieme R\{0} in cui è definita, ma la sua immagine non è un intervallo (perché assume valori sia negativi, sia positivi, ma non si annulla). La funzione f (x) = [x] è definita in R (che è un intervallo) ma la sua immagine non è un intervallo. Talvolta gli insiemi limitati e chiusi di R di chiamano i compatti (di R) e gli intervalli i connessi di R. I due teoremi di Weierstrass possono essere quindi riformulati affermando 8 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi che le funzioni continue mandano compatti in compatti e connessi in connessi. Applicazioni del Secondo Teorema di Weierstrass per provare l’esistenza di soluzioni di equazioni del tipo f (x) = 0. Cenni sul metodo numerico delle bisezioni per la ricerca di soluzioni di equazioni del tipo f (x) = 0. Esercizi assegnati [Spiegel, cap. 2]: 10, 11. 15 - Mer. 27/9/00 Teorema (di continuità per le funzioni monotone). Sia f : A → R una funzione monotona. Se l’immagine di f è un intervallo, allora f è continua (non occorre che sia definita in un intervallo). Come immediata conseguenza del precedente risultato si ottiene il Teorema (di continuità della funzione inversa). Sia f : J → R una funzione strettamente monotona in un intervallo. Allora f −1 : f (J) → R è una funzione continua. Dimostrazione. La funzione f −1 è strettamente crescente o decrescente, a seconda che sia strettamente crescente o decrescente la f . La sua immagine, inoltre, coincide col dominio J della f , che per ipotesi è un intervallo. Pertanto, per il precedente teorema, f −1 è continua. 16 - Mer. 27/9/00 Ulteriori definizioni del concetto di limite: f (x) → l, +∞, −∞, ∞ per x → x0 , +∞, −∞, ∞. Definizione. Il limite destro [sinistro] per x → x0 di una funzione f : A → R, detto anche − limite per x → x+ 0 [x0 ] di f , è (quando ha senso) il limite per x → x0 della restrizione di f all’insieme A ∩ (x0 , +∞) [A ∩ (−∞, x0 )]. Ovviamente, perché abbia senso parlare di limite destro [sinistro] per x → x0 di una funzione definita in A, occorre che x0 sia un punto di accumulazione per l’insieme A ∩ (x0 , +∞) [A ∩ (−∞, x0 )] . In questo caso si dice che x0 è un punto di accumulazione destro [sinistro] per A. 9 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi + Osservazione. Supponiamo che abbiano senso i limiti per x → x− 0 e per x → x0 di f (x). Allora f (x) → γ = l, +∞, −∞, ∞ se e solo se lim f (x) = lim f (x) = γ. x→x− 0 x→x+ 0 Un modo unitario per definire i vari concetti di limite è il seguente: “ si dice che una funzione f (x) tende a γ per x → α se per ogni intorno U di γ esiste un intorno forato V di α tale che se x ∈ V (e x sta nel dominio di f ) allora f (x) ∈ U ”. Ovviamente, la suddetta definizione di limite risulta chiara solo se si precisa cosa sono gli intorni (e gli intorni forati) di α e di γ, dove α e γ possono essere o un numero reale a ∈ R, o uno dei due simboli a− e a+ (con a ∈ R), o uno dei simboli −∞, +∞, ∞. Gli intorni di un punto a, ricordiamo, sono gli intervalli aperti di centro a, mentre gli intorni forati di a non sono altro che gli intorni privati del punto a stesso. Gli intorni di a− , detti anche intorni sinistri di a, sono gli intervalli aperti con secondo estremo a (in questo caso gli intorni e gli intorni forati sono la stessa cosa). In modo analogo si definiscono gli intorni (forati e non forati) di a+ . Gli intorni (e gli intorni forati) di −∞ [+∞] sono le semirette sinistre [destre] aperte (ossia, quelle del tipo (−∞, k) [(k, +∞)], con k ∈ R). Infine, gli intorni di ∞ sono gli insiemi {x ∈ R : |x| > k} = (−∞, −k) ∪ (k, +∞) costituiti dai complementari degli intervalli [−k, k], con k > 0. Quando si afferma che il limite per x → α di una funzione f : A → R ha senso, significa che α è un punto di accumulazione per A, ossia che ogni intorno forato di α contiene (infiniti) punti di A. Pertanto, un limite può aver senso anche quando non esiste. Per non appesantire troppo il discorso, data f : A → R, nei teoremi che enunceremo, ogni qual volta appare l’espressione f (x), sarà sempre sottinteso che x appartiene al dominio A di f . Cosı̀, ad esempio, scriveremo semplicemente “ 0 < |x − x0 | < δ implica |f (x) − l| < ² ” invece di “ 0 < |x − x0 | < δ e x ∈ A implica |f (x) − l| < ² ”, oppure scriveremo “ supx<α f (x) ” al posto di “ supx<α, x∈A f (x) ”. Per motivi che risulteranno chiari in seguito (quando faremo il teorema del limite per funzioni monotone), i simboli −∞ e +∞ verranno talvolta denotati rispettivamente con ∞+ e ∞− . In questo caso diremo anche che gli intorni di −∞ e di +∞ sono intorni destri e sinistri di ∞, rispettivamente. In un certo senso è come se i due “estremi” della retta reale si toccassero all’infinito per riunirsi in un unico punto: il punto all’infinito. Esercizi assegnati [Spiegel, cap. 2]: 12, 13, 15. 10 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 17 - Gio. 28/9/00 Da ora in avanti, con la notazione R intenderemo l’insieme dei numeri reali estesi, ossia l’insieme costituito dai numeri reali con l’aggiunta dei simboli −∞ e +∞. In R, per quanto riguarda la relazione d’ordine, si fa la convenzione che ogni numero reale sia maggiore di −∞ e minore di +∞. Si definiscono inoltre le seguenti operazioni (a è un arbitrario numero reale e ∞ sta per −∞ o +∞): −∞ + a = −∞, +∞ + a = +∞, (−∞) + (−∞) = −∞, (+∞) + (+∞) = +∞, a(±∞) = ±∞, se a > 0 e a(±∞) = ∓∞ se a < 0, a/∞ = 0, a/0 = ∞ se a 6= 0, ∞/0 = ∞. Ogni eventuale definizione di (+∞) + (−∞), 0/0, 0 · ∞ e ∞/∞ porterebbe a delle incoerenze, e quindi non conviene farlo. Riportiamo alcuni esempi per mostrare come non sia conveniente dare un senso alle espressioni ∞ − ∞, 0/0, 0 · ∞ e ∞/∞ (dette anche forme indeterminate): (∞ − ∞) (∞ − ∞) (0 · ∞) (0 · ∞) (0/0) (0/0) (∞/∞) (∞/∞) x−x→0 x2 − x → +∞ x(1/x) → 1 x2 (1/x) → 0 x/x → 1 x2 /x → 0 x/x → 1 x2 /x → +∞ per per per per per per per per x → +∞; x → +∞; x → 0; x → 0; x → 0; x → 0; x → +∞; x → +∞. Teorema (fondamentale dei limiti generalizzato). Siano f1 ed f2 due funzioni reali di variabile reale. Supponiamo che, nei reali estesi, f1 (x) → γ1 e f2 (x) → γ2 , per x → α. Allora, per x → α (e quando ha senso), si ha: 1) f1 (x) + f2 (x) → γ1 + γ2 ; 2) f1 (x)f2 (x) → γ1 γ2 ; 3) f1 (x)/f2 (x) → γ1 /γ2 . Teorema (della permanenza del segno). Sia f una funzione reale di variabile reale e sia c ∈ R. Supponiamo che f (x) tenda a γ ∈ R per x → α. Se γ > c [γ < c], allora un intorno forato di α risulta (quando ha senso) f (x) > c [f (x) < c]. In particolare, se γ 6= 0, in un conveniente intorno forato di α la funzione f (x) ha lo stesso segno di γ. Teorema (del confronto dei limiti). Siano f e g due funzioni reali tali che f (x) ≤ g(x). Supponiamo che per x → α si abbia f (x) → λ e g(x) → µ, con λ, µ ∈ R. Allora λ ≤ µ. 18 - Gio. 28/9/00 Teorema dei carabinieri. Siano f , g ed h tre funzioni reali tali che f (x) ≤ g(x) ≤ h(x). Supponiamo che per x → α si abbia f (x) → γ e h(x) → γ. Allora anche g(x) → γ per 11 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi x → α. Esercizio. Provare che una funzione tende a zero (per x → α) se e solo se tende a zero il suo valore assoluto. Applichiamo il teorema dei carabinieri per provare che la funzione sen x è continua. Si tratta di mostrare che, fissato x0 ∈ R, sen x → sen x0 per x → x0 , o, equivalentemente (per il teorema della somma dei limiti), che (sen x−sen x0 ) → 0 per x → x0 . Dalle formule di prostaferesi si ottiene sen x − sen x0 = 2 cos( x − x0 x + x0 ) sen( ). 2 2 Quindi x − x0 x + x0 )|| sen( )|. 2 2 Pertanto, essendo | cos α| ≤ 1 e | sen α| ≤ |α|, si ottiene 0 ≤ | sen x − sen x0 | = 2| cos( 0 ≤ | sen x − sen x0 | ≤ |x − x0 |. Poiché le due funzioni f (x) := 0 e h(x) := |x − x0 | tendono a 0 (per x → x0 ), tende a zero anche g(x) := | sen x − sen x0 |. Corollario (del teorema dei carabinieri). Siano f e g due funzioni reali di variabile reale. Supponiamo che f sia limitata e che g(x) → 0 per x → α. Allora f (x)g(x) → 0 per x → α. Per affermare che una funzione f tende a zero per x → α, si usa dire che è infinitesima (per x → α), o che è un infinitesimo (spesso si omette di aggiungere “per x → α”, quando risulta evidente dal contesto). Il precedente corollario può essere quindi enunciato cosı̀: “Il prodotto di una funzione limitata per una infinitesima è una funzione infinitesima”. Esempio. La funzione f (x) = x2 sen(1/x) è infinitesima per x → 0. Infatti x2 → 0 per x → 0 e sen(1/x) è una funzione limitata (si osservi che il teorema fondamentale dei limiti non è applicabile in questo caso, visto che sen(1/x) non ammette limite per x → 0). Teorema del carabiniere. Siano f e g due funzioni tali che f (x) ≤ g(x). Supponiamo che per x → α si abbia f (x) → +∞ [g(x) → −∞]. Allora anche g(x) → +∞ [f (x) → −∞]. Esempio. La funzione g(x) = x + sen x → +∞ per x → +∞. Si può infatti minorare col “carabiniere” f (x) = x − 1, che tende a +∞ per x → +∞ (il teorema fondamentale dei limiti non è applicabile in questo caso: sen x non ha limite per x → +∞). Teorema (di unicità del limite). Il limite di una funzione, se esiste, è unico (nei reali estesi). 12 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Esercizi assegnati [Spiegel, cap. 2]: 16, 17. 19 - Ven. 29/9/00 Teorema (di cambiamento di variabile per i limiti). Sia f una funzione tale che lim f (x) = γ. x→α Se g(t) → α per t → β e g(t) 6= α in un intorno forato di β, allora lim f (g(t)) = γ. t→β I due limiti fondamentali: sen x = 1 (esercizio 2.16); lim x→0 x lim x→±∞ µ 1 1+ x ¶x = e = 2.71828182845... Alcuni limiti notevoli (deducibili dai limiti fondamentali): 1 − cos x = 1/2 x→0 x2 log(1 + x) =1 lim x→0 x (1 + x)α − 1 lim =α x→0 x lim lim (1 + x)1/x = e x→0 ex − 1 =1 x→0 x log x lim =1 x→1 x − 1 lim 20 - Ven. 29/9/00 Prima di formulare il seguente teorema ricordiamo che i simboli ∞+ e ∞− denotano, rispettivamente, i numeri reali estesi −∞ e +∞. In questo modo il limite per x → −∞ viene pensato come un limite destro, e per x → +∞ come un limite sinistro. Si fa inoltre la convenzione che le disuguaglianze x < ∞ e x > ∞ significhino x < +∞ e x > −∞, rispettivamente (entrambe sono quindi verificate per ogni x ∈ R). Ricordiamo ancora che la variabile di una funzione, ovunque appaia in un enunciato, sta sempre nel dominio, anche se, per semplicità di linguaggio, ciò non è esplicitamente affermato. Teorema (del limite per le funzioni monotone). Sia f : A → R una funzione crescente [decrescente] e sia α ∈ R ∪ {∞}. Allora (quando ha senso) risulta · ¸ lim f (x) = sup f (x) lim f (x) = inf f (x) x<α x→α− x→α− x<α · ¸ lim f (x) = sup f (x) lim f (x) = inf f (x) x→α+ x>α x→α+ x>α 13 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Come applicazione del teorema del limite per funzioni monotone, mostriamo che limx→+∞ arctang x = π/2. Allo scopo ricordiamo che la funzione arcotangente è l’inversa della restrizione della tangente all’intervallo (−π/2, π/2). Essendo la tangente, in tale intervallo, una funzione strettamente crescente, anche l’arcotangente risulta strettamente crescente. Di conseguenza, ricordandosi che l’immagine di una funzione inversa coincide col dominio della funzione che viene invertita, si ha lim arctang x = sup arctang x = sup(−π/2, π/2) = π/2. x→∞− x<∞ Definizione. Una funzione reale di variabile reale si dice continua a tratti in un intervallo [a, b] se è definita ed è continua in [a, b] tranne un numero finito di punti in ciascuno dei quali esistono finiti i due limiti sinistro e destro. Teorema (di cambiamento di variabile per i limiti di funzioni continue). Sia f una funzione continua in un punto x0 . Se g(t) → x0 per t → α, allora f (g(t)) → f (x0 ) per t → α (non occorre assumere g(t) 6= x0 ). Esercizi assegnati [Spiegel, cap. 2]: 20, 21. 21 - Lun. 2/10/00 Definizione. Una successione in un insieme X è un’applicazione a: N → X. Se X è un sottoinsieme di R, la successione si dice reale (o di numeri reali). Data una successione a: N → X, per motivi di tradizione e di semplicità, l’immagine di un generico n ∈ N si denota col simbolo an , invece che con a(n). Il valore an associato ad n si chiama il termine n-esimo della successione o l’elemento di indice n. I numeri naturali sono detti gli indici della successione. Vari – – – – modi di indicare una successione a: N → X: a: N → X (è quello più corretto ma il meno usato); a1 , a2 , ..., an ,... (elencando i termini); {an }n∈N (specificando che il dominio è N ); {an } (è il più sintetico ed è usato quando risulta chiaro dal contesto che rappresenta una successione). Osservazione. Attenzione a non fare confusione tra i termini di una successione (che sono sempre infiniti) e i suoi valori assunti, che possono essere anche in numero finito. Ad esempio, la successione {an = (−1)n } assume solo i valori 1 e −1 ma, ciascuno, infinite volte. 14 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Da ora in avanti, a meno che non sia diversamente specificato, ci occuperemo di successioni di numeri reali. In questo caso vale la convenzione che abbiamo adottato per le funzioni reali: per semplicità, a meno che non sia dichiarato diversamente, si assume che il codominio coincida con R. Osserviamo che +∞ è un punto di accumulazione per N (in senso generalizzato); pertanto, data una successione {an }, ha senso parlare di limite per n → +∞ di an (la definizione di limite e i teoremi connessi discendono da quelli già visti per le funzioni reali di variabile reale). Il limite per n → +∞ di una successione {an } si denota col simbolo lim an n→+∞ o più semplicemente con lim an . Quest’ultima notazione, particolarmente sintetica, è giustificata dal fatto che +∞ è l’unico punto di accumulazione per N. Rivediamo la definizione di limite data per le funzioni, adattandola al caso particolare delle successioni. Definizione. Si dice che una successione {an } tende (o converge) ad l ∈ R, e si scrive an → l (per n → +∞), se per ogni ² > 0 esiste un indice n̄ tale che per n > n̄ si ha |an − l| < ². Si dice che {an } tende (o diverge) a +∞ (si scrive an → +∞) se per ogni k ∈ R esiste un indice n̄ tale che per n > n̄ si ha an > k. Analogamente an → −∞ se per ogni k ∈ R esiste n̄ tale che per n > n̄ si ha an < k. Si dice infine che {an } diverge (o tende) all’infinito se |an | → +∞. Esempio. Consideriamo la successione {(1 + 1/n)n }. Poiché la funzione di variabile reale (1 + x)1/x tende al numero e per x → 0, dal teorema di cambiamento di variabile per i limiti (ponendo x = 1/n) si ottiene {(1 + 1/n)n } → e per n → +∞. Definizione. Una successione {an } si dice convergente se ammette limite finito, divergente se il limite è ∞ (quindi anche +∞ o −∞) e indeterminata negli altri casi (quando non ammette limite). Una successione convergente, divergente a −∞ o divergente a +∞ si dice regolare. Teorema (fondamentale dei limiti delle successioni). Siano {an } e {bn } due successioni tali che an → α e bn → β (dove α, β ∈ R). Allora, quando ha senso, si ha: 1) an + bn → α + β; 2) an bn → αβ; 3) an /bn → α/β. 22 - Lun. 2/10/00 I concetti di successione limitata, limitata superiormente e limitata inferiormente sono 15 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi casi particolari di quelli già definiti per le funzioni reali di variabile reale; pertanto, non verranno ripetuti. Notazione. Data una successione {an }, analogamente a quanto si è visto per le funzioni reali, col simbolo sup an si denota l’estremo superiore della successione (ossia, dell’immagine della successione). Analogamente, inf an rappresenta l’estremo inferiore di {an }. La nozione di successione monotona (monotona crescente, strettamente crescente, ecc.) è un caso particolare di quella già introdotta per le funzioni reali di variabile reale. Esercizio. Provare che una successione {an } è crescente se e solo se an ≤ an+1 , per ogni n ∈ N. Il seguente risultato è un’immediata conseguenza del teorema del limite per funzioni monotone. Teorema (del limite per successioni monotone). Se {an } è una successione monotona, allora è regolare. Precisamente si ha lim an = sup an se {an } è crescente e lim an = inf an se è decrescente. In particolare se {an }, oltre ad essere monotona, è anche limitata, allora è convergente. Esercizi assegnati [Spiegel, cap. 3]: 1, 2, 4, 7, 8, 9, 10, 11, 12, 13, 14. 23 - Mar. 3/10/00 Definizione. Si dice che una successione {an } sta definitivamente in un insieme A ⊂ R se esiste un indice n̄ per il quale si ha an ∈ A per ogni n > n̄. Si dice che soddisfa definitivamente una data disequazione (con incognita n ∈ N) se esiste un n̄ con la proprietà che tale disequazione è soddisfatta per tutti gli n maggiori di n̄. Si osservi che una successione {an } converge ad l ∈ R se e solo se sta definitivamente in ogni intorno di l. Analogamente {an } diverge a +∞ (risp. −∞, ∞) se sta definitivamente in ogni intorno di +∞ (risp. −∞, ∞). Esercizio. Definire la nozione di successione definitivamente crescente [decrescente, strettamente crescente, strettamente decrescente]. Sia {an } una successione in R e sia λ un numero reale. Ricordiamo che λ è un maggiorante per {an } se an ≤ λ per ogni n ∈ N. Diremo che λ è un maggiorante definitivo per {an }, se an ≤ λ definitivamente. Ossia se esiste un n̄ ∈ N per il quale si ha an ≤ λ per ogni n > n̄ (chiaramente ogni maggiorante è anche un maggiorante definitivo). Il compito di definire il concetto di minorante definitivo è lasciato per esercizio allo studente. 16 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Osservazione. L’insieme dei maggioranti definitivi di una successione limitata è una semiretta destra. Esempi: – l’insieme dei maggioranti definitivi di {−1/n} è [0, +∞); – l’insieme dei maggioranti definitivi di {(−1)n } è [1, +∞); – l’insieme dei maggioranti definitivi di {1/n} è (0, +∞). Sia {an } una successione in R. Se {an } è l’imitata superiormente, il suo massimo limite, detto anche limite superiore, è l’estremo inferiore dei maggioranti definitivi di {an }. Se {an } non è limitata superiormente, per definizione, il suo massimo limite è +∞. In modo analogo si introduce il concetto di minimo limite, o limite inferiore (i dettagli sono lasciati allo studente). In base agli esempi visti, si osservi che, in generale, è sbagliato affermare che il massimo limite è il più piccolo dei maggioranti definitivi. L’insieme dei maggioranti definitivi, infatti, potrebbe non ammettere minimo. Il massimo [minimo] limite di una successione si denota con uno dei seguenti simboli: lim an , n→∞ lim an , lim sup an [ lim an , n→∞ lim an , lim inf an ]. Ricordiamo che il limite di una successione può non esistere, mentre il massimo e minimo limite esistono sempre; e questo, come si vedrà in seguito quando faremo le serie di potenze, è un notevole vantaggio. Teorema. Data una successione {an }, si ha lim an ≤ lim an . Inoltre an → γ ∈ R se e solo se liman = liman = γ. In generale non è vero che il limite superiore del prodotto di due successioni è uguale al prodotto dei limiti superiori. Tuttavia, si potrebbe dimostrare che se due successioni sono non negative e una delle due ammette limite, allora il limite superiore del loro prodotto coincide col prodotto dei limiti superiori (ovviamente, quando ha senso; ossia tranne il caso 0 · ∞). 24 - Mar. 3/10/00 Data una successione {an }, l’espressione ∞ X an n=1 17 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi si legge “serie (o somma) per n che va da 1 a +∞ di an ” e rappresenta, in modo sintetico, il n X lim ak . n→+∞ k=1 In altri termini, posto Sn = a1 + a2 + ... + an , per definizione si ha ∞ X an = lim Sn . n→+∞ n=1 La successione {Sn } si dice successione delle somme parziali (o delle ridotte) della serie, mentre an è detto il termine generale. Il carattere della serie è, per definizione, il carattere della successione {Sn }. In altre parole: se {Sn } converge, si dice che converge la serie; se {Sn } diverge, la serie diverge; se il limite di {Sn } non esiste, la serie è indeterminata. Il limite S (finito o infinito) di {Sn }, quando esiste, si dice somma della serie e si scrive S= ∞ X an . n=1 Talvolta, invece di sommare a partire da n = 1, si parte da un indice n0 ∈ Z (anche negativo). Scriveremo allora ∞ X an . n=n0 Teorema. Condizione necessaria affinché una serie sia convergente è che il termine generale tenda a zero. P Dimostrazione. Sia ∞ n=n0 an una serie convergente. Ciò significa, per definizione, che la successione {Sn } delle somme parziali converge ad un numero (finito) S. Osserviamo che an = Sn − Sn−1 e che (oltre ad Sn ) anche Sn−1 converge ad S (infatti, se |Sn − S| < ² per n > n̄, allora |Sn−1 − S| < ² per n > n̄ + 1). Si ha allora lim an = lim (Sn − Sn−1 ) = S − S = 0 . n→∞ n→∞ P La suddetta condizione non è sufficiente. Proveremo infatti che la serie ∞ n=1 1/n (detta armonica) non è convergente, sebbene il suo termine generale sia infinitesimo. P Definizione. Una serie ∞ n=n0 an è detta geometrica se il rapporto an+1 /an è costante (ossia, non dipende da n). In tal caso il rapporto si chiama ragione della serie. Teorema. Una serie geometrica converge se e solo se la sua ragione è in valore assoluto minore di uno. Inoltre, denotato con a il primo termine e con q ∈ (−1, 1) la ragione, la somma è a/(1 − q). 18 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi P n Dimostrazione. Sia ∞ n=0 aq una serie geometrica e denotiamo con Sn la sua somma parziale n-esima. Se q = 1, si ha Sn = na, e quindi la serie diverge (a meno che a non sia zero). Si può quindi supporre q 6= 1. Moltiplicando per 1 − q entrambi i membri dell’uguaglianza Sn = a + aq + aq 2 + · · · + aq n−1 , si ha Sn (1 − q) = (a + aq + aq 2 + · · · + aq n−1 )(1 − q) = a − aq + aq − aq 2 + aq 2 − · · · − aq n = a − aq n . Pertanto, avendo supposto q 6= 1, si ottiene Sn = a(1 − q n ) . 1−q Se |q| < 1, si ha q n → 0 e, di conseguenza, Sn → a/(1 − q). Se q = 1, abbiamo già visto che la serie diverge (quando non è una finta serie). Se q > 1, la successione {q n } diverge a +∞, e quindi anche Sn → +∞. Se q = −1, la serie è indeterminata, perché {(−1)n } non ammette limite. Infine, se q < −1, la successione {q n } diverge all’infinito, e quindi diverge all’infinito anche {Sn }. A titolo di esempio, consideriamo il numero decimale periodico 3, 17̄ = 3, 17777... Si può scrivere 7 7 7 3, 17̄ = 3, 1 + 0, 07 + 0, 007 + 0, 0007 + . . . = 3, 1 + 2 + 3 + 4 + . . . 10 10 10 Ovvero La serie pertanto ∞ P∞ n=2 31 X 7 . + 3, 17̄ = 10 10n n=2 7/10n è geometrica, di ragione 1/10 e il suo primo termine è 7/100. Si ha 3, 17̄ = 7/100 143 31 + . = 10 1 − 1/10 45 In modo analogo si prova che ogni numero decimale periodico è razionale e se ne determina la frazione generatrice. Esercizi assegnati [Spiegel, cap. 3]: 16, 17, 20, 21, 25, 26, 30. 25 - Mer. 4/10/00 Definizione. Sia f : A → R una funzione reale di variabile reale e sia x0 ∈ A ∩ A0 . Si dice che f è derivabile in x0 se esiste ed è finito il limite, per x → x0 , della funzione f (x) − f (x0 ) x − x0 19 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi detta rapporto incrementale di f in x0 . Tale limite, quando esiste ed è finito, si chiama derivata di f in x0 e si denota con uno dei seguenti simboli: f 0 (x0 ), Df (x0 ), df (x0 ), dx Dx0 f, Df (x)|x=x0 . Mostriamo, ad esempio, che la funzione f (x) = x2 è derivabile in ogni punto x0 ∈ R e risulta f 0 (x0 ) = 2x0 . Si ha infatti f (x) − f (x0 ) x→x0 x − x0 (x + x0 )(x − x0 ) lim x→x0 x − x0 lim = = lim x→x0 x2 − x20 = x − x0 lim (x + x0 ) = 2x0 . x→x0 Definizione. Una funzione f : A → R si dice derivabile se è derivabile in ogni punto del suo dominio. Ovviamente, perché questo accada, è necessario (ma non sufficiente) che ogni punto del dominio A di f sia di accumulazione (ciò è vero, ad esempio, quando A è un intervallo o, più in generale, unione di intervalli). Esercizio. Provare che se f : R → R è costante, allora è derivabile in ogni punto x e f 0 (x) = 0. Esercizio. Provare che la funzione f (x) = x è derivabile in ogni punto e si ha f 0 (x) = 1 per ogni x ∈ R. Teorema. Una funzione f : A → R è derivabile in x0 ∈ A ∩ A0 se e solo se esiste una funzione ϕ: A → R continua in x0 e tale che f (x) − f (x0 ) = ϕ(x)(x − x0 ), ∀x ∈ A. In questo caso il numero ϕ(x0 ) coincide con f 0 (x0 ). Dal suddetto teorema segue immediatamente che se una funzione è derivabile in un punto, allora in tale punto è anche continua. Sia f : A → R derivabile in x0 e sia ϕ: A → R continua in x0 e tale che f (x) − f (x0 ) = ϕ(x)(x − x0 ), ∀x ∈ A. Si ha ϕ(x0 + h) = ϕ(x0 ) + ²(h) = f 0 (x0 ) + ²(h) , dove la funzione ²(h) := ϕ(x0 + h) − ϕ(x0 ) è continua e nulla per h = 0. Si può dunque concludere che se f è derivabile in x0 , allora f (x0 + h) = f (x0 ) + f 0 (x0 )h + ²(h)h , 20 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi per ogni h ammissibile, ossia tale che x0 + h ∈ A. Tale uguaglianza, come vedremo meglio in seguito, si chiama formula di Taylor del primo ordine di f in x0 (col resto nella forma di Peano). 26 - Mer. 4/10/00 Interpretazione geometrica della derivata (vedere Spiegel). Definizione. Data una funzione reale di variabile reale f , consideriamo un punto (x0 , y0 ) del suo grafico (ossia, supponiamo che x0 stia nel dominio di f e che y0 sia uguale a f (x0 ) ). Se f è derivabile in x0 , la retta tangente al grafico della f in (x0 , y0 ) è la retta passante per (x0 , y0 ) con coefficiente angolare f 0 (x0 ). Ossia, è la retta di equazione y−y0 = f 0 (x0 )(x − x0 ). Teorema. Le funzioni sen x, cos x, ex , log x sono derivabili e D sen x = cos x, D cos x = − sen x, Dex = ex , D log x = 1/x. Teorema (fondamentale delle derivate). Siano f e g due funzioni derivabili in un punto x0 . Allora, quando ha senso, si ha (f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ) (f g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ) f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 ) . (f /g)0 (x0 ) = g(x0 )2 A titolo di esempio, dimostriamo il suddetto teorema nel caso del prodotto. Denotiamo con A il dominio comune ad f e g e supponiamo che abbia senso la derivata di f g in x0 ; ossia supponiamo che x0 ∈ A ∩ A0 . Per ipotesi si ha f (x) = f (x0 ) + ϕ(x)(x − x0 ) e g(x) = g(x0 ) + ψ(x)(x − x0 ) per ogni x ∈ A, dove ϕ, ψ: A → R sono continue in x0 . Quindi f (x)g(x) = f (x0 )g(x0 ) + [ϕ(x)g(x0 ) + f (x0 )ψ(x) + ϕ(x)ψ(x)(x − x0 )](x − x0 ). Pertanto (f g)(x) − (f g)(x0 ) = α(x)(x − x0 ), dove la funzione α(x) = ϕ(x)g(x0 ) + f (x0 )ψ(x) + ϕ(x)ψ(x)(x − x0 ) è continua in x0 (essendo somma e prodotto di funzioni continue in x0 ). Questo prova che f g è derivabile in x0 e (f g)0 (x0 ) = α(x0 ) = ϕ(x0 )g(x0 ) + f (x0 )ψ(x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ). 21 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Esercizio. Usando la regola della derivata del quoziente provare che D tang x = 1 + tang2 x = 1/ cos2 x. Esercizi assegnati [Spiegel, cap. 4]: 1, 2, 3. 27 - Gio. 5/10/00 Teorema (della derivata di una funzione composta). Siano f : A → R e g: B → R due funzioni derivabili rispettivamente in x0 e in y0 = f (x0 ). Allora, quando ha senso (ossia, quando x0 è di accumulazione per il dominio f −1 (B) di g ◦f ), la funzione composta g ◦f è derivabile in x0 e si ha (g◦f )0 (x0 ) = g 0 (y0 )f 0 (x0 ) = g 0 (f (x0 ))f 0 (x0 ). In altre parole, la derivata della composizione è il prodotto delle derivate (nei punti corrispondenti). Dimostrazione. Per ipotesi si ha f (x) = f (x0 ) + ϕ(x)(x − x0 ), g(y) = g(y0 ) + ψ(y)(y − y0 ), ∀x ∈ A, ∀y ∈ B, con ϕ: A → R e ψ: B → R continue in x0 e y0 rispettivamente. Osserviamo ora che se x appartiene al dominio di g◦f , il numero f (x) sta nel dominio B di g. Sostituendo quindi, nella seconda uguaglianza, f (x) al posto di y e tenendo conto che f (x0 ) = y0 , si ottiene g(f (x)) − g(f (x0 )) = ψ(f (x))(f (x) − f (x0 )) = ψ(f (x))ϕ(x)(x − x0 ), per ogni x nel dominio f −1 (B) della funzione composta. Questo prova che g◦f è derivabile in x0 , visto che ψ(f (x))ϕ(x) è continua in x0 essendo composizione e prodotto di funzioni continue (la f e la ϕ sono continue in x0 e la ψ in y0 = f (x0 )). Si ha infine (g◦f )0 (x0 ) = ψ(f (x0 ))ϕ(x0 ) = ψ(y0 )ϕ(x0 ) = g 0 (y0 )f 0 (x0 ). Teorema (della derivata di una funzione inversa). Sia f : J → R una funzione strettamente monotona in un intervallo. Se f è derivabile in un punto x0 ∈ J e f 0 (x0 ) 6= 0, allora f −1 è derivabile in y0 = f (x0 ) e (f −1 )0 (y0 ) = 1 1 = 0 −1 . f 0 (x0 ) f (f (y0 )) Dimostrazione. Essendo f derivabile in x0 , esiste ϕ: J → R continua in x0 e tale che f (x) − f (x0 ) = ϕ(x)(x − x0 ) per ogni x ∈ J. Poiché (per definizione di funzione inversa) 22 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi risulta f −1 (y) ∈ J per ogni y ∈ f (J), ponendo nella suddetta uguaglianza f −1 (y) al posto di x (e tenendo conto che x0 = f −1 (y0 ) ), si ottiene f (f −1 (y)) − f (f −1 (y0 )) = ϕ(f −1 (y))(f −1 (y) − f −1 (y0 )); che possiamo scrivere nella forma y − y0 = ϕ(f −1 (y))(f −1 (y) − f −1 (y0 )). Di conseguenza, se y 6= y0 , si ha necessariamente ϕ(f −1 (y)) 6= 0, ed avendo inoltre supposto ϕ(f −1 (y0 )) = ϕ(x0 ) = f 0 (x0 ) 6= 0, si ottiene l’uguaglianza f −1 (y) − f −1 (y0 ) = 1 ϕ(f −1 (y)) (y − y0 ), ∀y ∈ f (J). Osserviamo ora che f −1 : f (J) → R è continua, visto che è monotona ed ha per immagine l’intervallo J. Risulta quindi continua in y0 anche la funzione 1/(ϕ◦f −1 ). Questo prova che f −1 è derivabile in y0 e (f −1 )0 (y0 ) = 1 ϕ(f −1 (y 0 )) = 1 f 0 (x 0) . Come applicazione del teorema della derivata di una funzione inversa, mostriamo che arctang x è derivabile e si ha 1 . D arctang x = 1 + x2 Fissato un punto y0 ∈ R, dal suddetto teorema segue D arctang y0 = 1 1 , = D tang x0 1 + tang2 x0 dove x0 = arctang y0 . Dunque D arctang y0 = 1 1+ tang2 (arctang y 0) = 1 . 1 + y02 Esercizio. Mediante il teorema della derivata di una funzione inversa determinare le derivate di arcsen x e di arccos x. Definizione. Data una funzione f : A → R, la sua derivata (laterale) destra [sinistra] in x0 è (quando esiste) la derivata in x0 della restrizione di f all’insieme A ∩ [x0 , +∞) [A ∩ (−∞, x0 ] ]. Tale derivata si indica con D+ f (x0 ) [D− f (x0 )] o con f+0 (x0 ) [f−0 (x0 )]. Osservazione. Supponiamo che in un punto x0 abbiano senso le due derivate laterali di una funzione. Allora la funzione è derivabile in x0 se e solo se tali derivate esistono e coincidono. In tal caso le tre derivate, sinistra, destra e bilaterale sono uguali. 23 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Un punto si dice angoloso per una funzione se in tal punto la funzione è derivabile sia a sinistra sia a destra ma le derivate laterali sono diverse. 28 - Gio. 5/10/00 Se f : A → R è derivabile in ogni punto di A, allora la funzione che ad ogni x ∈ A associa il numero f 0 (x) si chiama derivata (o derivata prima) di f e si denota con uno dei seguenti simboli: df . f 0 , Df, dx La derivata della derivata di una funzione f si chiama derivata seconda di f e si indica con f 00 , con D2 f o con µ ¶ d2 f d df = 2. dx dx dx In generale, la derivata della derivata (n − 1)-esima di f si chiama derivata n-esima e si denota con f (n) , con Dn f o con µ ¶ dn f d dn−1 f = n. dx dx dx Definizione. Una funzione f si dice di classe C 0 se è continua. Si dice di classe C 1 (o che appartiene alla classe C 1 ) se è derivabile e la sua derivata è di classe C 0 . Per induzione, f è (di classe) C n , n ∈ N, se è derivabile e la sua derivata prima è C n−1 . Si dice infine che f è (di classe) C ∞ se è C n per ogni n ∈ N. Per indicare che f è di classe C n [C ∞ ] si scrive f ∈ C n [f ∈ C ∞ ]. Abbiamo visto che le funzioni derivabili sono anche continue, pertanto, se f è C 1 , essendo derivabile, è anche di classe C 0 . Più in generale vale il seguente Lemma. Se f è C n allora è anche C n−1 . Dimostrazione. Indichiamo con Pn la proposizione “ C n ⇒ C n−1 ”. Abbiamo appena osservato che P1 è vera. Procediamo per induzione: supponiamo, per ipotesi induttiva, che sia vera Pn−1 e deduciamo da tale ipotesi che è vera anche Pn . Supponiamo quindi che f sia C n , ossia che f 0 sia C n−1 . Dall’ipotesi induttiva si deduce che f 0 è anche C n−2 , e quindi f è C n−1 (per definizione di C n−1 ). Per meglio comprendere il concetto di funzione di classe C n , osserviamo che se f ∈ C n , allora f 0 , essendo di classe C n−1 , è ancora derivabile e la sua derivata, f 00 , è di classe C n−2 , e cosı̀ via fino ad arrivare alla derivata n-esima di f , che deve esistere e risultare continua. In altre parole, possiamo affermare che f è C n se (e solo se) è derivabile n volte e la sua derivata n-esima è continua (una dimostrazione rigorosa di tale affermazione richiede il principio di induzione). 24 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Teorema (di regolarità delle funzioni combinate). La somma, il prodotto, il quoziente e la composizione di funzioni di classe C n , quando (e dove) ha senso, è ancora una funzione di classe C n . Dimostrazione. (Somma) Sia Pn la proposizione “ f, g ∈ C n ⇒ (f + g) ∈ C n ”. Dal teorema della derivata della somma si ha (f + g)0 = f 0 + g 0 , e questo implica immediatamente che P1 è vera. Assumiamo vera Pn−1 e dimostriamo che allora è vera anche Pn . Supponiamo quindi che f, g ∈ C n (ovvero che f 0 , g 0 ∈ C n−1 ) e mostriamo che (f + g) ∈ C n (ossia che (f + g)0 ∈ C n−1 ). Poiché (f + g)0 = f 0 + g 0 , dall’ipotesi induttiva si ha (f + g)0 ∈ C n−1 , che per definizione significa (f + g) ∈ C n . (Prodotto) Analogamente alla dimostrazione precedente denotiamo con Pn la proposizione “ f, g ∈ C n ⇒ f g ∈ C n ”. Dal teorema della derivata del prodotto si ha (f g)0 = f 0 g +g 0 f , e questo implica che P1 è vera. Assumiamo (per ipotesi induttiva) vera Pn−1 e supponiamo che f, g ∈ C n . Vogliamo provare che il prodotto f g è di classe C n , ovvero che la funzione (f g)0 , che coincide con f 0 g + g 0 f , è di classe C n−1 . Questo segue facilmente dal lemma precedente, dall’ipotesi induttiva, e da quanto già provato per la somma. (Quoziente) La dimostrazione è simile alle due precedenti ed è lasciata per esercizio allo studente. (Composizione) La dimostrazione è basata sulla formula della derivata di una funzione composta: (g◦f )0 (x) = g 0 (f (x))f 0 (x). Questa ci dice che (g◦f )0 è prodotto e composizione di funzioni di una classe inferiore di un’unità rispetto a quella di appartenenza di f e g. Come per i casi precedenti, si può procedere per induzione, provando che P1 è vera e riducendo la veridicità della proposizione Pn = “ f, g ∈ C n ⇒ g ◦f ∈ C n ” a quella di Pn−1 . Definizione. Una funzione f : [a, b] → R si dice (di classe) C 0 a tratti se è continua a tratti. Per induzione, f si dice C n a tratti se è derivabile tranne un numero finito di punti e la sua derivata è C n−1 a tratti. Si dice C ∞ a tratti se è C n a tratti per ogni n ∈ N. Esercizi assegnati [Spiegel, cap. 4]: 4, 5, 9. 29 - Ven. 6/10/00 Teorema. Le funzioni xα , ax , loga x, senh x, cosh x sono derivabili e risulta Dxα = αxα−1 , Dax = ax loga, D loga x = 1/(x loga), D senh x = cosh x, D cosh x = senh x. Definizione. Un punto x0 ∈ R si dice interno ad un sottoinsieme A di R se esiste un intorno (x0 − δ, x0 + δ) di x0 contenuto in A. Si dice che x0 è di frontiera per A se ogni suo intorno interseca sia l’insieme A sia il suo complementare (ossia, se non è né interno 25 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi ad A né interno al complementare di A). Definizione. Sia f : A → R una funzione reale di variabile reale. Un punto x0 ∈ A si dice di minimo [di massimo ] relativo (o locale) per f in A se esiste un intorno U di x0 tale che f (x) ≥ f (x0 ) [f (x) ≤ f (x0 )] per ogni x ∈ U ∩ A. Un punto di minimo o di massimo relativo per f (in A) si dice estremante per f (in A). Teorema di Fermat. Sia f : A → R una funzione reale di variabile reale e sia x0 ∈ A. Supponiamo che siano soddisfatte le seguenti tre ipotesi: 1) x0 è interno ad A; 2) f è derivabile in x0 ; 3) x0 è un punto estremante per f in A. Allora f 0 (x0 ) = 0. Dimostrazione. Supponiamo per assurdo che f 0 (x0 ) 6= 0. Ad esempio supponiamo f 0 (x0 ) > 0. Per ipotesi esiste ϕ: A → R, continua in x0 e tale che f (x) − f (x0 ) = ϕ(x)(x − x0 ) per ogni x ∈ A. Essendo ϕ(x0 ) = f 0 (x0 ) > 0, esiste un intorno V di x0 in cui ϕ(x) > 0. Quindi, in tale intorno, f (x) < f (x0 ) per x < x0 e f (x) > f (x0 ) per x > x0 . Ne segue che x0 non può essere né un punto di minimo né un punto di massimo, contraddicendo l’ipotesi 3). Pertanto non può essere f 0 (x0 ) > 0. In maniera analoga si prova che non può essere f 0 (x0 ) < 0. Dunque f 0 (x0 ) = 0. Osserviamo che, in base al Teorema di Fermat, i punti estremanti di una funzione f : A → R vanno cercati tra le seguenti tre categorie: 1) punti di frontiera; 2) punti in cui la funzione non è derivabile; 3) punti in cui si annulla la derivata. Nessuna delle suddette tre condizioni ci assicura che un punto sia estremante. Tuttavia, se il punto è estremante, almeno una delle tre deve necessariamente essere soddisfatta. 30 - Ven. 6/10/00 Teorema di Rolle. Sia f : [a, b] → R una funzione soddisfacente le seguenti condizioni: 1) f è continua in [a, b]; 2) f è derivabile in (a, b); 3) f (a) = f (b). Allora esiste un punto c ∈ (a, b) tale che f 0 (c) = 0. Dimostrazione. Poiché f è continua in un insieme limitato e chiuso, per il Primo Teorema di Weierstrass ammette minimo e massimo assoluti. Esistono cioè (almeno) due punti c1 , c2 ∈ [a, b] per i quali risulta f (c1 ) ≤ f (x) ≤ f (c2 ) per ogni x ∈ [a, b]. Se uno dei due punti, ad esempio c = c1 , è interno all’intervallo [a, b], allora, essendo f derivabile in tal 26 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi punto, dal Teorema di Fermat segue f 0 (c) = 0 (e la tesi, in questo caso, è dimostrata). Se, invece, nessuno dei due punti è interno ad [a, b], allora sono entrambi di frontiera per [a, b], e quindi, per l’ipotesi 3) si ha f (c1 ) = f (c2 ). Pertanto, essendo f (c1 ) ≤ f (x) ≤ f (c2 ), la funzione risulta costante e, di conseguenza, la derivata è nulla in ogni punto c ∈ (a, b). Esempio. La funzione f (x) = |x| è continua in [−1, 1] e f (−1) = f (1), ma la sua derivata non si annulla mai in (−1, 1). Come mai? Esempio. La funzione f (x) = x−[x] è definita in [0, 1], è derivabile in (0, 1) e f (0) = f (1). Tuttavia la sua derivata non si annulla mai in (0, 1). Come mai? Esempio. La funzione f (x) = x è derivabile in [0, 1] (quindi anche continua), sebbene la sua derivata non si annulli mai in (0, 1). Come mai? Il seguente risultato è un’importante estensione del Teorema di Rolle. Teorema di Lagrange (o del valor medio). Sia f : [a, b] → R una funzione soddisfacente le seguenti condizioni: 1) f è continua in [a, b]; 2) f è derivabile in (a, b). Allora esiste un punto c ∈ (a, b) tale che f 0 (c) = f (b) − f (a) . b−a Dimostrazione. Definiamo una nuova funzione ϕ(x) := f (x) − kx , determinando la costante k in modo che ϕ soddisfi (in [a, b]) le ipotesi del Teorema di Rolle. È immediato verificare che l’unica costante che rende ϕ(a) = ϕ(b) è k= f (b) − f (a) . b−a Per teorema di Rolle esiste c ∈ (a, b) tale che ϕ0 (c) = 0, e la tesi segue immediatamente osservando che ϕ0 (x) = f 0 (x) − k. Dati due arbitrari punti a, b ∈ R, l’intervallo che ha per estremi tali punti si chiama segmento di estremi a e b e si denota con ab. In altre parole: ab = [a, b] se a < b, ab = {a} se a = b e ab = [b, a] se a > b. Corollario. Sia f derivabile in un intervallo J. Allora, dati a, b ∈ J, esiste un punto c ∈ ab per il quale risulta f (b) − f (a) = f 0 (c)(b − a). Esercizi assegnati [Spiegel, cap. 4]: 21, 22, 23. 27 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 31 - Lun. 9/10/00 Diamo ora alcune importanti conseguenze del Teorema di Lagrange. Corollario. Sia f : J → R derivabile in un intervallo J e tale f 0 (x) ≥ 0 [f 0 (x) ≤ 0] per ogni x ∈ J. Allora f è crescente [decrescente] in J. Dimostrazione. Siano x1 , x2 ∈ J tali che x1 < x2 . Per il Teorema di Lagrange esiste un c ∈ (x1 , x2 ) per cui f (x2 )−f (x1 ) = f 0 (c)(x2 −x1 ). Poiché f 0 (c) ≥ 0, si ha f (x1 ) ≤ f (x2 ). Esercizio. Sia f : J → R derivabile in un intervallo J. Provare che la condizione “f 0 (x) ≥ 0, ∀x ∈ J” non è soltanto sufficiente, ma anche necessaria affinché f sia crescente in J. Suggerimento. Osservare che se f è crescente, allora f (x) − f (x0 ) ≥ 0, x − x0 ∀ x, x0 ∈ J , e quindi, per il teorema del confronto dei limiti . . . Corollario. Sia f : J → R derivabile in un intervallo J e tale f 0 (x) > 0 [f 0 (x) < 0] per ogni x ∈ J. Allora f è strettamente crescente [strettamente decrescente] in J. Dimostrazione. È analoga a quella del precedente corollario. Esercizio. Sia f : J → R derivabile in un intervallo J. Mostrare, con un esempio, che la condizione f 0 (x) > 0 (pur essendo sufficiente) non è necessaria affinché f sia strettamente crescente in J. Non è difficile provare che una condizione necessaria e sufficiente affinché una funzione f : J → R, derivabile in un intervallo J, sia strettamente crescente è che siano soddisfatte le seguenti due condizioni: – f 0 (x) ≥ 0 per ogni x ∈ J; – in ogni sottointervallo non banale di J esiste almeno un punto c in cui f 0 (c) > 0. Corollario. Sia f : J → R derivabile in un intervallo J e tale f 0 (x) = 0 per ogni x ∈ J. Allora f è costante in J. Dimostrazione. È analoga a quella del precedente corollario. Osservazione. Nei tre precedenti corollari, l’ipotesi che f sia definita in un intervallo non può essere rimossa. Ad esempio, per quanto riguarda l’ultimo dei tre, si osservi che la funzione f (x) = |x|/x è derivabile nel suo dominio R\{0}, ha derivata nulla, ma non è costante (lo è in ogni sottointervallo del dominio). Corollario. Sia f : J → R continua in un intervallo J e derivabile in J\{x0 }, con x0 ∈ J. Supponiamo che esista finito il limite per x → x0 di f 0 (x). Allora f è derivabile in x0 ed 28 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi f 0 risulta continua in x0 . In altre parole si ha f 0 (x0 ) = lim f 0 (x) . x→x0 Dimostrazione. Consideriamo il rapporto incrementale f (x) − f (x0 ) , x − x0 dove x ∈ J. Per il Teorema di Lagrange esiste un punto c(x) interno al segmento di estremi x e x0 tale che f (x) − f (x0 ) = f 0 (c(x)) . x − x0 Poiché c(x) → x0 per x → x0 e c(x) 6= x0 per x 6= x0 (si osservi infatti che 0 < |c(x)−x0 | < |x − x0 |), dal teorema di cambiamento di variabile per i limiti segue lim f 0 (c(x)) = lim f 0 (x) , x→x0 x→x0 e la tesi è pertanto dimostrata. Esempio. La funzione ½ x2 sen(1/x) se x 6= 0 0 se x = 0 è derivabile nel punto x = 0 (per provarlo basta applicare la definizione di derivata), ma non esiste il limite per x → 0 di f 0 (x). Pertanto, f è derivabile ma non è di classe C 1 (si osservi che è addirittura di classe C ∞ in R\{0}). f (x) = Esempio. La derivata della funzione ½ x3 sen(1/x) f (x) = 0 se x 6= 0 se x = 0 ammette limite (uguale a zero) per x → 0. Pertanto, f è derivabile (anche) in x = 0, è di classe C 1 e f 0 (0) = 0. 32 - Lun. 9/10/00 Il seguente risultato è un’utile generalizzazione del Teorema di Lagrange. Teorema di Cauchy. Siano f, g: [a, b] → R due funzioni soddisfacenti le seguenti condizioni: 1) f e g continue in [a, b]; 2) f e g derivabili in (a, b); 3) g 0 (x) 6= 0 per ogni x ∈ (a, b). 29 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Allora esiste un punto c ∈ (a, b) tale che f (b) − f (a) f 0 (c) = . 0 g (c) g(b) − g(a) Esercizio. Provare il Teorema di Cauchy determinando (analogamente a quanto visto per il teorema di Lagrange) la costante k in modo che la funzione ϕ(x) := f (x) − kg(x) verifichi (in [a, b]) le ipotesi del Teorema di Rolle. Si osservi che dal Teorema di Cauchy, nel caso particolare in cui g(x) = x, si ottiene il Teorema di Lagrange. Ricordiamo che una funzione si dice infinitesima per x → α se tende a zero per x → α. Analogamente, diremo che una funzione è infinita (per x → α) se tende all’infinito (per x → α). I teoremi di de l’Hôpital (o l’Hospital, o l’Hôpital, o L’Hospital, o L’Hôpital, a seconda dei testi) sono utili strumenti per il calcolo del limite del rapporto di due funzioni entrambe infinitesime o infinite per x → α. In altre parole, rappresentano un artificio (anche se non l’unico) per determinare il limite delle cosiddette forme indeterminate 0/0 e ∞/∞. Uno dei teoremi di de l’Hôpital riguarda il rapporto di due infinitesimi per x → x0 , un altro il rapporto di due infiniti per x → x0 , un altro ancora il rapporto di due infinitesimi per x → +∞, e cosı̀ via fino ad esaurire tutta la casistica. A titolo di esempio enunciamo (e proviamo) quello riguardante il rapporto di due infinitesimi per x → x0 . Dopo, per il gusto della sintesi, daremo un enunciato che li comprende tutti. Teorema di de l’Hôpital per la forma 0/0 quando x → x0 . Siano f e g due funzioni infinitesime per x → x0 e derivabili in un intorno forato di x0 . Supponiamo che in tale intorno sia definito il rapporto f 0 (x)/g 0 (x) (ossia, supponiamo g 0 (x) 6= 0). Allora, se esiste il limite (finito o infinito) per x → x0 di f 0 (x)/g 0 (x), risulta lim x→x0 f 0 (x) f (x) . = lim 0 g(x) x→x0 g (x) Dimostrazione. Poiché f e g tendono a zero per x → x0 , è possibile definirle in x0 (o ridefinirle, nel caso siano già definite), rendendole continue anche in tal punto. Allo scopo, infatti, è sufficiente (ed è necessario) porre f (x0 ) = g(x0 ) = 0. Si ha quindi lim x→x0 f (x) − f (x0 ) f (x) = lim . g(x) x→x0 g(x) − g(x0 ) Fissato x 6= x0 (nell’intorno forato in cui è definito il rapporto f 0 (x)/g 0 (x) ), per il Teorema di Cauchy esiste un punto c(x) interno al segmento x x0 di estremi x e x0 per il quale risulta f 0 (c(x)) f (x) − f (x0 ) = 0 . g(x) − g(x0 ) g (c(x)) 30 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Poiché c(x) → x0 per x → x0 e c(x) 6= x0 per x 6= x0 (si osservi infatti che 0 < |c(x)−x0 | < |x − x0 |), dal teorema di cambiamento di variabile per i limiti segue lim x→x0 f 0 (c(x)) f 0 (x) = lim , g 0 (c(x)) x→x0 g 0 (x) e la tesi è pertanto dimostrata. Teorema di de l’Hôpital (caso generale). Siano f, g: A → R due funzioni (entrambe) infinitesime o (entrambe) infinite per x → α. Supponiamo che il rapporto f 0 (x)/g 0 (x) sia definito in un intorno forato di α e che tale rapporto tenda ad un limite (finito o infinito) per x → α. Allora si ha f 0 (x) f (x) = lim 0 . x→α g (x) x→α g(x) lim Osservazione. La condizione espressa dal Teorema di de l’Hôpital è solo sufficiente. Infatti, ad esempio f (x) 2x + cos x = g(x) 3x + sen x tende a 2/3 per x → +∞, mentre f 0 (x)/g 0 (x) non ammette limite per x → +∞. Notiamo che ci sono casi in cui l’uso del Teorema di de l’Hôpital non porta a nulla. Ad esempio basta considerare √ x2 + 1 . lim x→+∞ x Applicazioni del Teorema di de l’Hôpital al calcolo di alcuni limiti come, ad esempio, xn =0 e x→+∞ ex lim lim x→+∞ log x = 0. x √ Dal secondo dei due suddetti limiti si deduce facilmente il limite della successione { n n}. Infatti, per il teorema di cambiamento di variabile nei limiti, se esiste il limx→+∞ x1/x , in particolare esiste anche limn→+∞ n1/n (ed è uguale). Si ha lim x1/x = lim exp ( e, di conseguenza, √ n x→+∞ x→+∞ log x ) = exp 0 = 1 x n → 1. Esercizi assegnati [Spiegel, cap. 4]: 30, 31. 33 - Mar. 10/10/00 Definizione. Sia f : A → R una funzione reale il cui dominio contenga una semiretta destra (ossia, un intorno di +∞). Una retta y = mx + q si dice asintoto destro (o asintoto per x → +∞) per f , se lim (f (x) − (mx + q)) = 0. x→+∞ 31 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Se il coefficiente angolare m è uguale a zero, l’asintoto si dice orizzontale, altrimenti si dice obliquo. Un’analoga definizione vale per il concetto di asintoto sinistro (i dettagli sono lasciati per esercizio allo studente). Esempio. Consideriamo la funzione f (x) = 2x − 1 + sen x/x. Dalla definizione di asintoto segue subito che la retta y = 2x − 1 è l’asintoto destro (e anche sinistro) per f . Infatti, la funzione sen x/x, che coincide con la differenza f (x) − (2x − 1), tende a zero per x → ∞ (è il prodotto di una funzione limitata per una infinitesima). Esempio. La funzione f (x) = x2 non ammette asintoto destro. Infatti, la differenza tra x2 e un polinomio di primo grado è un polinomio di secondo grado, e non può quindi tendere a zero per x → +∞. Esercizio. Provare che l’asintoto destro (sinistro) di una funzione, se esiste, è unico. Osservazione. Se f (x) → c ∈ R per x → +∞, allora la retta y = c è l’asintoto destro per f . Osservazione. Se f (x) = mx + q + g(x), dove g(x) → 0 per x → +∞, allora y = mx + q è l’asintoto destro per f . Definizione. Una retta x = x0 si dice asintoto verticale per una funzione f : A → R se f (x) → ∞ per x → x0 . Osserviamo che l’informazione “ x = x0 è un asintoto verticale per f ” non dice molto sul comportamento di f (x) in un intorno di x0 . Per disegnare il grafico di f , infatti, occorre + conoscere i due limiti per x → x− 0 e per x → x0 di f (x). Pertanto se, ad esempio, in uno studio di funzione, elencando i limiti importanti, si è già affermato che f (x) → +∞ per + x → x− 0 e f (x) → −∞ per x → x0 , è inutile aggiungere poi che x = x0 è un asintoto verticale per f , non si danno certo ulteriori informazioni. Teorema. Condizione necessaria e sufficiente affinché y = mx + q sia l’asintoto destro [sinistro] per una funzione reale di variabile reale f è che f (x) =m x→+∞ x e f (x) lim =m x→−∞ x e lim · lim (f (x) − mx) = q. x→+∞ ¸ lim (f (x) − mx) = q . x→−∞ Si può provare che se una funzione ammette asintoto destro ed esiste il limite per x → +∞ della sua derivata, allora questo coincide col coefficiente angolare dell’asintoto. Non è detto comunque che se una funzione ammette asintoto per x → +∞, debba necessariamente esistere il limite per x → +∞ della sua derivata. Ad esempio, l’asintoto destro di f (x) = 32 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi x + sen(x2 )/x è la retta y = x, ma non esiste il limite per x → +∞ di f 0 (x). Può anche capitare che una funzione non abbia asintoto destro ma la derivata ammetta limite finito per x → +∞. Un esempio di quest’ultimo caso è dato da log x. Definizione. Una funzione reale definita in un intervallo si dice convessa [concava ] se il segmento (la corda) che congiunge due punti qualunque del suo grafico sta sopra [sotto] il grafico. Teorema. Sia f : J → R derivabile in un intervallo J. Allora f è convessa [concava] se e solo se la retta tangente ad un punto qualunque del suo grafico sta sotto [sopra] il grafico. Teorema. Sia f : J → R derivabile due volte in un intervallo J. Allora f è convessa [concava] se e solo se f 00 (x) ≥ 0 [f 00 (x) ≤ 0] per ogni x in J. 34 - Mar. 10/10/00 Definizione. Un punto x0 del dominio di una funzione f si dice di flesso (per f ) se in un suo semi-intorno la funzione è convessa e nell’altro semi-intorno è concava (ossia se esistono un intorno destro e un intorno sinistro di x0 con concavità discordi: da una parte la funzione è convessa e dall’altra è concava). In base al precedente teorema, se una funzione è di classe C 2 , una condizione che assicura che in un punto x0 del dominio si abbia un flesso è che la derivata seconda cambi segno in x0 (da una parte positiva e dall’altra negativa). Esempi: 1) la funzione f (x) = x + x3 ha un flesso nel punto x = 0, perché in tale punto (appartenente al dominio) f 00 (x) cambia segno; 2) la funzione f (x) = x + x4 non ha un flesso nel punto x = 0, perché la sua derivata seconda è positiva in un intorno forato di x = 0, e quindi non esiste un semi-intorno di x = 0 in cui la funzione è concava; 3) la funzione f (x) = 1/x non ha un flesso in x = 0 perché, pur cambiando segno in x = 0 la sua derivata seconda, il punto non sta nel dominio della funzione. Studio di alcune funzioni elementari come, ad esempio, f (x) = xe−x e f (x) = x − x3 . Esercizi assegnati [Spiegel, cap. 4]: 33, 34. 33 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 35 - Mer. 11/10/00 Studio completo della funzione f (x) = e della sua restrizione ad un intervallo. x2 + 2x |x| − 1 36 - Mer. 11/10/00 Una partizione di un intervallo limitato e chiuso [a, b] è un insieme finito p = {x0 , x1 , . . . xn } di punti di [a, b] con la seguente proprietà: x0 = a < x1 < x2 < . . . < xn−1 < xn = b . Gli intervalli J1 = [x0 , x1 ], J2 = [x1 , x2 ], . . . , Jn = [xn−1 , xn ] si dicono intervalli (parziali) della partizione. Una scelta di punti nella partizione p è un insieme finito s = {c1 , c2 , . . . cn } di punti di [a, b] tali che c 1 ∈ J1 , c 2 ∈ J2 , . . . , c n ∈ Jn . Una coppia α = (p, s) costituita da una partizione p di [a, b] e da una scelta s di punti in p si dice una partizione puntata. Sia ora assegnata una funzione f : [a, b] → R. Ad ogni partizione puntata α = (p, s) di [a, b] possiamo associare il numero Sf (α) = n X f (ci )∆xi , i=1 dove ∆xi = xi − xi−1 denotano le ampiezze degli intervalli Ji della partizione p e ci i punti della scelta s. Si ha cosı̀ una funzione reale (di variabile non reale) Sf : P → R definita nell’insieme P delle partizioni puntate di [a, b]. Intuitivamente l’integrale (classico) in [a, b] della funzione f è, quando esiste, il valore limite che si ottiene facendo tendere a zero le ampiezze ∆xi degli intervalli delle possibili partizioni puntate. Diremo infatti che il numero I è l’integrale di f in [a, b] se, fissato un “errore” ² > 0, esiste un δ > 0 tale che, comunque si assegni una partizione puntata α con intervalli parziali di ampiezza minore di δ, la somma Sf (α) sopra definita dista da I meno di ². In altre parole, denotando con |α| la massima ampiezza degli intervalli della partizione puntata α (|α| si legge “parametro di finezza di α”), l’integrale I di f in [a, b] è il limite per |α| → 0 della sommatoria Sf (α). Si scrive lim Sf (α) = I |α|→0 34 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi e, ripetiamo, significa che per ogni ² > 0 esiste δ > 0 tale che se |α| < δ allora |Sf (α)−I| < ². Diremo che la funzione f è integrabile (in [a, b]) secondo Cauchy quando tale limite esiste finito (si invita lo studente a verificarne l’unicità). Detto limite si denota con uno dei seguenti simboli: Z b Z b f, f (x) dx , a a il primo dei quali si legge “integrale tra a e b di f ” e il secondo “integrale tra a e b di f (x) in dx ”. La f si chiama “funzione integranda” e la variabile x che appare nella seconda delle due notazioni si dice “variabile di integrazione”. Detta variabile, non intervenendo nella definizione di integrale, potrà anche essere omessa (come nella prima delle due notazioni) o essere indicata con una qualunque altra lettera. Ad esempio, l’integrale tra a e b di f si può scrivere anche Z b Z b f (t) dt o f (s) ds . a a Talvolta però la variabile di integrazione, per evitare ambiguità, non potrà essere omessa. È il caso, ad esempio, di un integrale del tipo Z b f (x, y)dx , a dove f : R2 → R è una funzione di due variabili, che in questo caso viene pensata funzione della sola variabile x fissando un qualunque valore della y (si dice funzione parziale). In tale integrale il simbolo dx sta ad indicare che delle due funzioni parziali l’integranda è quella di variabile x (pensando y come un parametro assegnato). Riguardo a tale integrale, si osservi che Z b f (x, y)dx , a essendo un numero per ogni assegnato valore della y, rappresenta una funzione della sola variabile y. Esercizi assegnati [Spiegel, cap. 4]: 35, 36. 37 - Gio. 12/10/00 Definizione. Un sottoinsieme A di R si dice trascurabile, o di misura nulla secondo Lebesgue (si legge “lebeg”), se fissato un arbitrario ² > 0 si può ricoprire A con una famiglia (al più) numerabile di intervalli di lunghezza complessiva (intesa come serie delle lunghezze) minore o uguale ad ². Osserviamo che gli insiemi finiti, cosı̀ come gli insiemi numerabili, sono trascurabili. Per vederlo, fissato ², è sufficiente coprire il primo punto con un intervallo di ampiezza ²/2, il secondo con un intervallo di ampiezza ²/4, e cosı̀ via dividendo per due, ad ogni passo, 35 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi l’ampiezza del precedente intervallo. La lunghezza complessiva degli intervalli è data dalla P n serie ∞ n=1 ²/2 , la cui somma è ², essendo una serie geometrica di ragione 1/2 e primo termine ²/2. Teorema (di integrabilità). Una funzione f : [a, b] → R è integrabile (secondo Cauchy) in [a, b] se e solo se è limitata e l’insieme dei suoi punti di discontinuità è trascurabile. Una prima conseguenza del teorema di integrabilità è che la somma, il prodotto e la composizione di funzioni integrabili è ancora integrabile (il quoziente potrebbe essere una funzione non limitata, e quindi non integrabile). Facciamo notare, inoltre, che se una funzione è continua in un intervallo compatto [a, b], allora è anche integrabile, essendo limitata per il Primo Teorema di Weierstrass, ed avendo un insieme vuoto (quindi trascurabile) di punti di discontinuità. Più in generale, se una funzione ha un numero finito (o un’infinità numerabile) di punti di discontinuità, allora, purché sia limitata, è integrabile (la limitatezza, questa volta, non è assicurata). Si potrebbe dimostrare che le funzioni monotone in un intervallo compatto [a, b] hanno al massimo un’infinità numerabile di punti di discontinuità. Quindi anch’esse, essendo limitate (visto che ammettono massimo e minimo agli estremi dell’intervallo [a, b]), sono integrabili secondo Cauchy. Teorema (proprietà di linearità dell’integrale definito). Siano f, g: [a, b] → R due funzioni integrabili e λ una costante. Allora si ha Z b Z b Z b (f (x) + g(x)) dx = f (x) dx + g(x) dx (additività), a a a Z b Z b λf (x) dx = λ f (x) dx (omogeneità). a a Teorema (proprietà di monotonia dell’integrale definito). Siano f, g: [a, b] → R integrabili e tali che f (x) ≤ g(x) per ogni x ∈ [a, b]. Allora Z b Z b f (x) dx ≤ g(x) dx . a a Esercizio. Provare che (analogamente alla ben nota disuguaglianza che afferma che “il valore assoluto di una sommatoria è minore o uguale alla sommatoria dei valori assoluti”) per l’integrale si ha ¯Z b ¯ Z b ¯ ¯ ¯ f (x)dx¯ ≤ |f (x)|dx . ¯ ¯ a a Suggerimento. Partire dalla disuguaglianza −|f (x)| ≤ f (x) ≤ |f (x)| e applicare la proprietà di monotonia degli integrali. 36 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Sia f : J → R una funzione reale definita in un intervallo. Supponiamo che f sia localmente integrabile; ossia integrabile in ogni sottointervallo compatto di J. Dati due arbitrari punti a, b ∈ J, è conveniente definire e Z Z b f (x) dx = 0 se b a a = b, a f (x) dx = − Z a f (x) dx se a > b. b Teorema (di additività rispetto all’intervallo). Sia f : J → R localmente integrabile in un intervallo J. Allora, dati tre arbitrari punti a, b, c ∈ J, si ha Z b f (x) dx = a Z c f (x) dx + a Z b f (x) dx . c Primo teorema della media per gli integrali. integrabile. Allora la media di f in [a, b], ossia Sia f : [a, b] → R una funzione Rb af (x)dx , b−a è un numero compreso tra l’estremo inferiore e l’estremo superiore di f . In particolare, se f è continua, allora (per il Secondo Teorema di Weierstrass) esiste un punto c ∈ [a, b] per il quale si ha Z b f (x)dx = f (c)(b − a) . a Secondo teorema della media per gli integrali. Siano f, g: [a, b] → R due funzioni integrabili. Supponiamo che g(x) non cambi segno in [a, b]. Allora (quando ha senso) la media ponderata di f in [a, b] (con peso g), ossia Rb af (x)g(x)dx , Rb ag(x)dx è un numero compreso tra l’estremo inferiore e l’estremo superiore di f . Inoltre, se f è continua, esiste un punto c ∈ [a, b] per il quale si ha Z b f (x)g(x)dx = f (c) a Z b g(x)dx , a incluso il caso in cui l’integrale di g sia zero. 37 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 38 - Gio. 12/10/00 Definizione. Sia f : A → R una funzione reale di variabile reale. Si dice che una funzione derivabile F : A → R è una primitiva di f se F 0 (x) = f (x) per ogni x ∈ A. Una conseguenza del Teorema di Lagrange è che se due primitive di una stessa funzione sono definite in un intervallo, allora, la loro differenza è costante (essendo zero la derivata della differenza). Pertanto, data una funzione f definita in un intervallo e data una sua primitiva F , ogni altra primitiva di f si ottiene da F aggiungendo un’opportuna costante. Ossia, l’insieme delle primitive di f si esprime nella forma F (x) + c, con c costante arbitraria. È bene notare che tale affermazione è falsa se viene rimossa l’ipotesi che il dominio di f sia un intervallo. Si osservi, ad esempio, che le due funzioni F (x) = log |x| e G(x) = log |x| + x/|x| hanno la stessa derivata (f (x) = 1/x) ma non differiscono per una costante (il loro dominio, R\{0}, non è un intervallo). Teorema (fondamentale del calcolo integrale). Sia f una funzione continua in un intervallo J e sia c ∈ J. Allora la funzione F : J → R definita da Z x f (t)dt F (x) = c è una primitiva di f. Ossia, F è derivabile, e per ogni x ∈ J si ha F 0 (x) = f (x). La seguente importante conseguenza del teorema fondamentale del calcolo integrale fornisce un utilissimo metodo per il calcolo di alcuni integrali (per gli altri non rimane che rivolgersi ai metodi numerici). Formula fondamentale del calcolo integrale. Sia f : J → R continua in un intervallo J. Se G: J → R è una primitiva di f , allora, fissati a, b ∈ J, si ha Z b f (x)dx = G(b) − G(a) . a Notazione. Data una funzione G: A → R e due punti a, b ∈ A, col simbolo [G(x)]ba si denota la differenza G(b) − G(a). La formula fondamentale del calcolo integrale può essere quindi scritta nel seguente modo: Z b f (x)dx = [G(x)]ba . a Esercizi sul calcolo di alcuni integrali definiti (mediante la formula fondamentale del calcolo integrale). Esercizi assegnati [Spiegel, cap. 5]: 1, 2, 6. 38 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 39 - Ven. 13/10/00 Sia f : J → R una funzione definita in un intervallo J ⊂ R. Col simbolo Z f (x) dx , detto integrale indefinito di f (x) in dx, si denota l’insieme delle primitive di f . Poiché il dominio di f è un intervallo, se F è una primitiva di f , si ha Z f (x) dx = F (x) + c , dove c ∈ R è un’arbitraria costante. Se il dominio di una funzione f : A → R non è un intervallo (come nel caso di f (x) = 1/x), col simbolo Z f (x) dx , si intenderà (tacitamente) l’insieme delle primitive della restrizione di f ad un qualunque sottointervallo del dominio e, di conseguenza, se F è una di queste primitive, sarà ancora valido scrivere Z f (x) dx = F (x) + c . Ad esempio, scriveremo Z 1 dx = log |x| + c , x sottointendendo di avere scelto uno dei due intervalli (−∞, 0) o (0, +∞) che compongono il dominio R\{0} della funzione f (x) = 1/x. Calcolo di alcuni integrali indefiniti elementari: Z Z xα+1 α + c (α 6= −1) , x−1 dx = log |x| + c , x dx = α+1 Z Z Z sen x dx = − cos x + c , cos x dx = sen x + c , ex dx = ex + c , Z Z senh x dx = cosh x + c , 1 dx = arctang x + c , 1 + x2 Z Z cosh x dx = senh x + c , √ 1 dx = arcsen x + c . 1 − x2 40 - Ven. 13/10/00 Esercizi sullo studio del dominio di alcune funzioni integrali e calcolo della loro derivata: 39 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi ϕ(x) = Z −2x2 0 sen t dt , 1 − t2 ϕ(x) = Z x2 x cos t dt , t ϕ(x) = Z x2 −x cos t dt . t Sia f : J → R una funzione derivabile in un intervallo J ⊂ R. Consideriamo due punti x0 e x0 + h del dominio J di f . L’incremento che subisce la funzione f passando dal punto x0 al punto x0 + h è il numero ∆f = f (x0 + h) − f (x0 ). Per il Teorema di Lagrange possiamo scrivere ∆f = f 0 (c)h, dove c è un opportuno punto del segmento di estremi x0 e x0 + h (ricordiamo che tale punto è addirittura interno al segmento se h 6= 0). Il difetto dell’incremento ∆f (che dovremmo a rigore scrivere ∆f (x0 , h) o ∆f (x0 )(h) o ∆fx0 (h), perché dipende sia dal punto iniziale x0 sia dall’incremento h della variabile indipendente x) è che non è facile da valutare perché, tranne casi particolari, non è noto il punto c. Tuttavia, se l’incremento ∆f (x0 )(h) ci interessa soltanto per valori piccoli di h (come, ad esempio, per il calcolo degli errori), al posto dell’incremento vero è preferibile utilizzare un incremento “virtuale” che, pur avendo il difetto di non essere vero (a meno che il grafico di f non sia una retta), ha il duplice pregio di essere facile da calcolare e di approssimare bene l’incremento vero. Tale incremento virtuale, detto differenziale di f (nel punto x0 e relativo all’incremento h), è cosı̀ definito: df (x0 )(h) = f 0 (x0 )h . Riguardo alla facilità del calcolo di df (x0 )(h), osserviamo che, quando risulta noto il punto iniziale x0 , df (x0 )(h) si ottiene con una semplice moltiplicazione. Riguardo al fatto di approssimare bene l’incremento vero ∆f (x0 )(h) per piccoli valori di h, facciamo notare che, per definizione di derivata, (se f 0 (x0 ) 6= 0) il rapporto ∆f (x0 )(h) df (x0 )(h) tende ad uno al tendere a zero di h. Ciò significa che l’errore relativo ∆f (x0 )(h) − df (x0 )(h) df (x0 )(h) tende a zero per h che tende a zero (ossia, è tanto più trascurabile quanto più piccolo è l’incremento h della variabile indipendente). Osserviamo ora che la variabile indipendente x, passando dal punto x0 al punto x0 + h, subisce un incremento ∆x(x0 )(h) = h, e quindi il suo incremento vero coincide con quello virtuale (infatti, essendo uguale ad 1 la derivata di x, si ha dx(x0 )(h) = 1 · h). Pertanto, fissando il punto x0 , si ha l’uguaglianza df (x0 )(h) = f 0 (x0 )dx(x0 )(h) , 40 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi valida per ogni valore di h. Dato che la suddetta uguaglianza è vera per ogni h, possiamo scrivere df (x0 ) = f 0 (x0 )dx(x0 ), intendendo che df (x0 ), come funzione di h (x0 fissato), coincide col prodotto del numero f 0 (x0 ) per la funzione dx(x0 ) (ancora di h). A questo punto possiamo fare un’ulteriore semplificazione nelle notazioni: il differenziale di x in x0 (come funzione di h) non dipende dal punto x0 in cui viene considerato. Pertanto, la notazione dx(x0 ) è ridondante e possiamo tranquillamente scrivere dx al posto di dx(x0 ), senza che sia necessario specificare il punto in cui tale differenziale viene considerato. In altre parole, l’incremento virtuale dx(x0 )(h) è uguale ad h qualunque sia il punto iniziale x0 e qualunque sia l’incremento h della variabile, e questo incremento, ricordiamo, coincide con quello vero ∆x(x0 )(h) = (x0 + h) − x0 . In definitiva, dato un generico x nel dominio di f , da ora in avanti scriveremo df (x) = f 0 (x)dx , intendendo che l’incremento virtuale (ossia il differenziale) della funzione f in un generico punto x coincide col prodotto del numero f 0 (x) per l’incremento virtuale (o anche vero) della variabile x. Intuitivamente ciò significa che quando l’incremento della variabile x, invece di essere un numero finito, è un “numero infinitesimo”, anche l’incremento della funzione f è un infinitesimo e coincide col prodotto del numero (finito) f 0 (x) per l’infinitesimo dx. Tale affermazione, poco chiara nell’ambito della teoria dei numeri reali, diventerebbe rigorosa nella moderna teoria dei numeri iper-reali. Tra le due teorie, tuttavia, dal punto di vista cronologico, c’è un secolo di distanza (la prima del XIX e la seconda del XX), e la seconda, tuttora in ebollizione, deve essere ancora ben digerita dai matematici (figuriamoci da chi la matematica la usa soltanto!). Esercizi assegnati [Spiegel, cap. 5]: 8, 9. 41 - Lun. 16/10/00 Tenendo conto della parentela tra il differenziale di una funzione e la sua derivata, sono di immediata verifica le seguenti proprietà: 1) d(f (x) + g(x)) = df (x) + dg(x); 2) d(f (x)g(x)) = g(x)df (x) + f (x)dg(x); 3) d(f (x)/g(x)) = (g(x)df (x) − f (x)dg(x))/g(x)2 ; 4) d(g(f (x))) = g 0 (f (x))dg(x). Formula di integrazione per parti per l’integrale indefinito. Siano f e g due funzioni derivabili in un intervallo J. Allora gli integrali (indefiniti) delle funzioni f (x)g 0 (x) 41 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi e g(x)f 0 (x) sono legati dalla seguente relazione: Z Z f (x)g 0 (x)dx = f (x)g(x) − g(x)f 0 (x)dx . Dimostrazione. La relazione da dimostrare è un’uguaglianza tra due insiemi: il primo è costituito dalle primitive di f g 0 e il secondo dalle funzioni esprimibili come differenza tra f g ed una qualunque primitiva di gf 0 . Mostriamo prima che se H è una primitiva di gf 0 , allora f g − H è una primitiva di f g 0 . Si ha infatti (f g − H)0 (x) = f (x)g 0 (x) + f 0 (x)g(x) − g(x)f 0 (x) = f (x)g 0 (x). In modo analogo si prova che se K è una primitiva di f g 0 , allora questa è la differenza tra la funzione f g e una primitiva di gf 0 . Basta infatti scrivere K = f g − (f g − K). Osservazione. Con i differenziali la formula di integrazione per parti può essere scritta nel modo seguente: Z Z f (x)dg(x) = f (x)g(x) − g(x)df (x) . I termini f (x) e g(x) si chiamano fattori finiti, mentre dg(x) e df (x) sono i cosiddetti fattori differenziali. Esercizi su alcuni integrali indefiniti, tra i quali Z Z Z x x sen xdx , e cos xdx , x log xdx , Z cos2 xdx . 42 - Lun. 16/10/00 Formula di integrazione per sostituzione per gli integrali indefiniti. Sia f una funzione definita su un intervallo I e sia ϕ: J → I una funzione derivabile su un intervallo J, a valori nel dominio I di f . Allora, se F è una primitiva di f , la funzione G(t) = F (ϕ(t)) è una primitiva di f (ϕ(t))ϕ0 (t). Vale quindi la relazione Z Z f (x)dx = f (ϕ(t))ϕ0 (t)dt (modulo x = ϕ(t)), il cui significato è il seguente: ogni funzione del secondo insieme si ottiene da una del primo con la sostituzione x = ϕ(t). Nella formula di integrazione per sostituzione il termine ϕ0 (t)dt rappresenta il differenziale di ϕ(t). Si potrà quindi scrivere Z Z f (x)dx = f (ϕ(t))dϕ(t) (modulo x = ϕ(t)), 42 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi mettendo cosı̀ in risalto come si possa ricondurre il calcolo di un integrale del secondo tipo ad uno del primo: in pratica, per calcolare il secondo integrale, basta trovare una primitiva F (x) di f (x) e sostituire poi ϕ(t) al posto della variabile x, e per far ciò l’invertibilità di ϕ non è necessaria. Più problematico è invece il calcolo di un integrale del primo tipo riconducendolo ad uno del secondo. Il motivo è che, dopo aver effettuato la sostituzione x = ϕ(t) ed aver calcolato una primitiva G(t) di f (ϕ(t))ϕ0 (t), per trovarne una di f (x) occorre ricavare t in funzione di x dalla relazione x = ϕ(t) (che costituisce l’equazione del grafico di ϕ). Ciò è possibile (almeno teoricamente) se si suppone ϕ: J → I strettamente monotona e suriettiva. Esercizi assegnati [Spiegel, cap. 5]: 15, 17. 43 - Mar. 17/10/00 Esercizi sull’integrale indefinito. Decomposizione di una funzione razionale in frazioni semplici. 44 - Mar. 17/10/00 Esercizi sugli integrali di funzioni razionali. Cenno sui metodi numerici per il calcolo degli integrali definiti (rettangoli, trapezi e Simpson). Esercizi assegnati [Spiegel, cap. 5]: 18, 19. 45 - Mer. 18/10/00 Formula di integrazione per parti per gli integrali definiti. Siano f e g due funzioni C 1 in un intervallo J. Allora, fissati a, b ∈ J, vale la seguente formula: Z b Z b b f (t)dg(t) = [f (t)g(t)]a − g(t)df (t). a Dimostrazione. Posto ϕ(x) = Z a x a f (t)g 0 (t)dt − [f (t)g(t)]xa + Z x g(t)f 0 (t)dt, a basta provare che ϕ(b) = 0. Questo segue immediatamente dal fatto che ϕ(a) = 0 e ϕ0 (x) = 0 per ogni x ∈ [a, b]. Osservazione (utile per comprendere le ipotesi della formula di integrazione per sostituzione). Supponiamo che la composizione f (ϕ(t)) di due funzioni sia ben definita per ogni 43 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi t appartenente ad un segmento di estremi α, β ∈ R. Allora, se ϕ è continua, la funzione f (x) è necessariamente ben definita per ogni x appartenente al segmento di estremi ϕ(α) e ϕ(β). Tale segmento, infatti, per il Secondo Teorema di Weierstrass, è contenuto nell’immagine ϕ(αβ) di αβ, e tale immagine, a sua volta, se si vuole che sia ben definita in αβ la funzione f (ϕ(t)), deve essere contenuta nel dominio di f (x). Formula di integrazione per sostituzione (o di cambiamento di variabile) per gli integrali definiti. Sia f una funzione continua e sia ϕ un’applicazione di classe C 1 . Allora, fissati due punti α e β nel dominio di ϕ, purché f (ϕ(t)) sia definita per t ∈ αβ, si ha Z Z ϕ(β) β f (x)dx = ϕ(α) f (ϕ(t))ϕ0 (t)dt . α Dimostrazione. Consideriamo la funzione g: αβ → R definita da Z ϕ(s) Z s g(s) = f (x)dx − f (ϕ(t))ϕ0 (t)dt . ϕ(α) α Occorre provare che g(β) = 0. Dalla definizione di g(s) si ricava immediatamente g(α) = 0. Derivando si ha g 0 (s) = f (ϕ(s))ϕ0 (s) − f (ϕ(s))ϕ0 (s) = 0 , ∀s ∈ αβ. Quindi g è costante e, conseguentemente, g(β) = g(α) = 0. Si ricorda che una funzione f : A → R si dice periodica di periodo T > 0 (o T -periodica) se per ogni x ∈ A si ha x + T ∈ A e f (x) = f (x + T ). Esercizio. Provare che se f : R → R è T -periodica, allora l’integrale Z a+T f (x) dx a non dipende da a. Esercizio. Calcolare Più in generale, dato n ∈ N, calcolare Z 100 [x]dx . 0 Z n [x]dx . 0 46 - Mer. 18/10/00 Ricordiamo che, per semplicità di linguaggio, diremo che una funzione è localmente integrabile se è integrabile in ogni sottointervallo compatto del suo dominio. Ovviamente, le funzioni continue sono localmente integrabili. 44 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Abbiamo visto che se una funzione è integrabile (secondo Cauchy) in un intervallo compatto [a, b], allora deve essere necessariamente limitata in tale intervallo. Supponiamo ora che una funzione f sia definita in un intervallo non compatto (a, b] e che in tale intervallo risulti localmente integrabile (ad esempio, f potrebbe essere continua in (a, b], ma non definita in a). Il fatto che f possa non essere definita in a non costituisce un problema: è sempre possibile estenderla assegnandole un arbitrario valore f (a) (ad esempio, si può porre f (a) = 0). Comunque, che si estenda o no, i casi sono due: o f è limitata o non lo è. Nel primo caso non ci sono problemi: si potrebbe dimostrare, infatti, che ogni sua estensione è integrabile secondo Cauchy e l’integrale non dipende dal valore f (a) scelto. Se invece f è non limitata, nessuna sua estensione ad [a, b] potrà eliminare tale difetto (per fissare le idee si pensi ad una f continua in (a, b] che tende all’infinito per t → a+ ). In questo secondo caso si usa dire che f ha una singolarità in a e l’integrale Z b f (x)dx a non è definito secondo Cauchy. Per questa ragione viene detto improprio, e il suo valore (quando esiste nei reali estesi) è cosı̀ definito: Z b f (x)dx = lim c→a+ a Z b f (x)dx . c Se tale limite è finito, diremo che l’integrale (di f in [a, b]) è convergente, se vale +∞ o −∞ diremo che è divergente (a +∞ o a −∞, rispettivamente). Se il limite non esiste, l’integrale improprio si dirà indeterminato. Analogamente, se una funzione f è localmente integrabile in [a, b), ma non limitata, definiamo Z b Z c f (x)dx = lim f (x)dx . c→b− a a Come per il caso della singolarità in a, tale integrale potrà essere convergente, divergente o indeterminato. Esempio. L’integrale improprio Z 1 0 1 dx , xα α > 0, converge se 0 < α ≤ 1 e diverge se α > 1. Consideriamo ora una funzione f localmente integrabile in un intervallo [a, b] privato di un punto interno x0 . Si pensi, ad esempio, ad una funzione continua in [a, b]\{x0 } ma non definita in x0 . Se f è limitata, non ci sono problemi: basta definirla in un modo qualunque nel punto x0 , e la nuova funzione risulterà integrabile secondo Cauchy 45 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi (e l’integrale indipendente dal valore assegnato in x0 ). Se invece f non è limitata (ossia, se x0 è una singolarità per f ), allora l’integrale tra a e b di f è improprio e si definisce riconducendosi ai casi precedentemente visti: Z b Z x0 Z b f (x)dx = f (x)dx + f (x)dx , a a x0 purché non si abbia la forma indeterminata ∞ − ∞. Ovviamente si possono presentare casi di funzioni con più di una singolarità in [a, b]. Se queste sono in numero finito, è sufficiente spezzare l’integrale nella somma di integrali con singolarità in uno solo dei due estremi di integrazione, riconducendosi cosı̀ ai due casi già trattati. Esercizi assegnati [Spiegel, cap. 5]: 20, 21. 47 - Gio. 19/10/00 Sia f : [a, +∞) → R una funzione localmente integrabile. Poiché l’intervallo [a, +∞) non è limitato, l’integrale Z +∞ f (x)dx a non ha senso secondo Cauchy (si osservi infatti che ogni partizione dell’intervallo di integrazione non può avere parametro di finezza finito). Tale integrale si dice improprio e il suo valore (quando esiste, finito o infinito) si definisce nel modo seguente: Z +∞ Z c f (x)dx = lim f (x)dx . a c→+∞ a In altre parole, l’integrale tra a e +∞ di f non è altro che il limite per c → +∞ della funzione integrale Z c F (c) := f (x)dx . a Se tale limite è finito, diremo che l’integrale è convergente, se vale +∞ o −∞ diremo che è divergente (a +∞ o a −∞, rispettivamente). Se il limite non esiste, l’integrale improprio si dirà indeterminato. Osservazione. Sia f : [a, +∞) → R una funzione localmente integrabile. Supponiamo f (x) ≥ 0 per ogni x ≥ a. Allora la funzione integrale Z c F (c) := f (x)dx a è crescente. Pertanto, per il teorema del limite per le funzioni monotone, l’integrale di f in [a, +∞) converge o diverge a +∞. In ogni caso, nei reali estesi è ben definito. 46 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Criterio del confronto (per gli integrali impropri su una semiretta destra). Siano f, g: [a, +∞) → R due funzioni localmente integrabili e tali che 0 ≤ f (x) ≤ g(x) , ∀x ≥ a . Allora, nei reali estesi, si ha Z +∞ f (x)dx ≤ a Z +∞ g(x)dx . a In particolare, se converge l’integrale di g, converge anche l’integrale di f , e se diverge l’integrale di f , diverge anche l’integrale di g. Dimostrazione. Poiché f e g sono non negative, le due funzioni integrali Z c Z c F (c) = f (x)dx e G(c) = g(x)dx a a sono crescenti e, conseguentemente, per entrambe esiste (finito o infinito) il limite per c → +∞. Dall’ipotesi “ f (x) ≤ g(x) per x ≥ a ” si ottiene F (c) ≤ G(c) per ogni c ≥ a, e la tesi segue immediatamente dal teorema del confronto dei limiti. Criterio del confronto asintotico (per gli integrali impropri su una semiretta destra). Siano f, g: [a, +∞) → R due funzioni localmente integrabili e positive. Se f (x) = λ < +∞ x→+∞ g(x) lim e se converge (in [a, +∞)) l’integrale di g, converge anche l’integrale di f . Di conseguenza, se il limite λ (oltre ad essere finito) è diverso da zero, allora i due integrali hanno lo stesso carattere. Dimostrazione. Per il teorema della permanenza del segno esiste un x̄ ≥ a tale che f (x)/g(x) < λ + 1 per x ≥ x̄; da cui segue, essendo g(x) > 0, che f (x) < (λ + 1)g(x) per x ≥ x̄. Quindi, per il criterio del confronto, si ha Z +∞ Z +∞ f (x)dx ≤ (λ + 1) g(x)dx x̄ x̄ e, di conseguenza, se converge l’integrale di g, converge anche l’integrale di f . Supponiamo ora che il limite λ (oltre che essere finito) sia positivo. Allora g(x)/f (x) → 1/λ < +∞; pertanto, per quanto appena provato, se converge l’integrale di f , converge anche l’integrale di g, e gli integrali hanno dunque lo stesso carattere. Facciamo notare che il criterio del confronto asintotico può anche essere usato come criterio di divergenza (sempre nell’ipotesi che le funzioni in esame siano positive). Supponiamo 47 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi infatti che f (x)/g(x) → λ < +∞ e che l’integrale di f sia divergente. Allora l’integrale di g non può convergere, perché altrimenti convergerebbe anche l’integrale di f . Quindi, visto che l’integrale di una funzione positiva non può essere indeterminato, l’integrale di g deve necessariamente divergere. Criterio della convergenza assoluta (per gli integrali impropri su una semiretta destra). Sia f : [a, +∞) → R una funzione localmente integrabile. Se converge (in [a, +∞)) l’integrale del valore assoluto di f , allora converge anche l’integrale di f . Dimostrazione. Definiamo le funzioni f+ , f− : [a, +∞) → R nel seguente modo: f+ (x) = f− (x) = |f (x)| + f (x) = max{f (x), 0} , 2 |f (x)| − f (x) = max{−f (x), 0} , 2 e osserviamo che f (x) = f+ (x) − f− (x), |f (x)| = f+ (x) + f− (x), 0 ≤ f+ (x) ≤ |f (x)|, 0 ≤ f− (x) ≤ |f (x)|. Poiché l’integrale di |f (x)| è convergente, per il criterio del confronto convergono anche gli integrali di f+ (x) e di f− (x). Pertanto, dal teorema del limite della somma, si ottiene Z +∞ Z +∞ Z +∞ f− (x)dx , f+ (x)dx − f (x)dx = a a a e questo prova che Z esiste ed è finito. +∞ f (x)dx a Analogamente a come si è definito l’integrale improprio su una semiretta destra, data una funzione localmente integrabile f : (−∞, b] → R, il suo integrale improprio, che denoteremo col simbolo Z b f (x)dx, è il limite per c → −∞ della funzione −∞ F (c) = Z b f (x)dx. c È evidente che per gli integrali impropri su una semiretta sinistra valgono ancora, con ovvie modifiche, i criteri del confronto, del confronto asintotico e dell’assoluta convergenza (si invita lo studente a formularne gli enunciati). 48 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Consideriamo ora una funzione f localmente integrabile su tutta la retta reale. Col simbolo Z +∞ f (x)dx, −∞ detto integrale improprio (o generalizzato) di f in R, si denota, quando ha senso in R, la somma Z +∞ Z x0 f (x)dx + f (x)dx , −∞ x0 dove x0 è un qualunque punto di R. Lasciamo allo studente il compito di verificare che la definizione è ben posta (ossia, non dipende da x0 ∈ R). Diremo che l’integrale di f in R è convergente se sono convergenti entrambi i suddetti integrali; che è divergente se uno dei due integrali diverge e l’altro converge; che è indeterminato se la somma dei due integrali si presenta nella forma ∞ − ∞ o se è indeterminato uno dei due integrali. I criteri del confronto, del confronto asintotico, e della convergenza assoluta, con le opportune modifiche, valgono anche per gli integrali impropri di una funzione non limitata in un intervallo limitato. Lasciamo allo studente il compito di formularne gli enunciati. Esercizio. Determinare, in funzione di α > 0, il carattere dei seguenti integrali impropri: Z b a dx , (x − a)α Z b a dx . (b − x)α Sia f una funzione localmente integrabile in un intervallo J, limitato o non limitato. Denotiamo con α e β l’estremo inferiore e l’estremo superiore di J, rispettivamente. Ovviamente α può essere −∞, cosı̀ come β può essere +∞. In ogni caso, proprio o improprio che sia, l’integrale di f in J verrà indicato con Z o più semplicemente con Z Diremo che f è sommabile (in J) se Z β f (x)dx α f (x)dx < +∞ . J J |f (x)|dx < +∞ . In particolare, tutte le funzioni integrabili (nel senso di Cauchy) in un intervallo compatto [a, b] sono sommabili. Esempio. La funzione f (x) = 1/xα è sommabile in [a, +∞), a > 0, se e solo se α > 1. 49 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Esempio. La funzione f (x) = 1/xα è sommabile in (0, b], b > 0, se e solo se α < 1. 48 - Gio. 19/10/00 Sia f : J → R una funzione di classe C n in un intervallo. Consideriamo due arbitrari punti a, b ∈ J. Dalla formula fondamentale del calcolo integrale si ottiene Z b f (b) = f (a) + f 0 (t)dt, a che possiamo scrivere nella forma f (b) = f (a) + Z b a f 0 (t)d(t − b). Integrando per parti si ha 0 f (b) = f (a) + [f (t)(t − b)]ba − Quindi f (b) = f (a) + f 0 (a)(b − a) + Con un’ulteriore integrazione per parti si ottiene Z Z b a f 00 (t)(t − b)dt . b a (b − t)f 00 (t)dt . f 00 (a) (b − a)2 + 2 f (b) = f (a) + f 0 (a)(b − a) + Z b a (b − t)2 (3) f (t)dt. 2 Continuando ad integrare per parti si ha infine f (b) = f (a) + f 00 (a) f (n−1) (a) f 0 (a) (b − a) + (b − a)2 + . . . + (b − a)n−1 + Rn−1 , 1! 2! (n − 1)! dove Rn−1 = Z b a (b − t)n−1 (n) f (t)dt. (n − 1)! La suddetta uguaglianza si chiama formula di Taylor di ordine n − 1 col resto Rn−1 espresso in forma integrale. Lo scopo della formula è quello di esprimere il valore di f in un punto b tramite informazioni riguardanti il comportamento della funzione in un punto iniziale a. In generale non sarà possibile valutare con esattezza il valore in b conoscendo soltanto ciò che accade in a. Tuttavia, nella suddetta formula, tutto ciò che non riguarda il comportamento di f in a è confinato in un solo termine: il resto Rn−1 della formula. Se nel valutare f (b) si trascura il resto, si commette un errore, ma tale errore, talvolta, può essere maggiorato facilmente se si sa maggiorare la derivata n-esima di f . Una situazione limite particolarmente interessante si ottiene quando la derivata n-esima di f è zero: in 50 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi questo caso si può affermare che il valore di f in un arbitrario punto b dipende soltanto da ciò che accade in un assegnato punto a. Spesso, nella formula di Taylor, uno dei due punti, che denotiamo x0 , si suppone fissato e l’altro, che denotiamo x, si pensa variabile. La formula prende allora la seguente forma: f (x) = f (x0 ) + f 00 (x0 ) f 0 (x0 ) (x − x0 ) + (x − x0 )2 + . . . 1! 2! f (n−1) (x0 ) (x − x0 )n−1 + Rn−1 (x) , ... + (n − 1)! dove il resto Rn−1 (x) = Z x (x − t)n−1 (n) f (t)dt x0 (n − 1)! è una funzione di x, tanto più piccola quanto più vicino è x al punto x0 , detto centro della formula. Vediamo ora un altro modo per esprimere il resto della formula di Taylor. Poiché il termine g(t) = (x − t)n−1 (n − 1)! non cambia di segno quando la variabile di integrazione t varia tra x0 e x, si può applicare il secondo teorema della media per gli integrali. Si ottiene quindi Z x f (n) (c(x)) (x − t)n−1 (n) (x − x0 )n , dt = Rn−1 (x) = f (c(x)) n! x0 (n − 1)! dove c(x) è un opportuno punto (dipendente da x e) appartenente al segmento x0 x di estremi x0 e x (si osservi che la funzione c(x) tende ad x0 per x → x0 ). Il termine Rn−1 (x) = f (n) (c(x)) (x − x0 )n n! si chiama resto n-esimo della formula di Taylor di centro x0 nella forma di Lagrange e, a parte il fatto che la derivata n-esima di f è calcolata in un punto c(x), invece che nel centro x0 , ha una stretta parentela con i termini che lo precedono. Riguardo al motivo per cui detto resto si dice “di Lagrange”, si osservi che la suddetta formula si riduce al Teorema di Lagrange quando n = 1 (ad eccezione del fatto che nel Teorema di Lagrange non è richiesta la derivabilità agli estremi x e x0 del segmento). Se il centro x0 della formula di Taylor è 0, allora la formula si dice anche di MacLaurin. Esercizio. Sia f : R → R di classe C n e tale che f n (x) = 0 per ogni x ∈ R. Provare che f è un polinomio di grado minore o uguale ad n − 1 (in particolare, se n = 1, allora f è costante). 51 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Suggerimento. Scrivere la formula di MacLaurin di ordine n − 1 di f col resto di Lagrange. Applicazioni della formula di Taylor col resto di Lagrange al calcolo approssimato del numero e (si sviluppa ex per x = 1). Applicazioni della formula di Taylor col resto di Lagrange al calcolo approssimato di sen x, per valori piccoli di x. 49 - Ven. 20/10/00 Col cambiamento di variabile x = x0 + h, la formula di Taylor di ordine n − 1 e centro x0 di f diventa f (x0 + h) = f (x0 ) + f 00 (x0 ) 2 f (n−1) (x0 ) n−1 f 0 (x0 ) h+ h + ... + h + Rn−1 (h) . 1! 2! (n − 1)! Il resto Rn−1 (h), che rappresenta la differenza tra f (x0 + h) e il polinomio di Taylor Pn−1 (h) = f (x0 ) + f 00 (x0 ) 2 f (n−1) (x0 ) n−1 f 0 (x0 ) h+ h + ... + h , 1! 2! (n − 1)! può essere scritto nella forma di Lagrange: Rn−1 (h) = f (n) (c(h)) n h , n! dove c(h) è un punto, dipendente da h, appartenente al segmento di estremi x0 e x0 + h. Osservazione. Col cambiamento di variabile x = x0 + h, la formula di Taylor di centro x0 di f coincide con la formula di MacLaurin della funzione g(h) := f (x0 + h). Talvolta, per il calcolo dei limiti, è conveniente scrivere il resto della formula di Taylor in un modo diverso dalle due forme (integrale e di Lagrange) precedentemente viste. Consideriamo infatti il resto Rn−1 (h) = f (n) (c(h)) n h n! della formula di Taylor ottenuto con la sostituzione x = x0 + h. Come abbiamo visto, il punto c(h) appartiene al segmento di estremi x0 e x0 + h. Di conseguenza, c(h) tende ad x0 per h → 0 e c(0) = x0 . Ovvero, la funzione c(h) è continua nel punto h = 0. Poiché f è di classe C n , la funzione composta f (n) (c(h))/n! risulta continua per h = 0. Possiamo dunque scrivere f (n) (x0 ) f (n) (c(h)) = + ²(h) , n! n! 52 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi dove ²(h) := (f (n) (c(h)) − f (n) (x0 ))/n! è una funzione continua e nulla nel punto h = 0. La precedente formula di Taylor può quindi essere scritta nella forma f (x0 + h) = f (x0 ) + f 00 (x0 ) 2 f (n) (x0 ) n f 0 (x0 ) h+ h + ... + h + ²(h)hn , 1! 2! n! detta formula di Taylor di centro x0 e ordine n di f col resto nella forma di Peano. Tale formula costituisce un’uguaglianza valida per ogni h ammissibile (ossia per ogni h per cui x0 + h appartiene al dominio di f ) ed esprime f (x0 + h) come somma di un polinomio Pn (h) di grado minore o uguale ad n, detto polinomio di Taylor di f di centro x0 e ordine n, e di un resto Rn (h) = ²(h)hn , costituito dal prodotto di una funzione ²(h), continua e nulla per h = 0, con la potenza hn . Convenzione. Da ora in avanti, anche se non esplicitamente dichiarato, col simbolo ²(h) denoteremo una qualunque funzione continua e nulla nel punto h = 0. Ovviamente, la variabile potrà essere indicata con una qualunque lettera (non solo con h). Riguardo al calcolo con funzioni del tipo ²(h) facciamo le seguenti osservazioni: – la somma di due funzioni ²(h) è una funzione ²(h); – il prodotto di una funzione continua (nel punto h = 0) per una funzione ²(h) è una funzione ²(h); – se f è continua in un punto x = x0 , allora f (x0 + h) = f (x0 ) + ²(h); – se g(h) è una funzione continua e nulla in zero, allora la composizione ²(g(h)) è una funzione ²(h); – se g(h) è una funzione continua e nulla in zero, allora la composizione g(²(h)) è una funzione ²(h). 50 - Ven. 20/10/00 Formule di MacLaurin di sen x, cos x, ex , (1 + x)α . A titolo di esempio, consideriamo la funzione f (x) = x2 sen 2x e determiniamone la formula di MacLaurin del quinto ordine. Si dovrà scrivere un’uguaglianza del tipo f (x) = P5 (x) + ²(x)x5 , dove P5 (x) è un polinomio di grado minore o uguale a cinque (più avanti proveremo che tale polinomio è unico). Grazie alla presenza del termine x2 , è sufficiente determinare la formula di MacLaurin del terzo ordine di sen 2x, e moltiplicarla poi per x2 . Si osservi infatti che il prodotto di x2 per P3 (x) + ²(x)x3 , dove P3 (x) è un polinomio di grado non superiore a tre, diventa P5 (x) + ²(x)x5 , dove P5 (x) è di grado non superiore a cinque. Ricordiamo che per sen x si ha sen x = x − x3 + ²(x)x3 . 6 53 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Poiché tale uguaglianza è valida per ogni numero x, sostituendo 2x al posto di x si ottiene sen 2x = 2x − 4 3 x + 8²(2x)x3 , 3 che è ancora un’uguaglianza. Tenendo conto che 8²(2x) è una funzione del tipo ²(x), si ha sen 2x = 2x − e quindi f (x) = x2 (2x − 4 3 x + ²(x)x3 3 4 3 4 x + ²(x)x3 ) = 2x3 − x5 + ²(x)x5 . 3 3 Determiniamo ora una formula di Taylor con centro diverso da zero. calcoliamo la formula del quarto ordine e centro x0 = −1 di Ad esempio, f (x) = 2x + (x + 1)2 cos πx . Poiché il centro x0 non è zero, conviene effettuare la sostituzione x = x0 + h = −1 + h . In questo modo è come se si calcolasse la formula di MacLaurin di g(h) := f (−1 + h). Si ha f (−1 + h) = 2(−1 + h) + h2 cos(πh − π) = −2 + 2h + h2 [cos(πh) cos(−π) − sen(πh) sen(−π)] = −2 + 2h − h2 cos(πh) = −2 + 2h − h2 (1 − −2 + 2h − h2 + π2 2 h + ²(h)h2 ) = 2 π2 4 h + ²(h)h4 . 2 Esercizi sulla formula di Taylor. Esercizi sul calcolo dei limiti con l’aiuto della formula di Taylor. 51 - Lun. 23/10/00 Teorema (della derivata n-esima). Sia f : J → R di classe C n in un intervallo J e sia x0 un punto interno a J. Supponiamo che f 0 (x0 ) = f 00 (x0 ) = . . . = f (n−1) (x0 ) = 0 e f (n) (x0 ) 6= 0 (ossia, supponiamo che la prima derivata che non si annulla in x0 sia di ordine n). Se n è pari, allora x0 è un punto estremante per f e, in particolare, è di 54 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi minimo quando f (n) (x0 ) > 0 ed è di massimo quando f (n) (x0 ) < 0. Se invece n è dispari, allora x0 non è un punto estremante. Dimostrazione. Dalla formula di Taylor di centro x0 e ordine n si ottiene f (x0 + h) − f (x0 ) = f (n) (x0 ) n h + ²(h)hn n! (∀ h tale che x0 + h ∈ J). Dunque, ∆f (x0 )(h) = ϕ(h)hn , dove ∆f (x0 )(h) = f (x0 + h) − f (x0 ) è l’incremento subito dalla funzione f nel passare dal punto x0 al punto x0 + h e ϕ(h) := f (n) (x0 )/n! + ²(h). Supponiamo, per fissare le idee, che f (n) (x0 ) sia positiva. Allora, ϕ(0) > 0, e quindi, essendo ϕ(h) continua nel punto h = 0, per il teorema della permanenza del segno esiste un δ > 0 per cui risulta ϕ(h) > 0 per ogni h tale che |h| < δ. Dunque, se n è pari si ha ∆f (x0 )(h) > 0 per 0 < |h| < δ e, conseguentemente, x0 è un punto di minimo relativo per f . Se invece n è dispari, si ha ∆f (x0 )(h) < 0 per −δ < h < 0 e ∆f (x0 )(h) > 0 per 0 < h < δ, e pertanto x0 non è un punto estremante. Il caso f (n) (x0 ) < 0 si tratta in modo analogo. Teorema (di unicità della formula di Taylor). Sia f : J → R di classe C n in un intervallo J e sia x0 ∈ J. Supponiamo che f (x0 + h) = a0 + a1 h + a2 h2 + . . . + an hn + ²(h)hn per ogni h ammissibile (ossia, tale che x0 + h ∈ J). Allora a0 = f (x0 ), a1 = f 00 (x0 ) f (n) (x0 ) f 0 (x0 ) , a2 = , . . . , an = . 1! 2! n! Dimostrazione. Abbiamo già provato che f 00 (x0 ) 2 f (n) (x0 ) n f 0 (x0 ) h+ h + ... + h + ²(h)hn , 1! 2! n! per ogni h ammissibile. Quindi, sottraendo le due uguaglianze, si ha f (x0 + h) = f (x0 ) + f 00 (x0 ) 2 f (n) (x0 ) n f 0 (x0 ) )h + (a2 − )h + . . . + (an − )h + ²(h)hn , 1! 2! n! per ogni h ammissibile. Dobbiamo dunque dimostrare che se 0 = (a0 − f (x0 )) + (a1 − 0 = c0 + c1 h + c2 h2 + . . . + cn hn + ²(h)hn , ∀ h tale che x0 + h ∈ J, allora c0 = 0, c1 = 0, . . . , cn = 0. Poiché la suddetta uguaglianza è vera anche per h = 0 (ricordarsi che x0 ∈ J, e quindi h = 0 è ammissibile), si ottiene c0 = 0. Conseguentemente, cancellando c0 , si ha 0 = c1 h + c2 h2 + . . . + cn hn + ²(h)hn , ∀ h tale che x0 + h ∈ J, 55 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi e pertanto, raccogliendo h, si ottiene 0 = h (c1 + c2 h + . . . + cn hn−1 + ²(h)hn−1 ), ∀ h tale che x0 + h ∈ J. La funzione c1 + c2 h + . . . + cn hn−1 + ²(h)hn−1 è dunque nulla per tutti gli h 6= 0 tali che x0 +h ∈ J e, di conseguenza, poiché è continua nel punto per h = 0 (essendo somma e prodotto di funzioni continue), possiamo concludere che è nulla anche per h = 0 (si osservi che tende a zero per h → 0). Vale allora l’uguaglianza 0 = c1 + c2 h + . . . + cn hn−1 + ²(h)hn−1 , ∀ h tale che x0 + h ∈ J. Pertanto, ponendo h = 0, si deduce che anche il coefficiente c1 deve essere nullo. Il risultato si ottiene procedendo allo stesso modo per passi successivi. Esercizi sulla formula di Taylor e applicazioni alla ricerca dei punti estremanti. 52 - Lun. 23/10/00 Formule di MacLaurin di senh x, cosh x, log(1 + x). Esercizi sulla formula di Taylor. 53 - Mar. 24/10/00 Consideriamo il limite per x → α di una funzione del tipo f (x)g(x) , dove f (x) > 0. Supponiamo che, per x → α, f (x) → a ∈ R e g(x) → b ∈ R. Poiché ogni numero positivo c può essere scritto nella forma elog c , si ha f (x)g(x) = elog f (x) g(x) = eg(x) log f (x) . È importante quindi studiare il limite per x → α della funzione g(x) log f (x). Per semplicità di linguaggio, in ciò che segue, facciamo le seguenti convenzioni: e−∞ = 0, e+∞ = +∞, log 0 = −∞, log(+∞) = +∞. Nel caso che b log a sia un numero reale esteso, non sia cioè una forma indeterminata, in base a tali convenzioni possiamo affermare che lim f (x)g(x) = lim eg(x) log f (x) = elimx→α g(x) log f (x) = eb log a . x→α x→α Ovviamente, nei suddetti passaggi si è tenuto conto del teorema di cambiamento di variabile per i limiti e della continuità delle funzioni ex e log x. Analizziamo ora in quali casi la forma b log a risulta indeterminata. Si hanno solo due possibilità: 56 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 1) b = 0 e log a = ∞; 2) b = ∞ e log a = 0. Il primo caso dà luogo a due sottocasi: a = 0 e a = +∞. Il caso 2) può capitare solo se a = 1. La forma b log a risulta quindi indeterminata nelle seguenti tre situazioni: a) a = 0 e b = 0 (forma indeterminata 00 ); b) a = +∞ e b = 0 (forma indeterminata ∞0 ); c) a = 1 e b = ∞ (forma indeterminata 1∞ ). Nei reali estesi, all’infuori dei casi 00 , ∞0 e 1∞ (che rappresentano le tre forme indeterminate delle potenze), è conveniente definire ab = eb log a . Ovviamente, affinché nei reali estesi abbia senso log a, è necessario che a sia maggiore o uguale a zero (+∞ incluso). In base a tale definizione, se non si ha una forma indeterminata, si può dunque affermare che lim f (x)g(x) = elimx→α g(x) log f (x) = eb log a = ab = x→α ³ lim f (x) x→α ´limx→α g(x) Esempi di forme indeterminate delle potenze: (00 ) limx→0 xx = limx→0 ex log x = elimx→0 x log x = e0 = 1; (∞0 ) limx→+∞ x1/x = limx→+∞ elog x/x = elimx→+∞ log x/x = e0 = 1; (1∞ ) limx→0 (1 + x)1/x = limy→∞ (1 + 1/y)y = e. 54 - Mar. 24/10/00 Esercizi sulla formula di Taylor e applicazioni agli integrali impropri. Esercizi sulla formula di Taylor e applicazioni alle forme indeterminate. 55 - Mer. 25/10/00 Ricordiamo che una funzione reale di variabile reale si dice infinitesima (o un infinitesimo) per x → α se tende a zero per x → α. Definizione. Siano f, g: A → R due infinitesimi per x → α. Supponiamo g(x) 6= 0 in un intorno forato di α. Si dice che f (x) è un infinitesimo di ordine superiore a g(x), si scrive f (x) = o(g(x)) e si legge “ f (x) uguale ad o-piccolo di g(x) per x tendente ad α ”, se il rapporto f (x)/g(x) tende a zero per x → α. Si dice che f (x) e g(x) sono infinitesimi dello stesso ordine se f (x)/g(x) tende ad un numero finito e diverso da zero (per x → α). Si 57 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi dice che f e g sono due infinitesimi equivalenti (per x → α), e si scrive “ f (x) ∼ = g(x) per x → α ”, se f (x)/g(x) → 1 per x → α. Si osservi che se due infinitesimi sono equivalenti, allora sono anche dello stesso ordine (ma in generale non è vero il viceversa). Esempi di infinitesimi per x → 0: x, sen x, |x|, x2 /(1 + cos x), x + x2 , 2x, 1 − cos x, x2 − x, p |x|, tang(πx) . Riguardo ai suddetti esempi, osserviamo che (per x → 0) x ∼ = sen x, che 1 − cos x è di 2 ordine superiore ad x, che 1 − cos x è dello stesso ordine di x (ma non equivalente), che x p è di ordine superiore a |x|, che 1 − cos x ∼ = x2 /2 ∼ = x2 /(1 + cos x), che 2x e x2 − x sono dello stesso odine, che tang(πx) ∼ = πx. Esempi di infinitesimi per x → +∞: 1/x, √ 1/ x, 1/x2 , 2/x + 1/x3 , 1/|x|, 1/(x + x2 ), x/(1 + x − x2 ), sen x/(x − cos x), sen(1/x), sen(1/x) + 1/x2 . Osserviamo che (per x → +∞) 1/x2 è di ordine superiore a 1/x, che 1/(x+x2 ) è equivalente a 1/x2 ; che 1/x è dello stesso ordine di 2/x + 1/x3 , che x/(1 + x − x2 ) e sen(1/x) + 1/x2 sono dello stesso ordine. Ulteriori esempi di infinitesimi: p √ √ sen x per x → π; sen x/x per x → ∞; 2 − x per x → 2; 2 − x per x → 2− ; |2 − x| p √ per x → 2; |2 − x| per x → 2+ ; 1/x per x → −∞; 1/x per x → ∞; x + x2 − 1 per √ x → −∞; x − x2 − 1 per x → +∞; tang x per x → π. Osservazione. La relazione (tra infinitesimi per x → α) di “essere equivalenti” è una effettiva relazione di equivalenza; ossia, è riflessiva (f (x) ∼ = = f (x)), è simmetrica (se f (x) ∼ ∼ ∼ ∼ ∼ g(x) allora g(x) = f (x)), ed è transitiva (se f (x) = g(x) e g(x) = h(x) allora f (x) = h(x)). Talvolta, quando si afferma che una certa funzione f (x) è infinitesima per x → α, risulta superflua la precisazione “per x → α”, quando è evidente dal contesto o dalla natura di f (x) quale sia il punto α a cui deve tendere la variabile affinché f (x) risulti infinitesima. Ad esempio, se si afferma che x2 è un infinitesimo, è inutile aggiungere che lo è per x → 0, in quanto x = 0 è l’unico possibile punto (nei reali estesi) a cui può tendere x in modo che x2 sia un infinitesimo. Analogamente, se si afferma, ad esempio, che f (x) = o(x3 ), non occorre precisare che ciò accade per x → 0: x3 è un infinitesimo solo per x → 0. La più semplice funzione infinitesima per x → 0 è g(x) = x. Per questo motivo tale funzione viene spesso considerata un riferimento per gli altri infinitesimi per x → 0. Si usa dire infatti che f (x) è un infinitesimo del primo ordine se è dello stesso ordine di x, 58 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi che è del secondo se è dello stesso ordine di x2 , che è di ordine superiore al primo se è di ordine superiore ad x, e cosı̀ via. Sono – – – – – di facile verifica le seguenti proprietà: se f (x) = o(xn ), allora xm f (x) = o(xn+m ); se f (x) = o(xn ) e g(x) = o(xm ) allora f (x)g(x) = o(xn+m ); se f (x) = o(xn ) ed m < n, allora f (x) = o(xm ); se f (x) = o(xn ) e g(x) = o(xn ) allora f (x) + g(x) = o(xn ); se f (x) = o(xn ) e g(x) è continua per x = 0, allora g(x)f (x) = o(xn ). Osservazione. Se f (x) = ²(x)xn , n ≥ 1, allora f (x) = o(xn ). Non è difficile provare che se si assume f (x) continua nel punto x = 0, allora le due affermazioni “f (x) = o(xn )” e “f (x) = ²(x)xn ” sono addirittura equivalenti. Espressione della formula di Taylor col simbolo o-piccolo: f (x0 + h) = f (x0 ) + f 00 (x0 ) 2 f (n) (x0 ) n f 0 (x0 ) h+ h + ... + h + o(hn ) . 1! 2! n! 56 - Mer. 25/10/00 Lo spazio R2 è l’insieme delle coppie ordinate di numeri reali; ossia delle coppie di numeri (x, y), con x, y ∈ R. Una coppia (x, y) si dice “ordinata” perché dei due numeri x e y è importante conoscere quale sia il primo e quale il secondo (ovvero, l’ordine in cui si susseguono). In altre parole, una coppia (x, y), quando x 6= y, si considera diversa da (y, x). Analogamente, lo spazio R3 è l’insieme delle terne ordinate di numeri reali. Più in generale, dato k ∈ N, con Rk si denota l’insieme delle k-ple (si legge “cappuple”) di numeri reali. Gli elementi di R2 [di R3 , di Rk ] si dicono punti (o vettori). Dato un punto p = (x, y) ∈ R2 , il numero x si dice la prima coordinata (o componente) di p e il numero y la seconda. Analogamente, dato x = (x1 , x2 , . . . , xk ) ∈ Rk , i numeri x1 , x2 , . . . , xk sono le coordinate di x (la prima, la seconda, ... la k-esima). Il punto di Rk con componenti tutte nulle si chiama origine di Rk (o vettore nullo, o vettore banale) e si indica con 0 (come lo 0 dei reali, o dei complessi). Dati due punti p1 = (x1 , y1 ) e p2 = (x2 , y2 ) di R2 , la loro somma si definisce “componente per componente”: p1 + p2 = (x1 + x2 , y1 + x2 ) . Dato un punto p = (x, y) ∈ R2 e dato un numero λ ∈ R (detto scalare, per distinguerlo dal vettore p) si definisce il prodotto λp moltiplicando per λ ogni componente di p. Ossia, λp = (λx, λy). Ovviamente anche la differenza tra due punti di R2 , che è definita come 59 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi l’operazione inversa della somma, si fa componente per componente. Analoghe definizioni si danno in R3 e in Rk (i dettagli sono lasciati allo studente). Se p = (x, y) è un punto di R2 , la sua norma (o modulo) è il numero p kpk = x2 + y 2 , che rappresenta la distanza di p dall’origine di R2 . Più in generale, dato p = (x1 , x2 , . . . , xk ) ∈ Rk , la sua norma è il numero q kpk = x21 + x22 + . . . + x2k . I vettori di R2 [di Rk ] di norma uno si chiamano anche versori o direzioni di R2 [di Rk ]. Si potrebbe provare che la norma gode di proprietà simili a quelle del valore assoluto. Ossia: 1. kpk ≥ 0; 2. kpk = 0 se e solo se p = 0; 3. kλpk = |λ|kpk; 4. kp + qk ≤ kpk + kqk. La distanza tra due punti p e q di Rk è, per definizione, il numero d(p, q) = kp − qk . In particolare, se p1 = (x1 , y1 ) e p2 = (x2 , y2 ) sono due punti di R2 , si ha p d(p1 , p2 ) = kp1 − p2 k = (x1 − x2 )2 + (y1 − y2 )2 . Nello spazio R3 (e, in particolare, anche in R2 ) si definisce il prodotto tra due arbitrari vettori u = (x1 , y1 , z1 ) e v = (x2 , y2 , z3 ), detto prodotto scalare e denotato col simbolo u · v (si legge “u scalare v”), ponendo u · v = x 1 x 2 + y 1 y 2 + z1 z2 . Il significato geometrico è il seguente: il prodotto scalare tra due vettori u e v è dato dal prodotto dei moduli (dei due vettori) per il coseno dell’angolo θ compreso (tra i due vettori). Si ha pertanto |u · v| = kukkvk | cos θ| ≤ kukkvk , da cui segue la nota disuguaglianza di Schwarz: |u · v| ≤ kukkvk. Si osservi che la norma di un vettore v ∈ R3 può essere definita anche attraverso il prodotto √ scalare. Si ha infatti kvk = v · v. 60 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Dato un punto p0 ∈ Rk e dato r > 0, l’intorno (sferico) di centro p0 e raggio r è l’insieme Bp0 (r) = {p ∈ Rk : kp − p0 k < r} dei punti p di Rk che distano da p0 meno di r. In R2 , l’intorno sferico di un punto p0 si dice anche intorno circolare, ed è costituito da un cerchio di centro p0 privato della circonferenza (la frontiera del cerchio). Se da Bp0 (r) si toglie il punto p0 , ciò che rimane si chiama intorno forato (di centro p0 e raggio r). Analogamente a quanto si è visto per lo spazio R, dato A ⊂ Rk e dato p0 ∈ Rk , si dice che p0 è interno ad A se esiste un intorno di p0 contenuto in A; si dice che p0 è un punto di accumulazione per A se ogni suo intorno forato contiene punti di A; si dice che p0 è di frontiera per A se ogni suo intorno contiene sia punti di A sia punti del complementare Ac di A. Un punto p0 di A si dice isolato se non è di accumulazione (significa che p0 , in un suo intorno, è l’unico punto di A). L’insieme dei punti interni ad A si dice l’interno di A e si denota con Å, l’insieme dei punti di accumulazione si chiama il derivato di A e si indica con A0 e l’insieme dei punti di frontiera di A si denota con ∂A. Un sottoinsieme A di Rk si dice aperto se ogni suo punto è interno (ossia, se A = Å); si dice chiuso se il suo complementare è aperto. Si potrebbe provare che un insieme è chiuso se e solo se contiene tutti i punti della sua frontiera ed è aperto se e solo se ogni punto della sua frontiera appartiene al complementare (che in questo caso risulta chiuso). Un’altra condizione necessaria e sufficiente affinché un insieme sia chiuso è che contenga tutti i suoi punti di accumulazione. Ovviamente, esistono anche insiemi che non sono né aperti né chiusi; basti pensare ad un insieme che contiene soltanto alcuni punti della sua frontiera, ma non tutti; come, ad esempio, un intervallo (a, b] di R. Un sottoinsieme A di Rk si dice limitato se esiste una costante r > 0 tale che kpk ≤ r per ogni p ∈ A. Non è difficile verificare che A è limitato se e solo se il suo diametro, diam(A) = sup {kp − qk : p, q ∈ A}, è minore di +∞. 57 - Gio. 26/10/00 Una funzione f : A → R si dice reale di due [di tre, di k] variabili reali se il suo dominio A è un sottoinsieme di R2 [di R3 , di Rk ]. Se f è una funzione di due [tre, k] variabili, il valore che assume in un punto (x, y) [(x, y, z), (x1 , x2 , . . . xk )] si denota con f (x, y) [f (x, y, z), f (x1 , x2 , . . . xk )] o, più semplicemente, con f (p), dove p sta per (x, y) [per (x, y, z), per (x1 , x2 , . . . xk )]. Ricordiamo che il grafico di un’applicazione tra due arbitrari insiemi, f : X → Y , è costituito delle coppie ordinate (x, y) che soddisfano la relazione y = f (x), detta equazione del 61 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi grafico. Pertanto, in particolare, se f : A → R è una funzione reale di due variabili reali, il suo grafico è l’insieme delle coppie (p, z) che verificano la condizione z = f (p), con p ∈ A. D’altra parte, essendo p = (x, y) un punto di R2 , ossia una coppia ordinata di numeri reali, il grafico di f può essere “visualizzato” in R3 come l’insieme delle terne (x, y, z) che verificano l’equazione z = f (x, y), con (x, y) ∈ A (che, tranne “casi patologici”, rappresenta una superficie in R3 ). Data f : A → R, con A ⊂ R2 , e dato un numero c ∈ R, l’insieme f −1 (c) = {(x, y) ∈ A : f (x, y) = c} si dice insieme di livello c (della f ). Tranne “casi patologici”, f −1 (c) è una curva in R2 , detta curva (o linea) di livello c. Diremo che una funzione f : A → R, definita su un sottoinsieme A di R2 (o, più in generale, di Rk ), è limitata [limitata superiormente, limitata inferiormente] se lo è la sua immagine. Non è difficile verificare che f è limitata se e solo se esiste una costante M > 0 che domina f ; ossia, tale che |f (p)| ≤ M per ogni p ∈ A . Notazione. Da ora in avanti, a meno che non venga altrimenti specificato, con la lettera ρ denoteremo la seguente funzione di due variabili (che di solito verranno indicate con h e k, ma talvolta anche con x e y): p ρ = ρ(h, k) = k(h, k)k = h2 + k 2 . Osservazione. Le funzioni x/ρ e y/ρ sono limitate. Si ha infatti Analogamente |y/ρ| ≤ 1. |x| |x| |x/ρ| = p ≤ √ = 1. x2 x2 + y 2 Sia f : A → R una funzione reale di due variabili reali e sia (x0 , y0 ) un punto di accumulazione per il dominio A di f (non occorre che (x0 , y0 ) appartenga ad A). Si dice che f (x, y) tende ad un numero reale l per (x, y) che tende ad (x0 , y0 ), e si scrive f (x, y) → l per (x, y) → (x0 , y0 ), se per ogni ² > 0 esiste δ > 0 tale che da p 0 < (x − x0 )2 + (y − y0 )2 < δ e (x, y) ∈ A segue |f (x, y) − l| < ². Per indicare che f (x, y) → l per (x, y) → (x0 , y0 ) si usa anche dire che il limite per (x, y) che tende a (x0 , y0 ) di f (x, y) è uguale a l, e si scrive lim (x,y)→(x0 ,y0 ) f (x, y) = l 62 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi oppure, denotato con p0 il punto (x0 , y0 ) e con p il generico punto (x, y), si scrive lim f (p) = l . p→p0 Più in generale, se f : A → R è una funzione reale di k variabili reali, dato un punto p0 di accumulazione per il dominio A di f e dato un numero reale esteso λ, si dice che f (p) tende a λ per p → p0 , e si scrive lim f (p) = λ , p→p0 se fissato un arbitrario intorno U di λ esiste un δ > 0 tale che da 0 < kp − p0 k < δ (e p ∈ A) segue f (p) ∈ U . Osservazione. Se il limite per (x, y) → (x0 , y0 ) di f (x, y) è uguale λ ∈ R, allora, fissato un qualunque vettore non nullo v = (h, k) ∈ R2 , si ha lim f (x0 + th, y0 + tk) = λ . t→0 In particolare, se esiste il limite per p → p0 di f (p), allora il limite direzionale lim f (p0 + tv) t→0 esiste per ogni vettore non nullo v ed è indipendente dalla direzione v. Di conseguenza, se il limite direzionale (in p0 ) dipende dalla direzione (o non esiste per qualche direzione), allora f (p) non ammette limite per p → p0 . Esempio. Consideriamo il lim (x,y)→(0,0) x2 xy . + y2 Fissiamo un vettore (h, k) ∈ R2 ed eseguiamo, nel suddetto limite, le sostituzioni x = th, y = tk. Si ha hk t2 hk = 2 . lim 2 2 2 2 t→0 t h + t k h + k2 Il limite direzionale dipende dunque dalla direzione (h, k). Si può pertanto concludere che la funzione xy/(x2 + y 2 ) non ammette limite per (x, y) → (0, 0). Vedremo in seguito, con un esempio, che il limite direzionale può esistere ed essere uguale in ogni direzione, ma il limite può non esistere. Teorema (fondamentale dei limiti per funzioni di più variabili). Siano f1 ed f2 due funzioni reali di k variabili reali. Supponiamo che, nei reali estesi, f1 (p) → γ1 e f2 (p) → γ2 , per p → p0 . Allora, per p → p0 (e quando ha senso), si ha: 1) f1 (p) + f2 (p) → γ1 + γ2 ; 2) f1 (p)f2 (p) → γ1 γ2 ; 63 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 3) f1 (p)/f2 (p) → γ1 /γ2 . Per le funzioni di più variabili si hanno teoremi analoghi a quelli già incontrati nel caso di una variabile. Con le opportune modifiche, valgono infatti i seguenti risultati (si invita lo studente a formularne gli enunciati): – teorema di unicità del limite; – teorema della permanenza segno; – teorema del confronto tra i limiti; – teorema dei carabinieri (e del carabiniere). Corollario (del teorema dei carabinieri). Siano f e g due funzioni reali definite in un sottoinsieme A di Rk . Supponiamo che f sia limitata e che g(p) → 0 per p → p0 . Allora f (p)g(p) → 0 per p → p0 . Come applicazione del precedente corollario, determiniamo il seguente limite: xy 2 . (x,y)→(0,0) ρ2 lim Osserviamo che la funzione f (x, y) = xy 2 /ρ2 è il prodotto di tre funzioni: x/ρ, y/ρ e y. Le prime due non ammettono limite per (x, y) → (0, 0), come si vede facilmente controllando il limite direzionale (che, in questo caso, dipende dalla direzione). La terza funzione, invece, tende a zero. Non è dunque applicabile il teorema del prodotto dei limiti. Tuttavia, essendo limitate le prime due funzioni, per il suddetto corollario si può concludere che xy 2 /ρ2 → 0 per (x, y) → (0, 0). La continuità di una funzione di più variabili si definisce analogamente al caso di una sola variabile: data f : A → R, con A ⊂ Rk , e dato un punto p0 ∈ A, f è continua in p0 se per ogni ² > 0 esiste un δ > 0 tale che da kp − p0 k < δ segue |f (p) − f (p0 )| < ². Come nel caso di una variabile, se p0 è di accumulazione per il dominio di f , allora f è continua in p0 se e solo se f (p) → f (p0 ) per p → p0 . Se invece p0 è un punto isolato del dominio, allora la continuità in p0 segue direttamente dalla definizione. Teorema (di continuità delle funzioni combinate). La somma, il prodotto, il quoziente e la composizione di funzioni continue, quando (e dove) ha senso, è ancora una funzione continua. 58 - Gio. 26/10/00 Sia f (x, y) una funzione reale di due variabili reali. Se si fissa una delle due variabili, ad esempio se si fissa y = y0 , si ottiene la funzione di una sola variabile x 7→ f (x, y0 ), detta 64 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi funzione parziale della x (per y = y0 ). In realtà esistono infinite funzioni parziali della prima variabile: una per ogni fissato valore della y. Analogamente, se si fissa un valore della prima variabile, si ottiene una delle tante funzioni parziali della seconda variabile. Tuttavia, le funzioni parziali (delle funzioni di due variabili), anche se sono infinite, si dividono in due sole classi: quelle della prima variabile e quelle della seconda. In modo analogo, data una funzione di tre variabili [di k variabili], si definiscono tre [k] classi di funzioni parziali. I dettagli sono lasciati allo studente. Sia f : U → R una funzione reale definita su un aperto U di R2 e sia p0 = (x0 , y0 ) un punto di U . La derivata (parziale) nel punto p0 di f rispetto alla x (o meglio, rispetto alla prima variabile) è (se esiste) la derivata in x0 della funzione parziale (reale di variabile reale) x 7→ f (x, y0 ). In modo analogo si definisce la derivata (parziale) rispetto alla seconda variabile. La derivata parziale di f rispetto ad x in p0 = (x0 , y0 ) si denota con uno dei seguenti simboli: ∂f (x0 , y0 ) , ∂x ∂f (p0 ) , ∂x D1 f (x0 , y0 ) , D1 f (p0 ) . Un’analoga notazione vale per la derivata rispetto ad y. Si dice semplicemente che f è derivabile (parzialmente) rispetto ad x se è derivabile (rispetto ad x) in ogni punto del dominio. In questo caso risulta ben definita la funzione, detta derivata rispetto ad x, che ad ogni punto (x, y) di U associa il numero ∂f (x, y) . ∂x La definizione della funzione derivata rispetto ad y è analoga. Si dice che f è derivabile se è derivabile sia rispetto ad x sia rispetto ad y. Se la derivata di f rispetto ad x è di nuovo derivabile rispetto ad x, allora f si dice derivabile due volte rispetto ad x (o che ammette derivata seconda rispetto ad x due volte). La derivata rispetto ad x della derivata rispetto ad x, calcolata in un punto (x, y), si indica con uno dei seguenti simboli: ∂2f (x, y) , D1 D1 f (x, y) . ∂x2 In modo simile si definiscono le altre derivate seconde: ∂2f (x, y) , ∂y∂x ∂2f (x, y) , ∂x∂y ∂2f (x, y) . ∂y 2 Esercizio. Definire le derivate parziali di ordine superiore al secondo per una funzione di due variabili. 65 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Esercizio. Definire le derivate parziali di ogni ordine per le funzioni reali di tre (e di k) variabili reali. Definizione. Una funzione reale f : U → R, definita su un sottoinsieme aperto U di Rk , si dice di classe C 0 (o che è C 0 , o che appartiene a C 0 ) se è continua; si dice di classe C 1 se è derivabile e tutte le sue derivate parziali sono C 0 . A differenza di quanto accade per le funzioni di una sola variabile, una funzione di due (o più) variabili può essere derivabile senza che risulti continua. Tuttavia, se una funzione è derivabile e le sue derivate sono continue, allora si può affermare che è continua. Come conseguenza del Teorema di Lagrange, vale infatti il seguente risultato: Teorema Se f è una funzione di classe C 1 , allora è anche di classe C 0 . Definizione. Sia f : U → R una funzione definita su un aperto di Rk . Per induzione, si dice che f è di classe C n se è derivabile e tutte le sue derivate parziali sono di classe C (n−1) . Usando il principio di induzione non è difficile provare il seguente risultato: Teorema Se f è una funzione di classe C n , allora è anche di classe C n−1 . Teorema (di regolarità delle funzioni combinate). La somma, il prodotto, il quoziente e la composizione di funzioni C n , quando (e dove) ha senso, è ancora una funzione C n . Esempio (di funzione derivabile ma non continua). Consideriamo la funzione ( xy se (x, y) 6= (0, 0) x2 +y 2 f (x, y) = 0 se (x, y) = (0, 0) . Ovviamente, nel sottoinsieme aperto R2 \{(0, 0)} di R2 è di classe C ∞ , essendo (in tale insieme) rapporto di funzioni C ∞ . Dalla definizione derivata parziale segue subito che è derivabile anche in (0, 0) e le due derivate parziali (in tale punto) sono nulle. Pertanto, f è derivabile in ogni punto di R2 . È immediato verificare che f non è continua nell’origine, perché il limite direzionale dipende dalla direzione (di conseguenza, non esiste il limite per (x, y) → (0, 0) di f (x, y) ). Incidentalmente, osserviamo che f , non essendo continua, non può essere neppure di classe C 1 (si invita lo studente a verificare direttamente la discontinuità in (0, 0) delle derivate parziali di f ). Teorema di Schwarz. Sia f : A → R una funzione di classe C 2 su un aperto A di R2 . Allora ∂ ∂f ∂ ∂f (x, y) = (x, y) , ∀(x, y) ∈ A . ∂y ∂x ∂x ∂y Osserviamo che, se una funzione è sufficientemente regolare, il Teorema di Schwarz ci permette di scambiare l’ordine di due qualunque delle sue derivate. Si considerino, ad 66 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi esempio, le seguenti due derivate terze: ∂ ∂ ∂f (x, y) , ∂x ∂y ∂x ∂ ∂ ∂f (x, y) . ∂y ∂x ∂x Si può affermare che sono uguali? Mostriamo che se f è di classe C 3 , la risposta è affermativa. Infatti, in tale ipotesi, la funzione g(x, y) = ∂f (x, y) ∂x è di classe C 2 . Di conseguenza, le suddette derivate terze risultano uguali, essendo le derivate seconde miste della funzione g(x, y). In maniera analoga si prova che se una funzione è di classe C n , si può scambiare l’ordine di derivazione di due qualunque derivate in una sua derivata n-esima. Esercizi assegnati [Spiegel, cap. 6]: 1, 2. 59 - Ven. 27/10/00 - Lezione svolta dal Dott. Mugelli Vettori. Somma di vettori. Prodotto di un vettore per uno scalare. Versori e coordinate. Prodotto scalare e vettoriale. Prodotto misto. Significato geometrico dei prodotti scalare, vettoriale e misto. Prodotto scalare e vettoriale per componenti. 60 - Ven. 27/10/00 - Lezione svolta dal Dott. Mugelli Campi scalari e vettoriali. Operatore nabla. Definizioni di gradiente. Derivate direzionali. Differenziale. Divergenza e rotore mediante nabla. Esercizi consigliati [Spiegel, cap. 7]: 4, 5, 8, 34, 39. 61 - Lun. 30/10/00 Osservazione. Sia f : A → R una funzione reale definita su un sottoinsieme A di R2 (o, più in generale, di Rk ). Se il limite per p → p0 di f (p) esiste ed è finito, allora f è limitata in un intorno forato di p0 . Alcuni esercizi sui limiti: xy , (x,y)→(0,0) ρ lim sen xy − xy , x3 y 3 (x,y)→(0,0) lim xy , (x,y)→(0,0) y − x2 lim sen xy − xy cos y . x3 y 3 (x,y)→(0,0) lim 67 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 62 - Lun. 30/10/00 Sia f : U → R una funzione di classe C 1 definita in un aperto U di R2 . Consideriamo due punti p0 = (x0 , y0 ) e p0 + ∆p = (x0 + ∆x, y0 + ∆y) del dominio J di f . L’incremento che subisce la funzione f passando dal punto p0 al punto p0 + ∆p è il numero ∆f = f (p0 + ∆p) − f (p0 ). Analogamente a quanto si è visto per le funzioni di una sola variabile, l’incremento ∆f (che dovremmo a rigore scrivere ∆f (p0 , ∆p) o ∆f (p0 )(∆p) o ∆fp0 (∆p), perché dipende sia dal punto iniziale p0 sia dall’incremento ∆p della variabile vettoriale p) ha il difetto di non essere facile da valutare. Tuttavia, se l’incremento ∆f (p0 )(∆p) ci interessa soltanto per valori piccoli di k∆pk (come, ad esempio, per il calcolo degli errori), al posto dell’incremento vero è preferibile utilizzare un incremento “virtuale” che, pur non essendo vero (a meno che il grafico di f non sia un piano), ha il duplice pregio di essere facile da calcolare e di approssimare bene l’incremento vero. Tale incremento virtuale, detto differenziale di f (nel punto p0 e relativo all’incremento ∆p), è cosı̀ definito: df (p0 )(∆p) = ∇f (p0 ) · ∆p = ∂f ∂f (p0 )∆x + (p0 )∆y . ∂x ∂y Proveremo in seguito che df (p0 )(∆p) approssima bene l’incremento vero ∆f (p0 )(∆p) per piccoli valori di k∆pk, nel senso che il rapporto ∆f (p0 )(∆p) − df (p0 )(∆p) k∆pk tende a zero per k∆pk che tende a zero. In un certo senso, ciò significa che, per valori piccoli di ∆x e ∆y, lo scarto tra l’incremento vero e quello virtuale è trascurabile rispetto alla norma dell’incremento ∆p = (∆x, ∆y) della variabile vettoriale p. Osserviamo ora che gli incrementi veri, ∆x e ∆y, che subiscono le funzioni x e y passando dal punto p0 = (x0 , y0 ) al punto p0 + ∆p = (x0 + ∆x, y0 + ∆y) coincidono con i loro rispettivi incrementi virtuali dx e dy (indipendentemente dal punto iniziale p0 ). Si ha pertanto ∂f ∂f (p0 )dx + (p0 )dy , df (p0 ) = ∂x ∂y dove dx e dy sono i differenziali di due particolari funzioni da R2 ad R: le cosiddette funzioni coordinate (cartesiane) x ed y. Ovvero, le due “leggi” che ad ogni ad ogni punto p ∈ R2 assegnano, rispettivamente, la prima e la seconda coordinata di p. La suddetta uguaglianza, visto che vale per ogni p0 , si potrà scrivere anche df = ∂f ∂f dx + dy ∂x ∂y o, più semplicemente, con notazioni vettoriali, nella forma df = ∇f · dp . 68 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Esercizi assegnati [Spiegel, cap. 6]: 4, 5, 7. 63 - Mar. 31/10/00 Abbiamo visto che il differenziale di una funzione f (x, y), di classe C 1 su un aperto U di R2 , è un’espressione della forma A(x, y)dx + B(x, y)dy , dove le funzioni A(x, y) e B(x, y) sono le derivate parziali di f rispetto ad x e ad y, dx è il differenziale della prima funzione coordinata e dy della seconda. Da ora in avanti, un’espressione del tipo ω = A(x, y)dx + B(x, y)dy , dove A(x, y) e B(x, y) sono due funzioni continue su un aperto U di R2 , verrà chiamata una forma differenziale. Diremo che ω è di classe C n (in U ) se sono di classe C n (in U ) entrambe le funzioni, A(x, y) e B(x, y). Ci poniamo la seguente domanda: data una forma differenziale ω = A(x, y)dx + B(x, y)dy , si può affermare che questa è il differenziale di una funzione f (x, y)? Il seguente risultato mostra che la risposta è in generale negativa: Teorema. Sia ω = A(x, y)dx+B(x, y)dy una forma differenziale di classe C 1 su un aperto U di R2 . Se esiste una funzione f : U → R tale che df = ω (ossia, tale che ∂f /∂x = A e ∂f /∂y = B), allora ∂A/∂y = ∂B/∂x. Dimostrazione. Sia f una funzione tale che ∂f /∂x = A e ∂f /∂y = B. Poiché A e B sono di classe C 1 , la funzione f risulta di classe C 2 . Di conseguenza, tenendo conto del Teorema di Schwarz, si ha ∂2f ∂2f ∂B ∂A = = = . ∂y ∂y∂x ∂x∂y ∂x Esempio. Consideriamo la forma differenziale ω = xdx − xydy, definita su tutto R2 . Poiché ∂x/∂y = 0 e ∂(−xy)/∂x = −y, non esiste una funzione f : R2 → R tale che df = ω. Definizione. Sia ω = A(x, y)dx + B(x, y)dy una forma differenziale definita su un aperto U di R2 . Si dice che ω è una forma esatta (in U ) se esiste una funzione f : U → R, detta primitiva di ω, tale che df = ω. Si dice che ω è una forma chiusa (in U ) se ∂A/∂y = ∂B/∂x. In base alla suddetta definizione, il precedente teorema può essere riformulato nel modo seguente: 69 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi “condizione necessaria affinché una forma differenziale di classe C 1 sia esatta è che sia chiusa”. Vedremo in seguito (dopo aver introdotto gli integrali curvilinei) che la condizione di essere chiusa, senza opportune ipotesi sul dominio della forma differenziale, non assicura che la forma sia esatta. Esempi ed esercizi relativi alle forme differenziali in R2 . Calcolo delle primitive di alcune forme differenziali esatte. 64 - Mar. 31/10/00 Il differenziale di una funzione di tre variabili si definisce in modo analogo a come si è fatto per le funzioni di due variabili: se f (x, y, z) è una funzione di classe C 1 su un aperto U di R3 , il differenziale di f è l’espressione df = ∂f ∂f ∂f dx + dy + dz ∂x ∂y ∂z o, con notazioni vettoriali, l’espressione df = ∇f · dp , dove dp è il vettore incremento (di componenti dx, dy e dz). In generale, un’espressione del tipo ω = A(x, y, z)dx + B(x, y, z)dy + C(x, y, z)dz , dove A, B e C sono funzioni continue su un aperto U di R3 , si dice una forma differenziale in R3 . Come per le forme nel piano, ω è di classe C n (in U ) se sono di classe C n (in U ) le sue tre funzioni componenti: A, B e C. Diremo che ω è una forma esatta se esiste una funzione f , detta primitiva di ω, tale che df = ω. Diremo che ω è chiusa se sono verificate le seguenti tre condizioni: ∂A/∂y = ∂B/∂x, ∂B/∂z = ∂C/∂y e ∂C/∂x = ∂A/∂z. Come per le forme in R2 , dal Teorema di Schwarz discende che (anche in R3 ) ogni forma esatta di classe C 1 è chiusa. In generale, tuttavia, non è vero il viceversa (lo vedremo con un esempio, dopo aver introdotto gli integrali curvilinei). Una condizione che assicura che una forma chiusa sia anche esatta è che il dominio U della forma sia semplicemente connesso. La nozione di insieme semplicemente connesso richiede concetti topologici che vanno al di là degli scopi del corso. Ci limitiamo pertanto a darne un’idea intuitiva, corredandola poi con alcuni esempi esplicativi. 70 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Definizione (euristica di insieme semplicemente connesso). Un sottoinsieme aperto U di R2 (o di R3 ) si dice semplicemente connesso se ogni curva chiusa contenuta in U può essere deformata con continuità riducendola ad un punto, senza che nella deformazione si tocchino mai punti del complementare di U (si pensi ad un elastico che si contrae, rimanendo sempre dentro U , fino a diventare un punto). Ricordiamo che un sottoinsieme Q di R2 (o di R3 ) è convesso se presi due qualunque punti di Q, il segmento che li congiunge è contenuto in Q. Ad esempio, i cerchi, i triangoli e i rettangoli sono convessi di R2 , le sfere (piene) e i parallelepipedi sono convessi di R3 . Ovviamente, l’intero spazio R2 è convesso, cosı̀ come è convesso un semipiano. Si potrebbe dimostrare (se si fosse data una definizione rigorosa di semplicemente connesso) che gli insiemi convessi sono anche semplicemente connessi. Esempi di insiemi non semplicemente connessi si ottengono togliendo dal piano un punto, o un numero finito di punti o, addirittura, un arbitrario insieme limitato. Se, invece, dallo spazio R3 si toglie un punto (o un numero finito di punti), ciò che resta è ancora un insieme semplicemente connesso (si pensi ad un elastico che si contrae senza mai toccare i punti rimossi). Se da R3 si toglie una retta, o una circonferenza (o un numero finito di rette e circonferenze) ciò che rimane non è semplicemente connesso (si pensi ad un elastico che circonda una retta o che è concatenato con una circonferenza). Teorema. Se una forma differenziale (in R2 o in R3 ) è chiusa ed è definita in un insieme semplicemente connesso, allora è anche esatta. Esiste un perfetto parallelismo tra le forme differenziali e i campi vettoriali (in R2 o in R3 ). Ci limitiamo ad un confronto in R3 . Ad ogni forma differenziale ω = Adx + Bdy + Cdz associamo il campo vettoriale vω con le stesse componenti di ω; ossia, vω = Ai + Bj + Ck. È ovvio che in questo modo si ha una corrispondenza biunivoca tra forme differenziali e campi vettoriali. In questa corrispondenza biunivoca i seguenti concetti si corrispondono: f è una primitiva di ω ω è esatta ω è chiusa ⇐⇒ ⇐⇒ ⇐⇒ f è un potenziale di vω vω è conservativo vω è irrotazionale Esempi ed esercizi relativi alle forme differenziali. Esercizi assegnati [Spiegel, cap. 6]: 11, 14, 15. 65 - Gio. 2/11/00 Il limite di una funzione vettoriale di variabile vettoriale si definisce in modo analogo a 71 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi come è fatto per le funzioni reali di più variabili reali. Sia f : A → Rs un’applicazione definita in un sottoinsieme A di Rk e sia p0 un punto di accumulazione per il dominio A di f . Si dice che f (p) tende ad un vettore l ∈ Rs per p che tende a p0 , e si scrive f (p) → l per p → p0 , se per ogni ² > 0 esiste δ > 0 tale che da 0 < kp − p0 k < δ e p ∈ A segue kf (p) − lk < ². In questo caso si può anche scrivere lim f (p) = l . p→p0 Si potrebbe dimostrare che f (p) → l per p → p0 se e solo se la prima componente f1 (p) di f (p) tende alla prima componente l1 del vettore l, la seconda componente di f (p) tende alla seconda componente di l, e cosı̀ via per tutte le altre componenti. Sia f : A → Rs un’applicazione definita in un sottoinsieme A di Rk . Diremo che f è continua in un punto p0 ∈ A se sono continue (in p0 ) le sue s funzioni componenti: f1 , f2 , . . . , fs . Per quanto visto prima sul limite di una funzione vettoriale di variabile vettoriale, nel caso che p0 sia un punto di accumulazione per A, ciò equivale ad affermare che lim f (p) = f (p0 ) . p→p0 66 - Gio. 2/11/00 Una curva parametrica in R2 [in R3 ] è una funzione continua γ(t) da un intervallo compatto [a, b] a valori in R2 [in R3 ]. I punti γ(a) e γ(b) si dicono, rispettivamente, primo e secondo estremo della curva. La curva γ(t) si dice chiusa se i suoi estremi coincidono (ossia, se γ(a) = γ(b)). Se la curva γ(t) non è chiusa, allora si dice che è un arco di curva (parametrica). La variabile t di γ(t) si chiama il parametro della curva. Ovviamente, al posto di t si può usare una qualunque altra lettera (le più comuni sono t, τ , s, θ, ϕ). Definizione. Un sottoinsieme A di Rk si dice connesso (per archi) se dati due qualunque punti p, q ∈ A esiste una curva (parametrica) a valori in A congiungente p con q (cioè, con estremi p e q). Si potrebbe dimostrare che gli insiemi connessi di R sono esattamente gli intervalli. Definizione. Un sottoinsieme A di Rk si dice compatto se è limitato e chiuso. Ricordiamo che un insieme compatto A di R, essendo limitato, ha estremo inferiore ed estremo superiore finiti (cioè, appartenenti ad R). Inoltre, essendo anche chiuso, tali estremi sono, rispettivamente, minimo e massimo di A. 72 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Primo Teorema di Weierstrass in Rk . Sia f : A → Rs una funzione continua in un sottoinsieme compatto A ⊂ Rk . Allora l’immagine di f è un insieme compatto di Rs . In particolare, se s = 1, f ammette minimo e massimo assoluti. Secondo Teorema di Weierstrass in Rk . Sia f : A → Rs una funzione continua in un sottoinsieme connesso A ⊂ Rk . Allora l’immagine di f è un insieme connesso di Rs . In particolare, se s = 1, l’immagine di f è un intervallo. 67 - Ven. 3/11/00 Teorema (della derivata di una funzione composta). Sia f (x, y) una funzione di classe C 1 e siano x(t) e y(t) due funzioni derivabili. Allora la funzione composta ϕ(t) = f (x(t), y(t)) è derivabile e si ha ϕ0 (t) = ∂f ∂f (x(t), y(t)) x0 (t) + (x(t), y(t)) y 0 (t) . ∂x ∂y Più in generale, con le notazioni vettoriali, se f (x) è una funzione reale di k variabili reali e x(t) è una curva derivabile in Rk , allora la funzione (reale di variabile reale) ϕ(t) = f (x(t)) è derivabile e ϕ0 (t) = ∂f ∂f ∂f (x(t)) x01 (t) + (x(t)) x02 (t) + . . . + (x(t)) x0k (t) , ∂x1 ∂x2 ∂xk che possiamo scrivere (mediante il prodotto scalare) nella forma ϕ0 (t) = ∇f (x(t)) · x0 (t) Il suddetto teorema permette di calcolare la derivata di funzioni composte più complesse di f (x(t), y(t)). Calcoliamo, ad esempio, la derivata parziale rispetto alla prima variabile della funzione composta ϕ(u, v) = f (x(u, v), y(u, v)) , dove f (x, y), x(u, v) e y(u, v) sono di classe C 1 . Ricordandosi che la derivata parziale di ϕ(u, v) rispetto alla variabile u non è altro che la derivata della funzione parziale u 7→ ϕ(u, v), che è di una sola variabile, dal teorema precedente segue immediatamente ∂f ∂f ∂x ∂y ∂ϕ (u, v) = (x(u, v), y(u, v)) (u, v) + (x(u, v), y(u, v)) (u, v) . ∂u ∂x ∂u ∂y ∂u 68 - Ven. 3/11/00 Riportiamo senza dimostrazione il seguente importante risultato: 73 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Teorema (di esistenza della formula di Taylor del secondo ordine in R2 ). Sia f : U → R una funzione di classe C 2 su un aperto di R2 . Sia p0 = (x0 , y0 ) un punto di U . Allora vale la seguente formula di Taylor del secondo ordine (col resto nella forma di Peano): ∂f ∂f (p0 )h + (p0 )k + ∂x ∂y ¶ µ 1 ∂2f ∂2f ∂2f 2 2 (p0 )h + 2 (p0 )hk + 2 (p0 )k + ²(h, k)ρ2 , 2 ∂x2 ∂x∂y ∂y f (x0 + h, y0 + k) = f (x0 , y0 ) + dove ²(h, k) è una funzione reale di due variabili reali nulla in (0, 0) e continua in (0, 0) e √ ρ è la funzione ρ(h, k) = k(h, k)k = h2 + k 2 . Ricordiamo che il polinomio omogeneo di primo grado df (p0 )(h, k) = ∂f ∂f (p0 )h + (p0 )k ∂x ∂y è il differenziale della funzione f calcolato in p0 e applicato al vettore incremento v = (h, k). Per analogia, il polinomio omogeneo di secondo grado d2 f (p0 )(h, k) = ∂2f ∂2f ∂2f 2 (p (p0 )k 2 )h (p + 2 )hk + 0 0 ∂x2 ∂x∂y ∂y 2 si chiama il differenziale secondo di f calcolato in p0 e applicato al vettore incremento v = (h, k). Dunque, con simboli più sintetici la formula di Taylor del secondo ordine si può scrivere nella forma: 1 ∆f (p0 )(v) = df (p0 )(v) + d2 f (p0 )(v) + ²(v)kvk2 . 2 Analogamente al caso di una sola variabile, vale ancora un teorema di unicità della formula di Taylor. In altre parole se f (x0 + h, y0 + k) = P2 (h, k) + ²(h, k)ρ2 , dove P2 (h, k) è un polinomio di grado minore o uguale a due nelle due variabili h e k, allora i coefficienti di tale polinomio devono coincidere con quelli indicati nel suddetto teorema di esistenza della formula di Taylor. Se il centro è (0, 0), allora la formula di Taylor prende anche il nome di formula di MacLaurin. In questo caso si ha ∂f ∂f (0, 0) x + (0, 0) y + ∂x ∂y µ ¶ ∂2f ∂2f 1 ∂2f 2 2 (0, 0)x + 2 (0, 0)xy + 2 (0, 0)y + ²(x, y)ρ2 , 2 ∂x2 ∂x∂y ∂y f (x, y) = f (0, 0) + 74 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi dove ρ in questo caso è la funzione p x2 + y 2 . Esercizi assegnati [Spiegel, cap. 6]: 18, 22. 69 - Lun. 6/11/00 Definizione. Sia f : A → R una funzione reale definita in un sottoinsieme A di R2 (o, più in generale, di Rk ). Un punto p0 ∈ A si dice di minimo [di massimo ] relativo (o locale) per f in A se esiste un intorno U di p0 tale che f (p) ≥ f (p0 ) [f (p) ≤ f (p0 )] per ogni p ∈ U ∩ A. Un punto di minimo o di massimo relativo per f (in A) si dice estremante per f (in A). Teorema di Fermat (per funzioni di due variabili). Sia f : A → R una funzione reale di due variabili reali e sia p0 = (x0 , y0 ) ∈ A. Supponiamo che siano soddisfatte le seguenti tre ipotesi: 1) p0 è interno ad A; 2) f è derivabile in p0 ; 3) p0 è un punto estremante per f in A. Allora ∂f ∂f (p0 ) = 0 , (p0 ) = 0 ; ∂x ∂y ossia, ∇f (p0 ) = 0. Dimostrazione. Consideriamo la funzione parziale ϕ : x 7→ f (x, y0 ). Dalle ipotesi 1), 2) e 3) segue immediatamente che x0 è interno al dominio di ϕ, che ϕ è derivabile in x0 e che x0 è estremante per ϕ. Quindi, il Teorema di Fermat per funzioni di una variabile ci assicura che ϕ0 (x0 ) = 0. Pertanto, ricordandosi la definizione di derivata parziale, si ha ∂f (x0 , y0 ) = ϕ0 (x0 ) = 0 . ∂x In modo analogo si prova che in (x0 , y0 ) si annulla anche la derivata parziale di f rispetto ad y. I punti in cui si annulla il gradiente di una funzione f (x, y) vengono detti critici o stazionari per f . Osserviamo che, in base al suddetto teorema, i punti estremanti di una funzione f : A → R vanno cercati tra le seguenti tre categorie: 1) punti di frontiera di A; 2) punti in cui la funzione non è derivabile; 3) punti critici per f . Nessuna delle suddette tre condizioni ci assicura che un punto sia estremante. Tuttavia, se lo è, almeno una delle tre deve essere soddisfatta. 75 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Nella ricerca dei punti estremanti di una funzione di due variabili definita in un insieme A ⊂ R2 si procede per esclusione: come primo provvedimento, tenendo conto del Teorema di Fermat, si scagionano subito “dall’accusa di essere estremanti” tutti i punti interni ad A in cui la funzione risulta derivabile ed una delle due derivate parziali è diversa da zero. Rimangono da analizzare i punti di frontiera, i punti interni in cui la funzione non è derivabile e i punti interni in cui si annullano entrambe le derivate. Per “discolpare” altri punti di frontiera si tiene conto del fatto che se p ∈ ∂A non è estremante per la restrizione di f alla frontiera di A, allora non lo è neppure per f in A. Di solito, lo studio della restrizione di f a ∂A consente di escludere la grande maggioranza dei punti di frontiera. Con tale procedimento di successive esclusioni, molto spesso rimangono soltanto pochi punti “sospetti” che possono essere analizzati a parte con metodi vari; ad esempio, se si cercano gli estremi assoluti di f in A, mediante il confronto dei valori assunti. Per comprendere meglio il procedimento per esclusione nella ricerca dei punti estremanti, riformuliamo il Teorema di Fermat in una versione equivalente: la versione “garantista”. Teorema di Fermat in R2 (riformulato). Sia f : A → R una funzione reale di due variabili reali e sia p0 ∈ A. Supponiamo che siano soddisfatte le seguenti tre ipotesi: 1) p0 è interno ad A; 2) f è derivabile in p0 ; 3) una delle derivate parziali di f in p0 è diversa da zero. Allora p0 non è estremante per f in A. Esempi ed esercizi relativi alla ricerca dei punti estremanti per le funzioni di due variabili. 70 - Lun. 6/11/00 Un polinomio omogeneo di secondo grado di due variabili [di k variabili] si dice una forma quadratica in R2 [in Rk ]. Una forma quadratica si dice definita positiva [definita negativa] se è maggiore di zero [minore di zero] tranne il caso in cui tutte le variabili sono nulle. Una forma quadratica si dice indefinita se assume valori sia positivi sia negativi. Infine, una forma quadratica si dice semidefinita positiva [negativa] se è sempre maggiore [minore] o uguale a zero. Ovviamente, una forma quadratica definita (positiva o negativa) è anche semidefinita. Esempi di forme quadratiche in R2 : x2 + 2y 2 è definita positiva (e quindi anche semidefinita positiva); x2 − y 2 è indefinita; x2 − 2xy + y 2 = (x − y)2 è semidefinita positiva (ma non definita positiva). 76 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Studiamo, in generale, una forma quadratica del tipo ax2 + 2bxy + cy 2 , dove a 6= 0. Osserviamo che se y = 0, la forma si annulla solo se x = 0. Non è pertanto restrittivo supporre y 6= 0. In tal caso si ha ax2 + 2bxy + cy 2 = y 2 [a (x/y)2 + 2b (x/y) + c ]. Il segno di ax2 + 2bxy + cy 2 dipende quindi dal segno del trinomio at2 + 2bt + c, ove si è posto x/y = t. Si può quindi concludere che se il discriminante ∆ = 4(b2 − ac) è negativo, allora il trinomio non si annulla mai e, di conseguenza, la forma quadratica è definita (positiva o negativa, a seconda che il coefficiente a sia maggiore o minore di zero). Se ∆ è positivo, allora il trinomio cambia segno, e la forma quadratica risulta indefinita. Se, infine, ∆ = 0, allora la forma quadratica è semidefinita (ma non è definita, perché si annulla nei punti della retta x/y = t0 , dove t0 è l’unica radice del trinomio at2 + 2bt + c). Teorema. Sia f : U → R una funzione di classe C 2 in un aperto U di R2 . Supponiamo che in un punto p0 ∈ U si annullino le due derivate parziali di f . Consideriamo la forma quadratica ∂2f ∂2f ∂2f 2 (p (p0 )k 2 . (p )h )hk + + 2 d2 f (p0 )(h, k) = 0 0 ∂x2 ∂x∂y ∂y 2 Se d2 f (p0 )(h, k) è definita positiva, allora p0 è un punto di minimo relativo (per f ); se è definita negativa, allora p0 è un punto di massimo relativo; se è indefinita, allora p0 non è né di massimo né di minimo. Dal suddetto teorema e dalle considerazioni fatte prima riguardo allo studio del segno di una forma quadratica, segue la seguente Regola pratica. Sia f : U → R una funzione di classe C 2 in un aperto U di R2 . Supponiamo che in un punto p0 ∈ U si annullino le due derivate parziali di f . Se il numero ³ ∂2f ´2 ∂2f ∂2f (p (p ) ) − (p , ) Hf (p0 ) = 0 0 0 ∂x2 ∂y 2 ∂x∂y detto hessiano della f in p0 , è positivo, allora p0 è un punto estremante. Se è negativo, p0 non è estremante. In particolare, nel caso che Hf (p0 ) sia positivo, p0 è di minimo o di massimo a seconda che la derivata ∂ 2 f /∂x2 (p0 ) sia positiva o negativa. Esempi ed esercizi relativi alla ricerca dei punti estremanti per le funzioni di due variabili. 77 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 71 - Mar. 7/11/00 Esercizi relativi alla ricerca dei punti estremanti per le funzioni di due variabili. Consideriamo l’equazione x2 + y 2 − 1 = 0. Le sue soluzioni sono l’insieme di livello zero f −1 (0) = {(x, y) : f (x, y) = 0} della funzione di due variabili f (x, y) = x2 + y 2 − 1. Tale insieme, che rappresenta una circonferenza (in R2 ) di centro l’origine e raggio uno, non può essere considerato il grafico di una funzione reale di una variabile reale y = y(x). Il motivo è che per x ∈ (−1, 1) esistono due valori di y con la proprietà che (x, y) ∈ f −1 (0), e non uno solo, come è richiesto dalla definizione di funzione. Per la stessa ragione f −1 (0) non è neppure il grafico di una funzione del tipo x = x(y). Osserviamo però che f −1 (0) ammette dei sottoinsiemi che possono essere considerati dei grafici di funzioni continue. Ad esempio, √ l’insieme definito dall’equazione y = 1 − x2 è un sottoinsieme di f −1 (0) e rappresenta il grafico di una funzione continua e definita per x ∈ [−1, 1] (è addirittura C ∞ se la si √ restringe all’intervallo aperto (−1, 1)). Si dice allora che y = 1 − x2 è una funzione implicita definita dall’equazione x2 + y 2 − 1 = 0 (più precisamente si dovrebbe dire che √ y = 1 − x2 è l’equazione del grafico di una funzione ma, visto che ogni funzione è univocamente determinata dal suo grafico, non c’è pericolo di confondersi). Osserviamo √ y 2 − 1 = 0. Altre che anche la funzione y = − 1 − x2 è implicitamentepdefinita da x2 + p due si ottengono ricavando x in funzione di y: x = 1 − y 2 e x = − 1 − y 2 . Quindi, in un certo senso, si può dire che l’equazione x2 + y 2 − 1 = 0 definisce implicitamente quattro funzioni continue: due che si ottengono ricavando la y in funzione della x e le altre due ricavando la x in funzione della y. In realtà le funzioni implicite definite da x2 + y 2 − 1 = 0 sono infinite, perché si dovrebbero considerare anche tutte le restrizioni delle suddette quattro funzioni ai sottointervalli del loro dominio. Tuttavia le quattro funzioni trovate sono le uniche massimali (continue); nel senso che non sono restrizioni di altre funzioni implicite. Non sempre la situazione è cosı̀ semplice come nel suddetto esempio. Non è detto infatti che, data un’equazione del tipo f (x, y) = 0, sia facile ricavare esplicitamente una variabile in funzione dell’altra. Spesso, una volta accertata l’esistenza di una funzione implicita, per ricavarla si dovrà ricorrere a metodi numerici, o accontentarsi di trovarne la formula di Taylor di un dato ordine. Riguardo all’esistenza della funzione implicita, riportiamo, senza dimostrazione, il seguente importante risultato attribuito al matematico pisano Ulisse Dini (1845-1918): Teorema (della funzione implicita in R2 ). Sia f : U → R una funzione di classe C n (n ≥ 1) su un aperto U di R2 . Dato (x0 , y0 ) ∈ f −1 (0), supponiamo che la derivata parziale ∂f /∂y(x0 , y0 ) di f in (x0 , y0 ) sia diversa da zero. Allora f −1 (0), in un conveniente intorno di (x0 , y0 ), è il grafico di una funzione reale di variabile reale di classe C n , y = y(x), definita in un intorno del punto x0 ∈ R. 78 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Con riferimento al suddetto teorema, osserviamo che per x in un intorno J = (x0 −δ, x0 +δ) di x0 si deve avere f (x, y(x)) = 0. Pertanto, derivando rispetto ad x si ottiene ∂f ∂f (x, y(x)) + (x, y(x)) y 0 (x) = 0 , ∂x ∂y ∀x ∈ J . In particolare si ha y 0 (x0 ) = − ∂f /∂y (x0 , y0 ) . ∂f /∂y (x0 , y0 ) Osservazione. È ovvio che nel teorema della funzione implicita i ruoli di x e y possono essere scambiati. Pertanto, se si suppone che nel punto (x0 , y0 ) ∈ f −1 (0) si abbia ∂f /∂x (x0 , y0 ) 6= 0, allora f −1 (0), in un intorno di (x0 , y0 ), è il grafico di una funzione reale di classe C n , x = x(y), definita in un intorno di y0 . Esempi ed esercizi relativi al teorema della funzione implicita. 72 - Mar. 7/11/00 Consideriamo ora l’equazione f (x, y, z) = 0 definita dalla funzione f (x, y, z) = x2 + y 2 + z 2 − 1 . Questa definisce una superficie sferica di centro l’origine di R3 e raggio uno. L’insieme di livello f −1 (0) non è il grafico di una funzione reale di due variabili reali z = z(x, y). Tuttavia, se dall’equazione x2 + y 2 + z 2 − 1 = 0 si ricava la z, si ottengono due funzioni reali (e continue) di due variabili: p p z = 1 − x2 − y 2 e z = − 1 − x2 − y 2 , ciascuna delle quali è definita nel cerchio chiuso x2 + y 2 ≤ 1. Entrambe le funzioni hanno il grafico che soddisfa l’equazione x2 + y 2 + z 2 − 1 = 0, ossia contenuto nell’insieme di livello f −1 (0). Altre due funzioni si ottengono ricavando la y, e altre due ricavando la x. L’insieme f −1 (0) contiene quindi il grafico di sei funzioni (continue) reali di due variabili reali (che rappresentano le funzioni implicite massimali definite da x2 + y 2 + z 2 − 1 = 0). In generale, data un’equazione del tipo f (x, y, z) = 0, non è sempre cosı̀ facile ricavare esplicitamente una variabile in funzione delle altre due. Una volta accertata l’esistenza di una funzione implicita, per calcolarla si dovrà ricorrere a metodi numerici. Un risultato che ci assicura l’esistenza di tale funzione è costituito dalla seguente versione in R3 del Teorema di Dini: 79 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Teorema (della funzione implicita in R3 ). Sia f : U → R una funzione di classe C n (n ≥ 1) su un aperto U di R3 e sia (x0 , y0 , z0 ) ∈ f −1 (0). Se ∂f /∂z(x0 , y0 , z0 ) 6= 0, allora, in un conveniente intorno di (x0 , y0 , z0 ), f −1 (0) è il grafico di una funzione (implicita) z = z(x, y) di classe C n in un intorno del punto (x0 , y0 ) ∈ R2 . È ovvio che nel suddetto teorema il ruolo della variabile z potrà essere assunto da una qualunque delle altre variabili. Se, ad esempio, si suppone che in un punto (x0 , y0 , z0 ) ∈ f −1 (0) si abbia ∂f /∂x (x0 , y0 , z0 ) 6= 0, allora, in un intorno di tale punto, f −1 (0) è il grafico di una funzione x = x(y, z) di classe C n . Dovrà essere quindi verificata la condizione f (x(y, z), y, z) = 0 per ogni (y, z) in un intorno di (y0 , z0 ). Esempi ed esercizi relativi al teorema della funzione implicita. 73 - Mer. 8/11/00 Una partizione di un rettangolo R = [a, b] × [c, d] ⊂ R2 è una coppia p = (p1 , p2 ) di partizioni degli intervalli [a, b] e [c, d], rispettivamente. Date due partizioni, p1 = {x0 , x1 , . . . xn } di [a, b] e p2 = {y0 , y1 , . . . ym } di [c, d], il rettangolo R viene suddiviso in nm sottorettangoli Rij = [xi−1 , xi ] × [yj−1 , yj ] , i = 1, . . . , n , j = 1, . . . , m , di area µ(Rij ) = (xi − xi−1 )(yj − yj−1 ). In ogni sottorettangolo Rij scegliamo un punto cij . L’insieme s dei punti cij si dice una scelta di punti nella partizione p = (p1 , p2 ) di R. Ogni rettangolo Rij della partizione col punto cij scelto si dice un rettangolo puntato. La coppia α = (p, s), costituita dalla partizione p = (p1 , p2 ) di R e dalla scelta s, si dice una partizione puntata di R. Il parametro di finezza di α = (p, s), denotato con |α|, è la massima ampiezza dei lati di tutti i possibili rettangoli individuati dalla partizione p. Sia ora assegnata una funzione f : [a, b] × [c, d] → R. Ad ogni partizione puntata α = (p, s) di R = [a, b] × [c, d] possiamo associare il numero X Sf (α) = f (cij )µ(Rij ) , i=1,...,n j=1,...,m dove, ricordiamo, µ(Rij ) denotano le aree dei sottorettangoli Rij individuati dalla partizione. Si ha cosı̀ una funzione reale Sf : P → R definita nell’insieme P delle partizioni puntate del rettangolo R. Intuitivamente l’integrale doppio (secondo Cauchy) in R della funzione f (x, y) è, quando esiste, il valore limite che si ottiene facendo tendere a zero i lati dei sottorettangoli individuati dalle possibili partizioni puntate di R. Diremo infatti che il numero I è l’integrale 80 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi doppio di f in R se, fissato un “errore” ² > 0, esiste un δ > 0 tale che, comunque si assegni una partizione puntata α con parametro di finezza |α| minore di δ, la somma Sf (α) sopra definita dista da I meno di ². Se ciò accade, si scrive lim Sf (α) = I |α|→0 e la funzione f si dice integrabile (in R) secondo Cauchy. Il numero I si chiama “integrale (doppio)” di f (x, y) in R e si denota con uno dei seguenti simboli: Z ZZ ZZ Z f, f (x, y) dxdy , f, f (x, y) dxdy . R R R R Un sottoinsieme di R2 si dice trascurabile (in R2 ) se per ogni ² > 0 può essere ricoperto con una famiglia (al più) numerabile di rettangoli di area totale minore o uguale ad ². Si potrebbe dimostrare che il grafico (y = g(x) o x = g(y)) di una funzione continua è un insieme trascurabile di R2 . Analogamente a quanto si è visto per gli integrali semplici, una funzione f (x, y) è integrabile in un rettangolo R se e solo se è limitata e l’insieme dei suoi punti di discontinuità è trascurabile. Il seguente risultato riconduce il calcolo di un integrale doppio a due successive integrazioni semplici: Teorema di Fubini (per gli integrali doppi). Sia f (x, y) una funzione reale definita in un rettangolo R = [a, b] × [c, d]. Allora, quando ha senso, risulta ¶ ZZ Z d µZ b f (x, y) dxdy = f (x, y) dx dy R · ZZ f (x, y) dxdy = R c Z b µZ a a d ¶ f (x, y) dy dx c ¸ . In sostanza, il Teorema di Fubini afferma che per calcolare l’integrale doppio di f (x, y) in [a, b] × [c, d] è possibile integrare prima in [a, b] la funzione f (x, y) rispetto alla variabile x, ottenendo cosı̀ una funzione Z b g(y) = f (x, y)dx , a ed integrare poi g(y) nell’intervallo [c, d]. Per convenzione, in un integrale, un’espressione del tipo g(y) dy si potrà scrivere anche dy g(y). Tenendo conto di ciò, l’uguaglianza del Teorema di Fubini, si potrà esprimere nel 81 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi modo seguente: ZZ f (x, y) dxdy = R Z d dy c Z b f (x, y) dx . a 74 - Mer. 8/11/00 Esempi ed esercizi relativi agli integrali doppi nei rettangoli. Dato un insieme A di R2 e data f : A → R, la funzione fˆ: R2 → R definita da ½ f (x, y) se (x, y) ∈ A ˆ f (x, y) = 0 se (x, y) ∈ /A si chiama estensione standard di f . Sia f (x, y) una funzione di due variabili definita in un sottoinsieme limitato A di R2 . Consideriamo un (arbitrario) rettangolo R contenente A. Diremo che f è integrabile in A se è integrabile in R la sua estensione standard fˆ. In tal caso l’integrale di f in A si definisce nel modo seguente: ZZ ZZ f (x, y) dxdy := fˆ(x, y) dxdy . A R Dal fatto che fˆ è nulla fuori da A si potrebbe dedurre che il secondo integrale non dipende dal rettangolo R contenente A. Pertanto, la suddetta definizione è ben posta. Teorema (di additività rispetto all’insieme di integrazione). Supponiamo che una funzione f (x, y) sia integrabile sia in un insieme A che in un insieme B, con A ∩ B = ∅. Allora f è integrabile in A ∪ B e ZZ ZZ ZZ f (x, y) dxdy . f (x, y) dxdy + f (x, y) dxdy = A∪B A B Esempi ed esercizi relativi agli integrali doppi negli insiemi limitati di R2 . 75 - Gio. 9/11/00 Sia A ⊂ R2 un insieme del tipo A = {(x, y) : a ≤ x ≤ b, ϕ1 (x) ≤ y ≤ ϕ2 (x)} , dove ϕ1 , ϕ2 : [a, b] → R sono due funzioni continue. Si dice che A presenta il caso semplice rispetto all’asse y perché ogni retta parallela a tale asse lo interseca in un intervallo (di estremi ϕ1 (x) e ϕ2 (x), per x ∈ [a, b]). Supponiamo che f (x, y) sia una funzione integrabile 82 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi in A. Dato un rettangolo R = [a, b] × [c, d] contenente A, per definizione, l’integrale di f in A è ZZ fˆ(x, y) dxdy . R Dal Teorema di Fubini si ha ZZ Z fˆ(x, y) dxdy = R D’altra parte Z d Z ˆ f (x, y) dy = c ϕ1 (x) fˆ(x, y) dy + c b dx a Z Z ϕ2 (x) d fˆ(x, y) dy . c fˆ(x, y) dy + ϕ1 (x) Z d fˆ(x, y) dy , ϕ2 (x) e tenendo conto che fˆ è nulla fuori da A si ottiene Z d Z ϕ2 (x) ˆ f (x, y) dy = fˆ(x, y) dy . c ϕ1 (x) Poiché in A le due funzioni f ed fˆ coincidono, si ha Z ϕ2 (x) Z d ˆ f (x, y) dy = f (x, y) dy . ϕ1 (x) c Si ottiene cosı̀ la seguente importante formula di riduzione, valida per gli insiemi che presentano il caso semplice rispetto all’asse y: ZZ Z b Z ϕ2 (x) dx f (x, y) dxdy = f (x, y) dy . A ϕ1 (x) a Analogamente, se A ⊂ R2 è un insieme del tipo A = {(x, y) : c ≤ y ≤ d, ψ1 (y) ≤ x ≤ ψ2 (y)} , dove ψ1 , ψ2 : [c, d] → R sono due funzioni continue, ed f (x, y) è integrabile in A, si ha l’altra formula di riduzione, valida quando A presenta il caso semplice rispetto all’asse x: ZZ Z d Z ψ2 (y) f (x, y) dxdy = dy f (x, y) dx . A c ψ1 (y) Definizione. Un sottoinsieme limitato A di R2 si dice misurabile (secondo Peano-Jordan) quando è integrabile in A la funzione f (x, y) ≡ 1. In tal caso la misura (bidimensionale) di A, detta anche area, è il numero ZZ µ(A) = dxdy . A 83 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Purtroppo, non tutti i sottoinsiemi limitati del piano sono misurabili. Si consideri, ad esempio, l’insieme A dei punti di R2 con coordinate razionali comprese tra 0 e 1. Ossia A = {(x, y) ∈ [0, 1] × [0, 1] : x ∈ Q, y ∈ Q} . Si potrebbe provare che la funzione fˆ che vale 1 in A e 0 nel complementare di A è discontinua in tutti i punti dell’intero quadrato Q = [0, 1] × [0, 1], che ovviamente non è trascurabile. Pertanto fˆ non è integrabile e, di conseguenza, A non è misurabile. Sia A un sottoinsieme limitato di R2 . Consideriamo la cosiddetta funzione caratteristica di A. Ossia la funzione fˆ: R2 → R che vale 1 in A e 0 fuori di A. Non è difficile verificare che l’insieme dei punti di discontinuità di fˆ coincide con ∂A. Si può pertanto concludere che A è misurabile se e solo se la sua frontiera è trascurabile. Ad esempio, è misurabile ogni insieme limitato la cui frontiera è unione finita di grafici (y = g(x) o x = g(y)) di funzioni continue e definite in intervalli. Esercizi sull’inversione dell’ordine d’integrazione. Calcolo dell’area di un’ellisse. Esercizi consigliati [Spiegel, cap. 9]: 1, 8. 76 - Gio. 9/11/00 Una partizione di un parallelepipedo Q = [a1 , b1 ] × [a2 , b2 ] × [a3 , b3 ] ⊂ R3 è una terna p = (p1 , p2 , p3 ) di partizioni degli intervalli [a1 , b1 ], [a2 , b2 ] e [a3 , b3 ], rispettivamente. Date tre partizioni, p1 = {x0 , x1 , . . . xn1 } di [a1 , b1 ], p2 = {y0 , y1 , . . . yn2 } di [a2 , b2 ] e p3 = {z0 , z1 , . . . zn3 } di [a3 , b3 ], il parallelepipedo Q viene suddiviso in n1 n2 n3 sottoparallelepipedi Qijk = [xi−1 , xi ] × [yj−1 , yj ] × [zk−1 , zk ] di volume µ(Qijk ) = (xi −xi−1 )(yj −yj−1 )(zj −zj−1 ). In ogni parallelepipedo Qijk scegliamo un punto cijk . L’insieme s dei punti cijk si dice una scelta di punti nella partizione p = (p1 , p2 , p3 ) di Q. Ogni parallelepipedo Qijk della partizione col punto cijk scelto si dice un parallelepipedo puntato. La coppia α = (p, s), costituita dalla partizione p = (p1 , p2 , p3 ) di Q e dalla scelta s, si dice una partizione puntata di Q. Il parametro di finezza di α = (p, s), denotato con |α|, è la massima ampiezza dei lati di tutti i possibili parallelepipedi individuati dalla partizione p. 84 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Sia f (x, y, z) una funzione definita in Q. Ad ogni partizione puntata α = (p, s) di Q possiamo associare il numero X Sf (α) = f (cijk )µ(Qijk ) , (i,j,k)∈K dove la terna di indici (i, j, k) varia nell’insieme © ª K = (i, j, k) ∈ N3 : 1 ≤ i ≤ n1 , 1 ≤ j ≤ n2 , 1 ≤ k ≤ n3 . Intuitivamente l’integrale triplo (secondo Cauchy) in Q della funzione f è, quando esiste, il valore limite che si ottiene facendo tendere a zero i lati dei sottoparallelepipedi individuati dalle possibili partizioni puntate di Q. Diremo infatti che il numero I è l’integrale triplo di f in Q se, fissato un “errore” ² > 0, esiste un δ > 0 tale che, comunque si assegni una partizione puntata α con parametro di finezza |α| minore di δ, la somma Sf (α) sopra definita dista da I meno di ². Se ciò accade, si scrive lim Sf (α) = I |α|→0 e la funzione f si dice integrabile (in Q) secondo Cauchy. Il numero I si chiama “integrale (triplo)” di f (x, y, z) in Q e si denota con uno dei seguenti simboli: Z ZZZ ZZZ Z f, f (x, y, z) dxdydz , f, f (x, y, z) dxdydz . Q Q Q Q Un sottoinsieme di R3 si dice trascurabile (in R3 ) se per ogni ² > 0 può essere ricoperto con una famiglia (al più) numerabile di parallelepipedi di volume totale minore o uguale ad ². Si potrebbe dimostrare che il grafico di una funzione continua di due variabili (z = g(x, y), o x = g(y, z), o y = g(z, x)) è un insieme trascurabile di R3 . Analogamente a quanto si è visto per gli integrali semplici e doppi, una funzione f (x, y, z) è integrabile in un parallelepipedo Q se e solo se è limitata e l’insieme dei suoi punti di discontinuità è trascurabile. Il seguente risultato riconduce il calcolo di un integrale triplo a due successive integrazioni: una semplice seguita da una doppia, o una doppia seguita da una semplice. Teorema di Fubini (per gli integrali tripli). Sia f (x, y, z) una funzione reale definita in un parallelepipedo Q = [a1 , b1 ] × [a2 , b2 ] × [a3 , b3 ]. Allora, quando ha senso, risulta ZZZ f (x, y, z) dxdydz = Q ZZ dxdy R Z b3 f (x, y, z) dz , a3 85 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi ZZZ f (x, y, z) dxdydz = Q Z b3 dz a3 ZZ f (x, y, z) dxdy , R dove R denota il rettangolo [a1 , b1 ] × [a2 , b2 ] nel piano xy. La prima formula del Teorema di Fubini afferma che per calcolare l’integrale triplo di f (x, y, z) in Q è possibile integrare prima in [a3 , b3 ] la funzione f (x, y, z) rispetto alla variabile z, ottenendo cosı̀ una funzione Z b3 g(x, y) = f (x, y, z)dz , a3 ed integrare poi g(x, y) nel rettangolo [a1 , b1 ] × [a2 , b2 ]. La seconda formula afferma che si ottiene lo stesso risultato facendo prima l’integrale doppio in R = [a1 , b1 ] × [a2 , b2 ] della funzione f (x, y, z) rispetto alle variabili x ed y, ottenendo cosı̀ una funzione Z h(z) = f (x, y, z)dxdy , R ed integrando poi h(z) nell’intervallo [a3 , b3 ]. Ovviamente, nel Teorema di Fubini in R3 i ruoli delle variabili x, y e z possono essere permutati, ottenendo altre quattro formule di riduzione. In tutto sono sei formule: due se l’integrale semplice è rispetto a z (come nell’enunciato), due se è rispetto ad y e due se è rispetto ad x. Dato un insieme A di R3 e data f : A → R, la funzione fˆ: R3 → R definita da ½ f (x, y, z) se (x, y, z) ∈ A fˆ(x, y, z) = 0 se (x, y, z) ∈ /A si chiama estensione standard di f . Sia f (x, y, z) una funzione di tre variabili definita in un sottoinsieme limitato A di R3 . Consideriamo un (arbitrario) parallelepipedo Q contenente A. Diremo che f è integrabile in A se è integrabile in Q la sua estensione standard fˆ. In tal caso l’integrale di f in A si definisce nel modo seguente: ZZZ ZZZ f (x, y, z) dxdydz := fˆ(x, y, z) dxdydz . A R Dal fatto che fˆ è nulla fuori da A si può dedurre che il secondo integrale non dipende dal parallelepipedo Q contenente A. Pertanto, la suddetta definizione è ben posta. Teorema (di additività rispetto all’insieme di integrazione). Supponiamo che una funzione f (x, y, z) sia integrabile sia in un insieme A1 che in un insieme A2 , con A1 ∩ A2 = ∅. 86 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Allora f è integrabile in A = A1 ∪ A2 e ZZZ ZZZ ZZZ f (x, y, z) dxdydz = f (x, y, z) dxdydz + A A1 f (x, y, z) dxdydz . A2 Sia A ⊂ R3 un insieme del tipo A = {(x, y, z) : (x, y) ∈ B, ϕ1 (x, y) ≤ z ≤ ϕ2 (x, y)} , dove ϕ1 , ϕ2 : B → R sono due funzioni continue definite in un sottoinsieme compatto B di R2 . Si dice che A presenta il caso semplice rispetto all’asse z perché ogni retta parallela a tale asse lo interseca in un intervallo (di estremi ϕ1 (x, y) e ϕ2 (x, y), per (x, y) ∈ B). Supponiamo che f (x, y, z) sia una funzione integrabile in A. Per definizione, dato un parallelepipedo Q = [a1 , b1 ] × [a2 , b2 ] × [a3 , b3 ] contenente A, l’integrale di f in A è ZZZ fˆ(x, y, z) dxdydz . Q Dal Teorema di Fubini si ha ZZZ ZZ Z ˆ f (x, y, z) dxdydz = dxdy Q R b3 fˆ(x, y, z) dz , a3 dove R = [a1 , b1 ] × [a2 , b2 ]. Ossia, ZZZ ZZ f (x, y, z) dxdydz = g(x, y) dxdy , A R dove g: R → R è la funzione definita da g(x, y) = Z b3 fˆ(x, y, z) dz . a3 Osserviamo ora che, per la definizione di fˆ, la funzione g(x, y) è nulla se (x, y) ∈ / B. Di conseguenza, ZZ ZZ ZZ ZZ g(x, y) dxdy = g(x, y) dxdy + g(x, y) dxdy = g(x, y) dxdy . R B R\B B Tenendo conto che, dato (x, y) ∈ B, la funzione fˆ è nulla se z non appartiene all’intervallo [ϕ1 (x, y), ϕ2 (x, y)], per (x, y) ∈ B si ha g(x, y) = Z b3 a3 fˆ(x, y, z) dz = Z ϕ2 (x,y) ϕ1 (x,y) fˆ(x, y, z) dz = Z ϕ2 (x,y) f (x, y, z) dz . ϕ1 (x,y) 87 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Si ottiene cosı̀ la seguente importante formula di riduzione, detta anche formula degli spaghetti (paralleli all’asse z), valida per gli insiemi che presentano il caso semplice rispetto all’asse z: Z ϕ2 (x,y) ZZ ZZZ dxdy f (x, y, z) dxdydz = f (x, y, z) dz , B A ϕ1 (x,y) dove B è la proiezione ortogonale di A sul piano xy e ϕ1 , ϕ2 : B → R sono due funzioni i cui grafici delimitano A. Ovviamente si hanno altre due formule degli spaghetti: una con spaghetti paralleli all’asse x e l’altra con spaghetti paralleli all’asse y. I dettagli sono lasciati allo studente. Il Teorema di Fubini in R3 ci dice che per calcolare un integrale triplo si può eseguire prima un integrale doppio e poi un integrale semplice. Da tale teorema si deduce un’altra formula di riduzione per il calcolo di un integrale triplo in un insieme limitato A: la formula delle fette. Anche in questo caso, in realtà, si avranno tre formule, a seconda che le fette siano perpendicolari all’asse z, all’asse x o all’asse y. Riportiamo la formula delle fette perpendicolari all’asse z. Il compito di scrivere le altre due formule è lasciato per esercizio allo studente. Sia f (x, y, z) una funzione integrabile in un insieme limitato A ⊂ R3 . Fissato z ∈ R, denotiamo con © ª Az = (x, y) ∈ R2 : (x, y, z) ∈ A la “fetta” (eventualmente vuota) che si ottiene “tagliando” A col piano perpendicolare all’asse z e passante per il punto (0, 0, z). Sia [a, b] un intervallo contenente la proiezione ortogonale di A sull’asse z. Allora vale la seguente formula delle fette : Z b ZZ ZZZ f (x, y, z) dxdy . dz f (x, y, z) dxdydz = A a Az Definizione. Un sottoinsieme limitato A di R3 si dice misurabile (secondo Mengoli Cauchy - Riemann) quando è integrabile in A la funzione f (x, y, z) ≡ 1. In tal caso, la misura (tridimensionale) di A, detta anche volume, è il numero ZZZ µ(A) = dxdydz . A Esercizio: calcolo del volume di una sfera col metodo delle fette. 77 - Lun. 13/11/00 Esercizio: calcolo del volume di una sfera col metodo degli spaghetti. 88 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Dimostrazione della formula delle fette. Siano, rispettivamente, [a, b] ed R un intervallo nell’asse z e un rettangolo nel piano xy in modo che il parallelepipedo Q = [a, b] × R contenga A. Per definizione, si ha ZZZ ZZZ f (x, y, z) dxdydz = fˆ(x, y, z) dxdydz , A Q e per il Teorema di Fubini risulta ZZZ f (x, y, z) dxdydz = A Z b dz a ZZ fˆ(x, y, z) dxdy . R Poiché, fissato z ∈ [a, b], la funzione fˆ(x, y, z) è nulla fuori da Az , si ottiene ZZ ZZ ˆ f (x, y, z) dxdy = f (x, y, z) dxdy . R Pertanto ZZZ Az f (x, y, z) dxdydz = A Z b dz a ZZ f (x, y, z) dxdy . Az 78 - Lun. 13/11/00 Dalla definizione di integrale doppio discende immediatamente la seguente Proprietà di monotonia. Se in un insieme limitato A ⊂ R2 si ha f (x, y) ≤ g(x, y), allora (quando ha senso) risulta ZZ ZZ g(x, y)dxdy . f (x, y)dxdy ≤ A A È ovvio che un’analoga proprietà di monotonia vale anche per gli integrali tripli. Allo studente si lascia il compito di formularne l’enunciato. Primo teorema della media per gli integrali doppi. Sia f : A → R una funzione integrabile in un insieme limitato A ⊂ R2 di misura positiva. Allora la media di f in A, ossia ZZ 1 f (x, y)dxdy , µ(A) A è un numero compreso tra l’estremo inferiore e l’estremo superiore di f . In particolare, se f è continua ed A è connesso, allora (per il Secondo Teorema di Weierstrass) esiste un punto p ∈ A per il quale si ha ZZ f (x, y)dxdy = f (p)µ(A) . A 89 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Secondo teorema della media per gli integrali doppi. Siano f, g: A → R due funzioni integrabili in un insieme limitato A ⊂ R2 . Supponiamo che g(x, y) non cambi segno in A. Allora (quando ha senso) la media ponderata di f in A (con peso g), ossia RR (x, y)g(x, y)dxdy Af RR , A g(x, y)dxdy è un numero compreso tra l’estremo inferiore e l’estremo superiore di f . Inoltre, se f è continua ed A è connesso, esiste un punto p ∈ A per il quale si ha ZZ ZZ f (x, y)g(x, y)dxdy = f (p) g(x, y)dxdy , A A incluso il caso in cui l’integrale di g sia zero. Ovviamente, esistono versioni del primo e del secondo teorema della media anche per gli integrali tripli. Alle studente il compito di formularne gli enunciati. Cenni sugli integrali in R4 e calcolo della misura di una sfera (piena) a quattro dimensioni (col metodo delle fette). Esercizi consigliati [Spiegel, cap. 9]: 9, 10, 12, 13, 14. 79 - Mar. 14/11/00 Dato un sottoinsieme limitato e misurabile A ⊂ R2 , il suo baricentro geometrico è il punto (xc , yc ) che ha per ascissa la media delle ascisse e per ordinata le media delle ordinate. Si ha pertanto ZZ ZZ 1 1 xdxdy e yc = ydxdy . xc = µ(A) A µ(A) A Si osservi che dal primo teorema della media segue inf (x,y)∈A x ≤ xc ≤ sup x (x,y)∈A e inf (x,y)∈A y ≤ yc ≤ sup y . (x,y)∈A Esercizi sul calcolo di alcuni baricentri: baricentro di un triangolo, baricentro di un semicerchio, baricentro di un cerchio forato. La definizione di baricentro geometrico di un solido è analoga a quella che abbiamo dato per un sottoinsieme di R2 : dato un sottoinsieme limitato e misurabile A ⊂ R3 il suo baricentro è quel punto le cui coordinate sono la media in A delle corrispondenti funzioni coordinate. Il baricentro fisico di un solido (non necessariamente omogeneo) A ⊂ R3 (o di una piastra A ⊂ R2 ) è quel punto le cui coordinate (xg , yg , zg ) si ottengono facendo la media ponderata 90 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi delle funzioni coordinate omologhe mediante la densità di massa δ(p). Ad esempio, la prima coordinata è data da ZZZ ZZZ 1 1 xδ(x, y, z) dxdydz = x dm , xg = m m A A dove dm = δ(x, y, z)dxdydz = δ(p)dv si chiama elemento di massa e ZZZ ZZZ m= δ(p)dv = dm A A è la massa di A (dv = dxdydz si dice elemento di volume). Esercizio. Verificare che per i solidi omogenei il baricentro fisico coincide con quello geometrico. Sia A ⊂ R2 una piastra (non necessariamente omogenea) di massa m. Fissato un punto p0 = (x0 , y0 ) ∈ R2 , il momento d’inerzia di A rispetto a p0 (o, equivalentemente, rispetto ad una retta passante per p0 e perpendicolare al piano) è il numero ZZ I= d(p, p0 )2 dm , A dove d(p, p0 ) denota la distanza di un generico punto p = (x, y) ∈ A da p0 = (x0 , y0 ) e dm rappresenta l’elemento di massa, ossia il prodotto della densità (superficiale) δ(p) per l’elemento di area dσ = dxdy. Nel caso che la piastra sia omogenea, la densità è la costante δ = m/µ(A). Sia A ⊂ R3 un solido (non necessariamente omogeneo) di massa m. Fissata una retta α, il momento d’inerzia di A rispetto ad α è il numero ZZZ I= d(p, α)2 dm , A dove d(p, α) denota la distanza di un generico punto p = (x, y, z) ∈ A dalla retta α e dm rappresenta l’elemento di massa, ossia il prodotto della densità δ(p) per l’elemento di volume dv = dxdydz. 80 - Mar. 14/11/00 Dati due numeri naturali m ed n, una matrice (reale) n × m è un insieme A = {aij } di nm numeri reali, dove gli indici i e j verificano le seguenti condizioni: i ∈ {1, 2, . . . , n}, j ∈ {1, 2, . . . , m}. Una matrice n×m si dice anche matrice di n righe e m colonne. L’indice i rappresenta la riga alla quale appartiene l’elemento aij e l’indice j rappresenta la colonna. 91 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Dal punto di vista grafico si conviene di rappresentare una matrice A nel seguente modo: a11 a12 . . . a1m a21 a22 . . . a2m A= .. .. . . an1 an2 . . . anm Se n = m, la matrice si dice quadrata, e in questo caso è ben definito un numero, detto determinante della matrice. Ci sono varie definizioni equivalenti di determinante. Noi daremo quella induttiva. Prima di procedere è bene introdurre alcune notazioni. Data una matrice (non necessariamente quadrata) A e dato un elemento aij di A, se da A si cancella la riga e la colonna che contengono detto elemento, si ottiene una sottomatrice di A che denoteremo con Aij . Osserviamo che se A è una matrice n × m, una sottomatrice ottenuta in tal modo è del tipo (n − 1) × (m − 1). Un elemento aij di una matrice A si dice di posto pari se i + j è pari e di posto dispari in caso contrario. Il determinante det A di una matrice quadrata A = {aij } del tipo n × n è il numero a11 se n = 1 ed è il numero a11 det A11 − a12 det A12 + . . . + (−1)1+n a1n det A1n se n > 1. In altre parole, se n = 1 il determinante di A è l’unico elemento che compone la matrice, e se n > 1 si calcola facendo la somma a segni alterni del prodotto del generico elemento della prima riga per il determinante della sottomatrice che si ottiene cancellando, altre alla prima riga, la colonna corrispondente a tale elemento. Il segno dipende dall’elemento considerato: è 1 se l’elemento è di posto pari ed è −1 se è di posto dispari. È noto che il determinante di A si può calcolare eseguendo lo sviluppo, invece che rispetto alla prima riga, rispetto ad una qualunque altra riga o colonna. Il determinante di una matrice quadrata gode di varie proprietà che saranno oggetto di studio nel corso di Geometria. Le due seguenti sono tra le più importanti: – se si invertono tra loro due righe o due colonne della matrice, il determinante cambia segno; – se si moltiplica una riga o una colonna della matrice per una costante, il determinante viene moltiplicato per tale costante. Sia f : U → Rs un’applicazione di classe C 1 definita su un aperto U di Rk . Denotiamo con f1 , f2 , . . . , fs le s funzioni reali che compongono la f (ricordiamo che sono funzioni reali 92 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi di k variabili reali). Fissato un punto p0 ∈ U , la matrice ∂f ∂f1 ∂f1 1 · · · ∂x ∂x2 k ∂x1 ∂f2 ∂f2 ∂f2 ∂x1 ∂x2 · · · ∂xk f 0 (p0 ) = . .. .. . ∂fs ∂fs ∂fs · · · ∂x ∂x1 ∂x2 k p0 si chiama matrice jacobiana dell’applicazione f in p0 (il simbolo p0 in basso a destra significa che tutti gli elementi della matrice si considerano calcolati nel punto p0 ). Quando k = s, la matrice f 0 (p0 ) è quadrata, e in questo caso ha senso il suo determinante, det f 0 (p0 ), chiamato jacobiano dell’applicazione f in p0 . 81 - Mer. 15/11/00 Altre notazioni per indicare una matrice jacobiana (o una sottomatrice di una matrice jacobiana): ∂(x, y) ∂(x, z) ∂(x, y, z) , , , ecc. ∂(u, v) ∂(u, v) ∂u Teorema (di cambiamento di variabile per gli integrali doppi). Sia ϕ(u, v) = 2 (ϕ1 (u, v), ϕ2 (u, v)) un’applicazione continua da un compatto A ⊂ R in R2 . Supponiamo che A e ϕ(A) siano misurabili e che ϕ sia C 1 e iniettiva nell’interno Å di A. Allora, data una funzione f (x, y) continua su ϕ(A), risulta ZZ ZZ ¯ ¯ f (x, y) dxdy = f (ϕ1 (u, v), ϕ2 (u, v)) ¯det ϕ0 (u, v)¯ dudv . ϕ(A) A Coordinate polari. Momento d’inerzia di un disco (omogeneo) di massa m e raggio r: I = 21 mr2 . Esercizi sugli integrali doppi. Coordinate ellittiche. Cenni sugli integrali impropri su R2 . Calcolo di ZZ e−(x 2 +y 2 ) dxdy = π R2 93 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 82 - Mer. 15/11/00 Calcolo del momento d’inerzia di una sfera (col metodo delle fette). Teorema di Pappo (per i solidi di rotazione). Sia A un insieme misurabile interamente contenuto in un semipiano delimitato da una retta λ. Il volume del solido generato dalla rotazione di A di un angolo θ ∈ (0, 2π] intorno alla retta λ è dato dal prodotto dell’area di A per la lunghezza dell’arco di circonferenza percorso dal baricentro di A. Giustificazione geometrica del Teorema di Pappo per i solidi di rotazione. Esercizi basati sul Teorema di Pappo: calcolo del baricentro di un semicerchio (conoscendo l’area di un cerchio e il volume di una sfera); volume di un cono; volume di un toro solido. 83 - Gio. 16/11/00 Teorema (di cambiamento di variabile per gli integrali tripli). Sia ϕ(u, v, w) = (ϕ1 (u, v, w), ϕ2 (u, v, w), ϕ2 (u, v, w)) un’applicazione continua da un compatto A di R3 in R3 . Supponiamo che A e ϕ(A) siano misurabili e che ϕ sia C 1 e iniettiva nell’interno Å di A. Allora, data una funzione f (x, y, z) continua su ϕ(A), risulta ZZZ f (x, y, z) dxdydz = ZZZ ϕ(A) A ¯ ¯ f (ϕ1 (u, v, w), ϕ2 (u, v, w), ϕ3 (u, v, w)) ¯det ϕ0 (u, v, w)¯ dudvdw . Interpretazione geometrica dell’elemento di area in coordinate polari. Coordinate cilindriche nello spazio e relativo elemento di volume. Coordinate sferiche e relativo elemento di volume. Interpretazione geometrica dell’elemento di volume in coordinate cilindriche e sferiche. Esercizio. Calcolo del volume di una sfera (solida) in coordinate sferiche. Esercizio. Calcolo del momento d’inerzia (rispetto ad un asse passante per il centro) di una sfera (solida) omogenea. 84 - Gio. 16/11/00 Ricordiamo che una curva parametrica in R2 [in R3 ] è una funzione continua γ(t) da un intervallo compatto [a, b] a valori in R2 [in R3 ]. I punti γ(a) e γ(b) si dicono estremi della 94 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi curva. La curva γ(t) si dice chiusa se i suoi estremi coincidono (ossia, se γ(a) = γ(b)). Se la curva γ(t) non è chiusa, allora si dice che è un arco di curva parametrica. Un arco di curva γ da [a, b] in R2 (o in R3 ) si dice semplice se la funzione γ è iniettiva in [a, b]. Se γ è una curva chiusa, diremo che è semplice se è iniettiva la sua restrizione all’intervallo aperto (a, b). Ovviamente, in questo caso, essendo γ(a) = γ(b), la funzione γ non è iniettiva nell’intervallo chiuso [a, b]. Una curva γ(t) in R2 [in R3 ] avrà due [tre] funzioni componenti: γ1 (t) e γ2 (t) [γ1 (t), γ2 (t) e γ3 (t)], che talvolta vengono denotate x(t) e y(t) [x(t), y(t) e z(t)]. Diremo che γ(t) è C n se sono C n tutte le sue funzioni componenti. Le equazioni x = γ1 (t) e y = γ2 (t) di una curva γ(t) = (γ1 (t), γ2 (t)) si chiamano equazioni parametriche (o equazioni del grafico) della curva γ(t). Chiaramente, se la curva è a valori in R3 , le sue equazioni parametriche sono tre. La derivata in un punto t0 di una curva parametrica è, quando esiste, il limite per t → t0 del rapporto incrementale γ(t) − γ(t0 ) . t − t0 Ovviamente, tale rapporto ha senso perché è il prodotto del vettore γ(t) − γ(t0 ) per lo scalare 1/(t−t0 ). È facile verificare che γ(t) è derivabile in t0 se e solo se sono derivabili in t0 le sue funzioni componenti. In tal caso la derivata di γ(t) può essere eseguita componente per componente. Una curva parametrica γ(t) (chiusa o non chiusa) si dice regolare se è C 1 e se kγ 0 (t)k 6= 0 per ogni valore t del parametro. In altre parole, γ(t) è regolare se è C 1 e le derivate delle sue funzioni componenti non si annullano mai simultaneamente (ossia, per lo stesso valore di t). Dal punto di vista cinematico, una curva parametrica γ(t) rappresenta il moto di un punto nel piano o nello spazio e il parametro t rappresenta il tempo. Se il moto è C 1 , dire che è regolare significa affermare che il vettore velocità γ 0 (t) non si annulla mai (ovvero, il punto γ(t) non si ferma mai). L’immagine di una curva parametrica γ(t) si chiama il sostegno della curva. Da non confondere con la curva parametrica γ(t), che è una funzione e, dal un punto di vista cinematico, non rappresenta solo il percorso del punto γ(t), ma l’intera legge di percorrenza (lo stesso sostegno può essere infatti percorso in più modi e con velocità diverse). 85 - Ven. 17/11/00 Siano f, g: U → R due funzioni continue definite su un aperto U di R2 (o di R3 ) e sia γ: [a, b] → U una curva parametrica a valori in U . Vogliamo introdurre un nuovo concetto: 95 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi quello di integrale curvilineo orientato lungo la curva γ di f (p) in dg(p), che denoteremo col simbolo Z f (p)dg(p) . γ Ovviamente, p sta per (x, y) se U ⊂ R2 e per (x, y, z) se U ⊂ R3 . Fissiamo una partizione puntata α di [a, b] costituita da una partizione {t0 , t1 , . . . , tn } di [a, b] e da una scelta {c1 , c2 , . . . , cn } di punti tali che ci ∈ [ti , ti−1 ]. Alla partizione puntata α possiamo associare il numero S(α) = n X f (γ(ci ))∆gi , i=1 dove, per ogni i, ∆gi = g(γ(ti )) − g(γ(ti−1 )) denota l’incremento subito dalla funzione g nel passare dal punto γ(ti−1 ) al punto γ(ti ). In questo modo risulta definita, nell’insieme P delle partizioni puntate di [a, b], una funzione reale S che ad ogni α ∈ P associa la somma S(α). L’integrale curvilineo (orientato) lungo γ di f (p) in dg(p) è, quando esiste, il valore I a cui tende S(α) quando il parametro di finezza |α| di α tende a zero. Scriveremo Z lim S(α) = f (p)dg(p) = I ∈ R |α|→0 γ se fissato ² > 0 esiste δ > 0 tale che da |α| < δ segue |S(α) − I| < ². Ovviamente, affinché la definizione di integrale curvilineo abbia senso, è sufficiente che le funzioni f e g siano definite sul sostegno di γ. Le abbiamo supposte definite su un aperto contenente il sostegno di γ soltanto per semplificare l’enunciato di alcuni teoremi che vedremo in seguito. Osserviamo infatti che se g fosse definita soltanto sul sostegno di γ, non avrebbe senso considerare le sue derivate parziali (non sarebbero infatti definite le funzioni parziali). Dalle proprietà dei limiti discende facilmente che se λ1 e λ2 sono due costanti e f1 , f2 : U → R due funzioni, allora Z Z Z (λ1 f1 (p) + λ2 f2 (p))dg(p) = λ1 f1 (p)dg(p) + λ2 f2 (p)dg(p) . γ γ γ Analogamente si ha Z Z Z f (p)d(λ1 g1 (p) + λ2 g2 (p)) = λ1 f (p)dg1 (p) + λ2 f (p)dg2 (p) . γ γ γ Esercizio. Dalla definizione di integrale curvilineo dedurre che se γ è una curva costante, allora Z f (p)dg(p) = 0 . γ 96 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Osservazione. Se la funzione f è identicamente uguale ad uno, si ottiene Z dg(p) = g(p2 ) − g(p1 ) , γ dove p1 e p2 sono, rispettivamente, il primo ed il secondo estremo della curva γ. In questo caso, quindi, l’integrale non dipende dal cammino, ma soltanto dagli estremi della curva. Un caso particolare (molto importante) di integrale curvilineo si ottiene quando g(p) è una delle due funzioni coordinate, x o y, di R2 (o una delle tre funzioni coordinate di R3 ). Se ω = A(x, y)dx + B(x, y)dy è una forma differenziale in R2 e γ è una curva parametrica nel dominio U di ω, si definisce Z Z Z ω = A(x, y)dx + B(x, y)dy . γ γ γ Un’analoga definizione vale per l’integrale curvilineo di una forma differenziale in R3 . Osserviamo che una forma differenziale ω = A(x, y)dx + B(x, y)dy può essere pensata anche come il prodotto scalare F · dp tra il campo vettoriale F (x, y) = (A(x, y), B(x, y)) e il differenziale (vettoriale) dp = (dx, dy) del punto p. Nel caso che F = (A, B) rappresenti una forza, l’integrale esteso ad una curva γ di ω, che può essere equivalentemente scritto nella forma Z F · dp , γ è il lavoro che compie la forza F in seguito al moto del punto p lungo la curva γ. Il seguente importante risultato, di cui omettiamo la dimostrazione, riconduce il calcolo di un integrale curvilineo (orientato) ad un ordinario integrale definito: Teorema (di riduzione agli integrali semplici per gli integrali curvilinei orientati). Sia U un aperto di R2 (o di R3 ). Supponiamo che f : U → R sia continua, g: U → R sia C 1 e γ: [a, b] → U sia C 1 . Allora Z Z b f (p)dg(p) = f (γ(t))dg(γ(t)) γ o, equivalentemente, ϕ0 (t)dt dove g(γ(t)). Z a f (p)dg(p) = γ Z b f (γ(t))ϕ0 (t)dt , a è il differenziale delle funzione composta ϕ: [a, b] → R definita da ϕ(t) = 97 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 86 - Ven. 17/11/00 Dal teorema di riduzione segue che quando ω = A(x, y)dx + B(x, y)dy è una forma differenziale esatta e g(x, y) una sua primitiva, allora, per ogni curva parametrica γ di classe C 1 e con sostegno nel dominio U di ω, si ha Z Z Z dg(x, y) = A(x, y)dx + B(x, y)dy . γ γ γ Ciò mostra che la notazione dg(p) che appare in un integrale curvilineo è coerente con quella di differenziale. In effetti, è questo il vero motivo della scelta di tale notazione. Considerazioni analoghe valgono per gli integrali curvilinei in R3 . Teorema (formula fondamentale per gli integrali curvilinei). differenziale esatta e g una sua primitiva, allora Z ω = g(p2 ) − g(p1 ) , Se ω è una forma γ dove p1 e p2 sono, rispettivamente, il primo ed il secondo estremo della curva γ. In particolare, l’integrale curvilineo di una forma differenziale esatta non dipende dal cammino, ma soltanto dagli estremi della curva. Corollario Se ω è una forma differenziale esatta, allora l’integrale curvilineo di ω lungo una qualunque curva chiusa è nullo. In sostanza, il suddetto corollario afferma che “una condizione necessaria affinché una forma differenziale sia esatta è che l’integrale lungo ogni curva chiusa sia zero”. Si potrebbe dimostrare che tale condizione è anche sufficiente. Vale infatti il seguente Teorema. Condizione necessaria e sufficiente affinché una forma differenziale sia esatta è che l’integrale curvilineo della forma lungo una qualunque curva chiusa sia zero. Notazione. L’integrale curvilineo di f in dg esteso ad una curva chiusa γ viene spesso denotato con I f (p)dg(p) . γ Ricordiamo che, come conseguenza del Teorema di Schwarz, ogni forma differenziale esatta è anche chiusa. Inoltre, se una forma chiusa è definita in un aperto semplicemente connesso, allora è anche esatta. Mostriamo con un esempio che (negli aperti non semplicemente connessi) possono esistere forme chiuse che non sono esatte. Consideriamo la forma differenziale x y dx + 2 dy . ω = A(x, y)dx + B(x, y)dy = − 2 x + y2 x + y2 98 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Si ha y 2 − x2 ∂A (x, y) = 2 ∂y (x + y 2 )2 e ∂B y 2 − x2 (x, y) = 2 . ∂x (x + y 2 )2 Pertanto ω è una forma chiusa. Osserviamo che il dominio di ω è l’aperto U = R2 \{(0, 0)}, che non è semplicemente connesso. Ciò non implica che la forma debba essere non esatta (“il dominio semplicemente connesso” è soltanto una condizione sufficiente affinché una forma chiusa sia esatta). Tuttavia, se fosse esatta, il suo integrale lungo una qualunque curva chiusa (con sostegno in U ) dovrebbe essere zero. Proviamo ad integrare lungo la curva chiusa γr definita dalle equazioni parametriche x = r cos t, y = r sen t, 0 ≤ t ≤ 2π, che rappresenta una circonferenza (parametrica) di raggio r > 0 e centro nell’origine. Si ha ¶ I µ x y dx + 2 dy = − 2 x + y2 x + y2 γr ¶ Z 2π µ r cos t r sen t d(r cos t) + d(r sen t) = − r2 r2 0 Z 2π Z 2π 2 2 (sen t + cos t) dt = dt = 2π . 0 0 La forma differenziale non è pertanto esatta. Incidentalmente osserviamo che il suddetto integrale non dipende dal parametro r della curva γr . Questo fatto ha una spiegazione teorica di cui diamo soltanto un’idea intuitiva. La dimostrazione rigorosa compete ad una moderna disciplina matematica: la Topologia. Supponiamo che ω sia una forma differenziale chiusa, definita in un aperto U di R2 . Consideriamo l’integrale curvilineo di ω esteso ad una curva chiusa γ (con sostegno in U ). Supponiamo di deformare (in una zona) la curva γ, trasformandola in una nuova curva γ1 , in modo che la deformazione avvenga dentro un cerchio aperto C interamente contenuto in U . Se si considera la differenza dei due integrali curvilinei (quello esteso a γ meno quello esteso a γ1 ), il risultato è come se si facesse un integrale curvilineo esteso ad una curva chiusa interamente contenuta nel cerchio C. Si osservi infatti che le due curve coincidono fuori da C, e quindi, facendo la differenza dei due integrali, il contributo dei tratti di curva che stanno fuori da C è nullo. D’altra parte, il cerchio C è un insieme convesso; dunque, essendo ω chiusa, la sua restrizione a C è una forma esatta. Ciò prova che la differenza dei due integrali curvilinei, essendo equivalente ad un integrale curvilineo in C, è zero. Possiamo concludere che se ω è una forma chiusa e γ è una curva chiusa, l’integrale curvilineo di ω esteso a γ non muta se si deforma γ in un piccolo tratto. È un fatto intuitivo, e dimostrabile rigorosamente, che se due curve chiuse, entrambe con sostegno in un aperto U di R2 , differiscono di poco (non solo in un piccolo tratto, ma anche 99 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi nell’intero intervallo in cui varia il parametro), allora è possibile deformare una nell’altra con un numero finito di piccole deformazioni, in modo che ciascuna di queste avvenga dentro un cerchio (aperto) contenuto in U . Da ciò si deduce che se due curve differiscono di poco, l’integrale di una forma chiusa esteso a una curva o all’altra è lo stesso. Immaginiamo ora di avere (in un aperto U di R2 ) una famiglia di curve che dipendono con continuità da un parametro che varia in un intervallo (si pensi, ad esempio, alla famiglia di circonferenze {γr }, con r > 0, considerata prima). Per la dipendenza continua dal parametro, nel passare da una curva ad un’altra della stessa famiglia, si può dare al parametro una sequenza di valori in modo da ottenere delle curve intermedie con la proprietà che due qualunque curve consecutive siano sufficientemente vicine tra loro. Per quanto visto prima, se ω è una forma chiusa in U , passando da una curva alla curva successiva della sequenza, l’integrale curvilineo non cambia. Ciò prova, almeno Intuitivamente, che l’integrale curvilineo di ω esteso ad una qualunque delle curve della famiglia è sempre lo stesso. Se in un aperto U di R2 (o di R3 ) due curve chiuse sono deformabili l’una nell’altra con continuità (nel senso che fanno parte di una famiglia di curve con sostegno in U che dipendono con continuità da un parametro che varia in un intervallo), allora si dice che sono omotope in U . Le suddette “chiacchiere” si concretizzano nel seguente risultato: Teorema (di invarianza per omotopia). Se ω è una forma chiusa in un aperto U di R2 (o di R3 ), e se γ1 e γ2 sono due curve chiuse omotope in U , allora I I ω = ω. γ1 γ2 In particolare, se una curva chiusa γ è omotopa (in U ) ad una curva costante, risulta I ω = 0. γ 87 - Lun. 20/11/00 Sia γ: [a, b] → U una curva parametrica con sostegno in un aperto U di R2 (o di R3 ) e sia f : U → R una funzione continua definita su U (o, più in generale, definita sul sostegno di γ). Vogliamo introdurre la nozione di integrale curvilineo (non orientato) lungo la curva γ di f (p) in ds, che denoteremo col simbolo Z f (p)ds . γ 100 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Il termine ds viene detto elemento di lunghezza d’arco. Fissiamo una partizione puntata α di [a, b] costituita da una partizione {t0 , t1 , . . . , tn } di [a, b] e da una scelta {c1 , c2 , . . . , cn } di punti tali che ci ∈ [ti , ti−1 ]. Alla partizione puntata α possiamo associare il numero n X S(α) = i=1 f (γ(ci ))kγ(ti ) − γ(ti−1 )k , dove kγ(ti ) − γ(ti−1 )k denota la lunghezza del segmento che ha per estremi i due punti γ(ti−1 ) e γ(ti ) sul sostegno della curva γ. In questo modo risulta definita, nell’insieme P delle partizioni puntate di [a, b], una funzione reale S che ad ogni α ∈ P associa la somma S(α). L’integrale curvilineo (non orientato) lungo γ di f (p) in ds è, quando esiste, il valore I a cui tende S(α) quando il parametro di finezza |α| di α tende a zero. Scriveremo Z lim S(α) = f (p)ds = I ∈ R |α|→0 γ se fissato ² > 0 esiste δ > 0 tale che da |α| < δ segue |S(α) − I| < ². Dalle proprietà dei limiti discende facilmente che se λ1 e λ2 sono due costanti e f1 , f2 : U → R due funzioni, allora Z Z Z (λ1 f1 (p) + λ2 f2 (p))ds = λ1 f1 (p)ds + λ2 f2 (p)ds . γ γ γ Dalla proprietà del confronto dei limiti discende la monotonia: se f1 (p) ≤ f2 (p) per ogni p sul sostegno di γ, allora Z Z f1 (p)ds ≤ f2 (p)ds . γ γ Definizione. Una curva parametrica γ si dice rettificabile se esiste l’integrale lungo γ della funzione f (p) ≡ 1 in ds, e in questo caso la lunghezza di γ è il numero Z L(γ) = ds . γ Con riferimento alla definizione di integrale curvilineo non orientato, si osservi che quando f (p) ≡ 1, la somma S(α) associata ad una partizione puntata α non è altro che la lunghezza della poligonale inscritta al sostegno di γ con vertici γ(t0 ), γ(t1 ), . . . , γ(tn ). Pertanto, 101 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi la lunghezza di γ è il limite per |α| → 0 delle lunghezze delle poligonali associate alle partizioni α di [a, b]. Ovviamente, in questo caso, essendo f (p) ≡ 1, è superfluo che le partizioni di [a, b] siano puntate. Non tutte le curve parametriche (continue) sono rettificabili. Per avere un’idea di ciò, si fa presente che nel 1890 l’illustre matematico torinese Giuseppe Peano (1858-1932) fornı̀ uno esempio di curva parametrica (continua) il cui sostegno è un intero quadrato (pieno!), e una tale curva non è certo rettificabile. Nel 1935, tuttavia, A. B. Brown mostrò che un tale fenomeno non può verificarsi se la curva è di classe C 1 , perché il suo sostegno risulta privo di punti interni (sono queste, quelle di classe C 1 , le curve che più aderiscono alla nostra concezione intuitiva di curva). Le curve C 1 , come vedremo, sono rettificabili. Dalla proprietà di monotonia degli integrali curvilinei non orientati discende immediatamente il Primo teorema della media per gli integrali curvilinei. Siano γ una curva rettificabile ed f una funzione continua definita sul sostegno di γ. Allora la media di f lungo γ, ossia Z 1 f (p)ds , L(γ) γ è un numero compreso tra l’estremo inferiore e l’estremo superiore di f . Di conseguenza, per il Secondo Teorema di Weierstrass, esiste un punto p0 sul sostegno di γ per il quale risulta Z f (p)ds = f (p0 )L(γ) . γ Il seguente importante risultato riconduce il calcolo di un integrale curvilineo (non orientato) ad un ordinario integrale definito: Teorema (di riduzione agli integrali semplici per gli integrali curvilinei non orientati). Se f : U → R è continua e γ: [a, b] → U è C 1 , allora Z f (p)ds = γ Z b a f (γ(t)) kγ 0 (t)kdt . In particolare, γ è rettificabile e si ha L(γ) = Z b a kγ 0 (t)kdt . Calcolo della lunghezza di una circonferenza. Calcolo del momento d’inerzia di una circonferenza (di massa m) rispetto al centro. 102 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 88 - Lun. 20/11/00 Definizione. Un’applicazione tra due intervalli compatti, σ: [α, β] → [a, b], si dice un cambiamento di parametro se è di classe C 1 , suriettiva, con derivata sempre diversa da zero. Un cambiamento di parametro t = σ(τ ) è detto concorde se σ 0 (τ ) > 0 e discorde in caso contrario. Osserviamo che se t = σ(τ ) è un cambiamento di parametro, allora σ è invertibile e anche τ = σ −1 (t) è un cambiamento di parametro. Definizione. Due curve parametriche γ1 e γ2 si dicono equivalenti se una si ottiene dall’altra (mediante la composizione) con un cambiamento di parametro. Due curve parametriche equivalenti si dicono concordi o discordi a seconda che sia concorde o discorde il cambiamento di parametro che fa passare dall’una all’altra. Teorema (di indipendenza per gli integrali curvilinei orientati). Siano f, g: U → R due applicazioni continue e siano γ1 e γ2 due parametrizzazioni equivalenti (con sostegno in U ). Se γ1 e γ2 sono concordi, allora Z Z f (p)dg(p) = f (p)dg(p) . Se γ1 e γ2 sono discordi, allora Z γ1 γ2 f (p)dg(p) = − Z γ1 f (p)dg(p) . γ2 Teorema (di indipendenza per gli integrali curvilinei non orientati). Sia f : U → R un’applicazione continua e siano γ1 e γ2 due parametrizzazioni equivalenti (con sostegno in U ). Allora Z Z f (p)ds = f (p)ds , γ1 γ2 indipendentemente dal fatto che γ1 e γ2 siano concordi o discordi. 89 - Mar. 21/11/00 Definizione. Un arco di curva (regolare) è un sottoinsieme di R2 (o di R3 ) con la proprietà di essere sostegno (cioè immagine) di un arco di curva parametrica semplice e regolare, detta parametrizzazione della curva. La dimostrazione del seguente importante risultato non è banale ed esula dagli scopi del corso: Teorema. Se γ1 e γ2 sono due parametrizzazioni dello stesso arco di curva (regolare), allora sono equivalenti (concordi o discordi). 103 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Gli estremi di un arco di curva sono, per definizione, gli estremi di una qualunque parametrizzazione. Non è difficile provare, in base al precedente teorema, che tale definizione è ben posta (ossia, gli estremi non dipendono dalla parametrizzazione). Un arco di curva si dice orientato quando si è stabilito un ordine tra i due estremi (ossia, quale dei due è il primo e quale il secondo). Intuitivamente, ciò equivale ad aver scelto un senso di percorrenza sulla curva (più precisamente si dovrebbe dire “una classe di equivalenza di parametrizzazioni concordi”, ma lasciamo perdere). Una parametrizzazione γ di una curva orientata α si dice concorde (con l’orientazione di α) se il primo estremo di γ coincide col primo estremo di α (e, di conseguenza, il secondo col secondo) e si dice discorde in caso contrario. Definizione (di integrale curvilineo non orientato). Sia α un arco di curva (come insieme) e sia f : U → R una funzione continua definita su un aperto U contenente α (o, più in generale, definita su α). L’integrale di f in ds lungo α è il numero Z Z f (p)ds := f (p)ds , α γ dove γ è una qualunque parametrizzazione di α. Si fa notare che, in base al teorema di indipendenza per gli integrali curvilinei non orientati, la suddetta definizione è ben posta. In altre parole, Z f (p)ds γ non dipende dalla parametrizzazione γ di α. La definizione si estende facilmente ad una catena di archi (detta anche curva generalmente regolare o regolare a tratti); ossia ad un insieme α con la proprietà di essere sostegno di una curva parametrica semplice (chiusa o non chiusa) decomponibile in un numero finito di archi, α1 , α2 , . . . , αn , in modo tale che due qualunque di questi abbiano al più un estremo a comune. In tal caso si pone Z Z Z Z f (p)ds = f (p)ds + f (p)ds + · · · + f (p)ds . α α1 α2 αn Un integrale curvilineo non orientato può avere vari significati fisici o geometrici. Ad esempio: – la massa di un filo (quando f (p)ds è l’elemento di massa dm, ossia quando f (p) rappresenta la densità lineare di massa); – la carica elettrica su un filo (quando f (p) è una densità di carica); 104 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi – il momento d’inerzia di un filo rispetto ad una retta (se f (p) rappresenta il quadrato della distanza dalla retta per la densità di massa o, equivalentemente, quando f (p)ds è il prodotto del quadrato della distanza dalla retta per l’elemento di massa dm); – la lunghezza di α (quando f (p) ≡ 1). Definizione (di integrale curvilineo orientato). Siano α un arco di curva orientato, g: U → R una funzione C 1 su un aperto U contenente α ed f una funzione continua definita su U (o, più in generale, su α). L’integrale di f in dg lungo α è il numero Z Z f (p)dg(p) := f (p)dg(p) , α γ dove γ è una qualunque parametrizzazione di α concorde con l’orientazione. Si fa notare che, in base al teorema di indipendenza per gli integrali curvilinei orientati, la suddetta definizione è ben posta. In altre parole, Z f (p)dg(p) γ non dipende dalla parametrizzazione γ di α, purché sia concorde con l’orientazione. Anche in questo caso, la definizione può essere facilmente estesa ad una catena orientata di archi; ossia ad una catena di archi α dove è stato scelto un senso di percorrenza. Ciò significa che gli archi sono tutti orientati (quindi ogni arco ha un primo e un secondo estremo) e se due archi sono adiacenti, il comune estremo è il primo per un arco ed è il secondo per l’altro. Fisicamente, un integrale orientato rappresenta quasi sempre un lavoro. Ad esempio, quando f è una pressione e g un volume (si pensi alla termodinamica dei gas). Un altro caso di fondamentale importanza in Fisica si ha quando l’integrale orientato è del tipo Z Z ω= A(p)dx + B(p)dy + C(p)dz , α α che, mediante il prodotto scalare, possiamo equivalentemente scrivere nella forma Z F (p) · dp , α dove F (p) è il campo vettoriale (A(p), B(p), C(p)) e dp = (dx, dy, dz) il vettore spostamento (del punto p). In questo caso, se il campo vettoriale F (p) rappresenta una forza, l’integrale è il lavoro che questa compie spostando il punto p lungo la curva α in senso concorde con l’orientazione. È chiaro, anche fisicamente, che se si inverte l’orientazione, il lavoro che compie la forza cambia di segno. È interessante osservare che, in base al teorema di indipendenza dalla parametrizzazione, il lavoro non dipende dalla legge di moto γ(t) 105 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi lungo la curva α, purché il punto p = γ(t) si muova in senso concorde con l’orientazione di α (e ciò, in questo particolare caso, è vero anche se la forza non è conservativa). 90 - Mar. 21/11/00 Un sottoinsieme di R2 si dice una curva di Jordan (si pronuncia “giordàn”, con l’accento tonico sull’ultima sillaba) se è il sostegno di una curva parametrica semplice e chiusa. Il più banale esempio di curva di Jordan è costituito da una circonferenza. Un altro semplice esempio è dato dalla frontiera di un rettangolo. Enunciamo, senza dimostrazione, un famoso risultato topologico, tanto intuitivo quanto non banale da provare (come molti teoremi di Topologia). Teorema di Jordan. Il complementare di una curva di Jordan è unione di due aperti disgiunti, connessi per archi e aventi come frontiera comune la curva stessa. Uno dei due aperti, detto “insieme dei punti racchiusi dalla curva”, è limitato; l’altro è illimitato. Una curva di Jordan si dice una catena di Jordan o curva di Jordan regolare a tratti (o generalmente regolare) se è un catena di archi; ossia, ricordiamo, se è decomponibile in un numero finito di archi in modo che due qualunque di questi abbiano al più un estremo a comune. Ad esempio, la frontiera di un poligono è una catena di Jordan, cosı̀ come lo è una circonferenza (perché può essere decomposta in tre archi di cerchio). Non tutte le curve di Jordan sono catene. Esistono infatti curve di Jordan cosı̀ irregolari da non ammettere archi di curva come sottoinsiemi. Una di queste è la frontiera frastagliata della cosiddetta isola di Koch (un noto frattale). Una singola catena di Jordan può essere orientata in due modi, a seconda del senso di percorrenza: orario o antiorario. Quindi, un insieme costituito da n catene di Jordan a due a due disgiunte può essere orientato in 2n modi (due per ogni curva). Diremo che un insieme compatto X ⊂ R2 è delimitato da una o più catene di Jordan se queste sono a due a due disgiunte e la loro unione coincide con la frontiera di X. Ad esempio, una corona circolare è un insieme delimitato da due catene di Jordan (nella fattispecie, due circonferenze concentriche), mentre i quadrati, i cerchi e i triangoli sono delimitati da una sola catena di Jordan. Per convenzione, dato un insieme compatto X ⊂ R2 delimitato da catene di Jordan, l’orientazione indotta da X sulla sua frontiera si ottiene percorrendo ogni catena in modo che X si trovi sul lato sinistro e il complementare di X sul lato destro. Ad esempio, l’orientazione indotta da una corona circolare sulla sua frontiera è antioraria sul cerchio esterno e oraria su quello interno. Per comprendere meglio la definizione (non proprio ortodossa) di orientazione indotta, si 106 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi pensi al concetto di riva sinistra (o destra) di un fiume. D’altra parte, bisogna accontentarsi dell’idea intuitiva, perché la definizione formale richiederebbe concetti topologici troppo avanzati per il livello del corso. Purtroppo, le definizioni informali dei concetti non consentono dimostrazioni formali dei teoremi connessi (c’è poco da fare!). Da ora in poi, per semplicità di linguaggio, diremo che una funzione f (x, y) è C n [C ∞ ] in un insieme X di R2 (non necessariamente aperto) se è C n [C ∞ ] in un aperto U contenente X. Ad esempio, la funzione x2 + y 2 è C ∞ nel quadrato Q = [0, 1] × [0, 1] perché in realtà è C ∞ in tutto R2 , che è un aperto contenente Q. In un certo senso, il seguente risultato rappresenta per gli integrali doppi quello che per gli integrali semplici è la formula fondamentale del calcolo integrale. Sotto opportune ipotesi, infatti, l’integrale doppio dipende soltanto da ciò che accade sulla frontiera dell’insieme di integrazione. Teorema (formule di Gauss nel piano). Siano A(x, y) e B(x, y) due funzioni di classe C 1 su un insieme compatto X ⊂ R2 delimitato da una o più catene di Jordan. Allora Z ZZ ∂B (x, y) dxdy = B(x, y) dy , ∂X X ∂x Z ZZ ∂A (x, y) dxdy = − A(x, y) dx , ∂X X ∂y dove l’orientazione di ∂X è quella indotta da X. Esempi ed esercizi relativi agli integrali curvilinei. 91 - Mer. 22/11/00 Teorema (formule di Gauss-Green nel piano). Siano A(x, y) e B(x, y) due funzioni di classe C 1 su un insieme compatto X ⊂ R2 delimitato da una o più catene di Jordan. Allora ! Ã Z ZZ det Adx + Bdy = ∂X X ∂ ∂x ∂ ∂y A B dxdy , dove l’orientazione di ∂X è quella indotta da X. Osservazione. Dalla formula di Gauss-Green, ponendo A = 0 o B = 0, si ottengono le due formule di Gauss. Viceversa, sommando le due formule di Gauss si ottiene la formula di Gauss-Green. Osservazione. Se si scelgono A e B in modo che la funzione ! Ã ∂ ∂ ∂B ∂A ∂x ∂y − = det ∂x ∂y A B 107 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi sia uguale ad uno, allora l’integrale curvilineo Z Adx + Bdy ∂X rappresenta l’area di X. I casi più interessanti sono i seguenti tre: A = −y/2, B = x/2; A = 0, B = x; A = −y, B = 0. Calcolo dell’area di un cerchio come integrale curvilineo. Calcolo dell’area di un’ellisse come integrale curvilineo. 92 - Mer. 22/11/00 Dato un arco di curva (o, più in generale, una catena) α ⊂ R2 , il suo baricentro (geometrico) è il punto (xc , yc ) che ha per ascissa la media delle ascisse e per ordinata le media delle ordinate. Si ha pertanto Z Z 1 1 x ds e yc = y ds . xc = L(α) α L(α) α Calcolo del baricentro di una semicirconferenza. Teorema di Pappo (per le superfici di rotazione). Sia α un arco di curva interamente contenuto in un semipiano delimitato da una retta λ. L’area della superficie che si ottiene ruotando α di un angolo θ ∈ (0, 2π] intorno alla retta λ è dato dal prodotto della lunghezza di α per la lunghezza della curva percorsa dal baricentro di α. Esempi ed esercizi basati sul Teorema di Pappo per le superfici di rotazione: area laterale di un cono; area di una superficie sferica. Il vettore tangente ad una curva parametrica γ(t) in un punto γ(t0 ) è il vettore v = γ 0 (t0 ). Un vettore si dice tangente ad un arco di curva (sostegno) α in un punto p ∈ α se è nullo o è tangente in p ad una delle possibili parametrizzazioni di α. Si potrebbe dimostrare che se v 6= 0 è tangente ad α in p, tutti gli altri vettori tangenti (ad α in p) sono proporzionali a v (ossia, sono del tipo λv, con λ ∈ R). Definizione. Un sottoinsieme α di R2 si dice una curva implicita regolare (o curva di livello regolare) se è il luogo degli zeri di una funzione g(x, y), di classe C 1 su un aperto di R2 , ed è verificata la condizione ∇g(p) 6= 0 in ogni punto di p ∈ α (ossia, se in ogni punto di α almeno una delle due derivate parziali di g è non nulla). 108 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Definizione. Sia α una curva di livello regolare definita dall’equazione g(x, y) = 0. Un vettore v si dice tangente ad α in p0 se verifica la condizione v · ∇g(p0 ) = 0 (ossia, se è ortogonale al gradiente di g in p0 , che, ricordiamo, è non nullo). Si potrebbe dimostrare che un vettore v ∈ R2 è tangente ad una curva di livello regolare g −1 (0) in un punto p se e solo se è tangente in p ad una curva parametrica di classe C 1 con sostegno in g −1 (0). Si osservi, ad esempio, che il vettore nullo è tangente alla curva costante γ definita da γ(t) = p per ogni t ∈ [a, b]. Esercizi consigliati [Spiegel, cap. 10]: 1, 2, 3, 4, 5, 6, 8. 93 - Gio. 23/11/00 Ricordiamo che, data una funzione reale f definita in un aperto U di R2 e dato un sottoinsieme X di U , un punto p ∈ X si dice estremante per f in X se è di massimo o di minimo relativo per la restrizione di f ad X. Ricordiamo anche che (per il Teorema di Fermat in R2 ) se X = U ed f è C 1 , allora una condizione necessaria affinché un punto p ∈ X sia estremante è che sia critico per f (sia nullo, cioè, il gradiente di f in p). Il problema della ricerca dei punti estremanti di una funzione reale f in un aperto U di R2 (o, più in generale, di Rk ) si dice un problema di massimi e minimi (o estremi) liberi per distinguerlo da quello che consiste nella ricerca dei punti estremanti della restrizione di f ad un assegnato sottoinsieme X di U (come, ad esempio, un quadrato in R2 ). Se, in particolare, l’insieme in cui si cercano i punti estremanti è una curva di livello regolare g −1 (0) ⊂ U , allora il problema si dice di massimi e minimi (o estremi) condizionati (o vincolati) e g −1 (0) si dice il vincolo. Una condizione necessaria affinché un punto sia estremante per un problema di estremi vincolati è data dal seguente risultato: Teorema. Siano f, g: U → R due funzioni di classe C 1 su un aperto U di R2 . Supponiamo che l’insieme g −1 (0) = {(x, y) ∈ U : g(x, y) = 0} sia una curva di livello regolare (ossia, ∇g(p) 6= 0 per ogni p tale g(p) = 0). Allora, se p0 ∈ g −1 (0) è un punto estremante per f in g −1 (0), esiste un λ0 ∈ R per il quale si ha ∇f (p0 ) = λ0 ∇g(p0 ). Esempi ed esercizi relativi ai problemi di massimi e minimi condizionati. 94 - Gio. 26/2/01 Definizione. Un sottoinsieme S di R3 si dice una superficie implicita regolare (o superficie 109 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi di livello regolare) se è il luogo degli zeri di una funzione g(x, y, z), di classe C 1 su un aperto di R3 , ed è verificata la condizione ∇g(p) 6= 0 in ogni punto di p ∈ S (ossia, se in ogni punto di S almeno una delle tre derivate parziali di g è non nulla). Definizione. Sia S una superficie di livello regolare definita dall’equazione g(x, y, z) = 0 . Un vettore v si dice tangente ad S in p0 se verifica la condizione v · ∇g(p0 ) = 0 (ossia, se è ortogonale al gradiente di g in p0 , che, ricordiamo, è non nullo). Si potrebbe dimostrare che un vettore v ∈ R3 è tangente ad una superficie di livello regolare g −1 (0) in un punto p se e solo se è tangente in p ad una curva parametrica di classe C 1 con sostegno in g −1 (0). Si osservi, ad esempio, che il vettore nullo è tangente alla curva costante γ definita da γ(t) = p per ogni t ∈ [a, b]. Analogamente a quanto visto per le funzioni di due variabili, anche il problema della ricerca dei punti estremanti della restrizione di una funzione f (x, y, z) ad una superficie di livello regolare si chiama problema di massimi e minimi vincolati (o condizionati). Il seguente risultato fornisce una condizione necessaria affinché un punto sia estremante per un problema di massimi e minimi vincolati in R3 : Teorema. Siano f, g: U → R due funzioni di classe C 1 su un aperto U di R3 . Supponiamo che l’insieme g −1 (0) = {(x, y, z) ∈ U : g(x, y, z) = 0} sia una superficie di livello regolare (ossia, ∇g(p) 6= 0 per ogni p tale g(p) = 0). Allora, se p0 ∈ g −1 (0) è un punto estremante per f in g −1 (0), esiste un λ0 ∈ R per il quale si ha ∇f (p0 ) = λ0 ∇g(p0 ). Il suddetto teorema ci dice che per trovare gli eventuali punti estremanti di f in g −1 (0) si deve risolvere un sistema di quattro equazioni nelle quattro incognite x, y, z e λ. Le prime tre equazioni vengono fuori dall’uguaglianza (vettoriale) ∇f (p) = λ∇g(p) e la quarta rappresenta l’equazione del vincolo: g(p) = 0 (ovviamente p denota (x, y, z)). Se (p0 , λ0 ) è una soluzione del sistema, allora il punto p0 (che ovviamente sta sul vincolo) potrebbe essere estremante, ma non è detto che lo sia (va solo preso in considerazione tra i possibili “sospetti”). Per decidere se p0 è in effetti un punto estremante (e, nel caso, se è di minimo o di massimo) può essere di aiuto il Primo Teorema di Weierstrass (quando il vincolo è compatto). Talvolta si può far ricorso anche a considerazioni di natura fisica (quando il problema nasce dalla Fisica) o di natura geometrica (quando nasce dalla Geometria). Un metodo pratico per trovare i possibili punti estremanti di f in g −1 (0) è il cosiddetto metodo dei moltiplicatori di Lagrange. In questo caso, tuttavia, essendo il vincolo 110 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi definito da una sola equazione scalare, si dovrebbe dire “metodo del moltiplicatore di Lagrange” (λ è il moltiplicatore). Il metodo consiste nella ricerca dei punti critici della funzione ausiliaria F (x, y, z, λ) := f (x, y, z) − λg(x, y, z) . Uguagliando a zero le quattro derivate di F si ottiene infatti il sistema ∂F/∂x (x, y, z, λ) = 0 ∂F/∂y (x, y, z, λ) = 0 ∂F/∂z (x, y, z, λ) = 0 ∂F/∂λ (x, y, z, λ) = 0 , le cui prime tre equazioni scalari equivalgono all’equazione vettoriale ∇f (p) = λ∇g(p), e l’ultima costituisce l’equazione del vincolo. In un certo senso, col metodo di Lagrange, il problema della ricerca degli estremi vincolati in tre dimensioni viene trattato come se fosse un problema di estremi liberi in quattro dimensioni: si cercano i punti critici della funzione ausiliaria F , e questi corrispondono (considerando solo le prime tre coordinate) agli unici possibili candidati ad essere estremanti per f in g −1 (0) (tutti gli altri non sono estremanti). Ovviamente, il metodo dei moltiplicatori di Lagrange si applica anche ai problemi di estremi condizionati in R2 , e la funzione ausiliaria sarà F (x, y, λ) := f (x, y) − λg(x, y) . In R3 il vincolo può essere dato anche da due equazioni del tipo g1 (x, y, z) = 0 e g2 (x, y, z) = 0 , che in questo caso rappresenta una curva (si pensi, ad esempio, all’intersezione di una superficie sferica con un piano). Quest’anno non tratteremo problemi con vincoli definiti da più di un’equazione. Ci limitiamo a dire che i possibili punti estremanti della restrizione al vincolo di una funzione f corrispondono (tramite le prime tre coordinate) ai punti critici della seguente funzione di cinque variabili: F (x, y, z, λ1 , λ2 ) := f (x, y, z) − λ1 g1 (x, y, z) − λ2 g2 (x, y, z) , dove λ1 e λ2 sono i cosiddetti moltiplicatori di Lagrange (e questa volta il plurale è appropriato). Esempi ed esercizi relativi ai problemi di estremi condizionati. 111 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 95 - Ven. 24/11/00 Teorema di Lagrange in due variabili. Sia f : U → R una funzione di classe C 1 in un aperto U di R2 e siano p e q due punti di U tali che il segmento L di estremi p e q sia contenuto in U . Allora esiste un punto c ∈ L tale che f (q) − f (p) = ∇f (c) · (q − p) . Dimostrazione. Consideriamo la funzione composta ϕ: [0, 1] → R definita da ϕ(t) = f (γ(t)), dove γ(t) = p + t(q − p) per t ∈ [0, 1]. Chiaramente ϕ è ben definita perché al variare di t in [0, 1] il punto γ(t) “percorre” il segmento L che, per ipotesi, sta in U (incidentalmente si fa notare che γ(t) non è altro che una parametrizzazione della curva sostegno L). Osserviamo che l’incremento f (q)−f (p) della funzione di due variabili f coincide con l’incremento ϕ(1)−ϕ(0) della ϕ, la quale soddisfa (in [0, 1]) le ipotesi del Teorema di Lagrange, essendo composizione di funzioni C 1 . Esiste quindi un numero θ ∈ (0, 1) tale che ϕ(1) − ϕ(0) = ϕ0 (θ). Dal teorema della derivata di una funzione composta segue ϕ0 (t) = ∇f (γ(t)) · γ 0 (t) = ∇f (p + t(q − p)) · (q − p) , e pertanto f (q) − f (p) = ϕ0 (θ) = ∇f (p + θ(q − p)) · (q − p) = ∇f (c) · (q − p) , ove si è posto c = p + θ(q − p). Definizione. Sia f : A → R una funzione reale definita su un aperto A di R2 e sia p0 = (x0 , y0 ) un punto di A. Supponiamo che esistano ∂f /∂x(p0 ) e ∂f /∂y(p0 ). Diremo che f è differenziabile in p0 se f (x, y) − f (x0 , y0 ) − ∂f ∂x (p0 )(x − x0 ) − p lim (x,y)→(x0 ,y0 ) (x − x0 )2 + (y − y0 )2 ∂f ∂y (p0 )(y − y0 ) =0 o, equivalentemente, f (x0 + h, y0 + k) − f (x0 , y0 ) − √ (h,k)→(0,0) h2 + k 2 lim ∂f ∂x (p0 )h − ∂f ∂y (p0 )k = 0. Perciò, se f è differenziabile in p0 , si ha f (x0 + h, y0 + k) = f (x0 , y0 ) + con ²(h, k) continua e nulla in (0, 0) e ρ = in p0 , allora è anche continua (in p0 ). √ ∂f ∂f (p0 )h + (p0 )k + ²(h, k)ρ , ∂x ∂y h2 + k 2 ; e ciò mostra che se f è differenziabile 112 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Usando le notazioni vettoriali si può affermare che f è differenziabile in p0 se vale l’uguaglianza f (p0 + v) = f (p0 ) + ∇f (p0 ) · v + ²(v)kvk , dove ²(v) è una funzione continua e nulla nel punto v = 0. Se f è differenziabile in p0 , il polinomio omogeneo di primo grado df (p0 )(h, k) = ∂f ∂f (p0 )h + (p0 )k ∂x ∂y si chiama il differenziale (o incremento virtuale) della funzione f calcolato in p0 e applicato al vettore incremento v = (h, k). In un certo senso, il differenziale di f calcolato in p0 e applicato a v = (h, k) approssima l’incremento vero ∆f (p0 )(h, k) = f (x0 + h, y0 + k) − f (x0 , y0 ) di f in modo tale che la differenza tra i due valori (vero e virtuale) è tanto più trascurabile quanto più piccolo è l’incremento v (cioè tende a zero più velocemente della norma di v). Geometricamente l’equazione z = f (x0 , y0 ) + ∂f ∂f (p0 )(x − x0 ) + (p0 )(y − y0 ) ∂x ∂x rappresenta un piano passante per il punto (x0 , y0 , f (x0 , y0 )) del grafico di f , chiamato piano tangente al grafico di f in (x0 , y0 , f (x0 , y0 )). Tra tutti i piani di R3 , il piano tangente è quello il cui grafico “meglio approssima” il grafico di f in un intorno di (x0 , y0 , f (x0 , y0 )). Analogamente al caso delle funzioni di due variabili, si può (se ci è gradito) dire che una funzione reale di una variabile reale f definita in un aperto A di R è differenziabile in un punto x0 ∈ A se è derivabile e se lim x→x0 f (x) − f (x0 ) − f 0 (x0 )(x − x0 ) = 0, x − x0 ma ciò non serve a molto, perché dalla definizione di derivata segue subito che una funzione è derivabile se e solo se è differenziabile (e non c’è un gran vantaggio ad usare due nomi per uno stesso concetto). In due variabili non è più vero che l’esistenza delle derivate parziali implichi la differenziabilità. Per convincersene, basta ricordarsi che in R2 esistono funzioni derivabili (addirittura in ogni punto) ma non continue. Tali funzioni, nei punti di discontinuità, non possono certo essere differenziabili, visto che la differenziabilità implica la continuità. Ci si può chiedere se la continuità e la derivabilità, insieme, implichino la differenziabilità. Anche in questo caso la risposta è negativa, come mostra il seguente 113 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi p Esempio. La funzione f (x, y) = |xy| è chiaramente continua, essendo composizione di funzioni continue. Poiché la restrizione di f sia all’asse x che all’asse y è la funzione nulla, le derivate parziali ∂f /∂x(0, 0) e ∂f /∂y(0, 0) esistono e valgono zero. D’altra parte, p |xy| p lim 2 (x,y)→(0,0) x + y2 non esiste, come si verifica immediatamente considerando i limiti direzionali. Perciò f non è differenziabile in (0, 0). 96 - Ven. 24/11/00 Osserviamo esplicitamente che è il concetto di differenziabilità (e non di derivabilità) quello che estende a più variabili la nozione di derivabilità in modo che si possano ancora dedurre importanti proprietà come, ad esempio, la continuità. Infatti, come mostrato in precedenza con un esempio, a differenza di quanto accade in una variabile, per funzioni di più variabili la derivabilità non implica la continuità. Sia f : U → R una funzione reale definita su un aperto U di R2 e sia p0 = (x0 , y0 ) un punto di U . Fissiamo una qualunque direzione v = (h, k) ∈ R2 e consideriamo la restrizione di f alla retta passante per p0 e avente la direzione v, cioè la funzione di una variabile reale t 7→ ϕ(t) data da ϕ(t) = f (p0 + tv) = f (x0 + th, y0 + tk). Se ϕ è derivabile in t = 0, diremo che f è derivabile in p0 nella direzione v, e il numero ϕ0 (0), detto derivata direzionale di f in p0 nella direzione v, si denota col simbolo ∂f (p0 ) . ∂v Il suo significato risulta chiaro dalla definizione stessa: misura il tasso di crescita di f in p muovendosi nella direzione v. Osserviamo che le derivate parziali rispetto ad x e ad y non sono altro che le derivate direzionali nelle direzioni (1, 0) e (0, 1) rispettivamente. Teorema. Sia f : U → R una funzione reale definita su un aperto U di R2 . Se f è differenziabile in p0 ∈ U , allora è derivabile in p0 in ogni direzione e si ha ∂f (p0 ) = ∇f (p0 ) · v . ∂v Osserviamo che, in base al suddetto teorema, la derivata direzionale è massima quando il vettore v punta nella direzione del gradiente. In altre parole, facendo variare v tra i vettori di norma uno, il massimo di ∂f /∂v(p0 ) si ottiene quando l’angolo θ tra ∇f (p0 ) e v è nullo (cioè cos θ = 1). Ciò mostra che il gradiente è il vettore che indica la direzione 114 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi di massima crescenza della funzione f (partendo da p0 ) e il suo modulo misura il tasso di crescita in tale direzione. Dal Teorema di Lagrange per funzioni di due variabili segue il seguente risultato: Teorema. Sia f : U → R una funzione reale definita su un aperto U di R2 . Se f è di classe C 1 , allora è differenziabile in ogni punto in p ∈ U . 97 - Lun. 27/11/00 Richiami sulle serie numeriche. Esercizio. Provare che se due serie differiscono per un numero finito di termini, allora hanno lo stesso carattere (entrambe convergenti, divergenti o indeterminate). Talvolta non ha interesse calcolare esplicitamente la somma di una serie, ma stabilirne soltanto il carattere. Successivamente, dopo aver provato che una serie converge, la sua somma (se interessa) potrà essere stimata con metodi numerici mediante l’ausilio di un elaboratore elettronico (o di una calcolatrice scientifica). Quando di una serie interessa soltanto il carattere, in base all’esercizio precedente, non ha importanza da quale indice P P inizia la somma. In tal caso potremo scrivere n an al posto di ∞ n=n0 an . P Esercizio. Sia ∞ n=n0 an una serie convergente e sia c ∈ R. Provare che Esercizio. Siano P∞ n=n0 ∞ X can = c n=n0 an e P∞ ∞ X n=n0 bn an . n=n0 due serie convergenti. Provare che (an + bn ) = n=n0 ∞ X ∞ X an + n=n0 ∞ X bn . n=n0 Osservazione. Se una serie è a termini positivi (o anche negativi), allora la successione delle sue somme parziali è monotona e quindi (per il teorema del limite delle successioni monotone) non può essere indeterminata. Di conseguenza, la somma della serie risulta ben definita nei reali estesi. La stessa cosa vale, ovviamente, anche se la serie è a termini definitivamente positivi (o negativi). 98 - Lun. 27/11/00 P P∞ Criterio del confronto. Siano ∞ n=n0 an e n=n0 bn due serie a termini non negativi. Supponiamo an ≤ bn per n ≥ n0 . Allora, nei reali estesi, si ha ∞ X n=n0 an ≤ ∞ X bn . n=n0 115 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi P∞ In particolare, se converge la serie n=n0 bn (detta maggiorante), converge anche (la P∞ minorante) n=n0 an (e se diverge la minorante, diverge anche la maggiorante). Dimostrazione. Poiché le due serie sono a termini non negativi, le successioni delle somme parziali n n X X Sn = a k e Tn = bk k=n0 k=n0 risultano crescenti e, conseguentemente, per entrambe esiste (finito o infinito) il limite per n → +∞. Dall’ipotesi “ an ≤ bn per n ≥ n0 ” si ottiene Sn ≤ Tn per ogni n ≥ n0 , e la tesi segue immediatamente dal teorema del confronto dei limiti. Osservazione. Se, nel criterio del confronto, la disuguaglianza an ≤ bn vale soltanto definitivamente, si può ancora affermare che la convergenza della serie maggiorante implica la convergenza della minorante e, di conseguenza, la divergenza della minorante implica la divergenza della maggiorante. In questo caso, tuttavia, non è più detto che si abbia P∞ P∞ n=n0 bn . n=n0 an ≤ P P Criterio di convergenza assoluta. Se converge ∞ |an |, converge anche ∞ n=n n=n0 an 0 P∞ (in questo caso si dice che la serie n=n0 an converge assolutamente) e vale la disuguaglianza ¯ ¯ ∞ ∞ ¯X ¯ X ¯ ¯ an ¯ ≤ |an | . ¯ ¯ ¯ n=n n=n0 0 − Dimostrazione. Definiamo due successioni {a+ n } e {an } nel seguente modo: a+ n = |an | + an = max{an , 0} , 2 a− n = |an | − an = max{−an , 0} , 2 e osserviamo che − an = a+ n − an , − |an | = a+ n + an , 0 ≤ a+ n ≤ |an |, 0 ≤ a− n ≤ |an |. Poiché la serie degli |an | è convergente, per il criterio del confronto convergono anche le − serie degli a+ n e degli an . Pertanto, dal teorema del limite della somma, si ottiene ∞ X n=n0 an = ∞ X n=n0 a+ n − ∞ X a− n , n=n0 e ciò prova la convergenza della serie in esame. P P Criterio del confronto asintotico. Siano n an e n bn due serie a termini definitiP P vamente positivi. Allora, se an /bn → λ < +∞ e n bn converge, anche n an converge. In particolare, se il limite λ, oltre ad essere finito, è anche maggiore di zero, le due serie hanno lo stesso carattere. 116 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Dimostrazione. Per il teorema della permanenza del segno esiste un n̄ tale che an /bn < λ+1 per n ≥ n̄. Si può supporre (eventualmente scegliendo un n̄ più grande) che i termini an e bn siano positivi per n ≥ n̄. Di conseguenza an ≤ (λ + 1)bn per n ≥ n̄, e da ciò segue, per il criterio del confronto, che se converge la serie dei bn , converge anche la serie degli an . Supponiamo ora che il limite λ (oltre che finito) sia positivo. Allora bn /an → 1/λ < +∞; pertanto, per quanto appena provato, se converge la serie degli an , converge anche la serie dei bn , e le serie hanno dunque lo stesso carattere. Facciamo notare che il criterio del confronto asintotico può anche essere usato come criterio di divergenza (sempre nell’ipotesi che le serie in esame siano a termini definitivamente positivi). Supponiamo infatti che an /bn → λ < +∞ e che la serie degli an sia divergente. Allora la serie dei bn non può convergere, perché altrimenti convergerebbe anche la serie degli an e, di conseguenza (essendo a termini definitivamente positivi) deve necessariamente divergere (a +∞). Esercizi sulle serie numeriche. 99 - Mar. 28/11/00 Criterio integrale. decrescente. Allora Sia n0 ∈ Z e sia f : [n0 , +∞) → R una funzione positiva e ∞ X f (n) e n=n0 Z +∞ f (x)dx n0 hanno lo stesso carattere. Più precisamente si ha Z +∞ Z ∞ X f (x)dx ≤ f (n) ≤ n0 +1 n=n0 +1 +∞ f (x)dx . n0 Corollario (del criterio integrale). La serie ∞ X 1 , nα n=1 detta serie armonica generalizzata, converge se e solo se α > 1. Esercizio. Mediante un elaboratore elettronico (o una calcolatrice scientifica) valutare, P 3 con un errore inferiore a 10−5 , la somma S della serie ∞ n=1 1/n . Suggerimento. Usare la disuguaglianza del criterio integrale per stimare il resto Rn̄ = P∞ 3 S − Sn̄ = n=n̄+1 1/n della serie. Determinare (anche a tentativi) n̄ in modo che la stima approssimata R̄n̄ di Rn̄ differisca da Rn̄ meno di 10−5 . Calcolare la somma finita P Sn̄ = n̄n=1 1/n3 (mediante un computer) e aggiungere R̄n̄ a Sn̄ . Esercizi sulle serie numeriche. 117 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 100 - Mar. 28/11/00 Esercizi sulle serie numeriche. 101 - Mer. 29/11/00 Criterio del rapporto. Sia (nei reali estesi) il P n an una serie a termini positivi. Supponiamo che esista an+1 = λ. n→+∞ an Se λ < 1, la serie converge; se λ > 1, la serie diverge. lim Dimostrazione. Supponiamo prima λ < 1 e fissiamo un numero q ∈ (λ, 1). Dal teorema della permanenza del segno si ha an+1 /an < q definitivamente. Poiché il carattere di una serie numerica non muta se si altera un numero finito di termini, si può assumere, per semplicità, che la disuguaglianza an+1 /an < q valga per ogni n ≥ 0. Ne segue a1 < a0 q, a2 < a1 q < a0 q 2 , ... In generale si ha an < a0 q n , ∀n ∈ N, come si può facilmente verificare per induzione. P La serie a termini positivi ∞ n=0 an è quindi maggiorata, termine a termine, dalla serie P∞ n geometrica n=0 a0 q , che è convergente. Dunque, per il criterio del confronto, converge anche la serie in esame. Supponiamo ora an+1 /an → λ > 1. In questo caso la successione {an } risulta definitivamente crescente e, di conseguenza, il suo limite non può essere zero perché coincide con il sup an , che è necessariamente positivo. Non essendo verificata la condizione necessaria per la convergenza, la serie (essendo a termini positivi) diverge a +∞. Esempio. Consideriamo la serie ∞ X an n=0 n! , dove a è un numero positivo assegnato. Il suo termine n-esimo è an /n!, quindi an+1 n! a an+1 = = −→ 0 . n an (n + 1)! a n+1 In base criterio del rapporto possiamo dunque concludere che la serie è convergente. p P Criterio della radice. Sia n an una serie numerica e sia λ = lim n |an |. Se λ < 1 la serie converge (assolutamente), se λ > 1 non converge. In altre parole, λ < 1 è condizione sufficiente per la convergenza della serie, mentre λ ≤ 1 è condizione necessaria. Dimostrazione. Mostriamo prima che se λ > 1 la serie non può convergere. In questo caso, infatti, il termine generale non può tendere a zero, perché se cosı̀ fosse la successione {|an |} 118 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi sarebbe definitivamente minore di 1 e, di conseguenza, sarebbe definitivamente minore di p 1 anche { n |an |}. Ciò non è possibile perché l’estremo inferiore dei maggioranti definitivi p di { n |an |} è λ > 1. Supponiamo ora λ < 1 e fissiamo un numero q ∈ (λ, 1). Dalla definizione di massimo limite p segue n |an | < q definitivamente, e quindi anche |an | < q n definitivamente. Pertanto, per P il criterio del confronto, la serie n |an | converge e, di conseguenza, per il criterio della convergenza assoluta, converge anche la serie in esame. Esempio. Consideriamo la serie ∞ X (−1)n 2n n=1 Si ha p n |an | = r n 2n = n 3 − 2n s n 3n (1 3n − 2n . 2 2 2n = (1 − (2/3)n )−1/n −→ . n − (2/3) ) 3 3 Quindi, in base al criterio della radice, la serie converge. Esempio. Studiamo il carattere della serie ∞ X n=1 xn , (3 + (−1)n )n in funzione del parametro x ∈ R. Si ha s p |x|n |x| n . = |an | = n (3 + (−1)n )n 3 + (−1)n La successione ½ |x| 3 + (−1)n ¾ non ammette limite per n → +∞, ma il suo massimo limite è |x|/2. Dunque (per il criterio della radice) la serie converge se |x| < 2 e non converge se |x| > 2. Il criterio non dà informazioni nei punti x = ±2, che vanno quindi analizzati a parte. In tali punti, tuttavia, il valore assoluto del termine generale assume infinite volte il valore uno, e non è quindi soddisfatta la condizione necessaria per la convergenza. Possiamo dunque concludere che la serie in esame converge se e solo se x ∈ (−2, 2). 102 - Mer. 29/11/00 Esercizi sulle serie numeriche. Esercizi sulle serie numeriche dipendenti da un parametro x ∈ R. 119 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 103 - Gio. 30/11/00 P Una serie ∞ n=n0 an si dice a segni alterni se an an+1 < 0 per ogni n ≥ n0 (ossia, se i termini della serie sono alternativamente positivi e negativi). P Criterio di Leibniz. Sia ∞ n=n0 an una serie a segni alterni. Se la successione {|an |} è decrescente ed è infinitesima, allora la serie è convergente. Inoltre, denotata con S la sua somma e con Sn la sua somma parziale n-esima, risulta Sn > S, se l’ultimo termine di Sn è positivo, e Sn < S se è negativo. Di conseguenza |S − Sn | < |an+1 |, ∀n ∈ N; ossia l’errore che si commette nella valutazione di S arrestandosi alla somma parziale n-esima è inferiore, in valore assoluto, al valore assoluto del primo termine trascurato. Una serie del tipo ∞ X fn (x) , n=n0 dove le fn sono funzioni reali di variabile reale, è detta serie di funzioni (reali di variabile reale). Si dice che la serie è definita in un insieme A ⊂ R se il domino di tutte le funzioni contiene A (ossia, se sono tutte definite per ogni x ∈ A). Ovviamente, la suddetta serie può essere pensata anche come una serie numerica dipendente da un parametro x ∈ A e, fissato x ∈ A, la serie numerica cosı̀ ottenuta può essere o non essere convergente. L’insieme dei numeri x per cui la serie converge si dice insieme di convergenza. Ad esempio, l’insieme di convergenza della serie ∞ X xn n=0 è l’intervallo (−1, 1), visto che si tratta di una serie geometrica di ragione x ∈ R. Esercizi sulle serie numeriche e sulle serie di funzioni. 104 - Gio. 30/11/00 Una serie di funzioni del tipo ∞ X n=0 an (x − x0 )n , dove x0 e gli an sono numeri reali assegnati, si dice una serie di potenze in campo reale. Il punto x0 si chiama centro della serie. Esercizi sullo studio dell’insieme di convergenza di alcune serie di funzioni e, in particolare, di alcune serie di potenze. 120 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 105 - Ven. 1/12/00 Se una serie di funzioni ottiene un numero P∞ n=n0 fn (x) converge in un insieme A, allora per ogni x ∈ A si f (x) = ∞ X fn (x) . n=n0 Risulta cosı̀ definita una funzione reale di variabile reale f : A → R. È naturale porsi la domanda se una tale funzione sia continua quando sono continue tutte le fn . In altre parole: è ancora vero che la somma di funzioni continue è una funzione continua nel caso di infiniti addendi? La risposta, purtroppo, è negativa, come dimostra il seguente Esempio. Consideriamo, nell’intervallo [0, 1], la serie di funzioni ∞ X n=1 (1 − x)xn . Per x ∈ [0, 1) la serie è geometrica di ragione x e primo termine (1−x)x; pertanto converge e la sua somma è data da (1 − x)x = x. 1−x Per x = 1 tutte le funzioni fn (x) = (1 − x)x sono nulle e, di conseguenza, la serie converge anche in tale punto ed ha somma zero. Si può concludere che la serie converge in tutto l’intervallo chiuso [0, 1] e la sua somma ½ x se x ∈ [0, 1) f (x) = 0 se x = 1 è discontinua, sebbene tutte le fn siano continue (sono addirittura C ∞ ). Ricordiamo che una funzione f (x) si dice dominata da una costante c [da una funzione ϕ(x) ] in A se |f (x)| ≤ c [ |f (x)| ≤ ϕ(x) ] per ogni x ∈ A. P Definizione. Si dice che una serie di funzioni ∞ n=n0 fn (x) converge totalmente in un insieme A ⊂ R se è dominata, termine a termine, da una serie numerica convergente; P ossia, se esiste una serie numerica convergente ∞ n=n0 cn tale che |fn (x)| ≤ cn , ∀n ≥ n0 e ∀x ∈ A. P Si fa notare che se una serie di funzioni ∞ n=n0 fn (x) converge totalmente in un insieme A, allora (come conseguenza dei criteri di convergenza assoluta e del confronto) converge (assolutamente) per ogni x ∈ A. Risulta quindi ben definita la funzione somma f (x) = ∞ X fn (x) . n=n0 121 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Osserviamo inoltre che la più piccola serie numerica che domina cui termine generale λn è dato da P∞ n=n0 fn (x) è quella il λn = sup{|fn (x)| : x ∈ A}. Pertanto, se tale serie numerica converge, allora la serie di funzioni converge totalmente. P In caso contrario, ossia se ∞ n=n0 λn = +∞, per il criterio del confronto nessuna serie numerica che domina la serie di funzioni può convergere. Possiamo quindi enunciare il seguente Teorema. Condizione necessaria e sufficiente affinché una serie di funzioni ∞ X fn (x) n=n0 converga totalmente in un insieme A è che sia convergente la serie numerica ∞ X λn , n=n0 dove λn = sup{|fn (x)| : x ∈ A}. Esempi ed esercizi. 106 - Ven. 1/12/00 L’importanza della convergenza totale è giustificata dai due seguenti risultati (di continuità e di derivabilità). Teorema (di continuità per le serie di funzioni). Se una serie di funzioni continue, P∞ n=n0 fn (x), converge totalmente in un insieme A, allora la funzione somma f (x) := P∞ n=n0 fn (x) risulta continua. Teorema (di derivabilità per le serie di funzioni). Se una serie di funzioni di classe C 1 , P∞ P 0 serie delle derivate, ∞ n=n0 fn (x), converge in un insieme A e la n=n0 fn (x), converge P∞ totalmente in A, allora la funzione f (x) := n=n0 fn (x) risulta derivabile e si ha f 0 (x) = P∞ 0 n=n0 fn (x). Teorema. L’insieme di convergenza di una serie di potenze in campo reale è un intervallo non vuoto, detto intervallo di convergenza, i cui estremi sono equidistanti dal centro della serie. P∞ n Dimostrazione. Sia n=0 an (x − x0 ) una serie di potenze. Fissiamo un x ∈ R e applichiamo il criterio della radice alla serie numerica corrispondente. Si ha p p p lim n |an (x − x0 )n | = lim n |an ||x − x0 |n = lim |x − x0 | n |an | . 122 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Ovviamente, se x = x0 la serie converge (e la sua somma vale a0 ). Si può quindi supporre x 6= x0 , evitando cosı̀ la forma indeterminata 0 · ∞ nel suddetto limite. Ne segue (nei reali estesi) p p lim |x − x0 | n |an | = |x − x0 | lim n |an | . p Dunque, posto λ = lim n |an | ∈ R, la serie converge nel punto x se |x − x0 |λ < 1 e non converge se (nei reali estesi) risulta |x − x0 |λ > 1. Di conseguenza, posto (nei reali estesi) r = 1/λ, si può concludere che la serie converge in tutti i punti interni all’intervallo [x0 − r, x0 + r] e non converge nei punti esterni (ossia, interni al complementare). L’incertezza, quando 0 < r < +∞, si riduce ai soli punti di frontiera x0 − r e x0 + r (in quei casi, infatti, p il lim n |an (x − x0 )n | = 1, e il criterio della radice non dà informazioni). In ogni caso, l’insieme di convergenza è un intervallo (aperto, chiuso o semiaperto) e x0 è equidistante dagli estremi (finiti o infiniti che siano). Definizione. La semiampiezza dell’intervallo di convergenza di una serie di potenze si chiama raggio di convergenza della serie. Osservazione. Dalla dimostrazione del teorema precedente si deduce facilmente che il P n raggio di convergenza r di una serie di potenze ∞ n=0 an (x − x0 ) è dato dalla seguente formula (da interpretare nei reali estesi): r= lim 1 p n |an | . Avvertenza. La suddetta formula, per quanto utile dal punto di vista teorico, può facilmente condurre a valutazioni errate sul piano pratico (soprattutto per la difficoltà di determinare l’espressione generale del coefficiente an ). Se ne sconsiglia pertanto l’uso negli esercizi da parte degli studenti. Il modo più sicuro per determinare l’insieme di convergenza di una serie di potenze (o, più in generale, di funzioni) è quello di trattarla come una serie numerica dipendente da un parametro x. Esempio. Determiniamo il raggio di convergenza della serie di potenze ∞ X x2n . 2n n=0 (Primo metodo) Fissiamo x ∈ R e applichiamo il criterio della radice alla serie numerica P 2n n n x /2 . Si ha p p lim n |x2n /2n | = lim n |x|2n /2n = x2 /2. √ √ Pertanto la serie converge per |x| < 2 e non converge per |x| > 2. L’incertezza dovuta √ al criterio della radice si riduce a due soli punti: x = ± 2 e, conseguentemente, il raggio di √ convergenza r è 2. Talvolta lo studio negli estremi dell’intervallo presenta delle notevoli 123 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi √ difficoltà, ma non in questo caso. Si osservi infatti che per x = ± 2 il termine generale non tende a zero, e quindi la serie non può convergere. p (Metodo errato) Si ha an = 1/2n . Quindi lim n |an | = 1/2 e, di conseguenza, r = 2. (Secondo metodo) Determiniamo l’espressione generale del coefficiente an della serie ∞ X an xn = ∞ X x2n . 2n n=0 n=0 Sviluppando la sommatoria si ottiene a0 + a1 x + a2 x2 + a3 x3 + a4 x4 + · · · = 1 + x2 /2 + x4 /22 + · · · Quindi a0 = 1, a1 = 0, a2 = 1/2, a3 = 0, a4 = 1/22 , . . . In generale si ha ½ −n/2 2 se n è pari an = 0 se n è dispari o np In questo caso il limite della successione n |an | non esiste; tuttavia, il limite superiore √ √ (che esiste sempre) vale 1/ 2. Da cui segue r = 2. Da ora in poi, tra i metodi illustrati per il calcolo del raggio di convergenza, lo studente è libero di seguire quello che gli è più congeniale (o meno sgradito), purché non sia il metodo errato. Esercizi consigliati [Spiegel, cap. 11]: 1, 2, 3, 6, 7, 11, 12, 13, 16, 17, 19, 21, 22, 25. 107 - Lun. 4/12/00 Lemma (della convergenza totale per le serie di potenze). Una serie di potenze ∞ X n=0 an (x − x0 )n converge totalmente in ogni intervallo concentrico con quello di convergenza e di raggio inferiore. Ossia, la serie converge totalmente in ogni intervallo [x0 − ρ, x0 + ρ], con 0 < ρ < r; dove x0 è il centro della serie e r il raggio di convergenza. Dimostrazione. Basta osservare che se |x − x0 | ≤ ρ, si ha |an (x − x0 )n | = |an ||x − x0 |n ≤ |an |ρn e che la serie numerica ∞ X n=n0 |an |ρn 124 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi è convergente, essendo lim p n p |an |ρn = lim ρ n |an | = ρ/r < 1 . Osservazione. Una funzione definita come serie di potenze è continua in ogni punto interno all’intervallo aperto di convergenza (detto dominio di convergenza). Infatti, se x̄ è un qualunque punto interno a tale intervallo, denotato con x0 il centro della serie e con r il suo raggio di convergenza, esiste un intervallo (x0 − ρ, x0 + ρ), con 0 < ρ < r, contenente x̄. Questo implica che la funzione somma è continua nell’intervallo di centro x0 e raggio ρ, essendo la serie totalmente convergente in tale intervallo. Pertanto, la funzione è continua anche nel punto x̄. Lemma (di invarianza del dominio di convergenza). Una serie di potenze ∞ X n=0 e la serie delle sue derivate ∞ X n=1 an (x − x0 )n nan (x − x0 )n−1 hanno lo stesso raggio di convergenza. Di conseguenza, le due serie hanno lo stesso dominio di convergenza; ossia, (x0 − r, x0 + r). Dimostrazione. Osserviamo che se si fissa x ∈ R, si può pensare a ∞ X n=1 nan (x − x0 )n−1 come ad una serie numerica. Pertanto, se si moltiplica ogni suo termine per il numero x − x0 , il suo carattere non viene alterato. Di conseguenza, la nuova serie, ancora di potenze, avrà lo stesso insieme di convergenza della precedente. È sufficiente quindi provare p che il raggio di convergenza 1/ lim n |nan | di ∞ X n=n0 nan (x − x0 )n coincide con il raggio di convergenza 1/ lim ∞ X n=0 p n |an | di an (x − x0 )n . Si ha infatti lim p n |nan | = lim p p p √ √ n n n |an | = lim n n lim n |an | = lim n |an |. 125 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Teorema (di derivazione delle serie di potenze). Sia f (x) := ∞ X n=0 an (x − x0 )n una funzione definita da una serie di potenze. Allora f è derivabile nel suo dominio di convergenza e si ha ∞ X 0 f (x) = nan (x − x0 )n−1 . n=1 Dimostrazione. Denotiamo con r il raggio di convergenza della prima serie (quella che definisce f ). Fissato un qualunque punto x appartenente al dominio di convergenza (x0 − r, x0 + r) della prima serie, esiste un intervallo (x0 − ρ, x0 + ρ), con 0 < ρ < r, contenente x. Per il lemma precedente, r è anche il raggio di convergenza della serie delle derivate, e quindi, in base al lemma della convergenza totale per le serie di potenze, entrambe le serie convergono totalmente in (x0 − ρ, x0 + ρ). Dal teorema di derivabilità delle serie di funzioni segue che f è derivabile in x e risulta f 0 (x) = ∞ X n=1 nan (x − x0 )n−1 . Esercizio. Trovare una primitiva della funzione f (x) := P∞ n=0 an x n. Suggerimento. Utilizzare il teorema di derivazione delle serie di potenze. Osservazione. Poiché la derivata di una serie di potenze è ancora una serie di potenze, dal teorema precedente segue che le funzioni definite tramite serie di potenze sono di classe C ∞. 108 - Lun. 4/12/00 Osservazione. Sia f (x) := a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + an (x − x0 )n + · · · una funzione definita mediante una serie di potenze. Ponendo x = x0 , si ottiene a0 = f (x0 ). Derivando e ponendo di nuovo x = x0 , si ha a1 = f 0 (x0 ). Analogamente, mediante derivate successive, in generale si ottiene an = f (n) (x0 )/n!. Pertanto, risulta necessariamente ∞ X f (n) (x0 ) (x − x0 )n , f (x) = n! n=0 dove f (0) (x0 ) denota f (x0 ). 126 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Definizione. Una funzione f (x) si dice sviluppabile in serie di potenze in un intorno di un punto x0 (o analitica in x0 ) se esiste un intorno di x0 in cui vale l’uguaglianza f (x) = ∞ X f (n) (x0 ) n=0 n! (x − x0 )n , detta serie di Taylor di f (x) di centro x0 (o di MacLaurin, quando x0 = 0). Si dice che f (x) è analitica se ogni punto del suo dominio ammette un intorno in cui f (x) è sviluppabile in serie di potenze (ossia, se è analitica in ogni punto del suo dominio). Poiché, come abbiamo già osservato, le funzioni definite tramite serie di potenze sono di classe C ∞ , le funzioni analitiche sono necessariamente C ∞ . Quindi, ad esempio, le funzioni valore assoluto di x e parte intera di x non sono analitiche (sono sviluppabili in serie di potenze nell’intorno di “quasi tutti” i punti del dominio, ma non di tutti). Esistono (in campo reale) funzioni di classe C ∞ ma non analitiche. Una di queste è ½ −1/|x| e se x 6= 0 f (x) := 0 se x = 0, le cui derivate successive (come si potrebbe provare) risultano tutte continue e nulle nel punto x0 = 0. Quindi, se f (x) fosse analitica, in un intorno del punto x0 = 0 dovrebbe valere l’uguaglianza ∞ X f (n) (0) n x , f (x) = n! n=0 e ciò è impossibile perché f (x) 6= 0 per x 6= 0, mentre la serie ha per somma zero (essendo nulli tutti i suoi termini). Esempio. Consideriamo la funzione f (x) = x . 1 + x2 Dalla teoria delle serie geometriche sappiamo che, se | − x2 | < 1, f (x) rappresenta la somma di una serie geometrica di ragione −x2 e primo termine x. Per x ∈ (−1, 1) si ha quindi l’uguaglianza x = x − x3 + x5 − x7 + · · · + (−1)n x2n+1 + · · · 1 + x2 e ciò prova che f (x) è sviluppabile in serie di MacLaurin in un intorno del punto x0 = 0. Mostriamo ora che la funzione f (x) = ex è sviluppabile in serie di MacLaurin e che lo sviluppo è addirittura valido per ogni x ∈ R (in un certo senso si può dire che in questo caso l’intorno in cui vale lo sviluppo ha raggio infinito). Fissiamo un punto x ∈ R. 127 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Sappiamo che se ex è effettivamente sviluppabile in serie di MacLaurin, allora si deve necessariamente avere ∞ ∞ X f (n) (0) n X xn x = . ex = n! n! n=0 n=0 Per definizione di serie, ciò equivale ad affermare lim (ex − Pn (x)) = 0 , n→∞ dove la somma parziale n-esima Pn (x) = non è altro che il polinomio di MacLaurin di n X xk k! k=0 ex di ordine n. Ricordiamo che Rn (x) := ex − Pn (x) si chiama resto della formula di MacLaurin di ordine n della funzione ex e può essere scritto nella forma di Lagrange; ovvero Rn (x) = f (n+1) (cn (x)) xn+1 xn+1 = ecn (x) , (n + 1)! (n + 1)! dove il punto cn (x), che ovviamente dipende sia da n sia dal numero x fissato, appartiene al segmento 0x di estremi 0 e x. In ogni caso cn (x) sta nell’intervallo [−|x|, |x|], e quindi, per la crescenza della funzione esponenziale, risulta |Rn (x)| ≤ e|x| |x|n+1 . (n + 1)! Osserviamo ora che |x|n+1 /(n + 1)! → 0 per n → +∞, essendo il termine generale di una serie convergente, come si può facilmente verificare col criterio del rapporto. Poiché x è fissato, Rn (x) → 0 per x → +∞, e la funzione ex è quindi sviluppabile in serie di MacLaurin. Per l’arbitrarietà del punto x, possiamo concludere che lo sviluppo è valido in tutto R. Osservazione. Ponendo x = 1 nello sviluppo in serie di MacLaurin di ex si ottiene la seguente espressione del numero e in serie numerica: e= ∞ X 1 . n! n=0 Mostriamo ora che la funzione ex è analitica. A tale scopo fissiamo x0 ∈ R e poniamo, per comodità, x = x0 + h. Si ha ex = ex0 +h = ex0 eh = ex0 (1 + h + hn h2 + ··· + + · · ·) = 2! n! 128 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi ex0 + ex0 h + ex0 Quindi ex = ex0 + ex0 (x − x0 ) + ex0 h2 hn + · · · + e x0 + ··· 2! n! (x − x0 )n (x − x0 )2 + · · · + ex0 + ··· 2! n! È noto che non solo ex , ma tutte le funzioni esprimibili tramite serie di potenze sono analitiche. Più precisamente, se f (x) := ∞ X n=0 an (x − x0 )n per x ∈ (x0 − r, x0 + r), allora, fissato un punto x̄ ∈ (x0 − r, x0 + r), si ha f (x) = ∞ X f (n) (x̄) n=0 n! (x − x̄)n per ogni x nell’intorno di x̄ di raggio r − |x̄ − x0 |. Esercizio. Provare che le funzioni cos x e sen x sono sviluppabili in serie di MacLaurin. Determinarne lo sviluppo e l’intorno di validità. Suggerimento. esponenziale. Seguire, passo passo, il metodo usato per lo sviluppo della funzione Esercizio. Mostrare che le funzioni sen x e cos x sono analitiche. Suggerimento. Sfruttare le formule di addizione del seno e del coseno. 109 - Mar. 5/12/00 Il metodo usato per sviluppare in serie di MacLaurin le funzioni ex , sen x e cos x (basato su la stima del resto della formula di Taylor) non è adatto per la funzione f (x) = log(1 + x). In questo caso conviene procedere diversamente: – si determina prima lo sviluppo della derivata di f (x); – successivamente, mediante il teorema di derivazione delle serie di potenze, si trova una primitiva dello sviluppo di f 0 (x); – infine, tra tutte le primitive di f 0 (x) espresse in serie di potenze, si sceglie quella che coincide con f (x). Tale metodo è adatto anche per determinare lo sviluppo di arctang x e, in generale, di tutte le funzioni di cui è facile sviluppare la derivata. A tale proposito ricordiamo che due primitive di una stessa funzione (definita in un intervallo) differiscono per una costante e, di conseguenza, se coincidono in un punto, coincidono in tutto l’intervallo di definizione. 129 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Cominciamo col determinare, col metodo appena esposto, lo sviluppo di MacLaurin di log(1 + x). La derivata (1 + x)−1 di log(1 + x) rappresenta, per x ∈ (−1, 1), la somma di una serie geometrica di ragione −x e primo termine 1. Quindi, per x ∈ (−1, 1), si ha (1 + x)−1 = 1 − x + x2 − x3 + · · · + (−1)n xn + · · · Dal teorema di derivazione delle serie di potenze si deduce che g(x) = x − xn+1 x2 x3 x4 + − + · · · + (−1)n + ··· 2 3 4 n+1 è una primitiva di (1 + x)−1 ; ma, è bene precisare, soltanto per x appartenente al comune dominio di convergenza (−1, 1) delle due serie. Dunque, log(1 + x) e g(x) hanno la stessa derivata per x ∈ (−1, 1). Poiché coincidono per x = 0, si può concludere che log(1 + x) = x − xn+1 x2 x3 x4 + − + · · · + (−1)n + ··· 2 3 4 n+1 ∀x ∈ (−1, 1) . Esercizio. Provare che la funzione arctang x è sviluppabile in serie di MacLaurin, determinarne lo sviluppo e l’intervallo di validità. Suggerimento. Sviluppare prima la derivata di arctang x. 2 Esercizio. Provare che la funzione e−x è sviluppabile in serie di MacLaurin, determinarne lo sviluppo e l’intervallo di validità. Suggerimento. Si ricorda che l’uguaglianza ex = 1 + x + xn x2 + ··· + + ··· 2! n! è valida per ogni numero reale x, e quindi, in particolare, è valida per ogni numero reale −x2 . Esercizio. Provare che la funzione degli errori, Z x 2 2 e−t dt , erf x := √ π 0 è sviluppabile in serie di MacLaurin, determinarne lo sviluppo e l’intervallo di validità. Suggerimento. Sviluppare prima la derivata di erf x. Esercizio. Provare che la funzione f (x) := ( sen x x 1 se x 6= 0 se x = 0 130 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi è sviluppabile in serie di MacLaurin, determinarne lo sviluppo e l’intervallo di validità. Dedurre da ciò che f (x) è di classe C ∞ . Suggerimento. Sviluppare prima sen x e, successivamente, ragionare un po’, tenendo conto del significato di serie di potenze. Mostriamo ora che la funzione log x è analitica. Allo scopo fissiamo un punto x0 > 0 (ossia, appartenente al dominio di log x). Ponendo, per semplicità, x = x0 + h, si ottiene log x = log(x0 + h) = log(x0 (1 + Quindi log(x0 + h) = log x0 + h h )) = log x0 + log(1 + ) . x0 x0 h2 hn+1 h − 2 + · · · + (−1)n + ··· x0 2x0 (n + 1)xn+1 0 o, equivalentemente, log x = log x0 + n+1 (x − x0 ) (x − x0 )2 n (x − x0 ) + ··· − + · · · + (−1) x0 2x20 (n + 1)xn+1 0 110 - Mar. 5/12/00 Ricordiamo che una successione in un insieme X è un’applicazione da N ad X. Se X è un sottoinsieme di C, la successione è detta complessa (o di numeri complessi). Una successione {zn } di numeri complessi si dice convergente ad un numero complesso z se |zn − z| → 0; si dice divergente se |zn | → +∞. Se una successione non è né convergente né divergente, allora si dice indeterminata. Si potrebbe dimostrare che una successione {zn } = {an +ibn } di numeri complessi converge ad un numero complesso a = a + ib se e solo se an → a e bn → b. Sia {zn } una successione di numeri complessi. Analogamente a quanto visto per le serie di numeri reali, l’espressione ∞ X zn n=1 si legge “serie (o somma) per n che va da 1 a +∞ di zn ” e rappresenta, in modo sintetico, il n X lim zk . n→+∞ k=1 In altri termini, posto Sn = z1 + z2 + ... + zn , per definizione si ha ∞ X n=1 zn = lim Sn . n→+∞ 131 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi La successione {Sn } si dice successione delle somme parziali (o delle ridotte) della serie, mentre zn è detto il termine generale. Il carattere della serie è, per definizione, il carattere della successione {Sn }. Come nel caso reale, il limite S, quando esiste, si dice somma della serie. Talvolta, invece di sommare a partire da n = 1, si parte da un indice n0 ∈ Z (anche negativo). Scriveremo allora ∞ X zn . n=n0 Una serie dipendente da un parametro z ∈ C del tipo ∞ X n=0 an (z − z0 )n , dove z0 e gli an sono numeri complessi assegnati, si dice una serie di potenze in campo complesso. Il punto z0 si chiama centro della serie. Si potrebbe dimostrare che l’insieme dei punti z ∈ C in cui la serie converge (detto insieme di convergenza) è un cerchio (in senso generalizzato) di centro z0 . Più precisamente, esiste un numero reale esteso r ≥ 0, detto raggio di convergenza della serie, con la proprietà che la serie converge se la distanza |z − z0 | di z dal centro z0 è minore di r e non converge se |z − z0 | > r. Quindi, quando r < +∞, la serie converge nei punti interni al cerchio di centro z0 e raggio r e non converge nei punti esterni, mentre nei punti della circonferenza di equazione |z − z0 | = r la serie può convergere o non convergere. Se, invece, r = +∞, la serie converge in tutto il piano complesso, che può essere pensato come un cerchio di raggio infinito e centro in ogni punto (quindi anche in z0 ). Ricordiamo che la serie xn x2 + ··· + + ··· 2! n! converge per ogni x ∈ R, e la sua somma vale ex . Pertanto, se al posto del numero reale x si sostituisce un numero complesso z, si ottiene una serie in campo complesso, il cui cerchio di convergenza, dovendo contenere l’asse reale, coincide con l’intero piano complesso. Ha senso pertanto estendere la funzione esponenziale al campo complesso nel modo seguente: 1+x+ ez := 1 + z + zn z2 + ··· + + ··· 2! n! Analogamente al caso reale, anche la funzione esponenziale in campo complesso gode della proprietà fondamentale. Si ha infatti ez1 +z2 = ez1 ez2 , ∀ z1 , z2 ∈ C , da cui si deduce il 132 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Teorema (di rappresentazione della funzione esponenziale in campo complesso). Per ogni numero complesso z = x + iy si ha ex+iy = ex (cos y + i sen y) . Ossia, ex+iy è un numero complesso di modulo ex e argomento y. La funzione ez , denotata anche exp z, è un esempio di funzione complessa di variabile complessa; ossia, di una funzione con dominio e codominio in C. Un altro esempio è dato dalla potenza z n o, più in generale, da un polinomio di variabile complessa a coefficienti reali o complessi. Anche le funzioni razionali complesse, ossia le funzioni ottenute mediante il quoziente di polinomi complessi, sono esempi funzioni complesse di variabile complessa. La derivata in un punto z0 ∈ C di una funzione complessa f si definisce in modo del tutto analogo al caso reale: è (quando esiste) il lim z→z0 f (z) − f (z0 ) . z − z0 Proviamo, ad esempio, che la funzione f (z) = z 2 è derivabile in ogni punto. Si ha infatti f 0 (z0 ) = lim z→z0 (z − z0 )(z + z0 ) z 2 − z02 = lim = lim (z + z0 ) = 2z0 . z→z0 z→z0 z − z0 z − z0 Più in generale, se f (z) = z n , si ha f 0 (z0 ) = nz0n−1 . Per provarlo basta ricordarsi che z n − z0n = (z − z0 )(z n−1 + z n−2 z0 + z n−3 z02 + · · · + z0n−1 ) , come, d’altra parte, è facile verificare eseguendo il prodotto. Teorema (di derivazione delle serie di potenze in campo complesso). Sia f (z) := ∞ X n=0 an (z − z0 )n una funzione complessa definita da una serie di potenze. Allora f è derivabile nel cerchio aperto di convergenza e si ha f 0 (z) = ∞ X n=1 nan (z − z0 )n−1 . Esercizio. Dedurre dal precedente teorema che la derivata di ez è ez . 111 - Mer. 6/12/00 Sia g: W → R una funzione continua su un aperto W di R3 . Un’uguaglianza del tipo g(x, y, y 0 ) = 0 133 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi o del tipo g(x, y(x), y 0 (x)) = 0 si chiama equazione differenziale (ordinaria del prim’ordine). Si fa presente che per capire cosa sia un’equazione (anche non differenziale), a parte il modo di chiamarla o di scriverla, è indispensabile aver ben definito il concetto di soluzione. In altre parole, è necessario avere un criterio chiaro per decidere quando, in un assegnato insieme in cui si cercano le soluzioni, un elemento di detto insieme è o non è una soluzione. Per quanto riguarda la suddetta equazione, l’insieme in cui si cercano le soluzioni è dato dalle funzioni reali di classe C 1 definite in un intervallo non banale (l’intervallo può variare da funzione a funzione). Una funzione y(x), di classe C 1 in un intervallo J, è una soluzione se per ogni x ∈ J si ha (x, y(x), y 0 (x)) ∈ W e g(x, y(x), y 0 (x)) = 0 . In particolare, data una soluzione y: J → R, la sua restrizione ad un sottointervallo non banale di J è ancora una soluzione. Tra tutte le soluzioni, quelle che non sono restrizione di altre soluzioni si dicono massimali (o non prolungabili). Si potrebbe dimostrare che ogni soluzione non massimale è la restrizione di una massimale. In altre parole, ogni soluzione non massimale si può prolungare fino ad ottenere una soluzione massimale. L’insieme di tutte le soluzioni di un’equazione differenziale si dice soluzione generale o integrale generale. Talvolta la funzione g(x, y, y 0 ) è del tipo y 0 − f (x, y), con f definita (e continua) in un aperto U di R2 . Si osservi che in questo caso l’aperto W in cui è definita la funzione g(x, y, y 0 ) := y 0 − f (x, y) è U × R, e l’equazione può essere scritta nella forma y 0 = f (x, y) , detta forma normale. Da ora in avanti, a meno che non sia altrimenti specificato, ci occuperemo di equazioni differenziali in forma normale. Il più banale esempio di equazione differenziale è y 0 = f (x) , dove f è una funzione continua definita in un intervallo J ⊂ R. In questo caso la soluzione generale è data dall’insieme delle primitive di f . Non sempre la variabile di un’equazione differenziale viene indicata con x, e non sempre la funzione incognita si denota con y. Ad esempio, x0 = f (t, x) 134 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi è un’equazione differenziale dove t è la variabile e x(t) la funzione incognita. Esempio della carica di un condensatore. 112 - Mer. 6/12/00 Un’equazione differenziale del prim’ordine si dice lineare se è della forma y 0 = a(x)y + b(x) , dove a(x) e b(x) sono due funzioni continue definite in un intervallo J. In particolare, quando il termine noto b(x) è identicamente nullo, l’equazione si dice lineare omogenea, e in questo caso la funzione identicamente nulla è soluzione dell’equazione differenziale (si chiama soluzione banale o nulla). Si potrebbe dimostrare (ma non lo facciamo) che se la soluzione di un’equazione lineare omogenea è nulla in un punto, allora è nulla in tutto l’intervallo in cui è definita (è una conseguenza del teorema di esistenza e unicità che enunceremo più avanti). Teorema. Sia a(x) una funzione continua in un intervallo J ⊂ R. (massimali) dell’equazione (lineare omogenea del prim’ordine) Le soluzioni y 0 = a(x)y sono le funzioni del tipo y(x) = ceA(x) , dove A(x) è una primitiva di a(x) in J e c un’arbitraria costante. Dimostrazione. Proviamo prima che se y(x) è una soluzione, allora esiste una costante c tale che y(x) = ceA(x) . Se y(x) è la soluzione banale, allora l’uguaglianza è verificata per c = 0. Supponiamo quindi che y(x) non sia banale. Per quanto detto prima, y(x) non si annulla mai (altrimenti sarebbe sempre nulla). Possiamo quindi scrivere y 0 (x) = a(x) y(x) o, equivalentemente, d d log |y(x)| = A(x) . dx dx Le due funzioni log |y(x)| e A(x) hanno quindi la stessa derivata, ed essendo definite in un intervallo, esiste una costante k ∈ R tale che log |y(x)| = A(x) + k . Dunque |y(x)| = eA(x)+k = ek eA(x) . 135 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Poiché y(x) non si annulla mai ed è continua in un intervallo, per il Secondo Teorema di Weierstrass ha sempre lo stesso segno. Possiamo quindi concludere che y(x) = ceA(x) , dove c = ek se y(x) > 0, e c = −ek se y(x) < 0. Rimane da verificare che ogni funzione del tipo y(x) = ceA(x) è effettivamente una soluzione, e questo è lasciato per esercizio allo studente. Esempi ed esercizi. 113 - Gio. 7/12/00 Sia y 0 = f (x, y) un’equazione differenziale del prim’ordine in forma normale e sia U ⊂ R2 l’aperto in cui è definita la funzione f . Dato un punto (x0 , y0 ) ∈ U , ci si pone il problema di trovare, tra tutte le soluzioni y(x) della suddetta equazione, quella che verifica (o quelle che verificano) la condizione y(x0 ) = y0 . In altre parole, tra tutte le soluzioni, si cercano quelle il cui grafico contiene il punto (x0 , y0 ) assegnato. Tale problema viene detto di Cauchy; cosı̀ come di Cauchy si chiama la condizione y(x0 ) = y0 . Il seguente risultato dà una risposta al problema posto: Teorema (di esistenza e unicità per le equazioni del prim’ordine). l’equazione differenziale y 0 = f (x, y) , Consideriamo dove f è una funzione continua in un aperto U ⊂ R2 . Se f è derivabile rispetto ad y e ∂f /∂y è continua, allora, per ogni (x0 , y0 ) ∈ U , la suddetta equazione ammette un’unica soluzione massimale che verifica la condizione y(x0 ) = y0 . Notiamo che, nel caso in cui la funzione f abbia come dominio una striscia (a, b)×R (con a e b reali estesi), non c’è da aspettarsi, in generale, che le soluzioni massimali siano definite in tutto (a, b), come mostra l’esempio che segue. Una soluzione definita in tutto (a, b) sarà detta una soluzione globale. Esempio. Consideriamo il problema di Cauchy ( y0 = y2 y(0) = 1 . La soluzione massimale di tale problema (il metodo per trovarla sarà visto dopo) è la restrizione all’intervallo (−∞, 1) della funzione y(x) = 1 1−x 136 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi (ricordiamo che abbiamo assunto, per definizione, che il dominio di una soluzione di un’equazione differenziale sia un intervallo). Dal teorema di esistenza e unicità si deduce un’importante conseguenza: Corollario. Consideriamo l’equazione differenziale y 0 = f (x, y) , dove f è una funzione continua in un aperto U ⊂ R2 . Supponiamo che f sia derivabile rispetto ad y con derivata continua. Allora i grafici di due differenti soluzioni massimali non possono intersecarsi. Esempio (di non unicità della soluzione di un problema di Cauchy). Si osservi che le funzioni y1 (x) ≡ 0 e y2 (x) = x3 sono due soluzioni dell’equazione differenziale p y0 = 3 3 y2 e verificano entrambe la condizione di Cauchy y(0) = 0. Il seguente importante risultato asserisce che la continuità della funzione f assicura l’esistenza (anche se non l’unicità) di almeno una soluzione del problema di Cauchy per l’equazione y 0 = f (x, y): Teorema di esistenza di Peano. Sia f : U → R una funzione continua su un aperto U ⊂ R2 . Allora, per ogni (x0 , y0 ) ∈ U , l’equazione y 0 = f (x, y) ammette almeno una soluzione massimale che verifica la condizione y(x0 ) = y0 . Una proprietà significativa delle soluzioni di un’equazione differenziale è espressa dal teorema che segue. Per enunciarlo in modo più generale introduciamo la seguente definizione: una soluzione y: J → R che non sia restrizione di un’altra soluzione definita in un intervallo più ampio a destra [sinistra] verrà detta massimale a destra [sinistra] (o non prolungabile a destra [sinistra]). Ovviamente, una soluzione è massimale se e solo se è massimale sia a destra sia a sinistra. Teorema di Kamke. Sia f : U → R una funzione continua su un aperto U ⊂ R2 . Il grafico di una soluzione massimale a destra [a sinistra] dell’equazione differenziale y 0 = f (x, y) non può essere contenuto in un sottoinsieme compatto di U . 114 - Gio. 7/12/00 Teorema. Supponiamo che ȳ(x) sia una soluzione dell’equazione differenziale lineare y 0 = a(x)y + b(x) , 137 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi dove a(x) e b(x) sono funzioni continue in un intervallo J ⊂ R. Allora ogni altra soluzione si ottiene aggiungendo ad ȳ(x) la soluzione generale dell’equazione omogenea associata y 0 = a(x)y. Dimostrazione. Proviamo prima che se u(x) è una soluzione dell’equazione omogenea, allora y(x) := ȳ(x) + u(x) è soluzione della non omogenea. Dalle uguaglianze ȳ 0 (x) = a(x)ȳ(x) + b(x) e u0 (x) = a(x)u(x) segue ȳ 0 (x) + u0 (x) = (a(x)ȳ(x) + b(x)) + a(x)u(x) = a(x)(ȳ(x) + u(x)) + b(x) . Quindi y 0 (x) = a(x)y(x) + b(x) , e ciò prova che y(x) := ȳ(x) + u(x) è soluzione della non omogenea. Rimane da verificare che se ỹ(x) è una soluzione dell’equazione non omogenea, allora esiste una soluzione u(x) dell’omogenea tale che ỹ(x) = ȳ(x) + u(x). In altre parole, rimane da provare che la funzione u(x) := ỹ(x) − ȳ(x) è soluzione dell’equazione omogenea, e questo è un esercizio che lasciamo allo studente. Osserviamo che il suddetto teorema, nel caso particolare in cui la funzione a(x) sia nulla, si riduce ad un risultato ben noto: data una primitiva ȳ(x) di b(x), ogni altra primitiva si ottiene aggiungendo ad ȳ(x) un’arbitraria costante (ossia, la soluzione generale di y 0 = 0). Esempi ed esercizi. 115 - Lun. 11/12/00 Abbiamo visto che per trovare la soluzione generale di un’equazione non omogenea occorre prima trovarne almeno una (comunemente detta soluzione particolare). Un metodo per trovare una soluzione particolare è il cosiddetto metodo di variazione della costante (per equazioni di ordine superiore al primo si chiama metodo di variazione delle costanti). Consideriamo l’equazione y 0 = a(x)y + b(x) . Sappiamo che la soluzione generale dell’omogenea associata è data da u(x) = ceA(x) , dove A(x) è una primitiva di a(x) e c una costante arbitraria. Il metodo consiste nel cercare una soluzione particolare dell’equazione non omogenea, pensando variabile la costante c (è 138 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi una contraddizione in termini, ma l’espressione “variazione delle costanti” fa ormai parte del folclore matematico). In altre parole, si cerca una soluzione del tipo ȳ(x) = c(x)eA(x) . Derivando si ottiene ȳ 0 (x) = c0 (x)eA(x) + c(x)a(x)eA(x) . Quindi ȳ 0 (x) = c0 (x)eA(x) + a(x)ȳ(x) . Sostituendo l’espressione trovata nell’equazione, si ha c0 (x)eA(x) + a(x)ȳ(x) = a(x)ȳ(x) + b(x) , da cui si deduce che ȳ(x) è soluzione se (e solo se) c0 (x) = e−A(x) b(x) , ossia se (e solo se ) c(x) è una primitiva di e−A(x) b(x). Di conseguenza, la soluzione generale dell’equazione non omogenea è data da Z A(x) A(x) y(x) = ce +e e−A(x) b(x)dx , dove c è un’arbitraria costante. Esempio. Consideriamo l’equazione differenziale y 0 + 2xy = x . Supponiamo di voler trovare, tra tutte le soluzioni, quella che verifica la condizione di Cauchy y(0) = 0. Poiché A(x) = −x2 , si ha Z Z 1 −x2 2 −x2 −x2 x2 −x2 ex dx2 = y(x) = ce +e e x dx = ce + e 2 1 1 −x2 x2 2 e e = ce−x + . 2 2 Dobbiamo ancora determinare la costante c in modo che sia verificata la condizione y(0) = 0. Abbiamo 1 y(0) = c + = 0 , 2 da cui si ricava c = −1/2. La soluzione cercata è dunque 2 ce−x + y(x) = ´ 1³ 2 1 − e−x , 2 139 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi come si può facilmente verificare (si invita lo studente a farlo). Esempi ed esercizi. 116 - Lun. 11/12/00 Il metodo di variazione della costante per determinare una soluzione particolare di un’equazione lineare non omogenea può essere, talvolta, troppo elaborato. Esistono dei metodi, detti “rapidi”, che funzionano bene quando l’equazione omogenea associata ha il coefficiente costante (ossia, è del tipo y 0 = ay, con a costante) e quando il termine noto si presenta in una forma molto particolare. Il metodo (che possiamo chiamare “del pescatore”) consiste nel “tirare ad indovinare”, ovvero nel cercare una soluzione dell’equazione in una classe di funzioni dove si suppone debba essercene almeno una. Se poi non si trova, pazienza, si può sempre procedere col metodo di variazione della costante. Analizziamo alcuni casi in cui il metodo funziona. Consideriamo l’equazione y 0 = ay + b(x) . Supponiamo che b(x) sia un polinomio di grado n. Se a 6= 0, si cerca una soluzione particolare tra i polinomi di grado n; se, invece, a = 0 (ossia, se le costanti sono soluzione dell’equazione omogenea associata), si cerca moltiplicando per x un generico polinomio di grado n (si ottiene cosı̀ un generico polinomio di grado n + 1 con termine noto nullo). Supponiamo ora che b(x) sia del tipo α cos ωx + β sen ωx, con ω ∈ R. In questo caso si cerca una soluzione particolare dello stesso tipo, dove, ovviamente, al posto delle costanti α e β si scrivono dei coefficienti da determinare. Un terzo caso importante si ha quando b(x) = αeγx , con γ ∈ R. Se a 6= γ, si cerca una soluzione particolare del tipo ceγx , con c costante da determinare. Se a = γ (ossia se eγx è soluzione dell’equazione omogenea associata), si determina una soluzione particolare moltiplicando per x la funzione ceγx e si trova c in modo da ottenere una soluzione della non omogenea. Il primo e il terzo caso si potrebbero riunire in uno solo: quello in cui b(x) è del tipo q(x)eγx , dove q(x) è un polinomio e γ una costante. Si osservi infatti che se γ = 0 si ottiene il primo caso, e se q(x) ≡ 1 si ottiene il terzo. Con un tale b(x) si procede nel seguente modo: si considera un generico polinomio r(x) dello stesso grado di q(x); se a 6= γ, si cerca una soluzione particolare della forma r(x)eγx ; se, invece, a = γ (ossia, se eγx è soluzione dell’omogenea) si cerca una soluzione del tipo xr(x)eγx . Osserviamo che quest’ultimo metodo include i due già trattati nel primo e nel secondo caso. Esempi ed esercizi. 140 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi 117 - Mar. 12/12/00 Denotiamo con C ∞ (R, R) o, più bravemente, con C ∞ (R), l’insieme costituito dalle funzioni di classe C ∞ da R in sé. Osserviamo che due funzioni di C ∞ (R) si possono sommare, ottenendo ancora una funzione di C ∞ (R). Inoltre, se si moltiplica una funzione di C ∞ (R) per uno scalare reale (ossia per una costante appartenente ad R) si ottiene ancora una funzione dello stesso insieme. Si ha cosı̀ quello che viene chiamato uno spazio vettoriale sui reali (i reali si dicono gli scalari e gli elementi dello spazio i vettori). In tale spazio c’è un vettore che è neutro rispetto alla somma (cioè, sommato ad un qualunque vettore dà il vettore stesso): è la funzione identicamente nulla (chiamata zero dello spazio). L’applicazione D: C ∞ (R) → C ∞ (R) che ad ogni funzione y(x) dello spazio C ∞ (R) associa la funzione derivata Dy := y 0 gode delle seguenti due proprietà: (additività) D(y1 + y2 ) = Dy1 + Dy2 , per ogni y1 , y2 ∈ C ∞ (R); (omogeneità) D(λy) = λDy, per ogni λ ∈ R e per ogni y ∈ C ∞ (R). Poiché D gode di tali proprietà, si dice che è un’applicazione lineare (o un operatore lineare) dallo spazio C ∞ (R) in sé. Un altro esempio di operatore lineare da C ∞ (R) in sé e l’operatore identico (o identità) I: C ∞ (R) → C ∞ (R); ossia quell’applicazione che ad ogni funzione associa la funzione stessa. Due operatori lineari si possono sommare, ottenendo ancora un operatore lineare, cosı̀ come un operatore lineare si può moltiplicare per una costante (e il risultato è ancora un operatore lineare). Nel caso di applicazioni da uno spazio in sé, come quello che stiamo considerando, ha senso anche la composizione. Ad esempio, la composizione di D con D, denotata con D2 , è l’operatore che ad ogni funzione di C ∞ (R) associa la sua derivata seconda (ossia, D2 y = y 00 ). Più in generale, Dn rappresenta l’operatore linere che ad ogni funzione y ∈ C ∞ (R) associa la sua derivata nesima Dn y = y (n) . Per semplicità di linguaggio e di notazioni è comodo fare la convenzione che D0 rappresenti l’identità I dello spazio C ∞ (R) (D0 y significa quindi derivare zero volte y). Si fa notare che l’equazione lineare del primo ordine y 0 = ay + b(x) può essere scritta nella forma Ly = b , dove b ∈ C ∞ (R) è il termine noto, y ∈ C ∞ (R) rappresenta la funzione incognita ed L := D − aI è quell’operatore lineare da C ∞ (R) in sé che si ottiene sommando a D l’operatore −aI (dato dal prodotto della costante −a per l’identità I). L’insieme Pn dei polinomi di grado minore o uguale ad n costituisce un sottospazio vettoriale di C ∞ (R); ossia, è un sottoinsieme di C ∞ (R) chiuso rispetto alla somma e alla 141 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi moltiplicazione per gli scalari (cioè, la somma di due elementi di Pn è ancora un elemento di Pn e se si moltiplica un elemento di Pn per una costante si ottiene ancora un elemento di Pn ). Osserviamo che l’operatore L sopra definito manda Pn in sé e, in particolare, se a = 0, manda addirittura Pn+1 in Pn . Con riferimento al primo dei metodi rapidi precedentemente illustrati, è naturale aspettarsi che, nel caso in cui nella suddetta equazione differenziale il termine noto b appartenga a Pn , esista una soluzione (particolare) ȳ in Pn o in Pn+1 , a seconda che il coefficiente a sia non nullo o nullo. Infatti, da noti teoremi di algebra lineare (che verranno svolti nel corso di Geometria) si può facilmente dedurre che se a 6= 0, allora l’operatore L, visto da Pn in sé, è suriettivo (ed anche iniettivo); se, invece, a = 0, allora L è suriettivo da Pn+1 in Pn (ma, in questo caso, non iniettivo). Il motivo per cui funzionano gli altri metodi rapidi (quelli relativi al secondo e al terzo caso) potrebbe essere spiegato in maniera analoga scegliendo, in ciascuno dei due casi, al posto di Pn , un appropriato sottospazio di C ∞ (R); ma lasciamo perdere. Esempi ed esercizi. 118 - Mar. 12/12/00 Un’equazione del tipo y 0 = a(x)y + b(x)y α , dove α è un numero reale e le funzioni a(x) e b(x) sono definite in un intervallo J (spesso coincidente con R), si dice di Bernoulli. Osserviamo che se α = 0, allora l’equazione rientra in un caso già studiato: è lineare con termine noto b(x). Se α = 1, allora è addirittura lineare omogenea. Si può quindi supporre che l’esponente α sia diverso da 0 e da 1. Ricordiamo che la funzione reale y α è definita per ogni y ∈ R se α è un intero positivo e per ogni y 6= 0 se α è un intero negativo. Negli altri casi si conviene di definirla soltanto per y > 0 (e vale l’uguaglianza y α = eα log y ). Incidentalmente si fa notare che la funzione √ n y, pur essendo definita anche per y = 0 (e anche per y < 0 se n è dispari), coincide con 1 y 1/n (cioè con e n log y ) solo per y > 0. Con tale convenzione sul dominio di y α , f (x, y) := a(x)y + b(x)y α risulta definita in un aperto U di R2 e l’equazione di Bernoulli soddisfa le ipotesi del teorema di esistenza e unicità. Per chiarezza ribadiamo che U = J × R se α è un intero positivo, U = J × (R\{0}) se α è un intero negativo, mentre conveniamo di assumere U = J × (0, +∞) in tutti gli altri casi. Riguardo a tale equazione osserviamo, innanzi tutto, che se α è un intero positivo, allora tra le soluzioni c’è la funzione y(x) identicamente nulla (la cosiddetta soluzione banale). Di conseguenza, per il teorema di esistenza e unicità, ogni altra soluzione è sempre diversa da 142 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi zero e quindi, essendo definita in un intervallo, risulta sempre positiva o sempre negativa. La stessa cosa vale anche quando α non è un intero positivo, perché se una soluzione si annullasse, il suo grafico conterrebbe dei punti non appartenenti al dominio U di f (x, y) = a(x)y + b(x)y α , e ciò è in contrasto con la definizione di soluzione. Per motivi di semplicità ci limitiamo a determinare soltanto le soluzioni positive dell’equazione di Bernoulli (per quelle negative, quando hanno senso, il metodo è analogo, mentre la soluzione banale, quando esiste, si vede a occhio). Supponiamo dunque che y(x) sia una soluzione positiva. Dividendo per y(x)α entrambi i membri dell’uguaglianza y 0 (x) = a(x)y(x) + b(x)y(x)α , si ottiene y 0 (x)y(x)−α = a(x)y(x)1−α + b(x) . Posto z(x) = y(x)1−α , si ha z 0 (x) = (1−α)y 0 (x)y(x)−α . Pertanto, z(x) verifica l’equazione differenziale lineare z 0 = (1 − α)a(x)z + (1 − α)b(x) . Dalla formula risolutiva per le equazioni lineari del prim’ordine si deduce che z(x) è (necessariamente) una funzione del tipo Z z(x) = ce(1−α)A(x) + (1 − α)e(1−α)A(x) e(α−1)A(x) b(x) dx , dove A(x) è una primitiva di a(x) e c ∈ R un’opportuna costante (che dipende da z(x), e quindi, in definitiva, dalla soluzione y(x) che avevamo considerato). Tenendo conto che y(x) > 0, si ha y(x) = z(x)1/(1−α) . Di conseguenza, si ottiene la formula y(x) = µ ce (1−α)A(x) + (1 − α)e (1−α)A(x) Z e (α−1)A(x) b(x)dx ¶ 1 1−α , che fornisce tutte le soluzioni positive dell’equazione di Bernoulli (e spesso, non solo quelle; ma l’approfondimento di un tale fatto esula dai nostri scopi). Esempio. Determiniamo le soluzioni positive dell’equazione di Bernoulli y 0 + y/x = y 2 x sen x . Si tratta di applicare la formula precedente con α = 2, a(x) = −1/x e b(x) = x sen x. Poiché la funzione f (x, y) := −y/x + y 2 x sen x 143 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi è definita nell’aperto U costituito da R2 meno l’asse delle y (la retta x = 0), il grafico di una qualunque soluzione positiva è contenuto interamente o nel primo quadrante o nel secondo (entrambi aperti). Per fissare le idee, supponiamo che y(x) sia una soluzione con grafico nel primo quadrante. Visto che per x > 0 una primitiva di a(x) è data da A(x) = − log x, si deve avere y(x) = µ cx − x Z µ ce log x sen x dx −e ¶−1 log x Z e − log x x sen x dx = (cx + x cos x)−1 = ¶−1 = 1 , x(c + cos x) dove c è un’opportuna costante. Ovviamente y(x), essendo positiva, sarà definita in un intervallo di (0, +∞) in cui c + cos x > 0 (e da ciò si deduce che c deve essere maggiore di −1). Un semplice controllo mostra, tuttavia, che la formula y(x) = 1 , x(c + cos x) non fornisce solo le soluzioni con grafico nel primo quadrante, ma (al variare di c in R e senza la restrizione x > 0) dà addirittura tutte le possibili soluzioni non banali dell’equazione considerata (con grafico in uno qualunque dei quattro quadranti). Si fa notare che se |c| ≤ 1, allora la formula trovata non dà una sola soluzione, ma infinite: una per ogni intervallo in cui non si annulla la funzione x(c + cos x) (ricordiamo infatti che, per definizione, la soluzione di un’equazione differenziale deve essere definita in un intervallo). Il fatto di ottenere più di una soluzione per certi valori di c non deve meravigliare: il metodo precedentemente esposto per risolvere un’equazione di Bernoulli fa vedere che ad ogni soluzione positiva y(x) corrisponde una costante c, ma non viceversa (la corrispondenza può non essere iniettiva). Esempio. Determiniamo le soluzioni positive dell’equazione di Bernoulli y0 = − √ √ y +2 x y. x Seguendo il metodo illustrato in precedenza e ponendo z(x) = l’equazione lineare √ z z0 = − + x, 2x il cui integrale generale è √ x x c , c ∈ R. z(x) = √ + 2 x Si ha dunque √ p x x c , y(x) = √ + 2 x p y(x), otteniamo c∈R 144 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi o, equivalentemente, 1 y(x) = x µ x2 +c 2 ¶2 , c ∈ R, √ definita nell’intervallo (0, +∞) se c ≥ 0 oppure nell’intervallo ( −2c, +∞) se c < 0 (si ricorda che stiamo cercando le soluzioni positive). Ad esempio, la soluzione y(x) > 0 che soddisfa la condizione iniziale y(1) = 1/9 è 1 y(x) = x in ( p µ x2 − 1/6 2 ¶2 1/3, +∞). Il fatto che la funzione di una variabile ϕ(x) = 1 x µ ¶2 x2 − 1/6 2 sia definita in R\{0} non è in contrasto con quanto detto sopra, cioè che il dominio della p soluzione y(x) è l’intervallo ( 1/3, +∞); infatti y(x) è la soluzione positiva di un dato p problema di Cauchy e, come tale, è la restrizione di ϕ a ( 1/3, +∞). Un’equazione differenziale del tipo y 0 = g(x)h(y) , dove g e h sono funzioni di una variabile definite in aperti di R, si dice a variabili separabili. Cerchiamo di spiegarne il motivo, illustrandone il metodo di risoluzione. Supponiamo g continua e h di classe C 1 . Con tali ipotesi la funzione f (x, y) := g(x)h(y) soddisfa le condizioni del teorema di esistenza e unicità. Supponiamo inoltre che g non si annulli in nessun intervallo non banale (si può tuttavia annullare in punti isolati). Se c ∈ R è un punto in cui h(y) si annulla, allora la funzione costante y(x) ≡ c è chiaramente una soluzione dell’equazione differenziale. Viceversa, ogni soluzione costante y(x) ≡ c è tale h(c) = 0. Studiamo quindi le soluzioni non costanti. Se y(x) è una tale soluzione, per il teorema di esistenza e unicità si deve avere h(y(x)) 6= 0 per ogni x nell’intervallo J in cui è definita y(x) (altrimenti il grafico di y(x) intersecherebbe il grafico di una soluzione costante). Dividendo l’uguaglianza y 0 (x) = g(x)h(y(x)) per h(y(x)) si ha allora y 0 (x) = g(x) . h(y(x)) 145 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Quindi la funzione y(x) verifica l’equazione differenziale 1 dy = g(x) , h(y) dx che per abuso di notazioni (e per tradizione) viene talvolta scritta nella forma 1 dy = g(x)dx , h(y) dove la variabile dipendente y è separata dalla variabile indipendente x, nel senso che una sta soltanto nel primo membro dell’equazione e l’altra nel secondo (da ciò il nome di “equazione a variabili separabili”). Il metodo tradizionale (ma poco ortodosso) per risolvere quest’ultima equazione consiste nell’integrare entrambi i membri. Si ha quindi Z Z dy = g(x)dx . h(y) Dunque, denotando con H(y) una primitiva di 1/h(y) (in un intervallo in cui h(y) non si annulla) e con G(x) una primitiva di g(x), si ottiene H(y) = G(x) + c , dove c e un’arbitraria costante. Ricavando la y si ha la formula y = H −1 (G(x) + c) che dà tutte le soluzioni non costanti della suddetta equazione a variabili separabili (osserviamo esplicitamente che H è iniettiva perché la stiamo considerando in un intervallo in cui la sua derivata H 0 (y) = 1/h(y) non si annulla). Si lascia per esercizio la verifica che ogni funzione del tipo y(x) = H −1 (G(x) + c) , purché la si consideri in un intervallo, è effettivamente una soluzione dell’equazione y 0 = g(x)h(y) . Si avverte che nell’eseguire la verifica, la presenza di H −1 rende indispensabile l’uso del teorema di derivazione di una funzione inversa. Un metodo più convincente per ottenere la suddetta formula risolutiva è quello di integrare direttamente entrambi i membri dell’uguaglianza y 0 (x) = g(x) , h(y(x)) che avevamo precedentemente ottenuto. Con le notazioni introdotte, si ha H(y(x)) = G(x) + c , 146 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi come segue facilmente dal fatto che H(y(x)) e G(x) hanno la stessa derivata (ovviamente, per verificare che H(y(x)) è una primitiva di y 0 (x)/h(y(x)), occorre tener conto del teorema di derivazione di una funzione composta). Ricavando la y(x) si ha infine y(x) = H −1 (G(x) + c) . Osservazione. Il metodo per risolvere le equazioni a variabili separabili esposto sopra si può applicare anche quando non sono soddisfatte le ipotesi del teorema di esistenza e unicità, purché ci si limiti alla ricerca delle soluzioni y(x) tali che h(y(x)) 6= 0. Si fa presente che se la funzione reale y 7→ h(y) non è C 1 , possono esistere soluzioni non costanti il cui grafico incontra il grafico di una soluzione costante, comep accade, ad esempio, per la 3 3 0 soluzione y(x) = x dell’equazione a variabili separabili y = 3 y 2 . Esempio. Consideriamo l’equazione differenziale y0 = y2 . Essa è a variabili separabili con g(x) = 1 e h(y) = y 2 . Ovviamente l’equazione possiede la soluzione nulla, che è l’unica soluzione costante. Sia quindi y(x) una soluzione non costante. Come già osservato, essa non potrà mai annullarsi, e quindi sarà o sempre positiva o sempre negativa. Dividendo per y 2 (x) entrambi i membri dell’uguaglianza y 0 (x) = y 2 (x) e integrando si ottiene Z Z 0 y (x) dx = dx , y 2 (x) da cui − 1 = x + c, y(x) c∈R Di conseguenza, le soluzioni non costanti dell’equazione sono date dalla formula y(x) = − 1 , x+c e l’intervallo massimale di definizione è (−∞, −c) se y(x) > 0 e (−c, +∞) se y(x) < 0. Ad esempio, la soluzione dell’equazione con dato iniziale y(0) = 1 si ottiene per c = −1 ed è quindi 1 y(x) = 1−x in (−∞, 1). Esempio. Consideriamo il problema di Cauchy 1+y 2 0 y = 1+x2 y(0) = 1 . 147 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi L’equazione differenziale è a variabili separabili con h(y) = 1 + y 2 , che è di classe C 1 e quindi il problema di Cauchy ammette una e una sola soluzione massimale. Seguendo il metodo precedentemente illustrato si ha Z Z 1 y 0 (x) dx = dx , 2 1 + y (x) 1 + x2 da cui arctang y(x) = arctang x + c , c ∈ R. Considerando la condizione iniziale y(0) = 1, si ricava c = arctang 1 = π/4 , per cui la soluzione massimale y(x) del problema di Cauchy verifica la condizione π arctang y(x) = arctang x + , 4 definita se | arctang x + π/4| < π/2, cioè nell’intervallo (−∞, 1). In questo caso, facendo uso delle formule di addizione delle funzioni seno e coseno, si riesce anche a ricavare l’espressione esplicita della soluzione. Si ottiene ³ π´ x + 1 = . y(x) = tang arctang x + 4 1−x Esercizio. Trovare le soluzioni dell’equazione differenziale y 0 = (1 − y 2 ) . Esempio. Consideriamo l’equazione y 0 = (2x − y)2 . Essa soddisfa le ipotesi del teorema di esistenza e unicità, essendo la funzione f (x, y) = (2x − y)2 addirittura di classe C ∞ . Data una soluzione y(x) dell’equazione, poniamo z(x) = 2x − y(x) . Poiché z 0 (x) = 2 − y 0 (x), si ricava che z(x) è soluzione dell’equazione z0 = 2 − z2 . Quest’ultima equazione è a variabili separabili e la sua risoluzione è lasciata per esercizio. 119 - Mer. 13/12/00 Un’espressione del tipo y 00 = f (x, y, y 0 ) , 148 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi dove f è una funzione continua definita su un aperto U di R3 , si dice un’equazione differenziale del second’ordine (in forma normale). Come precedentemente affermato, se di un’equazione non è ben definito il concetto di soluzione, non è ben definita l’equazione stessa; e per introdurre in modo corretto la nozione di equazione occorrono due ingredienti: 1) un insieme, detto universo, in cui si cercano le soluzioni; 2) un criterio chiaro per stabilire quando un elemento dell’universo abbia il diritto di chiamarsi soluzione. Per quanto riguarda la suddetta equazione differenziale, le soluzioni si cercano nell’insieme delle funzioni di classe C 2 , ciascuna delle quali è definita in un intervallo (dipendente dalla funzione stessa). Una funzione y(x) di tale insieme si dirà una soluzione se per ogni x appartenente all’intervallo J in cui è definita risulta (x, y(x), y 0 (x)) ∈ U e y 00 (x) = f (x, y(x), y 0 (x)) . Dal punto di vista fisico, un’equazione del secondo ordine può rappresentare la legge di moto di un punto materiale di massa unitaria, vincolato a muoversi in una retta e sottoposto ad una forza f dipendente dal tempo (che in questo caso si denota con t invece che con x), dalla posizione e dalla velocità (denotate rispettivamente con x e con ẋ). Ovviamente, non è l’unica interpretazione fisica: un’equazione del second’ordine ne può avere molte altre o, più precisamente, molti fenomeni fisici (e non solo di dinamica) sono governati da equazioni differenziali del second’ordine (e non solo del second’ordine). Più in generale, un’equazione differenziale di ordine n (in forma normale) è un’espressione del tipo y (n) = f (x, y, y 0 , . . . , y (n−1) ) , dove f : U → R è una funzione continua da un aperto U di Rn+1 in R. Una soluzione è una funzione y(x) di classe C n in un intervallo J tale che y (n) (x) = f (x, y(x), y 0 (x), . . . , y (n−1) (x)), ∀ x ∈ J. Ovviamente, affinché abbia senso la suddetta uguaglianza, si sottintende che (x, y(x), y 0 (x), . . . , y (n−1) (x)) ∈ U, ∀ x ∈ J. Come per le equazioni del prim’ordine, anche per quelle di ordine n il problema di Cauchy consiste nella ricerca delle soluzioni che “passano” per un punto assegnato dell’aperto U in cui è definita la f . In altre parole, dato un punto p = (x0 , y0 , y1 , . . . , yn−1 ) ∈ U , tra tutte le soluzioni y(x) dell’equazione y (n) = f (x, y, y 0 , . . . , y (n−1) ) , si cerca quella che verifica (o quelle che verificano) le condizioni y(x0 ) = y0 , y 0 (x0 ) = y1 , . . . , y (n−1) (x0 ) = yn−1 (in un certo senso, la soluzione che si cerca è quella il cui grafico in U contiene il punto p). 149 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Anche per le equazioni di ordine n si può definire il concetto di soluzione massimale e vale ancora un teorema di esistenza e unicità. Ci limitiamo a dire che se f (x, y, y 0 , . . . , y (n−1) ) è continua e derivabile rispetto alle variabili y, y 0 , . . . , y (n−1) con derivate continue, allora il problema di Cauchy ammette una ed una sola soluzione massimale. Per l’equazione di moto di un punto vincolato ad una retta, ciò significa che se ad un certo istante t0 si assegna la posizione x0 e la velocità ẋ0 , il moto è determinato. Un’equazione differenziale di ordine n si dice lineare se è del tipo y (n) + an−1 (x)y (n−1) + an−2 (x)y (n−2) + · · · + a1 (x)y 0 + a0 (x)y = b(x) , dove a0 (x), . . . , an−1 (x) e b(x) sono funzioni continue in un intervallo J (di solito J = R). Le funzioni a0 (x), . . . , an−1 (x) si dicono i coefficienti dell’equazione e b(x) rappresenta il termine noto. Quando b(x) ≡ 0, l’equazione si dice omogenea. Per le equazioni lineari vale il teorema di esistenza e unicità e si potrebbe dimostrare che ogni soluzione massimale è globale, ossia è definita in tutto l’intervallo J in cui sono definite le funzioni a0 (x), . . . , an−1 (x) e b(x). Da ora in avanti ci occuperemo prevalentemente di equazioni differenziali lineari a coefficienti costanti con termine noto definito in tutto R e di classe C ∞ ; ossia di equazioni del tipo y (n) + an−1 y (n−1) + · · · + a1 y 0 + a0 y = b(x) , dove a0 , . . . , an−1 sono numeri reali e b ∈ C ∞ (R). In questo caso le soluzioni massimali sono definite in tutto R. Notiamo che un’equazione lineare a coefficienti costanti y (n) + an−1 y (n−1) + · · · + a1 y 0 + a0 y = b(x) si può scrivere in modo sintetico nella forma Ly = b , dove L: C ∞ (R) → C ∞ (R) è l’operatore lineare, detto operatore differenziale, che ad ogni y ∈ C ∞ (R) associa la funzione y (n) + an−1 y (n−1) + · · · + a1 y 0 + a0 y , e che può essere rappresentato nel modo seguente: L = Dn + an−1 Dn−1 + an−2 Dn−2 + · · · + a1 D + a0 I , mettendo cosı̀ in evidenza come L si possa esprimere mediante somma e composizione di operatori lineari più elementari. 150 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Si osservi che L si può ottenere a partire dal polinomio p(λ) = λn + an−1 λn−1 + an−2 λn−2 + · · · + a1 λ + a0 , detto polinomio caratteristico dell’equazione differenziale considerata, semplicemente sostituendo D al posto della variabile λ (notiamo che il termine a0 si può scrivere a0 λ0 , e sostituendo D al posto di λ si ha a0 D0 = a0 I). In generale, se p(λ) è un polinomio qualunque (anche non associato ad un’equazione differenziale), l’operatore che si ottiene sostituendo D al posto di λ si denota con p(D). Osservazione. Ogni equazione differenziale lineare a coefficienti costanti con termine noto b ∈ C ∞ (R) si può scrivere nella forma p(D)y = b, dove p(λ) è il polinomio caratteristico dell’equazione. Ad esempio, il polinomio caratteristico dell’equazione differenziale y 000 − 2y 00 − y 0 + 3y = x − cos x è p(λ) = λ3 − 2λ2 − λ + 3 e l’operatore differenziale associato è p(D) = D3 − 2D2 − D + 3I , L’equazione può quindi essere scritta nella forma p(D)y = b, dove b(x) = x − cos x. 120 - Mer. 13/12/00 Teorema. Le soluzioni di un’equazione differenziale lineare non omogenea p(D)y = b si ottengono sommando ad una soluzione dell’equazione non omogenea tutte le possibili soluzioni dell’equazione omogenea associata. In altre parole, se ȳ è una soluzione dell’equazione non omogenea, ogni altra soluzione è del tipo y = ȳ + u, dove u è una soluzione dell’equazione omogenea associata (ossia, p(D)u = 0). Dimostrazione. Mostriamo prima che, fissata una soluzione (detta particolare) ȳ dell’equazione non omogenea, ogni funzione del tipo y = ȳ + u, dove u soddisfa la condizione p(D)u = 0, è ancora una soluzione dell’equazione non omogenea. Per la linearità di p(D) si ha infatti p(D)(ȳ + u) = p(D)ȳ + p(D)u = p(D)ȳ = b. 151 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Rimane da provare che se y è una qualunque soluzione dell’equazione non omogenea, allora la differenza u := y − ȳ è una soluzione dell’omogenea. Risulta infatti p(D)u = p(D)(y − ȳ) = p(D)y − p(D)ȳ = b − b = 0 . In base al precedente risultato, il problema di risolvere un’equazione differenziale (lineare) non omogenea si scinde in due sottoproblemi: 1) risolvere l’equazione omogenea associata; 2) trovare almeno una soluzione dell’equazione non omogenea. Occupiamoci prima dei metodi per risolvere le equazioni differenziali (lineari) omogenee a coefficienti costanti. È necessario prima introdurre alcune nozioni di algebra lineare. Definizione. Una combinazione lineare di n funzioni y1 (x), y2 (x), . . . , yn (x) dello spazio C ∞ (R) è una funzione del tipo c1 y1 (x) + c2 y2 (x) + · · · + cn yn (x), dove c1 , c2 , . . . , cn sono n costanti (detti coefficienti della combinazione lineare). Ad esempio, un polinomio di grado minore o uguale ad n non è altro che una combinazione lineare delle funzioni 1, x, x2 , . . . , xn (il polinomio è di grado n se il coefficiente di xn è diverso da zero). Definizione. Si dice che n funzioni di C ∞ (R), y1 (x), y2 (x), . . . , yn (x), sono linearmente indipendenti se dall’uguaglianza c1 y1 (x) + c2 y2 (x) + · · · + cn yn (x) = 0, ∀x ∈ R segue c1 = c2 = · · · = cn = 0; ossia, se l’unica combinazione lineare che dà la funzione (identicamente) nulla è quella con i coefficienti tutti nulli. Esempio. Mostriamo che le funzioni cos ωx e sen ωx (dove ω ∈ R) sono linearmente indipendenti. Supponiamo infatti che la funzione y(x) := a cos ωx + b sen ωx sia (identicamente) nulla. Poiché y(x) è zero per ogni x, deve esserlo anche per x = 0. Ponendo x = 0 si ottiene a = 0. Per provare che anche il coefficiente b è nullo, basta porre x = π/(2ω). Esercizio. Provare che se λ1 e λ2 sono due numeri reali distinti, allora le funzioni eλ1 x e eλ2 x sono linearmente indipendenti. Suggerimento. Tenere conto del fatto che se la funzione y(x) := aeλ1 x + beλ2 x 152 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi è identicamente nulla, allora lo è anche la sua derivata. Esercizio. Provare che le funzioni 1, x e x2 sono linearmente indipendenti. Esercizio. Dato λ ∈ R, provare che le funzioni eλx e xeλx sono linearmente indipendenti. Per lo studio delle equazioni differenziali lineari a coefficienti costanti è utile introdurre uno spazio più ampio di C ∞ (R): lo spazio vettoriale C ∞ (R, C) costituito dalle funzioni di classe C ∞ da R in C. Una funzione z(x) di tale spazio si scrive nella forma z(x) = α(x) + iβ(x) dove α(x) e β(x), dette rispettivamente parte reale e parte immaginaria della funzione z(x), appartengono a C ∞ (R). La derivata di z(x) è la funzione z 0 (x) = α0 (x) + iβ 0 (x), e quindi appartiene ancora allo spazio C ∞ (R, C). Ovviamente, ogni funzione di C ∞ (R) può essere pensata anche in C ∞ (R, C) (con parte immaginaria nulla). Si fa notare che le funzioni di C ∞ (R, C), non solo si possono moltiplicare per dei numeri reali, ma addirittura per dei numeri complessi, ottenendo ancora delle funzioni di classe C ∞ da R in C. Per questo motivo si usa dire che C ∞ (R, C) è uno spazio vettoriale sui complessi (o uno spazio complesso) e gli elementi di C rappresentano gli scalari dello spazio. Esercizio. Definire la nozione di combinazione lineare (a coefficienti complessi) per le funzioni di C ∞ (R, C). Esercizio. Definire la nozione di funzioni linearmente indipendenti per gli elementi di C ∞ (R, C). Esercizio. Provare che se λ1 e λ2 sono due numeri complessi distinti, allora le funzioni eλ1 x e eλ2 x sono linearmente indipendenti (nello spazio C ∞ (R, C)). Esercizio. Dato λ ∈ C, provare che le funzioni eλx e xeλx sono linearmente indipendenti (in C ∞ (R, C)). Esercizio. Provare che le funzioni 1, x e x2 sono linearmente indipendenti anche in C ∞ (R, C). Per risolvere le equazioni differenziali lineari a coefficienti costanti è utile introdurre la nozione di soluzione complessa (il motivo risulterà chiaro in seguito). La definizione è analoga a quella che data per le soluzioni reali; l’unica sostanziale differenza è l’universo in cui tali soluzioni si cercano, che in questo caso è C ∞ (R, C). Definizione. Sia y (n) + an−1 y (n−1) + · · · + a1 y 0 + a0 y = b(x) un’equazione differenziale a coefficienti costanti con termine noto b ∈ C ∞ (R, C). Una 153 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi funzione z ∈ C ∞ (R, C) è una soluzione complessa di tale equazione se z (n) (x) + an−1 z (n−1) (x) + · · · + a1 z 0 (x) + a0 z(x) = b(x) , per ogni x ∈ R. Consideriamo, ad esempio, l’equazione differenziale y 00 + y = 0 . Proviamo a vedere se ammette soluzioni del tipo z(x) = eµx , dove µ è un numero complesso. Si ha z 0 (x) = µeµx e z 00 (x) = µ2 eµx . Quindi z(x) è soluzione se e solo se (µ2 + 1)eµx = 0 , ∀x ∈ R, ossia (essendo eµx 6= 0) se e solo se µ2 + 1 = 0, da cui si ricava µ = ±i. Pertanto eix e e−ix sono soluzioni dell’equazione differenziale considerata, e sono le uniche del tipo eµx . Si osservi che non solo eix = cos x + i sen x e e−ix = cos x − i sen x sono soluzioni dell’equazione in esame, ma lo è anche una loro arbitraria combinazione lineare z(x) = c1 eix + c2 e−ix . Ciò dipende dal fatto che l’equazione y 00 + y = 0 è lineare omogenea, e quindi (come è facile verificare) la somma di due soluzioni è ancora una soluzione e se si moltiplica una soluzione per una costante si ottiene ancora una soluzione. L’insieme delle soluzioni dell’equazione y 00 + y = 0 è dunque uno spazio vettoriale (è facile verificare che questo fatto è vero per una qualunque equazione differenziale lineare omogenea). Esercizio. Siano z(x) = α(x) + iβ(x) e z̄(x) = α(x) − iβ(x) due funzioni complesse e coniugate di C ∞ (R, C). Allora si ha z(x) + z̄(x) = α(x) 2 e z(x) − z̄(x) = β(x) . 2i Dedurre da ciò che se z(x) e z̄(x) sono soluzioni di un’equazione differenziale omogenea, allora lo sono anche α(x) e β(x) (ossia, la parte reale e la parte immaginaria di z(x)). Teorema. Le soluzioni reali [complesse] di un’equazione differenziale lineare omogenea di ordine n si ottengono combinando linearmente, con coefficienti in R [in C], n soluzioni reali [complesse] linearmente indipendenti. Esempio (equazione del moto armonico). Consideriamo l’equazione differenziale y 00 + ω 2 y = 0 . 154 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi È immediato verificare che cos ωx e sen ωx sono due soluzioni reali (quindi, in particolare, anche complesse) linearmente indipendenti. Pertanto, ogni altra soluzione reale [complessa] è del tipo y(x) = c1 cos ωx + c2 sen ωx , con c1 e c2 costanti reali [complesse] arbitrarie. Da elementari considerazioni di trigonometria si deduce facilmente che ogni soluzione reale può essere scritta anche nella forma y(x) = A cos(ωx + ϕ) , dove le costanti reali A e ϕ (dette, rispettivamente, ampiezza e fase della soluzione) sono arbitrarie. Esercizio. Mostrare che la funzione complessa z(x) = eµx è soluzione dell’equazione differenziale y 00 + by 0 + cy = 0 se e solo se µ è radice del polinomio caratteristico p(λ) = λ2 + bλ + c (ossia, se e solo se µ2 + bµ + c = 0). Esercizio. Trovare le radici del polinomio caratteristico dell’equazione differenziale y 00 + ω 2 y = 0. Osservazione. Ispirandosi agli esercizi precedenti, non è difficile provare (in generale) che la funzione complessa z(x) = eµx è soluzione di un’equazione differenziale omogenea a coefficienti costanti p(D)y = 0 se e solo se µ è radice del polinomio caratteristico p(λ); ovvero, se e solo se p(µ) = 0. Illustriamo il metodo generale per risolvere un’equazione differenziale omogenea a coefficienti costanti. Cominciamo con la ricerca delle soluzioni complesse, che è più semplice, poi passeremo al caso reale (spesso più utile per le applicazioni). Sia data un’equazione differenziale omogenea a coefficienti costanti (reali) di ordine n p(D)y = 0 e supponiamo, per il momento, che le radici del polinomio caratteristico p(λ) siano tutte distinte. Siano queste λ1 , λ2 , . . . , λn . Le funzioni eλ1 x , eλ2 x , . . . , eλn x sono allora soluzioni dell’equazione differenziale assegnata e, si potrebbe dimostrare, sono linearmente indipendenti. Il problema di scrivere l’integrale generale dell’equazione differenziale in esame è perciò risolto (almeno in campo complesso): ogni soluzione complessa è del tipo y(x) = c1 eλ1 x + c2 eλ2 x + · · · + cn eλn x , dove c1 , c2 , . . . , cn sono arbitrarie costanti complesse. In questo modo si ottengono anche tutte le soluzioni reali (che sono un sottoinsieme delle complesse), ma per ottenerle bisogna dare alle costanti degli opportuni valori complessi (in modo da annullare la parte immaginaria), e ciò non è molto agevole. Un metodo più astuto per ottenere tutte le 155 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi soluzioni reali è quello di combinare linearmente n soluzioni linearmente indipendenti tutte reali. In questo modo, se si vuole, si attengono ancora tutte le soluzioni complesse, ma bisogna farlo apposta (se si danno ai coefficienti valori soltanto reali, si ottengono soluzioni reali). Per raggiungere lo scopo occorre sostituire le n soluzioni complesse trovate con altrettante soluzioni reali, purché ancora linearmente indipendenti. Il compito non è difficile quando l’equazione differenziale, come nel caso che stiamo trattando, è a coefficienti reali: anche il polinomio caratteristico è a coefficienti reali, e se ammette una radice α+iβ, ammette anche la coniugata α − iβ. Quindi, non solo l’equazione differenziale ammette la soluzione e(α+iβ)x = eαx (cos βx + i sen βx) , ma anche e(α−iβ)x = eαx (cos βx − i sen βx) . Pertanto l’equazione ammette anche le soluzioni reali eαx cos βx e eαx sen βx che si ottengono dalle due precedenti mediante opportune combinazioni lineari (si somma e si divide per 2 per la prima, e si sottrae e si divide per 2i per la seconda). Si potrebbe provare che se nell’insieme delle n soluzioni complesse che avevamo inizialmente trovato si sostituiscono tutte le coppie coniugate del tipo e(α+iβ)x e e(α−iβ)x con eαx cos βx e eαx sen βx, si ottengono ancora n soluzioni linearmente indipendenti ma, questa volta, tutte reali. Esempio. Cerchiamo le soluzioni reali dell’equazione differenziale y 000 + 2y 00 + 2y 0 = 0 . Il polinomio caratteristico è p(λ) = λ(λ2 + 2λ + 2), le cui radici sono λ1 = 0, λ2 = −1 + i e λ2 = −1 − i. Quindi, per quanto visto, la soluzione generale in campo reale è data da y(x) = c1 + c2 e−x cos x + c2 e−x sen x ; che può essere anche scritta nella forma y(x) = c + Ae−x cos(x + ϕ) , con c, A e ϕ costanti arbitrarie. Illustriamo brevemente come trattare il problema di determinare n soluzioni linearmente indipendenti nel caso che non tutte le radici del polinomio caratteristico dell’equazione p(D)y = 0 siano distinte. Supponiamo, ad esempio, che tra le varie radici del polinomio p(λ) ce ne sia una doppia che denotiamo con µ. In questo caso, come si può facilmente verificare, non solo eµx è soluzione dell’equazione considerata, ma lo è anche xeµx . Se poi, per nostra sfortuna, µ è addirittura una soluzione tripla, allora anche x2 eµx è soluzione, e cosı̀ via (ma ora basta!). Poiché l’equazione differenziale p(D)y = 0 è a coefficienti reali, se il polinomio caratteristico ha una radice doppia µ = α + iβ, anche la coniugata µ̄ = α − iβ 156 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi risulta doppia. Quindi, non solo eµx = eαx (cos βx + i sen βx) e xeµx = xeαx (cos βx + i sen βx) sono soluzioni, ma lo sono anche le due coniugate eµ̄x = eαx (cos βx − i sen βx) e xeµ̄x = xeαx (cos βx − i sen βx). Si è gia visto che, nella combinazione lineare delle n soluzioni linearmente indipendenti, al posto delle due soluzioni coniugate eµx e eµ̄x si possono sostituire le soluzioni reali eαx cos βx e eαx sen βx (rispettivamente parte reale e parte immaginaria di eµx ). Con lo stesso procedimento si prova che al posto di xeµx e xeµ̄x si possono considerare le soluzioni reali xeαx cos βx e xeαx sen βx (rispettivamente parte reale e parte immaginaria di xeµx ). Invece di continuare ad illustrare il metodo generale è meglio procedere con degli esempi (lo studente sarà senz’altro in grado di estrapolare il procedimento adattandolo a situazioni simili). Esempio. Consideriamo l’equazione y 000 − 3y 00 + 4y = 0 . Il polinomio caratteristico è p(λ) = λ3 − 3λ2 + 4. Si vede subito che λ1 = −1 è una radice, e quindi il polinomio è divisibile per λ + 1. Il quoziente della divisione è λ2 − 4λ + 4, perciò p(λ) = (λ2 − 4λ + 4)(λ + 1). Le altre due radici sono λ2 = 2 e λ3 = 2 (ossia, 2 è una radice doppia). Dunque, la soluzione generale è y(x) = c1 e−x + c2 e2x + c3 xe2x . Supponiamo ora di voler trovare, tra tutte le soluzioni, quella che verifica il seguente problema di Cauchy: y(1) = 0, y 0 (1) = 0, y 00 (1) = 0. La risposta è semplice, non c’è bisogno di fare calcoli: la soluzione si vede a occhio (ed è unica, perché l’equazione è lineare e soddisfa quindi il teorema di esistenza e unicità). Esempio. Cerchiamo le soluzioni reali dell’equazione differenziale y (4) + 8y (2) + 16y = 0 . Per risolverla occorre prima trovare le quattro radici del polinomio caratteristico p(λ) = λ4 + 8λ2 + 16. Consideriamo quindi l’equazione algebrica λ4 + 8λ2 + 16 = 0. Ponendo λ2 = µ si ha µ2 + 8µ + 16 = (µ + 4)2 = 0, da cui si ricavano due soluzioni coincidenti: µ1 = −4 e µ2 = −4. Avendo posto λ2 = µ, si ottiene λ2 = −4, dove il valore −4 va considerato due volte. Le quattro radici del polinomio caratteristico sono quindi λ1 = 2i, λ2 = −2i, λ3 = 2i e λ4 = −2i. Alla radice doppia 2i corrispondono le due soluzioni e2ix e xe2ix , e alla radice doppia −2i (coniugata della precedente) corrispondono le due soluzioni e−2ix e xe−2ix (rispettivamente coniugate di e2ix e xe2ix ). Le soluzioni complesse sono dunque y(x) = c1 e2ix + c2 e−2ix + c3 xe2ix + c4 xe−2ix , 157 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi mentre le reali sono y(x) = a1 cos 2x + a2 sen 2x + a3 x cos 2x + a4 x sen 2x o, equivalentemente, y(x) = A1 cos(2x + ϕ1 ) + A2 x cos(2x + ϕ2 ) . Esempio. Consideriamo l’equazione differenziale y (n) = 0. Il polinomio caratteristico è p(λ) = λn , e quindi µ = 0 è una radice di molteplicità n (n radici coincidenti). In base al procedimento illustrato si può affermare che le funzioni e0x , xe0x , x2 e0x , · · · , xn−1 e0x sono n soluzioni linearmente indipendenti dell’equazione differenziale considerata. Dunque, l’integrale generale è y(x) = a0 + a1 x + a2 x2 + · · · , an−1 xn−1 . Ossia, y(x) è una soluzione se e solo se è un polinomio di grado minore o uguale ad n − 1. Esempio. Tra tutte le soluzioni reali dell’equazione differenziale y (4) + y = 0 determiniamo quelle che tendono a zero per x → +∞. Le soluzioni dell’equazione algebrica λ4 + 1 = 0 sono le quattro radici quarte del numero −1 (che è un numero complesso di modulo 1 e argomento π). Risolviamo quindi l’equazione [r(cos ϕ + i sen ϕ)]4 = cos π + i sen π (o, equivalentemente, l’equazione (reiϕ )4 = eiπ ). Si ha r4 cos(4ϕ) + ir4 sen(4ϕ) = cos π + i sen π , da cui si deduce r = 1 e 4ϕ = π + 2kπ, con k ∈ Z. Per ottenere le quattro radici basta dare a k quattro valori consecutivi. Per k = 0 si ottiene λ0 = cos(π/4) + i sen(π/4) = √ √ √ √ 2/2 + i 2/2, e per k = 1 si ha λ1 = cos(3π/4) + i sen(3π/4) = − 2/2 + i 2/2. Le altre due radici si ottengono ponendo k = −1 e k = 2 oppure, più semplicemente, considerando le coniugate delle due radici trovate (dipende dal fatto che il polinomio caratteristico è reale). Pertanto, la soluzione generale in campo reale è Ã Ã √ ! √ ! √ √ √ √ 2 2 2 2 2 x − 22 x x + c2 sen x +e 2 x + c4 sen x c1 cos c3 cos y(x) = e 2 2 2 2 158 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi o, equivalentemente, y(x) = Ae − √ 2 x 2 √ √ √ 2 2 2 x x + ϕ) + Be 2 cos ( x + ψ) . cos ( 2 2 Quindi, le soluzioni che tendono a zero per x → +∞ sono √ √ 2 − 22 x cos ( y(x) = Ae x + ϕ) , 2 dove A e ϕ sono due arbitrarie costanti. 121 - Gio. 14/12/00 Esercizio. Mostrare che se ȳ(x) è una soluzione dell’equazione non omogenea p(D)y = b(x) , allora, data una costante c ∈ R, cȳ(x) è una soluzione di p(D)y = cb(x). Esercizio. Provare che una soluzione particolare dell’equazione differenziale p(D)y = b1 (x) + b2 (x) si può ottenere sommando una soluzione di p(D)y = b1 (x) con una soluzione di p(D)y = b2 (x). Una regola pratica per determinare una soluzione particolare di un’equazione differenziale lineare non omogenea a coefficienti costanti del tipo y (n) + an−1 y (n−1) + · · · + a0 y = q(x)eµx , dove q(x) è un polinomio e µ ∈ C, è la seguente: se µ = α + iβ è radice di molteplicità s del polinomio caratteristico p(λ) = λn + an−1 λn−1 + · · · + a0 , si cerca nella forma xs r(x)eµx , dove r(x) è un polinomio dello stesso grado di q(x) (i cui coefficienti sono da determinare). In particolare, se µ non è radice di p(λ), ossia s = 0, si cerca nella forma r(x)eµx . Osservazione. Per determinare una soluzione di un’equazione a coefficienti reali del tipo y (n) + an−1 y (n−1) + · · · + a0 y = xk eαx cos βx , basta osservare che xk eαx cos βx è la parte reale di xk e(α+iβ)x . dell’equazione basta quindi determinare una soluzione di Per la linearità y (n) + an−1 y (n−1) + · · · + a0 y = xk e(α+iβ)x 159 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi (che è ovviamente complessa) e prenderne la parte reale. In modo analogo si determina una soluzione di un’equazione con termine noto del tipo xk eαx sen βx che è la parte immaginaria di xk eαx cos βx. In pratica una soluzione dell’equazione y (n) + an−1 y (n−1) + · · · + a0 y = xk eαx cos βx , si può determinare anche nel seguente modo: se α + iβ non è radice del polinomio caratteristico, si cerca nella forma ak (x)eαx cos βx + bk (x)eαx sen βx , dove ak (x) e bk (x) sono polinomi di grado k i cui coefficienti sono da determinare; se α+iβ è radice semplice si cerca moltiplicando per x la forma precedente, e cosı̀ via. 122 - Gio. 14/12/00 Esempio. Tra tutte le soluzioni dell’equazione differenziale y 00 = xe−x , determiniamo quella che verifica il problema di Cauchy y(0) = 0 e y 0 (0) = 0. L’equazione omogenea associata è y 00 = 0 e il suo polinomio caratteristico ha due radici coincidenti: λ1 = 0 e λ2 = 0. Quindi, la soluzione generale dell’equazione omogenea è u(x) = c0 + c1 x. Occorre trovare una soluzione particolare dell’equazione non omogenea (per poi sommarla alla soluzione generale dell’omogenea). Osserviamo che µ = −1 non è radice del polinomio caratteristico. Cerchiamo quindi una soluzione del tipo ȳ(x) = (a + bx)e−x . Derivando due volte si ha ȳ 00 (x) = (a − 2b)e−x + bxe−x . Quindi ȳ(x) è soluzione se (e solo se) è verificata la condizione (a − 2b)e−x + (b − 1)xe−x = 0 , ∀x ∈ R, ossia se (e solo se) a−2b = 0 e b−1 = 0 (si osservi che l’affermazione “ȳ(x) è soluzione solo se a − 2b = 0 e b − 1 = 0”, anche se non è importante per il nostro scopo, è conseguenza del fatto che le funzioni e−x e xe−x sono linearmente indipendenti). Dunque, una soluzione (particolare) dell’equazione non omogenea è data da ȳ(x) = (2 + x)e−x e la soluzione generale è y(x) = c0 + c1 x + (2 + x)e−x . 160 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi Determiniamo ora c0 e c1 in modo che siano soddisfatte le condizioni assegnate. Poiché y(0) = c0 + 2 e y 0 (0) = c1 − 1, ponendo y(0) = 0 e y 0 (0) = 0 si ricava c0 = −2 e c1 = 1. Pertanto, la soluzione che verifica il problema di Cauchy assegnato è y(x) = −2 + x + 2e−x − xe−x . Esempio. Tra tutte le soluzioni dell’equazione differenziale y 00 − 2y 0 + 2y = 2x , determiniamo quella che verifica il problema di Cauchy y(0) = 2, y 0 (0) = 2. Troviamo prima tutte le soluzioni dell’equazione differenziale e imponiamo poi le condizioni iniziali assegnate. Il polinomio caratteristico ha due radici complesse coniugate: λ1 = 1 + i e λ2 = 1 − i. Quindi, in campo complesso, la soluzione generale dell’equazione omogenea associata è data da u(x) = c1 e(1+i)x + c2 e(1−i)x . A questo punto, volendo, si potrebbe determinare anche la soluzione generale in campo reale, ma per risolvere il nostro problema non è necessario: il teorema di esistenza e unicità ci assicura che il problema di Cauchy ha una e una sola soluzione, e questa deve essere reale (visto che sia l’equazione sia le condizioni iniziali sono reali). Procediamo quindi in campo complesso. Occorre trovare una soluzione particolare dell’equazione non omogenea e sommarla alla soluzione generale dell’omogenea. Il termine noto si presenta nella forma q(x)eµx , dove q(x) è un polinomio di primo grado e µ = 0. Poiché µ = 0 non è radice del polinomio caratteristico, si cerca una soluzione nella forma r(x) = ax + b. Con semplici calcoli si vede che r(x) è soluzione se (e solo se) a = 1 e b = 1. La soluzione generale dell’equazione non omogenea è dunque y(x) = c1 e(1+i)x + c2 e(1−i)x + x + 1 , dove c1 e c2 sono arbitrarie costanti complesse. Occorre determinare tali costanti in modo che si abbia y(0) = 2, y 0 (0) = 2. Poiché y 0 (x) = (1 + i)c1 e(1+i)x + (1 − i)c2 e(1−i)x + 1 , le costanti devono verificare il sistema ( c1 + c2 = 1 (1 + i)c1 + (1 − i)c2 = 1 , da cui si ricava l’unica soluzione (c1 , c2 ) = (1/2, 1/2). Possiamo concludere che la soluzione dell’equazione differenziale che verifica le condizioni iniziali assegnate è y(x) = e(1+i)x + e(1−i)x + x + 1 = ex cos x + x + 1 2 161 Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi che, come ci aspettavamo, è una funzione reale. Si invita a verificare che la funzione y(x) = ex cos x+x+1 è effettivamente una soluzione dell’equazione differenziale considerata e che soddisfa le condizioni iniziali y(0) = 2, y 0 (0) = 2. Esempio. Determiniamo l’integrale generale della seguente equazione differenziale: y 00 − 4y = ex − xe−2x + 1 . Il polinomio caratteristico è p(λ) = λ2 − 4 e le sue radici sono λ1 = −2 e λ2 = 2. Quindi, la soluzione generale dell’equazione omogenea associata è u(x) = c1 e−2x + c2 e2x . Per determinare una soluzione particolare osserviamo che il termine noto è somma di tre termini, tutti del tipo q(x)eµx , dove q(x) è un polinomio e µ un numero complesso (in questo caso reale). Poiché µ = 1 non è radice di p(λ), il primo termine ci induce a cercare una soluzione (dell’equazione p(D)y = ex ) del tipo ȳ(x) = aex . Riguardo al secondo termine, osserviamo che µ = −2 è una radice semplice del polinomio caratteristico, e quindi si cerca una soluzione (di p(D)y = −xe−2x ) nella forma ȳ2 (x) = x(cx + d)e−2x . Infine, per quanto riguarda il terzo termine, si cerca una soluzione (di p(D)y = 1) del tipo ȳ3 (x) = d, cioè costante (in questo caso, infatti, µ = 0 non è radice di p(λ)). Cerchiamo quindi una soluzione dell’equazione differenziale non omogenea nella forma ȳ(x) = aex + x(bx + c)e−2x + d . Sostituendo ȳ(x) nell’equazione differenziale, si ricava a = −1/3, b = 1/8, c = 1/16 e d = −1/4. Pertanto, la soluzione generale dell’equazione non omogenea è y(x) = c1 e−2x + c2 e2x − x x2 1 ex + ( + )e−2x − , 3 8 16 4 dove c1 e c2 sono due costanti (reali o complesse, a seconda che si desiderino soltanto le soluzioni reali o tutte le soluzioni complesse). 162