2 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 Distanze e variazioni: gli spazi metrici Spazi metrici e spazi dotati di norma Continuità e convergenza Insiemi chiusi e aperti L'assioma di continuità nella teoria dell'utilità Differenziazione Derivate generalizzate Il teorema della funzione implicita e la statica comparata Applicazioni della statica comparata: i modelli macroeconomici elementari Introduzione Nel linguaggio comune sono molto frequenti frasi come “Questo oggetto è vicino a un altro oggetto”, oppure “Questo oggetto si avvicina sempre più all’altro”. In matematica, definire rigorosamente anche concetti così comuni e intuitivi si rivela molto produttivo. Questo capitolo si divide in due parti. La prima, costituita dai paragrafi da 2.1 a 2.4, privilegia, dei due concetti menzionati nel titolo del capitolo, quello di distanza. Il paragrafo 2.1 introduce i concetti di distanza, norma, distanza dedotta da una norma e pertanto la nozione di spazio metrico. Il paragrafo 2.2 definisce i concetti di continuità e di convergenza. Così come il paragrafo 2.1 precisava i concetti di “vicino e lontano da…”, quest’ultimo paragrafo definisce rigorosamente il concetto di “sempre più vicino a…”. Il paragrafo 2.3 è dedicato a uno dei concetti più importanti, quello di insieme aperto (e il corrispondente concetto di insieme chiuso) e alle proprietà di questi insiemi. Il paragrafo 2.4 contiene invece una prima applicazione economica, dove si mostra come il cosiddetto assioma di continuità nella teoria delle preferenze permette di dimostrare la continuità della funzione di utilità. I restanti paragrafi sono invece concentrati sulla nozione di variazione. Dato che la distanza tra due punti (dedotta da una norma) non è altro che la norma della differenza tra i due punti, esiste una relazione tra le nozioni di variazione o di differenza e il concetto di distanza dedotta da una norma, il che spiega la compresenza in questo cap2.pmd 55 15/02/2004, 11.48 56 Distanze e variazioni: gli spazi metrici capitolo di questi due argomenti. Il principale problema che affronteremo consisterà nella possibilità di approssimare le variazioni di una data funzione mediante le variazioni di una appropriata funzione lineare. Come vedremo, questo problema è sotteso alle diverse tecniche di differenziazione o di derivazione. Il paragrafo 2.5 è una rassegna dei concetti di derivata e derivata parziale di una funzione reale di variabili reali. Il paragrafo 2.6 introduce i concetti di derivata direzionale, di Gateaux e di Fréchet per lo stesso tipo di funzioni ed estende i precedenti concetti alle funzioni a valore vettoriale. Il paragrafo 2.7 presenta il teorema della funzione implicita e introduce al suo impiego nella statica comparata. Questa tecnica viene poi esemplificata nel paragrafo 2.8, con l’analisi di due modelli macroeconomici elementari, cioè il modello IS-LM e un modello “classico”. L’appendice C svolge invece il tema della differenziazione in spazi di funzioni, estendendo ai funzionali i concetti introdotti nei paragrafi 2.5 e 2.6. Benché dunque l’appendice non costituisca altro che una prosecuzione della trattazione contenuta nei due paragrafi citati, si è ritenuto preferibile separare dal testo principale del capitolo la presentazione di un argomento relativamente astratto e che risulterà utile soprattutto ai lettori interessati alla seconda parte del capitolo 5 e al capitolo 7. 2.1 Spazi metrici e spazi dotati di norma La seguente definizione esplicita le proprietà che si associano alla nozione intuitiva di distanza. Definizione 2.1.1 Dato un insieme S, una distanza è una funzione con valore reale ρ(.): S × S → R dalle seguenti proprietà. Per qualsiasi x, y, z ∈ S • • • • ρ( x, y ) ≥ 0 ρ( x, y ) = 0 ⇔ x = y ρ( x, y ) = ρ( y, x) (simmetria) ρ( x, z ) ≤ ρ( x, y ) + ρ( y, z ) (diseguaglianza triangolare) ■ Una volta che un’appropriata funzione di distanza ρ(x, y) sia definita su un certo insieme, allora si dice che S è uno spazio metrico (dotato della distanza ρ(.)). Esercizio 2.1 Provate che la seguente funzione è una funzione di distanza 1 ⇔ ρ( x, y ) = 0 ⇔ cap2.pmd 56 x≠ y x= y ■ 15/02/2004, 11.48 2.1 Spazi metrici e spazi dotati di norma 57 Definizione 2.1.2 Dato uno spazio metrico S dotato della distanza ρ(.), un intorno aperto di un punto x ∈ S con raggio ε è l’insieme N ( x, ε ) = { y ∈ S : ρ( x, y ) < ε} Se il segno della diseguaglianza è reso debole, si dice che l’intorno è chiuso. ■ Il concetto di intorno richiama, geometricamente, quello di una sfera: l’insieme dei punti che hanno una distanza non superiore a un dato valore ε (il raggio) rispetto a un dato punto x ∈ S (il centro della sfera). Tuttavia vedremo che, a seconda di come si definisce la distanza, un intorno “sferico” può essere molto diverso da una sfera come la intendiamo abitualmente. Fino a questo punto, non abbiamo imposto alcun requisito per quanto riguarda le caratteristiche di S. Supponiamo ora che S sia uno spazio vettoriale. In questo caso possiamo definire la seguente nozione. Definizione 2.1.3 Dato uno spazio vettoriale reale V, una norma è una funzione con valore reale ||(.)||: V → R dalle seguenti proprietà. Per ogni x, y ∈ V e α ∈ R • • • • x ≥0 x = 0 se e solo se x = 0V αx = α ⋅ x x+ y ≤ x + y Data una norma ||(.)||: V → R, V è detto uno spazio vettoriale dotato di norma. ■ Si noti, che se V non fosse uno spazio vettoriale, le espressioni ||αx|| e ||x + y|| che compaiono nella definizione non avrebbero senso, perché non sarebbero definite le operazioni αx e x + y. I seguenti sono esempi di norme. Consideriamo innanzitutto lo spazio vettoriale S = Rn. Avremo quindi: a) Norma euclidea (o L2), x ≡ n ∑ xi2 i =1 n b) Norma L1, x ≡ ∑ xi i =1 cap2.pmd 57 15/02/2004, 11.48 58 Distanze e variazioni: gli spazi metrici c) Norma L2, x ≡ max xi 1≤i ≤ n Esercizio 2.2 Controllate che le proprietà, indicate nella definizione 2.1.3, siano verificate nel caso delle norme: n a) Norma L1, x ≡ ∑ xi i =1 b) Norma L2, x ≡ max xi ■ 1≤i ≤ n Esercizio 2.3 Controllate che le proprietà, indicate nella definizione 2.1.3, siano verificate nel caso ■ della norma euclidea. Consideriamo ora l’insieme C[a,b] delle funzioni continue il cui dominio sia un dato intervallo chiuso [a, b]. Avremo dunque d) Norma uniforme g (.) = max g (t ) t ∈[ a ,b ] Una norma analoga si può definire per l’insieme S composto dalle sequenze infinite e limitate di numeri reali a = {a0, a1, ..., ak, ...} a = max a k C[1a ,b] Infine, considerando l’insieme composto dalle funzioni continue e dotate di derivata prima continua con dominio [a, b], si può definire: e) g (.) = max g (t ) + max g (t ) t ∈[ a ,b ] t ∈[ a ,b ] dove g (t ) è la derivata prima di g(t). Che chiameremo norma uniforme estesa1. 1 Le due norme, uniforme e uniforme estesa, possono essere riformulate ponendo ‘sup’ (con il che si intende il limite superiore) al posto di ‘max’: in questo modo le due norme possono applicarsi ad insiemi di funzioni o di sequenze che non hanno un massimo, ma che sono superiormente limitate. cap2.pmd 58 15/02/2004, 11.48 2.1 Spazi metrici e spazi dotati di norma 59 Esercizio 2.4 Considerate le due funzioni f 1 (t ) = 4t + 5 f 2 (t ) = t + 4 definite nell’intervallo chiuso [–10,5]. Calcolatene la distanza utilizzando prima la ■ norma uniforme e poi la norma uniforme estesa. Stabiliamo ora una relazione tra norma e funzione di distanza. Definizione 2.1.4 Dato uno spazio vettoriale V dotato della norma ||(.)||: V → R, la funzione ρ(.,.): V × V → R definita nel modo seguente ρ( x, y ) ≡ x − y ■ si dice distanza indotta dalla norma. Che ρ(x, y) = ||x – y|| sia effettivamente una funzione di distanza si può verificare facilmente. Dunque, per ognuna delle norme citate prima è possibile definire una distanza. Ad esempio, le distanze indotte dalle norme a), b) e c) sono rispettivamente: a) (distanza euclidea) ρ(x, y ) = (x − y )' (x − y ) n b) ρ(x, y ) = ∑ xi − yi i =1 c) ρ(x, y ) = max xi − yi 1≤i ≤ n Mentre dalle norme uniforme e uniforme estesa otterremo rispettivamente le distanze ρ( g (.), f (.)) = max g (t ) − f (t ) t ∈[ a ,b ] ρ( g (.), f (.)) = max g (t ) − f (t ) + max g (t ) − f (t ) t ∈[ a ,b ] t ∈[ a ,b ] per ogni g(.), f(.) ∈ S[a,b]. cap2.pmd 59 15/02/2004, 11.48 60 Distanze e variazioni: gli spazi metrici La distanza che più spesso utilizzeremo in questo libro, quando lo spazio metrico sia Rn sarà la distanza euclidea. È il caso di notare che se n = 1, la norma euclidea ||x|| si riduce al valore assoluto di x, indicato con |x|. Come ultima osservazione sulle distanze L e L1, può essere istruttivo notare che, a seconda della funzione di distanza che utilizziamo, un intorno che abbia, ad esempio, il centro nell’origine e raggio unitario, cambierà forma (figura 2.1). 2.2 Continuità e convergenza La nozione di continuità di una funzione è ben nota a partire dai corsi elementari di analisi e è per questo motivo che fino a ora abbiamo fatto più volte riferimento all’insieme delle funzioni continue C[a,b] e a quello delle funzioni con derivata prima continua, C1[a ,b] . Sulla base della nozione di spazio metrico, siamo ora in grado di fornire una definizione di questo concetto, così come di quello di convergenza. Definizione 2.2.1 Data una funzione reale di una sola variabile reale, f(.): D ⊆ R → R diciamo che f(.) è continua in un punto x ∈ R se: x ∈ D; lim f ( x) = lim f ( x) = f ( x ) x→ x+ x→ x− cioè per ogni δ > 0 esiste un ε > 0 tale che: x − x < ε ⇒ f ( x) − f ( x ) < δ ■ Il concetto di continuità si può facilmente generalizzare a funzioni il cui dominio e codominio siano contenuti in spazi metrici diversi da R. Figura 2.1 cap2.pmd 60 15/02/2004, 11.48 2.2 Continuità e convergenza 61 Definizione 2.2.2 Data una generica funzione M(.): U → V dove U, V sono spazi metrici dotati rispettivamente delle funzioni di distanza ρU, ρV, consideriamo x ∈U . M(.) è continua in x se per qualsiasi δ > 0 esiste un ε > 0 tale che ρU ( x, x ) < ε ⇒ ρV(M(x), M ( x )) < δ. ■ Una classe di funzioni più ampia rispetto alle funzioni continue è quella delle funzioni continue a tratti. Definizione 2.2.3 Una funzione f(t): [a, b] → R è continua a tratti in [a, b] se esiste un numero finito di punti x1, x2, ..., xk, ∈ [a, b] tali che: lim f ( x) ≠ lim f ( x) (con entrambi i limiti finiti) x→ xi + x→ xi − e lim f ( x) = f ( xi ) oppure lim f ( x) = f ( xi ) x→ xi + x→ xi − i = 1, 2,..., k ■ In altri termini, una funzione è continua a tratti se, in un numero finito di punti è definita, ma il limite destro e sinistro (entrambi finiti) differiscono in tali punti e uno di essi coincide con il valore della funzione nel punto. Il grafico riportato nella figura 2.2 ne fornisce un esempio. Figura 2.2 cap2.pmd 61 15/02/2004, 11.48 62 Distanze e variazioni: gli spazi metrici Passiamo ora al concetto di convergenza. La proprietà di convergenza si riferisce a una sequenza di punti in uno spazio metrico. Definizione 2.2.4 Si dice che una sequenza {xn} in uno spazio metrico V converge a un punto x ∈V se ogni intorno di x , N ( x , ε) contiene tutti gli elementi della sequenza a ■ partire da un certo xnε in avanti. Introduciamo ora una distinzione nell’ambito della nozione di convergenza, che si applica a spazi i cui elementi sono funzioni. Sia S uno spazio metrico i cui elementi sono funzioni, dotato della funzione di distanza ρS(.,.). Il dominio di tali funzioni è D e il codominio Y. Sul codominio è definita una distanza ρY(.,.). Definizione 2.2.5 Data una sequenza {f n } in S e una funzione f (.) ∈ S , se per ogni ε > 0 e ogni x ∈ D esiste un N tale che n ≥ N ⇒ ρY ( f n ( x), f ( x)) ≤ ε, allora si dice che {f n } converge in modo puntuale a f rispetto alla distanza ρY(.,.). Se invece, per ogni ε > 0 esiste un N tale che n ≥ N ⇒ ρY ( f n ( x), f ( x)) ≤ ε, e tale N è indipendente dallo specifico valore x ∈ D nel quale le funzioni sono valutate, allora si dice che {f n } converge uniformemente a f rispetto alla di■ stanza ρY(.,.). Esercizio 2.5 Considerate una sequenza di funzioni appartenente all’insieme C[a,b], sul quale è definita la norma uniforme: f (.) U = max f ( x) x∈[ a ,b ] Mostrate che se tale sequenza converge a una funzione f in base a questa norma, allo■ ra la sequenza converge uniformemente rispetto alla norma euclidea ||f(.)|| = |f(x)|. 2.3 Insiemi chiusi e aperti Le idee di “chiuso” e “aperto” riferite a insiemi sono tra le più importanti in matematica e nelle applicazioni economiche. cap2.pmd 62 15/02/2004, 11.48 2.3 Insiemi chiusi e aperti 63 Definizione 2.3.1 Dato uno spazio metrico S, e un sottoinsieme A ⊆ S. • • • • • • un punto x ∈ S tale che ogni intorno aperto di x contenga infiniti punti di A si dice punto di accumulazione di A. se esiste un intorno del punto x ∈ A che non contenga altri punti di A oltre a x stesso, quest’ultimo si chiama punto isolato. l’unione di A e dei suoi punti di accumulazione si chiama chiusura di A (indicata come cl(A)) se esiste un intorno, con centro in x ∈ A, interamente contenuto in A, x è un punto interno di A. l’interno di A (Int(A)) è l’insieme dei punti interni di A. l’insieme φ(A) ≡ {x ∈ S : x ∈ cl(A), x ∉ Int(A)} si chiama frontiera di A. ■ Notate che i punti di accumulazione di A non devono necessariamente fare parte di A; quindi, per definizione è vero che A ⊆ cl(A), ma il contrario non è necessariamente vero. Procediamo ora a definire i concetti di insieme chiuso o aperto. Definizione 2.3.2 Un sottoinsieme A di uno spazio metrico S è aperto se x ∈ A ⇒ x ∉ Int(A), cioè se tutti i suoi punti sono interni. ■ Un sottoinsieme A di uno spazio metrico S è chiuso se A = cl(A). I tre seguenti risultati provano alcune proprietà fondamentali degli insiemi aperti o chiusi. Proposizione 2.3.1 Se A è chiuso, il complemento di A, cioè A ≡ { x ∈ S , x ∉ A} è aperto. ■ Prova: considerate un qualsiasi punto y ∈ A; dato che A è chiuso, esso contiene tutti i propri punti di accumulazione, e dunque y non è un punto di accumulazione di A. Questo implica che esiste almeno un intorno con il centro in y il quale non contiene punti di A, cioè del tutto contenuto in A. Ma allora, qualsiasi y appartenente ad A appartiene all’interno di A, il che significa che A è aperto. Proposizione 2.3.2 L’intersezione di un numero arbitrario di insiemi chiusi è un insieme chiuso. ■ L’unione di un numero finito di insiemi chiusi è un insieme chiuso. cap2.pmd 63 15/02/2004, 11.48 64 Distanze e variazioni: gli spazi metrici Prova: considerate una collezione infinita di insiemi chiusi: A1, A2, ..., Ak, ... e la loro intersezione A = ∩ Ak k Se x ∈ cl(A), allora in qualsiasi intorno con centro in x sono allora contenuti infiniti punti di A (che sono a loro volta infiniti punti appartenenti a ciascuno degli insiemi della collezione A1, A2, ..., Ak, ...). Perciò se x ∈ cl(A), x è un punto di accumulazione di ciascuno degli insiemi della collezione. Ma, essendo questi ultimi, per ipotesi, insiemi chiusi è anche vero che x, appartiene a ciascuno di essi e dunque x ∈∩ Ak = A k Quindi abbiamo provato che x ∈ cl(A) ⇒ x ∈ A, cioè A è chiuso. Considerate una collezione finita di insiemi chiusi A1, A2, ..., An e la loro unione n B = ∪ Ak k =1 Considerate qualsiasi x ∉ B. Dato che gli insiemi A1, A2, ..., An sono chiusi, x non può essere punto di accumulazione di nessuno di essi. Quindi, per ogni insieme della collezione A1, A2, ..., An, qualsiasi intorno con centro in x contiene al più un numero finito di punti appartenenti a quell’insieme e, di conseguenza, non più di un numero finito di punti di B. Ma allora, se x ∉ B, x non è un punto di accumulazione di B. Un altro modo di dire la stessa cosa è che se x ∈ cl(B), allora x ∈ B, che significa che B è chiuso. Proposizione 2.3.3 L’unione di un numero arbitrario di insiemi aperti è un insieme aperto. ■ L’intersezione di un numero finito di insiemi aperti è un insieme aperto. Prova: considerate una collezione infinita di insiemi aperti: A1, A2, ..., Ak, ... e la loro unione A = ∪ Ak k A, il complemento di A, è composto di punti che non appartengono a nessuno degli insiemi A1, A2, ..., Ak, .... In altri termini A = ∩ Ak k Dato che gli insiemi A1, A2, ..., Ak, ..., sono aperti, i loro complementi sono chiusi (proposizione 3.1) e la loro intersezione A = ∩ Ak è chiusa (proposizione 2.3.2) k Ma se A è chiuso, il suo complemento A è aperto. cap2.pmd 64 15/02/2004, 11.48 2.3 Insiemi chiusi e aperti 65 Considerate ora una collezione finita di insiemi aperti A1, A2, ..., An e la loro intersezione n B = ∩ Ak k =1 Se un certo x non appartiene a B, allora appartiene al complemento di almeno uno degli insiemi A1, A2, ..., An; quindi l’insieme degli x che non appartengono a B è l’unione degli x che fanno parte dei complementi di A1, A2, ..., An, ovvero n B = ∪ Ak k =1 Ma allora B è l’unione di un numero finito di insiemi chiusi, e è chiuso a sua volta. Di conseguenza, il complemento di B (cioè B) è aperto. Nelle due proposizioni successive si stabiliscono relazioni tra le proprietà di apertura e chiusura di insiemi e le proprietà di convergenza e di continuità di sequenze e funzioni a tali insiemi associate. La prima di esse definisce una condizione necessaria e sufficiente perché un insieme sia chiuso. Proposizione 2.3.4 S è un insieme chiuso se e solo se è vero che, quando una sequenza {xn} ∈ S ■ converge a un punto x , allora x ∈ S . Prova: supponiamo in primo luogo che, se x è il punto di convergenza di una sequenza interamente contenuta in S, allora x appartiene a S. Sarà allora sufficiente mostrare che tutti i punti di accumulazione di S sono punti di convergenza di una sequenza contenuta in S, per provare che, nell’ipotesi citata, tutti i punti di accumulazione di S appartengono a S, il che corrisponde alla definizione di un insieme chiuso. Consideriamo allora un punto di accumulazione di S, che chiamiamo x . Ogni intorno di x contiene infiniti elementi di S. Possiamo allora costruire una sequenza convergente a x nel modo seguente: per n = 1, 2, ... selezioniamo un punto di S, che chiamiamo xn, tale che ρ( xn , x ) = 1/n. La sequenza {xn} ha dunque la proprietà che n ≥ nε implica ρ( xn , x ) ≤ ε, dove nε è l’intero immediatamente superiore a 1/ ε, con ε positivo e arbitrariamente prossimo a 0. Quindi la sequenza {xn} converge a x . Ora supponiamo che S sia chiuso e consideriamo una sequenza {xn} che converge a un punto x . Pertanto, per ogni ε > 0, esiste un nε tale che n ≥ nε implica ρ( xn , x ) ≤ ε. Ciò vuol dire che ogni intorno di x contiene infiniti punti di S, quelli appartenenti alla sequenza {xn}. Ma allora x è un punto di accumulazione di S e appartiene a S, dato che quest’ultimo è chiuso. Introduciamo la successiva proposizione con una definizione. cap2.pmd 65 15/02/2004, 11.48 66 Distanze e variazioni: gli spazi metrici Definizione 2.3.3 Data una funzione f(.): U → V, per ogni sottoinsieme A ⊆ V, l’immagine inversa di A è l’insieme: f −1 ( A) ≡ { x ∈U : f ( x) ∈ A} ■ La proposizione seguente caratterizza la funzioni continue mediante le proprietà delle loro immagini inverse. Proposizione 2.3.5 Data una funzione f(.): U → V dove U, V sono spazi metrici dotati rispettivamente delle funzioni di distanza ρU, ρV, f(.) è continua se e solo se per ogni A ⊆ V ■ aperto, allora anche f–1(A) è aperto. Prova: supponete in primo luogo che f(.) sia continua. Considerate un certo A ⊆ V e supponete che x ∈ f −1 ( A); di conseguenza, y = f ( x ) ∈ A. Se A è aperto, allora esiste un δ > 0 tale che ρV ( y, y ) < δ implica y ∈ A. D’altro canto, dato che f(.) è continua, esiste un ε tale che ρU ( x, x ) < ε implica ρV ( f ( x), y ) < δ. Ciò significa che esiste un intorno di x di raggio ε che è interamente contenuto in f–1(A). Dunque, se A è aperto, x ∈ f −1 ( A) implica che x sia un punto interno di f–1(A), cioè f–1(A) è aperto. Supponete ora che se A è aperto, anche f–1(A) sia necessariamente un insieme aperto. Consideriamo un x ∈U e definiamo A ≡ { y : ρV ( y, f ( x )) < δ} . Dato che A è aperto, allora esiste un ε tale che ρU ( x, x ) < ε implica x ∈ f −1 ( A). Ma allora ρU ( x, x ) < ε implica ρV ( f ( x), f ( x )) < δ per qualsiasi δ e un appropriato ε, il che corrisponde alla definizione di continuità. Il seguente esercizio è un’applicazione della proposizione 2.3.4. La proposizione 2.3.5 viene utilizzata invece nel paragrafo 2.4. Esercizio 2.6 Dato uno spazio metrico S, dotato della funzione di distanza ρ(.,.) dimostrate, servendovi delle proposizioni 2.3.1 e 2.3.4, che l’intorno N(x*, ε) = {x ∈ S: ρ(x, x*) ≤ ε} è un insieme chiuso e che l’intorno L(x*, ε) = {x ∈ S: ρ(x, x*) < ε} è un insieme ■ aperto. 2.4 L’assioma di continuità nella teoria dell’utilità La teoria microeconomica del consumatore si basa sulla nozione di preferenza. Più formalmente, dato un insieme U (per il consumatore, l’insieme dei panieri), si ipotizza esista una relazione P, definita su U × U, detta relazione di preferenza, che si indica come segue: x ≥p y (dove x, y ∈ U) e che si esprime verbalmente con la frase “x è cap2.pmd 66 15/02/2004, 11.48 2.4 L'assioma di continuità nella teoria dell'utilità 67 preferito o indifferente a y”. Ogni consumatore è quindi caratterizzato da una relazione di preferenza (i “gusti” del consumatore). Dato un ordinamento di preferenza P, diciamo che u(.): U → R è una funzione di utilità se, per ogni x, y ∈ U, gode della seguente proprietà di “rappresentare” l’ordinamento di preferenza: u ( x) ≥ u ( y ) ⇔ x ≥ P y In sostanza, una funzione di utilità non è altro che un metodo per attribuire ai diversi panieri un “punteggio”, in modo tale ai panieri preferiti sia attribuito un punteggio maggiore di quello associato ai panieri meno graditi al consumatore2. Un importante risultato, nella storia della teoria del consumatore è stato quello di chiarire sotto quali condizioni è effettivamente possibile definire un “punteggio” di questo genere e rappresentare le preferenze individuali mediante una funzione di utilità continua. Tali condizioni (note come assiomi sulle preferenze) sono le seguenti: 1) per ogni x, y ∈ U, x ≥p y, oppure x ≥p x, oppure entrambe le affermazioni sono vere (assioma di completezza); 2) per ogni x ∈ U, x ≥p x (assioma di riflessività); 3) per ogni x, y, z ∈ U, se x ≥p y e x ≥p z, allora x ≥p z (assioma di transitività); 4) per ogni y ∈ U, l’insieme S(y): { x ∈ U : x ≥p y} è chiuso (assioma di continuità). Mentre i primi due assiomi si limitano in sostanza a postulare che la relazione di preferenza sia definita su tutti i panieri e che ciascun paniere sia confrontabile con se stesso, e il terzo introduce una requisito di coerenza nel sistema delle preferenze, il quarto assioma ha un contenuto meno immediato. Esso svolge due funzioni: da un lato, esso serve a dimostrare che, per un ordinamento di preferenze che rispetti appunto i tre assiomi, esiste una funzione di utilità che rappresenta tali preferenze; dall’altro, serve a dimostrare che tale funzione è continua (da cui il nome di assioma di continuità). In questo paragrafo esamineremo questo secondo aspetto. Per chi fosse invece interessato alla dimostrazione dell’esistenza di una funzione di utilità, rinviamo a Mas-Colell et al. (1995). Ci proponiamo cioè di dimostrare la seguente proposizione. Proposizione 2.4.1 Dato un ordinamento di preferenza che soddisfa gli assiomi 1., 2., 3, 4. La fun■ zione di utilità che lo rappresenta è continua. 2 Si noti che, data una funzione T(.): R → R monotona non decrescente, allora W(.): R → R ≡ T(u(.)) costituisce anch’essa una funzione di utilità. Infatti: W(x) ≥ W(y) ⇔ T(u(x)) ≥ T(u(y)) ⇔ u(x) ≥ u(y) ⇔ x ≥p y. cap2.pmd 67 15/02/2004, 11.48 68 Distanze e variazioni: gli spazi metrici Prova: consideriamo un certo paniere x* e l’utilità a esso associata, u(x*). Definiamo A = {α ∈ R: α < u(x*)}, ovvero A = (–∞, u(x*)), un intervallo aperto. L’immagine inversa di A è pertanto u–1(A) = {x ∈ U: u(x) < u(x*)}. Ma u–1(A) si può definire in questo caso anche nel modo seguente u–1(A) = {x ∈ U: x ∉ S (x*)}, ossia come il complemento di S(x*): { x ∈ U : x ≥p x*}. Infatti, per la definizione di funzione di utilità u(x) ≥ u(x*) ⇒ x ∈ S(x*), per cui u(x) < u(x*) ⇒ x ∉ S(x*). Ma dato che per l’ipotesi di continuità S(x*) è chiuso, allora il suo complemento, ovvero u–1(A) è un insieme aperto. Dunque il fatto che A sia aperto comporta che u–1(A) sia aperto, e ciò implica, per la proposizione 2.3.5, che u(.) sia continua. 2.5 Differenziazione 2.5.1 Derivate e differenziali di una funzione di una sola variabile: una breve rassegna In questo e nel successivo paragrafo esamineremo successive generalizzazioni della nozione di derivata. Per questo cominciamo con una presentazione dei concetti di derivata e di differenziale nel caso più semplice, ponendo l’accento sulle caratteristiche esso ha in comune con altri casi più complessi e generali. Non dedicheremo invece spazio alle tecniche di derivazione, cioè al calcolo delle derivate di una funzione, rinviando il lettore a testi di base di matematica generale. Consideriamo una funzione reale di una sola variabile reale f(.): R → R. Nei due punti x0 e x0 + h essa assume rispettivamente i due valori f(x0) e f(x0 + h). L’espressione: ∆f ( x0 ; h) = f ( x0 + h) − f ( x0 ) è la variazione subita dalla funzione al variare di x da x0 a x0 + h. Vogliamo ora determinare una costante a tale che ah costituisca una approssimazione di ∆f(x0; h). In altre parole, vogliamo trovare una funzione lineare di h che approssimi la vera variazione della funzione. Limitiamoci per il momento al caso in cui h è positivo. Il primo requisito di una approssimazione è che l’errore di approssimazione tenda a 0 al tendere a 0 della variazione h, ovvero: lim ∆f ( x0 ; h) − ah = lim f ( x0 + h) − f ( x0 ) − ah = 0 h→ 0 + h→ 0 + È facile notare però che questo primo requisito o non è soddisfatto, oppure lo è indipendentemente dal valore di a. In realtà, affinché sia soddisfatto è sufficiente che f(.) sia continua. Possiamo allora imporre un requisito più stringente, ovvero, che l’errore di approssimazione tenda a 0 una volta normalizzato al valore di h, ovvero cap2.pmd 68 15/02/2004, 11.48 2.5 Differenziazione 69 lim h→ 0 + f ( x0 + h) − f ( x0 ) − ah ∆f ( x0 ; h) = −a=0 h h (2.5.1) Questo requisito invece non è soddisfatto, ammesso che lo sia, indipendentemente dal valore prescelto per a. Quest’ultimo infatti deve essere il limite destro (per h tendente a 0) del rapporto f ( x0 + h) − f ( x0 ) ∆f ( x0 ; h) = h h detto rapporto incrementale. Un requisito ancora più stringente del precedente è che il rapporto incrementale tenda a 0 non solo quando h tende a 0 per valori positivi, ma anche quando vi tende per valori negativi; in sintesi, richiediamo che lim h →0 + f ( x0 + h) − f ( x0 ) f ( x0 + h) − f ( x0 ) = lim = h →0 − h h = lim h →0 f ( x0 + h) − f ( x0 ) =a h (2.5.2) Tale requisito si può esprimere anche con la notazione alternativa: f ( x0 + h) − f ( x0 ) − ah = o( h ) (2.5.3) L’espressione (2.5.3) (dove il termine o|(h)| si chiama o di Landau) significa appunto, semplicemente, che lim h →0 f ( x0 + h) − f ( x0 ) − ah =0 h e si può utilizzare, secondo la convenienza, in modo equivalente. Notate che affinché il limite del rapporto incrementale sia finito, per h che tende a 0 in valore assoluto, è necessario (anche se non sufficiente) che il numeratore del rapporto incrementale stesso tenda a 0, ovvero lim f ( x0 + h) = f ( x0 ) h→ 0 Ciò significa che la funzione deve essere continua, ma, come si è detto, questa è solo una condizione necessaria, non sufficiente, affinché per qualche valore di a la relazione 2.5.1 sia verificata. Supponiamo ora che la condizione (2.5.2) sia verificata per una valore finito di a. Se ciò è vero, diciamo che la funzione possiede una derivata prima nel punto x0, cap2.pmd 69 15/02/2004, 11.49 70 Distanze e variazioni: gli spazi metrici oppure che è derivabile in x0. La derivata altro non è che questo unico limite il quale corrisponde al valore, da noi ricercato, di a. D’ora in avanti, però, per indicare la derivata prima di una funzione non useremo più il generico simbolo a, che abbiamo impiegato a scopo espositivo, ma la notazione f '(x0). Tale notazione sottolinea la dipendenza della derivata (qualora questa esista) dal punto x0 rispetto al quale si considerano le variazioni. Infatti, supponiamo che una certa funzione sia derivabile su di un certo intervallo (a, b) ⊆ R. Ciò significa, per definizione, che per ogni x ∈ (a, b) esiste uno e un solo valore f '(x) che costituisce appunto la derivata di f(.) in x. Ma allora la derivata si può considerare a sua volta come una funzione f '(.): (a, b) → R (una notazione alternativa per indicare la funzione f '(.): (a,b) → R è Df). Se tale funzione f '(.) è a sua volta continua, si dice che f(.) (derivabile in (a, b)) è liscia sullo stesso intervallo (nel paragrafo 1 abbiamo già indicato l’insieme di queste funzioni 1 con il simbolo C[a ,b] . Infine, una funzione si dice liscia a tratti in (a, b) se è continua, mentre la sua derivata prima è continua a tratti. La funzione nel grafico della figura 2.3 è un esempio di funzione liscia a tratti. Si noti infine che f '(.) potrebbe a sua volta essere derivabile. Chiameremo tale derivata la derivata seconda di f(.). L’espressione f '(x0)h, vale a dire la funzione lineare di h, che approssima la “vera” variazione ∆f(x0; h) = f(x0 + h) – f(x0), si chiama differenziale di f(.) nel punto x0. Spesso la variazione che noi abbiamo designato come h viene indicata con d x. Vi è però una importante differenza. Di norma, con d x si intende una variazione infinitesimale; tuttavia la definizione di differenziale non è valida solo per variazioni “piccole”, ma per qualsiasi valore di h. Naturalmente, quanto più grande in valore assoluto è h, tanto “peggiore” sarà l’approssimazione fornita dal differenziale. Una Figura 2.3 cap2.pmd 70 15/02/2004, 11.49 2.5 Differenziazione 71 volta chiarito questo punto, si possono utilizzare entrambe le notazioni in tutti i casi in cui non facciano sorgere equivoci. Laddove h viene intesa come prossima a 0 a piacere, allora il differenziale viene indicato come d f(x0) = f '(x0) d x. Una notazione alternativa alla nostra (e più antica) per indicare la derivata prima è quindi d f ( x0 ) dx 2.5.2 Funzioni a più variabili e derivate parziali Cosa cambierebbe se volessimo estendere la nozione di derivata da una funzione a una sola variabili a funzioni di più variabili reali, come ad esempio la seguente f(.): Rn → R? La principale complicazione risiede nel fatto che, mentre una variabile scalare può variare al più in due direzioni (aumentando o diminuendo), una variabile vettoriale può variare in infinite direzioni, come è evidente dalla figura 2.4. Vedremo che ogni generalizzazione della nozione di derivata appena studiata, corrisponde a una particolare scelta del tipo di variazione da prendere in considerazione. In questo paragrafo ci dedichiamo alla nozione di derivata parziale. Supponiamo inizialmente che la funzione sia a due variabili, f(.): R2 → R e fissiamo, nel grafico della figura 2.5 un certo punto x0 ∈ R2. Con la nozione di derivata parziale, si prendono in considerazione unicamente variazioni del tipo descritto nella figura 2.5, ovvero nelle quali, rispetto al punto iniziale x0, varia una sola variabile a parità di valore dell’altra. Se ci si muove lungo le frecce orizzontali, si mantiene costante il valore di x2 e si fa variare, in aumento o in diminuzione, l’altra variabile. L’opposto è vero se ci muove lungo le frecce verticali. Figura 2.4 cap2.pmd 71 15/02/2004, 11.49 72 Distanze e variazioni: gli spazi metrici Figura 2.5 Più in generale, supponiamo che vi siano n variabili indipendenti. Definiamo ei ∈ Rn come il vettore che ha 1 nella i-esima posizione e 0 altrove. L’espressione ∆f (x0 ; λei ) ≡ f ( x0 + λei ) − f ( x0 ) rappresenta dunque la variazione subita dalla funzione allorché tutte le variabili restano costanti tranne la i-esima, che subisce una variazione pari a λ. Ancora, cercheremo una funzione lineare di λ, aλ, costituisca una approssimazione di tale “vera” variazione, ovvero tale che: ∆f (x0 ; λei ) − aλ = f ( x0 + λei ) − f ( x0 ) − aλ = o( λ ) (2.5.4) Bisogna quindi che i limiti lim f (x0 + λei ) − f (x0 ) λ lim f (x0 + λei ) − f (x0 ) λ λ →0+ λ →0− esistano, siano finiti e coincidano. Questo comune limite (il valore di a da noi ricercato) si chiama derivata parziale di f(.) rispetto a xi in x0 ed è indicato con varie possibili notazioni: le principali sono ∂f ( x ) e fi (x0 ) ∂xi x = x 0 cap2.pmd 72 15/02/2004, 11.49 2.5 Differenziazione 73 Una notazione più snella rispetto alla prima è ∂f ( x 0 ) ∂xi e verrà utilizzata tutte le volte in cui non dia luogo a equivoci. L’espressione ∂f ( x ) ∂x λ i ovvero il termine che approssima la variazione della funzione si dice differenziale parziale. La variazione λ è anche indicata come d xi. Per quanto uno studio delle tecniche di derivazione non sia tra gli scopi di questo capitolo, si può ricordare che il calcolo di una derivata parziale non comporta alcuna difficoltà aggiuntiva rispetto al calcolo della derivata di una funzione a una sola variabile. Si tratta infatti di considerare, volta a volta, tutte la variabili diverse dalla i-esima, come costanti, e la funzione f(.) come una funzione della sola variabile i-esima, anche ai fini della derivazione. La successiva definizione introduce una utile notazione matriciale. Definizione 2.5.1 Data una funzione f(.): Rn → R che abbia derivate parziali rispetto a tutte le n variabili, il vettore: ∂f ( x ) ∂f ( x ) ∂f ( x ) ∇f ( x ) ≡ ... ∂x2 ∂xn ∂x1 ■ si dice gradiente di f(x). Considerate ora la derivata parziale fi(x0). Essa dipende in generale da quale punto x0 è stato prescelto come valore iniziale, a partire dal quale sono calcolate le variazioni. Pertanto essa è una funzione a più variabili. Possiamo perciò fornire la seguente definizione. Definizione 2.5.2 Se la derivata parziale i-esima di f(.): Rn → R, ossia fi (.) ≡ cap2.pmd 73 ∂fi (.) : Rn → R ∂xi (.) 15/02/2004, 11.49 74 Distanze e variazioni: gli spazi metrici è continua in x, per ogni i = 1, 2, ..., n, allora si dice che f(.) è una funzione liscia di x. Se fi(.) possiede a sua volta derivate parziali, queste si chiamano derivate seconde parziali di f(.). La derivata prima parziale rispetto a xk della derivata prima parziale di f(.) rispetto a xi si indica con una delle seguenti notazioni: ∂f i ( x ) ∂ 2 f ( x) = fik (x) = ∂xk ∂xi ∂xk Se k ≠ i, allora si dice che fik(x)è una derivata seconda parziale mista di f(.). ■ D’altro canto, se la derivata parziale rispetto a xi, fi(x), può considerarsi una funzione a più variabili, se essa possiede derivate parziali (e quindi se f(.) possiede derivate seconde parziali) sarà possibile definire per essa il vettore gradiente, che sarà così composto: ∇fi (x) ≡ [ fi1 (.) fi 2 (.) ... fin (.) ] Se poi per ogni derivata parziale prima di f(.) calcoliamo tale gradiente, e se riuniamo ordinatamente questi vettori come righe di una matrice, ciò che otterremo sarà: ∇f1 ( x) f11 ( x) f12 ( x) ∇f ( x ) f ( x ) ... 2 = 21 H f ( x) ≡ ... ... ... ... ∇f n ( x) f n1 ( x) ... f1n ( x) ... ... ... ... ... f nn ( x) Questa matrice è nota come matrice hessiana di f(x). Si può formulare la seguente proposizione. Proposizione 2.5.1 Se le derivate seconde parziali di una funzione f(.): Rn → R sono continue (cioè se le derivate parziali prime di f(.) sono tutte funzioni lisce) allora la matrice ■ hessiana è simmetrica. Infine, definiamo per uso futuro la matrice ∇f ( x ) 0 H bf (x) ≡ (∇f (x))' H f (x) che si dice matrice hessiana orlata. cap2.pmd 74 15/02/2004, 11.49 2.5 Differenziazione 75 Esercizio 2.7 Calcolate il gradiente, la matrice hessiana e la matrice hessiana orlata per le seguenti funzioni a) f(x, y) = Axαyβ. b) f(x, y) = (x + yβ)γ. c) f(p, m, q) = (p + m) ⋅ D(p, q) – C(m) dove D(.,.): R2 → R e C(.): R → R. ■ 2.5.3 La formula di Taylor Data una funzione f(.): [a, b] → R, sappiamo che la variazione f(b) – f(a) è approssimata da f '(a)(b – a), con un certo errore di approssimazione. La formula di Taylor pone questo errore di approssimazione in relazione con i valori assunti dalle derivate di ordine superiore al primo. Cominceremo enunciando un noto teorema, che utilizzeremo poi per la dimostrazione successiva. Proposizione 2.5.2 (Teorema di Rolle) Se f(.): [a, b] → R è una funzione differenziabile ovunque nell’intervallo [a, b] e ■ se f(a) = f(b), allora esiste almeno un punto ξ ∈ (a, b) tale che f'(ξ) = 0. Sulla base del teorema di Rolle si può dimostrare la seguente proposizione. Proposizione 2.5.3 (Teorema di Cauchy) Se f(.): [a, b] → R e g(.): [a, b] → R sono funzioni differenziabili ovunque nell’intervallo [a, b] e se g'(.) ≠ 0, allora esiste almeno un punto ξ ∈ (a, b) tale che f (b) − f (a ) f’(ξ) = g (b) − g (a ) g’(ξ) ■ Prova: definiamo la funzione φ(x) = (g(b) – g(a))f(x) + (f(a) – f(b))g(x), che, nelle ipotesi del teorema è ovunque differenziabile in [a,b]. Inoltre φ(a) = g(b)f(a) – f(b)g(a) = φ(b). Pertanto φ(x) soddisfa le ipotesi del teorema di Rolle. Esiste dunque un punto ξ ∈ (a, b) tale che φ'(ξ) = (g(b) – g(a))f'(ξ) + (f(a) – f(b))g'(x) = 0, il che dimostra la proposizione. Proposizione 2.5.4 (Teorema di Taylor per funzioni di una variabile) Se f(.): [a, b] → R possiede derivate fino all’ordine n-esimo ovunque nell’intervallo [a, b], allora: f (b) = f (a ) + (b − a ) f’(a ) + cap2.pmd 75 (b − a ) 2 (b − a ) n −1 n −1 f" (a ) + ... + f (a ) + Tn 2! (n − 1)! 15/02/2004, 11.50 76 Distanze e variazioni: gli spazi metrici dove: Tn = (b − a ) n n f (ξ ) n! ■ Prova: definiamo la funzione φ( x) = f ( x) + (b − x) f’( x) + (b − x) 2 (b − x) n −1 n −1 f" ( x) + ... + f ( x) 2! (n − 1)! che, nelle ipotesi del teorema è ovunque differenziabile in [a, b]. La derivata è: φ′( x) = (b − x)n −1 n f ( x) (n − 1)! Definiamo inoltre la funzione ψ(x) = (b – x)n. Per il teorema di Cauchy f n ( ξ) φ(b) − φ(a) φ′(ξ) = = ψ(b) − ψ(a) ψ ′(ξ) −(n − 1)!n Inoltre (b − a ) 2 (b − a ) n −1 n −1 φ(b) − φ(a ) = f (b) − f (a ) + (b − a ) f’(a ) + f" (a ) + ... + f (a) (n − 1)! 2! e ψ(b) – ψ(a) = (b – a)n. Pertanto: (b − a ) 2 (b − a ) n −1 n −1 f n (ξ) f (b) − f (a ) + (b − a ) f’(a ) + f" (a ) + ... + f (a) = (b − a ) n 2! (n − 1)! n! il che conclude la dimostrazione. Il teorema può essere generalizzato a funzioni di n variabili. Noi proveremo la generalizzazione al caso a due variabili e proporremo senza una prova formale l’estensione della formula di Taylor al caso generale (in entrambi i casi, limitatamente al termine di secondo grado). Proposizione 2.5.5 (Teorema di Taylor per funzioni a due variabili) Se f(.): R2 → R possiede derivate parziali prime e seconde, allora: f ( x1 + h1 , x2 + h2 ) = f ( x1 , x2 ) + ( f x1 ( x1 , x2 )h1 + f x2 ( x1 , x2 )h2 ) + + cap2.pmd ( f11 ( x1 + h1 , x2 + h2 ) h12 + f 22 ( x1 + h1 , x2 + h2 )h2 2 + f12 ( x1 + h1 , x2 + h2 ) h1h2 + f 21 ( x1 + h1 , x2 + h2 ) h1h2 ) 2! 76 15/02/2004, 11.50 2.6 Differenziazione dove 77 h12 + h22 ≤ h12 + h2 2 . ■ Prova: definiamo la funzione g (t ) ≡ f ( x1 + th1 , x2 + th2 ) t ∈[0,1] Pertanto, per la proposizione 2.5.3, avremo: g (1) = g (0) + g' (0) + 1 g" ( t ) dove t ∈[0,1] 2! ma g (1) = f ( x1 + h1 , x2 + h2 ); g (0) = f ( x1 , x2 ) g' (0) = f x1 ( x1 , x2 )h1 + f x2 ( x1 , x2 )h2 e g" ( t ) = f11 ( x1 + h1 , x2 + h2 )h12 + f 22 ( x1 + h1 , x2 + h2 )h22 + + f12 ( x1 + h1 , x2 + h2 )h1h2 + f 21 ( x1 + h1 , x2 + h2 )h1h2 dove h1 ≡ t h1 , h2 ≡ t h2 Essendo t ∈[0,1], avremo infine che h12 + h22 = t h12 + h22 ≤ h12 + h2 2 Nel caso di una funzione a n variabili, abbiamo la seguente generalizzazione: Proposizione 2.5.6 (Teorema di Taylor per funzioni a n variabili) Se f(.): Rn → R possiede derivate parziali prime e seconde, allora: f (x + h) = f (x) + ∇f (x)h + 1 h'H (ξ)h 2! dove H(ξ) è la matrice Hessiana di f(.) valutata in un punto ξ tale che ||ξ – x|| ■ ≤ ||h||. cap2.pmd 77 15/02/2004, 11.50