Metodi Matematici per l’Ingegneria - Prof. M. Caprili CAPITOLO 0 RICHIAMI DI ALGEBRA LINEARE E NOZIONI PRELIMINARI 1 Metodi Matematici per l’Ingegneria - Prof. M. Caprili Richiami di algebra lineare Dato un insieme S ed un campo di scalari K, si dice che S è uno spazio vettoriale (o lineare) su K se in S sono definite due funzioni: una detta addizione che ad ogni (x,y)SS associa un elemento x+yS e l’altra la moltiplicazione per uno scalare che ad (,x)KS associa l’elemento xS, soddisfacenti le proprietà: xyyx (x y) z x (y z) 0 S: x+ 0=x , x S x -x: x+(-x)= 0 α(βx)=(αβ) x α(x+y)=αx+ αy 1x=x , x S Diremo che gli elementi x 1 , x 2 ,..., x n di S sono linearmente indipendenti se n x i 1 i i 0 , i K , implica 1 2 ... n 0 . Un insieme {bi} di elementi di S linearmente indipendenti è detto una base di S se ogni xS può essere rappresentato come m x i bi i 1 in modo univoco. La cardinalità dell’insieme {bi} è la dimensione di S, che può essere finita come in Rn ma anche infinita come nel caso delle funzioni continue in [a,b]. Un insieme Q di elementi di S è un sottospazio se x,yQ x+yQ e se K xQ. In altre parole Q è di per sè uno spazio vettoriale come, ad esempio, il sottoinsieme delle funzioni continue costituito dall’insieme dei polinomi di grado minore o uguale ad n. Preso un vettore aS e un sottospazio Q non contenente a, l’insieme {x=a+y, yQ} si dice sottospazio affine. Una trasformazione T tra due spazi vettoriali S e V tale che T(x+y)=T(x)+T(y) e T(x)=T(x) è detta applicazione lineare; se S=V si dice che T è una operatore lineare. Se V=R (numeri reali) T è un funzionale lineare su S. L’insieme S’ di tutti i funzionali lineari su S è detto spazio duale di S. Si definisce nucleo di T l’insieme (T)=T-1(0) ossia {xS: T(x)=0} e rango di T la dimensione dell’immagine di S tramite T, cioè rango(T)=dimT(S). L’indicazione L (S,V) rappresenta lo spazio vettoriale delle applicazioni lineari da S in V. Uno spazio vettoriale si dice normato se in esso è definita un’applicazione N da S in R+ detta norma, di valore x , soddisfacente alle proprietà: 2 Metodi Matematici per l’Ingegneria - Prof. M. Caprili x 0, x 0 x 0 x0 x x xy x y . Ponendo d( x, y) x y si introduce in S una metrica, cioè un’applicazione SxS in R, soddisfacenti le proprietà : d(x,y)=d(y,x), d(x,y)d(x,z)+d(y,z), d(x,y)=0 se e solo se x=y. Esempi di norme in Rn 1 n x 2 ( x 2i ) 2 i 1 n x 1 xi i 1 x max x i 1 i n e in C([a,b]): y( t ) max y( t ) at b . Si dice che la successione {xn} converge ad x se lim x n x 0 n . In particolare essendo x y xy segue che lim x n x n implica lim x n x n e quindi la continuità della norma. Uno spazio vettoriale normato è detto completo se ogni successione di Cauchy è ivi convergente. Un tale spazio è chiamato di Banach. Quindi in uno spazio di Banach, se lim x n p x n 0 n , p allora, esiste un xS, tale che 3 Metodi Matematici per l’Ingegneria - Prof. M. Caprili lim x x n 0 . n Se S e V sono spazi normati e T una trasformazione lineare da S in V allora, essa è continua se e solo se è limitata. Un'applicazione è limitata se esiste un M>0 tale che Tx M x , x S . L’insieme delle trasformazioni lineari continue da S in V è uno spazio vettoriale la cui norma è definita da T sup x 0 Tx x V sup Tx S x 1 V sup Tx x 1 . V Questo spazio normato è indicato con L (S,V) ed è uno spazio di Banach se V è uno spazio di Banach. Nel caso che V=R allora L (S,R) è lo spazio dei funzionali lineari continui su S detto spazio duale o coniugato di S. Prodotto scalare Sia S uno spazio vettoriale nel campo C (numeri complessi). Un’applicazione f da SS in C è una forma hermitiana se f ( x x' , y ) f ( x , y ) f ( x' , y ) f ( x , y y' ) f ( x , y ) f ( x , y' ) f ( x , y ) f ( x , y ) f ( x , y ) f ( x , y ) f ( x , y ) f ( y,x ) Considerando uno spazio vettoriale di dimensione finita con base e1, e2,…, en, la forma f è completamente definita dai valori aij=f(ei , ej ) , i,j=1,2,…,n , ossia dalla matrice hermitiana A={aij } Infatti, presi n x i ei i 1 n y j e j j1 si ha n n n f ( x , y ) f i ei , j e j a iji j j1 i1 i ,j1 Una forma hermitiana è semidefinita positiva se f(x,x)0 , 4 xS . Metodi Matematici per l’Ingegneria - Prof. M. Caprili mentre, è definita positiva se f(x,x)>0 xS , , x0 . Se f è definita positiva valgono la disuguaglianza di Cauchy-Schwartz f ( x , y ) f ( x ,x ) f ( y, y ) 2 e la disuguaglianza di Minkowski f ( x y, x y) f ( x, x) f ( y, y) . Uno spazio vettoriale S in cui esiste una forma hermitiana definita positiva è detto spazio prehilbertiano e f(x,y) è un prodotto scalare, indicato brevemente con il simbolo (x,y)= f(x,y). Se (x,y)=0, allora x e y sono detti ortogonali. Uno spazio pre-hilbertiano può essere normato con x ( x, x) . Uno spazio pre-hilbertiano che risulti completo rispetto a questa norma è detto spazio di Hilbert. Esempi di spazi di Hilbert n 1. Rn : (x,y)= x i yi e x i 1 i 1 x i 1 n 2. Cn : (x,y)= x i yi n e x 2 i n x i 1 2 i b 3. Insieme delle funzioni reali a quadrato integrabili ; cioè l'insieme L2[a, b] {f : f (x)2 dx } a dove il prodotto scalare è definito da b ( f , g) f ( x)g( x)dx a e la norma vale b f f 2 ( x )dx a Un insieme di vettori costituisce un sistema ortonormale se sono a due a due ortogonali e di norma unitaria. 5 Metodi Matematici per l’Ingegneria - Prof. M. Caprili Uno spazio vettoriale di dimensione finita possiede una base ortonormale {ei} che può essere generata da una qualunque base {ui} mediante il seguente procedimento di ortonormalizzazione di Gram-Schmidt v 1 u1 , v1 v1 e1 i u i1 ,e j e j v u i 1 i1 j1 e v i1 , i 1,..., n 1 i1 v i1 . Se S è uno spazio di Hilbert e {en} un sistema ortonormale infinito numerabile allora la serie di Fourier c k 1 k ek è convergente se e solo se c k 1 2 k . In tal caso, detto x l’elemento a cui la serie converge, i coefficienti ck ovviamente, valgono c k ( x, e k ) e sono detti appunto, coefficienti di Fourier. Polinomi ortogonali Consideriamo l’insieme delle funzioni f(x) reali e tali che b p( x) f ( x) 2 dx a dove p(x) è una funzione positiva e integrabile su [a,b] detta funzione peso. Tale insieme indicato con L(2p ) [a, b] è uno spazio di Hilbert con prodotto scalare definito da b ( f , g) p( x) f ( x)g( x) dx a Esempio Sia [a,b]=[0,2] e p(x)=1. La famiglia di funzioni 6 . Metodi Matematici per l’Ingegneria - Prof. M. Caprili 1 1 1 1 1 , cos t , sen t , cos 2 t , sen 2 t , ... 2 costituisce un sistema ortonormale in L 2 [0,2 ] . Il sistema è completo e quindi ogni funzione in L 2 [0,2 ] è rappresentabile tramite la serie di Fourier: (*) f (t) a0 cos nt sen nt (a n bn ) n 1 dove an 1 bn 1 2 f t cos nt dt , n0 0 2 f t sen nt dt n 1 0 L'uguaglianza (*) non va intesa nel senso puntuale, ossia non è detto che la serie di Fourier converga puntualmente a f(t). Infatti, la convergenza è nella norma indotta dal prodotto scalare in L2[0,2] , cioè si ha: 2 lim k 0 2 k cos nt sen nt f ( t ) (a n bn ) dt 0 n0 o come suol dirsi la serie converge in media a f(t). Tuttavia, se la f(t) è continua in [0,2], f(0)=f(2) e la sua derivata è continua eccetto in un numero finito di punti allora, la serie di Fourier converge uniformemente a f(t). Esempio [a,b]=[-1,1], p(x)=1 La famiglia dei polinomi di Legendre definiti per ricorrenza dalle formule P0 ( x ) 1 P1 ( x ) x Pn 1 ( x ) 2n 1 n x Pn ( x ) Pn 1 ( x ), n 1 n 1 costituisce un sistema ortogonale completo in L2 ([-1,1]). Vale anche 1 dn 2 n Pn ( x) n n ( x 1) n! 2 dx Esempio [a,b]=[0,+], p(x)=e-x La famiglia dei polinomi di Laguerre 7 . n 1, 2 ,... Metodi Matematici per l’Ingegneria - Prof. M. Caprili L0 ( x ) 1 L1 ( x ) x 1 Ln ( x ) 2n x 1 n 1 L n 1 x L n 2 x , n n n 1, 2 ,... costituisce un sistema ortogonale completo su L(2e ) [0,] . Vale anche x d n x n n e L n ( x) ( 1) (e x ) n! dx n x Esempio [a,b]=(-,+), p(x)= e x La famiglia di polinomi di Hermite 2 H0( x ) 1 H 1 ( x ) 2x H n ( x ) 2x H n 1 ( x ) 2( n 1 )H n 2 ( x ), costituisce un sistema ortogonale completo su L( e Vale poi x2 ) n 1, 2 ,... ( ,) . d n x2 H n ( x) ( 1) e n e dx n x2 1 2 2 Esempio [a,b]=[-1,1], p(x)= (1 x ) . La famiglia dei polinomi di Chebyshev To ( x ) 1 T1 ( x ) x Tn ( x ) 2 x Tn 1 x Tn 2 x , n 1, 2 ,... 1 2 è un sistema ortogonale completo su L((21 x) ) [ 11 , ]. Si osservi che Tn(x) è definito anche da Tn x cosn arccos x ed ha come radici i valori x k cos[ (2 k 1)] , 2n x 1,1 k=1,2,…,n. Si dimostra nel capitolo 5 che un polinomio ortogonale di grado j, ha j radici reali e distinte appartenenti al proprio intervello di ortogonalizzazione. Ovviamente ogni polinomio Pn ( x) a 0 a 1 x a 2 x 2 ...a n x n 8 Metodi Matematici per l’Ingegneria - Prof. M. Caprili può essere rappresentato come combinazione lineare di polinomi ortogonali appartenenti ad una qualunque famiglia dei polinomi ortogonali sopra indicati. Ossia si può scrivere n Pn ( x) c r Q r ( x) r 1 e i coefficienti cr si possono ottenere applicando il principio di identità dei polinomi, oppure, per l’ortogonalità b wx P x Q x dx n cr r a b wx Qx dx r 1, 2 ,..., n . , a Richiami sui polinomi Un polinomio di grado n è una funzione complessa di variabile complessa rappresentabile nella forma n Pn ( x) a i x i i0 dove ai sono numeri complessi . L’insieme dei polinomi è uno spazio vettoriale con la somma e il prodotto per uno scalare definiti nel modo usuale. Dati due polinomi f(x) e g(x) di grado n ed m rispettivamente il loro prodotto è un polinomio fg di grado n+m ed inoltre sono univocamente definiti due polinomi q(x) e r(x) tali che f ( x) q ( x) g( x) r ( x) Se nm, allora q(x) è di grado n-m ed r(x) di grado m-1. Se r(x)=0, f(x) è divisibile per g(x) e g(x) è un divisore di f(x). Ne segue che f(x) è divisibile per x- se e solo se f()=0. Se n<m, allora q=0 e r=f. Se f(x) e g(x) non hanno divisori comuni, eccetto il caso di una costante, allora sono primi tra loro. Altrimenti il divisore comune di grado massimo è detto massimo comune divisore. Ogni polinomio ammette una fattorizzazione del tipo Pn ( x) a n ( x 1 ) m1 ( x 2 ) m2 ...( x k ) mk dove la somma delle molteplicità delle radici vale n. In particolare le radici dell’equazione algebrica Pn(x)=0 sono tutte semplici se e solo se Pn(x) e Pn' ( x) sono primi tra loro. Il M.C.D. tra Pn(x) e Pn' ( x) contiene tutte e solo le radici di Pn(x)=0 di molteplicità maggiore di 1. Le radici di molteplicità 1 sono quelle del polinomio quoziente tra Pn(x) e il M.C.D. tra Pn(x) e Pn' ( x) . Le radici di Pn(x) appartengono tutte al cerchio “complesso” x C: x 1 aA n 9 , A max a i 1 i n . Metodi Matematici per l’Ingegneria - Prof. M. Caprili Se Pn(x) è a coefficienti reali e (+i) è radice di molteplicità m allora lo è anche (-i). Valgono poi le relazioni tra i coefficienti e le radici (formule di Newton) i1 i2 ...i j 1 j a n j an , j 1,..., n dove la somma è estesa a tutte le combinazioni {i 1 , i 2 ,..., i j } degli indici {1,2,...,n} prese j a j. Per j=1 n i 1 i a n1 an per j=n n i 1 i ( 1) n a0 an La valutazione di un polinomio può essere efficacemente espressa dall’algoritmo di Horner. Supponiamo che il polinomio sia di grado tre P3 x a 0 a 1x a 2 x 2 a 3 x 3 . L’algoritmo di Horner propone il polinomio nella forma equivalente P3 x a 0 a1 a 2 a 3x x x che è più stabile e riduce sensibilmente il numero delle operazioni necessarie per una sua valutazione. La ripetizione ciclica delle operazioni tra parentesi favorisce la programmazione come appresso indicato px = a(n) for k = n-1 down to 0 px = a(k) + px x endfor La valutazione della derivata si effettua semplicemente cambiando i coefficienti a(k) in ka(k), k=1,2,…n. Il programma per la sua valutazione, risulta dp = n a(n) for k = n-1 down to 1 dp = k a(k) + pd x endfor Richiami sulle matrici 10 Metodi Matematici per l’Ingegneria - Prof. M. Caprili Si chiama rango di A K m n (K il campo dei reali o dei complessi) il numero massimo di colonne (o di righe) linearmente indipendenti. K m n è uno spazio vettoriale con le due operazioni addizione e moltiplicazione per uno scalare così definite CAB c ij a ij bij , i 1,2,..., m, j 1,2,..., n E A e ij a ij , i 1,2,..., m, j 1,2,..., n. . Si definisce matrice trasposta di A la matrice A T a ij a ji , T i 1,2,..., m, j 1,2,..., n. . Inoltre, valgono le proprietà ( A T )T A A BT A T BT ABT BT A T . Matrici quadrate. Sia ACnn. Si definisce trasposta coniugata di A la matrice A (a ij ) (a ji ) Se A A la matrice A si dice hermitiana, se invece è A A si dice antihermitiana. Nel primo caso gli elementi diagonali sono reali, nel secondo caso sono immaginari o nulli. Nel caso in cui gli elementi di A siano reali, la matrice si dice simmetrica se A A T , oppure, antisimmetrica se A A T . Ogni matrice ACnn è sempre scomponibile nella somma di una matrice hermitiana e di una antihermitiana: 1 1 A (A A ) (A A ) ; 2 2 1 1 (A A T ) (A A T ) . 2 2 Si può provare facilmente che le matrici ( AA ) e ( A A ) sono hermitiane e semidefinitwe positive ( definite positive se A è non degenere). In generale AA A A , qualora AA = A A la matrice A è detta normale.. Una matrice P è di permutazione se è ottenuta dalla matrice identità scambiando le righe. La premoltiplicazione PA produce su A lo stesso scambio di righe operato su I per definire P. Se invece si postmoltiplica A per P, ossia AP, si ottiene su A uno scambio di colonne come quello operato si I per dare P. Una matrice è detta triangolare superiore se sono nulli gli elementi sotto la diagonale principale. Analogamente è detta triangolare inferiore se sono nulli gli elementi sopra la diagonale principale. Una matrice A è a banda di larghezza 2m+1 se aij=0 per i j m . Se m=1 è tridiagonale, se m=2 è pentadiagonale. Una matrice è ripartita a blocchi se i suoi elementi sono matrici. Per le matrici quadrate di solito i blocchi diagonali sono matrici quadrate. Si chiama matrice aggiunta di A la matrice adjA=bij ove b ij (1) i j A ji con A ji il cofattore di aji. Nel caso in cui la matrice sia ad elementi reali, ovviamente si ha A Se A è non degenere 11 Metodi Matematici per l’Ingegneria - Prof. M. Caprili A 1 1 adjA det A . Si ha anche 1 det A 1 (A ) (A ) 1 det A 1 (AB) 1 B 1A 1 se A e B sono non singolari. Se A A 1 , ovvero AA*=A* A=I, la matrice è detta unitaria e nel caso reale in cui gli elementi di A sono reali è detta ortogonale. Se A è una matrice rettangolare mxn ad elementi complessi, i valori singolari di A, risultano k = (k)1/2, K=1,2,… dove k sono gli autovalori di A*A i quali, per essere A*A una matrice hemitiana e semidefinita positiva, risultano reali e non negativi. Ovviamente, 1 A 2 Gli autoalori di A*A coincidono con quelli di AA*. Pertanto, se A è quadrata e non degenere, riesce A 1 A 1 * A 1 AA * 1 2 1 n e quindi 2 A 1 . n Vale anche det A 12 ...n Infatti, tenendo conto che il determinante di una matrice è uguale al prodotto dei suoi autovalori, viene det A * A det A * det A det A 1 2 n 2 det A 1 2 n Una matrice elementare è della forma H(,u,v) = I - u v* 12 Metodi Matematici per l’Ingegneria - Prof. M. Caprili dove u,vCn e un numero reale o complesso, La matrice uv* è rango 1. Il prodotto di due matrici elementari è ancora una matrice elementare; cioè H( ,u,v) H( ,u,v) = H( ,u,v) dove vale = + - v*u. Se, =0, ovvero , v* u 1 la matrice H( ,u,v) è l’inversa di H( ,u,v) Ovviamente, se v*u è non nullo e uguale a 1/, allora H( ,u,v) è degenere. Se, ad esempio, una matrice A è perturbata da una matrice uv*, ossia B = A – uv* = A(I – A-1 uv*) = A H(1,A-1 u,v*) la sua inversa, diviene 1 1 B1 I A 1uv * A 1 A 1 A 1uv * A 1 . 1 1 v * A u 1 v * A u 1 Tale formula di Sherman-Morrison indica la perturbazione indotta sull’inversa di A. Se U è una matrice unitaria (oppure ortogonale se gli elementi di U sono reali), cioè U*U=UU*=I, allora detU=1, gli autovalori valgono in modulo uguale ad 1 e l’applicazione y=Ux è un isomorfismo isometrico. Infatti, risulta det(U*U) = detU* detU = detU2= 1 e quindi detU =1. Inoltre, valogono l’equazioni 13 Metodi Matematici per l’Ingegneria - Prof. M. Caprili Ux x x U* x 1 U* x x x * Ux 2 x2 1 x* U* x 2 x 2 1 x * Ux x 2 2 per cui 1 ossia 1. Infine, diviene Ux x Ux x x . Teorema Siano A e E due matrici quadrate di ordine n ad elementi reali, e 1 2 ... n 0 i valori singolari di A. Allora, (i) se A+E è una matrice singolare ne segue che E 2 n ; (ii) esiste una matrice E con E 2 n tale che A+E è singolare. Cioè E è la più “piccola” matrice che rende A+E singolare; indica quindi la “distanza” di A dalla più “vicina” matrice singolare. Dimostrazione. Consideriamo il punto (i). Se A+E è singolare esiste un vettore x non nullo, tale che (A+E) x = 0. Ma allora, essendo n min Ax x 0 2 x 2 14 Metodi Matematici per l’Ingegneria - Prof. M. Caprili risulta n x 2 Ax Ex 2 2 E2 x da cui n E 2 . Passiamo adesso al punto (ii). Se n 0 , allora A è già singolare. Se invece n > 0. si può scrivere AT A x n x x T A T Ax n x T x n 2 Ax x 2 2 2 Ponendo u=x/ x ed estraendo la radice quadrata, ne viene l’esistenza di un vettore u di norma che Au 2 n e, ovviamente, si può definire anche il vettore v 1 Au n di norma, chiaramente unitaria. Posto, E n v u * ne segue A Eu Au Eu n v n v 0 ossia, A+E è una matrica singolare. Inoltre,risulta E 2 max x 2 0 Ex x 2 2 max x 2 0 n vu * x x 2 2 n max u* x v x 2 0 x 15 2 2 n max x 2 0 u 2 x x 2 2 n unitaria, tale Metodi Matematici per l’Ingegneria - Prof. M. Caprili dove si è tenuto conto che u e v sono vettori con norma euclidea unitaria. L’uguale, ossia il massimo, si ottiene per x=u, e quindi E 2 n. . Matrice inversa generalizzata Come è noto, una matrice A rettangolare o degenere non ammette l’inversa in senso classico. Tuttavia, si osserva che, se A è invertibile allora AA 1A A , per analogia, se ACmn , la matrice Ag è detta inversa generalizzata di A, se AA g A A . Si osserva, che tale inversa, se esiste, non è unica. Infatti, se a 0 A 0 0 la matrice 1a b A 0 0 g è un’inversa generalizzata di A qualunque sia b. Ponendo questa ulteriore condizione A g AA g A g , analoga alla A 1AA 1 A 1 , l’unicità non è ancora garantita. Questa è invece raggiunta se oltre alle condizioni su indicate, si verificano anche le seguenti (AA g ) AA g (A g A ) A g A . . Se ciò accade l'inversa generalizzata di A è detta pseudoinversa , e si indica con Ap. Nell’esempio precedente la pseudoinversa di A si ottiene ponendo b=0, ossia 1a 0 A , 0 0 p che soddisfa le quattro condizioni indicate. Se ACmn , con n<m, ed ha rango massimo, ossia uguale ad n, allora la pseudoinversa risulta A p (A A) 1 A . In particolare vale A pA I . Se invece, ACmn, con n>m, ed ha rango massimo, ovviamente uguale ad m, risulta A p A(AA ) 1 16 Metodi Matematici per l’Ingegneria - Prof. M. Caprili In paricolare vale AAp=I. Sistemi lineari Se S e V sono due spazi vettoriali di dimensione n ed m rispettivamente, lo spazio delle applicazioni lineari L (S,V) e lo spazio delle matrici Cmn sono isomorfi, cioè esiste una corrispondenza biunivoca tra essi. Infatti, ad un’applicazione lineare lL (S,V) corrisponde la matrice ACmn i cui elementi {aij}sono definiti da m l(e j ) a ij u i j 1,..., n , , i 1 dove e1 , e 2 ,..., e n è una base di S e u 1 , u 2 ,..., u m una base di V. Viceversa, una matrice ACmn definisce un'applicazione lineare di S in V operando, come di consueto, sulle componenti dei vettori n x x i ei i 1 m y yj uj j1 Data un'applicazione lineare l L(S,V) l'equazione l(x)=b n m i 1 j1 dove x x i e i , b b j u j è equivalente al sistema lineare di m equazioni in n incognite n a x j1 ij j bi , i=1,2,…,m , overo Ax=b . Se Ag è una inversa generalizzata di A soddisfacente le condizioni AAg A=A e Ag AAg =Ag , allora il nucleo di A è (A) x R n:x (I A g A)y, y R n Infatti, si ha AA g A A A AA g A 0 A (I A g A ) 0 Applicando tale matrice ad un yS, risulta A(I A g A) y 0y 0 17 . Metodi Matematici per l’Ingegneria - Prof. M. Caprili Quindi gli elementi x I A g A y , y R n , sono il nucleo di A. Posto allora, il sistema Ax=b, nella forma A g Ax A g b essendo Ag un’inversa generalizzata, una soluzione generalizzata è x A g b , analogamente al caso classico A 1Ax A 1b con soluzione x A 1b . Infatti, sostituendo, viene A g A( A g b ) A g b . . Se in particolare A Cmxn , con n<m, ed A ha rango massimo, ovviamente uguale ad n, si può scrivere A Ax A b e quindi, per essere A*A non degenere, la soluzione generalizzata risulta x=(A*A)-1 A*b dove (A*A-1 )A* è un'inversa generalizzata di A che per essere in questo caso unica è una pseudoinversa, ossia Ap=(A*A)-1 A*. Il nucleo di A è costituito dal solo elemento nullo in quanto I-Ap A=0. Cosicchè la soluzione generalizzata è unica. Se invece, n>m, ed A ha rango massimo, uguale ad m, una soluzione del sistema Ax=b, risulta x=A*(AA*)-1 b e l’insieme di tutte le soluzioni del sistema Ax=b, divengono {x= A*(AA*)-1 b + (I- A*(AA*)-1 A)y , yRn}. In generale l'insieme delle soluzioni generalizzate di Ax=b è rappresentato da {x=Ag b+(I-AgA)y , y R n } . Autovalori e autovettori 18 Metodi Matematici per l’Ingegneria - Prof. M. Caprili Data ACnn , un vettore xCn con x0 è un autovettore di A se esiste uno scalare C tale che Ax=x; in tale caso si dice autovalore di A. Se è un autovalore di A il sistema lineare ( A I ) x 0 ammette soluzioni non nulle e perciò A-I è singolare, ossia det(A I) 0 . Ovviamente, ogni radice di questa equazione, detta equazione caratteristica di A, è un autovalore di A. Vale la rappresentazione dell’equazione caratteristica (1) PA λ det (A λI) ( 1) n[λ n σ1λ n 1 σ 2 λ n 2 σ 3λ n 3 ...( 1) n σ n ] 0 dove i (i=1,2,…,n) sono la somma dei minori principali di ordine i=1,2,…,n estratti da A. In particolare n 1 tr (A ) a ii , i 1 n det(A ) . L’insieme degli autovalori è detto spettro di A e max i 1 i n è detto raggio spettrale di A. La molteplicità di un autovalore è detta molteplicità algebrica, e il numero di autovettori associati è sempre , ossia ( ) ( ) . Inoltre n tr (A ) i , i 1 n det(A ) i . i 1 Dalla (1) segue che A è singolare se e solo se =0 è un suo autovalore. Dalla relazione Ax=x segue x Ax x x 19 Metodi Matematici per l’Ingegneria - Prof. M. Caprili e pertanto se A è hermitiana, e quindi ( x Ax) x Ax , i suoi autovalori sono reali. Inoltre, gli autovalori di A sono i complessi coniugati degli autovalori di A; mentre gli autovalori di A T sono gli stessi di A. Supponiamo adesso, per semplicità, che la matrice A sia reale. Se e y soddisfano l’equazione A T y y allora e y T soddisfano quest’altra equazione y T A y T . Per questo, gli autovettori di A T , sono spesso chiamati autovettori sinistri di A; per contro i vettori x per cui Ax=x sono detti autovettori destri. È facile verificare che autovettori destri e sinistri di A corrispondenti ad autovalori distinti sono ortogonali. In particolare se A è simmetrica gli autovettori destri e sinistri coincidono. Se A possiede n autovalori distinti 1 , 2 ,..., n gli insiemi di autovettori destri x (1) , x ( 2) ,..., x ( n ) e di T autovettori sinistri y(1) , y( 2) ,..., y( n ) formano un sistema biortogonale: y( i ) x ( j ) 0, i j . T Imponendo che i due sistemi soddisfino le condizioni y( i ) x ( j ) 1, i 1,2,..., n , ne viene che ogni vettore vRn si può rappresentare nelle forme n n i 1 j1 v v i x ( i ) w j y ( j) con vi y(i )T v e w j x ( j)T v , i, j 1,2,..., n Inoltre le matrici X ( x (1) x ( 2) x ( n ) ) e Y ( y(1) y ( 2) y ( n ) ) sono tali che YT X XT Y I ossia X1 YT , Y-1=XT , e dalle equazioni Ax (i ) x (i ) , i 1,2,..., n , che in forma matriciali, si scrivono AX X diag ( 1 , 2 ,..., n ) si trae 20 . Metodi Matematici per l’Ingegneria - Prof. M. Caprili X 1AX Y T AX diag( 1 , 2 ,..., n ) che è una trasformazione di similitudine di A. In generale A e B sono simili se esiste una matrice non singolare T tale che B T 1AT Questa relazione di similitudine è una relazione di equivalenza, in quanto, è riflessiva, simmetrica e transitiva. Matrici simili hanno gli stessi autovalori per essere det(B-I)=det(A-I) e hanno autovettori legati dalla relazione x B T 1 x A o anche x A Tx B . Data una matrice ACnn esiste sempre una matrice non singolare T tale che la matrice B T 1AT è triangolare superiore. Diremo poi che una matrice è a predominanza diagonale forte se n a ii a ij , i 1,..., n , j1 j i mentre è a predominanza diagonale debole se n a ii a ij , i 1,..., n , j1 j i e per almeno un i vale il maggiore. Una matrice A è detta riducibile se esiste una matrice di permutazione P tale che la matrice P T AP , simile ad A, è della forma A 11 B P T AP A 21 0 A 22 con le sottomatrici A 11 , A 22 quadrate. Il grafo di A è ottenuto fissando n punti nel piano, diciamo P1 , P2 ,..., Pn e collegando con un arco Pi e Pj solo se a ij 0 orientandolo con una freccia da Pi a Pj; nel caso sia anche a ji 0 si traccia un altro arco da Pj verso Pi, con freccia verso Pi. Una volta completato il grafo, consideriamo tutti gli elementi di A nulli. Se accade che in corrispondenza di ogni elemento nullo di A, di indici h,k, cioè a hk 0 , esiste un cammino orientato che da Ph va a Pk, diremo il grafo di A fortemente connesso. Si può dimostrare che A è irriducibile, cioè non riducibile, se e solo se il suo grafo è fortemente connesso. Una matrice è detta convergente se lim A k 0 k Si dimostra che A è convergente se e solo se (A)<1. 21 Metodi Matematici per l’Ingegneria - Prof. M. Caprili Dato lo spazio lineare delle matrici quadrate di ordine n sul campo reale o complesso ed assegnata una norma vettoriale, allora si può definire la norma matriciale indotta dalla norma vettoriale ponendo A sup x0 Ax max Ax x 1 x Tale norma indotta è detta naturale. Le norme vettoriali già viste inducono la norme matriciali n A 1 max a jk k j 1 A 2 (AA ) n A max a jk j . k 1 Se A è hermitiana A 2 (A) . Una norma matriciale si dice compatibile con una norma vettoriale se Ax A x la norma indotta è senz’altro compatibile. Vale anche il teorema di Hirsch: ogni norma naturale di A limita il suo raggio spettrale (A) A Infatti da Ax=x segue x A x ed essendo x 0 segue l’asserto. Vale anche (A) A per qualunque norma di A. Infatti, se è autovalore e x autovettore associato, definita la matrice B ( x 0 0) , si ha AB=B e anche B A B ma B 0 , in quanto x0, e quindi 22 Metodi Matematici per l’Ingegneria - Prof. M. Caprili A , autovalore di A . Viceversa, fissato un >0 arbitrario esiste una norma naturale tale che A (A) . Condizione necessaria e sufficiente affinchè A sia convergente è che esista una norma naturale per cui lim A k 0 k Condizione sufficiente perché A sia convergente è che esista una norma <1. Data la serie I A A 2 ...A n ... essa è convergente se e solo se A è convergente e in tal caso la serie converge alla matrice (I A) 1 . Se poi per una norma naturale vale A 1 , si hanno le disuguaglianze 1 1 (I A) 1 1 A 1 A Ovviamente, le disuguaglianze, valgono anche cambiando A con -A Dimostrazione. Per la disuguaglianza di destra, si ha 1 (I A) 1(I A) (I A) 1 I A (I A) 1 (1 A ) da cui 1 (I A) 1 1 A Si noti che per ogni norma matriciale naturale vale sempre I 1 ; inoltre, se A 1 , allora I A è non degenere. Per la disuguaglianza di sinistra, viene I (I A)(I A) 1 (I A) 1 A(I A) 1 I A(I A) 1 (I A) 1 (I A) 1 1 A (I A) 1 da cui (I A) 1 Se P(A) è un polinomio nella variabile A cioè 23 1 1 A . Metodi Matematici per l’Ingegneria - Prof. M. Caprili P(A) a n A n a n1A n1 ..a 0 I allora, se è un autovalore di A, P() è un autovalore della matrice P(A). Data una matrice A esiste il teorema di Cayley-Hamilton che afferma: ogni matrice è radice della propria equazione caratteristica. Localizzazione degli autovalori di A nel piano complesso In virtù del teorema di Hirsch tutti gli autovalori appartengono al cerchio nel piano complesso di centro l’origine e raggio A . Una regione più precisa del piano complesso è definita dal teorema di Gershgorin: gli autovalori di A appartengono alla regione n ci i 1 n dove ci sono i cerchi z a ii i con i a ij , i 1,..., n . j1 j i Infatti, se è autovalore di A e x un suo autovettore e x r x , allora la r-esima equazione del sistema Ax=x è n x r a rj x j j1 o anche n ( a rr ) x r a rj x j . j1 j r Passando ai moduli si ha n a rr x r a rj x j x r j1 j r n a j1 j r rj ed essendo x r 0 viene n a rr a rj . j 1 j r Da questo teorema segue subito che se A è a predominanza diagonale forte, allora è non degenere. Il secondo teorema di Gershgorin afferma: se A è irriducibile e appartiene alla frontiera dell’unione dei cerchi allora appartiene alla frontiera di ciascun cerchio. Dimostrazione. Infatti sia x l’autovettore associato a e x x . L’autovalore , per il p precedente teorema di Gershgorin appartiene al cerchio cp di centro app e raggio p, ma per l’ipotesi fatta appartiene alla frontiera di tale cerchio, cioè dovrà essere 24 Metodi Matematici per l’Ingegneria - Prof. M. Caprili n a pp a pj . j 1 j p Ma essendo n a pp x p a pj x j j1 j p o anche n xj j1 j p xp a pp a pj n a pj j1 j p per l’uguaglianza di cui sopra, deve valere l’uguale. Anzi se apj0 per qualche j ne segue x j x p , in quanto xj xp 1 . Per l’ipotesi di irriducibilità di A, ossia grafo di A fortemente connesso, esiste senz’altro almeno un elemento apr0 con rp e quindi x r x . Pertanto, ripetendo quanto sopra fatto, dovrà appartenere anche alla frontiera del cerchio cr. Iterando il procedimento, si considerano man mano tutti gli indici, in quanto, per essere il grafo di A fortemente connesso, esiste un cammino orientato che tocca tutti i nodi del grafo, ossia tutti i centri dei cerchi. Da questo teorema segue che una matrice a predominanza diagonale debole e grafo fortemente connesso è non singolare. Tenendo poi conto che la trasposta di A ha gli stessi autovalori diA, si può ripetere tutto quanto per la matrice AT e determinare una regione T che contiene tutti gli autovalori. Ne segue che gli autovalori di A appartengono anche a T. Riportiamo infine, senza dimostrazione, il terzo teorema di Gershgorin: ad ogni unione connessa di cerchi ci appartengono tanti autovalori quanti sono i cerchi. Oppure, se l’ insieme di k cerchi è disgiunto dall’insieme costituito dai restanti n-k cerchi, allora k autovalori appartengono al primo insieme e n-k all’altro. Infine, tenendo conto che l’equazione n Pn ( x) a i x i 0 an 0 i0 può equivalentemente essere intesa come l’equazione caratteristica della matrice di ordine n del tipo di Frobenius: aan 1 n 1 A 0 0 a n2 an 0 1 0 a 1n 0 0 1 a 25 a 0n 0 0 0 a Metodi Matematici per l’Ingegneria - Prof. M. Caprili è possibile localizzare le sue radici nel piano complesso facendo uso dei teoremi di Gerchgorini. Ad esempio, tutte le radici di Pn(x)=0 sono interne al cerchio del piano complesso n 1 ai i 0 an {z C : z max( 1, Il cerchio di centro z c ai an )} . e raggio 1, cioè |z – zc| 1 è interno al cerchio di centro l’origine e raggio 1 + |zc| , cioè al cerchio di equazione |z| 1 + |zc| . Infatti, se z appartiene al cerchio di centro zc e raggio 1, si ha: |z| = |z – zc+ zc| |z – zc| + |zc| 1 + |zc| , e quindi z appartiene al cerchio di centro l’origine e raggio 1+zc. La matrice A è detta compagna dell’equazione algebrica n Pn ( x ) i 0 26 ai i x . an