Metodi Matematici per l’Ingegneria - Prof. M. Caprili
CAPITOLO 0
RICHIAMI DI ALGEBRA LINEARE
E
NOZIONI PRELIMINARI
1
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
Richiami di algebra lineare
Dato un insieme S ed un campo di scalari K, si dice che S è uno spazio vettoriale (o lineare) su K se
in S sono definite due funzioni: una detta addizione che ad ogni (x,y)SS associa un elemento
x+yS e l’altra la moltiplicazione per uno scalare che ad (,x)KS associa l’elemento xS,
soddisfacenti le proprietà:
xyyx
(x y) z x (y z)
0 S: x+ 0=x
, x S
x -x: x+(-x)= 0
α(βx)=(αβ) x
α(x+y)=αx+ αy
1x=x
,
x S
Diremo che gli elementi x 1 , x 2 ,..., x n di S sono linearmente indipendenti se
n
x
i 1
i
i
0 , i K ,
implica 1 2 ... n 0 .
Un insieme {bi} di elementi di S linearmente indipendenti è detto una base di S se ogni xS può
essere rappresentato come
m
x i bi
i 1
in modo univoco.
La cardinalità dell’insieme {bi} è la dimensione di S, che può essere finita come in Rn ma anche
infinita come nel caso delle funzioni continue in [a,b].
Un insieme Q di elementi di S è un sottospazio se x,yQ x+yQ e se K xQ. In altre
parole Q è di per sè uno spazio vettoriale come, ad esempio, il sottoinsieme delle funzioni continue
costituito dall’insieme dei polinomi di grado minore o uguale ad n.
Preso un vettore aS e un sottospazio Q non contenente a, l’insieme {x=a+y, yQ} si dice
sottospazio affine.
Una trasformazione T tra due spazi vettoriali S e V tale che T(x+y)=T(x)+T(y) e T(x)=T(x) è
detta applicazione lineare; se S=V si dice che T è una operatore lineare. Se V=R (numeri reali) T è
un funzionale lineare su S. L’insieme S’ di tutti i funzionali lineari su S è detto spazio duale di S.
Si definisce nucleo di T l’insieme (T)=T-1(0) ossia {xS: T(x)=0} e rango di T la dimensione
dell’immagine di S tramite T, cioè rango(T)=dimT(S).
L’indicazione L (S,V) rappresenta lo spazio vettoriale delle applicazioni lineari da S in V.
Uno spazio vettoriale si dice normato se in esso è definita un’applicazione N da S in R+ detta
norma, di valore x , soddisfacente alle proprietà:
2
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
x 0,
x 0
x 0
x0
x x
xy x y
.
Ponendo d( x, y) x y si introduce in S una metrica, cioè un’applicazione SxS in R,
soddisfacenti le proprietà : d(x,y)=d(y,x), d(x,y)d(x,z)+d(y,z), d(x,y)=0 se e solo se x=y.
Esempi di norme in Rn
1
n
x
2
( x 2i ) 2
i 1
n
x 1 xi
i 1
x
max x i
1 i n
e in C([a,b]):
y( t ) max y( t )
at b
.
Si dice che la successione {xn} converge ad x se
lim x n x 0
n
.
In particolare essendo
x y xy
segue che
lim x n x
n
implica
lim x n x
n
e quindi la continuità della norma.
Uno spazio vettoriale normato è detto completo se ogni successione di Cauchy è ivi convergente.
Un tale spazio è chiamato di Banach. Quindi in uno spazio di Banach, se
lim x n p x n 0
n , p
allora, esiste un xS, tale che
3
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
lim x x n 0
.
n
Se S e V sono spazi normati e T una trasformazione lineare da S in V allora, essa è continua se e
solo se è limitata. Un'applicazione è limitata se esiste un M>0 tale che Tx M x , x S .
L’insieme delle trasformazioni lineari continue da S in V è uno spazio vettoriale la cui norma è
definita da
T sup
x 0
Tx
x
V
sup Tx
S
x 1
V
sup Tx
x 1
.
V
Questo spazio normato è indicato con L (S,V) ed è uno spazio di Banach se V è uno spazio di
Banach.
Nel caso che V=R allora L (S,R) è lo spazio dei funzionali lineari continui su S detto spazio duale o
coniugato di S.
Prodotto scalare
Sia S uno spazio vettoriale nel campo C (numeri complessi). Un’applicazione f da SS in C è una
forma hermitiana se
f ( x x' , y ) f ( x , y ) f ( x' , y )
f ( x , y y' ) f ( x , y ) f ( x , y' )
f ( x , y ) f ( x , y )
f ( x , y ) f ( x , y )
f ( x , y ) f ( y,x )
Considerando uno spazio vettoriale di dimensione finita con base e1, e2,…, en, la forma f è
completamente definita dai valori aij=f(ei , ej ) , i,j=1,2,…,n , ossia dalla matrice hermitiana A={aij }
Infatti, presi
n
x i ei
i 1
n
y j e j
j1
si ha
n
n
n
f ( x , y ) f i ei , j e j a iji j
j1
i1
i ,j1
Una forma hermitiana è semidefinita positiva se
f(x,x)0
,
4
xS
.
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
mentre, è definita positiva se
f(x,x)>0
xS ,
,
x0
.
Se f è definita positiva valgono la disuguaglianza di Cauchy-Schwartz
f ( x , y ) f ( x ,x ) f ( y, y )
2
e la disuguaglianza di Minkowski
f ( x y, x y) f ( x, x) f ( y, y) .
Uno spazio vettoriale S in cui esiste una forma hermitiana definita positiva è detto spazio prehilbertiano e f(x,y) è un prodotto scalare, indicato brevemente con il simbolo
(x,y)= f(x,y).
Se (x,y)=0, allora x e y sono detti ortogonali.
Uno spazio pre-hilbertiano può essere normato con
x ( x, x)
.
Uno spazio pre-hilbertiano che risulti completo rispetto a questa norma è detto spazio di Hilbert.
Esempi di spazi di Hilbert
n
1. Rn : (x,y)= x i yi
e
x
i 1
i 1
x
i 1
n
2. Cn : (x,y)= x i yi
n
e
x
2
i
n
x
i 1
2
i
b
3. Insieme delle funzioni reali a quadrato integrabili ; cioè l'insieme L2[a, b] {f : f (x)2 dx }
a
dove il prodotto scalare è definito da
b
( f , g) f ( x)g( x)dx
a
e la norma vale
b
f
f
2
( x )dx
a
Un insieme di vettori costituisce un sistema ortonormale se sono a due a due ortogonali e di norma
unitaria.
5
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
Uno spazio vettoriale di dimensione finita possiede una base ortonormale {ei} che può essere
generata da una qualunque base {ui} mediante il seguente procedimento di ortonormalizzazione di
Gram-Schmidt
v 1 u1 ,
v1
v1
e1
i
u i1 ,e j e j
v
u
i 1
i1
j1
e v i1 ,
i 1,..., n 1
i1 v i1
.
Se S è uno spazio di Hilbert e {en} un sistema ortonormale infinito numerabile allora la serie di
Fourier
c
k 1
k
ek
è convergente se e solo se
c
k 1
2
k
.
In tal caso, detto x l’elemento a cui la serie converge, i coefficienti ck ovviamente, valgono
c k ( x, e k )
e sono detti appunto, coefficienti di Fourier.
Polinomi ortogonali
Consideriamo l’insieme delle funzioni f(x) reali e tali che
b
p( x) f ( x)
2
dx
a
dove p(x) è una funzione positiva e integrabile su [a,b] detta funzione peso.
Tale insieme indicato con L(2p ) [a, b] è uno spazio di Hilbert con prodotto scalare definito da
b
( f , g) p( x) f ( x)g( x) dx
a
Esempio Sia [a,b]=[0,2] e p(x)=1.
La famiglia di funzioni
6
.
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
1
1
1
1
1
,
cos t ,
sen t ,
cos 2 t ,
sen 2 t , ...
2
costituisce un sistema ortonormale in L 2 [0,2 ] . Il sistema è completo e quindi ogni funzione in
L 2 [0,2 ] è rappresentabile tramite la serie di Fourier:
(*)
f (t)
a0
cos nt
sen nt
(a n
bn
)
n 1
dove
an
1
bn
1
2
f t cos nt dt ,
n0
0
2
f t sen nt dt
n 1
0
L'uguaglianza (*) non va intesa nel senso puntuale, ossia non è detto che la serie di Fourier converga
puntualmente a f(t). Infatti, la convergenza è nella norma indotta dal prodotto scalare in L2[0,2] ,
cioè si ha:
2
lim
k
0
2
k
cos nt
sen nt
f ( t ) (a n
bn
) dt 0
n0
o come suol dirsi la serie converge in media a f(t).
Tuttavia, se la f(t) è continua in [0,2], f(0)=f(2) e la sua derivata è continua eccetto in un numero
finito di punti allora, la serie di Fourier converge uniformemente a f(t).
Esempio [a,b]=[-1,1], p(x)=1
La famiglia dei polinomi di Legendre definiti per ricorrenza dalle formule
P0 ( x ) 1
P1 ( x ) x
Pn 1 ( x )
2n 1
n
x Pn ( x )
Pn 1 ( x ),
n 1
n 1
costituisce un sistema ortogonale completo in L2 ([-1,1]).
Vale anche
1
dn
2
n
Pn ( x)
n
n ( x 1)
n! 2 dx
Esempio [a,b]=[0,+], p(x)=e-x
La famiglia dei polinomi di Laguerre
7
.
n 1, 2 ,...
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
L0 ( x ) 1
L1 ( x ) x 1
Ln ( x )
2n x 1
n 1
L n 1 x
L n 2 x ,
n
n
n 1, 2 ,...
costituisce un sistema ortogonale completo su L(2e ) [0,] .
Vale anche
x
d n x n
n e
L n ( x) ( 1)
(e x )
n! dx n
x
Esempio [a,b]=(-,+), p(x)= e x
La famiglia di polinomi di Hermite
2
H0( x ) 1
H 1 ( x ) 2x
H n ( x ) 2x H n 1 ( x ) 2( n 1 )H n 2 ( x ),
costituisce un sistema ortogonale completo su L( e
Vale poi
x2
)
n 1, 2 ,...
( ,) .
d n x2
H n ( x) ( 1) e n e
dx
n
x2
1
2 2
Esempio [a,b]=[-1,1], p(x)= (1 x ) .
La famiglia dei polinomi di Chebyshev
To ( x ) 1
T1 ( x ) x
Tn ( x ) 2 x Tn 1 x Tn 2 x ,
n 1, 2 ,...
1
2
è un sistema ortogonale completo su L((21 x) ) [ 11
, ].
Si osservi che Tn(x) è definito anche da
Tn x cosn arccos x
ed ha come radici i valori
x k cos[
(2 k 1)] ,
2n
x 1,1
k=1,2,…,n.
Si dimostra nel capitolo 5 che un polinomio ortogonale di grado j, ha j radici reali e distinte
appartenenti al proprio intervello di ortogonalizzazione.
Ovviamente ogni polinomio
Pn ( x) a 0 a 1 x a 2 x 2 ...a n x n
8
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
può essere rappresentato come combinazione lineare di polinomi ortogonali appartenenti ad una
qualunque famiglia dei polinomi ortogonali sopra indicati. Ossia si può scrivere
n
Pn ( x) c r Q r ( x)
r 1
e i coefficienti cr si possono ottenere applicando il principio di identità dei polinomi, oppure, per
l’ortogonalità
b
wx P x Q x dx
n
cr
r
a
b
wx Qx dx
r 1, 2 ,..., n .
,
a
Richiami sui polinomi
Un polinomio di grado n è una funzione complessa di variabile complessa rappresentabile nella
forma
n
Pn ( x) a i x i
i0
dove ai sono numeri complessi .
L’insieme dei polinomi è uno spazio vettoriale con la somma e il prodotto per uno scalare definiti
nel modo usuale.
Dati due polinomi f(x) e g(x) di grado n ed m rispettivamente il loro prodotto è un polinomio fg di
grado n+m ed inoltre sono univocamente definiti due polinomi q(x) e r(x) tali che
f ( x) q ( x) g( x) r ( x)
Se nm, allora q(x) è di grado n-m ed r(x) di grado m-1. Se r(x)=0, f(x) è divisibile per g(x) e g(x)
è un divisore di f(x). Ne segue che f(x) è divisibile per x- se e solo se f()=0.
Se n<m, allora q=0 e r=f.
Se f(x) e g(x) non hanno divisori comuni, eccetto il caso di una costante, allora sono primi tra loro.
Altrimenti il divisore comune di grado massimo è detto massimo comune divisore.
Ogni polinomio ammette una fattorizzazione del tipo
Pn ( x) a n ( x 1 ) m1 ( x 2 ) m2 ...( x k ) mk
dove la somma delle molteplicità delle radici vale n.
In particolare le radici dell’equazione algebrica Pn(x)=0 sono tutte semplici se e solo se Pn(x) e
Pn' ( x) sono primi tra loro.
Il M.C.D. tra Pn(x) e Pn' ( x) contiene tutte e solo le radici di Pn(x)=0 di molteplicità maggiore di 1.
Le radici di molteplicità 1 sono quelle del polinomio quoziente tra Pn(x) e il M.C.D. tra Pn(x) e
Pn' ( x) .
Le radici di Pn(x) appartengono tutte al cerchio “complesso”
x C: x 1 aA
n
9
, A max a i
1 i n
.
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
Se Pn(x) è a coefficienti reali e (+i) è radice di molteplicità m allora lo è anche (-i).
Valgono poi le relazioni tra i coefficienti e le radici (formule di Newton)
i1
i2 ...i j 1
j
a n j
an
,
j 1,..., n
dove la somma è estesa a tutte le combinazioni {i 1 , i 2 ,..., i j } degli indici {1,2,...,n} prese j a j.
Per j=1
n
i 1
i
a n1
an
per j=n
n
i 1
i
( 1) n
a0
an
La valutazione di un polinomio può essere efficacemente espressa dall’algoritmo di Horner.
Supponiamo che il polinomio sia di grado tre
P3 x a 0 a 1x a 2 x 2 a 3 x 3 .
L’algoritmo di Horner propone il polinomio nella forma equivalente
P3 x a 0 a1 a 2 a 3x x x
che è più stabile e riduce sensibilmente il numero delle operazioni necessarie per una sua
valutazione. La ripetizione ciclica delle operazioni tra parentesi favorisce la programmazione come
appresso indicato
px = a(n)
for k = n-1 down to 0
px = a(k) + px x
endfor
La valutazione della derivata si effettua semplicemente cambiando i coefficienti a(k) in ka(k),
k=1,2,…n. Il programma per la sua valutazione, risulta
dp = n a(n)
for k = n-1 down to 1
dp = k a(k) + pd x
endfor
Richiami sulle matrici
10
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
Si chiama rango di A K m n (K il campo dei reali o dei complessi) il numero massimo di colonne
(o di righe) linearmente indipendenti.
K m n è uno spazio vettoriale con le due operazioni addizione e moltiplicazione per uno scalare così
definite
CAB
c ij a ij bij ,
i 1,2,..., m, j 1,2,..., n
E A
e ij a ij ,
i 1,2,..., m, j 1,2,..., n.
.
Si definisce matrice trasposta di A la matrice
A T a ij a ji ,
T
i 1,2,..., m, j 1,2,..., n.
.
Inoltre, valgono le proprietà
( A T )T A
A BT A T BT
ABT BT A T
.
Matrici quadrate. Sia ACnn. Si definisce trasposta coniugata di A la matrice A (a ij ) (a ji )
Se A A la matrice A si dice hermitiana, se invece è A A si dice antihermitiana. Nel primo
caso gli elementi diagonali sono reali, nel secondo caso sono immaginari o nulli.
Nel caso in cui gli elementi di A siano reali, la matrice si dice simmetrica se A A T , oppure,
antisimmetrica se A A T .
Ogni matrice ACnn è sempre scomponibile nella somma di una matrice hermitiana e di una
antihermitiana:
1
1
A (A A ) (A A ) ;
2
2
1
1
(A A T ) (A A T ) .
2
2
Si può provare facilmente che le matrici ( AA ) e ( A A ) sono hermitiane e semidefinitwe positive (
definite positive se A è non degenere).
In generale AA A A , qualora AA = A A la matrice A è detta normale..
Una matrice P è di permutazione se è ottenuta dalla matrice identità scambiando le righe. La
premoltiplicazione PA produce su A lo stesso scambio di righe operato su I per definire P. Se invece
si postmoltiplica A per P, ossia AP, si ottiene su A uno scambio di colonne come quello operato si I
per dare P.
Una matrice è detta triangolare superiore se sono nulli gli elementi sotto la diagonale principale.
Analogamente è detta triangolare inferiore se sono nulli gli elementi sopra la diagonale principale.
Una matrice A è a banda di larghezza 2m+1 se aij=0 per i j m . Se m=1 è tridiagonale, se m=2 è
pentadiagonale.
Una matrice è ripartita a blocchi se i suoi elementi sono matrici. Per le matrici quadrate di solito i
blocchi diagonali sono matrici quadrate.
Si chiama matrice aggiunta di A la matrice adjA=bij ove b ij (1) i j A ji con A ji il cofattore di aji.
Nel caso in cui la matrice sia ad elementi reali, ovviamente si ha A
Se A è non degenere
11
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
A 1
1
adjA
det A
.
Si ha anche
1
det A
1
(A ) (A ) 1
det A 1
(AB) 1 B 1A 1
se A e B sono non singolari.
Se A A 1 , ovvero AA*=A* A=I, la matrice è detta unitaria e nel caso reale in cui gli elementi di
A sono reali è detta ortogonale.
Se A è una matrice rettangolare mxn ad elementi complessi, i valori singolari di A, risultano
k = (k)1/2,
K=1,2,…
dove k sono gli autovalori di A*A i quali, per essere A*A una matrice hemitiana e semidefinita
positiva, risultano reali e non negativi.
Ovviamente,
1 A 2
Gli autoalori di A*A coincidono con quelli di AA*. Pertanto, se A è quadrata e non degenere, riesce
A 1 A 1 * A 1 AA *
1
2
1
n
e quindi
2 A
1
.
n
Vale anche
det A 12 ...n
Infatti, tenendo conto che il determinante di una matrice è uguale al prodotto dei suoi autovalori,
viene
det A * A det A * det A det A 1 2 n
2
det A 1 2 n
Una matrice elementare è della forma
H(,u,v) = I - u v*
12
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
dove u,vCn e un numero reale o complesso, La matrice uv* è rango 1.
Il prodotto di due matrici elementari è ancora una matrice elementare; cioè
H( ,u,v) H( ,u,v) = H( ,u,v)
dove vale
= + - v*u.
Se, =0, ovvero
,
v* u 1
la matrice H( ,u,v) è l’inversa di H( ,u,v) Ovviamente, se v*u è non nullo e uguale a 1/, allora
H( ,u,v) è degenere.
Se, ad esempio, una matrice A è perturbata da una matrice uv*, ossia
B = A – uv* = A(I – A-1 uv*) = A H(1,A-1 u,v*)
la sua inversa, diviene
1
1
B1 I
A 1uv * A 1 A 1
A 1uv * A 1 .
1
1
v
*
A
u
1
v
*
A
u
1
Tale formula di Sherman-Morrison indica la perturbazione indotta sull’inversa di A.
Se U è una matrice unitaria (oppure ortogonale se gli elementi di U sono reali), cioè U*U=UU*=I,
allora detU=1, gli autovalori valgono in modulo uguale ad 1 e l’applicazione y=Ux è un
isomorfismo isometrico.
Infatti, risulta
det(U*U) = detU* detU = detU2= 1
e quindi
detU =1.
Inoltre, valogono l’equazioni
13
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
Ux x
x U* x
1
U* x x
x * Ux
2
x2
1 x* U* x
2
x
2
1
x * Ux
x
2
2
per cui
1
ossia
1.
Infine, diviene
Ux x
Ux x x .
Teorema
Siano A e E due matrici quadrate di ordine n ad elementi reali, e 1 2 ... n 0 i valori singolari di A.
Allora,
(i)
se A+E è una matrice singolare ne segue che E 2 n ;
(ii)
esiste una matrice E con E 2 n tale che A+E è singolare. Cioè E è la più “piccola”
matrice che rende A+E singolare; indica quindi la “distanza” di A dalla più “vicina”
matrice singolare.
Dimostrazione.
Consideriamo il punto (i). Se A+E è singolare esiste un vettore x non nullo, tale che
(A+E) x = 0.
Ma allora, essendo
n min
Ax
x 0
2
x
2
14
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
risulta
n x 2 Ax
Ex
2
2
E2 x
da cui
n E 2 .
Passiamo adesso al punto (ii). Se n 0 , allora A è già singolare. Se invece n > 0. si può scrivere
AT A x n x
x T A T Ax n x T x
n
2
Ax
x
2
2
2
Ponendo u=x/ x ed estraendo la radice quadrata, ne viene l’esistenza di un vettore u di norma
che
Au 2 n
e, ovviamente, si può definire anche il vettore
v
1
Au
n
di norma, chiaramente unitaria.
Posto,
E n v u *
ne segue
A Eu Au Eu n v n v 0
ossia, A+E è una matrica singolare.
Inoltre,risulta
E 2 max
x 2 0
Ex
x
2
2
max
x 2 0
n vu * x
x
2
2
n max
u* x v
x 2 0
x
15
2
2
n max
x 2 0
u
2
x
x
2
2
n
unitaria, tale
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
dove si è tenuto conto che u e v sono vettori con norma euclidea unitaria.
L’uguale, ossia il massimo, si ottiene per x=u, e quindi
E 2 n. .
Matrice inversa generalizzata
Come è noto, una matrice A rettangolare o degenere non ammette l’inversa in senso classico.
Tuttavia, si osserva che, se A è invertibile allora AA 1A A , per analogia, se ACmn , la matrice
Ag è detta inversa generalizzata di A, se AA g A A . Si osserva, che tale inversa, se esiste, non è
unica.
Infatti, se
a 0
A
0 0
la matrice
1a b
A
0 0
g
è un’inversa generalizzata di A qualunque sia b.
Ponendo questa ulteriore condizione A g AA g A g , analoga alla A 1AA 1 A 1 , l’unicità non è
ancora garantita. Questa è invece raggiunta se oltre alle condizioni su indicate, si verificano anche le
seguenti
(AA g ) AA g
(A g A ) A g A .
.
Se ciò accade l'inversa generalizzata di A è detta pseudoinversa , e si indica con Ap.
Nell’esempio precedente la pseudoinversa di A si ottiene ponendo b=0, ossia
1a 0
A
,
0 0
p
che soddisfa le quattro condizioni indicate.
Se ACmn , con n<m, ed ha rango massimo, ossia uguale ad n, allora la pseudoinversa risulta
A p (A A) 1 A .
In particolare vale
A pA I .
Se invece, ACmn, con n>m, ed ha rango massimo, ovviamente uguale ad m, risulta
A p A(AA ) 1
16
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
In paricolare vale
AAp=I.
Sistemi lineari
Se S e V sono due spazi vettoriali di dimensione n ed m rispettivamente, lo spazio delle applicazioni
lineari L (S,V) e lo spazio delle matrici Cmn sono isomorfi, cioè esiste una corrispondenza
biunivoca tra essi.
Infatti, ad un’applicazione lineare lL (S,V) corrisponde la matrice ACmn i cui elementi {aij}sono
definiti da
m
l(e j ) a ij u i
j 1,..., n ,
,
i 1
dove e1 , e 2 ,..., e n è una base di S e u 1 , u 2 ,..., u m una base di V.
Viceversa, una matrice ACmn definisce un'applicazione lineare di S in V operando, come di
consueto, sulle componenti dei vettori
n
x x i ei
i 1
m
y yj uj
j1
Data un'applicazione lineare l L(S,V) l'equazione
l(x)=b
n
m
i 1
j1
dove x x i e i , b b j u j è equivalente al sistema lineare di m equazioni in n incognite
n
a x
j1
ij
j
bi
, i=1,2,…,m ,
overo
Ax=b
.
Se Ag è una inversa generalizzata di A soddisfacente le condizioni AAg A=A e Ag AAg =Ag , allora
il nucleo di A è
(A) x R n:x (I A g A)y, y R n
Infatti, si ha
AA g A A
A AA g A 0
A (I A g A ) 0
Applicando tale matrice ad un yS, risulta
A(I A g A) y 0y 0
17
.
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
Quindi gli elementi
x I A g A y ,
y R n ,
sono il nucleo di A.
Posto allora, il sistema Ax=b, nella forma
A g Ax A g b
essendo Ag un’inversa generalizzata, una soluzione generalizzata è x A g b , analogamente al caso
classico A 1Ax A 1b con soluzione x A 1b .
Infatti, sostituendo, viene
A g A( A g b ) A g b .
.
Se in particolare A Cmxn , con n<m, ed A ha rango massimo, ovviamente uguale ad n, si può
scrivere
A Ax A b
e quindi, per essere A*A non degenere, la soluzione generalizzata risulta
x=(A*A)-1 A*b
dove (A*A-1 )A* è un'inversa generalizzata di A che per essere in questo caso unica è una
pseudoinversa, ossia
Ap=(A*A)-1 A*.
Il nucleo di A è costituito dal solo elemento nullo in quanto I-Ap A=0. Cosicchè la soluzione
generalizzata è unica.
Se invece, n>m, ed A ha rango massimo, uguale ad m, una soluzione del sistema Ax=b, risulta
x=A*(AA*)-1 b
e l’insieme di tutte le soluzioni del sistema Ax=b, divengono
{x= A*(AA*)-1 b + (I- A*(AA*)-1 A)y , yRn}.
In generale l'insieme delle soluzioni generalizzate di Ax=b è rappresentato da
{x=Ag b+(I-AgA)y , y R n } .
Autovalori e autovettori
18
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
Data ACnn , un vettore xCn con x0 è un autovettore di A se esiste uno scalare C tale che
Ax=x; in tale caso si dice autovalore di A.
Se è un autovalore di A il sistema lineare
( A I ) x 0
ammette soluzioni non nulle e perciò A-I è singolare, ossia
det(A I) 0
.
Ovviamente, ogni radice di questa equazione, detta equazione caratteristica di A, è un autovalore di
A.
Vale la rappresentazione dell’equazione caratteristica
(1)
PA λ det (A λI) ( 1) n[λ n σ1λ n 1 σ 2 λ n 2 σ 3λ n 3 ...( 1) n σ n ] 0
dove i (i=1,2,…,n) sono la somma dei minori principali di ordine i=1,2,…,n estratti da A.
In particolare
n
1 tr (A ) a ii
,
i 1
n det(A ) .
L’insieme degli autovalori è detto spettro di A e
max i
1 i n
è detto raggio spettrale di A. La molteplicità di un autovalore è detta molteplicità algebrica, e il
numero di autovettori associati è sempre , ossia
( ) ( )
.
Inoltre
n
tr (A ) i
,
i 1
n
det(A ) i
.
i 1
Dalla (1) segue che A è singolare se e solo se =0 è un suo autovalore.
Dalla relazione
Ax=x
segue
x Ax
x x
19
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
e pertanto se A è hermitiana, e quindi ( x Ax) x Ax , i suoi autovalori sono reali. Inoltre, gli
autovalori di A sono i complessi coniugati degli autovalori di A; mentre gli autovalori di A T sono
gli stessi di A.
Supponiamo adesso, per semplicità, che la matrice A sia reale.
Se e y soddisfano l’equazione
A T y y
allora e y T soddisfano quest’altra equazione
y T A y T
.
Per questo, gli autovettori di A T , sono spesso chiamati autovettori sinistri di A; per contro i vettori
x per cui Ax=x sono detti autovettori destri.
È facile verificare che autovettori destri e sinistri di A corrispondenti ad autovalori distinti sono
ortogonali.
In particolare se A è simmetrica gli autovettori destri e sinistri coincidono.
Se A possiede n autovalori distinti 1 , 2 ,..., n gli insiemi di autovettori destri x (1) , x ( 2) ,..., x ( n ) e di
T
autovettori sinistri y(1) , y( 2) ,..., y( n ) formano un sistema biortogonale: y( i ) x ( j ) 0, i j .
T
Imponendo che i due sistemi soddisfino le condizioni y( i ) x ( j ) 1, i 1,2,..., n , ne viene che ogni
vettore vRn si può rappresentare nelle forme
n
n
i 1
j1
v v i x ( i ) w j y ( j)
con
vi y(i )T v e w j x ( j)T v , i, j 1,2,..., n
Inoltre le matrici X ( x (1) x ( 2) x ( n ) ) e Y ( y(1) y ( 2) y ( n ) ) sono tali che
YT X XT Y I
ossia
X1 YT , Y-1=XT
,
e dalle equazioni
Ax (i ) x (i ) , i 1,2,..., n ,
che in forma matriciali, si scrivono
AX X diag ( 1 , 2 ,..., n )
si trae
20
.
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
X 1AX Y T AX diag( 1 , 2 ,..., n )
che è una trasformazione di similitudine di A.
In generale A e B sono simili se esiste una matrice non singolare T tale che
B T 1AT
Questa relazione di similitudine è una relazione di equivalenza, in quanto, è riflessiva, simmetrica e
transitiva.
Matrici simili hanno gli stessi autovalori per essere det(B-I)=det(A-I) e hanno autovettori legati
dalla relazione x B T 1 x A o anche x A Tx B .
Data una matrice ACnn esiste sempre una matrice non singolare T tale che la matrice
B T 1AT
è triangolare superiore.
Diremo poi che una matrice è a predominanza diagonale forte se
n
a ii a ij
, i 1,..., n ,
j1
j i
mentre è a predominanza diagonale debole se
n
a ii a ij
, i 1,..., n ,
j1
j i
e per almeno un i vale il maggiore.
Una matrice A è detta riducibile se esiste una matrice di permutazione P tale che la matrice P T AP ,
simile ad A, è della forma
A 11
B P T AP
A 21
0
A 22
con le sottomatrici A 11 , A 22 quadrate.
Il grafo di A è ottenuto fissando n punti nel piano, diciamo P1 , P2 ,..., Pn e collegando con un arco
Pi e Pj solo se a ij 0 orientandolo con una freccia da Pi a Pj; nel caso sia anche a ji 0 si traccia un
altro arco da Pj verso Pi, con freccia verso Pi.
Una volta completato il grafo, consideriamo tutti gli elementi di A nulli. Se accade che in
corrispondenza di ogni elemento nullo di A, di indici h,k, cioè a hk 0 , esiste un cammino orientato
che da Ph va a Pk, diremo il grafo di A fortemente connesso.
Si può dimostrare che A è irriducibile, cioè non riducibile, se e solo se il suo grafo è fortemente
connesso.
Una matrice è detta convergente se
lim A k 0
k
Si dimostra che A è convergente se e solo se (A)<1.
21
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
Dato lo spazio lineare delle matrici quadrate di ordine n sul campo reale o complesso ed assegnata
una norma vettoriale, allora si può definire la norma matriciale indotta dalla norma vettoriale
ponendo
A sup
x0
Ax
max Ax
x 1
x
Tale norma indotta è detta naturale.
Le norme vettoriali già viste inducono la norme matriciali
n
A 1 max a jk
k
j 1
A 2 (AA )
n
A
max a jk
j
.
k 1
Se A è hermitiana A 2 (A) .
Una norma matriciale si dice compatibile con una norma vettoriale se
Ax A x
la norma indotta è senz’altro compatibile.
Vale anche il teorema di Hirsch: ogni norma naturale di A limita il suo raggio spettrale
(A) A
Infatti da
Ax=x
segue
x A x
ed essendo x 0 segue l’asserto.
Vale anche
(A) A
per qualunque norma di A.
Infatti, se è autovalore e x autovettore associato, definita la matrice B ( x 0 0) , si ha
AB=B
e anche
B A B
ma B 0 , in quanto x0, e quindi
22
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
A
, autovalore di A .
Viceversa, fissato un >0 arbitrario esiste una norma naturale tale che
A (A)
.
Condizione necessaria e sufficiente affinchè A sia convergente è che esista una norma naturale per
cui
lim A k 0
k
Condizione sufficiente perché A sia convergente è che esista una norma <1.
Data la serie
I A A 2 ...A n ...
essa è convergente se e solo se A è convergente e in tal caso la serie converge alla matrice
(I A) 1
.
Se poi per una norma naturale vale A 1 , si hanno le disuguaglianze
1
1
(I A) 1
1 A
1 A
Ovviamente, le disuguaglianze, valgono anche cambiando A con -A
Dimostrazione. Per la disuguaglianza di destra, si ha
1 (I A) 1(I A) (I A) 1 I A (I A) 1 (1 A )
da cui
1
(I A) 1
1 A
Si noti che per ogni norma matriciale naturale vale sempre I 1 ; inoltre, se A 1 , allora I A è
non degenere.
Per la disuguaglianza di sinistra, viene
I (I A)(I A) 1 (I A) 1 A(I A) 1
I A(I A) 1 (I A) 1
(I A) 1 1 A (I A) 1
da cui
(I A) 1
Se P(A) è un polinomio nella variabile A cioè
23
1
1 A
.
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
P(A) a n A n a n1A n1 ..a 0 I
allora, se è un autovalore di A, P() è un autovalore della matrice P(A).
Data una matrice A esiste il teorema di Cayley-Hamilton che afferma: ogni matrice è radice della
propria equazione caratteristica.
Localizzazione degli autovalori di A nel piano complesso
In virtù del teorema di Hirsch tutti gli autovalori appartengono al cerchio nel piano complesso di
centro l’origine e raggio A .
Una regione più precisa del piano complesso è definita dal teorema di Gershgorin: gli autovalori di
A appartengono alla regione
n
ci
i 1
n
dove ci sono i cerchi z a ii i con i a ij
, i 1,..., n .
j1
j i
Infatti, se è autovalore di A e x un suo autovettore e x r x , allora la r-esima equazione del
sistema Ax=x è
n
x r a rj x j
j1
o anche
n
( a rr ) x r a rj x j
.
j1
j r
Passando ai moduli si ha
n
a rr x r a rj x j x r
j1
j r
n
a
j1
j r
rj
ed essendo x r 0 viene
n
a rr a rj
.
j 1
j r
Da questo teorema segue subito che se A è a predominanza diagonale forte, allora è non degenere.
Il secondo teorema di Gershgorin afferma: se A è irriducibile e appartiene alla frontiera
dell’unione dei cerchi allora appartiene alla frontiera di ciascun cerchio.
Dimostrazione. Infatti sia x l’autovettore associato a e x x . L’autovalore , per il
p
precedente teorema di Gershgorin appartiene al cerchio cp di centro app e raggio p, ma per l’ipotesi
fatta appartiene alla frontiera di tale cerchio, cioè dovrà essere
24
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
n
a pp a pj
.
j 1
j p
Ma essendo
n
a pp x p a pj x j
j1
j p
o anche
n
xj
j1
j p
xp
a pp a pj
n
a pj
j1
j p
per l’uguaglianza di cui sopra, deve valere l’uguale. Anzi se apj0 per qualche j ne segue x j x p ,
in quanto
xj
xp
1 .
Per l’ipotesi di irriducibilità di A, ossia grafo di A fortemente connesso, esiste senz’altro almeno un
elemento apr0 con rp e quindi x r x . Pertanto, ripetendo quanto sopra fatto, dovrà
appartenere anche alla frontiera del cerchio cr. Iterando il procedimento, si considerano man mano
tutti gli indici, in quanto, per essere il grafo di A fortemente connesso, esiste un cammino orientato
che tocca tutti i nodi del grafo, ossia tutti i centri dei cerchi.
Da questo teorema segue che una matrice a predominanza diagonale debole e grafo fortemente
connesso è non singolare.
Tenendo poi conto che la trasposta di A ha gli stessi autovalori diA, si può ripetere tutto quanto per
la matrice AT e determinare una regione T che contiene tutti gli autovalori. Ne segue che gli
autovalori di A appartengono anche a T.
Riportiamo infine, senza dimostrazione, il terzo teorema di Gershgorin: ad ogni unione connessa di
cerchi ci appartengono tanti autovalori quanti sono i cerchi. Oppure, se l’ insieme di k cerchi è
disgiunto dall’insieme costituito dai restanti n-k cerchi, allora k autovalori appartengono al primo
insieme e n-k all’altro.
Infine, tenendo conto che l’equazione
n
Pn ( x) a i x i 0
an 0
i0
può equivalentemente essere intesa come l’equazione caratteristica della matrice di ordine n del tipo
di Frobenius:
aan 1
n
1
A 0
0
a n2
an
0
1
0
a 1n
0
0
1
a
25
a 0n
0
0
0
a
Metodi Matematici per l’Ingegneria - Prof. M. Caprili
è possibile localizzare le sue radici nel piano complesso facendo uso dei teoremi di Gerchgorini. Ad
esempio, tutte le radici di Pn(x)=0 sono interne al cerchio del piano complesso
n 1
ai
i 0
an
{z C : z max( 1,
Il cerchio di centro z c
ai
an
)} .
e raggio 1, cioè
|z – zc| 1
è interno al cerchio di centro l’origine e raggio 1 + |zc| , cioè al cerchio di equazione
|z| 1 + |zc| .
Infatti, se z appartiene al cerchio di centro zc e raggio 1, si ha:
|z| = |z – zc+ zc| |z – zc| + |zc| 1 + |zc| ,
e quindi z appartiene al cerchio di centro l’origine e raggio 1+zc.
La matrice A è detta compagna dell’equazione algebrica
n
Pn ( x )
i 0
26
ai i
x .
an