Dispense - Unicalbook

UNIVERSITÀ DELLA CALABRIA
ALGEBRA LINEARE E GEOMETRIA
Corso di Laurea in Ingegneria Elettronica
Dott. Gentile Tommaso
A.A. 2013/2014
. . . e com cinco ou seis retas
é fácil fazer um castelo
(Vinicius de Moraes)
Indice
1.
2.
3.
Sistemi di equazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.1.
Definizioni e notazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.2.
Il metodo di Gauss-Jordan. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Spazi vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.
Vettori geometrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.
Spazi vettoriali, definizioni e proprietà . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Matrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.1.
Definizioni e algebra delle matrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.2.
Rango e determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.
Prodotto scalare Euclideo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.
Applicazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
6.
7.
5.1.
Definizione e principali proprietà . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.2.
Applicazioni lineari e matrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Diagonalizzazione di matrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
6.1.
Problema di diagonalizzazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
6.2.
Caso delle matrici simmetriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Spazi affini e spazi Euclidei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
7.1.
Geometria nel piano affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
7.2.
Geometria nello spazio affine di dimensione 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
1
1. Sistemi di equazioni lineari
1.1. Definizioni e notazioni.
In questa prima parte studieremo sistemi di equazioni lineari. Sebbene abbiate già familiarità con alcuni
argomenti di questa sezione, prestate particolare attenzione ai metodi ed alle strumentazioni adottate.
Questo stimolerà l’intuito ed aiuterà la comprensione degli argomenti più astratti che seguiranno.
Fissiamo anzitutto alcune notazioni e convenzioni utilizzate nel resto della sezione. L’insieme numerico
su cui lavoriamo è l’insieme dei numeri reali R. Le prime lettere dell’alfabeto in minuscolo (a, b, c etc.)
denoteranno costanti mentre le ultime lettere dell’alfabeto (x, y, z etc.) saranno usate per rappresentare le
variabili. Quando il numero di incognite è arbitrariamente grande useremo un’unica lettera per designare
tutti i coefficienti ed un’unica lettera per tutte le incognite che distingueremo tra loro attraverso l’uso
di indici. Rappresenteremo inoltre le matrici con le lettere maiuscole, mentre i vettori saranno denotati
con lettere minuscole in grassetto.
Definizione 1.1. Una equazione lineare nelle n variabili x1 , x2 , . . . , xn è un’equazione del tipo
(1)
a1 x1 + a2 x2 + · · · + an xn = b,
dove i coefficienti a1 , a2 , . . . , an ed il termine noto b sono numeri reali. Una soluzione dell’equazione
lineare (1) è una sequenza di n numeri reali (s1 , s2 , . . . , sn ) tali che, sostituiti al posto delle rispettive variabili nell’equazione (1) rendono verificata l’uguaglianza. Risolvere un’equazione equivale a determinarne
l’insieme di tutte le soluzioni.
Nelle equazioni lineari pertanto non compaiono radici o potenze, né tantomeno funzioni trigonometriche,
esponenziali o logaritmiche, né tantomeno prodotti tra variabili e potenze.
Esempio 1.2. Le seguenti equazioni sono lineari:
√
2x − y = 6;
3x1 − πx2 + 23 x4 = 1.
Le seguenti equazioni non sono lineari:
xz − 4y = 3;
cos x1 − 3x2 + x3 − 2 log x4 = 0.
4
Per descrivere l’insieme delle soluzioni di un sistema lineare usualmente utilizziamo una rappresentazione
parametrica, come illustrato nell’esempio seguente.
Esempio 1.3. Risolviamo l’equazione: x1 + 2x2 = 4.
Per trovare l’insieme delle soluzioni la risolviamo in una delle variabili rispetto all’altra variabile. Risolvendola per x1 in termini della x2 otteniamo x1 = 4 − 2x2 . Ora la variabile x2 è “libera”, ovvero
può assumere un qualsiasi valore reale. La variabile x1 non è libera in quanto il suo valore dipende dal
valore assegnato ad x2 . Per rappresentare le infinite soluzioni dell’equazione è conveniente introdurre
una nuova variabile, che denoteremo con la lettera t per esempio, detta parametro. Ponendo x2 = t
possiamo rappresentare le soluzioni nella seguente forma:
(
x1 = 4 − 2t
dove t ∈ R.
x2 = t
2
Per ottenere una soluzione particolare assegniamo un valore al parametro t. Se per esempio t = −1 una
soluzione particolare sarà data da x1 = 6 e x2 = −1.
4
Definizione 1.4. Un sistema di m equazioni lineari nelle n variabili x1 , x2 , . . . , xn (in breve un sistema
lineare) è un insieme di m equazioni, ciascuna delle quali è lineare nelle stesse n variabili.

a11 x1 + a12 x2 + · · · + a1n xn = b1



 a x + a x + ··· + a x = b
21 1
22 2
2n n
2
 ··· ··· ···



am1 x1 + am2 x2 + · · · + amn xn = bm
(2)
dove i coefficienti aij ed i termini noti bi sono numeri reali. Una soluzione del sistema lineare (2) è una
sequenza di n numeri reali s1 , s2 , . . . , sn tali che, sostituiti al posto delle rispettive variabili in ciascuna
delle equazioni le uguaglianze sono verificate. Risolvere un sistema di equazioni equivale a determinarne
l’insieme di tutte le soluzioni.
Consideriamo adesso il ben noto problema di geometria analitica sul piano riguardo l’intersezione di due
rette.
Esempio 1.5. Disegniamo le seguenti coppie di rette:
(1) 2x − y = 0;
(2) 2x + 3y = 0;
(3) x − y = 0;
3x + 2y = 2;
4x + 6y = 0;
−x + y = 1.
(3)
(2)
(1)
2 y
y
y
1
2
1
x
1
−1
1
x
1
2
x
−1
1
−1
−1
Come può essere l’insieme delle soluzioni di un sistema lineare di due equazioni in due incognite? Il
sistema che fornisce l’intersezione delle prime due rette ha una sola soluzione, il secondo sistema ha
infinite soluzioni mentre il terzo non ha soluzioni.
4
L’esempio precedente illustra i tre possibili casi che possono presentarsi quando risolviamo un sistema di
equazioni lineari.
Definizione 1.6. Un sistema lineare è detto compatibile se ammette soluzioni mentre è incompatibile
o impossibile se non ammette soluzioni. Un sistema lineare compatibile è determinato se ammette
una sola soluzione ed è detto indeterminato se ammette infinite soluzioni.
3
1.2. Il metodo di Gauss-Jordan.
Consideriamo i
(3)

 2x1 −
3x1 +


−x1 −
seguenti sistemi lineari.
x2
2x2
5x2
+ 4x3
+ x3
− 3x3
−
+
−
x4
3x4
2x4
= 7
= −1
= 3


 2x1
− 3x2
8x2
+ 2x3
+ x3


−
+
x4
2x4
3x4
= 2
= −1
= 1
Quale sistema è più facile da risolvere algebricamente?
Il sistema a destra è chiaramente il piú facile. Questo sistema ha una forma particolare detta a scala.
Per risolverlo si adotta la procedura nota con il termine “risoluzione all’indietro” illustrata qui di seguito.
Esempio 1.7. Usiamo la risoluzione all’indietro per risolvere il seguente sistema:
(
2x − 3y = 2
5y = −1
Dall’ultima equazione otteniamo y = − 51 . Sostituendo questo valore nella prima equazione si ottiene:
1
13
2x − 3 −
= −2, da cui x = − .
5
10
Il sistema è quindi compatibile e determinato, con soluzione:

13

 x = − 10
.


1
y = −5
Usiamo la risoluzione all’indietro per risolvere il seguente sistema:


 x1 + x2 + x3 − 3x4 + x5
− x3 + x4 + 2x5


2x4 − 4x5
=
=
=
Risolviamo l’ultima equazione rispetto alla variabile x4 , ottenendo x4
espressione nelle precedenti due equazioni. Scriviamo pertanto il sistema


 x1 + x2 + x3 − 3(2x5 + 1) + x5
− x3 + (2x5 + 1) + 2x5


x4
= 2x5
2
−1
2
= 2x5 + 1. Sostituiamo tale
nella seguente forma:
=
=
+
2
−1
1
Portiamo quindi il monomio la cui parte letterale è x5 unitamente alla costante a secondo membro sia
nella prima che nella seconda equazione. Il sistema diventa:


= 5x5 + 1
 x1 + x2 + x3
− x3
= −4x5 − 2


x4 = 2x5 + 1
Dalla seconda equazione risulta x3 = 4x5 +2. Sostituiamo questa espressione ad x3 nella prima equazione.
Il sistema diventa:


= 5x5 + 1
 x1 + x2 + (4x5 + 2)
x3
= 4x5 + 2


x4 = 2x5 + 1
Portiamo ancora l’espressione in x5 con le costanti a secondo membro ottenendo:


= x5 − 1
 x1 + x2
+ x3
= 4x5 + 2


x4 = 2x5 + 1
4
Portiamo x2 a secondo membro nella prima equazione.


= −x2 + x5 − 1
 x1
x3
=
4x5 + 2


x4 =
2x5 + 1
Poniamo quindi x2 e x5 uguali ad altrettanti parametri s e t.
Otteniamo pertanto le soluzioni del sistema lineare espresse in forma parametrica:


x1 = −s + t −1





x
 2= s
dove s, t ∈ R.
x3 =
4t +2



x4 =
2t +1



 x =
t
5
Il sistema è quindi compatibile e indeterminato.
4
Due sistemi lineari sono detti equivalenti se hanno il medesimo insieme di soluzioni. In genere, quando
dobbiamo risolvere un sistema cerchiamo di trasformarlo in un altro equivalente, ma di forma più semplice.
Ma quali operazioni elementari trasformano un sistema in un altro equivalente?
Per quanto concerne le equazioni lineari valgono i Principi di equivalenza per le equazioni lineari, elencati
qui di seguito.
Primo principio di equivalenza - Data un’equazione, aggiungendo ad entrambi i membri uno stesso
numero od una stessa espressione lineare contenente una o più incognite si ottiene un’equazione equivalente.
Secondo principio di equivalenza - Data un’equazione, moltiplicando ambo i membri per un numero
diverso da zero si ottiene un’equazione equivalente.
Per risolvere un’equazione lineare applichiamo opportunatamente tali operazioni in sequenza fino ad
ottenere la soluzione dell’equazione data. Essi costituiscono quindi i passi base di un procedimento
algoritmico.
Consideriamo ora il caso di un sistema di equazioni lineari. Anche in virtù dell’esempio precedente per
risolvere un sistema lineare lo trasformiamo in un altro ad esso equivalente in forma a scala utilizzando
le operazioni qui elencate:
(OE1) - trasporre due equazioni;
(OE2) - moltiplicare un’equazione per una costante diversa da zero;
(OE3) - sommare ad un’equazione un multiplo di un’altra equazione.
Il procedimento è noto come metodo di eliminazione di Gauss, in onore del grande matematico
tedesco Carl Friedrich Gauss (1777-1855).
Valgono i seguenti teoremi di cui omettiamo la dimostrazione.
Teorema 1.8. Applicando una operazione del tipo (OE1), (OE2) o (OE3) ad un sistema di equazioni
lineari si ottiene un sistema equivalente a quello dato.
Teorema 1.9. Ogni sistema di equazioni lineari è equivalente ad un sistema in forma a scala.
Illustriamo ora il metodo di eliminazione di Gauss attraverso un esempio.
5
Esempio 1.10. Risolviamo il seguente sistema:


 x1 − 3x2
2x1 − x2


x1 + 2x2
+ x3
− 2x3
− 3x3
= 1
= 2
= −1
Sommiamo alla seconda equazione l’equazione ottenuta moltiplicando ambo i membri della prima equazione
per −2, ottenendo:


 x1 − 3x2 + x3 = 1
5x2 − 4x3 = 0


x1 + 2x2 − 3x3 = −1
Aggiungendo la prima equazione moltiplicata per −1 alla terza equazione otteniamo una nuova terza
equazione. Il sistema diventa:


 x1 − 3x2 + x3 = 1
5x2 − 4x3 = 0


5x2 − 4x3 = −2
Sottraiamo ora alla terza equazione la seconda equazione.


 x1 − 3x2 + x3
5x2 − 4x3


0
= 1
= 0
= −2
L’ultima equazione è chiaramente impossible. Il sistema è quindi incompatibile.
4
Per risolvere un sistema lineare mediante il procedimento di Gauss è conveniente focalizzare la nostra
attenzione sui coefficienti e sui termini noti. Dato un sistema lineare nella forma (2), introduciamo le
tabelle di numeri


a11 a12 · · · a1n


 a21 a22 · · · a2n 
(4)
A := 
..
.. 
..
 ..

.
 .
.
. 
am1 am2 · · · amn
e


b1


 b2 

(5)
b :=  . 
.
 .. 
bm
Una tabella del tipo (4) è detta matrice di tipo m × n dove m e n indicano rispettivamente il numero
di righe ed il numero di colonne in essa contenute. I numeri aij sono detti elementi o entrate della
matrice. Gli elementi ai1 , ai2 , . . . , ain costituiscono la i-esima riga della matrice A, mentre gli elementi
a1j , a2j , . . . , amj costituiscono la j-esima colonna della matrice A. Ad esempio la tabella (5) è una
matrice di tipo m × 1. Una tale matrice verrà chiamata vettore colonna. La matrice A è detta matrice
dei coefficienti, mentre b è il vettore termine noto. Introduciamo inoltre la matrice completa (o
matrice orlata) associata al sistema lineare (2):

(6)


A := 


C
a11
a21
..
.
am1
a12
a22
..
.
am2
···
···
..
.
···
a1n
a2n
..
.
amn
b1
b2
..
.
bm






6
Esempio 1.11. Consideriamo


 2x1 − x2 + 4x3
3x1 + 2x2 + x3


−x1 − 5x2 − 3x3
i sistemi lineari (3).
−
+
−
Scriviamo le due matrici complete

2 −1

2
 3
−1 −5
x4
3x4
2x4


 2x1
= 7
= −1
= 3
− 3x2
8x2
+ 2x3
+ x3
−
+


x4
2x4
3x4
= 2
= −1
= 1
loro associate:
4
1
−3
−1
3
−2

7

−1 
3

2

 0
0
−3
8
0

2 −1 2

1 2 −1 
0 3
1
4
Notiamo che la seconda matrice ha una particolare configurazione, detta anch’essa a scala. Formalizziamo
meglio tale nozione.
Definizione 1.12. Una matrice è detta in forma a scala se soddisfa le seguenti proprietà:
(1) ogni riga i cui elementi sono tutti nulli si trova nella parte più bassa della matrice;
(2) per due successive righe i cui elementi non sono tutti nulli allora il primo termine non nullo
nella riga posta più in alto è strettamente piă sinistra rispetto a quello della successiva riga.
I primi elementi non nulli di ciascuna riga (le cui entrate non siano tutte uguali a zero) vengono chiamati
pivots (o coefficienti leader). Notiamo che tutti gli elementi sottostanti un pivot sono uguali a zero.
Notiamo che un sistema lineare è in forma a scala se e soltanto se la matrice completa associata al sistema
è ancora a scala.
Nella risoluzione di un sistema di equazioni lineari spesso considereremo le matrici ad esso associate.
Quanto definito per i sistemi lineari ha un corrispettivo nel linguaggio delle matrici. In particolare il
metodo di eliminazione di Gauss permette di ridurre una matrice AC associata ad un sistema lineare ad
una matrice in forma a scala. Le operazioni elementari (OE1), (OE2) e (OE3) diventano:
(OE10 ) - trasporre due righe;
(OE20 ) - moltiplicare tutte le entrate di una riga per una costante diversa da zero;
(OE30 ) - sommare ad una riga un multiplo di un’altra riga (termine a termine).
Dunque per risolvere un sistema lineare noi procederemo come segue:
(1) scriviamo la matrice orlata AC associata al sistema;
(2) usiamo il metodo di eliminazione di Gauss per ridurre AC in una forma ridotta a scala;
(3) scriviamo il sistema corrispondente e lo risolviamo mediante la risoluzione all’indietro.
Esempio 1.13. Risolviamo il seguente sistema lineare:

x2 + x3 −



 x
+ 2x2 − x3
1

2x1 + 4x2 + x3 −



x1 − 4x2 − 7x3 +
3x4
12x4
La matrice completa associata al sistema è

0 1
 1 2


 2 4
1 −4
−3
2
−2
20
1
−1
1
−7
−2
0
−3
12
2x4





= −3
= 2
= −2
= 20
7
Trasponiamo ora le prime due righe:





1
0
2
1
2
1
4
−4
−1
1
1
−7
0
−2
−3
12
2
−3
−2
20





Ora sommiamo alla terza riga la prima riga moltiplicata per −2. Si ottiene:


1 2 −1 0
2
 0 1
1 −2 −3 




 0 0
3 −3 −6 
1 −4 −7 12 20
Sottraiamo la prima riga alla quarta:





1
0
0
0
2
1
0
−6
−1
1
3
−6
0
−2
−3
12
2
−3
−6
18





Abbiamo il nostro primo pivot. Ora sommiamo alla quarta riga la seconda moltiplicata per 6. Otteniamo:


1 2 −1 0
2
 0 1 1 −2 −3 




 0 0 3 −3 −6 
0
0
0
0
0
Abbiamo praticamente finito. La nostra matrice orlata è ridotta in una forma a scala. Moltiplichiamo
comunque la terza riga per lo scalare 31 . Si ottiene cosı̀:


1 2 −1 0
2
 0 1 1 −2 −3 




 0 0 1 −1 −2 
0 0 0
0
0
Il sistema corrispondente è il seguente:


 x1 +
2x2
x2


− x3
+ x3
x3
− 2x4
− x4
= 2
= −3
= −2
dove omettiamo l’identità 0 = 0. Usando la risoluzione all’indietro troviamo


=
2
 x1 + 2x2 − (x4 − 2)
x2 + (x4 − 2) − 2x4 =
−3


x3
= x4 − 2


=
x4
 x1 + 2x2
x2
= x4 − 1


x3 = x4 − 2
Infine:


 x1
+
2(x4 − 1)
x2


x3
=
x4
= x4 − 1
= x4 − 2
=
=
=
−x4 + 2
x4 − 1
x4 − 2
Segue


 x1


+
x2
x3
8
Ponendo x4 = t si ottengono le soluzioni:

x1



 x
2

x
3



x4
= −t + 2
= t−1
= t−2
=
t
dove t ∈ R.
4
Dopo aver ridotto la matrice a scala, è possibile usare una versione dell’algoritmo di Gauss in senso
inverso, cioè dal basso verso l’alto, per ottenere una matrice che in ogni colonna contenente un pivot
abbia solo il pivot come numero non nullo: basta usare ogni riga, partendo dall’ultima, per eliminare tutte
le cifre diverse da zero che stanno sopra al pivot di questa riga usando in genere regole di tipo (OE20 ) e
(OE30 ). Infine, sempre tramite operazioni elementari (moltiplicando righe), possiamo ottenere che ogni
pivot abbia valore 1. La matrice risultante è detta in forma a scala ridotta. L’algoritmo completo di
ambo le parti è detto metodo di Gauss-Jordan.
Esempio 1.14. Ad esempio, consideriamo

1
 0


 0
0
la matrice a scala dell’esempio precedente:

2 −1 0
2
1 1 −2 −3 


0 1 −1 −2 
0
0
0
0
Anziché scrivere ora il sistema lineare associato proseguiamo finché la matrice completa non si presenta
in forma a scala ridotta. Applichiamo pertanto operazioni elementare in modo che gli elementi sopra
alcun pivot siano nulli. Sottraendo la terza riga alla seconda si ottiene:


1 2 −1 0
2
 0 1 0 −1 −1 




 0 0 1 −1 −2 
0
0
0
0
Sommando ora la terza riga alla prima otteniamo:

1 2 0
 0 1 0


 0 0 1
0 0 0
−1
−1
−1
0
0
−1
−2
0
Sommiamo quindi alla prima riga la seconda

1
 0


 0
0
Il sistema associato a quest’ultima matrice è:


 x1
x2


0





moltiplicata per −2:

0 0 1
2
1 0 −1 −1 


0 1 −1 −2 
0
0
0
0
x3
+
−
−
x4
x4
x4
= 2
= −1
= −2
con soluzioni date da:

x1 = −t + 2



 x = t−1
2
 x3 = t − 2



x4 =
t
dove t ∈ R.
9
4
Ora analizziamo un caso molto particolare di sistema lineare, il sistema lineare omogeneo.
Definizione 1.15. Un sistema di equazioni lineari è detto omogeneo se i termini noti sono tutti uguali
a zero.
Consideriamo un sistema lineare omogeneo:

a11 x1 + a12 x2 + · · · + a1n xn = 0



 a x + a x + ··· + a x = 0
21 1
22 2
2n n
(7)

·
·
·
·
·
·
·
·
·



am1 x1 + am2 x2 + · · · + amn xn = 0
Si verifica facilmente che al termine dell’algoritmo di Gauss-Jordan le incognite si separano in due gruppi:
(1) xi1 , xi2 , . . . , xir variabili associate alle colonne dove ci sono i pivots (variabili pivotali );
(2) xj1 , xj2 , . . . , xjn−r variabili associate alle colonne dove non ci sono i pivots (variabili libere).
Il sistema associato alla matrice a

xi1



 x
i2

···



xir
scala ridotta è del tipo
= ci1 ,1 xj1 + ci1 ,2 xj2 + · · · + ci1 ,n−r xjn−r
= ci2 ,1 xj1 + ci1 ,2 xj2 + · · · + ci1 ,n−r xjn−r
··· ···
= ci1 ,1 xj1 + ci1 ,2 xj2 + · · · + ci1 ,n−r xjn−r
dove i ci,j sono numeri reali. Ponendo le variabili xj1 , xj2 , . . . , xjn−r pari ad altrettante variabili libere
(dette altresı̀ parametri) scriviamo le variabili pivotali in funzione delle variabili libere.
Poiché un sistema lineare omogeneo ha sempre la soluzione in cui ciascuna variabile è uguale a zero si
ha che ogni sistema lineare omogeneo è compatibile. Come conseguenza del metodo di Gauss-Jordan
abbiamo il seguente teorema di Steinitz.
Teorema 1.16. (di Steinitz) - Un sistema di equazioni lineari omogeneo dove il numero di incognite
è più alto del numero di equazioni ha sempre una soluzione non banale, ovvero quella in cui tutte le
variabili sono nulle.
Proof. Osserviamo che la matrice a scala ridotta che risulta applicando Gauss-Jordan ha sempre colonne
non pivotali poiché ci sono più incognite che equazioni. Poste le variabili libere uguali ad altrettanti
valori non tutti uguali a zero si ottiene una soluzione non banale del sistema.
10
2. Spazi vettoriali
2.1. Vettori geometrici.
I vettori furono introdotti nel XVI secolo per rispondere all’esigenza di caratterizzare alcune grandezze
fisiche quali velocità, accelerazione, forza, per le quali non era sufficiente una quantità scalare.
In un corso di matematica o fisica elementare un vettore è definito come un segmento orientato. Un
segmento orientato (o vettore applicato) dello spazio ordinario è individuato da un punto iniziale A e da
−−→
un punto finale B. Denotiamo tale segmento orientato con AB. Il punto iniziale A è detto anche punto
di applicazione del segmento orientato dato. Esso viene rappresentato con una freccia che congiunge i
punti A e B come in figura.
B
A
Un segmento orientato è quindi individuato da un punto di applicazione, una direzione ovvero la retta
su cui il vettore applicato giace, un verso ovvero il verso di percorrenza di tale retta da A a B e da un
modulo (detto altresı̀ norma) ovvero la lunghezza del segmento AB misurato mediante una prefissata
unità di misura. Se B ≡ A il vettore applicato corrispondente avrà modulo nullo, verso e direzione
indeterminati.
−−→ −−→
Due vettori applicati AB e CD sono detti equipollenti se giacciono su rette parallele e se, muovendo una
delle due rette parallelamente a sé stessa, è possibile sovrapporre i due segmenti in modo che coincidano
−−→ −−→
−−→ −−→
sia i punti iniziali che i punti finali. Se AB e CD sono equipollenti scriveremo AB ∼ CD.
B
D
A
C
−−→
Dato un vettore applicato AB tale che A 6≡ B ed un punto A0 esiste uno ed un solo punto B 0 tale che
−−→ −−0−→0
AB ∼ A B .
L’equipollenza è una relazione di equivalenza, cioè soddisfa alle proprietà riflessiva, simmetrica e transitiva. In virtù di questo noi considereremo “uguali ” vettori tra loro equipollenti. Useremo il termine
vettore geometrico o brevemente vettore una classe di equipollenza di vettori applicati, ovvero tutti i
vettori equipollenti ad un dato vettore applicato. Il vettore nullo 0 è la classe dei vettori equipollenti
−→
al vettore AA. Le nozioni di modulo, direzione e verso si estendono facilmente ai vettori geometrici. Il
vettore nullo ha quindi modulo nullo, verso e direzione indeterminati.
I vettori verranno denotati con lettere minuscole in grassetto (u, v, w etc.).
Definiamo ora due operazioni sull’insieme dei vettori, la somma e la moltiplicazione per uno scalare.
La somma è una operazione che associa ad una coppia di vettori, un terzo vettore. Per sommare due
vettori si possono usare la regola del parallelogramma o la regola della spezzata.
11
B
D
A
C
La figura qui in alto illustra la regola del parallelogramma. Dati due vettori u e v li consideriamo
applicati in un medesimo punto dello spazio ordinario A. Siano pertanto B e C due ulteriori punti tali
−−→
−→
−−→
che u = AB e v = AC. Il vettore somma u + v è il vettore AD dove D è il quarto vertice che forma con
A, B e C un parallelogramma, da cui il nome.
B
C
A
La precedente figura riguarda invece la regola della spezzata. Dati due vettori u e v siano B e C due
−−→
−−→
−→
ulteriori punti tali che u = AB e v = BC. Il vettore somma u + v è il vettore AC. Il termine spezzata
segue dal fatto che i segmenti AB e BC costituiscono una spezzata.
Si osserva facilmente che per ogni terna di vettori u, v e w valgono le seguenti:
•
•
u+v =v+u
u + (v + w) = (u + v) + w
(proprietà commutativa);
(proprietà associativa).
Dalla seconda di queste proprietà segue che possiamo estendere la somma ad un numero finito arbitario
di vettori e che possiamo omettere le parentesi quando sommiamo tre o più vettori.
Sia ora 0 il vettore nullo e sia v un vettore arbitrario. Denoteremo con −v il vettore avente lo stesso
modulo di v, la stessa direzione di v, ma verso opposto. Sono verificate le identità:
•
•
v+0=v
v + (−v) = 0
(0 elemento neutro della somma);
(esistenza dell’inverso additivo, detto altresı̀ opposto).
Definiamo ora il prodotto di un vettore v per un numero reale k. Il risultato di questa operazione è il
vettore kv che ha la stessa direzione di v, modulo pari a modulo di v moltiplicato |k| e verso concorde
o discorde con v a seconda che k sia positivo o negativo.
L’operazione di moltiplicazione di un vettore geometrico per uno scalare è compatibile con l’operazione
di somma di vettori e con le operazioni di addizione e moltiplicazione in R. Se k, h sono arbitrari scalari
e se u e v sono arbitrari vettori geometrici valgono le seguenti identità:
•
•
•
•
(−1)v = −v
(kh)v = k(hv)
k(u + v) = ku + kv
(k + h)v = kv + hv
(proprietà distributiva rispetto alla somma di vettori);
(proprietà distributiva rispetto alla somma di scalari).
2.2. Spazi vettoriali, definizioni e proprietà.
Le proprietà che i vettori geometrici soddisfano costituiranno gli assiomi nella definizione di un spazio
vettoriale.
12
Definizione 2.1. Uno spazio vettoriale reale è un insieme V non vuoto (i cui elementi saranno
chiamati vettori e saranno denotati con lettere minuscole in grassetto) tale che:
(1) per ogni coppia di vettori v1 , v2 ∈ V esiste un terzo vettore in V , detto somma dei vettori v1 e
v2 e denotato v1 + v2 ;
(2) per ogni vettore v ∈ V ed ogni scalare k ∈ R, esiste un nuovo vettore in V , detto prodotto del
vettore v per lo scalare k e denotato kv.
Queste operazioni devono soddisfare le seguenti proprietà:
(SV1) Proprietà commutativa della somma: per ogni coppia di vettori v1 , v2 ∈ V , v1 + v2 = v2 + v1 ;
(SV2) Proprietà associativa della somma: per ogni terna di vettori v1 , v2 , v3 ∈ V , (v1 + v2 ) + v3 =
v1 + (v2 + v3 );
(SV3) Esistenza dell’elemento neutro per la somma: esiste un vettore 0 ∈ V tale che per ogni altro
vettore v ∈ V , v + 0 = 0 + v = v (il vettore 0 è detto vettore nullo);
(SV4) Esistenza dell’opposto: per ogni vettore v ∈ V , esiste un vettore −v ∈ V tale che v + (−v) = 0;
(SV5) Proprietà distributiva della moltiplicazione per uno scalare rispetto alla somma di vettori: per
ogni scalare k ∈ R ed ogni coppia di vettori v1 , v2 ∈ V , k(v1 + v2 ) = kv1 + kv2 ;
(SV6) Proprietà distributiva della moltiplicazione per uno scalare rispetto alla somma di scalari: per
ogni coppia di scalari k, h ∈ R ed ogni vettore v ∈ V , (k + h)v = kv + hv;
(SV7) per ogni coppia di scalari k, h ∈ R ed ogni vettore v ∈ V , (kh)v = k(hv);
(SV8) per ogni vettore v ∈ V , 1v = v.
Dalla proprietà associativa segue che sommando tre o più vettori di uno spazio vettoriale possiamo
omettere le parentesi. Le seguenti ulteriori proprietà per uno spazio vettoriale possono essere ottenute
dalle proprietà (SV1), . . . , (SV8).
Proposizione 2.2. Sia V uno spazio vettoriale reale. Le seguenti valgono.
(i)
(ii)
(iii)
(iv)
(v)
Se k ∈ R, allora k0 = 0.
Sia k ∈ R \ {0}. Se kv = 0 allora v = 0.
Siano v, w ∈ V . Se v + w = 0 allora w = −v.
Se v ∈ V allora (−1)v = −v.
Se v ∈ V allora 0v = 0.
Esempio 2.3. Le proprietà che abbiamo verificato all’inizio della lezione implicano che l’insieme dei
vettori geometrici del piano e dello spazio ordinario costituiscono altrettanti spazi vettoriali reali.
4
Esempio 2.4. Sia n ≥ 1 e sia V = Rn l’insieme delle n-uple ordinate di numeri reali. Definiamo la
somma di due n-uple (x1 , . . . , xn ), (y1 , . . . , yn ) ∈ V come
(x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn )
e per ogni k ∈ R, definiamo
k(x1 , . . . , xn ) = (kx1 , . . . , kxn ).
Se v = (x1 , . . . , xn ) ∈ V chiamiamo x1 , . . . , xn componenti o coordinate di v. È immediato verificare
che con queste operazioni Rn soddisfa agli assiomi (SV1), . . . , (SV8). Notiamo che quando n = 1 le
usuali operazioni di addizione e sottrazione definiscono una struttura di spazio vettoriale su sé stesso.
4
13
Esempio 2.5. Sia V = R[x] l’insieme dei polinomi a coefficienti in R nella variabile x. Le usuali
operazioni di somma di polinomi e moltiplicazione per uno scalare definiscono una struttura di spazio
vettoriale reale su R[x].
4
Esempio 2.6. Sia V l’insieme delle funzioni a valori reali definite su un intervallo [a, b] ⊂ R. Definiamo
in V la somma e moltiplicazione per uno scalare nel modo usuale. Si verifica facilmente che V è uno
spazio vettoriale reale.
4
Definizione 2.7. Un sottoinsieme W di uno spazio vettoriale V è detto sottospazio vettoriale di V
se esso soddisfa le due condizioni.
(SSV1) Per ogni coppia di vettori v1 , v2 ∈ W , v1 + v2 ∈ W .
(SSV2) Per ogni vettore v ∈ W ed ogni scalare k ∈ R, kv ∈ W .
Esempio 2.8. Consideriamo un sistema lineare omogeneo in n incognite. Ricordiamo che una soluzione
di tale sistema è una n-upla di numeri reali soddisfacente tutte le equazioni del sistema. Essa è pertanto
un vettore di Rn . Inoltre si vede facilmente che la somma di due soluzioni del sistema ed il prodotto
di una soluzione per uno scalare (somma e moltiplicazione per uno scalare definite come nell’esempio
2.4) costituiscono altrettante soluzioni. Segue quindi che lo spazio delle soluzioni di un sistema lineare
omogeneo in n incognite è un sottospazio vettoriale di Rn .
4
Esempio 2.9. Nello spazio dei polinomi V = R[x], l’insieme dei polinomi aventi grado al più n (per
ogni n fissato) è un sottospazio vettoriale di V .
4
Esempio 2.10. Sia V lo spazio vettoriale definito come nell’esempio 2.6 e sia W ⊂ V l’insieme delle
funzioni a valori reali definite e continue su un intervallo [a, b] ⊂ R. Allora W è un sottospazio vettoriale.
4
È ovvio dalla definizione precedente che se W ⊆ V è un sottospazio vettoriale di V , allora W è esso
stesso uno spazio vettoriale. La seguente proposizione è di verifica immediata.
Proposizione 2.11. Ogni spazio vettoriale V contiene due sottospazi vettoriali, V e l’insieme contenente
il solo vettore nullo 0. Quest’ultimo è detto sottospazio nullo ed è denotato con (0) o semplicemente con
{0}.
Definiamo ora la seguente importante operazione sui sottospazi, la somma.
Definizione 2.12. Sia V uno spazio vettoriale e siano W1 , W2 due sottospazi vettoriali di V . Definiamo
il sottospazio somma di W1 e W2 come:
W1 + W2 := {v ∈ V |∃w1 ∈ W1 , w2 ∈ W2 tale che v = w1 + w2 }.
Se W1 ∩ W2 = {0} allora scriveremo W1 ⊕ W2 al posto di W1 + W2 e chiameremo tale sottospazio somma
diretta di W1 e W2 .
Vale la seguente proposizione.
Proposizione 2.13. Sia V uno spazio vettoriale e siano W1 , W2 due sottospazi vettoriali di V . Allora
W1 ∩ W2 e W1 + W2 sono altrettanti spazi vettoriali di V .
14
Proof. Siano w, w0 ∈ W1 ∩ W2 e sia k ∈ R. Per definizione di intersezione w e w0 appartengono sia a W1
che a W2 . Per definizione di sottospazio allora sia w + w0 che kw appartengono a W1 a W2 e pertanto
alla loro intersezione. Questo prova che W1 ∩ W2 è un sottospazio vettoriale di V .
Siano ora w, w0 ∈ W1 + W2 e sia k ∈ R. Siano x1 , y1 ∈ W1 e x2 , y2 ∈ W2 tali che w = x1 + x2 e
w0 = y1 + y2 . Allora:
w + w0 = x1 + x2 + y1 + y2 = (x1 + y1 ) + (x2 + y2 ) ∈ W1 + W2 .
e
kw = k(x1 + x2 ) = kx1 + kx2 ∈ W1 + W2 .
Segue quindi la tesi.
Consideriamo inoltre il seguente ulteriore risultato
Proposizione 2.14. Sia V uno spazio vettoriale e siano W1 , W2 due sottospazi vettoriali di V tali che
W1 ∩ W2 = (0). Allora ogni vettore in W1 ⊕ W2 ha una unica rappresentazione come somma di un vettore
in W1 ed un vettore in W2 .
Proof. Sia w ∈ W1 ⊕ W2 e siano x1 , y1 ∈ W1 e x2 , y2 ∈ W2 tali che w = x1 + x2 = y1 + y2 . Vogliamo
mostrare che x1 = y1 e x2 = y2 . Abbiamo:
0 = v − v = x1 + x2 = y1 + y2 = (x1 − y1 ) + (x2 − y2 ).
Segue pertanto:
x1 − y1 = −(x2 − y2 ) ∈ W1 ∩ W2 = (0).
Dunque x1 − y1 = x2 − y2 = 0, da cui x1 = y1 e x2 = y2 .
Consideriamo ora l’importante definizione di combinazione lineare.
Definizione 2.15. Sia V uno spazio vettoriale e siano v1 , v2 , . . . , vn vettori in V . Un vettore w è una
combinazione lineare dei precedenti n vettori se esistono scalari k1 , k2 , . . . , kn tali che
w = k1 v1 + k2 v2 + · · · kn vn .
Lo spazio generato dai vettori v1 , v2 , . . . , vn è l’insieme di tutte le combinazioni lineari degli n vettori,
e viene denotato con hv1 , v2 , . . . , vn i. Se V = hv1 , v2 , . . . , vn i diremo che v1 , v2 , . . . , vn generano V .
Esempio 2.16. Siano v1 = (1, 2, 3), v2 = (0, 1, 2) e v3 = (−1, 0, 1) tre vettori di R3 . Verifichiamo che il
vettore w = (1, 1, 1) ∈ R3 si può scrivere come combinazione lineare dei vettori v1 , v2 e v3 . Cerchiamo
pertanto scalari a1 , a2 e a3 tali che:
w = a1 v1 + a2 v2 + a3 v3 ,
cioè
(1, 1, 1) = a1 (1, 2, 3) + a2 (0, 1, 2) + a3 (−1, 0, 1).
Questa equazione “vettoriale” si traduce in un sistema di equazioni lineari nelle variabili a1 , a2 e a3 :


 a1 − a3 = 1
2a1 + a2 = 1


3a1 + 2a2 + a3 = 1
Questo sistema è compatibile e indeterminato con soluzioni:


t+1
 a1 =
dove t ∈ R.
a2 = −2t − 1


a3 =
t
15
Una particolare espressione di w come combinazione lineare di v1 , v2 e v3 si trova ponendo per esempio
t = 1. Allora a1 = 2, a2 = −3 e a3 = 1 e
w = 2v1 + −3v2 + v3 .
4
Si verifica facilmente che lo spazio generato da un insieme di vettori di V è un sottospazio vettoriale.
Definizione 2.17. Sia V uno spazio vettoriale. n vettori v1 , v2 , . . . , vn ∈ V sono detti linearmente
dipendenti (in breve l.d.) se esiste una combinazione lineare di v1 , v2 , . . . , vn uguale a 0 i cui coefficienti
non sono tutti nulli. Essi sono detti linearmente indipendenti (in breve l.i.) se non sono linearmente
dipendenti.
Esempio 2.18. Consideriamo i tre vettori v1 = (1, 2, 3), v2 = (0, 1, 2) e v3 = (−1, 0, 1) in R3 dell’esempio
precedente. Per verificare se i tre vettori v1 , v2 e v3 sono linearmente dipendenti o indipendenti cerchiamo
scalari a1 , a2 e a3 tali che:
0 = a1 v1 + a2 v2 + a3 v3 ,
cioè
(0, 0, 0) = a1 (1, 2, 3) + a2 (0, 1, 2) + a3 (−1, 0, 1).
Come prima risolviamo il sistema di equazioni lineari omogeneo associato nelle variabili a1 , a2 e a3 :


 a1 − a3 = 0
2a1 + a2 = 0


3a1 + 2a2 + a3 = 0
Questo sistema è indeterminato con soluzioni:


t
 a1 =
a2 = −2t


a3 =
t
dove t ∈ R.
Posto t = 1 otteniamo la combinazione lineare non banale:
0 = v1 + −2v2 + v3
che esprime il vettore nullo come combinazione lineare di v1 , v2 e v3 . I tre vettori sono pertanto
linearmente dipendenti.
4
Vale quest’ultima utile riformulazione della definizione di dipendenza lineare.
Proposizione 2.19. n vettori v1 , v2 , . . . , vn ∈ V sono detti linearmente dipendenti se e solo se uno
di loro è una combinazione lineare degli altri.
Proof. Supponiamo
vi = k1 v1 + · · · + ki−1 vi−1 + ki+1 vi+1 + · · · + kn vn .
In tal caso otteniamo k1 v1 + · · · + ki−1 vi−1 − vi + ki+1 vi+1 + · · · + kn vn = 0 e quindi v1 , v2 , . . . , vn
sono linearmente dipendenti. Viceversa supponiamo che esista una combinazione lineare dei vettori
v1 , v2 , . . . , vn con coefficienti non tutti nulli. Supponiamo quindi k1 v1 + k2 v2 + · · · kn vn = 0 con ki 6= 0.
Segue facilmente che vi = (−ki )−1 (k1 v1 + · · · + ki−1 vi−1 + ki+1 vi+1 + · · · + kn vn ) e quindi la tesi. Consideriamo ora la definizione di base di uno spazio vettoriale.
Definizione 2.20. Sia V uno spazio vettoriale. Un sistema di vettori v1 , v2 , . . . , vn ∈ V costituiscono
una base di V se generano V e se in aggiunta sono linearmente indipendenti.
16
Esempio 2.21. Consideriamo lo spazio vettoriale R3 . I vettori e1 = (1, 0, 0), e2 = (0, 1, 0) e e3 = (0, 0, 1)
sono linearmente indipendenti e generano tutto lo spazio. Essi pertanto costituiscono una base di R3 ,
detta base canonica (o base standard o ancora base euclidea). Tale definizione si estende facilmente
ad Rn . La base canonica di Rn è costituita dai vettori e1 , e2 , . . . , en , dove ei , per i = 1, 2, . . . , n, è il
vettore avente tutte le entrate uguali a 0 tranne la i-esima che vale 1.
4
Notiamo che non tutti gli spazi vettoriali possiedono una base fatta in questo modo. L’esistenza di un
numero finito di generatori e quindi di una base finita è propria degli spazi vettoriali finito dimensionali.
Uno spazio vettoriale che non è finito dimensionale è detto infinito dimensionale o equivalentemente
che ha dimensione infinita. D’ora in avanti, salvo avviso contrario quando parleremo di spazi vettoriali
intenderemo sempre spazi vettoriali finito dimensionali.
Teorema 2.22. Sia V uno spazio vettoriale. Siano v1 , v2 , . . . , vn ∈ V linearmente indipendenti e siano
k1 , k2 , . . . , kn e h1 , h2 , . . . , hn scalari tali che
k1 v1 + k2 v2 + · · · kn vn = h1 v1 + h2 v2 + · · · hn vn .
Allora ki = hi per i = 1, . . . , n.
Proof. Sottraendo il membro a destra dal membro a sinistra, abbiamo
(k1 − h1 )v1 + (k2 − h2 )v2 + · · · (kn − hn )vn = 0.
Per definizione di dipendenza lineare abbiamo ki − hi = 0, per ogni i = 1, . . . , n.
Corollario 2.23. Sia V uno spazio vettoriale e sia {v1 , v2 , . . . , vn } una base di V . Allora ogni elemento di V si scrive univocamente come combinazione lineare dei vettori v1 , v2 , . . . , vn . I coefficienti
k1 , k2 , . . . , kn che esprimono un vettore v come combinazione lineare degli elementi della base sono dette
coordinate di v rispetto alla base {v1 , v2 , . . . , vn }.
Teorema 2.24. Sia V uno spazio vettoriale e sia {v1 , v2 , . . . , vn } una base di V . Siano {w1 , w2 , . . . , wm }
vettori di V e assumiamo m > n. Allora w1 , w2 , . . . , wm sono linearmente dipendenti.
Proof. Omessa.
Corollario 2.25. (Teorema della dimensione per spazi vettoriali) Basi diverse di uno stesso
spazio vettoriale finito dimensionale hanno la stessa cardinalità.
Proof. Siano date due basi di uno spazio vettoriale V , una di cardinalità m, una di cardinalità n. In
virtù del teorema precedente applicato alle due basi otteniamo m ≤ n ed allo stesso tempo n ≤ m, da
cui l’uguaglianza.
Teorema 2.26. Sia V uno spazio vettoriale di dimensione n e siano v1 , v2 , . . . , vn vettori linearmente
indipendenti in V . Allora {v1 , v2 , . . . , vn } è una base di V .
Proof. Sia v ∈ V un vettore. I vettori {v, v1 , v2 , . . . , vn } sono linearmente dipendenti per il Teorema
2.24. Esiste pertanto una combinazione lineare dei suddetti vettori a coefficienti non tutti nulli uguale
al vettore nullo 0. Esistono cioè scalari k1 , k2 , . . . , kn , h tali che:
k1 v1 + k2 v2 + · · · kn vn + hv = 0.
Lo scalare h è diverso da zero altrimenti si avrebbe una combinazione lineare di v1 , v2 , . . . , vn a coefficienti non tutti nulli uguale al vettore nullo. Questo è impossibile perché v1 , v2 , . . . , vn sono linearmente
indipendenti. Segue quindi:
1
v = − (k1 v1 + k2 v2 + · · · kn vn + hv) ,
h
17
ovvero v è combinazione lineare di v1 , v2 , . . . , vn . Per l’arbitrarietà di scelta di v in V si ha che
v1 , v2 , . . . , vn generano V e quindi ne costituiscono una base.
Esempio 2.27. Siano v1 = (1, 2, −1), v2 = (0, −1, 2) e v3 = (2, 0, 3) in R3 . Mostriamo che essi sono
linearmente indipendenti, quindi costituiscono una base di R3 . A tal proposito siano a1 , a2 , a3 ∈ R tale
che:
a1 v1 + a2 v2 + a3 v3 = 0.
Questa equazione vettoriale si traduce nel seguente sistema lineare omogeneo:


 a1 + a3 = 0
2a1 − a2 = 0


−a1 + 2a2 + 3a3 = 0
Si verifica facilmente che questo sistema è compatibile e determinato. Esso ammette quindi la sola
soluzione banale a1 = a2 = a3 = 0. I tre vettori sono linearmente indipendenti, quindi in virtù del
Teorema 2.26 costituiscono una base di R3 .
4
Corollario 2.28. Sia V uno spazio vettoriale e sia W un sottospazio. Se dim(W ) = dim(V ) allora
W =V.
Proof. Per il teorema precedente una base di W è anche base di V .
Proposizione 2.29. Sia V uno spazio vettoriale di dimensione n e siano v1 , v2 , . . . , vr r vettori linearmente indipendenti di V , dove r < n. Allora esistono vettori vr+1 , vr+2 , . . . , vn tale che {v1 , v2 , . . . , vn }
è una base di V .
Proof. Omessa.
Chiudiamo questa prima parte sugli spazi vettoriali con la seguente importante proposizione che mette
in relazione le dimensioni degli spazi intersezione e somma di due sottospazi vettoriali di uno spazio
vettoriale fissato V .
Proposizione 2.30. (Grassmann) Siano V uno spazio vettoriale e siano U , W sottospazi vettoriali
di V . Vale la seguente formula, nota come Formula di Grassmann:
dim(U + W ) = dim(U ) + dim(W ) − dim(U ∩ W ).
Proof. Omessa.
Esempio 2.31. Due sottospazi vettoriali 2-dimensionali V, W di R3 hanno intersezione non nulla. Infatti
vale V + W ⊂ R3 e quindi dim(V + W ) ≤ 3. Dalla formula di Grassmann segue:
dim(V ∩ W ) = dim(V ) + dim(W ) − dim(V + W ) ≥ 2 + 2 − 3 = 1,
ovvero che dim(V ∩ W ) 6= {0}.
4
18
3. Matrici
3.1. Definizioni e algebra delle matrici.
Come definito precedentemente chiamiamo matrice di tipo m × n una tabella di numeri reali organizzata
in m righe e n colonne.

(8)


A=


a11
a21
..
.
am1
a12
a22
..
.
am2
···
···
..
.
···
a1n
a2n
..
.
amn






Indicheremo le matrici con lettere latine maiuscole (A, B, C etc.). Talvolta scriveremo una generica
matrice in forma contratta A = (aij ) dove 1 ≤ i ≤ m e 1 ≤ j ≤ n sono detti rispettivamente indice riga
e indice colonna. L’elemento aij sarà allora l’elemento che appartiene alla i-esima riga e alla j-esima
colonna. Se m = n la matrice è detta quadrata di ordine n. Una matrice di tipo 1 × n è detta vettore
riga mentre una matrice di tipo m × 1 è detta vettore colonna. Sia A la matrice (8), la i-esima riga di A
è il vettore riga
Ai = ai1 ai2 · · · ain
mentre la j-esima colonna è il vettore colonna



A =


j
a1j
a2j
..
.
amj



.


Due matrici sono uguali quando sono dello stesso tipo e hanno entrate uguali nelle stesse posizioni, cioè
se A = (aij ) e B = (bij ) sono matrici dello stesso tipo, allora A = B se e solo se aij = bij per ogni i, j.
Se A = (aij ) è una matrice di tipo m×n chiamiamo trasposta di A la matrice tA ottenuta scambiandone
le righe con le colonne, pertanto una matrice B = (bij ) di tipo n × m è la trasposta di A se per ogni
i, j, bij = aji . Ovviamente vale che t (tA) = A. Se A = tA allora A è detta simmetrica, mentre se
A = −tA (dove −A è la matrice ottenuta da A cambiando i segni di tutte le sue entrate) allora A è detta
antisimmetrica (o emisimmetrica). Una matrice simmetrica o antisimmetrica è necessariamente
quadrata.
Sia A = (aij ) una matrice quadrata. Gli elementi aij con i = j sono detti elementi principali. Essi
costituiscono la diagonale principale. In una matrice antisimmetrica gli elementi della diagonale principale
sono tutti uguali a zero. La somma degli elementi della diagonale principale di una matrice quadrata
A = (aij ) è detta traccia della matrice ed è denotata con tr(A).
Definiamo ora alcune importanti operazioni sulle matrici, la somma e la moltiplicazione per uno scalare.
Definiamo la somma di due matrici solo quando esse sono dello stesso tipo, ovvero solo se hanno lo stesso
numero di rige e di colonne. Siano quindi m, n interi positivi fissati e siano A = (aij ), B = (bij ) due
matrici di tipo m × n. Definiamo la matrice somma di A e B una matrice C = (cij ) dello stesso tipo
ponendo cij = aij + bij . Scriveremo in tal caso C = A + B.
19
La somma di matrici gode delle seguenti proprietà. Siano A, B e C tre matrici dello stesso tipo.
•
•
A+B =B+A
A + (B + C) = (A + B) + C
(proprietà commutativa);
(proprietà associativa).
La matrice le cui entrate sono tutte uguali a zero è detta matrice nulla. Denoteremo tale matrice con la
lettera O. Notiamo che comunque fissiamo due interi posivi m, n esiste una matrice nulla di tipo m × n.
Si verifica facilmente che tale matrice è l’elemento neutro rispetto alla somma, ovvero, per ogni matrice
A di tipo m × n,
A + O = O + A = A.
Notiamo infine che data una matrice A di tipo m × n, cambiando di egno a tutte le sue entrate otteniamo
una nuova matrice −A tale che
A + (−A) = O.
Definiamo ora la moltiplicazione di una matrice per uno scalare. Sia A = (aij ) una matrice e sia k ∈ R.
Definiamo il prodotto della matrice A per lo scalare k la matrice C = (cij ) dello stesso tipo di A tale
che cij = kaij . Scriveremo in tal caso C = kA. Siano A, B matrici dello stesso tipo e siano k, h numeri
reali. Le seguenti si verificano facilmente.
•
•
•
•
(−1)A = −A
(kh)A = k(hA)
k(A + B) = kA + kB
(k + h)A = kA + hA
(proprietà distributiva rispetto alla somma di matrici);
(proprietà distributiva rispetto alla somma di scalari).
Segue pertanto che, comunque noi fissiamo interi positivi m, n l’insieme delle matrici di tipo m × n
con le operazioni di somma e di moltiplicazione per uno scalare costituiscono uno spazio vettoriale, che
denoteremo con Mm×n .
Proposizione 3.1. (i) Se A, B sono arbitrarie matrici m × n allora:
t
(A + B) = tA + tB.
(ii) Se A è una matrice arbitraria e k ∈ R, allora
t
kA = k(tA).
(iii) Sia A è una matrice quadrata arbitraria. Allora A + tA è una matrice simmetrica.
(iv) Sia A è una matrice quadrata arbitraria. Allora A − tA è una matrice antisimmetrica.
(v) Ogni matrice quadrata è somma di una matrice simmetrica e di una matrice antisimmetrica.
Proof. Omessa. Lasciata per esercizio.
Definiamo ora una seconda operazione tra matrici, meno intuitiva delle due precedenti. La moltiplicazione tra matrici. Definiamo prima la moltiplicazione tra un vettore riga ed un vettore colonna aventi
il medesimo numero di entrate, ovvero il prodotto tra una matrice A di tipo 1 × n ed una matrice B di
tipo n × 1. Siano quindi


b1


 b2 

A = a1 a2 · · · an
e B= . 
.
 .. 
bn
20
La matrice prodotto C = AB è la matrice di tipo 1 × 1 (avente quindi un’unica entrata)
!
n
X
C = (a1 b1 + a2 b2 + · · · an bn ) =
ai bi .
i=1
Nel seguito identificheremo una matrice con una sola entrata con lo scalare corrispondente.
Estendiamo tale definizione al prodotto di due matrici A, B in cui il numero di colonne della prima
matrice A è uguale al numero di righe della seconda matrice B (se ciò accade A è detta conformabile
con B). Sia pertanto A di tipo m × p e sia B di tipo p × n. La matrice prodotto di A e B è la matrice
C = (cij ) di tipo m × n tale che cij = Ai B j , dove ricordiamo che Ai e B j sono rispettivamente l’i-esimo
vettore riga di A ed il j-esimo vettore colonna di B, che ovviamente hanno lo stesso numero p di elementi.
Esempio 3.2. Siano A e B le seguenti matrici:
!
1 −1
A=
2 3
1
−1
B=
0 3
1 2
!
.
La matrice A, di tipo 2 × 2 è conformabile con B, di tipo 2 × 3. Possiamo eseguire il prodotto di A e B
ed il risultato è il seguente:
!
!
1+1 0−1 3−2
2 −1 1
AB =
=
.
2−3 0+3 6+6
−1 3 12
4
Notiamo che tale operazione non gode della proprietà commutativa.
Esempio 3.3. Siano A e B le matrici:
1
0
A=
0
0
!
1
0
B=
!
.
In questo caso A è conformabile con B ma B non è conformabile con A. Il risultato del prodotto AB è
uguale alla matrice:
!
1
AB =
,
0
mentre non è possibile fare BA.
4
Esempio 3.4. Siano A e B le matrici:
1
0
A=
!
B=
1
1
.
In questo caso è possibile fare entrambi i prodotti AB e BA, ma essi non possono coincidere in quanto
le matrici risultanti non sono dello stesso tipo. Infatti si ha
!
1 1
AB =
BA = 1 .
0 0
mentre non è possibile fare BA.
4
Esempio 3.5. Siano A e B le matrici:
A=
1
0
0
0
!
B=
0
1
0
0
!
.
21
In questo caso è possibile fare entrambi i prodotti AB e BA, queste matrici sono dello stesso tipo ma il
risultato è diverso. Infatti
!
!
0 0
0 0
AB =
BA =
.
0 0
1 0
4
Sia In la matrice quadrata di ordine n in cui tutti gli elementi siti sulla diagonale principale sono uguali
a 1, mentre gli altri sono uguali a 0. Scriveremo semplicemente I quando non vogliamo porre l’attenzione
sull’ordine della matrice. Valgono le seguenti proprietà, elencate nella seguente proposizione.
Proposizione 3.6. (P1) Proprietà associativa: Per ogni terna di matrici A, B, C, dove A è conformabile con B e B è conformabile con C, si ha (AB)C = A(BC).
(P2) Proprietà distributiva della moltiplicazione rispetto alla somma: Per ogni terna di matrici
A, B, C, dove A è conformabile con B e C, e B, C sono dello stesso tipo, si ha A(B + C) =
AB + AC.
(P3) Per ogni coppia di matrici A, B dove A è conformabile con B ed ogni scalare k ∈ R, (kA)B =
k(AB).
(P4) Esistenza dell’elemento neutro: Per ogni matrice quadrata A, AI = IA = A.
(P5) Assorbenza della matrice nulla: Per ogni matrice quadrata A, AO = OA = O.
(P6) t (AB) = tB tA.
Proof. Omessa.
Applicando la definizione di prodotto tra matrici si vede anche che, per esempio, il sistema


 a11 x1 + a12 x2 + · · · + a1n xn = b1

 a x + a x + ··· + a x = b
21 1
22 2
2n n
2

·
·
·
·
·
·
·
·
·



am1 x1 + am2 x2 + · · · + amn xn = bm
si può scrivere nella forma, detta forma matriciale
Ax = b,
dove A è la matrice dei coefficienti, x = t (x1 , x2 , . . . , xn ) è il vettore colonna le cui entrate sono le
variabili e b è il vettore termine noto.
Notiamo che matrici quadrate dello stesso ordine possono essere sempre moltiplicate tra loro. In particolare una matrice quadrata può essere moltiplicata per sé stessa. Possiamo quindi definire la potenza
n-esima di una matrice quadrata nel modo seguente:

se n ≥ 1
· · · A}

 |A A{z
n
An =


I
se n = 0.
Per la potenza di matrici valgono quasi tutte le usuali proprietà delle potenze
Am An = Am+n ;
(Am )n = Amn ;
ma in generale la non commutatività implica che
(AB)n 6= An B n .
Una matrice quadrata A tale che A2 = A è detta idempotente, mentre se An = O per qualche n ≥ 1
A è detta nilpotente.
22
Esempio 3.7. La matrice:
A=
1
0
0
0
!
è idempotente. Infatti si verifica facilmente che A2 = A.
La matrice

0

B= 0
0
2
0
0

1

−1 
0
è nilpotente. Infatti:

0

2
B = 0
0
2
0
0

0
1

−1   0
0
0
2
0
0
 
0
1
 
−1  =  0
0
0
0
0
0

−2

0 ,
0
quindi

0 0

3
2
B =B B= 0 0
0 0

0 2
−2

0  0 0
0 0
0
 
0
1
 
−1  =  0
0
0
0
0
0

0

0 
0
4
Una matrice quadrata A è detta invertibile o non singolare se esiste una matrice B quadrata dello
stesso ordine tale che AB = BA = I. Una matrice è non invertibile o singolare se non è invertibile.
Se A è una matrice invertibile la matrice inversa è unicamente determinata da A. Supponiamo che B e
C siano matrici tali che AB = BA = AC = CA = I. Allora:
B = BI = B(AC) = (BA)C = IC = C.
L’inversa di una matrice A, se essa esiste, è denotata con A−1 .
La seguente proposizione elenca alcune immediate proprietà della matrice inversa.
Proposizione 3.8. Siano A, B matrici invertibili del medesimo ordine, sia n un intero positivo e sia k
uno scalare non nullo. Valgono le seguenti:
(1)
(2)
(3)
(4)
(5)
A−1 è invertibile con inversa (A−1 )−1 = A;
il prodotto AB è invertibile con inversa (AB)−1 = B −1 A−1 ;
la potenza An è invertibile con inversa (An )−1 = (A−1 )n ;
kA è invertibile con inversa (kA)−1 = k1 A−1 ;
t
A è invertibile con inversa (tA)−1 = t (A−1 ).
Studiamo ora un modo per determinare se una data matrice è invertibile e ne calcoliamo l’inversa.
Data una matrice quadrata A = (aij ) di ordine n, introduciamo una matrice quadrata X del medesimo
ordine le cui entrate sono incognite xij . Imponendo l’uguaglianza AX = I otteniamo equazioni lineari
nelle incognite xij aventi coefficienti tra le entrate della matrice A. In particolare tutto si traduce in n
sistemi lineari aventi tutti la stessa matrice dei coefficienti A con vettori dei termini noti ei , i = 1, . . . , n.
Possiamo risolvere simultaneamente tutti gli n sistemi applicando il procedimento di Gauss-Jordan alla
matrice:


a11 a12 · · · a1n | 1 0 · · · 0


 a21 a22 · · · a2n | 0 1 · · · 0 

(A|I) =  .
..
..
.. .. .. . .
. 
..
.
.
. .. 
 ..
.
.
. . .
an1 an2 · · · ann | 0 0 · · · 1
23
Quello che otteremo alla fine è che se la matrice A è invertibile tutti i sistemi saranno compatibili e
determinati, mentre se la matrice A è singolare almeno uno dei sistemi sarà incompatibile. Nel primo
caso la matrice assumerà la seguente forma finale:


1 0 · · · 0 | b11 b12 · · · b1n


 0 1 · · · 0 | b21 b22 · · · b2n 

(I|B) =  . . .
.. ..
..
..
.. 
..
.
.
.
.
.
.
 . .
. .
.
.
. 
0 0 · · · 1 | bn1 bn2 · · · bnn
Le entrate della matrice B costituiscono le soluzioni dei nostri sistemi, e quindi avremo B = A−1 .
Esempio 3.9. Sia A la matrice:

1

 −1
2
Applichiamo il procedimento di Gauss-Jordan alla

1 0

(A|I) =  −1 2
2 1

0 2

2 −1 
1 −1
matrice:

| 1 0 0

| 0 1 0 .
| 0 0 1
2
−1
−1
Otteniamo alla fine la matrice:

1 0 0

(I|B) =  0 1 0
0 0 1
A è invertibile con inversa


B=
1
11
3
11
5
11
|
|
|
2
− 11
5
11
1
11
1
11
3
11
5
11
2
− 11
5
11
1
11
4
11
1
11
2
− 11
4
11
1
11
2
− 11


.


.
4
3.2. Rango e determinante.
Consideriamo nuovamente il procedimento di Gauss. Osserviamo che le tre operazioni elementari sulle
righe di una matrice A:
(OE10 ) - trasporre due righe;
(OE20 ) - moltiplicare tutte le entrate di una riga per una costante diversa da zero;
(OE30 ) - sommare ad una riga un multiplo di un’altra riga (termine a termine).
corrispondono ad altrettante moltiplicazioni per particolari matrici, dette matrici elementari.
Definizione 3.10. Una matrice quadrata di ordine n è detta elementare se può essere ottenuta dalla
matrice idendità In applicando una delle tre operazioni elementari (OE10 ), (OE20 ) e (OE30 ).
Notiamo che le matrici elementari sono invertibili e matrici inverse di matrici elementari sono ancora
matrici elementari.
Una matrice B può quindi essere ottenuta da una matrice A mediante operazioni elementari sulle righe se
e solo se esistono matrici elementari E1 , E2 , · · · , En tali che B = En En−1 · · · E1 A. In tal caso diremo
24
che le matrici A, B sono equivalenti per righe. Osserviamo che tale relazione costituisce una relazione
di equivalenza tra matrici.
Data una matrice A di tipo m × n associamo ad A due sottospazi vettoriali di Rn e Rm rispettivamente,
lo spazio delle righe e lo spazio della colonne.
Definizione 3.11. Sia A una matrice di tipo m × n. con righe A1 , A2 . . . , Am ∈ Rn e colonne
A1 , A2 . . . , An ∈ Rm . Lo spazio delle righe di A è il sottospazio di Rn generato dalle righe della
matrice A. Lo spazio delle colonne di A è il sottospazio di Rm generato dalle colonne della matrice
A.
Vale il seguente teorema:
Teorema 3.12. Siano A, B due matrici sono ottenibili l’una dall’altra mediante operazioni elementari
sulle righe. Allora lo spazio delle righe di A è uguale allo spazio delle righe di B.
Proof. Il fatto che B si possa ottenere da A mediante operazioni elementari sulle righe equivale a dire
che le righe di B sono combinazioni lineari delle righe di A. Vale ovviamente anche il viceversa da cui
segue la tesi.
Questo teorema, unitamente al fatto che ogni matrice può essere ridotta in forma a scala segue che il
procedimento di Gauss ci permette di calcolare la dimensione dello spazio delle righe di una matrice.
Sussiste il seguente fondamentale teorema.
Teorema 3.13. Per ogni matrice A di tipo m × n la dimensione dello spazio delle righe di A è uguale
alla dimensione dello spazio delle colonne. Il valore comune, che denoteremo con rg(A) è detto rango
di A. Risulterà quindi rg(A) < m e rg(A) < n.
Proof. Sia r la dimensione dello spazio delle righe e sia {v1 , v2 , . . . , vr } una base di Rm . Allora per
ogni i ∈ {1, . . . , m}, esistono coefficienti cik tali che
(9)
Ai = ci1 v1 + · · · + cir vr .
Se vk = (xk1 xk2 · · · xkn ) allora le equazioni (9) sono equivalenti a
Aj = x1j w1 + x2j w2 + · · · xrj wr ,
dove wi = (c1i c2i · · · cmi ). Segue quindi che i vettori colonna sono combinazioni lineari degli r vettori
w1 , . . . , wr . Segue pertanto che la dimensione dello spazio delle colonne è minore di r. Considerando
la matrice trasposta tA otteniamo la diseguaglianza opposta. Segue la tesi.
Il seguente corollario fornisce un metodo per il calcolo del rango di una matrice A.
Corollario 3.14. Il rango di una matrice A è il numero delle righe non completamente nulle di una
matrice a scala B, ottenuta da A mediante operazioni elementari sulle righe.
Esempio 3.15. Calcoliamo il rango della matrice

2 0 1

A =  −1 1 0
−4 2 −1

−1

3 .
7
25
Sommando alla prima riga il doppio della seconda e sostituendo il risultato alla seconda, ed allo stesso
tempo sostituire alla terza riga il risultato della somma della stessa con il doppio della prima otteniamo
la matrice:


2 0 1 −1


 0 2 1 5 .
0 2 1 5
e quindi sostituendo alla terza riga la differenza della terza con la seconda abbiamo:


2 0 1 −1


 0 2 1 5 .
0 0 0 0
La matrice A ha pertanto rango 2.
4
Inoltre attraverso un procedimento di Gauss possiamo calcolare la dimensione dello spazio generato da
un sistema di vettori in Rn , di estrarre da un sistema di generatori una base e di estendere un sistema
di vettori linearmente indipendenti ad una base di Rn .
Esempio 3.16. Siano v1 = (2, 0, −1, 3), v2 = (1, 1, −1, 2), v3 = (−1, −2, 3, 4) e v4 = (−3, 0, 3, 2) vettori
in R4 . La dimensione del sottospazio di R4 generato dai vettori v1 , v2 , v3 e v4 equivale al rango della
matrice i cui vettori riga (o colonna) sono proprio i vettori considerati.
Il rango della matrice



A=

2
1
−1
−3
Applicando il metodo di Gauss alla matrice A

2
 0


 0
0
0 −1
1 −1
−2 3
0
3
3
2
4
2



.

è possibile ridurla alla seguente forma a scala:

0 −1 3
2 −1 1 

.
0 3 13 
0
0
0
Segue che V := hv1 , v2 , v3 , v4 i ha dimensione pari a 3. Inoltre una base dello stesso spazio V è costituita
dai vettori w1 = (2, 0, −1, 3), w2 = (0, 2, −1, 1) e w3 = (0, 0, 3, 13).
4
Esempio 3.17. Consideriamo gli stessi vettori dell’esempio percedente. Vogliamo una base dello spazio
V = hv1 , v2 , v3 , v4 i estratta dal sistema di generatori {v1 , v2 , v3 , v4 }. Per far questo occorre ridurre
con il processo algoritmico di Gauss la matrice le cui colonne coincidono con i vettori v1 , v2 , v3 e v4 ,
ovvero la matrice:


2
1 −1 −3
 0
1 −2 0 


B=
.
 −1 −1 3
3 
3
2
È possibile ottenere, da facili calcoli, la matrice ridotta

2 1 −1
 0 1 −2


 0 0 1
0 0 0
4
2
a scala:

−3
0 

.
1 
0
26
I pivot corrispondono alle prime tre colonne. Questo significa che i primi tre vettori v1 , v2 e v3 sono
linearmente indipendenti. Essi pertanto costituiscono una base di V .
4
Esempio 3.18. Sia V = Rn , per qualche n. Consideriamo ora il problema di estendere un sistema di
vettori linearmente indipendenti di V a base. Siano v1 = (2, 3, −1, −2) e v2 = (−1, −3, 2, 1) in R4 . I
vettori v1 , v2 , e1 , e2 , e3 , e4 costutuiscono un sistema di generatori per V . Agendo come nell’esempio
precedente costruiamo la matrice le cui colonne sono proprio questi sei vettori.


2 −1 1 0 0 0
 3
6 0 1 0 0 


C=
.
 −1 −2 0 0 1 0 
−2
−4
Riducendo con Gauss si ottiene la matrice ridotta a

2 −1 1
 0 −5 1


 0 0 0
0 0 0
0
0
0
1
scala:
0 0
0 0
1 3
0 −2
0
1
0
1



.

I pivot si trovano in corrispondenza delle colonne relative ai vettori v1 , v2 , e2 e e3 , che costituiscono
una base cercata.
4
Consideriamo ora il seguente fondamentale teorema che fornisce una condizione necessaria e sufficiente
affinché un sistema lineare sia compatibile.
Teorema 3.19. (di Rouché-Capelli) Un sistema lineare Ax = b è compatibile se e solo se il rango della
matrice A è uguale al rango della matrice completa AC .
Proof. Il sistema Ax = b si traduce nella seguente equazione vettoriale:
A1 x1 + A2 x2 + · · · + An xn = b,
da cui segue che il sistema è compatibile se e solo se il vettore termine noto è combinazione lineare
delle colonne della matrice dei coefficienti A Segue pertanto che lo spazio delle colonne della matrice dei
coefficienti A coincide con lo spazio delle colonne della matrice completa AC . Segue quindi la tesi.
Passiamo ora alla definizione di determinante. Ricordiamo che con Mn denotiamo lo spazio delle matrici
quadrate di ordine n.
Definizione 3.20. Sia n un intero positivo arbitrario. Il determinante è una funzione definita su Mn a
valori reali che denotiamo con det(·) che gode delle seguenti proprietà che lo determinano unicamente:
(D1)
(D2)
(D3)
(D4)
det(I) = 1;
Se B è ottenuta da A mediante trasposizione di due righe, allora det(B) = − det(A);
Se B è ottenuta da A sostituendo ad una riga per una costante k, allora det(B) = k det(A);
Se B è ottenuta da A sommando ad una riga un multiplo di un’altra riga det(B) = det(A).
Dalla definizione seguono importanti proprietà del determinante. In particolare valgono i seguenti teoremi.
Teorema 3.21. Sia A una matrice quadrata. Allora det(A) = det(tA).
27
Teorema 3.22. (di Binet) Siano A, B due matrice quadrate dello stesso ordine. Allora det(AB) =
det(A) det(B).
Dal teorema di Binet segue il seguente corollario.
Corollario 3.23. Sia A una matrice quadrata invertibile con inversa A−1 . Allora det(A−1 ) =
1
det(A) .
Inoltre vale il seguente risultato.
Teorema 3.24. Una matrice A è invertibile se e solo se det(A) 6= 0.
Vediamo ora come calcolare il determinante di una matrice.
Il determinante di matrici 2 ×2 si calcola facendo il cosiddetto prodotto incrociato, ovvero si moltiplicano
le entrate sulla diagonale principale e si sottrae dal risultato il prodotto degli altri due termini.
det
Sia ora
a
c

b
d
a11

A :=  a21
a31
!
= ad − bc.
a12
a22
a32

a13

a23 
a33
una matrice di tipo 3 × 3. Per tali matrici esiste un metodo, noto con il nome di metodo di Sarrus,
per il calcolo del determinante. Esso consiste nell’affiancare alla matrice A le prime due colonne. Poi
si procede moltiplicando le entrate nella diagonale principale e sommando a questo valore i risultati del
prodotto degli elementi delle “parallele” a questa. Infine sottraiamo al risultato ottenuto la somma dei
tre prodotti degli elementi dell’altra diagonale con le due “parallele”.
Questo procedimento non è generalizzabile a matrici di ordine superiore a 3. Descriviamo ora un metodo
più generale, il metodo di Laplace. Prima di descrivere questo procedimento definiamo il cofattore o
complemento algebrico di un elemento di una matrice quadrata. A tal proposito sia A = (aij ) una
matrice quadrata di ordine n e fissiamo i, j ∈ {1, . . . , n}. Il cofattore di aij è il determinante della
sottomatrice Mij (di ordine n − 1) che si ottiene da A cancellando la i-esima riga e la j-esima colonna,
con il proprio segno se i + j è pari, col segno opposto se i + j è dispari, cioè il numero
Aij = (−1)i+j det(Mij ).
Il determinante di A è dato da
det(A) =
n
X
k=1
aik Aik =
n
X
akj Akj ,
k=1
per ogni valore di i, j in {1, . . . , n}, cioè il determinante della matrice A è la somma dei prodotti degli
elementi di una linea di A (riga o colonna) per i rispettivi complementi algebrici. Il secondo membro è
detto sviluppo del determinante rispetto alla i-esima riga, mentre il membro a destra è lo sviluppo del
determinante rispetto alla j-esima colonna.
Data una matrice quadrata A, la matrice le cui entrate sono i cofattori degli elementi aij di A nella
medesima posizione è la matrice dei cofattori di A, mentre la sua trasposta è la matrice aggiunta di A,
che denotiamo con Adj(A). Vale il seguente teorema.
Teorema 3.25. Sia A una matrice quadrata. Allora A è invertibile se e solo se det(A) 6= 0 ed in tal
1
Adj(A).
caso A−1 = det(A)
Proof. Omessa.
28
Dal teorema precedente segue il seguente fondamentale teorema che ci permette di risolvere sistemi
quadrati.
Teorema 3.26. (di Cramer) Sia Ax = b un sistema lineare quadrato. Il sistema è compatibile e
determinato se e solo se det(A) 6= 0. In tal caso la soluzione del sistema è dato da
xi =
det(Ai )
,
det(A)
dove la matrice Ai è la matrice ottenuta sostituendo alla i-esima colonna il vettore termine noto b.
Proof. Poiché A ha determinante diverso da zero, A è invertibile. Segue che il sistema è compatibile e
determinato con soluzione:
1
x = A−1 b =
Adj(A)b.
det(A)
P
n
1
Segue che il valore di xi è dato da xi = det(A)
k=1 Aki bk . Notiamo che questa somma è lo sviluppo di
Laplace del determinante di Ai rispetto alla i-esima colonna. Segue la tesi.
Analizziamo ora più approfonditamente il rapporto che sussiste tra rango e determinante. Abbiamo visto
che se A è una matrice quadrata, il rango di A è massimo (pari all’ordine della matrice se e solo se il
determinante di A è diverso da zero. Vogliamo trovare un risultato più generale. A tal fine consideriamo
la seguente definizione.
Definizione 3.27. Un minore di ordine r di una matrice

a11 a12 · · · a1n

 a21 a22 · · · a2n
A=
..
..
..
 ..
.
 .
.
.
am1 am2 · · · amn






è il determinante di una matrice di ordine r ottenuta da A eliminando simultaneamente m − r righe e
n − r colonne. Qui chiaramente assumiamo r ≤ m e r ≤ n.
Per esempio i minori di ordine 1 corrispondono alle singole entrate della matrice mentre l’unico minore
di ordine n di una matrice quadrata n × n è il daterminante della matrice stessa.
Vale la seguente proposizione.
Proposizione 3.28. Il rango di una matrice A è il massimo ordine dei suoi minori non nulli.
Torniamo ora alla teoria degli spazi vettoriali. Abbiamo visto che le coordinate di un vettore dipendono
dalla base scelta. Esplicitiamo ora meglio questa dipendenza attraverso la teoria delle matrici.
Il teorema delle dimensioni per spazi vettoriali ci dice che basi diverse hanno comunque lo stesso numero
di elementi. Siano quindi B = {e1 , e2 , . . . , en } e B0 = {e01 , e02 , . . . , e0n } due basi di uno spazio vettoriale
finito dimensionale V . Per ogni i ∈ {1, 2, . . . , n} il vettore e0i si può esprimere come combinazione lineare
dei vettori della base B (e viceversa). Esistono quindi scalari c1i , c2i , . . . , c1n tali che
e0i
=
n
X
cki ei .
k=1
Usando una notazione matriciale possiamo scrivere:
( e01
e02
···
e0n ) = ( e1
e2
···
en )C,
dove C = (cij ). Poiché gli e0i cosı̀ come gli ei costituiscono altrettante basi le matrici le cui colonne sono
proprio tali vettori hanno rango massimo, quindi sono invertibili. Pertanto anche C è invertibile.
29
Sia ora v un vettore di V e siano x1 , x2 , . . . , xn e x01 , x02 , . . . , x0n le coordinate di v rispetto alle due
basi. Possiamo scrivere in tal caso:
 0 
 0 


x1
x1
x1
 0 
 0 


 x2 
 x2 
 x2 
0
0
0





v = ( e1 e2 · · · en ) 
 ..  = ( e1 e2 · · · en )  ..  = ( e1 e2 · · · en ) C  ..  ,
 . 
 . 
 . 
x0n
x0n
xn
da cui






x1
x2
..
.
xn






= C 




x01
x02
..
.
x0n






Moltiplicando ambo i membri di quest’ultima equazione per la matrice C −1 a sinistra otteniamo la
relazione inversa:


 0 
x1
x1


 0 
 x2 
 x2 
 .  = C −1  . 
 . 
 . 
 . 
 . 
xn
x0n
La matrice C prende il nome di matrice di cambiamento di base. Essa ha nelle sue colonne le componenti
dei vettori della seconda base rispetto alla prima base.
30
4. Prodotto scalare Euclideo
All’inizio della sezione sugli spazi vettoriali abbiamo analizzato vettori geometrici nel piano e nello spazio
ordinario. È possibile estendere questi concetti a spazi Rn . Consideriamo vettori in Rn come vettori
geometrici applicati all’origine delle coordinate. In questo modo un vettore geometrico nel piano è
identificato da una coppia di numeri reali. La direzione del vettore sarà la retta che lo contiene mentre il
verso dello stesso vettore sarà individuato in modo naturale dalla coppia di numeri reali ad esso associato.
La norma del vettore potrà quindi essere calcolata mediante il teorema di Pitagora. Infatti se v = (x1 , x2 )
p
allora la norma di v sarà kvk = x21 + x22 .
Sia ora v ∈ Rn . Definiamo la norma (o lunghezza) di v = (x1 , x2 , . . . , xn ) la quantità:
q
kvk = x21 + x22 + · · · + x2n .
Notiamo che le seguenti valgono:
(1) Per ogni vettore v ∈ Rn , kvk ≥ 0 e kvk = 0 se e solo se v = 0.
(2) Per ogni vettore v ∈ Rn e scalare k ∈ R, kkvk = |k|kvk.
(3) Per ogni coppia di vettori v, w ∈ Rn , kv + wk ≤ kkvk + kkwk (Diseguaglianza triangolare).
Due vettori non nulli v, w in Rn sono paralleli se hanno la medesima direzione, ovvero esiste uno scalare
non nullo k ∈ R tale che w = kv. Inoltre se k > 0 diremo che v e w hanno lo stesso verso, altrimenti
diremo che hanno verso opposto. Un versore è un vettore di norma pari ad 1. Dato un vettore v ∈ Rn
v
b = kvk
possiamo asso ciare a v un versore ad esso parallelo ed avente lo stesso verso ponendo v
. Tale
b è il normalizzato di v.
processo è noto come normalizzazione di v e v
Definiamo ora una importante operazione tra vettori di Rn , il prodotto scalare euclideo. Dati due vettori
v = (x1 , x2 , . . . , xn ), w = (y1 , y2 , . . . , yn ) in Rn il prodotto scalare tra v e w è il numero
v · w = x1 y1 + x2 y2 + · · · + xn yn .
Notiamo che kvk2 = v · v.
Osserviamo che il prodotto scalare euclideo soddisfa alle proprietà, di verifica immediata, elencate nella
seguente proposizione:
Proposizione 4.1. Per ogni k ∈ R, u, v, w ∈ Rn vale:
(1)
(2)
(3)
(4)
v · v ≥ 0 e v · v = 0 se e solo se v = 0;
v · w = w · v;
u · v + w = u · v + u · w;
(kv) · w = k(v · w) = v · (kw).
Una funzione che ad ogni coppia di vettori in uno spazio vettoriale V associa uno scalare che soddisfa le
quattro proprietà elencate nella proposizione è detto prodotto scalare.
Vale inoltre (per ogni prodotto scalare, in particolare per il prodotto scalare euclideo):
Proposizione 4.2. (Disuguaglianza di Cauchy-Schwarz) - Se v, w sono vettori in Rn allora
|v · w| ≤ kvkkwk.
Proof. Supponiamo dapprima v = 0. In tal caso |v · w| = 0, cosı̀ come kvk = 0 e quindi anche il secondo
membro è uguale a zero. Pertanto in tal caso la diseguaglianza è verificata. Supponiamo ora v 6= 0. Sia
31
x una variabile reale. La disuguaglianza
(xv + w) · (xv + w) ≥ 0,
deve essere soddisfatta per ogni valore di x per la positività del prodotto scalare. Segue
(v · v)x2 + 2(v · w)x + (w · w) ≥ 0
deve essere soddisfatta per ogni valore di x. Questo si ha se e solo se il discriminante del polinomio a
primo membro è minore o uguale a zero, ovvero se e solo se:
∆
≤ 0 =⇒ (v · w)2 − (v · v)(w · w) ≤ 0.
4
Dunque
(v · w)2 ≤ kvk2 kwk2 .
Estraendo la radice quadrata si ottiene la tesi.
Usando come modello R2 guardiamo al suo significato geometrico. Notiamo che la differenza di due vettori
in R2 è il vettore che collega i punti finali dei due vettori. Pertanto avremo che il vettore differenza dei
p
vettori v = (x1 , x2 ) e w = (y1 , y2 ) avrà norma pari a kv − wk = (x1 − y1 )2 + (x2 − y2 )2 . In virtù del
Teorema di Carnot (detto altresı̀ del coseno) si ha che la stessa lunghezza è uguale a:
kv − wk2 = kvk2 + kwk2 − 2kvkkwk cos(d
v w),
d
dove con v
w denotiamo l’angolo compreso tra v e w. Eguagliando le due quantità otteniamo:
(x1 − y1 )2 + (x2 − y2 )2 = x21 + x22 + y12 + y22 − 2kvkkwk cos(d
v w),
e quindi
x1 y1 + x2 y2
v·w
=
.
kvkkwk
kvkkwk
Pertanto il prodotto scalare euclideo fornisce l’angolo minimo compreso tra i due vettori.
cos(d
v w) =
Due vettori R2 sono tra loro ortogonali se e solo se l’angolo tra loro compreso è pari a π2 radianti misurato
in senso orario o antiorario, e quindi in virtù dell’uguaglianza precedente se e solo se v · w = 0. Questi
concetti possono essere generalizzati facilmente al caso di Rn , mantenendo le stesse notazioni. Se due
vettori v, w ∈ Rn sono ortogonali scriveremo v ⊥ w. Se v ∈ Rn e W è un sottospazio vettoriale di Rn
scriveremo ancora v ⊥ W se v è perpendicolare ad ogni vettore di W . Infine se U, W sono sottospazi
vettoriali di Rn , U è ortogonale a W se per ogni u ∈ U e per ogni w ∈ W , u ⊥ w.
Sia ora W ⊂ Rn un sottospazio vettoriale. Poniamo
W ⊥ := {v ∈ Rn : ∀w ∈ W v ⊥ w}.
W ⊥ è detto complemento ortogonale di W . Il complemento ortogonale dello spazio nullo è l’intero
spazio Rn e viceversa. Conoscendo la base di un sottospazio vettoriale W di Rn è possibile trovare lo
spazio complementare. Infatti se BW = {w1 , w2 , . . . , wm } è una base di W , si considera un vettore
incognito x = (x1 , x2 , . . . , xn ). Un tale x è in W ⊥ se e solo se wi · x = 0, per i = 1, 2, . . . , m. Il
complemento ortogonale di W è quindi soluzione di un sistema lineare omogeneo di m equazioni in n
incognite. Notiamo che il rango della matrice dei coefficienti (e quindi quella completa) è uguale a m.
In questo caso necessitiamo di n − m parametri per descrivere lo spazio W ⊥ , ovvero dim(W ⊥ ) = n − m.
Osserviamo inoltre che la proprietà (1) del prodotto scalare implica W ∩ W ⊥ = (0). Segue dalla formula
di Grassmann che W ⊕ W ⊥ = Rn . Una base B di un sottospazio vettoriale W ∈ Rn è detta ortogonale
se ogni coppia di vettori in B è mutuamente ortogonale. In particolare se B = {v1 , v2 , . . . , vm }, allora
vi · vj = 0 se i 6= j, i, j ∈ {1, 2, . . . , m}. Una base ortogonale è detta ortonormale se in aggiunta i
vettori vi sono versori, ovvero se vi · vj = δij se i, j ∈ {1, 2, . . . , m}.
32
Proposizione 4.3. Un sistema di vettori non nulli S ⊂ Rn a due a due ortogonali è linearmente
indipendente.
Proof. Sia S = {v1 , v2 , . . . , vm } un sistema di vettori non nulli a due a due ortogonali e siano k1 , k2 , . . . , km
scalari tali che k1 v1 + k2 v2 + · · · + km vm = 0. Per ogni i = 1, 2, . . . , m, vi · (k1 v1 + k2 v2 + · · · + km vm ) =
0·vi = 0. D’altra parte vi ·(k1 v1 +k2 v2 +· · ·+km vm ) = ki (vi ·vi ). Segue quindi ki = 0 per i = 1, 2, . . . , m,
ovvero la tesi.
Corollario 4.4. Un sistema di n vettori a due a due ortogonali in Rn costituisce una base dello spazio.
Proposizione 4.5. Se B = {v1 , v2 , . . . , vn } è una base ortonormale di Rn allora un vettore w ∈ Rn
ha la seguente rappresentazione come combinazione lineare dei vettori v1 , v2 , . . . , vn :
w = (w · v1 )v1 + (w · v2 )v2 + · · · + (w · vn )vn .
Questa proposizione ci mostra il vantaggio di avere una base ortonormale. Vediamo ora una procedura
che ci permette di costruire una base ortonormale da una base arbitraria di uno spazio vettoriale V dotato
di prodotto scalare. Tale procedimento è noto con il nome di procedimento di ortonormalizzazione
di Gram-Schmidt in onore di Jorgen Pederson Gram e Erhardt Schmidt. Esso consta di due parti:
• costruire una base ortogonale a partire dalla base data;
• normalizzare ciascun vettore della base costruita al punto precedente.
Prima di procedere fornendo i dettagli del processo, consideriamo l’importante concetto di proiezione.
Siano v e w due vettori di Rn , con w 6= 0. La proiezione di v nella direzione di w è il vettore
v·w
w.
projw (v) =
w·w
Si noti che (v − projw (v)) ⊥ w.
Torniamo al procedimento di Gram-Schmidt. Sia B = {v1 , v2 , . . . , vn } una base di Rn . Costruiamo
vettori w1 , w2 , . . . , wn ponendo
w1 := v1
w2 := v2 − projw1 (v2 )
..
.
wn := vn − projw1 (vn ) − projw2 (vn ) − · · · − projwn−1 (vn ).
Si verifica facilmente che i vettori w1 , w2 , . . . , wn sono a due a due ortogonali. Essi sono pertanto
linearmente indipendenti e quindi costituiscono una base di Rn . Infine ponendo
w1
c1
=w
u1 :=
kw1 k
w2
c2
u2 :=
=w
kw2 k
..
.
wn
d
un :=
=w
n,
kwn k
otteniamo una base ortonormale di Rn .
Notiamo che mettendo in colonna i vettori di una base ortogonale formiamo una matrice A tale che
AtA = I. Poichè ogni matrice commuta con l’inversa, abbiamo anche che AAt = I. Segue quindi che
anche le righe della matrice costituiscono una base ortonormale dello stesso spazio.
Consideriamo la seguente definizione:
33
Definizione 4.6. Una matrice è detta matrice ortogonale se AtA = AAt = I.
Le seguenti proprietà per matrici ortogonali sono di verifica immediata.
Proposizione 4.7. Siano A, B due matrici ortogonali. Le seguenti valgono:
(1) tA è ortogonale;
(2) det(A) = ±1;
(3) AB è ortogonale.
34
5. Applicazioni lineari
5.1. Definizione e principali proprietà.
Consideriamo ora funzioni tra spazi vettoriali. Particolarmente importanti per i nostri scopi è di studiare applicazioni ‘compatibili ’ con le strutture di spazio vettoriale. Consideriamo quindi la seguente
definizione.
Definizione 5.1. Siano V, W due spazi vettoriali. Una funzione T : V −→ W è un’applicazione
lineare se ∀v1 , v2 ∈ V e ∀kR,
(AL1) T (v1 + v2 ) = T (v1 ) + T (v2 );
(AL2) T (kv1 ) = kT (v1 ).
V è il dominio, W è il codominio. T è detta iniettiva se per ogni coppia di vettori v1 , v2 ∈ V con
v1 6= v2 , si ha T (v1 ) 6= T (v2 ). T è suriettiva se ogni elemento del codominio ha una controimmagine,
ovvero se per ogni w ∈ W esiste v ∈ V tale che T (v) = w. T è biiettiva se è sia iniettiva che suriettiva.
Esempio 5.2. Sia V uno spazio vettoriale n-dimensionale e sia B = {v1 , v2 , . . . , vn } una base di V .
L’applicazione T : V −→ Rn che associa ad ogni v ∈ V le sue coordinate rispetto alla base B scelta. Si
mostra facilmente che T è un’applicazione lineare, iniettiva e suriettiva, quindi biiettiva.
4
Esempio 5.3. Sia V lo spazio vettoriale delle funzioni infinitamente volte differenziabili, V = C∞ e
consideriamo l’operatore di derivazione D : V −→ V . D è chiaramente un’applicazione lineare. Essa non
è né iniettiva né suriettiva.
4
Definizione 5.4. Sia T : V −→ W una applicazione lineare. Poniamo:
ker(T ) := {v ∈ V : T (v) = 0W }.
Ricordiamo che l’immagine di una applicazione T : V −→ W , e quindi in particolare anche di una
applicazione lineare, è definita ponendo
Im(T ) := {w ∈ W : ∃v ∈ V tale che T (v) = w} = {T (v) : v ∈ V }.
Valgono le seguenti proposizioni:
Proposizione 5.5. Sia T : V −→ W una applicazione lineare. Allora ker(T ) è un sottospazio vettoriale
di V e Im(T ) è un sottospazio vettoriale di W .
Proof. Proviamo che ker(T ) è un’applicazione lineare. Siano v1 , v2 vettori appartenenti al nucleo e sia
k un numero reale. Consideriamo la somma v1 + v2 . Si ha dalla definizione di ker(T ):
T (v1 + v2 ) = T (v1 ) + T (v2 ) = 0W + 0W = 0W ,
cioè v1 + v2 ∈ ker(T ). Inoltre anche kv1 ∈ ker(T ) in quanto:
T (kv1 ) = kT (v1 ) = k0W = 0W .
Segue quindi che ker(T ) è un sottospazio vettoriale di V .
35
Siano ora w1 , w2 vettori appartenenti all’immagine di T e sia k un numero reale. Siano v1 , v2 ∈ V tali
che T (v1 ) = w1 e T (v2 ) = w2 . Allora:
w1 + w2 = T (v1 ) + T (v2 ) = T (v1 + v2 )
e
kw1 = kT (v1 ) = T (kv1 ).
Segue che w1 + w2 e kw1 appartengono all’immagine di T e quindi che Im(T ) è un sottospazio vettoriale
di W .
Proposizione 5.6. Un’applicazione lineare T : V −→ W è iniettiva se e solo se ker(T ) = {0V }.
Proof. Supponiamo T iniettiva e sia v ∈ ker(T ). Poiché T (v) = T (0V = 0W per l’iniettività di T segue
v = 0V .
Supponiamo ora che ker(T ) = {0V } e siano v1 , v2 ∈ V con T (v1 ) = T (v2 ). Allora T (v1 − v2 ) =
T (v1 ) − T (v2 ) = 0W , cioè v1 − v2 ∈ ker(T ). Quindi v1 − v2 = 0V , da cui v1 = v2 , ovvero T è
iniettiva.
Dalla definizione di Im(T ) si ha ovviamente che T è suriettiva se e solo se Im(T ) = W .
Un’applicazione lineare è detta anche omomorfismo. Se essa è iniettiva allora è un monomorfismo, se
suriettiva è un epimorfismo e se biiettiva è un isomorfismo. Un’applicazione lineare di uno spazio in
sé è detta endomorfismo mentre con il termine automorfismo si intende un isomorfismo di uno spazio
vettoriale in sé stesso.
Date due applicazioni lineari T, T 0 : V −→ W , definiamo la somma T + T 0 ponendo, per ogni v ∈ V :
(T + T 0 )(v) := T (v) + T 0 (v).
Si verifica facilmente che T + T 0 è una applicazione lineare. Inoltre se k ∈ R possiamo definire
un’applicazione lineare kT : V −→ W , ponendo, per ogni v ∈ V :
(kT )(v) := k(T (v)).
Proposizione 5.7. Siano V, W due spazi vettoriali. L’insieme
Hom(V, W ) := {T : V −→ W : T è un’applicazione lineare},
con le operazioni di somma e moltiplicazione per uno scalare definite precedentemente e vettore nullo
l’applicazione lineare che associa ad ogni vettore v il vettore nullo in W , è uno spazio vettoriale. Se
W = V scriveremo End(V ) al posto di Hom(V, V ).
Teorema 5.8. Siano V, W spazi vettoriali finito dimensionali e sia T : V −→ W un’applicazione lineare.
Allora
dim(V ) = dim(ker(T )) + dim(Im(T )).
Proof. Se Im(T ) = {0W } allora V = ker(T ) e quindi in tal caso il risultato è ovvio. Sia s = dim(Im(T ))
e sia {w1 , w2 , . . . , ws } una base di Im(T ). Siano v1 , v2 , . . . , vs vettori di V tali che T (vi ) = wi per
ogni i ∈ {1, 2, . . . , s}.
Sia ora q = dim(ker(T )) e {u1 , u2 , . . . , uq } una base di ker(T ).
Dimostriamo che {u1 , u2 , . . . , uq , v1 , v2 , . . . , vs } è una base di V . Dobbiamo quindi mostrare che:
(1) i vettori u1 , u2 , . . . , uq , v1 , v2 , . . . , vs sono linearmente indipendenti;
(2) i vettori u1 , u2 , . . . , uq , v1 , v2 , . . . , vs generano V .
36
Siano a1 , a2 , . . . , aq , b1 , b2 , . . . , bs scalari tali che:
a1 u1 + a2 u2 + · · · + aq uq + b1 v1 + b2 v2 + · · · + bs vs = 0V .
(10)
Poiché {u1 , u2 , . . . , uq } è una base di ker(T ) e T (vi ) = wi per ogni i ∈ {1, 2, . . . , s} vale:
0W = T (0V ) = T (a1 u1 + a2 u2 + · · · + aq uq + b1 v1 + b2 v2 + · · · + bs vs )
= a1 T (u1 ) + a2 T (u2 ) + · · · + aq T (uq ) + b1 T (v1 ) + b2 T (v2 ) + · · · + bs T (vs )
= b1 w1 + b2 w2 + · · · + bs ws .
Essendo i vettori w1 , w2 , . . . , ws linearmente indipendenti (essi formano una base di Im(T )) si ha che
b1 = b2 = · · · = bs = 0. Sostituendo tali valori in (10) otteniamo:
a1 u1 + a2 u2 + · · · + aq uq = 0V .
I vettori u1 , u2 , . . . , uq sono linearmente indipendenti, da cui a1 = a2 = · · · = aq = 0 e quindi i vettori
u1 , u2 , . . . , uq , v1 , v2 , . . . , vs sono linearmente indipendenti.
Dimostriamo ora che gli stessi vettori costituiscono un sistema di generatori di V . Sia v ∈ V . Allora
T (v) ∈ Im(T ). Essendo {w1 , w2 , . . . , ws } una base di Im(T ) esistono coefficienti b1 , b2 , . . . , bs ∈ R tali
che T (v) = b1 w1 + b2 w2 + · · · + bs ws . Ma per ogni i = 1, 2, . . . , s wi = T (vi ). Pertanto:
T (v) = b1 T (v1 ) + b2 T (v2 ) + · · · + bs T (vs ) = T (b1 v1 + b2 v2 + · · · + bs vs ),
da cui
0W = T (v) − T (b1 v1 + b2 v2 + · · · + bs vs ) = T (v − b1 v1 − b2 v2 − · · · − bs vs ).
Quindi v − b1 v1 − b2 v2 − · · · − bs vs ∈ ker(T ) ed esistono pertanto scalari a1 , a2 , . . . , aq tali che:
v − b1 v1 − b2 v2 − · · · − bs vs = a1 u1 + a2 u2 + · · · + aq uq .
Dunque v = a1 u1 + a2 u2 + · · · + aq uq + b1 v1 + b2 v2 + · · · + bs vs . Questo prova la tesi.
Corollario 5.9. Siano V, W spazi vettoriali finito dimensionali tali che dim(V ) = dim(W ) e sia T :
V −→ W un’applicazione lineare. Allora T è iniettiva se e solo se è suriettiva.
Siano U, V, W spazi vettoriali reali e siano T : U −→ V , S : V −→ W due applicazioni lineari. La
composizione di S e T è l’applicazione S ◦ T : U −→ W definita ponendo, al variare di u ∈ U :
S ◦ T (u) = S(T (u)).
L’applicazione S ◦ T è ancora lineare.
Proposizione 5.10. Siano U, V, W spazi vettoriali reali,
T1 , T2 : U −→ V
and
S1 , S2 : V −→ W
applicazioni lineari e k ∈ R. Allora:
• S1◦ (T1 + T2 ) = S1◦ T1 + S1◦ T2 ;
• (S1 + S2 ) ◦ T1 = S1◦ T1 + S2◦ T1 ;
• (kS1 ) ◦ T1 = S1◦ (kT1 ) + k(S1◦ T1 ).
Si noti che se S, T : V −→ V sono due endomorfismi allora esistono S ◦ T e T ◦ S ma in generale
S ◦ T 6= T ◦ S.
Inoltre se T è un endomorfismo allora T si può comporre con sé stesso. Possiamo quindi definire T n
come il risultato della composizione di T con sé stesso n volte:
Tn = T
|
◦
·{z
· · ◦ T}
n
37
Proposizione 5.11. Sia T : V −→ W un’applicazione biettiva. Allora l’applicazione inversa S : V −→
W è lineare.
5.2. Applicazioni lineari e matrici.
Cominciamo questa sezione con un esempio.
Esempio 5.12. Sia



A=


a11
a21
..
.
am1
a12
a22
..
.
am2
···
···
..
.
···
a1n
a2n
..
.
amn






una matrice m × n. Possiamo associare ad A un’applicazione lineare TA : Rn −→ Rm ponendo:


x1


 x2 

TA (x1 , x2 , . . . , xn ) := A  . 
.
 .. 
xn
La linearità di TA segue dalle proprietà del prodotto di matrici.
4
Viceversa siano V, W spazi vettoriali con basi rispettivamente {v1 , v2 , . . . , vn } e {w1 , w2 , . . . , wm } e
sia T : V −→ W una applicazione lineare. Costruiamo la matrice MT associata all’applicazione lineare
T rispetto alle basi scelte nel seguente modo. Al variare di i in {1, 2, . . . , n} la i-esima colonna di MT
è costituita dalle coordinate del vettore vi ∈ W rispetto alla base {w1 , w2 , . . . , wm }.
Per fissare le idee consideriamo il caso in cui V = Rn e W = Rm . Quanto verificheremo per tale
particolare esempio è generalizzabile al caso di generici spazi vettoriali finito dimensionali V e W .
Fissiamo su Rn e Rm le basi canoniche. Sia ora T : Rn −→ Rm un’applicazione lineare, v = (x1 , x2 , . . . , xn ) ∈
Rn e sia w = (y1 , y2 , . . . , ym ) := T (v) ∈ Rm .
Dalle proprietà di linearità di T , segue:






y1
y2
..
.
ym




 = T (v) = x1 T (e1 ) + x2 T (e2 ) + · · · + xn T (en ) = MT







x1
x2
..
.
xn



,


dove MT è la matrice le cui colonne sono i vettori T (e1 ), T (e2 ), . . . , T (en ).
Dall’uguaglianza T (v) = x1 T (e1 )+x2 T (e2 )+· · ·+xn T (en ) notiamo che i vettori T (e1 ), T (e2 ), . . . , T (en )
costituiscono un sistema di generatori per Im(T ). Il nucleo di T è l’insieme dei vettori (x1 , x2 , . . . , xn ) ∈
Rn tali che:
38
 
0
x1
 

 x2   0
 
MT 
 ..  =  ..
 .   .
0
xn
con lo spazio delle soluzioni del sistema lineare omogeneo la




,


cui matrice dei coefficienti è MT .
0
Sia T : V −→ W un’applicazione lineare. Siano {v1 , v2 , . . . , vn }, {v10 , v20 , . . . , vn
} basi di V e
0
0
0
{w1 , w2 , . . . , wm }, {w1 , w2 , . . . , wm } basi di W , con matrici cambio di base C e D rispettivamente.
Siano ancora A, A0 le due matrici associate a T rispetto alle basi {v1 , v2 , . . . , vn }, {w1 , w2 , . . . , wm }
0
0
e {v10 , v20 , . . . , vn
}, {w10 , w20 , . . . , wm
}.
Se v ∈ V ha coordinate (x1 , x2 , . . . , xn ) rispetto alla base {v1 , v2 , . . . , vn } e (x01 , x02 , . . . , x0n ) rispetto
0
alla base {v10 , v20 , . . . , vn
} e T (v) ha coordinate (y1 , y2 , . . . , ym ) rispetto alla base {w1 , w2 , . . . , wm }
0
0
0
0
e (y1 , y2 , . . . , ym ) rispetto alla base {w10 , w20 , . . . , wm
} allora sussistono le seguenti relazioni:


 0 
 0 


x1
y1
x1
y1
 0 
 0 




 x 
 y 
 x2 
 y2 
 .  = A  .  e  .2  = A0  .2  .
 . 
 . 
 . 
 . 
 . 
 . 
 . 
 . 
0
x0n
ym
xn
ym
Inoltre poiché:






x01
x02
..
.
x0n




 = C −1







x1
x2
..
.
xn












e
y10
y20
..
.
0
ym




 = D−1







y1
y2
..
.
ym



,


segue

D
−1





y1
y2
..
.
ym




 = A0 C −1







x1
x2
..
.
xn



,


da cui






y1
y2
..
.
ym




 = DA0 C −1







x1
x2
..
.
xn



.


Pertanto A = DA0 C −1 ed equivalentemente A0 = DAC −1 .
0
Nel caso speciale in cui V e W coincidono, fissate le basi {v1 , v2 , . . . , vn }, {v10 , v20 , . . . , vn
} di V con
matrice di cambio di base C, allorain tal caso:
A0 = C −1 AC.
Definizione 5.13. Due matrici quadrate di ordine n A e A0 sono simili se esiste una matrice invertibile
C tale che A0 = C −1 AC.
Vale il seguente teorema:
Teorema 5.14. La similitudine è una relazione di equivalenza.
Dal teorema di Binet segue il seguente risultato:
Proposizione 5.15. Due matrici simili hanno lo stesso determinante.
39
6. Diagonalizzazione di matrici
6.1. Problema di diagonalizzazione.
Nello studio di un endomorfismo particolarmente interessante è analizzare gli spazi che sono invarianti
rispetto a tale applicazione. Tale analisi prende il nome di teoria spettrale. In questa sezione ne studieremo
alcuni aspetti basilari con particolare riferimento a spazi vettoriali reali di dimensione finita.
Definizione 6.1. Sia V uno spazio vettoriale reale finito dimensionale e sia T : V −→ V un’applicazione
vettoriale di V in sé (endomorfismo). Un autovettore di T è un vettore non nullo v ∈ V \ {0} per cui
esiste uno scalare λ ∈ R tale che:
T (v) = λv.
In tal caso λ è detto autovalore di T relativo all’autovettore v o equivalentemente che v è un autovettore
di T con autovalore λ. L’insieme di tutti gli autovalori di T è detto spettro di T .
Osserviamo che se v è un autovettore di T , il suo autovalore è univocamente determinato: infatti se fosse
T (v) = λ1 v = λ2 v allora 0 = λ1 v −λ2 v = (λ1 −λ2 )v, da cui, poiché v 6= 0, λ1 −λ2 = 0 e quindi λ1 = λ2 .
Inoltre se v è un autovettore di un endomorfismo T con autovalore λ e k ∈ R uno scalare diverso da 0
allora kv è anch’esso un autovettore di T con autovalore λ.
Più in generale vale la seguente:
Proposizione-Definizione 6.2. Sia T : V −→ V un endomorfismo e sia λ ∈ R un autovalore di T .
Poniamo:
Aλ := {v ∈ V : T (v) = λv}.
Allora Aλ è un sottospazio vettoriale di V , detto autospazio di T relativo all’autovalore λ.
Introduciamo anche il seguente risultato.
Proposizione 6.3. Sia T : V −→ V un endomorfismo, v1 , v2 , . . . , vr autovettori di T con distinti
autovalori λ1 , λ2 , . . . , λr . Allora i vettori v1 , v2 , . . . , vr sono linearmente indipendenti.
Proof. Omessa.
Se V è uno spazio vettoriale n-dimensionale su R e {v1 , v2 , . . . , vn } è una base di V , allora esiste
una corrispondenza biunivoca tra endomorfismi di V e matrici ad entrate reali di tipo n × n ottenuta
associando ad ogni endomorfismo la sua matrice associata rispetto alla base {v1 , v2 , . . . , vn } e viceversa
ad ogni matrice A n × n l’applicazione v 7→ Av.
Se T : V −→ V è un endomorfismo di V , con matrice associata A rispetto ad una base fissata
{v1 , v2 , . . . , vn } di V allora uno scalare λ è un autovalore di T se e solo se esiste v ∈ V \ {0} tale
che, se (x1 , x2 , . . . , xn ) sono le coordinate di v rispetto alla base scelta, allora:




x1
x1




 x2 
 x2 



A .  = λ . 
.
 .. 
 .. 
xn
xn
40
In tal caso si ottiene



A


x1
x2
..
.
xn

x1
x2
..
.
xn



x1
x2
..
.
xn




 − λ






 = 0,


da cui



A







 − λI 




x1
x2
..
.
xn





=0


e quindi


(A − λI) 


x1
x2
..
.
xn


 = 0.


Pertanto λ è un autovalore di T se e solo se il sistema lineare omogeneo con matrice dei coefficienti A−λI
è compatibile e indeterminato e questo si verifica se e solo se A − λI è singolare, ovvero det(A − λI) = 0.
Se λ è uno scalare generico, il determinante di A − λI è un polinomio in λ di grado n, detto polinomio
caratteristico di A. L’equazione che si ottiene eguagliando a 0 il determinante di A − λI è detta
equazione caratteristica di T (o di A). La molteplicità di λ come radice dell’equazione caratteristica è
la molteplicità algebrica di λ. La dimensione di Aλ come sottospazio vettoriale di V è la molteplicità
geometrica.
Questa definizione di polinomio caratteristico e quindi di equazione caratteristica è ben posta se matrici
associate al medesimo endomorfismo rispetto a basi differenti hanno lo stesso polinomio caratteristico.
Abbiamo visto alla fine della sezione precedente che due tali matrici sono simili. Siano A e A0 due matrici
simili e sia C una matrice invertibile tale che A0 = C −1 AC. Allora:
det(A0 − λI) = det[C −1 AC − λI] =
= det[C −1 AC − C −1 (λI)C] =
= det[C −1 (A − λI)C] =
= det(A − λI),
ovvero matrici simili hanno lo stesso polinomio caratteristico.
Un minore di ordine k di una matrice quadrata A è detto principale se i termini principali della sottomatrice di A di cui esso è il determinante sono termini principali di A.
Proposizione 6.4. Sia A una matrice di ordine n. Il polinomio caratteristico di A è:
p(λ) = (−1)n λn + c1 λn−1 + · · · + cn−1 λ + cn ,
dove i coefficienti ck sono dati da:
ck = (−1)n−k
X
Mk ,
dove la somma è estesa ai minori principali di A di ordine k. In particolare abbiamo c1 = (−1)n−1 tr(A)
e cn = det(A).
Se una matrice A ha forma diagonale, ovvero gli unici elementi della matrice che possono essere diversi
da 0 sono i suoi elementi principali a11 , a22 , . . . , ann allora tali elementi sono gli autovalori della matrice.
Introduciamo ora il seguente problema noto con il termine: Problema di diagonalizzazione.
41
PROBLEMA DI DIAGONALIZZAZIONE - Data un endomorfismo T di uno spazio vettoriale
finito dimensionale V , esiste una base di V tale che la matrice associata a T rispetto a questa base è
diagonale? Se il problema ha risposta affermativa diremo T diagonalizzabile.
Dal punto di vista delle matrici la questione diventa: data una matrice quadrata A di ordine n, esiste una
matrice invertibile P dello stesso ordine tale che P −1 AP è diagonale? Ancora diremo A diagonalizzabile
se la risposta alla precedente domanda è sı̀.
Il seguente fondamentale teorema fornisce una condizione necessaria e sufficiente affinché una matrice A
(e quindi un endomorfismo) sia diagonalizzabile.
Teorema 6.5. Una matrice quadrata di ordine n A è diagonalizzabile se e solo se esiste una base di Rn
formata da autovettori di A.
Proof. Assumiamo A diagonalizzabile. Allora dalla definizione esiste P matrice invertibile con D =
P −1 AP diagonale. Siano p1 , p2 , . . . , pn le colonne di P e siano λ1 , λ2 , . . . , λn gli elementi sulla diagonale di D. Si noti che P D e AP sono le la matrici n × n le cui colonne sono rispettivamente i vettori λi pi
e Api , i = 1, 2, . . . , n. Ma D = P −1 AP implica P D = AP e quindi i vettori pi sono gli autovettori di A
con autovalori λi . Poiché P è invertibile allora il rango di P è massimo ovvero i vettori p1 , p2 , . . . , pn
sono linearmente indipendenti. Essi pertanto costituiscono una base Rn e la prima implicazione è provata.
Supponiamo ora che {p1 , p2 , . . . , pn } sia una base di Rn costituita da autovettori, con pi autovettore
di A con autovalore λi . Allora si vede facilmente che la matrice P le cui colonne sono proprio i vettori
p1 , p2 , . . . , pn è tale che P −1 AP sia la matrice diagonale


λ1 0 · · · 0


 0 λ2 · · · 0 

D= .
..
.. 
..
.
.
 ..
.
. 
0
0 · · · λn
Questo completa la dimostrazione.
Vale inoltre anche il seguente importante risultato che comunque non dimostriamo.
Teorema 6.6. Sia A una matrice quadrata e λ un autovalore di A. Allora la molteplicità algebrica di λ
è sempre maggiore o uguale della molteplicit à geometrica dello stesso autovalore. Se vale l’uguaglianza
l’autovalore è detto regolare.
Corollario 6.7. Una matrice quadrata di ordine n A è diagonalizzabile (in R) se la somma delle
molteplicità algebriche dei suoi autovalori è n e se tutti i suoi autovalori sono sono regolari.
Proof. Scegliamo una base di ciascun autospazio. In virtù del Teorema 6.6 e della Proposizione 6.3
l’unione delle basi scelte per ogni autospazio costituisce una base di Rn . Il corollario segue pertanto dal
Teorema 6.5.
Corollario 6.8. Ogni autovalore semplice, ovvero la cui molteplicità algebrica è pari ad 1, è regolare.
Proof. Infatti se A è una matrice quadrata e λ è un autovalore semplice di A allora, indicando con
m. a.(λ) e con m. g.(λ) rispettivamente le molteplicità algebrica e geometrica dell’autovalore λ, si ha:
1 ≤ m. g.(λ) ≤ m. a.(λ) = 1,
da cui m. g.(λ) = m. a.(λ) = 1.
Corollario 6.9. Se una matrice quadrata di ordine n A ha n autovalori distinti allora A è diagonalizzabile.
42
Proof. Il risultato segue immediatamente dai due corollari precedenti.
6.2. Caso delle matrici simmetriche.
Ricordiamo che una matrice quadrata è simmetrica se uguale alla sua trasposta, mentre è ortogonale se
la sua inversa è uguale alla sua trasposta. Per tali matrici valgono le seguenti proprietà:
Teorema 6.10. Ogni matrice simmetrica è diagonalizzabile.
Teorema 6.11. Sia A una matrice simmetrica. Se λ1 e λ2 sono distinti autovalori di A, allora autovettori v1 e v2 di A relativi rispettivamente agli autovalori λ1 e λ2 sono ortogonali.
Corollario 6.12. Una matrice simmetrica è diagonalizzabile mediante una matrice ortogonale, ovvero
è ortogonalmente simile ad una matrice diagonale.
Data quindi una matrice A esiste una matrice ortogonale P tale che D = t P AP è diagonale.
Quest’ultimo enunciato si può scrivere nella forma equivalente:
Corollario 6.13. Sia A una matrice simmetrica di ordine n. Allora esiste una base ortogonale di Rn
formata da autovettori di A.
Vale anche il viceversa del Corollario 6.12, ovvero:
Teorema 6.14. Una matrice ortogonalmente simile ad una matrice diagonale reale è simmetrica.
Proof. Sia A una matrice ortogonalmente diagonalizzabile. Siano pertanto D una matrice diagonale e P
una matrice ortogonale tale che:
D = t P AP.
Trasponendo ambo i termini dell’uguaglianza otteniamo:
D = t D = P t At P = P At P,
dove abbiamo utilizzato il fatto che sia A che D sono diagonali. Moltiplicando ora a sinistra per t P e a
destra per P otteniamo t A = A, cioè la tesi.
43
7. Spazi affini e spazi Euclidei
Vogliamo ora applicare le nozioni acquisite di algebra lineare alla geometria euclidea. Introduciamo
pertanto un modello di spazio geometrico che generalizza che generalizza lo spazio reale. Approfondiremo
in seguito il caso dello spazio ordinario.
Definizione 7.1. Sia V uno spazio vettoriale reale. Uno spazio affine su V è un insieme non vuoto
S, i cui elementi si diranno punti, unitamente ad una applicazione
φ : S × S −→ V
−−→
che associa ad ogni coppia di punti (P, Q) ∈ S × S un vettore di φ((P, Q)) = P Q = Q − P ∈ V , detto
vettore di punto inziale P e punto finale Q, che gode delle seguenti proprietà:
−−→
(SA1) per ogni punto P ∈ S e per ogni vettore v ∈ V esiste un unico punto Q ∈ S tale che P Q = v;
(SA2) per ogni terna di punti P, Q, R ∈ S risulta
−→ −−→ −−→
P R = P Q + QR.
−−→
Se (P, Q) ∈ S × S diremo anche che P è il punto di applicazione del vettore P Q.
Dalla proprietà (SA1) segue che, fissato un punto O ∈ S si ottiene in modo naturale una corrispondenza
−−→
biunivoca tra S e V associando ad ogni punto P ∈ S il vettore OP ∈ V . In conseguenza delle propriet‘a
(SA1) e (SA2) seguono la proposizione.
Proposizione 7.2. Sia V uno spazio vettoriale e sia S uno spazio affine su V . Allora, per ogni P, Q ∈ S
−−→
• P Q = 0V se e solo se P = Q;
−−→
−−→
• P Q = −QP .
Esempio 7.3. Sia V uno spazio vettoriale reale. Ponendo
−
→ := w − v
vw
definiamo su V una struttura di spazio affine su sé stesso. Denotiamo V con questa struttura di spazio
affine con Va .
4
Esempio 7.4. Un caso particolare dell’esempio precedente particolarmente interessante è quando V =
Rn per qualche n. Lo spazio affine An := (Rn )a è detto n-spazio affine reale.
4
Definizione 7.5. Sia V uno spazio vettoriale reale di dimensione n e sia S uno spazio affine su V . Un
sistema di riferimento affine è costituito da un punto O ∈ S, detto origine del sistema e da una base
B = {e1 , . . . , en } di V ; esso si indica anche con Oe1 . . . en .
−−→
Sia P ∈ S. Le coordinate del vettore OP rispetto alla base B sono le coordinate affini di P . Se P ha
coordinate a1 , . . . , an scriveremo in breve P (a1 , . . . , an ). Notiamo che se P (a1 , . . . , an ), Q(b1 , . . . , bn ) ∈ S
−−→
il vettore P Q ha (b1 − a1 , . . . , bn − an ) come n-upla di coordinate rispetto alla base B.
Definizione 7.6. Sia S uno spazio affine su uno spazio vettoriale V , con struttura fornita dall’applicazione
φ : S × S −→ V . Un sottoinsieme S0 di S è un sottospazio affine se esiste un sottospazio vettoriale
V 0 tale che la restrizione di φ a S0 × S0 induce su S0 la struttura di spazio affine su V 0 . In tal caso lo
44
spazio vettoriale V 0 è detto spazio direttore o più semplicemente direzione o ancora giacitura del
sottospazio affine S0 .
Sia S uno spazio affine su uno spazio vettoriale V e sia S0 un sottospazio affine di S. Se dim(S0 ) = 0
allora S0 è costituito da un solo punto. Vale anche il viceversa ovvero ogni sottoinsieme di S costiutito
da un solo punto è un sottospazio affine di S 0-dimensionale. Se dim(S0 ) = 1 (dim(S0 ) = 2) allora S0 è
una retta di S (piano di S). Se dim(S0 ) = dim(S) − 1 allora S0 è detto iperpiano di S.
Nota 7.7. Dalla definizione di sottospazio affine notiamo che per dare un sottospazio affine S0 di un
sottospazio affine di S è sufficiente dare un suo punto P0 e la sua giacitura. Infatti i punti di S0 sono
−−→
esattamente i punti P di S tali che il vettore P0 P appartiene alla giacitura di S0 .
Analizziamo ora la posizione reciproca tra due sottospazi affini di uno spazio affine S.
Definizione 7.8. Sia S uno spazio affine su uno spazio vettoriale V e siano S0 , S00 sottospazi affini di S.
• S0 , S00 sono incidenti se S0 ∩ S00 6= ∅.
• S0 , S00 sono paralleli se gli spazi direttori sono uno contenuto nell’altro.
• S0 , S00 sono sghembi se non sono né incidenti né paralleli.
Studiamo ora i due principali modi di rappresentare algebricamente un sottospazio affine.
Sia S uno spazio affine su uno spazio vettoriale V e sia Oe1 . . . en un sistema di riferimento affine su S.
Sia S0 un sottospazio affine m-dimensionale di S con giacitura V 0 e sia P0 un punto arbitrario di S0 . Lo
spazio S0 è il luogo dei punti P di S tali che
(11)
−−→
P0 P ∈ V 0 .
Fissiamo una base B0 = {e01 , . . . , e0m }. Da (11) si ottiene che per ogni P ∈ S0 esistono (e sono unicamente
determinati) scalari t1 , . . . , tm tali che
−−→ −−→
OP = OP0 + t1 e01 + · · · + tm e0m .
Esplicitando le singole coordinate otteniamo una rappresentazione parametrica del sottospazio affine.
Da tali equazioni, “eliminando” i parametri osserviamo che un punto P ∈ S è in S0 se e solo se le sue
coordinate soddisfano un sistema lineare di n − m equazioni in n incognite. Viceversa si vede facilmente
che lo spazio delle soluzioni di un sistema lineare costituisce un sottospazio affine di un dato (Rn )a . Questa
rappresentazione è nota come rappresentazione cartesiana. In particolare notiamo che un iperpiano di
(Rn )a è dato come soluzione di un’unica equazione lineare in n incognite x1 , . . . , xn . In questa ottica
possiamo vedere un sottospazio affine come intersezione di più iperpiani affini.
Quando lo spazio V è dotato di prodotto interno (·, ·) : V × V −→ R (come nel caso di Rn ) lo spazio ad
esso associato Va è detto spazio euclideo. Attraverso il prodotto scalare si definisce quindi una metrica
in Va . Dati due punti P (a1 , . . . , an ) e Q(b1 , . . . , bn ) la distanza tra P e Q è data da:
−−→ −−→
d(P, Q) = (P Q, P Q).
Inoltre attraverso il prodotto scalare è possibile definire l’ortogonalità tra due vettori (vettori geometrici)
e l’angolo tra due vettori.
45
7.1. Geometria nel piano affine.
Studiamo ora più in dettaglio il piano euclideo A2 = (R2 )a . Fissiamo quindi un punto O in R2 e sia
−−→
{e1 , e2 } la base canonica. Un generico vettore v = OP si scriverà:
−−→
v = OP = xe1 + ye2 ,
−−→
dove x, y sono le componenti del vettore OP e simultaneamente le coordinate affini del punto P .
Il punto O è l’origine del sistema di riferimento, le rette per O di giaciture he1 i e he2 i sono gli assi
coordinati (dette altresı̀ ascissa ed ordinata o più semplicemente asse x e asse y).
−−→
Se P (x1 , y1 ) e Q(x2 , y2 ) sono punti nel piano affine, il vettore P Q avrà componenti
(x2 − x1 , y2 − y1 ).
Consideriamo ora una retta nel piano. Per rappresentarlo possiamo utilizzare come usuale la rappresentazione parametrica e la rappresentazione cartesiana.
Sia r una retta nel piano affine, sia v = (l, m) un vettore preso come base dello spazio direttore di r
(detto anche vettore direttore o vettore di direzione) e sia P0 (x0 , y0 ) un punto di r. Un generico punto
P (x, y) si può scrivere in forma vettoriale:
−−→ −−→
r : OP = OP0 + tv
t ∈ R.
Esplicitando le coordinate si ottiene:
(12)
r:


 x = x0 + lt


t ∈ R.
y = y0 + mt
Queste sono le equazioni parametriche della retta r passante per il punto P e avente vettore di
direzione v = (l, m). Al variare di t in R esse forniscono le coordinate di tutti i punti della retta.
Esempio 7.9. Consideriamo il problema di determinare l’equazione in forma parametrica della retta
r passante per due punti distinti P (x1 , y1 ) e Q(x2 , y2 ). Poiché i due punti appartengono alla retta il
−−→
vettore P Q appartiene allo spazio direttore della retta stessa. Essendo i due punti distinti tale vettore
è diverso dal vettore nullo e pertanto costituisce una base dello spazio direttore di r. Ricordiamo che il
−−→
vettore P Q si trova facendo la differenza delle coordinate dei due punti, cioè
−−→
P Q = Q − P = (x2 − x1 , y2 − y1 ).
L’equazione in forma parametrica di r è quindi data da:


 x = x1 + (x2 − x1 )t
r:


y = y1 + (y2 − y1 )t
t ∈ R.
−−→
Per esempio se P (1, 2) e Q(−1, 4) allora la retta r per P e Q ha vettore direttore dato da v = P Q =
Q − P = (−2, 2) e quindi la retta r ha equazione parametrica:


 x = 1 − 2t
r:
t ∈ R.


y = 2 + 2t
4
46
Dalle equazioni (12), “eliminando” il parametro t si ottiene l’equazione lineare:
(13)
m(x − x0 ) = l(y − y0 ).
Ponendo a := m, b := −l e c = −mx0 + ly0 l’equazione assume la forma nota:
r : ax + by + c = 0,
dove a, b non sono entrambi nulli.
Essa viene detta equazione cartesiana (o affine) della retta r. Viceversa data un’equazione lineare del
tipo ax + by + c = 0, nella quale a e b non sono entrambi nulli, è facile verificare che le sue soluzioni sono
date da:

 x = x0 − bt

t ∈ R,


y = y0 + at
dove (x0 , y0 ) corrisponde ad una soluzione particolare dell’equazione. Possiamo quindi interpretare
l’equazione lineare ax + by + c = 0 come l’equazione in forma cartesiana della retta passante per un
punto le cui coordinate (x0 , y0 ) sono una particolare soluzione dell’equazione ed avente come vettore di
direzione il vettore v = (−b, a).
Sussiste quindi una corrispondenza tra equazioni lineari in due variabili e rette nel piano affine (R2 )a .
Vale cioè la:
Proposizione 7.10. In coordinate affini x e y una retta è rappresentata in forma cartesiana da un’equazione
lineare in x e y; viceversa un’equazione lineare rappresenta una retta.
Si noti che tale corrispondenza non è biunivoca. Infatti mentre un’equazione lineare individua una ben
determinata retta, ad una retta del piano possiamo associare più equazioni lineari. Esse comunque devono
essere equivalenti, ovvero devono avere le stesse soluzioni (lo spazio delle soluzioni coincide con l’insieme
dei punti della retta).
Sia r : ax + by + c = 0 l’equazione di una retta. Se b 6= 0 l’equazione di r può scriversi nella forma:
y = mx + q,
dove m = − ab è il coefficiente angolare della retta r. Tale nome è dovuto al fatto che essa fornisce
informazioni sulla misura dell’angolo α che la retta forma con il semiasse positivo delle ascisse. In
particolare vale m = tg(α).
Due rette r e s sono parallele se e solo se esse hanno lo stesso spazio direttore, e qundi se e solo se i loro
vettori di direzione sono tra loro proporzionali. Se le rette sono date attraverso le equazioni cartesiane
r : ax + by + c = 0 e s : a0 x + b0 y + c0 = 0 allora r ed s sono parallele se le coppie (a, b) e (a0 , b0 ) sono
in proporzione ovvero se e solo se esiste k ∈ R \ {0} tale che a0 = ka e b0 = kb. Essendo il coefficiente
angolare di una retta dato dal rapporto tra i coefficienti di x e y (cambiato di segno) si osserva facilmente
che due rette parallele hanno lo stesso coefficiente angolare.
Esempio 7.11. Determiniamo le rette passanti per un punto P (0, −1) e parallele rispettivamente alle
rette di equazioni:


 x=3+t
r:
t∈R


y = −7 + 5t
e
s : 2x − 3y + 1 = 0.
47
Il vettore di direzione della retta r è v = (1, 5). La retta r0 passante per P e parallela a r ha equazione
in forma parametrica data da


 x=t
r0 :
t ∈ R.


y = −1 + 5t
Un’equazione della retta r0 in forma cartesiana si ottiene facilmente sostituendo a t il monomio x nella
seconda equazione. Essa è pertanto:
r0 : 5x − y − 1 = 0.
La retta s0 passante per P e parallela a s ha equazione del tipo:
s0 : 2x − 3y + c0 = 0.
Imponendo che le coordinate di P siano soluzioni dell’equazione (tale condizione è nota come condizione
di passaggio di s0 per P o condizione di appartenenza di P ad s0 ) si ottiene c0 = 2. Quindi s0 ha equazione:
s0 : 2x − 3y + 2 = 0.
Possiamo scrivere immediatamente l’equazione in forma parametrica per s0 osservando che un vettore di
direzione di s è dato da v = (l, m) = (−b, a) = (3, 2). L’equazione di s0 in forma parametrica è quindi
data da:

 x = 3t

s0 :
t ∈ R.


y = −1 + 2t
4
Date due rette distinte nel piano r e r0 queste o sono incidenti, cioè si intersecano in un punto, o sono
parallele. Utilizzando il prodotto interno in R2 possiamo avere informazioni sull’angolo compreso tra le
due rette. Esso coincide con l’angolo che i due vettori di direzione formano tra loro se applicati in un
medesimo punto. Se i due vettori direttori sono rispettivamente (l, m) e (l0 , m0 ) allora il coseno dell’angolo
compreso tra le due rette è dato da:
c0 ) = ±
cos(rr
(l, m) · (l0 , m0 )
.
k(l, m)kk(l0 , m0 )k
Se conosciamo l’equazione cartesiana delle due rette:
r : ax + by + c = 0,
r0 : a0 x + b0 y + c0 = 0,
allora i due vettori direttori saranno rispettivamente (−b, a) e (−b0 , a0 ). Il coseno dell’angolo tra loro
compreso è dato da:
c0 ) = ±
cos(rr
aa0 + bb0
(−b, a) · (−b0 , a0 )
√
= ±√
.
0
0
2
k(−b, a)kk(−b , a )k
a + b2 a02 + b02
Due rette sono perpendicolari quando l’angolo tra loro compreso, misurato in senso orario o antiorario
◦
c0 ) = 0. Quindi r è perpendicolare a r0 se i vettori
misura 90 o meglio π2 radianti, ovvero quando cos(rr
direttori sono ortogonali o equivalentemente, se r : ax + by + c = 0 e r0 : a0 x + b0 y + c0 = 0 sono le
0
equazioni affini delle due rette, la quantità aa0 + bb0 = 0. Se i coefficienti angolari m = − ab e m0 = − ab0
di entrambe le rette sono diversi da zero allora r è perpendicolare a r0 se e solo se:
m=−
1
,
m0
o equivalentemente se un vettore direttore di r0 è dato da:
(l0 , m0 ) = (a, b).
48
Esempio 7.12. Determiniamo le rette passanti per un punto P (2, −3) e perpendicolari rispettivamente
alle rette di equazioni:


 x = 1 + 2t
r:
t∈R


y = −1 + t
e
s : x − 2y + 3 = 0.
L’equazione della retta r0 avrà coefficienti a e b tali che il vettore direzione v = (2, 1) di r sia perpendicolare l vettore direttore di r0 , v 0 = (−b, a). Pertanto possiamo prendere a = 2 e b = 1. La retta r0 avrà
equazione:
2x + y + c = 0.
Imponendo la condizione di passaggio di r0 per P , si ottiene c = −1. L’equazione affine di r0 è quindi
data da:
2x + y + −1 = 0.
L’equazione parametrica di r0 sarà pertanto:


 x=2−t
0
r :


y = −3 + 2t
t ∈ R,
avendo preso come vettore direttore il vettore (−b, a) = (−1, 2).
Il vettore direttore di s0 è invece il vettore (1, −2). Quindi un’equazione in forma parametrica di s0 è
data da:
s0 :


 x=2+t


t ∈ R,
y = −3 − 2t
4
Dati due punti P (x1 , y1 ) e Q(x2 , y2 ) nel piano, la distanza tra i due punti coincide con il modulo del
−−→
vettore P Q di punto iniziale P e punto finale Q. Essa vale quindi:
d(P ; Q) = k(x2 − x1 , y2 − y1 )k =
p
(x2 − x1 )2 + (y2 − y1 )2 .
Vogliamo ora calcolare la distanza di un punto da una retta. In generale la distanza tra due insiemi di
punti (entrambi contenuti in uno stesso spazio metrico) è il valore minimo delle distanze tra due punti
appartenenti rispettivamente ai due insiemi. Nel caso considerato ovvero della distanza di un punto
P (x0 , y0 ) da una retta r di equazione ax + by + c = 0 il valore minimo è ottenuto in corrispondenza del
punto di intersezione H di r con la perpendicolare condotta da P a r stessa.
Potremo trovare la retta s perpendicolare a r passante per P , trovare il punto H di intersezione di s e
r e quindi la distanza tra i due punti P e H. Questo procedimento è troppo lungo. Abbiamo strumenti
matematici adeguati per trovare la distanza cercata in modo più rapido. Prendiamo un punto Q(x1 , y1 )
−−→
appartenente alla retta r e consideriamo il vettore QP = P − Q. Abbiamo visto precedentemente che un
vettore perpendicolare al piano è il vettore n = (a, b). La distanza punto retta è proprio la norma del
−−→
vettore proiezione di QP lungo la direzione individuata da n.
Essa pertanto vale:
−−→
QP · n (x − x , y − y ) · (a, b) |ax + by − ax − by |
|ax0 + by0 + c|
0
1 0
1
0
1
1
=
√
√0
√
(14) d(P ; r) = n = =
,
2
2
2
2
knk2 a +b
a +b
a2 + b2
49
essendo Q(x1 , y1 ) un punto della retta r.
Torniamo per un attimo al semplice problema di determinare la retta per due punti P (x1 , y1 ) e Q(x2 , y2 ).
Ogni equazione lineare che ammette come soluzioni le coppie di numeri reali (x1 , y1 ) e (x2 , y2 ) è un’equazione
affine della retta per P e Q. È pertanto possibile scrivere l’equazione della retta r per P e Q in forma di
determinante, ovvero:

x

r : det  x1
x2
y
y1
y2

1

1  = 0.
1
Infatti l’espressione a primo membro è proprio un’espressione lineare in x e y tale che, sostituendo alle
variabili (x1 , y1 ) o (x2 , y2 ) otteniamo il determinante di una matrice avente due righe uguali, cioè 0.
Determiniamo ora l’area di un triangolo in R2 di estremi P1 (x1 , y1 ), P2 (x2 , y2 ) e P3 (x3 , y3 ). Essa sarà
uguale al semiprodotto della lunghezza di un lato per l’altezza ad esso relativa. Sia pertanto b =
p
d(P2 ; P3 ) = (x3 − x2 )2 + (y3 − y2 )2 . La retta r per P2 e P3 ha equazione in forma di determinante
data da:


x y 1


r : det  x2 y2 1  = 0.
x3 y3 1
Notiamo che in tal caso il coefficiente di x è dato da (y2 −y3 ) mentre il coefficiente di y è dato da (x2 −x3 ).
L’altezza relativa al lato P2 P3 corrisponde alla distanza di P1 dalla retta passante per P2 e P3 . Usando
la formula (14), si ottiene:


x1 y1 1
1


det  x2 y2 1  .
h = d(P1 ; r) = p
2
2
(y3 − y2 ) + (x3 − x2 )
x3 y3 1
Segue quindi che l’area A del triangolo di estremi P1 (x1 , y1 ), P2 (x2 , y2 ) e P3 (x3 , y3 ) è data da:


x1 y1 1
1
1


A = b h = det  x2 y2 1  .
2
2
x3 y3 1
7.2. Geometria nello spazio affine di dimensione 3.
In questa sezione studiamo lo spazio affine A3 = (R3 )a . I suoi sottospazi affini, oltre a sé stesso ed i
suoi punti, sono i piani e le rette. Fissiamo in (R3 )a un sistema di riferimento affine Oe1 e2 e3 dove
−−→
{e1 , e2 , e3 } è una base ortonormale di R3 . Se P è un punto di (R3 )a allora il vettore v = OP si scriverà:
−−→
v = OP = xe1 + ye2 + ze3 ,
−−→
dove x, y, z sono le componenti del vettore OP e simultaneamente le coordinate affini del punto P .
Il punto O è l’origine del sistema di riferimento mentre gli assi coordinati coincidono con le direzioni dei
tre vettori e1 , e2 , e3 e sono detti rispettivamente asse x, asse y e asse z.
−−→
Il vettore P Q individuato dai punti P (x1 , y1 , z1 ) e Q(x2 , y2 , z2 ) avrà componenti
(x2 − x1 , y2 − y1 , z2 − z1 ).
50
Un piano π in A3 passante per un punto P0 (x0 , y0 , z0 ) ha equazione vettoriale
−−→ −−→
π : OP = OP0 + tv + t0 v 0
t, t0 ∈ R.
che si scrive anche in forma scalare come

0 0

 x = x0 + lt + l t
(15)
π:
y = y0 + mt + m0 t0


z = z0 + nt + n0 t0
t, t0 ∈ R,
dove i due vettori v = (l, m, n) e v 0 = (l0 , m0 , n0 ) costiutiscono una base della giacitura V ∈ R3 del piano
considerato. I punti P del piano si ottengono dall’equazione (15) al variare dei parametri t, t0 in R.
I piani individuati dall’origine O(0, 0, 0) e da due vettori presi in {e1 , e2 , e3 } vengono chiamati piani
coordinati. Essi sono il piano xy, il piano yz ed il piano xz.
Esempio 7.13. Consideriamo il problema di determinare l’equazione in forma parametrica del piano π
passante per tre punti non allineati P1 (x1 , y1 ), P2 (x2 , y2 ) e P3 (x3 , y3 ). Poiché i tre punti appartengono
−−−→ −−−→
al piano ma non ad una stessa retta i vettori P1 P2 e P1 P3 (più in generale due vettori congiungenti
coppie distinte di punti presi tra P1 , P2 e P3 ) costituiscono una base dello spazio direttore del piano π.
Pertanto, posto:
−−−→
v := P1 P2 = P2 − P1 = (x2 − x1 , y2 − y1 )
e
−−−→
v 0 := P1 P3 = P3 − P1 = (x3 − x1 , y3 − y1 )
L’equazione in forma parametrica di π è quindi data da:

0

 x = x0 + (x2 − x1 )t + (x3 − x1 )t
π:
y = y0 + (y2 − y1 )t + (y3 − y1 )t0


z = z0 + (z2 − z1 )t + (z3 − z1 )t0
t, t0 ∈ R.
Per esempio se P1 (−1, 0, 2), P2 (3, 1, 0) e P3 (1, −1, 4) allora il piano π per P1 , P2 e P3 ha direzione
−−−→
−−−→
individuata dai vettori v = P1 P2 = P2 − P1 = (4, 1, −2) e v 0 = P1 P3 = P3 − P1 = (2, −1, 2). Il piano π
ha equazione parametrica:

 x = x0 + 4t + 2t0

π:
y = y0 + t − t0
t, t0 ∈ R.


0
z = z0 − 2t + 2t
4
Scriviamo ora l’equazione, in forma affine, del piano π passante per un punto P (x0 , y0 , z0 ) avente giacitura
V = hv, v 0 i dove v = (l, m, n) e v 0 = (l0 , m0 , n0 ). Sia P (x, y, z) un punto del piano π. I vettori
−−→
P0 P = (x − x0 , y − y0 , z − z0 ), v e v 0 appartengono tutti alla giacitura di π, che ha dimensione 2.
Pertanto essi sono linearmente dipendenti. Consideriamo la matrice:


x − x0 y − y0 z − z0


A=
l
m
n
.
0
0
0
l
m
n
−−→
I tre vettori riga di A corrispondono ai vettori P0 P , v e v 0 e quindi A ha rango 2. Il determinante di A
deve pertanto essere uguale a 0. Otteniamo, sviluppando il determinante mediante il metodo do Laplace
rispetto alla prima riga:
(16)
0 = det(A) = (x − x0 )(mn0 − m0 n) + (y − y0 )(−ln0 + l0 n) + (z − z0 )(lm0 − l0 m).
Posto a := (mn0 − m0 n), b := (−ln0 + l0 n), c := (lm0 − l0 m) e d := −x0 (mn0 − m0 n) − y0 (−ln0 + l0 n) −
z0 (lm0 − l0 m) l’equazione 16 è della forma:
(17)
ax + by + cz + d = 0.
51
Viceversa data un’equazione del tipo (17), scritto il suo spazio delle soluzioni utilizzando i parametri,
otteniamo un’espressione del tipo (15).
Essa corrisponde quindi ad un piano affine in A3 .
Come per il caso 2-dimensionale, sussiste quindi una corrispondenza tra equazioni lineari in tre variabili
e piani affini in A3 . Vale cioè la:
Proposizione 7.14. In coordinate affini x, y e z, un piano in A3 è rappresentato in forma cartesiana
da un’equazione lineare in x, y e z; viceversa un’equazione lineare nelle stesse coordinate rappresenta un
determinato piano in A3 .
Si noti che anche in questo caso tale corrispondenza non è biunivoca. Infatti mentre un’equazione lineare
individua un piano, ad un piano nello spazio affine 3-dimensionale possiamo associare più equazioni
lineari. Esse comunque devono essere equivalenti, ovvero devono avere le stesse soluzioni (lo spazio delle
soluzioni coincide con l’insieme dei punti del piano).
Notiamo inoltre che dato un piano attraverso la sua equazione affine ne possiamo trovare una rappresentazione paraetrica “risolvendo” l’equazione ovvero scrivendone lo spazio dele soluzione attraverso due
parametri. Viceversa data la rappresentazione parametrica di un piano, “eliminando” i parametri dal
sistema o attraverso una doppia sostituzione o un procedimento di Gauss otteniamo una rappresetazione
Cartesiana dello stesso piano.
Esempio 7.15. Sia ad esempio π : 3x + 4z − 3 = 0. Risolviamo l’equazione. Poniamo pertanto y uguale
ad un parametro t e z uguale alla quantità 3t0 . Otteniamo pertanto, al variare di t e t0 in R lo spazio
delle soluzioni dell’equazione. L’equazione in forma parametrica di π è quindi data da

0

 x = −4t + 1
π:
y=t
t, t0 ∈ R.


0
z=t
Viceversa, dato il piano α attraverso un’equazione in forma parametrica, ad esempio

0

 x = 2t − t + 1
α:
y = 2t0 − 5
t, t0 ∈ R.


0
z = −3t + 2t − 2
per determinarne un’equazione in forma cartesiana, ne riscriviamo l’equazione parametrica nella forma

0

 2t − t − x = −1
0
α:
2t − y = 5


−3t + 2t0 − z = 2
Abbiamo in un certo senso ‘promosso’ i parametri a variabili.
è la seguente

2 −1 −1 0
0

2
0 −1 0
 0
−3 2
0
0 −1
La matrice completa associata al sistema

−1

5 .
2
Attraverso l’algoritmo di Gauss è possibile ridurre tale matrice nella forma a scala:


2 −1 −1 0
0 −1


 0 1 −3 0 −2 1  .
0 0
6 −1 4
3
L’equazione 6x − 3y + 4 = 3 è l’equazione del piano in forma affine.
4
52
Esempio 7.16. Consideriamo il problema di determinare l’equazione in forma Cartesiana (affine) del
piano π passante per tre punti non allineati P1 (x1 , y1 ), P2 (x2 , y2 ) e P3 (x3 , y3 ). Dall’esempio precedente
−−−→
−−−→
sappiamo che i vettori v := P1 P2 e v 0 := P1 P3 costituiscono una base della giacitura di π. L’equazione
in forma cartesiana del piano π si trova ponendo uguale a zero il determinante della matrice:


x − x1 y − y1 z − z1


(18)
 x2 − x1 y2 − y1 z2 − z1  ,
x3 − x1 y3 − y1 z3 − z1
dove x, y e z sono le coordinate di un generico punto del piano π.
Per esempio se P1 (−1, 0, 2), P2 (3, 1, 0) e P3 (1, −1, 4), come nel precedente esempio, allora l’equazione
cartesiana del piano π per P1 , P2 e P3 ha equazione:


x+1 y z−2


π : det  4
1
−2  = 0,
2
−1
2
ovvero
π : 0(x + 1) − 12y − 6(z − 2) = 0,
che si può scrivere nella forma
π : 2y + z − 2 = 0.
4
Esempio 7.17. Consideriamo ancora la matrice (18) il cui determinante posto uguale a zero è l’equazione
in forma Cartesiana (affine) del piano π passante per tre punti non allineati P1 (x1 , y1 ), P2 (x2 , y2 ) e
P3 (x3 , y3 ). Da semplici calcoli si ottiene che questo determinante è uguale a 0 se e solo se è nullo il
determinante della matrice:


x y z
 x y z 
 1
1
1 
(19)

.
 x2 y2 z2 
x3 y3 z3
Segue il seguente risultato:
Quattro punti P0 (x0 , y0 ), P1 (x1 , y1 ), P2 (x2 , y2 ) e P3 (x3 , y3 ) sono complanari (ovvero appartengono ad
uno stesso piano) se e solo se il determinante della matrice


x0 y0 z0
 x y z 
 1
1
1 


 x2 y2 z2 
x3
y3
z3
è nullo.
4
Esempio 7.18. Osserviamo ora che l’equazione cartesiana di un piano può assumere delle forme particolari in relazione alla sua posizione rispetto al sistema di riferimento scelto.
Se ad esempio i piani passanti per l’origine O sono tutti e soli i piani di equazione:
ax + by + cz = 0,
con a, b e c non tutti nulli.
I piani paralleli ad un asse coordinato sono caratterizzati dal fatto di avere equazione in forma affine
ax + by + cz + d = 0,
53
dove a = 0 o b = 0 o c = 0, ma non vale a = b = c = 0. In particolare se a = 0 allora il piano è parallelo
all’asse x, se b = 0 è parallelo all’asse y, mentre se c = 0 allora il piano è parallelo all’asse z. In tal caso
rispettivamente i vettori e1 , e2 o e3 appartengono alla giacitura del piano.
Se nell’equazione affine del piano “mancano” due variabili anziché una allora il piano è parallelo ad
uno dei piani coordinati. Tali piani hanno pertanto equazione in forma affine del tipo x = costante,
y = costante o z = costante a seconda che il piano sia parallelo rispettivamente al piano yz, xz o xy.
4
Studiamo ora la posizione reciproca tra due piani π : ax + by + cz + d = 0, π 0 : a0 x + b0 y + c0 z + d0 = 0
nello spazio affine A3 . In particolare noi siamo interessati alle possibili intersezioni tra i due piani. A
tale scopo esaminiamo il sistema formato dalle equazioni cartesiane dei due piani:
(
ax + by + cz + d = 0
(20)
a0 x + b0 y + c0 z + d0 = 0
La matrice dei coefficienti A ed il vettore termine noto b sono quindi:
!
!
a b c
−d
A=
b=
.
a0 b0 c0
−d0
Poiché i coefficienti a, b e c non sono tutti nulli (cosı̀ come i coefficienti a0 , b0 e c0 ) il rango della matrice A
e quello della matrice completa AC possono essere uguali a 1 o a 2. Se entrambi sono uguali ad 1, allora
il sistema è compatibile e indeterminato. Necessitiamo in tal caso di due parametri per rappresentarne
lo spazio delle soluzioni. Lo spazio delle soluzioni ha pertanto dimensione (affine) pari a due e quindi
coinciderà con entrambi i piani π e π 0 . I due piani sono quindi coincidenti.
Se rg(A) = 1 e rg(AC ) = 2, allora il sistema è incompatibile. In tal caso i due piani hanno la medesima
giacitura e sono paralleli ma non coincidenti. Notiamo che anche quando i due piani sono coincidenti
essi hanno (ovviamente) la medesima giacitura.
Se invece rg(A) = rg(AC ) = 2, allora il sistema è compatibile e indeterminato con spazio delle soluzioni
avente dimensione affine pari ad 1. Esso coincide pertanto con una retta nello spazio A3 . Notiamo
quindi che a differenza di quello che avviene nel piano affine, per rappresentare una retta occorrono due
equazioni lineari nelle coordinate affini x, y e z. L’equazione (o meglio il sistema di equazioni) (20) dove
il determinante della matrice dei coefficienti A è uguale a due è l’equazione affine di una retta nello
spazio. Notiamo ancora che tale rappresentazione non è univocamente determinata dalla retta stessa.
Ogni sistema lineare di due equazioni nelle coordinate x, y e z equivalente a (20) rappresenta la stessa
retta.
Torniamo al caso di rette tra loro parallele. In tal caso la matrice dei coefficienti A ha rango 1. In tal
caso, moltiplicando al più per una costante non nulla una delle due equazioni (questo non ne modifica
ovviamente lo spazio delle soluzioni), se due piani sono paralleli i primi membri delle loro equazioni si
possono far differire al più per il termine noto.
Esempio 7.19. In virtù di quanto osservato, i piani paralleli al piano π di equazione ax + by + cz + d = 0
sono tutti i piani del tipo:
(21)
ax + by + cz + d0 = 0,
al variare di d0 in R. Se ad esempio vogliamo determinare l’equazione del piano π 0 parallelo al piano π
e passante per il punto P0 (x0 , y0 , z0 ) si procede nel seguente modo. L’equazione di π 0 è del tipo (21)
dove d0 è un opportuno valore reale. Per trovare il valore di d0 imponiamo che le coordinate di P0 sono
soluzioni di (21). Sostituendo x0 , y0 e z0 alle coordinate affini nell’equazione di π 0 si ottiene un’equazione
di primo grado in d0 che risolta ci fornisce il termine noto dell’equazione stessa.
54
Possiamo evitare qualche calcolo osservando che l’equazione:
a(x − x0 ) + b(y − y0 ) + c(z − z0 ) = 0
rappresenta proprio il piano affine parallelo a π e passante per P0 .
Ad esempio il piano π 0 parallelo al piano π : 2x − 3y + 2z + 1 = 0 e passante per il punto P0 (1, 0, −2) ha
equazione:
π 0 : 2(x − 1) − 3(y − 0) + 2(z + 2) = 0,
da cui, eseguendo i calcoli:
π 0 : 2x − 3y + 2z + 2 = 0.
Sappiamo che due piani nello spazio sono paralleli se e solo se hanno la stessa giacitura. Pertanto se
l’equazione di un piano π è data in forma parametrica da:

0 0

 x = x0 + lt + l t
π:
y = y0 + mt + m0 t0
t, t0 ∈ R,


z = z0 + nt + n0 t0
il piano parallelo a π passante per un dato punto P (x1 , y1 , z1 ) ha equazione:

0 0

 x = x1 + lt + l t
π:
y = y1 + mt + m0 t0
t, t0 ∈ R,


0 0
z = z1 + nt + n t
4
Abbiamo visto che una retta ha equazione data n forma cartesiana-affine da equazioni del tipo
(
ax + by + cz + d = 0
a0 x + b0 y + c0 z + d0 = 0
dove la matrice dei coefficienti del sistema ha rango 2. Scriviamone la generica forma parametrica di una
sua equazione. Ricordiamo che una retta è un sottospazio affine di dimensione 1. Consideriamo la retta
in A3 la cui giacitura è generata dal vettore v = (l, m, n) e sia P0 (x0 , y0 , z0 ) un suo punto. L’equazione
di r in forma vettoriale è
−−→ −−→
r : OP = OP0 + tv
t ∈ R.
Esplicitando le coordinate si ottiene:
(22)


 x = x0 + lt
r:
y = y0 + mt


z = z0 + nt
t ∈ R.
Esempio 7.20. Consideriamo il problema di determinare l’equazione in forma parametrica della retta
r passante per due punti distinti P (x1 , y1 , z1 ) e Q(x2 , y2 , z2 ). Poiché i due punti appartengono alla retta
−−→
il vettore P Q appartiene allo spazio direttore della retta stessa. Essendo i due punti distinti tale vettore
è diverso dal vettore nullo e pertanto costituisce una base dello spazio direttore di r. Ricordiamo che il
−−→
vettore P Q si trova facendo la differenza delle coordinate dei due punti, cioè
−−→
P Q = Q − P = (x2 − x1 , y2 − y1 , z2 − z1 ).
L’equazione in forma parametrica di r è quindi data da:


 x = x1 + (x2 − x1 )t
r:
y = y1 + (y2 − y1 )t


z = z1 + (z2 − z1 )t
t ∈ R.
55
Per esempio se P (0, −1, −2) e Q(−1, 2, 3) allora la retta r per P e Q ha vettore direttore dato da
−−→
v = P Q = Q − P = (−1, 3, 5) e quindi la retta r ha equazione parametrica:


 x = −t
r:
y = −1 + 3t
t ∈ R.


z = −2 + 5t
Siano ancora P (x1 , y1 , z1 ) e Q(x2 , y2 , z2 ) due punti distinti generici dello spazio. Notiamo che le tre
equazioni lineari:
(y2 − y1 )(x − x1 ) = (x2 − x1 )(y − y1 ),
(z2 − z1 )(x − x1 ) = (x2 − x1 )(z − z1 ),
(z2 − z1 )(y − y1 ) = (y2 − y1 )(z − z1 )
rappresentano altrettanti piani per P (x1 , y1 , z1 ) e Q(x2 , y2 , z2 ). Tali equazioni sono inoltre indipendenti
ed i piani corrispondenti hanno in comune la retta per P e Q. Pertanto il sistema lineare avente come
equazione due qualsiasi di queste tre equazioni è l’equazione della retta r per P e Q in forma affine.
Ad esempio la retta r per P (−1, 1, 2) e Q(−1, −2, 0) ha equazione in forma affine:
(
−3(x + 1) = 0(y − 1)
r:
−2(y − 1) = −3(z − 2)
cioè
(
r:
x = −1
2y − 3z + 4 = 0
4
Due rette sono parallele quando queste hanno la medesima giacitura. Se pertanto un vettore direttore di
una retta r è il vettore v ed un vettore direttore di una retta s è il vettore w allora r e s sono paralleli
se e solo se v e w sono tra loro proporzionali.
Esempio 7.21. Sia r la retta di equazione


 x = 2t − 1
r:
y = −t + 2


z = −2
t ∈ R.
Vogliamo determinare l’equazione della retta r0 parallela a r passante per il punto P (0, 2, 4). Il vettore di
direzione della retta r è il vettore v = (2, −1, 0). Esso può essere preso come vettore di direzione anche
della retta r0 , che pertanto ha equazione, in forma parametrica, data da


 x = 2t
0
r :
y = −t + 2
t ∈ R.


z=4
Supponiamo ora data la retta s data attraverso l’equazione in forma affine
(
2x + y − z = 0
s:
4x − 5z − 3 = 0
ed il punto P (−2, 1, 1). Siano α : 2x + y − z = 0 e β : 4x − 5z − 3 = 0 i piani le cui equazioni formano
l’equazione di s. La retta s0 è contenuta nei piani α0 e β 0 paralleli rispettivamente ad α e β e passanti
per P . Essa pertanto ha equazione:
(
2(x + 2) + (y − 1) − (z − 1) = 0
s0 :
4(x + 2) − 5(z − 1) = 0
56
Svolgendo i calcoli si ottiene finalmente
(
s0 :
2x + y − z + 4 = 0
4x − 5z + 13 = 0
4
Studiamo ora più in dettaglio la posizione reciproca tra due rette. Due rette r e s dello spazio possono
essere 1) Parallele; 2) Incidenti; 3) Sghembe. Esse sono parallele se hanno la medesima direzione, incidenti
se si intersecano in un punto e sghembe se esse non sono né parallele né incidenti. Se esse sono parallele
o incidenti esse sono complanari, ovvero esiste un piano che le contiene entrambe.
Per studiare in dettaglio la posizione reciproca tra le due rette occorre studiare l’intersezione delle stesse.
A tal proposito siano r e s di equazioni rispettive:
(
(
a00 x + b00 y + c00 z + d00 = 0
ax + by + cz + d = 0
s:
r:
0
0
0
0
a000 x + b000 y + c000 z + d000 = 0
ax+by+cz+d =0
Studiamo quindi le soluzioni del sistema:

ax + by + cz + d = 0



 a0 x + b0 y + c0 z + d0 = 0

a00 x + b00 y + c00 z + d00 = 0


 000
a x + b000 y + c000 z + d000 = 0
Siano A la matrice dei coefficienti, b il vettore termine noto e AC la matrice completa associati al sistema.
Si ha:




−d
a
b
c
 −d0 
 a0
b0
c0 




b
=
A =  00

.

 −d00 
 a
b00 c00 
a000
b000
c000

a
a0
a00
a000
−d000
e pertanto


AC = 

b
b0
b00
b000
c
c0
c00
c000
−d
−d0
−d00
−d000



.

Il rango della matrice A è uguale a 2 o a 3, mentre il rango della matrice orlata AC è pari al rango di A
o a rg(A) + 1. Seguono quindi quattro possibilià:
1 - rg(A) = rg(AC ) = 2 In tal caso, per il teorema di Rouchè-Capelli, il sistema è compatibile con
“∞1 ” soluzioni. In tal caso le due rette sono coincidenti.
2 - rg(A) = 2, rg(AC ) = 3 Il sistema è incompatibile. Le due rette hanno comunque la medesima
direzione, quindi sono parallele.
3 - rg(A) = rg(AC ) = 3 Sistema compatibile e determinato, corrispondente al caso di rette incidenti.
4 - rg(A) = 3, rg(AC ) = 4 Il sistema in questo caso è incompatibile e le due rette non sono parallele.
Esse sono sghembe.
Deduciamo che le due rette sono complanari se e solo se il rango della matrice completa AC è non
massimale, ovvero se e solo se il suo determinante è uguale a 0.
Studiamo ora la posizione reciproca tra una retta ed un piano in A3 , focalizzando la nostra attenzione
alla condizione di parallelismo. Vogliamo studiare l’intersezione del piano π con la retta r, dati attraverso
57
le equazioni in forma affine:
(
π : ax + by + cz + d = 0 r :
a0 x + b0 y + c0 z + d0 = 0
a00 x + b00 y + c00 z + d00 = 0
Ci riconduciamo pertanto a studiare le soluzioni del sistema:


 ax + by + cz + d = 0
a0 x + b0 y + c0 z + d0 = 0

 00
a x + b00 y + c00 z + d00 = 0
Come prima siano rispettivamente A e AC la matrice dei coefficienti e la matrice completa associata al
sistema. Si possono presentare i seguenti casi.
1 - rg(A) = rg(AC ) = 2 In tal caso il sistema è compatibile e indeterminato. La retta r è contenuta
nel piano.
2 - rg(A) = 2, rg(AC ) = 3 Il sistema è incompatibile. In tal caso diremo che la retta r è parallela al
piano e viceversa.
3 - rg(A) = rg(AC ) = 3 Sistema compatibile e determinato, corrispondente al caso di retta e piano tra
loro incidenti.
Sia ora v = (l, m, n) il vettore direttore della retta e sia P (x1 , y1 , z1 ) un punto del piano π. In virtù della
−−→
definizione di spazio affine (proprietà (SA1)), esiste (ed è unico) un punto Q in π tale che v = P Q =
(x2 − x1 , y2 − y1 , z2 − z1 ). Segue:
(23)
al + bm + cn = a(x2 − x1 ) + b(y2 − y1 ) + c(z2 − z1 ) = ax2 + by2 + cz2 − (ax1 + by1 + cz1 ) = 0.
Questa relazione esprime il parallelismo tra la retta r ed il piano π. Utilizzando la notazione del prodotto
scalare, ponendo n = (a, b, c), la retta r avente vettore direttore v è parallela al piano π : ax+by+cz+d =
0 se e solo se n · v = 0, ovvero i due vettori n e v sono ortogonali tra loro.
Notiamo che ogni vettore v = (l, m, n) appartenente alla giacitura del piano π : ax + by + cz + d = 0 è
tale che n · v = 0, dove n = (a, b, c). Il vettore n è quindi perpendicolare al piano π. La sua direzione
è la direzione ortogonale al piano. Segue che una retta r è perpendicolare al piano π se e solo se il suo
vettore direzione è parallelo a (quindi multiplo di) n. Il vettore n è anche detto la normale al piano π.
Esempio 7.22. Consideriamo ora il problema di determinare il piano π perpendicolare ad una data
retta r e passante per un dato punto P . Supponiamo r data attraverso una sua equazione in forma
parametrica:


 x = x0 + lt
r:
y = y0 + mt
t ∈ R.


z = z0 + nt
e sia P il punto di coordinate (x1 , y1 , z1 ). Affinché r sia perpendicolare a π il vettore normale al piano n
deve essere proporzionale al vettore direttore v = (l, m, n) di r. Quindi possiamo porre n = v e quindi
il piano π perpendicolare a r e passante per P ha equazione:
l(x − x1 ) + m(y − y1 ) + n(z − z1 ) = 0.
Siano ad esempio P (1, −1, 3) e


 x = 2 + 5t
r:
y = −t


z = −1 − t
t ∈ R.
Il vettore di direzione di r è il vettore v = (5, −1, −1). Pertanto possiamo porre che il vettore normale
al piano n = (a, b, c) sia proprio uguale a v, da cui a = 5, b = −1 e c = −1. Una rappresentazione affine
58
del piano π è quindi data da:
π : 5(x − 1) − (y + 1) − (z − 3) = 0,
cioè
π : 5x − y − z − 3 = 0.
Similmente la retta perperndicolare al piano π : ax + by + cz + d = 0 e passante per il dato punto
P (x1 , y1 , z1 ) ha come vettore di direzione il vettore v = n = (a, b, c) e quindi ha equazione, in forma
parametrica,


 x = x1 + at
r:
y = y1 + bt
t ∈ R.


z = z1 + ct
Siano per esempio π : 2y + 7z − 11 = 0 e P (2, 1, −3) rispettivamente un piano ed un punto nello spazio
A3 . La retta r perpendicolare a π e passante per P ha come vettore di direzione il vettore v = (0, 2, 7).
La sua equazione è pertanto:


 x=2
r:
y = 1 + 2t
t ∈ R.


z = −3 + 7t
4
Consideriamo ora due piani distinti π e π 0 di equazione:
π : ax + by + cz = 0.
π 0 : a0 x + b0 y + c0 z + d0 = 0.
Il fascio di piani F generato (o individuato) dai piani π e π 0 è l’insieme dei piani aventi equazioni date
da:
(24)
F : λ(ax + by + cz + d) + µ(a0 x + b0 y + c0 z + d0 ) = 0, λ, µ ∈ R,
dove λ e µ sono scalari non entrambi nulli. Si osservi che i piani del fascio solo apparentemente dipendono
da due parametri. Coppie di scalari λ, µ e λ0 , µ0 tra loro proporzionali danno luogo al medesimo piano.
Talvolta si pone k := µλ ed in tal caso l’equazione del fascio diventa:
F : ax + by + cz + d + k(a0 x + b0 y + c0 z + d0 ) = 0,
k ∈ R.
In tal caso comunque si noti che la corrispondenza tra i valori di k ed i piani del fascio non è perfettamente
biunivoca. Il piano π 0 : a0 x + b0 y + c0 z + d0 = 0 non può essere ottenuto per nessun valore di k.
I due piani che determinano il fascio, essendo distinti, sono o incidenti in una retta o paralleli. Nel primo
caso notiamo che la retta r intersezione di π e π 0 , detta asse del fascio, è contenuta in ogni piano del
fascio. Nel secondo caso i piani del fascio sono tutti paralleli tra loro. Nel primo caso chiamiamo F
fascio di piani proprio di asse r (o fascio di piani proprio di centro r), mentre nel secondo fascio di piani
improprio.
Osserviamo che nel caso di un fascio di piani improprio, piani distinti del fascio hanno differenti giaciture
e quindi differenti direzioni ortogonali.
Supponiamo dato un fascio di equazione:
F : a(k)x + b(k)y + c(k)z + d(k) = 0,
k ∈ R.
F è un fascio proprio o improprio a seconda che la direzione del vettore n(k) = a(k), b(k), c(k) vari con
k o no.
59
Esempio 7.23. Sia F il fascio di equazione:
F : (3k − 1)x + (k − 2)y + −kz + k + 11 = 0,
k ∈ R.
Il vettore ortogonale n(k) ha coordinate (3k − 1, k − 2, −k). La sua direzione varia con k. Il fascio di
rette F è quindi un fascio proprio. Per determinarne l’asse, occorre svolgere i prodotti nell’equazione del
fascio e raccogliere k a fattore comune parziale. In dettaglio:
F : 3kx − x + ky − 2y + −kz + k + 11 = 0,
k ∈ R,
F : −x − 2y + 11 + k(3x + y − z + 1) = 0,
k ∈ R.
da cui
L’asse del fascio è la retta r di equazione:
(
r:
−x − 2y + 11 = 0
3x + y − z + 1 = 0
4
Se π : ax + by + cz + d = 0 è un piano fissato nello spazio, il fascio di piani proprio F individuato da π è
l’insieme di tutti i piani paralleli a π. Esso ha equazione:
F : ax + by + cz + k = 0,
k ∈ R.
Un fascio improprio è invece individuato da una coppia di piani incidenti o dall’asse stesso. Noto l’asse
di un fascio è facile scriverne l’equazione. Se infatti r è data in forma cartesiana da:
(
ax + by + cz + d = 0
r:
a0 x + b0 y + c0 z + d0 = 0
il fascio di asse r ha equazione
ax + by + cz + d + k(a0 x + b0 y + c0 z + d0 ) = 0,
k ∈ R.
Esempio 7.24. Consideriamo ora il problema di determinare i piani paralleli ad una data retta r passanti
per un dato punto P . Essi devono tutti contenere la retta r0 parallela a r e passante per P . Tali piani
costituiscono pertanto il fascio di piani proprio di asse r0 .
Sia P (3, −5, 2) un punto ed r la retta di equazione:
(
−x + y + 2z − 4 = 0
r:
3x − z − 6 = 0
La retta r0 parallela a r e passante per P ha equazione:
(
−(x − 3) + (y + 5) + 2(z − 2) = 0
0
r :
3(x − 3) − (z − 2) = 0
cioè
(
0
r :
−x + y + 2z + 4 = 0
3x − z − 7 = 0
Il fascio di piani paralleli a s per P ha quindi equazione:
−x + y + 2z + 4 + k(3x − z − 7) = 0.
Illustriamo qui, mediante un esempio numerico, un metodo differente per determinare l’equazione del
fascio di piani paralleli ad una data retta e passanti per un dato punto. QUesto metodo si presta bene
60
nel caso in cui la retta è data in forma parametrica. A tal proposito sia P (1, 2, −2) e sia r la retta di
equazione:


 x = −2t + 3
r:
y =t+4
t ∈ R.


z = 3t
Affinché un piano generico di equazione ax + by + cz + d = 0 appartenga al fascio esso deve contenere
il punto P ed il suo vettore normale n = (a, b, c) deve essere perpendicolare al vettore di direzione di r,
v = (l, m, n) = (−2, 1, 3). Pertanto si deve avere:
(a, b, c) · (l, m, n) = −2a + b + 3c = 0,
da cui
b = 2a − 3c.
L’equazione del fascio di piani per P paralleli a r ha pertanto equazione:
a(x − 1) + (2a − 3c)(y − 2) + c(z + 2) = 0
a, c ∈ R,
ovvero
a(x + 2y − 5) + c(−3y + z + 8) = 0,
Posto k =
c
a,
a, c ∈ R.
l’equazione del fascio si può scrivere usando un solo parametro essenziale:
x + 2y − 5 + k(−3y + z + 8) = 0,
k ∈ R.
4
Esempio 7.25. Consideriamo il problema di determinare i piani perpendicolari ad una dato piano π
e passanti per un dato punto P . Essi costituiscono il fascio di piani proprio avente per asse la retta r
passante per P e perpendicolare a π.
Siano π : 4x + y + z − 2 = 0 e P (1, 1, −2). La retta r perpendicolare a π per P ha vettore direttore
v = (4, 1, 1). Essa ha quindi equazione:


 x = 4t + 1
r:
y =t+1
t ∈ R.


z =t−2
Dalla terza equazione troviamo t = z + 2. Sostituendo questa quantità nella prima e nella seconda
equazione si ottiene:
(
x − 4z − 9 = 0
r:
y−z−3=0
Il fascio di piani per r ha equazione:
x − 4z − 9 + k(y − z − 3) = 0.
4
Nello spazio affine in tre dimensioni l’insieme delle rette parallele tra loro o tutte passanti per un punto
costituiscono una famiglia di rette nota con il termine stella di rette. Un fascio di rette è un sottoinsieme
di una stella di rette formato da quelle rette che giacciono su uno stesso piano. Un fascio di rette è detto
improprio se i suoi elementi sono paralleli tra loro, proprio se essi passano tutti per uno stesso punto.
Esempio 7.26. L’insieme delle rette parallele ad un piano fissato π e passanti per un punto P costituisce
un fascio di rette proprio F. Tutte tali rette sono contenute nel piano π 0 parallelo a π e passante per P .
Esse possono essere viste come l’intersezione del fascio di piani perpendicolari a π con π 0 .
Siano dati π : x + 2y − z − 1 = 0 e P (−1, 0, 1). Il piano π 0 per P parallelo a π ha equazione:
π 0 : (x + 1) + 2y − (z − 1) = 0,
61
cioè
π 0 : x + 2y − z + 2 = 0.
I piani perpendicolari a π e passanti per P sono i piani i cui vettori normali sono perpendicolari al vettore
n = (1, 2, −1) ortogonale al piano π. Essi sono quindi i piani di equazione
a(x + 1) + by + c(z − 1) = 0,
dove il vettore (a, b, c) é ortogonale al vettore n, cioè tale che:
a + 2b − c = 0.
Dunque c = a + 2b e l’equazione del fascio G dei piani per P e perpendicolari a π è:
G : a(x + 1) + by + (a + 2b)(z − 1) = 0,
a, b ∈ R.
che si può scrivere nella forma:
G : a(x + z) + b(y + 2z − 2) = 0,
a, b ∈ R.
L’equazione del fascio F è pertanto la seguente:
(
x + 2y − z + 2 = 0
F:
a(x + z) + b(y + 2z − 2) = 0
Lo stesso fascio può anche essere trovato, con rappresentazione parametrica stavolta, in un modo differente. Siano π e P come prima. Le rette r per P parallele al piano π hanno vettore direttore v = (l, m, n)
perpendicolare al vettore normale al piano π, cioè al vettore n = (1, 2, −1). Segue quindi:
0 = v · n = l + 2m − n,
da cui
n = l + 2m.
Il fascio F ha pertanto equazione, in forma parametrica, data da:


 x = −1 + lt
F:
y = mt
t ∈ R.


z = 1 + (l + 2m)t
Al variare di l e m in R abbiamo tutte le rette del fascio.
4
Date due rette r e r0 nello spazio affine, siano v = (l, m, n) e v 0 = (l0 , m0 , n0 ) i loro vettori direttori.
Definiamo l’angolo tra le due rette come l’angolo tra i due vettori direttori. Vale quindi:
0
0
0
ll0 + mm0 + nn0
d0 = ± (l, m, n) · (l , m , n ) = ±
c0 := cos vv
.
cos rr
k(l, m, n)kk(l0 , m0 , n0 )k
k(l, m, n)kk(l0 , m0 , n0 )k
Due rette sono quindi ortogonali se e solo se il coseno dell’angolo è uguale a 0, cioè se e solo se ll0 +
mm0 + nn0 = 0.
Esempio 7.27. Le rette perpendicolari ad una data retta r e passanti per un punto dato P costituiscono
un fascio proprio. Tutte le rette del fascio appartengono al piano passante per P e perpendicolare a r.
Sia ad esempio P (4, −2, −1) un punto dello spazio ed r la retta di equazione:


 x = −t + 2
r:
y = 4t
t ∈ R.


z = −2
Il piano π passante per P e perpendicolare a r ha equazione:
π : −(x − 4) + 4(y + 2) = 0,
62
cioè
π : −x + 4y + 12 = 0.
Le rette del fascio F delle rette per P e perpendicolari a r sono tutte e sole le rette ottenute come
intersezione di un piano per P e parallelo ad r con il piano π. Il fascio G dei piani paralleli a r per P è
un fascio proprio avente come asse la retta r0 parallela a r e passante per P . Tale retta ha equazione:


 x = −t + 4
r0 :
y = 4t − 2
t ∈ R.


z = −1
Un’equazione affine di r0 pu‘o essere trovata trovando t nella prima “equazione” e sostituendo tale valore
nella seconda. Si ottiene:
(
4x − y − 18 = 0
0
r :
z+1=0
Il fascio G ha equazione:
G : 4x − y − 18 + k(z + 1) = 0.
Il fascio di rette cercato ha equazione:
(
F:
−x + 4y + 12 = 0
4x − y − 18 + k(z + 1) = 0
Determiniamo ora il fascio F in altro modo. Una retta appartiene ala fascio F se e solo se passa per
il punto P ed ha vettore direttore w = (l, m, n) perpendicolare al vettore direttore v = (−1, 4, 0) di r.
Pertanto vale:
0 = v · w = (−1, 4, 0) · (l, m, n) = −l + 4m,
da cui
l = 4m.
L’equazione di F, in forma parametrica, è data da:


 x = 4 + 4mt
F:
y = −2 + mt


z = −1 + nt
t ∈ R.
Al variare di m e n in R otteniamo tutte le rette del fascio.
4
Dati due punti P (x1 , y1 , z1 ) e Q(x2 , y2 , z2 ) nello spazio, la distanza tra i due punti coincide con il modulo
−−→
del vettore P Q di punto iniziale P e punto finale Q. Essa vale quindi:
d(P ; Q) = k(x2 − x1 , y2 − y1 , z2 − z1 )k =
p
(x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 .
Per calcolare la distanza tra il punto P (x0 , y0 , z0 ) ed il piano π : ax + by + cz + d = 0 si trova utilizzando
la formula:
|ax0 + by0 + cz0 + d|
√
(25)
d(P ; π) =
.
a2 + b2 + c2
Questa formula si ottiene, come nel caso della distanza punto-retta in A2 calcolando il modulo della
−−→
proiezione del vettore P Q, dove Q è un punto arbitrario nel piano π, lungo la direzione normale al piano,
individuata dal vettore n = (a, b, c).
Esempio 7.28. Siano P (−1, 1, 4) e π : 2x − y − 2z − 3 = 0. La distanza di P dal piano π è quindi
uguale a:
|ax0 + by0 + cz0 + d|
|2(−1) − 1 − 2(4) − 3|
| − 14|
14
√
.
d(P ; π) =
=p
= √
=
2
2
2
2
2
2
3
9
a +b +c
(2) + (−1) + (−2)
63
4
Per il calcolo della distanza di un punto P da una retta r occorre trovare il piano π perpendicolare a r e
passante per P , poi il punto H di intersezione di π e r e quindi la distanza tra i due punti P e H.
Esempio 7.29. Calcoliamo la distanza del punto P (0, 3, −2) dalla retta r di equazione:


 x = −1 − t
r:
y = 2 + 3t
t ∈ R.


z = 6 − 5t
Il vettore direttore di r è il vettore v = (−1, 3, −5). Il piano π passante per P e perpendicolare r ha
quindi equazione:
π : (−1)(x − 0) + 3(y − 3) − 5(z + 2) = 0,
cioè
π : −x + 3y − 5z − 19 = 0
Il punto H, intersezione di r e π, si può calcolare sostituendo le coordinate di un generico punto di
r (date attraverso il parametro t nell’equazione parametrica) all’equazione del piano. Otteniamo cosı̀
un’equazione di primo grado nella variabile t, che risolta ci permette di determinare le coordinate del
punto H. In dettaglio:
−(−1 − t) + 3(2 + 3t) − 5(6 − 5t) − 19 = 0,
da cui
35t − 42 = 0
28
Il punto H ha coordinate H(− 11
5 , 5 , 0). La distanza cercata è quindi uguale a:
r
r
r
√
11 2
28
121
+
169
+
100
390
390
d(P ; r) = d(P ; H) = (− ) + ( − 3)2 + (2)2 =
=
=
.
5
5
25
25
5
e quindi t =
6
5.
4