Appunti del Corso di Istituzioni di Fisica Matematica

annuncio pubblicitario

Dipartimento di Matematica
Università degli Studi di Genova
U. Bruzzo — M. Pedroni
Appunti del Corso di
Istituzioni di Fisica Matematica
(2o modulo)
Anno Accademico 1997–98
I.1
Capitolo I
GRUPPI DI LIE
Molto spesso si incontrano gruppi i cui elementi dipendono in maniera regolare da un certo
numero di parametri (per esempio, gli elementi di una matrice di rotazione in tre dimensioni
si possono esprimere in funzione degli angoli di Eulero che parametrizzano la rotazione). La
nozione di gruppo di Lie rende rigorosa questa constatazione euristica. Un gruppo di Lie è
sostanzialmente un gruppo che è allo stesso tempo una varietà differenziabile, in modo che le
due strutture siano compatibili.
1. Prime definizioni
Un gruppo di Lie G è una varietà differenziabile dotata di una struttura di gruppo in modo
tale che l’applicazione
(1)
ψ : G × G → G,
ψ(g, h) = gh−1
sia differenziabile (in questo capitolo tutte le applicazioni differenziabili saranno di classe
C ∞ ). La differenziabilità dell’applicazione (1) fa sı̀ che siano differenziabili anche
(i) l’applicazione che prende l’inverso, ι(g) = g −1 , in quanto questa si può scrivere ι(g) =
ψ(e, g), essendo e l’elemento identità di G;
(ii) l’applicazione prodotto π(g, h) = gh, in quanto si può scrivere π(g, h) = ψ(g, ι(h)).
Un omomorfismo φ : G → H di gruppi di Lie è un’applicazione differenziabile che è anche un
omomorfismo di gruppi, ovvero, φ(gh) = φ(g)φ(h) (ponendo h = eG , questa implica φ(eG ) =
eH ). Un isomorfismo di gruppi di Lie è un diffeomorfismo che è anche un omomorfismo di
gruppi (l’applicazione inversa φ−1 : H → G è automaticamente un omomorfismo di gruppi).
Esempio 1.1. Uno spazio vettoriale V su R di dimensione finita, con la sua struttura differenziabile canonica e la struttura gruppale data dalla somma, è un gruppo di Lie (abeliano).
In particolare ciò vale per Rn .
Esempio 1.2. Il toro n-dimensionale T n = Rn /Zn ' S 1 ×· · ·×S 1 è un gruppo di Lie (abeliano
e compatto).
Esempio 1.3. Siano
2
gl(n, R) = {matrici reali n × n} ' Rn
Gl(n, R) = {matrici reali n × n invertibili}
det : gl(n, R) → R
l’applicazione determinante.
I.2
Gl(n, R) = gl(n, R) \ det−1 (0) è un aperto di gl(n, R), e quindi è una varietà differenziabile. Si
2
può mettere su Gl(n, R) un sistema di coordinate “tautologico” {xi j } a valori in Rn , che ad
ogni matrice M associa i suoi n2 coefficienti, M 7→ {M ij }. Il prodotto di matrici è polinomiale,
mentre l’inverso di una matrice è una funzione razionale degli elementi di matrice; entrambe
le operazioni sono C ∞ . Pertanto Gl(n, R) è un gruppo di Lie di dimensione n2 .
Nello stesso modo si definisce il gruppo Gl(n, C), formato dalle matrici n × n invertibili
a coefficienti complessi. Gl(n, C) è un gruppo di Lie di dimensione 2n2 , ed è un aperto in
gl(n, C), lo spazio vettoriale delle matrici n × n a coefficienti complessi.
Ogni elemento g ∈ G definisce un’operazione di trasporto sinistro
Lg : G → G,
Lg (h) = gh
Rg : G → G,
Rg (h) = hg.
e una di trasporto destro
Si hanno le ovvie relazioni
Lg1 ◦ Lg2 = Lg1 g2 ,
Rg1 ◦ Rg2 = Rg2 g1 ,
Le = Re = idG ,
Lg1 ◦ Rg2 = Rg2 ◦ Lg1 .
Per ogni g ∈ G le applicazioni Lg ed Rg sono diffeomorfismi, e vale
Lg−1 = (Lg )−1 ,
Rg−1 = (Rg )−1 .
I differenziali (Lg )∗ ed (Rg )∗ agiscono sui campi vettoriali su G.
Definizione 1.4. Un campo vettoriale X su G è detto invariante a sinistra se (Lg )∗ X = X
per ogni g ∈ G; invariante a destra se (Rg )∗ X = X (scrivendo esplicitamente la dipendenza
dal posto, si ha rispettivamente (Lg )∗ X(h) = X(gh) e (Rg )∗ X(h) = X(hg)).
Esercizio 1.5. Consideriamo ancora su Gl(n, R) il sistema di coordinate “tautologico” {xi j }
2
a valori in Rn , che ad ogni matrice M associa i suoi n2 coefficienti, M 7→ {M ij }. Dimostrare
che i campi vettoriali
∂
X ij (M ) = M kj
∂xki
sono invarianti a sinistra.
Sottogruppi. Sia G un gruppo di Lie. Un sottogruppo H di G (in senso algebrico) è un
sottogruppo di Lie di G se l’inclusione H ,→ G realizza H come sottovarietà di G.1,2
Esempio 1.6. I seguenti sono sottogruppi di Lie di Gl(n, R):3
(i) O(n, R) = matrici reali n × n che sono ortogonali, ovvero verificano R R̃ = In , essendo R̃
la matrice trasposta di R, e In la matrice identità n × n. O(n, R) è il sottogruppo di Gl(n, R)
1Siano V , W varietà differenziabili, e sia ι : V → W un’applicazione differenziabile iniettiva. Diciamo che
la coppia (V, ι) è una sottovarietà di W se l’applicazione lineare (ι∗ )x : Tx V → Tι(x) W è iniettiva. Per esempi
e controesempi si veda W. Boothby, An introduction to Riemannian Geometry.
2Nel seguito, qualora ciò non dia adito a confusione, diremo spesso “sottogruppo” intendendo “sottogruppo
di Lie”.
3La dimostrazione che i seguenti esempi siano effettivamente dei sottogruppi di Lie di Gl(n, R) verrà data
più avanti.
I.3
che preserva il prodotto scalare canonico di Rn : si ha Ru · Rv = u · v per ogni u, v ∈ Rn se e
solo se R ∈ O(n, R).
(ii) SO(n, R) = matrici in O(n, R) aventi determinante uguale a 1;
(iii) Sl(n, R) = matrici in Gl(n, R) aventi determinante uguale a 1;
(iv) le matrici reali n × n triangolari superiori (inferiori) invertibili.
Dato un gruppo di Lie G, ed un sottogruppo algebrico H di G, si pone in generale la
questione se H possa essere realizzato come sottogruppo di Lie di G. In altri termini, ci
chiediamo se sia possibile mettere su H una struttura differenziabile in modo che H sia un
gruppo di Lie, e l’immersione H ,→ G sia differenziabile. La risposta è sempre affermativa
quando H è un sottoinsieme chiuso di G. Ciò è espresso dal seguente risultato, che enunciamo
senza dimostrazione (cf. Warner, Foundations of differentiable manifolds and Lie groups).
Proposizione 1.7. Sia H un sottogruppo algebrico di un gruppo di Lie G. Se H è chiuso in
G, esiste su H un’unica struttura differenziabile che rende H un sottogruppo di Lie di G.
2. Algebre di Lie
Un’algebra di Lie è un’algebra a su R, in generale non associativa, non necessariamente di
dimensione finita, tale che, denotando [α, β] il prodotto nell’algebra, questo verifica le seguenti
condizioni:
(i) antisimmetria: [α, β] = −[β, α] per ogni α, β ∈ a;
(ii) identità di Jacobi:
[α, [β, γ]] + [γ, [α, β]] + [β, [γ, α]] = 0
per ogni α, β, γ ∈ a .
L’operazione bilineare [· , ·] è detta commutatore o parentesi di Lie.
Esempio 2.1. Ogni spazio vettoriale, dotato della parentesi di Lie banale [α, β] = 0, è un’algebra di Lie (detta abeliana).
Esempio 2.2. Lo spazio vettoriale X(V ) dei campi vettoriali su una varietà differenziabile V ,
con la parentesi di Lie data dal commutatore dei campi vettoriali visti come derivazioni,
[X, Y ](f ) = X(Y (f )) − Y (X(f )) ,
è un’algebra di Lie infinito-dimensionale (f è una qualunque funzione differenziabile).
Esempio 2.3. Sia {e1 , e2 , e3 } la base canonica di R3 . Stabiliamo un isomorfismo di spazi
vettoriali Λ2 R3 → R3 ponendo
e1 ∧ e2 7→ e3 ,
e2 ∧ e3 7→ e1 ,
e3 ∧ e1 7→ e2 .
Via quest’isomorfismo il prodotto wedge di elementi di R3 induce un prodotto bilineare
R3 ⊗ R3 → R3 , usualmente detto prodotto vettore, che denoteremo con lo stesso simbolo
del prodotto wedge. Il prodotto vettore è evidentemente antisimmetrico, ed inoltre vale
(2)
(u ∧ v) ∧ w + (w ∧ u) ∧ v + (v ∧ w) ∧ u = 0 ,
I.4
come è facile dimostrare prendendo come u, v, w gli elementi della base canonica. Con questo
prodotto R3 diventa un’algebra di Lie (in particolare la proprietà (2) è l’identità di Jacobi),
che denoteremo r.
Esempio 2.4. Denotiamo (x1 , . . . , xn , y1 , . . . , yn ) le coordinate canoniche di R2n . Sullo spazio
vettoriale F(R2n ) delle funzioni C ∞ su R2n definiamo le parentesi di Poisson
∂f ∂g
∂g ∂f
{f, g} =
− i
.
i
∂x ∂yi ∂x ∂yi
La proprietà di antisimmetria {f, g} = −{g, h} è evidente, mentre la verifica dell’identità di
Jacobi richiede un calcolo un poco laborioso. F(R2n ) con le parentesi di Poisson è un’algebra
di Lie infinito-dimensionale.
Esempio 2.5. Lo spazio gl(n, R) delle matrici n × n reali, con la parentesi di Lie data dal
commutatore
[A, B] = AB − BA,
è un algebra di Lie. gl(n, R) ammette svariati sottospazi vettoriali che sono chiusi rispetto
alla parentesi di Lie (ovvero, detto b un tale sottospazio, [b, b] ⊂ b. Questi sottospazi sono
allora delle sottoalgebre). Ad esempio:
(i) o(n, R) = {matrici n × n antisimmetriche}
(ii) sl(n, R) = {matrici n × n aventi traccia nulla}
(iii) le matrici n × n reali triangolari superiori (inferiori).
Definizione 2.6. Siano a, b algebre di Lie. Un omomorfismo φ : a → b è un’applicazione
lineare tale che [φ(α), φ(β)] = φ([α, β]).
Se φ è bigettivo, viene detto isomorfismo di algebre di Lie.
Esercizio 2.7. Mostrare che l’applicazione
r → o(3, R),


0
c −b
1
a e1 + b e2 + c e3 7→
−c 0
a
2
b −a 0
stabilisce un isomorfismo di algebre di Lie.
Esercizio 2.8. Con riferimento agli Esempi 2.2 e 2.4, mostrare che l’applicazione lineare
∂f ∂
∂f ∂
F(R2n ) → X(R2n ),
f 7→
−
i
∂x ∂yi ∂yi ∂xi
è un omomorfismo di algebre di Lie.
3. Algebra di Lie di un gruppo di Lie
Vogliamo vedere come ad ogni gruppo di Lie G si possa associare una algebra di Lie che in
qualche modo rappresenta la struttura di G in maniera infinitesima. Facciamo una premessa
introducendo la nozione di campi vettoriali correlati. Data un’applicazione differenziabile
φ : V → W , un campo vettoriale X su V e un campo vettoriale Y su W , diciamo che X e Y
sono φ-correlati se φ∗ X(p) = Yφ(p) per ogni p ∈ V . Sotto questa ipotesi si ha
I.5
Lemma 3.1. Se {ψt } è il flusso di X, e χt il flusso di Y , si ha φ ◦ ψt = χt ◦ φ.
Dimostrazione. Per ogni x ∈ V il campo vettoriale Y è tangente sia alla curva χt ◦ φ sia alla
curva φ ◦ ψt , e per l’unicità del flusso locale dei campi vettoriali si ha la tesi.
Lemma 3.2. Se X1 , Y1 sono φ-correlati, e X2 , Y2 sono φ-correlati, allora [X1 , X2 ] e [Y1 , Y2 ]
sono φ-correlati.
Dimostrazione. Faremo uso dell’identità
dω(X, Y ) = X(< Y, ω >) − Y (< X, ω >)− < [X, Y ], ω >
valida per ogni 1-forma differenziale ω ed ogni coppia di campi vettoriali X, Y . Data una
funzione f su W , si ha la catena di uguaglianze
φ∗ ([X1 , X2 ])(f ) =< [X1 , X2 ], dφ∗ (f ) >
= X1 (< X2 , dφ∗ (f ) >) − X2 (< X1 , dφ∗ (f ) >)
= X1 (φ∗ (< φ∗ (X2 ), df >)) − X2 (φ∗ (< φ∗ (X1 ), df >))
= φ∗ (X1 )(< φ∗ (X2 ), df >) − φ∗ (X2 )(< φ∗ (X1 ), df >)
= [Y1 , Y2 ](f ) .
Dire che X è campo vettoriale invariante a sinistra su un gruppo di Lie equivale a dire che
X è Lg -correlato a se stesso per ogni g ∈ G. Dal Lemma 3.2 segue che il commutatore di due
campi vettoriali invarianti a sinistra è anch’esso invariante a sinistra. Lo spazio vettoriale dei
campi vettoriali invarianti a sinistra pertanto è chiuso rispetto al commutatore, e con esso
costituisce un’algebra di Lie g, detta l’algebra di Lie di G.
Esempio 3.3. Dalla definizione T n = Rn /Zn segue che sull’aperto denso U del toro T n ,
corrispondente alla cella fondamentale del reticolo Zn , sono definite coordinate {x1 , . . . , xn }
indotte dalle coordinate canoniche di Rn . In queste coordinate il prodotto gruppale è rappresentato dall’addizione delle coordinate. In campi vettoriali invarianti a sinistra sono i campi
vettoriali che in queste coordinate hanno componenti costanti (è sufficiente verificare questo
su U perché quest’ultimo è denso). Tali campi commutano fra di loro, e pertanto l’algebra di
Lie di T n è isomorfa a Rn con la parentesi di Lie banale.
Per uso futuro notiamo che se le componenti di un campo vettoriale invariante a sinistra
P
X sono linearmente indipendenti su Z (ovvero se i mi X i = 0 con mi ∈ Z implica X i = 0)
allora la curva integrale γ X di X è densa in T n . Se n = 2 e γ X non è densa, allora è chiusa
(per n = 2 il fatto che le componenti di X siano linearmente indipendenti su Z significa che
X 1 , X 2 6= 0 e X 1 /X 2 è irrazionale).
L’esistenza di campi vettoriali invarianti a sinistra su ogni gruppo di Lie G (cioè la non
banalità della corrispondente algebra di Lie g) segue dal fatto che g si può identificare, come
spazio vettoriale, con lo spazio tangente Te G.
I.6
Proposizione 3.4. L’applicazione lineare
g → Te G
X 7→ X(e)
è un isomorfismo.
Dimostrazione. L’applicazione sopra definita è lineare e surgettiva; infatti, se Y ∈ Te G, la
condizione X(g) = (Lg )∗ Y definisce un campo vettoriale invariante a sinistra. Rimane da
dimostrare che se X(e) = 0, allora X è il campo vettoriale nullo. Ciò segue da X(g) =
(Lg )∗ X(e).
Come prima conseguenza abbiamo che dim g = dim G.4
Esempio 3.5. Da quanto detto segue che un campo vettoriale invariante a sinistra non nullo
non si annulla in alcun punto. Dalla topologia differenziale sappiamo che un campo vettoriale
sulla sfera S 2 si annulla almeno in due punti. Pertanto S 2 non ammette alcuna struttura di
gruppo di Lie. Dal precedente teorema segue anche che su un gruppo di Lie G di dimensione
n siano sempre definiti n campi vettoriali linearmente indipendenti in ogni punto, cosicché il
fibrato tangente T G è sempre banale. Ciò implica per esempio che l’unica varietà differenziabile bidimensionale, orientabile, compatta e connessa che ammetta una struttura di gruppo
di Lie è il toro T 2 .
Applicazione esponenziale. L’algebra di Lie g di un gruppo di Lie G “approssima” il gruppo
in un intorno dell’identità. Questa affermazione euristica si può rendere precisa in termini
della cosiddetta applicazione esponenziale.
Lemma 3.6. Ogni campo vettoriale invariante a sinistra su G è completo.
(Ricordiamo che un campo vettoriale su una varietà differenziabile V è completo se le sue
curve integrali sono definite per ogni valore del loro argomento. In tal caso la famiglia delle
curve integrali costituisce un gruppo ad un parametro di diffeomorfismi di V .)
Dimostrazione. Sia X un campo vettoriale invariante a sinistra. Se γ : (−, ) → G è una
curva integrale di X per e, allora Lg ◦ γ è una curva integrale di X per g. È cosı̀ sufficiente
considerare il caso di curve per e. È inoltre sufficiente dimostrare che se γ è definita per due
valori s e t del parametro, è definita anche in s + t. Si ponga γ̃(t) = γ(s)γ(t) (dove γ(s) e
4Seguendo una convenzione ormai del tutto consolidata, abbiamo definito l’algebra di Lie di un gruppo di
Lie come l’algebra dei campi vettoriali invarianti a sinistra. Si potrebbe nello stesso modo considerare l’algebra
gr dei campi vettoriali invarianti a destra. Anche gr risulta isomorfa allo spazio tangente Te G, e pertanto si
∼ gr . Le due strutture di algebra sono però diverse; detto [ , ]r il
ha un isomorfismo di spazi vettoriali φ : g →
commutatore in gr , si ha φ([α, β]) = −[φ(α), φ(β)]r (le due algebre di Lie sono anti-isomorfe).
I.7
γ(t) sono moltiplicate mediante il prodotto gruppale). Allora in coordinate locali si ha
∂ ∂ d k
d k
x ◦ γ̃(t)
=
x ◦ Lγ(s) ◦ (γ(t))
dt
∂xk γ̃(t) dt
∂xk γ̃(t)
"
#
∂ d k
= (Lγ(s) )∗
x ◦ γ(t)
dt
∂xk γ̃(t)
= (Lγ(s) )∗ X(γ(t))
= X(γ(s)γ(t)) = X(γ̃(t)) .
Pertanto γ̃ soddisfa l’equazione delle curve integrali di X. Per il risultato di unicità, γ è
definita in s + t, e vale γ(s + t) = γ̃(t) = γ(s)γ(t).
Per ogni X ∈ g sia γ X la curva integrale di X per e. L’applicazione esponenziale exp : g → G
è definita dalla condizione
exp X = γ X (1) .
Lemma 3.7. Per ogni campo vettoriale invariante a sinistra X vale γ tX (s) = γ X (ts).
Dimostrazione. In coordinate locali vale
d i
x ◦ γ tX (s) = tX i (γ tX (s))
ds
d i
x ◦ γ X (ts) = tX i (γ X (ts))
ds
per cui le curve γ tX (s) e γ̄(s) = γ X (ts) verificano la stessa equazione differenziale. Essendo
inoltre γ tX (0) = γ̄(0), per il teorema di unicità esse coincidono.
Cosı̀ exp(tX) = γ tX (1) = γ X (t), e {exp tX}t∈R si può identificare con il gruppo ad un
parametro di diffeomorfismi generato da X. Più precisamente,
Proposizione 3.8. Il gruppo ad un parametro di diffeomorfismi di G generato da X è dato
da ψt (g) = g exp(tX) = Rexp(tX) (g).
Siano G, H gruppi di Lie e g, h le corrispondenti algebre di Lie, e sia φ : G → H un
omomorfismo di gruppi di Lie. Ricordando che un campo vettoriale invariante a sinistra è
determinato dal sua valore nell’identità, ed essendo φ(eG ) = eH , definiamo un’applicazione
lineare φ∗ : g → h ponendo Y (eH ) = φ∗ (X(eG )). Da ciò segue che X e Y sono φ-correlati.5
Pertanto vale
[φ∗ (X1 ), φ∗ (X2 )] = φ∗ ([X1 , X2 ]),
e φ∗ : g → h è un omomorfismo di algebre di Lie. In particolare, se G e H sono isomorfi, anche
le loro algebre lo sono. Il risultato inverso non è vero: per esempio, Rn e T n hanno la stessa
algebra di Lie (Rn con la parentesi di Lie banale), ma non sono evidentemente isomorfi.6
5Si ha infatti per definizione
φ∗ X(g) = (Lφ(g) )∗ Y (eH ) = Y (φ(g)) .
6In realtà si dimostra che due gruppi di Lie connessi e semplicemente connessi le cui algebre di Lie sono
isomorfe sono essi stessi isomorfi (Warner, op. cit.).
I.8
Proposizione 3.9. Sia φ : G → H un omomorfismo di gruppi di Lie. Il seguente diagramma
è commutativo
φ
G −−−−→
x

exp
H
x
exp

φ∗
g −−−−→ h
Dimostrazione. Sia X ∈ g, e siano {ψt }, {χt } i flussi di X e φ∗ X. Dal Lemma 3.1 sappiamo
che χt ◦ φ = φ ◦ ψt . Inoltre per la Proposizione 3.8 per ogni h ∈ H abbiamo
φ ◦ ψt (h) = φ(h exp tX) = φ(h)φ(exp tX)
χt ◦ φ(h) = φ(h) exp(tφ∗ (X))
da cui la tesi.
Proposizione 3.10. Sia G un gruppo di Lie. Esiste un intorno aperto U di 0 in g tale che
exp stabilisce un diffeomorfismo di U con un intorno aperto di e ∈ G.
Dimostrazione. Essendo exp(0) = e, ed identificando7 lo spazio tangente T0 g con g, in base
al teorema della funzione inversa8 è sufficiente mostrare che il differenziale (exp∗ )0 : g → Te G
è un isomorfismo. Dalla definizione di differenziale si ha
d X
d
=
= X(e) ;
exp(tX)
γ (t)
(exp∗ )0 (X) =
dt
dt
t=0
t=0
pertanto, identificando g con Te G, l’applicazione (exp∗ )0 è l’identità.
Corollario 3.11. Se G è un sottogruppo di un gruppo di Lie H, il differenziale dell’applicazione di inclusione ι : G → H induce un omomorfismo iniettivo di algebre di Lie ι∗ : g →
h.
Dimostrazione. Sia U l’intorno aperto di 0 ∈ g di cui alla Proposizione 3.10. Per ogni X ∈ g
esiste un numero reale non nullo α tale che αX ∈ U . Se ι∗ (X) = 0 allora ι∗ (αX) = 0. La
Proposizione 3.9 e il fatto che ι sia iniettivo implicano la tesi.
Esercizio 3.12. Siano X, Y campi vettoriali su una varietà differenziabile V , e siano {ψt },
{χs } i corrispondenti flussi. Dimostrare che [X, Y ] = 0 se e solo se χs ◦ ψt = ψt ◦ χs .
Esempio 3.13. Sia G un gruppo di Lie abeliano, ovvero, gh = hg per ogni g, h ∈ G. Allora
l’algebra di Lie g è abeliana, [X, Y ] = 0 per ogni X, Y ∈ g. Infatti, essendo g exp(tX) exp(sY )
= g exp(sY ) exp(tX), detti {ψt } e {χs } i flussi di X ed Y rispettivamente, si ha ψt ◦χs = χs ◦ψt .
Ma allora [X, Y ] = 0.
7Per ogni spazio vettoriale E vi è una identificazione canonica E →
∼ T0 E data da u 7→ [tu].
8cfr. Boothby, op. cit.
I.9
4. Il gruppo generale lineare
Abbiamo già visto che Gl(n, R) è un gruppo di Lie. Identifichiamo adesso la sua algebra di
Lie. Ricordiamo che se A ∈ gl(n, R), allora
det(I + tA) = 1 + t tr A + O(t2 ) .
Se B ∈ Gl(n, R), A ∈ gl(n, R) e t è un numero reale sufficientemente piccolo, allora B + tA ∈
Gl(n, R); infatti
(3)
det(B + t A) = det B det(I + t B −1 A) = det B 1 + t tr(B −1 A) + O(t2 ) ;
essendo det B 6= 0, se t è sufficientemente piccolo, allora det(B + tA) 6= 0. Pertanto lo spazio
tangente TB Gl(n, R) si identifica con lo spazio vettoriale gl(n, R).
Fissiamo in particolare B = I. Se {xi j } è il sistema di coordinate “tautologico” preceden∼ TI Gl(n, R) è data da
temente introdotto, l’identificazione gl(n, R) →
A 7→ A
i
j
∂
∂xi j
!
.
I
Se A ∈ gl(n, R), sia XA il campo vettoriale invariante a sinistra ad esso associato. Essendo
LB (B 0 ) = BB 0 si ha (cf. Esercizio 1.5)
"
XA (B) = (LB )∗ Ai j
∂
∂xi j
! #
= (BA)
I
i
j
∂
∂xi j
!
.
B
Prendendo il commutatore di due campi
vettoriali invarianti a sinistra in un punto B ∈
Gl(n, R) si ottiene (ricordando che
∂
∂xi j
B kh = δik δhj )
B
"
#
k
0 )k
∂(BA
∂(BA)
∂
i
0 i
h
h
[XA , XA0 ]B = (BA) j
− (BA ) j
∂xi j
∂xi j
∂xkh B
h
i ∂ j
k
m 0j
k
0m
= B mA j A h − B mA hA j
∂xkh B
∂
j
m
= B km [Amj A0 h − A0 j Ajh ]
= X[A,A0 ] (B) .
∂xkh B
Da ciò si deduce che anche come algebra di Lie l’algebra di Lie di Gl(n, R) è isomorfa a
gl(n, R). Nello stesso modo l’algebra di Lie di Gl(n, C) si può identificare con gl(n, C).
L’applicazione esponenziale di Gl(n, R). Nelle solite coordinate l’equazione differenziale
soddisfatta dalle curve integrali γ XA di un campo vettoriale invariante a sinistra XA (dove
A ∈ gl(n, R)) si scrive
d
B(t) = B(t) A .
dt
I.10
Questa ha soluzione B(t) = eAt , essendo l’esponenziale di matrici definito da9
(4)
A
e =
∞
X
Ak
k=0
k!
.
(Si noti che correttamente B(0) = I.) Per unicità del flusso locale, l’applicazione A 7→ eA
non è altro che la rappresentazione in coordinate dell’applicazione exp : gl(n, R) → Gl(n, R).
Una manipolazione formale della (4) permette di dimostrare il seguente risultato.
Proposizione 4.1. Se A, B ∈ gl(n, R) commutano, vale eA eB = eA+B .
Proposizione 4.2. Se A ∈ gl(n, R), vale det eA = etr A .
Dimostrazione. È sufficiente mostrare il risultato nel caso dell’applicazione esponenziale exp :
gl(n, C) → Gl(n, C), che nelle ovvie coordinate ammette anch’essa la rappresentazione (4). In
questo caso possiamo usare il fatto che l’insieme ∆n ⊂ gl(n, C) delle matrici diagonalizzabili
è denso in gl(n, C). Basta allora dimostrare la formula per A ∈ ∆n . D’altra parte se Q ∈
−1
Gl(n, C) si ha QeA Q−1 = eQAQ , e possiamo assumere che A sia diagonale. In questo caso
la formula è evidente.10
La precedente Proposizione mostra che exp : gl(n, R) → Gl(n, R) prende valori in Gl+ (n, R),
il sottogruppo di Gl(n, R) formato dalle matrici aventi determinante positivo (vedremo infatti più avanti che GL+ (n, R) è la componente connessa di Gl(n, R) che contiene l’identità.
Essendo exp continua, ed exp(0) = I, è ovvio che exp prenda valori in GL+ (n, R)).
Sia S(n) lo spazio vettoriale delle matrici n × n reali simmetriche, e S + (n) il sottoinsieme
delle matrici simmetriche definite positive. S + (n) è aperto in S(n), e pertanto ha una struttura di varietà differenziabile. La matrice identità In sta in S + (n), e si ha un’identificazione
TIn S + (n) ' S(n).
Proposizione 4.3. La restrizione di exp : gl(n, R) → Gl(n, R) a S(n) stabilisce un diffeomorfismo exp : S(n) → S + (n).
Dimostrazione. Nuovamente con un argomento di diagonalizzazione ci si può ridurre a dimostrare i seguenti fatti: (i) Se exp(A) = exp(B) è una matrice diagonale, allora A = B; (ii)
se B è una matrice diagonale definita positiva, allora esiste una matrice diagonale A tale che
B = exp(A). Entrame le affermazioni si provano applicando la funzione log.
Una parentesi: summersioni e sottovarietà regolarmente immerse. Data una sottovarietà
V di una varietà differenziabile W , l’insieme V ha a priori due distinte topologie: una come
varietà differenziabile, ed una come sottoinsieme di W (la cosiddetta topologia relativa, i
cui aperti sono le intersezioni di V con gli aperti di W ). In generale le due topologie sono
i
9Nell’algebra gl(n, R) possiamo mettere la norma kAk = P
i,j=1,...,n |A j |. Si vede allora che la serie nel
membro di destra della seguente formula è assolutamente convergente, e definisce un’applicazione C ∞ da
gl(n, R) in gl(n, R).
10Si può dimostrare lo stesso risultato mediante la Proposizione 3.9, prendendo G = Gl(n, R), H = R∗ ,
φ = det (e quindi φ∗ = tr).
I.11
diverse. Si consideri per esempio la realizzazione di R+ (numeri reali strettamente positivi)
come sottovarietà di R2 data dalla curva ottenuta raccordando le prescrizioni
(
x(t) = t, y(t) = sin 1t
se t ∈ (0, 1]
x(t) = 0, y(t) = 3 − t
se t ∈ [2, +∞)
con una qualunque prescrizione per t ∈ [1, 2] che produca una immersione C ∞ . Un intervallo
della curva dato da t1 < 3 < t2 è aperto nell’usuale topologia di R+ mentre non è aperto nella
topologia relativa di R+ come sottoinsieme di R2 , in quanto ogni suo intorno in R2 contiene
anche un altro tratto di curva.
Definizione 4.4. Una sottovarietà regolarmente immersa è una sottovarietà tale che la sua
topologia come varietà differenziabile e la topologia relativa coincidono.
Per esempio una sfera in Rn è una sottovarietà regolarmente immersa.
Un utile criterio per decidere se una sottovarietà è regolarmente immersa è dato dalla
nozione di summersione.
Definizione 4.5. Sia f : V → W un’applicazione differenziabile fra varietà differenziabili.
Diciamo che f è una summersione se f è surgettiva e il differenziale f∗ : Tx V → Tf (x) W è
surgettivo per ogni x ∈ V .
In tale situazione, dato y ∈ W , definiamo Sy = f −1 (y). Vale il seguente risultato, che non
proviamo (per una dimostrazione si veda Warner, op. cit. o Boothby, op. cit.).
Proposizione 4.6. Sy è una sottovarietà regolarmente immersa di V . Inoltre, Tx Sy =
ker(f∗ )x per ogni x ∈ Sy .
(Si noti che f manda tutta la varietà Sy nel punto y, per cui ogni curva in Sy viene mandata
in una curva costante in W , il che implica l’isomorfismo Tx Sy = ker(f∗ )x ).
Il gruppo speciale lineare. Ricordiamo che il gruppo speciale lineare di ordine n, denotato
Sl(n, R), è il sottogruppo di Gl(n, R) formato da matrici avente determinante pari a uno.
Lemma 4.7. L’applicazione
F : Gl(n, R) → R∗
A 7→ det A
è una summersione. Inoltre, (FB )∗ (A) = (det B) tr(B −1 A).
Dimostrazione. F è evidentemente C ∞ e surgettiva. Calcoliamo il suo differenziale: usando
l’equazione (3) si ha
d
(F∗ )B (A) =
det (B + t A)
dt
t=0
d
−1
= det B
det (I + t B A)
= det B tr(B −1 A) .
dt
t=0
α
(F∗ )B è surgettivo per ogni B, come segue dall’identità (F∗ )B n det
B
= α valida per ogni
B
α ∈ R. Quindi F è una summersione.
I.12
Di conseguenza, Sl(n, R) = F −1 (1) è una sottovarietà regolarmente immersa di Gl(n, R),
ed è un gruppo di Lie di dimensione n2 − 1. Il suo spazio tangente nell’identità (e quindi la
sua algebra di Lie sl(n, R)) si identifica con lo spazio delle matrici reali n × n a traccia nulla,
ker(F∗ )I = {A ∈ gl(n, R) | tr A = 0}.
Si noti che, coerentemente con la Proposizione 4.2, si ha exp tA ∈ Sl(n, R) per ogni t ∈ R se
e solo se tr A = 0.
I gruppi ortogonali. Il gruppo ortogonale di ordine n, denotato O(n, R), è il sottogruppo di
Gl(n, R) le cui matrici R verificano la condizione RR̃ = I, essendo R̃ la matrice trasposta di
R. Ricordiamo che S + (n) denota l’insieme delle matrici n × n simmetriche definite positive.
Lemma 4.8. L’applicazione
F : Gl(n, R) → S + (n)
A 7→ AÃ
è una summersione.
Dimostrazione. Dimostriamo che F è surgettiva. Sia B ∈ S + (n). Essendo B simmetrica esiste
una matrice ortogonale Q tale che QB Q̃ sia diagonale, QB Q̃ = diag(λ1√
, . . . , λn ). Essendo
√
√
B √
definita positiva i λi sono positivi. Posto C = diag( λ1 , . . . , λn ) e B = Q̃CQ, si ha
F ( B) = B. Calcoliamo l’applicazione (FB )∗ : gl(n, R) → S(n):
d
(FB )∗ (A) =
(B + t A)(B̃ + t Ã)
= B Ã + AB̃ .
dt
t=0
(FB )∗ è surgettivo: se C ∈ S(n) allora (FB )∗ ( 12 C B̃ −1 ) = C.
Quindi O(n, R) = F −1 (I) è una sottovarietà regolarmente immersa di Gl(n, R) di dimensione dim O(n, R) = dim Gl(n, R) − dim S(n) = n2 − 21 n(n + 1) = 12 n(n − 1), ed è un gruppo di
Lie. Poiché (FI )∗ (B) = 0 se e solo se B + B̃ = 0, l’algebra di Lie di O(n, R) è l’algebra o(n, R)
delle matrici n × n reali antisimmetriche. Essendo det O(n, R) = {±1}, O(n, R) è sconnesso.
Proposizione 4.9. O(n, R) è compatto.
Dimostrazione. Poiché ogni matrice ortogonale è invertibile, O(n, R) è anche l’immagine
inversa di I rispetto all’applicazione
gl(n, R) → S + (n),
A 7→ AÃ;
2
pertanto O(n, R) è chiuso in gl(n, R) ' Rn . La condizione RR̃ = I implica
X
(Ri j )2 = n .
i,j=1,...,n
2
Cosı̀ O(n, R) è un sottoinsieme chiuso e limitato di Rn , ed è compatto nella sua topologia relativa come sottoinsieme di gl(n, R). Essendo Gl(n, R) aperto in gl(n, R), O(n, R) è
una sottovarietà regolarmente immersa di gl(n, R), ed è quindi compatto nella sua topologia
originaria.
I.13
Definiamo il gruppo speciale ortogonale di ordine n come
SO(n, R) = {R ∈ O(n, R) | det R = 1}.
Sia det : O(n, R) → {±1} la restrizione dell’applicazione determinante a O(n, R). Gli insiemi
SO(n, R) = det−1 (1) e O(n, R)\SO(n, R) = det−1 (−1) sono entrambi chiusi, quindi SO(n, R) è
aperto e chiuso in O(n, R), ed è allora formato dall’unione di componenti connesse di O(n, R);
in particolare, essendo un aperto, è un gruppo di Lie; essendo chiuso, è compatto. Sia P
la matrice P = diag(−1, 1, . . . , 1). La moltiplicazione per P definisce un omeomorfismo
SO(n, R) → O(n, R) \ SO(n, R).
Proposizione 4.10. SO(n, R) è connesso.
Dimostrazione. Una possibile dimostrazione consiste nel considerare l’immersione ι : SO(n, R)
→ SO(n + 1, R) data da
1 0
R 7→
.
0 R
Questa permette di definire il quoziente SO(n + 1, R)/ SO(n, R) come l’insieme delle classi di
equivalenza della relazione in SO(n + 1, R)
S1 ∼ S2
se
S1 = S2 ι(R)
per un R ∈ SO(n, R) .
Nel prossimo Lemma viene mostrato che il quoziente, con la topologia quoziente, è omeomorfo
alla sfera S n ,
(5)
SO(n + 1, R)/ SO(n, R) ' S n .
Ciò permette di dimostrare la tesi per induzione: SO(1, R) = {1} è connesso, e dalla (5),
essendo S n connesso, segue che se SO(n, R) è connesso, anche SO(n + 1, R) lo è.
In generale, dato un gruppo di Lie G ed un suo sottogruppo H, possiamo considerare in
G la relazione di equivalenza g1 ∼ g2 se g1 = g2 h con h ∈ H; denotiamo G/H il quoziente.
Ogni elemento di G/H rappresenta un sottoinsieme di G, la sua classe di equivalenza. Tale
sottoinsieme è detto un laterale (sinistro). Il laterale sinistro che contiene g ∈ G è usualmente
denotato gH.
Lemma 4.11. SO(n + 1, R)/ SO(n, R) ' S n .
Dimostrazione. Scriviamo un elemento di SO(n + 1, R) come
a x̃
M=
y R
dove a è un numero reale, x, y sono vettori colonna con n elementi, e R è una matrice n × n.
La condizione M̃ M = I si scrive11
(6)
a2 + ỹy = 1,
ax + R̃y = 0,
R̃R + xx̃ = I .
11Si noti che il prodotto di un vettore riga per un vettore colonna è un numero reale, mentre il prodotto di
un vettore colonna per un vettore riga è una matrice quadrata.
I.14
Inoltre M ι(S) si scrive
a x̃
1 0
a x̃S
M ι(S) =
=
.
y R
0 S
y RS
Due elementi M1 , M2 ∈ SO(n + 1, R) sono in relazione se
(7)
a1 = a2 ,
y1 = y2 ,
x̃1 S = x̃2 ,
R1 S = R2 .
Il quoziente SO(n + 1, R)/ SO(n, R) è parametrizzato dalle quantità a, y, soggette al vincolo
espresso dalla prima delle relazioni (6): infatti, due elementi M1 , M2 ∈ SO(n + 1, R) tali
che a1 6= a2 o y1 6= y2 corrispondono a diversi elementi del quoziente, mentre se a1 = a2
e y1 = y2 allora M1 ∼ M2 con S = R1−1 R2 (si noti che la terza delle (7) segue dalle (6)).
Insiemisticamente il quoziente è isomorfo alla sfera S n .
Fissiamo in S n la sua topologia usuale. Essendo SO(n+1, R) una sottovarietà regolarmente
immersa di gl(n + 1, R), la sua topologia ammette una base formata dalle intersezioni di
SO(n + 1, R) con gli aperti del tipo aij < Mij < bij , essendo Mij gli elementi di matrice di un
elemento M ∈ SO(n + 1, R), e aij , bij numeri reali. Tali aperti vengono proiettati su aperti di
S n , e di conseguenza la proiezione SO(n + 1, R) → S n è aperta. Per noti risultati di topologia
generale12 ciò implica che la topologia di S n coincida con la topologia quoziente.
Corollario 4.12. O(n, R) è formato da due componenti connesse.
L’algebra di Lie di SO(n, R) è una sottoalgebra di o(n, R), ma ha la stessa dimensione,
quindi coincide con o(n, R). Abbiamo un altro esempio di due gruppi di Lie non isomorfi
aventi algebre di Lie isomorfe. Più generalmente, quando G è un gruppo di Lie non connesso,
con algebra di Lie g, la componente connessa G0 di G che contiene l’identità è un gruppo
di Lie, la cui algebra di Lie è isomorfa a g. Ovviamente l’applicazione esponenziale prende
valori in G0 .
Esercizio 4.13. Sia J la matrice reale 2n × 2n avente la struttura a blocchi n × n
0 I
J=
.
−I 0
Dimostrare che
Sp(2n, R) = {B ∈ gl(2n, R) | B̃JB = J}
è un sottogruppo di Lie di Gl(2n, R) di dimensione 2n2 + n. Esso è detto gruppo simplettico
di ordine n. La sua algebra di Lie è
sp(2n, R) = {A ∈ gl(2n, R) | ÃJ + JA = 0} .
(Cenno: in questo caso si può usare la mappa F : Gl(2n, R) → o(2n, R), B 7→ B̃JB. In
particolare il differenziale (FB )∗ (A) = ÃJB + B̃JA è surgettivo, essendo F∗ (− 12 J B̃ −1 C) =
C.)
Ulteriori proprietà di connessione. Il gruppo Gl(n, R) ed il suo sottogruppo GL+ (n, R)
hanno le stesse proprietà di connessione di O(n, R) ed SO(n, R), ovvero, GL+ (n, R) è connesso,
mentre Gl(n, R) ha due componenti connesse. Queste proprietà si dimostrano mediante la
cosiddetta decomposizione polare (o di Cauchy) delle matrici invertibili.
12Cfr. J. Kelley, General Topology, p. 95.
I.15
Proposizione 4.14. Ogni matrice B ∈ Gl(n, R) si scrive in maniera unica nella forma
B = SR, dove R ∈ O(n, R), e S ∈ S + (n).
Dimostrazione. La matrice B B̃ è simmetrica definita positiva; esiste allora Q ∈ O(n, R) tale
che
QB B̃ Q̃ = diag(λ1 , . . . , λn )
con tutti i λi positivi. Sia
Λ = diag(
p
p
λ1 , . . . , λn ) .
La matrice S = Q̃ΛQ è simmetrica definita positiva. Posto R = S −1 B si ha
R̃R = B̃S −2 B = B̃ Q̃QB̃ −1 B −1 Q̃QB = I .
Ciò mostra l’esistenza della decomposizione. Per dimostrare l’unicità, si supponga che sia
anche B = S 0 R0 . Ciò implica S 2 = S 02 , ed essendo S, S 0 simmetriche definite positive, si ha
S = S 0 , da cui anche R = R0 .
Abbiamo pertanto l’isomorfismo Gl(n, R)/ O(n, R) ' S + (n). Se B = SR con B ∈ GL+ (n, R)
allora det R = 1, per cui si ha un isomorfismo GL+ (n, R)/ SO(n, R) ' S + (n). Quest’ultimo mostra che GL+ (n, R) è connesso. Nuovamente, la moltiplicazione per la matrice
P = diag(−1, 1, . . . , 1) stabilisce un omeomorfismo fra GL+ (n, R) e Gl(n, R) \ GL+ (n, R),
e quindi Gl(n, R) ha due componenti connesse.
Gruppi di matrici a coefficienti complessi. In aggiunta a Gl(n, C), il gruppo delle matrici
complesse n × n invertibili, possiamo considerare svariati altri gruppi di matrici complesse:
Sl(n, C), gruppo delle matrici complesse n×n di determinante uno, di dimensione 2(n2 −1),
con algebra sl(n, C) (matrici complesse n × n a traccia nulla);
O(n, C), gruppo delle matrici complesse n × n ortogonali; ha dimensione n(n − 1), è compatto, e la sua algebra di Lie o(n, C) è formata dalle matrici n × n a coefficienti complessi
antisimmetriche.
U(n) = {U ∈ gl(n, C) | U U † = I}, essendo † l’operazione di aggiunzione; ha dimensione n2 ,
è compatto, e ha algebra di Lie u(n) (matrici n × n complesse A anti-hermitiane, ovvero tali
che A + A† = 0);
SU(n) = {U ∈ U(n) | det U = 1}; ha dimensione n2 − 1, è compatto, e ha algebra di Lie
su(n) (matrici n × n complesse anti-hermitiane a traccia nulla).
Esercizio 4.15. Mostrare che SO(2, R) ' U(1) ' S 1 .
Esempio 4.16. Vogliamo studiare in qualche dettaglio il gruppo SU(2). Poiché le matrici U
in SU(2) sono tutte e sole le matrici complesse 2 × 2 tali che U −1 = U † e det U = 1, si ha la
rappresentazione
a b
(8)
SU(2) ≡ {
| a, b ∈ C, |a|2 + |b|2 = 1}.
−b̄ ā
Pertanto SU(2) è diffeomorfo alla sfera S 3 , ed è connesso, semplicemente connesso e compatto.
Analogamente, essendo l’algebra di Lie su(2) formata dalla matrici anti-hermitiane a traccia
I.16
nulla, si ha la rappresentazione
(9)
su(2) ≡ {
ix1
x2 + ix3
−x2 + ix3
−ix1
Quindi su(2) ha una base formata dalle tre matrici
0 i
0 1
σ1 =
σ2 =
i 0
−1 0
| x1 , x2 , x3 ∈ R}.
σ3 =
i 0
.
0 −i
Queste sono dette matrici di Pauli e svolgono un ruolo fondamentale nel formalismo della
meccanica quantistica.13
Il gruppo SU(2) agisce sullo spazio dei polinomi omogenei di grado due in due variabili a
coefficienti complessi,
P2 = {c0 u2 + c1 uv + c2 v 2 , c0 , c1 , c2 ∈ C} .
u
u
L’azione è data da
→ A
. Un semplice calcolo mostra che quest’azione lascia
v
v
invariante il discriminante dei polinomi, c21 − 4c0 c2 . Se introduciamo nuove variabili
x = −c0 + c2 ,
y = −i(c0 + c2 ),
c0 = − 21 (x − iy),
c1 = z,
z = c1 ,
c2 = 12 (x + iy),
il discriminante si scrive x2 +y 2 +z 2 . Quindi quest’azione di SU(2) preserva la forma quadratica
x2 + y 2 + z 2 ; scrivendo esplicitamente la matrice che rappresenta l’azione di SU(2) sulla terna
x, y, z, si vede che tutti gli elementi di matrice sono reali, ovvero, abbiamo costruito un’applicazione φ : SU(2) → O(3, R). L’applicazione φ è continua (essendo data da polinomi
quadratici negli elementi di matrice di A), ed essendo SU(2) connesso, φ deve avere valori
nella componente connessa con l’identità, ovvero nel gruppo SO(3, R).
L’applicazione φ : SU(2) → SO(3, R) è per costruzione un omomorfismo di gruppi. Mostriamo che questo è surgettivo. Consideriamo le matrici di SU(2), dipendenti da un parametro,


−iγ/2
cos β2 − sin β2
e
0


B(β) = 
,
C(γ)
=
.

0
eiγ/2
β
β
cos 2
sin 2
Le corrispondenti rotazioni di R3 sono
(10)
(11)
φ(B(β)) =


x0

y0


z 0

0


x
φ(C(γ)) = y 0


z 0
= x cos β + z sin β
=y
= −x sin β + z cos β
= x cos γ − y sin γ
= x sin γ + y cos γ
=z
13In realtà, secondo le convenzioni abituali, si dicono matrici di Pauli le matrici iσ .
k
I.17
Queste sono rotazioni rispetto all’asse y e all’asse z di angoli β e γ, rispettivamente. Poiché
ogni rotazione si può ottenere come composizione di tre rotazioni di tale tipo (teorema di
Eulero),14 φ è surgettivo.
Caratterizziamo il nucleo di φ (ovvero il sottogruppo normale φ−1 (I) di SU(2)). Gli elementi A ∈ SU(2) che vi appartengono lasciano invariati i prodotti u2 , uv e v 2 . Usando la
rappresentazione (8) si ottiene A = ±I, ovvero, ker φ ' Z2 . Quindi due elementi di SU(2)
che vengono mandati nella stessa matrice di SO(3, R) differiscono per il segno.15
Determiniamo l’applicazione indotta φ∗ : su(2) → o(3, R) (che sappiamo essere a priori un
omomorfismo di algebre di Lie). Ponendo β = γ = t nelle (10) e (11) e calcolando la derivata
in t = 0 si ottiene che φ∗ (su(2)) contiene le matrici




0 0 1
0 −1 0
 0 0 0 ,
1 0 0  .
(13)
−1 0 0
0 0 0
Anche il commutatore


0 0 0
0 0 1
0 −1 0
(14)
di queste due matrici sta in φ∗ (su(2)). Poiché ogni matrice antisimmetrica 3 × 3 si scrive
come combinazione lineare delle matrici in (13) e (14), φ∗ è surgettivo, ed è pertanto un
isomorfismo. Quindi su(2) ' o(3, R); i gruppi SU(2), SO(3, R) e O(3, R) non sono isomorfi,
ma hanno algebre di Lie isomorfe.
5. Azione di un gruppo di Lie su una varietà
Sia G un gruppo di Lie e V una varietà differenziabile. Un’azione (sinistra) di G su V è
un’applicazione differenziabile ρ : G × V → V tale che
(i) ρ(e, x) = x per ogni x ∈ V ;
(ii) ρ(g, ρ(h, x)) = ρ(gh, x) per ogni g, h ∈ G e x ∈ V .
Posto ρ(g, x) = ρg (x), le due precedenti condizioni si scrivono ρe = idV , ρg ◦ ρh = ρgh .
Per ogni g ∈ G, ρg è un diffeomorfismo di M , avente inverso ρg−1 ; la corrispondenza g 7→
14Questo risultato si usa in Meccanica Razionale per descrivere ogni rotazione in termini dei tre angoli di
Eulero.
15In termini formali, abbiamo verificato che la sequenza
(12)
φ
1 → Z2 → SU(2) → SO(3, R) → 1
è esatta. Notiamo inoltre che A = −B se i punti corrispondenti di S 3 sono antipodali; essendo SO(3, R) '
SU(2)/{I, −I}, il gruppo SO(3, R) è diffeomorfo allo spazio proiettivo P3 (R). Essendo SU(2) semplicemente
connesso, la (12) mostra anche che il gruppo fondamentale π1 (SO(3, R)) di SO(3, R) è Z2 , cosicché SO(3, R)
non è semplicemente connesso. Si noti che essendo
1
HDR
(SO(3, R)) ' π1 (SO(3, R)) ⊗Z R ' Z2 ⊗Z R = 0
il gruppo SO(3, R) fornisce un esempio di varietà differenziabile non semplicemente connessa il cui primo
gruppo di coomologia di de Rham è nullo.
I.18
ρg stabilisce un omomorfismo di gruppi G → Diff(V ), essendo quest’ultimo il gruppo dei
diffeomorfismi di V .
Analogamente si definisce la nozione di azione destra, chiedendo che ρg ◦ ρh = ρhg .
Esempi.
(i) Le traslazioni a sinistra (destra) definiscono un’azione sinistra (destra) di G su se stesso.
(ii) Se X è un campo vettoriale completo su V , il suo flusso definisce un’azione di R su V ,
che è sia destra che sinistra perché R è abeliano. In particolare, dato un gruppo di Lie G, e
fissato X ∈ g, la corrispondenza t 7→ exp(tX) è un’azione di R su G.
(iii) Gl(n, R) ed ogni suo sottogruppo agiscono nel modo ovvio su Rn . Se si rappresentano
i vettori di Rn come vettori colonna (riga), si ha un’azione sinistra (destra).
Definizione 5.1. Un’azione ρ di G su V si dice
(i) transitiva se per ogni x, y ∈ V esiste g ∈ G tale che x = ρg (y);
(ii) effettiva se ρg = idV implica g = e (ovvero, g 7→ ρg è iniettiva);
(iii) libera se per ogni g 6= e, ρg non ha punti fissi (ovvero ρg (x) 6= x per ogni x ∈ V , o
equivalentemente, g 7→ ρg (x) è iniettiva per ogni x ∈ V ).
Si noti che ogni azione libera è effettiva.
Esempi.
(i) Le traslazioni sinistre (o destre) su un gruppo di Lie sono azioni transitive e libere.
(ii) L’azione di R su S 1 data da (t, eiθ ) 7→ ei(t+θ) è transitiva ma non effettiva.
(iii) L’azione naturale di Gl(n, R) su Rn è effettiva, ma non libera né transitiva.
(iv) L’azione naturale di Gl(n, R) su Rn − {0} è effettiva, libera e transitiva.
(v) L’azione naturale di O(n, R) su Rn − {0} è effettiva e libera ma non transitiva.
Definizione 5.2. Sia ρ un’azione sinistra di G su uno spazio vettoriale E. Se per ogni g ∈ G
ρg : E → E è un’applicazione lineare, si dice che ρ è una rappresentazione di G su E. Quindi,
una rappresentazione di G su E è un omomorfismo G → Aut(E), essendo Aut(E) il gruppo
degli automorfismi di E (applicazioni lineari E → E invertibili).
Esempi.
(i) G = Gl(n, R) (o un suo sottogruppo), E = R, ρM = det M .
(ii) Ogni omomorfismo di gruppi di Lie G → Gl(n, R) è una rappresentazione di G su Rn .
(L’esempio precedente è un caso particolare, con Gl(1, R) ' R∗ ).
(iii) In particolare, l’omomorfismo φ dell’Esempio 4.16 definisce una rappresentazione di
SU(2) su R3 .
Se ρ è un’azione di G su V , e fissiamo un punto x ∈ V , l’insieme Ox = {ρg (x), g ∈ G} è
detto orbita di G per x. Si può dimostrare che ogni orbita Ox è una sottovarietà di V .
Esercizio 5.3. In generale, Ox non è una sottovarietà regolarmente immersa di V : si discuta
per esempio il caso G = R, V = T 2 , e l’azione è data da un “flusso irrazionale” su T 2
(cfr. Esempio 3.3).
I.19
Lo spazio delle orbite è l’insieme quoziente di V rispetto alla relazione di equivalenza
x∼y
se esiste g ∈ G
tale che x = ρg (y) .
Se l’azione ρ è stata fissata, lo spazio delle orbite viene denotato V /G, e denominato quoziente
di V per l’azione di G. In generale V /G non è una varietà (si consideri per esempio l’azione
naturale di SO(2, R) su R2 ). In certi casi d’altra parte ciò avviene, come vediamo nella
seguente Proposizione, che riportiamo senza dimostrazione.
Definizione 5.4. Un’azione ρ di G su V si dice propria se, definita l’applicazione
ρ̃ : G × V → V × V,
(g, x) 7→ (ρg (x), x),
questa è propria in senso topologico, ovvero, ρ̃−1 (K) è compatto per ogni compatto K ⊂
V ×V.
Si verifica facilmente che ogni azione di un gruppo compatto è propria.
Proposizione 5.5. Se il gruppo G agisce su V in maniera propria e libera, il quoziente V /G
ammette una struttura di varietà differenziabile, in modo che
1. V /G è dotato della topologia quoziente;
2. la proiezione V → V /G è differenziabile.
Otteniamo in questo modo un gran numero di esempi di quozienti V /G che sono varietà
differenziabili: è sufficiente prendere per V un gruppo di Lie H, e G come un suo sottogruppo
compatto.
Il gruppo di isotropia Gx di un punto x ∈ V è definito come Gx = {g ∈ G |ρg (x) = x}.
L’insieme Gx è un sottogruppo di Lie di G ed è chiuso in G: infatti Gx = ψx−1 (x), essendo
ψx : G → V l’applicazione ψx (g) = ρg (x). Il gruppo Gx è una sottovarietà regolarmente
immersa di G. Non proveremo quest’ultima affermazione (in realtà si può provare che un
sottogruppo H di un gruppo di Lie G è chiuso in G se e solo se è regolarmente immerso;
cf. Warner, op. cit.).
Esercizio 5.6. Stabilire un isomorfismo di insiemi fra Ox e il quoziente G/Gx (quest’ultimo
quoziente è fatto rispetto all’azione naturale di Gx su G come suo sottogruppo).
Generatori di un’azione. Sia G un gruppo di Lie che agisce su una varietà V . Fissato
X ∈ g, per ogni x ∈ V consideriamo la curva
γ X (t) = ρexp tX (x) = ρ(exp tX, x) .
Al variare di x in V il vettore tangente alla corrispondente famiglia di curve,
d
∗
ρ(exp tX, x)
,
X (x) =
dt
t=0
dipende differenziabilmente da x, e definisce un campo vettoriale su V , usualmente denominato campo fondamentale di X. Il vettore X ∗ (x) è tangente all’orbita Ox di G per
x.
Esempi.
I.20
(i) Consideriamo l’azione sinistra di un gruppo su se stesso. Vale allora
d
d
∗
(Rg )∗ (X (h)) = (Rg )∗
Lexp tX (h)
Lexp tX (hg)
=
= X ∗ (hg) ,
dt
dt
t=0
t=0
ovvero, i campi fondamentali dell’azione sinistra sono i campi vettoriali invarianti a destra (e
viceversa).
(ii) I campi fondamentali dell’azione di Gl(n, R) su Rn sono
A∗ (x) = Ai k xk
∂
.
∂xi
(iii) Se X è un campo vettoriale completo su V , i campi fondamentali associati all’azione
del flusso di X su V sono tutti multipli di X.
(iv) Sia ρ l’azione di R su Rn data da ρt (x) = et x. Dato T ∈ R (visto come algebra di Lie)
si ha
∂
T ∗ (x) = T xi i .
∂x
Fissata una base {Xi } di g, i corrispondenti campi vettoriali fondamentali Xi∗ su V sono
detti generatori dell’azione.
Esercizio 5.7. Calcolare i generatori delle azioni dei precedenti esempi.
Esercizio 5.8. Il gruppo U(n + 1) agisce (transitivamente) sullo spazio proiettivo complesso
Pn .16 Calcolare i campi fondamentali e i generatori di questa azione.
6. Rappresentazione aggiunta
Ad ogni gruppo di Lie G si può associare una sua rappresentazione sulla sua algebra g, detta
rappresentazione aggiunta. In certe situazioni il corrispondente omomorfismo G → Aut(g) è
iniettivo, e ciò permette di rappresentare il gruppo G — che a priori è un gruppo astratto —
mediante un gruppo di matrici (ovviamente, fissata una base di g, si ha Aut(g) ' Gl(n, R),
essendo n = dim G). Mediante la rappresentazione aggiunta si possono inoltre provare vari
risultati circa la relazione fra un gruppo di Lie e la sua algebra.
Per costruire questa rappresentazione useremo il seguente risultato. Sia x un punto fisso
di un’azione ρ di un gruppo di Lie G su una varietà V . Per ogni g ∈ G il differenziale
(ρg )∗ : Tx V → Tx V è un automorfismo di Tx V (infatti ammette inverso (ρg−1 )∗ ). Si ha cosı̀
un’applicazione ψx : G → Aut(Tx V ), data da ψx (g)(X) = (ρg )∗ (X) per ogni X ∈ Tx V .
Proposizione 6.1. L’applicazione ψx è una rappresentazione.
16Ricordiamo che lo spazio proiettivo complesso n-dimensionale Pn è lo spazio delle rette per l’origine di
n+1
C
, ovvero, è il quoziente di Cn+1 −{0} rispetto alla relazione di equivalenza secondo la quale z1 ∼ z2 se z1 =
λz2 per un numero complesso λ. Lo spazio Pn si può anche descrivere come il quoziente U(n + 1)/ U(1) × U(n).
I.21
Dimostrazione. ψx è evidentemente un omomorfismo di gruppi:
ψx (gh)(X) = (ρgh )∗ (X) = (ρg )∗ (ρh )∗ (X) = ψx (g)ψx (h)(X) .
Rimane solo da mostrare che ψx è differenziabile. Ciò equivale a mostrare che per ogni
X ∈ Tx V la quantità (ρg )∗ (X) dipende differenziabilmente da g. Questo segue dalla relazione
d
(ρg )∗ (X) =
ρ(g, γ(t))
dt
t=0
essendo γ una curva per x ∈ V che è tangente a X.
Definita l’azione di G su se stesso
a : G × G → G,
a(g, h) = ghg −1 ,
l’identità e ∈ G è un punto fisso di questa azione. Identificando Te G con g si ha una rappresentazione Ad : G → Aut(g). Lo spazio Aut(g) è esso stesso un gruppo di Lie, isomorfo a
Gl(n, R) se n = dim G, e la sua algebra di Lie si può identificare con End(g), lo spazio di tutte
le applicazioni lineari g → g; quest’ultimo spazio è un’algebra di Lie con la parentesi data
dal commutatore, [A, B] = AB − BA, ed è isomorfo come algebra di Lie a gl(n, R). Pertanto
differenziando la mappa Ad si ottiene un omomorfismo di algebre di Lie ad : g → End(g), e
si ha un diagramma commutativo (cf. la Proposizione 3.9)
Ad
(15)
G −−−−→ Aut(g)
x
x

exp
exp

ad
g −−−−→ End(g)
Useremo una notazione abbreviata secondo la quale
Ad(g)(X) = Adg X,
ad(X)(Y ) = adX Y .
Applicando la Proposizione 3.9 all’omomorfismo ag : G → G, ag (h) = ghg −1 si ottiene anche
un diagramma
ag
(16)
G −−−−→
x

exp
G
x
exp

Adg
g −−−−→ g
Proposizione 6.2. Se G = Gl(n, R) si ha
AdB A = BAB −1 ,
adA A0 = [A, A0 ] = AA0 − A0 A.
Dimostrazione. Se A ∈ gl(n, R) allora A, come vettore tangente a Gl(n, R) in I, è rappresentato dalla curva I + tA. Si ha
d
−1
AdB A =
B(I + tA)B
= BAB −1 .
dt
t=0
Quindi vale anche
d
d
0
0
−1
0
adA A =
(I + tA)A (I + tA)
=
(I + tA)A (I − tA)
= AA0 − A0 A
dt
dt
t=0
t=0
essendo (I + tA)−1 = I − tA + O(t2 ) per t abbastanza piccolo.
I.22
Il secondo di questi risultati vale per un qualunque gruppo di Lie G, nel senso che per ogni
X, Y ∈ g vale adX Y = [X, Y ]. Dimostriamo questa formula. Si ha
d
d
adX Y (e) =
Adexp tX Y (e)
(R
)∗ (Lexp tX )∗ (Y (e))
=
dt
dt exp(−tX)
t=0
t=0
d
=
(R
)∗ (Y (exp tX))
= (£X Y )(e)
dt exp(−tX)
t=0
= [X, Y ](e) .
Essendo adX Y e [X, Y ] entrambi invarianti a sinistra, essi coincidono in ogni punto.17,18
Lemma 6.3. Sia G un gruppo di Lie connesso. Allora ogni intorno U di e genera G, nel
senso che
[
G=
Un
n∈N
dove U n è il sottoinsieme di G formato dai prodotti di n elementi di U .
(Ciò significa che ogni g ∈ G si scrive nella forma g = u1 · · · · · uN , con gli ui in U .)
Dimostrazione. Sia V = U ∩ U −1 ⊂ U , dove U −1 è il sottoinsieme di G formato dagli inversi
degli elementi di U . Allora V = V −1 . Si ponga
H=
[
n∈N
Vn ⊂
[
U n.
n∈N
H è aperto in G. Il laterale che contiene e ∈ G coincide con H. Ogni laterale è diffeomorfo
ad H ed è quindi aperto in G. Inoltre H è il complemento in G di tutti i laterali distinti da
H (i laterali sono tutti disgiunti). Allora H è chiuso in G. Essendo G connesso ciò significa
che H = G.
Ricordiamo che
(i) un sottogruppo H di un gruppo G è normale se ghg −1 ∈ H per ogni g ∈ G, h ∈ H.
(ii) un ideale di un’algebra è un sottospazio vettoriale che è chiuso rispetto alla moltiplicazione per ogni elemento dell’algebra. Nel caso di un’algebra di Lie a, i è un ideale di a se
[i, a] ⊂ i.
Proposizione 6.4. Sia H un sottogruppo connesso di un gruppo di Lie connesso G. Allora
H è normale se e solo se la sua algebra h è un ideale di g.
17Il simbolo £ Y denota la derivata di Lie del campo vettoriale Y rispetto al campo vettoriale X.
X
˜
18L’uguaglianza ad Y = ˆ d Ad
X
exp tX Y t=0 mostra che, per ogni X ∈ g, il corrispondente campo vettoriale
dt
fondamentale su g associato alla rappresentazione aggiunta di G su g si può identificare con adX .
I.23
Dimostrazione. Assumiamo che h sia un ideale in g. Siano Y ∈ h, X ∈ g, g = exp X. Allora19
g(exp Y )g −1 = exp Adg Y
= exp((exp adX )Y )
= exp(Y + [X, Y ] + 12 [X, [X, Y ]] + . . . )
dal diagramma (16)
dal diagramma (15)
Essendo h un ideale in g, la serie nell’ultima riga della precedente equazione converge ad un
elemento di h. Pertanto g(exp Y )g −1 ∈ H. Per il Lemma 6.3, H e G sono generati da elementi
del tipo exp Y e exp X rispettivamente, e H è normale in G.
Assumiamo ora che H sia normale in G, e siano s, t numeri reali. Siano inoltre Y ∈ h,
X ∈ g, e g = exp tX. Si ha
g(exp sY )g −1 = exp Adg (sY ) = exp s [(exp adtX )(Y )] ∈ H .
Perciò (exp adtX )(Y ) ∈ h per ogni t ∈ R. Inoltre
(exp adtX )(Y ) = (exp t adX )(Y ) = Y + t[X, Y ] + 21 t2 [X, [X, Y ]] + . . . .
Al variare di t questa è una curva in h, e, mediante l’identificazione canonica di TY h con h, il
suo vettore tangente in Y è [X, Y ]; quindi h è un ideale.
Definizione 6.5. Il centro C(G) di un gruppo G è il sottogruppo di G dato da
C(G) = {g ∈ G | gh = hg per ogni h ∈ G} .
Il centro C(g) di un’algebra di Lie g è la sottoalgebra di Lie
C(g) = {X ∈ g | [X, Y ] = 0 per ogni Y ∈ g} .
Proposizione 6.6. Sia G un gruppo di Lie connesso. Il centro di G è il nucleo della
rappresentazione aggiunta.
Dimostrazione. Sia g ∈ C(G), e X ∈ g. Allora per ogni t ∈ R
(18)
exp tX = g(exp tX)g −1 = exp(t Adg X) .
Se t è abbastanza piccolo, tX sta in un intorno di 0 ∈ g su cui exp è iniettivo, cosicché
X = Adg X, ovvero, g ∈ ker Ad.
Se g ∈ ker Ad, allora vale la (18) per ogni X ∈ g, e g commuta con ogni elemento di un
intorno di e ∈ G. Poiché G è connesso, tale intorno genera G, e pertanto g commuta con ogni
elemento di G, ovvero, g ∈ C(G).
19Nella seguente equazione si usa la forma esplicita dell’esponenziale di un endomorfismo di uno spazio
vettoriale. Se E è uno spazio vettoriale, e φ ∈ End(E), allora exp φ è definito dalla relazione
(17)
(exp φ)(u) =
∞
X
1 k
φ (u) = u + φ(u) + 12 φ2 (u) + . . .
k!
k=0
per ogni u ∈ E. Scelta una base di E, la definizione (17) si riduce alla definizione dell’esponenziale di matrice;
la serie (17) converge, e definisce l’esponenziale End(E) → Aut(E). Nel nostro caso, E = g, e φ = adX , e si ha
(exp adX )(Y ) =
∞
X
1
(adX )k (Y ) = Y + [X, Y ] + 12 [X, [X, Y ]] + . . .
k!
k=0
I.24
Corollario 6.7. Sia G un gruppo di Lie connesso. Allora il centro C(G) è un sottogruppo di
Lie chiuso di G, la cui algebra di Lie è il centro di g.
Dimostrazione. C(G) = Ad−1 (idg ) è chiuso in G, e per la Proposizione 1.7, è un sottogruppo
di Lie di G. Identifichiamo la sua algebra, che denotiamo h. Siano X ∈ g, Y ∈ h, e
gt = exp tX, s, t ∈ R. Allora, operando come nella dimostrazione della Proposizione 6.4,
exp sY = gt (exp sY )gt−1 = exp s(Y + t[X, Y ] + 12 t2 [X, [X, Y ]] + . . . ) .
Se s è abbastanza piccolo exp è iniettivo, e
Y = Y + t[X, Y ] + 21 t2 [X, [X, Y ]] + . . .
da cui segue [X, Y ] = 0, ovvero, h ⊂ C(g).
Viceversa, se Y ∈ C(g) e X ∈ g, vale [X, Y ] = 0, ed allora, posto g = exp X,
g(exp Y )g −1 = exp(Y + [X, Y ] + 21 [X, [X, Y ]] + . . . ) = exp Y.
Poiché ogni elemento di G si scrive come prodotto di elementi del tipo exp X, exp Y sta in
C(G), per cui C(g) ⊂ h. Pertanto, h = C(g).
Corollario 6.8. Un gruppo di Lie connesso è abeliano se e solo se la sua algebra di Lie è
abeliana.
Dimostrazione. Già sappiamo che l’algebra di Lie di un gruppo di Lie abeliano, connesso o
meno, è abeliana. Dimostriamo l’implicazione opposta. Se g è abeliana, g = C(g). Poiché
C(g) è l’algebra di Lie di C(G), i gruppi G e C(G) sono diffeomorfi in un intorno dell’identità.
Essendo G connesso, esso è generato da un suo sottoinsieme i cui elementi commutano tutti
fra di loro. Quindi G è abeliano.
I.25
Capitolo I
RIDUZIONI DI SISTEMI DINAMICI
Una classe importante di problemi della fisica matematica si riconduce alla risoluzione di
un sistema di equazioni differenziali alle derivate ordinarie del primo ordine (per esempio,
lo studio dell’evoluzione di un sistema meccanico). Possiamo scrivere un tale sistema nella
forma
(19)
ẋi = X i (x1 , . . . , xn ),
i = 1, . . . , n
i
dove le x1 (t), . . . , xn (t) sono le n funzioni incognite e ẋi = dx
dt (abbiamo assunto che il sistema
di equazioni sotto esame sia autonomo, ovvero, che il membro di destra della (19) non contenga
t). In un contesto geometrico risolvere il sistema (19) significa, dato un campo vettoriale X,
determinarne il flusso. Spesso la soluzione del problema risulta semplificata dal fatto di poter
trovare delle quantità che si mantengono costanti “durante il moto”, ovvero, sono invarianti
sotto l’azione del flusso del campo vettoriale X. Un’altra situazione in cui la risoluzione del
sistema viene semplificata si ha quando il campo vettoriale X sia invariante sotto un gruppo
di trasformazioni.
In questo capitolo studieremo in un certo dettaglio la possibilità di semplificare (o, come
si dice usualmente, “ridurre”) il sistema (19) quando una o entrambe di queste situazioni
siano verificate, in particolare nel caso di sistemi dinamici hamiltoniani. Ciò culminerà con
l’enunciazione e la dimostrazione del cosiddetto teorema di Marsden-Weinstein.
7. Costanti del moto di un sistema dinamico
Un primo passo per la risoluzione del sistema (19) può essere quello di metterlo (se possibile,
e mediante un opportuno cambio di coordinate) nella forma “ridotta”
(20)
ẏ a = Y a (y 1 , . . . , y r )
(21)
ż b = Z b (y 1 , . . . , y r ; z 1 , . . . , z n−r )
In questo caso si dice che si è effettuata una riduzione del sistema, poiché si è passati dalla
risoluzione del sistema (19), a n incognite, alla risoluzione successiva del sistema (20), a r
incognite, seguita dalla risoluzione del sistema (21), detto sistema residuo. Tale procedura
usualmente semplifica lo studio del problema.
Come precedentemente accennato, una possibilità in questa direzione si offre quando il
sistema ammetta delle costanti del moto. Ciò giustifica la seguente definizione.
I.26
Definizione 7.1. Un sistema dinamico è una coppia (V, X), dove V è una varietà differenziabile e X è un campo vettoriale su V . Una costante del moto di X è una funzione f : U → R
(dove U è un aperto di V ) che è costante lungo le curve integrali di X.
Quindi, se {ψt } è il flusso di X, f è una costante del moto se f = f ◦ ψt identicamente in
t, o equivalentemente, X(f ) = 0. Se U è contenuto propriamente in V , diciamo che f è una
costante del moto locale; in generale non è possibile estendere una costante del moto locale
ad una globale (si noti tra l’altro come, per il teorema di raddrizzamento dei campi vettoriali,
ogni sistema dinamico ammetta sempre n − 1 costanti del moto locali se n = dim V ).20
Esempio 7.2. Sia V = R2 − {0}, con coordinate canoniche x1 , x2 , e si consideri il campo
vettoriale
1
∂
2x1
∂
X(x1 , x2 ) = 1 2
+
.
2
2
1
1
2
2
2
(x ) + (x ) ∂x
(x ) + (x ) ∂x2
La funzione f = x2 − (x1 )2 è una costante del moto. Posto per semplicità y2 = x1 , y1 = f =
x2 − (x1 )2 il problema dell’integrazione di X si scrive

ẏ1 = 0
1
ẏ2 = 2
y2 + (y1 + y22 )2
ed è pertanto facilmente risolubile.
Esempio 7.3. (Il flusso di Kronecker su T 2 ). Prendiamo V = T 2 , con coordinate x, y, e
∂
∂
X = α ∂x
+ β ∂y
, con α, β costanti. La funzione f definita sull’aperto di T 2 corrispondente
all’interno della cella fondamentale dalla condizione f (x, y) = βx − αy è una costante del
moto locale, ma non può essere estesa a tutto T 2 a meno che α = β = 0 (f non è periodica).
Consideriamo il caso in cui α/β ∈
/ Q; allora le curve integrali di X sono dense in T 2 . In
questo caso non esistono costanti del moto f globali non banali (infatti se f è costante su un
sottoinsieme denso allora è costante su tutto T 2 ). Più in generale, per lo stesso argomento
un sistema dinamico che possiede almeno una costante del moto globale non banale non può
avere traiettorie dense.
Esempio 7.4. (Reticolo di Toda) È un sistema composto da n particelle di massa unitaria
che si muovono su una retta, sottoposte ad una interazione “fra primi vicini” data da un
potenziale di tipo esponenziale; se xi è la posizione dell’i-esima particella,
∂V
ẍ = − i ,
∂x
i
V =
n−1
X
i
ex −x
i+1
.
i=1
La dinamica del sistema si può scrivere in forma hamiltoniana; la funzione di Hamilton è
1
n
H(x , . . . , x , y1 , . . . , yn ) =
1
2
n
X
i=1
yi2
+
n−1
X
i
ex −x
i+1
.
i=1
20Ricordiamo che, dato un campo vettoriale X e un punto x ∈ V in modo che X(x) 6= 0, si possono scegliere
attorno a x coordinate locali {x1 , . . . , xn } tali che X =
(locali) del moto.
∂
.
∂x1
Le coordinate x2 , . . . , xn sono pertanto costanti
I.27
Ricordiamo che le equazioni di Hamilton sono
ẏi = −
(22)
∂H
,
∂xi
ẋi =
∂H
.
∂yi
Consideriamo la matrice simmetrica L avente la struttura

1
1
2
0
y1
e 2 (x −x )
1
 21 (x1 −x2 )
(x2 −x3 )
2
y2
e
e

1
(x2 −x3 )

2
0
e
y3


L(x, y) = 

...
... ...






yn−1
e
e la matrice antisimmetrica

1
1
2
0
0
e 2 (x −x )
1
2
3
 12 (x1 −x2 )
(x
0
e 2 −x )
−e

1
2
3

0
−e 2 (x −x )
0

1
A(x, y) = 
2
...
...





1
(xn−1 −xn )
2












1
e 2 (xn−1 −xn ) 
yn

...
0
−e
1
(xn−1 −xn )
2












1
e 2 (xn−1 −xn ) 
0
Un calcolo esplicito mostra che le equazioni (22) si possono scrivere nella forma (detta di Lax )
L̇ = [L, A] .
Da questa è facile dedurre che le funzioni
Fk =
1
tr Lk
k
sono costanti del moto: infatti
Ḟk = tr(L̇Lk−1 ) = tr([L, A]Lk−1 ) = tr(Lk A − A Lk ) = 0 .
Si noti che F1 = tr L è la quantità di moto, mentre F2 è l’energia (cioè, F2 ≡ H). Si
può dimostrare che le funzioni Fk sono in involuzione ({Fi , Fk } = 0 per ogni i, k) e, per
k = 1, . . . , n, sono linearmente indipendenti.
Vediamo come in generale si possa operare il processo di riduzione qualora siano presenti
costanti globali del moto. Sia (V, X) un sistema dinamico, e siano f1 , . . . , fr costanti del moto
globali. Fissata una r-pla µ = (µ1 , . . . , µr ) ∈ Rr , consideriamo la “superficie di livello”
Sµ = {x ∈ V | fi (x) = µi , i = 1, . . . , r} .
Consideriamo l’applicazione
ψ : V → Rr ,
x 7→ (f1 (x), . . . , fr (x)) .
I.28
Se i differenziali dfi sono linearmente indipendenti per ogni x ∈ Sµ (ovvero, se µ è un valore
regolare di ψ), allora esiste un intorno U di µ ∈ Rr tale che la restrizione di ψ su ψ −1 (U ) sia
una summersione. Pertanto, Sµ è una sottovarietà regolarmente immersa in V di dimensione
m = dim V − r. Su ψ −1 (U ) possiamo prendere coordinate locali {y 1 , . . . , y m , z 1 , . . . , z r },
con z i = fi . Poiché X(z i ) = 0 (X è tangente a Sµ ), in queste coordinate il problema
dell’integrazione di X si scrive
(
ż i = 0,
i = 1, . . . , r
(23)
j
j
ẏ = X (y, z),
j = 1, . . . , m .
L’Esempio 7.2 mostra una situazione di questo tipo. Questo processo di riduzione viene spesso
detto riduzione per restrizione.
8. Simmetrie di un sistema dinamico
Una simmetria di un sistema dinamico (V, X) è un diffeomorfismo φ di V che trasforma
curve integrali di X in curve integrali di X, ovvero,
φ ◦ ψt = ψt ◦ φ
(24)
essendo {ψt } il flusso di X. Questa condizione equivale a φ∗ (X) = X.
Un gruppo ad un parametro di simmetrie di (V, X) è un gruppo ad un parametro {φs } di
diffeomorfismi di V ognuno dei quali è una simmetria di X, ovvero (equivalentemente)
(25)
φs ◦ ψt = ψt ◦ φs
o
£Y X = 0
essendo Y il generatore di {φs }.
Un gruppo di simmetrie G di (V, X) è un gruppo di Lie con un’azione φ su V , tale che per
ogni g ∈ G il diffeomorfismo φg : V → V sia una simmetria di X. Sia g l’algebra di Lie di G.
Proposizione 8.1. Se (G, φ) è un gruppo di simmetrie di X, allora, dato Y ∈ g, vale
[Y ∗ , X] = 0, essendo Y ∗ il campo vettoriale fondamentale su V associato a Y . Viceversa, se
G è un gruppo di Lie connesso con un’azione φ su V , e Y ∈ g è tale che [Y ∗ , X] = 0, allora
(G, φ) è un gruppo di simmetrie di (V, X).
Dimostrazione. La prima affermazione è di immediata verifica. Per dimostrare la seconda si
usa il fatto che essendo G connesso esso è generato da un intorno della sua identità su cui exp
è surgettivo; inoltre, la condizione [Y ∗ , X] = 0 implica φexp sY ◦ ψt = ψt ◦ φexp sY e pertanto
fornisce φg ◦ ψt = ψt ◦ φg .
Se (G, φ) è un gruppo di simmetrie di (V, X), la condizione φg ◦ ψt = ψt ◦ φg implica che
per ogni x in V valga ψt (Ox ) ⊂ Oψt (x) , ossia, il flusso di X manda orbite di G in orbite di G.
Se il quoziente VG = V /G è una varietà differenziabile, ciò significa che X induce un sistema
dinamico “ridotto” su V /G (riduzione per proiezione); ovvero, esiste un campo vettoriale X̂
su VG tale che X̂ = π∗ X, essendo π : V → VG la proiezione.21
21Questa relazione va intesa nel senso π (X(x)) = X̂(π(x)) per ogni x ∈ V .
∗
I.29
In aggiunta all’assunzione che il quoziente VG = V /G sia una varietà differenziabile, supponiamo anche che l’azione di G sia libera. In questo caso le orbite di G sono sottovarietà
regolarmente immerse di dimensione r = dim G;22 possiamo introdurre coordinate locali
{y 1 , . . . , y m , z 1 , . . . z r } “adattate alla orbite”, dove le {z 1 , . . . , z r } sono coordinate sulle orbite, e le {y 1 , . . . , y m } sono coordinate sul quoziente VG (si ha m = dim VG = dim V − r). In
queste coordinate il problema dell’integrazione di X si scrive
(
ẏ i = X̂ i (y 1 , . . . , y m )
ż j
= X j (y 1 , . . . , y m , z 1 , . . . z r ) .
Esempio 8.2. Si interpreti, alla luce della precedente discussione, il caso di un campo vettoriale
su Rn che non dipenda da una coordinata. Qual è il gruppo di simmetria? Scrivere il sistema
ridotto ed il sistema residuo.
Esempio 8.3. Si determinino le curve integrali del campo su V = R2 − {0}
X(x1 , x2 ) = −
x1 + x2
∂
x1 − x2
∂
+
.
(x1 )2 + (x2 )2 ∂x1 (x1 )2 + (x2 )2 ∂x2
Si verifica facilmente che X ammette il gruppo di simmetria SO(2, R) con la sua azione
naturale su R2 − {0}. La varietà quoziente è evidentemente la semiretta aperta (0, +∞), e la
proiezione π è data da
p
(x1 , x2 ) 7→ ρ = (x1 )2 + (x2 )2 .
Un sistema di coordinate adattato alle orbite è fornito dalle coordinate polari (ρ, θ), in cui il
problema dell’integrazione di X si scrive

1

ρ̇ = −
ρ
1

θ̇ =
.
ρ2
9. Simmetrie di un sistema hamiltoniano
Sia (V, ω) una varietà simplettica. Ricordiamo che un simplettomorfismo di (V, ω) è un
diffeomorfismo φ di V tale che φ∗ ω = ω. La forma simplettica induce un isomorfismo di
fibrati vettoriali
T ∗ V → T V,
α 7→ Xα
con
α(Y ) = ω(Xα , Y )
per ogni Y ∈ T V .
Se α è una 1-forma esatta, α = df , il campo Xdf si dice il campo vettoriale hamiltoniano
associato alla funzione f ; quest’ultima è la funzione hamiltoniana di Xdf . Se α è chiusa, Xα
è detto localmente hamiltoniano; infatti ogni punto di V ha un intorno U su cui α = df , e
Xα |U è hamiltoniano.
22Le orbite di G in V sono regolarmente immerse perché sono chiuse in V (cfr. S. Helgason, Differential
geometry and symmetric spaces, Academic Press). Essendo l’azione libera, tutti i gruppi di isotropia Gx sono
banali, e pertanto ogni orbita è diffeomorfa a G; in particolare, dim Ox = dim G. Si noti che al variare di
ξ ∈ g = Lie(G) i campi vettoriali fondamentali ξ ∗ formano una distribuzione involutiva in V , le cui varietà
integrali massimali sono le orbite di G.
I.30
Un gruppo ad un parametro di simplettomorfismi {φt } è un gruppo ad un parametro di diffeomorfismi di V tale che per ogni t, φt sia un simplettomorfismo. I generatori dei gruppi ad un
parametro di simplettomorfismi sono esattamente i campi vettoriali localmente hamiltoniani.
Proposizione 9.1. Sia X il campo vettoriale generatore di un gruppo {φt } ad un parametro
di diffeomorfismi di V . Le seguenti condizioni sono equivalenti.
(1) {φt } è un gruppo ad un parametro di simplettomorfismi.
(2) £X ω = 0.
(3) X è localmente hamiltoniano.
Dimostrazione. (1) ⇒ (2): segue da
d ∗
£X ω =
φ ω
dt t
= 0.
t=0
L’implicazione opposta si ottiene dalla stessa formula, scritta per t generico: se £X ω = 0
allora φ∗t ω non dipende da t, ed essendo φ0 = idV , si ha φ∗t ω = ω.
(3) ⇒ (2): se X = Xα è localmente hamiltoniano, vale
£X ω = iX dω + d(iX ω) = −dα = 0;
la stessa formula mostra che se £X ω = 0 allora d(iX ω) = 0, per cui localmente iX ω = −df ,
ovvero, X è localmente hamiltoniano.
Nota 9.2. Non è in realtà necessario assumere la completezza del campo vettoriale localmente
hamiltoniano; in altri termini, il flusso di un campo vettoriale X è formato da simplettomorfismi se e solo se X è localmente hamiltoniano (e se e solo se £X ω = 0).
∂
∂
, Y = ∂θ
,
Esempio 9.3. Sia V = R × S 1 con la forma simplettica ω = dz ∧ dθ. Posto X = ∂z
si ha £X ω = £Y ω = 0. Y è hamiltoniano, mentre X lo è solo localmente (nonostante la
scrittura, la forma dθ su S 1 non è esatta).
Esempio 9.4. (Trasformazioni canoniche puntuali) Siano V = T ∗ Q il fibrato cotangente di una
varietà differenziabile Q, con proiezione canonica π : T ∗ Q → Q, e sia θ la forma di Liouville
su T ∗ Q. (Ricordiamo che questa è definita dalla condizione < X, θ >α = < π∗ X, α > per
ogni α ∈ T ∗ Q e ogni X ∈ Tα T ∗ Q. In coordinate locali fibrate {x1 , . . . , xn , y1 , . . . , yn } si ha
θα = pi (dq i )α se x = π(α) e α = pi (dq i )x ). La 2-forma ω = dθ è una forma simplettica su
T ∗ Q.
Sia Y il generatore di un gruppo ad un parametro {ψs } di diffeomorfismi di Q. Possiamo
definire un “sollevamento” di {ψs } su T ∗ Q; questo è il gruppo ad un parametro {Ψs } di
diffeomorfismi
(26)
∗
Ψs (α) = ψ−s
α.
Si ha un diagramma commutativo
Ψ
s
T ∗ Q −−−−
→


πy
Q
ψs
TQ

π
y
−−−−→ Q
I.31
Sia X il generatore di {Ψs }. Dimostriamo che £X θ = 0 facendo il calcolo in coordinate locali
∂
fibrate23 {x1 , . . . , xn , y1 , . . . , yn } di T ∗ Q. Se Y = Y i ∂x
i dalla definizione (26) si ottiene
X =Yi
∂
∂Y k
∂
−
yk
i
i
∂x
∂x
∂yi
e pertanto
∂Y k
yk dxi + d(Y i yi ) = 0 .
∂xi
Di conseguenza, £X ω = 0, il campo X è localmente hamiltoniano, e {Ψs } è un gruppo di
simplettomorfismi di T ∗ Q. In realtà X è anche hamiltoniano. Infatti
£X θ = iX dθ + d(iX θ) = −Y i dyi −
iX ω = £X θ − d(iX θ)
per cui X = Xdf con f = −iX θ = −yi Y i .
Definizione 9.5. Un sistema dinamico hamiltoniano è una tripla (V, ω, X), dove V è una
varietà differenziabile, ω una forma simplettica su V , e X è un campo vettoriale hamiltoniano
su V .
Proposizione 9.6. Sia (V, ω, X) un sistema dinamico hamiltoniano. (1) Una funzione f su
V è una costante del moto per XdH se e solo se {f, H} = 0. (2) Ogni simplettomorfismo φ
di (V, ω) che lasci invariante H — ovvero, tale che H ◦ φ = H — è una simmetria di XdH .
Dimostrazione. (1) {f, H} = 0 equivale a XdH (f ) = 0.
(2) Per ogni funzione g su V vale
(φ∗ XdH )(g) = XdH (g ◦ φ) ◦ φ−1 = {g ◦ φ, H} ◦ φ−1 = {g, H ◦ φ−1 } = {g, H} = XdH (g) .
Proposizione 9.7. (Teorema di Noether) Sia (V, ω, XdH ) un sistema dinamico hamiltoniano;
sia f una funzione su V , e sia {φs } il flusso di Xdf .24 La famiglia {φs } lascia invariato H
(ovvero H ◦ φs = H per ogni s) se e solo se {f, H} = 0.
Dimostrazione. La condizione H ◦ φs = H equivale a
d
H ◦ φs (x)
= 0 per ogni x ∈ V.
ds
s=0
d
H ◦ φs s=0 = Xdf (H) = {f, H} si ha la tesi.
Essendo ds
In conseguenza del teorema di Noether, ad ogni costante del moto f di XdH è associato
un “gruppo locale” di simmetria di XdH ; il gruppo è “globale” se Xdf è completo. Viceversa,
sia {φs } un gruppo ad un parametro di simplettomorfismi che preservano H (il che per il
punto (2) della Proposizione 9.6 implica che {φs } è un gruppo di simmetria di XdH ). Allora
il generatore X di {φs } è localmente hamiltoniano, ovvero, localmente vale X = Xdf , e dal
teorema di Noether segue che f è una costante del moto locale; se X è hamiltoniano, f è una
costante del moto globale.
23Alternativamente si può dimostrare direttamente che Ψ∗ θ = θ dalla definizione intrinseca di θ.
s
24Già sappiamo che i diffeomorfismi {φ } sono simplettomorfismi di (V, ω).
s
I.32
Esempio 9.8. Con riferimento all’esempio 9.4, la funzione f = −iX θ è una costante del moto
per XdH se e solo se {Ψs } lascia invariata H, ovvero, H ◦ Ψ = H.
Esempio 9.9. (Coordinate cicliche) Supponiamo che Q ammetta una carta globale con coordinate {q 1 , . . . , q n }, e sia ψs : Q → Q dato da
ψs (q 1 , . . . , q n ) = (q 1 , . . . , q k + s, . . . , q n )
per un k fissato. Il sollevamento {Ψs } di {ψs } a T ∗ Q è un gruppo di simplettomorfismi il
cui generatore è hamiltoniano, con funzione hamiltoniana f (q, p) = pk (stiamo denotando con
{q 1 , . . . , q n , p1 , . . . , pn } un sistema di coordinate fibrate su T ∗ Q). Per il teorema di Noether,
f è una costante del moto se e solo se H non dipende da q k . In particolare in quest’ambito
si formalizza l’invarianza per traslazioni e rotazioni di un sistema meccanico.
Esempio 9.10. Sia Q = R3 , con coordinate canoniche (q 1 , q 2 , q 3 ). Le rotazioni attorno all’asse
q3 costituiscono un gruppo ad un parametro di diffeomorfismi di Q, descritto da
 1

  1
q
cos s sin s 0
q
ψs : q 2  7→ − sin s cos s 0 q 2 
q3
0
0
1
q3
Posto in coordinate (q̄, p̄) = Ψ(q, p), si ha q̄ k = ψ k (q), p̄k = (J −1 )i k pi , con J ik =
∂ψ i
.
∂q k
Essendo ψs lineare e J ortogonale, si ha
 

 
p̄1
cos s sin s 0
p1
p̄2  7→ − sin s cos s 0 p2  .
p̄3
0
0
1
p3
Il generatore di {Ψs } è hamiltoniano con funzione hamiltoniana f (q, p) = p1 q 2 − p2 q 1 (coincidente con la proiezione del momento angolare lungo l’asse q3 ). Il teorema di Noether afferma
che f è una costante del moto per XdH se e solo se H è invariante per rotazioni attorno
all’asse q3 .
10. Dalle costanti del moto alle simmetrie
Sia (V, XdH ) un sistema dinamico hamiltoniano che ammette costanti del moto f1 , . . . , fr ,
e supponiamo che ogni campo hamiltoniano Xdfi sia completo. Per il teorema di Noether
si hanno r gruppi ad un parametro di simmetrie di XdH . Vogliamo da questi costruire un
gruppo G di simmetrie di XdH . A questo scopo faremo un’ipotesi.
Se calcoliamo la parentesi di Poisson {fi , fk } di due costanti del moto otteniamo una
ulteriore costante del moto, in conseguenza dell’identità di Jacobi:
{{fi , fk }, H} = −{{H, fi }, fk } − {{fk , H}, fi } = 0
(o, equivalentemente, perché il commutatore dei campi hamiltoniani Xdfi e Xdfk è anch’esso
hamiltoniano, con funzione hamiltoniana {fi , fk }). Aggiungiamo alle funzioni f1 , . . . , fr tutte
le funzioni {fi , fk }, i, k = 1, . . . , r, e iteriamo questo procedimento — ottenendo cosı̀ un nuovo
I.33
insieme di costanti del moto, {f1 , . . . , fm }, con m ≥ r — sino a che sia vero il seguente fatto:
esistono costanti cijk e σij , i, j, k = 1 . . . m, tali che
{fj , fk } = cijk fi + σjk .
Stiamo evidentemente assumendo che ciò avvenga dopo un numero finito di iterazioni.
Dati ξ = (ξ 1 , . . . , ξ m ), η = (η 1 , . . . , η m ) ∈ Rm poniamo
fξ =
m
X
ξ i fi ,
[ξ, η]k = ckij ξ i η j ,
σ(ξ, η) = σij ξ i η j .
i=1
Si ha cosı̀ fξ : V → R, [ξ, η] ∈ Rm , σ(ξ, η) ∈ R. La (10) si riscrive
{fξ , fη } = f[ξ,η] + σ(ξ, η) ,
e l’identità di Jacobi implica
(27)
[[ξ, η], θ] + [[θ, ξ], η] + [[η, θ], ξ] = 0
(28)
σ([ξ, η], θ) + σ([θ, ξ], η) + σ([η, θ], ξ) = 0 .
L’equazione (27) esprime il fatto che g = (Rm , [ , ]) è un’algebra di Lie; la (28) invece afferma
che σ è un 2-cociclo di tale algebra. I corrispondenti campi vettoriali hamiltoniani verificano
la condizione
[Xdfξ , Xdfη ] = Xd{fξ , fη } = Xdf[ξ,η] ;
in altri termini, si ha un omomorfismo di algebre di Lie
g → X(V ).
(29)
Si dice che ciò definisce un’azione dell’algebra g su V .
Sia G un gruppo di Lie connesso avente algebra di Lie g.25 In generale un’azione di g su V
non “si esponenzia” ad un’azione di G. Supponiamo comunque che ciò accada; più precisamente, assumiamo che esista un’azione destra26 φ di G su V in modo che la corrispondenza
ξ 7→ ξ ∗ , che ad ogni ξ ∈ g associa il corrispondente campo vettoriale fondamentale su V ,
coincida con l’omomorfismo (29).
25Un tale gruppo esiste sempre. Se g non ha centro il gruppo G si può costruire facilmente. Il nucleo
dell’applicazione ad : g → End(g), ad(ξ)(η) = [ξ, η], è proprio il centro di g, per cui ad è iniettiva. Si definisce
allora G come l’immagine in Aut(g) della composizione
ad
exp
g −→ End(g) −→ Aut(g) .
Se invece il centro di g non è banale la costruzione di G è più complicata.
26La scelta dell’azione destra segue da questo fatto: se G è un gruppo di Lie che agisce da destra su una
varietà differenziabile V , allora l’applicazione lineare
g → X(V ),
ξ 7→ ξ ∗
è un omomorfismo di algebre di Lie. Infatti, se ξ, η ∈ g, ed f è una funzione su V , vale
»
–
d d
(f (ρexp sη (ρexp tξ (x)) − f (ρexp tξ (ρexp sη (x)))
[ξ ∗ , η ∗ ](f ) =
ds dt
(s=t=0)
»
–
d d
=
(f (ρexp tξ exp sη (x)) − f (ρexp sη exp tξ (x)))
.
ds dt
(s=t=0)
Essendo
(30)
exp sη exp tξ = exp(sη + tξ + 12 st[ξ, η] + O(t, s)2 )
I.34
Proposizione 10.1. Il gruppo G costruito sotto queste ipotesi, con l’azione φ, è un gruppo
di simplettomorfismi di (V, ω) che lascia H invariata.
Dimostrazione. Fissato ξ ∈ g, il campo vettoriale ξ ∗ = Xdfξ è hamiltoniano, e fξ è una
costante del moto di XdH (ciò a causa delle ipotesi enunciate all’inizio del paragrafo). Per il
teorema di Noether, la famiglia {φexp sξ }s∈R è un gruppo ad un parametro di simplettomorfismi
che lascia H invariata. Essendo G connesso, lo stesso vale per ogni φg .
Esempio 10.2. Sia Q = R3 , V = T ∗ Q ' R6 con coordinate canoniche (q 1 , q 2 , q 3 , p1 , p2 , p3 ),
dotato della forma simplettica canonica. Sia H(q, p) una qualunque funzione C ∞ delle
quantità
3
3
3
X
X
X
i 2
2
(q ) ,
(pi ) ,
q i pi .
q3
i=1
p3 q 2 ,
i=1
−p3 q 1
i=1
q3
Le funzioni f1 = −p2 +
f2 =
+ p1 sono costanti del moto. Anche f3 =
2
1
{f1 , f2 } = p1 q − p2 q è una costante del moto. Non è possibile però generare altre costanti
del moto, in quanto {f1 , f3 } = −f2 e {f2 , f3 } = f1 . Queste costanti del moto soddisfano
pertanto la condizione della precedente discussione, con σ = 0 e cijk = εijk (il simbolo di
Levi-Civita a tre indici). L’algebra di Lie generata dalle costanti del moto fi coincide quindi
con l’algebra o(3, R). Si una cosı̀ un’azione di o(3, R) su R6 , data da
ξ 7→ fξ =
3
X
ξ i fi 7→ Xdfξ =
i=1
∂fξ ∂
∂fξ ∂
−
.
∂q i ∂pi
∂pi ∂q i
In particolare,
ξ = (0, 0, 1) 7→ f3 7→ Xdf3 = q 2
∂
∂
∂
∂
− q 1 2 + p2
− p1
.
1
∂q
∂q
∂p1
∂p2
Questa azione si esponenzia ad un’azione di SO(3, R) su R6 , ed allora coincide con il sollevamento a R6 ≡ T ∗ R3 dell’azione destra di SO(3, R) su R3 data da (R, q) 7→ R̃q. Il gruppo
SO(3, R) agisce mediante simplettomorfismi che preservano H.
11. Dalle simmetrie alle costanti del moto: l’applicazione momento
Un’azione φ di un gruppo di Lie su una varietà simplettica V con forma simplettica ω
è detta simplettica se ogni φg è un simplettomorfismo. Ciò implica che per ogni ξ ∈ g la
famiglia {φexp sξ }s∈R è un gruppo ad un parametro di simplettomorfismi, ed il campo vettoriale
fondamentale ξ ∗ su V è localmente hamiltoniano. Supponiamo che esso sia hamiltoniano, con
si ottiene
[ξ ∗ , η ∗ ](f ) =
»
d d
f (ρexp st[ξ,η] (x))
ds dt
–
= [ξ, η]∗ (f ) .
(s=t=0)
L’equazione (30) è un troncamento della cosiddetta formula di Baker-Campbell-Hausdorff, cfr. V.S. Varadarajan, Lie groups, Lie algebras, and their representations, Springer-Verlag. Si può facilmente provare la (30)
quando G non ha centro, cosicché mediante la rappresentazione aggiunta G stesso può essere pensato come un
gruppo di matrici. Ci si può quindi ridurre alla situazione G = Gl(n, R), nel qual caso la formula è elementare.
I.35
funzione hamiltoniana fξ .27 Per ogni ξ la funzione fξ è definita a meno di una costante se
V è connesso (se V non è connesso si ha una costante additiva arbitraria diversa su ogni
componente connessa di V ). È pertanto necessario imporre delle condizioni per eliminare
questa ambiguità; per esempio, scelto un punto xi in ogni componente connessa Vi di V , si
può imporre fξ (xi ) = 0 per ogni ξ ∈ g.
Per ogni x ∈ V definiamo un’applicazione
Jx : g → R,
Jx (ξ) = fξ (x) .
Questa è lineare; infatti fcξ = cfξ . Una conveniente descrizione di questa applicazione si ha
scegliendo una base {ξ1 , . . . , ξm } di g; allora
(31)
Jx =
m
X
fξi (x) Ξi ,
i=1
essendo
{Ξ1 , . . . , Ξm }
la base duale di
g∗ .
Abbiamo in questo modo costruito un’applicazione differenziabile J : V → g∗ , che per
costruzione soddisfa la seguente condizione: se φ è un’azione simplettica di un gruppo di
Lie G su V , tale che i suoi campi vettoriali fondamentali siano hamiltoniani, la funzione
fξ : V → R, fξ (x) =< ξ, J(x) >, è la hamiltoniana di ξ ∗ . Chiameremo applicazione momento
ogni applicazione differenziabile J : V → g∗ soddisfacente questa condizione.
Se µ ∈ g∗ è un elemento fissato, e J è una applicazione momento, allora J 0 = J + µ
(ovvero, J 0 (x)(ξ) = J(x)(ξ)+ < ξ, µ >) definisce un’altra applicazione momento (ciò cambia la costante additiva arbitraria delle costanti del moto fξ ). Viceversa, se J 0 è un’altra applicazione momento, allora esiste µ ∈ g∗ tale che J 0 = J + µ; infatti l’applicazione
ξ → fξ0 (x) − fξ (x) ∈ R non dipende da x ed è lineare, quindi determina un elemento µ ∈ g∗
tale che < ξ, µ > = fξ0 (x) − fξ (x).
Se H è una funzione invariante per l’azione di G, ovvero, H = H ◦ φg per ogni g ∈ G, allora
J è una costante del moto di XdH (a valori in g∗ ), in quanto ogni fξi è una costante del moto.
Esempio 11.1. Sia G un gruppo di Lie che agisce su una varietà differenziabile Q con un’azione φ. Per ogni elemento g ∈ G si ha un diffeomorfismo φg : Q → Q, il quale induce un
diffeomorfismo
Φg : T ∗ Q → T ∗ Q,
Φg (α) = φ∗g−1 α,
definendo cosı̀ un “sollevamento” dell’azione di G su T ∗ Q. Per ogni ξ ∈ g, sia Xξ il campo
vettoriale fondamentale dato da questa azione. Si ha una situazione come nell’Esempio 9.4; il
campo Xξ è hamiltoniano, con funzione hamiltoniana fξ = −iXξ (θ). l’applicazione momento
è data da
< ξ, J(α) > = −< Xξ , θ >α
con α ∈ T ∗ Q. Definita per ogni α ∈ T ∗ Q l’applicazione
Φα : G → T ∗ Q,
Φα (g) = Φg (α) ,
si ha Xξ (α) = (Φα )∗ (ξ), e
< ξ, J(α) > = −< (Φα )∗ (ξ), θ > = −< ξ, (Φα )∗ (θ) >
27Ciò accade automaticamente se il primo gruppo di coomologia di de Rham di V è nullo, in particolare se
V è semplicemente connessa.
I.36
da cui J(α) = −(Φα )∗ (θ).
Avremmo anche potuto scrivere le costanti del moto fξ nella forma (equivalente alla precedente) fξ (α) = −< Yξ (x), α >, essendo Yξ il campo vettoriale fondamentale dato dall’azione
di G su Q, e x il punto di applicazione di α in Q. In questo caso avremmo ottenuto la scrittura
J(α) = −(φx )∗ (α), essendo adesso φx : G → Q dato da φx (g) = φ(g, x).
Più concretamente, possiamo scrivere l’applicazione momento usando l’equazione (31); fissata una base {ξ1 , . . . , ξm } di g, e detto Y(i) il generatore di {φexp sξi }, in coordinate locali
j
fibrate {q 1 , . . . , q n , p1 , . . . , pn } si ha fξi = −pj Y(i)
, e pertanto
J(q, p) = −
m
X
j
pj Y(i)
(q) Ξi
i=1
essendo
{Ξ1 , . . . , Ξm }
la base duale di
g∗ .
Esempio 11.2. Consideriamo il gruppo delle traslazioni Rn che agisce su Q = Rn mediante
q 7→ q − a. In questo caso φq : Rn → Q è dato da φq (a) = q − a, per cui (φq )∗ = id, e
J(q, p) = p; l’applicazione momento è la quantità di moto.
Esempio 11.3. Prendiamo Q = Rn , V = T ∗ Q, G un sottogruppo di Gl(n, R), con l’azione
destra (M, q) 7→ M̃ q (denotiamo q = (q 1 , . . . , q n ) gli elementi di Rn , visti come vettori colonna.
Alternativamente, se i punti di Rn vengono visti come vettori riga, l’azione si scrive (M, q) 7→
˜ e quindi < ξ, J(q, p) > = −< p, ξ ∗ (q) > = −p̃ ξ˜ q.
qM ). Allora per ogni ξ ∈ g vale ξ ∗ (x) = ξx,
∼ R3 , si ha ξ q =
Se n = 3 e G = SO(3, R), denotato ξ 7→ ωξ l’usuale isomorfismo o(3, R) →
ωξ ∧ q. Denotando inoltre “·” il prodotto scalare standard in R3 , si ha
< ξ, J(q, p) > = p̃ ξ q = p · ωξ ∧ q = ωξ · q ∧ p ,
da cui J(q, p) = q ∧ p: l’applicazione momento è il momento angolare.
Azioni poissoniane. Sia φ un’azione simplettica di un gruppo di Lie G su una varietà
simplettica (V, ω), e sia J un’applicazione momento. Per ogni ξ ∈ g il campo vettoriale
fondamentale ξ ∗ è hamiltoniano, con funzione hamiltoniana fξ (x) = < ξ, J(x) >.
Definizione 11.4. L’azione φ è poissoniana se è possibile scegliere J in modo che {fξ , fη } =
f[ξ,η] .
L’applicazione g → F(V ), ξ 7→ fξ diventa cosı̀ un omomorfismo di algebre di Lie.
Esempio 11.5. (Un’azione simplettica non poissoniana) V = R2 , ω = dx1 ∧ dx2 ; G = R2
agisce su V per traslazioni. I campi vettoriali fondamentali sono
ξ∗ = ξ1
∂
∂
+ ξ2 2 .
1
∂x
∂x
Si ha iξ∗ ω = ξ 1 dx2 − ξ 2 dx1 e quindi la funzione hamiltoniana di ξ ∗ ha la forma fξ =
ξ 1 x2 − ξ 2 x1 + c(ξ), dove c : g → R è una funzione differenziabile. L’azione di G è infatti
simplettica, e le possibili applicazioni momento sono del tipo
J(x1 , x2 ) = (x2 + µ1 , −x1 + µ2 ),
µ ∈ R2 .
I.37
Esiste un 2-cociclo non nullo, dato da
σ(ξ, η) = {fξ , fη } − f[ξ,η] = −ξ 1 η 2 + ξ 2 η 1 .
Proposizione 11.6. Il sollevamento a T ∗ Q dell’azione di un gruppo di Lie G su Q è un’azione
poissoniana.
Dimostrazione. Per ogni ξ ∈ g denotiamo con ξ ∗ il campo fondamentale associato all’azione
di G su Q e ξ˜∗ il suo sollevamento a T ∗ Q. Quest’ultimo è hamiltoniano, ovvero, ξ˜∗ = Xdfξ
per una funzione fξ : T ∗ Q → R. Si ha {fξ , fη } = ω(Xdfξ , Xdfη ) con fξ (α) = −< α, ξ ∗ (q) > se
q = π(α) (ξ ∗ è il campo fondamentale su Q). Inoltre dalla formula di Cartan
ω(X, Y ) = dθ(X, Y ) = X(< Y, θ >) − Y (< X, θ >)− < [X, Y ], θ >
= < Y, £X θ > − < X, £Y θ > + < [X, Y ], θ >
essendo £Xdfξ θ = £Xdfη θ = 0 abbiamo
{fξ , fη }(α) = −< [Xdfξ , Xdfη ], α > = −< Xdf[ξ,η] , α > = f[ξ,η] (α) .
Proposizione 11.7. Sia φ un’azione poissoniana di un gruppo di Lie connesso G su una
varietà simplettica (V, ω), e sia J un’applicazione momento che annulla il cociclo σ. Allora
J è Ad∗ -equivariante, nel senso che per ogni g ∈ G il seguente diagramma è commutativo:
φg
V −−−−→


Jy
V


yJ
Ad∗g
g∗ −−−−→ g∗
Viceversa, se J è un’applicazione momento Ad∗ -equivariante, e fξ (x) = < ξ, J(x) >, allora
{fξ , fη } = f[ξ,η] ; ovvero, un’azione simplettica che ammette un’applicazione momento Ad∗ equivariante è poissoniana.
Dimostrazione. La condizione di Ad∗ -equivarianza di J equivale a
< ξ, J ◦ φg (x) > = < ξ, Ad∗g J(x) > = < Adg ξ, J(x) >
e pertanto J è Ad∗ -equivariante se e solo se fξ ◦ φg = fAdg ξ per ogni ξ ∈ g, g ∈ G. Questa
affermazione è equivalente a fξ ◦ φexp sη = fAdexp(sη) ξ per ogni ξ, η ∈ g, s ∈ R, ovvero,
d
d
fξ ◦ φexp sη
=
fAdexp(sη) ξ
;
ds
ds
s=0
s=0
ma il membro di sinistra di questa uguaglianza è Xdfη (fξ ) = −{fξ , fη }, mentre il membro di
destra è fadη ξ = −f[ξ,η] .
Esempio 11.8. Verifichiamo l’Ad∗ -equivarianza dell’applicazione momento nel caso del sollevamento a T ∗ Q dell’azione di un gruppo di Lie G su una varietà Q. Usiamo le stesse notazioni
della Proposizione 11.6. Valgono per ogni ξ ∈ g e ogni α ∈ T ∗ Q le implicazioni
J ◦ Φg (α) = Ad∗g ◦J(α)
⇐⇒
< ξ, J ◦ Φg (α) > = < Adg ξ, J(α) >
I.38
⇐⇒
Ma (Φg )∗ Xdfξ = XdfAd
g −1
ξ
< Xdfξ , θ >Φg (α) = < XdfAdg ξ , θ >α
,28 e quindi il secondo membro dell’ultima equazione è
< (Φg )∗ Xdfξ , θ >α = < Xdfξ , Φ∗g−1 θ >Φg (α) = < Xdfξ , θ >Φg (α) .
12. Riduzione di sistemi hamiltoniani
Iniziamo con alcuni esempi.
Esempio 12.1. (Variabili cicliche) Prendiamo Q = Rn , T ∗ Q ' R2n con coordinate {q 1 , . . . , q n ,
p1 , . . . , pn } e forma simplettica ω = dpi ∧ dq i . Sia H una funzione che non dipende da r delle
coordinate q, per esempio q 1 , . . . , q r . Allora le funzioni p1 , . . . , pr sono costanti del moto (in
involuzione, ovvero {pi , pk } = 0 per i, k = 1, . . . , r). Il corrispondente gruppo di simmetria è
il gruppo delle traslazioni G = Rr che agisce su Q secondo
φa (q 1 , . . . , q n ) = (q 1 − a1 , . . . , q r − ar , q r+1 , . . . , q n )
se
a = (a1 , . . . , ar ).
Vogliamo studiare la riduzione di questo sistema. Un primo passo è la restrizione del
sistema alla sottovarietà
Sµ = {(q, p) ∈ R2n | pi = µi , i = 1, . . . , r} .
Il campo vettoriale XdH è tangente a Sµ , avendo la forma
XdH =
n
n
X
X
∂H ∂
∂H ∂
−
α
∂q ∂pα
∂pi ∂q i
α=r+1
i=1
e induce pertanto un campo vettoriale Xµ su Sµ . Il sistema ristretto a Sµ si scrive

∂H r+1

q̇ i =
(q , . . . , q n , µ1 , . . . , µr , pr+1 , . . . , pn )
i = 1, . . . , n
∂pi
∂H r+1

ṗα = −
(q , . . . , q n , µ1 , . . . , µr , pr+1 , . . . , pn )
α = r + 1, . . . , n
∂q α
mentre il sistema residuo si riduce a ṗj = 0, j = 1, . . . , r. Secondo passo: il gruppo delle
traslazioni G agisce su Sµ ed è un gruppo di simmetrie di Xµ . Lo spazio quoziente Vµ =
Sµ /G è un iperpiano sul quale le funzioni {q r+1 , . . . , q n , pr+1 , . . . , pn } formano un sistema di
28Si ha infatti
»
(Φg )∗ Xdfξ =
d
Φg ◦ Φexp sξ (α)
ds
–
»
=
s=0
–
d
Φ(exp sξ)g (α)
.
ds
s=0
Definita l’applicazione
Φα : G → T ∗ Q,
Φα (g) = Φg (α)
vale ξ˜∗ (α) = (Φα )∗ (ξ), e pertanto
»
(Φg )∗ Xdfξ (α) =
d
Φα ◦ Rg (exp sξ)
ds
–
= (Φα )∗ (Rg )∗ ξ
s=0
= (Φα )∗ (Rg )∗ (Lg−1 )∗ ξ = (Φα )∗ Adg−1 ξ = XdfAd
g −1
ξ
(α) .
I.39
coordinate. Il campo vettoriale Xµ induce su Vµ un campo vettoriale hamiltoniano la cui
funzione hamiltoniana è
Hµ (q r+1 , . . . , q n , pr+1 , . . . , pn ) = H(q r+1 , . . . , q n , µ1 , . . . , µr , pr+1 , . . . , pn ) ;
il sistema ridotto è ora
(32)


q̇ α



=




ṗα
=−
∂Hµ
∂pα
∂Hµ
,
∂q α
α = r + 1, . . . , n .
Il sistema residuo è ora dato da
∂H r+1
q̇ j =
(q , . . . , q n , µ1 , . . . , µr , pr+1 , . . . , pn ) ,
∂pj
ṗj = 0,
j = 1, . . . , r .
Possiamo notare che
(i) La varietà Vµ è simplettica: su di essa si può definire la forma simplettica
ωµ =
n
X
dpα ∧ dq α .
α=r+1
Inoltre il sistema ridotto (32) è hamiltoniano.
(ii) L’esistenza di r costanti del moto (oppure l’esistenza di un gruppo di simmetria rdimensionale) permette di ridurre l’ordine del sistema di 2r unità.
(iii) Una volta risolto il sistema ridotto, il sistema residuo si integra per quadrature, in
∂H
quanto le funzioni ∂p
non dipendono dalle q j (j = 1, . . . , r).
j
Esempio 12.2. Sia (V, ω, XdH ) un sistema dinamico hamiltoniano, e f una sua constante
del moto. Assumiamo che Xdf sia completo. Se µ ∈ R è un punto regolare di f , l’insieme
Sµ = f −1 (µ) è una sottovarietà regolarmente immersa di V . Il campo XdH è tangente a Sµ
(essendo {f, H} = 0), ed induce un campo Xµ su Sµ .
D’altra parte essendo Xdf completo il gruppo ad un parametro {ψs } da esso generato dà
luogo ad un’azione di R su V , che per il teorema di Noether è un gruppo di simmetrie di
XdH . l’applicazione momento coincide con f (si noti che g∗ ' R, e l’azione di R è ovviamente
poissoniana). Ogni diffeomorfismo ψs lascia Sµ invariata (Xdf (f ) = 0), e pertanto {ψs } induce
un gruppo ad un parametro {ψsµ } di diffeomorfismi di Sµ .
Se supponiamo che quest’azione sia libera e propria, il quoziente Vµ = Sµ /R è una varietà
differenziabile, ed il campo vettoriale Xµ si proietta sul quoziente.
La varietà Vµ è simplettica; possiamo infatti scegliere (localmente) in V coordinate simplettiche {q 1 , . . . , q n , p1 , . . . , pn } tali che p1 = f . In queste coordinate ψs è descritto dall’equazione
ψs (q 1 , . . . , q n , p1 , . . . , pn ) = (q 1 − s, q 2 . . . , q n , p1 , . . . , pn ) .
Le funzioni {q 2 , . . . , q n , p2 , . . . , pn } sono allora coordinate su Vµ , e la forma
ωµ =
n
X
i=2
è simplettica.
dpi ∧ dq i
I.40
Localmente siamo nella stessa situazione dell’esempio precedente, e valgono le stesse conclusioni. Notiamo che, dette ιµ : Sµ → V l’inclusione e πµ : Sµ → Vµ la proiezione, la forma
simplettica ωµ verifica la condizione πµ∗ ωµ = ι∗µ ω.
Esempio 12.3. Prendiamo V = R4 con coordinate canoniche {q 1 , q 2 , p1 , p2 }, ω = dp1 ∧ dq 1 +
dp2 ∧dq 2 , H = 12 (p21 +p22 )+V (q1 −q2 ) (questa è la funzione hamiltoniana di due particelle che si
muovono su una retta soggette ad una forza conservativa che dipende solo dalla loro posizione
relativa). La funzione H è invariante per il gruppo di trasformazioni ψs : (q 1 , q 2 , p1 , p2 ) 7→ (q 1 −
s, q 2 − s, p1 , p2 ) il cui generatore X = − ∂q∂ 1 − ∂q∂ 2 è hamiltoniano, con funzione hamiltoniana
f = p1 + p2 ; questa è una costante del moto (fisicamente, la quantità di moto totale del
sistema). Dal precedente esempio sappiamo che è possibile ridurre di due unità l’ordine del
sistema; ciò si ottiene introducendo la nuove coordinate simplettiche
q̄ 1 = q 1 ,
q̄ 2 = q 2 − q 1 ,
p̄1 = p1 + p2 ,
p̄2 = p2
che “raddrizzano” X, in quanto X = − ∂∂q̄1 . In queste variabili H non dipende da q̄ 1 ,
H = p̄22 − p̄1 p̄2 + 12 p̄21 + V (−q̄ 2 ) .
Il sistema delle equazioni di Hamilton si spezza in
∂V
,
∂ q̄ 2
p̄1 = µ = costante
q̄˙2 = 2p̄2 − p̄1 ,
q̄˙1 = p̄1 − p̄2 ,
p̄˙2 =
(sistema ridotto)
(sistema residuo) .
Una volta risolto il sistema ridotto il sistema residuo si integra direttamente:
Z
q̄ 1 (t) = − p̄2 (t) dt + µ1 t .
Esercizio 12.4. È utile notare che il sistema del precedente Esempio si può studiare anche
senza introdurre coordinate simplettiche. Rifare dunque i calcoli usando le coordinate
p = p1 + p2 ,
q = q1,
y = p1 ,
r = q1 − q2 .
Esempio 12.5. Siano V = R4 con coordinate canoniche {q 1 , q 2 , p1 , p2 }, ω = dp1 ∧dq 1 +dp2 ∧dq 2 ,
2
H = f (p2 , p1 eq ). La funzione H è invariante sotto l’azione di R2 data da
ψs,t (q 1 , q 2 , p1 , p2 ) = (q 1 − s, q 2 + t, p1 e−t , p2 ) .
Il campo fondamentale t∗ = ∂q∂ 2 − p1 ∂p∂ 1 , e la 1-forma corrispondente è −p1 dq 1 − dp1 , che non
è chiusa. t∗ non è localmente hamiltoniano, e l’azione non è simplettica. La funzione H è
anche invariante sotto l’azione φ di R2 data da29
(33)
φs,t (q 1 , q 2 , p1 , p2 ) = (q 1 et + s, q 2 + t, p1 e−t , p2 ) .
In questo caso i campi fondamentali
s∗ =
∂
∂q 1
e
t∗ = q 1
∂
∂
∂
+ 2 − p1
1
∂q
∂q
∂p1
29In realtà non è il gruppo R2 che agisce, in quanto, come si può verificare direttamente, e come vedremo
sotto, questa azione non è abeliana. Si tratta quindi dell’azione di un gruppo di Lie G diffeomorfo (ma non
isomorfo come gruppo) a R2 .
I.41
sono hamiltoniani, e l’azione φ è simplettica. Le costanti del moto associate a questa simmetria
sono f1 = −p1 q 1 − p2 , f2 = −p1 ; si ha {f1 , f2 } = −f2 , e quindi l’azione è poissoniana.
Introduciamo nuove coordinate
q̄ 1 = p1 q 1 + p2 ,
q̄ 2 = q 2 + log p1 ,
p̄1 = log p1 ,
p̄2 = p2 .
Il calcolo diretto mostra che
dp̄1 ∧ dq̄ 1 + dp̄2 ∧ dq̄ 2 = ω ,
ovvero, le nuove coordinate sono simplettiche. La funzione H dipende solo da q̄ 2 e p̄2 : le
equazioni di Hamilton si scrivono adesso
q̄ 1 = µ1 = costante,
p̄1 = µ2 = costante,
q̄˙2 =
∂H
,
∂ p̄2
p̄˙2 = −
∂H
.
∂ q̄ 2
Sia Sµ , con µ = (µ1 , µ2 ), la superficie di equazione q̄ 1 = µ1 , p̄1 = µ2 . I campi fondamentali
s∗ , t∗ non sono tangenti a Sµ , il che significa che l’azione (33) non preserva Sµ .
Esercizio 12.6. Con riferimento al precedente esempio, si consideri il quoziente di V sotto
l’azione (33). In questo caso conviene considerare coordinate {u, v, p1 , p2 }, con
2
u = p1 eq ,
v = p1 q 1 + p2 .
(Attenzione: queste coordinate non sono simplettiche!) Le funzioni (u, p2 ) sono coordinate
sul quoziente W . Dimostrare che il campo vettoriale XdH si proietta su W , mentre i campi
s∗ e t∗ non proiettano.
Si caratterizzi inoltre il gruppo G la cui azione è data dalla formula (33).
Sulla base di questi esempi discuteremo ora un risultato riguardante la riduzione di sistemi
hamiltoniani in presenza di un’azione poissoniana. Sia (V, ω) una varietà simplettica e φ
un’azione poissoniana di un gruppo di Lie G su V . Per definizione φ ammette un’applicazione
momento J Ad∗ -equivariante. Sia µ un fissato elemento di g∗ e sia Sµ = J −1 (µ). Supponendo
che µ sia un valore regolare di J, il sottoinsieme Sµ ⊂ V è una sottovarietà regolarmente
immersa. Come abbiamo visto nel precedente esempio, non è detto che φ lasci Sµ invariata,
in quanto in generale l’azione del gruppo cambia il valore di µ. Introduciamo allora il gruppo
di isotropia di Sµ rispetto all’azione coaggiunta,
Gµ = {g ∈ G | Ad∗g µ = µ} .
∗
∗
Poiché Gµ = χ−1
µ (µ), essendo χµ : G → g l’applicazione χµ (g) = Adg µ, Gµ è un sottogruppo
∗
chiuso di G, ed è pertanto un gruppo di Lie. Per la Ad -equivarianza di J si ha φg (Sµ ) ⊂
Sµ se g ∈ Gµ (infatti se x ∈ Sµ vale J(φg (x)) = Ad∗g J(x) = Ad∗g µ = µ); ciò definisce
un’applicazione differenziabile Gµ × Sµ → Sµ , che è un’azione φµ di Gµ su Sµ . Supponiamo
infine che quest’azione sia libera e propria, in modo che il quoziente Vµ = Sµ /Gµ sia una
varietà differenziabile. La dimensione di Vµ è
(34)
dim Vµ = dim Sµ − dim Gµ = dim V − dim G − dim Gµ .
Siano ιµ : Sµ → V l’immersione della sottovarietà Sµ , e πµ : Sµ → Vµ la proiezione sullo spazio
quoziente.
I.42
Proposizione 12.7. (Teorema di Marsden-Weinstein) Sotto le ipotesi enunciate nella precedente discussione, e sotto l’ulteriore ipotesi che G sia compatto e connesso,
(1) esiste un’unica forma simplettica ωµ su Vµ tale che πµ∗ ωµ = ι∗µ ω.
(2) Se H è una funzione differenziabile su V invariante sotto l’azione φ di G, allora il flusso
{ψt } di XdH lascia Sµ invariata e commuta con l’azione di Gµ su Sµ , inducendo un flusso
{ψ̂t } su Vµ . Tale flusso è hamiltoniano, e la sua funzione hamiltoniana Hµ è la proiezione di
H su Vµ , ovvero, verifica la condizione Hµ ◦ πµ = H ◦ ιµ .
Dimostrazione della parte (2). Incominciamo col dimostrare la parte (2), assumendo già
dimostrata la parte (1). Il flusso {ψt } di XdH lascia Sµ invariata perché XdH (J) = {H, J} = 0.
Poiché H è invariante sotto l’azione di G, il gruppo Gµ è un gruppo di simmetria per XdH |Sµ ,
ovvero, Gµ commuta con i diffeomorfismi {ψt |Sµ }. Risulta pertanto indotto un flusso “ridotto”
{ψ̂t } su Vµ . Sia Xµ il generatore di questo flusso. Nuovamente per la sua G-invarianza, H
induce una funzione Hµ su Vµ tale che Hµ ◦ πµ = H ◦ ιµ .
Rimane da mostrare che Xµ è hamiltoniano con funzione hamiltoniana Hµ . Sia y ∈ Vµ , e
sia x ∈ Sµ tale che πµ (x) = y. Dato Y ∈ Ty Vµ sia Ỹ ∈ Tx Sµ tale che (πµ )∗ Ỹ = Y . Vale allora
ωµ (Xµ (y), Y ) = ωµ (πµ ∗ XdH (x), (πµ )∗ Ỹ ) = (πµ∗ ωµ )(XdH (x), Ỹ )
= (ι∗µ ω)(XdH (x), Ỹ )
= ω(XdH (x), Ỹ )
perché Ỹ , XdH sono tangenti a Sµ
= < Ỹ , dH(x) > = < Ỹ , ι∗µ dH(x) > = < Ỹ , πµ∗ dHµ (y) >
= < Y, dHµ (y) > ,
ovvero, Xµ = XdHµ .
La rimanente parte del presente paragrafo sarà dedicata alla dimostrazione della parte
(1) del teorema di Marsden-Weinstein. Studiamo in primo luogo il caso “lineare”, ovvero,
consideriamo uno spazio vettoriale E con una forma simplettica ω. Per ogni sottospazio
vettoriale F ⊂ E definiamo il suo complemento simplettico come il sottospazio vettoriale di
E
F ω = {u ∈ E | ω(u, v) = 0 per ogni v ∈ F } .
Definizione 12.8. Un sottospazio vettoriale F di E è detto
— isotropo se F ⊂ F ω
— coisotropo se F ω ⊂ F
— simplettico se F ∩ F ω = {0}
— lagrangiano se F = F ω .
Esercizio 12.9. Dimostrare che (F ω )ω = F . Di conseguenza, il complemento simplettico di
un sottospazio isotropo è coisotropo, e viceversa.
Ogni sottospazio coisotropo dà luogo ad un nuovo spazio vettoriale simplettico.
Lemma 12.10. Se F è sottospazio coisotropo di E, ι : F → E l’inclusione, e π : F → F 0 la
proiezione sul quoziente F 0 = F/F ω , quest’ultimo ammette un’unica forma simplettica ω 0 tale
che π ∗ ω 0 = ι∗ ω.
I.43
Dimostrazione. Se v ∈ F ω e w ∈ F vale ω(v, w) = 0. Allora, denotando con [w] la classe in
F 0 di un elemento ω ∈ F , possiamo definire ω 0 ([w1 ], [w2 ]) = ω(w1 , w2 ). Se ω 0 ([w1 ], [w2 ]) = 0
per ogni [w2 ] ∈ F 0 allora ω(w1 , w2 ) = 0 per ogni w2 ∈ F , per cui w1 ∈ F ω , e [w1 ] = 0. La
forma ω 0 verifica la condizione π ∗ ω 0 = ι∗ ω per costruzione. L’unicità segue dal fatto che π ∗ è
iniettiva.
Passiamo ora al caso delle varietà. Una sottovarietà Q di una varietà simplettica (V, ω) è
detta isotropa (coisotropa) se per ogni x ∈ Q lo spazio tangente Tx Q è isotropo (coisotropo)
in Tx V .
Consideriamo il caso di una sottovarietà coisotropa Q. Definiamo in Q la distribuzione (nel
senso del teorema di Frobenius) ∆Q data da ∆Q (x) = (Tx Q)ω .
Lemma 12.11. La distribuzione ∆Q è integrabile.
Dimostrazione. Siano X, Y campi vettoriali su Q che stanno in ∆Q . Poiché ω è chiusa
abbiamo, per ogni campo vettoriale Z su Q,
0 = dω(X, Y, Z) = X(ω(Y, Z)) + Z(ω(X, Y )) + Y (ω(Z, X))
+ ω([Y, Z], X) + ω([X, Y ], Z) + ω([Z, X], Y ) .
Essendo Q coisotropa si ha ω(Y, Z) = ω(X, Y ) = ω(Z, X) = 0. Anche i termini ω([Y, Z], X) e
ω([Z, X], Y ) si annullano perché [Y, Z] e [Z, X] sono campi vettoriali su Q. Quindi ω([X, Y ], Z)
= 0, e [X, Y ] ∈ ∆Q .
Essendo ∆Q integrabile, ne possiamo considerare le varietà integrali massimali.30 In virtù
del precedente Lemma e del teorema di Frobenius, la varietà Q ammette una foliazione le
cui foglie sono sottovarietà isotrope di Q. Diciamo che Q è regolare se ognuna di queste
foglie è una sottovarietà regolarmente immersa di Q, compatta e connessa. In questo caso, se
definiamo una relazione di equivalenza in Q ponendo x1 ∼ x2 se x1 e x2 stanno sulla stessa
foglia, il quoziente Q/ ∼ è una varietà differenziabile.
Lemma 12.12. Se Q è una sottovarietà coisotropa regolare di una varietà simplettica V , il
quoziente Q/ ∼ è una varietà simplettica.
Dimostrazione. Sia p : Q → V 0 = Q/ ∼ la proiezione sul quoziente. Se y = p(x) lo spazio
tangente Ty V 0 è isomorfo al quoziente Tx Q/∆Q (x). Per il Lemma 12.10 in Ty V 0 c’è un’unica
forma simplettica ω 0 (y) tale che p∗ ω 0 (y) = ι∗ ω(x), essendo ι : Q → V l’inclusione. Mettendo
in Q coordinate locali “adattate” (come si può effettivamente fare in virtù del teorema di
Frobenius), si nota che al variare di y la forma ω 0 (y) è differenziabile. Inoltre la condizione
p∗ ω 0 (y) = ι∗ ω(x), essendo p∗ iniettiva, implica che ω 0 sia chiusa. Quindi ω 0 è una forma
simplettica su V 0 .
30Una varietà integrale W di una distribuzione integrabile ∆ si dice massimale se ogni varietà integrale di
∆ passante per un punto x ∈ W è contenuta in W . Per costruzione, per ogni punto x ∈ V passa una sola
varietà integrale massimale. Una varietà integrale massimale è spesso detta “foglia”, e si dice che V ammette
una “foliazione”.
I.44
Dimostrazione della parte (1) del teorema di Marsden-Weinstein: il caso µ = 0. Cominciamo
col dimostrare il teorema di Marsden-Weinstein quando µ = 0. Il gruppo di isotropia coincide
allora con G, e la dimensione del quoziente V0 = S0 /G è
dim V0 = dim V − 2 dim G .
(35)
Sia x ∈ S0 , e sia Ox l’orbita dell’azione di G su x; si ha Ox ⊂ S0 . Lo spazio tangente Tx Ox
è generato dai valori ξ ∗ (x) dei campi vettoriali fondamentali al variare di ξ in g. Vogliamo
mostrare che Tx Ox è il complemento simplettico di Tx S0 . Infatti essendo J(x) = 0 vale
fξ (x) = 0 per ogni ξ ∈ g e pertanto ω(Xdfξ , Y ) = dfξ (Y ) = 0 per ogni Y ∈ Tx S0 , il che
implica Tx Ox ⊂ (Tx S0 )ω . Ma i due spazi vettoriali hanno la stessa dimensione, e quindi
coincidono.
Essendo (Tx S0 )ω = Tx Ox ⊂ Tx S0 , la sottovarietà S0 è coisotropa. La foglie della foliazione
isotropa di S0 sono quindi le orbite di G; in base alle ipotesi fatte (G è compatto e connesso
e la sua azione è libera), le orbite sono sottovarietà compatte regolarmente immerse, ovvero,
S0 è una sottovarietà coisotropa regolare.
Il risultato cercato segue ora dal Lemma 12.12. L’unicità di ω0 segue nuovamente dall’iniettività di π0∗ .
Una generalizzazione. La versione appena dimostrata del teorema di Marsden-Weinstein
(ovvero il caso µ = 0) ammette una generalizzazione del seguente tipo. Sia O un’orbita
dell’azione coaggiunta di G su g∗ tale che ogni punto di O sia un valore regolare di J. Allora
SO = J −1 (O) è una sottovarietà regolarmente immersa di V , invariante sotto l’azione di G.
Si assuma inoltre che G sia compatto e che la sua azione su SO sia libera.
Proposizione 12.13. Sotto le ipotesi sopra menzionate, il quoziente VO = SO /G è una
varietà simplettica di dimensione
dim VO = dim V + dim O − 2 dim G .
(36)
Per dimostrare questo enunciato avremo bisogno di alcuni risultati circa le orbite coaggiunte
in g∗ . Consideriamo in particolare le orbite sotto l’azione destra di G su g∗
$g (Γ) = Ad∗g Γ
(37)
per ogni
Γ ∈ g∗ .
Essendo queste orbite chiuse, esse sono delle varietà regolarmente immerse di g∗ . Su ogni
orbita O si può definire una forma simplettica. Lo spazio tangente a O in Γ ∈ O si può
identificare come
TΓ O = {ad∗ξ Γ |ξ ∈ g} ;
infatti i campi vettoriali fondamentali dell’azione coaggiunta sono proprio dati da
d
∗
∗
ξ (Γ) =
Adexp sξ Γ
ds
s=0
e vale, per ogni η ∈ g,
< η, ξ ∗ (Γ) > =
d
< Adexp sξ η, Γ >
= < adξ η, Γ > = < η, ad∗ξ Γ >.
ds
s=0
I.45
Lemma 12.14. La 2-forma differenziale Ω definita su O dalla condizione
ΩΓ (ξ ∗ , η ∗ ) = ΩΓ (ad∗ξ Γ, ad∗η Γ) = −< [ξ, η], Γ >
è non degenere e chiusa.
Dimostrazione. Dimostriamo che Ω è non degenere. Fissato Γ ∈ g∗ sia ΩΓ (ξ ∗ , η ∗ ) = 0 per
ogni η ∈ g. Allora
< η, ad∗ξ Γ > = −ΩΓ (ξ ∗ , η ∗ ) = 0
per ogni η ∈ g ;
pertanto ξ ∗ (Γ) = ad∗ξ Γ = 0.
Dimostriamo ora che dΩ = 0. Per ogni λ, ξ, η ∈ g si ha
dΩ(λ∗ , ξ ∗ , η ∗ ) = λ∗ (Ω(ξ ∗ , η ∗ )) + permutazioni cicliche
− (Ω(λ∗ , [ξ ∗ , η ∗ ]) + permutazioni cicliche).
Essendo
d
∗
λ (Ω(ξ , η ))Γ =
= < [λ, [ξ, η]], Γ >
< [ξ, η], Adexp sλ Γ >
ds
s=0
Ω(λ∗ , [ξ ∗ , η ∗ ]) = < [λ, [ξ, η]], Γ >
∗
∗
∗
si ha dΩ(λ∗ , ξ ∗ , η ∗ ) = 0.
Avremo più avanti bisogno del seguente risultato.
Proposizione 12.15. La forma simplettica Ω definita su un’orbita coaggiunta soddisfa la
seguente relazione di Ad∗ -invarianza:
$g∗ (Ω$g (Γ) ) = ΩΓ .
In altri termini, la rappresentazione coaggiunta di G agisce su O per simplettomorfismi
rispetto alla forma simplettica Ω.
Dimostrazione. Cominciamo col notare che i campi vettoriali fondamentali verificano la proprietà di Ad∗ -equivarianza
($g )∗ ξ ∗ = (Adg−1 ξ)∗ ,
o, più precisamente,
($g )∗ ξ ∗ ($g−1 (Γ)) = (Adg−1 ξ)∗ (Γ)
per ogni ξ ∈ g, Γ ∈ g∗ , g ∈ G. Si ha infatti
d
d
∗
(Adg−1 ξ) (Γ) =
$exp s Adg−1 ξ (Γ)
=
$ −1
(Γ)
ds
ds g (exp sξ)g
s=0
s=0
d
=
$g ◦ $exp sξ ◦ $g−1 (Γ)
= ($g )∗ ξ ∗ ($g−1 (Γ)) .
ds
s=0
Si calcola allora
($g∗ Ω$g (Γ) )(ξ ∗ (Γ), η ∗ (Γ)) = Ω$g (Γ) (($g )∗ ξ ∗ (Γ), ($g )∗ η ∗ (Γ))
= −< [Adg−1 ξ, Adg−1 η], Ad∗g Γ > = −< Adg−1 [ξ, η], Ad∗g Γ >
= ΩΓ (ξ ∗ (Γ), η ∗ (Γ)) .
I.46
I campi vettoriali fondamentali dell’azione (37) di G su O sono la restrizione dei campi
{ξ ∗ , ξ ∈ g} a O; questi sono hamiltoniani, con funzione hamiltoniana fξ (Γ) = < ξ, Γ >.
Infatti per ogni η ∈ g si ha
d
∗
∗
∗
dfξ (η )Γ = η (fξ )Γ =
fξ (Adexp sη Γ)
ds
s=0
d
=
< ξ, Ad∗exp sη Γ >
= −< [ξ, η], Γ > = ΩΓ (ξ ∗ , η ∗ )
ds
s=0
e quindi Xdfξ = ξ ∗ . La corrispondente applicazione momento JO : O → g∗ è l’inclusione
naturale.
Dimostriamo infine che l’azione (37) è poissoniana. Si ha
{fξ , fη }Γ = −Ω(Xdfξ , Xdfη )Γ = −Ω(ξ ∗ , η ∗ )Γ
= < [ξ, η], Γ > = f[ξ,η] (Γ).
D’altra parte l’applicazione momento è ovviamente Ad∗ -invariante:
JO ◦ $g (Γ) = Ad∗g Γ = Ad∗g JO (Γ) .
Dimostrazione della Proposizione 12.13. Lo spazio VO è una varietà differenziabile come
conseguenza delle ipotesi riassunte prima dell’enunciato della Proposizione. Costruiamo ora
la forma simplettica ωO su VO . Per ogni ξ ∈ g denotiamo con Xξ il campo vettoriale fondamentale associato all’azione di G su V e con ξ ∗ il campo vettoriale fondamentale associato
all’azione coaggiunta di G su O.
Si consideri la varietà Ṽ = V × O dotata della forma simplettica ω̃ = ω ⊕ (−Ω), essendo
ω la forma simplettica di V , e Ω la forma simplettica di O precedentemente descritta. Il
gruppo G agisce su Ṽ per simplettomorfismi (cfr. in particolare la Proposizione 12.15), e la
˜ Γ) = J(x)−JO (Γ) = J(x)−Γ.
corrispondente applicazione momento J˜: Ṽ → g∗ è data da J(x,
La restrizione a SO dell’applicazione
V → V × g∗ ,
x 7→ (x, J(x))
stabilisce un diffeomorfismo SO → J˜−1 (0), il cui inverso è la restrizione a J˜−1 (0) della proiezione V × O → V . Si ha pertanto un diffeomorfismo VO ' J˜−1 (0)/G, e dalla formula (35)
segue che la dimensione di VO è data dall’equazione (36).
Per il teorema di Marsden-Weinsten nel caso µ = 0, che già abbiamo dimostrato, esiste su
J˜−1 (0)/G un’unica forma simplettica ω0 tale che
(38)
π̃ ∗ ω0 = ι̃∗ ω̃ .
Identificando VO con J˜−1 (0)/G otteniamo la forma simplettica richiesta.
Dimostrazione della Proposizione 12.7 (teorema di Marsden-Weinstein per un qualsiasi valore di µ ∈ g∗ ). Sia Oµ l’orbita di µ in g∗ . Riconduciamo la Proposizione 12.7 alla 12.13,
dimostrando in primo luogo che J −1 (µ)/Gµ ' J −1 (Oµ )/G, ovvero, Vµ ' VOµ . Notiamo che
J −1 (µ) ⊂ J −1 (Oµ ). Sia π 0 : J −1 (Oµ ) → J −1 (Oµ )/G la proiezione sul quoziente, e sia y ∈ Vµ .
I.47
Se x ∈ J −1 (µ) è tale che πµ (x) = y, l’elemento π 0 (x) ∈ J −1 (Oµ )/G non dipende dalla scelta
di x in πµ−1 (y). Definiamo allora un’applicazione
α : J −1 (µ)/Gµ → J −1 (Oµ )/G,
y 7→ π 0 (x).
Viceversa, se z ∈ J −1 (Oµ )/G, sia x ∈ J −1 (Oµ ) tale che π 0 (x) = z, e sia Γ = J(x). Esiste
g ∈ G tale che Ad∗g Γ = µ; allora φg (x) ∈ J −1 (µ). Definiamo un’applicazione
β : J −1 (Oµ )/G → J −1 (µ)/Gµ ,
z 7→ πµ (φg (x)) .
Le due applicazioni sono entrambe differenziabili, e sono l’una l’inverso dell’altra; di conseguenza le varietà J −1 (µ)/Gµ e J −1 (Oµ )/G sono diffeomorfe.
Consideriamo adesso il diagramma commutativo
πOµ
ι̃
πµ
ιµ
VOµ ←−−−− SOµ −−−−→ V × Oµ
x
x
x

j
̃
α


Vµ ←−−−− Sµ −−−−→
V
dove le applicazioni j e ̃ sono rispettivamente l’inclusione naturale e l’applicazione ̃(x) =
(x, J(x)) (si noti che per ogni x ∈ Sµ vale ̃ ◦ ιµ (x) = (x, µ), e che pertanto ι∗µ ω = ι∗µ ◦ ̃∗ ω̃).
Inoltre πOµ è la naturale proiezione sul quoziente.
Definiamo ωµ = α∗ ωO . Dalla (38) e dalla commutatività del precedente diagramma segue
la condizione πµ∗ ωµ = ι∗µ ω.
I.48
Capitolo I
SISTEMI COMPLETAMENTE INTEGRABILI
L’integrabilità di un sistema di 2n equazioni alle derivate ordinarie equivale alla conoscenza
di 2n integrali primi. Quando queste equazioni sono di tipo canonico (nel senso che si possono
scrivere sotto forma di equazioni di Hamilton), è a volte sufficiente conoscere a priori solo n
integrali primi. Ciò accade nel caso dei cosiddetti sistemi completamente integrabili. Un
esempio di tale situazione, che esamineremo nel primo paragrafo, si incontra nell’ambito della
teoria della riduzione che abbiamo studiato nel precedente capitolo. I seguenti paragrafi
forniranno poi un’introduzione generale alla teoria dei sistemi completamente integrabili.
13. Il teorema di Jacobi-Liouville
Sia (V, ω) una varietà simplettica, di dimensione 2n, e siano f1 , . . . , fr funzioni differenziabili
su V che sono in involuzione, ovvero, {fi , fj } = 0 per ogni i, j = 1, . . . , r. Supponiamo che
(i)
i campo vettoriali hamiltoniani associati X (i) = Xdfi siano completi, e sia {ψs } il flusso di
X (i) . Poiché 0 = Xd{fi , fj } = [X (i) , X (j) ], i campi X (i) commutano, e pertanto commutano
anche i loro flussi:
(j)
(j)
ψs(i) ◦ ψw
= ψw
◦ ψs(i)
per ogni i, j = 1, . . . , r, e ogni s, w ∈ R .
Possiamo definire un’azione φ di G = Rr su V , ponendo
φ(s1 ,...,sr ) (x) = ψs(1)
◦ · · · ◦ ψs(r)
(x) .
r
1
Essendo G abeliano, l’azione φ è poissoniana; l’applicazione momento è
J : V → Rr ,
J(x) = (f1 (x), . . . , fr (x)).
Supponiamo che µ = (µ1 , . . . , µr ) ∈ Rr sia un valore regolare di J. Con riferimento alla
notazione impiegata nel precedente capitolo a proposito del teorema di Marsden-Weinstein,
la sottovarietà Sµ ⊂ V è regolarmente immersa; inoltre in questo caso Gµ = G, e i campi
vettoriali X (i) sono tangenti a Sµ e indipendenti in ogni punto. Di conseguenza l’azione di G
su Sµ è localmente libera,31 e una varietà quoziente di dimensione 2(n − r)(che assumiamo
essere liscia) esiste almeno localmente.
Sia H una funzione su V , in involuzione con tutte le funzioni fi (ovvero, {H, fi } = 0,
i = 1, . . . , r); in altri termini, le funzioni fi sono costanti del moto per l’evoluzione del sistema
31L’azione ρ di un gruppo G su una varietà V è localmente libera se per ogni punto x ∈ V il gruppo di
isotropia Gx è discreto. Non è difficile dimostrare che se i generatori dell’azione di G su V sono linearmente
indipendenti in ogni punto allora l’azione è localmente libera.
I.49
dinamico dato dalla funzione H. Il teorema di Marsden-Weinstein permette di ridurre di 2r
l’ordine del sistema associato al campo vettoriale XdH . Si può mostrare che il sistema residuo è
integrabile per quadrature.32,33 Se r = n il sistema ridotto scompare, ed il sistema è integrabile
per quadrature.
14. Il teorema di Liouville-Arnold
Motivati dalla precedente discussione, definiamo la nozione di sistema completamente integrabile come segue. Sia V il fibrato cotangente di una varietà differenziabile n-dimensionale
Q, sia ω la forma simplettica canonica di V = T ∗ Q, e si fissi una funzione hamiltoniana H.
Fissati una n-pla di funzioni fi : V → R, i = 1, . . . , n e un punto µ = (µ1 , . . . , µn ) ∈ Rn ,
poniamo Sµ = f −1 (µ), essendo
f : V → Rn ,
f (x) = (f1 (x), . . . , fn (x)) .
Definizione 14.1. Diciamo che il sistema dinamico hamiltonianiano (V, ω, H) è completamente integrabile in un aperto U ⊂ V se esistono n costanti del moto f1 , . . . , fn (si assume
f1 ≡ H) soddisfacenti le seguenti condizioni:
(1) le funzioni fi sono in involuzione, {fi , fj } = 0 per ogni i, j = 1, . . . , n;
(2) per ogni x ∈ U i covettori dfi (x) ∈ Tx∗ (V ) sono linearmente indipendenti.34
Proposizione 14.2. Dato un sistema completamente integrabile in U ⊂ V , sia µ = (µ1 , . . . ,
µn ) ∈ f (U ) ⊂ Rn , e sia Sµ = f −1 (µ). Allora
(1) Sµ è una sottovarietà regolarmente immersa di V , invariante sotto i flussi dei campi
vettoriali Xdfi .
Se si assume inoltre che la varietà Sµ sia compatta e connessa,
(2) Sµ è diffeomorfa al toro n-dimensionale;
(3) l’evoluzione temporale avviene su Sµ ,35 e determina su Sµ un flusso condizionalmente
periodico; ovvero, esistono coordinate (ψ 1 , . . . , ψ n ) su Sµ , e costanti ν 1 , . . . , ν n , funzione dei
valori µ1 , . . . , µn , tali che l’evoluzione sia descritta su Sµ dalle relazioni
(39)
ψ i (t) = ν i t + ψ0i
dove le quantità ψ0i sono costanti;36
(4) le equazioni del moto del sistema sono integrabili per quadrature.
32Si veda ad es. P.J. Olver, Applications of Lie groups to differential equations, Springer-Verlag.
33Si dice che un sistema di equazioni differenziali è integrabile per quadrature se esso può essere risolto
mediante una successione di operazioni di tipo algebrico, inversioni di funzioni e calcoli di integrali.
34Quando questa condizione è soddisfatta si dice che le costanti del moto f sono indipendenti in U .
i
35Per questo motivo la sottovarietà S è detta essere un toro invariante del sistema integrabile.
µ
36Le equazioni (39) esprimono il fatto che in coordinate angolari il moto appare essere condizionalmente
periodico (o quasi-periodico). Notiamo che in generale le costanti ν i dipendono dai dati iniziali, e non solo
dalla struttura del sistema meccanico. È pertanto possibile che per opportuni dati iniziali le frequenze ν i siano
tutte commensurabili, ovvero, che i quozienti ν i /ν j siano tutti razionali. In questo caso dopo un certo tempo il
sistema si ritrova nelle condizioni iniziali, ed esibisce un comportamento periodico; per questo motivo il moto
è detto “condizionalmente periodico”.
I.50
Dimostrazione del punto (1). Essendo i covettori dfi (x) linearmente indipendenti per x ∈ U ,
l’applicazione f|U : U → Im f|U è una summersione, e Sµ è una sottovarietà regolarmente
immersa di V . Poniamo X (i) = Xdfi . Essendo
< X (i) , dfj > = X (i) (fj ) = {fi , fj } = 0
i campi vettoriali X (i) sono tangenti a Sµ , il che equivale a dire che Sµ è preservata dai loro
flussi.
Per ogni x ∈ Sµ , i vettori X (i) (x) sono linearmente indipendenti e quindi formano una base
dello spazio tangente Tx Sµ . Detta ι : Sµ → V l’applicazione che realizza Sµ come sottovarietà
di V , si ha
(ι∗ ω)(X (i) , X (j) ) = {fj , fi }(x) = 0 ,
ovvero ι∗ ω = 0; lo spazio Tx Sµ è un sottospazio isotropo di Tx V . Essendo dim Tx V =
2 dim Tx Sµ lo spazio Tx Sµ è in realtà un sottospazio lagrangiano, ovvero, Sµ è una sottovarietà
lagrangiana di V .
15. Dimostrazione del punto (2)
Cominciamo con l’introdurre alcune nozioni e risultati che saranno utili per dimostrare la
parte (2) del teorema di Liouville-Arnold. Ricordiamo che un reticolo Λ di rango k in Rn è
un sottogruppo di Rn generato su Z da k vettori linearmente {e1 , . . . , ek } di Rn :
( k
)
X
Λ=
mi ei , m1 , . . . , mk ∈ Z .
i=1
Il toro n-dimensionale
n.37,38
Tn
è definito come il quoziente Rn /Λ, essendo Λ un reticolo di rango
Definizione 15.1. Un sottogruppo Γ di Rn è detto discreto se ogni compatto di Rn contiene
solo un numero finito di elementi di Γ.
Evidentemente ogni reticolo di rango k è un sottogruppo discreto di Rn , con k ≤ n; anche
l’implicazione opposta è vera.
Lemma 15.2. Ogni sottogruppo discreto Γ di Rn è un reticolo.
37Ricordiamo che T n viene topologizzato mediante la topologia quoziente, mentre la struttura differenziabile
viene fissata dalla condizione che sia differenziabile l’applicazione
φ : π(Z) → Rn ,
φ(x) = (x1 , . . . , xn )
se
x = π(
n
X
xi ei )
i=1
essendo π : Rn → T n la proiezione, e Z ⊂ Rn la “cella elementare aperta” del reticolo, ovvero
k
X
Z = { xi ei ,
0 < xi < 1} .
i=1
Diversi reticoli di rango n danno luogo a quozienti diffeomorfi.
Ricordiamo inoltre che i generatori {ei } di Λ divengono sul quoziente delle curve chiuse γi , dette cicli
fondamentali del toro. I cicli fondamentali generano il primo gruppo di omotopia e il primo gruppo di omologia
a coefficienti interi del toro, entrambi isomorfi alla somma diretta di n copie di Z.
38Più avanti considereremo per convenienza il toro n-dimensionale definito come il quoziente Rn /2πΛ.
I.51
Dimostrazione. Evidentemente il punto 0 ∈ Rn sta sempre in Γ. Se Γ non ha altri punti,
abbiamo finito. Altrimenti, sia ~0 un altro punto39 di Γ. Se d1 è la distanza di ~0 dall’origine,
la sfera di raggio d1 centrata in 0 contiene un numero finito di punti di Γ. Si scelga fra questi
il punto ~1 sulla retta r = R~0 più vicino a 0, escludendo 0 (se ve ne sono due, se ne prenda
uno a caso). I punti sulla retta r sono tutti del tipo m~1 con m ∈ Z; infatti se su r vi fosse
un punto ~ compreso fra m~1 e (m + 1)~1 allora ~ − m~1 sarebbe più vicino a 0 di ~1 .
Se Γ non ha punti fuori di r, abbiamo concluso. Altrimenti se ~ 0 è un punto di Γ che non
sta in r, sia d2 la sua distanza da r, e si prenda il punto (o uno dei punti) ~2 della sfera di
raggio d2 centrata nella proiezione di ~ 0 su r più vicino a r, ma non giacente su r. Detto
π il piano passante per r e ~2 , si dimostra come prima che ogni punto di π è della forma
m1~1 + m2~2 , con m1 ed m2 interi.
Se Γ ha punti fuori da π si itera la procedura, che al più finisce all’n-simo passo.
Vogliamo adesso dimostrare il seguente risultato.
Proposizione 15.3. Sia W una varietà differenziabile n-dimensionale, connessa e compatta,
su cui sono definiti n campi vettoriali linearmente indipendenti, che commutano fra di loro.
Allora W è diffeomorfa al toro n-dimensionale.
(i)
Detti X (i) i campi vettoriali (che essendo W compatta sono completi), e Ψ i loro flussi,
possiamo definire un’azione di Rn su W fissando un punto x ∈ W e ponendo
(40)
(1)
(n)
~(x) = Ψ1 ◦ . . . Ψn (x), .
Scambiando il ruolo di ~ e x otteniamo un’applicazione
gx : Rn → W,
(1)
(n)
gx (~) = Ψ1 ◦ . . . Ψn (x) .
Lemma 15.4. Per ogni x ∈ W l’applicazione gx è
(1) iniettiva quando ristretta ad un opportuno intorno di 0 ∈ Rn
(2) surgettiva (ovvero, l’azione (40) di Rn su W è transitiva).
Dimostrazione. Notiamo che gx (0) = x. Scelte coordinate attorno a x, la matrice jacobiana di
gx in 0 è formata dalle componenti dei vettori X (i) (x) su queste coordinate. Essendo i vettori
linearmente indipendenti, la matrice ha identicamente caratteristica pari a n. Pertanto in un
intorno di 0 l’applicazione gx è un diffeomorfismo, ed in particolare è iniettiva.
Di conseguenza, ogni x ∈ W ammette un intorno aperto N tale che per ogni y ∈ N esista
un ~ ∈ Rn per cui vale y = gx (~). Per compattezza, W può essere coperto da un numero finito
di tali intorni. Inoltre, fissato y ∈ W , possiamo scegliere m+1 di questi aperti, che denotiamo
(N0 , . . . , Nm ), in modo che y ∈ Nm , x ∈ N0 , e Ni ∩ Ni+1 6= ∅, con i = 0, . . . , m − 1. Scegliamo
punti yi ∈ Ni ∩ Ni+1 e poniamo ym = y, y0 = x. Esistono ~ei ∈ Rn tali che gyi (~ei ) = yi+1 . Ciò
P
implica gx ( m−1
ei ) = y.
i=0 ~
39In questo capitolo denotiamo gli elementi di Rn sovrapponendo ad essi una freccia: cosı̀, ~
= (1 , . . . , n ).
I.52
Nota 15.5. La prima parte della precedente dimostrazione si modifica facilmente per dimostrare che l’applicazione gx è un diffeomorfismo locale: ogni ~ ∈ Rn ha un intorno N tale che
gx ristretta a N è un diffeomorfismo.
Definizione 15.6. Il gruppo di isotropia (o stabilità) di W in un punto x ∈ W è il sottogruppo
Γx di Rn dato da
Γx = {~ ∈ Rn t.c. gx (~) = x} .
In realtà il gruppo di isotropia Γx non dipende da x: se ~ ∈ Γy vale ~(y) = y, ma y = ~η (x)
per qualche ~η ∈ Rn , per cui
~(~η (x)) = ~η (x) ;
questa si può anche scrivere
(1)
(n)
(1)
(n)
(1)
(n)
(1)
(n)
(1)
(n)
Ψη1 ◦ . . . Ψηn (x) = Ψ1 ◦ . . . Ψn ◦ Ψη1 ◦ . . . Ψηn (x) = Ψη1 ◦ . . . Ψηn ◦ Ψ1 ◦ . . . Ψn (x)
da cui si ricava ~(x) = x, ovvero, ~ ∈ Γx e quindi Γy ⊂ Γx . Poiché vale anche Γx ⊂ Γy , si ha
Γy = Γx . Possiamo quindi parlare del gruppo di isotropia Γ di W .
Dimostriamo che Γ è discreto. Si ha ovviamente 0 ∈ Γ; essendo gx iniettiva in un intorno
di 0, esiste un intorno di 0 che non contiene altri elementi di Γ. Questo intorno contiene una
sfera piena aperta Bd (0) di raggio d, a patto che d sia sufficientemente piccolo. Se ~ è un
altro elemento di Γ, la sfera Bd (~) di raggio d centrata in ~ non contiene altri elementi di Γ
(se ~η ∈ Bd (~) allora ~η − ~ ∈ Bd (0)). Quindi Γ è un sottogruppo discreto di Rn , ed è pertanto
un reticolo.40
Dimostrazione della Proposizione 15.3. Sia π : Rn → Rn /Γ la proiezione. Fissiamo x ∈ W , e,
dato y ∈ W , scegliamo un ~ ∈ Rn tale che y = gx (~). Definiamo un’applicazione f : W → Rn /Γ
ponendo y 7→ π(~). L’applicazione è ben definita perché se anche ~η verifica y = gx (~η ) allora
~η − ~ ∈ Γ, e quindi π(~η ) = π(~).
L’applicazione f è surgettiva: se p ∈ Rn /Γ, sia ~ ∈ Rn tale che π(~) = p. Posto y = ~(x)
vale f (y) = x.
L’applicazione f è iniettiva: se f (y1 ) = f (y2 ), sia y1 = gx (~1 ), y2 = gx (~2 ). Da ciò segue
~1 − ~2 ∈ Γ. D’altra parte si ha
(1)
(n)
1
1
y1 = Ψ1 ◦ . . . Ψn (x),
(1)
(n)
2
2
y2 = Ψ1 ◦ . . . Ψn (x),
da cui y1 = gy2 (~1 − ~2 ). Essendo ~1 − ~2 ∈ Γ si ha y1 = y2 .
Quindi f è bigettiva. Inoltre f è differenziabile, ed essendo un diffeomorfismo locale (come
segue dalla Nota 15.5), il suo inverso è pure differenziabile. Quindi f è un diffeomorfismo.
Essendo W compatta, Γ ha rango n, e Rn /Γ è un toro.41
Nota 15.7. Fissato come al solito x ∈ W , i parametri 1 , . . . , n possono essere usati come
coordinate su un intorno aperto Z di x in W . Mediante l’identificazione W ' Rn /Γ, queste
40Si noti che Rn /Γ ' T k × Rn−k , essendo k il rango di Γ.
41Ciò in realtà dimostra che se non assumiamo che W sia compatta, dimostriamo che W è diffeomorfa ad
un prodotto T k × Rn−k per un k compreso fra 0 ed n. In questo caso però, venendo a mancare la compattezza,
dobbiamo assumere che i campi vettoriali X (i) siano completi. Anche la dimostrazione del punto (1) del Lemma
15.4 andrebbe modificata.
I.53
coordinate si identificano con le coordinate angolari sul toro Rn /Γ indotte dai generatori di
Γ, e per Z si può prendere la cella elementare del reticolo.
Notiamo inoltre che, avendo assunto che la costante del moto f1 coincida con l’hamiltoniana
H, il parametro 1 si può identificare con il tempo t.
Possiamo adesso dimostrare il punto (2) della Proposizione 14.2. I campi vettoriali X (i)
commutano fra loro anche una volta ristretti a Sµ . Siamo allora nelle ipotesi della Proposizione
15.3, e il punto (2) della Proposizione 14.2 rimane provato.
16. Variabili azione-angolo
Possiamo fissare in U (eventualmente restringendo quest’ultimo) 2n funzioni (φ1 , . . . , φn , f1 ,
. . . , fn ) che ristrette ad ogni Sµ (con µ ∈ f (U )) costituiscono un sistema di coordinate su Sµ ,
e che insieme alle funzioni (f1 , . . . , fn ) forniscono un sistema di coordinate in U . In generale
queste coordinate non sono simplettiche; se cosı̀ fosse, in queste coordinate le equazioni del
moto di Hamilton assumerebbero la forma canonica
dφi
∂H
=
= ν̃ i ,
dt
∂fi
dfi
∂H
=− i =0
dt
∂φ
dove le ν̃ i sono costanti durante dell’evoluzione. Ricordando che H = f1 si ha
ν̃ i =
dφi
∂H
=
= δ1i ,
dt
∂fi
ovvero, una sola delle “frequenze” ν̃ i è diversa da zero, il che in generale è falso.
È possibile però sostituire le coordinate (φ1 , . . . , φn ) con nuove coordinate angolari (ψ 1 , . . . ,
e le funzioni f1 , . . . , fn con nuove funzioni I1 , . . . , In , da esse dipendenti, in modo che le
2n funzioni (ψ 1 , . . . , ψ n , I1 , . . . , In ) siano un sistema di coordinate simplettiche, dette variabili
azione-angolo . Come discuteremo più avanti, mediante l’introduzione di tali coordinate
dimostreremo anche il punto (4) del teorema di Liouville-Arnold.
ψ n ),
Esempio 16.1. Cominciamo con l’introdurre queste coordinate in un semplice esempio unidimensionale, un oscillatore armonico con funzione hamiltoniana H = 21 p2 + 12 q 2 . Lo spazio
delle fasi V di questo sistema è diffeomorfo a R2 ; la funzione H è indipendente dove dH 6= 0,
ovvero, fuori dall’origine. La condizione di involutività è banalmente verificata. In questo
caso i tori invarianti sono le circonferenze H = costante, e ogni toro invariante si identifica
con il suo ciclo fondamentale γ1 . Introduciamo in V coordinate polari ponendo
p = r cos φ,
q = r sin φ;
evidentemente φ è una coordinata angolare sui tori invarianti. Se poniamo I = 21 r2 = H la
forma simplettica si scrive
ω = dp ∧ dq = dI ∧ dφ,
per cui le funzioni (φ, I) formano, sullo stesso aperto su cui sono definite le coordinate polari,
un sistema di coordinate simplettiche, ovvero, sono coordinate azione-angolo (in questo caso
queste coordinate coincidono con le coordinate (φ, f1 = I) del precedente paragrafo).
I.54
Vediamo ora di trovare una trasformazione canonica42 che produca la trasformazione di
coordinate (q, p) 7→ (φ, I). Se assumiamo che questa trasformazione canonica sia descritta da
una funzione generatrice W (q, I) di seconda specie, devono valere le relazioni
(41)
p=
∂W
,
∂q
φ=
∂W
.
∂I
L’hamiltoniana trasformata è I, per cui deve valere l’equazione di Hamilton-Jacobi
dW 2 1 2
1
+ 2q = I
2
dq
dove vediamo la funzione incognita W come funzione di q con una “dipendenza parametrica”
da I. Questa equazione è evidentemente risolta dalla funzione
Z p
W (q, I) =
2I − q 2 dq ;
in particolare si ha
∂W
=
∂I
Z
dq
q
p
= arc sin √ = φ .
2
2 I
2I − q
R
La funzione W si può scrivere W = p dq (come si vede anche direttamente dalle equazioni
(41) pensando di fissare il valore di I), ed essendo p dq la forma di Liouville (forma presimplettica), in un certo senso W è l’integrale della forma di Liouville. Si noti come l’integrale
Z 2π
H
p dq =
r2 cos2 φ dφ = π r2 = 2π I
0
fornisca 2π volte la variabile I, e allo stesso tempo coincida con l’area della regione di V
H
contenuta nel toro invariante definito dal valore r della coordinata radiale. Il simbolo
rappresenta l’integrale lungo il ciclo fondamentale. Infine notiamo che la variabile I dipende
solo da H (in questo caso vale addirittura I = H).
Definizione 16.2. Sia dato un sistema completamente integrabile, con integrali primi in
involuzione f1 , . . . , fn . Un sistema di coordinate locali simplettiche {ψ 1 , . . . , ψ n , I1 , . . . , In } è
un sistema di variabili azione-angolo se
1) le coordinate Ij , dette azioni,43 dipendono solo dai valori degli integrali primi fi ;
2) le funzioni {ψ 1 , . . . , ψ n } sono coordinate angolari sui tori invarianti, ovvero, dato un toro
invariante S, esiste un diffeomorfismo S → Rn /2πΛ che identifica le funzioni {ψ 1 , . . . , ψ n }
con le coordinate angolari naturali di Rn /2πΛ; Λ è il reticolo “standard” generato dalla base
canonica di Rn .
42Usiamo qui il fatto che ogni diffeomorfismo di una varietà differenziabile induce una trasformazione di
coordinate; in particolare, se f è un diffeomorfismo di Rn , la sua rappresentazione y i = y i (x1 , . . . , xn ) nelle
coordinate canoniche di Rn permette di vedere le y i come un nuovo sistema di coordinate su Rn ; le “coordinate
y” di un punto p ∈ Rn sono le “coordinate x” di f (p). Le teoria delle funzioni generatrici delle trasformazioni
canoniche viene svolta in questo modo.
43Il termine “azione” proviene dal fatto che le funzioni I hanno le dimensioni fisiche un’azione (energia per
j
tempo), come segue dalla scrittura locale θ = pi dq i .
I.55
Procediamo adesso alla costruzione delle variabili azione-angolo. Si fissino valori µ1 , . . . , µn
degli integrali primi in modo da determinare un toro invariante S, e si scelgano su S coordinate angolari {φ1 , . . . , φn } con i corrispondenti cicli fondamentali γi , i = 1, . . . , n; il ciclo
fondamentale γi ha equazione
φi (ξ) = ξ,
φj (ξ) = 0
per
j 6= i .
Sia θ la forma di Liouville di V = T ∗ Q, cosicché ω = dθ. Detta ι : S → V l’immersione locale,
poniamo θS = ι∗ θ. Si noti che dθS = ι∗ ω = 0. Definiamo infine la j-esima variabile d’azione
come
Z
1
(42)
Ij (µ1 , . . . , µn ) =
θS .
2π γj
Le variabili d’azione sono indipendenti dalla scelta delle coordinate angolari {φ1 , . . . , φn }.
Questo si può vedere con un argomento omologico: i cicli fondamentali γi0 associati ad un
diverso sistema di coordinate angolari si possono deformare con continuità nei γi , e pertanto
sono ad essi omologhi; i valori degli integrali (42) non cambiano. Esplicitamente, ciò siginifica
che l’unione dei due cicli γi e γi0 (uno dei due preso con orientazione rovesciata) è la frontiera
di una regione Σ di S. Si ha allora44
Z
Z
Z
Z
θS =
θS =
dθS = 0 .
θS −
γj0
∂Σ
γj
Σ
Le variabili (I1 , . . . , In ) verranno completate ad un sistema di coordinate, ed è pertanto
necessario assumere che esse dipendano in maniera bigettiva dalle coordinate (f1 , . . . , fn ).
Faremo quindi la seguente assunzione:
per ogni µ = (µ1 , . . . , µn ) ∈ f (U ) la matrice jacobiana
∂Ij
∂µk
è non singolare.
Facendoci guidare dall’esempio 1, determiniamo adesso coordinate angolari (ψ 1 , . . . , ψ n ) in
modo che insieme alle azioni (I1 , . . . , In ) esse formino un sistema di coordinate simplettiche.
Fissiamo un sistema di coordinate simplettiche (q 1 , . . . , q n , p1 , . . . , pn ) in V . Notiamo inoltre
che, essendo la forma θS chiusa, localmente essa è esatta. In particolare, detto Z l’aperto di
S corrispondente alla cella fondamentale, su di Z vale θS = dW per un’opportuna funzione
W . Fissato ad arbitrio un punto P0 ∈ Z abbiamo quindi
Z P
W (P ) =
θS
P0
dove P ∈ Z. Il cammino di integrazione da P0 a P può essere scelto ad arbitrio essendo θS
chiusa (ovviamente il cammino di integrazione deve essere completamente contenuto in Z,
e, in particolare, non si deve “avvolgere” attorno al toro). Se adesso riguardiamo W come
44Usiamo qui il teorema di Stokes: se η è una (k − 1)-forma differenziale su una varietà differenziabile orien-
tabile k-dimensionale V , e U è un aperto a chiusura compatta di V , la cui frontiera è una varietà differenziabile
orientabile di dimensione k − 1, vale
Z
Z
η=
dη .
∂U
U
Il teorema di Stokes della geometria differenziale rappresenta una generalizzazione, ed una enunciazione
unificata, dei vari teoremi di Gauss, Stokes, Green etc. dell’analisi matematica.
I.56
la funzione generatrice di seconda specie di una trasformazione canonica, che trasforma le
coordinate (q, p) in nuove coordinate simplettiche (ψ 1 , . . . , ψ n , I1 , . . . , In ), abbiamo le relazioni
(43)
pi =
∂W
,
∂q i
ψj =
∂W
∂Ij
dove vediamo W come funzione di (q 1 , . . . , q n , I1 , . . . , In ). Si noti che in generale le coordinate
pi non sono delle buone variabili di azione perché non assumono valori costanti lungo i tori
invarianti. Il secondo gruppo di equazioni determina i “nuovi” angoli ψ j .
R
Lemma 16.3. Le variabili ψ j soddisfano la condizione γi dψ j = 2π δij .
Dimostrazione. Esprimendo le quantità ψ j in funzione delle q e delle I, dalle equazioni (43)
si ottiene
Z
Z
Z j
∂ψ
∂ψ j
∂2W
k
dψ j =
dq
+
dq k
dI
=
k
k
k ∂I
∂I
∂q
∂q
j
k
γi
γi
γi
Z
∂
∂I
i
=
pk dq k = 2π
= 2π δij .
∂Ij γi
∂Ij
(Si è usato il fatto che dIk|S = 0.)
Le funzioni ψ j sono coordinate su S, e, a causa del precedente Lemma, il loro valore viene
incrementato di 2π quando si faccia “un giro” attorno ad un ciclo del toro. Esse sono pertanto
coordinate angolari; l’isomorfismo con il quoziente Rn /2πΛ (cfr. Definizione 16.2) è dato, in
un certo senso tautologicamente, dalle coordinate ψ j stesse.
Scrittura delle equazioni del moto. Essendo le variabili azione-angolo delle coordinate
simplettiche, le equazioni del moto assumono in esse la forma canonica
(44)
∂H
I˙j = − j ,
∂ψ
ψ̇ j =
∂H
.
∂Ij
Dal primo gruppo di queste, essendo le variabili d’azione costanti durante il moto, vediamo
come la funzione hamiltoniana sia ciclica in tutte le variabili d’angolo; ritroviamo in questo
contesto il risultato secondo il quale se la funzione hamiltoniana è ciclica in una variabile, il
momento cinetico coniugato è un integrale primo. Ritroviamo quindi il fatto che la funzione
hamiltoniana è esprimibile solo in termini delle variabili d’azione, H = H(I1 , . . . , In ) (questo
era già chiaro in precedenza, poiché le funzioni (f1 , . . . , fn ) si esprimono solo in funzione delle
azioni, e H = f1 ).
Dal secondo gruppo delle equazioni (44) segue che ψ̇ j = costante. Posto
ν j (I1 , . . . , In ) =
∂H
∂Ij
troviamo allora
ψ j (t) = ν j t + ψ0j
dimostrando cosı̀ il punto 3 della Proposizione 14.2. In particolare, vediamo come le frequenze
dei moti condizionalmente periodici di un sistema completamente integrabile si possono determinare scrivendo la funzione hamiltoniana del sistema in termini delle variabili d’azione,
e calcolandone poi le derivate rispetto a queste.
I.57
Dimostrazione del punto (4) della Proposizione 14.2. Tutte le operazioni che abbiamo
eseguito sono di tipo algebrico, oppure sono consistite nell’invertire o integrare funzioni note.
Inoltre, le variabili d’azione evolvono in modo banale, mantenendosi costanti durante l’evoluzione temporale, mentre le variabili angolari ψ j evolvono in maniera lineare, con frequenze
ricavabili nel modo appena descritto. In questo senso, il problema di integrare le equazioni
del moto del sistema è stato ricondotto alle quadrature, dimostrando l’ultima affermazione
del teorema di Liouville-Arnold.
Esempio 16.4. Consideriamo nuovamente l’oscillatore armonico, questa volta tenendo conto
di tutti i parametri da cui esso dipende. Scriviamo quindi una funzione hamiltoniana
p2
+ 1 mν 2 q 2
2m 2
essendo ν la pulsazione dell’oscillatore. I tori invarianti sono ellissi nel piano (p, q), aventi
equazione
p2
mν 2 q 2
+
=1
2mh
2h
essendo h un valore fissato dell’energia. Queste sono ellissi di semiassi
r
√
2h
b=
a = 2mh,
.
mν 2
La variabile d’azione è
I
1
area dell’ellisse
ab
h
I=
p dq =
=
= .
2π
2π
2
ν
H=
La funzione hamiltoniana si scrive45 H = Iν, ed effettivamente ν =
∂H
∂I
.
Esempio 16.5. Lo spazio delle fasi di un pendolo piano è un cilindro V = S 1 × R, con
coordinate (q, p) e forma simplettica ω = dp ∧ dq. Mettendo a 1 tutte le costanti fisiche la
funzione hamiltoniana si scrive H = 21 p2 − cos q. L’integrale primo H è indipendente quando
dH = p dp + sin q dq 6= 0;
vanno quindi esclusi i punti di V dati da p = 0, q = 0, ±π. Il punto O, dato da q = p = 0,
corrisponde all’origine nella figura 1, mentre i due rimanenti punti sono in realtà lo stesso
punto P sul cilindro. Il punto O corrisponde alla quiete nella posizione di equilibrio stabile,
mentre il punto P corrisponde alla quiete nella posizione di equilibrio instabile.
I tori invarianti, disegnati in figura, hanno equazione H = 21 p2 − cos q = c; i “tori degeneri”
sono dati da c = −1 (l’origine) e c = 1 (in questo caso il toro non è liscio, esattamente nei
punti dove H non è indipendente). Il toro H = 1 divide il cilindro in tre regioni, denotate
A, B e C in figura. A e C sono diffeomorfe ad un cilindro, mentre B è diffeomorfa a R2 . In
ognuna di queste regioni si possono introdurre variabili di azione-angolo. I moti del pendolo
che avvengono nella regione B sono detti oscillazioni, mentre quelli che avvengono nelle regioni
A e C sono detti rotazioni (il pendolo, giunto alla sommità q = π, continua il moto nella stessa
direzione di rotazione). Le regioni A e C corrispondono a rotazioni nei due versi opposti.
45Il lettore che abbia conoscenze di meccanica quantistica potrà cogliere l’analogia con la relazione di de
Broglie E = hν, essendo h (costante di Planck) il quanto elementare di azione. In effetti il formalismo delle
variabili di azione-angolo è alla base delle cosiddette regole di quantizzazione di Bohr, che svolsero un ruolo
fondamentale nella formulazione della meccanica quantistica.
I.58
Esempio 16.6. (Completa integrabilità del sistema di Keplero) Consideriamo il sistema meccanico composto da un punto materiale che si muove in un campo conservativo di forze centrali.
È noto che un tale punto materiale si muove in un piano (il piano passante per il centro di
forza e normale al vettore momento angolare, che si conserva). Lo spazio delle configurazioni
è Q = R2 − {0} e lo spazio delle fasi (fibrato cotangente) V = T ∗ Q è diffeomorfo a R4 privato
di un piano bidimensionale. Poste in Q coordinate polari ρ, ϑ, risultano definite su V coordinate simplettiche ρ, ϑ, pρ , pϑ (in realtà queste coordinate sono definite su un sottoinsieme
aperto proprio ma denso di V ). La funzione hamiltoniana è
H=
p2ρ
p2ρ
p2
+ ϑ 2 + V (ρ) =
+ Ṽ (ρ)
2m 2mρ
2m
essendo V l’energia potenziale della forza centrale, e avendo definito
Ṽ (ρ) = V (ρ) +
p2ϑ
.
2mρ2
Le funzioni H e pϑ sono costanti del moto; vale {H, pϑ } = 0 proprio in quanto pϑ è una
costante del moto (vale infatti ṗϑ = −{H, pϑ }; oppure si noti che {ρ, pϑ } = {pϑ , pϑ } =
{pρ , pϑ } = 0). Le due costanti del moto sono indipendenti dove la matrice
!
pρ
pϑ
−Ṽ 0 (ρ) 0
m
mρ2
0
1
0
0
ha caratteristica pari a 2. Ciò accade nell’unione degli aperti {pρ 6= 0} e {Ṽ 0 (ρ) 6= 0}. In
questa regione di V è definito un sistema completamente integrabile.
Assumiamo che V abbia la forma
V (ρ) = −α ρ−β
con α > 0, 0 < β < 2 .
La funzione Ṽ ha l’andamento mostrato in figura 2. Le costanti ρ∗ , µ∗1 il cui significato è
mostrato in figura 2 hanno i valori
1
2 2−β
µ2
µ2 mαβ 2(2−β)
mαβ β(2−β)
∗
ρ =
,
µ∗1 = 2
−
α
mαβ
2m
µ22
µ22
dove µ2 è il valore costante di pϑ . Denotiamo con µ1 il valore costante di H durante un moto.
Analizzando la figura 2 possiamo trarre delle conclusioni qualitative circa il moto:
1) non esistono moti con µ < µ∗1 .
2) Se µ = µ∗1 il moto avviene su una traiettoria circolare di raggio ρ∗ .
3) Se µ1 ≥ 0 il moto non è limitato; la varietà S è una superficie bidimensionale non
compatta.
4) Se µ∗1 < µ1 < 0 il moto avviene in una regione limitata. Ci possiamo aspettare che in
questo caso S sia una superficie bidimensionale compatta. Infatti dalla conservazione della
funzione H troviamo che
p
pρ = ± 2mµ1 ρ2 + 2mαρ2−β − µ2 .
Il radicando di questa espressione ha due radici positive, che forniscono i valori ρ− , ρ+ (vedi
figura 2); per ρ− < ρ < ρ+ il radicando è positivo, ed ha un solo massimo. Ciò significa che
I.59
le condizioni H = µ1 = costante, pϑ = µ2 = costante determinano una superficie diffeomorfa
ad un toro, esplicitamente realizzata incollando lungo i bordi due copie della corona circolare
{(ρ, ϑ) | ρ− ≤ ρ ≤ ρ+ , 0 ≤ ϑ ≤ 2π}
(cfr. figura 3).
Calcolo delle azioni. Fissiamo su S due cicli γ1 , γ2 , rispettivamente dati dalle condizioni
ϑ = costante, ρ = costante. Le azioni risultano essere
r
Z
Z
1
1 ρ+
(45)
I1 (µ1 , µ2 ) =
pρ dρ =
2m µ1 − Ṽµ2 (ρ) dρ
2π γ1
π ρ−
1
I2 (µ1 , µ2 ) =
2π
avendo posto Ṽµ2 (ρ) =
µ22
2mρ2
Z
pϑ dθ = µ2
γ2
− V (ρ) per evidenziare la dipendenza dal valore di µ2 .
Per β = 1 (caso kepleriano) anche l’azione I1 si può scrivere esplicitamente, risolvendo
l’integrale (45):
r
m
− µ2 ;
I1 (µ1 , µ2 ) = α −
2µ1
la funzione hamiltoniana si scrive in termini delle azioni nella forma
H=−
mα2
.
2(I1 + I2 )2
Le frequenze sono
ν1 =
1
∂H
∂H
mα2
= (−2mµ1 )3/2 .
=
= ν2 =
3
∂I1
∂I2
(I1 + I2 )
α
Le due frequenze sono uguali, il che implica che la traiettoria (orbita) sia una curva chiusa;
in questo senso, il moto è periodico.
Calcolo degli angoli. Per impostare il calcolo degli angoli scriviamo la funzione generatrice
W . Scegliamo come punto di partenza per l’integrazione il punto (ρ = ρ− , ϑ = 0) di S. Si ha:
Z ρr
Z (ρ,ϑ)
W (ρ, ϑ, I1 , I2 ) =
2m µ1 − Ṽµ2 (ξ) dξ
(pρ dρ + pϑ ϑ) = µ2 ϑ +
(ρ− ,0)
ρ−
se pρ > 0 (ovvero sulla metà superiore del toro)
Z
(ρ,ϑ)
W (ρ, ϑ, I1 , I2 ) =
(pρ dρ + pϑ ϑ)
(ρ, 0)
Z
ρ+
r
Z
ρ
2m µ1 − Ṽµ2 (ξ) dξ −
= µ2 ϑ +
ρ−
r
2m µ1 − Ṽµ2 (ξ) dξ
ρ+
se pρ < 0 (ovvero sulla metà inferiore del toro)
I.60
dove i membri di destra dipendono da I1 , I2 tramite i valori µ1 , µ2 . Limitandoci per semplicità
al caso pρ > 0 otteniamo
∂W
ψ =
=
∂I1
1
Z
ρ
= mν
ρ−
ψ2 =
Z
ρ
ρ−
1
m ∂µ
∂I1
r
dξ
2m µ1 − Ṽµ2 (ξ)
dξ
r
2m µ1 − Ṽµ2 (ξ)
∂W
=ϑ+
∂I2
Z
ρ
ρ−
2m ∂I∂2 µ1 − Ṽµ2 (ξ)
r
dξ
2m µ1 − Ṽµ2 (ξ)
Nel caso kepleriano (β = 1) è possibile risolvere esplicitamente i due integrali.
Figura 1
I.61
Figura 2
Figura 3