Dipartimento di Matematica Università degli Studi di Genova U. Bruzzo — M. Pedroni Appunti del Corso di Istituzioni di Fisica Matematica (2o modulo) Anno Accademico 1997–98 I.1 Capitolo I GRUPPI DI LIE Molto spesso si incontrano gruppi i cui elementi dipendono in maniera regolare da un certo numero di parametri (per esempio, gli elementi di una matrice di rotazione in tre dimensioni si possono esprimere in funzione degli angoli di Eulero che parametrizzano la rotazione). La nozione di gruppo di Lie rende rigorosa questa constatazione euristica. Un gruppo di Lie è sostanzialmente un gruppo che è allo stesso tempo una varietà differenziabile, in modo che le due strutture siano compatibili. 1. Prime definizioni Un gruppo di Lie G è una varietà differenziabile dotata di una struttura di gruppo in modo tale che l’applicazione (1) ψ : G × G → G, ψ(g, h) = gh−1 sia differenziabile (in questo capitolo tutte le applicazioni differenziabili saranno di classe C ∞ ). La differenziabilità dell’applicazione (1) fa sı̀ che siano differenziabili anche (i) l’applicazione che prende l’inverso, ι(g) = g −1 , in quanto questa si può scrivere ι(g) = ψ(e, g), essendo e l’elemento identità di G; (ii) l’applicazione prodotto π(g, h) = gh, in quanto si può scrivere π(g, h) = ψ(g, ι(h)). Un omomorfismo φ : G → H di gruppi di Lie è un’applicazione differenziabile che è anche un omomorfismo di gruppi, ovvero, φ(gh) = φ(g)φ(h) (ponendo h = eG , questa implica φ(eG ) = eH ). Un isomorfismo di gruppi di Lie è un diffeomorfismo che è anche un omomorfismo di gruppi (l’applicazione inversa φ−1 : H → G è automaticamente un omomorfismo di gruppi). Esempio 1.1. Uno spazio vettoriale V su R di dimensione finita, con la sua struttura differenziabile canonica e la struttura gruppale data dalla somma, è un gruppo di Lie (abeliano). In particolare ciò vale per Rn . Esempio 1.2. Il toro n-dimensionale T n = Rn /Zn ' S 1 ×· · ·×S 1 è un gruppo di Lie (abeliano e compatto). Esempio 1.3. Siano 2 gl(n, R) = {matrici reali n × n} ' Rn Gl(n, R) = {matrici reali n × n invertibili} det : gl(n, R) → R l’applicazione determinante. I.2 Gl(n, R) = gl(n, R) \ det−1 (0) è un aperto di gl(n, R), e quindi è una varietà differenziabile. Si 2 può mettere su Gl(n, R) un sistema di coordinate “tautologico” {xi j } a valori in Rn , che ad ogni matrice M associa i suoi n2 coefficienti, M 7→ {M ij }. Il prodotto di matrici è polinomiale, mentre l’inverso di una matrice è una funzione razionale degli elementi di matrice; entrambe le operazioni sono C ∞ . Pertanto Gl(n, R) è un gruppo di Lie di dimensione n2 . Nello stesso modo si definisce il gruppo Gl(n, C), formato dalle matrici n × n invertibili a coefficienti complessi. Gl(n, C) è un gruppo di Lie di dimensione 2n2 , ed è un aperto in gl(n, C), lo spazio vettoriale delle matrici n × n a coefficienti complessi. Ogni elemento g ∈ G definisce un’operazione di trasporto sinistro Lg : G → G, Lg (h) = gh Rg : G → G, Rg (h) = hg. e una di trasporto destro Si hanno le ovvie relazioni Lg1 ◦ Lg2 = Lg1 g2 , Rg1 ◦ Rg2 = Rg2 g1 , Le = Re = idG , Lg1 ◦ Rg2 = Rg2 ◦ Lg1 . Per ogni g ∈ G le applicazioni Lg ed Rg sono diffeomorfismi, e vale Lg−1 = (Lg )−1 , Rg−1 = (Rg )−1 . I differenziali (Lg )∗ ed (Rg )∗ agiscono sui campi vettoriali su G. Definizione 1.4. Un campo vettoriale X su G è detto invariante a sinistra se (Lg )∗ X = X per ogni g ∈ G; invariante a destra se (Rg )∗ X = X (scrivendo esplicitamente la dipendenza dal posto, si ha rispettivamente (Lg )∗ X(h) = X(gh) e (Rg )∗ X(h) = X(hg)). Esercizio 1.5. Consideriamo ancora su Gl(n, R) il sistema di coordinate “tautologico” {xi j } 2 a valori in Rn , che ad ogni matrice M associa i suoi n2 coefficienti, M 7→ {M ij }. Dimostrare che i campi vettoriali ∂ X ij (M ) = M kj ∂xki sono invarianti a sinistra. Sottogruppi. Sia G un gruppo di Lie. Un sottogruppo H di G (in senso algebrico) è un sottogruppo di Lie di G se l’inclusione H ,→ G realizza H come sottovarietà di G.1,2 Esempio 1.6. I seguenti sono sottogruppi di Lie di Gl(n, R):3 (i) O(n, R) = matrici reali n × n che sono ortogonali, ovvero verificano R R̃ = In , essendo R̃ la matrice trasposta di R, e In la matrice identità n × n. O(n, R) è il sottogruppo di Gl(n, R) 1Siano V , W varietà differenziabili, e sia ι : V → W un’applicazione differenziabile iniettiva. Diciamo che la coppia (V, ι) è una sottovarietà di W se l’applicazione lineare (ι∗ )x : Tx V → Tι(x) W è iniettiva. Per esempi e controesempi si veda W. Boothby, An introduction to Riemannian Geometry. 2Nel seguito, qualora ciò non dia adito a confusione, diremo spesso “sottogruppo” intendendo “sottogruppo di Lie”. 3La dimostrazione che i seguenti esempi siano effettivamente dei sottogruppi di Lie di Gl(n, R) verrà data più avanti. I.3 che preserva il prodotto scalare canonico di Rn : si ha Ru · Rv = u · v per ogni u, v ∈ Rn se e solo se R ∈ O(n, R). (ii) SO(n, R) = matrici in O(n, R) aventi determinante uguale a 1; (iii) Sl(n, R) = matrici in Gl(n, R) aventi determinante uguale a 1; (iv) le matrici reali n × n triangolari superiori (inferiori) invertibili. Dato un gruppo di Lie G, ed un sottogruppo algebrico H di G, si pone in generale la questione se H possa essere realizzato come sottogruppo di Lie di G. In altri termini, ci chiediamo se sia possibile mettere su H una struttura differenziabile in modo che H sia un gruppo di Lie, e l’immersione H ,→ G sia differenziabile. La risposta è sempre affermativa quando H è un sottoinsieme chiuso di G. Ciò è espresso dal seguente risultato, che enunciamo senza dimostrazione (cf. Warner, Foundations of differentiable manifolds and Lie groups). Proposizione 1.7. Sia H un sottogruppo algebrico di un gruppo di Lie G. Se H è chiuso in G, esiste su H un’unica struttura differenziabile che rende H un sottogruppo di Lie di G. 2. Algebre di Lie Un’algebra di Lie è un’algebra a su R, in generale non associativa, non necessariamente di dimensione finita, tale che, denotando [α, β] il prodotto nell’algebra, questo verifica le seguenti condizioni: (i) antisimmetria: [α, β] = −[β, α] per ogni α, β ∈ a; (ii) identità di Jacobi: [α, [β, γ]] + [γ, [α, β]] + [β, [γ, α]] = 0 per ogni α, β, γ ∈ a . L’operazione bilineare [· , ·] è detta commutatore o parentesi di Lie. Esempio 2.1. Ogni spazio vettoriale, dotato della parentesi di Lie banale [α, β] = 0, è un’algebra di Lie (detta abeliana). Esempio 2.2. Lo spazio vettoriale X(V ) dei campi vettoriali su una varietà differenziabile V , con la parentesi di Lie data dal commutatore dei campi vettoriali visti come derivazioni, [X, Y ](f ) = X(Y (f )) − Y (X(f )) , è un’algebra di Lie infinito-dimensionale (f è una qualunque funzione differenziabile). Esempio 2.3. Sia {e1 , e2 , e3 } la base canonica di R3 . Stabiliamo un isomorfismo di spazi vettoriali Λ2 R3 → R3 ponendo e1 ∧ e2 7→ e3 , e2 ∧ e3 7→ e1 , e3 ∧ e1 7→ e2 . Via quest’isomorfismo il prodotto wedge di elementi di R3 induce un prodotto bilineare R3 ⊗ R3 → R3 , usualmente detto prodotto vettore, che denoteremo con lo stesso simbolo del prodotto wedge. Il prodotto vettore è evidentemente antisimmetrico, ed inoltre vale (2) (u ∧ v) ∧ w + (w ∧ u) ∧ v + (v ∧ w) ∧ u = 0 , I.4 come è facile dimostrare prendendo come u, v, w gli elementi della base canonica. Con questo prodotto R3 diventa un’algebra di Lie (in particolare la proprietà (2) è l’identità di Jacobi), che denoteremo r. Esempio 2.4. Denotiamo (x1 , . . . , xn , y1 , . . . , yn ) le coordinate canoniche di R2n . Sullo spazio vettoriale F(R2n ) delle funzioni C ∞ su R2n definiamo le parentesi di Poisson ∂f ∂g ∂g ∂f {f, g} = − i . i ∂x ∂yi ∂x ∂yi La proprietà di antisimmetria {f, g} = −{g, h} è evidente, mentre la verifica dell’identità di Jacobi richiede un calcolo un poco laborioso. F(R2n ) con le parentesi di Poisson è un’algebra di Lie infinito-dimensionale. Esempio 2.5. Lo spazio gl(n, R) delle matrici n × n reali, con la parentesi di Lie data dal commutatore [A, B] = AB − BA, è un algebra di Lie. gl(n, R) ammette svariati sottospazi vettoriali che sono chiusi rispetto alla parentesi di Lie (ovvero, detto b un tale sottospazio, [b, b] ⊂ b. Questi sottospazi sono allora delle sottoalgebre). Ad esempio: (i) o(n, R) = {matrici n × n antisimmetriche} (ii) sl(n, R) = {matrici n × n aventi traccia nulla} (iii) le matrici n × n reali triangolari superiori (inferiori). Definizione 2.6. Siano a, b algebre di Lie. Un omomorfismo φ : a → b è un’applicazione lineare tale che [φ(α), φ(β)] = φ([α, β]). Se φ è bigettivo, viene detto isomorfismo di algebre di Lie. Esercizio 2.7. Mostrare che l’applicazione r → o(3, R), 0 c −b 1 a e1 + b e2 + c e3 7→ −c 0 a 2 b −a 0 stabilisce un isomorfismo di algebre di Lie. Esercizio 2.8. Con riferimento agli Esempi 2.2 e 2.4, mostrare che l’applicazione lineare ∂f ∂ ∂f ∂ F(R2n ) → X(R2n ), f 7→ − i ∂x ∂yi ∂yi ∂xi è un omomorfismo di algebre di Lie. 3. Algebra di Lie di un gruppo di Lie Vogliamo vedere come ad ogni gruppo di Lie G si possa associare una algebra di Lie che in qualche modo rappresenta la struttura di G in maniera infinitesima. Facciamo una premessa introducendo la nozione di campi vettoriali correlati. Data un’applicazione differenziabile φ : V → W , un campo vettoriale X su V e un campo vettoriale Y su W , diciamo che X e Y sono φ-correlati se φ∗ X(p) = Yφ(p) per ogni p ∈ V . Sotto questa ipotesi si ha I.5 Lemma 3.1. Se {ψt } è il flusso di X, e χt il flusso di Y , si ha φ ◦ ψt = χt ◦ φ. Dimostrazione. Per ogni x ∈ V il campo vettoriale Y è tangente sia alla curva χt ◦ φ sia alla curva φ ◦ ψt , e per l’unicità del flusso locale dei campi vettoriali si ha la tesi. Lemma 3.2. Se X1 , Y1 sono φ-correlati, e X2 , Y2 sono φ-correlati, allora [X1 , X2 ] e [Y1 , Y2 ] sono φ-correlati. Dimostrazione. Faremo uso dell’identità dω(X, Y ) = X(< Y, ω >) − Y (< X, ω >)− < [X, Y ], ω > valida per ogni 1-forma differenziale ω ed ogni coppia di campi vettoriali X, Y . Data una funzione f su W , si ha la catena di uguaglianze φ∗ ([X1 , X2 ])(f ) =< [X1 , X2 ], dφ∗ (f ) > = X1 (< X2 , dφ∗ (f ) >) − X2 (< X1 , dφ∗ (f ) >) = X1 (φ∗ (< φ∗ (X2 ), df >)) − X2 (φ∗ (< φ∗ (X1 ), df >)) = φ∗ (X1 )(< φ∗ (X2 ), df >) − φ∗ (X2 )(< φ∗ (X1 ), df >) = [Y1 , Y2 ](f ) . Dire che X è campo vettoriale invariante a sinistra su un gruppo di Lie equivale a dire che X è Lg -correlato a se stesso per ogni g ∈ G. Dal Lemma 3.2 segue che il commutatore di due campi vettoriali invarianti a sinistra è anch’esso invariante a sinistra. Lo spazio vettoriale dei campi vettoriali invarianti a sinistra pertanto è chiuso rispetto al commutatore, e con esso costituisce un’algebra di Lie g, detta l’algebra di Lie di G. Esempio 3.3. Dalla definizione T n = Rn /Zn segue che sull’aperto denso U del toro T n , corrispondente alla cella fondamentale del reticolo Zn , sono definite coordinate {x1 , . . . , xn } indotte dalle coordinate canoniche di Rn . In queste coordinate il prodotto gruppale è rappresentato dall’addizione delle coordinate. In campi vettoriali invarianti a sinistra sono i campi vettoriali che in queste coordinate hanno componenti costanti (è sufficiente verificare questo su U perché quest’ultimo è denso). Tali campi commutano fra di loro, e pertanto l’algebra di Lie di T n è isomorfa a Rn con la parentesi di Lie banale. Per uso futuro notiamo che se le componenti di un campo vettoriale invariante a sinistra P X sono linearmente indipendenti su Z (ovvero se i mi X i = 0 con mi ∈ Z implica X i = 0) allora la curva integrale γ X di X è densa in T n . Se n = 2 e γ X non è densa, allora è chiusa (per n = 2 il fatto che le componenti di X siano linearmente indipendenti su Z significa che X 1 , X 2 6= 0 e X 1 /X 2 è irrazionale). L’esistenza di campi vettoriali invarianti a sinistra su ogni gruppo di Lie G (cioè la non banalità della corrispondente algebra di Lie g) segue dal fatto che g si può identificare, come spazio vettoriale, con lo spazio tangente Te G. I.6 Proposizione 3.4. L’applicazione lineare g → Te G X 7→ X(e) è un isomorfismo. Dimostrazione. L’applicazione sopra definita è lineare e surgettiva; infatti, se Y ∈ Te G, la condizione X(g) = (Lg )∗ Y definisce un campo vettoriale invariante a sinistra. Rimane da dimostrare che se X(e) = 0, allora X è il campo vettoriale nullo. Ciò segue da X(g) = (Lg )∗ X(e). Come prima conseguenza abbiamo che dim g = dim G.4 Esempio 3.5. Da quanto detto segue che un campo vettoriale invariante a sinistra non nullo non si annulla in alcun punto. Dalla topologia differenziale sappiamo che un campo vettoriale sulla sfera S 2 si annulla almeno in due punti. Pertanto S 2 non ammette alcuna struttura di gruppo di Lie. Dal precedente teorema segue anche che su un gruppo di Lie G di dimensione n siano sempre definiti n campi vettoriali linearmente indipendenti in ogni punto, cosicché il fibrato tangente T G è sempre banale. Ciò implica per esempio che l’unica varietà differenziabile bidimensionale, orientabile, compatta e connessa che ammetta una struttura di gruppo di Lie è il toro T 2 . Applicazione esponenziale. L’algebra di Lie g di un gruppo di Lie G “approssima” il gruppo in un intorno dell’identità. Questa affermazione euristica si può rendere precisa in termini della cosiddetta applicazione esponenziale. Lemma 3.6. Ogni campo vettoriale invariante a sinistra su G è completo. (Ricordiamo che un campo vettoriale su una varietà differenziabile V è completo se le sue curve integrali sono definite per ogni valore del loro argomento. In tal caso la famiglia delle curve integrali costituisce un gruppo ad un parametro di diffeomorfismi di V .) Dimostrazione. Sia X un campo vettoriale invariante a sinistra. Se γ : (−, ) → G è una curva integrale di X per e, allora Lg ◦ γ è una curva integrale di X per g. È cosı̀ sufficiente considerare il caso di curve per e. È inoltre sufficiente dimostrare che se γ è definita per due valori s e t del parametro, è definita anche in s + t. Si ponga γ̃(t) = γ(s)γ(t) (dove γ(s) e 4Seguendo una convenzione ormai del tutto consolidata, abbiamo definito l’algebra di Lie di un gruppo di Lie come l’algebra dei campi vettoriali invarianti a sinistra. Si potrebbe nello stesso modo considerare l’algebra gr dei campi vettoriali invarianti a destra. Anche gr risulta isomorfa allo spazio tangente Te G, e pertanto si ∼ gr . Le due strutture di algebra sono però diverse; detto [ , ]r il ha un isomorfismo di spazi vettoriali φ : g → commutatore in gr , si ha φ([α, β]) = −[φ(α), φ(β)]r (le due algebre di Lie sono anti-isomorfe). I.7 γ(t) sono moltiplicate mediante il prodotto gruppale). Allora in coordinate locali si ha ∂ ∂ d k d k x ◦ γ̃(t) = x ◦ Lγ(s) ◦ (γ(t)) dt ∂xk γ̃(t) dt ∂xk γ̃(t) " # ∂ d k = (Lγ(s) )∗ x ◦ γ(t) dt ∂xk γ̃(t) = (Lγ(s) )∗ X(γ(t)) = X(γ(s)γ(t)) = X(γ̃(t)) . Pertanto γ̃ soddisfa l’equazione delle curve integrali di X. Per il risultato di unicità, γ è definita in s + t, e vale γ(s + t) = γ̃(t) = γ(s)γ(t). Per ogni X ∈ g sia γ X la curva integrale di X per e. L’applicazione esponenziale exp : g → G è definita dalla condizione exp X = γ X (1) . Lemma 3.7. Per ogni campo vettoriale invariante a sinistra X vale γ tX (s) = γ X (ts). Dimostrazione. In coordinate locali vale d i x ◦ γ tX (s) = tX i (γ tX (s)) ds d i x ◦ γ X (ts) = tX i (γ X (ts)) ds per cui le curve γ tX (s) e γ̄(s) = γ X (ts) verificano la stessa equazione differenziale. Essendo inoltre γ tX (0) = γ̄(0), per il teorema di unicità esse coincidono. Cosı̀ exp(tX) = γ tX (1) = γ X (t), e {exp tX}t∈R si può identificare con il gruppo ad un parametro di diffeomorfismi generato da X. Più precisamente, Proposizione 3.8. Il gruppo ad un parametro di diffeomorfismi di G generato da X è dato da ψt (g) = g exp(tX) = Rexp(tX) (g). Siano G, H gruppi di Lie e g, h le corrispondenti algebre di Lie, e sia φ : G → H un omomorfismo di gruppi di Lie. Ricordando che un campo vettoriale invariante a sinistra è determinato dal sua valore nell’identità, ed essendo φ(eG ) = eH , definiamo un’applicazione lineare φ∗ : g → h ponendo Y (eH ) = φ∗ (X(eG )). Da ciò segue che X e Y sono φ-correlati.5 Pertanto vale [φ∗ (X1 ), φ∗ (X2 )] = φ∗ ([X1 , X2 ]), e φ∗ : g → h è un omomorfismo di algebre di Lie. In particolare, se G e H sono isomorfi, anche le loro algebre lo sono. Il risultato inverso non è vero: per esempio, Rn e T n hanno la stessa algebra di Lie (Rn con la parentesi di Lie banale), ma non sono evidentemente isomorfi.6 5Si ha infatti per definizione φ∗ X(g) = (Lφ(g) )∗ Y (eH ) = Y (φ(g)) . 6In realtà si dimostra che due gruppi di Lie connessi e semplicemente connessi le cui algebre di Lie sono isomorfe sono essi stessi isomorfi (Warner, op. cit.). I.8 Proposizione 3.9. Sia φ : G → H un omomorfismo di gruppi di Lie. Il seguente diagramma è commutativo φ G −−−−→ x exp H x exp φ∗ g −−−−→ h Dimostrazione. Sia X ∈ g, e siano {ψt }, {χt } i flussi di X e φ∗ X. Dal Lemma 3.1 sappiamo che χt ◦ φ = φ ◦ ψt . Inoltre per la Proposizione 3.8 per ogni h ∈ H abbiamo φ ◦ ψt (h) = φ(h exp tX) = φ(h)φ(exp tX) χt ◦ φ(h) = φ(h) exp(tφ∗ (X)) da cui la tesi. Proposizione 3.10. Sia G un gruppo di Lie. Esiste un intorno aperto U di 0 in g tale che exp stabilisce un diffeomorfismo di U con un intorno aperto di e ∈ G. Dimostrazione. Essendo exp(0) = e, ed identificando7 lo spazio tangente T0 g con g, in base al teorema della funzione inversa8 è sufficiente mostrare che il differenziale (exp∗ )0 : g → Te G è un isomorfismo. Dalla definizione di differenziale si ha d X d = = X(e) ; exp(tX) γ (t) (exp∗ )0 (X) = dt dt t=0 t=0 pertanto, identificando g con Te G, l’applicazione (exp∗ )0 è l’identità. Corollario 3.11. Se G è un sottogruppo di un gruppo di Lie H, il differenziale dell’applicazione di inclusione ι : G → H induce un omomorfismo iniettivo di algebre di Lie ι∗ : g → h. Dimostrazione. Sia U l’intorno aperto di 0 ∈ g di cui alla Proposizione 3.10. Per ogni X ∈ g esiste un numero reale non nullo α tale che αX ∈ U . Se ι∗ (X) = 0 allora ι∗ (αX) = 0. La Proposizione 3.9 e il fatto che ι sia iniettivo implicano la tesi. Esercizio 3.12. Siano X, Y campi vettoriali su una varietà differenziabile V , e siano {ψt }, {χs } i corrispondenti flussi. Dimostrare che [X, Y ] = 0 se e solo se χs ◦ ψt = ψt ◦ χs . Esempio 3.13. Sia G un gruppo di Lie abeliano, ovvero, gh = hg per ogni g, h ∈ G. Allora l’algebra di Lie g è abeliana, [X, Y ] = 0 per ogni X, Y ∈ g. Infatti, essendo g exp(tX) exp(sY ) = g exp(sY ) exp(tX), detti {ψt } e {χs } i flussi di X ed Y rispettivamente, si ha ψt ◦χs = χs ◦ψt . Ma allora [X, Y ] = 0. 7Per ogni spazio vettoriale E vi è una identificazione canonica E → ∼ T0 E data da u 7→ [tu]. 8cfr. Boothby, op. cit. I.9 4. Il gruppo generale lineare Abbiamo già visto che Gl(n, R) è un gruppo di Lie. Identifichiamo adesso la sua algebra di Lie. Ricordiamo che se A ∈ gl(n, R), allora det(I + tA) = 1 + t tr A + O(t2 ) . Se B ∈ Gl(n, R), A ∈ gl(n, R) e t è un numero reale sufficientemente piccolo, allora B + tA ∈ Gl(n, R); infatti (3) det(B + t A) = det B det(I + t B −1 A) = det B 1 + t tr(B −1 A) + O(t2 ) ; essendo det B 6= 0, se t è sufficientemente piccolo, allora det(B + tA) 6= 0. Pertanto lo spazio tangente TB Gl(n, R) si identifica con lo spazio vettoriale gl(n, R). Fissiamo in particolare B = I. Se {xi j } è il sistema di coordinate “tautologico” preceden∼ TI Gl(n, R) è data da temente introdotto, l’identificazione gl(n, R) → A 7→ A i j ∂ ∂xi j ! . I Se A ∈ gl(n, R), sia XA il campo vettoriale invariante a sinistra ad esso associato. Essendo LB (B 0 ) = BB 0 si ha (cf. Esercizio 1.5) " XA (B) = (LB )∗ Ai j ∂ ∂xi j ! # = (BA) I i j ∂ ∂xi j ! . B Prendendo il commutatore di due campi vettoriali invarianti a sinistra in un punto B ∈ Gl(n, R) si ottiene (ricordando che ∂ ∂xi j B kh = δik δhj ) B " # k 0 )k ∂(BA ∂(BA) ∂ i 0 i h h [XA , XA0 ]B = (BA) j − (BA ) j ∂xi j ∂xi j ∂xkh B h i ∂ j k m 0j k 0m = B mA j A h − B mA hA j ∂xkh B ∂ j m = B km [Amj A0 h − A0 j Ajh ] = X[A,A0 ] (B) . ∂xkh B Da ciò si deduce che anche come algebra di Lie l’algebra di Lie di Gl(n, R) è isomorfa a gl(n, R). Nello stesso modo l’algebra di Lie di Gl(n, C) si può identificare con gl(n, C). L’applicazione esponenziale di Gl(n, R). Nelle solite coordinate l’equazione differenziale soddisfatta dalle curve integrali γ XA di un campo vettoriale invariante a sinistra XA (dove A ∈ gl(n, R)) si scrive d B(t) = B(t) A . dt I.10 Questa ha soluzione B(t) = eAt , essendo l’esponenziale di matrici definito da9 (4) A e = ∞ X Ak k=0 k! . (Si noti che correttamente B(0) = I.) Per unicità del flusso locale, l’applicazione A 7→ eA non è altro che la rappresentazione in coordinate dell’applicazione exp : gl(n, R) → Gl(n, R). Una manipolazione formale della (4) permette di dimostrare il seguente risultato. Proposizione 4.1. Se A, B ∈ gl(n, R) commutano, vale eA eB = eA+B . Proposizione 4.2. Se A ∈ gl(n, R), vale det eA = etr A . Dimostrazione. È sufficiente mostrare il risultato nel caso dell’applicazione esponenziale exp : gl(n, C) → Gl(n, C), che nelle ovvie coordinate ammette anch’essa la rappresentazione (4). In questo caso possiamo usare il fatto che l’insieme ∆n ⊂ gl(n, C) delle matrici diagonalizzabili è denso in gl(n, C). Basta allora dimostrare la formula per A ∈ ∆n . D’altra parte se Q ∈ −1 Gl(n, C) si ha QeA Q−1 = eQAQ , e possiamo assumere che A sia diagonale. In questo caso la formula è evidente.10 La precedente Proposizione mostra che exp : gl(n, R) → Gl(n, R) prende valori in Gl+ (n, R), il sottogruppo di Gl(n, R) formato dalle matrici aventi determinante positivo (vedremo infatti più avanti che GL+ (n, R) è la componente connessa di Gl(n, R) che contiene l’identità. Essendo exp continua, ed exp(0) = I, è ovvio che exp prenda valori in GL+ (n, R)). Sia S(n) lo spazio vettoriale delle matrici n × n reali simmetriche, e S + (n) il sottoinsieme delle matrici simmetriche definite positive. S + (n) è aperto in S(n), e pertanto ha una struttura di varietà differenziabile. La matrice identità In sta in S + (n), e si ha un’identificazione TIn S + (n) ' S(n). Proposizione 4.3. La restrizione di exp : gl(n, R) → Gl(n, R) a S(n) stabilisce un diffeomorfismo exp : S(n) → S + (n). Dimostrazione. Nuovamente con un argomento di diagonalizzazione ci si può ridurre a dimostrare i seguenti fatti: (i) Se exp(A) = exp(B) è una matrice diagonale, allora A = B; (ii) se B è una matrice diagonale definita positiva, allora esiste una matrice diagonale A tale che B = exp(A). Entrame le affermazioni si provano applicando la funzione log. Una parentesi: summersioni e sottovarietà regolarmente immerse. Data una sottovarietà V di una varietà differenziabile W , l’insieme V ha a priori due distinte topologie: una come varietà differenziabile, ed una come sottoinsieme di W (la cosiddetta topologia relativa, i cui aperti sono le intersezioni di V con gli aperti di W ). In generale le due topologie sono i 9Nell’algebra gl(n, R) possiamo mettere la norma kAk = P i,j=1,...,n |A j |. Si vede allora che la serie nel membro di destra della seguente formula è assolutamente convergente, e definisce un’applicazione C ∞ da gl(n, R) in gl(n, R). 10Si può dimostrare lo stesso risultato mediante la Proposizione 3.9, prendendo G = Gl(n, R), H = R∗ , φ = det (e quindi φ∗ = tr). I.11 diverse. Si consideri per esempio la realizzazione di R+ (numeri reali strettamente positivi) come sottovarietà di R2 data dalla curva ottenuta raccordando le prescrizioni ( x(t) = t, y(t) = sin 1t se t ∈ (0, 1] x(t) = 0, y(t) = 3 − t se t ∈ [2, +∞) con una qualunque prescrizione per t ∈ [1, 2] che produca una immersione C ∞ . Un intervallo della curva dato da t1 < 3 < t2 è aperto nell’usuale topologia di R+ mentre non è aperto nella topologia relativa di R+ come sottoinsieme di R2 , in quanto ogni suo intorno in R2 contiene anche un altro tratto di curva. Definizione 4.4. Una sottovarietà regolarmente immersa è una sottovarietà tale che la sua topologia come varietà differenziabile e la topologia relativa coincidono. Per esempio una sfera in Rn è una sottovarietà regolarmente immersa. Un utile criterio per decidere se una sottovarietà è regolarmente immersa è dato dalla nozione di summersione. Definizione 4.5. Sia f : V → W un’applicazione differenziabile fra varietà differenziabili. Diciamo che f è una summersione se f è surgettiva e il differenziale f∗ : Tx V → Tf (x) W è surgettivo per ogni x ∈ V . In tale situazione, dato y ∈ W , definiamo Sy = f −1 (y). Vale il seguente risultato, che non proviamo (per una dimostrazione si veda Warner, op. cit. o Boothby, op. cit.). Proposizione 4.6. Sy è una sottovarietà regolarmente immersa di V . Inoltre, Tx Sy = ker(f∗ )x per ogni x ∈ Sy . (Si noti che f manda tutta la varietà Sy nel punto y, per cui ogni curva in Sy viene mandata in una curva costante in W , il che implica l’isomorfismo Tx Sy = ker(f∗ )x ). Il gruppo speciale lineare. Ricordiamo che il gruppo speciale lineare di ordine n, denotato Sl(n, R), è il sottogruppo di Gl(n, R) formato da matrici avente determinante pari a uno. Lemma 4.7. L’applicazione F : Gl(n, R) → R∗ A 7→ det A è una summersione. Inoltre, (FB )∗ (A) = (det B) tr(B −1 A). Dimostrazione. F è evidentemente C ∞ e surgettiva. Calcoliamo il suo differenziale: usando l’equazione (3) si ha d (F∗ )B (A) = det (B + t A) dt t=0 d −1 = det B det (I + t B A) = det B tr(B −1 A) . dt t=0 α (F∗ )B è surgettivo per ogni B, come segue dall’identità (F∗ )B n det B = α valida per ogni B α ∈ R. Quindi F è una summersione. I.12 Di conseguenza, Sl(n, R) = F −1 (1) è una sottovarietà regolarmente immersa di Gl(n, R), ed è un gruppo di Lie di dimensione n2 − 1. Il suo spazio tangente nell’identità (e quindi la sua algebra di Lie sl(n, R)) si identifica con lo spazio delle matrici reali n × n a traccia nulla, ker(F∗ )I = {A ∈ gl(n, R) | tr A = 0}. Si noti che, coerentemente con la Proposizione 4.2, si ha exp tA ∈ Sl(n, R) per ogni t ∈ R se e solo se tr A = 0. I gruppi ortogonali. Il gruppo ortogonale di ordine n, denotato O(n, R), è il sottogruppo di Gl(n, R) le cui matrici R verificano la condizione RR̃ = I, essendo R̃ la matrice trasposta di R. Ricordiamo che S + (n) denota l’insieme delle matrici n × n simmetriche definite positive. Lemma 4.8. L’applicazione F : Gl(n, R) → S + (n) A 7→ AÃ è una summersione. Dimostrazione. Dimostriamo che F è surgettiva. Sia B ∈ S + (n). Essendo B simmetrica esiste una matrice ortogonale Q tale che QB Q̃ sia diagonale, QB Q̃ = diag(λ1√ , . . . , λn ). Essendo √ √ B √ definita positiva i λi sono positivi. Posto C = diag( λ1 , . . . , λn ) e B = Q̃CQ, si ha F ( B) = B. Calcoliamo l’applicazione (FB )∗ : gl(n, R) → S(n): d (FB )∗ (A) = (B + t A)(B̃ + t Ã) = B Ã + AB̃ . dt t=0 (FB )∗ è surgettivo: se C ∈ S(n) allora (FB )∗ ( 12 C B̃ −1 ) = C. Quindi O(n, R) = F −1 (I) è una sottovarietà regolarmente immersa di Gl(n, R) di dimensione dim O(n, R) = dim Gl(n, R) − dim S(n) = n2 − 21 n(n + 1) = 12 n(n − 1), ed è un gruppo di Lie. Poiché (FI )∗ (B) = 0 se e solo se B + B̃ = 0, l’algebra di Lie di O(n, R) è l’algebra o(n, R) delle matrici n × n reali antisimmetriche. Essendo det O(n, R) = {±1}, O(n, R) è sconnesso. Proposizione 4.9. O(n, R) è compatto. Dimostrazione. Poiché ogni matrice ortogonale è invertibile, O(n, R) è anche l’immagine inversa di I rispetto all’applicazione gl(n, R) → S + (n), A 7→ AÃ; 2 pertanto O(n, R) è chiuso in gl(n, R) ' Rn . La condizione RR̃ = I implica X (Ri j )2 = n . i,j=1,...,n 2 Cosı̀ O(n, R) è un sottoinsieme chiuso e limitato di Rn , ed è compatto nella sua topologia relativa come sottoinsieme di gl(n, R). Essendo Gl(n, R) aperto in gl(n, R), O(n, R) è una sottovarietà regolarmente immersa di gl(n, R), ed è quindi compatto nella sua topologia originaria. I.13 Definiamo il gruppo speciale ortogonale di ordine n come SO(n, R) = {R ∈ O(n, R) | det R = 1}. Sia det : O(n, R) → {±1} la restrizione dell’applicazione determinante a O(n, R). Gli insiemi SO(n, R) = det−1 (1) e O(n, R)\SO(n, R) = det−1 (−1) sono entrambi chiusi, quindi SO(n, R) è aperto e chiuso in O(n, R), ed è allora formato dall’unione di componenti connesse di O(n, R); in particolare, essendo un aperto, è un gruppo di Lie; essendo chiuso, è compatto. Sia P la matrice P = diag(−1, 1, . . . , 1). La moltiplicazione per P definisce un omeomorfismo SO(n, R) → O(n, R) \ SO(n, R). Proposizione 4.10. SO(n, R) è connesso. Dimostrazione. Una possibile dimostrazione consiste nel considerare l’immersione ι : SO(n, R) → SO(n + 1, R) data da 1 0 R 7→ . 0 R Questa permette di definire il quoziente SO(n + 1, R)/ SO(n, R) come l’insieme delle classi di equivalenza della relazione in SO(n + 1, R) S1 ∼ S2 se S1 = S2 ι(R) per un R ∈ SO(n, R) . Nel prossimo Lemma viene mostrato che il quoziente, con la topologia quoziente, è omeomorfo alla sfera S n , (5) SO(n + 1, R)/ SO(n, R) ' S n . Ciò permette di dimostrare la tesi per induzione: SO(1, R) = {1} è connesso, e dalla (5), essendo S n connesso, segue che se SO(n, R) è connesso, anche SO(n + 1, R) lo è. In generale, dato un gruppo di Lie G ed un suo sottogruppo H, possiamo considerare in G la relazione di equivalenza g1 ∼ g2 se g1 = g2 h con h ∈ H; denotiamo G/H il quoziente. Ogni elemento di G/H rappresenta un sottoinsieme di G, la sua classe di equivalenza. Tale sottoinsieme è detto un laterale (sinistro). Il laterale sinistro che contiene g ∈ G è usualmente denotato gH. Lemma 4.11. SO(n + 1, R)/ SO(n, R) ' S n . Dimostrazione. Scriviamo un elemento di SO(n + 1, R) come a x̃ M= y R dove a è un numero reale, x, y sono vettori colonna con n elementi, e R è una matrice n × n. La condizione M̃ M = I si scrive11 (6) a2 + ỹy = 1, ax + R̃y = 0, R̃R + xx̃ = I . 11Si noti che il prodotto di un vettore riga per un vettore colonna è un numero reale, mentre il prodotto di un vettore colonna per un vettore riga è una matrice quadrata. I.14 Inoltre M ι(S) si scrive a x̃ 1 0 a x̃S M ι(S) = = . y R 0 S y RS Due elementi M1 , M2 ∈ SO(n + 1, R) sono in relazione se (7) a1 = a2 , y1 = y2 , x̃1 S = x̃2 , R1 S = R2 . Il quoziente SO(n + 1, R)/ SO(n, R) è parametrizzato dalle quantità a, y, soggette al vincolo espresso dalla prima delle relazioni (6): infatti, due elementi M1 , M2 ∈ SO(n + 1, R) tali che a1 6= a2 o y1 6= y2 corrispondono a diversi elementi del quoziente, mentre se a1 = a2 e y1 = y2 allora M1 ∼ M2 con S = R1−1 R2 (si noti che la terza delle (7) segue dalle (6)). Insiemisticamente il quoziente è isomorfo alla sfera S n . Fissiamo in S n la sua topologia usuale. Essendo SO(n+1, R) una sottovarietà regolarmente immersa di gl(n + 1, R), la sua topologia ammette una base formata dalle intersezioni di SO(n + 1, R) con gli aperti del tipo aij < Mij < bij , essendo Mij gli elementi di matrice di un elemento M ∈ SO(n + 1, R), e aij , bij numeri reali. Tali aperti vengono proiettati su aperti di S n , e di conseguenza la proiezione SO(n + 1, R) → S n è aperta. Per noti risultati di topologia generale12 ciò implica che la topologia di S n coincida con la topologia quoziente. Corollario 4.12. O(n, R) è formato da due componenti connesse. L’algebra di Lie di SO(n, R) è una sottoalgebra di o(n, R), ma ha la stessa dimensione, quindi coincide con o(n, R). Abbiamo un altro esempio di due gruppi di Lie non isomorfi aventi algebre di Lie isomorfe. Più generalmente, quando G è un gruppo di Lie non connesso, con algebra di Lie g, la componente connessa G0 di G che contiene l’identità è un gruppo di Lie, la cui algebra di Lie è isomorfa a g. Ovviamente l’applicazione esponenziale prende valori in G0 . Esercizio 4.13. Sia J la matrice reale 2n × 2n avente la struttura a blocchi n × n 0 I J= . −I 0 Dimostrare che Sp(2n, R) = {B ∈ gl(2n, R) | B̃JB = J} è un sottogruppo di Lie di Gl(2n, R) di dimensione 2n2 + n. Esso è detto gruppo simplettico di ordine n. La sua algebra di Lie è sp(2n, R) = {A ∈ gl(2n, R) | ÃJ + JA = 0} . (Cenno: in questo caso si può usare la mappa F : Gl(2n, R) → o(2n, R), B 7→ B̃JB. In particolare il differenziale (FB )∗ (A) = ÃJB + B̃JA è surgettivo, essendo F∗ (− 12 J B̃ −1 C) = C.) Ulteriori proprietà di connessione. Il gruppo Gl(n, R) ed il suo sottogruppo GL+ (n, R) hanno le stesse proprietà di connessione di O(n, R) ed SO(n, R), ovvero, GL+ (n, R) è connesso, mentre Gl(n, R) ha due componenti connesse. Queste proprietà si dimostrano mediante la cosiddetta decomposizione polare (o di Cauchy) delle matrici invertibili. 12Cfr. J. Kelley, General Topology, p. 95. I.15 Proposizione 4.14. Ogni matrice B ∈ Gl(n, R) si scrive in maniera unica nella forma B = SR, dove R ∈ O(n, R), e S ∈ S + (n). Dimostrazione. La matrice B B̃ è simmetrica definita positiva; esiste allora Q ∈ O(n, R) tale che QB B̃ Q̃ = diag(λ1 , . . . , λn ) con tutti i λi positivi. Sia Λ = diag( p p λ1 , . . . , λn ) . La matrice S = Q̃ΛQ è simmetrica definita positiva. Posto R = S −1 B si ha R̃R = B̃S −2 B = B̃ Q̃QB̃ −1 B −1 Q̃QB = I . Ciò mostra l’esistenza della decomposizione. Per dimostrare l’unicità, si supponga che sia anche B = S 0 R0 . Ciò implica S 2 = S 02 , ed essendo S, S 0 simmetriche definite positive, si ha S = S 0 , da cui anche R = R0 . Abbiamo pertanto l’isomorfismo Gl(n, R)/ O(n, R) ' S + (n). Se B = SR con B ∈ GL+ (n, R) allora det R = 1, per cui si ha un isomorfismo GL+ (n, R)/ SO(n, R) ' S + (n). Quest’ultimo mostra che GL+ (n, R) è connesso. Nuovamente, la moltiplicazione per la matrice P = diag(−1, 1, . . . , 1) stabilisce un omeomorfismo fra GL+ (n, R) e Gl(n, R) \ GL+ (n, R), e quindi Gl(n, R) ha due componenti connesse. Gruppi di matrici a coefficienti complessi. In aggiunta a Gl(n, C), il gruppo delle matrici complesse n × n invertibili, possiamo considerare svariati altri gruppi di matrici complesse: Sl(n, C), gruppo delle matrici complesse n×n di determinante uno, di dimensione 2(n2 −1), con algebra sl(n, C) (matrici complesse n × n a traccia nulla); O(n, C), gruppo delle matrici complesse n × n ortogonali; ha dimensione n(n − 1), è compatto, e la sua algebra di Lie o(n, C) è formata dalle matrici n × n a coefficienti complessi antisimmetriche. U(n) = {U ∈ gl(n, C) | U U † = I}, essendo † l’operazione di aggiunzione; ha dimensione n2 , è compatto, e ha algebra di Lie u(n) (matrici n × n complesse A anti-hermitiane, ovvero tali che A + A† = 0); SU(n) = {U ∈ U(n) | det U = 1}; ha dimensione n2 − 1, è compatto, e ha algebra di Lie su(n) (matrici n × n complesse anti-hermitiane a traccia nulla). Esercizio 4.15. Mostrare che SO(2, R) ' U(1) ' S 1 . Esempio 4.16. Vogliamo studiare in qualche dettaglio il gruppo SU(2). Poiché le matrici U in SU(2) sono tutte e sole le matrici complesse 2 × 2 tali che U −1 = U † e det U = 1, si ha la rappresentazione a b (8) SU(2) ≡ { | a, b ∈ C, |a|2 + |b|2 = 1}. −b̄ ā Pertanto SU(2) è diffeomorfo alla sfera S 3 , ed è connesso, semplicemente connesso e compatto. Analogamente, essendo l’algebra di Lie su(2) formata dalla matrici anti-hermitiane a traccia I.16 nulla, si ha la rappresentazione (9) su(2) ≡ { ix1 x2 + ix3 −x2 + ix3 −ix1 Quindi su(2) ha una base formata dalle tre matrici 0 i 0 1 σ1 = σ2 = i 0 −1 0 | x1 , x2 , x3 ∈ R}. σ3 = i 0 . 0 −i Queste sono dette matrici di Pauli e svolgono un ruolo fondamentale nel formalismo della meccanica quantistica.13 Il gruppo SU(2) agisce sullo spazio dei polinomi omogenei di grado due in due variabili a coefficienti complessi, P2 = {c0 u2 + c1 uv + c2 v 2 , c0 , c1 , c2 ∈ C} . u u L’azione è data da → A . Un semplice calcolo mostra che quest’azione lascia v v invariante il discriminante dei polinomi, c21 − 4c0 c2 . Se introduciamo nuove variabili x = −c0 + c2 , y = −i(c0 + c2 ), c0 = − 21 (x − iy), c1 = z, z = c1 , c2 = 12 (x + iy), il discriminante si scrive x2 +y 2 +z 2 . Quindi quest’azione di SU(2) preserva la forma quadratica x2 + y 2 + z 2 ; scrivendo esplicitamente la matrice che rappresenta l’azione di SU(2) sulla terna x, y, z, si vede che tutti gli elementi di matrice sono reali, ovvero, abbiamo costruito un’applicazione φ : SU(2) → O(3, R). L’applicazione φ è continua (essendo data da polinomi quadratici negli elementi di matrice di A), ed essendo SU(2) connesso, φ deve avere valori nella componente connessa con l’identità, ovvero nel gruppo SO(3, R). L’applicazione φ : SU(2) → SO(3, R) è per costruzione un omomorfismo di gruppi. Mostriamo che questo è surgettivo. Consideriamo le matrici di SU(2), dipendenti da un parametro, −iγ/2 cos β2 − sin β2 e 0 B(β) = , C(γ) = . 0 eiγ/2 β β cos 2 sin 2 Le corrispondenti rotazioni di R3 sono (10) (11) φ(B(β)) = x0 y0 z 0 0 x φ(C(γ)) = y 0 z 0 = x cos β + z sin β =y = −x sin β + z cos β = x cos γ − y sin γ = x sin γ + y cos γ =z 13In realtà, secondo le convenzioni abituali, si dicono matrici di Pauli le matrici iσ . k I.17 Queste sono rotazioni rispetto all’asse y e all’asse z di angoli β e γ, rispettivamente. Poiché ogni rotazione si può ottenere come composizione di tre rotazioni di tale tipo (teorema di Eulero),14 φ è surgettivo. Caratterizziamo il nucleo di φ (ovvero il sottogruppo normale φ−1 (I) di SU(2)). Gli elementi A ∈ SU(2) che vi appartengono lasciano invariati i prodotti u2 , uv e v 2 . Usando la rappresentazione (8) si ottiene A = ±I, ovvero, ker φ ' Z2 . Quindi due elementi di SU(2) che vengono mandati nella stessa matrice di SO(3, R) differiscono per il segno.15 Determiniamo l’applicazione indotta φ∗ : su(2) → o(3, R) (che sappiamo essere a priori un omomorfismo di algebre di Lie). Ponendo β = γ = t nelle (10) e (11) e calcolando la derivata in t = 0 si ottiene che φ∗ (su(2)) contiene le matrici 0 0 1 0 −1 0 0 0 0 , 1 0 0 . (13) −1 0 0 0 0 0 Anche il commutatore 0 0 0 0 0 1 0 −1 0 (14) di queste due matrici sta in φ∗ (su(2)). Poiché ogni matrice antisimmetrica 3 × 3 si scrive come combinazione lineare delle matrici in (13) e (14), φ∗ è surgettivo, ed è pertanto un isomorfismo. Quindi su(2) ' o(3, R); i gruppi SU(2), SO(3, R) e O(3, R) non sono isomorfi, ma hanno algebre di Lie isomorfe. 5. Azione di un gruppo di Lie su una varietà Sia G un gruppo di Lie e V una varietà differenziabile. Un’azione (sinistra) di G su V è un’applicazione differenziabile ρ : G × V → V tale che (i) ρ(e, x) = x per ogni x ∈ V ; (ii) ρ(g, ρ(h, x)) = ρ(gh, x) per ogni g, h ∈ G e x ∈ V . Posto ρ(g, x) = ρg (x), le due precedenti condizioni si scrivono ρe = idV , ρg ◦ ρh = ρgh . Per ogni g ∈ G, ρg è un diffeomorfismo di M , avente inverso ρg−1 ; la corrispondenza g 7→ 14Questo risultato si usa in Meccanica Razionale per descrivere ogni rotazione in termini dei tre angoli di Eulero. 15In termini formali, abbiamo verificato che la sequenza (12) φ 1 → Z2 → SU(2) → SO(3, R) → 1 è esatta. Notiamo inoltre che A = −B se i punti corrispondenti di S 3 sono antipodali; essendo SO(3, R) ' SU(2)/{I, −I}, il gruppo SO(3, R) è diffeomorfo allo spazio proiettivo P3 (R). Essendo SU(2) semplicemente connesso, la (12) mostra anche che il gruppo fondamentale π1 (SO(3, R)) di SO(3, R) è Z2 , cosicché SO(3, R) non è semplicemente connesso. Si noti che essendo 1 HDR (SO(3, R)) ' π1 (SO(3, R)) ⊗Z R ' Z2 ⊗Z R = 0 il gruppo SO(3, R) fornisce un esempio di varietà differenziabile non semplicemente connessa il cui primo gruppo di coomologia di de Rham è nullo. I.18 ρg stabilisce un omomorfismo di gruppi G → Diff(V ), essendo quest’ultimo il gruppo dei diffeomorfismi di V . Analogamente si definisce la nozione di azione destra, chiedendo che ρg ◦ ρh = ρhg . Esempi. (i) Le traslazioni a sinistra (destra) definiscono un’azione sinistra (destra) di G su se stesso. (ii) Se X è un campo vettoriale completo su V , il suo flusso definisce un’azione di R su V , che è sia destra che sinistra perché R è abeliano. In particolare, dato un gruppo di Lie G, e fissato X ∈ g, la corrispondenza t 7→ exp(tX) è un’azione di R su G. (iii) Gl(n, R) ed ogni suo sottogruppo agiscono nel modo ovvio su Rn . Se si rappresentano i vettori di Rn come vettori colonna (riga), si ha un’azione sinistra (destra). Definizione 5.1. Un’azione ρ di G su V si dice (i) transitiva se per ogni x, y ∈ V esiste g ∈ G tale che x = ρg (y); (ii) effettiva se ρg = idV implica g = e (ovvero, g 7→ ρg è iniettiva); (iii) libera se per ogni g 6= e, ρg non ha punti fissi (ovvero ρg (x) 6= x per ogni x ∈ V , o equivalentemente, g 7→ ρg (x) è iniettiva per ogni x ∈ V ). Si noti che ogni azione libera è effettiva. Esempi. (i) Le traslazioni sinistre (o destre) su un gruppo di Lie sono azioni transitive e libere. (ii) L’azione di R su S 1 data da (t, eiθ ) 7→ ei(t+θ) è transitiva ma non effettiva. (iii) L’azione naturale di Gl(n, R) su Rn è effettiva, ma non libera né transitiva. (iv) L’azione naturale di Gl(n, R) su Rn − {0} è effettiva, libera e transitiva. (v) L’azione naturale di O(n, R) su Rn − {0} è effettiva e libera ma non transitiva. Definizione 5.2. Sia ρ un’azione sinistra di G su uno spazio vettoriale E. Se per ogni g ∈ G ρg : E → E è un’applicazione lineare, si dice che ρ è una rappresentazione di G su E. Quindi, una rappresentazione di G su E è un omomorfismo G → Aut(E), essendo Aut(E) il gruppo degli automorfismi di E (applicazioni lineari E → E invertibili). Esempi. (i) G = Gl(n, R) (o un suo sottogruppo), E = R, ρM = det M . (ii) Ogni omomorfismo di gruppi di Lie G → Gl(n, R) è una rappresentazione di G su Rn . (L’esempio precedente è un caso particolare, con Gl(1, R) ' R∗ ). (iii) In particolare, l’omomorfismo φ dell’Esempio 4.16 definisce una rappresentazione di SU(2) su R3 . Se ρ è un’azione di G su V , e fissiamo un punto x ∈ V , l’insieme Ox = {ρg (x), g ∈ G} è detto orbita di G per x. Si può dimostrare che ogni orbita Ox è una sottovarietà di V . Esercizio 5.3. In generale, Ox non è una sottovarietà regolarmente immersa di V : si discuta per esempio il caso G = R, V = T 2 , e l’azione è data da un “flusso irrazionale” su T 2 (cfr. Esempio 3.3). I.19 Lo spazio delle orbite è l’insieme quoziente di V rispetto alla relazione di equivalenza x∼y se esiste g ∈ G tale che x = ρg (y) . Se l’azione ρ è stata fissata, lo spazio delle orbite viene denotato V /G, e denominato quoziente di V per l’azione di G. In generale V /G non è una varietà (si consideri per esempio l’azione naturale di SO(2, R) su R2 ). In certi casi d’altra parte ciò avviene, come vediamo nella seguente Proposizione, che riportiamo senza dimostrazione. Definizione 5.4. Un’azione ρ di G su V si dice propria se, definita l’applicazione ρ̃ : G × V → V × V, (g, x) 7→ (ρg (x), x), questa è propria in senso topologico, ovvero, ρ̃−1 (K) è compatto per ogni compatto K ⊂ V ×V. Si verifica facilmente che ogni azione di un gruppo compatto è propria. Proposizione 5.5. Se il gruppo G agisce su V in maniera propria e libera, il quoziente V /G ammette una struttura di varietà differenziabile, in modo che 1. V /G è dotato della topologia quoziente; 2. la proiezione V → V /G è differenziabile. Otteniamo in questo modo un gran numero di esempi di quozienti V /G che sono varietà differenziabili: è sufficiente prendere per V un gruppo di Lie H, e G come un suo sottogruppo compatto. Il gruppo di isotropia Gx di un punto x ∈ V è definito come Gx = {g ∈ G |ρg (x) = x}. L’insieme Gx è un sottogruppo di Lie di G ed è chiuso in G: infatti Gx = ψx−1 (x), essendo ψx : G → V l’applicazione ψx (g) = ρg (x). Il gruppo Gx è una sottovarietà regolarmente immersa di G. Non proveremo quest’ultima affermazione (in realtà si può provare che un sottogruppo H di un gruppo di Lie G è chiuso in G se e solo se è regolarmente immerso; cf. Warner, op. cit.). Esercizio 5.6. Stabilire un isomorfismo di insiemi fra Ox e il quoziente G/Gx (quest’ultimo quoziente è fatto rispetto all’azione naturale di Gx su G come suo sottogruppo). Generatori di un’azione. Sia G un gruppo di Lie che agisce su una varietà V . Fissato X ∈ g, per ogni x ∈ V consideriamo la curva γ X (t) = ρexp tX (x) = ρ(exp tX, x) . Al variare di x in V il vettore tangente alla corrispondente famiglia di curve, d ∗ ρ(exp tX, x) , X (x) = dt t=0 dipende differenziabilmente da x, e definisce un campo vettoriale su V , usualmente denominato campo fondamentale di X. Il vettore X ∗ (x) è tangente all’orbita Ox di G per x. Esempi. I.20 (i) Consideriamo l’azione sinistra di un gruppo su se stesso. Vale allora d d ∗ (Rg )∗ (X (h)) = (Rg )∗ Lexp tX (h) Lexp tX (hg) = = X ∗ (hg) , dt dt t=0 t=0 ovvero, i campi fondamentali dell’azione sinistra sono i campi vettoriali invarianti a destra (e viceversa). (ii) I campi fondamentali dell’azione di Gl(n, R) su Rn sono A∗ (x) = Ai k xk ∂ . ∂xi (iii) Se X è un campo vettoriale completo su V , i campi fondamentali associati all’azione del flusso di X su V sono tutti multipli di X. (iv) Sia ρ l’azione di R su Rn data da ρt (x) = et x. Dato T ∈ R (visto come algebra di Lie) si ha ∂ T ∗ (x) = T xi i . ∂x Fissata una base {Xi } di g, i corrispondenti campi vettoriali fondamentali Xi∗ su V sono detti generatori dell’azione. Esercizio 5.7. Calcolare i generatori delle azioni dei precedenti esempi. Esercizio 5.8. Il gruppo U(n + 1) agisce (transitivamente) sullo spazio proiettivo complesso Pn .16 Calcolare i campi fondamentali e i generatori di questa azione. 6. Rappresentazione aggiunta Ad ogni gruppo di Lie G si può associare una sua rappresentazione sulla sua algebra g, detta rappresentazione aggiunta. In certe situazioni il corrispondente omomorfismo G → Aut(g) è iniettivo, e ciò permette di rappresentare il gruppo G — che a priori è un gruppo astratto — mediante un gruppo di matrici (ovviamente, fissata una base di g, si ha Aut(g) ' Gl(n, R), essendo n = dim G). Mediante la rappresentazione aggiunta si possono inoltre provare vari risultati circa la relazione fra un gruppo di Lie e la sua algebra. Per costruire questa rappresentazione useremo il seguente risultato. Sia x un punto fisso di un’azione ρ di un gruppo di Lie G su una varietà V . Per ogni g ∈ G il differenziale (ρg )∗ : Tx V → Tx V è un automorfismo di Tx V (infatti ammette inverso (ρg−1 )∗ ). Si ha cosı̀ un’applicazione ψx : G → Aut(Tx V ), data da ψx (g)(X) = (ρg )∗ (X) per ogni X ∈ Tx V . Proposizione 6.1. L’applicazione ψx è una rappresentazione. 16Ricordiamo che lo spazio proiettivo complesso n-dimensionale Pn è lo spazio delle rette per l’origine di n+1 C , ovvero, è il quoziente di Cn+1 −{0} rispetto alla relazione di equivalenza secondo la quale z1 ∼ z2 se z1 = λz2 per un numero complesso λ. Lo spazio Pn si può anche descrivere come il quoziente U(n + 1)/ U(1) × U(n). I.21 Dimostrazione. ψx è evidentemente un omomorfismo di gruppi: ψx (gh)(X) = (ρgh )∗ (X) = (ρg )∗ (ρh )∗ (X) = ψx (g)ψx (h)(X) . Rimane solo da mostrare che ψx è differenziabile. Ciò equivale a mostrare che per ogni X ∈ Tx V la quantità (ρg )∗ (X) dipende differenziabilmente da g. Questo segue dalla relazione d (ρg )∗ (X) = ρ(g, γ(t)) dt t=0 essendo γ una curva per x ∈ V che è tangente a X. Definita l’azione di G su se stesso a : G × G → G, a(g, h) = ghg −1 , l’identità e ∈ G è un punto fisso di questa azione. Identificando Te G con g si ha una rappresentazione Ad : G → Aut(g). Lo spazio Aut(g) è esso stesso un gruppo di Lie, isomorfo a Gl(n, R) se n = dim G, e la sua algebra di Lie si può identificare con End(g), lo spazio di tutte le applicazioni lineari g → g; quest’ultimo spazio è un’algebra di Lie con la parentesi data dal commutatore, [A, B] = AB − BA, ed è isomorfo come algebra di Lie a gl(n, R). Pertanto differenziando la mappa Ad si ottiene un omomorfismo di algebre di Lie ad : g → End(g), e si ha un diagramma commutativo (cf. la Proposizione 3.9) Ad (15) G −−−−→ Aut(g) x x exp exp ad g −−−−→ End(g) Useremo una notazione abbreviata secondo la quale Ad(g)(X) = Adg X, ad(X)(Y ) = adX Y . Applicando la Proposizione 3.9 all’omomorfismo ag : G → G, ag (h) = ghg −1 si ottiene anche un diagramma ag (16) G −−−−→ x exp G x exp Adg g −−−−→ g Proposizione 6.2. Se G = Gl(n, R) si ha AdB A = BAB −1 , adA A0 = [A, A0 ] = AA0 − A0 A. Dimostrazione. Se A ∈ gl(n, R) allora A, come vettore tangente a Gl(n, R) in I, è rappresentato dalla curva I + tA. Si ha d −1 AdB A = B(I + tA)B = BAB −1 . dt t=0 Quindi vale anche d d 0 0 −1 0 adA A = (I + tA)A (I + tA) = (I + tA)A (I − tA) = AA0 − A0 A dt dt t=0 t=0 essendo (I + tA)−1 = I − tA + O(t2 ) per t abbastanza piccolo. I.22 Il secondo di questi risultati vale per un qualunque gruppo di Lie G, nel senso che per ogni X, Y ∈ g vale adX Y = [X, Y ]. Dimostriamo questa formula. Si ha d d adX Y (e) = Adexp tX Y (e) (R )∗ (Lexp tX )∗ (Y (e)) = dt dt exp(−tX) t=0 t=0 d = (R )∗ (Y (exp tX)) = (£X Y )(e) dt exp(−tX) t=0 = [X, Y ](e) . Essendo adX Y e [X, Y ] entrambi invarianti a sinistra, essi coincidono in ogni punto.17,18 Lemma 6.3. Sia G un gruppo di Lie connesso. Allora ogni intorno U di e genera G, nel senso che [ G= Un n∈N dove U n è il sottoinsieme di G formato dai prodotti di n elementi di U . (Ciò significa che ogni g ∈ G si scrive nella forma g = u1 · · · · · uN , con gli ui in U .) Dimostrazione. Sia V = U ∩ U −1 ⊂ U , dove U −1 è il sottoinsieme di G formato dagli inversi degli elementi di U . Allora V = V −1 . Si ponga H= [ n∈N Vn ⊂ [ U n. n∈N H è aperto in G. Il laterale che contiene e ∈ G coincide con H. Ogni laterale è diffeomorfo ad H ed è quindi aperto in G. Inoltre H è il complemento in G di tutti i laterali distinti da H (i laterali sono tutti disgiunti). Allora H è chiuso in G. Essendo G connesso ciò significa che H = G. Ricordiamo che (i) un sottogruppo H di un gruppo G è normale se ghg −1 ∈ H per ogni g ∈ G, h ∈ H. (ii) un ideale di un’algebra è un sottospazio vettoriale che è chiuso rispetto alla moltiplicazione per ogni elemento dell’algebra. Nel caso di un’algebra di Lie a, i è un ideale di a se [i, a] ⊂ i. Proposizione 6.4. Sia H un sottogruppo connesso di un gruppo di Lie connesso G. Allora H è normale se e solo se la sua algebra h è un ideale di g. 17Il simbolo £ Y denota la derivata di Lie del campo vettoriale Y rispetto al campo vettoriale X. X ˜ 18L’uguaglianza ad Y = ˆ d Ad X exp tX Y t=0 mostra che, per ogni X ∈ g, il corrispondente campo vettoriale dt fondamentale su g associato alla rappresentazione aggiunta di G su g si può identificare con adX . I.23 Dimostrazione. Assumiamo che h sia un ideale in g. Siano Y ∈ h, X ∈ g, g = exp X. Allora19 g(exp Y )g −1 = exp Adg Y = exp((exp adX )Y ) = exp(Y + [X, Y ] + 12 [X, [X, Y ]] + . . . ) dal diagramma (16) dal diagramma (15) Essendo h un ideale in g, la serie nell’ultima riga della precedente equazione converge ad un elemento di h. Pertanto g(exp Y )g −1 ∈ H. Per il Lemma 6.3, H e G sono generati da elementi del tipo exp Y e exp X rispettivamente, e H è normale in G. Assumiamo ora che H sia normale in G, e siano s, t numeri reali. Siano inoltre Y ∈ h, X ∈ g, e g = exp tX. Si ha g(exp sY )g −1 = exp Adg (sY ) = exp s [(exp adtX )(Y )] ∈ H . Perciò (exp adtX )(Y ) ∈ h per ogni t ∈ R. Inoltre (exp adtX )(Y ) = (exp t adX )(Y ) = Y + t[X, Y ] + 21 t2 [X, [X, Y ]] + . . . . Al variare di t questa è una curva in h, e, mediante l’identificazione canonica di TY h con h, il suo vettore tangente in Y è [X, Y ]; quindi h è un ideale. Definizione 6.5. Il centro C(G) di un gruppo G è il sottogruppo di G dato da C(G) = {g ∈ G | gh = hg per ogni h ∈ G} . Il centro C(g) di un’algebra di Lie g è la sottoalgebra di Lie C(g) = {X ∈ g | [X, Y ] = 0 per ogni Y ∈ g} . Proposizione 6.6. Sia G un gruppo di Lie connesso. Il centro di G è il nucleo della rappresentazione aggiunta. Dimostrazione. Sia g ∈ C(G), e X ∈ g. Allora per ogni t ∈ R (18) exp tX = g(exp tX)g −1 = exp(t Adg X) . Se t è abbastanza piccolo, tX sta in un intorno di 0 ∈ g su cui exp è iniettivo, cosicché X = Adg X, ovvero, g ∈ ker Ad. Se g ∈ ker Ad, allora vale la (18) per ogni X ∈ g, e g commuta con ogni elemento di un intorno di e ∈ G. Poiché G è connesso, tale intorno genera G, e pertanto g commuta con ogni elemento di G, ovvero, g ∈ C(G). 19Nella seguente equazione si usa la forma esplicita dell’esponenziale di un endomorfismo di uno spazio vettoriale. Se E è uno spazio vettoriale, e φ ∈ End(E), allora exp φ è definito dalla relazione (17) (exp φ)(u) = ∞ X 1 k φ (u) = u + φ(u) + 12 φ2 (u) + . . . k! k=0 per ogni u ∈ E. Scelta una base di E, la definizione (17) si riduce alla definizione dell’esponenziale di matrice; la serie (17) converge, e definisce l’esponenziale End(E) → Aut(E). Nel nostro caso, E = g, e φ = adX , e si ha (exp adX )(Y ) = ∞ X 1 (adX )k (Y ) = Y + [X, Y ] + 12 [X, [X, Y ]] + . . . k! k=0 I.24 Corollario 6.7. Sia G un gruppo di Lie connesso. Allora il centro C(G) è un sottogruppo di Lie chiuso di G, la cui algebra di Lie è il centro di g. Dimostrazione. C(G) = Ad−1 (idg ) è chiuso in G, e per la Proposizione 1.7, è un sottogruppo di Lie di G. Identifichiamo la sua algebra, che denotiamo h. Siano X ∈ g, Y ∈ h, e gt = exp tX, s, t ∈ R. Allora, operando come nella dimostrazione della Proposizione 6.4, exp sY = gt (exp sY )gt−1 = exp s(Y + t[X, Y ] + 12 t2 [X, [X, Y ]] + . . . ) . Se s è abbastanza piccolo exp è iniettivo, e Y = Y + t[X, Y ] + 21 t2 [X, [X, Y ]] + . . . da cui segue [X, Y ] = 0, ovvero, h ⊂ C(g). Viceversa, se Y ∈ C(g) e X ∈ g, vale [X, Y ] = 0, ed allora, posto g = exp X, g(exp Y )g −1 = exp(Y + [X, Y ] + 21 [X, [X, Y ]] + . . . ) = exp Y. Poiché ogni elemento di G si scrive come prodotto di elementi del tipo exp X, exp Y sta in C(G), per cui C(g) ⊂ h. Pertanto, h = C(g). Corollario 6.8. Un gruppo di Lie connesso è abeliano se e solo se la sua algebra di Lie è abeliana. Dimostrazione. Già sappiamo che l’algebra di Lie di un gruppo di Lie abeliano, connesso o meno, è abeliana. Dimostriamo l’implicazione opposta. Se g è abeliana, g = C(g). Poiché C(g) è l’algebra di Lie di C(G), i gruppi G e C(G) sono diffeomorfi in un intorno dell’identità. Essendo G connesso, esso è generato da un suo sottoinsieme i cui elementi commutano tutti fra di loro. Quindi G è abeliano. I.25 Capitolo I RIDUZIONI DI SISTEMI DINAMICI Una classe importante di problemi della fisica matematica si riconduce alla risoluzione di un sistema di equazioni differenziali alle derivate ordinarie del primo ordine (per esempio, lo studio dell’evoluzione di un sistema meccanico). Possiamo scrivere un tale sistema nella forma (19) ẋi = X i (x1 , . . . , xn ), i = 1, . . . , n i dove le x1 (t), . . . , xn (t) sono le n funzioni incognite e ẋi = dx dt (abbiamo assunto che il sistema di equazioni sotto esame sia autonomo, ovvero, che il membro di destra della (19) non contenga t). In un contesto geometrico risolvere il sistema (19) significa, dato un campo vettoriale X, determinarne il flusso. Spesso la soluzione del problema risulta semplificata dal fatto di poter trovare delle quantità che si mantengono costanti “durante il moto”, ovvero, sono invarianti sotto l’azione del flusso del campo vettoriale X. Un’altra situazione in cui la risoluzione del sistema viene semplificata si ha quando il campo vettoriale X sia invariante sotto un gruppo di trasformazioni. In questo capitolo studieremo in un certo dettaglio la possibilità di semplificare (o, come si dice usualmente, “ridurre”) il sistema (19) quando una o entrambe di queste situazioni siano verificate, in particolare nel caso di sistemi dinamici hamiltoniani. Ciò culminerà con l’enunciazione e la dimostrazione del cosiddetto teorema di Marsden-Weinstein. 7. Costanti del moto di un sistema dinamico Un primo passo per la risoluzione del sistema (19) può essere quello di metterlo (se possibile, e mediante un opportuno cambio di coordinate) nella forma “ridotta” (20) ẏ a = Y a (y 1 , . . . , y r ) (21) ż b = Z b (y 1 , . . . , y r ; z 1 , . . . , z n−r ) In questo caso si dice che si è effettuata una riduzione del sistema, poiché si è passati dalla risoluzione del sistema (19), a n incognite, alla risoluzione successiva del sistema (20), a r incognite, seguita dalla risoluzione del sistema (21), detto sistema residuo. Tale procedura usualmente semplifica lo studio del problema. Come precedentemente accennato, una possibilità in questa direzione si offre quando il sistema ammetta delle costanti del moto. Ciò giustifica la seguente definizione. I.26 Definizione 7.1. Un sistema dinamico è una coppia (V, X), dove V è una varietà differenziabile e X è un campo vettoriale su V . Una costante del moto di X è una funzione f : U → R (dove U è un aperto di V ) che è costante lungo le curve integrali di X. Quindi, se {ψt } è il flusso di X, f è una costante del moto se f = f ◦ ψt identicamente in t, o equivalentemente, X(f ) = 0. Se U è contenuto propriamente in V , diciamo che f è una costante del moto locale; in generale non è possibile estendere una costante del moto locale ad una globale (si noti tra l’altro come, per il teorema di raddrizzamento dei campi vettoriali, ogni sistema dinamico ammetta sempre n − 1 costanti del moto locali se n = dim V ).20 Esempio 7.2. Sia V = R2 − {0}, con coordinate canoniche x1 , x2 , e si consideri il campo vettoriale 1 ∂ 2x1 ∂ X(x1 , x2 ) = 1 2 + . 2 2 1 1 2 2 2 (x ) + (x ) ∂x (x ) + (x ) ∂x2 La funzione f = x2 − (x1 )2 è una costante del moto. Posto per semplicità y2 = x1 , y1 = f = x2 − (x1 )2 il problema dell’integrazione di X si scrive ẏ1 = 0 1 ẏ2 = 2 y2 + (y1 + y22 )2 ed è pertanto facilmente risolubile. Esempio 7.3. (Il flusso di Kronecker su T 2 ). Prendiamo V = T 2 , con coordinate x, y, e ∂ ∂ X = α ∂x + β ∂y , con α, β costanti. La funzione f definita sull’aperto di T 2 corrispondente all’interno della cella fondamentale dalla condizione f (x, y) = βx − αy è una costante del moto locale, ma non può essere estesa a tutto T 2 a meno che α = β = 0 (f non è periodica). Consideriamo il caso in cui α/β ∈ / Q; allora le curve integrali di X sono dense in T 2 . In questo caso non esistono costanti del moto f globali non banali (infatti se f è costante su un sottoinsieme denso allora è costante su tutto T 2 ). Più in generale, per lo stesso argomento un sistema dinamico che possiede almeno una costante del moto globale non banale non può avere traiettorie dense. Esempio 7.4. (Reticolo di Toda) È un sistema composto da n particelle di massa unitaria che si muovono su una retta, sottoposte ad una interazione “fra primi vicini” data da un potenziale di tipo esponenziale; se xi è la posizione dell’i-esima particella, ∂V ẍ = − i , ∂x i V = n−1 X i ex −x i+1 . i=1 La dinamica del sistema si può scrivere in forma hamiltoniana; la funzione di Hamilton è 1 n H(x , . . . , x , y1 , . . . , yn ) = 1 2 n X i=1 yi2 + n−1 X i ex −x i+1 . i=1 20Ricordiamo che, dato un campo vettoriale X e un punto x ∈ V in modo che X(x) 6= 0, si possono scegliere attorno a x coordinate locali {x1 , . . . , xn } tali che X = (locali) del moto. ∂ . ∂x1 Le coordinate x2 , . . . , xn sono pertanto costanti I.27 Ricordiamo che le equazioni di Hamilton sono ẏi = − (22) ∂H , ∂xi ẋi = ∂H . ∂yi Consideriamo la matrice simmetrica L avente la struttura 1 1 2 0 y1 e 2 (x −x ) 1 21 (x1 −x2 ) (x2 −x3 ) 2 y2 e e 1 (x2 −x3 ) 2 0 e y3 L(x, y) = ... ... ... yn−1 e e la matrice antisimmetrica 1 1 2 0 0 e 2 (x −x ) 1 2 3 12 (x1 −x2 ) (x 0 e 2 −x ) −e 1 2 3 0 −e 2 (x −x ) 0 1 A(x, y) = 2 ... ... 1 (xn−1 −xn ) 2 1 e 2 (xn−1 −xn ) yn ... 0 −e 1 (xn−1 −xn ) 2 1 e 2 (xn−1 −xn ) 0 Un calcolo esplicito mostra che le equazioni (22) si possono scrivere nella forma (detta di Lax ) L̇ = [L, A] . Da questa è facile dedurre che le funzioni Fk = 1 tr Lk k sono costanti del moto: infatti Ḟk = tr(L̇Lk−1 ) = tr([L, A]Lk−1 ) = tr(Lk A − A Lk ) = 0 . Si noti che F1 = tr L è la quantità di moto, mentre F2 è l’energia (cioè, F2 ≡ H). Si può dimostrare che le funzioni Fk sono in involuzione ({Fi , Fk } = 0 per ogni i, k) e, per k = 1, . . . , n, sono linearmente indipendenti. Vediamo come in generale si possa operare il processo di riduzione qualora siano presenti costanti globali del moto. Sia (V, X) un sistema dinamico, e siano f1 , . . . , fr costanti del moto globali. Fissata una r-pla µ = (µ1 , . . . , µr ) ∈ Rr , consideriamo la “superficie di livello” Sµ = {x ∈ V | fi (x) = µi , i = 1, . . . , r} . Consideriamo l’applicazione ψ : V → Rr , x 7→ (f1 (x), . . . , fr (x)) . I.28 Se i differenziali dfi sono linearmente indipendenti per ogni x ∈ Sµ (ovvero, se µ è un valore regolare di ψ), allora esiste un intorno U di µ ∈ Rr tale che la restrizione di ψ su ψ −1 (U ) sia una summersione. Pertanto, Sµ è una sottovarietà regolarmente immersa in V di dimensione m = dim V − r. Su ψ −1 (U ) possiamo prendere coordinate locali {y 1 , . . . , y m , z 1 , . . . , z r }, con z i = fi . Poiché X(z i ) = 0 (X è tangente a Sµ ), in queste coordinate il problema dell’integrazione di X si scrive ( ż i = 0, i = 1, . . . , r (23) j j ẏ = X (y, z), j = 1, . . . , m . L’Esempio 7.2 mostra una situazione di questo tipo. Questo processo di riduzione viene spesso detto riduzione per restrizione. 8. Simmetrie di un sistema dinamico Una simmetria di un sistema dinamico (V, X) è un diffeomorfismo φ di V che trasforma curve integrali di X in curve integrali di X, ovvero, φ ◦ ψt = ψt ◦ φ (24) essendo {ψt } il flusso di X. Questa condizione equivale a φ∗ (X) = X. Un gruppo ad un parametro di simmetrie di (V, X) è un gruppo ad un parametro {φs } di diffeomorfismi di V ognuno dei quali è una simmetria di X, ovvero (equivalentemente) (25) φs ◦ ψt = ψt ◦ φs o £Y X = 0 essendo Y il generatore di {φs }. Un gruppo di simmetrie G di (V, X) è un gruppo di Lie con un’azione φ su V , tale che per ogni g ∈ G il diffeomorfismo φg : V → V sia una simmetria di X. Sia g l’algebra di Lie di G. Proposizione 8.1. Se (G, φ) è un gruppo di simmetrie di X, allora, dato Y ∈ g, vale [Y ∗ , X] = 0, essendo Y ∗ il campo vettoriale fondamentale su V associato a Y . Viceversa, se G è un gruppo di Lie connesso con un’azione φ su V , e Y ∈ g è tale che [Y ∗ , X] = 0, allora (G, φ) è un gruppo di simmetrie di (V, X). Dimostrazione. La prima affermazione è di immediata verifica. Per dimostrare la seconda si usa il fatto che essendo G connesso esso è generato da un intorno della sua identità su cui exp è surgettivo; inoltre, la condizione [Y ∗ , X] = 0 implica φexp sY ◦ ψt = ψt ◦ φexp sY e pertanto fornisce φg ◦ ψt = ψt ◦ φg . Se (G, φ) è un gruppo di simmetrie di (V, X), la condizione φg ◦ ψt = ψt ◦ φg implica che per ogni x in V valga ψt (Ox ) ⊂ Oψt (x) , ossia, il flusso di X manda orbite di G in orbite di G. Se il quoziente VG = V /G è una varietà differenziabile, ciò significa che X induce un sistema dinamico “ridotto” su V /G (riduzione per proiezione); ovvero, esiste un campo vettoriale X̂ su VG tale che X̂ = π∗ X, essendo π : V → VG la proiezione.21 21Questa relazione va intesa nel senso π (X(x)) = X̂(π(x)) per ogni x ∈ V . ∗ I.29 In aggiunta all’assunzione che il quoziente VG = V /G sia una varietà differenziabile, supponiamo anche che l’azione di G sia libera. In questo caso le orbite di G sono sottovarietà regolarmente immerse di dimensione r = dim G;22 possiamo introdurre coordinate locali {y 1 , . . . , y m , z 1 , . . . z r } “adattate alla orbite”, dove le {z 1 , . . . , z r } sono coordinate sulle orbite, e le {y 1 , . . . , y m } sono coordinate sul quoziente VG (si ha m = dim VG = dim V − r). In queste coordinate il problema dell’integrazione di X si scrive ( ẏ i = X̂ i (y 1 , . . . , y m ) ż j = X j (y 1 , . . . , y m , z 1 , . . . z r ) . Esempio 8.2. Si interpreti, alla luce della precedente discussione, il caso di un campo vettoriale su Rn che non dipenda da una coordinata. Qual è il gruppo di simmetria? Scrivere il sistema ridotto ed il sistema residuo. Esempio 8.3. Si determinino le curve integrali del campo su V = R2 − {0} X(x1 , x2 ) = − x1 + x2 ∂ x1 − x2 ∂ + . (x1 )2 + (x2 )2 ∂x1 (x1 )2 + (x2 )2 ∂x2 Si verifica facilmente che X ammette il gruppo di simmetria SO(2, R) con la sua azione naturale su R2 − {0}. La varietà quoziente è evidentemente la semiretta aperta (0, +∞), e la proiezione π è data da p (x1 , x2 ) 7→ ρ = (x1 )2 + (x2 )2 . Un sistema di coordinate adattato alle orbite è fornito dalle coordinate polari (ρ, θ), in cui il problema dell’integrazione di X si scrive 1 ρ̇ = − ρ 1 θ̇ = . ρ2 9. Simmetrie di un sistema hamiltoniano Sia (V, ω) una varietà simplettica. Ricordiamo che un simplettomorfismo di (V, ω) è un diffeomorfismo φ di V tale che φ∗ ω = ω. La forma simplettica induce un isomorfismo di fibrati vettoriali T ∗ V → T V, α 7→ Xα con α(Y ) = ω(Xα , Y ) per ogni Y ∈ T V . Se α è una 1-forma esatta, α = df , il campo Xdf si dice il campo vettoriale hamiltoniano associato alla funzione f ; quest’ultima è la funzione hamiltoniana di Xdf . Se α è chiusa, Xα è detto localmente hamiltoniano; infatti ogni punto di V ha un intorno U su cui α = df , e Xα |U è hamiltoniano. 22Le orbite di G in V sono regolarmente immerse perché sono chiuse in V (cfr. S. Helgason, Differential geometry and symmetric spaces, Academic Press). Essendo l’azione libera, tutti i gruppi di isotropia Gx sono banali, e pertanto ogni orbita è diffeomorfa a G; in particolare, dim Ox = dim G. Si noti che al variare di ξ ∈ g = Lie(G) i campi vettoriali fondamentali ξ ∗ formano una distribuzione involutiva in V , le cui varietà integrali massimali sono le orbite di G. I.30 Un gruppo ad un parametro di simplettomorfismi {φt } è un gruppo ad un parametro di diffeomorfismi di V tale che per ogni t, φt sia un simplettomorfismo. I generatori dei gruppi ad un parametro di simplettomorfismi sono esattamente i campi vettoriali localmente hamiltoniani. Proposizione 9.1. Sia X il campo vettoriale generatore di un gruppo {φt } ad un parametro di diffeomorfismi di V . Le seguenti condizioni sono equivalenti. (1) {φt } è un gruppo ad un parametro di simplettomorfismi. (2) £X ω = 0. (3) X è localmente hamiltoniano. Dimostrazione. (1) ⇒ (2): segue da d ∗ £X ω = φ ω dt t = 0. t=0 L’implicazione opposta si ottiene dalla stessa formula, scritta per t generico: se £X ω = 0 allora φ∗t ω non dipende da t, ed essendo φ0 = idV , si ha φ∗t ω = ω. (3) ⇒ (2): se X = Xα è localmente hamiltoniano, vale £X ω = iX dω + d(iX ω) = −dα = 0; la stessa formula mostra che se £X ω = 0 allora d(iX ω) = 0, per cui localmente iX ω = −df , ovvero, X è localmente hamiltoniano. Nota 9.2. Non è in realtà necessario assumere la completezza del campo vettoriale localmente hamiltoniano; in altri termini, il flusso di un campo vettoriale X è formato da simplettomorfismi se e solo se X è localmente hamiltoniano (e se e solo se £X ω = 0). ∂ ∂ , Y = ∂θ , Esempio 9.3. Sia V = R × S 1 con la forma simplettica ω = dz ∧ dθ. Posto X = ∂z si ha £X ω = £Y ω = 0. Y è hamiltoniano, mentre X lo è solo localmente (nonostante la scrittura, la forma dθ su S 1 non è esatta). Esempio 9.4. (Trasformazioni canoniche puntuali) Siano V = T ∗ Q il fibrato cotangente di una varietà differenziabile Q, con proiezione canonica π : T ∗ Q → Q, e sia θ la forma di Liouville su T ∗ Q. (Ricordiamo che questa è definita dalla condizione < X, θ >α = < π∗ X, α > per ogni α ∈ T ∗ Q e ogni X ∈ Tα T ∗ Q. In coordinate locali fibrate {x1 , . . . , xn , y1 , . . . , yn } si ha θα = pi (dq i )α se x = π(α) e α = pi (dq i )x ). La 2-forma ω = dθ è una forma simplettica su T ∗ Q. Sia Y il generatore di un gruppo ad un parametro {ψs } di diffeomorfismi di Q. Possiamo definire un “sollevamento” di {ψs } su T ∗ Q; questo è il gruppo ad un parametro {Ψs } di diffeomorfismi (26) ∗ Ψs (α) = ψ−s α. Si ha un diagramma commutativo Ψ s T ∗ Q −−−− → πy Q ψs TQ π y −−−−→ Q I.31 Sia X il generatore di {Ψs }. Dimostriamo che £X θ = 0 facendo il calcolo in coordinate locali ∂ fibrate23 {x1 , . . . , xn , y1 , . . . , yn } di T ∗ Q. Se Y = Y i ∂x i dalla definizione (26) si ottiene X =Yi ∂ ∂Y k ∂ − yk i i ∂x ∂x ∂yi e pertanto ∂Y k yk dxi + d(Y i yi ) = 0 . ∂xi Di conseguenza, £X ω = 0, il campo X è localmente hamiltoniano, e {Ψs } è un gruppo di simplettomorfismi di T ∗ Q. In realtà X è anche hamiltoniano. Infatti £X θ = iX dθ + d(iX θ) = −Y i dyi − iX ω = £X θ − d(iX θ) per cui X = Xdf con f = −iX θ = −yi Y i . Definizione 9.5. Un sistema dinamico hamiltoniano è una tripla (V, ω, X), dove V è una varietà differenziabile, ω una forma simplettica su V , e X è un campo vettoriale hamiltoniano su V . Proposizione 9.6. Sia (V, ω, X) un sistema dinamico hamiltoniano. (1) Una funzione f su V è una costante del moto per XdH se e solo se {f, H} = 0. (2) Ogni simplettomorfismo φ di (V, ω) che lasci invariante H — ovvero, tale che H ◦ φ = H — è una simmetria di XdH . Dimostrazione. (1) {f, H} = 0 equivale a XdH (f ) = 0. (2) Per ogni funzione g su V vale (φ∗ XdH )(g) = XdH (g ◦ φ) ◦ φ−1 = {g ◦ φ, H} ◦ φ−1 = {g, H ◦ φ−1 } = {g, H} = XdH (g) . Proposizione 9.7. (Teorema di Noether) Sia (V, ω, XdH ) un sistema dinamico hamiltoniano; sia f una funzione su V , e sia {φs } il flusso di Xdf .24 La famiglia {φs } lascia invariato H (ovvero H ◦ φs = H per ogni s) se e solo se {f, H} = 0. Dimostrazione. La condizione H ◦ φs = H equivale a d H ◦ φs (x) = 0 per ogni x ∈ V. ds s=0 d H ◦ φs s=0 = Xdf (H) = {f, H} si ha la tesi. Essendo ds In conseguenza del teorema di Noether, ad ogni costante del moto f di XdH è associato un “gruppo locale” di simmetria di XdH ; il gruppo è “globale” se Xdf è completo. Viceversa, sia {φs } un gruppo ad un parametro di simplettomorfismi che preservano H (il che per il punto (2) della Proposizione 9.6 implica che {φs } è un gruppo di simmetria di XdH ). Allora il generatore X di {φs } è localmente hamiltoniano, ovvero, localmente vale X = Xdf , e dal teorema di Noether segue che f è una costante del moto locale; se X è hamiltoniano, f è una costante del moto globale. 23Alternativamente si può dimostrare direttamente che Ψ∗ θ = θ dalla definizione intrinseca di θ. s 24Già sappiamo che i diffeomorfismi {φ } sono simplettomorfismi di (V, ω). s I.32 Esempio 9.8. Con riferimento all’esempio 9.4, la funzione f = −iX θ è una costante del moto per XdH se e solo se {Ψs } lascia invariata H, ovvero, H ◦ Ψ = H. Esempio 9.9. (Coordinate cicliche) Supponiamo che Q ammetta una carta globale con coordinate {q 1 , . . . , q n }, e sia ψs : Q → Q dato da ψs (q 1 , . . . , q n ) = (q 1 , . . . , q k + s, . . . , q n ) per un k fissato. Il sollevamento {Ψs } di {ψs } a T ∗ Q è un gruppo di simplettomorfismi il cui generatore è hamiltoniano, con funzione hamiltoniana f (q, p) = pk (stiamo denotando con {q 1 , . . . , q n , p1 , . . . , pn } un sistema di coordinate fibrate su T ∗ Q). Per il teorema di Noether, f è una costante del moto se e solo se H non dipende da q k . In particolare in quest’ambito si formalizza l’invarianza per traslazioni e rotazioni di un sistema meccanico. Esempio 9.10. Sia Q = R3 , con coordinate canoniche (q 1 , q 2 , q 3 ). Le rotazioni attorno all’asse q3 costituiscono un gruppo ad un parametro di diffeomorfismi di Q, descritto da 1 1 q cos s sin s 0 q ψs : q 2 7→ − sin s cos s 0 q 2 q3 0 0 1 q3 Posto in coordinate (q̄, p̄) = Ψ(q, p), si ha q̄ k = ψ k (q), p̄k = (J −1 )i k pi , con J ik = ∂ψ i . ∂q k Essendo ψs lineare e J ortogonale, si ha p̄1 cos s sin s 0 p1 p̄2 7→ − sin s cos s 0 p2 . p̄3 0 0 1 p3 Il generatore di {Ψs } è hamiltoniano con funzione hamiltoniana f (q, p) = p1 q 2 − p2 q 1 (coincidente con la proiezione del momento angolare lungo l’asse q3 ). Il teorema di Noether afferma che f è una costante del moto per XdH se e solo se H è invariante per rotazioni attorno all’asse q3 . 10. Dalle costanti del moto alle simmetrie Sia (V, XdH ) un sistema dinamico hamiltoniano che ammette costanti del moto f1 , . . . , fr , e supponiamo che ogni campo hamiltoniano Xdfi sia completo. Per il teorema di Noether si hanno r gruppi ad un parametro di simmetrie di XdH . Vogliamo da questi costruire un gruppo G di simmetrie di XdH . A questo scopo faremo un’ipotesi. Se calcoliamo la parentesi di Poisson {fi , fk } di due costanti del moto otteniamo una ulteriore costante del moto, in conseguenza dell’identità di Jacobi: {{fi , fk }, H} = −{{H, fi }, fk } − {{fk , H}, fi } = 0 (o, equivalentemente, perché il commutatore dei campi hamiltoniani Xdfi e Xdfk è anch’esso hamiltoniano, con funzione hamiltoniana {fi , fk }). Aggiungiamo alle funzioni f1 , . . . , fr tutte le funzioni {fi , fk }, i, k = 1, . . . , r, e iteriamo questo procedimento — ottenendo cosı̀ un nuovo I.33 insieme di costanti del moto, {f1 , . . . , fm }, con m ≥ r — sino a che sia vero il seguente fatto: esistono costanti cijk e σij , i, j, k = 1 . . . m, tali che {fj , fk } = cijk fi + σjk . Stiamo evidentemente assumendo che ciò avvenga dopo un numero finito di iterazioni. Dati ξ = (ξ 1 , . . . , ξ m ), η = (η 1 , . . . , η m ) ∈ Rm poniamo fξ = m X ξ i fi , [ξ, η]k = ckij ξ i η j , σ(ξ, η) = σij ξ i η j . i=1 Si ha cosı̀ fξ : V → R, [ξ, η] ∈ Rm , σ(ξ, η) ∈ R. La (10) si riscrive {fξ , fη } = f[ξ,η] + σ(ξ, η) , e l’identità di Jacobi implica (27) [[ξ, η], θ] + [[θ, ξ], η] + [[η, θ], ξ] = 0 (28) σ([ξ, η], θ) + σ([θ, ξ], η) + σ([η, θ], ξ) = 0 . L’equazione (27) esprime il fatto che g = (Rm , [ , ]) è un’algebra di Lie; la (28) invece afferma che σ è un 2-cociclo di tale algebra. I corrispondenti campi vettoriali hamiltoniani verificano la condizione [Xdfξ , Xdfη ] = Xd{fξ , fη } = Xdf[ξ,η] ; in altri termini, si ha un omomorfismo di algebre di Lie g → X(V ). (29) Si dice che ciò definisce un’azione dell’algebra g su V . Sia G un gruppo di Lie connesso avente algebra di Lie g.25 In generale un’azione di g su V non “si esponenzia” ad un’azione di G. Supponiamo comunque che ciò accada; più precisamente, assumiamo che esista un’azione destra26 φ di G su V in modo che la corrispondenza ξ 7→ ξ ∗ , che ad ogni ξ ∈ g associa il corrispondente campo vettoriale fondamentale su V , coincida con l’omomorfismo (29). 25Un tale gruppo esiste sempre. Se g non ha centro il gruppo G si può costruire facilmente. Il nucleo dell’applicazione ad : g → End(g), ad(ξ)(η) = [ξ, η], è proprio il centro di g, per cui ad è iniettiva. Si definisce allora G come l’immagine in Aut(g) della composizione ad exp g −→ End(g) −→ Aut(g) . Se invece il centro di g non è banale la costruzione di G è più complicata. 26La scelta dell’azione destra segue da questo fatto: se G è un gruppo di Lie che agisce da destra su una varietà differenziabile V , allora l’applicazione lineare g → X(V ), ξ 7→ ξ ∗ è un omomorfismo di algebre di Lie. Infatti, se ξ, η ∈ g, ed f è una funzione su V , vale » – d d (f (ρexp sη (ρexp tξ (x)) − f (ρexp tξ (ρexp sη (x))) [ξ ∗ , η ∗ ](f ) = ds dt (s=t=0) » – d d = (f (ρexp tξ exp sη (x)) − f (ρexp sη exp tξ (x))) . ds dt (s=t=0) Essendo (30) exp sη exp tξ = exp(sη + tξ + 12 st[ξ, η] + O(t, s)2 ) I.34 Proposizione 10.1. Il gruppo G costruito sotto queste ipotesi, con l’azione φ, è un gruppo di simplettomorfismi di (V, ω) che lascia H invariata. Dimostrazione. Fissato ξ ∈ g, il campo vettoriale ξ ∗ = Xdfξ è hamiltoniano, e fξ è una costante del moto di XdH (ciò a causa delle ipotesi enunciate all’inizio del paragrafo). Per il teorema di Noether, la famiglia {φexp sξ }s∈R è un gruppo ad un parametro di simplettomorfismi che lascia H invariata. Essendo G connesso, lo stesso vale per ogni φg . Esempio 10.2. Sia Q = R3 , V = T ∗ Q ' R6 con coordinate canoniche (q 1 , q 2 , q 3 , p1 , p2 , p3 ), dotato della forma simplettica canonica. Sia H(q, p) una qualunque funzione C ∞ delle quantità 3 3 3 X X X i 2 2 (q ) , (pi ) , q i pi . q3 i=1 p3 q 2 , i=1 −p3 q 1 i=1 q3 Le funzioni f1 = −p2 + f2 = + p1 sono costanti del moto. Anche f3 = 2 1 {f1 , f2 } = p1 q − p2 q è una costante del moto. Non è possibile però generare altre costanti del moto, in quanto {f1 , f3 } = −f2 e {f2 , f3 } = f1 . Queste costanti del moto soddisfano pertanto la condizione della precedente discussione, con σ = 0 e cijk = εijk (il simbolo di Levi-Civita a tre indici). L’algebra di Lie generata dalle costanti del moto fi coincide quindi con l’algebra o(3, R). Si una cosı̀ un’azione di o(3, R) su R6 , data da ξ 7→ fξ = 3 X ξ i fi 7→ Xdfξ = i=1 ∂fξ ∂ ∂fξ ∂ − . ∂q i ∂pi ∂pi ∂q i In particolare, ξ = (0, 0, 1) 7→ f3 7→ Xdf3 = q 2 ∂ ∂ ∂ ∂ − q 1 2 + p2 − p1 . 1 ∂q ∂q ∂p1 ∂p2 Questa azione si esponenzia ad un’azione di SO(3, R) su R6 , ed allora coincide con il sollevamento a R6 ≡ T ∗ R3 dell’azione destra di SO(3, R) su R3 data da (R, q) 7→ R̃q. Il gruppo SO(3, R) agisce mediante simplettomorfismi che preservano H. 11. Dalle simmetrie alle costanti del moto: l’applicazione momento Un’azione φ di un gruppo di Lie su una varietà simplettica V con forma simplettica ω è detta simplettica se ogni φg è un simplettomorfismo. Ciò implica che per ogni ξ ∈ g la famiglia {φexp sξ }s∈R è un gruppo ad un parametro di simplettomorfismi, ed il campo vettoriale fondamentale ξ ∗ su V è localmente hamiltoniano. Supponiamo che esso sia hamiltoniano, con si ottiene [ξ ∗ , η ∗ ](f ) = » d d f (ρexp st[ξ,η] (x)) ds dt – = [ξ, η]∗ (f ) . (s=t=0) L’equazione (30) è un troncamento della cosiddetta formula di Baker-Campbell-Hausdorff, cfr. V.S. Varadarajan, Lie groups, Lie algebras, and their representations, Springer-Verlag. Si può facilmente provare la (30) quando G non ha centro, cosicché mediante la rappresentazione aggiunta G stesso può essere pensato come un gruppo di matrici. Ci si può quindi ridurre alla situazione G = Gl(n, R), nel qual caso la formula è elementare. I.35 funzione hamiltoniana fξ .27 Per ogni ξ la funzione fξ è definita a meno di una costante se V è connesso (se V non è connesso si ha una costante additiva arbitraria diversa su ogni componente connessa di V ). È pertanto necessario imporre delle condizioni per eliminare questa ambiguità; per esempio, scelto un punto xi in ogni componente connessa Vi di V , si può imporre fξ (xi ) = 0 per ogni ξ ∈ g. Per ogni x ∈ V definiamo un’applicazione Jx : g → R, Jx (ξ) = fξ (x) . Questa è lineare; infatti fcξ = cfξ . Una conveniente descrizione di questa applicazione si ha scegliendo una base {ξ1 , . . . , ξm } di g; allora (31) Jx = m X fξi (x) Ξi , i=1 essendo {Ξ1 , . . . , Ξm } la base duale di g∗ . Abbiamo in questo modo costruito un’applicazione differenziabile J : V → g∗ , che per costruzione soddisfa la seguente condizione: se φ è un’azione simplettica di un gruppo di Lie G su V , tale che i suoi campi vettoriali fondamentali siano hamiltoniani, la funzione fξ : V → R, fξ (x) =< ξ, J(x) >, è la hamiltoniana di ξ ∗ . Chiameremo applicazione momento ogni applicazione differenziabile J : V → g∗ soddisfacente questa condizione. Se µ ∈ g∗ è un elemento fissato, e J è una applicazione momento, allora J 0 = J + µ (ovvero, J 0 (x)(ξ) = J(x)(ξ)+ < ξ, µ >) definisce un’altra applicazione momento (ciò cambia la costante additiva arbitraria delle costanti del moto fξ ). Viceversa, se J 0 è un’altra applicazione momento, allora esiste µ ∈ g∗ tale che J 0 = J + µ; infatti l’applicazione ξ → fξ0 (x) − fξ (x) ∈ R non dipende da x ed è lineare, quindi determina un elemento µ ∈ g∗ tale che < ξ, µ > = fξ0 (x) − fξ (x). Se H è una funzione invariante per l’azione di G, ovvero, H = H ◦ φg per ogni g ∈ G, allora J è una costante del moto di XdH (a valori in g∗ ), in quanto ogni fξi è una costante del moto. Esempio 11.1. Sia G un gruppo di Lie che agisce su una varietà differenziabile Q con un’azione φ. Per ogni elemento g ∈ G si ha un diffeomorfismo φg : Q → Q, il quale induce un diffeomorfismo Φg : T ∗ Q → T ∗ Q, Φg (α) = φ∗g−1 α, definendo cosı̀ un “sollevamento” dell’azione di G su T ∗ Q. Per ogni ξ ∈ g, sia Xξ il campo vettoriale fondamentale dato da questa azione. Si ha una situazione come nell’Esempio 9.4; il campo Xξ è hamiltoniano, con funzione hamiltoniana fξ = −iXξ (θ). l’applicazione momento è data da < ξ, J(α) > = −< Xξ , θ >α con α ∈ T ∗ Q. Definita per ogni α ∈ T ∗ Q l’applicazione Φα : G → T ∗ Q, Φα (g) = Φg (α) , si ha Xξ (α) = (Φα )∗ (ξ), e < ξ, J(α) > = −< (Φα )∗ (ξ), θ > = −< ξ, (Φα )∗ (θ) > 27Ciò accade automaticamente se il primo gruppo di coomologia di de Rham di V è nullo, in particolare se V è semplicemente connessa. I.36 da cui J(α) = −(Φα )∗ (θ). Avremmo anche potuto scrivere le costanti del moto fξ nella forma (equivalente alla precedente) fξ (α) = −< Yξ (x), α >, essendo Yξ il campo vettoriale fondamentale dato dall’azione di G su Q, e x il punto di applicazione di α in Q. In questo caso avremmo ottenuto la scrittura J(α) = −(φx )∗ (α), essendo adesso φx : G → Q dato da φx (g) = φ(g, x). Più concretamente, possiamo scrivere l’applicazione momento usando l’equazione (31); fissata una base {ξ1 , . . . , ξm } di g, e detto Y(i) il generatore di {φexp sξi }, in coordinate locali j fibrate {q 1 , . . . , q n , p1 , . . . , pn } si ha fξi = −pj Y(i) , e pertanto J(q, p) = − m X j pj Y(i) (q) Ξi i=1 essendo {Ξ1 , . . . , Ξm } la base duale di g∗ . Esempio 11.2. Consideriamo il gruppo delle traslazioni Rn che agisce su Q = Rn mediante q 7→ q − a. In questo caso φq : Rn → Q è dato da φq (a) = q − a, per cui (φq )∗ = id, e J(q, p) = p; l’applicazione momento è la quantità di moto. Esempio 11.3. Prendiamo Q = Rn , V = T ∗ Q, G un sottogruppo di Gl(n, R), con l’azione destra (M, q) 7→ M̃ q (denotiamo q = (q 1 , . . . , q n ) gli elementi di Rn , visti come vettori colonna. Alternativamente, se i punti di Rn vengono visti come vettori riga, l’azione si scrive (M, q) 7→ ˜ e quindi < ξ, J(q, p) > = −< p, ξ ∗ (q) > = −p̃ ξ˜ q. qM ). Allora per ogni ξ ∈ g vale ξ ∗ (x) = ξx, ∼ R3 , si ha ξ q = Se n = 3 e G = SO(3, R), denotato ξ 7→ ωξ l’usuale isomorfismo o(3, R) → ωξ ∧ q. Denotando inoltre “·” il prodotto scalare standard in R3 , si ha < ξ, J(q, p) > = p̃ ξ q = p · ωξ ∧ q = ωξ · q ∧ p , da cui J(q, p) = q ∧ p: l’applicazione momento è il momento angolare. Azioni poissoniane. Sia φ un’azione simplettica di un gruppo di Lie G su una varietà simplettica (V, ω), e sia J un’applicazione momento. Per ogni ξ ∈ g il campo vettoriale fondamentale ξ ∗ è hamiltoniano, con funzione hamiltoniana fξ (x) = < ξ, J(x) >. Definizione 11.4. L’azione φ è poissoniana se è possibile scegliere J in modo che {fξ , fη } = f[ξ,η] . L’applicazione g → F(V ), ξ 7→ fξ diventa cosı̀ un omomorfismo di algebre di Lie. Esempio 11.5. (Un’azione simplettica non poissoniana) V = R2 , ω = dx1 ∧ dx2 ; G = R2 agisce su V per traslazioni. I campi vettoriali fondamentali sono ξ∗ = ξ1 ∂ ∂ + ξ2 2 . 1 ∂x ∂x Si ha iξ∗ ω = ξ 1 dx2 − ξ 2 dx1 e quindi la funzione hamiltoniana di ξ ∗ ha la forma fξ = ξ 1 x2 − ξ 2 x1 + c(ξ), dove c : g → R è una funzione differenziabile. L’azione di G è infatti simplettica, e le possibili applicazioni momento sono del tipo J(x1 , x2 ) = (x2 + µ1 , −x1 + µ2 ), µ ∈ R2 . I.37 Esiste un 2-cociclo non nullo, dato da σ(ξ, η) = {fξ , fη } − f[ξ,η] = −ξ 1 η 2 + ξ 2 η 1 . Proposizione 11.6. Il sollevamento a T ∗ Q dell’azione di un gruppo di Lie G su Q è un’azione poissoniana. Dimostrazione. Per ogni ξ ∈ g denotiamo con ξ ∗ il campo fondamentale associato all’azione di G su Q e ξ˜∗ il suo sollevamento a T ∗ Q. Quest’ultimo è hamiltoniano, ovvero, ξ˜∗ = Xdfξ per una funzione fξ : T ∗ Q → R. Si ha {fξ , fη } = ω(Xdfξ , Xdfη ) con fξ (α) = −< α, ξ ∗ (q) > se q = π(α) (ξ ∗ è il campo fondamentale su Q). Inoltre dalla formula di Cartan ω(X, Y ) = dθ(X, Y ) = X(< Y, θ >) − Y (< X, θ >)− < [X, Y ], θ > = < Y, £X θ > − < X, £Y θ > + < [X, Y ], θ > essendo £Xdfξ θ = £Xdfη θ = 0 abbiamo {fξ , fη }(α) = −< [Xdfξ , Xdfη ], α > = −< Xdf[ξ,η] , α > = f[ξ,η] (α) . Proposizione 11.7. Sia φ un’azione poissoniana di un gruppo di Lie connesso G su una varietà simplettica (V, ω), e sia J un’applicazione momento che annulla il cociclo σ. Allora J è Ad∗ -equivariante, nel senso che per ogni g ∈ G il seguente diagramma è commutativo: φg V −−−−→ Jy V yJ Ad∗g g∗ −−−−→ g∗ Viceversa, se J è un’applicazione momento Ad∗ -equivariante, e fξ (x) = < ξ, J(x) >, allora {fξ , fη } = f[ξ,η] ; ovvero, un’azione simplettica che ammette un’applicazione momento Ad∗ equivariante è poissoniana. Dimostrazione. La condizione di Ad∗ -equivarianza di J equivale a < ξ, J ◦ φg (x) > = < ξ, Ad∗g J(x) > = < Adg ξ, J(x) > e pertanto J è Ad∗ -equivariante se e solo se fξ ◦ φg = fAdg ξ per ogni ξ ∈ g, g ∈ G. Questa affermazione è equivalente a fξ ◦ φexp sη = fAdexp(sη) ξ per ogni ξ, η ∈ g, s ∈ R, ovvero, d d fξ ◦ φexp sη = fAdexp(sη) ξ ; ds ds s=0 s=0 ma il membro di sinistra di questa uguaglianza è Xdfη (fξ ) = −{fξ , fη }, mentre il membro di destra è fadη ξ = −f[ξ,η] . Esempio 11.8. Verifichiamo l’Ad∗ -equivarianza dell’applicazione momento nel caso del sollevamento a T ∗ Q dell’azione di un gruppo di Lie G su una varietà Q. Usiamo le stesse notazioni della Proposizione 11.6. Valgono per ogni ξ ∈ g e ogni α ∈ T ∗ Q le implicazioni J ◦ Φg (α) = Ad∗g ◦J(α) ⇐⇒ < ξ, J ◦ Φg (α) > = < Adg ξ, J(α) > I.38 ⇐⇒ Ma (Φg )∗ Xdfξ = XdfAd g −1 ξ < Xdfξ , θ >Φg (α) = < XdfAdg ξ , θ >α ,28 e quindi il secondo membro dell’ultima equazione è < (Φg )∗ Xdfξ , θ >α = < Xdfξ , Φ∗g−1 θ >Φg (α) = < Xdfξ , θ >Φg (α) . 12. Riduzione di sistemi hamiltoniani Iniziamo con alcuni esempi. Esempio 12.1. (Variabili cicliche) Prendiamo Q = Rn , T ∗ Q ' R2n con coordinate {q 1 , . . . , q n , p1 , . . . , pn } e forma simplettica ω = dpi ∧ dq i . Sia H una funzione che non dipende da r delle coordinate q, per esempio q 1 , . . . , q r . Allora le funzioni p1 , . . . , pr sono costanti del moto (in involuzione, ovvero {pi , pk } = 0 per i, k = 1, . . . , r). Il corrispondente gruppo di simmetria è il gruppo delle traslazioni G = Rr che agisce su Q secondo φa (q 1 , . . . , q n ) = (q 1 − a1 , . . . , q r − ar , q r+1 , . . . , q n ) se a = (a1 , . . . , ar ). Vogliamo studiare la riduzione di questo sistema. Un primo passo è la restrizione del sistema alla sottovarietà Sµ = {(q, p) ∈ R2n | pi = µi , i = 1, . . . , r} . Il campo vettoriale XdH è tangente a Sµ , avendo la forma XdH = n n X X ∂H ∂ ∂H ∂ − α ∂q ∂pα ∂pi ∂q i α=r+1 i=1 e induce pertanto un campo vettoriale Xµ su Sµ . Il sistema ristretto a Sµ si scrive ∂H r+1 q̇ i = (q , . . . , q n , µ1 , . . . , µr , pr+1 , . . . , pn ) i = 1, . . . , n ∂pi ∂H r+1 ṗα = − (q , . . . , q n , µ1 , . . . , µr , pr+1 , . . . , pn ) α = r + 1, . . . , n ∂q α mentre il sistema residuo si riduce a ṗj = 0, j = 1, . . . , r. Secondo passo: il gruppo delle traslazioni G agisce su Sµ ed è un gruppo di simmetrie di Xµ . Lo spazio quoziente Vµ = Sµ /G è un iperpiano sul quale le funzioni {q r+1 , . . . , q n , pr+1 , . . . , pn } formano un sistema di 28Si ha infatti » (Φg )∗ Xdfξ = d Φg ◦ Φexp sξ (α) ds – » = s=0 – d Φ(exp sξ)g (α) . ds s=0 Definita l’applicazione Φα : G → T ∗ Q, Φα (g) = Φg (α) vale ξ˜∗ (α) = (Φα )∗ (ξ), e pertanto » (Φg )∗ Xdfξ (α) = d Φα ◦ Rg (exp sξ) ds – = (Φα )∗ (Rg )∗ ξ s=0 = (Φα )∗ (Rg )∗ (Lg−1 )∗ ξ = (Φα )∗ Adg−1 ξ = XdfAd g −1 ξ (α) . I.39 coordinate. Il campo vettoriale Xµ induce su Vµ un campo vettoriale hamiltoniano la cui funzione hamiltoniana è Hµ (q r+1 , . . . , q n , pr+1 , . . . , pn ) = H(q r+1 , . . . , q n , µ1 , . . . , µr , pr+1 , . . . , pn ) ; il sistema ridotto è ora (32) q̇ α = ṗα =− ∂Hµ ∂pα ∂Hµ , ∂q α α = r + 1, . . . , n . Il sistema residuo è ora dato da ∂H r+1 q̇ j = (q , . . . , q n , µ1 , . . . , µr , pr+1 , . . . , pn ) , ∂pj ṗj = 0, j = 1, . . . , r . Possiamo notare che (i) La varietà Vµ è simplettica: su di essa si può definire la forma simplettica ωµ = n X dpα ∧ dq α . α=r+1 Inoltre il sistema ridotto (32) è hamiltoniano. (ii) L’esistenza di r costanti del moto (oppure l’esistenza di un gruppo di simmetria rdimensionale) permette di ridurre l’ordine del sistema di 2r unità. (iii) Una volta risolto il sistema ridotto, il sistema residuo si integra per quadrature, in ∂H quanto le funzioni ∂p non dipendono dalle q j (j = 1, . . . , r). j Esempio 12.2. Sia (V, ω, XdH ) un sistema dinamico hamiltoniano, e f una sua constante del moto. Assumiamo che Xdf sia completo. Se µ ∈ R è un punto regolare di f , l’insieme Sµ = f −1 (µ) è una sottovarietà regolarmente immersa di V . Il campo XdH è tangente a Sµ (essendo {f, H} = 0), ed induce un campo Xµ su Sµ . D’altra parte essendo Xdf completo il gruppo ad un parametro {ψs } da esso generato dà luogo ad un’azione di R su V , che per il teorema di Noether è un gruppo di simmetrie di XdH . l’applicazione momento coincide con f (si noti che g∗ ' R, e l’azione di R è ovviamente poissoniana). Ogni diffeomorfismo ψs lascia Sµ invariata (Xdf (f ) = 0), e pertanto {ψs } induce un gruppo ad un parametro {ψsµ } di diffeomorfismi di Sµ . Se supponiamo che quest’azione sia libera e propria, il quoziente Vµ = Sµ /R è una varietà differenziabile, ed il campo vettoriale Xµ si proietta sul quoziente. La varietà Vµ è simplettica; possiamo infatti scegliere (localmente) in V coordinate simplettiche {q 1 , . . . , q n , p1 , . . . , pn } tali che p1 = f . In queste coordinate ψs è descritto dall’equazione ψs (q 1 , . . . , q n , p1 , . . . , pn ) = (q 1 − s, q 2 . . . , q n , p1 , . . . , pn ) . Le funzioni {q 2 , . . . , q n , p2 , . . . , pn } sono allora coordinate su Vµ , e la forma ωµ = n X i=2 è simplettica. dpi ∧ dq i I.40 Localmente siamo nella stessa situazione dell’esempio precedente, e valgono le stesse conclusioni. Notiamo che, dette ιµ : Sµ → V l’inclusione e πµ : Sµ → Vµ la proiezione, la forma simplettica ωµ verifica la condizione πµ∗ ωµ = ι∗µ ω. Esempio 12.3. Prendiamo V = R4 con coordinate canoniche {q 1 , q 2 , p1 , p2 }, ω = dp1 ∧ dq 1 + dp2 ∧dq 2 , H = 12 (p21 +p22 )+V (q1 −q2 ) (questa è la funzione hamiltoniana di due particelle che si muovono su una retta soggette ad una forza conservativa che dipende solo dalla loro posizione relativa). La funzione H è invariante per il gruppo di trasformazioni ψs : (q 1 , q 2 , p1 , p2 ) 7→ (q 1 − s, q 2 − s, p1 , p2 ) il cui generatore X = − ∂q∂ 1 − ∂q∂ 2 è hamiltoniano, con funzione hamiltoniana f = p1 + p2 ; questa è una costante del moto (fisicamente, la quantità di moto totale del sistema). Dal precedente esempio sappiamo che è possibile ridurre di due unità l’ordine del sistema; ciò si ottiene introducendo la nuove coordinate simplettiche q̄ 1 = q 1 , q̄ 2 = q 2 − q 1 , p̄1 = p1 + p2 , p̄2 = p2 che “raddrizzano” X, in quanto X = − ∂∂q̄1 . In queste variabili H non dipende da q̄ 1 , H = p̄22 − p̄1 p̄2 + 12 p̄21 + V (−q̄ 2 ) . Il sistema delle equazioni di Hamilton si spezza in ∂V , ∂ q̄ 2 p̄1 = µ = costante q̄˙2 = 2p̄2 − p̄1 , q̄˙1 = p̄1 − p̄2 , p̄˙2 = (sistema ridotto) (sistema residuo) . Una volta risolto il sistema ridotto il sistema residuo si integra direttamente: Z q̄ 1 (t) = − p̄2 (t) dt + µ1 t . Esercizio 12.4. È utile notare che il sistema del precedente Esempio si può studiare anche senza introdurre coordinate simplettiche. Rifare dunque i calcoli usando le coordinate p = p1 + p2 , q = q1, y = p1 , r = q1 − q2 . Esempio 12.5. Siano V = R4 con coordinate canoniche {q 1 , q 2 , p1 , p2 }, ω = dp1 ∧dq 1 +dp2 ∧dq 2 , 2 H = f (p2 , p1 eq ). La funzione H è invariante sotto l’azione di R2 data da ψs,t (q 1 , q 2 , p1 , p2 ) = (q 1 − s, q 2 + t, p1 e−t , p2 ) . Il campo fondamentale t∗ = ∂q∂ 2 − p1 ∂p∂ 1 , e la 1-forma corrispondente è −p1 dq 1 − dp1 , che non è chiusa. t∗ non è localmente hamiltoniano, e l’azione non è simplettica. La funzione H è anche invariante sotto l’azione φ di R2 data da29 (33) φs,t (q 1 , q 2 , p1 , p2 ) = (q 1 et + s, q 2 + t, p1 e−t , p2 ) . In questo caso i campi fondamentali s∗ = ∂ ∂q 1 e t∗ = q 1 ∂ ∂ ∂ + 2 − p1 1 ∂q ∂q ∂p1 29In realtà non è il gruppo R2 che agisce, in quanto, come si può verificare direttamente, e come vedremo sotto, questa azione non è abeliana. Si tratta quindi dell’azione di un gruppo di Lie G diffeomorfo (ma non isomorfo come gruppo) a R2 . I.41 sono hamiltoniani, e l’azione φ è simplettica. Le costanti del moto associate a questa simmetria sono f1 = −p1 q 1 − p2 , f2 = −p1 ; si ha {f1 , f2 } = −f2 , e quindi l’azione è poissoniana. Introduciamo nuove coordinate q̄ 1 = p1 q 1 + p2 , q̄ 2 = q 2 + log p1 , p̄1 = log p1 , p̄2 = p2 . Il calcolo diretto mostra che dp̄1 ∧ dq̄ 1 + dp̄2 ∧ dq̄ 2 = ω , ovvero, le nuove coordinate sono simplettiche. La funzione H dipende solo da q̄ 2 e p̄2 : le equazioni di Hamilton si scrivono adesso q̄ 1 = µ1 = costante, p̄1 = µ2 = costante, q̄˙2 = ∂H , ∂ p̄2 p̄˙2 = − ∂H . ∂ q̄ 2 Sia Sµ , con µ = (µ1 , µ2 ), la superficie di equazione q̄ 1 = µ1 , p̄1 = µ2 . I campi fondamentali s∗ , t∗ non sono tangenti a Sµ , il che significa che l’azione (33) non preserva Sµ . Esercizio 12.6. Con riferimento al precedente esempio, si consideri il quoziente di V sotto l’azione (33). In questo caso conviene considerare coordinate {u, v, p1 , p2 }, con 2 u = p1 eq , v = p1 q 1 + p2 . (Attenzione: queste coordinate non sono simplettiche!) Le funzioni (u, p2 ) sono coordinate sul quoziente W . Dimostrare che il campo vettoriale XdH si proietta su W , mentre i campi s∗ e t∗ non proiettano. Si caratterizzi inoltre il gruppo G la cui azione è data dalla formula (33). Sulla base di questi esempi discuteremo ora un risultato riguardante la riduzione di sistemi hamiltoniani in presenza di un’azione poissoniana. Sia (V, ω) una varietà simplettica e φ un’azione poissoniana di un gruppo di Lie G su V . Per definizione φ ammette un’applicazione momento J Ad∗ -equivariante. Sia µ un fissato elemento di g∗ e sia Sµ = J −1 (µ). Supponendo che µ sia un valore regolare di J, il sottoinsieme Sµ ⊂ V è una sottovarietà regolarmente immersa. Come abbiamo visto nel precedente esempio, non è detto che φ lasci Sµ invariata, in quanto in generale l’azione del gruppo cambia il valore di µ. Introduciamo allora il gruppo di isotropia di Sµ rispetto all’azione coaggiunta, Gµ = {g ∈ G | Ad∗g µ = µ} . ∗ ∗ Poiché Gµ = χ−1 µ (µ), essendo χµ : G → g l’applicazione χµ (g) = Adg µ, Gµ è un sottogruppo ∗ chiuso di G, ed è pertanto un gruppo di Lie. Per la Ad -equivarianza di J si ha φg (Sµ ) ⊂ Sµ se g ∈ Gµ (infatti se x ∈ Sµ vale J(φg (x)) = Ad∗g J(x) = Ad∗g µ = µ); ciò definisce un’applicazione differenziabile Gµ × Sµ → Sµ , che è un’azione φµ di Gµ su Sµ . Supponiamo infine che quest’azione sia libera e propria, in modo che il quoziente Vµ = Sµ /Gµ sia una varietà differenziabile. La dimensione di Vµ è (34) dim Vµ = dim Sµ − dim Gµ = dim V − dim G − dim Gµ . Siano ιµ : Sµ → V l’immersione della sottovarietà Sµ , e πµ : Sµ → Vµ la proiezione sullo spazio quoziente. I.42 Proposizione 12.7. (Teorema di Marsden-Weinstein) Sotto le ipotesi enunciate nella precedente discussione, e sotto l’ulteriore ipotesi che G sia compatto e connesso, (1) esiste un’unica forma simplettica ωµ su Vµ tale che πµ∗ ωµ = ι∗µ ω. (2) Se H è una funzione differenziabile su V invariante sotto l’azione φ di G, allora il flusso {ψt } di XdH lascia Sµ invariata e commuta con l’azione di Gµ su Sµ , inducendo un flusso {ψ̂t } su Vµ . Tale flusso è hamiltoniano, e la sua funzione hamiltoniana Hµ è la proiezione di H su Vµ , ovvero, verifica la condizione Hµ ◦ πµ = H ◦ ιµ . Dimostrazione della parte (2). Incominciamo col dimostrare la parte (2), assumendo già dimostrata la parte (1). Il flusso {ψt } di XdH lascia Sµ invariata perché XdH (J) = {H, J} = 0. Poiché H è invariante sotto l’azione di G, il gruppo Gµ è un gruppo di simmetria per XdH |Sµ , ovvero, Gµ commuta con i diffeomorfismi {ψt |Sµ }. Risulta pertanto indotto un flusso “ridotto” {ψ̂t } su Vµ . Sia Xµ il generatore di questo flusso. Nuovamente per la sua G-invarianza, H induce una funzione Hµ su Vµ tale che Hµ ◦ πµ = H ◦ ιµ . Rimane da mostrare che Xµ è hamiltoniano con funzione hamiltoniana Hµ . Sia y ∈ Vµ , e sia x ∈ Sµ tale che πµ (x) = y. Dato Y ∈ Ty Vµ sia Ỹ ∈ Tx Sµ tale che (πµ )∗ Ỹ = Y . Vale allora ωµ (Xµ (y), Y ) = ωµ (πµ ∗ XdH (x), (πµ )∗ Ỹ ) = (πµ∗ ωµ )(XdH (x), Ỹ ) = (ι∗µ ω)(XdH (x), Ỹ ) = ω(XdH (x), Ỹ ) perché Ỹ , XdH sono tangenti a Sµ = < Ỹ , dH(x) > = < Ỹ , ι∗µ dH(x) > = < Ỹ , πµ∗ dHµ (y) > = < Y, dHµ (y) > , ovvero, Xµ = XdHµ . La rimanente parte del presente paragrafo sarà dedicata alla dimostrazione della parte (1) del teorema di Marsden-Weinstein. Studiamo in primo luogo il caso “lineare”, ovvero, consideriamo uno spazio vettoriale E con una forma simplettica ω. Per ogni sottospazio vettoriale F ⊂ E definiamo il suo complemento simplettico come il sottospazio vettoriale di E F ω = {u ∈ E | ω(u, v) = 0 per ogni v ∈ F } . Definizione 12.8. Un sottospazio vettoriale F di E è detto — isotropo se F ⊂ F ω — coisotropo se F ω ⊂ F — simplettico se F ∩ F ω = {0} — lagrangiano se F = F ω . Esercizio 12.9. Dimostrare che (F ω )ω = F . Di conseguenza, il complemento simplettico di un sottospazio isotropo è coisotropo, e viceversa. Ogni sottospazio coisotropo dà luogo ad un nuovo spazio vettoriale simplettico. Lemma 12.10. Se F è sottospazio coisotropo di E, ι : F → E l’inclusione, e π : F → F 0 la proiezione sul quoziente F 0 = F/F ω , quest’ultimo ammette un’unica forma simplettica ω 0 tale che π ∗ ω 0 = ι∗ ω. I.43 Dimostrazione. Se v ∈ F ω e w ∈ F vale ω(v, w) = 0. Allora, denotando con [w] la classe in F 0 di un elemento ω ∈ F , possiamo definire ω 0 ([w1 ], [w2 ]) = ω(w1 , w2 ). Se ω 0 ([w1 ], [w2 ]) = 0 per ogni [w2 ] ∈ F 0 allora ω(w1 , w2 ) = 0 per ogni w2 ∈ F , per cui w1 ∈ F ω , e [w1 ] = 0. La forma ω 0 verifica la condizione π ∗ ω 0 = ι∗ ω per costruzione. L’unicità segue dal fatto che π ∗ è iniettiva. Passiamo ora al caso delle varietà. Una sottovarietà Q di una varietà simplettica (V, ω) è detta isotropa (coisotropa) se per ogni x ∈ Q lo spazio tangente Tx Q è isotropo (coisotropo) in Tx V . Consideriamo il caso di una sottovarietà coisotropa Q. Definiamo in Q la distribuzione (nel senso del teorema di Frobenius) ∆Q data da ∆Q (x) = (Tx Q)ω . Lemma 12.11. La distribuzione ∆Q è integrabile. Dimostrazione. Siano X, Y campi vettoriali su Q che stanno in ∆Q . Poiché ω è chiusa abbiamo, per ogni campo vettoriale Z su Q, 0 = dω(X, Y, Z) = X(ω(Y, Z)) + Z(ω(X, Y )) + Y (ω(Z, X)) + ω([Y, Z], X) + ω([X, Y ], Z) + ω([Z, X], Y ) . Essendo Q coisotropa si ha ω(Y, Z) = ω(X, Y ) = ω(Z, X) = 0. Anche i termini ω([Y, Z], X) e ω([Z, X], Y ) si annullano perché [Y, Z] e [Z, X] sono campi vettoriali su Q. Quindi ω([X, Y ], Z) = 0, e [X, Y ] ∈ ∆Q . Essendo ∆Q integrabile, ne possiamo considerare le varietà integrali massimali.30 In virtù del precedente Lemma e del teorema di Frobenius, la varietà Q ammette una foliazione le cui foglie sono sottovarietà isotrope di Q. Diciamo che Q è regolare se ognuna di queste foglie è una sottovarietà regolarmente immersa di Q, compatta e connessa. In questo caso, se definiamo una relazione di equivalenza in Q ponendo x1 ∼ x2 se x1 e x2 stanno sulla stessa foglia, il quoziente Q/ ∼ è una varietà differenziabile. Lemma 12.12. Se Q è una sottovarietà coisotropa regolare di una varietà simplettica V , il quoziente Q/ ∼ è una varietà simplettica. Dimostrazione. Sia p : Q → V 0 = Q/ ∼ la proiezione sul quoziente. Se y = p(x) lo spazio tangente Ty V 0 è isomorfo al quoziente Tx Q/∆Q (x). Per il Lemma 12.10 in Ty V 0 c’è un’unica forma simplettica ω 0 (y) tale che p∗ ω 0 (y) = ι∗ ω(x), essendo ι : Q → V l’inclusione. Mettendo in Q coordinate locali “adattate” (come si può effettivamente fare in virtù del teorema di Frobenius), si nota che al variare di y la forma ω 0 (y) è differenziabile. Inoltre la condizione p∗ ω 0 (y) = ι∗ ω(x), essendo p∗ iniettiva, implica che ω 0 sia chiusa. Quindi ω 0 è una forma simplettica su V 0 . 30Una varietà integrale W di una distribuzione integrabile ∆ si dice massimale se ogni varietà integrale di ∆ passante per un punto x ∈ W è contenuta in W . Per costruzione, per ogni punto x ∈ V passa una sola varietà integrale massimale. Una varietà integrale massimale è spesso detta “foglia”, e si dice che V ammette una “foliazione”. I.44 Dimostrazione della parte (1) del teorema di Marsden-Weinstein: il caso µ = 0. Cominciamo col dimostrare il teorema di Marsden-Weinstein quando µ = 0. Il gruppo di isotropia coincide allora con G, e la dimensione del quoziente V0 = S0 /G è dim V0 = dim V − 2 dim G . (35) Sia x ∈ S0 , e sia Ox l’orbita dell’azione di G su x; si ha Ox ⊂ S0 . Lo spazio tangente Tx Ox è generato dai valori ξ ∗ (x) dei campi vettoriali fondamentali al variare di ξ in g. Vogliamo mostrare che Tx Ox è il complemento simplettico di Tx S0 . Infatti essendo J(x) = 0 vale fξ (x) = 0 per ogni ξ ∈ g e pertanto ω(Xdfξ , Y ) = dfξ (Y ) = 0 per ogni Y ∈ Tx S0 , il che implica Tx Ox ⊂ (Tx S0 )ω . Ma i due spazi vettoriali hanno la stessa dimensione, e quindi coincidono. Essendo (Tx S0 )ω = Tx Ox ⊂ Tx S0 , la sottovarietà S0 è coisotropa. La foglie della foliazione isotropa di S0 sono quindi le orbite di G; in base alle ipotesi fatte (G è compatto e connesso e la sua azione è libera), le orbite sono sottovarietà compatte regolarmente immerse, ovvero, S0 è una sottovarietà coisotropa regolare. Il risultato cercato segue ora dal Lemma 12.12. L’unicità di ω0 segue nuovamente dall’iniettività di π0∗ . Una generalizzazione. La versione appena dimostrata del teorema di Marsden-Weinstein (ovvero il caso µ = 0) ammette una generalizzazione del seguente tipo. Sia O un’orbita dell’azione coaggiunta di G su g∗ tale che ogni punto di O sia un valore regolare di J. Allora SO = J −1 (O) è una sottovarietà regolarmente immersa di V , invariante sotto l’azione di G. Si assuma inoltre che G sia compatto e che la sua azione su SO sia libera. Proposizione 12.13. Sotto le ipotesi sopra menzionate, il quoziente VO = SO /G è una varietà simplettica di dimensione dim VO = dim V + dim O − 2 dim G . (36) Per dimostrare questo enunciato avremo bisogno di alcuni risultati circa le orbite coaggiunte in g∗ . Consideriamo in particolare le orbite sotto l’azione destra di G su g∗ $g (Γ) = Ad∗g Γ (37) per ogni Γ ∈ g∗ . Essendo queste orbite chiuse, esse sono delle varietà regolarmente immerse di g∗ . Su ogni orbita O si può definire una forma simplettica. Lo spazio tangente a O in Γ ∈ O si può identificare come TΓ O = {ad∗ξ Γ |ξ ∈ g} ; infatti i campi vettoriali fondamentali dell’azione coaggiunta sono proprio dati da d ∗ ∗ ξ (Γ) = Adexp sξ Γ ds s=0 e vale, per ogni η ∈ g, < η, ξ ∗ (Γ) > = d < Adexp sξ η, Γ > = < adξ η, Γ > = < η, ad∗ξ Γ >. ds s=0 I.45 Lemma 12.14. La 2-forma differenziale Ω definita su O dalla condizione ΩΓ (ξ ∗ , η ∗ ) = ΩΓ (ad∗ξ Γ, ad∗η Γ) = −< [ξ, η], Γ > è non degenere e chiusa. Dimostrazione. Dimostriamo che Ω è non degenere. Fissato Γ ∈ g∗ sia ΩΓ (ξ ∗ , η ∗ ) = 0 per ogni η ∈ g. Allora < η, ad∗ξ Γ > = −ΩΓ (ξ ∗ , η ∗ ) = 0 per ogni η ∈ g ; pertanto ξ ∗ (Γ) = ad∗ξ Γ = 0. Dimostriamo ora che dΩ = 0. Per ogni λ, ξ, η ∈ g si ha dΩ(λ∗ , ξ ∗ , η ∗ ) = λ∗ (Ω(ξ ∗ , η ∗ )) + permutazioni cicliche − (Ω(λ∗ , [ξ ∗ , η ∗ ]) + permutazioni cicliche). Essendo d ∗ λ (Ω(ξ , η ))Γ = = < [λ, [ξ, η]], Γ > < [ξ, η], Adexp sλ Γ > ds s=0 Ω(λ∗ , [ξ ∗ , η ∗ ]) = < [λ, [ξ, η]], Γ > ∗ ∗ ∗ si ha dΩ(λ∗ , ξ ∗ , η ∗ ) = 0. Avremo più avanti bisogno del seguente risultato. Proposizione 12.15. La forma simplettica Ω definita su un’orbita coaggiunta soddisfa la seguente relazione di Ad∗ -invarianza: $g∗ (Ω$g (Γ) ) = ΩΓ . In altri termini, la rappresentazione coaggiunta di G agisce su O per simplettomorfismi rispetto alla forma simplettica Ω. Dimostrazione. Cominciamo col notare che i campi vettoriali fondamentali verificano la proprietà di Ad∗ -equivarianza ($g )∗ ξ ∗ = (Adg−1 ξ)∗ , o, più precisamente, ($g )∗ ξ ∗ ($g−1 (Γ)) = (Adg−1 ξ)∗ (Γ) per ogni ξ ∈ g, Γ ∈ g∗ , g ∈ G. Si ha infatti d d ∗ (Adg−1 ξ) (Γ) = $exp s Adg−1 ξ (Γ) = $ −1 (Γ) ds ds g (exp sξ)g s=0 s=0 d = $g ◦ $exp sξ ◦ $g−1 (Γ) = ($g )∗ ξ ∗ ($g−1 (Γ)) . ds s=0 Si calcola allora ($g∗ Ω$g (Γ) )(ξ ∗ (Γ), η ∗ (Γ)) = Ω$g (Γ) (($g )∗ ξ ∗ (Γ), ($g )∗ η ∗ (Γ)) = −< [Adg−1 ξ, Adg−1 η], Ad∗g Γ > = −< Adg−1 [ξ, η], Ad∗g Γ > = ΩΓ (ξ ∗ (Γ), η ∗ (Γ)) . I.46 I campi vettoriali fondamentali dell’azione (37) di G su O sono la restrizione dei campi {ξ ∗ , ξ ∈ g} a O; questi sono hamiltoniani, con funzione hamiltoniana fξ (Γ) = < ξ, Γ >. Infatti per ogni η ∈ g si ha d ∗ ∗ ∗ dfξ (η )Γ = η (fξ )Γ = fξ (Adexp sη Γ) ds s=0 d = < ξ, Ad∗exp sη Γ > = −< [ξ, η], Γ > = ΩΓ (ξ ∗ , η ∗ ) ds s=0 e quindi Xdfξ = ξ ∗ . La corrispondente applicazione momento JO : O → g∗ è l’inclusione naturale. Dimostriamo infine che l’azione (37) è poissoniana. Si ha {fξ , fη }Γ = −Ω(Xdfξ , Xdfη )Γ = −Ω(ξ ∗ , η ∗ )Γ = < [ξ, η], Γ > = f[ξ,η] (Γ). D’altra parte l’applicazione momento è ovviamente Ad∗ -invariante: JO ◦ $g (Γ) = Ad∗g Γ = Ad∗g JO (Γ) . Dimostrazione della Proposizione 12.13. Lo spazio VO è una varietà differenziabile come conseguenza delle ipotesi riassunte prima dell’enunciato della Proposizione. Costruiamo ora la forma simplettica ωO su VO . Per ogni ξ ∈ g denotiamo con Xξ il campo vettoriale fondamentale associato all’azione di G su V e con ξ ∗ il campo vettoriale fondamentale associato all’azione coaggiunta di G su O. Si consideri la varietà Ṽ = V × O dotata della forma simplettica ω̃ = ω ⊕ (−Ω), essendo ω la forma simplettica di V , e Ω la forma simplettica di O precedentemente descritta. Il gruppo G agisce su Ṽ per simplettomorfismi (cfr. in particolare la Proposizione 12.15), e la ˜ Γ) = J(x)−JO (Γ) = J(x)−Γ. corrispondente applicazione momento J˜: Ṽ → g∗ è data da J(x, La restrizione a SO dell’applicazione V → V × g∗ , x 7→ (x, J(x)) stabilisce un diffeomorfismo SO → J˜−1 (0), il cui inverso è la restrizione a J˜−1 (0) della proiezione V × O → V . Si ha pertanto un diffeomorfismo VO ' J˜−1 (0)/G, e dalla formula (35) segue che la dimensione di VO è data dall’equazione (36). Per il teorema di Marsden-Weinsten nel caso µ = 0, che già abbiamo dimostrato, esiste su J˜−1 (0)/G un’unica forma simplettica ω0 tale che (38) π̃ ∗ ω0 = ι̃∗ ω̃ . Identificando VO con J˜−1 (0)/G otteniamo la forma simplettica richiesta. Dimostrazione della Proposizione 12.7 (teorema di Marsden-Weinstein per un qualsiasi valore di µ ∈ g∗ ). Sia Oµ l’orbita di µ in g∗ . Riconduciamo la Proposizione 12.7 alla 12.13, dimostrando in primo luogo che J −1 (µ)/Gµ ' J −1 (Oµ )/G, ovvero, Vµ ' VOµ . Notiamo che J −1 (µ) ⊂ J −1 (Oµ ). Sia π 0 : J −1 (Oµ ) → J −1 (Oµ )/G la proiezione sul quoziente, e sia y ∈ Vµ . I.47 Se x ∈ J −1 (µ) è tale che πµ (x) = y, l’elemento π 0 (x) ∈ J −1 (Oµ )/G non dipende dalla scelta di x in πµ−1 (y). Definiamo allora un’applicazione α : J −1 (µ)/Gµ → J −1 (Oµ )/G, y 7→ π 0 (x). Viceversa, se z ∈ J −1 (Oµ )/G, sia x ∈ J −1 (Oµ ) tale che π 0 (x) = z, e sia Γ = J(x). Esiste g ∈ G tale che Ad∗g Γ = µ; allora φg (x) ∈ J −1 (µ). Definiamo un’applicazione β : J −1 (Oµ )/G → J −1 (µ)/Gµ , z 7→ πµ (φg (x)) . Le due applicazioni sono entrambe differenziabili, e sono l’una l’inverso dell’altra; di conseguenza le varietà J −1 (µ)/Gµ e J −1 (Oµ )/G sono diffeomorfe. Consideriamo adesso il diagramma commutativo πOµ ι̃ πµ ιµ VOµ ←−−−− SOµ −−−−→ V × Oµ x x x j ̃ α Vµ ←−−−− Sµ −−−−→ V dove le applicazioni j e ̃ sono rispettivamente l’inclusione naturale e l’applicazione ̃(x) = (x, J(x)) (si noti che per ogni x ∈ Sµ vale ̃ ◦ ιµ (x) = (x, µ), e che pertanto ι∗µ ω = ι∗µ ◦ ̃∗ ω̃). Inoltre πOµ è la naturale proiezione sul quoziente. Definiamo ωµ = α∗ ωO . Dalla (38) e dalla commutatività del precedente diagramma segue la condizione πµ∗ ωµ = ι∗µ ω. I.48 Capitolo I SISTEMI COMPLETAMENTE INTEGRABILI L’integrabilità di un sistema di 2n equazioni alle derivate ordinarie equivale alla conoscenza di 2n integrali primi. Quando queste equazioni sono di tipo canonico (nel senso che si possono scrivere sotto forma di equazioni di Hamilton), è a volte sufficiente conoscere a priori solo n integrali primi. Ciò accade nel caso dei cosiddetti sistemi completamente integrabili. Un esempio di tale situazione, che esamineremo nel primo paragrafo, si incontra nell’ambito della teoria della riduzione che abbiamo studiato nel precedente capitolo. I seguenti paragrafi forniranno poi un’introduzione generale alla teoria dei sistemi completamente integrabili. 13. Il teorema di Jacobi-Liouville Sia (V, ω) una varietà simplettica, di dimensione 2n, e siano f1 , . . . , fr funzioni differenziabili su V che sono in involuzione, ovvero, {fi , fj } = 0 per ogni i, j = 1, . . . , r. Supponiamo che (i) i campo vettoriali hamiltoniani associati X (i) = Xdfi siano completi, e sia {ψs } il flusso di X (i) . Poiché 0 = Xd{fi , fj } = [X (i) , X (j) ], i campi X (i) commutano, e pertanto commutano anche i loro flussi: (j) (j) ψs(i) ◦ ψw = ψw ◦ ψs(i) per ogni i, j = 1, . . . , r, e ogni s, w ∈ R . Possiamo definire un’azione φ di G = Rr su V , ponendo φ(s1 ,...,sr ) (x) = ψs(1) ◦ · · · ◦ ψs(r) (x) . r 1 Essendo G abeliano, l’azione φ è poissoniana; l’applicazione momento è J : V → Rr , J(x) = (f1 (x), . . . , fr (x)). Supponiamo che µ = (µ1 , . . . , µr ) ∈ Rr sia un valore regolare di J. Con riferimento alla notazione impiegata nel precedente capitolo a proposito del teorema di Marsden-Weinstein, la sottovarietà Sµ ⊂ V è regolarmente immersa; inoltre in questo caso Gµ = G, e i campi vettoriali X (i) sono tangenti a Sµ e indipendenti in ogni punto. Di conseguenza l’azione di G su Sµ è localmente libera,31 e una varietà quoziente di dimensione 2(n − r)(che assumiamo essere liscia) esiste almeno localmente. Sia H una funzione su V , in involuzione con tutte le funzioni fi (ovvero, {H, fi } = 0, i = 1, . . . , r); in altri termini, le funzioni fi sono costanti del moto per l’evoluzione del sistema 31L’azione ρ di un gruppo G su una varietà V è localmente libera se per ogni punto x ∈ V il gruppo di isotropia Gx è discreto. Non è difficile dimostrare che se i generatori dell’azione di G su V sono linearmente indipendenti in ogni punto allora l’azione è localmente libera. I.49 dinamico dato dalla funzione H. Il teorema di Marsden-Weinstein permette di ridurre di 2r l’ordine del sistema associato al campo vettoriale XdH . Si può mostrare che il sistema residuo è integrabile per quadrature.32,33 Se r = n il sistema ridotto scompare, ed il sistema è integrabile per quadrature. 14. Il teorema di Liouville-Arnold Motivati dalla precedente discussione, definiamo la nozione di sistema completamente integrabile come segue. Sia V il fibrato cotangente di una varietà differenziabile n-dimensionale Q, sia ω la forma simplettica canonica di V = T ∗ Q, e si fissi una funzione hamiltoniana H. Fissati una n-pla di funzioni fi : V → R, i = 1, . . . , n e un punto µ = (µ1 , . . . , µn ) ∈ Rn , poniamo Sµ = f −1 (µ), essendo f : V → Rn , f (x) = (f1 (x), . . . , fn (x)) . Definizione 14.1. Diciamo che il sistema dinamico hamiltonianiano (V, ω, H) è completamente integrabile in un aperto U ⊂ V se esistono n costanti del moto f1 , . . . , fn (si assume f1 ≡ H) soddisfacenti le seguenti condizioni: (1) le funzioni fi sono in involuzione, {fi , fj } = 0 per ogni i, j = 1, . . . , n; (2) per ogni x ∈ U i covettori dfi (x) ∈ Tx∗ (V ) sono linearmente indipendenti.34 Proposizione 14.2. Dato un sistema completamente integrabile in U ⊂ V , sia µ = (µ1 , . . . , µn ) ∈ f (U ) ⊂ Rn , e sia Sµ = f −1 (µ). Allora (1) Sµ è una sottovarietà regolarmente immersa di V , invariante sotto i flussi dei campi vettoriali Xdfi . Se si assume inoltre che la varietà Sµ sia compatta e connessa, (2) Sµ è diffeomorfa al toro n-dimensionale; (3) l’evoluzione temporale avviene su Sµ ,35 e determina su Sµ un flusso condizionalmente periodico; ovvero, esistono coordinate (ψ 1 , . . . , ψ n ) su Sµ , e costanti ν 1 , . . . , ν n , funzione dei valori µ1 , . . . , µn , tali che l’evoluzione sia descritta su Sµ dalle relazioni (39) ψ i (t) = ν i t + ψ0i dove le quantità ψ0i sono costanti;36 (4) le equazioni del moto del sistema sono integrabili per quadrature. 32Si veda ad es. P.J. Olver, Applications of Lie groups to differential equations, Springer-Verlag. 33Si dice che un sistema di equazioni differenziali è integrabile per quadrature se esso può essere risolto mediante una successione di operazioni di tipo algebrico, inversioni di funzioni e calcoli di integrali. 34Quando questa condizione è soddisfatta si dice che le costanti del moto f sono indipendenti in U . i 35Per questo motivo la sottovarietà S è detta essere un toro invariante del sistema integrabile. µ 36Le equazioni (39) esprimono il fatto che in coordinate angolari il moto appare essere condizionalmente periodico (o quasi-periodico). Notiamo che in generale le costanti ν i dipendono dai dati iniziali, e non solo dalla struttura del sistema meccanico. È pertanto possibile che per opportuni dati iniziali le frequenze ν i siano tutte commensurabili, ovvero, che i quozienti ν i /ν j siano tutti razionali. In questo caso dopo un certo tempo il sistema si ritrova nelle condizioni iniziali, ed esibisce un comportamento periodico; per questo motivo il moto è detto “condizionalmente periodico”. I.50 Dimostrazione del punto (1). Essendo i covettori dfi (x) linearmente indipendenti per x ∈ U , l’applicazione f|U : U → Im f|U è una summersione, e Sµ è una sottovarietà regolarmente immersa di V . Poniamo X (i) = Xdfi . Essendo < X (i) , dfj > = X (i) (fj ) = {fi , fj } = 0 i campi vettoriali X (i) sono tangenti a Sµ , il che equivale a dire che Sµ è preservata dai loro flussi. Per ogni x ∈ Sµ , i vettori X (i) (x) sono linearmente indipendenti e quindi formano una base dello spazio tangente Tx Sµ . Detta ι : Sµ → V l’applicazione che realizza Sµ come sottovarietà di V , si ha (ι∗ ω)(X (i) , X (j) ) = {fj , fi }(x) = 0 , ovvero ι∗ ω = 0; lo spazio Tx Sµ è un sottospazio isotropo di Tx V . Essendo dim Tx V = 2 dim Tx Sµ lo spazio Tx Sµ è in realtà un sottospazio lagrangiano, ovvero, Sµ è una sottovarietà lagrangiana di V . 15. Dimostrazione del punto (2) Cominciamo con l’introdurre alcune nozioni e risultati che saranno utili per dimostrare la parte (2) del teorema di Liouville-Arnold. Ricordiamo che un reticolo Λ di rango k in Rn è un sottogruppo di Rn generato su Z da k vettori linearmente {e1 , . . . , ek } di Rn : ( k ) X Λ= mi ei , m1 , . . . , mk ∈ Z . i=1 Il toro n-dimensionale n.37,38 Tn è definito come il quoziente Rn /Λ, essendo Λ un reticolo di rango Definizione 15.1. Un sottogruppo Γ di Rn è detto discreto se ogni compatto di Rn contiene solo un numero finito di elementi di Γ. Evidentemente ogni reticolo di rango k è un sottogruppo discreto di Rn , con k ≤ n; anche l’implicazione opposta è vera. Lemma 15.2. Ogni sottogruppo discreto Γ di Rn è un reticolo. 37Ricordiamo che T n viene topologizzato mediante la topologia quoziente, mentre la struttura differenziabile viene fissata dalla condizione che sia differenziabile l’applicazione φ : π(Z) → Rn , φ(x) = (x1 , . . . , xn ) se x = π( n X xi ei ) i=1 essendo π : Rn → T n la proiezione, e Z ⊂ Rn la “cella elementare aperta” del reticolo, ovvero k X Z = { xi ei , 0 < xi < 1} . i=1 Diversi reticoli di rango n danno luogo a quozienti diffeomorfi. Ricordiamo inoltre che i generatori {ei } di Λ divengono sul quoziente delle curve chiuse γi , dette cicli fondamentali del toro. I cicli fondamentali generano il primo gruppo di omotopia e il primo gruppo di omologia a coefficienti interi del toro, entrambi isomorfi alla somma diretta di n copie di Z. 38Più avanti considereremo per convenienza il toro n-dimensionale definito come il quoziente Rn /2πΛ. I.51 Dimostrazione. Evidentemente il punto 0 ∈ Rn sta sempre in Γ. Se Γ non ha altri punti, abbiamo finito. Altrimenti, sia ~0 un altro punto39 di Γ. Se d1 è la distanza di ~0 dall’origine, la sfera di raggio d1 centrata in 0 contiene un numero finito di punti di Γ. Si scelga fra questi il punto ~1 sulla retta r = R~0 più vicino a 0, escludendo 0 (se ve ne sono due, se ne prenda uno a caso). I punti sulla retta r sono tutti del tipo m~1 con m ∈ Z; infatti se su r vi fosse un punto ~ compreso fra m~1 e (m + 1)~1 allora ~ − m~1 sarebbe più vicino a 0 di ~1 . Se Γ non ha punti fuori di r, abbiamo concluso. Altrimenti se ~ 0 è un punto di Γ che non sta in r, sia d2 la sua distanza da r, e si prenda il punto (o uno dei punti) ~2 della sfera di raggio d2 centrata nella proiezione di ~ 0 su r più vicino a r, ma non giacente su r. Detto π il piano passante per r e ~2 , si dimostra come prima che ogni punto di π è della forma m1~1 + m2~2 , con m1 ed m2 interi. Se Γ ha punti fuori da π si itera la procedura, che al più finisce all’n-simo passo. Vogliamo adesso dimostrare il seguente risultato. Proposizione 15.3. Sia W una varietà differenziabile n-dimensionale, connessa e compatta, su cui sono definiti n campi vettoriali linearmente indipendenti, che commutano fra di loro. Allora W è diffeomorfa al toro n-dimensionale. (i) Detti X (i) i campi vettoriali (che essendo W compatta sono completi), e Ψ i loro flussi, possiamo definire un’azione di Rn su W fissando un punto x ∈ W e ponendo (40) (1) (n) ~(x) = Ψ1 ◦ . . . Ψn (x), . Scambiando il ruolo di ~ e x otteniamo un’applicazione gx : Rn → W, (1) (n) gx (~) = Ψ1 ◦ . . . Ψn (x) . Lemma 15.4. Per ogni x ∈ W l’applicazione gx è (1) iniettiva quando ristretta ad un opportuno intorno di 0 ∈ Rn (2) surgettiva (ovvero, l’azione (40) di Rn su W è transitiva). Dimostrazione. Notiamo che gx (0) = x. Scelte coordinate attorno a x, la matrice jacobiana di gx in 0 è formata dalle componenti dei vettori X (i) (x) su queste coordinate. Essendo i vettori linearmente indipendenti, la matrice ha identicamente caratteristica pari a n. Pertanto in un intorno di 0 l’applicazione gx è un diffeomorfismo, ed in particolare è iniettiva. Di conseguenza, ogni x ∈ W ammette un intorno aperto N tale che per ogni y ∈ N esista un ~ ∈ Rn per cui vale y = gx (~). Per compattezza, W può essere coperto da un numero finito di tali intorni. Inoltre, fissato y ∈ W , possiamo scegliere m+1 di questi aperti, che denotiamo (N0 , . . . , Nm ), in modo che y ∈ Nm , x ∈ N0 , e Ni ∩ Ni+1 6= ∅, con i = 0, . . . , m − 1. Scegliamo punti yi ∈ Ni ∩ Ni+1 e poniamo ym = y, y0 = x. Esistono ~ei ∈ Rn tali che gyi (~ei ) = yi+1 . Ciò P implica gx ( m−1 ei ) = y. i=0 ~ 39In questo capitolo denotiamo gli elementi di Rn sovrapponendo ad essi una freccia: cosı̀, ~ = (1 , . . . , n ). I.52 Nota 15.5. La prima parte della precedente dimostrazione si modifica facilmente per dimostrare che l’applicazione gx è un diffeomorfismo locale: ogni ~ ∈ Rn ha un intorno N tale che gx ristretta a N è un diffeomorfismo. Definizione 15.6. Il gruppo di isotropia (o stabilità) di W in un punto x ∈ W è il sottogruppo Γx di Rn dato da Γx = {~ ∈ Rn t.c. gx (~) = x} . In realtà il gruppo di isotropia Γx non dipende da x: se ~ ∈ Γy vale ~(y) = y, ma y = ~η (x) per qualche ~η ∈ Rn , per cui ~(~η (x)) = ~η (x) ; questa si può anche scrivere (1) (n) (1) (n) (1) (n) (1) (n) (1) (n) Ψη1 ◦ . . . Ψηn (x) = Ψ1 ◦ . . . Ψn ◦ Ψη1 ◦ . . . Ψηn (x) = Ψη1 ◦ . . . Ψηn ◦ Ψ1 ◦ . . . Ψn (x) da cui si ricava ~(x) = x, ovvero, ~ ∈ Γx e quindi Γy ⊂ Γx . Poiché vale anche Γx ⊂ Γy , si ha Γy = Γx . Possiamo quindi parlare del gruppo di isotropia Γ di W . Dimostriamo che Γ è discreto. Si ha ovviamente 0 ∈ Γ; essendo gx iniettiva in un intorno di 0, esiste un intorno di 0 che non contiene altri elementi di Γ. Questo intorno contiene una sfera piena aperta Bd (0) di raggio d, a patto che d sia sufficientemente piccolo. Se ~ è un altro elemento di Γ, la sfera Bd (~) di raggio d centrata in ~ non contiene altri elementi di Γ (se ~η ∈ Bd (~) allora ~η − ~ ∈ Bd (0)). Quindi Γ è un sottogruppo discreto di Rn , ed è pertanto un reticolo.40 Dimostrazione della Proposizione 15.3. Sia π : Rn → Rn /Γ la proiezione. Fissiamo x ∈ W , e, dato y ∈ W , scegliamo un ~ ∈ Rn tale che y = gx (~). Definiamo un’applicazione f : W → Rn /Γ ponendo y 7→ π(~). L’applicazione è ben definita perché se anche ~η verifica y = gx (~η ) allora ~η − ~ ∈ Γ, e quindi π(~η ) = π(~). L’applicazione f è surgettiva: se p ∈ Rn /Γ, sia ~ ∈ Rn tale che π(~) = p. Posto y = ~(x) vale f (y) = x. L’applicazione f è iniettiva: se f (y1 ) = f (y2 ), sia y1 = gx (~1 ), y2 = gx (~2 ). Da ciò segue ~1 − ~2 ∈ Γ. D’altra parte si ha (1) (n) 1 1 y1 = Ψ1 ◦ . . . Ψn (x), (1) (n) 2 2 y2 = Ψ1 ◦ . . . Ψn (x), da cui y1 = gy2 (~1 − ~2 ). Essendo ~1 − ~2 ∈ Γ si ha y1 = y2 . Quindi f è bigettiva. Inoltre f è differenziabile, ed essendo un diffeomorfismo locale (come segue dalla Nota 15.5), il suo inverso è pure differenziabile. Quindi f è un diffeomorfismo. Essendo W compatta, Γ ha rango n, e Rn /Γ è un toro.41 Nota 15.7. Fissato come al solito x ∈ W , i parametri 1 , . . . , n possono essere usati come coordinate su un intorno aperto Z di x in W . Mediante l’identificazione W ' Rn /Γ, queste 40Si noti che Rn /Γ ' T k × Rn−k , essendo k il rango di Γ. 41Ciò in realtà dimostra che se non assumiamo che W sia compatta, dimostriamo che W è diffeomorfa ad un prodotto T k × Rn−k per un k compreso fra 0 ed n. In questo caso però, venendo a mancare la compattezza, dobbiamo assumere che i campi vettoriali X (i) siano completi. Anche la dimostrazione del punto (1) del Lemma 15.4 andrebbe modificata. I.53 coordinate si identificano con le coordinate angolari sul toro Rn /Γ indotte dai generatori di Γ, e per Z si può prendere la cella elementare del reticolo. Notiamo inoltre che, avendo assunto che la costante del moto f1 coincida con l’hamiltoniana H, il parametro 1 si può identificare con il tempo t. Possiamo adesso dimostrare il punto (2) della Proposizione 14.2. I campi vettoriali X (i) commutano fra loro anche una volta ristretti a Sµ . Siamo allora nelle ipotesi della Proposizione 15.3, e il punto (2) della Proposizione 14.2 rimane provato. 16. Variabili azione-angolo Possiamo fissare in U (eventualmente restringendo quest’ultimo) 2n funzioni (φ1 , . . . , φn , f1 , . . . , fn ) che ristrette ad ogni Sµ (con µ ∈ f (U )) costituiscono un sistema di coordinate su Sµ , e che insieme alle funzioni (f1 , . . . , fn ) forniscono un sistema di coordinate in U . In generale queste coordinate non sono simplettiche; se cosı̀ fosse, in queste coordinate le equazioni del moto di Hamilton assumerebbero la forma canonica dφi ∂H = = ν̃ i , dt ∂fi dfi ∂H =− i =0 dt ∂φ dove le ν̃ i sono costanti durante dell’evoluzione. Ricordando che H = f1 si ha ν̃ i = dφi ∂H = = δ1i , dt ∂fi ovvero, una sola delle “frequenze” ν̃ i è diversa da zero, il che in generale è falso. È possibile però sostituire le coordinate (φ1 , . . . , φn ) con nuove coordinate angolari (ψ 1 , . . . , e le funzioni f1 , . . . , fn con nuove funzioni I1 , . . . , In , da esse dipendenti, in modo che le 2n funzioni (ψ 1 , . . . , ψ n , I1 , . . . , In ) siano un sistema di coordinate simplettiche, dette variabili azione-angolo . Come discuteremo più avanti, mediante l’introduzione di tali coordinate dimostreremo anche il punto (4) del teorema di Liouville-Arnold. ψ n ), Esempio 16.1. Cominciamo con l’introdurre queste coordinate in un semplice esempio unidimensionale, un oscillatore armonico con funzione hamiltoniana H = 21 p2 + 12 q 2 . Lo spazio delle fasi V di questo sistema è diffeomorfo a R2 ; la funzione H è indipendente dove dH 6= 0, ovvero, fuori dall’origine. La condizione di involutività è banalmente verificata. In questo caso i tori invarianti sono le circonferenze H = costante, e ogni toro invariante si identifica con il suo ciclo fondamentale γ1 . Introduciamo in V coordinate polari ponendo p = r cos φ, q = r sin φ; evidentemente φ è una coordinata angolare sui tori invarianti. Se poniamo I = 21 r2 = H la forma simplettica si scrive ω = dp ∧ dq = dI ∧ dφ, per cui le funzioni (φ, I) formano, sullo stesso aperto su cui sono definite le coordinate polari, un sistema di coordinate simplettiche, ovvero, sono coordinate azione-angolo (in questo caso queste coordinate coincidono con le coordinate (φ, f1 = I) del precedente paragrafo). I.54 Vediamo ora di trovare una trasformazione canonica42 che produca la trasformazione di coordinate (q, p) 7→ (φ, I). Se assumiamo che questa trasformazione canonica sia descritta da una funzione generatrice W (q, I) di seconda specie, devono valere le relazioni (41) p= ∂W , ∂q φ= ∂W . ∂I L’hamiltoniana trasformata è I, per cui deve valere l’equazione di Hamilton-Jacobi dW 2 1 2 1 + 2q = I 2 dq dove vediamo la funzione incognita W come funzione di q con una “dipendenza parametrica” da I. Questa equazione è evidentemente risolta dalla funzione Z p W (q, I) = 2I − q 2 dq ; in particolare si ha ∂W = ∂I Z dq q p = arc sin √ = φ . 2 2 I 2I − q R La funzione W si può scrivere W = p dq (come si vede anche direttamente dalle equazioni (41) pensando di fissare il valore di I), ed essendo p dq la forma di Liouville (forma presimplettica), in un certo senso W è l’integrale della forma di Liouville. Si noti come l’integrale Z 2π H p dq = r2 cos2 φ dφ = π r2 = 2π I 0 fornisca 2π volte la variabile I, e allo stesso tempo coincida con l’area della regione di V H contenuta nel toro invariante definito dal valore r della coordinata radiale. Il simbolo rappresenta l’integrale lungo il ciclo fondamentale. Infine notiamo che la variabile I dipende solo da H (in questo caso vale addirittura I = H). Definizione 16.2. Sia dato un sistema completamente integrabile, con integrali primi in involuzione f1 , . . . , fn . Un sistema di coordinate locali simplettiche {ψ 1 , . . . , ψ n , I1 , . . . , In } è un sistema di variabili azione-angolo se 1) le coordinate Ij , dette azioni,43 dipendono solo dai valori degli integrali primi fi ; 2) le funzioni {ψ 1 , . . . , ψ n } sono coordinate angolari sui tori invarianti, ovvero, dato un toro invariante S, esiste un diffeomorfismo S → Rn /2πΛ che identifica le funzioni {ψ 1 , . . . , ψ n } con le coordinate angolari naturali di Rn /2πΛ; Λ è il reticolo “standard” generato dalla base canonica di Rn . 42Usiamo qui il fatto che ogni diffeomorfismo di una varietà differenziabile induce una trasformazione di coordinate; in particolare, se f è un diffeomorfismo di Rn , la sua rappresentazione y i = y i (x1 , . . . , xn ) nelle coordinate canoniche di Rn permette di vedere le y i come un nuovo sistema di coordinate su Rn ; le “coordinate y” di un punto p ∈ Rn sono le “coordinate x” di f (p). Le teoria delle funzioni generatrici delle trasformazioni canoniche viene svolta in questo modo. 43Il termine “azione” proviene dal fatto che le funzioni I hanno le dimensioni fisiche un’azione (energia per j tempo), come segue dalla scrittura locale θ = pi dq i . I.55 Procediamo adesso alla costruzione delle variabili azione-angolo. Si fissino valori µ1 , . . . , µn degli integrali primi in modo da determinare un toro invariante S, e si scelgano su S coordinate angolari {φ1 , . . . , φn } con i corrispondenti cicli fondamentali γi , i = 1, . . . , n; il ciclo fondamentale γi ha equazione φi (ξ) = ξ, φj (ξ) = 0 per j 6= i . Sia θ la forma di Liouville di V = T ∗ Q, cosicché ω = dθ. Detta ι : S → V l’immersione locale, poniamo θS = ι∗ θ. Si noti che dθS = ι∗ ω = 0. Definiamo infine la j-esima variabile d’azione come Z 1 (42) Ij (µ1 , . . . , µn ) = θS . 2π γj Le variabili d’azione sono indipendenti dalla scelta delle coordinate angolari {φ1 , . . . , φn }. Questo si può vedere con un argomento omologico: i cicli fondamentali γi0 associati ad un diverso sistema di coordinate angolari si possono deformare con continuità nei γi , e pertanto sono ad essi omologhi; i valori degli integrali (42) non cambiano. Esplicitamente, ciò siginifica che l’unione dei due cicli γi e γi0 (uno dei due preso con orientazione rovesciata) è la frontiera di una regione Σ di S. Si ha allora44 Z Z Z Z θS = θS = dθS = 0 . θS − γj0 ∂Σ γj Σ Le variabili (I1 , . . . , In ) verranno completate ad un sistema di coordinate, ed è pertanto necessario assumere che esse dipendano in maniera bigettiva dalle coordinate (f1 , . . . , fn ). Faremo quindi la seguente assunzione: per ogni µ = (µ1 , . . . , µn ) ∈ f (U ) la matrice jacobiana ∂Ij ∂µk è non singolare. Facendoci guidare dall’esempio 1, determiniamo adesso coordinate angolari (ψ 1 , . . . , ψ n ) in modo che insieme alle azioni (I1 , . . . , In ) esse formino un sistema di coordinate simplettiche. Fissiamo un sistema di coordinate simplettiche (q 1 , . . . , q n , p1 , . . . , pn ) in V . Notiamo inoltre che, essendo la forma θS chiusa, localmente essa è esatta. In particolare, detto Z l’aperto di S corrispondente alla cella fondamentale, su di Z vale θS = dW per un’opportuna funzione W . Fissato ad arbitrio un punto P0 ∈ Z abbiamo quindi Z P W (P ) = θS P0 dove P ∈ Z. Il cammino di integrazione da P0 a P può essere scelto ad arbitrio essendo θS chiusa (ovviamente il cammino di integrazione deve essere completamente contenuto in Z, e, in particolare, non si deve “avvolgere” attorno al toro). Se adesso riguardiamo W come 44Usiamo qui il teorema di Stokes: se η è una (k − 1)-forma differenziale su una varietà differenziabile orien- tabile k-dimensionale V , e U è un aperto a chiusura compatta di V , la cui frontiera è una varietà differenziabile orientabile di dimensione k − 1, vale Z Z η= dη . ∂U U Il teorema di Stokes della geometria differenziale rappresenta una generalizzazione, ed una enunciazione unificata, dei vari teoremi di Gauss, Stokes, Green etc. dell’analisi matematica. I.56 la funzione generatrice di seconda specie di una trasformazione canonica, che trasforma le coordinate (q, p) in nuove coordinate simplettiche (ψ 1 , . . . , ψ n , I1 , . . . , In ), abbiamo le relazioni (43) pi = ∂W , ∂q i ψj = ∂W ∂Ij dove vediamo W come funzione di (q 1 , . . . , q n , I1 , . . . , In ). Si noti che in generale le coordinate pi non sono delle buone variabili di azione perché non assumono valori costanti lungo i tori invarianti. Il secondo gruppo di equazioni determina i “nuovi” angoli ψ j . R Lemma 16.3. Le variabili ψ j soddisfano la condizione γi dψ j = 2π δij . Dimostrazione. Esprimendo le quantità ψ j in funzione delle q e delle I, dalle equazioni (43) si ottiene Z Z Z j ∂ψ ∂ψ j ∂2W k dψ j = dq + dq k dI = k k k ∂I ∂I ∂q ∂q j k γi γi γi Z ∂ ∂I i = pk dq k = 2π = 2π δij . ∂Ij γi ∂Ij (Si è usato il fatto che dIk|S = 0.) Le funzioni ψ j sono coordinate su S, e, a causa del precedente Lemma, il loro valore viene incrementato di 2π quando si faccia “un giro” attorno ad un ciclo del toro. Esse sono pertanto coordinate angolari; l’isomorfismo con il quoziente Rn /2πΛ (cfr. Definizione 16.2) è dato, in un certo senso tautologicamente, dalle coordinate ψ j stesse. Scrittura delle equazioni del moto. Essendo le variabili azione-angolo delle coordinate simplettiche, le equazioni del moto assumono in esse la forma canonica (44) ∂H I˙j = − j , ∂ψ ψ̇ j = ∂H . ∂Ij Dal primo gruppo di queste, essendo le variabili d’azione costanti durante il moto, vediamo come la funzione hamiltoniana sia ciclica in tutte le variabili d’angolo; ritroviamo in questo contesto il risultato secondo il quale se la funzione hamiltoniana è ciclica in una variabile, il momento cinetico coniugato è un integrale primo. Ritroviamo quindi il fatto che la funzione hamiltoniana è esprimibile solo in termini delle variabili d’azione, H = H(I1 , . . . , In ) (questo era già chiaro in precedenza, poiché le funzioni (f1 , . . . , fn ) si esprimono solo in funzione delle azioni, e H = f1 ). Dal secondo gruppo delle equazioni (44) segue che ψ̇ j = costante. Posto ν j (I1 , . . . , In ) = ∂H ∂Ij troviamo allora ψ j (t) = ν j t + ψ0j dimostrando cosı̀ il punto 3 della Proposizione 14.2. In particolare, vediamo come le frequenze dei moti condizionalmente periodici di un sistema completamente integrabile si possono determinare scrivendo la funzione hamiltoniana del sistema in termini delle variabili d’azione, e calcolandone poi le derivate rispetto a queste. I.57 Dimostrazione del punto (4) della Proposizione 14.2. Tutte le operazioni che abbiamo eseguito sono di tipo algebrico, oppure sono consistite nell’invertire o integrare funzioni note. Inoltre, le variabili d’azione evolvono in modo banale, mantenendosi costanti durante l’evoluzione temporale, mentre le variabili angolari ψ j evolvono in maniera lineare, con frequenze ricavabili nel modo appena descritto. In questo senso, il problema di integrare le equazioni del moto del sistema è stato ricondotto alle quadrature, dimostrando l’ultima affermazione del teorema di Liouville-Arnold. Esempio 16.4. Consideriamo nuovamente l’oscillatore armonico, questa volta tenendo conto di tutti i parametri da cui esso dipende. Scriviamo quindi una funzione hamiltoniana p2 + 1 mν 2 q 2 2m 2 essendo ν la pulsazione dell’oscillatore. I tori invarianti sono ellissi nel piano (p, q), aventi equazione p2 mν 2 q 2 + =1 2mh 2h essendo h un valore fissato dell’energia. Queste sono ellissi di semiassi r √ 2h b= a = 2mh, . mν 2 La variabile d’azione è I 1 area dell’ellisse ab h I= p dq = = = . 2π 2π 2 ν H= La funzione hamiltoniana si scrive45 H = Iν, ed effettivamente ν = ∂H ∂I . Esempio 16.5. Lo spazio delle fasi di un pendolo piano è un cilindro V = S 1 × R, con coordinate (q, p) e forma simplettica ω = dp ∧ dq. Mettendo a 1 tutte le costanti fisiche la funzione hamiltoniana si scrive H = 21 p2 − cos q. L’integrale primo H è indipendente quando dH = p dp + sin q dq 6= 0; vanno quindi esclusi i punti di V dati da p = 0, q = 0, ±π. Il punto O, dato da q = p = 0, corrisponde all’origine nella figura 1, mentre i due rimanenti punti sono in realtà lo stesso punto P sul cilindro. Il punto O corrisponde alla quiete nella posizione di equilibrio stabile, mentre il punto P corrisponde alla quiete nella posizione di equilibrio instabile. I tori invarianti, disegnati in figura, hanno equazione H = 21 p2 − cos q = c; i “tori degeneri” sono dati da c = −1 (l’origine) e c = 1 (in questo caso il toro non è liscio, esattamente nei punti dove H non è indipendente). Il toro H = 1 divide il cilindro in tre regioni, denotate A, B e C in figura. A e C sono diffeomorfe ad un cilindro, mentre B è diffeomorfa a R2 . In ognuna di queste regioni si possono introdurre variabili di azione-angolo. I moti del pendolo che avvengono nella regione B sono detti oscillazioni, mentre quelli che avvengono nelle regioni A e C sono detti rotazioni (il pendolo, giunto alla sommità q = π, continua il moto nella stessa direzione di rotazione). Le regioni A e C corrispondono a rotazioni nei due versi opposti. 45Il lettore che abbia conoscenze di meccanica quantistica potrà cogliere l’analogia con la relazione di de Broglie E = hν, essendo h (costante di Planck) il quanto elementare di azione. In effetti il formalismo delle variabili di azione-angolo è alla base delle cosiddette regole di quantizzazione di Bohr, che svolsero un ruolo fondamentale nella formulazione della meccanica quantistica. I.58 Esempio 16.6. (Completa integrabilità del sistema di Keplero) Consideriamo il sistema meccanico composto da un punto materiale che si muove in un campo conservativo di forze centrali. È noto che un tale punto materiale si muove in un piano (il piano passante per il centro di forza e normale al vettore momento angolare, che si conserva). Lo spazio delle configurazioni è Q = R2 − {0} e lo spazio delle fasi (fibrato cotangente) V = T ∗ Q è diffeomorfo a R4 privato di un piano bidimensionale. Poste in Q coordinate polari ρ, ϑ, risultano definite su V coordinate simplettiche ρ, ϑ, pρ , pϑ (in realtà queste coordinate sono definite su un sottoinsieme aperto proprio ma denso di V ). La funzione hamiltoniana è H= p2ρ p2ρ p2 + ϑ 2 + V (ρ) = + Ṽ (ρ) 2m 2mρ 2m essendo V l’energia potenziale della forza centrale, e avendo definito Ṽ (ρ) = V (ρ) + p2ϑ . 2mρ2 Le funzioni H e pϑ sono costanti del moto; vale {H, pϑ } = 0 proprio in quanto pϑ è una costante del moto (vale infatti ṗϑ = −{H, pϑ }; oppure si noti che {ρ, pϑ } = {pϑ , pϑ } = {pρ , pϑ } = 0). Le due costanti del moto sono indipendenti dove la matrice ! pρ pϑ −Ṽ 0 (ρ) 0 m mρ2 0 1 0 0 ha caratteristica pari a 2. Ciò accade nell’unione degli aperti {pρ 6= 0} e {Ṽ 0 (ρ) 6= 0}. In questa regione di V è definito un sistema completamente integrabile. Assumiamo che V abbia la forma V (ρ) = −α ρ−β con α > 0, 0 < β < 2 . La funzione Ṽ ha l’andamento mostrato in figura 2. Le costanti ρ∗ , µ∗1 il cui significato è mostrato in figura 2 hanno i valori 1 2 2−β µ2 µ2 mαβ 2(2−β) mαβ β(2−β) ∗ ρ = , µ∗1 = 2 − α mαβ 2m µ22 µ22 dove µ2 è il valore costante di pϑ . Denotiamo con µ1 il valore costante di H durante un moto. Analizzando la figura 2 possiamo trarre delle conclusioni qualitative circa il moto: 1) non esistono moti con µ < µ∗1 . 2) Se µ = µ∗1 il moto avviene su una traiettoria circolare di raggio ρ∗ . 3) Se µ1 ≥ 0 il moto non è limitato; la varietà S è una superficie bidimensionale non compatta. 4) Se µ∗1 < µ1 < 0 il moto avviene in una regione limitata. Ci possiamo aspettare che in questo caso S sia una superficie bidimensionale compatta. Infatti dalla conservazione della funzione H troviamo che p pρ = ± 2mµ1 ρ2 + 2mαρ2−β − µ2 . Il radicando di questa espressione ha due radici positive, che forniscono i valori ρ− , ρ+ (vedi figura 2); per ρ− < ρ < ρ+ il radicando è positivo, ed ha un solo massimo. Ciò significa che I.59 le condizioni H = µ1 = costante, pϑ = µ2 = costante determinano una superficie diffeomorfa ad un toro, esplicitamente realizzata incollando lungo i bordi due copie della corona circolare {(ρ, ϑ) | ρ− ≤ ρ ≤ ρ+ , 0 ≤ ϑ ≤ 2π} (cfr. figura 3). Calcolo delle azioni. Fissiamo su S due cicli γ1 , γ2 , rispettivamente dati dalle condizioni ϑ = costante, ρ = costante. Le azioni risultano essere r Z Z 1 1 ρ+ (45) I1 (µ1 , µ2 ) = pρ dρ = 2m µ1 − Ṽµ2 (ρ) dρ 2π γ1 π ρ− 1 I2 (µ1 , µ2 ) = 2π avendo posto Ṽµ2 (ρ) = µ22 2mρ2 Z pϑ dθ = µ2 γ2 − V (ρ) per evidenziare la dipendenza dal valore di µ2 . Per β = 1 (caso kepleriano) anche l’azione I1 si può scrivere esplicitamente, risolvendo l’integrale (45): r m − µ2 ; I1 (µ1 , µ2 ) = α − 2µ1 la funzione hamiltoniana si scrive in termini delle azioni nella forma H=− mα2 . 2(I1 + I2 )2 Le frequenze sono ν1 = 1 ∂H ∂H mα2 = (−2mµ1 )3/2 . = = ν2 = 3 ∂I1 ∂I2 (I1 + I2 ) α Le due frequenze sono uguali, il che implica che la traiettoria (orbita) sia una curva chiusa; in questo senso, il moto è periodico. Calcolo degli angoli. Per impostare il calcolo degli angoli scriviamo la funzione generatrice W . Scegliamo come punto di partenza per l’integrazione il punto (ρ = ρ− , ϑ = 0) di S. Si ha: Z ρr Z (ρ,ϑ) W (ρ, ϑ, I1 , I2 ) = 2m µ1 − Ṽµ2 (ξ) dξ (pρ dρ + pϑ ϑ) = µ2 ϑ + (ρ− ,0) ρ− se pρ > 0 (ovvero sulla metà superiore del toro) Z (ρ,ϑ) W (ρ, ϑ, I1 , I2 ) = (pρ dρ + pϑ ϑ) (ρ, 0) Z ρ+ r Z ρ 2m µ1 − Ṽµ2 (ξ) dξ − = µ2 ϑ + ρ− r 2m µ1 − Ṽµ2 (ξ) dξ ρ+ se pρ < 0 (ovvero sulla metà inferiore del toro) I.60 dove i membri di destra dipendono da I1 , I2 tramite i valori µ1 , µ2 . Limitandoci per semplicità al caso pρ > 0 otteniamo ∂W ψ = = ∂I1 1 Z ρ = mν ρ− ψ2 = Z ρ ρ− 1 m ∂µ ∂I1 r dξ 2m µ1 − Ṽµ2 (ξ) dξ r 2m µ1 − Ṽµ2 (ξ) ∂W =ϑ+ ∂I2 Z ρ ρ− 2m ∂I∂2 µ1 − Ṽµ2 (ξ) r dξ 2m µ1 − Ṽµ2 (ξ) Nel caso kepleriano (β = 1) è possibile risolvere esplicitamente i due integrali. Figura 1 I.61 Figura 2 Figura 3