Università degli studi di Trento Corso di Meccanica razionale 2 METODI VARIAZIONALI Dispense per il corso di Meccanica Razionale 2 di Stefano Siboni 1. Il calcolo delle variazioni 1.1 Il problema variazionale Sull’insieme delle funzioni q : λ ∈ [λ1 , λ2 ] → q(λ) ∈ Rn di classe C 2 nell’intervallo [λ1 , λ2 ] ⊂ R si consideri il funzionale definito da λ2 L[λ, q(λ), q(λ)] ˙ dλ L(q) = (1.1) λ1 dove q̇ = dq/dλ e L è una funzione C 2 delle variabili λ ∈ R,(1) q ∈ A = int(A) ⊆ Rn e q̇ ∈ Rn . In generale, si parla di funzionale in riferimento ad una applicazione che ad ogni funzione di una certa famiglia fa corrispondere un numero reale. Il problema fondamentale del calcolo delle variazioni consiste nell’individuare la funzione q(λ) con i valori al contorno assegnati q(λ1 ) = q (1) ∈ A q(λ2 ) = q (2) ∈ A (1.2) in modo che il funzionale L(q) assuma un valore estremo — minimo o massimo. A questo scopo si introduce il concetto di prima variazione del funzionale. 1.2 Prima variazione Dato il funzionale (1.1) si supponga di variare la funzione q(λ) ad estremi fissi, cioè di sostituire a q(λ) la funzione variata q(λ) + δq(λ) q(λ) −−−−−−−−→ q(λ) + δq(λ) dove δq(λ) è una qualsiasi funzione C 2 nell’intervallo [λ1 , λ2 ] nulla agli estremi del proprio dominio di definizione δq(λ1 ) = δq(λ2 ) = 0 . Beninteso, il modulo di δq(λ) dovrà risultare abbastanza piccolo da assicurare che la curva variata sia contenuta nell’aperto A q(λ) + δq(λ) ∈ A ∀ λ ∈ [λ1 , λ2 ] . Tipicamente la variazione di q(λ) viene espressa nella forma δq(λ) = αη(λ) (1.3) con α costante reale arbitraria e η(λ) di classe C 2 in [λ1 , λ2 ], nulla agli estremi dello stesso intervallo. Il valore assunto dal funzionale (1.1) in corrispondenza della funzione variata risulta perciò λ2 L(q + αη) = L[λ, q(λ) + αη(λ), q̇(λ) + αη̇(λ)] dλ λ1 (1) in luogo di R si può considerare un intervallo aperto che includa [λ1 ,λ2 ]. Stefano Siboni 1 Università degli studi di Trento Corso di Meccanica razionale 2 e per ogni q(λ) e η(λ) assegnate si può intendere come una funzione reale della variabile reale α. Qualora q(λ) costituisca un estremo del funzionale, dovrà necessariamente risultare d L(q + αη) = 0 dα α=0 deve cioè annullarsi la variazione prima del fuzionale in q(λ) definita da d . δL(q, δq) = α L(q + αη) dα α=0 (1.4) La derivata rispetto ad α si può portare sotto integrale e porge λ2 d d = L[λ, q(λ) + αη(λ), q̇(λ) + αη̇(λ)] dλ = L(q + αη) dα dα α=0 α=0 λ1 λ2 = λ1 ∂ dλ = L[λ, q(λ) + αη(λ), q̇(λ) + αη̇(λ)] ∂α α=0 n λ2 ∂L ∂L [λ, q(λ), q(λ)]η ˙ [λ, q(λ), q̇(λ)]η̇i (λ) dλ. = i (λ) + ∂qi ∂ q̇i i=1 λ1 Integrando per parti il secondo termine e raccogliendo il fattore comune ηi si ottiene λ2 n n λ2 d ∂L d ∂L ∂L L(q + αη) ηi (λ) dλ = ηi (λ) + − dα ∂ q̇i ∂qi dλ ∂ q̇i α=0 λ1 i=1 i=1 λ 1 espressione nella quale la variazione δq(λ) di q(λ) è nulla agli estremi di integrazione, per cui il termine estratto dall’integrale risulta identicamente nullo n λ2 d ∂L d ∂L = − ηi (λ) dλ L(q + αη) dα ∂qi dλ ∂ q̇i α=0 i=1 λ 1 e la prima variazione del funzionale (1.1) assume la forma δL(q, δq) = λ2 n λ1 Stefano Siboni i=1 ∂L d ∂L − δqi (λ) dλ . ∂qi dλ ∂ q̇i (1.5) 2 Università degli studi di Trento Corso di Meccanica razionale 2 1.3 Osservazione. Definizione generale di variazione Agli stessi risultati si perviene, in modo del tutto equivalente, adottando una definizione più generale di variazione della funzione q(λ). Non è infatti indispensabile assumere che la variazione di q(λ) debba essere lineare in α, secondo la (1.3). Si consideri una qualsiasi funzione u(α, λ) di classe C 2 in (α, λ) ∈ [−ε, ε] × [λ1 , λ2 ] per ε > 0 assegnato, a valori in Rn e tale che u(0, λ) = 0 ∀ λ ∈ [λ1 , λ2 ] , con l’ulteriore condizione di annullamento agli estremi u(α, λ1 ) = u(α, λ2 ) = 0 ∀ α ∈ [−ε, ε] . Le relazioni ricavate in precedenza rimangono valide a patto di porre, come è evidente, ∂u δq(λ) = (α, λ) ∂α α=0 ∀ λ ∈ [λ1 , λ2 ] . La δq(λ) cosı̀ definita può essere una qualsiasi funzione C 2 in [λ1 , λ2 ] nulla agli estremi λ1 e λ2 . Si noti che applicando questa definizione generale a variazioni del tipo (1.3) si ottiene δq(λ) = η(λ) ∀ λ ∈ [λ1 , λ2 ] per cui nella nuova definizione: (i) δq(λ) differisce dalla (1.3) per la soppressione del fattore α; (ii) comunque αδq(λ) non coincide, in generale, con la variazione u(α, λ); (iii) la stessa soppressione del fattore α si riflette anche nella definizione (1.5) per la variazione δL(q, δq) del funzionale L(q). In effetti, nel calcolo delle variazioni la quantità rilevante è la derivata ∂u/∂α(0, λ), mentre il fattore α eventualmente introdotto non gioca alcun ruolo se non quello di riscalare le variazioni intorno a valori prossimi a zero. Venendo generalmente meno l’identificazione fra δq(λ) e variazione u(α, λ), l’inessenziale fattore α può essere tranquillamente ignorato. 1.4 Condizione di stazionarità del funzionale In forza del risultato precedente la condizione di stazionarietà del funzionale si scrive n λ2 d ∂L ∂L − δqi (λ) dλ = 0 ∂qi dλ ∂ q̇i i=1 λ (1.6) 1 per qualsiasi variazione δq(λ) di classe C 2 in [λ1 , λ2 ] e nulla agli estremi. Si verifica agevolmente che questa condizione è equivalente alle equazioni di Eulero-Lagrange d ∂L ∂L − = 0 dλ ∂ q̇i ∂qi Stefano Siboni ∀ i = 1, . . . , n . (1.7) 3 Università degli studi di Trento Corso di Meccanica razionale 2 L’equivalenza va intesa nel senso che se q(λ) rende stazionario il funzionale (1.1) allora deve anche risolvere le equazioni (1.7) con le assegnate condizioni al contorno (1.2), e viceversa. Nulla può affermarsi, in generale, circa l’esistenza e l’unicità della soluzione dell’uno o dell’altro dei due problemi; si ricorda, in particolare, che per il problema a valori al contorno — o di Sturm-Liouville — i teoremi di esistenza e unicità sono decisamente non banali persino nel caso di equazioni differenziali lineari. La sufficienza delle equazioni (1.7) per la validità delle (1.6) è evidente. La necessità si prova per assurdo, ammettendo che esista un λ ∈ [λ1 , λ2 ] tale che una delle funzioni entro parentesi quadre in (1.6) sia diverso da zero. Per fissare le idee, si assuma ad esempio che d ∂L ∂L (λ ) > 0 − dλ ∂ q̇1 ∂q1 (1.8) per λ ∈ (λ1 , λ2 ). Per continuità esisterà un intorno (λ − ε, λ + ε) ⊂ [λ1 , λ2 ], per ε > 0 opportuno, in cui la funzione si mantiene strettamente positiva. Se si sceglie allora la funzione δq1 della forma δq1 (λ) = (λ − λ + ε)3 (λ + ε − λ)3 se λ ∈ (λ − ε, λ + ε) 0 per λ ∈ [λ1 , λ2 ] \ (λ − ε, λ + ε) e si pone nel contempo δqi = 0 ∀ i = 2, . . . , n in modo da cancellare identicamente tutti gli n − 1 integrali successivi al primo nella (1.6), si perviene alla conclusione λ2 n λ2 d ∂L d ∂L ∂L ∂L − − δq1 dλ + δqi dλ = ∂q1 dλ ∂ q̇1 ∂qi dλ ∂ q̇i i=2 λ λ1 1 λ +ε = λ −ε d ∂L ∂L δq1 dλ < 0 − ∂q1 dλ ∂ q̇1 che è palesemente contraddittoria in quanto le funzioni δqi , i = 1, . . . , n assegnate hanno tutte le proprietà di regolarità prescritte per la validità della (1.6) — sono C 2 nell’intervallo [λ1 , λ2 ] e si annullano agli estremi. Ad un analogo risultato si perviene nell’ipotesi che in (1.8) valga la diseguaglianza opposta, oppure λ sia un estremo dell’intervallo [λ1 , λ2 ], o ancora che la relazione sia verificata per una qualsiasi delle altre funzioni d ∂L ∂L − dλ ∂ q̇i ∂qi i = 2, . . . , n . La stazionarietà del funzionale L(q), e quindi l’annullarsi della prima variazione (1.5), è condizione necessaria ma in generale non sufficiente per l’esistenza di un estremo. Stefano Siboni 4 Università degli studi di Trento Corso di Meccanica razionale 2 1.5 Integrale di Beltrami Può darsi il caso che la lagrangiana formale del funzionale (1.1) non dipenda esplicitamente dalla funzione q1 (λ). La condizione di stazionarietà del funzionale conduce allora alle equazioni di Eulero-Lagrange (1.7), la prima delle quali si scrive d ∂L = 0 dλ ∂ q̇1 ed implica che lungo tutte le sue soluzioni si mantenga costante l’espressione entro parentesi p1 (λ, q, q̇) = ∂L (λ, q, q̇) . ∂ q̇1 (1.9) La (1.9) definisce pertanto un integrale primo delle equazioni di Eulero-Lagrange, noto come integrale di Beltrami. Analogo risultato vale qualora la lagrangiana sia indipendente da qualche altra delle funzioni qi (λ), i = 2, . . . , n. Si osservi che qualora la variabile indipendente λ abbia il significato fisico di un tempo e L sia interpretabile come la lagrangiana di un sistema olonomo a vincoli ideali, la variabile q1 in (1.9) è l’equivalente di una variabile ciclica o ignorabile, mentre l’integrale di Beltrami si identifica con l’usuale integrale di Poisson. 1.6 Integrale di Jacobi Un ulteriore integrale primo delle equazioni di Eulero-Lagrange ricorre quando la lagrangiana L non dipende esplicitamente dalla variabile indipendente λ: L = L(q, q̇) . Moltiplicando membro a membro le (1.7) per la derivata q̇i corrispondente si ottiene infatti d ∂L ∂L q̇i − q̇i = 0 dλ ∂ q̇i ∂qi ∀ i = 1, . . . , n ossia, manipolando un poco l’espressione della derivata totale in λ, ∂L d ∂L ∂L q̇i − q̈i − q̇i = 0 dλ ∂ q̇i ∂ q̇i ∂qi ∀ i = 1, . . . , n e sommando sull’indice i = 1, . . . , n: n n n ∂L d ∂L ∂L q̇i − q̈i + q̇i = 0 , dλ i=1 ∂ q̇i ∂ q̇i ∂qi i=1 i=1 in modo che basta fare uso dell’identità generale n n ∂L ∂L ∂L d q̈i + q̇i + L(λ, q, q̇) = dλ ∂ q̇i ∂qi ∂λ i=1 Stefano Siboni i=1 5 Università degli studi di Trento Corso di Meccanica razionale 2 per ottenere l’equazione n d ∂L ∂L q̇i + −L + = 0. dλ ∂ q̇i ∂λ i=1 Qualora la lagrangiana non dipenda esplicitamente da λ, si conclude che ∂L/∂λ = 0 e che la funzione n ∂L q̇i (1.10) J (q, q̇) = −L + ∂ q̇i i=1 definisce un integrale primo per le equazioni di Eulero-Lagrange. Detta funzione (1.10) è nota come integrale di Jacobi e costituisce l’esatto analogo dell’energia meccanica generalizzata(1) dei sistemi olonomi a vincoli ideali con lagrangiana indipendente dal tempo. 1.7 Estremo di un funzionale con vincoli di tipo funzionale Si hanno casi di interesse in cui del funzionale (1.1) si deve determinare un punto stazionario q(λ), λ ∈ [λ1 , λ2 ], a estremi fissi, subordinatamente ad m vincoli del tipo λ2 Fk [λ, q(λ), q(λ)] ˙ dλ = Lk ∀ k = 1, . . . , m (1.11) λ1 dove L1 , . . . , Lm sono costanti reali assegnate e le F1 , . . . , Fm funzioni C 2 di (λ, q, q̇) ∈ R × A × Rn . Le variazioni δq(λ) non soggiaciono quindi alle sole condizioni di regolarità e di annullamento agli estremi di integrazione, ma devono anche essere scelte in modo da soddisfare gli ulteriori vincoli (1.11) λ2 Fk [λ, q(λ) + δq(λ), q(λ) ˙ + δ q̇(λ)] dλ = Lk ∀ k = 1, . . . , m . λ1 Problemi variazionali di questo tipo vengono convenzionalmente indicati come problemi isoperimetrici in quanto, storicamente, il primo problema variazionale con una condizione della forma (1.11) ad essere studiato fu quello della determinazione della curva piana chiusa di lunghezza assegnata che racchiuda la superficie di area massima — la circonferenza. Per stabilire la condizione di stazionarietà del funzionale (1.1) sotto i vincoli (1.11) si rendono necessarie alcune nozioni preliminari. 1.7.1 Definizione. Funzioni linearmente indipendenti in un intervallo reale Le funzioni f1 (λ), . . . , fm (λ), continue e definite nell’intervallo [λ1 , λ2 ] si dicono linearmente indipendenti in tale intervallo se l’equazione m ck fk (λ) = 0 ∀ λ ∈ [λ1 , λ2 ] , (1.12) k=1 (1) altrimenti nota, non a caso, con la stessa denominazione di integrale di Jacobi Stefano Siboni 6 Università degli studi di Trento Corso di Meccanica razionale 2 per c1 , . . . , cm costanti reali assegnate, implica ck = 0 ∀ k = 1, . . . , m. 1.7.2 Lemma (caratterizzazione delle funzioni linearmente indipendenti) Le funzioni continue f1 (λ), . . . , fm (λ) sono linearmente indipendenti nell’intervallo [λ1 , λ2 ] se e soltanto se esistono m punti distinti ξ1 , . . . , ξm ∈ [λ1 , λ2 ] tali che f1 (ξ1 ) f1 (ξ2 ) . . . .. .. .. det . . . fm (ξ1 ) fm (ξ2 ) . . . f1 (ξm ) .. 0. = . fm (ξm ) (1.13) Dimostrazione La sufficienza della condizione è immediata: per qualsiasi insieme di punti ξ1 , . . . , ξm ∈ [λ1 , λ2 ], dalla combinazione lineare (1.12) segue il sistema di equazioni lineari omogenee f1 (ξ1 ) .. . fm (ξ1 ) ... .. . ... f1 (ξm ) c1 0 .. .. .. = . . . 0 cm fm (ξm ) che se i punti soddisfano la (1.13) ammette (c1 , . . . , cm ) = (0, . . . , 0) come unica soluzione. Per la necessità della condizione si procede dimostrando per induzione che se f1 (ξ1 ) . . . f1 (ξm ) .. .. ∀ ξ1 , . . . , ξm ∈ [λ1 , λ2 ] , (1.14) det ... = 0 . . fm (ξ1 ) . . . fm (ξm ) allora le funzioni f1 (λ), . . . , fm (λ) sono linearmente dipendenti in [λ1 , λ2 ]. Per una singola funzione f1 (λ) la condizione f1 (ξ1 ) = 0 ∀ ξ1 ∈ [λ1 , λ2 ] significa semplicemente che f1 (λ) è identicamente nulla nell’intervallo di definizione ed implica pertanto che ∀ λ ∈ [λ1 , λ2 ] c1 f1 (λ) = c1 0 = 0 qualunque sia la costante c1 ∈ R, in particolare per qualsiasi c1 = 0; la funzione f1 (λ) è dunque linearmente dipendente. Si supponga poi che l’asserto sia verificato per un sistema di m funzioni: se la condizione (1.14) è soddisfatta allora le funzioni f1 (λ), . . . , fm (λ) risultano linearmente dipendenti. Si consideri allora il sistema di m + 1 funzioni f1 (λ), . . ., fm λ, fm+1 (λ), continue in [λ1 , λ2 ], e si assuma che f (ξ ) 1 1 .. . det fm (ξ1 ) fm+1 (ξ1 ) Stefano Siboni ... ... ... ... f1 (ξm+1 ) .. . = 0 fm (ξm ) fm (ξm+1 ) fm+1 (ξm ) fm+1 (ξm+1 ) f1 (ξm ) .. . ∀ ξ1 , . . . , ξm , ξm+1 ∈ [λ1 , λ2 ] . 7 Università degli studi di Trento Corso di Meccanica razionale 2 Il teorema di Laplace applicato rispetto all’ultima riga porge m+1 ∀ ξ1 , . . . , ξm , ξm+1 ∈ [λ1 , λ2 ] ck (ξ1 , . . . , ξm ) fk (ξm+1 ) = 0 (1.15) k=1 dove si è indicato con ck (ξ1 , . . . , ξm ) l’aggiunto classico dell’elemento di matrice fk (ξm+1 ). Vale, in particolare, f1 (ξ1 ) . . . .. .. cm+1 (ξ1 , . . . , ξm ) = det . . fm (ξ1 ) . . . f1 (ξm ) .. . . fm (ξm ) Se esiste un insieme di valori ξ1 , . . . , ξm ∈ [λ1 , λ2 ] tale che cm+1 (ξ1 , . . . , ξm ) = 0, allora la relazione (1.15) definisce ∀ ξm+1 ∈ [λ1 , λ2 ] una combinazione lineare delle funzioni f1 (ξm+1 ), . . . , fm+1 (ξm+1 ) identicamente nulla e con un coefficiente non nullo: le funzioni risultano perciò linearmente dipendenti. Qualora fosse, all’opposto, cm+1 (ξ1 , . . . , ξm ) = 0 ∀ ξ1 , . . . , ξm ∈ [λ1 , λ2 ], le funzioni f1 (λ), . . . , fm (λ) sono linearmente dipendenti per via dell’ipotesi di induzione; di conseguenza, linearmente dipendente risulta anche il più ampio sistema f1 (λ), . . . , fm (λ), fm+1 (λ). 1.7.3 Lemma (generatrice delle funzioni test) La funzione definita da 1 (λ + 1)s (1 − λ)s ∀ λ ∈ [−1, 1] N (s) ρ(λ) = 0 ∀ λ ∈ R \ [−1, 1] per s ≥ 3 intero assegnato ed N (s) > 0 fattore di normalizzazione opportuno, gode delle seguenti proprietà: (i) ρ(λ) è C s−1 in R; (ii) il supporto di ρ(λ) si identifica con l’intervallo [−1, +1]; (iii) la funzione è strettamente positiva nell’intervallo aperto (−1, 1), nulla altrove; (iv) ρ(λ) risulta integrabile in R e, posto +1 s s s N (s) = (λ + 1) (1 − λ) dλ = 2 r=1 −1 2r , 2r + 1 soddisfa la condizione di normalizzazione ρ(λ) dλ = 1. R Stefano Siboni 8 Università degli studi di Trento Corso di Meccanica razionale 2 Dimostrazione Tutte le proprietà elencate sono ovvie. Conviene soltanto ricordare che il fattore di normalizzazione N (s) si calcola introducendo il cambiamento di variabile λ = sin θ, θ ∈ [−π/2, π/2], e facendo uso della relazione di ricorrenza N (0) = 2 , N (s) = 2s N (s − 1) − 2s N (s) ∀s ∈ N, s ≥ 1, che segue immediatamente da una integrazione per parti. 1.7.4 Definizione. Funzioni test nell’intervallo [λ1 , λ2 ] Per s ≥ 3 fissato, nell’intervallo [λ1 , λ2 ] si definiscono le seguenti funzioni test, tutte di classe C s−1, a supporto compatto, non-negative e normalizzate: (i) ∀ λ0 ∈ (λ1 , λ2 ) e ∀ ε > 0, ε < min{λ0 − λ1 , λ2 − λ0 }, ρ (λ0 , λ) = 1 λ − λ0 , ρ ε ε con supporto [λ0 − ε, λ0 + ε]; (ii) per λ0 = λ1 e ∀ ε > 0, ε < (λ2 − λ1 )/2, ρε (λ1 , λ) = 1 λ − λ1 − ε ρ , ε ε di supporto [λ1 , λ1 + 2ε]; (iii) per λ0 = λ2 e ∀ ε > 0, ε < (λ2 − λ1 )/2, ρε (λ2 , λ) = 1 λ − λ2 + ε ρ ε ε con supporto [λ2 − 2ε, λ2 ]. La figura seguente illustra il grafico delle funzioni test cosı̀ introdotte Le proprietà di supporto e di normalizzazione seguono immediatamente dalla definizione di ρ(λ) e dal fatto che le funzioni test sono ottenute da ρ(λ) con la sostituzione λ → (λ−λ0 )/ε. Stefano Siboni 9 Università degli studi di Trento Corso di Meccanica razionale 2 1.7.5 Teorema (estensione del teorema della media di Lagrange) Per ogni funzione f(λ) continua nell’intervallo [λ1 , λ2 ] e per ogni funzione test ρε (λ0 , λ), λ0 ∈ [λ1 , λ2 ], vale la relazione λ2 f(λ) ρε (λ0 , λ) dλ = f(λε ) (1.16) λ1 per un λε opportuno contenuto nel supporto di ρε (λ0 , λ). Dimostrazione Si supponga, per fissare le idee, che λ0 ∈ (λ1 , λ2 ), i casi di λ0 = λ1 e λ0 = λ2 potendosi trattare in modo del tutto analogo. L’integrale a primo membro in (1.16) si riduce a λ0 +ε f(λ) ρε (λ0 , λ) dλ (1.17) λ0 −ε ed in esso conviene introdurre il cambiamento regolare di variabile λ → µ definito da λ ρε (λ0 , λ) dλ , µ(λ) = λ0 −ε funzione monotòna crescente e di classe C 1 in [λ0 − ε, λ0 + ε], con codominio [0, 1] e derivata dµ/dλ = ρε (λ0 , λ) > 0 ∀ λ ∈ (λ0 − ε, λ0 + ε). La corrispondente funzione inversa λ(µ) : [0, 1] → [λ0 − ε, λ0 + ε] ha la stessa regolarità in (0, 1) e risulta continua in [0, 1], quale inversa di una funzione continua. Con tale cambiamento di variabile l’integrale (1.17) diventa 1 f[λ(µ)] dµ 0 e poichè f[λ(µ)] è continua in [0, 1] in quanto composizione di funzioni continue, il teorema della media di Lagrange porge 1 f[λ(µ)] dµ = f[λ(µε )] 0 per µε ∈ [0, 1] opportuno. Basta infine porre λε = λ(µε ) ∈ [λ0 − ε, λ0 + ε] per ottenere il risultato richiesto (1.16). Stefano Siboni 10 Università degli studi di Trento Corso di Meccanica razionale 2 1.7.6 Lemma (caratterizzazione delle variazioni compatibili con i vincoli) Sia q : λ ∈ [λ1 , λ2 ] −−→ q(λ) ∈ A, una funzione C 2 nulla agli estremi dell’intervallo di definizione che soddisfa i vincoli (1.11). Si supponga inoltre che per almeno un valore dell’indice i = 1, . . . , n le funzioni ∂Fk d ∂Fk [λ, q(λ), q̇(λ)] − ∂qi dλ ∂ q̇i ∀ k = 1, . . . , m . (1.18) siano linearmente indipendenti in [λ1 , λ2 ]. Allora per ogni variazione u(α, λ) di q(λ) a estremi fissi e compatibile con i vincoli (1.11), posto al solito δq(λ) = ∂u/∂α(0, λ) = (δq1 (λ), . . . , δqn (λ)) si ha λ2 n λ1 i=1 d ∂Fk ∂Fk − [λ, q(λ), q̇(λ)] δqi (λ) dλ = 0 ∂qi dλ ∂ q̇i ∀ k = 1, . . . , m . (1.19) Viceversa, per qualsiasi δq(λ) di classe C 2 in [λ1 , λ2 ], nulla agli estremi e che soddisfi le condizioni (1.19), esiste una variazione u(α, λ), sempre di classe C 2 nello stesso intervallo e nulla agli estremi, che rispetta i vincoli (1.11) e per la quale risulta ∂u = δq(λ) (α, λ) ∂α α=0 ∀ λ ∈ [λ1 , λ2 ] . Nota Si osservi che l’insieme delle funzioni δq(λ) definite dalle (1.19) costituisce uno spazio vettoriale ed è certamente non vuoto. Quelle relazioni possono infatti essere interpretate come condizioni di ortogonalità fra δq(λ) e le funzioni g (k) (λ) := d ∂Fk ∂Fk − [λ, q(λ), q̇(λ)] ∂q dλ ∂ q̇ ∀ k = 1, . . . , m (1.20) secondo il prodotto scalare ·|· definito da λ2 f|h = f(λ) · h(λ) dλ = λ1 λ2 n fi (λ)hi (λ) dλ (1.21) λ1 i=1 ∀ f, h : [λ1 , λ2 ] → Rn continue in [λ1 , λ2 ] e di componenti rispettive (f1 , . . . , fn ), (h1 , . . . , hn ). Se le g (k)(λ) sono linearmente indipendenti in [λ1 , λ2 ] è sempre possibile applicare loro il metodo di Gram-Schmidt ed ottenerne un sistema ortonomale w1 (λ), . . . , wm (λ) λ2 wk |wj = wk (λ)wj (λ) dλ = δjk ∀ j, k = 1, . . . , m λ1 Stefano Siboni 11 Università degli studi di Trento Corso di Meccanica razionale 2 costituito da opportune combinazioni lineari degli stessi vettori g (k) (λ). Tutte e soltanto le funzioni del tipo δq(λ) possono allora ricavarsi per mezzo della proiezione ortogonale δq(λ) = ψ(λ) − m wk |ψwk (λ) (1.22) k=1 dove ψ(λ) è una qualsiasi funzione C 2 nell’intervallo [λ1 , λ2 ], nulla agli estremi e a valori in Rn . Dimostrazione del lemma 1.7.6 Per provare la necessità della condizione si assuma che esista una variazione u(α, λ), di classe C 2 in [−ε, ε] × [λ1 , λ2 ] e nulla in λ = λ1 e λ = λ2 per la quale si abbia λ2 ∂u Fk λ, q(λ) + u(α, λ), q̇(λ) + (α, λ) dλ = Lk ∂λ ∀ k = 1, . . . , m . λ1 Derivando ambo i membri rispetto ad α e prendendo il risultato in α = 0 si ottiene allora λ2 n λ1 i=1 ∂Fk ˙ ∂Fk δqi (λ) + δq (λ) dλ = 0 ∂qi ∂ q̇i i ∀ k = 1, . . . , m per cui una integrazione per parti, unitamente alle condizioni al contorno δq(λ1 ) = δq(λ2 ) = 0, conduce alle (1.19). Da notare che questo risultato è valido a prescindere dalla condizione di lineare indipendenza delle funzioni (1.18). L’argomento che dimostra la sufficienza è un poco più articolato. Sia δq(λ) una funzione C 2 in [λ1 , λ2 ] che si annulla agli estremi dell’intervallo e che soddisfa le relazioni (1.19). Si supponga che le m funzioni ∂Fk d ∂Fk [λ, q(λ), q(λ)] ˙ − ∂q1 dλ ∂ q̇1 k = 1, . . . , m (1.23) risultino linearmente indipendenti in [λ1 , λ2 ]. Dato un qualsiasi sistema di funzioni ζ (1)(λ), . . ., ζ (m) (λ) di classe C 2 nell’intervallo [λ1 , λ2 ], a valori in Rn e nulle agli estremi, per costanti α, c1 , . . . , cm ∈ R abbastanza vicine a zero sono definite le funzioni λ2 Fk λ,q(λ) + αδq(λ) + Fk (α; c1 , . . . , cm ) = m cr ζ (r) (λ), r=1 λ1 ˙ q̇(λ) + αδq(λ) + m cr ζ̇ (r) (λ) dλ − Lk ∀ k = 1, . . . , m r=1 Stefano Siboni 12 Università degli studi di Trento Corso di Meccanica razionale 2 di classe C 2 in un intorno aperto di (α, c1 , . . . , cm ) = (0, 0, . . . , 0). Le derivate parziali prime delle Fk rispetto alle cj si determinano derivando sotto il segno di integrale ∂Fk (α; c1 , . . . , cm ) = ∂cj λ2 n λ1 i=1 m d ∂Fk ∂Fk λ, q(λ) + αδq(λ) + − cr ζ (r) (λ), ∂qi dλ ∂ q̇i r=1 ˙ q̇(λ) + αδq(λ) + m cr ζ̇ (r) (j) (λ) ζi (λ)dλ r=1 (j) dove si è indicata con ζi (λ) la componente i-esima di ζ (j)(λ). Queste funzioni possono sempre scegliersi in modo che la matrice ∂F/∂c(0, 0, . . . , 0) di elementi ∂Fk (0; 0, . . . , 0) = ∂cj λ2 n λ1 i=1 d ∂Fk ∂Fk (j) [λ, q(λ), q̇(λ)]ζi (λ)dλ − ∂qi dλ ∂ q̇i j, k = 1, . . . , m abbia determinante diverso da zero. Basta ad esempio assumerle della forma ζ (j) (λ) = (j) (ζ1 (λ), 0, . . . , 0) con (j) ζ1 (λ) = ρε (ξj , λ) ∀ j = 1, . . . , m , essendo ξ1 , . . . , ξm ∈ [λ1 , λ2 ] punti assegnati in modo che risulti diverso da zero il determinante della matrice di elementi d ∂Fk ∂Fk [ξj , q(ξj ), q̇(ξj )] − k, j = 1, . . . , m ∂q1 dλ ∂ q̇1 e che è sempre possibile individuare per la postulata lineare indipendenza delle (1.23); l’estensione del teorema della media implica infatti che per λεk,j ∈ supp ρε (ξj , λ) opportuni si abbia ∂Fk (0; 0, . . . , 0) = ∂cj λ2 ∂Fk d ∂Fk − [λ, q(λ), q̇(λ)]ρε (ξj , λ) dλ = ∂q1 dλ ∂ q̇1 λ1 = d ∂Fk ε ∂Fk [λk,j , q(λεk,j ), q̇(λεk,j )] − ∂q1 dλ ∂ q̇1 e se ε → 0+ dalla continuità di d ∂Fk ∂Fk − [λ, q(λ), q(λ)] ˙ ∂q1 dλ ∂ q̇1 j, k = 1, . . . , m ∀ k = 1, . . . , m segue che ∀ k, j = 1, . . . , m d ∂Fk ε d ∂Fk ∂Fk ∂Fk ε ε − − [λk,j , q(λk,j ), q̇(λk,j )] −−→ [ξj , q(ξj ), q̇(ξj )] ∂q1 dλ ∂ q̇1 ∂q1 dλ ∂ q̇1 Stefano Siboni 13 Università degli studi di Trento Corso di Meccanica razionale 2 in quanto suppρε (ξj , λ) → ξj per ε → 0+. È dunque sufficiente considerare ε > 0 abbastanza piccolo per soddisfare la condizione richiesta det ∂F ∂c (0; 0 . . . , 0) = 0 . Riassumendo, la funzione F (α; c1 , . . . , cm ), di componenti Fk (α; c1 , . . . , cm ), k = 1, . . . , m: (i) è di classe C 2 in un intorno di (α, c1 , . . . , cm ) = (0, 0 . . . , 0) ∈ R × Rm ; (ii) si annulla in (α, c1 , . . . , cm ) = (0, 0, . . . , 0) F (0; 0, . . . , 0) = 0 ; (iii) la matrice delle derivate parziali rispetto alle variabili c1 , . . . , cm è non singolare nello stesso punto ∂F det (0; 0 . . . , 0) = 0 . ∂c Il teorema delle funzioni implicite assicura allora che in un intorno aperto I ⊂ R di α = 0 è definita una funzione c(α) = (c1 (α), . . . , cm (α)) a valori in un intorno aperto C ⊂ Rm di (c1 , . . . , cm ) = (0, . . . , 0) tale che F [α, c(α)] = 0 ∀α ∈ I . Tale funzione risulta di classe C 2 nel proprio dominio di definizione e soddisfa, per la regola di catena, ∂F dc ∂F [α, c(α)] + [α, c(α)] (α) = 0 ∀α ∈ I ∂α ∂c dα in modo che e, in particolare, ∂F −1 ∂F dc (α) = − [α, c(α)] [α, c(α)] dα ∂c ∂α ∀α ∈ I ∂F −1 ∂F dc (0) = (0; 0, . . . , 0) (0; 0, . . . , 0) . dα ∂c ∂α Si può pertanto scrivere, ∀ α ∈ I e ∀ k = 1, . . . , m, λ2 m m (r) (r) ˙ ˙ Fk λ, q(λ) + αδq(λ) + cr (α)ζ (λ), q̇(λ) + αδq(λ) + cr (α)ζ (λ) dλ = Lk λ1 Stefano Siboni r=1 r=1 14 Università degli studi di Trento Corso di Meccanica razionale 2 con derivata prima rispetto ad α nulla in α = 0: λ2 n λ1 i=1 m m ∂Fk ˙ λ, q(λ) + αδq(λ) + c(α)r ζ (r) (λ), q̇(λ) + αδq(λ) + c(α)r ζ̇ (r) (λ) · ∂qi r=1 r=1 m dcr (r) · δqi (λ) + (α)ζi (λ) + dα r=1 m m ∂Fk (r) (r) ˙ + c(α)r ζ (λ), q̇(λ) + αδq(λ) + c(α)r ζ̇ (λ) · λ, q(λ) + αδq(λ) + ∂ q̇i r=1 r=1 m dc r (r) ˙ ˙ (α)ζi (λ) dλ = · δq i (λ) + dα r=1 = λ2 n λ1 i=1 = λ2 n λ1 i=1 α=0 ∂Fk ∂Fk ˙ (λ) dλ = [λ, q(λ), q̇(λ)]δqi (λ) + [λ, q(λ), q̇(λ)]δq i ∂qi ∂ q̇i ∂Fk d ∂Fk − δqi (λ) dλ = 0 ∂qi dλ ∂ q̇i per via delle relazioni (1.19). La funzione u(α, λ) = αδq(λ) + m cr (α)ζ (r) (λ) ∀ (α, λ) ∈ I × [λ1 , λ2 ] r=1 è di classe C 2 in I × [λ1 , λ2 ], con u(0, λ) = 0 ∀ λ ∈ [λ1 , λ2 ], risulta nulla agli estremi u(α, λs ) = αδq(λs ) + m cr (α)ζ (r) (λs ) = 0 s = 1, 2 r=1 e soddisfa i vincoli (1.11). Essa costituisce perciò una variazione di q(λ) compatibile con i vincoli e obbedisce alla condizione ∂u(α, λ) = δq(λ) ∀ λ ∈ [λ1 , λ2 ] ∂α α=0 come richiesto. 1.7.7 Osservazione. Estensione del lemma 1.7.6 Si noti che la caratterizzazione (1.19) delle funzioni η(λ) offerta dal precedente lemma può essere estesa, con un argomento analogo, al più generale caso in cui si assumano linearmente indipendenti in [λ1 , λ2 ] le funzioni ∂Fk d ∂Fk [λ, q(λ), q(λ)] ˙ ∀ k = 1, . . . , m − ∂qi(k) dλ ∂ q̇i(k) Stefano Siboni 15 Università degli studi di Trento Corso di Meccanica razionale 2 dove i(k) ∈ {1, . . . , n} ∀ k = 1, . . . , m — non è cioè indispensabile che i(k) sia costante per tutti i k come richiesto in (1.18). 1.7.8 Teorema (punti stazionari condizionati) Sia q : λ ∈ [λ1 , λ2 ] −−→ q(λ) un punto stazionario del funzionale λ2 L[λ, q(λ), q(λ)] ˙ dλ L(q) = (1.24) λ1 che soddisfa i vincoli (1.11) λ2 Fk [λ, q(λ), q(λ)] ˙ dλ = Lk ∀ k = 1, . . . , m (1.11) λ1 con L1 , . . . , Lm costanti reali assegnate e tale che le funzioni d ∂Fk ∂Fk [λ, q(λ), q(λ)] ˙ ∀ k = 1, . . . , m − ∂qi(k) dλ ∂ q̇i(k) (1.25) risultano linearmente indipendenti in [λ1 , λ2 ] per opportuni i(k) ∈ {1, . . . , n}, k = 1, . . . , m. Esistono allora m costanti reali µ1 , . . . , µm tali che m d ∂L d ∂Fk ∂L ∂Fk − µk − = ∀ i = 1, . . . , n . (1.26) ∂qi dλ ∂ q̇i ∂qi dλ ∂ q̇i k=1 1.7.9 Osservazione. Funzione ausiliaria e moltiplicatori di Lagrange La condizione (1.26) necessaria per la stazionarietà condizionata del funzionale L(q) si può intendere come equivalente a scrivere le equazioni di Eulero-Lagrange non per la lagrangiana formale L(λ, q, q̇) ma per la funzione ausiliaria L(λ, q, q̇) − m µk Fk (λ, q, q̇) k=1 con µ1 , . . . , µm costanti reali opportune, note come moltiplicatori di Lagrange del problema estremale. Beninteso, le equazioni di Eulero-Lagrange vanno risolte tenendo conto dei vincoli (1.11). Dimostrazione del teorema 1.7.8 La stazionarietà del funzionale (1.24) condizionato ai vincoli (1.11) richiede che si annulli la variazione prima (1.5) δL(q, δq) = λ2 n λ1 i=1 Stefano Siboni d ∂L ∂L − δqi (λ) dλ = 0 ∂qi dλ ∂ q̇i 16 Università degli studi di Trento Corso di Meccanica razionale 2 non più per qualsiasi variazione u(α, λ), a estremi fissi, della funzione q(λ), ma limitatamente alle variazioni che soddisfano anche gli ulteriori vincoli (1.11). Le variazioni di q(λ) compatibili con i vincoli (1.11) sono tutte e soltanto le u(α, λ) per le quali δq(λ) = ∂u/∂α(0, λ) soddisfa le condizioni (1.19). Deve perciò aversi λ2 n λ1 i=1 d ∂L ∂L [λ, q(λ), q̇(λ)] δqi (λ) dλ = 0 − ∂qi dλ ∂ q̇i per ogni δq(λ) di classe C 2 in [λ1 , λ2 ], nulla agli estremi e tale che λ2 n λ1 i=1 d ∂Fk ∂Fk − [λ, q(λ), q̇(λ)] δqi (λ) dλ = 0 ∂qi dλ ∂ q̇i Ponendo per brevità, come già in (1.20), d ∂Fk ∂Fk (k) g (λ) := − [λ, q(λ), q̇(λ)] ∂q dλ ∂ q̇ unitamente a a(λ) := ∀ k = 1, . . . , m . ∀ k = 1, . . . , m d ∂L ∂L − [λ, q(λ), q(λ)] ˙ , ∂q dλ ∂ q̇ e ricordando la nozione di prodotto scalare introdotta in (1.21), la condizione di stazionarietà diventa a|δq = 0 ∀ δq : g (k) |δq = 0 ∀ k = 1, . . . , m , dove le δq si intendono C 2 nel loro intervallo di definizione e nulle agli estremi dello stesso. Di qui segue facilmente che a(λ) deve essere una combinazione lineare delle g (k)(λ) a(λ) = m µk g (k)(λ) ∀ λ ∈ [λ1 , λ2 ] k=1 secondo opportuni coefficienti costanti µ1 , . . . , µm ∈ R, provando in tal modo la relazione (1.26). Per convincersi di ciò basta osservare che la condizione (1.25) implica la lineare indipendenza in [λ1 , λ2 ] delle g (k)(λ), in modo che è sempre possibile combinare linearmente queste funzioni per ottenere un sistema ortonormale di m vettori w(1) (λ), . . . , w(m) (λ) w(j) |w(h) = δjh ∀ j, h = 1, . . . , m che genera lo stesso sottospazio vettoriale di funzioni. I vettori δq(λ) ortogonali a tutti i g (k)(λ) assumono perciò la forma δq = ψ − m w(k) |ψ w(k) k=1 Stefano Siboni 17 Università degli studi di Trento Corso di Meccanica razionale 2 essendo ψ : [λ1 , λ2 ] → Rn una qualsiasi funzione C 2 nel proprio intervallo di definizione e nulla agli estremi; per ogni δq cosiffatto deve aversi 0 = a|δq = a|ψ − m w (k) |ψa|w (k) = a− k=1 m a|w(k) w(k) ψ k=1 e quindi grazie alla arbitrarietà di ψ — che può sempre identificarsi con una funzione test di supporto arbitrario in [λ1 , λ2 ] — m a− a|w(k) w(k) = 0 . k=1 Non resta che indicare esplicitamente la trasformazione lineare che lega i vettori w(k) e g (j) w (k) = m Rkj g (j) j=1 secondo una appropriata matrice non singolare R di coefficienti Rkj , per ottenere a = m a|w (k) w k=1 ossia (k) = m a|w k=1 (k) m Rkj g (j) j=1 = m m a|w(k) Rkj g (j) j=1 k=1 m d ∂L d ∂Fj ∂Fj ∂L − = − µj ∂q dλ ∂ q̇ ∂q dλ ∂ q̇ j=1 a patto di porre µj = m a|w(k) Rkj ∀ j = 1, . . . , m. k=1 1.8 Estremo di un funzionale soggetto a vincoli olonomi Per questo argomento si rinvia al volume Calculus of variations, R. Weinstock, Dover, New York, 1974 Estremo di un funzionale con vincoli espressi da equazioni finite Descrizione del problema variazionale con questo tipo di vincoli Nozione di variazioni a supporto concentrato, sufficienti per caratterizzare gli estremi 1.8.1 Teorema (estremi dei funzionali soggetti a vincoli olonomi) Funzione moltiplicatrice di Lagrange Dimostrazione del teorema 1.8.1 1.9 Estremo di un funzionale soggetto a vincoli anolonomi Per questo argomento si rinvia al volume Calculus of variations, R. Weinstock, Dover, New York, 1974 Stefano Siboni 18 Università degli studi di Trento Corso di Meccanica razionale 2 Estremo di un funzionale con vincoli espressi da equazioni differenziali Descrizione del problema variazionale con questo tipo di vincoli 1.9.1 Teorema (estremi dei funzionali soggetti a vincoli anolonomi) Funzione moltiplicatrice di Lagrange (1.27) Si indica con (1.27) la condizione che la matrice del differenziale dei vincoli rispetto alle derivate prime deve avere rango massimo lungo tutte le funzioni che rispettano il vincolo differenziale (o fra le quali vengono ricercati gli estremi) Dimostrazione del teorema 1.9.1 2. I principi variazioniali della meccanica Le equazioni della dinamica per i sistemi olonomi a vincoli — bilaterali — ideali sono suscettibili di riformulazioni notevoli in termini di problemi o “principi” variazionali appropriati. I più singificativi di questi sono il principio di Hamilton ed il principio dell’azione stazionaria, o di Maupertuis. 2.1 Principio di Hamilton Sia dato un sistema olonomo a vincoli bilaterali ideali e n gradi di libertà, descritto dai parametri lagrangiani q = (q1 , . . . , qn ) variabili in un aperto A di Rn e da una lagrangiana L(t, q, q̇) di classe C 2 in R × A × Rn . Si consideri un moto regolare q = q(t) nell’intervallo [t1 , t2 ] ⊂ R, di estremi assegnati q (1) e q (2) ∈ A: q(t1 ) = q (1) q(t2 ) = q (2). (2.1.1) La funzione principale di Hamilton (1) per il moto q(t) è definita da t2 L[t, q(t), q̇(t)] dt . S[q(t)] = (2.1.2) t1 La funzione principale si può intendere come un funzionale non lineare sullo spazio delle funzioni q(t) di classe C 2 in un intervallo di tempo [t1 , t2 ]. Il principio di Hamilton afferma l’equivalenza dei seguenti asserti: (i) la funzione q = q(t), di classe C 2 in t ∈ [t1 , t2 ], soddisfa le equazioni lagrangiane del moto e le condizioni al contorno (2.1.1). Essa è perciò soluzione del problema a valori al contorno d ∂L ∂L − = 0 dt ∂ q̇i ∂qi (1) ∀ i = 1, . . . , n , q(t1 ) = q (1) , q(t2 ) = q (2) ; da non pochi autori correntemente designata come azione di Hamilton, ovvero integrale dell azione o semplicemente azione Stefano Siboni 19 Università degli studi di Trento Corso di Meccanica razionale 2 (ii) la funzione q = q(t), di classe C 2 in t ∈ [t1 , t2 ], rende stazionaria la funzione principale di Hamilton (2.1.2), nel senso che ne annulla la variazione prima a estremi fissi t2 L[t, q(t), q̇(t)] dt δS[q(t)] = δ t1 per qualsiasi variazione δq(t) del moto che sia di classe C 2 nell’intervallo [t1 , t2 ] e che si annulli agli estremi: δq(t1 ) = δq(t2 ) = 0 . È significativo sottolineare che il principio sancisce l’equivalenza di un problema a valori al contorno e di un problema variazionale, nel senso che tutte e sole le soluzioni dell’uno sono anche tutte e sole le soluzioni dell’altro, ma non assicura in alcun modo né l’esistenza né l’unicità di dette soluzioni — come ben noto, per il problema a valori al contorno non esiste alcun analogo semplice del teorema di esistenza e unicità delle soluzioni massimali per il problema di Cauchy. Questa osservazione permette di riformulare il principio di Hamilton, equivalentemente, nella forma seguente: in un sistema olonomo a vincoli bilaterali ideali, di lagrangiana L, i moti naturali del sistema sono descritti da tutte e sole le funzioni q(t), definite e C 2 in un qualsiasi intervallo di tempo [t1 , t2 ], che rendono stazionaria la funzione principale di Hamilton per ogni variazione δq(t) ad estremi fissi della funzione q(t). Dimostrazione del principio di Hamilton Per provare il principio è sufficiente osservare che la condizione di stazionarietà sul funzionale dell’azione, per variazioni δq(t) del moto q(t) che si annullino agli estremi, equivale al sistema delle equazioni di Eulero-Lagrange: ∂L d ∂L − = 0 ∀ i = 1, . . . , n , ∂qi dt ∂ q̇i che dovrà essere soddisfatto da una funzione q(t) di classe C 2 in [t1 , t2 ] e con valori al contorno assegnati q(t1 ) = q (1) e q(t2 ) = q (2). 2.1.1 Osservazione. Sistemi lagrangiani generali È interessante notare che la prova del principio di Hamilton non presuppone in alcun modo una lagrangiana classica, interpretabile come somma di un termine di energia cinetica T (t, q, q̇) = T0 (t, q) + T1 (t, q, q̇) + T2 (t, q, q̇), polinomio di secondo grado nelle velocità generalizzate q̇ con parte quadratica definita positiva, e di un termine potenziale U(q): L(t, q, q̇) = T0 (t, q) + T1 (t, q, q̇) + T2 (t, q, q̇) + U(q) , in cui si sono evidenziati rispettivamente il termine costante T0 , quello lineare T1 e quello quadratico T2 rispetto a q̇ dell’energia cinetica. In realtà il principio si estende immediatamente a sistemi lagrangiani di tipo generale, la cui lagrangiana sia una generica funzione C 2 dei propri argomenti (t, q, q̇) ∈ R × A × Rn : L = L(t, q, q̇) Stefano Siboni (2.1.3) 20 Università degli studi di Trento Corso di Meccanica razionale 2 e soddisfi la condizione supplementare che per ogni (t, q, q̇) ∈ R × A × Rn la matrice — simmetrica — delle derivate parziali seconde rispetto alle velocità generalizzate ∂2L (t, q, q̇) ∂ q̇h ∂ q̇k h, k = 1, . . . , n (2.1.4) risulti non singolare. Il requisito (2.1.4) è teso ad assicurare la riducibilità alla forma normale delle relative equazioni di Lagrange del moto d ∂L ∂L − = 0 dt ∂ q̇h ∂qh h = 1, . . . , n . In tal modo è possibile applicare il teorema di esistenza ed unicità delle soluzioni massimali per il problema di Cauchy, sempreché il secondo membro delle equazioni ridotte in forma normale sia adeguatamente regolare — localmente lipschitziano in (q, q̇) ∈ A × Rn uniformemente in t ∈ R o, più semplicemente, C 1 nel dominio R × A × Rn dell’argomento (t, q, q̇). Questa condizione di regolarità sul secondo membro si assume sempre soddisfatta in tutti i sistemi lagrangiani di interesse. 2.2 Principio dell’azione stazionaria, o di Maupertuis Diversamente dal principio di Hamilton, il principio di Maupertuis classico non riguarda i sistemi olonomi lagrangiani di tipo generale, ma soltanto quelli scleronomi posizionali conservativi, la cui lagrangiana assume la forma particolare L(q, q̇) = T (q, q̇) + U(q) , dove U(q) indica il potenziale delle sollecitazioni agenti sul sistema mentre l’energia cinetica T (q, q̇) è una forma quadratica definita positiva delle velocità generalizzate T (q, q̇) = n 1 ahk (q) q̇h q̇k 2 h,k=1 con coefficienti ahk (q) che sono funzioni C 1 delle coordinate lagrangiane. Come ben noto, i sistemi di questo tipo ammettono l’integrale primo dell’energia meccanica, definito da H(q, q̇) = T (q, q̇) − U(q) , (2.2.1) per cui tutti i moti naturali del sistema sono di energia costante. Non è però vero il viceversa: un moto possibile q(t), t ∈ [t1 , t2 ], di energia costante H[q(t), q(t)] ˙ = E, ∀ t ∈ [t1 , t2 ] non costituisce necessariamente un moto naturale del sistema. Lo scopo del principio di Maupertuis è precisamente quello di caratterizzare, fra tutti i moti di energia costante, quelli che siano effettivamente moti naturali per il sistema. Il procedimento logico che Stefano Siboni 21 Università degli studi di Trento Corso di Meccanica razionale 2 permette di impostare, enunciare e dimostrare il principio si può articolare in una serie di punti successivi, di seguito illustrati. 2.2.1 Moti test Il principio di Maupertuis riguarda una particolare classe di moti possibili che verranno denominati moti test. Moto test è un qualsiasi moto q(t), definito e di classe C 2 in un intervallo di tempo limitato e chiuso [t1 , t2 ], che abbia energia costante E ∈ R: H[q(t), q̇(t)] = E ∀ t ∈ [t1 , t2 ] e che non presenti alcun istante di arresto: q̇(t) = 0 ∀ t ∈ [t1 , t2 ] . A tale moto sono associate una configurazione iniziale q(t1 ) = q (1) ed una configurazione finale q(t1 ) = q (2). Si sottolinea che tali configurazioni iniziale e finale non sono necessariamente distinte: il principio di Maupertuis permette di caratterizzare anche eventuali moti naturali periodici considerati su un periodo, per i quali è evidentemente q (1) = q (2) . Come risulterà chiaro nel seguito, la richiesta che il moto test non contempli istanti di arresto è giustificata dalla necessità di poter introdurre moti variati — “asincroni” — di sufficiente generalità. 2.2.2 Moti variati asincroni Dato un qualsiasi moto test q(t) in [t1 , t2 ], di energia E e configurazioni estreme q(t1 ) = q (1), q(t1 ) = q (2), se ne vogliono considerare i più generali moti variati con la stessa energia e le stesse configurazioni iniziale e finale: configurazioni estreme ed energia costante sono uguali a quelle del moto non variato q(t), che d’ora innanzi verrà denominato moto base. È facile convincersi che in generale un moto variato di energia costante non può essere definito sullo stesso intervallo di tempo [t1 , t2 ] del moto base; esso non può cioè scriversi nella forma (2.2.2) q(t) + δq(t) ∀ t ∈ [t1 , t2 ] , già considerata nell’enunciato del principio di Hamilton, di classe C 2 e con δq(t1 ) = δq(t2 ) = 0 — moti variati di questo tipo sono detti sincroni, con riferimento al fatto che l’intervallo di tempo su cui sono definiti non varia rispetto a quello del moto base. Se infatti si impone ad un moto variato sincrono come (2.2.2) di conservare l’energia meccanica, si perviene ad una equazione differenziale non autonoma in δq(t) H[q(t) + δq(t), q̇(t) + δ q̇(t)] = E alla quale non è possibile associare le condizioni δq(t1 ) = 0 e δq(t2 ) = 0, in quanto — di regola — il corrispondente problema a valori al contorno non ammette alcuna soluzione oltre a quella banale δq(t) = 0 ∀ t ∈ [t1 , t2 ]. Si rende cosı̀ necessario ricorrere ai cosiddetti moti variati asincroni nei quali può essere variato anche l’intervallo di tempo [t1 , t2 ]. Un moto variato asincrono viene costruito variando non soltanto la funzione q(t) che rappresenta il moto ma anche la coordinata temporale t; tempo e moto vengono espressi in termini di Stefano Siboni 22 Università degli studi di Trento Corso di Meccanica razionale 2 un comune parametro ausiliario u definito su un intervallo fisso [u1 , u2 ], compatto in R, in modo che il moto variato sia parametrizzato da t = u + δτ (u) (2.2.3) , u ∈ [u1, u2 ] . q = q(u) + δq(u) In questa espressione δτ (u) e δq(u) sono funzioni C 2 dell’intervallo [u1 , u2 ] ed ivi “piccole”, nel senso che le costanti numeriche dτ dδq (u) max (u) max max |δτ (u)| max |δq(u)| u∈[u1 ,u2 ] u∈[u1 ,u2 ] du u∈[u1,u2 ] u∈[u1,u2 ] du devono risultare sufficientemente vicine a zero; in particolare si richiede che valga dτ max (u) < 1 u∈[u1 ,u2 ] du in modo che la trasformazione u → t definisca un diffeomorfismo C 2 dell’intervallo fisso [u1 , u2 ] su un intervallo variabile [t1 , t2 ] del tempo t — cosı̀ da assicurare che gli istanti iniziale t1 = u1 + δτ (u1 ) e finale t2 = u2 + δτ (u2 ) siano lasciati liberi. Ne segue che la derivata prima dt/du(u) è non solo strettamente positiva ma anche limitata tanto inferiormente quanto superiormente in [u1, u2 ]. Il moto base si ottiene evidentemente dalla (2.2.3) per δτ (u) = 0 e δq(u) = 0 ∀ u ∈ [u1 , u2 ], allorquando t = u, q = q(t), t1 = u1 e t2 = u2 . È altrettamento evidente che i moti variati sincroni sono sempre esprimibili nella forma (2.2.3) per δτ (u) = 0 identicamente in [u1, u2 ]. La richiesta che le configurazioni iniziale e finale dei moti variati coincidano con le corrispondenti configurazioni del moto base, ossia che q(t1 ) = q (1) e q(t2 ) = q (2) , si traducono nelle condizioni al contorno q(u1 ) + δq(u1 ) = q (1) e q(u2 ) + δq(u2 ) = q (2) che, per effetto delle analoghe condizioni al contorno valide per il moto base q(u1 ) = q (1) q(u2 ) = q (2) , equivalgono più semplicemente alle δq(u1 ) = 0 δq(u2 ) = 0 . Ricordando che si tratta di una forma quadratica nelle velocità generalizzate, l’energia cinetica del moto variato si scrive d T q(u) + δq(u), [q(u) + δq(u)] = dt 1 d [q(u) + δq(u)] = = T q(u) + δq(u), du dt/du(u) d 1 = T q(u) + δq(u), = [q(u) + δq(u)] du [dt/du(u)]2 d 1 [q(u) + δq(u)] = T q(u) + δq(u), 2 d du δτ (u) 1+ du Stefano Siboni 23 Università degli studi di Trento Corso di Meccanica razionale 2 e indicata con un apice la derivata rispetto ad u si riduce all’espressione più compatta T q(u) + δq(u), q (u) + δq (u) 1 . [1 + δτ (u)]2 La condizione di conservazione, al valore E del moto base, dell’energia meccanica lungo il moto variato assume perciò la forma T q(u) + δq(u), q (u) + δq (u) 1 − U[q(u) + δq(u)] = E [1 + δτ (u)]2 ∀ u ∈ [u1 , u2 ] . (2.2.4) Per definizione, il moto test non presenta istanti di arresto e quindi q̇(t) = 0 ∀ t ∈ [t1 , t2 ]; ne deriva che l’energia cinetica si mantiene strettamente positiva lungo l’intero moto: ⇐⇒ T [q(t), q̇(t)] > 0 E + U[q(t)] > 0 ∀ t ∈ [t1 , t2 ] . In tali condizioni la variazione δq(u) può essere assegnata a piacere, purché C 2 in [u1, u2 ], nulla agli estremi — δq(u1 ) = δq(u2 ) = 0 — e “abbastanza piccola”, nel senso che i numeri positivi max |δq(u)| e max |δq (u)| u∈[u1 ,u2 ] u∈[u1 ,u2] siano sufficientemente vicini a zero. In tal caso si ha infatti che tanto T [q(u)+δq(u), q (u)+ δq (u)] quanto E + U[q(u) + δq(u)] risulteranno strettamente positivi ∀ u ∈ [u1, u2 ], per cui [1 + δτ (u)]2 = T [q(u) + δq(u), q (u) + δq (u)] E + U[q(u) + δq(u)] e la variazione sul tempo δτ (u) potrà sempre essere assegnata in modo da mantenere costante l’energia, risolvendo l’equazione differenziale dδτ (u) = −1 + du T [q(u) + δq(u), q (u) + δq (u)] E + U[q(u) + δq(u)] con una immediata integrazione diretta u δτ (u) = δτ (u1 ) − u + u1 + T [q(u) + δq(u), q (u) + δq (u)] du E + U[q(u) + δq(u)] ∀ u ∈ [u1, u2 ] , u1 ponendo ad esempio δτ (u1 ) = 0 — il che equivale a fissare l’istante iniziale t1 . Per ragioni di continuità è evidente che per δq(u) abbastanza piccolo anche la funzione δτ (u) risulta piccola. È importante sottolineare che la possibilità di scegliere arbitrariamente, nel senso anzidetto, la variazione δq(u) ad energia costante, verrebbe meno in corrispondenza degli eventuali Stefano Siboni 24 Università degli studi di Trento Corso di Meccanica razionale 2 istanti di arresto del moto. Se q(u0 ) = q0 è una posizione di arresto del moto, corrispondente al valore u = u0 del parametro ausiliario, l’annullarsi dell’energia cinetica implica infatti che −U(q0 ) = E , per cui si possono distinguere due casi: ◦ se q0 non è un minimo relativo di U(q), in ogni intorno sferico di Q0 di raggio ε piccolo a piacere è sempre possibile determinare almeno un punto qε dove U(qε ) < U(q0 ) . La variazione δq(u), per quanto piccola nel senso predetto, non può assumere in u0 nessuno dei valori qε − q0 che, causa il segno non negativo dell’energia cinetica, non consentono di rispettare la condizione di conservazione dell’energia E: T [q0 + δq(u0 ), q (u0 ) + δq (u0 )] − U[q0 + δq(u0 )] ≥ ≥ −U[q0 + δq(u0 )] = −U(qε ) > −U(q0 ) = E ; ◦ se q0 costituisce un minimo relativo di U(q), in generale non sarà possibile esplicitare la derivata dδτ /du(u) dall’equazione (2.2.4) di conservazione dell’energia: T [q(u) + δq(u), q (u) + δq (u)] dδτ (u) = −1 + du U[q(u) + δq(u)] − U(q0 ) causa l’eventuale annullarsi del denominatore, infinitesimo per q(u) + δq(u) → q0 . Anche nel caso sia consentita la riduzione alla forma normale rispetto alla variabile dipendente δτ (u), la derivata dδτ /du(u) in generale non risulterà “piccola” per δq(u) e δq (u) arbitrari e piccoli, nel senso precedentemente precisato. Queste osservazioni giustificano la definizione di moto test come moto di energia costante privo di istanti di arresto. È importante sottolineare che in un moto variato asincrono di energia assegnata sono fissate le configurazioni iniziale e finale, ma non gli istanti t1 e t2 in corrispondenza dei quali dette configurazioni sono raggiunte dal sistema: è sempre possibile richiedere, senza perdita di generalità, che sia assegnato l’istante iniziale t1 , ma non è tuttavia dato di fissare quello finale t2 . 2.2.3 Azione L’azione(1) è il funzionale non lineare che al moto base q(t), t ∈ [t1 , t2 ] associa il numero reale S [q(t)] definito dall’integrale t2 2 T [q(t), q̇(t)] dt , (2.2.5) t1 (1) nota anche, più precisamente, come azione di M aupertuis o azione ridotta Stefano Siboni 25 Università degli studi di Trento Corso di Meccanica razionale 2 e sfruttando la costanza dell’energia lungo q(t) può anche riscriversi nella forma equivalente S [q(t)] = t2 T [q(t), q̇(t)] + U[q(t)] + T [q(t), q̇(t)] − U[q(t)] dt = t1 t2 = T [q(t), q̇(t)] + U[q(t)] dt + E(t2 − t1 ) . (2.2.6) t1 2.2.4 Variazione dell’azione La variazione dell’azione (2.2.5) deve essere calcolata per moti variati asincroni arbitrari, di energia costante E e con estremi fissati q (1) e q (2). L’azione di Maupertuis per il moto base q(t), t ∈ [t1 , t2 ], di energia E ed estremi q(t1 ) = q (1), q(t2 ) = q (2) , è data dall’integrale (2.2.6). Il generico moto variato asincrono q̃(t), di uguale energia e con le stesse configurazioni estreme, sarà espresso dalle equazioni parametriche t = u + δτ (u) u ∈ [u1 , u2 ] q̃ = u + δq(u) con δq(u) e δτ (u) funzioni C 2 sull’intervallo fisso [u1, u2 ] del parametro u, unitamente alla condizione δq(u1 ) = δq(u2 ) = 0 e a quella di conservazione dell’energia (2.2.4). Il moto variato sarà perciò definito sull’intervallo di tempo di estremi t̃1 = u1 + δτ (u1 ) t̃2 = u2 + δτ (u2) per i quali si potrà sempre assumere, senza perdita di generalità, t̃1 = t1 .(1) L’azione per il moto variato si scrive perciò t̃2 S [q̃(t)] = ˙ T [q̃(t), q̃(t)] + U[q̃(t)] dt + E(t̃2 − t̃1 ) t̃1 ed introducendo il parametro u come variabile di integrazione, oltre alla forma esplicita degli istanti iniziale e finale variati, diventa S [q̃(t)] = E[u2 + δτ (u2 ) − u1 − δτ (u1 )]+ u2 + T [q(u) + δq(u), q (u) + δq (u)] 1 dt (u) du + U[q(u) + δq(u)] 2 [dt/du(u)] du u1 (1) in termini del parametro ausiliario u il moto base è individuato da δq(u)=0 e δτ (u)=0, per cui t1 =u1 e t2 =u2 ; la condizione t̃1 =t1 equivale perciò a richiedere che sia δτ (u1 )=0. Stefano Siboni 26 Università degli studi di Trento Corso di Meccanica razionale 2 ossia S [q̃(t)] = E[u2 − u1 + δτ (u2) − δτ (u1 )]+ u2 dδτ 1 (u) du . + U[q(u) + δq(u)] 1 + + T [q(u) + δq(u), q (u) + δq (u)] dδτ du (u) 1+ u1 du Seguendo lo stesso procedimento generale indicato nella sezione 1.2, e dunque considerando i soli termini al primo ordine in δq(u) e δτ (u) e relative derivate, la prima variazione dell’azione di Maupertuis lungo il moto base assume cosı̀ la forma u2 d ∂T δS [q(t)] = E[δτ (u2) − δτ (u1 )] + −T [q(u), q (u)] δτ (u) + [q(u), q (u)] · δq (u)+ du ∂ q̇ u1 ∂U ∂T d [q(u), q (u)] · δq(u) + U[q(u)] δτ (u) + [q(u)] · δq(u) du + ∂q du ∂q dove per brevità si è indicato con il punto il prodotto scalare fra vettori di Rn . Un riordinamento dei termini porge allora l’espressione u2 d −T [q(u), q (u)] + U[q(u)] δS [q(t)] = E[δτ (u2) − δτ (u1)] + δτ (u) du+ du u1 u2 + ∂T ∂U ∂T [q(u), q (u)] · δq (u) + [q(u), q (u)] + [q(u)] · δq(u) du ∂ q̇ ∂q ∂q u1 nella quale, per la conservazione dell’energia lungo il moto base, si ha −T [q(u), q (u)] + U[q(u)] = −E ∀ u ∈ [u1, u2 ] in modo che δS [q(t)] = −E[δτ (u2) − δτ (u1 )] + E[δτ (u2) − δτ (u1)]+ u2 ∂T ∂U ∂T + [q(u), q (u)] · δq (u) + [q(u), q (u)] + [q(u)] · δq(u) du ∂ q̇ ∂q ∂q u1 u2 = ∂T ∂U ∂T [q(u), q (u)] · δq (u) + [q(u), q (u)] + [q(u)] · δq(u) du . ∂ q̇ ∂q ∂q u1 Non rimane che riesprimere il termine in δq (u) come un’unica derivata di un prodotto, introducendo il termine correttivo appropriato, u2 d ∂T d ∂T δS [q(t)] = [q(u), q (u)] · δq(u) [q(u), q (u)] · δq(u)+ du ∂ q̇ du ∂ q̇ u1 ∂T ∂U [q(u), q (u)] + [q(u)] · δq(u) du + ∂q ∂q Stefano Siboni 27 Università degli studi di Trento Corso di Meccanica razionale 2 e raccogliere tutti i termini in δq(u), integrando poi la derivata totale in u, u2 u2 ∂U ∂T d ∂T ∂T + δS [q(t)] = + · δq(u) du + · δq(u) − du ∂ q̇ ∂q ∂q ∂ q̇ u1 u1 per ottenere, grazie alla condizione al contorno δq(u1 ) = δq(u2 ) = 0, l’espressione finale della variazione u2 ∂ d ∂T + − δS [q(t)] = (T + U) · δq(u) du du ∂ q̇ ∂q u1 che può anche scriversi come u2 δS [q(t)] = ∂ d ∂ (T + U) + (T + U) · δq(u) du − du ∂ q̇ ∂q (2.2.7) u1 in quanto il potenziale U dipende unicamente da q e non da q̇. Si osservi che il fattore entro parentesi quadre nell’integrando di (2.2.7) è calcolato lungo il moto base q(t), per cui alla variabile ausiliaria u si può in esso intendere sostituito il tempo t: a parte un cambiamento di segno, l’espressione entro parentesi quadre in (2.2.7) si identifica con il binomio di Lagrange per il sistema scleronomo di lagrangiana L = T + U, valutato lungo il moto base q(t). 2.2.5 Stazionarietà dell’azione come condizione necessaria per i moti naturali Dalla relazione (2.2.7) risulta evidente che se il moto base q(t) è naturale per il sistema di lagrangiana L = T + U tale moto costituisce una soluzione delle equazioni di Lagrange e deve perciò aversi ∂L d ∂L [q(t), q̇(t)] − [q(t), q̇(t)] = 0 dt ∂ q̇ ∂q ∀ t ∈ [t1 , t2 ] e la variazione prima dell’azione di Maupertuis lungo lo stesso moto base deve annullarsi δS [q(t)] = 0 per qualsiasi moto variato asincrono di uguali estremi ed energia. La stazionarietà dell’azione di Maupertuis, l’annullarsi cioè della sua variazione prima rispetto a moti variati del tipo descritto, è condizione necessaria perché il moto base sia naturale. Va rilevato che la condizione necessaria rimane valida anche per moti base naturali che non siano test, lungo i quali cioè siano presenti istanti di arresto — ferma restando la conservazione dell’energia, comunque soddisfatta per tutti i moti naturali del sistema. È anche importante sottolineare che la condizione non è in generale sufficiente per riconoscere il generico moto base come naturale: di regola le funzioni δq(u) non si possono Stefano Siboni 28 Università degli studi di Trento Corso di Meccanica razionale 2 assegnare a piacere, o comunque con la generalità sufficiente a concludere dalla stazionarietà dell’azione di Maupertuis in (2.2.7) che il moto base soddisfa le equazioni di Lagrange. 2.2.6 Stazionarietà dell’azione come condizione sufficiente affinché un moto test sia naturale Nel caso che quello base sia un moto test, si è già osservato come sia sempre dato di assegnare arbitrariamente, purché abbastanza piccole, le variazioni δq(u) in modo da generare un moto variato asincrono di energia e configurazioni estreme uguali a quelle del moto base: l’assenza di istanti di arresto permette sempre di aggiustare la variazione sul tempo, δτ (u), in modo da ottenere un moto variato dell’energia desiderata, a patto di scegliere le funzioni δq(u) di classe C 2 in [u1 , u2 ], nulle agli estremi — δq(u1 ) = δq(u2 ) = 0 — e con le costanti: max |δq (u)| max |δq(u)| , u∈[u1 ,u2 ] u∈[u1,u2 ] abbastanza vicine a zero. Questa scelta delle funzioni δq(u) è sufficiente a provare, in virtù della procedura illustrata alla sezione 1.4, l’implicazione u2 ∂ d ∂ (T + U) + (T + U) · δq(u) = 0 − du ∂ q̇ ∂q ∀ δq(u) u1 =⇒ − d ∂ ∂ (T + U) + (T + U) = 0 du ∂ q̇ ∂q ∀ u ∈ [u1, u2 ] come affermato. Si è cosı̀ provato che per tutti i moti regolari, privi di istanti di arresto, rendere stazionaria l’azione di Maupertuis rispetto a moti variati isoenergetici di estremi fissati q (1) e q (2) equivale a risolvere le equazioni di Lagrange con le condizioni al contorno q(t1 ) = q (1), q(t2 ) = q (2). Si perviene in tal modo al principio di Maupertuis, di seguito enunciato. In un sistema scleronomo a vincoli bilaterali ideali, soggetto a sollecitazioni posizionali conservative di potenziale U(q), per ogni moto possibile q(t), di classe C 2 in t ∈ [t1 , t2 ], con configurazione iniziale q(t1 ) = q (1) e configurazione finale q(t2 ) = q (2) , di energia costante E e privo di istanti di arresto, le proposizioni seguenti sono equivalenti: (a) q(t) descrive un moto naturale del sistema di configurazione iniziale q (1) e configurazione finale q (2) , essendo soluzione delle equazioni di Lagrange con le condizioni al contorno q(t1 ) = q (1) e q(t2 ) = q (2); (b) la funzione q(t) rende stazionaria l’azione di Maupertuis (2.2.5) rispetto a moti variati — asincroni — di classe C 2 , uguale energia E e medesimi estremi q (1) , q (2). Come già quello di Hamilton, il principio di Maupertuis afferma l’equivalenza di un problema a valori al contorno — (a) — e di un problema variazionale — (b) — senza entrare nel merito della esistenza ed eventuale unicità delle corrispondenti soluzioni. In sintesi, il principio di Maupertuis permette di individuare, fra tutti i moti possibili isoenergetici privi di istanti di arresto, tutti e soltato quelli naturali per il sistema. Può essere interessante sottolineare che la possibilità di assegnare a piacere, per un qualsiasi moto test, le variazioni δq(u) senza mai pregiudicare la condizione di conservazione Stefano Siboni 29 Università degli studi di Trento Corso di Meccanica razionale 2 dell’energia (2.2.4) appare evidente anche considerando l’approssimazione di Taylor della stessa equazione (2.2.4) al primo ordine in δq(u) e δτ (u): −2T [q(u), q (u)] d ∂T δτ (u) + [q(u), q (u)] · δq(u)+ du ∂q ∂U ∂T + [q(u), q (u)] · δq (u) − [q(u)] · δq(u) = 0 ∂q ∂q dove è sempre possibile esplicitare la derivata dδτ /du(u) ∂T ∂U 1 ∂T dδτ (u) = [q(u), q (u)]·δq(u)+ [q(u), q (u)]·δq (u)− [q(u)]·δq(u) du 2T [q(u), q (u)] ∂q ∂q ∂q grazie al segno strettamente positivo dell’energia cinetica, assicurato dall’assenza di istanti di arresto. 2.2.7 Determinazione alternativa della condizione di stazionarietà dell’azione per i moti test Per i moti test il calcolo della condizione di stazionarietà dell’azione (2.2.5), relativamente a moti variati asincroni di energia e configurazioni estreme uguali a quelle del moto base, può essere eseguito ricorrendo ad una procedura alternativa che fa uso dei risultati della sezione 1.9, riguardante i problemi variazionali con vincoli espressi da equazioni differenziali. In primo luogo si riesprime l’azione di Maupertuis (2.2.5) come integrale sul parametro ausiliario u ∈ [u1 , u2 ] u2 u2 1 du dt 2 T q(u), q (u) (u) 2 T q(u), q (u) ω(u) (u) du = du = dt du ω(u) u1 u2 2 T q(u), q (u) ω(u)2 = u1 u1 1 du = ω(u) u2 2 T q(u), q (u) ω(u) du (2.2.8) u1 ponendo formalmente 1/[dt/du(u)] = ω(u) > 0. Introducendo la stessa trasformazione formale t → u e la stessa funzione ausiliaria ω(u), la condizione di energia costante diventa E = T q(u), q (u) ω(u) − U[q(u)] ∀ u ∈ [u1 , u2 ] che, essendo T una forma quadratica in q̇, equivale a E = T q(u), q (u) ω(u)2 − U[q(u)] ∀ u ∈ [u1 , u2 ] . (2.2.9) Si osservi come al moto base sia in realtà associata la funzione ω(u) = 1 ∀ u ∈ [u1 , u2 ], che deve però essere variata per includere i moti variati propriamente asincroni nella ricerca della condizione di stazionarietà dell’azione (2.2.8): per semplicità è opportuno assumere per ω(u) una generica funzione C 1 strettamente positiva in [u1 , u2 ]; risulterà che la condizione di stazionarietà dell’azione non determina in alcun modo la ω(u), per la quale si Stefano Siboni 30 Università degli studi di Trento Corso di Meccanica razionale 2 potrà sempre richiedere a posteriori che sia ω(u) = 1. L’integrale (2.2.8) si può allora intendere come funzionale delle funzioni incognite q(u) e ω(u), la prima rappresentativa di un generico moto test e la seconda strettamente positiva nell’intervallo [u1 , u2 ]. Di tale integrale si deve calcolare la variazione per moti variati q(u) + δq(u) ad estremi fissi — δq(u1 ) = δq(u2 ) = 0 — e funzioni variate ω(u) + δω(q), nel rispetto della condizione supplementare sull’energia (2.2.9): da notare come quest’ultima e le condizioni al contorno su δq(u) implichino l’annullarsi di δω(u) negli estremi — δω(u1 ) = δω(u2 ) = 0. Si deve cosı̀ determinare la condizione di stazionarietà dell’azione u2 2 T (q, q ) ω du (2.2.10) u1 rispetto a variazioni arbitrarie a estremi fissi delle funzioni q(u) e ω(u) nell’intervallo assegnato [u1 , u2 ], rappresentativa di un moto test la prima e strettamente positiva la seconda, che conservino l’energia T (q, q ) ω 2 − U(q) = E . (2.2.11) Si osservi che la condizione (2.2.11) deve essere soddisfatta tanto dalle funzioni incognite q(u), ω(u) quanto dalle corrispondenti funzioni variate q(u) + δq(u), ω(u) + δω(u) e costituisce perciò un vincolo per il problema variazionale, da rispettare nella ricerca della condizione di stazionarietà del funzionale (2.2.10). Va altresı̀ sottolineato che il voler limitare la ricerca delle possibili soluzioni alle sole funzioni q(u), ω(u) tali che q (u) = 0 e ω(u) > 0 ∀ u ∈ [u1 , u2 ] di per sè non rappresenta un vincolo ulteriore per il calcolo dei punti stazionari del funzionale (2.2.10) già soggetto al vincolo (2.2.11): le stesse condizioni sono infatti verificate anche dalle funzioni variate q(u) + δq(u), ω(u) + δω(u), qualora le variazioni δq(u) e δω(u) siano sufficientemente “piccole” nel senso usuale, e questo basta ad applicare l’analisi variazionale standard — che è puramente locale. Va rilevato che il vincolo (2.2.11) ha la regolarità prescritta per poter applicare il metodo dei moltiplicatori di Lagrange. Il vincolo è infatti specificato da una funzione di classe C 2, e si verifica facilmente che la matrice delle derivate parziali della funzione vincolare rispetto alle variabili q ha sempre rango massimo — 1 — per tutti i valori di (q, q , ω) ∈ A×Rn \{0}×R+ che rispettano il vincolo, vale a dire che il vettore di componenti ∂ ∂T [T (q, q ) ω 2 − U(q) − E] = (q, q ) ∂qi ∂qi i = 1, . . . , n è sempre diverso da zero negli stessi (q, q , ω), in modo che il requisito (1.27) risulta soddisfatto. Se cosı̀ non fosse, dovrebbe aversi 0 = n i=1 0 qi n ∂T = (q, q ) qi = 2T (q, q ) ∂q i i=1 per via del teorema di Eulero applicato alla funzione T (q, q ), omogenea di ordine 2 in q . La contraddizione è evidente, in quanto lungo i moti test qui considerati risulta in realtà q = 0 e dunque T (q, q ) > 0. Stefano Siboni 31 Università degli studi di Trento Corso di Meccanica razionale 2 Conformemente ai risultati illustrati nella sezione 1.9 si deve dunque applicare il metodo dei moltiplicatori di Lagrange e calcolare le equazioni di Eulero-Lagrange per la lagrangiana efficace F(q, q , ω) = 2 T (q, q ) ω − λ[T (q, q ) ω 2 − U(q) − E] (2.2.12) dove λ = λ(u) è una funzione C 1 nell’intervallo [u1 , u2 ] da determinare — moltiplicatore di Lagrange associato al vincolo (2.2.11). Di queste equazioni si dovranno considerare le sole soluzioni q(u), ω(u) in [u1, u2 ] per le quali risulti q (u) = 0 e ω(u) > 0 ∀ u ∈ [u1, u2 ]. Poiché la lagrangiana (2.2.12) non dipende esplicitamente da ω , l’equazione di Eulero-Lagrange relativa ad ω si riduce a ∂F = 0 ∂ω ovvero a 2T (q, q ) − 2λT (q, q ) ω = 0 . Si ottiene pertanto (1 − λω)T (q, q ) = 0 (2.2.13) e siccome per ipotesi i moti base di interesse devono essere privi di istanti di arresto, risulta certamente q (u) = 0 ⇐⇒ T [q(u), q (u)] > 0 ∀ u ∈ [u1 , u2 ] e dunque, dovendosi richiedere altresı̀ ω(u) > 0 ∀ u ∈ [u1 , u2 ], 1 − λω = 0 =⇒ λ(u) = 1 ω(u) ∀ u ∈ [u1, u2 ] . (2.2.14) Le equazioni di Eulero-Lagrange associate ai parametri lagrangiani qh , per h = 1, . . . , n, diventano invece d ∂T ∂U ∂T (q, q ) − λ (q) = 0 h = 1, . . . , n (2.2.15) (2 − λω)ω (q, q ) − (2 − λω)ω du ∂qh ∂qh ∂qh e con la sostituzione di (2.2.14) si riducono a ∂T 1 ∂U d ∂T ω (q, q ) − ω (q, q ) − (q) = 0 du ∂qh ∂qh ω ∂qh h = 1, . . . , n Una moltiplicazione membro a membro per ω porge ∂U d ∂T ∂T ω (q, q ) − ω 2 (q, q ) − (q) = 0 , ω du ∂qh ∂qh ∂qh (2.2.16) (2.2.17) espressione nella quale risulta n n dqk ∂T ahk (q)qk = ahk (q) ω (q, q ) = ω ω = ∂qh du k=1 = n k=1 Stefano Siboni k=1 n dqk du ∂T = ahk (q) ahk (q)q̇k = (q, q̇) du dt ∂ q̇h k=1 32 Università degli studi di Trento Corso di Meccanica razionale 2 mentre ∂T (q, q ) = ∂qh per cui (2.2.17) si rilegge come d ∂T (q, q̇) − dt ∂ q̇h ω2 ∂T ∂T (q, q ω) = (q, q̇) ∂qh ∂qh ∂T ∂U (q, q̇) − (q) = 0 . ∂qh ∂qh In definitiva, in virtù della identificazione ω(u) = 1/[dt/du(u)] i moti test che rendono stazionaria l’azione di Maupertuis rispetto a moti variati del tipo illustrato sono tutti e soli quelli che soddisfano le equazioni di Lagrange — moti naturali. Lungo tutti i moti naturali l’energia meccanica è conservata, in modo che il vincolo (2.2.11) risulta automaticamente soddisfatto. Giova sottolineare che, a stretto rigore, le equazioni di Eulero-Lagrange (2.2.13) e (2.2.16) non individuano univocamente la funzione ausiliaria ω(u), strettamente positiva sull’intervallo compatto [u1 , u2 ]: questa indeterminazione non modifica la conclusione che nella variabile t il moto base test che rende stazionaria l’azione di Maupertuis soddisfa le equazioni di Lagrange e costituisce dunque un moto naturale del sistema. Una funzione ω(u) diversa dalla costante 1 descrive la stessa traiettoria del moto naturale ma diversamente parametrizzata — in u anziché in t — ed è associata ad una variazione asincrona del moto naturale che non modifica la traiettoria di questo.(1) In questi termini, per h = 1, . . . , n si può guardare alle (2.2.17), con ω(u) > 0 ricavato dalla conservazione dell’energia (2.2.9) ω = E + U(q) , T (q, q ) come alle equazioni che individuano le traiettorie dei moti naturali di energia E privi di istanti di arresto, a prescindere dalla legge oraria con cui tali traiettorie sono effettivamente percorse. 2.2.8 Calcolo diretto delle traiettorie dei moti naturali Si è provato che il principio di Maupertuis consente di caratterizzare completamente tutti e soli i moti naturali del sistema che siano privi di istanti di arresto. Nondimeno, il principio viene correntemente utilizzato per scrivere in modo diretto l’equazione delle sole traiettorie dei moti naturali predetti, senza preoccuparsi della legge oraria con cui tali traiettorie sono percorse. Sotto questo aspetto, il principio di Maupertuis presenta forti analogie con il cosiddetto principio di Fermat dell’ottica geometrica, che caratterizza i percorsi seguiti dai raggi luminosi in un mezzo con indice di rifrazione dipendente dalla posizione, e che verrà esaminato nel seguito. Dopo aver riespresso l’azione di Maupertuis nella forma (2.2.8), cioè su un intervallo [u1 , u2 ] fisso del parametro ausiliario u, anziché ricorrere al metodo dei moltiplicatori di Lagrange per tenere conto della condizione supplementare (2.2.11) sull’energia si ricava la funzione ω(u) > 0 dalla stessa relazione E + U(q) ω = T (q, q ) (1) per il moto naturale in senso stretto, cosı̀ come si deve porre t=u e dunque ω(u)=1 ∀ u∈[u1,u2 ], anche il moltiplicatore di Lagrange deve ritenersi uguale alla costante 1: λ(u)= 1/ω(1)=1 ∀ u∈[u1 ,u2 ] Stefano Siboni 33 Università degli studi di Trento Corso di Meccanica razionale 2 e si sostituisce l’espressione ottenuta nell’integrale dell’azione u2 u2 √ E + U(q) ) E + U(q) du , du = 2T (q, q ) 2 2T (q, q S [q(t)] = T (q, q ) u1 (2.2.18) u1 di cui si impone poi la stazionarietà per variazioni δq(u) arbitrarie, di classe C 2 in [u1 , u2 ] e ad estremi fissi. Le equazioni differenziali delle traiettorie q(u) dei moti naturali regolari di energia E, privi di istanti di arresto, sono allora date dalle equazioni di Eulero-Lagrange d ∂LE ∂LE − = 0, du ∂qh ∂qh in termini della lagrangiana efficace LE (q, q ) = h = 1, . . . , n , (2.2.19) √ 2 2T (q, q ) E + U(q) che, si osservi, dipende esplicitamente dal livello di energia E fissato. La correttezza delle equazioni (2.2.19) è presto verificata. Scritta esplicitamente la lagrangiana efficace n 1/2 √ E L (q, q ) = 2 ahk (q) qh qk [E + U(q)]1/2 h,k=1 per ogni i = 1, . . . , n si ha infatti E ∂L = ∂qi √ 2 n aik (q) qk k=1 2 n 1/2 [E + U(q)] 2 ahk (q) qh qk 1/2 = n E + U(q) aik (q) qk T (q, q ) k=1 h,k=1 cosicché d d ∂LE = du ∂qi du n E + U(q) aik (q) qk T (q, q ) k=1 mentre per il secondo termine del binomio di Lagrange risulta n E ∂L E + U(q) 1 ∂ahk T (q, q ) ∂U = (q) q q + (q) . h k ∂qi T (q, q ) 2 ∂qi E + U(q) ∂qi h,k=1 La i-esima equazione di Eulero-Lagrange (2.2.19) assume perciò la forma esplicita n E + U(q) d aik (q) qk − du T (q, q ) k=1 n E + U(q) 1 ∂ahk T (q, q ) ∂U − (q) q q − (q) = 0 h k T (q, q ) 2 ∂qi E + U(q) ∂qi h,k=1 Stefano Siboni 34 Università degli studi di Trento Corso di Meccanica razionale 2 e moltiplicata membro a membro per E + U(q) d T (q, q ) du E + U(q)/ T (q, q ) si riduce a n n ∂U E + U(q) 1 E + U(q) ∂ahk a (q) q (q) q q − (q) = 0 − ik k h k T (q, q ) 2 T (q, q ) ∂qi ∂qi k=1 h,k=1 (2.2.20) . Ma vale altresı̀ du 2 du = −U(q) + T (q, q ) E = −U(q) + T (q, q̇) = −U(q) + T q, q dt dt per cui du = dt E + U(q) T (q, q ) e le equazioni (2.2.20) diventano n n 2 ∂U 1 ∂ahk du d du du aik (q) qk = − (q) qh qk − (q) = 0 dt du dt 2 ∂qi dt ∂qi k=1 ossia h,k=1 n n d 1 ∂ahk ∂U aik (q) q˙k − (q) q̇h q̇k − (q) = 0 dt 2 ∂qi ∂qi k=1 h,k=1 chiaramente identificabili con le equazioni di Lagrange del moto d ∂L ∂L − = 0, dt ∂ q̇i ∂qi i = 1, . . . , n , di lagrangiana L = T (q, q̇) + U(q): n 1 ahk (q)q̇h q̇k + U(q) . L(q, q̇) = 2 h,k=1 2.3 Principio di Maupertuis generalizzato Il principio di Maupertuis si può estendere al caso di sistemi lagrangiani arbitrari la cui lagrangiana non dipenda esplicitamente dal tempo t: per la validità del principio non è cioè essenziale richiedere che la lagrangiana del sistema abbia la struttura classica L = T (q, q̇) + U(q), con T forma quadratica definita positiva nelle velocità generalizzate q̇. In questo caso, in luogo della (2.2.5) si introduce la definizione seguente per l’azione di Maupertuis t2 n ∂L [q(t), q̇(t)] q̇h (t) dt (2.3.1) S [q(t)] = ∂ q̇h t1 h=1 Stefano Siboni 35 Università degli studi di Trento Corso di Meccanica razionale 2 valida per un qualsiasi moto possibile q(t), regolare in [t1 , t2 ]. I moti naturali del sistema sono ancora identificabili con tutte e sole le soluzioni delle equazioni di Lagrange d ∂L ∂L − = 0, dt ∂ q̇h ∂qh h = 1, . . . , n , di cui un ovvio integrale primo è quello di Jacobi: n ∂L (q, q̇) q̇h − L(q, q̇) J (q, q̇) = ∂ q̇h (2.3.2) h=1 che nell’enunciato del principio di Maupertuis prende il posto dell’energia meccanica. Tutti i moti naturali del sistema si accompagnano ad un valore costante dell’integrale di Jacobi J (q, q̇), ma in generale non è dato affermare il viceversa: esistono moti possibili q(t), t ∈ [t1 , t2 ], che conservano la funzione di Jacobi J (q, q̇) ma che non risultano naturali per il sistema. Il principio di Maupertuis generalizzato ha precisamente lo scopo di caratterizzare fra tutti i moti regolari per i quali J è conservata soltanto quelli naturali. Salvo che per la sostituzione di (2.3.1) a (2.2.5) e dell’integrale di Jacobi (2.3.2) all’energia meccanica (2.2.1), l’enunciato del principio generalizzato e la relativa dimostrazione sono sostanzialmente identici a quelli già illustrati per il teorema classico. 2.3.1 Requisiti della lagrangiana I requisiti base della lagrangiana sono gli stessi già discussi nella sezione 2.1.1 per i sistemi lagrangiani generali, in modo da assicurare la riducibilità alla forma normale delle equazioni di Lagrange e l’applicabilità del teorema di esistenza e unicità delle soluzioni massimali per il problema di Cauchy. Requisito più specifico è quello della indipendenza esplicita dal tempo: L = L(q, q̇) che assicura l’esistenza dell’integrale primo di Jacobi (2.3.2). La lagrangiana L sarà dunque di classe C 2 nei suoi due argomenti q ∈ A e q̇ ∈ Rn , con A aperto di Rn , e si richiederà inoltre che per ogni (q, q̇) ∈ A × Rn la matrice simmetrica delle derivate parziali seconde rispetto alle velocità generalizzate ∂2L (q, q̇) ∂ q̇h ∂ q̇k h, k = 1, . . . , n (2.3.3) sia non singolare. In molti casi di interesse è soddisfatta la condizione più restrittiva che la stessa matrice (2.3.3) sia in effetti definita positiva per ogni scelta di (q, q̇) ∈ A × Rn : ∂2L (q, q̇) ∂ q̇h ∂ q̇k h,k=1,...,n Stefano Siboni definita positiva ∀ (q, q̇) ∈ A × Rn . (2.3.4) 36 Università degli studi di Trento Corso di Meccanica razionale 2 2.3.2 Moti test Nella forma generalizzata del principio di Maupertuis si intende per moto test un qualsiasi moto possibile q(t), di classe C 2 in un intervallo di tempo limitato e chiuso [t1 , t2 ], lungo il quale sia conservata la funzione di Jacobi J [q(t), q̇(t)] = E , costante , ∀ t ∈ [t1 , t2 ] (2.3.5) e si mantenga di segno costante(1) ∀ t ∈ [t1 , t2 ] l’espressione n h,k=1 ∂2L [q(t), q̇(t)] q̇h (t)q̇k (t) . ∂ q̇h ∂ q̇k (2.3.6) Si osservi che qualora sia soddisfatta l’ipotesi restrittiva (2.3.4) sulla lagrangiana, la condizione di segno costante sulla (2.3.6) si riduce a prescrivere l’assenza di istanti di arresto lungo il moto test. Per il moto test sono definite una configurazione iniziale q(t1 ) = q (1) e una configurazione finale q(t2 ) = q (2) . 2.3.3 Moti variati asincroni Sia dato un arbitrario moto test q(t) in [t1 , t2 ], di configurazioni estreme q(t1 ) = q (1), q(t2 ) = q (2) e caratterizzato da un valore costante E della funzione di Jacobi (2.3.2). Se ne vuole costruire una famiglia sufficientemente ampia di moti variati asincroni, contraddistinti dallo stesso valore costante E dell’integrale di Jacobi e dalle medesime configurazioni estreme. Moti cosiffatti hanno la forma generale descritta in (2.2.3): t = u + δτ (u) q = q(u) + δq(u) , u ∈ [u1, u2 ] con le funzioni δτ (u) e δq(u) di classe C 2 nell’intervallo fisso [u1 , u2 ] ed ivi “piccole” nel senso già specificato alla sezione 2.2. L’aver fissato le configurazioni estreme implica che le variazioni δq(u) debbano soggiacere alle condizioni al contorno δq(u1 ) = 0 δq(u2 ) = 0 . In termini del parametro ausiliario u, la condizione di conservazione della funzione di Jacobi assume allora la forma 1 J q(u) + δq(u), [q (u) + δq (u)] = E ∀ u ∈ [u1 , u2 ] . 1 + δτ (u) Imporre la condizione di conservazione, al valore invariato E, dell’integrale di Jacobi lungo il moto variato è operazione più complessa che non nel caso classico. In effetti non si dimostrerà che le variazioni δq(u) possano essere assegnate a piacere, purché C 2 , nulle (1) ovvero, per continuità, non si annulli Stefano Siboni 37 Università degli studi di Trento Corso di Meccanica razionale 2 agli estremi e sufficientemente piccole nel senso solito: si proverà l’asserto limitatamente a variazioni δq(u) definite su un qualsiasi intervallo chiuso e sufficientemente piccolo, collocabile a piacere nell’intervallo [u1, u2 ] del parametro ausiliario u. Questa caratterizzazione parziale dei moti variati asincroni che rispettano la conservazione dell’integrale di Jacobi è adeguata allo studio delle condizioni di stazionarietà dell’azione, come si illustrerà nel seguito. (i) ω come funzione locale di q e q ad E fissato, lungo i moti test È facile verificare che lungo un qualsiasi moto test, q(u), u ∈ [u1, u2 ], per il quale sia E il valore conservato della funzione di Jacobi, l’equazione algebrica J (q, q ω) − E = 0 per q = 0 consente di ricavare ω come funzione C 1 di q e q . Basta infatti considerare la funzione ausiliaria GE (q, q , ω) = J (q, q ω) − E ed osservare che: ◦ GE (q, q , ω) è di classe C 1 nelle variabili q, q , ω; ◦ per (q, q , ω) = (q(u), q (u), 1) la funzione ausiliaria si annulla GE (q(u), q (u), 1) = 0 qualunque sia u ∈ [u1, u2 ] fissato; ◦ la derivata parziale prima di GE (q, q , ω) rispetto a ω risulta diversa da zero lungo il moto test, in quanto n n n ∂L ∂GE ∂J ∂L ∂ (q, q , ω) = (q, q ω)qh = qh q̇k − = ∂ω ∂ q̇h ∂ q̇h ∂ q̇k ∂ q̇h h=1 h=1 k=1 q̇=q ω n n n ∂2L ∂L ∂L ∂2L qh q̇k + − = q q ω = ∂ q̇h ∂ q̇k ∂ q̇h ∂ q̇h ∂ q̇h ∂ q̇k h k h=1 k=1 q̇=q ω h,k=1 per cui, come affermato, n ∂2L ∂GE [q(u), q (u)] qh (u)qk (u) = 0 (q(u), q (u), 1) = ∂ω ∂ q̇h ∂ q̇k ∀ u ∈ [u1 , u2 ] h,k=1 in virtù della condizione su (2.3.6). Se si fissa un valore u0 ∈ [u1 , u2 ], per il teorema delle funzioni implicite esistono allora tre costanti positive ε, ε , ε , con ε < 1, ed altrettanti intorni sferici: − B(q(u2 ), ε) ⊂ A ⊆ Rn del punto q(u0 ), Stefano Siboni 38 Università degli studi di Trento Corso di Meccanica razionale 2 − B(q (u2 ), ε ) ⊂ Rn di q (u0 ), − B(1, ε ) ⊂ R di 1, tali che l’equazione J (q, q ω) − E = 0 per q ∈ B(q(u0 ), ε) , q ∈ B(q (u0 ), ε ) e ω ∈ B(1, ε ) definisce ω come funzione C 1 delle variabili q e q : ω = Ω(q, q ) ∈ B(1, ε ) ∀ (q, q ) ∈ B(q(u0 ), ε) × B(q (u0 ), ε ) . Restringendone eventualmente il raggio, se necessario, i predetti intorni si possono sempre considerare chiusi. (ii) Variazioni δq(u) di supporto sufficientemente piccolo Si omette per brevità questa parte della dimostrazione (iii) Variazioni δτ (u) sui tempi Si omette per brevità questa parte della dimostrazione 2.3.4 Azione Per un sistema lagrangiano di tipo generale l’azione di Maupertuis del moto base q(t), t ∈ [t1 , t2 ], è definita dall’integrale S [q(t)] = t2 n t1 h=1 ∂L [q(t), q̇(t)] q̇h (t) dt = ∂ q̇h t2 ∂L [q(t), q̇(t)] · q̇(t) dt ∂ q̇ (2.3.7) t1 che generalizza la corrispondente definizione classica (2.2.5). Per la conservazione della funzione di Jacobi lungo il moto base, l’espressione precedente equivale a t2 S [q(t)] = ∂L [q(t), q̇(t)] · q̇(t) − L[q(t), q̇(t)] dt + ∂ q̇ t1 t2 L[q(t), q̇(t)] dt = t1 t2 = E(t2 − t1 ) + L[q(t), q̇(t)] dt , (2.3.8) t1 essendo E il valore costante assunto dall’integrale di Jacobi lungo il moto. 2.3.5 Variazione dell’azione Si deve determinare la variazione prima dell’azione di Maupertuis (2.3.7) per moti variati asincroni arbitrari che conservano la funzione di Jacobi al valore E e presentano configurazioni estreme assegnate q (1) e q (2): la costante E e gli estremi fissi q (1) , q (2) sono gli stessi del moto non variato che, come per i sistemi lagrangiani classici, verrà denominato moto Stefano Siboni 39 Università degli studi di Trento Corso di Meccanica razionale 2 base. Per quest’ultimo l’azione di Maupertuis è data dall’integrale (2.3.8). Si dovrà allora prendere in esame il generico moto variato asincrono q̃(t) parametrizzato da t = u + δτ (u) u ∈ [u1 , u2 ] q̃ = u + δq(u) in termini delle funzioni δq(u) e δτ (u), che si intenderanno C 2 sull’intervallo fisso [u1 , u2 ] del parametro ausiliario u, oltre a soddisfare le condizioni al contorno δq(u1 ) = δq(u2 ) = 0 — che esprimono la fissità delle configurazioni estreme — e il requisito (2.3.5) relativo alla conservazione della funzione di Jacobi. Detto moto sarà definito nell’intervallo di tempo [t̃1 , t̃2 ], di estremi t̃2 = u2 + δτ (u2) . t̃1 = u1 + δτ (u1 ) L’azione per il moto variato si scrive, secondo la relazione (2.3.8), t̃2 S [q̃(t)] = E(t̃2 − t̃1 ) + ˙ L[q̃(t), q̃(t)] dt (2.3.9) t̃1 e usando il parametro u come variabile di integrazione diventa u2 q (u) + δq (u) 1+δτ (u) du . (2.3.10) S [q̃(t)] = E[u2+δτ (u2 )−u1 −δτ (u1 )]+ L q(u), 1 + δτ (u) u1 La variazione prima dell’azione lungo il moto base viene calcolata in modo analogo a quanto già visto per la lagrangiana classica, con una approssimazione di Taylor al primo ordine nelle funzioni δq(u), δτ (u) e nelle relative derivate prime. Più precisamente, si osserva che al primo ordine in δq(u), δτ (u) e corrispondenti derivate l’integrando in (2.3.10) ammette l’approssimazione di Taylor definita da 1 [1 + δτ (u)] ∼ L q(u) + δq(u), [q (u) + δq (u)] 1 + δτ (u) ∼ L q(u) + δq(u), [q (u) + δq (u)][1 − δτ (u)] [1 + δτ (u)] ∼ ∼ L q(u) + δq(u), q (u) − q (u)δτ (u) + δq (u) [1 + δτ (u)] ∼ ∂L ∂L · δq(u) + · δq (u) − q (u)δτ (u) [1 + δτ (u)] ∼ ∼ L[q(u), q (u)] + ∂q ∂q ∂L ∂L ∂L ∼ L[q(u), q (u)] + L[q(u), q (u)] δτ (u) + · δq(u) + · δq (u) − · q (u) δτ (u) = ∂q ∂q ∂q ∂L ∂L ∂L · δq(u) + · δq (u) · q (u) − L[q(u), q (u)] δτ (u) + = L[q(u), q (u)] − ∂q ∂q ∂q Stefano Siboni 40 Università degli studi di Trento Corso di Meccanica razionale 2 dove le derivate parziali ∂L/∂q e ∂L/∂q si intendono calcolate lungo il moto base q(u): ∂L ∂L = [q(u), q (u)] ∂q ∂q ∂L ∂L = [q(u), q (u)] . ∂q ∂q Lungo lo stesso moto vale peraltro, essendo t = u, ∂L ∂L [q(t), q̇(t)] · q̇(t) − L[q(t), q̇(t)] = E [q(u), q (u)] · q (u) − L[q(u), q (u)] = ∂q ∂ q̇ e la variazione prima dell’integrale di Maupertuis assume perciò la forma u2 δS [q(t)] = E[δτ (u2 ) − δτ (u1)] + ∂L ∂L −Eδτ (u) + · δq(u) + · δq (u) du . ∂q ∂q u1 L’integrazione del termine contenente il fattore E nell’integrando semplifica l’espressione u2 δS [q(t)] = ∂L ∂L · δq(u) + · δq (u) du ∂q ∂q u1 che una ulteriore integrazione per parti, standard, permette di scrivere nella forma equivalente u2 u2 ∂L d ∂L ∂L · δq(u) + δS [q(t)] = − · δq(u) du ∂q ∂q du ∂q u1 u1 e grazie alle condizioni al contorno δq(u1 ) = δq(u2 ) = 0 si riduce a u2 δS [q(t)] = d ∂L ∂L − · δq(u) du . ∂q du ∂q (2.3.11) u1 L’integrale a secondo membro deve essere valutato lungo il moto base, per il quale è t = u: la variabile d’integrazione u può dunque sostituirsi con il tempo t. Ne deriva che a meno di un cambiamento di segno la somma entro parentesi quadre in (2.3.11) si identifica con il binomio di Lagrange per il sistema di lagrangiana L(q, q̇), calcolato lungo il moto base q(t). 2.3.6 Stazionarietà dell’azione come condizione necessaria per i moti naturali Dall’espressione (2.3.11) della variazione dell’azione segue immediatamente che se il moto base q(t) è naturale esso soddisfa le equazioni di Lagrange di lagrangiana L(q, q̇) ∂L d ∂L [q(t), q̇(t)] − [q(t), q̇(t)] = 0 dt ∂ q̇ ∂q Stefano Siboni ∀ t ∈ [t1 , t2 ] 41 Università degli studi di Trento Corso di Meccanica razionale 2 e rende perciò stazionaria l’azione di Maupertuis: δS [q(t)] = 0 per qualsiasi moto variato asincrono con gli stessi estremi e lo stesso valore E dell’integrale di Jacobi. Anche per un sistema lagrangiano generale la stazionarietà dell’azione di Maupertuis, rispetto a moti variati del tipo anzidetto, è condizione necessaria affinché il moto base sia naturale. Giova sottolineare che la necessità della condizione sussiste anche per i moti base che non siano test, lungo i quali la funzione di Jacobi è costante — come per tutti i moti naturali — ma la funzione (2.3.6) non ha segno definito — ossia presenta almeno uno zero in [t1 , t2 ]. Da notare altresı̀ che la stazionarietà dell’azione di Maupertuis non costituisce una condizione sufficiente a riconoscere il moto base generico come moto naturale. Il problema nasce dal fatto che per un moto base qualsiasi le variazioni δq(u) nella formula (2.3.11) non possono essere scelte in modo abbastanza generale da concludere che se S [q(t)] risulta stazionaria allora il moto base q(t) deve essere naturale. 2.3.7 Stazionarietà dell’azione come condizione sufficiente perché un moto test sia naturale Qualora quello base sia un moto test si è già dimostrato che è sempre possibile introdurre moti variati asincroni in modo che le variazioni δq(u) siano funzioni C 2 “piccole” e diverse da zero in un intervallo limitato e chiuso di ampiezza sufficientemente ridotta ma collocabile a piacere nell’intervallo [u1 , u2 ]. In queste condizioni, la procedura presentata nella sezione 1.4 permette di dimostrare immediatamente — per assurdo — che la stazionarietà dell’azione di Maupertuis (2.3.11) u2 δS [q(t)] = d ∂L ∂L (q, q ) − (q, q ) · δq(u) du = 0 ∂q du ∂q u1 implica l’annullarsi della funzione entro parentesi quadre nell’integrando: ∂L d ∂L (q, q ) − (q, q ) = 0 ∂q du ∂q ∀ u ∈ [u1, u2 ] in modo che il moto base — lungo il quale u = t, q(u) = q(t) e q (u) = q̇(t) — risulta naturale per il sistema ∂L d ∂L (q, q̇) − (q, q̇) = 0 ∂q dt ∂ q̇ ∀ t ∈ [t1 , t2 ] . Si è cosı̀ dimostrato il principio di Maupertuis generalizzato, che può enunciarsi nei termini seguenti: In un sistema lagrangiano generale di lagrangiana L(q, q̇), C 2 e indipendente dal tempo, per ogni moto possibile q(t), di classe C 2 in [t1 , t2 ], con configurazione iniziale q(t1 ) = q (1) Stefano Siboni 42 Università degli studi di Trento Corso di Meccanica razionale 2 e configurazione finale q(t2 ) = q (2) , lungo il quale la funzione di Jacobi sia conservata al valore E e la funzione ausiliaria n h,k=1 ∂2L (q, q̇)q̇h q̇k ∂ q̇h ∂ q̇k mantenga segno costante, le seguenti proposizioni sono equivalenti: (a) q(t) descrive un moto naturale del sistema con configurazione iniziale q (1) e configurazione finale q (2), in quanto soluzione delle equazioni di Lagrange con le condizioni al contorno q(t1 ) = q (1) , q(t2 ) = q (2) ; (b) la funzione q(t) rende stazionaria l’azione di Maupertuis (2.3.2) rispetto a moti variati asincroni di classe C 2 , con lo stesso valore conservato E della funzione di Jacobi e le stesse configurazioni estreme q (1) , q (2). Come già la sua versione classica, il principio di Maupertuis generalizzato afferma l’equivalenza del problema a valori al contorno (a) e del problema variazionale (b), senza tuttavia assicurare l’esistenza o tantomeno l’unicità della corrispondente soluzione. In definitiva, il principio consente di caratterizzare, fra tutti i moti possibili che conservino la funzione di Jacobi e lungo i quali la funzione ausiliaria (2.3.6) si mantenga non nulla, tutti e soltanto quelli naturali per il sistema. 2.3.8 Determinazione alternativa della condizione di stazionarietà dell’azione per i moti test Il calcolo della condizione di stazionarietà dell’azione (2.3.7) sui moti test, relativamente a moti variati asincroni con estremi e valore della funzione di Jacobi rispettivamente uguali a quelli del moto base, può essere condotto con un metodo alternativo basato sui risultati della sezione 1.9, in modo analogo a quanto già visto per le lagrangiane classiche. L’azione di Maupertuis viene scritta come integrale nel parametro ausiliario u, sull’intervallo fisso [u1 , u2 ], ponendo ω(u) = 1/[dt/du(u)]: S [q(t)] = t2 n t1 h=1 u2 n = ∂L [q(t), q̇(t)] q̇h (t) dt = ∂ q̇h ∂L 1 du = [q(u), q (u)ω(u)] qh (u) ω(u) ∂ q̇h ω(u) (2.3.12) u1 h=1 u2 n = ∂L [q(u), q (u)ω(u)] qh (u) du ∂ q̇h u1 h=1 e la condizione addizionale circa la conservazione della funzione di Jacobi assume la forma J [q(u), q (u)ω(u)] = E Stefano Siboni ∀u ∈ [u1 , u2 ] , (2.3.13) 43 Università degli studi di Trento dove Corso di Meccanica razionale 2 n ∂L J (q, q ω) = (q, q ω) qh ω − L(q, q ω) . ∂ q̇h h=1 Il moto base q(u) può essere un qualsiasi moto test, mentre sarebbe ω(u) = 1 identicamente lungo il moto base. Tuttavia, siccome anche ω(u) deve essere variata per assicurare il rispetto del vincolo (2.3.13) — e descrivendo cosı̀ moti variati propriamente asincroni — conviene rendere meno rigida la scelta di ω(u) e assumere per questa una qualsiasi funzione C 1 strettamente positiva in [u1, u2 ]. Si vedrà che la condizione di stazionarietà dell’azione non determina in alcun modo la funzione ω(u), per la quale si potrà sempre richiedere a posteriori che sia ω(u) = 1. La stazionarietà dell’azione di Maupertuis (2.3.12) deve essere analizzata per variazioni arbitrarie δq(u), δω(u), con δq(u1 ) = δq(u2 ) = 0, che conservano la funzione di Jacobi al valore costante E: ∀u ∈ [u1 , u2 ] ; J q(u) + δq(u), [q (u) + δq (u)][ω(u) + δω(u)] = E la conservazione di J e l’essere δq(u1 ) = δq(u2 ) = 0 autorizzano a richiedere che si abbia altresı̀ δω(u1 ) = δω(u2 ) = 0. Si è cosı̀ condotti a studiare la condizione di stazionarietà rispetto alle funzioni incognite q(u) e ω(u), definite sull’intervallo fisso [u1 , u2 ], di un funzionale (2.3.12) soggetto ad un vincolo descritto da una equazione differenziale (2.3.13), per variazioni δq(u), δω(u) nulle agli estremi. L’ulteriore richiesta che ω(u) sia positiva e che q(u) renda di segno definito l’espressione (2.3.6) ∀ u ∈ [u1, u2 ] risulta certamente soddisfatta anche dalle funzioni variate ω(u) + δω(u) e q(u) + δq(u) se le variazioni δω(u) e δq(u) sono abbastanza piccole, nel senso consueto: è cosı̀ possibile applicare i metodi standard, illustrati alla sezione 1.9, per calcolare gli estremi locali di un funzionale soggetto a un vincolo rappresentato da una equazione differenziale, salvo poi selezionare tutte e e sole le soluzioni conformi ai requisiti addizionali sul segno di ω(u) e di (2.3.6). È necessario richiedere che la funzione di Jacobi sia di classe C 2 nei suoi argomenti e per questo basta assumere una lagrangiana di classe C 3. La condizione (1.27) risulta invece sempre soddisfatta per i moti test: essa richiede infatti che la matrice delle derivate prime di J (q, q ω)−E rispetto alle q abbia rango massimo per ogni (q, q , ω) che soddisfa il vincolo, ovvero che il vettore di componenti n ∂ ∂2L ∂L ∂L [J (q, q ω) − E] = ω (q, q ω) ω qh + (q, q ω) δhk − (q, q ω) ω = ∂qk ∂ q̇k ∂ q̇h ∂ q̇h ∂ q̇k = ω h=1 n 2 h=1 ∂2L (q, q ω) qh ∂ q̇k ∂ q̇h k = 1, . . . , n (2.3.14) risulti sempre diverso da zero per gli stessi valori di (q, q , ω). Qualora cosı̀ non fosse, in un qualche punto (q, q , ω) compatibile con il vincolo dovrebbe aversi ∂J (q, q ω) = 0 ∂qk Stefano Siboni ∀ k = 1, . . . , n 44 Università degli studi di Trento Corso di Meccanica razionale 2 e quindi n n ∂J (q, q ω) q = 0 qk = 0 , k ∂qk k=1 k=1 circostanza che non può ricorrere in quanto per la (2.3.14) n n n ∂J ∂2L ∂2L 2 (q, q ω) q = ω (q, q ω) q q = (q, q ω) q̇h q̇k k h k ∂qk ∂ q̇k ∂ q̇h ∂ q̇k ∂ q̇h k=1 h=1 h=1 e l’espressione finale, coincidendo con la (2.3.6), è sempre diversa da zero lungo i moti test. Il problema viene perciò risolto con il metodo dei moltiplicatori di Lagrange, calcolando le n + 1 equazioni di Eulero-Lagrange associate alla lagrangiana efficace n n ∂L ∂L (q, q ω) qh − λ (q, q ω) qh ω − L(q, q ω) , F(q, q , ω) = ∂ q̇h ∂ q̇h h=1 h=1 dove q = q(u) e ω = ω(u) sono le funzioni incognite, mentre λ = λ(u) indica il solo moltiplicatore di Lagrange del problema, corrispondente all’unico vincolo (2.3.13). Siccome F non dipende esplicitamente da ω , si ha ∂F (q, q , ω) = 0 ∂ω ossia n h,k=1 n −λ h,k=1 ∂2L (q, q ω) qh qk − ∂ q̇h ∂ q̇k ∂L ∂L ∂2L (q, q ω) qh qk ω + (q, q ω) qh − (q, q ω) qh ∂ q̇h ∂ q̇k ∂ q̇h ∂ q̇h e quindi (1 − λω) n h,k=1 n n h=1 h=1 ∂2L (q, q ω) qh qk = 0 ∂ q̇h ∂ q̇k ∀ u ∈ [u1 , u2 ] . = 0 (2.3.15) Ma i moti base q(t) considerati sono per ipotesi moti test, lungo i quali l’espressione n h,k=1 n ∂2L ∂2L (q, q̇) q̇h q̇k = ω 2 (q, q ω) qh qk ∂ q̇h ∂ q̇k ∂ q̇h ∂ q̇k h,k=1 si mantiene sistematicamente diversa da zero ∀ u ∈ [u1, u2 ], in conformità alla (2.3.6), con ω > 0. Di conseguenza, l’equazione (2.3.15) si riduce a 1 − λω = 0 Stefano Siboni ⇐⇒ λ(u) = 1 ω(u) ∀ u ∈ [u1 , u2 ] . (2.3.16) 45 Università degli studi di Trento Corso di Meccanica razionale 2 Le equazioni di Eulero-Lagrange relative alle qi (u) diventano invece, ∀ i = 1, . . . , n, d ∂F ∂F (q, q , ω) − (q, q , ω) = 0 du ∂qi ∂qi dove in forza della (2.3.16) vale n ∂F ∂L ∂2L (q, q , ω) = (q, q ω) + (q, q ω) ω qh − ∂qi ∂ q̇i ∂ q̇i ∂ q̇h h=1 n ∂L ∂L ∂2L 2 −λ (q, q ω) ω + (q, q ω) qh ω − (q, q ω) ω = ∂ q̇i ∂ q̇i ∂ q̇h ∂ q̇i h=1 ∂2L ∂L ∂L = (q, q ω) + ω(1 − λω) (q, q ω) qh = (q, q ω) ∂ q̇i ∂ q̇i ∂ q̇h ∂ q̇i n h=1 e pertanto d ∂L d ∂F (q, q , ω) = (q, q ω) , du ∂qi du ∂ q̇i mentre n n ∂L ∂2L ∂2L ∂F (q, q , ω) = (q, q ω) qh − λ (q, q ω) qh ω − (q, q ω) = ∂qi ∂qi ∂ q̇h ∂qi ∂ q̇h ∂qi = (1 − λω) h=1 n h=1 per cui h=1 2 ∂L ∂L 1 ∂L ∂ L (q, q ω) qh + λ (q, q ω) = λ (q, q ω) = (q, q ω) ∂qi ∂ q̇h ∂qi ∂qi ω ∂qi 1 ∂L d ∂L (q, q ω) − (q, q ω) = 0 , du ∂ q̇i ω ∂qi i = 1, . . . , n . (2.3.17) Come preannunciato, ω(u) non è determinata univocamente dalla stazionarietà dell’azione di Maupertuis e si può identificare con una arbitraria funzione C 1 strettamente positiva nell’intervallo [u1 , u2 ], da interpretare come il reciproco della derivata dt/du(u) ω(u) = 1 dt/du(u) ∀ u ∈ [u1, u2 ] di un generico moto variato asincrono che non modifica la traiettoria {q(u), u ∈ [u1 , u2 ]} del moto — una trasformazione cioè del tipo t = u + δτ (u), q = q(u), ∀ u ∈ [u1 , u2 ]. È evidente che nella variabile indipendente t le equazioni (2.3.17) diventano quelle di Lagrange, una volta moltiplicate membro a membro per ω(u), ∂L d ∂L (q, q̇) − (q, q̇) = 0 dt ∂ q̇i ∂qi Stefano Siboni , i = 1, . . . , n 46 Università degli studi di Trento Corso di Meccanica razionale 2 per cui si conclude che il moto base test è naturale, come già per altra via stabilito. Lungo questo moto naturale — come lungo qualsiasi altro — la funzione di Jacobi si conserva e di conseguenza il vincolo (2.3.13) è automaticamente rispettato. Al pari di ω(u), anche il moltiplicatore di Lagrange λ(u) = 1/ω(u) rimane indeterminato, sebbene per ricavare il moto naturale con la corretta legge oraria sia necessario identificare u con t ed assumere di conseguenza ω(u) = λ(u) = 1 ∀ u ∈ [u1 , u2 ]. Ogni scelta di ω(u) positiva e C 1, ma diversa da ω(u) = 1 ∀ u ∈ [u1 , u2 ], individua la stessa traiettoria {q(u), u ∈ [u1 , u2 ]} del moto naturale, ma con una diversa legge oraria. In questo senso si possono riguardare le (2.3.17) come le equazioni che caratterizzano le traiettorie dei moti naturali lungo i quali l’espressione (2.3.6) presenta segno costante, prescindendo dalla legge oraria con cui tali traiettorie sono effettivamente percorse. 2.3.9 Calcolo diretto delle traiettorie dei moti naturali Il principio di Maupertuis generalizzato può essere usato per scrivere le equazioni differenziali delle traiettorie dei moti naturali lungo i quali l’espressione (2.3.6) conserva segno costante. Come già per la lagrangiana classica, l’idea è quella di riesprimere l’azione di Maupertuis come integrale sull’intervallo fisso [u1 , u2 ] del parametro ausiliario, secondo la formula (2.3.12): u2 n ∂L S [q(t)] = [q(u), q (u)ω(u)] qh (u) du (2.3.18) ∂ q̇h u1 h=1 per poi andare ad esprimere la funzione ausiliaria ω(u) in termini di q(u), q (u) ed E, facendo uso della conservazione della funzione di Jacobi: J (q, q ω) = n ∂L (q, q ω) qk ω − L(q, q ω) = E ∂ q̇k ∀ u ∈ [u1, u2 ] (2.3.19) k=1 — moto base e moti variati devono infatti conservare la funzione di Jacobi, e ad un comune valore E. Che l’equazione (2.3.19) consenta di ricavare ω > 0 come funzione di E, q, q si stabilisce molto facilmente calcolando la derivata parziale: n ∂J ∂J (q, q ω) = (q, q ω) qh = ∂ω ∂ q̇h h=1 n n ∂L ∂2L ∂L = qh (q, q ω) + (q, q ω)qk ω − (q, q ω) = ∂ q̇h ∂ q̇h ∂ q̇k ∂ q̇h h=1 = ω n h,k=1 k=1 qh qk n 1 ∂ L ∂2L (q, q ω) = q̇h q̇k (q, q̇) . ∂ q̇h ∂ q̇k ω ∂ q̇h ∂ q̇k 2 h,k=1 Si nota immediatamente che limitandosi a considerare regioni dello spazio delle fasi (q, q̇) ∈ A × Rn nelle quali l’espressione n h,k=1 Stefano Siboni ∂2L (q, q̇) q̇h q̇k ∂ q̇h ∂ q̇k 47 Università degli studi di Trento Corso di Meccanica razionale 2 abbia segno definito, la derivata ∂J/∂ω si mantiene a sua volta di segno costante, in modo che per ogni (q, q ) assegnati come sopra, E risulta una funzione strettamente monotòna di ω: esisterà perciò la funzione C 1 ω = ω(q, q , E) , (2.3.20) nella quale (q, q ) vanno scelti nel modo sopra precisato e l’intervallo di definizione di E dipende in generale da q e q . Non rimane che sostituire la funzione (2.3.20) nell’integrale (2.3.18) per eliminare ω ed ottenere l’espressione dell’azione di Maupertuis: u2 n S[q(t)] = u1 h=1 ∂L (q, q ω) qh du ∂ q̇h ω=ω(q,q ,E) operazione certamente lecita in quanto il moto base q(t) mantiene costante, per ipotesi, il segno della funzione (2.3.6) — si tratta cioè di un moto test. In tal modo viene rimossa la funzione ausiliaria ω e si evita il ricorso al metodo dei moltiplicatori di Lagrange per tenere conto del vincolo di consevazione della funzione di Jacobi, vincolo che viene imposto direttamente per ricavare ω in funzione di q e q : l’azione di Maupertuis, cosı̀ riespressa, dipende unicamente dalle funzioni incognite q(u), che descrivono la traiettoria del moto. Il presso pagato, naturalmente, è l’introduzione esplicita della costante E nell’integrale dell’azione. Le traiettorie dei moti test naturali sono dunque tutte e sole le soluzioni delle equazioni di Eulero-Lagrange d ∂LE ∂LE − = 0 i = 1, . . . , n (2.3.21) du ∂qi ∂qi nelle quali figura la lagrangiana efficace n ∂L L (q, q ) = q, q ω(q, q , E) qh . ∂ q̇h E (2.3.22) h=1 Non è particolarmente impegnativo verificare la correttezza delle equazioni (2.3.21). A tale scopo conviene osservare in via preliminare che, identicamente in q, q , deve aversi n ∂L (q, q ω)qk ω − L(q, q ω) = E ∂ q̇k ω=ω(q,q ,E) k=1 ossia, ricordando la definizione (2.3.22), L ω − L(q, q ω) E = E. (2.3.23) ω=ω(q,q ,E) Indicata per brevità con ω la funzione ω(q, q , E), una derivazione parziale dell’identità (2.3.23) rispetto a qi , i = 1, . . . , n porge l’equazione ∂L ∂LE E ∂ω ∂ω = 0 ω + L − (q, q ω) δ ω + q ik k ∂qi ∂qi ∂ q̇k ∂qi n k=1 Stefano Siboni 48 Università degli studi di Trento Corso di Meccanica razionale 2 che contraendo il delta di Kronecker si riduce a ∂L ∂ω ∂LE ∂L E ∂ω ω + L − (q, q ω) ω − (q, q ω)qk = 0 ∂qi ∂qi ∂ q̇i ∂ q̇k ∂qi n k=1 e con la raccolta del fattore comune ∂ω/∂qi diventa n ∂L ∂ω ∂L ∂LE E ω− (q, q ω) ω + L − (q, q ω)qk = 0. ∂qi ∂ q̇i ∂ q̇k ∂qi k=1 Facendo uso della definizione (2.3.22), che permette di rimuovere la parentesi quadrata, e della positività di ω, che può essere raccolto e semplificato, si perviene infine alla semplice relazione ∂LE ∂L (q, q ) = (q, q ω) ∀ i = 1, . . . , n . ∂qi ∂ q̇i In modo analogo, derivando la stessa (2.3.23) rispetto ai parametri lagrangiani qi , si ottiene l’equazione ∂L ∂L ∂LE ∂ω ∂ω ω + LE − (q, q ω) − (q, q ω)qh = 0 ∂qi ∂qi ∂qi ∂ q̇h ∂qi n h=1 che un ovvio raccoglimento a fattore comune n ∂L ∂LE ∂L E ∂ω ω− (q, q ω) + L − (q, q ω)qh = 0 ∂qi ∂qi ∂ q̇h ∂qi h=1 e la definizione (2.3.22) consentono di riesprimere come 1 ∂L ∂LE (q, q ) = (q, q ω) ∂qi ω ∂qi ∀ i = 1, . . . , n . Le equazioni di Eulero-Lagrange (2.3.21) assumono perciò la forma 1 ∂L d ∂L (q, q ω) − (q, q ω) = 0 ∀ i = 1, . . . , n du ∂ q̇i ω ∂qi (2.3.24) e ricordando che ω(u) = 1/[dt/du(u)] si riducono alle equazioni di Lagrange del moto ∂L d ∂L (q, q̇) − = 0 dt ∂ q̇i ∂qi ∀ i = 1, . . . , n La funzione q(u) che rende stazionaria l’azione di Maupertuis descrive pertanto la traiettoria di un moto test naturale del sistema. L’equazione della traiettoria può essere ricavata risolvendo il sistema di equazioni differenziali (2.3.24), che costituiscono dunque le equazioni differenziali delle orbite per i moti test naturali del sistema. Stefano Siboni 49 Università degli studi di Trento Corso di Meccanica razionale 2 2.4 Moto di una carica elettrica in un campo elettromagnetico statico Una applicazione notevole del principio di Maupertuis — nella forma generalizzata — riguada il punto materiale elettricamente carico in moto in un campo elettromagnetico x il indipendente dal tempo rispetto ad un riferimento inerziale Ox1 x2 x3 . Indicato con x) e B( x) si potranno rappresentare vettore posizione del punto materiale, i campi statici E( x) opportuni: mediante un potenziale scalare φ(x) ed un potenziale vettore A( x) = ∇φ(x) E( x) = ∇ ∧ A( x) B( ∀ x ∈ R3 , entrambi indipendenti dal tempo. Lagrangiana del sistema Per una particella di massa m e carica q la lagrangiana relativistica si scrive |x˙ |2 x) , L(x, x˙ ) = −mc2 1 − 2 − qφ(x) + q x˙ · A( c (2.4.1) dove c indica la velocità della luce nel vuoto e x˙ = ẋ1 ê1 + ẋ2 ê2 + ẋ3 ê3 è la velocità istantanea del punto. Poichè nel caso di campi stazionari la lagrangiana non dipende esplicitamente dal tempo il sistema ammette l’integrale di Jacobi come costante del moto, necessaria premessa all’applicazione del principio di Maupertuis. Si osservi tuttavia che la (2.4.1) non ha la struttura di una lagrangiana classica, somma di un potenziale U, funzione dei soli parametri lagrangiani, e di una energia cinetica T , forma quadratica definita positiva delle velocità generalizzate: non è perciò possibile ricorrere alla forma classica dell’enunciato di Maupertuis. Momenti coniugati e integrale di Jacobi Il momento coniugato alla coordinata xi , per i = 1, 2, 3, è dato da |x˙ |2 −1/2 ∂L = m 1− 2 ẋi + q Ai (x) ∂ ẋi c e di conseguenza l’integrale di Jacobi vale J (x, x˙ ) = 3 i=1 ẋi ∂L −L = ∂ ẋi ˙ 2 1/2 |x˙ |2 −1/2 2 x) · x˙ + mc2 1 − |x| x) · x˙ = ẋi + q A( + qφ(x) − q A( = 1− 2 c c2 |x˙ |2 −1/2 = mc2 1 − 2 + qφ(x) c che si identifica con l’energia meccanica totale. Introducendo la trasformazione t → u sulla scala dei tempi e ponendo come prima du/dt[t(u)] = ω(u) > 0 e dx/du(u) = x (u), l’integrale di Jacobi diventa allora |x |2 −1/2 J (x, x ω) = mc2 1 − 2 ω 2 + qφ(x) c Stefano Siboni 50 Università degli studi di Trento Corso di Meccanica razionale 2 e uguagliato ad un valore costante E porge un’equazione che deve essere risolta in ω. Determinazione di ω in funzione di E Per un fissato valore E dell’integrale di Jacobi deve essere possibile determinare univocamente il corrispondente valore del parametro ω > 0, risolvendo l’equazione mc 2 |x |2 2 −1/2 1− 2 ω + qφ(x) = E . c (2.4.2) Si verifica facilmente che è soddisfatta la condizione forte (2.3.4) di riducibilità delle equazioni di Lagrange alla forma normale, dal momento che la matrice delle derivate parziali seconde |x˙ |2 |x˙ |2 −3/2 ẋi ẋj ∂2L 1 − 2 δij + 2 = m 1− 2 ∂ ẋj ∂ ẋi c c c risulta reale simmetrica e definita positiva. Essendo di necessità |x˙ | < c, per ogni vettore v =∈ R3 , di componenti cartesiane v1 , v2 , v3 , vale infatti ∂2L vi vj = m 1 − ∂ ẋi ∂ ẋj = m 1− ed inoltre |x˙ |2 |x˙ |2 −3/2 ẋi ẋj vi vi 1 − 2 + vi vj 2 = c2 c c |x˙ |2 x˙ 2 |x˙ |2 −3/2 2 |v | 1 − 2 + v · ≥ 0 c2 c c ∂2L vi vj = 0 ∂ ẋi ∂ ẋj ⇐⇒ ∀ v ∈ R3 |v| = 0 . In ogni caso, la soluzione richiesta esiste globalmente ogni qual volta risulti x = 0 — ovvero E − qφ(x) > 0 — e può essere ricavata in modo esplicito. Dall’equazione (2.4.2) si ottiene infatti 2 |x |2 2 mc2 1− 2 ω = (2.4.3) c E − qφ(x) e quindi, escludendo l’eventualità di avere x = 0 e ricordando che ci si limita a considerare valori di ω strettamente positivi, 2 c mc2 ω = 1− . (2.4.4) |x | E − qφ(x) Azione di Maupertuis e lagrangiana efficace L’azione di Maupertuis del sistema per un generico moto x(t), t ∈ [t1 , t2 ], è data dall’espressione S [x(t)] = t2 3 t1 i=1 Stefano Siboni ∂L ẋi dt = ∂ ẋi t2 |x˙ |2 −1/2 ˙ 2 ˙ m 1− 2 |x| + q A(x) · x dt c t1 51 Università degli studi di Trento Corso di Meccanica razionale 2 che con la ridefinizione della scala dei tempi t → u si riduce all’integrale sull’intervallo fisso [u1 , u2 ]: u2 |x |2 2 −1/2 2 m 1− 2 ω |x | ω + q A(x) · x du S [x(t)] = c u1 e con la sostituzione di (2.4.4) diventa u2 |x |2 c S [x(t)] = [E − qφ(x)] 2 c |x | u1 u2 = mc2 1− E − qφ(x) 2 + q A(x) · x du = u2 |x | 2 2 4 x) · x du = [E − qφ(x)] − m c + q A( LE (x, x ) du , c u1 u1 in termini della lagrangiana efficace |x | x) · x . [E − qφ(x)]2 − m2 c4 + q A( c ) := LE (x, x Equazioni delle traiettorie Le equazioni di Eulero-Lagrange che specificano le traiettorie dei moti naturali privi di istanti di arresto sono perciò d ∂LE ∂LE − = 0 du ∂xi ∂xi ed avendosi: i = 1, 2, 3 1 xi ∂LE = [E − qφ(x)]2 − m2 c4 + qAi (x) ∂xi c |x | E − qφ(x) ∂LE |x | ∂φ ∂A = − q (x) + q (x) · x 2 2 4 ∂xi c ∂xi [E − qφ(x)] − m c ∂xi si scrivono esplicitamente come d 1 xi 2 2 4 [E − qφ(x)] − m c + qAi (x) + du c |x | + ∂φ ∂A E − qφ(x) |x | q (x) − q (x) · x = 0 , 2 2 4 c ∂x ∂x [E − qφ(x)] − m c i i (2.4.5) i = 1, 2, 3 , con xi = dxi /du. Va ricordato che − Stefano Siboni ∂φ (x) = Ei (x) ∂xi i = 1, 2, 3 , 52 Università degli studi di Trento Corso di Meccanica razionale 2 mentre, convenendo la somma sugli indici ripetuti e usando note proprietà del delta di Knorecker e del permutatore di Ricci εijk , ∂A ∂A ∂Ai ∂Aj ∂Ai dAi j (x) + (x) · x = − xj + xj = − x = du ∂xi ∂xj ∂xi ∂xi ∂xj j ∂Ah ∂Ah ∂Ah xj = εjir εhkr xj = εijr xj εrkh = = (δjh δik − δih δjk ) ∂xk ∂xk ∂xk x) , = εijr x Br (x) = êi · x ∧ B( − j in modo che le equazioni (2.4.5) si leggono anche d 1 xi [E − qφ(x)]2 − m2 c4 = du c |x | E − qφ(x) |x | x) + qêi · x ∧ B( x) , qêi · E( = 2 2 4 c [E − qφ(x)] − m c i = 1, 2, 3 , ovvero, in notazione vettoriale, d 1 x 2 2 4 [E − qφ(x)] − m c = du c |x | |x | E − qφ(x) x) + qx ∧ B( x) . q E( = 2 2 4 c [E − qφ(x)] − m c (2.4.6) Verifica dell’equazione delle orbite È facile verificare che l’equazione (2.4.6) descrive effettivamente le orbite di tutti i moti naturali senza istanti di arresto. Dalla (2.4.3) si deduce infatti che lungo un qualsiasi moto naturale valgono le relazioni: [E − qφ(x)]2 − m2 c4 |x˙ | mc2 = E − qφ(x) = E − qφ(x) c |x˙ |2 1− 2 c per cui [E − qφ(x)]2 − m2 c4 = mc|x˙ | 1− |x˙ |2 c2 e una sostituzione nella (2.4.3), tenuto conto che x˙ = 0, porge d x m|x˙ | |x | x) . q E(x) + qx ∧ B( = ˙ du |x | |x| |x˙ |2 1− 2 c Stefano Siboni (2.4.7) 53 Università degli studi di Trento Corso di Meccanica razionale 2 Basta allora osservare che ˙ x |x| = x˙ |x | dt |x | = du |x˙ | dt x = x˙ du e moltiplicare membro a membro la (2.4.7) per du/dt per ricavare l’equazione differenziale mx˙ d x) + qx˙ ∧ B( x) = q E( dt |x˙ |2 1− 2 c che coincide con la corretta equazione relativistica del moto della particella carica. 2.4.1 Caso della particella carica in un campo magnetico costante i potenPer un punto materiale soggetto ad un campo di induzione magnetica costante B ziali scalare e vettore del campo elettromagnetico assumono la forma φ(x) = 0 ∧ x . x) = 1 B A( 2 Per semplificare la discussione, ma senza alcuna perdita di generalità, si può ritenere che il campo di induzione sia diretto secondo l’asse Oz della terna di riferimento assoluta Oxyz, = B ê3 e il potenziale vettore si riduce a cosicché B x) = B (−y ê1 + x ê2 ) . A( 2 Posto per brevità arresto si scrivono ossia Stefano Siboni √ E 2 − m2 c4 = α le equazioni delle orbite per i moti privi di punti di d x B B α − y − y = 0 du |x | 2 2 d y B B α + x + x = 0 du |x | 2 2 d z α = 0 du |x | d x α − By = 0 du |x | d y + Bx = 0 α | du | x d z α = 0 du |x | (2.4.8) 54 Università degli studi di Trento Corso di Meccanica razionale 2 dove si è indicata con l’apice la derivata rispetto al parametro u. Si osservi che 2 x˙ m2 c 4 E 2 − m2 c 4 α2 = 1 − = = c2 E2 E2 E2 per cui valgono le seguenti equivalenze: α = 0 ⇐⇒ x˙ = 0 α > 0 ⇐⇒ x˙ = 0 essendo in ogni caso |x˙ | = cα = costante positiva . E È importante discutere separatamente i casi α = 0 e α > 0. Traiettorie per α = 0 Il sistema (2.4.8) si riduce a −By = 0 Bx = 0 da cui segue che x = costante y = costante mentre la coordinata z appare completamente indeterminata: la relativa traiettoria, in generale, consisterebbe in un segmento parallelo al campo di induzione magnetica Bê3 . In realtà, come ben noto, la condizione α = |x˙ | = 0 individua moti con velocità iniziale nulla che per una particella soggetta esclusivamente ad un campo di induzione magnetica in un riferimento inerziale corrispondono a stati di quiete. La traiettoria corretta sarebbe dunque del tipo (x, y, z) = costante, costituita da un unico punto, senza coordinata z libera: nella fattispecie il principio di Maupertuis non individua correttamente le traiettorie del moto. Ciò ribadisce la necessità di escludere, nell’enunciato del principio, i moti di energia costante lungo i quali siano presenti istanti di arresto — e dunque, in particolare, gli stati di quiete. Traiettorie per α > 0 In questo caso le equazioni delle traiettorie diventano invece d x α − By = 0 du |x | d y α + Bx = 0 du |x | d z = 0 du |x | Stefano Siboni (2.4.9) 55 Università degli studi di Trento Corso di Meccanica razionale 2 e porge, per β, γ ed n3 costanti opportune, x α − By = β |x | y α + Bx = γ |x | z = n3 , costante , |x | dove n3 ∈ [−1, 1] rappresenta la componente lungo ê3 del versore tangente alla traiettoria. Con una immediata manipolazione algebrica si perviene cosı̀ al sistema di equazioni x β + By = |x | α y γ − Bx = |x | α z = n3 . |x | È opportuno scegliere come parametro l’ascissa curvilinea s della traiettoria, in modo che |x | = 1 e il sistema precedente assume la forma più semplice dx β B = + y ds α α dy γ B = − x (2.4.10) ds α α dz = n3 ds con α > 0, β, γ, n3 ∈ [−1, 1] e B costanti. Il sistema lineare non omogeneo (2.4.10) si può risolvere convenientemente in rappresentazione complessa, sommando alla prima equazione la seconda moltiplicata membro a membro per l’unità immaginaria: β + iγ B B β + iγ B d (x + iy) = + y−i x = − i (x + iy) ds α α α α α in modo che l’equazione complessa ottenuta porge la soluzione generale β B B γ β + iγ iϕ −i B s α +Ke e − i + K cos ϕ − s + iK sin ϕ − s = x + iy = iB B B α α essendo K ≥ 0 e ϕ ∈ R rispettivamente un modulo e una fase costanti. Considerato poi che la soluzione generale della terza equazione in (2.4.10) è immediata, la soluzione completa risulta γ B x = + K cos ϕ − s B α β B (2.4.11) y = − + K sin ϕ − s B α z = n3 s + h Stefano Siboni 56 Università degli studi di Trento Corso di Meccanica razionale 2 con h ulteriore costante. In effetti le costanti che compaiono nella soluzione generale (2.4.11) non sono tutte indipendenti, dal momento che l’uso dell’ascissa curvilinea come variabile indipendente impone che si abbia 1 = dx 2 ds + dy 2 ds per cui ! K = + dz 2 ds 1 − n23 = B2 2 K + n23 2 α α . |B| Ad ogni buon conto, dall’equazione parametrica (2.4.11) si conclude che la traiettoria di un qualsiasi moto privo di istanti di arresto è un’elica cilindrica, come si può facilmente verificare integrando direttamente le equazioni legrangiane o newtoniane del moto. Un caso limite ricorre per n3 = 0, allorquando la traiettoria degenera in una semplice circonferenza, che peraltro si può sempre riguardare come elica cilindrica di passo nullo. Per K = 0, ovvero n3 = ±1, si ottengono infine traiettorie rettilinee parallele al campo di induzione B ê3 e associate ai moti uniformi della particella carica nella medesima direzione — quando la forza di Lorentz risulta identicamente nulla e non disturba in la velocità è parallela a B alcun modo il moto rettilineo ed uniforme della carica nel riferimento inerziale Oxyz. 2.5 Principio di Hamilton per i sistemi hamiltoniani. Teorema di Helmholtz Il principio di Hamilton è suscettibile di una estensione notevole al caso dei sistemi hamiltoniani, estensione che va sotto il nome di teorema di Helmholtz. Un sistema hamiltoniano è definito da una funzione hamiltoniana H(t, p, q) di classe C 2 nello spazio delle fasi esteso delle variabili (t, p, q), che si identifica con un aperto Ω di R × Rn × Rn . Con q = (q1 , . . . , qn ) ∈ Rn si indicano, al solito, le coordinate lagrangiane del sistema, mentre p = (p1 , . . . , pn ) ∈ Rn sono i corrispondenti momenti coniugati. Le equazioni del moto del sistema sono quelle di Hamilton ∂H (t, p, q) ṗi = − ∂qi ∂H q̇i = (t, p, q) ∂pi i = 1, . . . , n . (2.5.1) Per brevità, e in analogia con il linguaggio adottato per i sistemi lagrangiani, le soluzioni di queste equazioni verranno dette moti naturali del sistema hamiltoniano. Per un generico moto (p(t), q(t)), t ∈ [t1 , t2 ], nello spazio delle fasi Ω, la relativa funzione principale di Hamilton (1) è definita dall’integrale S[p(t), q(t)] = t2 n t1 (1) ph (t)q̇h (t) − H[t, p(t), q(t)] dt . (2.5.2) h=1 nota anche come azione di Hamilton o, semplicemente, azione Stefano Siboni 57 Università degli studi di Trento Corso di Meccanica razionale 2 Di tale moto (p(t), q(t)), t ∈ [t1 , t2 ], che verrà denominato moto base, si vogliono considerare arbitrari moti variati sincroni di classe C 2 e con configurazioni estreme fissate q(t1 ) e q(t2 ), che si potranno sempre esprimere nella forma p = p(t) + δp(t) q = q(t) + δq(t) , ∀ t ∈ [t1 , t2 ] , (2.5.3) dove δp(t), δq(t) sono arbitrarie funzioni C 2 nello stesso intervallo [t1 , t2 ] del moto base soggette alle condizioni al contorno δq(t1 ) = δq(t2 ) = 0. Lungo un moto variato la funzione principale di Hamilton diventa, omesse per brevità le dipendenze dal tempo delle varie funzioni in gioco, S[p(t) + δp(t), q(t) + δq(t)] = t2 n t1 ˙ (ph + δph )(q̇h + δqh ) − H(t, p + δp, q + δq) dt (2.5.4) h=1 ˙ in cui l’integrando ammette l’approssimazione di Taylor al primo ordine in δp, δq, δq, definita da n h=1 n ˙ ) − H(t, p + δp, q + δq) ∼ (ph + δph )(q̇h + δq h ∂H ∼ (t, p, q)δph + (t, p, q)δqh ∼ ∂ph ∂qh h=1 h=1 n n ∂H ∂H ˙ ∼ ph q̇h + (t, p, q)δqh + q̇h − (t, p, q) δph . ph δq h − (2.5.5) ∂qh ∂ph ˙ + q̇h δph ) − (ph q̇h + ph δq h h=1 n ∂H h=1 La variazione prima della funzione principale di Hamilton (2.5.2) si ottiene sostituendo l’integrando con il termine lineare dello sviluppo (2.5.5) t2 n ∂H ∂H ˙ ph δq h − (t, p, q)δqh + q̇h − (t, p, q) δph dt δS[p(t), q(t)] = ∂qh ∂ph (2.5.6) t1 h=1 ˙ viene espressa nella forma equivalente e integrando per parti i termini in δq δS[p(t), q(t)] = n t2 ph δqh h=1 t1 t2 n ∂H ∂H − ṗh + + δqh + q̇h − δph dt = ∂qh ∂ph t1 h=1 t2 n ∂H ∂H = − ṗh + δqh + q̇h − δph dt ∂qh ∂ph (2.5.7) t1 h=1 Stefano Siboni 58 Università degli studi di Trento Corso di Meccanica razionale 2 per via delle condizioni al contorno δq(t1 ) = δq(t2 ) = 0. La condizione di stazionarietà della funzione principale di Hamilton per moti variati sincroni arbitrari, C 2 e con configurazioni estreme uguali a quelle del moto base, corrisponde ad annullare la variazione prima δS[p(t), q(t)]: t2 n ∂H ∂H − ṗh + δqh + q̇h − δph dt = 0 ∂qh ∂ph t1 h=1 per ogni scelta delle funzioni δp(t), δq(t), di classe C 2 e tali che δq(t1 ) = δq(t2 ) = 0. In virtù dell’argomento standard già sviluppato nella sezione 1.4, ciò equivale a richiedere che ∀ t ∈ [t1 , t2 ] siano soddisfatte le equazioni differenziali ṗh + ∂H = 0 ∂qh q̇h − ∂H = 0 ∂ph h = 1, . . . , n che corrispondono alle equazioni di Hamilton (2.5.1). Si è cosı̀ stabilito il seguente 2.5.1 Teorema di Helmholtz Sia dato un sistema hamiltoniano di hamiltoniana H(t, p, q) nella spazio delle fasi esteso Ω e si consideri in Ω un moto (p(t), q(t)) di classe C 2 nell’intervallo t ∈ [t1 , t2 ], di valori estremi (p(t1 ), q(t1 )) = (p(1) , q (1)) e (p(t2 ), q(t2 )) = (p(2) , q (2)). Allora le proposizioni seguenti sono equivalenti: (i) il moto (p(t), q(t)) soddisfa le equazioni di Hamilton — ovvero costituisce un moto naturale del sistema hamiltoniano — con le condizioni al contorno assegnate: ∂H (t, p, q) (p(t1 ), q(t1 )) = (p(1) , q (1) ) ṗi = − ∂qi i = 1, . . . , n , ∂H (p(t2 ), q(t2 )) = (p(2), q (2) ); q̇i = (t, p, q) ∂pi (ii) il moto (p(t), q(t)) rende stazionaria la funzione principale di Hamilton S[p(t), q(t)] = t2 n t1 ph (t)q̇h (t) − H[t, p(t), q(t)] dt h=1 per moti variati sincroni arbitrari di classe C 2 e con le stesse configurazioni estreme q(t1 ) = q (1) , q(t2 ) = q (2) . Va osservato che nel rendere stazionaria la funzione principale di Hamilton non è necessario richiedere che i moti variati sincroni abbiano gli stessi valori estremi, p(t1 ) = p(1) e p(t2 ) = p(2) , dei momenti coniugati. Da sottolineare inoltre che il teorema di Helmholtz assicura l’equivalenza di un problema a valori al contorno e di un problema variazionale, ma non entra nel merito della esistenza ed eventuale unicità delle relative soluzioni — in generale tutt’altro che ovvie. Stefano Siboni 59 Università degli studi di Trento Corso di Meccanica razionale 2 2.6 Estensione del principio di Maupertuis ai sistemi hamiltoniani Oltre che ai sistemi lagrangiani di tipo generale il principio di Maupertuis può essere esteso anche ai sistemi hamiltoniani, per quanto non esattamente negli stessi termini. In questa sezione si illustra la procedura che consente tale estensione e si formula l’enunciato generale del principio per i sistemi hamiltoniani. 2.6.1 Sistemi hamiltoniani conservativi Si considera un sistema hamiltoniano definito da una hamiltoniana indipendente dal tempo H(p, q), di classe C 2 nello spazio delle fasi Ω ⊆ Rn × Rn delle coordinate generalizzate q = (q1 , . . . , qn ) e dei relativi momenti coniugati p = (p1 , . . . , pn ). Le equazioni del moto sono quelle di Hamilton ∂H (p, q) ṗi = − ∂qi i = 1, . . . , n (2.6.1) ∂H q̇i = (p, q) ∂pi di cui l’hamiltoniana costituisce un ovvio integrale primo, come è immediato verificare calcolando la derivata di H(p, q) lungo le soluzioni di (2.6.1): n n ∂H ∂H (p, q)ṗi + (p, q)q̇i = Ḣ(p, q) = ∂pi ∂qi i=1 i=1 n n ∂H ∂H ∂H ∂H = (p, q) − (p, q) + (p, q) (p, q) = 0 . ∂pi ∂qi ∂qi ∂pi i=1 (2.6.2) i=1 In questo senso il sistema hamiltoniano con hamiltoniana indipendente dal tempo risulta conservativo: lungo qualsiasi moto di un sistema hamiltoniano conservativo l’hamiltoniana, che solitamente ha il significato fisico di una energia, si mantiene costante. Non è però vera la proposizione inversa: un generico moto di energia costante non soddisfa le equazioni di Hamilton (2.6.1) e dunque non costituisce un moto del sistema. Scopo del principio di Maupertuis è proprio quello di caratterizzare fra tutti i moti di energia costante quelli che risolvono le equazioni di Hamilton — i cosiddetti moti naturali del sistema hamiltoniano — o più precisamente, le orbite di tali moti. 2.6.2 Moti test e superfici isoenergetiche Nel formulare la versione hamiltoniana del principio di Maupertuis si definisce moto test un qualsiasi moto (p(t), q(t)) di classe C 2 in un intervallo di tempo limitato e chiuso [t1 , t2 ], che conservi l’energia ad un valore E H[p(t), q(t)] = E , costante , e che sia privo di punti stazionari,(1) in modo che risulti (ṗ(t), q̇(t)) = 0 (1) ∀ t ∈ [t1 , t2 ] . Si dice stazionario il punto (p,q) della traiettoria dove le derivate in t di coordinate e momenti sono simul- taneamente nulle Stefano Siboni 60 Università degli studi di Trento Corso di Meccanica razionale 2 Al moto test sono associate una configurazione iniziale q(t1 ) = q (1) e una configurazione finale q(t2 ) = q (2) , come pure un momento iniziale p(t1 ) = p(1) ed un momento finale p(t2 ) = p(2). La superficie isoenergetica di energia E è il sottoinsieme dello spazio delle fasi Ω ⊆ Rn × Rn composto da tutti e soli i punti (p, q) che soddisfano l’equazione H(p, q) = E . Le superfici isoenergetiche sono quindi le superfici di livello dell’hamiltoniana. Per semplicità, si assume che in ogni punto della superficie isoenergetica di energia E il gradiente dell’hamiltoniana rispetto alle variabili di fase (p, q) risulti diverso da zero: ∂H ∂H (p, q), (p, q) = 0 ∂p ∂q ∀ (p, q) ∈ Ω : H(p, q) = E ; (2.6.3) ciò basta ad assicurare che la superficie isoenergetica costituisca una 2n−1 varietà differenziabile di classe C 2 immersa nello spazio delle fasi Ω ⊆ Rn × Rn . Per definizione, appare evidente che l’orbita di un moto test appartiene sempre ad una superficie isoenergetica. 2.6.3 Moti variati sincroni Sia dato un qualsiasi moto test (p(t), q(t)) in [t1 , t2 ], di energia E, con valori estremi (p(t1 ), q(t1 )) = (p(1), q (1) ) e (p(t2 ), q(t2 )) = (p(2) , q (2) ) delle variabili di fase. Se ne vogliono considerare i relativi moti variati sincroni, definiti sullo stesso intervallo di tempo [t1 , t2 ], con gli stessi valori iniziale e finale e con la stessa energia. I moti variati sono quindi esprimibili nella forma generale p = p(t) + δp(t) q = q(t) + δq(t) ∀ t ∈ [t1 , t2 ] con le funzioni δp(t) e δq(t) di classe C 2 in [t1 , t2 ], nulle agli estremi δp(t1 ) = δq(t1 ) = 0 δp(t2 ) = δq(t2 ) = 0 e conformi alla condizione di conservazione dell’energia H[p(t) + δp(t), q(t) + δq(t)] = E ∀ t ∈ [t1 , t2 ] . Questa definizione presenta analogie e differenze rispetto al concetto di moto variato che viene introdotto per il principio di Hamilton, per quello di Maupertuis o per il teorema di Helmholtz: (i) anche i moti variati sincroni del principio di Hamilton sono definiti sullo stesso intervallo di tempo [t1 , t2 ] del moto non variato. Tuttavia le variazioni sono limitate alla sola dipendenza dal tempo dei parametri lagrangiani, attraverso l’introduzione delle funzioni ausiliarie δq(t), e non riguardano i relativi momenti coniugati p = ∂L/∂ q̇, le Stefano Siboni 61 Università degli studi di Trento Corso di Meccanica razionale 2 cui variazioni sono indotte dalle δq(t). Le configurazioni estreme essendo fisse, si impongono le condizioni al contorno δq(t1 ) = δq(t2 ) = 0 che implicano l’annullarsi delle variazioni dei momenti coniugati agli estremi. Nei moti variati del principio di Hamilton non è inoltre richiesta la conservazione dell’energia — che può tranquillamente non costituire un integrale primo per le equazioni di Lagrange del moto; (ii) i moti variati del principio di Maupertuis, classico come generalizzato, conservano l’energia o la funzione di Jacobi. Vengono generati variando la dipendenza dal tempo dei parametri lagrangiani q e non dei corrispondenti momenti coniugati p = ∂L/∂ q̇; tuttavia, l’esigenza di conservare l’energia o la funzione di Jacobi obbliga a variare anche la coordinata t e il moto variato che ne risulta non è definito sullo stesso intervallo [t1 , t2 ] del moto non variato. In questo senso i moti variati sono asincroni. La variazione dei momenti coniugati è determinata di conseguenza e non assegnata liberamente; (iii) i moti variati che si considerano nel teorema di Helmholtz sono costruiti variando a piacere tanto le coordinate generalizzate quanto i momenti, per mezzo delle appropriate funzioni δp(t) e δq(t) dell’intervallo fisso [t1 , t2 ]. Non è tuttavia richiesto che δp(t1 ) = δp(t2 ) = 0, né ai moti variati viene imposta la conservazione dell’energia. Fatti salvi i requisiti di regolarità e la condizione al contorno δq(t1 ) = δq(t2 ) = 0, le variazioni δp(t) e δq(t) sono completamente arbitrarie. È interessante sottolineare che, diversamente dai sistemi lagrangiani ha senso considerare moti variati sincroni di energia costante — senza dunque variare l’intervallo di tempo [t1 , t2 ] in cui i moti variati sono definiti. Il motivo è che nel caso hamiltoniano vengono variati anche i momenti coniugati p e non soltanto le coordinate generalizzate q, potendo cosı̀ assicurare la conservazione dell’energia senza dover intervenire sulla coordinata t e sul relativo intervallo [t1 , t2 ]. Come già per il principio di Maupertuis classico e per quello generalizzato, il moto (p(t), q(t)), t ∈ [t1 , t2 ], su cui vengono introdotte le variazioni δp(t), δq(t) si indicherà con il termine di moto base. 2.6.4 Azione Per un sistema hamiltoniano conservativo l’azione di Maupertuis del moto base (p(t), q(t)), t ∈ [t1 , t2 ], è data dall’integrale S [p(t), q(t)] = t2 n t1 pi (t)q̇i (t)dt (2.6.4) i=1 che in virtù della conservazione dell’energia — il cui valore è E — si può anche riscrivere come t2 n S [p(t), q(t)] = pi (t)q̇i (t) − H[p(t), q(t)] dt + E(t2 − t1 ) (2.6.5) t1 i=1 dove l’integrale residuo coincide con la funzione principale di Hamilton definita in (2.5.2). Stefano Siboni 62 Università degli studi di Trento Corso di Meccanica razionale 2 2.6.5 Variazione dell’azione La variazione prima dell’azione di Maupertuis (2.6.4) deve essere calcolata rispetto a moti variati sincroni arbitrari con valori estremi fissi ed energia conservata e uguale a quella del moto base. La relazione (2.6.5), nella quale E, t1 e t2 sono costanti, permette di identificare la variazione dell’azione di Maupertuis con quella della funzione principale di Hamilton (2.5.2); l’espressione cercata è quindi la (2.5.7): t2 n ∂H ∂H − ṗh + (p, q) δqh + q̇h − (p, q) δph dt , δS [p(t), q(t)] = ∂qh ∂ph t1 h=1 con p = p(t), q = q(t) e le variazioni δp(t), δq(t) funzioni C 2 arbitrarie dell’intervallo [t1 , t2 ], purché nulle agli estremi e di energia E: H[p(t) + δp(t), q(t) + δq(t)] = E ∀ t ∈ [t1 , t2 ] . 2.6.6 Stazionarietà dell’azione come condizione necessaria per i moti naturali L’espressione precedente per la variazione prima dell’azione di Maupertuis dimostra in modo ovvio che se il moto base (p(t), q(t), t ∈ [t1 , t2 ], è naturale, l’azione di Maupertuis è stazionaria per qualsiasi moto variato δS [p(t), q(t)] = 0 essendo soddisfatte le equazioni di Hamilton (2.6.1). La stazionarietà dell’azione di Maupertuis rispetto a moti variati arbitrari sincroni C 2, con valori estremi ed energia uguali a quelli del moto base, è condizione necessaria perché quest’ultimo sia un moto naturale del sistema hamiltoniano. Non è irrilevante sottolineare che questa proprietà sussiste a prescindere dal fatto che la superficie isoenergetica sulla quale l’orbita del moto base si colloca sia o meno una varietà, e indipendentemente dalla mancanza o meno di punti stazionari lungo lo stesso moto. Il altri termini, la condizione necessaria è valida anche per moti base che non siano test. Da notare che l’annullarsi della variazione prima dell’azione di Maupertuis t2 n ∂H ∂H (p, q) δqh + q̇h − (p, q) δph dt = 0 − ṗh + ∂qh ∂ph t1 h=1 per qualsiasi moto variato sincrono del tipo descritto non è condizione sufficiente perché il moto base sia naturale, neppure nel caso dei moti test. Il vincolo di conservazione dell’energia esclude infatti che le variazioni δpi (t), δqi (t) si possano scegliere indipendentemente le une dalle altre — condizione cruciale per poter applicare la procedura descritta nella sezione 1.4. Stefano Siboni 63 Università degli studi di Trento Corso di Meccanica razionale 2 2.6.7 Forma hamiltoniana del principio di Maupertuis Si vuole determinare la condizione necessaria e sufficiente affinché l’azione di Maupertuis (2.6.4): t2 n pi q̇i dt t1 i=1 sia stazionaria in corrispondenza di un moto base di energia costante E, per moti variati sincroni arbitrari di classe C 2 delle funzioni incognite p(t), q(t), con valori estremi p(1), q (1) , p(2), q (2) ed energia E uguali a quelli del moto base. Moto base e relative variazioni a valori estremi fissi devono rispettare il vincolo di energia costante H(p, q) = E ∀ t ∈ [t1 , t2 ] . (2.6.6) Si richiede inoltre che il moto base (p(t), q(t)) sia un moto test e che la superficie isoenergetica di energia E su cui esso si svolge sia una varietà C 2 dello spazio delle fasi. Per continuità, il requisito che (p(t), q(t)) sia privo di punti stazionari è sicuramente rispettato anche da tutti i moti variati (p(t) + δp(t), q(t) + δq(t)) dove le variazioni (δp(t), δq(t)) siano abbastanza piccole, ovvero, più specificamente, max |δ q̇(t)| < ε t∈[t1 ,t2 ] con | · | norma euclidea di Rn ed ε > 0 sufficientemente vicino a zero: nell’analisi locale di stazionarietà del funzionale (2.6.4) soggetto alla condizione (2.6.6), l’esclusione dei punti stazionari lungo il moto base non rappresenta un vincolo e può essere considerata solo a posteriori, dopo aver calcolato tutte le possibili soluzioni con i metodi standard del calcolo variazionale. Le soluzioni si determinano perciò, conformemente ai risultati della sezione 1.8, con il metodo dei moltiplicatori di Lagrange: le funzioni (p(t), q(t)) di energia E che rendono stazionario il funzionale (2.6.4) sono tutte e sole le funzioni di uguali estremi ed energia che soddisfano le equazioni di Eulero-Lagrange associate alla lagrangiana efficace E L (p, q, q̇) = n pi q̇i − λ[H(p, q) − E] i=1 per una appropriata funzione λ(t), di classe C 1 in [t1 , t2 ] — il moltiplicatore di Lagrange del problema. Di queste soluzioni si prenderanno in considerazione soltanto quelle prive di punti stazionari. 2.6.8 Osservazione: la superficie isoenergetica può non essere una varietà Omissis 2.6.9 Derivazione alternativa del principio di Maupertuis Omissis Stefano Siboni 64 Università degli studi di Trento Corso di Meccanica razionale 2 2.6.10 Osservazione: relazione con il principio di Hamilton Da notare che il principio di Hamilton vale anche per sistemi hamiltoniani non conservativi, dove l’hamiltoniana dipende esplicitamente dal tempo e non costituisce un integrale primo per il sistema, mentre la versione hamiltoniana del principio di Maupertuis riguarda i soli sistemi hamiltoniani conservativi. Sembrerebbe che, essendosi limitati a considerare moti variati di energia E uguale a quella del moto base e su un intervallo di tempo fisso [t1 , t2 ], rendere stazionaria l’azione di Maupertuis o la funzione principale di Hamilton — che differiscono per il termine costante E(t2 − t1 ) — sia esattamente la stessa cosa e che perciò la forma hamiltoniana del principio di Maupertuis sia equivalente al principio di Hamilton classico, sia pure limitatamente ai soli sistemi hamiltoniani conservativi. In realtà le cose non stanno cosı̀. In effetti, nel caso conservativo le variazioni prime dell’azione di Maupertuis e della funzione principale di Hamilton sono identiche: t2 n ∂H ∂H − ṗh + δS [p(t), q(t)] = δS[p(t), q(t)] = (p, q) δqh + q̇h − (p, q) δph dt . ∂qh ∂ph t1 h=1 (2.6.7) Ma nel principio di Hamilton le variazioni δq(t), δp(t) sono arbitrarie, compatibilmente con le condizioni al contorno δq(t1 ) = δq(t2 ) = 0, mentre nel principio di Maupertuis i moti variati sono isoenergetici, oltre a doversi assumere anche l’ulteriore condizione al contorno δp(t1 ) = δp(t2 ) = 0 — nel principio di Hamilton quest’ultimo requisito è irrilevante e può essere omesso nell’ununciato. In altri termini, nel principio di Maupertuis le variazioni δq(t), δp(t) che compaiono in (2.6.7) non sono indipendenti e dall’annullarsi della variazione prima non è dato concludere che le equazioni di Hamilton siano soddisfatte. E infatti la caratterizzazione che si ottiene non è quella — completa — di tutti i moti naturali, ma soltanto quella — parziale — delle loro orbite, a prescindere dalla corretta legge oraria con cui le stesse sono percorse. 2.6.11 Esempio illustrativo Dato un aperto non vuoto B di Rn , si consideri una hamiltoniana della forma n H(p, q) = H(p) = Hi (pi ) , (p, q) ∈ B × Rn (2.6.8) i=1 interpretabile come l’hamiltoniana di un sistema integrabile espresso in variabili d’azione — i momenti coniugati pi — e angolo — le coordinate generalizzate qi . Per un dato livello E di energia, si assuma soddisfatta la condizione supplementare (2.6.3) sul gradiente dell’hamiltoniana lungo la superficie isoenergetica corrispondente, che nella fattispecie si riduce a richiedere che H1 (p1 ), H2 (p2 ), . . . , Hn (pn ) = 0 ∀ p ∈ B : H(p) = E . Per fissare le idee si supponga che Hn (pn ) = 0. Localmente, l’equazione H(p, q) = E può allora essere risolta in pn : n−1 −1 Hi (pi ) pn = Hn E − i=1 Stefano Siboni 65 Università degli studi di Trento Corso di Meccanica razionale 2 essendo Hn−1 l’inversa locale della funzione Hn . 3. Linee geodetiche di una superficie assegnata Si consideri la superficie S di R3 di parametrizzazione regolare C 2 (u, v) ∈ D −−−−→ ϕ(u, v) ∈ R3 , in cui D indica un qualsiasi dominio di R2 . Una generica curva regolare C 2 su S si rappresenterà per mezzo della parametrizzazione s ∈ [0, L] −−−−→ ϕ[u(s), v(s)] ∈ R3 , dove s ∈ [0, L] → (u(s), v(s)) ∈ D è una qualsiasi funzione C 2 con derivata prima non nulla dell’intervallo [0, L], mentre s ed L rappresentano rispettivamente l’ascissa curvilinea e la lunghezza della curva. Una curva regolare C 2 si dice linea geodetica o semplicemente geodetica (1) della superficie S se in ogni suo punto biregolare — dove è definito il relativo versore normale — la normale alla curva coincide con la normale alla superficie nello stesso punto. Detto altrimenti: in ogni punto biregolare di una linea geodetica su S il versore normale alla curva e quello normale alla superficie sono paralleli. Indicato con τ̂ il versore tangente alla curva regolare, le linee geodetiche della superficie S sono individuate completamente dalle equazioni dτ̂ · ϕu = 0 ds dτ̂ · ϕv = 0 , ds (3.1) nel quale per brevità si sono indicate con ϕu e ϕv le derivate parziali prime della parametrizzazione ϕ rispetto alle variabili u e v rispettivamente. Si tratta di un sistema di due equazioni differenziali del secondo ordine nelle variabili u, v. Non tutte le curve su S sono linee geodetiche, ma soltanto quelle per le quali le funzioni u(s) e v(s) soddisfano le (3.1). 3.1 Geodetiche come linee di lunghezza stazionaria a estremi fissi Delle linee geodetiche di una superficie S si può dare una caratterizzazione più intuitiva e del tutto equivalente come linee di lunghezza minima o stazionaria sulla superficie ad estremi fissati.(1) Per illustrare e dimostrare questa caratterizzazione equivalente conviene considerare la parametrizzazione di una curva regolare C 2 della superficie S nella sua forma più generale, facendo uso di un parametro generico λ che non necessariamente abbia il significato geometrico di una ascissa curvilinea: P (λ) = ϕ[u(λ), v(λ)] (1) , λ ∈ [λ1 , λ2 ] , queste curve sono a volte indicate come estremali della superficie, il termine geodetiche essendo riservato alle sole curve di lunghezza minima, ad estremi fissati, sulla superficie (definizione di Kneser) Stefano Siboni 66 Università degli studi di Trento Corso di Meccanica razionale 2 con ϕ(u, v), u(λ) e v(λ) funzioni C 2 nei rispettivi domini di definizione. La condizione di regolarità della curva viene soddisfatta, vista la regolarità di S, richiedendo semplicemente che (u̇(λ), v̇(λ)) = (0, 0) ∀ λ ∈ [λ1 , λ2 ] , in modo che la derivata prima della parametrizzazione sia diversa da zero in tutto l’intervallo di definizione: Ṗ (λ) = du dv dϕ (λ) = ϕu + ϕv = ϕuu̇ + ϕv v̇ dλ dλ dλ essendosi indicata con il punto, per brevità, la derivata rispetto al parametro libero λ. La lunghezza della curva si scrive allora λ2 λ2 λ2 2 1/2 L = |Ṗ (λ)| dλ = (Ṗ ) dλ = Ldλ , λ1 λ1 (3.1.1) λ1 essendosi introdotta la “funzione di Lagrange” 1/2 = L(u, v, u̇, v̇) . L = (Ṗ 2 )1/2 = (ϕu u̇ + ϕv v̇)2 (3.1.2) Si consideri ora una nuova curva regolare C 2 sulla superficie S che abbia gli stessi estremi P (λ1 ) e P (λ2 ). Tale curva viene detta curva variata a estremi fissi e la sua parametrizzazione si potrà esprimere nella forma P̃ (λ) = ϕ[u(λ) + δu(λ), v(λ) + δv(λ)] con le funzioni δu e δv definite e C 2 sullo stesso intervallo [λ1 , λ2 ] e nulle agli estremi: δu(λ1 ) = δu(λ2 ) = 0 δv(λ1 ) = δv(λ2 ) = 0 . La prima variazione a estremi fissi della lunghezza (3.1.1) si scrive allora λ2 δL(u, v, δu, δv) = λ1 λ2 d ∂L d ∂L ∂L ∂L δu dλ + δv dλ − − ∂u dλ ∂ u̇ ∂v dλ ∂ v̇ (3.1.3) λ1 e per l’arbitrarietà delle variazioni δu, δv la condizione di stazionarietà della lunghezza conduce alle equazioni di Eulero-Lagrange: d ∂L ∂L dλ ∂ u̇ − ∂u = 0 L = (Ṗ 2 )1/2 (3.1.4) ∂L d ∂L dλ ∂ v̇ − ∂v = 0 Stefano Siboni 67 Università degli studi di Trento Corso di Meccanica razionale 2 che equivalgono all’annullarsi della prima variazione (3.1.3). Questa condizione risulta necessaria ma non sufficiente perché la lunghezza della curva a estremi fissati sia minima. Quando la variazione prima è zero si parla più genericamente di stazionarietà dell’integrale della lunghezza. Le equazioni di Eulero-Lagrange (3.1.4) sono quindi equivalenti alla stazionarietà dell’integrale della lunghezza della curva. Non rimane che scrivere in modo più esplicito le equazioni di Eulero-Lagrange. Osservato che ∂ ∂P ∂ Ṗ = ϕu (u, v)u̇ + ϕv (u, v)v̇ = ϕu(u, v) = ∂ u̇ ∂ u̇ ∂u e ∂ϕu ∂ ∂ϕv ∂ Ṗ = ϕu(u, v)u̇ + ϕv (u, v)v̇ = (u, v)u̇ + (u, v)v̇ = ∂u ∂u ∂u ∂u ∂2ϕ ∂2ϕ ∂2ϕ ∂2ϕ (u, v) u̇ + (u, v) u̇ + (u, v) v̇ = (u, v)v̇ = = ∂u2 ∂u∂v ∂u2 ∂v∂u ∂ ∂ϕ d ∂ϕ ∂ ∂ϕ u̇ + v̇ = , = ∂u ∂u ∂v ∂u dλ ∂u e che analoghe espressioni valgono per le derivate in v ∂ Ṗ ∂P ∂ Ṗ d ∂P = = , ∂ v̇ ∂v ∂v dλ ∂v si ottiene: 1 Ṗ ∂P ∂ Ṗ ∂L ∂P = (Ṗ 2 )−1/2 2Ṗ · = (Ṗ 2 )−1/2 Ṗ · = · ∂ u̇ 2 ∂ u̇ ∂u |Ṗ | ∂u d ∂P ∂ Ṗ 1 2 −1/2 Ṗ ∂ Ṗ Ṗ ∂L · · 2Ṗ · = (Ṗ ) = = ∂u 2 ∂u |Ṗ | ∂u |Ṗ | dλ ∂u ossia ∂P ∂L = τ̂ · ∂ u̇ ∂u d ∂P ∂L = τ̂ · , ∂u dλ ∂u per cui d ∂P d ∂P dτ̂ ∂P d ∂L ∂L − = τ̂ · − τ̂ · = · = 0 dλ ∂ u̇ ∂u dλ ∂u dλ ∂u dλ ∂u ed analogamente dτ̂ ∂P d ∂L ∂L − = · = 0. dλ ∂ v̇ ∂v dλ ∂v Lungo la linea geodetica la derivata dτ̂ /dλ risulta pertanto normale alla superficie vincolare, avendosi dτ̂ ∂P dτ̂ ∂P · = 0 · = 0. (3.1.5) dλ ∂u dλ ∂v Poiché la stessa derivata, se non nulla, è per definizione parallela al versore normale alla curva dτ̂ n̂ , dλ si conclude che lungo la geodetica la normale alla curva coincide punto per punto con la normale alla superficie. L’asserto è provato. Stefano Siboni 68 Università degli studi di Trento Corso di Meccanica razionale 2 3.2 Esempio: geodetiche sul cilindro circolare Per illustrare la nozione di linea geodetica su una superficie assegnata, si vogliono caratterizzare le linee geodetiche di una superficie cilindrica — cilindro circolare. La superficie cilindrica in questione abbia asse coincidente con l’asse coordinato Oz e sezione circolare di raggio R > 0, con parametrizzazione x = R cos u y = R sin u z = v u, v ∈ R . (3.2.1) Una generica curva appartenente alla superficie si rappresenterà mediante la stessa parametrizzazione, a patto di sostituire agli argomenti u e v funzioni regolari del parametro λ nell’intervallo [λ1 , λ2 ] ⊂ R P (λ) − O = R cos u(λ) ê1 + R sin u(λ) ê2 + v(λ) ê3 . (3.2.2) La derivata prima in λ della parametrizzazione diventa perciò Ṗ = −R sin u u̇ ê1 + R cos u u̇ ê2 + v̇ ê3 con modulo quadrato Ṗ 2 = R2 u̇2 + v̇ 2 in modo che la funzione da integrare fra λ1 e λ2 per ottenere la lunghezza della curva è data da (3.2.3) L = (R2 u̇2 + v̇ 2 )1/2 . È ora sufficiente sostituire la parametrizzazione (3.2.2) nelle equazioni delle geodetiche (3.1) dτ̂ ∂ϕ · = 0 dλ ∂u dτ̂ ∂ϕ · = 0 dλ ∂v per ottenere il sistema di equazioni dτ̂ · (− sin u ê1 + cos u ê2 ) = 0 dλ dτ̂ · ê3 = 0 dλ (3.2.4) che caratterizzano tutte e sole le linee geodetiche sulla superficie cilindrica. La seconda delle equazioni (3.2.4) equivale a d (τ̂ · ê3 ) = 0 dλ Stefano Siboni 69 Università degli studi di Trento Corso di Meccanica razionale 2 per cui lungo la linea geodetica il prodotto τ̂ · ê3 deve mantenersi costante, ossia (R2 u̇2 v̇ = a, + v̇ 2 )1/2 costante , (3.2.5) con la costante a necessariamente compresa fra −1 e +1 — u̇ e v̇ sono numeri reali. È opportuno distinguere i casi in cui la costante a sia diversa da zero o nulla. (i) Se a = 0, allora dalla (3.2.5) si ha v̇ = 0 |Ṗ | = (R2 u̇2 + v̇ 2 )1/2 = e sicché v̇ a −R sin u u̇ ê1 + R cos u u̇ ê2 + v̇ ê3 u̇ Ṗ u̇ = τ̂ = = a −R sin u ê1 + R cos u ê2 + ê3 v̇/a v̇ v̇ |Ṗ | espressione nella quale, peraltro, la stessa equazione (3.2.5) implica che il quoziente u̇/v̇ sia costante. Derivando rispetto a λ si ottiene allora u̇ u̇ d dτ̂ = aR (− sin u ê1 + cos u ê2 ) = aR (− cos u ê1 − sin u ê2 ) u̇ dλ v̇ dλ v̇ e la prima delle equazioni (3.2.4) diventa u̇ 0 = −aR (cos u ê1 + sin u ê2 ) u̇ · (− sin u ê1 + cos u ê2 ) v̇ risultando cosı̀ identicamente soddisfatta. La seconda delle equazioni (3.2.4), ovvero l’equivalente (3.2.5), è quindi la sola che caratterizza le linee geodetiche del sistema per a = 0. Essa porge la relazione v̇ 2 = a2 , a2 ≤ 1 2 2 2 R u̇ + v̇ nella quale deve essere necessariamente v̇ = 0 e quindi R2 u̇2 1 +1 = 2 2 v̇ a ovvero 1 1 u̇2 = − 1 > 0 per − 1 < |a| < +1 , v̇ 2 R2 a2 condizione che individua un’elica cilindrica. Per a = ±1 vale u̇ = 0 e quindi u = costante, mentre v è libero. Si tratta di un segmento di retta parallelo alla generatrice — ovvero all’asse del cilindro. (ii) Se a = 0 si ha invece v̇ = 0 (e u̇ = 0) per cui τ̂ = Stefano Siboni (−R sin u ê1 + R cos u ê2 ) u̇ u̇ = (− sin u ê1 + cos u ê2 ) R|u̇| |u̇| 70 Università degli studi di Trento Corso di Meccanica razionale 2 e quindi u̇ dτ̂ = (− cos u ê1 − sin u ê2 ) u̇ dλ |u̇| in modo che la prima delle (3.2.4) 0 = dτ̂ · (− sin u ê1 + cos u ê2 ) dλ è identicamente soddisfatta. Anche in questo caso le geodetiche sono individuate quindi dalla (3.2.5), ma con a = 0 v̇ = 0. (R2 u̇2 + v̇ 2 )1/2 Si ha perciò v̇ = 0, cioè v = costante, mentre u è libero: la curva descritta è un arco di circonferenza a quota z costante. In conclusione, le geodetiche di una superficie cilindrica circolare retta sono di tre tipi diversi: archi di elica cilindrica, archi di circonferenza di quota costante, segmenti di retta paralleli alla generatrice, ovvero all’asse del cilindro. Si noti che circonferenze e segmenti possono essere visti come casi limite di eliche cilindriche, di passo nullo o infinito. rispettivamente. 3.2.1 Osservazione: linee geodetiche e integrale di Beltrami Un approccio alternativo alla determinazione delle linee geodetiche sul cilindro è offerto dall’uso diretto delle equazioni di Eulero-Lagrange (3.1.4) e dall’introduzione degli appropriati integrali di Beltrami. Poiché la lagrangiana L = (R2 u̇2 + v̇ 2 )1/2 = L(u̇, v̇) non dipende esplicitamente dalle funzioni u e v, le equazioni delle geodetiche sul cilindro d ∂L ∂L − = 0 dλ ∂ u̇ ∂u d ∂L ∂L − = 0 dλ ∂ v̇ ∂v si riducono a d ∂L d ∂L = 0 = 0 dλ ∂ u̇ dλ ∂ v̇ e porgono perciò ben due integrali di Beltrami: ∂L = α ∂ u̇ ∂L = β ∂ v̇ ossia, esplicitamente, R2 u̇ √ = α R2 u̇2 + v̇ 2 √ v̇ R2 u̇2 + v̇ 2 = β (3.2.6) dove α, β sono costanti reali arbitrarie e le derivate u̇ e v̇ non possono risultare simultaneamente nulle. Si devono distinguere tre casi: Stefano Siboni 71 Università degli studi di Trento Corso di Meccanica razionale 2 (i) se u̇ = 0 e v̇ = 0 è immediato dedurre dalle (3.2.6) che α = 0 e β = v̇ = ±1 |v̇| per cui la coppia composta da u(λ) = costante e v(λ) funzione C 2 arbitraria con derivata non nulla nel proprio intervallo di definizione [λ1 , λ2 ], scelto a piacere, rappresenta sempre una soluzione delle equazioni assegnate. Si ottengono in tal modo le linee geodetiche collocate lungo le rette parallele all’asse del cilindro — e che ne costituiscono la superficie, è bene ricordare che il cilindro costituisce un classico esempio di superficie rigata, identificabile cioè con una unione di rette; (ii) se all’opposto u̇ = 0 e v̇ = 0 risulta α = u̇ = ±1 |u̇| e β = 0 e si ottiene soluzione per v(λ) = costante arbitraria qualunque sia la funzione u(λ), C 2 e con derivata non nulla nell’intervallo di definizione arbitrario [λ1 , λ2 ]; (iii) se infine u̇ = 0 e v̇ = 0, dividendo la prima per la seconda delle (3.2.6) si ricava e quindi u̇ − α R2 u̇ = v̇ β =⇒ u̇ α = , costante v̇ βR2 α v̇ = 0 βR2 ⇐⇒ u− α v = γ , costante βR2 in modo che la (3.2.1) diventa α x = R cos v + γ 2 βR α v+γ y = R sin βR2 z = v (3.2.7) con v variabile monotonicamente in un qualsiasi intervallo reale, a parametrizzare un arco di elica cilindrica di passo 2πβR2 /α. 3.2.2 Osservazione: le linee geodetiche sono curve di minima lunghezza Le linee geodetiche sul cilindro circolare in realtà non sono semplicemente delle curve estremali, che rendono stazionaria la variazione prima dell’integrale (3.1.1), ma bensı̀ curve di lunghezza localmente minima a estremi fissi. Con ciò si vuole intendere che qualsiasi curva variata C 2, che abbia gli stessi estremi della geodetica e che sia sufficientemente prossima a questa, è caratterizzata da una lunghezza maggiore di quella della geodetica. Per provarlo è sufficiente: Stefano Siboni 72 Università degli studi di Trento Corso di Meccanica razionale 2 ◦ considerare variazioni della forma δu(λ) = αη1 (λ) δv(λ) = αη2 (λ) (3.2.8) con η1 , η2 funzioni C 2 a derivata non nulla in [λ1 , λ2 ], nulle agli estremi, e α ∼ 0; ◦ introdurre la variazione seconda dell’integrale della lunghezza (3.1.1), che assume una forma particolarmente semplice λ2 2 δ L(u, v, δu, δv) = ∂2L ∂2L 2 ∂2L 2 δ u̇ + 2 δ v̇ dλ δ u̇δ v̇ + ∂ u̇2 ∂ u̇∂ v̇ ∂ v̇ 2 (3.2.9) λ1 in conseguenza del fatto che la lagrangiana (3.2.3) con contiene alcuna dipendenza esplicita dagli argomenti u e v, ma soltanto dalle derivate prime corrispondenti u̇ e v̇. Nella fattispecie, dalle derivate parziali prime ∂L = R2 (R2 u̇2 + v̇ 2 )−1/2 u̇ ∂ u̇ ∂L = R2 (R2 u̇2 + v̇ 2 )−1/2 v̇ ∂ v̇ si deducono immediatamente le espressioni delle derivate parziali seconde richieste: ∂2L = (R2 u̇2 + v̇ 2 )−3/2 R2 v̇ 2 ∂ u̇2 ∂2L = −(R2 u̇2 + v̇ 2 )−3/2 R2 u̇v̇ ∂ u̇∂ v̇ ∂2L = (R2 u̇2 + v̇ 2 )−3/2 R2 u̇2 ∂ v̇ 2 che sostituite nella formula (3.2.9) porgono λ2 δ 2 L(u, v, δu, δv) = R2 (R2 u̇2 + v̇ 2 )−3/2 (v̇ 2 δ u̇2 − 2u̇v̇ δ u̇δ v̇ + u̇2 δ v̇ 2 ) dλ = λ1 λ2 = R (R2 u̇2 + v̇ 2 )−3/2 (v̇ δ u̇ − u̇ δ v̇)2 dλ . 2 λ1 L’espressione cosı̀ ottenuta è chiaramente di segno non negativo. Spingendosi più oltre, data la continuità dell’integrando e la conseguente possibilità di applicare il teorema di permanenza del segno, la variazione seconda δ 2 L risulta strettamente positiva a meno che non si abbia (3.2.10) u̇ δ v̇ − v̇ δ u̇ = 0 ∀ λ ∈ [λ1 , λ2 ] equazione che deve essere soddisfatta dalle variazioni δu(λ) e δv(λ) lungo la parametrizzazione (u(λ), v(λ)) di una linea geodetica arbitraria. Secondo il tipo di geodetica si devono distinguere, come già visto in precedenza, tre diversi casi. Stefano Siboni 73 Università degli studi di Trento Corso di Meccanica razionale 2 (i) Per le geodetiche rettilinee, laddove risulta u(λ) = costante e v(λ) arbitraria(1) la (3.2.10) si riduce a −v̇ δ u̇ = 0 e quindi, essendo v̇ = 0 ∀ λ ∈ [λ1 , λ2 ], alla semplice condizione ∀ λ ∈ [λ1 , λ2 ] . δ u̇(λ) = 0 La variazione δu deve cosı̀ risultare costante sull’intero intervallo di definizione δu(λ) = costante ∀ λ ∈ [λ1 , λ2 ] ed anzi nulla ∀ λ ∈ [λ1 , λ2 ] δu(λ) = 0 a causa delle condizioni al contorno che, per via degli estremi fissi, impongono δu(λ1 ) = δu(λ2 ) = 0. Per questa classe di geodetiche non è definita alcuna curva variata C 2 che abbia gli estremi fissi e annulli la variazione seconda della lunghezza. (ii) Per le geodetiche circolari, lungo le quali risulta v(λ) costante e u(λ) funzione C 2 arbitraria con derivata prima non nulla, si perviene ad una conclusione analoga in quanto la (3.2.10) diventa u̇ δ v̇ = 0 =⇒ δ v̇ = 0 =⇒ δv = costante per cui δv(λ) = 0 ∀ λ ∈ [λ1 , λ2 ] a causa della condizione al contorno δv(λ1 ) = δv(λ2 ) = 0. Anche per questa tipologia di linee geodetiche non sono definite curve variate C 2 con gli estremi assegnati che annullino la variazione seconda δ 2 L. (iii) Nel caso delle geodetiche elicoidali la parametrizzazione (3.2.7) richiede che si abbia u(λ) = α v(λ) + γ βR2 con α, β, γ costanti e v(λ) arbitraria funzione C 2 con derivata prima diversa da zero nell’intervallo [λ1 , λ2 ], assegnato a piacere. L’equazione (3.2.10) assume perciò la forma α v̇ δ v̇ − v̇ δ u̇ = 0 βR2 e raccogliendo le derivate dopo aver semplificato il fattore non nullo v̇ si riduce a d α δv − δu = 0 dλ βR2 sicché risulta δu = (1) α δv + costante . βR2 (3.2.11) purché C 2 e con v̇(λ)=0 ∀ λ∈[λ1 ,λ2 ] Stefano Siboni 74 Università degli studi di Trento Corso di Meccanica razionale 2 In effetti, le condizioni al contorno impongono che si abbia 0 = δu(λi ) = α α δv(λi ) + costante = · 0 + costante = costante 2 βR βR2 i = 1, 2 , in modo che (3.2.11) vale semplicemente δu = α δv . βR2 Dalla parametrizzazione (3.2.7) appare allora evidente che la curva variata (u(λ) + δu(λ), v(λ) + δv(λ)) è in realtà ancora lo stesso arco di elica cilindrica, diversamente parametrizzato in funzione di λ.(1) Non esistono curve variate in senso geometrico: le sole variazioni consentite si limitano a riparametrizzare la linea geodetica assegnata. Le linee geodetiche sul cilindro sono dunque caratterizzate dall’annullarsi, ad estremi fissi, della variazione prima e dal segno positivo della variazione seconda della lunghezza (3.2.3). Queste due condizioni bastano ad assicurare che la lunghezza L delle linee geodetiche sia minima, ad estremi fissi, per qualsiasi curva variata sufficientemente prossima alla geodetica. Si può discutere la questione in termini generali, considerando un funzionale della forma (1.1) nella funzione incognita q(λ), soluzione delle equazioni di Eulero-Lagrange, ed una variazione δq(λ) del tipo (1.3). Il valore del funzionale in corrispondenza della funzione variata q(λ) + δq(λ) è allora dato dall’espressione λ2 L(q + αη) = L[λ, q(λ) + αη(λ), q̇(λ) + αη̇(λ)] dλ λ1 che per q(λ) ed η(λ) assegnati si può intendere come una funzione di α ∼ 0. Questa funzione risulta derivabile con continuità k volte se la lagrangiana L è di classe C k , e le derivate possono essere calcolate derivando sotto integrale. In particolare, per una L di classe C 3 si hanno le relazioni: dL (q + αη) = dα λ2 ∂L ∂L ηi + η̇i dλ ∂qi ∂ q̇i λ1 d2 L (q + αη) = dα2 λ2 ∂2L ∂2L ∂2L ηi ηj + 2 ηi η̇j + η̇i η̇j dλ ∂qi ∂qj ∂qi ∂ q̇j ∂ q̇i ∂ q̇j λ1 d3 L (q + αη) = dα3 λ2 λ1 +3 (1) ∂3L ∂3L ηi ηj ηk + 3 ηi ηj η̇k + ∂qi ∂qj ∂qk ∂qi ∂qj ∂ q̇k ∂3L ∂3L ηi η̇j η̇k + η̇i η̇j η̇k dλ ∂qi ∂ q̇j ∂ q̇k ∂ q̇i ∂ q̇j ∂ q̇k la parametrizzazione è data dalla (3.2.7) con v=v(λ)+δv(λ) in luogo di v=v(λ) Stefano Siboni 75 Università degli studi di Trento Corso di Meccanica razionale 2 nelle quali le derivate della lagrangiana si intendono calcolate in (λ, q + αη, q̇ + αη̇) e si è inoltre adottata la convenzione di somma sugli indici ripetuti. L’approssimazione di Taylor al secondo ordine in α con resto in forma di Lagrange porge allora, per θ = θ(α) ∈ (0, 1) opportuno, 2 dL 1 1 d3 L d L 2 L(q + αη) = L(q) + α+ (q + αη) α + (q + θαη) α3 (q + αη) 2 3 dα 2 dα 6 dα α=0 α=0 dove: ◦ ricordando la definizione (1.4) della variazione prima, vale dL α = δL(q, δq) = 0 , (q + αη) dα α=0 essendo per ipotesi q(λ) soluzione delle equazioni di Eulero-Lagrange; ◦ la derivata seconda corrisponde alla variazione seconda del funzionale L nella soluzione stazionaria q(λ) e con variazione δq(λ): d2 L (q + αη) α2 = δ 2 L(q, δq) ; 2 dα α=0 ◦ se per una funzione η(λ), C 2, a derivata non nulla e con estremi nulli in [λ1 , λ2 ], risulta δ 2 L(q, η) > 0, si avrà certamente che per ogni α ∈ R di modulo abbastanza piccolo vale la diseguaglianza L(q + αη) > L(q) . L’asserto segue dalla relazione 1 d3 L 1 2 (q + θαη) α3 = δ L(q, η) α2 + 2 6 dα3 1 2 1 d3 L = (q + θαη) α α2 δ L(q, η) + 2 6 dα3 L(q + αη) − L(q) = nella quale, se |α| è abbastanza piccolo, il secondo membro assume segno positivo per via della diseguaglianza 1 d3 L < 1 δ 2 L(q, η) (q + θαη) α 6 dα3 2 la cui validità è assicurata dalla continuità della derivata terza. Nel caso specifico delle geodetiche sul cilindro si ha δ 2 L(u, v, η1 , η2 ) > 0 per tutte le funzioni η1 , η2 di classe C 2 , con derivata diversa da zero e nulle agli estremi di [λ1 , λ2 ]. Per ogni α abbastanza vicino a zero le variazioni (3.2.8) soddisfano perciò L(u + αη1 , v + αη2 ) > L(u, v) . In questo senso le linee geodetiche sul cilindro circolare sono curve di lunghezza localmente minima a estremi fissi. Stefano Siboni 76 Università degli studi di Trento Corso di Meccanica razionale 2 3.3 Esempio: geodetiche sul cono circolare Come ulteriore esempio di caratterizzazione delle geodetiche si considera il caso di una superficie conica a base circolare. Il vertice e l’asse del cono circolare si identificano rispettivamente con l’origine O e l’asse coordinato Oz di una terna cartesiana ortogonale Oxyz. Come ben noto, la superficie conica completa non è regolare in quanto nel vertice O non risulta definibile alcun versore normale; ci si limiterà perciò alla sola falda z > 0 della superficie, rappresentabile per mezzo della parametrizzazione regolare ϕ : (u, v) ∈ R × R+ −−→ ϕ(u, v) ∈ R3 definita da x = v cos u y = v sin u z = kv (u, v) ∈ R × R+ dove k indica una costante positiva legata all’angolo di apertura del cono.(1) Una qualsiasi curva regolare C 2 sulla superficie sarà rappresentata per mezzo della parametrizzazione ϕ, sostituendo le variabili u ∈ R e v ∈ R+ con funzioni C 2 e a derivata non nulla della variabile λ ∈ [λ1 , λ2 ], intervallo reale arbitrario: P (λ) − O = v(λ) cos u(λ) ê1 + v(λ) sin u(λ) ê2 + kv ê3 . La derivata di P (λ) vale pertanto Ṗ = (v̇ cos u − v sin u u̇) ê1 + (v̇ sin u + v cos u u̇) ê2 + k v̇ ê3 ed ha modulo quadrato dato da Ṗ 2 = (1 + k 2 )v̇ 2 + v 2 u̇2 in modo che la lagrangiana da inserire nelle equazioni di Eulero-Lagrange assume la forma L = (1 + k 2 )v̇ 2 + v 2 u̇2 . (3.3.1) Le equazioni delle geodetiche sono perciò d ∂L ∂L − = 0 dλ ∂ u̇ ∂u e d ∂L ∂L − = 0. dλ ∂ v̇ ∂v Siccome la lagrangiana (3.3.1) non dipende esplicitamente dalla variabile u, alla prima equazione di Eulero-Lagrange è associato l’integrale di Beltrami ∂L v 2 u̇ = = α ∂ u̇ (1 + k 2 )v̇ 2 + v 2 u̇2 (1) (3.3.2) dalla relazione α= arctg(1/k), se α indica l’angolo di apertura del cono. Stefano Siboni 77 Università degli studi di Trento Corso di Meccanica razionale 2 dove α è una costante reale arbitraria. La seconda equazione di Eulero-Lagrange si scrive esplicitamente come (1 + k 2 )v̇ d v u̇2 − = 0. dλ (1 + k 2 )v̇ 2 + v 2 u̇2 (1 + k 2 )v̇ 2 + v 2 u̇2 Si possono distinguere due diverse tipologie di soluzioni. (i) Soluzioni, corrispondenti al valore α = 0 dell’integrale di Beltrami (3.3.2), si hanno per u(λ) = costante. In tal caso infatti la seconda equazione di Eulero-Lagrange si riduce a (1 + k 2 )v̇ d = 0 dλ (1 + k 2 )v̇ 2 ovvero d v̇ = 0 dλ |v̇| ed è soddisfatta per qualsiasi funzione v(λ) > 0 di classe C 2 e con v̇(λ) = 0 ∀ λ ∈ [λ1 , λ2 ], intervallo reale arbitrario. Le geodetiche corrispondenti sono segmenti delle semirette passanti per il vertice O che costituiscono la superficie — rigata — di ciascuna falda del cono circolare. (ii) Se α = 0, l’integrale di Beltrami porge u̇ = α (1 + k 2 )v̇ 2 + v 2 u̇2 v2 (3.3.3) per cui u̇ ha segno costante — lo stesso di α — ed è pertanto possibile adottare u come variabile indipendente in luogo di λ. La seconda equazione di Eulero-Lagrange diventa allora, dividendo membro a membro per u̇ e cambiando la variabile, α d 2 dv α (1 + k ) −v 2 = 0 2 du du v v e può porsi nella forma equivalente 1 1 d2 1 + = 0 2 2 du v 1+k v dalla quale si deduce che 1 1 = β cos √ u+γ v 1 + k2 ossia v = Stefano Siboni 1 1 β cos √ u+γ 1 + k2 (3.3.4) 78 Università degli studi di Trento Corso di Meccanica razionale 2 con β > 0 e γ ∈ R costanti assegnate. Le linee geodetiche di questo tipo sono descritte dalla parametrizzazione (3.3.4) con la u variabile monotonicamente in un intervallo assegnato. Causa la condizione v > 0, detto intervallo deve essere incluso in uno degli intervalli reali della forma: π π 2 2 1 + k 2πn − − γ < u < 1 + k 2πn + − γ , n ∈ Z , 2 2 dove il coseno in (3.3.4) è strettamente positivo. Esempi di linee geodetiche di questo genere sono illustrati nelle figure seguenti, dove la stessa superficie conica e la stessa geodetica sono rappresentate secondo diverse prospettive Vale la pena di notare che in realtà la costante positiva β che compare in (3.3.4) risulta correlata al valore α dell’integrale di Beltrami. Si ha infatti, sostituendo la soluzione (3.3.4) nella formula (3.3.3), " d 1 2 u̇2 2) + (1 + k = v2 dλ v β2 1 1 2 √ = α u̇2 β 2 cos2 √ u + γ + (1 + k 2 ) sin u + γ u̇2 = 1 + k2 1 + k2 1 + k2 u̇ = α = αβ|u̇| per cui β = 1 1 u̇ = sgnu̇ α |u̇| α in quanto deve essere u̇ = 0 e di segno costante nel proprio intervallo di definizione [λ1 , λ2 ]. 3.3.1 Osservazione: geodetiche come rette nello sviluppo piano del cono Le linee geodetiche del cono circolare sono suscettibili di una notevole interpretazione geometrica. È conveniente distinguere le geodetiche rigate e quelle del tipo (3.3.4). Stefano Siboni 79 Università degli studi di Trento Corso di Meccanica razionale 2 (i) Per una geodetica del tipo (3.3.4) è sempre possibile scegliere il parametro u(1) in modo che γ = 0 e la relazione (3.3.4) si riduca a π π 1 , con − 1 + k2 < u < 1 + k2 . v = 1 2 2 β cos √ u 1 + k2 Si introduce allora la trasformazione che “srotola” su un piano la superficie del cono — sviluppo piano della superficie conica — nel modo seguente.√ L’arco di √ circonferenza individuato sul cono da v > 0 costante e da u ∈ (− π2 1 + k 2 , π2 1 + k 2 ) viene √ mappato sulla semicirconferenza di centro O — il vertice del cono — e raggio v 1 + k 2 collocata nel piano tangente al cono lungo la retta di equazione u = 0. Indicando tale retta come asse Oξ, e definendo un secondo asse coordinato Oη come passante per il diametro della √ semicirconferenza immagine, il generico punto di coor√ dinate (u, v) ∈ (− π2 1 + k 2, π2 1 + k 2 ) × R+ sul cono viene mappato nel punto (ξ, η) del semipiano R+ × R secondo la trasformazione 1 2 2 √ u ξ = v 1 + k cos θ = v 1 + k cos 1 + k2 1 η = v 1 + k 2 sin θ = v 1 + k 2 sin √ u 1 + k2 √ dove θ = u/ 1 + k 2 rappresenta l’angolo al vertice che il raggio condotto per il punto immagine forma con la direzione positiva dell’asse Oξ — vedi figura. Nel semipiano dei punti (ξ, η) ∈ R+ × R cosı̀ costruito l’equazione della linea geodetica diventa 1 π π 1 2 √ 1 + k v cos u = 1 + k2 , − 1 + k2 < u < 1 + k2 , β 2 2 1 + k2 (1) pagando l’eventuale prezzo di una traslazione Stefano Siboni 80 Università degli studi di Trento Corso di Meccanica razionale 2 ossia ξ = 1 1 + k2 β ∀η ∈ R. Si conclude pertanto che la geodetica viene proiettata nel semipiano R+ × R come una retta parallela all’asse Oη. (ii) Le geodetiche “rettilinee” sul cono sono rappresentate nel semipiano degli (ξ, η) ∈ R+ × R come semirette passanti per il vertice O, in quanto per ciascuna di esse risulta 1 u ξ = v 1 + k 2 cos √ 2 1 1+ k ξ = v 1 + k 2 sin √ u 1 + k2 con u = u0 costante e v > 0 arbitrario, per cui 1 1 √ ξ sin √ u0 − η cos u0 = 0 1 + k2 1 + k2 che rappresenta precisamente l’equazione di una retta nel semipiano R+ × R di Oξη passante per l’origine O. 3.3.2 Osservazione: geodetiche con punti doppi (o autointersezioni) Le geodetiche non rettilinee, di rappresentazione v = 1 1 β cos √ u 1 + k2 , con − π π 1 + k2 < u < 1 + k2 , 2 2 presenta una autointersezione — o punto √ doppio √— se esistono due valori distinti u1 e π π 2 u2 del parametro u nell’intervallo (− 2 1 + k , 2 1 + k 2) di definizione della curva, che differiscono per un multiplo intero di 2π in modo da collocarsi nello stesso piano condotto dall’asse del cono e che presentano nel contempo lo stesso valore del corrispondente parametro v, e dunque della quota z, 1 1 1 1 cos √ u1 = cos √ u2 . β β 1 + k2 1 + k2 (3.3.5) Grazie alle formule di prostaferesi, l’equazione (3.3.5) può riscriversi nella forma u − u u + u 1 1 1 1 2 1 1 2 √ √ cos √ sin =0 u1 − cos √ u2 = 2 sin 2 2 1 + k2 1 + k2 1 + k2 1 + k2 e le sue soluzioni possono perciò determinarsi annullando separatamente o il primo o il secondo fattore del profotto fra seni. Stefano Siboni 81 Università degli studi di Trento Corso di Meccanica razionale 2 (a) Annullare il primo seno trigonometrico con u1 e u2 distinti significa richiedere che si abbia u2 − u1 = 2πq 1 + k 2 , q ∈ Z \ {0} √ in modo che la distanza fra u2 e u1 non può risultare inferiore a 2π 1 + k 2; la condizione non può evidentemente essere √ soddisfatta, in quanto l’ampiezza dell’intervallo di definizione di u1 , u2 è pari a π 1 + k 2 , ossia inferiore. (b) l’annullarsi del secondo seno trigonometrico nella formula di prostaferesi equivale alla condizione (3.3.6) u1 + u2 = 2πp 1 + k 2 , p ∈ Z , cui va affiancata la condizione di periodicità sulla variabile angolare u u1 − u2 = 2πn , n ∈ Z \ {0} . (3.3.7) Ne derivano cosı̀ le relazioni # $ u1 = π p 1 + k 2 + n # $ u2 = π p 1 + k 2 − n , p ∈ Z , n ∈ Z \ {0} . D’altra parte, è facile ricavare l’intervallo di definizione della somma u1 + u2 noto che sia quello delle variabili u1, u2 : − π π 1 + k 2 < u1 , u2 < 1 + k2 2 2 =⇒ −π 1 + k 2 < u1 + u2 < π 1 + k2 per cui la sola scelta possibile in (3.3.6) è p = 0 e quindi u1 + u2 = 0 ⇐⇒ u2 = −u1 . Dalla (3.3.7) si conclude che i punti doppi della geodetica si hanno per tutti gli u1 della forma u1 = πn , n ∈ Z \ {0} a condizione che risulti n∈ 1 1 − 1 + k2, 1 + k2 . 2 2 (3.3.8) Da quest’ultima prescrizione si vede come il numero dei punti doppi per le geodetiche complete dipenda unicamente dal parametro k e cresca all’aumentare di questo, ovvero al diminuire dell’angolo di apertura del cono. In particolare, il valore di k per il quale le √ geodetiche complete presentano √ almeno un √ punto doppio deve essere maggiore di 3, in modo che l’intervallo (− 12 1 + k 2 , 12 1 + k 2 ) contenga almeno un intero non nullo — conformemente alla (3.3.8). Stefano Siboni 82 Università degli studi di Trento Corso di Meccanica razionale 2 3.4 Esempio: geodetiche sulla sfera Per determinare le geodetiche di una superficie sferica di centro O e raggio R è possibile utilizzare due diverse metodologie: la prima opera direttamente in coordinate cartesiane e, benché si tratti di una procedura generale, risulta particolarmente vantaggiosa nella caratterizzazione del geodetiche sferiche; la seconda fa invece uso di una parametrizzazione della sfera in coordinate polari. 3.4.1 Geodetiche della sfera in coordinate cartesiane Le geodetiche della sfera direttamente in coordinate cartesiane si ricavano imponendo la stazionarietà, a estremi fissi, dell’integrale della lunghezza λ2 ẋ2 + ẏ 2 + ż 2 dλ (3.4.1) x2 + y 2 + z 2 − R2 = 0 . (3.4.2) L = λ1 con la condizione di vincolo Secondo quanto osservato nella sezione 1.8, ciò equivale a scrivere le equazioni di EuleroLagrange nelle variabili x, y, z con la lagrangiana efficace L (x, y, z, ẋ, ẏ, ż) = ẋ2 + ẏ 2 + ż 2 + µ(x2 + y 2 + z 2 − R2 ) , dove µ = µ(λ) è una funzione C 1 di λ da determinare — il moltiplicatore di Lagrange del problema. Si verifica immediatamente che le equazioni di Eulero-Lagrange associate alla lagrangiana L sono d ẋ − 2µx = 0 dλ ẋ2 + ẏ 2 + ż 2 d ẏ − 2µy = 0 2 + ẏ 2 + ż 2 dλ ẋ d ż − 2µz = 0 dλ ẋ2 + ẏ 2 + ż 2 e che introducendo l’ascissa curvilinea s della geodetica dette equazioni possono esprimersi nella forma equivalente 2 d x dλ = 2 µx 2 ds ds d2 y dλ (3.4.3) = 2 µy ds2 ds 2 d z = 2 dλ µ z . ds2 ds Posto P − O = x ê1 + y ê2 + z ê3 , l’equazione delle geodetiche (3.4.3) si riduce alla relazione vettoriale dλ d2 P (3.4.4) = 2 µ (P − O) 2 ds ds Stefano Siboni 83 Università degli studi di Trento Corso di Meccanica razionale 2 che formalmente presenta una struttura analoga alle equazioni del moto per un punto materiale in un campo di forze centrali. Moltiplicando vettorialmente membro a membro da sinistra la (3.4.4) per P − O si ottiene infatti l’equazione (P − O) ∧ d2 P dλ = (P − O) ∧ 2 µ (P − O) = 0 2 ds ds che in forza dell’identità(1) dP d2 P d (P − O) ∧ (P − O) ∧ = ds2 ds ds diventa d dP (P − O) ∧ = 0 ds ds e porge pertanto (P − O) ∧ dP = K ds vettore costante di R3 . Da notare che, per effetto del vincolo (P − O)2 − R2 = 0, il con K vettore P − O — raggio della sfera condotto dal punto P di questa — e il versore dP/ds — tangente alla geodetica e alla sfera in P — sono diversi da zero e fra loro ortogonali 2(P − O) · dP = 0, ds = 0 — e il vettore K è tangente alla sfera nel punto P della per cui è certamente K geodetica. Ne deriva che = (P − O) · (P − O) ∧ (P − O) · K dP = 0 ds = K1 ê1 + K2 ê2 + K3 ê3 e tornando alle coordinate cartesiane, ovvero, posto K K1 x + K2 y + K3 z = 0 che è l’equazione di un piano passante per il centro O della superficie sferica. E siccome le intersezioni fra la sfera e i piani passanti per il suo centro sono i cosiddetti cerchi massimi della sfera, si conclude che le geodetiche della sfera sono i suoi archi di cerchio massimo. La prova che le geodetiche giacciono su un piano passante per il centro O è molto simile alla dimostrazione della planarità delle traiettorie per il punto materiale in moto in un campo di forze centrali. (1) si noti in questo l’analogia con la derivazione della seconda equazione cardinale della dinamica, laddove d (P −O)∧ mP̈ = dt [(P −O)∧mṖ ], con O punto fisso Stefano Siboni 84 Università degli studi di Trento Corso di Meccanica razionale 2 3.4.2 Geodetiche della sfera in coordinate polari Si può rappresentare la superficie sferica mediante la parametrizzazione regolare x = R sin θ cos φ θ ∈ (0, π) , φ ∈ R , y = R sin θ sin φ z = R cos θ (3.4.5) dove θ e φ sono le usuali coordinate polari di colatitudine e longitudine. Lungo una generica curva regolare sulla superficie, parametrizzata da (3.4.5) con θ = θ(λ) e φ = φ(λ), λ ∈ [λ1 , λ2 ], si hanno le derivate prime ẋ = R(cos θ cos φ θ̇ − sin θ sin φ φ̇) ẏ = R(cos θ sin φ θ̇ + sin θ cos φ φ̇) ż = −R sin θ θ̇ ed il conseguente modulo quadrato ẋ2 + ẏ 2 + ż 2 = R2 (θ̇2 + sin2 θφ̇2 ) in modo che l’integrale della lunghezza diventa λ2 L = R(θ̇2 + sin2 θφ̇2 )1/2 dλ λ1 essendo, per una curva regolare, θ̇2 + sin2 θ φ̇2 > 0 ∀ λ ∈ [λ1 , λ2 ]. Omesso l’inessenziale fattore costante R, la lagrangiana efficace del sistema si riduce a L(θ, θ̇, φ̇) = (θ̇2 + sin2 θφ̇2 )1/2 e le geodetiche sono individuate da tutte e soltanto le soluzioni delle equazioni di EuleroLagrange d ∂L ∂L d ∂L ∂L = 0 = 0. (3.4.6) − − dλ ∂ φ̇ ∂φ dλ ∂ θ̇ ∂θ Poiché ∂L/∂φ = 0 dalla prima equazione segue l’integrale di Beltrami ∂L ∂ φ̇ = sin2 θ φ̇ (θ̇2 + sin2 θφ̇2 )1/2 = a, costante , (3.4.7) mentre la seconda delle equazioni (3.4.6) si scrive esplicitamente come θ̇ d sin θ cos θ φ̇2 − = 0. dλ (θ̇2 + sin2 θφ̇2 )1/2 (θ̇2 + sin2 θφ̇2 )1/2 (3.4.8) Conviene esaminare separatamente i casi di a = 0 e a = 0. Stefano Siboni 85 Università degli studi di Trento Corso di Meccanica razionale 2 (i) Integrale di Beltrami nullo Per a = 0 l’equazione (3.4.7) si riduce a sin2 θ φ̇ = 0 ⇐⇒ φ̇ = 0 in modo che la seconda equazione (3.4.8) diventa d θ̇ = 0 dλ |θ̇| e non potendo che risultare |θ̇| > 0 è identicamente soddisfatta. Tutte le funzioni φ = costante con θ variabile a piacere in (0, π) sono dunque soluzioni delle equazioni di Eulero-Lagrange ed individuano altrettante linee geodetiche della sfera. Si tratta dei meridiani tracciati sulla sfera, privati dei poli θ = 0 e θ = π, che devono essere esclusi per garantire la regolarità della parametrizzazione (3.4.5). (ii) Integrale di Beltrami diverso da zero Se a = 0, dalla (3.4.7) si deduce φ̇ = a 2 2 2 1/2 2 (θ̇ + sin θ φ̇ ) sin θ (3.4.9) e che pertanto φ̇ è di segno costante lungo tutta la soluzione. Ciò significa che φ(λ) è una funzione monotòna crescente, e perciò invertibile, di λ: essa costituisce un diffeomorfismo di [λ1 , λ2 ] su un opportuno intervallo chiuso e limitato della variabile φ. Per esprimere la geodetica è cosı̀ possibile usare φ come variabile indipendente in luogo di λ. Sostituendo la (3.4.9), la seconda equazione di Eulero-Lagrange diventa allora un’equazione differenziale nella funzione incognita θ(φ): a d dθ a − sin θ cos θ φ̇ = 0 φ̇ 2 dφ dφ sin θ sin2 θ nella quale i fattori non nulli a e φ si possono raccogliere e semplificare: d 1 dθ cos θ − = 0. dφ sin2 θ dφ sin θ (3.4.10) L’equazione ottenuta si può integrare esplicitamente notando che 1 dθ d cos θ = − dφ sin θ sin2 θ dφ per cui la (3.4.10) diventa Stefano Siboni d2 cos θ cos θ + = 0 dφ2 sin θ sin θ 86 Università degli studi di Trento Corso di Meccanica razionale 2 in cui è immediato riconoscere l’equazione di un oscillatore armonico di pulsazione unitaria ed elongazione cos θ/ sin θ. La relativa soluzione generale si scrive perciò cos θ = b cos(φ + c) , φ ∈ R , sin θ (3.4.11) con b e c costanti reali arbitrarie. Il risultato ottenuto si può interpretare conveneientemente dal punto di vista geometrico espandendo il secondo membro della (3.4.11) con la formula di somma del coseno cos θ = b cos c cos φ − b sin c sin φ sin θ e moltiplicando poi membro a membro per R sin θ R cos θ = b cos c R sin θ cos φ − b sin c R sin θ sin φ . Basta infatti sostituire le espressioni (3.4.5) per arrivare alla relazione fra le coordinate x, y, z: z = b cos c x − b sin c y che per l’arbitrarietà delle costanti b e c rappresenta un qualsiasi piano passante per il centro O ma non per l’asse Oz: la geodetica corrispondente si identifica con un qualsiasi arco di cerchio massimo che non coincida con un meridiano. Mettendo insieme i risultati (i) e (ii) si conclude che le linee geodetiche sulla sfera sono tutti e soli gli archi di cerchio massimo, in accordo con quanto già stabilito. 4. Catenaria omogenea. Come è noto la catenaria omogenea è la curva secondo la quale si dispone, all’equilibrio, una fune ideale omogenea inestendibile ad estremi fissi soggetta unicamente al proprio peso — curva funicolare. 4.1 Caratterizzazione mediante le equazioni intrinseche di equilibrio della fune Le equazioni intrinseche di equilibrio della fune si scrivono d dP T +f = 0 ds ds dove s è l’ascissa curvilinea, T > 0 rappresenta la tensione della fune e f indica la densità delle forze distribuite. Rispetto ad una terna cartesiana ortogonale Ox1 x2 x3 avente l’asse Ox3 orientato verticalmente verso l’alto, la densità delle forze peso assume la forma f = −λg ê3 in termini dell’accelerazione gravitazionale g > 0 e della densità lineare di massa λ della fune. Le equazioni intrinseche di equilibrio diventano perciò d dP T − λg ê3 = 0 ds ds Stefano Siboni 87 Università degli studi di Trento Corso di Meccanica razionale 2 e separando le singole componenti cartesiane si riducono al sistema d dx1 T = 0 ds ds d dx 2 T = 0 ds ds d dx3 T = λg . ds ds (4.1.1) Dalle prime due equazioni si deducono gli ovvi integrali primi T dx1 = p1 ds T dx2 = p2 . ds (4.1.2) Qualora le costanti p1 e p2 siano entrambe nulle la curva di equilibrio è una retta verticale, avendosi dx1 dx2 = 0 = 0 ds ds mentre dalla condizione di normalizzazione del versore tangente dx 2 1 ds + dx 2 2 ds + dx 2 3 ds = 1 segue che l’ascissa curvilinea coincide con la quota x3 a meno di un eventuale cambiamento di segno e di una traslazione, in quanto dx 2 ds = 1. In ogni caso la terza delle equazioni di equilibrio (4.1.1) si semplifica e prende la forma dT = λg dx3 dalla quale si deduce il campo di tensioni lungo la funicolare T (x3 ) = λgx3 + T (0) . Se viceversa le costanti p1 e p2 non sono entrambe nulle, è sempre possibile usare una delle variabili x1 o x2 come variabile indipendente in luogo dell’ascissa curvilinea s. Si supponga, per fissare le idee, che p1 = 0. Allora la prima delle (4.1.2) consente di riconoscere x1 (s) come funzione monotòna dell’ascissa curvilinea, avendo derivata di segno definito — lo stesso di p1 — p1 dx1 = . ds T Stefano Siboni 88 Università degli studi di Trento Corso di Meccanica razionale 2 Risulta cosı̀ definita la funzione inversa s = s(x1 ), di cui è inoltre facile verificare la regolarità C 2 : in tal modo l’ascissa x1 viene adottata come variabile indipendente al posto dell’ascissa curvilinea s. La seconda delle (4.1.2) diventa p2 dx2 = dx1 p1 e porta a concludere che la curva funicolare si colloca in un piano verticale p2 x1 + costante p1 x2 = come peraltro ci si aspetta a priori data la natura del campo di forze distribuite applicato — sistema di forze parallele. La terza equazione di equilibrio (4.1.1) si scrive invece d dx3 p1 = λg ds dx1 ossia dove dx1 d2 x3 λg = 2 ds dx1 p1 dx 2 dx 2 p 2 dx 2 ds 2 2 3 2 3 = 1+ + = 1+ + dx1 dx1 dx1 p1 dx1 per cui dx1 = ds sgnp1 p 2 dx 2 2 3 1+ + p1 dx1 e quindi λg sgnp1 d2 x3 = . 2 p 2 dx 2 dx1 p1 2 3 1+ + p1 dx1 Con la sostituzione x3 = 1+ p 2 2 p1 (4.1.3) z l’equazione (4.1.3) diventa 1 λg d2 z dz 2 dx2 = |p1 | 1 1+ dx1 " che è risolvibile per separazione di variabili ponendo preliminarmente dz/dx1 = ξ λg dξ 1 = 2 |p1 | 1 + ξ dx1 Stefano Siboni 89 Università degli studi di Trento Corso di Meccanica razionale 2 e quindi integrando l’equazione ottenuta λg 1 dξ = x1 + a 2 |p1 | 1+ξ per ottenere λg dz = ξ = sinh x1 + a . dx1 |p1 | Una ulteriore integrazione porge infine la soluzione cercata λg |p1 | cosh x1 + a + b z = λg |p1 | che nelle variabili originarie torna a scriversi come λg p21 + p22 p21 + p22 cosh x1 + a + b x3 = λg |p1 | |p1 | con a e b costanti reali arbitrarie. Si noti che la forma della soluzione generale ottenuta non cambia se il fattore positivo che moltiplica la costante arbitraria b viene omesso: λg p21 + p22 (4.1.4) cosh x1 + a + b . x3 = λg |p1 | 4.2 Caratterizzazione variazionale della catenaria Lo stesso risultato del punto precedente può ricavarsi imponendo che la fune, di estremi fissi e lunghezza assegnata, abbia energia potenziale gravitazionale stazionaria. L’energia potenziale — gravitazionale — della fune si ricava integrando la densità di energia potenziale gravitazionale ξ2 ξ2 Wg = [P (ξ) − O] · ê3 λg|P (ξ)| dξ = [P (ξ) − O] · ê3 λg[P (ξ)2 ]1/2 dξ ξ1 ξ1 mentre la condizione di inestendibilità si traduce nel constraint ξ2 ξ2 |P (ξ)| dξ = [P (ξ)2 ]1/2 dξ = L , ξ1 costante . ξ1 Si richiede dunque di calcolare il minimo ad estremi fissi del funzionale dell’energia potenziale Wg con il vincolo di L costante. Si tratta di determinare una funzione P (ξ), ξ ∈ [ξ1 , ξ2 ] che renda stazionario, ad estremi fissi, il funzionale ausiliario ξ2 Wg − µL = {[P (ξ) − O] · ê3 λg − µ}[P (ξ)2 ]1/2 dξ ξ1 Stefano Siboni 90 Università degli studi di Trento Corso di Meccanica razionale 2 in cui la costante scalare µ rappresenta il cosiddetto moltiplicatore di Lagrange del problema. La condizione di stazionarietà ad estremi fissi del funzionale Wg − µL equivale alle equazioni di Eulero-Lagrange d ∂L ∂L − = 0 dξ ∂ ẋi ∂xi i = 1, 2, 3 con Lagrangiana L(x1 , x2 , x3 , ẋ1 , ẋ2 , ẋ3 ) = (λgx3 − µ)[ẋ21 + ẋ22 + ẋ23 ]1/2 essendosi indicate con x1 = x1 (ξ), x2 = x2 (ξ), x3 = x3 (ξ) le coordinate cartesiane di P (ξ) e con ẋ1 = ẋ1 (ξ), ẋ2 = ẋ2 (ξ), ẋ3 = ẋ3 (ξ) le relative derivate prime rispetto alla variabile indipendente ξ. Si hanno due integrali primi di Poisson — o di Beltrami — associati alle variabili cicliche x1 ed x2 : ∂L ẋ1 = (λgx3 − µ) 2 2 ∂ ẋ1 [ẋ1 + ẋ2 + ẋ23 ]1/2 ∂L ẋ2 p2 = = (λgx3 − µ) 2 2 ∂ ẋ2 [ẋ1 + ẋ2 + ẋ23 ]1/2 p1 = (4.2.1) dai quali si deduce che p2 ẋ1 − p1 ẋ2 = 0 ⇐⇒ p2 x1 − p1 x2 = c , costante , ∀ ξ ∈ [ξ1 , ξ2 ] a conferma del fatto che la funicolare è una curva piana, completamente ubicata nel piano verticale di equazione p2 x1 − p1 x2 = c. Gli integrali p1 e p2 sono associati alle prime due equazioni di Eulero-Lagrange, per i = 1, 2 rispettivamente. La terza equazione vale invece ẋ3 d (λgx3 − µ) 2 − λg[ẋ21 + ẋ22 + ẋ23 ]1/2 = 0 dξ [ẋ1 + ẋ22 + ẋ23 ]1/2 ed in termini dell’ascissa curvilinea s definita da ds = [ẋ21 + ẋ22 + ẋ23 ]1/2 dξ si esprime nella forma equivalente dx3 d (λgx3 − µ) = λg ds ds (4.2.2) Usando s come variabile indipendente le equazioni (4.2.1) diventano infine p1 = (λgx3 − µ) Stefano Siboni dx1 ds p2 = (λgx3 − µ) dx2 . ds (4.2.3) 91 Università degli studi di Trento Corso di Meccanica razionale 2 Se p1 e p2 assumono entrambe valore nullo, le (4.2.3) implicano che x1 e x2 si mantengano costanti lungo l’intera curva di equilibrio, che pertanto costituisce un segmento di retta verticale. La circostanza più interessante ricorre quando (p1 , p2 ) = (0, 0). Si supponga, per fissare le idee, che p1 = 0. Per le (4.2.3) lungo la funicolare deve aversi dx1 = 0 ds λgx3 − µ = 0 e quindi p1 dx1 = ds λgx3 − µ di segno costante per via della continuità delle funzioni dx1 /ds e λgx3 − µ. È dunque possibile utilizzare x1 come variabile indipendente in luogo dell’ascissa curvilinea s e scrivere la seconda delle (4.2.3) come p2 = (λgx3 − µ) dx2 dx1 dx2 = p1 ds dx1 dx1 mentre per la (4.2.2) risulta dx3 dx1 dx1 d = λg (λgx3 − µ) ds dx1 dx1 ds ossia p1 d dx3 p1 = λg λgx3 − µ dx1 dx1 e quindi, isolando la derivata a primo membro λ2 g 2 µλg d2 x3 = x3 − 2 . 2 2 dx1 p1 p1 Di questa equazione del secondo ordine, lineare a coefficienti costanti non omogenea, la soluzione generale si esprime nella forma λg x3 = a + c1 e |p1 | x1 λg − |p x | 1 + c2 e 1 dove c1 , c2 sono costanti reali arbitrarie e la costante a è determinata come soluzione particolare µλg λ2 g 2 a− 2 0 = 2 p1 p1 risultando perciò a = Stefano Siboni µ p21 µλg 2 = 2 2 λ g p1 λg 92 Università degli studi di Trento Corso di Meccanica razionale 2 in modo che la soluzione generale dell’equazione diventa x3 = λg µ x − λg x + c1 e |p1 | 1 + c2 e |p1 | 1 . λg (4.2.4) In realtà le costanti c1 e c2 non possono assegnarsi a piacere in quanto la variabile indipendente originaria, s, ha il significato geometrico di una ascissa curvilinea e deve perciò verificare la condizione di normalizzazione del versore tangente dx 2 dx 2 dx 2 1 2 3 1+ = + 1 = ds dx1 dx1 2 λg λ2 g 2 |pλg| x1 p21 p22 − |p x1 | − c2 e 1 = 1 + 2 + 2 c1 e 1 = (λgx3 − µ)2 p1 p1 2 2λg 2λg p21 + p22 λg λg 2 |p1 | x1 2 − |p1 | x1 x − |p x1 2 2 2 2 |p1 | 1 | + c e + c e − 2c1 c2 − c2 e 1 p1 + p2 + λ g c1 e 1 2 λ2 g 2 = , = 2 2λg 2λg λg λg 2 |p1 | x1 2 − |p1 | x1 x − |p x1 2 2 |p1 | 1 | c e + c e + 2c c 1 2 λ g c1 e + c2 e 1 1 2 per cui p21 + p22 − 2c1 c2 = 2c1 c2 λ2 g 2 ed infine c1 c2 = p21 + p22 > 0. 4λ2 g 2 La soluzione (4.2.4) ha cosı̀ una forma più particolare " " c1 |pλg| x1 c2 − |pλg| x1 µ √ e 1 + e 1 x3 = + c1 c2 = λg c2 c1 " " µ p21 + p22 c1 |pλg| x1 c2 − |pλg| x1 e 1 + e 1 = + λg 2λg c2 c1 (4.2.5) per via del fatto che le costanti c1 c2 hanno prodotto pari ad una costante positiva fissata. Questo risultato può porsi facilmente nella forma (4.1.4) con la sostituzione " " c1 c2 a = e ⇐⇒ = e−a , a ∈ R, c2 c1 sicché la (4.2.5) si riduce a λg λg p21 + p22 |pλg| x1 +a p21 + p22 µ µ −( x +a) + e 1 + cosh x1 + a = + e |p1 | 1 x3 = λg 2λg λg λg |p1 | e basta identificare la costante arbitraria µ/λg con la costante b, del pari arbitraria, per ottenere l’espressione (4.1.4). La caratterizzazione variazionale della catenaria omogenea è equivalente a quella basata sulle equazioni intrinseche di equilibrio dei fili. Stefano Siboni 93 Università degli studi di Trento Corso di Meccanica razionale 2 5. Equilibrio di una fune ideale omogenea in un campo conservativo Si supponga che una fune omogenea ideale, perfettamente flessibile e inestendibile, ad estremi fissati, sia soggetta ad un campo di forze distribuite posizionali conservative di densità ∂W (x) f(x) = − ∂x essendo W (x) la densità di energia potenziale di dette sollecitazioni. Le equazioni intrinseche di equilibrio della fune si scrivono allora d dxi ∂W T − = 0 ds ds ∂xi i = 1, 2, 3 ossia, una volta eseguita la derivata del prodotto, d2 xi dT dxi ∂W +T 2 − (x) = 0 ds ds ds ∂xi i = 1, 2, 3 . Moltiplicando membro a membro per dxi /ds le equazioni precedenti e sommando in i = 1, 2, 3 si ottiene 3 3 3 dxi dT dxi dxi d2 xi dxi ∂W (x) +T − = 0 2 ds i=1 ds ds ds ds ∂xi ds i=1 i=1 ma poiché 3 dxi dxi = 1 ds ds i=1 mentre 3 d 1 dxi 2 = = 0, ds ds 2 ds 3 d2 xi dxi i=1 3 ∂W i=1 ∂xi ds2 (x) i=1 dxi dW (x) = , ds ds si conclude che dW dT − = 0 ds ds e quindi che lungo la funicolare deve aversi T (s) − W [x(s)] = −µ ∀ s ∈ [0, L] per una costante reale µ opportuna, essendo L la lunghezza complessiva della fune. La tensione della fune coincide con la densità di energia potenziale, a meno di una costante additiva che dipende dalle condizioni iniziali — o al contorno. Le equazioni di equilibrio possono perciò porsi nella forma dxi ∂W d [W (x) − µ] − (x) = 0 ds ds ∂xi Stefano Siboni i = 1, 2, 3 (5.1) 94 Università degli studi di Trento Corso di Meccanica razionale 2 per una appropriata costante µ ∈ R. Di questo risultato si può dare una caratterizzazione variazionale, considerando l’energia potenziale totale Wγ della fune che viene ricavata per integrazione della densità W (x). Se x(ξ), ξ ∈ [ξ1 , ξ2 ], è la parametrizzazione regolare del supporto γ della fune, si ha ξ2 Wγ = dx W [x(ξ)] (ξ) dξ . dξ ξ1 Di questa energia potenziale si vuole determinare un estremo ad estremi fissi imponendo la condizione che la lunghezza totale della fune ξ2 dx L = (ξ) dξ dξ ξ1 si mantenga costante. Ciò equivale ad individuare un estremo del funzionale ξ2 dx Wγ − µL = [W [x(ξ)] − µ] (ξ) dξ dξ (5.2) ξ1 dove la costante µ costituisce il moltiplicatore di Lagrange del problema. Posto al solito ẋ = dx/dξ, la lagrangiana formale associata al funzionale (5.2) vale L(x, ẋ) = [W (x) − µ](ẋ2 )1/2 per cui la condizione di stazionarietà δ(Wγ − µL) del funzionale equivale alle equazioni di Eulero-Lagrange d ∂L ∂L = 0 i = 1, 2, 3 − dξ ∂ ẋi ∂xi dove dxi ∂L = [W (x) − µ](ẋ2 )−1/2 ẋi = [W (x) − µ] ∂ ẋi ds dxi d ∂W d ∂L ∂L [W (x) − µ] = = (x)(ẋ2 )1/2 dξ ∂ ẋi dξ ds ∂xi ∂xi e quindi dxi ∂W d (x) = 0 [W (x) − µ] − ds ds ∂xi i = 1, 2, 3 . (5.3) Appare evidente che queste equazioni coincidono con quelle già ricavate partendo direttamente dalle equazioni intrinseche di equilibrio della fune. Stefano Siboni 95 Università degli studi di Trento Corso di Meccanica razionale 2 6. Il problema della brachistocrona. Il primo, e dunque il più classico, dei problemi variazionali è quello detto della brachistocrona, che storicamente venne risolto ricorrendo al principio di Fermat dell’ottica geometrica. In queste note il problema verrà affrontato utilizzando i metodi standard del calcolo delle variazioni. 6.1 Formulazione del problema fisico Un punto materiale pesante è vincolato a scorrere lungo una curva liscia che congiunge due punti fissati in un piano verticale. Il punto parte con velocità nulla dal primo estremo, quindi si muove lungo la curva sotto l’azione del proprio peso e della reazione vincolare. Si vuole determinare per quale curva di estremi assegnati il tempo occorrente al punto materiale per passare dal primo al secondo estremo risulta minimo. Tale curva risulta definita ed univocamente determinata dalle posizioni estreme del moto ed è nota come brachistocrona — letteralmente, dal greco, linea del tempo più breve. 6.2 Curve ammissibili Nel piano Oxy, con asse verticale Oy, un punto materiale pesante P di massa m è vincolato a scorrere senza attrito lungo una curva γ di estremi fissati. La curva si assume regolare e C 2 , con parametrizzazione λ ∈ [λ1 , λ2 ] −−−−−−−−−−−→ (x(λ), y(λ)) ∈ R2 in modo che dx dλ (λ), dy (λ) = (0, 0) dλ ∀ λ ∈ [λ1 , λ2 ] . Senza perdita di generalità il primo estremo di γ viene identificato con l’origine del sistema di coordinate (x(λ1 ), y(λ1 )) = (0, 0) mentre il secondo estremo viene indicato per brevità come (x(λ2 ), y(λ2 )) = (a, f(a)) , Stefano Siboni 96 Università degli studi di Trento Corso di Meccanica razionale 2 potendosi sempre assumere a ≥ 0 — ricorrendo alla eventuale inversione dell’asse delle ascisse, se necessario. La lagrangiana del sistema ideale si scrive m dx 2 dy 2 2 L = + λ̇ − mgy(λ) 2 dλ dλ e l’equazione pura del moto è quella di Lagrange d ∂L ∂L = 0 − dt ∂ λ̇ ∂λ di cui siamo interessati alla soluzione di condizioni iniziali (λ(0), λ̇(0)) = (λ1 , 0). Tale soluzione deve accedere alla posizione finale (x(λ2 ), y(λ2 )) = (a, f(a)) in un intervallo di tempo finito. La condizione necessaria e sufficiente affinché questa proprietà risulti soddisfatta si determina applicando i criteri di Weierstrass all’energia potenziale gravitazionale W (λ) = mgy(λ) , λ ∈ [λ1 , λ2 ] e consiste nel richiedere che: (i) sia y(λ) < 0 ∀ λ ∈ (λ1 , λ2 ). Se infatti esistesse un λ ∈ (λ1 , λ2 ) tale che y(λ ) = 0, allora per y (λ ) = 0 la soluzione ammetterebbe in λ = λ un punto di meta asintotica, per cui la soluzione considerata non passarebbe per l’estremo B. In modo analogo, per y (λ ) > 0 ricorre in λ = λ un punto di inversione del moto. Anche in questo secondo caso la soluzione considerata non potrebbe transitare per l’estremo B; (ii) debba aversi y(λ1 ) = 0, in conformità alle condizioni iniziali, ed inoltre y (λ1 ) < 0. Qualora fosse y (λ1 ) > 0, la funzione y(λ) assumerebbe segno positivo in un intorno destro di λ2 e l’estremo B risulterebbe inaccessibile al moto, mentre per y (λ1 ) = 0 la soluzione si ridurrebbe alla quiete nel primo estremo O, ancora senza alcuna possibilità di accesso all’estremo finale; (iii) valga y(λ2 ) ≤ 0, con y (λ2 ) > 0 per y(λ2 ) = 0. Se si avesse y (λ2 ) = 0 il moto presenterebbe una meta asintotica in λ = λ2 ed il tempo di percorrenza della traiettoria risultarebbe infinito. Stefano Siboni 97 Università degli studi di Trento Corso di Meccanica razionale 2 Le traiettorie ammissibili sono quindi quelle per le quali la funzione y(λ) ha uno degli andamenti illustrati nella figura seguente: 6.3 Tempo di percorrenza della curva Il teorema di conservazione dell’energia meccanica porge l’equazione m m m 2 v(λ)2 + mgy(λ) = v(λ1 )2 + mgy(λ1 ) = 0 + mg0 = 0 2 2 2 nella quale v(λ) indica la velocità istantanea scalare del punto in una generica posizione, individuata da λ, lungo la traiettoria γ. Tale velocità scalare può pertanto scriversi in funzione della posizione λ v(λ) = 2g −y(λ) e consente di esprimere il tempo di percorrenza della traiettoria per mezzo dell’integrale definito " λ2 λ2 dx 2 dy 2 1 ds(λ) 1 √ = √ T = + dλ (6.3.1) v(λ) −y dλ dλ 2g λ1 λ1 dove l’elemento infinitesimo di lunghezza di γ è definito come " ds(λ) = dx 2 dy 2 + dλ . dλ dλ 6.4 Condizione di stazionarietà per il tempo di percorrenza L’integrale del tempo di percorrenza può essere interpretato come un funzionale non lineare delle funzioni incognite x(λ) e y(λ). Più specificamente, può esprimersi nella forma 1 T = √ 2g λ2 F(ẋ, ẏ, y) dλ (6.4.1) λ1 Stefano Siboni 98 Università degli studi di Trento Corso di Meccanica razionale 2 a patto di porre per brevità dx = ẋ dλ e di introdurre la funzione F(ẋ, ẏ, y) = dy = ẏ dλ ẋ2 + ẏ 2 1 1 √ = (ẋ2 + ẏ 2 ) 2 (−y)− 2 −y (6.4.2) definita nell’intero intervallo di integrazione [λ1 , λ2 ] esclusi al più gli estremi — la funzione è formalmente indefinita in λ1 in quanto y(λ1 ) = 0 per ipotesi, mentre può esserlo o meno nel secondo estremo λ2 , secondo che sia y(λ2 ) = 0 o y(λ2 ) < 0. Condizione necessaria perchè la curva considerata (x(λ), y(λ)) sia quella con il tempo di percorrenza minimo fra tutte le curve di uguali estremi è che si annulli la variazione prima del funzionale ad estremi fissi 1 δT = √ 2g λ2 λ2 d ∂F 1 d ∂F ∂F ∂F − δx dλ + √ − δy dλ ∂x dλ ∂ ẋ 2g ∂y dλ ∂ ẏ λ1 (6.4.3) λ1 per ogni variazione (δx(λ), δy(λ)) della parametrizzazione (x(λ), y(λ)), che sia C 2 in [λ1 , λ2 ] e tale che (δ(λ1 ), δ(λ1 )) = (δ(λ2 ), δ(λ2 )) = (0, 0). Condizione equivalente è che esista una soluzione in λ ∈ (λ1 , λ2 ) delle equazioni di Eulero-Lagrange d ∂F ∂F d ∂F ∂F − = 0 − = 0 (6.4.4) dλ ∂ ẋ ∂x dλ ∂ ẏ ∂y che soddisfi le condizioni al contorno assegnate: (x(λ1 ), y(λ1 )) = (0, 0) (x(λ2 ), y(λ2 )) = (a, f(a)) . È opportuno sottolineare come l’integrando nel funzionale (6.4.1) non sia di classe C 2 nell’intero dominio di integrazione [λ1 , λ2 ], causa la singolarità integrabile certamente presente in λ = λ1 e quella che potrebbe altresı̀ ricorrere in λ = λ2 , qualora fosse y(λ2 ) = 0. Apparentemente viene perciò meno il requisito di regolarità che consente di esprimere la variazione prima di T per mezzo della relazione (6.4.3). In realtà l’argomento che conduce alla (6.4.3) ed alle susseguenti equazioni di Eulero-Lagrange è ancora applicabile nell’intervallo aperto (λ1 , λ2 ), a patto di considerare variazioni δx(λ) e δy(λ) con supporto compatto incluso nello stesso intervallo (λ1 , λ2 ) — mentre potrebbero incontrarsi problemi nel caso di variazioni il cui supporto comprenda l’uno o l’altro degli estremi di integrazione. Sostituendo la (6.4.2) in (6.4.4) in modo si ottengono le equazioni di Eulero-Lagrange in forma esplicita: 1 d ẋ = 0 (6.4.5a) √ dλ ẋ2 + ẏ 2 −y 1 2 d ẏ 1 3 √ = ẋ + ẏ 2 (−y)− 2 . (6.4.5b) 2 2 dλ −y 2 ẋ + ẏ Stefano Siboni 99 Università degli studi di Trento Corso di Meccanica razionale 2 6.5 Soluzione delle equazioni di Eulero-Lagrange L’equazione (6.4.5a) individua l’integrale primo ẋ 1 √ px (x, y, ẋ, ẏ) = ẋ2 + ẏ 2 −y (6.5.1) per cui lungo tutte le soluzioni delle equazioni di Eulero-Lagrange vale 1 √ = c = costante . ẋ2 + ẏ 2 −y ẋ Conseguentemente, devono distinguersi tre diversi casi: (i) se c > 0 si ha che ẋ > 0, in modo che l’ascissa è una funzione monotòna crescente del parametro λ. In particolare, dovrà aversi a > 0; (ii) se c = 0 si deduce che ẋ = 0 identicamente nell’intervallo [λ1 , λ2 ], sicché x(λ) si mantiene costante nello stesso dominio. In virtù della condizione costante x(λ1 ) = 0 si conclude che x(λ) = 0 ∀ λ ∈ [λ1 , λ2 ]: ciò significa che la curva γ si dispone lungo l’asse verticale Oy. (iii) se infine c < 0 risulta invece ẋ < 0 ∀ λ ∈ [λ1 , λ2 ]. x(λ) è perciò una funzione monotòna decrescente, con a < 0; I casi (i) e (iii) sono sostanzialmente equivalenti, potendosi ricondurre l’uno all’altro mediante una semplice inversione dell’asse delle ascisse; ci si può pertanto limitare ad esaminare in dettaglio il solo caso (i). A parte va esaminato il caso (ii). Caso (i) Essendo ẋ > 0 ∀ λ ∈ [λ1 , λ2 ] la funzione x(λ) risulta monotòna crescente ed è lecito considerare x come variabile indipendente in luogo del parametro λ. L’ordinata y si esprimerà dunque come funzione di x: y = f(x) = y[λ(x)] derivabile con derivata prima ẏ dy (x) = f (x) = . dx ẋ L’integrale primo (6.5.1) diventa perciò Px [x, f(x), f (x)] = 1 1 + f (x)2 1 −f(x) mentre l’equazione (6.4.5b) assume la forma 1 f (x) 1 3 d = 1 + f (x)2 [−f(x)]− 2 2 dx 2 1 + f (x) −f(x) Stefano Siboni 100 Università degli studi di Trento Corso di Meccanica razionale 2 ossia, eseguendo la derivata a primo membro e semplificando, 1 [−f(x)] f (x) − [1 + f (x)2 ] = 0 2 (6.5.2) grazie all’identità f (x) 1 d = dx 1 + f (x)2 −f(x) 1 ∂ 2 −1/2 −1/2 2 −1/2 − (−f)−3/2 (−f ) = (1 + f ) (−f) + f (1 + f ) f f = ∂f 2 1 = (1 + f 2 )−3/2 f (−f)−1/2 + f 2 (1 + f 2 )−1/2 (−f)−3/2 . 2 L’equazione (6.5.2) è immediatamente riducibile alla forma normale f = 1 1 + f 2 2 −f e può ovviamente esprimere come sistema normale equivalente del primo ordine nelle variabili dipendenti f ed h = f : f = h (f, h) ∈ R− × R (6.5.3) 1 1 + h2 h = 2 −f che ammette l’integrale primo πx (f, h) = √ 1 1 √ 1 + h2 −f per cui lungo le soluzioni di (6.5.3) deve aversi 1 1 √ √ = c 2 −f 1+h ossia 1 (6.5.4) c2 con c costante positiva. La seconda delle (6.5.3) può allora essere ridotta ad una equazione nella sola variabile h: c2 1 1 + h2 = (1 + h2 )2 h = (6.5.5) 2 −f 2 (1 + h2 )(−f) = dalla quale è subito evidente che la slope h della curva estremale risulta una funzione monotòna crescente: la brachistocrona è una curva convessa. Dalla (6.5.4) appare peraltro chiaro che essendo c2 >, f(0) = 0 e f(x) > 0 ∀ x ∈ (0, a), deve aversi 1 1 − 1 = +∞ 2 x→0+ c −f(x) lim h(x)2 = lim x→0+ Stefano Siboni 101 Università degli studi di Trento Corso di Meccanica razionale 2 per cui lim f (x) = lim h(x) = −∞ . x→0+ (6.5.6) x→0+ La (6.5.5) si risolve per separazione di variabili mediante la formula c2 x = 2 f (x) f (0+) dh = (1 + h2 )2 f (x) −∞ dh (1 + h2 )2 ∀ x ∈ (0, a) dove l’integrale a secondo membro si calcola esplicitamente introducendo il cambiamento di variabili h → ξ definito da ξ ∈ (−π/2, ξ+ ) −−−−−−→ h = tgξ ∈ (−∞, f (a)) , ξ+ = tg−1 [f (a)] , che porge c2 x = 2 ξ −π/2 ξ = −π/2 1 1 dξ = (1 + tg2 ξ)2 cos2 ξ ξ 1 cos ξ dξ = cos2 ξ ξ 4 −π/2 cos2 ξ dξ = −π/2 ξ 1 sin 2ξ sin 2ξ π 1 + cos 2ξ 1 dξ = ξ+ ξ+ + = 2 2 2 2 2 2 −π/2 e quindi 1 (2ξ + sin 2ξ + π) , ξ ∈ (−π/2, ξ+ ) . (6.5.7) 2c2 La componente y(ξ) della parametrizzazione si ricava integrando l’espressione della derivata x = dx 1 dy 1 = f [x(ξ)] (ξ) = tgξ 2 (2 + 2 cos 2ξ) = tgξ 2 (1 + cos 2ξ) = dξ dξ 2c c 1 1 1 = 2 tgξ 2 cos2 ξ = 2 2 sin ξ cos ξ = 2 sin 2ξ c c c dalla quale segue ξ y(ξ) = y(−π/2) + −π/2 ξ 1 1 1 cos 2ξ sin 2ξ dξ = 0 + 2 − = (−1 − cos 2ξ) 2 c c 2 2c2 −π/2 ∀ ξ ∈ (−π/2, ξ+ ). Prolungando il risultato, per continuità, anche agli estremi ξ = −π/2 e ξ = ξ+, la parametrizzazione della brachistocrona si scrive pertanto 1 (2ξ + sin 2ξ + π) x = 2c2 (6.5.8) ξ ∈ [−π/2, ξ+ ] . 1 y = (−1 − cos 2ξ) 2c2 Stefano Siboni 102 Università degli studi di Trento Corso di Meccanica razionale 2 Si tratta di determinare i parametri c > 0 e ξ+ ∈ (−π/2, π/2] usando le coordinate del secondo estremo 1 a = 2 (2ξ+ + sin 2ξ+ + π) 2c 1 f(a) = (−1 − cos 2ξ+) . 2c2 Il parametro ξ+ è specificato univocamente dal quoziente delle due equazioni: 1 + cos 2ξ+ −f(a) = := Ψ(ξ+ ) a 2ξ+ + sin 2ξ+ + π (6.5.9) dal momento che la funzione Ψ a secondo membro risulta monotòna decrescente nell’intervallo [−π/2, π/2], con codominio [0, +∞), come illustrato nel grafico seguente La costante c > 0 viene infine calcolata dall’ascissa della parametrizzazione: " c = 1 (2ξ+ + sin 2ξ+ + π) . 2a (6.5.10) La curva che rende stazionario il tempo di percorrenza è dunque individuata univocamente dai punti iniziale e finale della traiettoria, nel caso considerato che i punti in questione non siano allineati lungo una retta verticale — a = 0. La brachistocrona cosı̀ ottenuta è suscettibile di una interpretazione geometrica molto semplice, potendosi identificare con un arco di cicloide di parametri opportunamente definiti. La cicloide è definita come la curva descritta da un punto fissato di una circonferenza che rotola senza strisciare su una retta assegnata. Scelto l’asse orizzontale Ox come retta di rotolamento e collocata una circonferenza Γ di raggio r al di sotto di questa, se si indica con θ l’angolo di rotazione della circonferenza le equazioni Stefano Siboni x = rθ − r sin θ = r(θ − sin θ) y = −r + r cos θ = r(−1 + cos θ) ∀ θ ∈ [0, 2π] (6.5.11) 103 Università degli studi di Trento Corso di Meccanica razionale 2 parametrizzano la cicloide descritta dal punto di Γ che occupa l’origine del sistema di coordinate per θ = 0 — vedi figura. La parametrizzazione (6.5.11) della cicloide si riconduce a quella (6.5.8) della brachistocrona identificando il raggio r della circonferenza generatrice con la costante positiva 1/2c2 ed introducendo in luogo dell’angolo di rotazione θ ∈ [0, 2π] la variabile ξ ∈ [−π/2, π/2] definita da θ = π + 2ξ . Il tempo di percorrenza della brachistocrona si ottiene sostituendo la parametrizzazione (6.5.8) nell’espressione (6.3.1), che diventa — con λ = ξ — Tmin 1 = √ 2g 1 = √ 2g 1 = √ 2g ξ+ −π/2 1 √ −y ξ+ " −π/2 ξ+ −π/2 dx 2 dξ 1 + dy 2 dξ " dξ = 1 1 (1 + cos 2ξ)2 + 4 sin2 2ξ dξ = 4 c c 1 (1 + cos 2ξ) 2c2 " 1 2 π 2 dξ = ξ+ + c c g 2 con le costanti ξ+ ∈ [−π/2, π/2] e c > 0 specificate da (6.5.9) e (6.5.10). Caso (ii) Nell’ipotesi che sia c = 0 l’individuazione della brachistocrona è molto più semplice rispetto al caso precedente. Dalla (6.4.5a) si ha infatti che ẋ(λ) = 0 ∀ λ ∈ (λ1 , λ2 ), mentre l’equazione (6.4.5b) si riduce ad una identità a patto che risulti ẏ(λ) = 0 ∀ λ ∈ (λ1 , λ2 ). Conseguentemente: − deve risultare x(λ) = a ∀ λ ∈ [λ1 , λ2 ]; − y(λ) deve essere una funzione monotòna in [λ1 , λ2 ]. In effetti, dovendosi avere y(λ1 ) = 0 e y(λ) < 0 ∀ λ ∈ (λ1 , λ2 ), la funzione y(λ) dovrà assumersi monotòna decrescente. Stefano Siboni 104 Università degli studi di Trento Corso di Meccanica razionale 2 Si conclude che la brachistocrona è il segmento di retta verticale che congiunge i due estremi assegnati. Il tempo di percorrenza della traiettoria viene ricavato, al solito, facendo uso della definizione (6.3.1), che diventa Tmin 1 = √ 2g λ2 λ1 1 1 2 √ ẋ + ẏ 2 dλ = √ −y 2g λ2 λ1 |ẏ| 1 √ dλ = √ −y 2g λ2 λ1 −ẏ √ dλ = −y " " λ2 2 2 1 = −y(λ2 ) − −y(λ1 ) = − y(λ2 ) = √ 2 −y(λ) g g 2g λ1 e corrisponde al tempo di caduta di un grave soggetto all’accelerazione g che parte dalla quiete e percorre una distanza −y(λ2 ) lungo la verticale. 6.6 Verifica della condizione di minimo locale Nel caso di a = 0 — brachistocrona in senso proprio — si può verificare agevolmente che la curva estremale corrisponde effettivamente ad un minimo relativo forte per il funzionale (6.3.1) del tempo di percorrenza, ad estremi fissi. Scegliendo direttamente l’ascissa x come variabile indipendente il funzionale si scrive infatti: 1 T = √ 2g a a 1 + f (x)2 1 dx = √ F[f(x), f (x)] dx 2g −f(x) 0 0 in termini della funzione densità F[f(x), f (x)] = 1 + f (x)2 . −f(x) Per una qualsiasi funzione η(x), di classe C 2 nell’intervallo [0, a] e a supporto compatto nell’interno dello stesso intervallo, e ∀ α ∈ R, la variazione prima del campo f(x) è definita da δf(x) = αη(x) , x ∈ (0, a) in modo che si può scrivere 1 T (α) = √ 2g a 1 F[f(x)+αη(x), f (x)+αη (x)] dx = T (0)+δT + δ 2 T +o(α2 ) 2 (α → 0) 0 dove: • T (0) rappresenta il valore di T lungo la curva estremale T (0) = Tmin ; Stefano Siboni 105 Università degli studi di Trento Corso di Meccanica razionale 2 • δT è la variazione prima del funzionale, ossia a dT d (α) δT = α = α F[f(x) + αη(x), f (x) + αη (x)] dx = dα dα α=0 α=0 a = 0 d ∂F ∂F − δf(x) dx = 0 ; ∂f dx ∂f 0 • δ 2 T indica la variazione seconda del funzionale e vale d2 δ T = α dα2 2 a 2 a = α 2 F[f(x) + αη(x), f (x) + αη (x)] dx 0 = α=0 ∂2F ∂2F ∂2F 2 2 η(x) + 2 η(x)η (x) + 2 η (x) dx = ∂f 2 ∂f∂f ∂f 0 a = 0 ∂2F ∂2F 2 ∂2F 2 δf(x) + 2 δf(x)δf (x) + 2 δf (x) dx ∂f 2 ∂f∂f ∂f ∂2F ∂f 2 ( δf(x) δf (x) ) ∂2F ∂f∂f ∂2F ∂f∂f δf(x) dx = = ∂2F δf (x) 0 ∂f 2 a δf(x) dx . = ( δf(x) δf (x) ) HF (f, f ) δf (x) 0 a Nella fattispecie un calcolo diretto mostra che 3 ∂2F = (1 + f 2 )1/2 (−f)−5/2 2 ∂f 4 2 1 ∂ F = (1 + f 2 )−1/2 f (−f)−3/2 ∂f∂f 2 2 ∂ F = (1 + f 2 )−3/2 (−f)−1/2 ∂f 2 in modo che la matrice delle derivate seconde diventa 3 1 (1 + f 2 ) − f 2 HF (f, f ) = (−f)−5/2 (1 + f 2 )−1/2 4 1 2 −1 2 − f (1 + f ) (−f) 2 Stefano Siboni 106 Università degli studi di Trento Corso di Meccanica razionale 2 con determinante e traccia strettamente positive nell’intero intervallo aperto (0, a): det HF (f, f ) = trHF (f, f ) = 3 1 1 (−f)2 − (−f)2 = (−f)2 4 4 2 3 (1 + f 2 ) + (1 + f 2 )−1 (−f)2 . 4 La matrice HF (f, f ) è dunque reale, simmetrica e definita positiva ∀ x ∈ (0, a), e costituisce una funzione continua di x nello stesso intervallo. Ne consegue che per ogni variazione δf(x) C 2 in [0, a], a supporto compatto in (0, a) e non identicamente nulla, deve aversi a δ2T = ( δf(x) δf (x) ) HF (f, f ) 0 δf(x) dx > 0 ; (6.6.1) δf (x) basta osservare che l’integrando in (6.6.1) è strettamente positivo in ogni punto x ∈ (0, a) tale che (δf(x ), δf (x )) = (0, 0) e che, per la continuità delle funzioni in gioco, la stessa proprietà deve essere soddisfatta in un intorno appropriato di x — teorema di permanenza del segno. Dall’approssimazione di Taylor 1 T (α) = T (0) + δ 2 T + o(α2 ) 2 (α → 0) si deduce la natura di minimo locale della soluzione stazionaria. 7. Il pendolo cicloidale La cicloide, il cui arco è stato riconosciuto come il tipo più generale di brachistocrona, gode di molte proprietà notevoli. Particolarmente interessante è il cosiddetto pendolo cicloidale che può immaginarsi realizzato da un punto materiale pesante P , di massa m, vincolato a scorrere senza attrito lungo una cicloide γ ubicata in un piano verticale, in modo che la sua retta generatrice sia disposta orizzontalmente. Per semplicità conviene scegliere la terna di riferimento Oxyz in modo che l’origine coincida con il punto più basso della curva — vedi figura. Stefano Siboni 107 Università degli studi di Trento Corso di Meccanica razionale 2 La parametrizzazione standard della cicloide, rispetto alla terna O x y z che vede collocato nell’origine O il punto di pendenza infinita del grafico, è data da x = r(θ − sin θ) θ ∈ [0, 2π] y = r(−1 + cos θ) dove r > 0 indica il raggio della circonferenza generatrice. Il punto più basso di γ ha coordinate (x , y ) = (πr, −2r), per cui la trasformazione fra le coordinate (x , y ) e le coordinate (x, y) si scrive x = x − πr x = x + πr ⇐⇒ y = y − 2r y = y + 2r In luogo di θ ∈ [0, 2π] conviene poi introdurre il nuovo parametro ξ ∈ [−π, π] definito dalla traslazione ξ = θ−π. In questo modo la parametrizzazione della cicloide relativamente alla terna Oxyz diventa x = r(ξ + sin ξ) ξ ∈ [−π, π] y = r(1 − cos ξ) regolare ∀ ξ ∈ (−π, π): gli estremi vanno quindi esclusi dall’analisi del moto vincolato del punto. La posizione del punto materiale lungo la cicloide, rispetto alla terna Oxyz, viene cosı̀ individuata in termini del parametro lagrangiano ξ: P − O = r(ξ + sin ξ) ê1 + r(1 − cos ξ) ê2 in modo che la velocità istantanea vale Ṗ = r[(1 + cos ξ) ê1 + sin ξ ê2 ] ξ̇ e l’accelerazione istantanea si scrive P̈ = r[(1 + cos ξ) ê1 + sin ξ ê2 ] ξ¨ + r(− sin ξ ê1 + cos ξ ê2 ) ξ˙2 . D’altra parte, un vettore tangente alla cicloide è dato da 1 ∂P = (1 + cos ξ) ê1 + sin ξ ê2 r ∂ξ per cui l’equazione pura del moto, nell’ipotesi di curva liscia, diventa mP̈ · Stefano Siboni 1 ∂P 1 ∂P = −mg ê2 · r ∂ξ r ∂ξ (7.1) 108 Università degli studi di Trento Corso di Meccanica razionale 2 esplicabili dal vincolo sono tutte e sole quelle ortogonali in quanto le reazioni vincolari Φ alla curva nella posizione occupata dal punto · 1 ∂P = 0 . Φ r ∂ξ Eseguiti i prodotti scalari l’equazione (7.1) assume la forma esplicita r[(1 + cos ξ)2 + sin2 ξ]ξ̈ + r(− sin ξ − sin ξ cos ξ + cos ξ sin ξ)ξ˙2 = −g sin ξ che con semplici manipolazioni algebriche si riduce a r(1 + cos2 ξ + 2 cos ξ + sin2 ξ)ξ¨ − r sin ξ ξ˙2 = −g sin ξ ed infine a 2r(1 + cos ξ)ξ¨ − r sin ξ ξ˙2 = −g sin ξ ovvero, equivalentemente, g 2(1 + cos ξ)ξ¨ − sin ξ ξ̇ 2 = − sin ξ . r Nella (7.2) si pone ξ = 2u, introducendo la nuova variabile π π ξ , ∈ − , u = 2 2 2 per cui l’equazione del moto diventa g 2 2 cos2 u 2ü − 2 sin u cos u 4u̇2 = − 2 sin u cos u r ossia g cos2 u ü − sin u cos u u̇2 = − sin u cos u 4r e quindi semplificando un fattore cos u, mai nullo in (−π/2, π/2), (7.2) d g du̇ + (cos u) u̇ = − sin u . dt dt 4r Il primo membro si può esprimere come un’unica derivata cos u g d (cos uu̇) = − sin u dt 4r che a sua volta è identificabile con la derivata seconda di sin u d2 g sin u . (sin u) = − dt2 4r Non rimane che porre v = sin u ∈ (−1, 1) per ottenere g v̈ = − v 4r che è l’equazione di un oscillatore armonico semplice unidimensionale di pulsazione ω = g/4r. Tutti i moti del sistema sono periodici e rigorosamente isocroni, avendo esattamente lo stesso periodo " " 4r r 2π = 2π = 4π . T = ω g g Stefano Siboni 109 Università degli studi di Trento Corso di Meccanica razionale 2 7.1 Realizzazione fisica alternativa del pendolo cicloidale Un modo fisicamente semplice per realizzare il pendolo cicloidale è il pendolo matematico a filo con ostacolo fisso rigido. Si supponga che un punto materiale P , di massa m e soggetto al proprio peso, sia connesso mediante un filo di lunghezza L, imponderabile, inestendibile e perfettamente flessibile all’origine O di una terna inerziale Oxyz, avente l’asse Oy diretto verticalmente verso l’alto. Il punto sia vincolato a restare nel piano coordinato Oxy. Una curva convessa γ, di parametrizzazione (x, y, z) = (x(ξ), y(ξ), 0), ξ ∈ [ξ1 , ξ2 ], passa per l’origine O e costituisce un ostacolo fisso per il filo che, mentre il punto P oscilla, si avvolge parzialmente su di essa. Si indichi con s(ξ) l’ascissa curvilinea lungo γ, assumendo l’origine O come origine degli spazi lungo la curva, in modo che s = 0 in O. In una generica configurazione del sistema il filo si disporrà per un certo tratto OQ lungo la curva γ e per il tratto residuo QP seguirà la retta tangente a γ in Q. Se si usa la parametrizzazione della curva per rappresentare la posizione del punto di tangenza Q, allora vale Q − O = x(ξ) ê1 + y(ξ) ê2 e la posizione del punto P sarà individuata dalla relazione geometrica dx(ξ) x = x(ξ) + [L − s(ξ)] ds(ξ) dy(ξ) y = y(ξ) + [L − s(ξ)] ds(ξ) ξ ∈ [ξ1 , ξ2 ] (7.1.1) nella quale l’ascissa curvilinea s(ξ) di Q dovrà beninteso risultare non superiore alla lunghezza complessiva L del filo: s(ξ) ≤ L ∀ ξ ∈ [ξ1 , ξ2 ] . Per ricavare la (7.1.1) è sufficiente osservare che il segmento di retta QP ha lunghezza pari a quella del tratto residuo di filo non avvolto su γ, L − s(ξ), e risulta parallelo e concorde Stefano Siboni 110 Università degli studi di Trento Corso di Meccanica razionale 2 con il versore tangente alla curva nella posizione Q τ̂ (ξ) = dy(ξ) dx(ξ) dQ(ξ) = ê1 + ê2 . ds(ξ) ds(ξ) ds(ξ) Di fatto, quindi, il punto P è vincolato a scorrere senza attrito sulla curva Γ di parametrizzazione (7.1.1). Nella fattispecie, interessa considerare il caso in cui la curva vincolare γ è una cicloide di parametrizzazione x = r(θ − sin θ) θ ∈ [−2π, 2π] y = −r(1 − cos θ) il cui supporto viene rappresentato nella figura seguente — si tratta di due archi regolari completi di cicloide, su ognuno dei quali il filo si avvolge, alternativamente, quando il punto materiale muove verso destra o verso sinistra rispetto all’origine Si intende verificare che, a patto di assumere L = 4r, la curva Γ lungo la quale muove il punto materiale P è ancora un arco di cicloide, convenientemente traslato rispetto alla precedente curva γ. In primo luogo conviene calcolare l’espressione dell’ascissa curvilinea partendo dalla relazione differenziale θ ds2 = dx2 + dy 2 = r2 [(1 − cos θ)2 + sin2 θ] dθ2 = r2 [2 − 2 cos θ] dθ2 = 4r2 sin2 dθ2 2 Stefano Siboni 111 Università degli studi di Trento Corso di Meccanica razionale 2 dalla quale si deduce che il differenziale dell’ascissa curvilinea vale ds = 2r sin θ dθ 2 e quindi, integrando a partire dall’origine degli spazi, che θ s(θ) = 0 θ θ θ θ 2r sin dθ = 4r − cos = 4r 1 − cos . 2 2 0 2 (7.1.2) Facendo uso della (7.1.1), per la parametrizzazione di Γ si hanno allora le espressioni θ r(1 − cos θ) = (7.1.3a) x = r(θ − sin θ) + L − 4r + 4r cos θ 1 2 4r sin 2 2 θ θ = r(θ − sin θ) + L − 4r + 4r cos sin = 2 2 θ θ = r(θ − sin θ) + (L − 4r) sin + 2r sin θ = r(θ + sin θ) + (L − 4r) sin 2 2 e θ −r sin θ = y = −r(1 − cos θ) + L − 4r + 4r cos θ 1 2 4r sin 2 2 θ θ cos = = −r(1 − cos θ) − L − 4r + 4r cos (7.1.3b) 2 2 1 + cos θ θ θ = −r(3 + cos θ) − (L − 4r) cos , = −r(1 − cos θ) − (L − 4r) cos − 4r 2 2 2 che nell’ipotesi di L = 4r si riducono a x = r(θ + sin θ) y = −2r − r(1 + cos θ) ∀ θ ∈ [−π, π] l’intervallo di definizione essendo il solo [−π, π] a causa della limitazione |s(θ)| ≤ L = 4r θ ≤ 4r . −4r ≤ 4r 1 − cos 2 Il cambiamento di parametro θ ∈ [−π, π] → ξ ∈ [−2π, 0] definito da θ = π + ξ porge poi x = r(π + ξ − sin ξ) = πr + r(ξ − sin ξ) y = −2r − r(1 − cos ξ) Stefano Siboni ∀ ξ ∈ [−2π, 0] 112 Università degli studi di Trento Corso di Meccanica razionale 2 e la traslazione di coordinate cartesiane (x, y) → (x , y ) = (x − rπ, y + 2r) conduce alla parametrizzazione di un solo arco di cicloide x = r(ξ − sin ξ) = πr + r(ξ − sin ξ) ∀ ξ ∈ [−2π, 0] y = −r(1 − cos ξ) della stessa forma e dimensione di quelli che costituiscono γ. La figura seguente mostra come sono reciprocamente collocate le curve γ e Γ 7.2 Osservazione. Evoluta di una curva Si dice evoluta di una curva biregolare assegnata Γ la curva γ costituita dai centri di curvatura della curva stessa. Per centro di curvatura di una curva biregolare Γ in un suo punto P si intende il punto collocato lungo la normale a Γ in P e ad una distanza da questo pari al raggio di curvatura. Γ viene anche detta involuta di γ. Se la curva Γ è piana si verifica facilmente che anche la sua evoluta γ è ancora una curva piana. Per le curve biregolari piane vale il seguente 7.2.1 Teorema (costruzione di una classe di involute) Sia data la curva biregolare piana γ di parametrizzazione Q = Q(s) , s ∈ [s1 , s2 ] , in cui s indica una ascissa curvilinea di γ. Sia τ̂ (s) il versore tangente di γ in Q(s). Allora ∀ L ∈ R \ [s1 , s2 ] assegnato, la curva Γ di parametrizzazione P (s) = Q(s) + (L − s)τ̂ (s) , s ∈ [s1 , s2 ] (7.2.1) è involuta di γ — ammette cioè γ come propria evoluta. Dimostrazione Indicando con n̂(s) e ρ(s) rispettivamente il versore normale ed il raggio di curvatura di γ in Q(s), la derivata prima della parametrizzazione di Γ si scrive dQ dτ̂ dP (s) = (s) − τ̂ (s) + (L − s) (s) = ds ds ds Stefano Siboni 113 Università degli studi di Trento Corso di Meccanica razionale 2 = τ̂ (s) − τ̂ (s) + (L − s) 1 1 n̂(s) = (L − s) n̂(s) ρ(s) ρ(s) (7.2.2) e risulta diversa da zero ∀ s ∈ [s1 , s2 ], causa la regolarità di Q(s) e l’essere L ∈ R \ [s1 , s2 ]: la curva Γ è quindi regolare in ogni suo punto. L’ascissa curvilinea S lungo Γ è cosı̀ definita da dP |L − s| dS = (s) = ∀ s ∈ [s1 , s2 ] ds ds ρ(s) e si scrive esplicitamente come s s dP |L − s| (s) ds = ds S(s) = ds ρ(s) s1 s1 sicché la parametrizzazione (7.2.1) diventa P̃ (S) = P [s(S)] = Q[s(S)] + [L − s(S)]τ̂ [s(S)] ∀ S ∈ [0, S(s2 )] con versore tangente ρ(s) L − s dP̃ 1 dP = = sgn[L − s(S)]n̂[s(S)]. T̂ (S) = (S) = (s) n̂(s) dS dS ds |L − s| ρ(s) s=s(S) s=s(S) (s) ds Una ulteriore derivazione porge ρ(s) 1 dT̂ dn̂ dT̂ = (S) = sgn(L − s) (s) dS dS ds s=s(S) |L − s| ds s=s(S) (s) ds e poichè in una curva piana le formule di Frenet-Serret impongono che si abbia 1 dn̂ (s) = − τ̂ (s) ds ρ(s) si conclude che 1 dT̂ (S) = −sgn(L − s) τ̂ (s) dS |L − s| s=s(S) per cui il versore normale ed il raggio di curvatura della curva Γ nel punto P̃ (S) sono dati da = −sgn[L − s(S)] τ̂ [s(S)] N̂ (S) = −sgn(L − s)τ̂ (s) s=s(S) e Stefano Siboni R(S) = |L − s| = |L − s(S)| . s=s(S) 114 Università degli studi di Trento Corso di Meccanica razionale 2 L’evoluta di Γ ammette allora la parametrizzazione P̃ (S) + R(S) N̂ (S) = Q[s(S)] + [L − s(S)] τ̂ [s(S)]+ % & + |L − s(S)| −sgn[L − s(S)] τ̂ [s(S)] = Q[s(S)] che, tornando alla variabile s in luogo dell’ascissa curvilinea S, può anche esprimersi come Q(s) s ∈ [s1 , s2 ] . , L’evoluta di Γ coincide dunque con la curva γ, come affermato. Il risultato seguente costituisce una sorta di inversione del teorema appena dimostrato. Per una data curva γ tutte le involute Γ hanno la forma (7.2.1) per L ∈ R \ [s1 , s2 ] opportuno. Si ha infatti il risultato seguente 7.2.2 Teorema (caratterizzazione delle involute regolari piane) Sia data la curva biregolare piana γ di parametrizzazione Q = Q(s) , s ∈ [s1 , s2 ] con s ascissa curvilinea. Allora tutte le involute piane regolari di γ sono della forma P (s) = Q(s) + (L − s) τ̂ (s) s ∈ [s1 , s2 ] per ogni L ∈ R \ [s1 , s2 ] assegnato. Dimostrazione Sia P = P̃ (S) , S ∈ [S1, S2 ] , la parametrizzazione di una qualsiasi involuta Γ di γ, in termini della sua ascissa curvilinea S. Il versore tangente a Γ in P̃ (S) è dato dalla derivata prima T̂ (S) = dP̃ (S) dS mentre il versore normale N̂ (S) ed il raggio di curvatura R(S) nello stesso punto si ricavano dalla derivata seconda dT̂ 1 d2 P̃ (S) = (S) = N̂ (S) . dS 2 dS R(S) Si vuole che l’evoluta di Γ coincida con γ. Deve perciò esistere una biiezione regolare s ∈ [s1 , s2 ] → S ∈ [S1 , S2 ] tale che Q[s(S)] = P̃ (S) + R(S) N̂ (S) Stefano Siboni ∀ S ∈ [S1 , S2 ] . (7.2.3) 115 Università degli studi di Trento Corso di Meccanica razionale 2 Derivando membro a membro rispetto ad S si ha ds dP̃ dR dN̂ dQ [s(S)] (S) = (S) + (S) N̂ (S) + R(S) (S) ds dS dS dS dS ma siccome Γ è per ipotesi una curva piana deve risultare dR dQ ds dR 1 T̂ (S) = [s(S)] (S) = T̂ (S) + (S) N̂ (S) + R(S) − (S) N̂ (S) ds dS dS R(S) dS in modo che, indicato con τ̂ (s) il versore tangente a γ in Q(s), vale τ̂ [s(S)] dR ds (S) = (S) N̂ (S) dS dS ∀ S ∈ [S1 , S2 ] ossia d (7.2.4) R[S(s)] N̂ [S(s)] ∀ s ∈ [s1 , s2 ] , ds relazione nella quale si sono riespressi ambo i membri in funzione di s. Da questa si deduce che d R[S(s)] = 1 ∀ s ∈ [s1 , s2 ] ds τ̂ (s) = per cui la continuità della derivata implica d R[S(s)] = a costante ds ∀ s ∈ [s1 , s2 ] con a = +1 o a = −1. Ne segue pertanto che per una appropriata costante b ∈ R deve aversi R[S(s)] = as + b ∀ s ∈ [s1 , s2 ] , (7.2.5) mentre la (7.2.4) fornisce l’equazione vettoriale τ̂ (s) = a N̂ [S(s)] ∀ s ∈ [s1 , s2 ] . (7.2.6) La (7.2.3) diventa cosı̀ , sostituendo le formule (7.2.5)-(7.2.6) e tornando alla variabile s, 1 Q(s) = P̃ [S(s)] + (as + b) τ̂ (s) a ∀ s ∈ [s1 , s2 ] per cui la parametrizzazione dell’involuta Γ si scrive nella forma b P (s) = P̃ [S(s)] = Q(s) + − − s τ̂ (s) a ∀ s ∈ [s1 , s2 ] . Come già visto nella (7.2.2) del teorema precedente, la condizione di regolarità dell’involuta richiede che si abbia −b/a − s = 0 ∀ s ∈ [s1 , s2 ]. Basta porre −b/a = L per concludere la dimostrazione. Stefano Siboni 116 Università degli studi di Trento Corso di Meccanica razionale 2 7.2.3 Conclusioni Dal primo dei teoremi precedenti segue che se un filo ideale di lunghezza L ha una estremità O fissata in un punto della curva piana biregolare γ ed è vincolato ad avvolgersi su γ mantenendo rettilineo l’eventuale tratto non avvolto, allora il secondo estremo P del filo si muove su una involuta di γ. Beninteso, involute diverse si ottengono considerando fili di lunghezza L differente. Nei casi di interesse fisico l’evoluta γ deve essere una curva convessa, in modo che la condizione di avvolgimento possa essere soddisfatta semplicemente mantenendo il filo ben teso. Cosı̀ ad esempio dalle relazioni (7.1.3a) e (7.1.3b) ricavate in precedenza è facile dedurre che tutte le curve di parametrizzazione θ x = r(r̂ + sin θ) + (L − 4r) sin 2 θ y = −r(3 + cos θ) − (L − 4r) cos 2 θ ∈ (−π, π) (7.2.7) per ogni L ≥ 4r assegnato sono involute della stessa evoluta, la cicloide di parametrizzazione r(θ − sin θ) ∀ θ ∈ (−π, π) . (7.2.8) r(−1 + cos θ) Ma soltanto per L = 4r la (7.2.7) è a sua volta una cicloide — identica alla (7.2.8) e convenientemente traslata. 8. Il problema della tautocrona Si vuole determinare una curva regolare γ, disposta in un piano verticale Oxy e passante per un punto assegnato, che si identificherà con l’origine O, in modo che un punto materiale pesante P vincolato a scorrere lungo di essa impieghi sempre lo stesso intervallo di tempo a coprire il tratto di curva compreso fra un qualsiasi punto A = O di questa, in cui P sia collocato con velocità nulla all’istante iniziale, e il punto fissato O. Una curva cosiffatta si dice tautocrona — termine di etimo greco che significa linea dei tempi uguali. Stefano Siboni 117 Università degli studi di Trento Corso di Meccanica razionale 2 Da sottolineare che il punto O viene espressamente escluso dal novero delle possibili posizioni iniziali del punto materiale: per A = O infatti il tempo di percorrenza risulta banalmente nullo, per cui includere anche O nell’analisi renderebbe il problema privo di significato fisico — è evidente che per A = 0 il tempo di percorrenza non potrebbe mai essere nullo e la condizione di tautocronia sarebbe impossibile da soddisfare. 8.1 Formulazione matematica del problema Per fissare le idee, si assuma l’asse Oy diretto verticalmente verso l’alto e si indichi con m la massa del punto P . La posizione di P lungo la curva γ sarà individuata mediante la parametrizzazione P (ξ) di questa, che assumerà la forma P (ξ) − O = x(ξ) ê1 + y(ξ) ê2 , ξ ∈ [0, ξmax ] , con x(0) = 0 e y(0) = 0. La corrispondente equazione del moto si scrive d m dt dx 2 dξ + dy 2 dξ 1 dy ξ˙ = −mg dξ dx 2 dy 2 + dξ dξ ed ammette l’integrale primo dell’energia meccanica dy 2 2 m dx ˙ = + H(ξ, ξ) ξ̇ 2 + mgy(ξ) 2 dξ dξ (8.1.1) che consente di discutere l’andamento qualitativo delle soluzioni applicando l’analisi di Weierstrass alla funzione energia potenziale W (ξ) = mgy(ξ) . Si richiede preliminarmente che qualunque sia la posizione iniziale del punto P lungo γ, distinta da P (0) = O, il moto con velocità iniziale nulla raggiunga l’estremo O in un intervallo di tempo finito. Dai criteri di Weierstrass segue allora che: (i) l’ordinata y(ξ) dei punti lungo la curva deve avere derivata non nulla in tutto l’intervallo (0, ξmax ]. Se infatti fosse y (ξ ), per un dato ξ ∈ (0, ξmax ], allora alla condizione Stefano Siboni 118 Università degli studi di Trento Corso di Meccanica razionale 2 ˙ = (ξ , 0) corrisponderebbe lo stato di quiete in ξ = ξ e il punto materiale iniziale (ξ, ξ) non potrebbe raggiungere l’estremo O. Da notare che nessuna condizione è individuata sulla derivata y (0), che in effetti potrebbe risultare nulla; (ii) l’ordinata y(ξ) dei punti lungo la curva deve essere una funzione monotòna crescente del parametro ξ ∈ (0, ξmax ]. Se infatti esistessero ξ1 , ξ2 ∈ (0, ξmax ], ξ1 < ξ2 , tali che y(ξ1 ) > y(ξ2 ), la conservazione dell’energia meccanica impedirebbe al moto di ˙ = (ξ2 , 0) di raggiungere l’origine ξ = 0. Anche la possibilità che dato iniziale (ξ, ξ) sia y(ξ1 ) = y(ξ2 ) deve essere scartata, in quanto il teorema di Rolle implicherebbe l’esistenza di un ξ intermedio dove y (ξ ) = 0, in contrasto con quanto già rilevato in (i). Si conclude, in particolare, che l’applicazione y = y(ξ) definisce un diffeomorfismo C 1 dell’intervallo (0, ξmax ] in un intervallo (0, ymax ] dell’ordinata y. Il tempo di percorrenza T della traiettoria viene determinato scrivendo la conservazione dell’energia (8.1.1) per le assegnate condizioni iniziali. Se ξ0 ∈ (0, ξmax ] individua la posizione iniziale del punto si ha m dx 2 dy 2 ˙2 + ξ + mgy(ξ) = mgy(ξ0 ) 2 dξ dξ e ricavando il modulo di ξ˙ |ξ̇| = 2g y(ξ0 ) − y(ξ) ' dx 2 dξ + dy 2 dξ (8.1.2) — si ricordi che il denominatore della (8.1.2) è certamente diverso da zero per l’ipotesi di regolarità della curva γ. Conseguentemente, il tempo di percorrenza è espresso dall’integrale definito ξ0 ξ0 dx 2 dy 2 1 1 1 T = dξ = √ + dξ (8.1.3) 2g dξ dξ |ξ̇| y(ξ0 ) − y(ξ) 0 0 che con il cambiamento di variabile y = y(ξ) diventa y(ξ 0) 2gT = 0 Stefano Siboni 1 y(ξ0 ) − y 1+ dx 2 dy dy 119 Università degli studi di Trento Corso di Meccanica razionale 2 in cui la sola funzione incognita è ora x = x(y). Quella ottenuta è una equazione integrale lineare della forma y(ξ 0) ϕ(y) dy (8.1.4) 2g T = y(ξ0 ) − y 0 a patto di porre ϕ(y) = 1+ dx 2 dy ∀ y ∈ (0, ymax ] . (8.1.5) Il problema si separa quindi in due parti: in primo luogo si deve ricavare la funzione ϕ(y) risolvendo l’equazione integrale (8.1.4); una volta determinata ϕ(y) si può procedere al calcolo della funzione incognita x(y) integrando l’equazione differenziale (8.1.5), ovvero dx (8.1.6) = ± ϕ(y)2 − 1 . dy 8.2 Soluzione dell’equazione integrale L’equazione integrale (8.1.4) — lineare — si risolve con la tecnica delle trasformate di Laplace. Posto per brevità a = y(ξ0 ) > 0, si calcola la trasformata di Laplace rispetto ad a di ambo i membri +∞ +∞ a ϕ(y) √ dy = 2g T da e−λa da e−λa a−y 0 0 0 ottenendo, per λ > 0, l’equazione +∞ a 1 ϕ(y) da dy e−λa √ = 2g T . a−y λ 0 (8.2.1) 0 L’integrale doppio a primo membro è esteso al dominio evidenziato con l’ombreggiatura nella figura seguente ed invertendo l’ordine delle integrazioni, per Fubini, diventa +∞ +∞ +∞ +∞ 1 1 dy da e−λa √ dy ϕ(y) da e−λa √ ϕ(y) = . a−y a−y 0 Stefano Siboni y 0 (8.2.2) y 120 Università degli studi di Trento Corso di Meccanica razionale 2 Nell’integrale più interno conviene introdurre, ad y > 0 fissato, il cambiamento di variabile a ∈ (y, +∞) → t ∈ R+ definito da a = y + t2 . Si ottiene in tal modo +∞ +∞ +∞ 2√ 1 −λa −λ(y+t2 ) 1 −λy 2 √ √ da e dt 2t e e−λt λ dt = = e a−y t λ y 0 0 √ e con l’ulteriore sostituzione u = λt 2 e−λy √ λ +∞ √ √ π π −u2 −λy 2 √ = √ e−λy e du = e λ 2 λ 0 dove si è fatto uso della ben nota relazione +∞ +∞ √ 1 π −u2 −u2 e du = e du = . 2 2 −∞ 0 Tramite la (8.2.2) la (8.2.1) si riduce perciò alla formula seguente +∞ √ √ π −λy π 1 dy ϕ(y) √ e = √ Lϕ(λ) = 2g T λ λ λ 0 dalla quale segue la trasformata di Laplace Lϕ(λ) della funzione incognita ϕ(y) T 1 (8.2.3) 2g √ √ . π λ √ √ L’antitrasformata di Laplace della funzione 1/ λ è data da 1/ πy — la verifica di questo risultato si trova in appendice — per cui Lϕ(λ) = ϕ(y) = T 1 1 T = 2g √ 2g √ √ π πy π y ∀ y ∈ (0, ymax ] . (8.2.4) 8.3 Soluzione dell’equazione differenziale finale L’equazione (8.1.5) si scrive ora esplicitamente come dx 2 T2 1 ∀ y ∈ (0, ymax ] = 2g 2 − 1 dy π y dove x(y) = x[ξ(y)] è una funzione di classe C 1 in (0, ymax ] in quanto composizione di funzioni di classe C 1. Ciò implica che nell’equazione ottenuta estraendo membro a membro la radice quadrata dell’equazione precedente T2 1 dx = ± 2g 2 − 1 dy π y Stefano Siboni 121 Università degli studi di Trento Corso di Meccanica razionale 2 il cambiamento di segno potrebbe ricorrere soltanto qualora si annullasse il radicando, ossia per y = 2gT 2 /π 2 , valore oltre il quale il radicando risulta in effetti negativo e la radice non è definita — si avrà, in particolare, ymax ≤ 2gT 2 /π 2 . In realtà nessun cambiamento di segno può dunque verificarsi e due soli casi sono possibili: dx T2 1 = + 2g 2 − 1 ∀ y ∈ (0, ymax ], nel qual caso la x(y) è una funzione monotòna (i) dy π y crescente al pari della corrispondente inversa y(x); T2 1 dx (ii) = − 2g 2 − 1 ∀ y ∈ (0, ymax ], equazione che invece implica il carattere stretdy π y tamente decrescente di x(y) e della relativa inversa y(x). Caso (i) L’equazione della curva si risolve per separazione di variabili e, tenuto conto della condizione iniziale limite x(0) = 0, è data da y " T2 1 x = 2g 2 − y √ dy (8.3.1) ∀ y ∈ (0, ymax ] . π y 0 Nell’integrale si può introdurre il cambiamento di variabile y → η definito dalle relazioni π π2 T2 2 y = 2g 2 sin η ∈ (0, ymax ] η = arc sin y ∈ [0, η ] ⊆ 0, max π 2gT 2 2 per ottenere η " η T2 1 T2 T2 2g 2 cos η " 2cos2 η dη = 2g 2 2 sin η cos η dη = 2g 2 x = 2 π π π T 0 0 2g 2 sin η π η η sin 2η T2 T2 T2 = g 2 (2η + sin 2η) . = 2g 2 (1 + cos 2η) dη = 2g 2 η + π π 2 π 0 0 Facendo uso dell’identità trigonometrica 2sin2 η = 1 − cos 2η, l’equazione della tautocrona si esprime perciò nella forma parametrica T2 x = g 2 (2η + sin 2η) η ∈ [0, ηmax ] π 2 T (0 < ηmax ≤ π/2) y = g 2 (1 − cos 2η) π che con l’ovvia sostituzione 2η = φ — e 2ηmax = φmax — equivale a T2 x = g (φ + sin φ) φ ∈ [0, φmax ] π2 2 T (0 < φmax ≤ π) . y = g 2 (1 − cos φ) π Stefano Siboni (8.3.2) 122 Università degli studi di Trento Corso di Meccanica razionale 2 Il risultato ottenuto si può interpretare convenientemente ricordando la parametrizzazione dell’arco completo di cicloide x = r(θ − sin θ) y = r(1 − cos θ) θ ∈ [0, 2π] che con il cambiamento di variabile angolare θ = π + φ diventa x = r(π + φ + sin φ) = πr + r(φ + sin φ) y = r(1 + cos φ) = 2r + r(−1 + cos φ) ossia x − πr = r(φ + sin φ) −(y − 2r) = r(1 − cos φ) φ ∈ [−π, π] φ ∈ [−π, π] e limitatamente all’arco individuato da φ ∈ [0, φmax ] ⊆ [0, π] si identifica con la (8.3.2) a condizione di porre x = x − πr y = −(y − 2r) c = g T2 . π2 L’arco in questione è evidenziato in grassetto nella figura seguente Si tratta dunque di un arco di cicloide rovesciata rispetto all’asse orizzontale Ox, con il minimo assoluto nell’origine e parametro di scala r = gT 2 /π 2 . Caso (ii) Il caso di dx/dy < 0 si tratta in modo analogo, l’unica differenza risultando il cambiamento di segno dell’ascissa x. La tautocrona è ancora un arco della stessa cicloide, ma parametrizzato in un intervallo del tipo φ ∈ [φmin , 0], con φmin ∈ [−π, 0) assegnato. 8.4 Verifica della tautocronia Si vuole verificare che la curva (8.3.2) soddisfa effettivamente la condizione di tautocronia. Il tempo di percorrenza è dato dall’equivalente della formula (8.1.3) in termini della Stefano Siboni 123 Università degli studi di Trento Corso di Meccanica razionale 2 parametrizzazione standard (8.3.2) Tφmax 1 = √ 2g φmax 0 1 dx 2 y(φmax ) − y(φ) dφ + dy 2 dφ dφ . Si ha cosı̀ Tφmax 1 = √ 2g φmax 1 " g 0 1 √ T g = √ 2g π T2 π2 (cos φ − cos φmax ) φmax √ 0 = T2 π2 ! (1 + cos φ)2 + sin2 φ dφ = 1 2(1 + cos φ) dφ = cos φ − cos φmax √ φmax T π g √ 0 1 + cos φ dφ cos φ − cos φmax espressione che con la sostituzione φ = 2η diventa Tφmax T = π √ φmax /2 " 0 2 cos η φmax − 2 sin2 η 2 sin2 2 2 2 dη = T π φmax /2 " 0 cos η φmax − sin2 η sin2 2 dη e con l’ulteriore cambiamento di variabile sin η = sin φmax sin u , 2 u ∈ [0, π/2] si riduce a Tφmax 2 = T π π/2 0 1 φmax cos u du = T sin φmax 2 sin cos u 2 qualunque sia la posizione iniziale del punto materiale, individuata da φmax ∈ (0, π]. Da sottolineare che la tautocrona non è un arco di cicloide qualsiasi: il punto di arrivo del grave deve essere il punto di minimo della cicloide. Un arco di cicloide che non comprenda la posizione di minimo come punto di arrivo non soddisfa la condizione di tautocronia. Stefano Siboni 124 Università degli studi di Trento Corso di Meccanica razionale 2 8.5 Condizione di tautocronia per le curve non piane Lo studio della tautocrona è stato condotto sotto l’ipotesi che la curva sia piana. Nel caso di curve non piane è ancora possibile caratterizzare le curve che soddisfano la condizione di tautocronia, ma le soluzioni del problema non sono affatto delle cicloidi: si tratta di una classe di curve assai più ampia. Assumendo che il traguardo dei moti sia sempre nell’origine O, la parametrizzazione regolare della curva γ dovrà essere in questo caso della forma generale ξ ∈ [0, ξmax] P − O = x(ξ) ê1 + y(ξ) ê2 + z(ξ) ê3 , con P (0) = 0. Come prima, la condizione necessaria e sufficiente affinché tutti i moti di ˙ = (ξ0 , 0), per ξ0 ∈ (0, ξmax ] assegnato, transitino per l’origine in un dato iniziale (ξ, ξ) intervallo di tempo finito è che la funzione energia potenziale W (ξ) = mgy(ξ) , ξ ∈ [0, ξmax] sia monotòna crescente e non abbia punti critici nell’intervallo (0, ξmax ] — valgono sempre le stesse considerazioni già espresse circa la necessità di escludere il punto di arrivo O dalle possibili posizioni iniziali. Pertanto dy (ξ) > 0 , dξ ξ ∈ (0, ξmax ] , per cui è possibile usare la y come variabile indipendente in luogo della ξ. Il tempo di ˙ = (ξ0 , 0) è quindi espresso da percorrenza per il moto di condizioni iniziali (ξ, ξ) ξ0 2 2 2 1 dx dy dz 1 dξ = + + T = √ dξ dξ dξ 2g y(ξ0 ) − y(ξ) 0 1 = √ 2g y(ξ 0 ) 1+ dx 2 dy + dz 2 dy 0 1 y(ξ0 ) − y dy e dalla condizione che T sia costante ∀ y(ξ0 ) ∈ (0, y(ξmax )] si deduce che dx 2 dz 2 T 1 1+ + = 2g √ . dy dy π y La condizione di tautocronia si scrive cosı̀ dx 2 dz 2 T2 1 + = 2g 2 − 1 dy dy π y ∀ y ∈ (0, y(ξmax )] con y(ξmax ) ≤ 2gT 2 /π 2 . La sua soluzione generale può esprimersi integrando il seguente sistema generale di equazioni differenziali " dx T2 1 2g 2 − y = cos α(y) √ dy y π " (8.5.1) 2 1 T dz = sin α(y) √ 2g 2 − y dy y π Stefano Siboni 125 Università degli studi di Trento Corso di Meccanica razionale 2 in termini di una qualsiasi funzione α(y) di classe C 1 nell’intervallo [0, y(ξmax )]. Il caso della cicloide considerato in precedenza ricorre ad esempio per α(y) = 0 ∀ y ∈ (0, y(ξmax )] — ovvero per α(y) = π ∀ y ∈ (0, y(ξmax )]. Tenuto conto della condizione al contorno x(0) = z(0) = 0, la soluzione generale di (8.5.1) vale " y T2 1 x(y) = 2g − y cos α(y) dy √ y π2 0 " y T2 1 2g 2 − y sin α(y) dy z(y) = √ y π ∀ y ∈ [0, y(ξmax )] , 0 dove gli integrandi presentano una singolarità sempre integrabile in y = 0, corrispondente al punto di arrivo del moto. A titolo di esempio, nelle figure seguenti sono rappresentate graficamente le tautocrone corrispondenti ad α(y) = y 2 , α(y) = y 4 e α(y) = 1 + ey . α(y) = y 2 α(y) = y 4 α(y) = 1 + ey Stefano Siboni 126 Università degli studi di Trento Corso di Meccanica razionale 2 9. Il principio di Fermat in ottica Un’altra classica ed interessante applicazione dei metodi variazionali riguarda l’ottica geometrica ed è costituita dal cosiddetto principio di Fermat. Benché si tratti di un ambito completamente diverso da quello della meccanica, nella sua formulazione matematica il problema presenta notevoli analogie con la meccanica del punto materiale ed in molti casi importanti può essere studiato usando i metodi propri di questa, quali l’analisi di Weierstrass o il teorema di Noether. L’ottica geometrica descrive la propagazione della luce per mezzo di raggi luminosi, ignorando la natura ondulatoria della radiazione; nondimeno, se si tiene conto delle leggi di Snell per la riflessione e la rifrazione, l’ottica geometrica costituisce una buona approssimazione in molti casi di interesse pratico, fornendo risultati molto simili a quelli ottenibili applicando la rigorosa teoria ondulatoria — equazioni di Maxwell del campo elettromagnetico. I raggi luminosi si intendono coprire dei percorsi curvilinei ad una velocità che può dipendere dalle caratteristiche ottiche del mezzo in cui avviene la propagazione. Si supponga che il raggio luminoso percorra la curva γ di parametrizzazione P (λ) − O = 3 xi (λ) êi , λ ∈ [λ1 , λ2 ] i=1 regolare e di classe C 2 nel proprio intervallo di definizione [λ1 , λ2 ] ⊂ R. Il cammino ottico I del raggio luminoso viene definito come il prodotto fra il tempo di percorrenza T , necessario a che il raggio copra per intero il proprio tragitto dall’estremo iniziale a quello finale, e la velocità della luce nel vuoto, la costante universale c. Il cammino ottico si esprime in termini del indice di rifrazione assoluto n ≥ 1 del mezzo, dato dal rapporto fra la velocità c della luce nel vuoto e quella v nel mezzo assegnato. In un mezzo non omogeneo e isotropo velocità v e indice di rifrazione assoluto n possono dipendere dalla posizione e dalla direzione di propagazione del raggio. In molti casi, tuttavia, l’indice di rifrazione può ritenersi funzione della sola posizione e non anche della direzione di propagazione del raggio, per cui n = n(P ). Il cammino ottico è espresso da una relazione della forma s2 s2 s2 1 c I = cT = c n ds = n ds . ds = ds = v v s1 s1 s1 γ Il principio di Fermat afferma che fra gli infiniti cammini regolari che hanno come estremi i punti fissi P1 = P (λ1 ) e P2 = P (λ2 ), il percorso effettivamente seguito dal raggio luminoso nel passare dall’estremo P1 all’estremo P2 è quello di cammino ottico minimo. Condizione necessaria per tale minimo è che per una generica variazione del percorso ottico P (λ) → Stefano Siboni 127 Università degli studi di Trento Corso di Meccanica razionale 2 P (λ) + δP (λ), con variazione δP (λ) di classe C 2 in [λ1 , λ2 ] e tale che δP (λi ) = 0, i = 1, 2 (estremi fissi), si abbia δI = 0, ossia λ2 n[P (λ)] |Ṗ (λ)| dλ = 0 . δ (9.1) λ1 Il problema variazionale è equivalente a risolvere le equazioni di Eulero-Lagrange d ∂L ∂L = 0 − dλ ∂ ẋi ∂xi , i = 1, 2, 3 , (9.2) dove la lagrangiana formale si identifica con l’integrando del funzionale (9.1) L = n(P ) (Ṗ 2 )1/2 . (9.3) Di qui è facile ricavare le relazioni 1 ∂ Ṗ ∂L = n (Ṗ 2 )−1/2 2Ṗ · = n τ̂ · ∂ ẋi 2 ∂ ẋi ∂P d ∂L d ∂ Ṗ (nτ̂ ) · = + nτ̂ · dλ ∂ ẋi dλ ∂xi ∂xi ∂n 2 1/2 1 ∂L = (Ṗ ) + n (Ṗ 2 )−1/2 2Ṗ ∂xi ∂xi 2 ∂P ∂xi · ∂ Ṗ ∂n ∂ Ṗ = |Ṗ | + nτ̂ · ∂xi ∂xi ∂xi che sostituite nelle (9.2) conducono alle equazioni di propagazione ∂P ∂n d (nτ̂ ) · − |Ṗ | = 0 dλ ∂xi ∂xi i = 1, 2, 3 . Ricordando che |Ṗ | = ds/dλ, essendo s un’ascissa curvilinea della traiettoria, queste si possono anche scrivere nella forma equivalente ∂n d (nτ̂ ) · êi − = 0 ds ∂xi i = 1, 2, 3 ossia, in notazione vettoriale, d (nτ̂ ) = ∇n . ds Eseguendo la derivata a primo membro si ottiene l’equazione (9.4) dτ̂ dn τ̂ + n = ∇n ds ds che per via della postulata dipendenza dell’indice di rifrazione dalla sola posizione diventa ∇n · Stefano Siboni dτ̂ dP τ̂ + n = ∇n ds ds 128 Università degli studi di Trento Corso di Meccanica razionale 2 e quindi, essendo dP/ds = τ̂ , n dτ̂ = ∇n − ∇n · τ̂ τ̂ ds ovvero dτ̂ 1 = ∇n − ∇n · τ̂ τ̂ . ds n Si ha cosı̀ il sistema di equazioni del primo ordine in forma normale 1 dτ̂ = ∇n(P ) − ∇n(P ) · τ̂ τ̂ ds n(P ) dP = τ̂ ds (9.5) dove P ∈ R3 e τ̂ ∈ R3 tale che τ̂ 2 = 1. L’indice di rifrazione n(P ) si assumerà funzione di classe C 2 in R3 , per cui i secondi membri delle equazioni differenziali risultano funzioni C 1 degli argomenti (P, τ̂ ). La questione dell’esistenza ed unicità della soluzione massimale per il problema di Cauchy è tuttavia delicata in quanto il dominio di definizione del sistema rappresenta un sottoinsieme chiuso di R6 : K = {(P, τ̂ ) ∈ R3 × R3 : |τ̂ |2 = 1} = R3 × S2 ⊂ R6 . La difficoltà può essere aggirata considerando in luogo di (9.5) il sistema 1 ∇n(P ) · τ̂ dτ̂ = ∇n(P ) − τ̂ ds n(P ) τ̂ 2 dP = τ̂ ds # $ (P, τ̂ ) ∈ R3 × R3 \ {0} (9.6) definito nel dominio aperto di R6 Ω = {(P, τ̂ ) ∈ R3 × (R3 \ {0})} = R3 × (R3 \ {0}) . Il sistema (9.6) differisce da (9.5) per la sola introduzione del fattore di normalizzazione τ̂ 2 > 0 a denominatore del termine ∇n(P ) · τ̂ nella prima equazione e per il fatto di essere definito sull’aperto Ω ⊂ R6 : il vettore τ̂ non viene più necessariamente identificato con un versore. Al nuovo sistema il teorema di esistenza ed unicità è quindi immediatamente applicabile: per ogni scelta dei valori iniziali (P (0), τ̂ (0)) ∈ Ω di (P, τ̂ ) esisterà unica la relativa soluzione massimale (P (s), τˆ(s)), definita su un intervallo aperto della variabile indipendente s. D’altra parte è altresı̀ evidente che (9.6) ammette τ̂ 2 come integrale primo: ) ) ( ( dτ̂ 2 1 ∇n · τ̂ ∇n · τ̂ d 2 τ̂ = τ̂ · τ̂ = 0 . (τ̂ ) = 2τ̂ · = 2τ̂ · ∇n − τ̂ · ∇n − ds ds n τ̂ 2 n τ̂ 2 In particolare, il sistema (9.6) ammette una ed una sola soluzione massimale per qualsiasi dato iniziale P (0) ∈ R3 e τ̂ (0) di modulo unitario, ma τ̂ (s)2 si mantiene costante al valore 1 lungo l’intera soluzione, come richiesto dal significato geometrico del vettore. Risolvere la Stefano Siboni 129 Università degli studi di Trento Corso di Meccanica razionale 2 (9.6) con dato iniziale (P (0), τ̂ (0)) tale che τ̂ (0)2 = 1 equivale dunque a risolvere il sistema (9.5). Le equazioni (9.6) sono ovviamente equivalenti al sistema di equazioni scalari ∂n dτx ∂n ∂n 1 ∂n 1 = − τx + τy + τz τx ds n ∂x τx2 + τy2 + τz2 ∂x ∂y ∂z ∂n dτy ∂n ∂n 1 ∂n 1 = − 2 τx + τy + τz τy ds n ∂y τx + τy2 + τz2 ∂x ∂y ∂z ∂n 1 ∂n 1 ∂n ∂n dτz ds = n ∂z − τx2 + τy2 + τz2 ∂x τx + ∂y τy + ∂z τz τz dx = τx ds dy = τy (x, y, z) ∈ R3 ds dz (τx , τy , τz ) ∈ R3 \ {0} = τz ds (9.7) in cui si sono indicate con x, y, z le coordinate del generico punto P e con τx , τy , τz le componenti del versore τ̂ , mentre n = n(x, y, z). Ogni soluzione completa di (9.7) sarà individuata assegnando i valori iniziali delle variabili dipendenti x(0) = xo y(0) = y o z(0) = z o τx (0) = τxo τy (0) = τyo τz (0) = τzo con (τxo )2 + (τyo )2 + (τzo )2 = 1. 9.1 Principio di invertibilità dei raggi luminosi È facile convincersi che se P (s) , τ̂ (s) , s ∈ [0, L] , è soluzione del sistema (9.6) con condizioni iniziali P (0) = P o τ̂ (0) = τ̂ o , allora le funzioni Q(s) = P (L − s) , T̂ (s) = −τ̂ (L − s) , Stefano Siboni s ∈ [0, L] , 130 Università degli studi di Trento Corso di Meccanica razionale 2 definiscono una soluzione dello stesso sistema di equazioni differenziali soddisfacente le condizioni iniziali Q(0) = P (L) T̂ (0) = −τ̂ (L) e con valori finali Q(L) = P (0) = P o T̂ (L) = −τ̂ (0) = −τ̂ o . Si ha in effetti che dP dQ (s) = − (L − s) = −τ̂ (L − s) = T̂ (s) ds ds ∀ s ∈ [0, L] mentre ∇n[P (L − s)] · τ̂ (L − s) dτ̂ 1 dT̂ ∇n[P (L − s)] − τ̂ (L − s) (s) = (L − s) = ds ds n[P (L − s)] τ̂ (L − s)2 1 ∇n[Q(s)] · T̂ (s) T̂ (s) . = ∇n[Q(s)] − n[Q(s)] T̂ (s)2 Il risultato si interpreta nel senso che se P (s), s ∈ [0, L] rappresenta la traiettoria di un raggio luminoso che congiunge il punto iniziale P (0) con l’estremo finale P (L), allora l’arco P (L − s), s ∈ [0, L] costituisce ancora una soluzione delle equazioni di propagazione e corrisponde al percorso del raggio luminoso che congiunge l’estremo iniziale P (L) all’estremo finale P (0) — principio di invertibilità dei raggi luminosi. 9.2 Caso notevole. Strato limite e leggi di Snell Si supponga che l’indice di rifrazione assoluto costituisca un campo scalare C 2 in R3 e che il suo dominio di definizione sia ripartito in tre regioni come di seguito descritte: (i) un ε-intorno σ di una superficie aperta S semplicemente connessa, vale a dire, per un qualche ε > 0 piccolo, l’insieme σ = * {y ∈ R3 : |y − x| < ε} , x∈S in modo che σ separi R3 in due componenti connesse Ω1 e Ω2 ; Stefano Siboni 131 Università degli studi di Trento Corso di Meccanica razionale 2 (ii) il dominio chiuso e connesso Ω1 dove l’indice di rifrazione si mantiene costante al valore n1 ; (iii) il dominio chiuso e connesso residuo Ω2 , caratterizzato da un indice di rifrazione costante n2 = n1 . Dalle ipotesi assunte segue che l’indice di rifrazione deve essere una funzione regolare e rapidamente variabile nell’aperto σ fra i valori n1 ed n2 . Per la sua conformazione σ può riguardarsi come uno strato sottile del mezzo trasparente caratterizzato da una variazione molto rapida e localizzata dell’indice di rifrazione, costante a valori distinti n1 ed n2 nelle regioni contigue alle facce che delimitano lo strato: σ costituisce una sorta di strato limite fra le regioni Ω1 ed Ω2 nelle quali l’indice di rifrazione risulta costante ai valori n1 ed n2 rispettivamente. In effetti, se s ∈ [s1 , s2 ] −−−−−−−−→ P (s) ∈ σ è la parametrizzazione regolare del tratto di raggio luminoso compreso entro lo strato σ, dall’equazione (9.4) si deduce s2 d (n τ̂ ) ds = ds s1 s2 s2 ∇n ds = s1 ∇n[P (s)] ds s1 ossia, eseguendo l’integrale dell’integrando continuo a primo membro ed applicando il teorema della media al secondo, 3 s2 3 ∇n[P (s)] · êi ds êi = (s2 − s1 ) ∇n[P (ξi)] · êi êi (n τ̂ )(s2 ) − (n τ̂ )(s1 ) = i=1 s 1 i=1 per ξi ∈ (s1 , s2 ), i = 1, 2, 3, opportuni. Poichè lo strato σ è di spessore molto piccolo e l’indice di rifrazione assoluto n costituisce un campo C 2 della posizione, si può assumere senza introdurre errori rilevanti 3 ∇n[P (ξi )] · êi êi ∇n[P (s1 )] ∇n[P (s2 )] i=1 Stefano Siboni 132 Università degli studi di Trento Corso di Meccanica razionale 2 vettori che, in quanto normali alle superfici n = n[P (s1 )] = costante e n = n[P (s2 )] = costante che delimitano lo strato σ, individuano la retta normale a σ in P (s1 ), ovvero in P (s2 ). Si ha allora (9.2.1) n2 τ̂ (s2 ) − n1 τ̂ (s1 ) = (s2 − s1 ) ∇n(s1 ) . Questa equazione precisa due circostanze importanti: (i) i vettori n(s2 )τ̂ (s2 ), ∇n(s2 ) e n(s1 )τ̂ (s1 ) sono linearmente dipendenti, per cui possono immaginarsi complanari ed applicati nel punto P (s1 ) P (s2 ); (ii) la componente di n τ̂ tangente allo strato σ è continua attraverso lo strato stesso. Se si indicano con i ed r gli angoli formati dai versori τ̂ (s1 ) e τ̂ (s2 ) con il vettore normale ∇n, la componente di n τ̂ tangente allo strato σ proiettata nel piano individuato da ∇n e n1 τ̂ (s1 ) porge n1 sin i = n2 sin r ossia n1 sin r = sin i n2 che è la ben nota legge di Snell della rifrazione. Si osservi che qualora il raggio incidente sullo strato limite σ fosse riflesso nella stessa regione Ω1 di provenienza, la componente di nτ̂ tangente a σ dovrebbe risultare continua prima e dopo la riflessione; data la costanza dell’indice di rifrazione, uguale a n1 prima e dopo la riflessione, se ne dedurrebbe la continuità della componente di τ̂ tangente a σ e quindi l’identità fra angolo di incidenza e angolo di riflessione — legge di Snell della riflessione. 9.3 Esempio di interesse fisico: i miraggi Il modello basato sul principio di Fermat può spiegare anche fenomeni relativamente complessi quali i miraggi. Si supponga che l’indice di rifrazione dipenda unicamente dalla coordinata z, con un andamento di tipo sigmoidale come quello della funzione n(x, y, z) = n(z) = 1.2 + 0.2 tanh(5z) (9.3.1) in cui la variazione dell’indice di rifrazione è esagerata rispetto a quanto potrebbe avvenire in una situazione fisica reale al solo scopo di amplificare l’effetto. L’indice di rifrazione è Stefano Siboni 133 Università degli studi di Trento Corso di Meccanica razionale 2 circa costante per z 0 e per z 0, subendo una variazione molto accentuata nell’intorno di z = 0 — la funzione tanh ξ ha andamento sigmoidale, con derivata significativamente diversa da zero soltanto nell’intorno dell’origine ξ = 0. Il grafico di n(z) ha l’aspetto illustrato nella figura seguente: Le equazioni dei raggi, scritte per componenti, assumono allora la forma semplificata dx 1 1 ∂n dτx = τ = − τ τ x 2 ∂z z x ds ds n τ̂ dy dτy 1 1 ∂n = τy = − τz τy ds ds n τ̂ 2 ∂z ( ) 1 ∂n 1 ∂n dz dτz = − 2 τz τz ds = τz ds n ∂z τ̂ ∂z con n(z) dato dalla (9.3.1). Per esemplificare l’andamento delle soluzioni si considerino due raggi passanti per il comune punto P (0) di coordinate (x(0), y(0), z(0)) e con direzioni iniziali leggermente diverse. I raggi di condizioni iniziali rispettive x(0) = 0 y(0) = −1 z(0) = 1 τx (0) = 0 τy (0) = 0.979795897113 τz (0) = −0.2 x(0) = 0 y(0) = −1 z(0) = 1 τx (0) = 0 τy (0) = 0.994987437107 τz (0) = −0.1 e sono indicati con i simboli I e II nella figura di seguito riportata Stefano Siboni 134 Università degli studi di Trento Corso di Meccanica razionale 2 Si nota immediatamente che entrambi i raggi vengono riflessi nel semispazio z > 0 senza attraversare il piano coordinato Oxy; il raggio I, con l’angolo di incidenza maggiore, è anche quello con l’angolo di riflessione più alto, mentre il raggio II ha inferiori tanto l’angolo di incidenza quanto quello di riflessione. Collocando un osservatore in P (0) ed applicando il principio di invertibilità dei raggi luminosi, i raggi provenienti da un oggetto collocato nel semispazio z > 0 verranno percepiti, a seguito di una propagazione apparente in linea retta, come provenienti dal semispazio z < 0 e daranno luogo ad una immagine virtuale rovesciata dell’oggetto — miraggio. 9.4 Descrizione meccanica equivalente della propagazione dei raggi luminosi Il teorema di Fermat prevede che il percorso γ seguito dal raggio luminoso che congiunge i punti P1 e P2 è quello di minimo cammino ottico I = n(P ) ds . γ D’altra parte, il principio di Maupertuis — o di minima azione — stabilisce che per un punto materiale libero, di massa m e soggetto esclusivamente a sollecitazioni posizionali conservative di potenziale U(P ), la traiettoria γ corrispondente al moto naturale che il punto materiale percorre fra posizioni estreme fissate P1 e P2 e per un preassegnato valore E dell’energia è quella che rende stazionaria l’azione ridotta W = 2m[E + U(P )] ds . γ Si osserva allora che la condizione di stazionarietà δI = 0 risulta equivalente a quella meccanica δW = 0 a patto di considerare un punto materiale di massa unitaria soggetto Stefano Siboni 135 Università degli studi di Trento Corso di Meccanica razionale 2 ad una forza posizionale conservativa di potenziale U(P ) = n2 (P )/2 e limitatamente ai moti naturali di energia nulla, avendosi in tali condizioni " n(P )2 W = 2m[E + U(P )] ds = 2 n(P ) ds = I . ds = 2 γ γ γ Pertanto: i percorsi dei raggi luminosi si identificano tutti e soltanto con le traiettorie di energia nulla di un punto materiale libero di massa unitaria e soggetto esclusivamente a sollecitazioni posizionali conservative di potenziale n(P )2 /2. L’asserto è suscettibile di una verifica diretta. Le equazioni del moto per il punto materiale sopradescritto risultano infatti quelle lagrangiane P̈ = n(P ) ∇(P ) (9.4.1) ed ammettono l’ovvio integrale primo dell’energia meccanica H(P, Ṗ ) = 1 2 1 Ṗ − n(P )2 . 2 2 Lungo un qualsiasi moto naturale di energia nulla si ha 1 2 1 Ṗ − n(P )2 = 0 2 2 ossia, introducendo l’ascissa curvilinea s, ṡ2 = n(P )2 e quindi ṡ = n(P ) — il caso alternativo ṡ = −n(P ) si tratta in modo analogo e conduce allo stesso risultato. Di conseguenza la (9.4.1) diventa d dP n(P ) = n(P ) ∇n(P ) dt ds ma siccome il primo membro si riesprime come d dP d dP d dP n(P ) = ṡ n(P ) = n(P ) n(P ) dt ds ds ds ds ds ne deriva che Stefano Siboni d dP n(P ) − ∇n(P ) n(P ) = 0 . ds ds 136 Università degli studi di Trento Corso di Meccanica razionale 2 Basta ricordare che n(P ) ≥ 1 ∀ p ∈ R3 per giungere all’equazione delle traiettorie d dP n(P ) − ∇n(P ) = 0 ds ds ossia d (n τ̂ ) = ∇n ds che è precisamente l’equazione di propagazione dei raggi in ottica geometrica. Si osservi che, potendosi definire i funzionali del cammino ottico e dell’azione ridotta a meno di una costante moltiplicativa arbitraria senza per questo modificare i relativi principi variazionali, la condizione che il punto materiale equivalente abbia massa unitaria non è restrittiva e può essere in realtà rimossa. Sulla base di questa analogia formale fra i percorsi dei raggi luminosi e le traiettorie dei moti di energia nulla del punto materiale libero soggetto al potenziale n(P )2 /2, la rifrazione di un raggio luminoso che passa da un mezzo meno rifrangente — Ω1 di indice n1 — a uno più rifrangente — Ω2 di indice n2 > n1 — si può interpretare come moto di un punto materiale che si muove uniformemente tanto in Ω1 quanto in Ω2 ed accelera in corrispondenza dell’interfaccia fra i due mezzi a causa del gradiente di potenziale. La figura seguente illustra questa osservazione nel caso che l’indice di rifrazione, per esigenze di visualizzazione grafica, sia indipendente dalla coordinata z, quasi costante in due ampi dominii Ω1 , Ω2 di (x, y) e rapidamente variabile in una sottile regione di transizione fra i due. 9.5 Teorema di Noether Nella successiva discussione è di fondamentale importanza individuare gli integrali primi dell’equazione di propagazione dei raggi luminosi. A questo scopo è molto vantaggioso ricorrere al teorema di Noether, che associa appropriati integrali primi alle trasformazioni di invarianza della lagrangiana. Stefano Siboni 137 Università degli studi di Trento Corso di Meccanica razionale 2 Si consideri un sistema descritto dalle coordinate generalizzate q = (q1 , . . . , qn ) ∈ A = int(A) ⊆ Rn e governato dalle equazioni di evoluzione di Eulero-Lagrange d ∂L ∂L − = 0 h = 1, . . . , n (9.5.1) dt ∂ q̇h ∂qh con lagrangiana L(t, q, q̇), (t, q, q̇) ∈ R × A × Rn . Si supponga definita una famiglia di diffeomorfismi C 2 di A su A, interpretabili come trasformazioni di coordinate lagrangiane q → Q, dipendente in modo regolare C 2 dai parametri reali (α1 , . . . , αp ) = α ∈ U, p < n, essendo U un intorno aperto di α = 0 in Rp : Q = Q(q, α) ⇐⇒ Qk = Qk (q1 , . . . , qn , α1 , . . . , αp ) , k = 1, . . . , n ; la trasformazione di coordinate coincida con l’identità per α = 0: Q(q, 0) = q . La lagrangiana del sistema sia invariante rispetto ai diffeomorfismi Q(q, α) ∀ α ∈ U L(t, Q(t, α), Q̇(q, α)) = L(t, q, q̇) ∀α ∈ U , (9.5.2) essendo Q̇ = (Q̇1 , . . . , Q̇n ) la velocità generalizzata naturalmente indotta dalla trasformazione q → Q: n ∂Qk Q̇k = Q̇k (q, q̇, α) = (q, α) q˙h , ∂qh k = 1, . . . , n . h=1 In tali ipotesi si dimostra che il sistema ammette i p integrali primi, non necessariamente indipendenti, n ∂Qk ∂L (JO )r = (t, q, q̇) (q, α) r = 1, . . . , p . (9.5.3) ∂ q̇k ∂αr α=0 k=1 Per provare il teorema è sufficiente derivare parzialmente membro a membro la (9.5.2) rispetto ad un qualsiasi parametro αr , r = 1, . . . , p, per ottenere la relazione n ∂Qk ∂L (t, Q(q, α), Q̇(q, q̇, α)) (q, α)+ ∂Qk ∂αr k=1 n n ∂ ∂Qk ∂L (t, Q(q, α), Q̇(q, q̇, α)) (q, α) q̇h = 0 + ∂αr ∂qh ∂ Q̇k k=1 h=1 che può esprimersi nella forma equivalente n ∂L ∂Qk (t, Q(q, α), Q̇(q, q̇, α)) (q, α)+ ∂Qk ∂αr k=1 n ∂L ∂ 2 Qk (t, Q(q, α), Q̇(q, q̇, α)) (q, α) q˙h + ∂qh ∂αr ∂ Q̇k h=1 Stefano Siboni = 0 138 Università degli studi di Trento Corso di Meccanica razionale 2 e calcolata in α = 0 porge n n ∂Q ∂Qk ∂L ∂ ∂L k q̇h = 0 . (9.5.4) (t, q, q̇) (q, α) + (t, q, q̇) (q, α) ∂qk ∂αr ∂ q̇ ∂q ∂α k h r α=0 α=0 k=1 h=1 Lungo una arbitraria soluzione delle equazioni di evoluzione (9.5.1) vale la relazione d ∂L ∂L (t, q, q̇) = (t, q, q̇) k = 1, . . . , n ∂qk dt ∂ q̇k che sostituita in (9.5.4) fornisce n n ∂Q ∂Q d ∂L ∂ ∂L k k q̇h = 0 (t, q, q̇) (q, α) + (t, q, q̇) (q, α) dt ∂ q̇k ∂αr ∂ q̇ ∂q ∂α k h r α=0 α=0 k=1 h=1 ossia, applicando al secondo termine il teorema di derivazione delle funzioni composte n ∂L d ∂Qk d ∂L ∂Qk = 0 (t, q, q̇) (q, α) + (t, q, q̇) (q, α) dt ∂ q̇k ∂αr ∂ q̇ dt ∂α k r α=0 α=0 k=1 ed infine n d ∂L ∂Qk (t, q, q̇) (q, α) = 0. dt ∂ q̇k ∂αr α=0 k=1 Se ne conclude che la funzione entro parentesi quadre n ∂L ∂Qk (JO )r (t, q, q̇) = (t, q, q̇) (q, α) ∂ q̇k ∂αr α=0 (9.5.5) k=1 si mantiene costante lungo tutte le soluzioni delle equazioni di Eulero-Lagrange, delle quali costituisce pertanto un integrale primo. L’arbitrarietà dell’indice r = 1, . . . , p permette di concludere quanto affermato. 9.6 Campo di rifrazione a simmetria sferica Nell’equazione (9.6) si assuma che l’indice di rifrazione costituisca un campo scalare C 2 a simmetria sferica di centro O: il potenziale è funzione della distanza r del generico punto P dal centro O del campo n(P ) = η(r) , r = |P − O| . Per semplicità, nella trattazione che segue conviene indicare con x1 , x2 , x3 le coordinate del generico punto P ∈ R3 rispetto ad una terna Ox1 x2 x3 . Il simbolo x denoterà il corrispondente vettore colonna di tali componenti x1 x = x2 ∈ R3 . x3 Stefano Siboni 139 Università degli studi di Trento Corso di Meccanica razionale 2 Un campo con questo tipo di simmetria può modellare l’effetto di rifrazione prodotto da una atmosfera planetaria trasparente sui raggi luminosi provenienti da una sorgente astronomica — una stella, ad esempio. La rifrazione della luce determina variazioni sistematiche e significative nella posizione apparente degli astri, con particolare riguardo all’epoca del sorgere o del tramontare di questi, allorquando i raggi luminosi attraversano l’atmosfera in direzione fortemente non radiale e l’azione rifrangente risulta massima . Ciò è dovuto al fatto che i raggi luminosi vengono percepiti dall’occhio come propagantisi in linea retta — vedi figura. Integrale primo Nell’ipotesi di simmetria sferica del campo di rifrazione, la lagrangiana (9.3) è invariante per rotazioni arbitrarie. Ciò significa che sotto trasformazioni lineari ortogonali arbitrarie delle coordinate cartesiane e delle relative derivate prime X = Rx Ẋ = Rẋ la lagrangiana si mantiene inalterata L(X, Ẋ) = L(Rx, Rẋ) = L(x, ẋ) . Le matrici ortogonali R che descrivono le rotazioni possono scegliersi della forma 0 −α3 α2 0 −α1 (9.6.1) R(α) = exp α3 −α2 α1 0 funzione C ∞ dei tre parametri reali (α1 , α2 , α3 ) = α ∈ R3 , sicché è sempre lecito porre X = R(α)x = X(x, α). Per α = 0 si ha R(0) = I e la trasformazione di coordinate si riduce all’identità. Il teorema di Noether prevede che il sistema debba ammettere i tre integrali primi definiti dalle espressioni 3 ∂Xk ∂L (x, ẋ) (x, α) (JO )r = ∂ ẋk ∂αr α=0 r = 1, 2, 3 k=1 Stefano Siboni 140 Università degli studi di Trento Corso di Meccanica razionale 2 in cui le derivate parziali prime rispetto ai parametri della trasformazione valgono 3 3 ∂Xk ∂R ∂Rkj kj (x, α) = (α)xj = (0)xj ∂αr ∂αr ∂αr α=0 α=0 j=1 mentre j=1 ẋk ∂L dxk (x, ẋ) = η(|x|) = η(|x|) = η(|x|)τk ∂ ẋk |ẋ| ds e pertanto 3 ∂Rkj dxk (0) xj (JO )r = η(|x|) ∂αr ds r = 1, 2, 3 . (9.6.2) k,j=1 D’altra parte l’espressione (9.6.1) porge, per definizione di esponenziale di una matrice, n ∞ 0 −α3 α2 0 −α3 α2 1 α→0 α3 0 −α1 = I + α3 0 −α1 + o(|α|) R(α) = n! n=0 −α2 α1 0 −α2 α1 0 e di conseguenza deve aversi Rkj (α) = δkj − εkjr αr + o(|α|) in modo che risulta ∂Rkj (α) = −εkjr + o(1) ∂αr (α → 0) (α → 0) e per α = 0 vale ∂Rkj (0) = −εkjr . ∂αr (9.6.3) Non resta che sostituire (9.6.3) in (9.6.2) per ricavare l’espressione esplicita degli integrali primi (JO )r = η(|x|) 3 k,j=1 (−εkjr ) xj 3 dxk dxk = η(|x|) εrjk xj ds ds r = 1, 2, 3 j,k=1 i quali altro non sono se non le componenti cartesiane del vettore JO = η(|x|)x ∧ dP dx = η(|P − O|) (P − O) ∧ = η(|P − O|) (P − O) ∧ τ̂ . ds ds (9.6.4) Allo stesso risultato si perviene interpretando i parametri α come funzioni regolari del tempo tali che α(0) = 0. In tal modo R è una matrice di rotazione dipendente dal tempo che descrive un qualsiasi moto rotatorio del sistema con punto fisso O e tale che R(0) = I. Dal teorema di Poisson per l’atto di moto rigido si deduce allora che per ogni punto x vale 3 d R[α(t)]x = ω ∧ R[α(t)]x = ωr êr ∧ R[α(t)]x dt r=1 Stefano Siboni 141 Università degli studi di Trento Corso di Meccanica razionale 2 e quindi all’istante iniziale t = 0 3 d R[α(t)]x = ωr êr ∧ x dt t=0 r=1 (9.6.5) espressione nella quale la velocità angolare istantanea ω può essere un qualsiasi vettore di R3 , di componenti ω1 , ω2 , ω3 arbitrarie. Una applicazione del teorema di derivazione delle funzioni composte al primo membro della (9.6.5) porge peraltro 3 3 ∂R α̇r (0) (0)x = ωr êr ∧ x ∂α r r=1 r=1 e basta identificare le derivate arbitrarie α̇r (0) con le componenti ωr della velocità angolare istantanea a t = 0 per ottenere ∂R (0) x = êr ∧ x ∂αr r = 1, 2, 3 da cui, per l’arbitrarietà di x ∈ R3 , segue la (9.6.3). L’integrale JO presenta una evidente analogia formale con il momento angolare, la cui conservazione per un punto materiale libero di muoversi in un campo di forze centrali segue infatti dall’invarianza del potenziale scalare per rotazioni attorno al centro e da una analoga applicazione del teorema di Noether. Beninteso, dal punto di vista fisico non mancano le differenze: in luogo della massa costante troviamo l’indice di rifrazione, che è funzione della posizione, mentre la velocità istantanea viene sostituita dal versore tangente al raggio luminoso nella posizione considerata. Verifica diretta dell’integrale primo L’esistenza dell’integrale primo (9.6.4) può essere stabilita anche per via diretta, manipolando l’equazione dei raggi (9.5). In forza della simmetria del potenziale, le componenti del gradiente di n(P ) assumono una forma assai particolare ∂n dη ∂r dη xi = = ∂xi dr ∂xi dr r i = 1, 2, 3 . Conviene porre P − O = r r̂ dove r̂ è il versore radiale concorde con il raggio vettore P − O. Si ottiene allora per il gradiente dell’indice di rifrazione l’espressione ∇n = 1 dη dη (r) (P − O) = (r) r̂ , dr |P − O| dr mentre il versore tangente al raggio luminoso si scrive τ̂ = Stefano Siboni dP dr dr̂ = r̂ + r ds ds ds 142 Università degli studi di Trento Corso di Meccanica razionale 2 e l’unitarietà del suo modulo impone che si abbia 1 = dr 2 ds dr̂ 2 + r2 ds dal momento che dr̂/ds è un vettore ortogonale ad r̂ d 1 dr̂ d 1 2 = 0. = · r̂ = r̂ ds ds 2 ds 2 L’equazione di propagazione diventa dr dτ̂ 1 dη dη dr̂ dr dr̂ = = r̂ − r̂ · r̂ + r r̂ + r ds η dr dr ds ds ds ds 1 dη dη dr dr dr̂ dη dr dr̂ 1 dη = r̂ − r̂ + r r̂ − r̂ + r = η dr dr ds ds ds η dr ds ds ds e di conseguenza è possibile scrivere dP dτ̂ d [(P − O) ∧ τ̂ ] = ∧ τ̂ + (P − O) ∧ = ds ds ds dη dr dr̂ 1 dη r̂ − r̂ + r = = τ̂ ∧ τ̂ + r r̂ ∧ η dr ds ds ds 1 1 dη dη dr dr̂ = − r r̂ ∧ = − r̂ + r (P − O) ∧ τ̂ η ds ds ds η ds ovvero η o ancora dη d [(P − O) ∧ τ̂ ] + (P − O) ∧ τ̂ = 0 ds ds d [η(P − O) ∧ τ̂ ] = 0 . ds Pertanto il vettore entro parentesi quadre JO = η(P − O) ∧ τ̂ è un integrale primo del sistema, come si voleva verificare. Traiettorie piane L’esistenza dell’integrale primo (9.6.4) ha come immediata conseguenza il fatto che le traiettorie di tutti i raggi luminosi sono piane. Si devono distinguere due casi. (i) Se JO = 0 allora, essendo η ≥ 1 si ha (P − O) ∧ τ̂ = 0, ossia (P − O) ∧ Stefano Siboni dP = 0 ds 143 Università degli studi di Trento Corso di Meccanica razionale 2 e quindi dP = λ(s)(P − O) ds per cui, usando ad esempio il metodo del fattore integrante, la traiettoria del raggio deve essere descritta da una espressione del tipo ) (s λ(ξ) dξ [P (0) − O] P (s) − O = exp 0 dalla quale appare evidente che il raggio luminoso si propaga in direzione radiale. (ii) Se viceversa JO = 0 risulta invece JO · (P − O) = η(P − O) ∧ τ̂ · (P − O) = 0 che è l’equazione cartesiana di un piano passante per l’origine; il raggio luminoso percorre dunque una traiettoria piana. Il piano è quello passante per O e normale al vettore JO , ovvero quello contenente i valori iniziali dei vettori P − O e τ̂ . La circostanza (i) non appare particolarmente interessante, in quanto la propagazione del raggio avviene semplicemente lungo una retta passante per il centro del campo di rifrazione. Nella discussione seguente ci si limiterà pertanto a considerare il solo caso (ii), con JO = 0. Si osservi comunque la stretta analogia con la prova che tutte le traiettorie di un punto materiale libero in un campo di forze centrali sono piane: nel caso meccanico l’argomento usato è la conservazione del momento angolare calcolato rispetto al centro del campo, mentre nella circostanza presente si fa uso, in modo sostanzialmente identico, dell’analogo integrale JO . Terna cartesiana adattata al piano di giacitura della traiettoria Come per i moti centrali conviene scegliere una terna di riferimento cartesiana ortogonale in modo che Oxy sia il piano di giacitura del raggio e quindi JO = c ê3 , con c = 0 costante reale opportuna. Pagando il prezzo di una eventuale rotazione supplementare che inverta l’orientamento dell’asse Oz, può sempre ritenersi c > 0. In tale ipotesi si avrà allora dx dy dx dy ê1 + ê2 = n x −y ê3 c ê3 = n(xê1 + yê2 ) ∧ ds ds ds ds e quindi dy dx = c. (9.6.6) n x −y ds ds In coordinate polari piane risulta x = r cos φ y = r sin φ Stefano Siboni dr dφ dx = cos φ − r sin φ ds ds ds dr dφ dy = sin φ + r cos φ ds ds ds (9.6.7) 144 Università degli studi di Trento Corso di Meccanica razionale 2 per cui x dy dφ dx −y = r2 ds ds ds e la condizione (9.6.6) assume la forma η(r) r2 dφ = c. ds (9.6.8) Vale la pena di sottolineare che il valore della costante c è completamente specificato dalle condizioni iniziali per mezzo della relazione c = |JO | = |η(|P − O|)(P − O) ∧ τˆ| ovvero, con la particolare scelta della terna di riferimento considerata, mediante la formula c = η(r)(xτy − yτx ) . (9.6.9) È altresı̀ evidente dalla (9.6.8) che la costante c non può eccedere, in valore assoluto, il massimo di rη(r) per r > 0: 2 dφ dφ 2 dr 2 + = rη(r) ≤ sup rη(r) . |c| = rη(r) r ≤ rη(r) r ds ds ds r>0 (9.6.10) Nonostante la sua interpretazione fisica sia alquanto diversa, l’equazione (9.6.8) richiama alla memoria la legge delle aree — o prima legge di Keplero — per i moti centrali. Equazione delle traiettorie in coordinate polari piane Usando le coordinate polari (9.6.7) nel piano Oxy di giacitura della traiettoria, l’equazione (9.5) del raggio luminoso diventa 1 dη dτ̂ = (r)(r̂ − r̂ · τ̂ τ̂ ) ds η(r) dr d (r cos φ ê + r sin φ ê ) = τ̂ . 1 2 ds (9.6.11) La seconda equazione fornisce le equazioni scalari dr dφ cos φ − r sin φ = τx ds ds dφ dr sin φ + r cos φ = τy ds ds che possono facilmente ricondursi alla forma normale del primo ordine dr = τx cos φ + τy sin φ ds 1 dφ = (−τx sin φ + τy cos φ) . ds r Stefano Siboni 145 Università degli studi di Trento Corso di Meccanica razionale 2 Ricordando che r̂ = cos φ ê1 + sin φ ê2 , le equazioni (9.6.11) si riducono a dτx 1 dη = (r) cos φ − (τx cos φ + τy sin φ) τx ds η(r) dr 1 dη dτ y = (r) sin φ − (τx cos φ + τy sin φ) τy ds η(r) dr dr = τx cos φ + τy sin φ ds 1 dφ = (−τx sin φ + τy cos φ) . ds r (9.6.12) in forma normale del primo ordine nelle quattro variabili dipendenti (r, φ, τx , τy ) ∈ R+ ×R3 , con τx2 + τy2 = 1. Esistenza ed unicità della soluzione massimale per qualsiasi problema di Cauchy sono già state provate nel caso generale; tuttavia è molto semplice stabilire il risultato anche in coordinate polari, eseguendo le sostituzioni (τx cos φ + τy sin φ) τx −−−−−−→ τx cos φ + τy sin φ τx τx2 + τy2 (τx cos φ + τy sin φ) τy −−−−−−→ τx cos φ + τy sin φ τy τx2 + τy2 nei membri destri delle prime due equazioni, assumendo (τx , τy ) ∈ R2 \ {0} e verificando che τx2 + τy2 costituisce un integrale primo del sistema di equazioni cosı̀ modificato. Equazione delle traiettorie in coordinate polari: angolo φ come variabile indipendente L’espressione (9.6.4), per JO = 0, esclude che la traiettoria massimale del raggio luminoso possa attraversare il centro del campo di rifrazione dove peraltro il sistema di coordinate polari risulterebbe singolare. In caso contrario si avrebbe infatti, contro l’ipotesi di JO non nullo, JO = η(|P − O|)(P − O) ∧ τ̂ = η(0) 0 ∧ τ̂ = 0 . La stessa conclusione è confermata dalla corrispondente espressione in coordinate polari (9.6.8), dalla quale è perciò lecito dedurre che lungo la traiettoria massimale deve aversi dφ c = > 0. ds η(r)r2 (9.6.13) Nel proprio intervallo di definizione, la parte angolare φ(s) della soluzione completa deve quindi risultare una funzione monotòna crescente dell’ascissa curvilinea s, in modo che appare definita la corrispondente funzione inversa s = s(φ) . La funzione è di classe C 2 nel proprio intervallo di definizione, lo si può verificare facilmente applicando il teorema delle funzioni implicite alla funzione C 2 di s e φ s F (φ, s) = −φ + φ(0) + c ds η(r) r2 0 Stefano Siboni 146 Università degli studi di Trento Corso di Meccanica razionale 2 per la quale risulta c ∂F > 0. (φ, s) = ∂s η[r(s)] r(s)2 La derivata prima della funzione s(φ) risulta, in particolare, 1 ds (φ) = η(r) r2 dφ c (9.6.14) È cosı̀ possibile usare l’angolo φ in luogo dell’ascissa curvilinea s come variabile indipendente e considerare quindi in luogo della soluzione (r(s), φ(s)) la sola funzione incognita r = r[s(φ)] = r(φ) che rappresenta la traiettoria del raggio direttamente — e non parametricamente — in coordinate polari piane. Il versore tangente τ̂ sarà poi determinabile calcolando la derivata prima della parametrizzazione e normalizzando il risultato. Per un assegnato valore non nullo della costante c è dato di scrivere una equazione differenziale delle orbite per la funzione r(φ). A questo scopo conviene riprendere l’equazione dei raggi nella forma primitiva (9.4) ed esprimerla in coordinate polari nel piano di giacitura Oxy, proiettandola lungo gli assi Ox e Oy ed eliminando τ̂ : d d dη ds η ds (r cos φ) = dr cos φ (9.6.15) d dη d ds η ds (r sin φ) = dr sin φ . Con il cambiamento di variabile indipendente s → φ e ricordando la (9.6.13) le espressioni entro parentesi quadre diventano c dr d cos φ − r sin φ η (r cos φ) = 2 ds r dφ d c dr η (r sin φ) = 2 sin φ + r cos φ ds r dφ per cui le (9.6.15) assumono la forma c dr c dη d cos φ − r sin φ = cos φ ηr2 dφ r2 dφ dr dη c d c dr sin φ = ηr2 dφ r2 dφ sin φ + r cos φ dr che equivale a Stefano Siboni c2 d d 1 1 dη ηr2 dφ − dφ r cos φ − r sin φ = dr cos φ d 1 1 dη c2 d ηr2 dφ − dφ r sin φ + r cos φ = dr sin φ . 147 Università degli studi di Trento Vale d’altra parte Corso di Meccanica razionale 2 dη dη(r) d 1 1 dη(r) (r) = = − 2 dr d(1/r) dr r r d(1/r) per cui ponendo 1/r = u ∈ (0, +∞) e η(1/u) = η̃(u) si ottiene 2 du 2c d 2 dη̃ u η̃ dφ − dφ cos φ − u sin φ = −u du cos φ 2 du 2c d 2 dη̃ u η̃ dφ − dφ sin φ + u cos φ = −u du sin φ ossia 2 c d du dη̃ cos φ + u sin φ = cos φ η̃ dφ dφ du c2 d du dη̃ sin φ − u cos φ = sin φ η̃ dφ dφ du ed infine d du η̃ dη̃ cos φ + u sin φ = 2 cos φ dφ dφ c du η̃ dη̃ d du sin φ − u cos φ = 2 sin φ . dφ dφ c du Non rimane che eseguire le derivate a primo membro per ricavare le equazioni 2 d u cos φ − du sin φ + dφ2 dφ 2 du d u 2 sin φ + cos φ − dφ dφ du η̃ dη̃ sin φ + u cos φ = 2 cos φ dφ c du du η̃ dη̃ cos φ + u sin φ = 2 sin φ dφ c du che semplificando e raccogliendo i fattori comuni si riducono a 2 d u +u− dφ2 d2 u +u− dφ2 η̃ dη̃ cos φ = 0 c2 du η̃ dη̃ sin φ = 0 . c2 du Non potendo risultare cos φ e sin φ simultaneamente nulli, il sistema è equivalente alla sola equazione differenziale scalare η̃ dη̃ d2 u = 0 +u− 2 2 dφ c du (9.6.16) che costituisce l’equazione delle orbite cercata. Stefano Siboni 148 Università degli studi di Trento Corso di Meccanica razionale 2 Analisi di Weierstrass A patto di sostituire l’angolo φ con il tempo, l’equazione (9.6.16) ha una forma analoga a quella del moto di un sistema scleronomo unidimensionale soggetto soltanto a sollecitazioni posizionali conservative, dal momento che può scriversi come d2 u 1 dη̃ 1 2 d 1 2 dW u − 2 η̃ (u) = 2 η̃ (u) − u = − (u) = − 2 dφ c du du 2 c du in termini dell’energia potenziale formale 1 2 1 2 u − 2 η̃ (u) . W (u) = 2 c (9.6.17) L’equazione delle orbite (9.6.16) ammette dunque l’integrale primo, analogo dell’energia meccanica, du 1 du 2 H u, = + W (u) (9.6.18) dφ 2 dφ che consente di applicare l’analisi di Weierstrass allo studio qualitativo delle soluzioni u = u(φ) e dunque di r = r(φ) = 1/u(φ). In realtà la discussione di Weierstrass deve essere utilizzata in un modo molto particolare, in quanto l’integrale primo (9.6.18) è identicamente nullo. Ciò è dovuto al fatto che nelle equazioni (9.6.15) di propagazione dei raggi la variabile indipendente s non costituisce un parametro qualsiasi ma rappresenta una ascissa curvilinea, legata dunque a r(s) e φ(s) dalla relazione differenziale ds2 = dr2 + r2 dφ2 . Si ha cosı̀ ds 2 dφ = dr 2 dφ + r2 per cui, sostituendo la (9.6.14), dr 2 1 2 4 η(r) r = + r2 c2 dφ e quindi 1 1 1 dr 2 + 2 − 2 η(r)2 = 0 . 4 r dφ r c Basta infine porre u = 1/r per ottenere du 2 dφ + u2 − 1 η̃(u)2 = 0 c2 e concludere che H(u, du/dφ) = 0, come affermato. La funzione di Weierstrass dipende perciò unicamente dalla costante c Ψc (u) = Stefano Siboni 1 η̃(u)2 − u2 c2 149 Università degli studi di Trento Corso di Meccanica razionale 2 a sua volta determinata univocamente dalle condizioni iniziali per mezzo della (9.6.9) o, in coordinate polari, da 1 c = η(r) r (τu cos φ − τx sin φ) = η̃(u)(τy cos φ − τx sin φ) . u Per stabilire l’andamento qualitativo della soluzione radiale u = u(φ) occorre e basta determinare gli zeri della funzione Ψc , ossia le soluzioni di 1 1 η̃(u) + u η̃(u) − u = 0 c c che per per l’essere c > 0 e u > 0 si identificano con le soluzioni dell’equazione η̃(u) − cu = 0 , u > 0. È altresı̀ importante stabilire il simultaneo annullarsi o meno della derivata prima di Ψc dΨc 1 dη̃ 1 1 1 dη̃ (u) = (u) + 1 η̃(u) − u + η̃(u) + u (u) − 1 (9.6.19) du c du c c c du onde assicurarsi che lo zero di Ψc sia semplice o doppio, rappresentando nel primo un caso un punto di inversione della soluzione, ovvero un punto di meta asintotica nel secondo. Si osservi che in corrispondenza di un punto critico di Ψc , la derivata (9.6.19) si semplifica in modo significativo, riducendosi all’espressione dΨc 1 1 dη̃ (u) = η̃(u) + u (u) − 1 du c c du in cui annullarsi o meno dipende unicamente dal secondo fattore dη̃ dΨc (u) = 0 ⇐⇒ (u) = c , u > 0 . du du Giova ricordare che per via della relazione (9.6.10) la costante c deve soddisfare la diseguaglianza c ≤ sup η̃(u)/u . u>0 A titolo esemplificativo, si supponga che la funzione η̃(u) abbia l’andamento illustrato nel grafico seguente. Si osservi, in particolare, che per u → 0+ — ovvero per r → +∞ — l’indice di rifrazione tende al valore +1, caratteristico del vuoto. Stefano Siboni 150 Università degli studi di Trento Corso di Meccanica razionale 2 Secondo il valore della costante c > 0 possono distinguersi varie tipologie di traiettorie; quelle più interessanti corrispondono ai casi notevoli illustrati nel seguito, per valori decrescenti di c. Primo caso Per c > 0 sufficientemente grande esiste un unico punto di intersezione u = umax fra il grafico di η̃(u) e la retta cu; in u = umax il grafico di η̃(u) ha pendenza minore di c per cui il punto rappresenta uno zero semplice della funzione di Weierstrass Ψc , punto di inversione della soluzione. Per una variazione finita ∆φ della variabile angolare la soluzione u(φ) passa da 0 al suo valore massimo umax , essendo umax ∆φ = 0 1 Ψc (u) umax " du = 0 1 1 η̃(u)2 − u2 c2 du integrale generalizzato convergente. Con una ulteriore variazione ∆φ dell’angolo φ la soluzione passa a ritroso dal valore massimo a zero. In coordinate polari il raggio parte dall’infinito e al crescere di φ si avvicina monotonicamente al centro, raggiungendo una distanza minima r = 1/umax da questo mentre l’angolo varia di ∆φ rispetto al proprio valore iniziale; superata questa posizione di massimo avvicinamento il raggio torna ad allontanarsi dal centro e si porta a distanza infinita con una ulteriore variazione ∆φ dell’anomalia. La variazione complessiva subita dalla variabile angolare lungo la traiettoria completa del raggio vale 2∆φ e la deflessione totale del raggio si scrive perciò umax " ∆φdeflessione = 2∆φ − π = 2 0 1 1 η̃(u)2 − u2 c2 du − π . La figura sottoriportata illustra quanto affermato. Stefano Siboni 151 Università degli studi di Trento Corso di Meccanica razionale 2 Secondo caso Se la costante c scende ad un valore critico c1 la retta c1 u oltre ad intersecare il grafico di η̃(u) in un punto umas analogo a quello considerato nel caso precedente, risulta altresı̀ tangente a detto grafico in un successivo punto u0 > umax — vedi figura. Accanto alla soluzione di codominio (0, umax ], che presenta un andamento simile a quella già esaminata nel primo caso, compare una soluzione costante u(φ) = u0, ∀ φ ∈ R, che corrisponde ad una traiettoria circolare del raggio luminoso ad una distanza dal centro pari a 1/u0 . Stefano Siboni 152 Università degli studi di Trento Corso di Meccanica razionale 2 Terzo caso Per c > 0 un poco più piccolo di c1 si ha ancora una intersezione propria del tipo umax come nei casi precedenti, oltre alla quale tuttavia compaiono altre due intersezioni proprie u− e u+ , con umax < u− < u+ e η̃(u) > cu ∀ u ∈ (u− , u+ ) . In quanto intersezioni proprie fra i due grafici, entrambi i punti u− e u+ sono punti di inversione della soluzione, che risulta perciò periodica e di codominio chiuso [u− , u+], alternando tratti crescenti a tratti decrescenti definiti su uguali intervalli della variabile angolare. La traiettoria del raggio è quindi completamente compresa fra le circonferenze di centro O e raggi rispettivi 1/u+ e 1/u− . Il minimo periodo positivo è dato dall’integrale di Weierstrass completo u+ Tφ = 2 u− 1 du = 2 Ψc (u) u+ " u− 1 1 η̃(u)2 − u2 c2 du (9.6.20) sicché risulta u(φ + Tφ ) = u(φ) ∀ φ ∈ R. In particolare Tφ rappresenta l’intervallo angolare fra due posizioni successive del raggio luminoso alla minima distanza 1/u+ dal centro — pericentro. Da ciò è evidente che il raggio luminoso si richiude su sè stesso se e soltanto se esistono due interi positivi m, q ∈ N tali che Tφ = 2π m q in modo che in m rivoluzioni complete attorno al centro O il raggio luminoso compie un numero intero q di passaggi al pericentro. In caso contrario il raggio riempie densamente la corona circolare chiusa di centro O e compresa fra i raggi 1/u+ e 1/u− , come illustrato nella figura seguente. Stefano Siboni 153 Università degli studi di Trento Corso di Meccanica razionale 2 Quarto caso Riducendo ulteriormente la costante c si perviene ad un valore critico c2 in corrispondenza del quale i grafici di η̃(u) e c2 u hanno un punto di tangenza in u0 ed una intersezione propria per u = umax > u0 — vedi figura. Si hanno orbite per valori iniziali di u minori di u0, uguali a u0 , oppure compresi nell’intervallo (u0 , umax ]. Se u < u0 e du/dφ < 0 la soluzione u(φ) decresce monotonicamente a zero, in modo che il raggio si allontana indefinitamente dal centro compiendo un numero finito di rivoluzioni — l’integrale di Weierstrass fra 0 e u < u0 è convergente. Se all’opposto u < u0 ma du/dφ > 0, u(φ) tende asintoticamente crescendo al valore asintotico u0 , eseguendo nel contempo un numero infinito di rivoluzioni attorno al centro — integrale di Weierstrass divergente. Qualora u0 sia il valore iniziale della variabile u, l’equazione del raggio è semplicemente u(φ) = u0 ∀ φ ∈ R e la propagazione avviene lungo una circonferenza di centro O e raggio 1/u0. Se infine il dato iniziale per la variabile u sia compreso nell’intervallo Stefano Siboni 154 Università degli studi di Trento Corso di Meccanica razionale 2 (u0 , umax ], la soluzione massimale presenta i comportamenti asintotici lim u(φ) = u0 φ→−∞ lim u(φ) = u0 φ→+∞ risultando tangente alla circonferenza di centro O e raggio 1/umax — vedi figura. Dalla figura è altresı̀ evidente, come peraltro appare ovvio, che la circonferenza centrata in O e di raggio 1/u0 costituisce l’insieme α-limite e l’insieme ω-limite della soluzione 1/u(φ). Quest’ultima tipologia di traiettorie, la più interessante, è rappresentata qualitativamente nella figura sottoriportata Quinto caso Se infine si considera c < c2 i grafici di η̃(u) e di cu assumono una disposizione relativa molto simile a quella già considerata nel primo caso, con un unico punto di intersezione propria in u = umax. La differenza consiste nel fatto che il valore critico umax risulta più elevato, per cui il raggio luminoso transita ad una distanza minima del centro inferiore rispetto al caso considerato in precedenza. Stefano Siboni 155 Università degli studi di Trento Corso di Meccanica razionale 2 9.7 Integrale primo del tipo Runge-Lenz È ben noto dalla meccanica che un punto materiale P in moto in un campo centrale di tipo coulombiano/kepleriano, di potenziale V (r) = −k/r, ammette come integrale primo notevole il vettore A(P, Ṗ ) = mṖ ∧ [(P − O) ∧ Ṗ ] − mk P −O |P − O| (9.7.1) che è definito grazie alla particolare dipendenza del campo dalla distanza r = |P − O| di P dal centro O del campo e si aggiunge agli integrali primi del momento angolare in O e dell’energia meccanica, validi per qualsiasi campo di forze centrali. L’integrale primo (9.7.1) è noto come integrale di Runge-Lenz ed è responsabile del fatto che nel campo newtoniano tutte le orbite limitate sono chiuse — ellittiche. Si è già sottolineato che le traiettorie dei raggi luminosi in un mezzo con indice di rifrazione n(P ) si identificano con quelle di un punto materiale libero di massa unitaria e soggetto a una forza conservativa di potenziale n(P )2 /2; ci si aspetta pertanto che l’equazione di propagazione di un raggio luminoso in un campo di rifrazione del tipo " α +β , P ∈ R3 , n(P ) = |P − O| con α > 0 e β ≥ 1, debba ammettere un integrale primo di forma analoga a (9.7.1). Naturalmente, in luogo della massa si deve considerare l’indice di rifrazione e la velocità istantanea del punto materiale viene sostituita dalla derivata del parametrizzazione rispetto all’ascissa curvilinea. Posto per brevità P − O = x, si vuole quindi verificare che per η(r) = α/r + β il campo vettoriale A(x, dx/ds) = η(r) dx α x dx ∧ x ∧ η(r) − ds ds 2r (9.7.2) costituisce un integrale primo per le equazioni (9.4). Derivando il primo termine nel secondo membro della (9.7.2) lungo le soluzioni delle (9.4) si ottiene dx dx d η ∧ x∧η = ds ds ds dx dx dx dx d dx d dx η ∧ x∧η +η ∧ ∧η +x∧ η = ds ds ds ds ds ds ds ds dx dx dη x dη x ∧ x∧η +η ∧ x∧ = dr r ds ds dr r espressione nella quale il primo termine, il solo non nullo, si riscrive come dx dη dx x dx x · x dη x ∧ x∧η = xη · − η = dr r ds dr ds r ds r η d x2 dx dη η dr dx dη x − ηr = x r − ηr = dr r ds 2 ds dr r ds ds Stefano Siboni 156 Università degli studi di Trento Corso di Meccanica razionale 2 e raccogliendo i fattori comuni diventa dη dr dx η x −r . dr ds ds (9.7.3) Si può riesprimere (9.7.3) evidenziando la derivata del vettore x/r dr dx dη 2 d x dη 2 r ds − x ds = −η −η r r dr r2 dr ds r e il risultato si riduce a α d x d α x = 2 ds r ds 2 r a patto di assumere che sia dη 2 α r = − dr 2 per α ∈ R costante assegnata. Si conclude pertanto che d dx dx α x − η(r) ∧ x ∧ η(r) ds ds ds 2r η (9.7.4) = 0 per qualsiasi funzione η(r) soluzione positiva dell’equazione (9.7.4), che si ricava per separazione di variabili " α η(r) = +β r e nella quale si deve richiedere che sia α > 0 e β ≥ 1 in modo da assicurare il requisito fisico di η(r) ≥ 1 ∀ r > 0. L’integrale primo (9.7.2) è l’equivalente, nel caso ottico, dell’integrale di Runge-Lenz per il problema di Keplero. 9.8 Campo di rifrazione a simmetria assiale Si supponga che l’indice di rifrazione costituisca un campo scalare C 2 con simmetria assiale rispetto all’asse On̂. Se si indica con R(θ) la matrice ortogonale che descrive una rotazione di un angolo θ attorno all’asse On̂, in modo che R(0) = I, sostituendo a θ una qualsiasi funzione regolare θ(t) del tempo il teorema di Poisson consente di scrivere la relazione d R[θ(t)]x = θ̇(t) n̂ ∧ R[θ(t)]x dt che all’istante iniziale t = 0 si riduce a d = θ̇(0) n̂ ∧ x . R[θ(t)]x dt t=0 Basta allora ricorrere al teorema di derivazione delle funzioni composte al primo membro θ̇(0) Stefano Siboni ∂R (0)x = θ̇(0) n̂ ∧ x ∂θ 157 Università degli studi di Trento Corso di Meccanica razionale 2 e ricordare l’arbitrarietà di θ̇(0) per concludere che ∂R (0)x = n̂ ∧ x ∂θ ∀ x ∈ R3 . Dal teorema di Noether e dall’invarianza della lagrangiana (9.3) sotto rotazioni del tipo R(θ) segue allora che un integrale primo del sistema (9.5) si scrive 3 ∂L ∂L ∂R ∂L ∂R (0) x = · (0) x = · n̂ ∧ x = ∂ ẋi ∂θ ∂ ẋ ∂θ ∂ ẋ i (9.8.1) i=1 ∂L ẋ dx = n̂ · x ∧ = n̂ · x ∧ n(x) = n̂ · x ∧ n(x) = n̂ · JO ∂ ẋ |ẋ| ds espressione identificabile con la componente di JO lungo l’asse di simmetria. Un modo alternativo ma del tutto equivalente di ottenere questo risultato consiste nel considerare l’asse coordinato Ox3 come asse di simmetria, in modo che risulti ! n(x) = n( x21 + x22 , x3 ) (9.8.2) e la lagrangiana (9.3) sia quindi invariante L(x, ẋ) = L[R(θ)x, R(θ)ẋ] per qualsiasi rotazione attorno all’asse di simmetria cos θ sin θ R(θ) = 0 Vale allora 0 ∂R (0) = 1 ∂θ 0 per cui 0 ∂R (0)x = 1 ∂θ 0 0 0 1 − sin θ cos θ 0 −1 0 0 ∀θ ∈ R. 0 0 0 −1 0 x1 −x2 0 0 x2 = x1 = ê3 ∧ x 0 0 x3 0 e l’integrale primo di Noether (9.5.5) diventa ∂L ∂L ∂R ∂L dx · (0)x = · ê3 ∧ x = ê3 · x ∧ = ê3 · x ∧ n(x) ∂ ẋ ∂θ ∂ ẋ ∂ ẋ ds in accordo con il risultato precedente per n̂ = ê3 . Stefano Siboni 158 Università degli studi di Trento Corso di Meccanica razionale 2 Terna di riferimento adattata all’asse di simmetria del campo In presenza di un asse di simmetria è sempre dato di scegliere la terna di riferimento Oxyz in modo che l’asse coordinato Oz concida con l’asse di simmetria e l’indice di rifrazione sia un campo scalare della forma (9.8.2) n(x, y, z) = η( x2 + y 2 , z) (x, y, z) ∈ R3 . In coordinate cilindriche si ha x = ρ cos φ y = ρ sin φ dx dρ dφ = cos φ − ρ sin φ ds ds ds dρ dφ dy = sin φ + ρ cos φ ds ds ds per cui x dρ dρ dy dx dφ dφ dφ − ρ sin φ = ρ2 −y = ρ cos φ sin φ + ρ cos φ cos φ − ρ sin φ ds ds ds ds ds ds ds e l’integrale primo (9.8.1) assume perciò la forma n̂ · JO = η(ρ, z) ρ2 dφ . ds (9.8.3) Da quest’ultima relazione è immediato verificare che i valori della costante del moto devono soddisfare la limitazione 1/2 dφ dφ 2 dr 2 + = |n̂ · JO | = ρ η(ρ, z)ρ ≤ ρ η(ρ, z) ρ ds ds ds = ρ η(ρ, z) ≤ sup (9.8.4) ρ η(ρ, z) . (ρ,z)∈R+ ×R Equazione delle traiettorie in coordinate cilindriche Scritta in coordinate cilindriche, l’equazione τ̂ = dP/ds diventa τ̂ = d (ρ cos φ ê1 + ρ sin φ ê2 + z ê3 ) ds cui corrispondono le componenti dρ dφ cos φ − ρ sin φ τx = ds ds dφ dρ sin φ + ρ cos φ τy = ds ds dz τz = ds Stefano Siboni 159 Università degli studi di Trento Corso di Meccanica razionale 2 la cui inversione è immediata dρ = τx cos φ + τy sin φ ds dφ 1 1 = − τx sin φ + τy cos φ ds ρ ρ dz = τz . ds (9.8.5) Le equazioni differenziali ottenute, del primo ordine ed in forma normale, chiudono le equazioni (9.5) del raggio luminoso, che in coordinate cilindriche si riducono a ∂η dρ ∂η dz dτx 1 ∂η 1 ∂η dη τx = cos φ − τx = cos φ − + ds η(ρ, z) ∂ρ ds η(ρ, z) ∂ρ ∂ρ ds ∂z ds dτ ∂η dρ ∂η dz 1 ∂η 1 ∂η dη y = sin φ − τy = sin φ − + τy ds η(ρ, z) ∂ρ ds η(ρ, z) ∂ρ ∂ρ ds ∂z ds 1 ∂η ∂η dρ ∂η dz dτz 1 ∂η dη τz . = = − τz − + ds η(ρ, z) ∂z ds η(ρ, z) ∂z ∂ρ ds ∂z ds La propagazione dei raggi luminosi è quindi governata dal sistema di 6 equazioni differenziali del primo ordine in forma normale di 6 variabili: dρ = τx cos φ + τy sin φ ds 1 1 dφ = − τx sin φ + τy cos φ ds ρ ρ dz = τz ds ∂η 1 ∂η dτx ∂η = cos φ − (τx cos φ + τy sin φ) + τz τx ds η(ρ, z) ∂ρ ∂ρ ∂z ∂η 1 ∂η dτy ∂η = sin φ − (τx cos φ + τy sin φ) + τz τy ds η(ρ, z) ∂ρ ∂ρ ∂z ∂η ∂η dτ 1 ∂η z = − (τx cos φ + τy sin φ) + τz τz ds η(ρ, z) ∂z ∂ρ ∂z definito ∀ (ρ, φ, z) ∈ R+ × R × R e (τx , τy , τz ) ∈ R3 con τx2 + τy2 + τz2 = 1. Come nel caso di simmetria sferica, nell’ipotesi che η sia funzione C 2 dei propri argomenti, è possibile applicare il teorema di esistenza e unicità del problema di Cauchy introducendo a secondo membro la sostituzione ∂η ∂η 1 ∂η ∂η (τx cos φ + τy sin φ) + τz −−−−−−→ (τx cos φ + τy sin φ) + τz ∂ρ ∂z τx2 + τy2 + τz2 ∂ρ ∂z che rende il sistema definito sul dominio aperto , + (ρ, φ, z, τx , τy , τz ) : (ρ, φ, z) ∈ R+ × R2 , (τx , τy , τz ) ∈ R3 \ {0} Stefano Siboni 160 Università degli studi di Trento Corso di Meccanica razionale 2 e munito dell’integrale primo τx2 + τy2 + τz2 . Equazione delle traiettorie in coordinate cilindriche: angolo φ come variabile indipendente Per n̂ · JO = 0 si ha dφ/ds = 0, ossia φ = costante: la traiettoria del raggio luminoso giace interamente in un piano passante per l’asse di simmetria Oz. Qualora risulti n̂ · JO = c = 0 il segno di dφ/ds coincide con quello di c c dφ = 0 = ds η(ρ, z)ρ2 (9.8.6) ed è lecito ricorrere all’angolo φ come variabile indipendente in luogo dell’ascissa curvilinea s. Per ricavare l’equazione differenziale delle traiettorie in coordinate cilindriche in termini di φ conviene riferirsi all’equazione (9.4), che in coordinate cilindriche e separando le componenti cartesiane diventa d d η (ρ cos φ) = ds ds d d η (ρ sin φ) = ds ds d dz ∂η η = . ds ds ∂z ∂η cos φ ∂ρ ∂η sin φ ∂ρ Nella prima equazione l’espressione entro parentesi quadre si riscrive mediante la (9.8.6) come η d dφ d c d c dρ (ρ cos φ) = η (ρ cos φ) = 2 (ρ cos φ) = 2 cos φ − ρ sin φ = ds ds dφ ρ dφ ρ dφ 1 dρ 1 1 d 1 cos φ − sin φ = c 2 cos φ − sin φ = c − ρ dφ ρ dφ ρ ρ per cui dφ d 1 d d d 1 η (ρ cos φ) = c cos φ − sin φ = − ds ds ds dφ dφ ρ ρ 2 2 c d 1 d 1 1 c 2 d2 1 1 d 1 = 2 − 2 cos φ + − − cos φ = − 2 + cos φ. ηρ dφ ρ dφ ρ dφ ρ ρ ηρ dφ2 ρ ρ In modo analogo si prova che c 2 d2 1 1 d d η (ρ sin φ) = − 2 + sin φ ds ds ηρ dφ2 ρ ρ e che dφ d dφ dz c d c dz c2 d 1 dz d dz η = η = η = . ds ds ds dφ ds dφ ηρ2 dφ ηρ2 dφ ηρ2 dφ ρ2 dφ Stefano Siboni 161 Università degli studi di Trento Corso di Meccanica razionale 2 Le equazioni del raggio luminoso diventano cosı̀ c 2 d2 1 − 2 + ηρ dφ2 ρ c 2 d2 1 + − 2 ηρ dφ2 ρ c2 d 1 dz ηρ2 dφ ρ2 dφ = ∂η 1 cos φ = cos φ ρ ∂ρ 1 ∂η sin φ = sin φ ρ ∂ρ ∂η ∂z c 2 d2 1 − ηρ2 dφ2 ρ + c2 d 1 dz ηρ2 dφ ρ2 dφ = ossia 1 ρ = ∂η ∂ρ ∂η . ∂z Con le sostituzioni u = 1/ρ e η̃(u, z) = η(1/u, z) le equazioni precedenti si riducono a 2 ∂ η̃ 2 d u c dφ2 + u = η̃(u, z) ∂u (u, z) dz ∂ η̃ 2 2 d u2 = η̃(u, z) (u, z) . u c dφ dφ ∂z (9.8.7) Traiettorie limitate nella coordinata radiale ρ Le (9.8.7) si possono esprimere in modo equivalente come 2 d ∂ 1 u 2 dφ2 + u = ∂u 2c2 η̃(u, z) dz ∂ 1 2 d 2 2 u dφ u dφ = ∂z 2c2 η̃(u, z) . (9.8.8) Moltiplicando membro a membro la prima per du/dφ e la seconda per dz/dφ, la somma dei prodotti ottenuti porge l’equazione dz dz d 1 du d2 u 2 d 2 2 u u = +u + η̃(u, z) dφ dφ2 dφ dφ dφ dφ 2c2 dalla quale si deduce 1 2 dz 2 d 1 d 1 du 2 u2 2 + u = + η̃(u, z) dφ 2 dφ 2 2 dφ dφ 2c2 Stefano Siboni 162 Università degli studi di Trento ed infine Corso di Meccanica razionale 2 1 2 dz 2 1 1 du 2 u2 + u + − 2 η̃(u, z)2 = γ , 2 dφ 2 2 dφ 2c ovvero du 2 dφ + u2 + u4 dz 2 − dφ costante , 1 η̃(u, z)2 = 2γ . c2 (9.8.9) La costante γ non è arbitraria, ma risulta determinata univocamente dalla condizione dρ 2 1 = ds + ρ2 dφ 2 ds + dz 2 ds che si riscrive come 1 = dφ 2 dρ 2 ds dφ 2 +ρ + dz 2 dφ dz 2 c2 dρ 2 2 = 2 4 = +ρ + η ρ dφ dφ 2 c2 du 2 c2 1 dρ 2 1 1 dz 2 2 4 dz = 2 = 2 4 + 2+ 4 +u +u η ρ dφ ρ ρ dφ η̃ dφ dφ e quindi sostituendo la (9.8.9) 1 = η̃ 2 c2 c2 2γ + = 2γ +1 η̃ 2 c2 η̃ 2 per cui γ = 0. Di conseguenza la (9.8.9) diventa du 2 dφ + u2 + u4 dz 2 dφ − 1 η̃(u, z)2 = 0 c2 ossia, equivalentemente, du 2 dφ + u4 dz 2 dφ = 1 η̃(u, z)2 − u2 . c2 (9.8.10) Da quest’ultima relazione si deduce che lungo la traiettoria di un raggio luminoso deve risultare 1 η̃(u, z)2 − u2 ≥ 0 . c2 Siano allora η̃(u, z) e c = 0 tali che la funzione Ξ(u, z) = η̃(u, z)2 /c2 −u2 abbia l’andamento “a bande” illustrato nella figura seguente Stefano Siboni 163 Università degli studi di Trento Corso di Meccanica razionale 2 Il semipiano {(u, z) ∈ R+ × R} si suddivide in almeno 4 regioni aperte Σ1 , Σ2 , Σ3 , Σ4 , . . . dai contorni non necessariamente rettilinei sui quali la funzione Ξ(u, z) assume alternativamente segno positivo e negativo. Più precisamente: (i) essendo η(ρ, z) ≥ 1 ∀ (ρ, z) ∈ R+ × R, vale certamente Ξ(u, z) ≥ 1 − u2 > 0 c2 ∀ u < 1/|c| , per cui è certamente definita una banda aperta Σ1 contigua all’asse u = 0 in cui Ξ(u, z) > 0; (ii) si assume l’esistenza di una banda aperta Σ2 , contigua a Σ1 , dove risulta Ξ(u, z) < 0 e la cui larghezza lungo u non tende a zero inf sup z∈R (u,z)∈Σ2 u− inf (u,z)∈Σ2 u > 0; (iii) esista una regione Σ3 , continua a Σ2 , in cui Ξ(u, z) > 0, e di larghezza strettamente positiva inf sup u − inf u > 0 ; z∈R (u,z)∈Σ3 (u,z)∈Σ3 (iv) non può non essere definita una regione finale Σ4 , che potrebbe essere eventualmente preceduta da altre coppie di regioni adiacenti del tipo Σ2 e Σ3 dove sia alternativamente Ξ(u, z) < 0 e Ξ(u, z) > 0, in cui si abbia Ξ(u, z) < 0. Il ricorrere di una regione cosiffatta è conseguenza immediata dell’avere assunto, per ragioni fisiche, η(ρ, z) limitata: è infatti evidente che ∀ z ∈ R fissato vale 1 Ξ(u, z) ≤ 2 c Stefano Siboni sup (u,z)∈R+ ×R 2 η̃(u, z) − u2 < 0 ∀u > 1 sup η̃(u, z) . |c| (u,z)∈R+×R 164 Università degli studi di Trento Corso di Meccanica razionale 2 La condizione può certamente ricorrere nel caso l’indice di rifrazione η(ρ, z) sia una funzione periodica dell’argomento z ∈ R η(ρ, z + T ) = η(ρ, z) ∀ (ρ, z) ∈ R+ × R , allorquando è sufficiente che η̃(u, z)2 /c2 − u2 presenti la struttura a bande sopra descritta nella striscia {(u, z) ∈ R+ × R , z ∈ [0, Tz ]} essendo T il minimo periodo positivo di η(ρ, z) in z. Nelle ipotesi suindicate appare evidente che per ogni condizione iniziale le cui componenti (u, z) siano comprese nel dominio aperto Σ3 , la continuità della funzione Ξ(u, z) assicura che Σ3 sia una regione invariante per l’intera traiettoria del raggio luminoso. Poichè tale dominio si mantiene a distanza strettamente positiva dall’asse u = 0, si conclude che il raggio luminoso segue una traiettoria limitata secondo la coordinata radiale ρ. Un comportamento di questo tipo si verifica per esempio per i raggi periassiali di una fibra ottica rettilinea assisimmetrica. Caso notevole: invarianza lungo l’asse di simmetria cilindrica Qualora l’indice di rifrazione sia invariante lungo l’asse di simmetria cilindrica Oz si ha n = η(ρ) e le equazioni (9.8.7) assumono la forma 2 ∂ η̃ 2 d u c + u = η̃(u) (u) 2 dφ ∂u d 2 dz dφ u dφ = 0 . (9.8.11) La prima delle (9.8.11) è una equazione differenziale nella sola funzione incognita u(φ) e può risolversi per quadrature. La si riesprime infatti come 2 u 1 d2 u ∂ 2 − + 2 η̃(u) , = dφ2 ∂u 2 2c relazione che implica sia 1 1 du 2 u2 − 2 η̃(u)2 = γ , + 2 dφ 2 2c ovvero du 2 dφ = 2γ − u2 + costante 1 η̃(u)2 . c2 Da questa equazione è anche possibile ricavare l’andamento qualitativo della soluzione u(φ) facendo uso dell’analisi di Weierstrass. Una volta determinata u(φ), si completa Stefano Siboni 165 Università degli studi di Trento Corso di Meccanica razionale 2 l’individuazione della traiettoria per mezzo della seconda equazione, alla quale è associato un secondo integrale primo dz u2 = a , costante dφ e da cui segue perciò a dz = dφ u(φ)2 ed infine z(φ) = a dφ . u(φ)2 È importante sottolineare che le costanti γ e a non sono indipendenti, dovendosi avere dρ 2 2 dφ 2 dφ 2 dρ 2 dz 2 2 dz 2 = +ρ + = +ρ + ds ds ds ds dφ dφ 2 dz 2 dρ 2 c2 c2 du 2 2 2 4 dz +ρ + +u +u = = = η(ρ)2 ρ4 dφ dφ η̃(u)2 dφ dφ 2 1 1 c2 c2 2 2 2 4 a 2 2 2γ − u + 2 η̃(u) + u + u 4 = 2γ + a + 2 η̃(u) = η̃(u)2 c u η̃(u)2 c 1 = e dunque a2 . 2 Le traiettorie dei raggi sono pertanto, per c = 0, tutte e sole le soluzioni del sistema γ = − 1 du 2 = −a2 − u2 + 2 η̃(u)2 dφ c a z(φ) = dφ u(φ)2 dove a indica una costante reale arbitraria, dipendente dai dati iniziali. Da notare che in virtù della diseguaglianza (9.8.4) per la costante c deve aversi |c| ≤ sup η̃(u)/u . u>0 Per la prima delle due equazioni, autonoma, si possono individuare tutte le tipologie di soluzioni già descritte per il campo di rifrazione a simmetria sferica. 9.9 Campo di rifrazione a simmetria traslazionale Si supponga che l’indice di rifrazione sia un campo C 2 invariante per traslazioni arbitrarie lungo la direzione individuata dal versore n̂: n(x + αn̂) = n(x) Stefano Siboni ∀ α ∈ R , x ∈ R3 . 166 Università degli studi di Trento Corso di Meccanica razionale 2 La lagrangiana (9.3) è allora invariante rispetto alle stesse traslazioni L(x + α n̂, ẋ) = L(x, ẋ) per cui ∂L ∂ = = 0 = L(x + α n̂, ẋ) (x + α n̂, ẋ) · n̂ ∂α ∂x α=0 α=0 d ∂L ∂L d ∂L · n̂ = = (x, ẋ) · n̂ = · n̂ . ∂x dλ ∂ ẋ dλ ∂ ẋ Questa procedura, che equivale ad applicare il teorema di Noether, porta a concludere che il sistema ammette l’integrale primo Q · n̂ = ∂L ẋ dx · n̂ = n(x) · n̂ = n(x) · n̂ ∂ ẋ |ẋ| ds (9.9.1) formalmente analogo alla componente lungo On̂ dell’impulso, a patto di considerare l’indice di rifrazione in luogo della massa ed il versore tangente dx/ds al posto della velocità istantanea. Terna di riferimento adattata alla simmetria dell’indice di rifrazione In introduca una terna di riferimento Oxyz in modo che il versore di base ê3 coincida con il versore n̂ associato alle proprietà di invarianza dell’indice di rifrazione. Quest’ultimo risulta perciò indipendente dalla coordinata z n(x, y, z) = η(x, y) ∀ (x, y, z) ∈ R3 e l’integrale primo (9.9.1) assume la forma particolare Q3 = Q · ê3 = η(x, y) dz . ds (9.9.2) Equazione delle traiettorie Rispetto alla terna di riferimento introdotta al punto precedente le equazioni dei raggi costituiscono un sistema di 6 equazioni differenziali del primo ordine in forma normale dx = τx ds dy = τy ds dz ds = τz (9.9.3) ∂η ∂η 1 ∂η dτ x = − τx + τy τx ds η(x, y) ∂x ∂x ∂y 1 ∂η dτy ∂η ∂η = − τx + τy τy ds η(x, y) ∂y ∂x ∂y 1 ∂η ∂η dτ z = − τx + τy τz ds η(x, y) ∂x ∂y Stefano Siboni 167 Università degli studi di Trento Corso di Meccanica razionale 2 definito nel dominio chiuso {(x, y, z, τx , τy , τz ) ∈ R6 : τx2 + τy2 + τz2 = 1}, ma sempre estendibile al dominio aperto Ω = + , (x, y, z, τx , τy , τz ) ∈ R6 , : (τx , τy , τz ) ∈ R3 \ {0} a condizione di eseguire la sostituzione ∂η ∂η ∂η 1 ∂η τx + τy −−−−−−→ 2 τ τy + x ∂x ∂y τx + τy2 + τz2 ∂x ∂y che assicura τx2 +τy2 +τz2 essere un integrale primo per il sistema cosı̀ modificato. Per η(x, y) di classe C 2 il teorema di esistenza ed unicità assicura l’esistenza di un’unica soluzione massimale per qualsiasi problema di Cauchy. Equazione delle traiettorie: coordinata z come variabile indipendente Per Q3 = 0 si ha che dz/ds = 0, per cui la coordinata z si mantiene costante lungo l’intera traiettoria del raggio luminoso, la quale giace pertanto in un piano z = costante; la terza e la sesta delle equazioni (9.9.3) sono identicamente soddisfatte per τz (s) = 0 ∀ s, mentre la traiettoria è descritta unicamente dalle quattro equazioni residue nelle sole incognite x, y, τx , τy . Più interessante è il caso di Q3 = c = 0, allorquando la (9.9.2) impone che si abbia dz c = = 0 ds η(x, y) (9.9.4) con z funzione monotòna dell’ascissa curvilinea s — è facile verificare che si tratta di un diffeomorfismo C 2 . Si può allora introdurre z in luogo di s come variabile indipendente e semplificare le equazioni (9.9.3) dei raggi. Dalle (9.4) si ha infatti d dx ∂η η = ds ds ∂x d dy ∂η η = ds ds ∂y dz d η = 0 ds ds (9.9.5) dove l’ultima equazione si riduce ad una identità, mentre d dx dz d dz dx c 2 d2 x η = η = ds ds ds dz ds dz η dz 2 ed analogamente Stefano Siboni c 2 d2 y d dy η = ds ds η dz 2 168 Università degli studi di Trento Corso di Meccanica razionale 2 in modo che il sistema (9.9.5) si riduce a d2 x 1 ∂η ∂ 1 2 dz 2 = c2 η(x, y) ∂x (x, y) = ∂x 2c2 η(x, y) 1 ∂η d2 y ∂ 1 2 dz 2 = c2 η(x, y) ∂y (x, y) = ∂y 2c2 η(x, y) (9.9.6) formalmente equivalente alle equazioni del moto di un punto materiale di massa unitaria vincolato a muoversi nel piano Oxy e soggetto a forze posizionali conservative di potenziale η(x, y)2 /2c2 — in luogo del tempo t, la variabile indipendente è la quota z. La soluzione (x, y) = (x(z), y(z)) descrive parametricamente la traiettoria del raggio luminoso. Si osservi che la costante c deve soddisfare la limitazione dz |c| = η(x, y) ≤ η(x, y) ≤ sup η(x, y) , ds (x,y)∈R2 dovuta alla definizione (9.9.2). Treiettorie limitate in (x, y) Si moltiplichino membro a membro le due equazioni (9.9.6) per dx/dz e dy/dz rispettivamente. Sommando membro a membro i risultati ottenuti si perviene all’equazione d 1 dx 2 1 dy 2 d 1 2 + η(x, y) = dz 2 dz 2 dz dz 2c2 dalla quale si deduce che lungo la traiettoria deve risultare 1 1 dx 2 1 dy 2 + − 2 η(x, y)2 = γ , 2 dz 2 dz 2c costante . (9.9.7) In realtà la costante γ è determinata univocamente dalla condizione dz 2 dx 2 dy 2 dx 2 dy 2 dz 2 + + = + +1 1 = ds ds ds ds dz dz che in virtù della (9.9.4) e di (9.9.7) diventa c2 c2 1 2 1 = 2 2γ + 2 η + 1 = 1 + (2γ + 1) 2 η c η per cui γ = −1/2. La (9.9.7) si riduce perciò a dx 2 dz ossia dx 2 dz Stefano Siboni + + dy 2 dz dy 2 dz − 1 η(x, y)2 = −1 c2 = 1 η(x, y)2 − 1 , c2 169 Università degli studi di Trento Corso di Meccanica razionale 2 in modo che lungo la traiettoria di un qualsiasi raggio luminoso deve risultare 1 η(x, y)2 − 1 ≥ 0 . 2 c Ciò premesso, siano η(x, y) e c = 0 tali che il piano Oxy risulti suddiviso in 3 domini aperti e connessi ∆1 , ∆2 , ∆3 disposti secondo quanto illustrato nella figura seguente vale a dire tali che: (i) sull’aperto connesso ∆1 la funzione Θ(x, y) = η(x, y)2 /c2 − 1 è strettamente positiva; (ii) il dominio ∆2 circonda completamente ∆1 in modo che la distanza fra le rispettive frontiere fr(∆1 ) e fr(∆2 ) \ fr(∆1 ) risulta strettamente positiva inf{ (x1 − x2 )2 + (y1 − y2 )2 : (x1 , y1 ) ∈ fr(∆1 ) , (x2 , y2 ) ∈ fr(∆2 ) \ fr(∆1 )} > 0 e su di esso si ha Θ(x, y) < 0; (iii) ∆3 è il complemento in Oxy dell’unione delle chiusure di ∆1 e ∆2. Su di esso non sono assunte ipotesi particolari circa il segno di Θ(x, y). In tal caso appare chiaro che per ogni condizione iniziale le cui componenti (x, y) siano contenute nel dominio aperto ∆1 , la continuità della funzione Θ(x, y) implica che ∆1 sia una regione invariante lungo l’intera traiettoria del raggio luminoso, non essendo consentito l’attraversamento del dominio “proibito” ∆2 che la circonda. La traiettoria del raggio si mantiene quindi limitata nelle coordinate (x, y), sviluppandosi essenzialmente secondo la direzione z. Da notare che per il teorema di prolungabilità in queste condizioni la soluzione massimale deve essere definita ∀ z ∈ R — la soluzione (x(z), y(z), dx/dz(z), dy/dz(z)) si mantiene limitata mentre il dominio di definizione delle variabili dipendenti (x, y, dx/dz, dy/dz) è l’intero R4 . Un modello di questo tipo può descrivere ad esempio i raggi periassiali in una fibra ottica rettilinea, anche non assisimmetrica. A titolo di esempio si consideri per l’indice di rifrazione una espressione della forma η(x, y) = 1 + α e−β(2x 2 +2xy+y2 ) con α e β costanti positive assegnate. Si fissino poi le condizioni iniziali x(0), y(0), z(0), dx/ds(0), dy/ds(0), dz/ds(0) del raggio in modo che si abbia 1 1 < 1, = c dz (0) 1 + αe−β[2x(0)2+2x(0)y(0)+y(0)2] ds Stefano Siboni 170 Università degli studi di Trento Corso di Meccanica razionale 2 in cui |dz/ds(0)| < 1. Vale allora 2 1 1 + αe−β(2x +2xy+y ) Θ(x, y) = 2 η(x, y)2 − 1 = −1 2 2 dz c −β[2x(0) +2x(0)y(0)+y(0) ] (0) 1 + αe ds con 2 2 1 Θ(x(0), y(0)) = −1 > 0, dz 2 (0) ds mentre, monotonicamente, √ lim Θ(x, y) = x2 +y2 →+∞ 1 − 1 < 0. c2 La regione permessa ∆1 e quella proibita ∆2 sono perciò del tipo indicato in figura Caso particolare: doppia simmetria traslazionale Si supponga che l’indice di rifrazione dipenda unicamente dalla coordinata x n(x, y, z) = η(x) in modo che la lagrangiana (9.3) soddisfi alle relazioni di simmetria L(x + α ê2 , ẋ) = L(x, ẋ) ∀ α ∈ R , ∀ x, ẋ ∈ R3 L(x + β ê3 , ẋ) = L(x, ẋ) ∀ β ∈ R , ∀ x, ẋ ∈ R3 . Il teorema di Noether implica l’esistenza delle due quantità conservate Q2 = Stefano Siboni ∂L ∂L dy · ê2 = = η(x) ∂ ẋ ∂ ẏ ds 171 Università degli studi di Trento Corso di Meccanica razionale 2 Q3 = ∂L ∂L dz · ê3 = = η(x) ∂ ẋ ∂ ż ds per cui lungo ogni traiettoria devono valere le relazioni c2 dy = ds η(x) c3 dz = ds η(x) per appropriate costanti c2 e c3 . Le equazioni di propagazione (9.4) diventano infatti d dx ∂η (x) η(x) = ds ds ∂x d dy ∂η η(x) = (y) = 0 ds ds ∂x d dz ∂η (z) = 0 η(x) = ds ds ∂x d dx dη η(x) = (x) ds ds dx dy = c2 η(x) ds dz η(x) = c3 . ds ossia (9.9.8) Se entrambe le costanti c2 e c3 sono nulle, allora anche y(s) e z(s) risultano costanti e la propagazione del raggio luminoso avviene lungo una retta parallela all’asse Ox. In effetti per la condizione di normalizzazione del versore tangente 1 = dx 2 ds + dy 2 ds + dz 2 ds = dx 2 ds non può che aversi dx = 1 ds oppure dx = −1 ds e in ambo i casi la prima delle (9.9.8) diventa l’identità d dη η(x) = (x) dx dx in modo che per x(s) si può assumere una funzione arbitraria. Il caso più interessante ricorre quando almeno una delle costanti c2 , c3 è diversa da zero. Per fissare le idee, si supponga c3 = 0. Allora la derivata dz/ds ha segno costante, lo stesso di c3 , c3 dz = = 0 (9.9.9) ds η(x) Stefano Siboni 172 Università degli studi di Trento Corso di Meccanica razionale 2 e la z può essere introdotta come variabile indipendente in luogo dell’ascissa curvilinea s. Per la seconda delle equazioni (9.9.8) si ha η(x) dy dz = c2 dz ds ovvero, in virtù della (9.9.9), c2 dy = , dz c3 (9.9.10) in modo che la traiettoria del raggio luminoso si sviluppa completamente in un piano parallelo all’asse Ox, di equazione c3 y − c2 z = costante. La prima delle equazioni di propagazione (9.9.8) si riesprime invece come dz dx dη dz d η(x) = (x) ds dz ds dz dx ovvero nella forma equivalente dη c23 d2 x (x) = 2 η(x) dz dx dalla quale si deduce 1 dη d2 x d 1 2 = 2 η(x) (x) = η(x) . dz 2 c3 dx dx 2c23 Di conseguenza lungo il raggio deve risultare 1 1 dx 2 − 2 η(x)2 = γ , 2 dz 2c3 costante . (9.9.11) In realtà la costante γ non è indipendente da c2 e da c3 ; ci si convince facilmente di ciò notando che a causa delle (9.9.10) e (9.9.11) vale dx 2 dy 2 dz 2 dz 2 dx 2 dy 2 + + = + +1 = ds ds ds ds dz dz c22 c23 c22 c23 1 2 η(x) + 2γ + 2 + 1 = 1 + 2γ + 2 + 1 = η(x)2 c23 c3 η(x)2 c3 1 = e pertanto γ = − 1 c22 + c23 . 2 c23 La (9.9.11) si riscrive dunque nella forma dx 2 dz Stefano Siboni = 2γ + 1 η(x)2 − c22 − c23 2 η(x) = c23 c23 173 Università degli studi di Trento Corso di Meccanica razionale 2 che, al solito, si può risolvere per quadrature, consentendo comunque l’analisi qualitativa delle soluzioni per mezzo della discussione di Weierstrass. La funzione di Weierstrass dipende da entrambe le costanti c2 e c3 : η(x)2 − c22 − c23 1 = η(x) + Φc2 ,c3 (x) = c23 c23 ! c22 + c23 η(x) − ! c22 + c23 e la sua derivata prima ha lo stesso segno di η (x) Φc2 ,c3 (x) = 2 η(x)η (x) c23 ∀x ∈ R. √ 10. Appendice. Antitrasformata di Laplace di 1/ λ, λ > 0 √ Si vuole verificare che l’antitrasformata di Laplace della funzione 1/ λ, λ > 0, è data da √ 1/ πy, y > 0: +∞ 1 1 1 e−st √ dt = √ (s) := ∀s > 0. (10.1) L √ s πt πt 0 La verifica diretta è immediata, in quanto con la sostituzione t = u2 /s, u ∈ R+ , il primo membro della (10.1) diventa +∞ +∞ 1 2 1 1 2u −st 1 √ (s) = e √ dt = √ e−u du = L √ π u/ s s πt πt 0 2 = √ πs 0 +∞ −u2 e √ 2 π 1 du = √ = √ πs 2 s ∀s > 0. 0 In alternativa, ma in modo del tutto equivalente, si può fare ricorso alla formula di Bromwich per il calcolo dell’antitrasformata −1 L c+iM 1 1 1 1 √ (t) = √ est ds = √ lim s 2πi M →+∞ s πt ∀t > 0, (10.2) c−iM √ in cui la funzione 1/ s si intende prolungata analiticamente all’intero piano complesso privato dell’origine e del semiasse reale negativo e c rappresenta una qualsiasi costante √ positiva — tale da escludere ogni singolarità della funzione analitica 1/ s dal semipiano complesso {s ∈ C : e(s) > c}. L’integrale in (10.2) si può determinare ricorrendo alla tecnica dei residui, che deve essere applicata ad un percorso chiuso in C del tipo illustrato in figura: Stefano Siboni 174 Università degli studi di Trento Corso di Meccanica razionale 2 e che si compone dei seguenti tratti regolari, dove R, c ed ε R sono tre costanti positive e α indica un angolo compreso strettamente fra π/2 e π: ◦ un arco rettilineo γ1 parallelo all’asse immaginario, di estremi c−iR sin α e c+iR sin α, orientato secondo il verso positivo dell’asse immaginario; ◦ un arco rettilineo γ2 parallelo all’asse reale, di estremo iniziale c + iR sin α ed estremo finale R cos α + iR sin α; ◦ un arco circolare√γ3 di centro O e raggio R, con estremo iniziale R cos α + iR sin α ed estremo finale − R2 − ε2 + iε; ◦ un tratto rettilineo√γ4 parallelo all’asse reale e rispetto a questo concordemente orientato, di estremi − R2 − ε2 + iε e iε; ◦ una semicirconferenza γ5 , avente centro O e raggio ε, di estremi iniziale e finale iε e −iε rispettivamente; √ ◦ un tratto rettilineo γ6 di estremo iniziale −iε ed estremo finale − R2 − ε2 − iε; √ ◦ un arco di circonferenza γ7 , di centro O e raggio R, che ha nel punto − R2 − ε2 − iε il proprio estremo iniziale e in R cos α − iR sin α quello finale; ◦ un tratto rettilineo γ8 di estremi R cos α − iR sin α e c − iR sin α. Degli integrali sui vari archi interessa considerare il limite per ε → 0+ e per R → +∞. Integrale su γ2 L’arco γ2 è parametrizzato da z = x + iR sin α , Stefano Siboni x ∈ [c, R cos α] 175 Università degli studi di Trento Corso di Meccanica razionale 2 ed il corrispondente integrale curvilineo si scrive perciò Rcos α est √ ds = s γ2 c etx+itR sin α √ dx = − x + iR sin α c etx+itR sin α √ dx x + iR sin α R cos α e con il cambiamento di variabile x = Rξ diventa est √ ds = − s γ2 c/R etRξ+itR sin α √ √ R dξ . ξ + i sin α (10.3) cos α Il modulo dell’integrale (10.3) si stima con l’integrale del modulo dell’integrando c/R c/R √ √ st tRξ e e R R etRξ √ ds ≤ √ dξ = ξ2 1/4 dξ ≤ s (ξ 2 + sin2 α)1/4 sin α +1 γ2 cos α cos α sin2 α c/R √ √ c/R 1 R R etRξ tRξ etc − etR cos α e dξ = √ = √ ≤ √ sin α sin α tR cos α t R sin α cos α che tende a zero nel limite per R → +∞: 1 √ etc − etR cos α −−−−−−−−→ 0 R→+∞ t R sin α in virtù della condizione cos α < 0. Integrale su γ3 L’arco di circonferenza γ3 viene descritto dalla parametrizzazione z = R eiφ = R cos φ + iR sin φ , φ ∈ [α, π − arcsin(ε/R)] in modo che il relativo integrale curvilineo diventa est √ ds = s π−arcsin(ε/R) γ3 α √ = i R etR cos φ+itR sin φ √ iR eiφ dφ = iφ/2 Re π−arcsin(ε/R) etR cos φ ei[tR sin φ+(φ/2)] dφ α e il suo modulo quadro si stima con st √ e √ ds ≤ R s γ3 Stefano Siboni π−arcsin(ε/R) √ etR cos φ dφ = R etR cos α α π−arcsin(ε/R) etR(cos φ−cos α) dφ ≤ α 176 Università degli studi di Trento √ ≤ R etR cos α Corso di Meccanica razionale 2 π−arcsin(ε/R) 1 dφ = √ tR cos α Re [π − arcsin(ε/R) − α] α avendosi cos φ − cos α ≤ 0 ∀ φ ∈ [α, π − arcsin(ε/R)]. L’essere cos α < 0 comporta che quest’ultimo integrale tenda a zero nel limite per R → +∞: √ tR cos α Re [π − arcsin(ε/R) − α] −−−−−−−−→ 0 . R→+∞ Integrale su γ4 Si usa la parametrizzazione −x + iε , x∈ R2 − ε2 , 0 che porge per l’integrale su γ4 l’espressione γ4 0 st e √ ds = s √ √ R 2 −ε2 t(−x+iε) e √ R2 −ε2 −x + iε (−1) dx = 0 √ t(−x+iε) e √ dx = −x + iε R 2 −ε2 0 e−tx eitε √ dx i x − iε e con il cambiamento di variabile x = ξ 2 diventa st e √ ds = s 2 1/4 (R2 −ε ) γ4 0 −tξ2 itε 2e e eitε 2ξ dξ = i i ξ 2 − iε 2 1/4 (R2 −ε ) 0 e−tξ ξ dξ . ξ 2 − iε 2 Il limite per ε → 0+ di quest’ultimo integrale vale itε 2e ε→0+ i 2 1/4 (R2 −ε ) lim 0 √ R 2 2 e ξ dξ = e−tξ dξ i ξ 2 − iε −tξ2 e con l’ulteriore cambiamento di variabile u = 0 √ tξ si riduce a √ √ 0 0 R tR 2 2 2 −tξ2 e dξ = √ e−u du i i t e nel limite per R → +∞ converge ad un limite esplicitamente calcolabile √ 2 √ i t +∞ √ √ tR 2 2 π π −u2 −u2 = √ . e du −−−−−−−−→ √ e du = √ R→+∞ i t i t 2 i t 0 Stefano Siboni 0 177 Università degli studi di Trento Corso di Meccanica razionale 2 Integrale su γ5 Il percorso semicircolare γ5 è parametrizzato dal’esponenziale complessa φ ∈ [π/2, −π/2] z = ε eiφ = ε cos φ + iε sin φ , cui è dunque associato l’integrale curvilineo est √ ds = s γ5 −π/2 π/2 √ etε cos φ+itε sin φ √ iφ/2 i ε eiφ dφ = −i ε εe etε cos φ eitε sin φ+i(φ/2) dφ −π/2 π/2 che in modulo ammette la maggiorazione st π/2 π/2 e √ √ √ √ ds ≤ ε etε cos φ dφ ≤ ε etε dφ = ε etε π s −π/2 γ5 −π/2 tendente a zero nel limite di ε → 0+. Integrale su γ6 Il segmento rettilineo γ6 viene descritto da z = −x − iε , x ∈ [0, R2 − ε2 ] . L’integrale curvilineo su γ6 assume perciò la forma √ st e √ ds = s γ6 R 2 −ε2 0 √ √ R 2 −ε2 t(−x−iε) e √ −x − iε R2 −ε2 = − 0 (−1) dx = − 0 √ e−itε et(−x−iε) √ dx = i −i x + iε et(−x−iε) √ dx = −x − iε R 2 −ε2 e−tx √ dx x + iε 0 e con il cambiamento di variabile x = u2/t si riduce all’espressione √ −itε st e e √ ds = s i 2 t(R −ε2 )1/4 e−u " γ6 0 √ −itε = 2e √ i t 1 u2 + iε t 2u du = t 2 t(R −ε2 )1/4 0 Stefano Siboni 2 2 u du e−u √ u2 + iεt 178 Università degli studi di Trento Corso di Meccanica razionale 2 che per ε → 0+ converge al limite: √ 2 t(R −ε2 )1/4 −itε 2e √ lim ε→0+ i t √ −u2 e 0 2 u √ du = √ i t u2 + iεt Rt 2 e−u du 0 e per R → +∞ porge infine: √ 2 lim √ R→+∞ i t +∞ √ √ Rt 2 2 2 π π −u −u2 e du = √ e du = √ = √ . i t i t 2 i t 0 0 Integrale su γ7 L’arco di circonferenza γ7 si parametrizza con z = R eiφ = R cos φ + iR sin φ , φ ∈ [−π + arcsin(ε/R), −α] che consente di scrivere il relativo integrale curvilineo nella forma esplicita est √ ds = s γ7 −α −π+arcsin(ε/R) etR cos φ+itR sin φ √ iR eiφ dφ = R eiφ/2 −α √ = i R etR cos φ eitR sin φ+i(φ/2) dφ −π+arcsin(ε/R) per la quale è immediato stabilire la maggiorazione in modulo st √ e √ ds ≤ R s γ7 = √ −α tR cos φ e dφ ≤ √ −α etR cos α dφ = R −π+arcsin(ε/R) −π+arcsin(ε/R) R etR cos α [−α + π − arcsin(ε/R)] grazie alla evidente diseguaglianza cos φ ≤ cos α valida ∀ φ ∈ [−π + arcsin(ε/R), −α]. Essendo poi cos α < 0, l’espressione ottenuta converge a zero nel limite per R → +∞: √ tR cos α Re [−α + π − arcsin(ε/R)] −−−−−−−−→ 0 . R→+∞ Integrale su γ8 L’arco finale γ ammette l’ovvia parametrizzazione z = x − iR sin α , Stefano Siboni x ∈ [R cos α, c] 179 Università degli studi di Trento Corso di Meccanica razionale 2 e per l’integrale curvilineo associato conduce all’espressione c est √ ds = s γ8 c/R √ etRξ−itR sin α etx−itR sin α √ √ dξ dx = R ξ − i sin α x − iR sin α cos α R cos α dove si è introdotto il cambiamento di variabile x = Rξ. Il modulo dell’integrale si maggiora con l’integrale del modulo dell’integrando e converge a zero per R → +∞: c/R c/R √ st √ tRξ e 1 R √ ds ≤ R e dξ ≤ √ etRξ dξ = s (ξ 2 + sin2 α)1/4 sin α γ8 cos α cos α 1 etc − etR cos α −−−−−−−−→ 0 = √ R→+∞ t R sin α sempre per via della condizione cos α < 0. √ Applicando il teorema dei residui alla funzione est / s, analitica nel piano complesso privato dell’origine e del semiasse reale negativo, integrata lungo il cammino chiuso regolare a tratti ∪8j=1 γj si ottiene 8 est √ ds = 0 s j=1 γ e segue perciò che j est √ ds = − s 8 j=2 γ γ1 est √ ds , s (10.4) j dove l’integrale a primo membro è calcolato lungo il segmento di parametrizzazione c + iy, y ∈ [−R sin α, R sin α], e si scrive dunque: est √ ds = s γ1 c+iR sin α est √ ds = s c−iR sin α Rsin α −R sin α D’altra parte, sono stati stabiliti i limiti seguenti: st st e e √ ds = 0 √ ds = 0 lim lim R→+∞ R→+∞ s s γ2 lim lim R→+∞ ε→0+ γ3 lim ε→0+ est √ ds = 0 s γ5 lim R→+∞ γ7 Stefano Siboni et(c+iy) √ i dy . c + iy γ4 lim lim R→+∞ ε→0+ γ6 est √ ds = 0 s lim R→+∞ √ est π √ ds = √ s i t √ est π √ ds = √ s i t est √ ds = 0 , s γ8 180 Università degli studi di Trento Corso di Meccanica razionale 2 in modo che la (10.4) implica altresı̀ l’esistenza del limite c+iR sin α lim R→+∞ c−iR sin α est √ ds = s Rsin α lim R→+∞ −R sin α = − 8 j=2 lim et(c+iy) √ lim i dy = − R→+∞ c + iy j=2 8 lim R→+∞ ε→0+ γj est √ ds = s γj √ √ 2 π est 2i π √ ds = − √ = √ . s i t t √ La formula di Bromwich per l’antitrasformata di 1/ s porge allora, per ogni t > 0 fissato, L−1 c+iM 1 1 1 √ (t) = √ est ds = lim s 2πi M →+∞ s c−iM 1 = lim 2πi R→+∞ c+iR sin α √ 1 2i π 1 1 st √ e ds = √ = √ s 2πi t πt c−iR sin α che è la trasformata richiesta. Stefano Siboni 181 Università degli studi di Trento Corso di Meccanica razionale 2 Indice degli argomenti 1. 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.7.1 1.7.2 1.7.3 1.7.4 1.7.5 1.7.6 1.7.7 1.7.8 1.7.9 1.8 1.8.1 1.9 1.9.1 2. 2.1 2.1.1 2.2 2.2.1 2.2.2 2.2.3 2.2.4 2.2.5 2.2.6 2.2.7 2.2.8 2.3 2.3.1 2.3.2 2.3.3 2.3.4 2.3.5 2.3.6 Il calcolo delle variazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Il problema variazionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prima variazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Osservazione. Definizione generale di variazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Condizione di stazionarietà del funzionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Integrale di Beltrami . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Integrale di Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Estremo di un funzionale con vincoli di tipo funzionale . . . . . . . . . . . . . . . . . . . . . . . . Definizione. Funzioni linearmente indipendenti in un intervallo reale . . . . . . . . . . Lemma (caratterizzazione delle funzioni linearmente indipendenti) . . . . . . . . . . . . Lemma (generatrice delle funzioni test) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Definizione. Funzioni test nell’intervallo [λ1 , λ2 ] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Teorema (estensione del teorema della media di Lagrange) . . . . . . . . . . . . . . . . . . . . Lemma (caratterizzazione delle variazioni compatibili con i vincoli) . . . . . . . . . . . Osservazione. Estensione del lemma 1.7.6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Teorema (punti stazionari condizionati) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Osservazione. Funzione ausiliaria e moltiplicatori di Lagrange . . . . . . . . . . . . . . . . . Estremo di un funzionale soggetto a vincoli olonomi . . . . . . . . . . . . . . . . . . . . . . . . . . Teorema (estremi dei funzionali soggetti a vincoli olonomi) . . . . . . . . . . . . . . . . . . . . Estremo di un funzionale soggetto a vincoli anolonomi . . . . . . . . . . . . . . . . . . . . . . . . Teorema (estremi dei funzionali soggetti a vincoli anolonomi) . . . . . . . . . . . . . . . . . I principi variazionali della meccanica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Principio di Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Osservazione. Sistemi lagrangiani generali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Principio dell’azione stazionaria, o di Maupertuis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Moti test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Moti variati asincroni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Azione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Variazione dell’azione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stazionarietà dell’azione come condizione necessaria per i moti naturali . . . . . . . Stazionarietà dell’azione come condizione sufficiente affinché un moto test sia naturale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Determinazione alternativa della condizione di stazionarietà dell’azione per i moti test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Calcolo diretto delle traiettorie dei moti naturali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Principio di Maupertuis generalizzato . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Requisiti della lagrangiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Moti test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Moti variati asincroni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Azione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Variazione dell’azione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stazionarietà dell’azione come condizione necessaria per i moti naturali . . . . . . . Stefano Siboni 1 1 1 3 4 5 5 6 6 7 8 9 10 11 15 16 16 18 18 18 18 19 19 20 21 22 22 25 26 28 29 30 33 35 36 37 37 39 39 41 i Università degli studi di Trento Corso di Meccanica razionale 2 2.3.7 Stazionarietà dell’azione come condizione sufficiente perché un moto test sia naturale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 2.3.8 Determinazione alternativa della condizione di stazionarietà dell’azione per i moti test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.3.9 Calcolo diretto delle traiettorie dei moti naturali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 2.4 Moto di una carica elettrica in un campo elettromagnetico statico . . . . . . . . . . . . . 50 2.4.1 Caso della particella carica in un campo elettromagnetico costante . . . . . . . . . . . . 54 2.5 Principio di Hamilton per i sistemi hamiltoniani. Teorema di Helmholtz . . . . . . . 57 2.5.1 Teorema di Helmholtz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 2.6 Estensione del principio di Maupertuis ai sistemi hamiltoniani . . . . . . . . . . . . . . . . 60 2.6.1 Sistemi hamiltoniani conservativi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 2.6.2 Moti test e superfici isoenergetiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 2.6.3 Moti variati sincroni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 2.6.4 Azione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 2.6.5 Variazione dell’azione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 2.6.6 Stazionarietà dell’azione come condizione necessaria per i moti naturali . . . . . . . 63 2.6.7 Forma hamiltoniana del principio di Maupertuis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 2.6.8 Osservazione: la superficie isoenergetica può non essere una varietà . . . . . . . . . . . 64 2.6.9 Derivazione alternativa del principio di Maupertuis . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 2.6.10 Osservazione: relazione con il principio di Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 2.6.11 Esempio illustrativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3. Linee geodetiche di una superficie assegnata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 3.1 Geodetiche come linee di lunghezza stazionaria a estremi fissi . . . . . . . . . . . . . . . . . 66 3.2 Esempio: geodetiche sul cilindro circolare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 3.2.1 Osservazione: linee geodetiche e integrale di Beltrami . . . . . . . . . . . . . . . . . . . . . . . . . 71 3.2.2 Osservazione: le linee geodetiche sono curve di minima lunghezza . . . . . . . . . . . . . 72 3.3 Esempio: geodetiche sul cono circolare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 3.3.1 Osservazione: geodetiche come rette nello sviluppo piano del cono . . . . . . . . . . . . . 79 3.3.2 Osservazione: geodetiche con punti doppi (o autointersezioni) . . . . . . . . . . . . . . . . . 81 3.4 Esempio: geodetiche sulla sfera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 3.4.1 Geodetiche della sfera in coordinate cartesiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 3.4.2 Geodetiche della sfera in coordinate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 4. Catenaria omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 4.1 Caratterizzazione mediante le equazioni di equilibrio dei fili . . . . . . . . . . . . . . . . . . . 87 4.2 Caratterizzazione variazionale della catenaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 5. Equilibrio di una fune ideale omogenea in un campo conservativo . . . . . . . . . . . . . 94 6. Il problema della brachistocrona . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 6.1 Formulazione del problema fisico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 6.2 Curve ammissibili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 6.3 Tempo di percorrenza della curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 6.4 Condizione di stazionarietà per il tempo di percorrenza . . . . . . . . . . . . . . . . . . . . . . . 98 6.5 Soluzione delle equazioni di Eulero-Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 6.6 Verifica della condizione di minimo locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 7. Il pendolo cicloidale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 Stefano Siboni ii Università degli studi di Trento 7.1 7.2 7.2.1 7.2.2 7.2.3 8. 8.1 8.2 8.3 8.4 8.5 9. 9.1 9.2 9.3 9.4 9.5 9.6 9.7 9.8 9.9 10. Corso di Meccanica razionale 2 Realizzazione fisica alternativa del pendolo cicloidale . . . . . . . . . . . . . . . . . . . . . . . . . . Osservazione. Evoluta di una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Teorema (costruzione di una classe di involute) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Teorema (caratterizzazione delle involute regolari piane) . . . . . . . . . . . . . . . . . . . . . . Conclusioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Il problema della tautocrona . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Formulazione matematica del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Soluzione dell’equazione integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Soluzione dell’equazione differenziale finale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Verifica della tautocronia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Condizione di tautocronia per curve non piane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Il principio di Fermat in ottica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Principio di invertibilità dei raggi luminosi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Caso notevole. Strato limite e leggi di Snell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Esempio di interesse fisico: i miraggi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Descrizione meccanica equivalente della propagazione dei raggi luminosi . . . . . . . Teorema di Noether . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Campo di rifrazione a simmetria sferica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Integrale primo del tipo Runge-Lenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Campo di rifrazione a simmetria assiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Campo di rifrazione a simmetria traslazionale√. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Appendice. Antitrasformata di Laplace di 1/ λ, λ > 0 . . . . . . . . . . . . . . . . . . . . . . . Stefano Siboni 110 113 113 115 117 117 118 120 121 123 125 127 130 131 133 135 137 139 156 157 166 174 iii