Introduzione Matematica 1. I vettori In questa introduzione si vogliono rivedere alcuni elementi di matematica dei quali si farà uso nei capitoli successivi, nonché stabilire le notazioni che saranno utilizzate nel seguito. Non si ha alcuna pretesa di rigorosità. È detta operazione su di un insieme di elementi A, una corrispondenza che a due elementi di A associa in maniera univoca un terzo elemento. Esempio: somma e moltiplicazione tra numeri reali. Un insieme di oggetti è chiamato gruppo, se in esso è definita un’operazione W tale che: 1. Esiste un elemento nullo u , un elemento cioè tale che: W(x,u) = x 2. Per ogni elemento x, esiste un altro elemento x −1 1 tale che: W(x,x −1 ) = u Per ogni terna di elementi del gruppo vale: W(x, W(y, z)) = W(W(x, y),z ) (proprietà associativa) Se poi vale la proprietà commutativa: W(x, y) = W(y, x), allora il gruppo è detto abeliano 3. Un ovvio esempio di gruppo abeliano è l’insieme dei numeri reali rispetto all’operazione di somma e di moltiplicazione. Con i soliti simboli per indicare le due operazioni i tre punti precedenti si riscrivono: 1. a+0=a per la somma e a × 1 = a per la moltiplicazione. 2. 3. a+(-a)=0 per la somma e a × a −1 = 1 . a+(b+c)=(a+b)+c per la somma e a × (b × c) = (a × b) × c per la moltiplicazione. La proprietà commutativa si scrive: a+ b = b + a e a × b = b × a rispettivamente per la somma e la moltiplicazione. Un insieme di oggetti che forma un gruppo abeliano rispetto a due operazioni è detto campo, se l’operazione di prodotto è distributiva in rapporto alla somma: a × (b + c) = a × b + a × c . A stretto rigore sono gli elementi del gruppo, escluso lo zero che formano gruppo abeliano rispetto al prodotto. Lo zero infatti non ha inverso. Un esempio di campo è il campo dei numeri reali rispetto alle operazioni di somma e moltiplicazione. Un insieme A di oggetti forma uno spazio vettoriale su un campo C, se in detto insieme è definita un’operazione interna, rispetto alla quale l’insieme forma un gruppo abeliano, ed un’operazione esterna, cioè con gli elementi del campo, che sia distributiva e associativa. Devono quindi valere le seguenti proprietà: • a( α + β ) = aα + aβ e ( a + b )α = aα + b a (proprietà distributiva) Introduzione matematica ____________________________________________________________ ·a(bα ) = ( ab )α dove le lettere greche indicano gli elementi del campo e quelle latine gli elementi del gruppo abeliano A. Inoltre si richiede che se 1 è l’unità del campo C, allora 1a = a per ogni elemento a di A. Gli elementi del campo si chiamano scalari. Un esempio di spazio vettoriale e l’insieme delle n-ple di numeri reali (x1 ,...,x n ) . Possiamo chiamarlo spazio vettoriale numerico. L’operazione rispetto alla quale le n-ple formano un gruppo abeliano è la somma definita dalla posizione: (x 1 ,..., x n ) + (y1 ,..., y n ) = (x 1 + y1 ,..., x n + y n ). Negli spazi vettori esiste un sistema massimo di vettori linearmente indipendenti. Si tratta di un insieme di vettori tali che ogni altro vettore è esprimibile come loro combinazione lineare. Tale insieme di vettori costituisce una “base” dello spazio vettoriale. Per esempio nelle n-ple di numeri reali, i vettori e1 = (1,...,0) e 2 = (0,1,...,0) e n = (0,...,1) costituiscono una possibile base. E’ evidente, infatti, che una n-pla si può scrivere come: ( x 1 ,..., x n ) = x 1e1 + ... + x n e n . Le quantità x1 ,..., x n , si chiamano componenti controvarianti del vettore. Possiamo definire il prodotto scalare tra due vettori nel modo seguente. Presi due vettori a= ∑a e e b= i i ∑b e j j , il prodotto scalare è dato da: a ⋅ b = j i ∑a b e ⋅e i j i j . i, j Occorre dunque definire il prodotto scalare tra due vettori della base: ei ⋅ e j = g ij . g ij è 0 se i ≠ j noto come “tensore metrico”. Una scelta semplice è: g ij = δ ij con δ ij = (delta 1 se i = j di Kronecker). In questo caso la base è detta ortonormale. Sempre in questo caso il prodotto scalare tra due vettori, come la somma dei prodotti delle componenti omologhe dei due vettori: a ⋅ b = a 1b1 + ... + a n b n . Moltiplicando scalarmente un vettore per se stesso, si ottiene una quantità la cui radice quadrata è il modulo del vettore: a = ∑g a a i j ij (= ∑a i 2 i , nel caso di base ortonormale). i Per esempio, in uno spazio a tre dimensioni, posto: i = (1,0,0), j = (0,1,0), k = (0,0,1) , si ha: i 2 = j 2 = k 2 = 1 e i ⋅ j = j ⋅ k = i ⋅ k = 0 ; questa base è dunque ortonormale. Si chiama distanza tra due punti, P1 = ( x11 ,..., x1n ) e P2 = ( x 12 ,..., x 2n ) la quantità: con ∆2 = ∑ g ( x − x )(x ij i 1 i 2 j 1 ∆2 , − x 2j ) . Come si vede il tensore metrico definisce la metrica ij del sistema. Nel caso di una base ortonormale, questa espressione si riduce a: ∆2 = ∆2 = ∑ (x − x ) i 1 i ( x11 i 2 2 e, specializzando allo spazio tridimensionale: − x 12 ) 2 + ( x12 − x 22 ) 2 + ( x13 − x 23 ) 2 = ( x 1 − x 2 ) 2 + ( y 1 − y 2 ) 2 + ( z 1 − z 2 ) 2 . L’ultima espressione si ha, se si usano i simboli: x = x 1 ; y = x 2 ; z = x 3 , come è consueto. 2 Introduzione matematica ____________________________________________________________ È anche possibile definire un prodotto vettore. Limitandosi allo spazio tridimensionale, dati due vettori: a = (a 1 , a 2 , a 3 ) e b = (b1 , b 2 , b 3 ) , si definisce prodotto vettore di a e i b il vettore: j k a × b = a a a = ( a 2 b 3 − a 3 b 2 )i + ( a 3 b 1 − a 1 b 3 ) j + ( a 1 b 2 − a 2 b 1 ) k 1 2 3 b 1b 2 b 3 Evidentemente il prodotto vettore di due vettori è anticommutativo, cioè cambia segno se si cambia l’ordine dei fattori. E’ facile vedere che il modulo del prodotto vettore è più piccolo del prodotto dei moduli dei due vettori, o al più uguale: 0 < a ×b ab <1 Un punto particolarmente interessante è dato dalle proprietà di trasformazione dei vettori rispetto ad un cambiamento della base. Le relazioni che trasformano le componenti da una base ad un’altra si chiamano trasformazioni. Si dicono trasformazioni lineari, le trasformazioni per le quali esistono n relazioni del tipo: x' i = ∑c x i j + x 0i dove i coefficienti c ij sono costanti e le x' i sono le componenti j j rispetto alla nuova base. Moltiplichiamo i primi membri per i vettori di base e sommiamo: ∑ x ' e ' = ∑ (∑ c x )e ' = ∑ x ∑ c e ' = ∑ x e i i j i i i j j j i j i j i j i j j con: ej = ∑c e . i ' j i i Quest’ultima relazione dà le componenti dei vettori di base del primo sistema nel secondo sistema. Se i vettori e ' j della nuova base sono ortogonali tra loro (il loro prodotto scalare è ∑ ∑ 2 c ij = 1 i nullo) e normali (cioè con modulo uguale a 1), e: allora anche i vettori c ni c mi = 0 i ei sono ortonormali. Si vede immediatamente che le due relazioni tra i coefficienti appena scritte sono verificate nel semplice esempio di una rotazione intorno all’asse Z di un g11 g 12 g 13 cos θ − sin θ 0 angolo θ , in cui: g 21 g 22 g 23 = sin θ cos θ 0 (vedi il primo capitolo). g 0 1 31 g 32 g 33 0 La trasformazione si chiama ortogonale, perché trasforma le coordinate, mantenendo l’ortogonalità della base. Esercizio. Dimostrare che il prodotto scalare ed il prodotto vettore sono invarianti sotto tale rotazione. 3 Introduzione matematica ____________________________________________________________ Introducendo la convenzione che, se un indice è ripetuto, allora è sottintesa un’operazione di somma su quell’indice, si potrà dire che le trasformazioni ortogonali sono quelle trasformazioni lineari x' i − x' i0 = c ij x j per le quali vale la condizione: c ni c mi = δ nm . In una trasformazione ortogonale, la distanza tra due punti: ∆2 = ∆x i ∆x i ( ∆x i = x1i − x 2i ) rimane invariante: s 2 = ∆x i ∆x i = c ij c ki ∆x' j ∆x' k = δ jk ∆x' j ∆x' k = ∆x' j ∆x' k = s ' 2 . In particolare, si usa spesso la distanza infinitesima al quadrato: ds 2 = g ij dx i dx j anche essa invariante. Occorre sottolineare che l’insieme delle trasformazioni ortogonali è un gruppo. Definiamo come prodotto di due trasformazioni ortogonali la successiva applicazione delle due trasformazioni alle coordinate e dimostriamo di avere ancora una trasformazione ortogonale. Siano dunque le due trasformazioni: x' i − x' 0i = c ij x j x' ' j − x ' ' 0j = c' kj x' k Sostituendo la seconda equazione nella prima si ha: x' ' j = c' kj x' k + x' ' 0j = c' kj (c lk x l + x' 0k ) + x' ' 0j = bl j x l + (c' kj x ' 0k + x' ' 0j ) = = bl j x l + x' ' fj + x' ' 0j = bl j x l + x' ' fj Poiché . bkj blk = c' nj c kn c' kn c ln = c' nj c' kn c ln c kn = δ jk δ lk = δ jl , la trasformazione risulta ortogonale. Inoltre esiste una trasformazione unitaria con elementi non nulli, se gli indici sono uguali: c ij = δ ij ed esiste anche la trasformazione inversa che riporta le coordinate ai valori iniziali. Basta scegliere i c' kj in modo che risulti: b lj = c' kj c kl = δ jl . Questo gruppo è anche abeliano. Esiste un altro spazio vettoriale di uso comune: quello “ordinario” o dei segmenti orientati. Nello spazio fisico, è possibile tracciare tre rette, o assi, perpendicolari fra loro che si incontrano in un punto O (origine). Su tali rette si stabilisce un verso positivo. Per definire le coordinate di un certo punto P nello spazio, si tracciano le perpendicolari da questo punto ai tre assi. Misurando dall’origine la lunghezza dei tre segmenti ottenuti, si può associare al punto una terna di numeri, detti “coordinate cartesiane” (si veda fig. 1). Queste terne formano uno spazio vettoriale rispetto all’operazione di somma, sul campo reale. Il vettore corrispondente è detto “posizione” del punto O. Si tenga presente che, affinché si possano definire le coordinate cartesiane di un punto, occorre che sia valido il quinto postulato di Euclide, cioè che, dati una retta ed un punto fuori di essa, esista una e una sola parallela per il punto alla retta data. Se ciò è vero, lo spazio si dice euclideo. Risulteranno importanti nel seguito, le proprietà di trasformazione dei vettori rispetto ai cambiamenti di coordinate. Non esiste una maniera univoca di assegnare le coordinate 4 Introduzione matematica ____________________________________________________________ cartesiane ad un punto di uno spazio fisico. Inoltre, le coordinate cartesiane sono solo uno dei molti modi di assegnare coordinate ad un punto. Dunque, dato lo spazio fisico, esistono infinite terne di coordinate che corrispondono allo stesso punto, ma a terne di assi (sistemi di riferimento) cioè basi dello spazio diverse. Occorre allora stabilire come si possa passare da un sistema di coordinate ad un altro in modo da assegnare ad un punto di coordinate (x, y, z) in un certo sistema di assi le corrispondenti coordinate in un altro sistema di assi o addirittura in un sistema di coordinate non cartesiane. Cerchiamo di nuovo le relazioni (trasformazioni) che trasformano le coordinate in un sistema d’assi nelle coordinate in un altro sistema d’assi. Z Parallele ai vari assi: uniche per il V0 postulato di Euclide Marcati in nero i segmenti le cui lunghezze danno le coordinate. O Y Q X Fig. 1: Coordinate cartesiane. Su di una terna d’assi cartesiana possiamo scegliere tre versori o vettori unitari, generalmente indicati con i simboli i , j , k , rispettivamente per gli assi X, Y, Z, come mostrato in fig. 2. I vettori vengono normalmente rappresentati da una lettera sovrastata da una freccia o, talvolta, da una lettera sottolineata o in grassetto. La rappresentazione geometrica di un vettore è una freccia. Infatti, un vettore ha un modulo, equivalente alla lunghezza della freccia, una direzione, la retta sulla quale la freccia giace, ed un verso, il verso della freccia. 5 Introduzione matematica ____________________________________________________________ Z Q P k j O Y i X Fig. 2: Versori associati agli assi cartesiani. Le componenti di un vettore P sono date dalle coordinate del punto Q (il suo punto estremo) e si può quindi scrivere: P = xi + yj + zk . Il prodotto scalare tra due vettori si calcola moltiplicando i due moduli per il coseno dell’angolo compreso: a ⋅ b = a b cos θ , dove il simbolo c rappresenta il modulo del vettore: c = c x2 + c 2y + c z2 . Il prodotto vettore, a × b ha come modulo il prodotto dei moduli moltiplicato il seno dell’angolo compreso a × b = a b senθ , come direzione la direzione perpendicolare al piano formato dalle rette su cui giacciono i due vettori e come verso, il verso di una vite che avanza girando in modo tale che il primo vettore si sovrapponga al secondo. Il prodotto vettore ha dunque un senso che dipende dall’ordine dei due vettori da moltiplicare. Le due formule per il prodotto scalare e vettoriale a ⋅ b = a b cos θ e a × b = a b senθ possono essere facilmente dimostrate nel caso i due vettori giacciano su un piano coordinato per esempio X-Y. In tal caso i vettori hanno componente Z uguale a zero, mentre il loro prodotto vettoriale è lungo l’asse Z, cioè componente Z e modulo sono uguali. Detti θ a e θb gli angoli che i due vettori formano con l’asse X, l’angolo fra i vettori è: θ = θb − θ a , ovvero: sin θ = sin(θb − sin θ a ) = sin θb cos θ a − sin θ a cos θb = 6 by ax bx a y a × b − = b a b a ab Introduzione matematica ____________________________________________________________ cos θ = cos(θb − sin θ a ) = cos θb cos θ a + sin θ a sin θb = bx ax by a y a ⋅ b + = b a b a ab Il prodotto vettore di un vettore per se stesso è nullo. i × j = k Si vede che - in base alla definizione data - per i tre versori degli assi vale: j × k = i k × i = j Dunque per due vettori si può scrivere: a × b = (a x i + a y j + a z k ) × (b x i + b y j + b z k ) = a x b y i × j + a x b z i × k + a y b x j × i + + a y bz j × k + a z bx k × i + a z b y k × j = a x b y k − a x bz j − a y bx k + a y bz i + a z bx j − − a z b y i = ( a y b z − a z b y )i + ( a z b x − a x b z ) j + ( a x b y − a y b x ) k Che è la definizione data per i vettori numerici. Dal punto di vista matematico, il risultato di un prodotto vettore è un vettore perché soddisfa all’algebra dei vettori. Tuttavia, dal punto di vista della fisica è importante verificare se un oggetto matematico con tre componenti si trasforma sotto un cambiamento degli assi come un vettore. Ci sono parecchi esempi di oggetti che sono dei vettori, ma le cui proprietà vettoriali non sono confermate dalle proprietà di trasformazioni. La ragione per cui siamo interessati alle proprietà di trasformazione è che una legge di fisica sarà normalmente scritta nella forma di un’equazione, cioè, eguagliando due enti matematici. Se le proprietà di trasformazione di questi enti non sono le stesse, la legge avrà valore solo in un sistema di riferimento. Per essere più espliciti, si supponga che in un sistema di assi o riferimento si possa scrivere la legge fisica: A=B, dove A e B sono enti matematici di un certo tipo (scalari, vettori, tensori...). Trasformando ad un secondo sistema di riferimento, si deve ancora trovare: A’=B’, A’ e B’ essendo le quantità trasformate di A e B. Se invece la trasformazione portasse per esempio ad avere: A' → A + C e B → B ' 2 , sostituendo i nuovi valori nell’ espressione della legge fisica si avrebbe: A'−C = B' 2 , e chiaramente la forma della legge cambierebbe. Se si vogliono dunque formulare leggi invarianti rispetto al sistema di riferimento, allora occorre utilizzare enti le cui proprietà di trasformazione siano le stesse e ben definite. Del resto una legge fisica non deve risentire della scelta, che è arbitraria, del sistema di riferimento. Si può adesso verificare che il prodotto vettore è invariante rispetto a trasformazioni lineari proprie, ma cambia di verso (segno) se si cambia la direzione di un’asse. Si scriva il prodotto vettore nella forma: a × b = (a y b z − a z b y )i + (a z b x − a x b z ) j + + (a x b y − a y b x )k , si inverta poi il senso di un’asse, per esempio dell’asse X ( i ' → −i ), cambiando così le componenti lungo l’asse X dei due vettori (a x , b x ) → (−a x ,−b x ) . Si ha: a × b = −(a y b z − a z b y )i '−(a z b x − a x b z ) j '−(a x b y − a y b x )k ' . Come si vede, tutte e tre le componenti risultano cambiate di segno. Per un vettore ordinario si ha invece: 7 Introduzione matematica ____________________________________________________________ a = a x i + a y j + az k → a x ( − i ') + a y j '+ az k ' = − a x i '+ a y j '+ az k ' . Un vettore che cambia come un vettore nelle trasformazioni proprie, ma cambia verso nelle trasformazioni improprie è chiamato pseudovettore o vettore assiale. 2. Sistemi di coordinate non cartesiane A priori esistono infiniti sistemi per assegnare delle coordinate ad un punto. Tuttavia due particolari sistemi di coordinate risultano particolarmente utili nella pratica, oltre alle coordinate cartesiane: le coordinate sferiche e polari e quelle cilindriche. Le coordinate sferiche sono rappresentate in fig. 3. Dalla figura si capisce non solo la definizione delle tre coordinate ρ , θ , φ , ma anche la loro relazione con le coordinate cartesiane: ρ = x 2 + y 2 + z 2 x = ρsenθcosφ y y = ρsenθ sin φ e si ha che: φ = arctg x z = ρ cos θ z θ = arcos ρ 0 < θ < π Evidentemente i valori dei due angoli variano nei limiti: 0 < φ < 2π Z Q θ ρ O Y φ X 8 Fig. 3: Coordinate sferiche. Introduzione matematica ____________________________________________________________ Analogamente si possono definire nel piano, delle coordinate polari, come: mostrato in fig. 4 : Y Q ρ θ X O Fig. IV: Coordinate polari. x = ρ cos θ y = ρsenθ ρ = x 2 + y 2 e quindi: y θ = arctg x Passando adesso alle coordinate cilindriche (fig. 5), si ha: ρ = x 2 + y 2 x = ρcosφ y y = ρ sin φ e invertendo: φ = arctg x z = z z = z Z z ρ Q O Y φ X 9 Fig. 5: Coordinate cilindriche. Introduzione matematica ____________________________________________________________ Esercizio Per le coordinate sferiche, polari e cilindriche, calcolare il tensore metrico. Risposta: prendiamo l’espressione della distanza infinitesima ds 2 = dx 2 + dy 2 + dz 2 e calcoliamo i vari differenziali. Per esempio, per le coordinate polari, si ha: dx = cos θdρ − ρ sin θdθ dy = sin θdρ + ρ cos θdθ Sommando e quadrando, si ottiene: ds 2 = dx 2 + dy 2 = dr 2 + ρ 2 dθ 2 , espressione che paragonata all’espressione generale ds 2 = g ij dx i dx j , fornisce a vista: g 12 = g 21 = 0 , g 11 = 1 e g 22 = ρ 2 . Ripetendo il calcolo per le coordinate sferiche, si ha: ds 2 = dx 2 + dy 2 + dz 2 = dρ 2 + ρ 2 dθ 2 + ρ 2 sin 2 θdφ 2 e dunque: g11 g 21 g 31 g13 1 0 g 23 = 0 ρ 2 g 33 0 0 g12 g 22 g 32 0 0 e per quelle cilindriche: ρ 2 sin 2 θ ds 2 = dx 2 + dy 2 + dz 2 = dρ 2 + ρ 2 dφ 2 + dz 2 , ovvero: g 11 g12 g 13 1 0 0 2 0 . g 21 g 22 g 23 = 0 ρ g 31 g 32 g 33 0 0 1 Come si vede, le componenti del tensore metrico non hanno necessariamente valore costante. 3. L’angolo solido E’ utile definire, in analogia con l’angolo nel piano, un angolo nello spazio a tre dimensioni detto angolo solido. Prendiamo una sfera di raggio R ed una calotta di S superficie S. Definiamo angolo solido sotteso da S, il rapporto: Ω = 2 . Naturalmente è R possibile che la superficie sia infinitesima e l’angolo solido sia conseguentemente infinitesimo. Vogliamo calcolare l’espressione esatta dell’angolo solido infinitesimo ed il valore dell’angolo solido totale, quello cioè, sotteso dall’intera superficie sferica. Dalla fig. 6 si vede che: dS = rdφRdθ = R 2 senθdθdφ = R 2 d (− cos θ )dφ , da cui l’angolo solido infinitesimo risulta: dΩ = 2π π 0 0 dS R2 = senθdθdφ = d (− cos θ )dφ . Integrando su tutto l’angolo solido, si ha: ∫ dφ ∫ d (− cos θ ) = 2π 2 = 4π . Evidentemente il volume infinitesimo tra due sfere di raggio r e r+dr è: dV = dSdr = r 2 dΩdr . 10 Introduzione matematica ____________________________________________________________ Z dS θ r R O Y φ X Fig. 6: Angolo solido. 4. Il determinante giacobiano In molti casi, è conveniente usare, nel calcolare un integrale, coordinate diverse da quelle cartesiane, per esempio coordinate sferiche o cilindriche. In tal caso è necessario calcolare il determinante giacobiano. La regola è infatti che, nel passare dalle coordinate x = x (ξ ,η , ζ ) y = y(ξ , η , ζ ) alle coordinate ξ ,η , ζ sia: z = z (ξ ,η , ζ ) 11 Introduzione matematica ____________________________________________________________ ∂( x , y, z ) ∫ f ( x, y, z )dxdydz = ∫ f (ξ ,η , ζ ) ∂(ξ ,η , ζ ) dξ dη dζ , dove il simbolo il determinante giacobiano: ∂( x , y , z ) = ∂ (ξ , η , ζ ) ∂x ∂ξ ∂x ∂η ∂x ∂ζ ∂y ∂ξ ∂y ∂η ∂y ∂ζ ∂z ∂ξ ∂z ∂η ∂z ∂ζ ∂( x , y , z ) indica ∂ (ξ ,η , ζ ) . Nel caso di coordinate sferiche, x = ρsenθcosφ y = ρsenθ sin φ il determinante giacobiano è: z = ρ cos θ ∂x ∂ρ ∂x ∂θ ∂x ∂ϕ ∂( x , y, z ) ∂y = ∂ ( ρ , θ , ϕ ) ∂ρ ∂y ∂θ ∂y = sin θ sin ϕ ∂ϕ ∂z ∂θ ∂z ∂ϕ ∂z ∂ρ sin θ cos ϕ cos θ ρ cos θ cos ϕ ρ cos θ sin ϕ − ρ sin θ 2 . Sostituendo ∂( x, y, z ) ∫ f ( x, y, z )dxdydz = ∫ f ( ρ ,θ , ϕ ) ∂( ρ ,θ , ϕ ) d ρ dθ dϕ , cioè: sin θ d ρ dθ d ϕ = ∫ f ( ρ , θ , ϕ ) ρ d ρ d Ω , essendo d Ω = sin θ d θ d ϕ l’angolo nell’integrale abbiamo: ∫ f ( ρ ,θ , ϕ ) ρ − ρ sin θ sin ϕ ρ sin θ cos ϕ = ρ 2 sin θ 0 2 solido, come visto nel paragrafo precedente. Nel caso di coordinate polari lo giacobiano si riduce a ρ . E’ facile vedere che l’espressione ρ 2 d ρ d Ω è il volumetto compreso tra due sfere di raggio ρ e ρ + d ρ e definito dall’angolo solido dΩ che viene così a sostituire il volumetto cubico dxdydz . A volte, se la funzione f ( ρ , θ , ϕ ) non dipende dall’angolo θ , scriveremo direttamente 2π allora scriveremo: 4π ∫ f ( ρ ,θ ) ρ d ρ sin θ dθ o, se non dipende né θ 2 ∫ f ( ρ )ρ d ρ , 2 da né da ϕ , semplificando in maniera notevole i calcoli. Considerazioni simili si fanno per le coordinate polari e cilindriche. 5. Analisi vettoriale. a. Il gradiente Definiamo gradiente della funzione scalare V=V(x,y,z), la terna di dV dV dV funzioni∗: , , . Si pone la questione se questa terna di funzioni sia un vettore, dx1 dx 2 dx3 cioè si trasformi come il vettore P , che denota la posizione di un punto. Data dunque una ∗ Per comodità qui si indicano le tre coordinate con un indice da 1 a 3. Si sarebbero ugualmente potute usare: x, y , z. 12 Introduzione matematica ____________________________________________________________ trasformazione ortogonale: x' i − x' 0i = c ij x j con la condizione: c ij c ki = δ jk , le tre derivate cambieranno come: dV = dV dx' j = c ij dV . Dunque effettivamente la derivata di una dx dx' ∂x dx i funzione scalare si trasforma come la componente di un vettore. Il gradiente di una funzione scalare si può considerare come ottenuto applicando alla funzione scalare V=V(x,y,z) un operatore matematico il Del o Nabla, indicato col simbolo1 ∂ ∂ ∂ j + k ) . Simbolicamente possiamo scrivere: gradV = ∇V . ∇=( i + ∂x ∂y ∂z E’ naturalmente possibile esprimere il gradiente in coordinate sferiche, utilizzando le formule di trasformazione da coordinate cartesiane a coordinate sferiche. Scriviamo simbolicamente le tre derivate presenti nella formula della divergenza: ∂ ∂ρ ∂ ∂θ + = ρ ∂ x ∂ x ∂ ∂x ∂ ∂ρ ∂ ∂θ + = ∂y ∂y ∂ρ ∂y ∂ ∂ρ ∂ ∂θ + = ∂z ∂z ∂ρ ∂z i j i ∂ ∂φ ∂ + ∂θ ∂x ∂φ ∂ ∂φ ∂ + ∂θ ∂y ∂φ ∂ ∂φ ∂ + ∂θ ∂z ∂φ In queste espressioni appaiono nove derivate che dobbiamo ricavare dalle formule di trasformazione ∂ρ x ∂θ − cos θsenφ = = ρ ∂x ρ ∂x ∂ρ y ∂θ − cos θ cos φ = = ρ y ∂ ρ ∂y ∂ρ z ∂θ senθ = = ρ ∂z ρ ∂z cos φ ∂φ ∂x = − ρsenθ senφ ∂φ = ∂ y senθ ρ ∂φ =0 ∂z Sostituiamo dopo aver moltiplicato le derivate per i versori appropriati ed otteniamo: ∇= ∂ 1 ∂ 1 ∂ eρ + eθ + eφ ∂ρ ρ ∂θ ρsenθ ∂φ Normalmente il nabla è indicato come ∇ , senza freccia. Tuttavia preferisco aggiungere la freccia per ricordare allo studente che si tratta di un operatore da trattare come un vettore. Il nome viene da un tipo di arpa che ha forma triangolare e fu dato all’operatore dal fisico-matematico britannico W. R. Hamilton. 11 13 Introduzione matematica ____________________________________________________________ dove i tre vettori: e ρ , eθ , eφ sono dati dalle espressioni: y x z e ρ = ρ i + ρ j + ρ k eθ = − cos θsenφi − cos θ cos φj + senθk eφ = cos φi − senφj eρ ⋅ eθ = 0 eρ ⋅ eρ = 1 e risultano così dei versori ortogonali: eρ ⋅ eϕ = 0 eθ ⋅ eθ = 1 eθ ⋅ eϕ = 0 eϕ ⋅ eϕ = 1 il primo dei quali ha la direzione del raggio e gli altri due giacciono nel piano ortogonale al primo vettore. In maniera analoga si calcola il gradiente in coordinate cilindriche, che risulta essere: ∂ 1 ∂ ∂ ∇= eρ + eθ + k , con: ∂ρ ρ ∂θ ∂z x y eρ = ρ i + ρ j i due versori aggiuntivi a k . e = cos θ i − senθ j θ Di questo lasciamo il calcolo come esercizio allo studioso lettore. b. La divergenza Se il Del è un operatore vettoriale, possiamo farne il prodotto scalare con un vettore funzione delle coordinate: ∂B ∂B ∂B ∂B ∇ ⋅ B( x, y, z ) = 1 + 2 + 3 = i , dove il doppio indice i, implica una somma. ∂x1 ∂x 2 ∂x 3 ∂x i Evidentemente la dizione “prodotto scalare” qui non ha un significato rigoroso. Verifichiamo comunque che il risultato sia effettivamente uno scalare: ∇ ⋅ B ( x, y , z ) = ∂B i ∂x i = ∂ (c' ij B' j ) ∂x k ∂x' k ∂x i = c ik c' ij ∂B' j ∂x' k = δ jk ∂B' j ∂x' k = ∂B ' j ∂x' j Naturalmente possiamo applicare il Del al gradiente di una funzione scalare che, come abbiamo visto, è un vettore. Si ottiene: ∇ ⋅ (∇V ) = 14 ∂ 2V ∂x 2 + ∂ 2V ∂y 2 + ∂ 2V ∂z 2 . L’espressione di Introduzione matematica ____________________________________________________________ destra è normalmente chiamata Laplaciano e viene indicata con il simbolo: ∇ 2 oppure ∆ . In coordinate sferiche il Laplaciano risulta essere: ∂ ∂ ∂ ∂2 1 ∂ 1 1 ∆= 2 = (ρ 2 )+ 2 ( senθ )+ 2 2 ∂ρ ∂θ ρ ∂ρ ρ senθ ∂θ ρ sen θ ∂φ 2 = 1 ∂2 ρ ∂ρ 2 (ρ ) + ∂ ∂ ∂2 1 sen + ( ) θ ∂θ ρ 2 senθ ∂θ ρ 2 sen 2θ ∂φ 2 1 Mentre in coordinate cilindriche assume la forma: ∆= 1 ∂ ∂ 1 ∂2 ∂2 (ρ )+ 2 + 2 2 ρ ∂ρ ∂ρ ρ ∂θ ∂z c. Il rotore Il rotore si ottiene facendo il prodotto vettore dell’operatore Del con un vettore funzione delle coordinate. Possiamo scrivere: i rotB = ∇ × B = j k ∂B y ∂B y ∂B x ∂B ∂B ∂B ∂ ∂ ∂ =( z − )i + ( x − z ) j + ( − )k . ∂x ∂y ∂z ∂y ∂z ∂z ∂x ∂x ∂y Bx B y Bz Evidentemente il rotore di un vettore è in realtà uno pseudovettore. E’ facile vedere che il rotore di un gradiente è sempre nullo: ∇ × (∇V ) = 0 . Sostituendo infatti alle componenti di B le componenti di un gradiente nelle precedenti espressioni si ha: ∂B z ∂B y ∂ ∂V ∂ ∂V − = − = 0 purché sia invertibile l’ordine di derivazione. Lo stesso ∂y ∂z ∂y ∂z ∂z ∂y vale per le altre due componenti. Lasciamo allo studioso lettore il compito di dimostrare che: ∇ × (∇ × B) = − ∆B + ∇(∇ ⋅ B) . d. Il teorema di Gauss Data una superficie S, denotiamo con n il versore normale alla superficie S in un punto contornato dalla superficie infinitesima dS. Consideriamo un campo vettoriale E , definito in un volume contenente la superficie e funzione del punto. Definiamo flusso infinitesimo dΦ( E ) del vettore E attraverso la superficie dS la quantità: dΦ( E ) = E ⋅ ndS . Integrando su tutta la superficie S, otteniamo il flusso totale: Φ ( E ) = ∫S E ⋅ ndS . Data una superficie chiusa S che racchiude il volume V, il teorema di Gauss stabilisce che: Φ ( E ) = ∫S E ⋅ ndS = ∫V (∇ ⋅ E )dV . Ovvero: il flusso attraverso una superficie chiusa di un vettore è uguale all’integrale della sua divergenza sul volume racchiuso dalla superficie. 15 Introduzione matematica ____________________________________________________________ Cominciamo considerando il flusso infinitesimo attraverso un cubetto di lati perpendicolari ai tre assi e di lunghezza infinitesima, dx=dy=dz=dl. Il flusso infinitesimo attraverso le facce perpendicolari all’asse X (si veda fig. VII) Z sarà: ∂E dΦ( E x ) = ( E x ( x + dx) − E x ( x))dS = x dxdS . ∂x E x (x) Analogamente, attraverso le facce perpendicolari all’asse Y, si avrà: ∂E y dΦ( E y ) = ( E y ( y + dy ) − E y ( y ))dS = dydS e ∂y E x ( x + dx) attraverso quelle perpendicolari all’asse Z: ∂E dΦ( E z ) = ( E z ( z + dz ) − E z ( z ))dS = z dzdS . ∂z X Sommando i tre contributi, il flusso totale Fig. VII: Teorema di Gauss. attraverso le facce del cubetto sarà: ∂E y ∂E z ∂E dΦ ( E ) = ( x + + )dldS = ∇ ⋅ EdV . Il teorema di Gauss risulta a questo punto ∂x ∂y ∂z verificato per il nostro cubetto infinitesimo. Notiamo che, se accostiamo dei cubetti infinitesimi e sommiamo il flusso attraverso le superfici laterali comuni, questo appare in uscita da un cubetto ed in entrata in quello adiacente (come mostrato in fig. VIII), dando un contributo totale nullo. Dunque sommando il flusso attraverso le facce dei due cubetti, si ha il contributo del solo flusso per le facce esterne. Ovvero il flusso attraverso le facce esterne è uguale alla somma dei flussi attraverso le facce dei due cubetti. E’ chiaro che se dividiamo un volume finito V, limitato da una superficie S in cubetti infinitesimi, il flusso attraverso la superficie esterna rimane uguale alla somma dei flussi attraverso le facce dei cubetti. Rimane così provato Z che: Φ ( E ) = ∫S E ⋅ ndS = ∫V (∇ ⋅ E )dV Y X Fig. VIII: Teorema di Gauss per una serie di cubetti adiacenti. Con considerazioni simili si dimostra che e. Il teorema di Stokes 16 ∫ E × ndS = ∫ (∇ × E )dV . S V Y Introduzione matematica ____________________________________________________________ Il teorema di Stokes stabilisce che, data una curva chiusa l, una qualunque superficie S limitata da questa curva ed un campo vettoriale E , si ha: ∫l E ⋅ dl = ∫ (∇ × E ) ⋅ n dS , ovvero S la circuitazione di un campo vettoriale E è uguale al flusso del suo rotore attraverso S (fig. IX). La dimostrazione segue una logica simile a quella usata nella dimostrazione del teorema di Gauss. Cominciamo a calcolare la circuitazione lungo un cammino infinitesimo. C = E x ( y )dx − E x ( y + dy )dx − E y ( x)dy + E y ( x + dx)dy = ∂E y ∂E x )dxdy = (∇ × E ) z dxdy = (∇ × E ) ⋅ k dS , che è in effetti quello che vogliamo dx ∂y dimostrare. Se vogliamo passare ad una curva finita, basta dividere la superficie inclusa nella curva in quadratini infinitesimi (fig. X), sommare notando che i contributi alla circuitazione da lati comuni a due quadratini si cancellano e che dunque la somma di tutti i contributi si riduce al contributo della curva di contorno. ( − Y X Fig. IX: Teorema di Stokes. Fig. X: Caso di una curva finita. Questa dimostrazione può essere completata prendendo una superficie che si appoggi sullo stesso contorno, ma non giaccia sul piano X-Y. In effetti, l’unione della superficie piatta considerata prima S1 e quella non giacente sul piano S2 , formano una superficie chiusa S = S1 ∪ S 2 contenente un volume V . Poiché la divergenza di un rotore è sempre nulla, ∇⋅ ( ∇× a ) dV = 0 = ( ∇× a ) ⋅ ndS = ( ∇× a )⋅ndS + ∫ (∇× a )⋅ndS ⇒ ∫ ∫ ∫ V S S1 avremo: S2 ⇒ ∫ (∇×a )⋅ndS = − ∫ (∇× a )⋅ndS S1 S2 17 Introduzione matematica ____________________________________________________________ Il segno meno è dovuto all’orientazione della normale (di segno opposto sulle due superfici). In conclusione: ∫ (∇×a )⋅ndS = ∫ (∇×a )⋅ndS = ∫ a ⋅ds e il teorema è S2 S1 dimostrato anche per una superficie qualunque. Appendice. La derivata covariante Sia dato uno spazio numerico ad n dimensioni, R ( x1 ,..., x n ) . Assegniamo un punto O, fisso, ed un punto P. Designiamo con il simbolo OP , l’insieme dei numeri ( x1P − x10 ,..., x nP − x no ). L’insieme di tali n-uple di numeri costituiscono uno spazio vettoriale sul campo dei numeri reali. In un tale spazio vettoriale si può definire un prodotto scalare tra vettori (vedi introduzione matematica nelle dispense). Data una base di tale spazio vettoriale, (e1 ,..., e n ) , ei ⋅ e j = g ij , possiamo definire allora un sistema di riferimento, O (e1 ,..., e n ) , in questo spazio l’insieme del punto O e della base (e1 ,..., e n ) . Le 16 quantità g ij costituiscono il “tensore metrico”. Chiamiamo “componenti controvarianti” di un vettore i coefficienti della combinazione lineare dei vettori della base che danno il vettore in considerazione: OA = x 1 e1 + ... + x n e n . Chiamiamo “componenti covarianti” di un vettore le quantità: x j = e j ⋅ OA . Se la base è ortonormale non c’è differenza tra componenti covarianti e controvarianti. Altrimenti la relazione tra componenti covarianti e controvarianti è: x j = e j ⋅ OA = e j ⋅ ( x 1 e1 + ... + x n e n ) = g ij x i , che ci ridà: x j = x j , se g ij = δ ij . Notare che, dato un vettore a , il prodotto scalare del vettore per sé stesso (il quadrato del modulo del vettore) è: a 2 = ai a j ei ⋅ e j = ai a j gij = ai ai . Da cui si deduce che: a 2 = ai ai = g ij a j gij a j = g ij gij a j a j ⇒ g ij gij = 1 , ∀i , ovvero: g ij = Aij , in cui Aij è il g complemento algebrico di gij e g è il determinante della matrice degli gij . Nel caso −1 0 della metrica pseudoeuclidea, gij = 0 0 18 0 0 −1 0 0 −1 0 0 0 0 , g = −1 e i complementi 0 1 Introduzione matematica ____________________________________________________________ algebrici valgono +1 per i primi tre e -1 l’ultimo, così che si ha: 0 1 0 0 1 0 0 ij 0 g = . 0 0 1 0 0 0 0 −1 Data una base ortonormale di tale spazio vettoriale: (e1 ,..., e n ) , cioè una base tale che i prodotti: ei ⋅ e j = g ij = δ ij , ovvero siano 0 o 1 a seconda che moltiplichiamo il vettore della base per sé stesso o per un altro, chiameremo “cartesiano” il riferimento O (e1 ,..., e n ) . Esiste sempre una base ortonormale. Chiamiamo “euclideo” lo spazio in cui sia stato introdotto un sistema di coordinate cartesiane. Chiamiamo “distanza” d tra due punti A e B la “lunghezza” cioè il modulo del vettore, AB ovvero la radice quadrata di: 2 A A B B A B A B d = ( x1 e1 + ... + x n e n ) ⋅ ( x1 e1 + ... + x n e n ) = x i x j ei ⋅ e j = g ij x i x j , che in un riferimento cartesiano diventa: d 2 = x iA x iB . Evidentemente esso è uguale alla delta di Kroenecker se lo spazio è euclideo. Naturalmente non è vero in genere che g ij = δ ij . In uno spazio euclideo, possiamo passare da un sistema cartesiano ad un sistema di “coordinate curvilinee”, usando delle funzioni continue delle coordinate cartesiane: yi = fi ( x1 ,..., xn ) . Per esempio, possiamo passare alle coordinate sferiche o cilindriche definite nell’Introduzione. Dato un punto M di coordinate cartesiane x1 ,..., x n e curvilinee yi = fi ( x1 ,..., xn ) , possiamo definire un riferimento “locale” nel punto M, il riferimento “naturale”, prendendo come origine il punto M e base i versori tangenti alle curve yi = cos tan, i ≠ j (solo una coordinata varia, chiamate “curve coordinate”) nel punto: ei = d (OM ) . Il riferimento naturale cambia da punto a punto e occorre cambiare le dy i componenti di ogni vettore da punto a punto, si tratta di trovare le formule di trasformazione. Passiamo dunque da un punto ad un altro e cambieranno le componenti dei vettori, sia perché i vettori non sono costanti, sia perché è cambiato il sistema di riferimento. Vogliamo dunque vedere come cambiano le componenti da yi a yi + dyi e i vettori di base da ei a ei + dei . Prendiamo dunque un vettore a = ai ei e differenziamolo, senza assumere che i vettori della base rimangano costanti: da = dai ei + ai dei . Per essere sicuri di capire questa formula, riscriviamola esplicitamente, senza ricorrere alla formula generale: da = a ( y + dy ) − a ( y ) = ai ( y + dy )ei ( y + dy ) − ai ( y )ei ( y ) = ai ( y + dy )ei ( y + dy ) − − ai ( y )(ei ( y + dy ) − (ei ( y + dy ) − ei ( y ))) = (ai ( y + dy ) − ai ( y ))ei ( y + dy ) + ai ( y )dei = = dai ei + ai ( y )dei 19 Introduzione matematica ____________________________________________________________ A questo punto possiamo introdurre i differenziali dei vettori di base in funzione dei vettori di base stessi: dei = ε ij e j = Γihj dy h e j , dove le ε i j sono le componenti (infinitesime) dei vettori dei sulla base e j , che abbiamo espresso in funzione dei differenziali delle coordinate curvilinee come: ε ij = Γihj dy h . Sostituendo abbiamo: ∂ai + a h Γihk )dy k ei = ∇ik ady k ei . da = dai ei + ai ( y )dei = (dai + a h ε hi )ei = ∇vi ei = ( Le k ∂y ∇vi sono le componenti controvarianti del vettore da , detto “differenziale assoluto” di ai . Le quantità: ∇aki = ∂ai + a h Γihk costituiscono un tensore detto derivata covariante ∂y del vettore a . In effetti possiamo adesso calcolare l’accelerazione di un punto materiale, prendendo un k parametro scalare che per ora chiamo s . Prendiamo ai = vi = ∇a i = ∇ dy i ds e sostituiamo: dy h dy k dy h dy k ∂y i ∂ ∂y i dy k ∂ 2 yi =( ( ) + Γihk )ds = ( + Γihk )ds ⇒ ∂s ds ds ds ds ∂y k ∂s ds ∂s 2 ∇v i ∂ 2 y i dy h dy k = + Γihk ds ds ds ∂s 2 dove la quantità a sinistra è la componente i-esima dell’accelerazione e la quantità a destra è effettivamente la componente di un vettore. Nel caso classico, il parametro s deve essere il tempo e si avrà: ai = ∂ 2 yi ∂t 2 + Γihk dy h dy k 2 . In assenza di forze il principio d’inerzia si esprime ponendo dt dt ∂ 2 yi dy h dy k =0. dt dt ∂t 2 Facciamo un esempio. Prendiamo un sistema di coordinate cartesiane e un sistema di coordinate curvilinee, per esempio coordinate cilindriche: Le tre curve marcate “r”, “z”, “φ”, sono le curve su cui variano solo r, z, φ rispettivamente. Il sistema O’X’Y’Z’ è il riferimento naturale. Calcoliamo la distanza infinitesima tra due x = r cos φ dx = dr cos φ − rsenφ dφ punti: y = rsenφ , differenziando: dy = drsenφ + r cos φ dφ e quadrando e sommando, z = ς dz = d ς uguale a zero l’accelerazione, dunque: + Γihk si ha: ds 2 = dx 2 + dy 2 + dz 2 = dr 2 + r 2 dφ 2 + d ς 2 , da cui otteniamo che il tensore metrico 2 La dimostrazione che queste equazioni definiscono una geodesica (cioè una “retta”) è data a pag. 21 delle note di meccanica. 20 Introduzione matematica ____________________________________________________________ Z’ Z Y’ φ r O’ X’ z O Y φ X con queste coordinate curvilinee è funzione delle coordinate. Precisamente abbiamo: 0 0 0 0 1 r2 0 0 1 ij A 1 1 . gij = 0 r 2 0 , quindi: g ij = = 0 1 0 = 0 0 2 g r2 r 0 0 0 1 0 r 2 0 0 1 Supponiamo che l’angolo φ cambi in funzione del tempo. Questo è il caso di un punto materiale visto da una piattaforma rotante. Il punto avrà un’accelerazione rispetto al sistema in moto, le cui componenti sono: ai = ∂ 2 yi ∂t 2 dy h dy k dt dt + Γihk e che, oltre ad avere la derivata seconda delle coordinate dy h dy k che dovrebbero risultare uguali alle dt dt accelerazioni di trascinamento e di Coriolis. Consideriamo un moto piano a ζ = costante Le componenti dell’accelerazione sono: rispetto al tempo, ha i termini: Γihk a1 = a2 = d 2r dt 2 d 2φ dt 2 + Γ111 ( dr 2 dφ dφ dr 1 d φ dr ) + Γ122 ( )2 + Γ121 + Γ12 dt dt dt dt dt dt 2 + Γ11 ( dr 2 dφ dφ dr 2 d φ dr ) + Γ 222 ( )2 + Γ 221 + Γ12 dt dt dt dt dt dt 21 Introduzione matematica ____________________________________________________________ dr 2 dφ dφ dr 3 d φ dr ) + Γ322 ( )2 + Γ321 + Γ12 dt dt dt dt dt dt 1 Prendendo per Γihk = g im ( g km,h + g mh,k − g hk ,m ) , troviamo: 2 3 a3 = Γ11 ( i 2 3 Γ11 = 0 , Γ122 = −r , Γ 222 = Γ322 = 0 , Γ121 = Γ321 = 0 , Γ 221 = Γ12 = r −1 , Γ112 = Γ12 =0 In conclusione: dφ 2 2 d 2φ 2 dφ dr ) , a = + , a3 = 0 . 2 2 dt r dt dt dt dt Sulla prima si vede che è apparsa l’accelerazione centrifuga, mentre sulla seconda l’accelerazione di Coriolis.3 In effetti, le due accelerazioni (per la seconda occorre moltiplicare per r ) sono esattamente le due componenti dell’accelerazione calcolate a pag. 13 delle dispense, accelerazione radiale: rɺɺ − rφɺ2 e tangenziale: rφɺɺ + 2rɺφɺ . Poniamo le a1 = d 2r − r( due componenti uguali a zero e otteniamo le equazioni covarianti del moto in caso di forze dφ 2 d 2φ 2 dφ dr ) =0 e + = 0 . Poiché le due equazioni sono valide nella dt dt 2 dt 2 r dt dt stessa forma in ogni sistema, applichiamole al sistema assoluto in cui la particella è ferma. La soluzione φ = costante e r = costante soddisfa entrambe le equazioni. In un sistema in moto circolare uniforme rispetto al primo, imponiamo ϕ = ω t e la prima ci dice che c’è nulle. d 2r − r( un’accelerazione radiale che è proprio l’accelerazione centrifuga: d 2r dt 2 = rω 2 , la cui soluzione è: r (t ) = r0 eωt . Comunque la soluzione è più complicata perché se c’è una velocità radiale diversa da zero la seconda equazione dice che interviene un’accelerazione di Coriolis e non possiamo ignorare la seconda. Vediamo adesso come possiamo definire uno spazio non euclideo, ovvero come, vivendo in uno spazio a n dimensioni si possa decidere se il proprio spazio è o no euclideo. Seguiamo l’idea dello spostamento parallelo di un vettore costante. Scegliamo una curva chiusa (per esempio un ”parallelogramma”). Punto per punto trasformiamo da sistema naturale a sistema naturale e usiamo la regola trovata prima per il differenziale assoluto del vettore: ∇a i = ( ∂ai ∂y k + a h Γihk )dy k , che per un vettore costante si riduce a: ∇ai = a h Γihk dy k . Spostamento parallelo vuol dire che le componenti a h vengono tenute costanti. 3 Si potrebbe vedere quale è la geodetica corrispondente. J. Weber , General Relativity and gravitational waves, pag. 14 dice che una metrica appropriata al caso relativistico è: − ds 2 = dr 2 + r 2 dϕ 2 + dz 2 + 2ω r 2 dϕ dt − (c 2 − ω 2 r 2 )dt 2 . Anche in questo caso si potrebbe cercare la geodetica corrispondente. 22 Introduzione matematica ____________________________________________________________ Calcoliamo la variazione totale lungo il parallelogramma come il Weber (pag. 20/30), e otteniamo: l’espressione del tensore di curvatura. Appendice 1 Il raggio di curvatura. Data una curva y = f ( x ) , prendiamo tre punti A , B e C sulla curva. Il cerchio che passa per due punti (A e C) al limite di una distanza infinitesima tra i punti, si chiama ˆ ha lunghezza ds . Si chiama parametro di cerchio osculatore (Leibnitz). L’arco ABC dθ quando i punti A e C tendono a B . Il punto ds d’intersezione dei raggi passanti per A e C , quando i punti A e C tendono a B , si chiama centro di curvatura. Calcoliamo il raggio di curvatura R e il parametro di 1 curvatura κ = . Il raggio di curvatura è inteso come quantità positiva. R Consideriamo la curva rappresentata dalla y = f ( x ) ; L’angolo tra i due raggi (normali alla curva in A e C ) è anche l’angolo tra le tangenti alla curva i cui coefficienti angolari sono le derivate di y = f ( x ) . Dunque curvatura in B il rapporto κ = ∆θ = θC − θ A ≈ tg(θ C − θ A ) = tgθC − tgθ A 1 + tgθ C tgθ A (quest’ultimo passaggio usando la relazione Y Centro di curvatura Raggi di dθ Curvatura R A dθ C B ds y = f ( x) X tgα − tg β trigonometrica tg(α − β ) = 1 + tgα tg β . Sostituendo, abbiamo: 23 Introduzione matematica ____________________________________________________________ tg(θC − θ A ) tgθC − tg(θ A ) ∆θ ≃ lim dx = lim = A , C → B ∆s A,C → B A,C → B ∆x 2 + ∆y 2 (1 + tgθ A tgθC ) ∆x 2 + ∆y 2 κ = lim dy dy ) − ( )A dx C dx y '' ∆x = lim = A,C → B dy dy ∆y 2 (1 + y '2 )3 1 + ( dx ) A ( dx )C 1 + ( ∆x ) indicando con apici le derivate prima e seconda di y rispetto a x . Consideriamo adesso le curve parametriche della curva: x = x(θ ) e y = y(θ ) ; ( d 2 y dx dy d 2 x − d y' d dθ dθ 2 dθ dθ dθ 2 1 d 2 y y '' x '− x '' y ' ( )= tan θ d, = ⇒ 2 = 3 dx 2 dx dx x ' dϑ dx ' dx x ( ) dθ dθ indicando con apici le derivate prima e seconda di y e di x rispetto a θ . Sostituendo nella formula precedente: κ= R= d2y y '' x '− x '' y ' y '' x '− x '' y ' dx 2 da cui, infine: = = 3 2 3 dy x ' (1 + y ' ) ( x '2 + y '2 )3 (1 + ( )2 )3 dx ( x '2 + y '2 )3/ 2 . Ad esempio per un cerchio le cui equazioni parametriche sono: y '' x '− x '' y ' x = R cos θ e y = R sin θ , si trova facilmente che la formula da effettivamente il raggio del cerchio. Come esercizio calcoliamo adesso il raggio di curvatura di una “trattrice”4, la cui equazione differenziale è: dy a2 − x2 da cui =− dx x 4 La trattrice è la curva descritta da un punto trascinato a distanza costante pari ad a da un secondo punto che si muove lungo l’asse Y in modo che il segmento congiungente i due punti sia sempre tangente alla curva. L’equazione differenziale è 24 dy a2 − x2 . =− dx x Introduzione matematica ____________________________________________________________ a + a2 − x2 y = ± a ln − a2 − x2 x κ= a2 x = d2 y a2 , e . Sostituendo troviamo: = − 2 2 2 2 dx x a x − , ovvero R = a a2 − x2 . x 2 2 a ( )3 x 2 a 2 − x 2 a a − x x Un altro esercizio. Questa volta prendiamo una cicloide. x = a(θ − sin θ ) Le equazioni parametriche sono: ; calcoliamo le derivate: y = a(1 − cos θ ) x ' = a(1 − cos θ ) x '' = a sin θ e . Sostituendo nell’espressione del raggio di curvatura, y ' = a sin θ y '' = a cos θ abbiamo: R= ( x '2 + y '2 )3/ 2 ((1 − cos θ )2 + sin 2 θ )3/2 (2 − 2cos θ )3/ 2 a =a = = 2 2a(1 − cos θ )1/2 = y '' x '− x '' y ' cos θ − 1 cos θ (1 − cos θ ) − sin 2 θ = 2 2a 2 sin θ θ = 4a sin . 2 2 L’evoluta di una curva è il luogo geometrico dei centri di curvatura della curva. Calcoliamo l’evoluta di una cicloide. Dalla figura si evince che le coordinate del centro di curvatura in un punto sono date dalle coordinate del punto più o meno il raggio di curvatura per il coseno o il seno di x = a (θ − sin θ ) + R cos y = a(1 − cos θ ) − R sin θ 2 θ 2 θ 2 : = aθ − 2a sin θ 2 cos = a − a(1 − 2sin 2 Che l’angolo α valga proprio θ θ 2 θ 2 + 4a sin ) − 4a sin 2 θ 2 θ 2 cos θ 2 = aθ + 2a sin = − a 2sin 2 θ 2 θ 2 cos θ 2 = a(θ + sin θ ) = −a(1 − cos θ ) , lo possiamo dimostrare notando che il raggio di 2 curvatura è su una direzione normale alla tangente alla cicloide nel punto in dy 1 − cos θ considerazione. Poiché il coefficiente angolare della tangente è (vedi = dx sin θ discussione della cicloide al cap. 2 la dinamica), il coefficiente angolare della giacitura dy del raggio di curvatura sarà l’inverso di , ovvero dx θ 2sin 2 sin θ 2 = tg θ . Da cui α = θ . tgα = = θ θ 2 1 − cos ϑ 2 2 sin cos 2 2 25 Introduzione matematica ____________________________________________________________ O rig in P r o 8 E va lu at io n 2 O rig in P ro 8 E valu a tion tangente y/a Raggio di curvatura 0 O rig in P r o 8 E va lu at io n O rig in P ro 8 E valu a tion O rig in P r o 8 E va lu at io n O rig in P ro 8 E valu a tion O rig in P r o 8 E va lu at io n O rig in P ro 8 E valu a tion α=θ/2 O rig in P r o 8 E va lu at io n O rig in P ro 8 E valu a tion c -2 0 Centro di curvatura O rig in P r o 8 E va lu at io n O rig in P ro 8 E valu a tion O rig in P r o 8 E va lu at io n O rig in P ro 8 E valu a tion 2 4 evoluta cicloide 6 x/a Le equazioni trovate sono quelle di una cicloide inversa con un’inversione dell’asse Y . In conclusione, l’evoluta è anche essa una cicloide spostata in basso di 2a . Pensiamo adesso di rovesciare la figura in modo che la cuspide dell’evoluta sia sotto sopra e in alto. Dalla cuspide facciamo pendere un filo cui è attaccato in punta un punto materiale. Quando il pendolo così fatto oscilla, una parte (quella superiore) del filo aderirà alla “parete” dell’evoluta e una parte (inferiore) costituirà un segmento tangente all’evoluta che terminerà sulla cicloide. Il punto materiale descriverà così una cicloide realizzando un pendolo cicloidale. Vediamo che cosa è il raggio di curvatura di una superficie. Dato un punto P di una superficie Σ , si considerino tutti i piani passanti per la normale a Σ in P: l’intersezione di ogni piano con la superficie determina una curva piana di cui è possibile calcolare la curvatura con la convenzione che la curvatura sarà positiva se la curva devia nello stesso verso della normale, negativa nel caso opposto. I valori massimi e minimi così ottenuti sono detti curvature principali, e le rispettive direzioni anch’esse principali. Note le due curvature principali κ1 e κ 2 , è possibile definire due diverse misure della curvatura, la curvatura gaussiana data 26 Introduzione matematica ____________________________________________________________ dal prodotto delle due curvature principali, e la curvatura media, che ne è, come suggerisce il nome, la media aritmetica. Calcoliamo la curvatura gaussiana in un punto P di una superficie cilindrica. La curvatura massima si ha su un piano perpendicolare all’asse del cilindro. Quella minima in un piano contenente l’asse del cilindro ed è nulla. Pertanto la curvatura di un cilindro è nulla come quella di un piano. La geometria intrinseca del piano e del cilindro sono dunque uguali. Calcoliamo la curvatura gaussiana in un punto P di una superficie sferica. Le curvature per i vari piani sono uguali e uguali a quella di un cerchio di raggio R . 1 Pertanto: κ = κ 1κ 2 = 2 . R Proviamo adesso a calcolare il raggio di curvatura della pseudosfera. Assumiamo che il massimo raggio di curvatura sia sulla trattrice che limita la pseudo sfera, cioè prendendo un piano per la normale contenente l’asse di rotazione. x sin t In questo caso κ 1 = , ponendo x = a cos t . Il raggio minimo si = 2 2 a cos t a a −x troverà sul piano passante per la normale e ortogonale a quello passante per l’asse di rotazione. Si ottiene così una sezione il cui raggio di curvatura è uguale a quello del cerchio di raggio di curvatura a sin t (sezione ortogonale) proiettato su un piano formante cos t 1 . Infine: κ = κ 1κ 2 = − 2 . l’angolo cos t con le sezione ortogonale, ovvero: κ 2 = a sin t a Il segno meno viene dal fatto che i due raggi di curvatura hanno segni opposti. 27