Attilio Ferrari Stelle, galassie e universo FONDAMENTI DI ASTROFISICA APPENDICI Springer Indice - Appendici A Traccia storica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2 L’Astronomia antica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.3 Copernico, Keplero e Galileo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.4 La Gravitazione Universale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.5 La nascita dell’Astrofisica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.6 L’evoluzione stellare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.7 Le distanze delle stelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.8 La Via Lattea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.9 Le galassie esterne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.10 Le “altre” Astronomie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.11 L’Universo alle grandi scale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.12 La Cosmologia fisica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.13 Conclusione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 2 6 8 9 11 13 15 17 20 21 23 25 26 B Principi di trigonometria sferica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.1 La Sfera Celeste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.2 Trigonometria sferica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 27 28 32 C Galileo e il cannocchiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 D Cenni di ottica geometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 E Diffrazione di un’apertura circolare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 F Orbite planetarie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . F.1 Lo studio delle orbite con gli integrali primi del moto . . . . . . . . . . . . F.2 Energia totale su orbite ellittiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . F.3 Leggi temporali del moto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 45 48 48 v vi Indice - Appendici Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 G Equazioni cinetiche della fluidodinamica e derivazione delle equazioni macroscopiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G.1 Equazioni cinetiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G.1.1 Equazione di Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G.2 Equazioni macroscopiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 51 52 54 H Lo stato di plasma, equazioni cinetiche ed equazioni macroscopiche . . H.1 Lo stato di plasma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H.1.1 Quasi-neutralità dei plasmi . . . . . . . . . . . . . . . . . . . . . . . . . . . . H.1.2 La frequenza di plasma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H.1.3 La conduttività elettrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H.2 Teoria cinetica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H.3 Teoria fluida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H.3.1 Modello a due fluidi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H.3.2 Equazioni magnetoidrodinamiche . . . . . . . . . . . . . . . . . . . . . . H.3.3 Equazioni magnetoidrodinamiche ideali . . . . . . . . . . . . . . . . . H.3.4 Il regime di plasma freddo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H.3.5 Il regime di forte campo magnetico . . . . . . . . . . . . . . . . . . . . . H.4 Teoria delle orbite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H.4.1 Moti di deriva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H.4.2 Deriva elettrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H.4.3 Deriva di gradiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H.4.4 Deriva di curvatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H.4.5 Specchi (mirrors) magnetici . . . . . . . . . . . . . . . . . . . . . . . . . . . H.5 Bottiglie magnetiche cosmiche, le fasce di Van Allen . . . . . . . . . . . . . Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 57 59 59 60 60 62 63 66 68 69 69 70 73 74 75 75 76 79 80 I Onde nei plasmi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I.1 Onde magnetoidrodinamiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I.2 Onde elettromagnetiche (E0 = B0 = 0) . . . . . . . . . . . . . . . . . . . . . . . . . I.2.1 Propagazione k k E . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I.2.2 Propagazione k ⊥ E . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 81 83 84 84 85 J Teoria dell’irraggiamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . J.1 Frenamento di particelle cariche nella materia . . . . . . . . . . . . . . . . . . . J.2 Perdite per ionizzazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . J.3 Calcolo con i potenziali ritardati di Liénard-Wiechert . . . . . . . . . . . . J.3.1 Distribuzione angolare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . J.3.2 Distribuzione spettrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 87 87 89 92 95 96 Indice - Appendici vii K Accelerazione dei raggi cosmici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 K.1 Accelerazione dei raggi cosmici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 L Evoluzione dello spettro di corpo nero nell’espansione dell’Universo . 103 Appendice A Traccia storica A.1 Introduzione L’Astronomia è la scienza che studia la struttura, la dinamica e l’evoluzione degli oggetti che si osservano in cielo. È quindi una delle principali attività creative dell’uomo verso la comprensione dell’ordinamento dei fenomeni naturali. È anche la scienza più antica, in quanto il suo grande laboratorio è esteso sulla volta celeste e, almeno entro certi limiti, non ha richiesto all’origine grandi tecnologie: bastano l’occhio umano e un’attenta, regolare osservazione dei fenomeni. L’Astronomia assunse agli inizi della civiltà una valenza di “magia” nell’illusione di poter collegare il verificarsi di fenomeni celesti (moto del Sole attraverso le costellazioni, eclissi, comparsa di comete, ecc.) con la predizione di eventi umani. Questa vana speranza portò all’astrologia, che ancora oggi vanta indebitamente un’origine scientifica. Va tuttavia detto che gli astrologi nel passato svolsero un’importante funzione di raccolta di dati osservativi sui moti planetari, che permisero agli astronomi (che spesso per sopravvivere si dovettero anche vestire da astrologi) di formulare le leggi fisiche della gravitazione. Altre importanti funzioni dell’Astronomia furono quelle pratiche di predire l’evoluzione delle stagioni, fondamentale per le civiltà agricole, e di permettere di definire un sistema di riferimento “universale” in grado di guidare naviganti e nomadi in terre sconosciute. L’inizio dell’Astronomia come scienza quantitativa nel mondo occidentale risale agli antichi Greci: Aristarco, Eratostene, Eudosso, Ipparco, Tolomeo svilupparono una completa interpretazione dei moti celesti a carattere geocentrico, già basata sulla conclusione scientifica che la Terra fosse sferica e non piatta e furono in grado di misurare con grande approssimazione le dimensioni della Terra e le distanze planetarie. Ipparco rivelò anche la precessione degli equinozi, un fenomeno molto sottile che porta il Polo celeste a compiere sulla volta celeste un’orbita circolare con raggio di circa 17 gradi in un tempo di 26 mila anni. Tolomeo nel II secolo d. C. presentò una teoria cinematica dei moti planetari che permetteva di interpretare tutte le orbite in termini di singoli cerchi o combinazioni di due o più cerchi. Il cerchio e la sfera 1 2 A Traccia storica erano considerate curve e figure perfette: perciò, in accordo con le teorie filosofiche Aristotele, il cielo fu concepito come un sistema perfetto, incorruttibile, e quindi infinito nello spazio e nel tempo. Si dovette attendere fino al XVI secolo per rivedere questa visione dell’Universo. Anzitutto Copernico mostrò come la descrizione dei moti planetari risultasse semplificata assumendo come centro di riferimento il Sole e non la Terra, trasformando il concetto geocentrico dell’Universo in eliocentrico. Quindi Tycho Brahe e Johannes Kepler mostrarono che le orbite dei pianeti non sono esattamente circolari, bensı̀ ellittiche con piccole eccentricità e che valgono precise regole quantitative che legano la velocità orbitale alla distanza dal Sole e il periodo di rivoluzione intorno al Sole all’asse maggiore dell’ellisse. Infine, 400 anni fa, Galileo compı̀ il primo fondamentale progresso tecnologico con l’utilizzazione del cannocchiale per osservazioni astronomiche. Mostrò che i pianeti sono oggetti di dimensioni finite, che Venere ha fasi come la Luna, che il Sole non è puro e perfetto, bensı̀ “corrotto” da macchie. Da quel momento la modellizzazione teorica e il progresso tecnologico strumentale si intrecciano in una gara travolgente che continua tuttora. A.2 L’Astronomia antica Esistono molti testi che trattano in gran dettaglio e con dovizia di informazioni la storia dell’Astronomia; ad esempio la Storia dell’Astronomia di J.P. Verdet [1]. Qui indicheremo solo le tappe più significative in un rapido sguardo d’insieme, limitando le indicazioni storiche all’Astronomia occidentale, perchè fu la sola a sviluppare un modello scientifico di Universo. La prima fase è quella dell’Astronomia antica, che culmina con la formulazione della teoria tolemaica, incentrata sulla classificazione e interpretazione dei moti degli “astri”, intendendo come tali il Sole, la Luna, i pianeti Mercurio, Venere, Marte, Giove, Saturno e le stelle. La differenza tra stelle e pianeti consisteva nel fatto che, mentre le stelle compiono nel cielo traiettorie regolari, questi ultimi presentano moti irregolari, anche retrogradi (in greco “planétes” significa appunto “errante”); un’osservazione che informò la costruzione di modelli di Universo per oltre 2000 anni. Le osservazioni venivano effettuate con gli occhi, nel visibile, e senza grandi mezzi tecnici per acuire la visione. I Babilonesi raggiunsero precisioni molto elevate nelle osservazioni astronomiche cosı̀ da far supporre ad alcuni storici che essi abbiano usato, per affinare la propria vista, lenti naturali di quarzo reperibili nelle sabbie desertiche. Ma gli unici strumenti di misura di cui abbiamo prove di esistenza furono varie forme di gnomoni, quadranti e sestanti per derivare le distanze angolari degli oggetti celesti, e seguire il moto dei pianeti e della Luna rispetto alle stelle, dette appunto “fisse”, perché, pur ruotando giornalmente intorno alla Terra, mantenevano le loro disposizioni relative (Fig. A.1). A.2 L’Astronomia antica 3 Fig. A.1 Antichi strumenti di osservazione Alla presunta carenza di mezzi tecnici, gli astronomi antichi, dalla Grecia alla Cina, supplirono con accuratissime, regolari e attente osservazioni che permisero, ad esempio, a Ipparco di valutare fenomeni impercettibili come la precessione degli equinozi, che comporta una lentissima variazione del polo nord celeste (oggi prossimo alla Stella Polare appunto) su tempi dell’ordine delle decine di migliaia di anni. Eratostene si rese conto che il Sole culmina a tempi diversi in luoghi a longitudini diverse (ad esempio Alessandria ed Assuan in Egitto), e propose che ciò fosse facilmente spiegabile considerando la Terra sferica, e ne calcolò il raggio con una notevole approssimazione rispetto al valore oggi noto. Va tuttavia citato il fatto che nel ’900 alcuni pescatori scoprirono al largo della costa dell’isola di Antikythera nell’Egeo il relitto di una nave mercantile romana del I secolo a. C. tra i cui reperti, oltre a statue e suppellettili di grande interesse archeologico, fu trovata una scatoletta di bronzo delle dimensioni di 326×164×48 Fig. A.2 Lo schema del meccanismo di Antikythera 4 A Traccia storica mm contenente un meccanismo basato su 30 ruote dentate. Dopo anni di studio gli studiosi sono giunti alla conclusione che si tratta di un raffinato meccanismo per calcolare i moti del Sole, della Luna e dei pianeti allora noti e della visibilità delle principali stelle e costellazioni (Fig. A.2). Non esistono altri esemplari o notizie di oggetti di tal genere, forse più usati per previsioni astrologiche che astronomiche; certo rivela la capacità degli astronomi dell’epoca di realizzare sistemi meccanici di alta precisione per gli studi astronomici. Il modello di Universo utilizzato dagli antichi, si occupò essenzialmente dello studio dei moti celesti e, per interpretare il moto retrogrado dei pianeti rispetto alle stelle fisse (Fig. A.3), fu sviluppato un sistema geometrico sistematizzato da Claudio Tolomeo nell’età ellenistica (intorno al 127-150 d.C.) nel suo testo “Megále Sýntaxis” (“Grande Trattato”), dagli arabi chiamato Almagesto. In tale cosmologia la Terra è una sfera immobile al centro dello spazio, la volta celeste con le stelle fisse ruotano intorno ad essa e i pianeti, il Sole e la Luna ruotano su un complesso sistema di sfere deferenti ed epicicliche (Fig. A.4). Ogni particolare deviazione del moto Fig. A.3 Moto retrogrado apparente di Marte (72 giorni ogni 2 anni) dei pianeti da quello della sfera delle stelle fisse veniva interpretato aggiungendo un’ulteriore sfera con un suo moto proprio: un sistema che oggigiorno i matematici chiamerebbero sviluppo in funzioni armoniche sferiche. Si trattava di un modello soddisfacente sulla base delle misure disponibili, sufficientemente completo e consistente, in grado di prevedere eclissi e occultazioni, e anche effetti su lunghi tempi scala come la precessione degli equinozi già citata. Non dobbiamo quindi pensare all’Astronomia antica come errata perché geocentrica, bensı̀ come ben costruita e onnicomprensiva. Poiché con i moti delle sfere si spiegava tutto, Aristotele assunse tale forma geometrica come perfetta per un Universo perfetto, immutabile e divino, di cui la Terra era il centro assoluto. Un salto, che a noi pare oggi ingiustificato, dal piano della scienza a quello della metafisica. Il reale limite del modello di Universo aristotelico / tolemaico era piuttosto nella sua caratteristica puramente geometrica tanto cara ai Greci antichi, che non affrontava la spiegazione della ragione dei moti sferici, ma rimandava genericamente A.2 L’Astronomia antica 5 Fig. A.4 Il sistema tolemaico e moti epiciclici il loro controllo ad un Demiurgo, onnipotente ed eterno, amante della perfezione. È però vero che Eratostene riconobbe che la Terra doveva essere sferica osservandone l’ombra sulla Luna durante le eclissi lunari; e fu in grado di misurarne il raggio con grande accuratezza entro i limiti degli strumenti di osservazione allora disponibili. Aristarco propose inoltre che il Sole, e non la Terra, fosse il centro dell’Universo: il suo sistema eliocentrico non ebbe tuttavia grande influenza sulla concezione corrente del mondo perché lontano dall’esperienza quotidiana. Il Medioevo in Europa e la lentezza negli sviluppi tecnologici delle civiltà di altre parti del mondo non permisero per lungo tempo di superare questo livello di comprensione della natura dell’Universo. Anzi, in Europa l’Astronomia diventò sempre più vicina all’astrologia, un puro strumento di irrazionale approccio alla natura. 6 A Traccia storica Fig. A.5 Nicolò Copernico (1473 - 1543) e Tycho Brahe (1546 - 1601) A.3 Copernico, Keplero e Galileo L’Astronomia copernicana nasce alla metà del XVI secolo dalla raccolta di una maggior quantità di dati e su tempi più lunghi di quelli utilizzati dagli antichi. Dalle osservazioni di Niccolò Copernico e soprattutto di Tycho Brahe (Fig. A.5) si evidenzia sempre più la difficoltà di spiegare i moti planetari in termini di sfere su sfere secondo lo schema tolemaico. Tale schema diventa troppo complicato da risultare inutilizzabile. Inoltre le previsioni del modello tolemaico sul succedersi delle stagioni diventano sempre più contraddette, entra in crisi il calendario. Il primo passo a risolvere queste difficoltà venne compiuto con intuizione geniale da Copernico che propose, seguendo Aristarco, di trasferire il centro dell’Universo sul Sole: facendo ruotare pianeti e stelle, e anche la Terra, intorno al Sole, i moti dei pianeti sono calcolabili con maggior precisione. Inoltre Copernico suggerı̀ che le stelle stesse non fossero altro che dei Soli posti a grande distanza. Il centro dell’Universo copernicano è una stella, il Sole, la sfera celeste lo racchiude con tante altre stelle e gli ruota intorno; nel mezzo i pianeti orbitano a velocità variabili. A questo punto la Terra è essa stessa un pianeta. Il grande contributo di Copernico sta nel fatto di essere riuscito a “vedere” i moti orbitali dei pianeti sottraendovi il moto della Terra intorno al Sole. Ma va anche detto che Copernico considerò il modello eliocentrico solo come un artificio matematico e non andò oltre a Tolomeo per quanto riguarda l’interpretazione del perché dei moti. La teoria copernicana sarebbe quindi rimasta un argomento di “geografia celeste” se non fossero intervenuti i contributi di Keplero e Galileo [3]. Giovanni Keplero ricavò le leggi dei moti planetari (Fig. A.6): 1. Le orbite dei pianeti sono ellissi di cui il Sole occupa uno dei fuochi; a parte la forma, quel che bisogna notare è che si tratta di orbite piane. 2. La velocità dei pianeti lungo i vari punti dell’orbita è inversamente proporzionale alla distanza dal Sole. A.3 Copernico, Keplero e Galileo 7 Fig. A.6 Johannes Kepler (1571 - 1630) e le leggi sui moti planetari 3. Il quadrato del periodo orbitale dei pianeti (il loro anno) è proporzionale al cubo del semiasse maggiore dell’ellisse. Keplero aveva finalmente individuato le regole che governano i moti dei pia-neti in modo quantitativo: era dunque possibile pensare a come li si potesse produrre [4]. Il contributo di Galileo Galilei (Fig. A.7) fu duplice. Da un lato, con l’utilizzo del cannocchiale, “occhiale a cannone”, rivelò che i pianeti tutti possono avere fasi come la Luna, il che indica che si tratta proprio di corpi sferici illuminati dal Sole, distinti dalle stelle; scoprı̀ i satelliti di Giove, mostrando che non tutti i corpi celesti ruotano intorno al Sole, e tanto meno intorno alla Terra; osservò le macchie solari, cancellando il concetto che i corpi celesti fossero perfetti e immutabili [5]. Inoltre con i suoi esperimenti sulla caduta dei gravi, sul piano inclinato e sul pendolo fondò il metodo scientifico, detto appunto metodo galileiano, e introdusse il principio d’inerzia: i corpi non soggetti ad alcun agente esterno rimangono in quiete o si muovono di moto rettilineo uniforme. In tal modo divenne chiaro il fatto Fig. A.7 Galileo Galilei (1564 - 1642) e Isaac Newton (1642 - 1727) 8 A Traccia storica che i moti planetari, tutt’altro che rettilinei e uniformi, rimandavano ad un agente esterno. Questo fu proprio il punto che lo mise in difficoltà con la Chiesa: le leggi di Keplero avrebbero permesso di ricavare le caratteristiche dell’agente esterno, quindi del Demiurgo; Dio invece deve essere conoscibile solo attraverso le Scritture. A.4 La Gravitazione Universale Più lontano dal controllo della Chiesa di Roma, Isaac Newton (Fig. A.7) raccolse l’eredità di Galileo e, con le sue grandi capacità matematiche, ricavò la legge che “muove il Sole e l’altre stelle”, quella che oggi chiamiamo la legge di gravitazione universale. I moti planetari sono dovuti all’azione del Sole; ma tutte le masse si sentono attraverso questa forza che è anche quella che ci tiene attaccati alla superficie della Terra, che fa “cadere” allo stesso modo la mela e la Luna: F= GM1 M2 . r2 (A.1) Newton pubblicò i suoi Philosophiae Naturalis Principia Mathematica nel 1687 [2], dando inizio al primo periodo dell’Astronomia teorica. Nei due secoli successivi Christiaan Huygens, Leonhard Euler, Jean Baptiste Le Rond d’Alembert, Pierre Simon de Laplace e Joseph-Louis Lagrange furono i più grandi esponenti dello studio della meccanica celeste, con cui si pervenne all’interpretazione dinamica delle orbite dei pianeti e dei loro satelliti e successivamente alla predizione dell’esistenza di pianeti ignoti agli antichi. Lagrange mostrò anche come sia importante studiare il moto dei singoli pianeti tenendo conto non solo dell’azione del Sole, ma anche di quella di tutti gli altri pianeti. Tuttavia non esiste alcuna soluzione analitica completa del problema a molti corpi. Giovanni Plana, allievo di Lagrange a Torino, impostò lo studio del problema a molti corpi con l’applicazione del metodo perturbativo e lo applicò al calcolo dettagliato del moto della Luna. A fianco degli studi teorici, nel XVII e XVIII secolo ebbero grande sviluppo le tecniche osservative, che perfezionarono i cannocchiali di Galileo e Newton. Tra i contributi osservativi più importanti occorre ricordare quelli di Giovanni Domenico Cassini su Giove e gli anelli di Saturno, di Edmund Halley sulle comete e sulla catalogazione delle stelle, di James Bradley e Tobias Mayer sui moti propri stellari. Nel 1781 William Herschel, originario di Hannover, trasferitosi in Inghilterra, scoprı̀ Urano, il primo pianeta non noto agli antichi; in seguito William e il figlio John Herschel si dedicarono alla catalogazione di stelle deboli e nebulose con telescopi sempre più grandi, cercando di comprenderne la distribuzione. Charles Messier produsse nel 1771 il primo grande catalogo di oggetti nebulari; nel 1801 Giuseppe Piazzi scoprı̀ il pianetino Cerere; nel 1837 Friedrich Bessel ricavò la prima distanza stellare (quella della stella 61 Cygni) col metodo della parallassi che discuteremo in seguito. A.5 La nascita dell’Astrofisica 9 Fig. A.8 Il modello della Via Lattea secondo William Herschel, con il Sole prossimo al centro Cosı̀, si giunse alla metà del XIX secolo alla definizione dell’Universo come un insieme di stelle e nebulose disposte a grandi distanze dal Sistema Solare, fino a un milione di volte maggiori delle distanze planetarie. L’Universo delle stelle, come proposto da Herschel, appariva schiacciato a forma di disco che noi vediamo proiettato sulla sfera celeste nella Via Lattea già ben nota agli antichi. Il Sole si troverebbe in una posizione centrale nel disco, perché la Via Lattea non mostra grandi differenze lungo l’intera circonferenza, includendo anche l’emisfero sud (Fig. A.8). In quegli anni fu anche sperimentata la finitezza della velocità della luce, già sospettata da Galileo che ne tentò invano la misura. Nel 1676 Ole Rømer, proprio studiando i ritardi nel succedersi delle eclissi del satellite Io di Giove, fu in grado di misurare che i segnali luminosi viaggiano ad una velocità grande ma finita, che oggi sappiamo essere di 300.000 km al secondo. Pertanto, date le grandi dimensioni della distribuzione delle stelle al di fuori del Sistema Solare, la nostra conoscenza di oggetti astronomici posti a grandi distanze risulta ritardata nel tempo: guardare lontano, significa guardare anche indietro nel tempo. Vediamo la Luna più giovane di un secondo, il Sole di oltre 7 minuti, la stella Proxima Centauri di circa 3 anni, le stelle più lontane e deboli di parecchie migliaia di anni. A.5 La nascita dell’Astrofisica Il XIX secolo segnò l’avvento di una nuova metodologia nell’Astronomia, l’Astrofisica, dedicata allo studio della struttura fisica degli oggetti celesti, pianeti, stelle e nebulose [6]. Ciò fu reso possibile dalla nascita della spettroscopia ad alta sensibilità e risoluzione, in grado di disperdere la luce delle stelle nelle varie componenti. Il metodo era già stato utilizzato da Newton per il Sole. Inoltre William Herschel intorno al 1800 aveva mostrato che l’emissione del Sole si estendeva al di là del visibile, nella banda che chiamò appunto infrarossa. Ora si poteva applicare lo stesso metodo anche all’emissione molto più debole delle stelle. Si fu cosı̀ in grado di valutare quantitativamente il fatto che le stelle non sono tutte eguali, ma hanno diversi colori. Il loro spettro, cioè la distribuzione della loro 10 A Traccia storica luminosità alle varie frequenze, segue la cosiddetta legge del corpo nero di Gustav Robert Kirchhoff: proprio come si trattasse di giganteschi “forni” a varie temperature, secondo la teoria termodinamica giunta in quegli anni alle prime sistemazioni teoriche. Padre Angelo Secchi alla Specola Vaticana nella seconda metà del XIX secolo fu tra i primi astronomi a classificare le stelle in base a questa proprietà. Nel 1814 Joseph von Fraunhofer aveva già scoperto che lo spettro del Sole è solcato da un numero grandissimo di righe di assorbimento, attraverso le quali è possibile calcolare la situazione termodinamica dettagliata dell’atmosfera solare e la sua composizione chimica, confrontando lo spettro solare con gli spettri dei gas rarefatti in laboratorio. Mentre fino ad allora delle stelle si era soltanto misurato il flusso totale di radiazione, ora si poteva valutarne l’intensità nei vari colori, cioè l’energia specifica, e ciò permise di concludere che erano sfere gassose ad elevate temperature tenute insieme dalla forza di gravità. Cosı̀ a metà del XIX secolo Hermann von Helmholtz potè cimentarsi nei primi calcoli sulla struttura del Sole, mostrando l’inadeguatezza dei combustibili chimici per sostenerne l’esistenza al livello di irraggiamento attuale per più di qualche centinaia di migliaia di anni, un tempo troppo breve rispetto all’età della Terra stessa, pari a 4.5 miliardi di anni come mostrato dalle radioattività delle rocce. Nacque l’Astrofisica teorica, con problematiche che dalla Meccanica Celeste e dallo studio delle orbite si muovevano verso la fisica della struttura dell’Universo e della sua origine. Il XIX secolo vide in generale l’espandersi dell’attività in campo astronomico con la costituzione dei primi grandi osservatori. Potè cosı̀ iniziare lo studio sistematico della distribuzione delle stelle nello spazio combinato con la classificazione del loro tipo spettrale, quindi della loro configurazione fisica. Un’importante scoperta della fisica, che si rivelò di fondamentale importanza per l’Astronomia, è dovuta a Hippolyte Fizeau. Nel 1848 fu in grado di mostrare in laboratorio che le onde luminose subiscono l’effetto Doppler, già ben noto per le onde acustiche. Se sorgente (stella) e osservatore (telescopio) sono in moto relativo di allontanamento, le componenti spettrali, in particolare le righe, sono spostate verso il rosso; se viceversa si avvicinano le componenti spettrali sono spostate verso il blu. In particolare vale la seguente legge v ∆λ =± λ c (A.2) dove v è la velocità relativa di allontanamento (+) o avvicinamento (-) e c la velocità della luce, che Fizeau fu in grado di misurare con elevata precisione. Dunque, dall’osservazione dalla deformazione degli spettri stellari rispetto a quelli di laboratorio, si può ricavarne la velocità del moto relativo alla Terra. Dato il numero limitato di moti propri osservabili in alcune stelle vicine, lo spostamento Doppler è il metodo più diretto di misurare i moti degli oggetti celesti. Ne derivarono subito le indicazioni che l’Universo è tutt’altro che immutabile, anzi è caratterizzato da una dinamica globale molto violenta. A.6 L’evoluzione stellare 11 Fig. A.9 La nebulosa del Granchio Un altro elemento veniva a disturbare il concetto di Universo immutabile. Gli astronomi incominciarono a rivelare la comparsa di oggetti stellari non cometari che improvvisamente appaiono nelle profondità dello spazio, aumentano rapidamente la loro luminosità e poi scompaiono nel nulla. Eventi del genere erano già stati registrati in tempi lontani, in particolare dai Cinesi, che le soprannominavano “stelle ospiti”. Un evento particolarmente famoso fu la stella ospite dell’anno 1054 d.C. nella costellazione del Granchio, dove oggi si osserva una nebulosa con una dinamica molto ricca, a indicare il resto di una gigantesca esplosione (Fig. A.9). Tanto fu grande quell’evento che oggi lo cataloghiamo, insieme ad altri, come supernova. Lo stesso Tycho nel 1572 fu testimone dell’apparire di un altra supernova proprio mentre osservava Venere; Keplero e Galileo ne osservarono un’altra nel 1604. Dunque le stelle cambiano, evolvono! A.6 L’evoluzione stellare Nel 1908 le ricerche sistematiche sugli spettri e le luminosità assolute delle stelle permisero di mostrare che le temperature e le luminosità delle stelle sono strettamente collegate. Ejnar Hertzsprung e Henry Norris Russell costruirono indipendentemente un diagramma osservativo diventato oggi fondamentale per la comprensione della struttura ed evoluzione delle stelle, che mostrava come le stelle blu, le più calde in termini della curva di corpo nero, sono anche le più luminose, mentre quelle rosse, cioè le più fredde, sono le meno luminose. Il diagramma di Hertzsprung - Russell è rappresentato schematicamente in Fig. A.10: la maggior parte delle stelle si dispone lungo quella che si chiama la “sequenza principale”, che conferma appunto il fatto che le stelle più calde sono anche le più luminose. Studiando sistemi di stelle binarie, fu possibile verificare che è la massa, cioè la quantità di materia autogravitante, a definire le caratteristiche di una stella, 12 A Traccia storica in particolare il suo colore e luminosità. Questo risultato era però reso incerto dall’impossibilità di spiegare l’origine della potenza delle stelle: nessun combustibile noto era sufficientemente potente. Si dovette aspettare fino al 1939 quando Hans Bethe comprese che le reazioni termonucleari (poi anche usate nei reattori nucleari) potevano risolvere il dilemma in quanto capaci di trasformare in energia quantità non trascurabili della massa dei nuclei atomici di cui è costituita la materia, secondo il principio di equivalenza E = mc2 della teoria della relatività di Einstein; mentre le reazioni chimiche raggiungono al massimo una trasformazione ∼ 10−8 mc2 , con le reazioni termonucleari che transmutano l’idrogeno in elio si raggiunge un efficienza ∼ 10−2 mc2 . Con quest’ultimo tassello nella fisica delle stelle, fu possibile produrre modelli fisici che riproducevano le caratteristiche misurabili delle stelle osservate, permettendo anche di ricavare i dati sull’interno opaco. Il pioniere di questi modelli era stato Helmholtz, cui seguirono Robert Emden, Martin Schwarzschild, Subrahmanyan Chandrasekhar. Nel contempo divennero disponibili gli elaboratori elettronici ad elevata potenza di calcolo che permisero di sviluppare tali modelli tenendo conto dei processi e fenomeni fisici dettagliati. Fu possibile comprendere che il Sole brucia idrogeno al suo interno trasformandosi in elio, mentre altri tipi di stelle, le cosiddette stelle giganti, sono in fasi di vita più avanzate in cui è l’elio che brucia a sua volta trasformandosi in carbonio. Si noti che l’espressione “brucia” non ha nulla a che fare con un qualunque processo chimico, bensı̀ è solo modo di esprimere il fatto che una reazione fisica di trasmutazione nucleare porta alla produzione di energia termica. Pertanto fu possibile calcolare come le stelle evolvono cambiando nel tempo. Si passò dai modelli statici delle stelle ai modelli evolutivi. Si calcolò che le stelle si distaccano dal gas interstellare per collasso dovuto alla forza di autogravitazione; nel collasso si surriscaldano al punto di raggiungere l’innesco delle reazioni termonucleari, prima fra tutte quella dell’idrogeno. Esaurito il combustibile, la stella diventa di nuovo preda dell’autogravitazione, andando incontro ad un nuovo sur- Fig. A.10 Schema del diagramma di Hertzsprung-Russell A.7 Le distanze delle stelle 13 Fig. A.11 Il ciclo di vita di una stella di grande massa riscaldamento e alle condizioni di innesco di successive reazioni. Si tratta di una progressiva battaglia tra la forza di gravità che tende a ridurre la massa gassosa ad un punto e la pressione termica sprigionata dalle reazioni termonucleari. Fino ad un punto in cui la gravità prevale e il collasso finale è violento e diventa esplosivo, trasformando le stelle in nebulose planetarie o supernovae. In Fig. A.11 è ripotato lo schema dell’evoluzione di una stella di massa maggiore del Sole verso la fase supernova. Il concetto di Universo in evoluzione rappresenta una grande conquista della moderna Astronomia rispetto ai modelli antichi. L’Universo non è più immutabile, neppure infinito nello spazio e nel tempo. Quali le conseguenze? Il primo passo dev’essere dunque la definizione dei suoi limiti spaziali, se li possiamo raggiungere. A.7 Le distanze delle stelle La distanza degli oggetti celesti è la grandezza fisica più difficile da misurare, eppure fondamentale per definire tutte le altre: ad esempio, per valutare quanto potente è una stella non basta sapere quanta radiazione ne riceve il nostro telescopio, ma anche quanto è distante da noi, perché il flusso di radiazione decade in modo inversamente proporzionale al quadrato della distanza. Ad esempio, una stella debole può essere intrinsecamente debole, oppure molto luminosa, ma lontanissima. Di conseguenza tutta la fisica delle stelle, e degli altri corpi celesti, dipende anzitutto dalla distanza. Purtroppo però, proprio a causa delle grandi distanze in Astronomia, non possiamo avere una visione stereoscopica della distribuzione di stelle: tutto ci appare appiattito, all’infinito. Possiamo aumentare le capacità di visione tridimensionale combinando osservazioni del cielo separate di sei mesi, quando la Terra si trova da parti opposte del Sole, quindi a distanza di 300 milioni di chilometri; esattamente come fanno i geografi quando traguardano punti di riferimento da due posizioni di distanza relativa nota. Il metodo è quello della cosiddetta triangolazione, basata sulla ricostruzione trigonometrica di triangoli di cui siano misurati i lati e i due angoli adiacenti. 14 A Traccia storica Fig. A.12 Lo schema delle misure di parallasse annua Ebbene in Astronomia alcune stelle assumono posizioni relative differenti quando osservate a sei mesi di distanza: sono stelle “in primo piano”, ma la maggior parte di esse non mostrano alcun cambiamento, sono praticamente stelle fisse. Questo avviene perché, quando il triangolo ha una base troppo piccola rispetto all’altezza, gli angoli adiacenti sono praticamente ambedue di 90 gradi. Oggi solo i telescopi permettono di raggiungere risoluzioni inferiori a qualche centesimo di secondo d’arco e quindi la distanza maggiore che possiamo misurare con questo metodo è: 150 milioni di km = 0.01 arc sec = 4.848 × 10−8 radianti (A.3) p= d d = 3.086 × 1020 cm = 100 parsec = 326 anni luce . (A.4) Tali misure dirette sono dette misure di parallassi, essendo questo il nome dell’angolo θ sotto cui viene “visto” il raggio dell’orbita terrestre dalla stella (Fig. A.12). Come si possono misurare le distanze maggiori, quelle cioè delle stelle “fisse”? La fisica stellare permette, come abbiamo visto precedentemente, di concludere che tutte le stelle di una data massa hanno la stessa luminosità e lo stesso colore. Pertanto, individuata una stella con lo stesso colore del Sole (in realtà si richiede che abbia lo stesso spettro), si può concludere che ne deve avere la stessa luminosità. Se appare diversamente luminosa, significa che il suo flusso di radiazione è modificato dalla distanza. Dal confronto tra la luminosità apparente e quella che avrebbe se fosse alla stessa distanza del Sole, si può dunque valutarne la distanza. Definendo come luminosità assoluta della stella quella che avrebbe se fosse alla distanza di 10 parsec, si può scrivere: Lapparente = Lassoluta 10 pc distanza in parsec 2 . (A.5) Quindi, confrontando la luminosità apparente di una stella con quella assoluta dedotta dalle caratteristiche spettroscopiche tramite il diagramma di HertzsprungRussell, se ne ottiene la distanza. Questo metodo è detto delle parallassi spettroscopiche. Nel 1912 l’astronoma Henrietta Leavitt all’Harvard College Observatory (Fig. A.13) scoprı̀ un fatto di fondamentale importanza per lo sviluppo della misura delle distanze delle stelle: una classe di stelle variabili, il cui prototipo è la stella δ della costellazione del Cefeo, da cui dette variabili Cefeidi, mostra una precisa relazione A.8 La Via Lattea 15 Fig. A.13 Henrietta Leavitt (1868 - 1921) di proporzionalità tra periodo di variabilità e luminosità assoluta: Lmedia log = 1.15 log Pgiorni + 2.47 . LSole (A.6) Pertanto con una misura di periodo di variabilità (si tratta di stelle con periodi tipici di 5 - 10 giorni) e curva di luce sinusoidale molto regolare) si ricava direttamente la luminosità assoluta, che, confrontata con quella apparente, permette di avere direttamente la distanza. Le Cefeidi sono quindi preziosi indicatori di distanza, ancor oggi i più accurati disponibili. Anche altre classi di variabili (RR Lyrae, W Virginis) hanno infatti simili correlazioni periodo - luminosità assoluta, e anch’esse possono essere utilizzate come indicatori di distanza. Un altro tipo di indicatore sono le supernove, cioè gli eventi esplosivi che caratterizzano la fine della vita delle stelle. La luminosità massima raggiunta dalle supernove è caratteristica del tipo di esplosione che dipende dalla massa della stella; pertanto risulta possibile dare una valutazione della luminosità assoluta del fenomeno e, confrontandola con quella apparente, giungere ancora ad una misura di distanza. Poiché le supernove raggiungono luminosità pari a 10 miliardi di Soli, esse sono gli indicatori migliori per le grandissime distanze. A.8 La Via Lattea Agli inizi del XX secolo il concetto di Universo era quello di un vasto sistema di stelle e nubi di gas rarefatto a forma di disco di cui il Sole occupa una posizione centrale: in gran parte si adattava allo schema della Via Lattea proposto da William Herschel fin dal 1780. Questo modello fu sostanziato quantitativamente da Jacobus Kapteyn nel 1922 sulla base di un’accurata statistica della distribuzione di stelle. Il problema scientifico fu la ricostruzione della geografia tridimensionale dell’Universo con la misura 16 A Traccia storica delle distanze delle stelle secondo i metodi descritti nel precedente paragrafo: Kaptyen giunse alla conclusione che gli estremi del disco dovessero trovarsi ad almeno 6.000 anni luce. Contemporaneamente però un altro astronomo, Shapley, giungeva ad un modello completamente diverso. Si era occupato non delle stelle singole, ma di quei meravigliosi globi di stelle che vanno sotto il nome di ammassi globulari (Fig. A.14). Fig. A.14 L’ammasso globulare NGC 6093 Si tratta di sistemi fino a 100.000 stelle, gigantesche “lampadine” cosmiche, facili quindi da rivelare. Per gli ammassi è possibile una buona misura delle distanze in quanto il metodo delle parallassi spettroscopiche può essere applicato agli spettri di tutte stelle dell’ammasso che ovviamente si trovano circa alla stessa distanza. In realtà si confrontano il diagramma di Hertzsprung - Russell dell’ammasso con quello delle stelle vicine con distanze note e si opera la sovrapposizione delle sequenze principali: in tal modo si ha la differenza tra luminosità assoluta e apparente, e quindi si ottiene la distanza in modo più affidabile che non riferendosi a singole stelle. Utilizzando tale tecnica combinata con il metodo periodo - luminosità delle stelle variabili osservate in 93 ammassi, Harlow Shapley ricostruı̀ la disposizione tridimensionale degli ammassi globulari, ricavando che alcuni di essi sono ben più lontani delle stelle fino ad allora osservate. Inoltre essi non sono raccolti in un disco, bensı̀ in uno sferoide di dimensioni dell’ordine dei 150.000 anni luce, il cui centro di simmetria è nella direzione della costellazione del Sagittario, ben 25.000 anni luce lontano dalla posizione del nostro Sistema Solare. Improvvisamente l’Universo poteva diventare 10 volte più grande di quanto immaginato da Kapteyn e non più centrato sul Sole (Fig. A.15). I due punti di vista furono successivamente riconciliati. Kapteyn non aveva potuto tener conto dell’effetto di assorbimento della luce delle stelle da parte del mezzo interstellare che ne riduce fortemente la luminosità e ne cambia anche lo spettro. Quindi aveva sistematicamente sottovalutato le distanze stellari, ma soprattutto non aveva considerato che il sistema stellare potesse estendersi ben più in là di quanto A.9 Le galassie esterne 17 Fig. A.15 Il modello di Shapley della Via Lattea osservabile: la nostra visione del disco galattico è ridotta dalla “nebbia” assorbente del mezzo interstellare. Gli ammassi globulari sono potenti “lampadine”, ma soprattutto sono presenti anche fuori del disco, in un alone sferoidale che contiene poco gas interstellare, poca “nebbia”. Per questo Shapley potè vedere più lontano. E notiamo soprattutto che arrivò a dimostrare che il Sole non è al centro dell’Universo di stelle. Un’altra rivoluzione copernicana si era consumata, anche se meno drammatica della prima. Negli anni successivi fu possibile studiare il moto del Sole rispetto alle stelle vicine, ricavare il moto d’insieme di gruppi fisici di stelle e ricostruire che il disco della Via Lattea ruota intorno al centro nella costellazione del Sagittario. La velocità di rotazione cambia alle diverse distanze dal centro seguendo le leggi della dinamica kepleriana; in particolare il Sistema Solare si trova a 25.000 anni luce dal centro, ha una velocità di rivoluzione di 220 km s−1 e compie una rivoluzione in 240 milioni di anni. In effetti Il Sistema Solare compie anche delle oscillazioni rispetto al piano del disco: fra 15 milioni di anni la Terra sarà al di sopra del disco, libera dalle ”nebbie” del mezzo interstellare, e l’umanità, se sarà sopravvissuta, potrà avere una fantastica visione diretta dei ricchi ammassi di stelle nelle regioni centrali della Via Lattea. A.9 Le galassie esterne La prima metà del XX secolo rappresenta un periodo di grande sviluppo tecnologico dell’Astronomia ottica. Il più grande telescopio rifrattore con una lente da 1.02 m operava a Yerkes dal 1897. A Mount Wilson fu inaugurato il telescopio riflettore Hooker con specchio da 2.5 m nel 1905 e nel 1948 iniziò ad operare a Mount Palomar il riflettore Hale con specchio da 5.1 m (Fig. A.16), che è rimasto per grande tempo il maggior strumento al mondo. Mount Wilson e Mount Palomar hanno consentito all’umanità di osservare oltre la Via Lattea. 18 A Traccia storica Fig. A.16 Il telescopio Hale dell’Osservatorio di Mount Palomar Nel 1923 Edwin Hubble (Fig. A.17) utilizzò il telescopio Hooker per osservare la nebulosa di Andromeda e ottenne una fotografia storica: mostrò che essa era un insieme gigantesco di stelle e tra esse potè identificare una Cefeide. Quando applicò la legge di Leavitt, ne ottenne una distanza 2.25 milioni di anni luce, quasi 1000 volte maggiore delle dimensioni della nostra Galassia. Quella nebulosa doveva rappresentare un oggetto distinto dalla Galassia, probabilmente un “Universo isola” come la Galassia appunto. Proprio tre anni prima, nel 1920, Shapley aveva affrontato un’accesa discussione con il collega Heber Curtis alla National Academy of Sciences a Washington sulla natura delle nebulose catalogate da Messier prima e più recentemente da Lord Rosse, che aveva costruito a proprie spese un gigantesco telescopio da 2 m in Irlanda (il Leviatano). Con quello strumento Lord Rosse aveva riconosciuto che molte delle nebulose presentavano una chiara struttura a spirale. Secondo Curtis questo indicava che si trattava di “Universi isola”, strutture stellari a disco rotanti analoghe alla Via Lattea, la nostra Galassia. Shapley era invece dell’opinione si trattasse di oggetti all’interno della Via Lattea, quindi di relativamente piccole dimensioni, simili agli ammassi; questa volta perse la scommessa. Fig. A.17 Edwin Hubble e il telescopio Hooker dell’Osservatorio di Mount Wilson A.9 Le galassie esterne 19 Fig. A.18 Tipi di galassie secondo la classificazione morfologica di Hubble La soluzione al dibattito venne appunto da Mount Wilson: Hubble fu in grado di risolvere la nebulosa di Andromeda in stelle, una delle quali con la caratteristica curva di luce delle Cefeidi. Era nato l’Universo delle galassie, migliaia di volte più grande di quanto fino allora ipotizzato. Hubble continuò le sue indagini sulle galassie esterne, classificandole in tre classi morfologiche (Fig. A.18): spirali, spirali barrate e lenticolari (circa 77% del totale), ellittiche (20%), irregolari (3%). Ancora non sappiamo con certezza quali siano i processi di formazione ed evoluzione delle galassie dei vari tipi, ma certamente il fattore fisico che divide ellittiche e spirali è il momento angolare: le ellittiche hanno basso momento angolare, le spirali alto. Si può facilmente comprendere questa dicotomia come quello che i fisici chiamano l’effetto “ballerina”. La ballerina che ruota rapidamente e contrae le proprie braccia distese vedrà crescere la propria velocità angolare. Inoltre il gas galattico (stelle e gas interstellare) subirà anche un progressivo schiacciamento in un piano perpendicolare all’asse di rotazione: si formerà il disco delle spirali. Nelle ellittiche tutto ciò non si verifica perché ruotano lentamente e quindi mantengono una forma più sferoidale. Peraltro non è chiaro come si differenzino le condizioni iniziali che portano alle galassie dei due tipi. Attualmente alcune evidenze suggerirebbero che le galassie ellittiche possano formarsi dalla coalescenza di due o più spirali, con grande dissipazione di momento angolare nell’interazione gravitazionale. Va detto che la collisione di galassie non è un urto nella comune accezione del termine, non si hanno cioè scontri tra particelle o stelle. Essa è puramente determinata dall’interazione gravitazione, è quindi una specie di grande marea che deforma quelle enormi distese di gas. Anche il mondo delle galassie non è dunque immutabile, anzi mostra caratteristiche dinamiche molto attive. Nel 1929 Hubble compı̀ un’altra fondamentale scoperta. Dalle osservazioni spettroscopiche su un buon numero di galassie di cui aveva anche misurato la distanza attraverso il metodo delle Cefeidi, giunse a concludere che le galassie tendono ad avere spettri spostati verso il rosso. Se interpretato come effetto Doppler dinamico, 20 A Traccia storica questo dato comporta che esse si allontanano dalla nostra Galassia. Inoltre esiste una ben precisa correlazione lineare tra velocità di allontanamento e distanza, nel senso che le galassie più lontane si allontanano più velocemente: v = Hd . (A.7) Si tratta della nota legge di Hubble, dove H è detta costante di Hubble (Fig. A.19). Tra l’altro con questa legge si possono misurare le distanze di galassie lontanissime e non risolubili in stelle a partire dallo studio dello spostamento delle righe spettrali. Fig. A.19 Legge di Hubble: correlazione tra velocità di recessione e distanza A.10 Le “altre” Astronomie A partire dagli anni ’30 gli astronomi si resero conto che gli oggetti cosmici e in particolare proprio le galassie sono forti emettitori in bande elettromagnetiche diverse dal visibile. Nacque cosı̀ per prima la radioastronomia, che ha il vantaggio di poter essere fatta con radiotelescopi a Terra, poi negli anni ’60 l’Astronomia a raggi X, che richiede che i rivelatori vengano portati da sonde e satelliti artificiali al di sopra dell’atmosfera che assorbe completamente queste lunghezze d’onda. E quindi vennero le Astronomie dei raggi ultravioletti, infrarossi e gamma, che pure richiedono osservazioni al di sopra dell’atmosfera terrestre. Il contributo di queste Astronomie non è solo complementare a quanto si osserva nella banda ottica. In queste diverse lunghezze d’onda si rivelano oggetti ed eventi invisibili nell’ottico, o che nell’ottico sono poco brillanti: ad esempio, le radiogalassie, i quasar e le pulsar nella banda radio, le regioni di formazione stellare nell’infrarosso, i venti supersonici intorno a stelle calde e le nebulose planetarie nell’ultravioletto, le binarie compatte, i buchi neri e le galassie attive nei raggi X (Fig. A.20). Per quanto riguarda la catalogazione delle galassie distanti e quindi deboli, le osservazioni radio e X permettono di selezionare le galassie da osservare nell’ottico e che sarebbero “perse” nei cataloghi stellari dove le galassie, molto deboli, si con- A.11 L’Universo alle grandi scale 21 Fig. A.20 Il cielo alle diverse lunghezze d’onda: (a) radio, (b) infrarosso, (c) ottico, (d) raggi X, (e) raggi gamma fondono con le stelle. Più in generale, si può dire che le mappe radio del cielo ci mostrano la distribuzione di radiogalassie, quasar e galassie attive: osservando con i radiotelescopi si rivela il cielo delle galassie più distanti e più attive. E similmente succede per le mappe X, anche se nella banda X sono molto brillanti anche un gran numero di oggetti galattici. A.11 L’Universo alle grandi scale I telescopi di Mount Wilson e in seguito di Mount Palomar sono stati tra gli anni 1920 e 1960 gli strumenti con cui l’Astronomia moderna ha classificato le galassie e ha iniziato a farne la mappa della distribuzione spaziale. In particolare, applicando il metodo della legge di Hubble per le misure di distanza, quei telescopi furono utilizzati per misure spettroscopiche di galassie deboli che richiedevano pose fotografiche 22 A Traccia storica su tempi molto lunghi, anche più notti successive. Negli ultimi dieci anni sono entrati in operazione raffinati telescopi di nuova tecnologia, il Multi-Mirror Telescope (MMT), il New Technology Telescope (NTT), lo Hubble Telescopio Spaziale (HST, Fig. A.21), il Keck Telescope, il Very Large Telescope e sono stati sviluppati rivelatori ben più efficienti delle lastre fotografiche, come i rivelatori di fotoni e le camere CCD (Charge Coupled Devices). Fig. A.21 Lo Hubble Space Telescope ripreso dallo Space Shuttle La distribuzione tridimensionale delle galassie su grandi scale, tra i 30 e i 300 milioni di anni luce, è dovuta al paziente lavoro di gruppi di astronomi che si sono dedicati a misurare gli spettri di galassie in regioni selezionate del cielo (non possediamo ancora una mappa delle galassie su tutto il cielo, perché occorrerà prendere miliardi di spettri). Le prime mappe globali della distribuzione di galassie risalgono a George Abell, John Huchra, Margaret Geller, Marc Aaronson, Alan Dressler. Oggi esistono mappe estese e/o profonde: l’Hubble Space Telescope Guide Catalog, la 2MASS Redshift Survey, la 6dF Galaxy Redshift Survey, la Sloan Digital Sky Survey. Si è osservato che le galassie non sono distribuite uniformemente, ma si aggregano in gruppi, ammassi e superammassi, secondo una gerarchia ben definita, probabilmente risalente alle fasi primordiali in cui le galassie si sono formate. L’immagine dell’Universo su grande scala è quella di una spugna, con grandi vuoti circondati da ammassi di galassie addensati sulle superfici interstiziali tra vuoti (Fig. A.22). Lo spazio tra le galassie contiene gas intergalattico molto caldo, osservabile a raggi X. La nostra Galassia, pur essendo una cospicua spirale, non ha nulla di peculiare: ancora una volta una rivoluzione di tipo copernicano si è compiuta. Siamo in un angolo esterno della Galassia, che non ha di per sé alcuna caratteristica fuori dal comune, e siamo ben lontani dall’esser al centro dell’Universo. A.12 La Cosmologia fisica 23 Fig. A.22 Aggregazioni di galassie nella struttura a grande scala A.12 La Cosmologia fisica Negli stessi anni in cui Hubble osservava che tutte le galassie appaiono allontanarsi tra loro, Albert Einstein (Fig. A.23) propose la teoria della Relatività Generale con cui divenne possibile sviluppare veri e propri modelli cosmologici (fisici e non soltanto metafisici). Einstein tentò con una certa difficoltà di sviluppare modelli di Universo statici, in cui cioè, a parte effetti dinamici locali, l’insieme delle galassie su grandi scala rimanesse immutabile: anche Einstein, come più tardi riconobbe egli stesso, era caduto nel pregiudizio di considerare l’Universo chiuso e senza evoluzione. Fig. A.23 Storica foto di Einstein, Hubble e Humason al telescopio di Mount Palomar Invece Friedmann calcolò che le soluzioni più coerenti delle equazioni di Einstein cosmologiche producevano modelli in cui l’Universo delle galassie si espande o si contrae mantenendo immutati i rapporti di distanze relative tra le galassie: pro- 24 A Traccia storica prio come prevede la legge di Hubble, che è quindi contenuta nelle soluzioni di Friedmann. Oggi la legge di Hubble mostra che l’Universo è in espansione. Se quindi fossimo in grado di far tornare indietro il tempo, vedremmo un Universo sempre più denso e compatto: le galassie e le stelle si fonderebbero infine in un’unica “zuppa cosmica” molto calda, come ci dice la semplice considerazione fisica che un gas compresso si surriscalda. L’Universo è dunque iniziato da una violenta espansione dello spazio-tempo, un’inflazione, che venne ironicamente definita da Hoyle negli anni ’40 il big-bang, nome che poi è rimasto nell’uso comune. Esiste qualche segno di tale evento, oltre la recessione delle galassie? Alpher, Bethe e Gamow proposero nel 1942 che dovesse essere rimasta da quella fase calda una componente di radiazione di corpo nero in fase di raffreddamento; previdero che oggi essa dovesse essere scesa alla temperatura di 3 gradi assoluti, circa 270 gradi centigradi sotto la temperatura di congelamento dell’acqua. Nel 1965 Arno Penzias e Robert Wilson rivelarono tale radiazione di fondo di corpo nero attraverso misure nelle microonde, e fu possibile calcolare che essa rappresenta la radiazione energeticamente dominante nello spazio (Fig. A.24). Fig. A.24 Arno Penzias e Robert Wilson davanti all’antenna con cui scoprirono nel 1965 la radiazione cosmologica di fondo Tornando ai modelli di Friedmann, egli mostrò anche come due tipi di Universi in espansione sono possibili: quelle di Universo aperto, in cui il fattore di scala cresce indefinitamente, e quelle di Universo chiuso in cui il fattore di scala cresce fino ad un massimo per trasformarsi arrestarsi e tornare a decrescere verso zero. Il modo di distinguere in quale tipo di Universo ci troviamo a vivere richiede di misurare le sottili deviazioni che la legge di Hubble lineare subisce quando si osservi il comportamento di galassie lontanissime. Finora questo compito non è ancora stato svolto, nonostante l’utilizzo dei più raffinati telescopi di nuova tecnologia, incluso l’NTT, l’HST, il Keck, e rivelatori ben più efficienti delle lastre fotografiche come i rivelatori di fotoni e i CCD. Un altro modo di affrontare la questione è legato alla ragione fisica per cui l’Universo può essere aperto o chiuso. L’espansione cosmologica avviene a seguito del big-bang primordiale, in cui la materia è stata dotata di una quantità di energia cinetica, e che però è rallentata dall’autogravitazione di tutta la materia dell’Universo. A.13 Conclusione 25 A seconda del prevalere della spinta cinetica o dell’autogravitazione si avranno espansioni senza fine o espansioni che si arresteranno per trasformarsi in collassi. La spinta può essere valutata dalla legge di Hubble stessa; l’autogravitazione richiede la misura della massa dell’Universo. Problema questo non facile: sia perché è difficile essere sicuri di “contare” tutta la materia visibile, sia perché è oggi chiaro che la maggior parte della materia gravitante dev’essere sotto forma di una forma esotica di materia, detta appunto materia oscura, capace di interagire solo gravitazionalmente e in nessun altro modo con la materia visibile di cui siamo fatti noi e i nostri rivelatori. La presenza di materia oscura può essere valutata dalla dinamica delle galassie che è appunto determinata dalla forza gravitazionale: su scale di gruppi e ammassi di galassie è possibile calcolare quanta materia oscura è necessaria per determinare i moti osservati. Come già detto, i risultati sono che la materia oscura può essere in quantità oltre 10 volte superiore alla materia visibile. Nel 1998 due gruppi di osservatori della California, specializzatisi nella rivelazione di supernove in galassie lontane, hanno utilizzato le supernove di tipo SNe Ia per ricalibrare la legge di Hubble: abbiamo già detto infatti che la luminosità assoluta delle supernove al loro massimo ha un valore tipico e quindi permette una valutazione della distanza; le SNe Ia corrispondono ad un collasso di nana bianca con liberazione di energia gravitazionale ben definita. Quel che risulta dai loro dati è che le galassie lontane con supernove di tipo SNe Ia risultano più distanti di quanto previsto dalla legge di Hubble (anche eventualmente tenendo conto di effetti relativistici). Ciò può essere dovuto a due principali ragioni: (i) le supernove in galassie lontane, e quindi risalenti a tempi molto primitivi nella vita dell’Universo, sono diverse da quelle attuali, sebbene tutte le loro caratteristiche fotometriche e spettrali non sembrino differenti; (ii) l’Universo sta accelerando, cioè la legge di Hubble va modificata introducendo un progressivo aumento della velocità di espansione dell’Universo. Quale forma di energia può dare origine a un tale effetto? Tanto per continuare nella terminologia già adottata, si parla di energia oscura. Il risultato è ancora molto preliminare e forse potrà essere falsificato da future osservazioni: tuttavia è importante notare come le nostre attuali conoscenze comportino che l’Universo sia dominato dall’energia oscura (73%) e dalla materia oscura (23%), mentre la materia a noi nota appare solo una piccola componente di circa il 4% (Fig. A.25). A.13 Conclusione Il significato di questa rapida cavalcata attraverso la storia antica e recente dell’Astronomia è stato quello di generare il quadro d’insieme. Abbiamo scoperto che la nostra Terra è un pallido punto azzurro che orbita nelle vicinanze di una stella del tutto comune, che a sua volta compie una rotazione intorno al centro della Galassia da cui è molto lontana. La Galassia non è a sua volta particolarmente importante. E 26 A Traccia storica Fig. A.25 Percentuali delle componenti di materia/energia dell’Universo l’Universo sembra essere uguale in tutte le sue parti se si guarda alla struttura complessiva. Eppure in questo Universo ci siamo noi, una civiltà si è qui formata. E questo fatto può forse condizionarne in futuro l’evoluzione globale. Anche se insignificanti, siamo giunti a comprendere lo schema fisico in cui ci troviamo e forse lo potremo in futuro influenzare. Dobbiamo quindi procedere oltre nella nostra ricerca. Che cosa ha determinato il big-bang, quali processi fisici governano la materia, lo spazio e il tempo nei momenti iniziali della nascita dell’Universo? Possono esistere altri Universi, al di fuori e separati dal nostro? Queste (e altre ancora) sono le domande che dobbiamo affrontare. Bibliografia 1. J. P. Verdet – Storia dell’Astronomia, Longanesi, 1995 2. I. Newton – Principi Matematici della filosofia naturale, Classici della scienza, Torino Utet, 1965 3. N. Copernico – Opere: De Revolutionibus, Classici della scienza, Torino Utet, 1979 4. J. Kepler – Astronomia nova, seu, Physica coelestis, tradita commentariis De motibus stellae martis, ex observationibus G.V. Tychonis Brahe, 1609 5. G. Galilei – Opere Casa Editrice Riccardo Ricciardi, Collana La Letteratura Italiana, 1953 6. J. Gribbin – Enciclopedia di Astronomia e Cosmologia, Garzanti, 2005 Appendice B Principi di trigonometria sferica B.1 La Sfera Celeste Per determinare la posizione di un astro in cielo in un certo istante si ricorre alla proiezione di questo su un’ideale Sfera Celeste di raggio indefinito con origine nel centro della Terra o in qualche altro punto dello spazio (ad es. il baricentro del sistema solare). Inoltre si definisce sulla Sfera Celeste un sistema di coordinate analogo a quello che viene utilizzato per stabilire la posizione geografica di un luogo sulla Fig. B.1 La Sfera Celeste 27 28 B Principi di trigonometria sferica Terra. Con riferimento alla Fig. B.1 consideriamo una sfera di raggio indefinito con origine nel centro della Terra sulla quale vengono proiettati gli astri. Immaginiamo di intersecarla con due piani perpendicolari tra di loro passanti per il centro della sfera detti rispettivamente Piano Fondamentale e Piano Origine. In tal modo si individuano sulla sfera due cerchi massimi AA0 A00 A000 e PCAQ che si intersecano in due punti A e A00 di cui uno (il punto A), per convenzione, viene considerato come origine del sistema di coordinate a cui viene riferita la posizione delle stelle. La prima coordinata ψ viene contata positivamente sul cerchio del Piano Fondamentale, generalmente in gradi, a partire dal punto A fino al punto S0 che rappresenta la proiezione della stella S presa sul cerchio massimo passante per il polo P e perpendicolare al Piano Fondamentale, mentre la seconda coordinata θ viene contata positivamente dal punto S0 del Piano Fondamentale sul cerchio massimo passante per P fino ad incontrare il cerchio minore parallelo al Piano Fondamentale nel punto S. Si ricorda che qualsiasi piano intersecante la Sfera Celeste e non passante per il suo centro determina sulla sfera un cerchio minore. A volte risulta conveniente calcolare la distanza angolare tra due punti aventi stessa altezza dal Piano Fondamentale su di un cerchio minore anziché su di un cerchio massimo. Ad esempio per calcolare la distanza angolare CS di Fig. B.1 si noti che questa è legata a ψ, θ (in radianti) e R = CO = AO dalle seguenti relazioni: CS = ψ ×CO0 = ψ × R cos θ . (B.1) D’altra parte ψ = AS0 /R per cui: CS = AS0 cos θ . (B.2) La distanza angolare CS è cosı̀ calcolata su di un cerchio minore, mentre andrebbe calcolata su di un cerchio massimo. Tuttavia, quando il moto proprio di una stella corrisponde ad uno spostamento angolare inferiore al grado è ragionevole confondere l’arco di cerchio minore con quello massimo in quanto la differenza tra i due ammonta al massimo solo a qualche millesimo di secondo d’arco. B.2 Trigonometria sferica Poiché sulla Sfera Celeste si misurano solo distanze angolari di oggetti rispetto ad un sistema di coordinate, lo studio dei triangoli sferici e della trigonometria sferica diventa uno strumento indispensabile per effettuare le trasformazioni da un sistema di coordinate ad un altro, oppure per calcolare le distanze angolari di punti sulla Sfera Celeste partendo dalla conoscenza delle coordinate e/o distanze di altri punti. Sono qui ricavate alcune formule principali della trigonometria sferica. I triangoli sferici sono i triangoli generati sulla sfera dall’intersezione di 3 piani passanti per il centro della sfera stessa, come schematicamente rappresentato in Fig. B.2. I piani DOE, AOE e DOA determinano sulla superficie della sfera rispettivamente i lati sferici BC = a, AC = b e AB = c, mentre i rispettivi angoli opposti a B.2 Trigonometria sferica 29 Fig. B.2 Prima formula fondamentale della trigonometria sferica (formula dei coseni) tali lati sono α, β , γ. Consideriamo il piano tangente alla sfera in A (Fig. B.2) e il triangolo ADE generato su tale piano dal prolungamento dei raggi OA, OB e OC. L’analisi dei triangoli rettangoli piani DOA e AOE indica che, assumendo il raggio della sfera come unitario (OA = OB = OC = 1), valgono le seguenti relazioni: AD = OA tan(c) = tan(c) (B.3) AE = OA tan(b) = tan(b) (B.4) OD = OA sec(c) = sec(c) (B.5) OE = OA sec(b) = sec(b) , (B.6) mentre l’analisi del triangolo piano DAE, tramite il teorema di Carnot, fornisce: d . DE 2 = AD2 + AE 2 − 2 AD AE cos DAE (B.7) d = α si ha: Sostituendo i valori dati dalle (B.3) e (B.4) e con DAE DE 2 = tan2 (c) + tan2 (b) − 2 tan(c) tan(b) cos(α) . (B.8) Analogamente, con riferimento al triangolo piano DOE, si ottiene: DE 2 = sec2 (c) + sec2 (b) − 2 sec(c) sec(b) cos(a) . (B.9) Eguagliando le due espressioni e ricordando la relazione trigonometrica sec2 (x) = 1 + tan2 (x) si ottiene infine: 30 B Principi di trigonometria sferica cos(a) = cos(b) cos(c) + sin(b) sin(c) cos(α) (B.10) che è la Prima Formula Fondamentale della Trigonometria Sferica, detta anche Formula dei Coseni. Con questa formula possibile calcolare un lato di un triangolo sferico conoscendone gli altri due e langolo compreso tra questi. Ruotando le lettere della relazione (B.10) è possibile generare le formule analoghe per i restanti due lati del triangolo sferico: cos(b) = cos(c) cos(a) + sin(c) sin(a) cos(β ) (B.11) cos(c) = cos(a) cos(b) + sin(a) sin(b) cos(γ) . (B.12) Dal set di formule (B.10), (B.11) e (B.12) è possibile ricavare gli angoli α, β , γ se sono noti i tre lati a, b, c: cos(a) − cos(b) cos(c) sin(b) sin(c) cos(b) − cos(c) cos(a) cos β = sin(c) sin(a) cos(c) − cos(a) cos(b) cos γ = . sin(a) sin(b) cos α = (B.13) (B.14) (B.15) Un altro set di formule può essere ricavato partendo dalla formula (B.10) riscritta nella forma: sin(b) sin(c) cos(α) = cos(a) − cos(b) cos(c) . (B.16) Usando eguaglianze delle funzioni trigonometriche ed eseguendo una serie di semplici trasformazioni, si ottiene la Seconda Formula Fondamentale della Trigonometria Sferica, detta anche Formula dei Seni: sin(α) sin(β ) sin(γ) = = . sin(a) sin(b) sin(c) (B.17) Questa formula si applica al caso in cui siano dati due lati di un triangolo sferico ed un angolo non compreso tra i lati: ad esempio dati a, b, α si ricava β e cosı̀ via. Infine combinando la prima Formula dei Coseni (B.10) con la seconda (B.11) si giunge alla forma: sin(a) cos(β ) = cos(b) sin(c) − sin(b) cos(c) cos(α) (B.18) che rappresenta la Terza Formula Fondamentale della Trigonometria Sferica. Ruotando le lettere di questa espressione si ha tutto un set di formule che permettono il calcolo di un angolo dati due lati e un angolo oppure il calcolo di un lato dati gli altri due lati e due angoli secondo le seguenti relazioni: sin(a) cos(γ) = cos(c) sin(b) − sin(c) cos(b) cos(α) (B.19) sin(b) cos(α) = cos(a) sin(c) − sin(a) cos(c) cos(β ) (B.20) B.2 Trigonometria sferica 31 sin(b) cos(γ) = cos(c) sin(a) − sin(c) cos(a) cos(β ) (B.21) sin(c) cos(α) = cos(a) sin(b) − sin(a) cos(b) cos(γ) (B.22) sin(c) cos(β ) = cos(b) sin(a) − sin(b) cos(a) cos(γ) . (B.23) Esiste inoltre un ultimo set di formule di trigonometria sferica che permettono di calcolare i lati del triangolo sferico quando siano noti i tre angoli α, β , γ: cos α + cos β cos γ sin β sin γ cos β + cos α cos γ cos(b) = sin α sin γ cos γ + cos α cos β . cos(c) = sin α sin β cos(a) = (B.24) (B.25) (B.26) Queste formule generalmente sono poco usate, in quanto, di un triangolo sferico, difficilmente si conoscono solo i tre angoli. In determinati problemi di trigonometria sferica si possono dover risolvere triangoli sferici rettangoli in cui cioè un angolo è di 90◦ (vedi Fig. B.3). In questo caso le formule viste sinora si semplificano nel seguente modo se supponiamo che l’angolo in A sia retto (α = 90◦ ). In tal caso la (B.10) diventa: cos(a) = cos(b) cos(c) Fig. B.3 Triangolo sferico rettangolo (B.27) 32 B Principi di trigonometria sferica e, per mezzo della (B.17), si ottiene: sin(a) = sin(b) sin(c) = . sin(β ) sin(γ) (B.28) Questa relazione permette di ricavare l’ipotenusa sferica dati gli altri due lati. Sempre con combinazioni delle precedenti formule si ottengono altre espressioni per la risoluzione dei triangoli rettangoli sferici: tan(b) = tan(a) cos(γ) (B.29) tan(c) = tan(a) cos(β ) (B.30) che permettono di trovare un lato data lipotenusa e un angolo adiacente al lato incognito. Per una completa trattazione della trigonometri sferica si possono consultare i testi di Barbieri [1] e Zagar [2]. Bibliografia 1. C. Barbieri – Lezioni di Astronomia, Zanichelli, 1999 2. F. Zagar – Astronomia Sferica e Teorica, Zanichelli, 1984 Appendice C Galileo e il cannocchiale Il 30 novembre del 1609, come egli stesso racconta nel Sidereus Nuncius, un libretto pubblicato nel marzo del 1610 (Fig. C.1), Galileo puntò il cannocchiale che aveva costruito per osservazioni essenzialmente terrestri verso il cielo e scoprı̀ un nuovo cielo [1]. Da allora gli astronomi hanno preso a costruire telescopi sempre più potenti per raggiungere oggetti sempre più deboli e lontani; un nuovo modo di viaggiare nello spazio attraverso le onde elettromagnetiche che i corpi celesti mandano verso di noi dalle profondità del cosmo; e anche un modo di viaggiare nel tempo giacché le “cartoline spaziali”, pur viaggiando alla velocità della luce, impiegano tempi lunghissimi per giungere a noi e quindi ci portano immagini di tempi tanto più antichi quanto più lontana la loro origine. Fig. C.1 Frontespizio del Sidereus Nuncius (Biblioteca Nazionale Universitaria di Torino 33 34 C Galileo e il cannocchiale Ma quale fu il vero ruolo di Galileo nell’invenzione del cannocchiale? I sistemi ottici sono antichi; probabilmente i Babilonesi 4000 anni fa ebbero a disposizione cristalli di quarzo naturali trovati nel deserto; e con questi certamente capirono di poter ingrandire oggetti lontani. Perché non furono mai usati in astronomia visto che da sempre l’uomo scrutava il cielo e cercava di carpirne i segreti? Racconta Plinio il Vecchio che il vetro, con cui si forgiano le lenti e gli specchi dei telescopi, fu scoperto dai Fenici che casualmente sciolsero salnitro in sabbie silicee. Basta poi ritornare alle testimonianze di Giuseppe Flavio sullo strumento costruito nel III secolo a. C. sull’isola di Pharos all’ingresso del porto di Alessandria di Egitto: uno specchio metallico posto su una torre alta oltre 100 metri era in grado di mostrare immagini di navi in avvicinamento molto tempo prima del loro arrivo, e allo stesso tempo era utilizzato per indicare la strada a tali navi collimando e intensificando la luce di un fuoco, il primo esempio di faro appunto. Euclide, Archimede, Tolomeo scrissero testi di ottica geometrica. Lo scienziato arabo Alhazen nel X secolo d.C. compı̀ varie esperienze sulla riflessione e rifrazione della luce e correttamente propose la spiegazione della variazione delle dimensioni apparenti del Sole e della Luna al variare dell’altezza sull’orizzonte come effetto della rifrazione atmosferica. Sperimentò gli effetti di ingrandimento di specchi sferici e parabolici, pur senza giungere a proporli come strumenti di aiuto alla visione. Un suo discepolo, Witelo, nato in Polonia ma vissuto in Italia, mostrò come il brillare delle stelle sia dovuto alle correnti atmosferiche. Ruggero Bacone nel XIII secolo riportò nell’Opus Maius importanti esperimenti sulla rifrazione con lenti convesse, facendo anche riferimento a osservazioni di oggetti celesti: Se le lettere di un libro o qualche oggetto minuto sono visti attraverso un segmento di una sfera di vetro o cristallo che su di essi sia appoggiato, essi saranno visti meglio e ingranditi [...] possiamo leggere piccolissime lettere da incredibili distanze e contare piccolissime particelle di sabbia o polvere grazie al maggior angolo sotto cui le possiamo osservare; [...] il Sole e la Luna e le stelle possono essere fatti apparire discendere verso di noi. Gli occhiali da vista erano di uso comune alla fine del XIII secolo. La loro invenzione è legata al nome di due italiani, il monaco pisano Alessandro della Spina e il suo amico Salvino degli Armati di Firenze (sulla tomba di questultimo si legge: Qui giace Salvino degli Armati di Firenze. Inventore degli occhiali. Dio perdoni i suoi peccati. A.D. 1317). Dunque la possibilità di costruire strumenti ottici per ingrandire oggetti era nota fin da tempi remoti ed essi furono anche puntati verso la Luna e il Sole, come raccontava Bacone. Ma perché allora l’astronomia tardò tanto ad usare sistematicamente quegli strumenti per studiare il cielo? L’ovvia spiegazione è che occorreva trovare il tempo e la persona giusti. Circa il tempo va detto anzitutto che il cielo fino al tardo medioevo fu guardato con molto rispetto e timore, come la sede del soprannaturale; il mondo era diviso in mondo sublunare, quello umano corruttibile, e in empireo, lo spazio perfetto, incorruttibile, eterno ed infinito. Bacone per avere osato trastullarsi con Luna e Sole venne accusato di stregoneria. Solo nell’Inghilterra del XVI secolo poterono riprendere quegli esperimenti e Leonard Digges e il figlio Thomas a Oxford giunsero a costruire uno strumento che potrebbe essere considerato il primo telescopio riflettore: Per mezzo di specchi concavi e con- C Galileo e il cannocchiale 35 vessi di forma sferica e parabolica, o per mezzo di coppie di essi disposti opportunamente, e usando vetri trasparenti che dividono o combinano le immagini riflesse dagli specchi, si possono rappresentare intere regioni: e le loro parti possono essere ingrandite cosicché un piccolo oggetto può essere risolto come se fosse vicino all’osservatore, pur essendo ben lontano ... (Pantometria 1571). L’interesse per il cannocchiale fu poi sponsorizzato dalle attività belliche; è tradizione che il cannocchiale sia nato in Olanda, proprio nel momento in cui l’Olanda guerreggiava contro la Spagna. Nel 1608 l’ottico Hans Lippershey presentò una richiesta di patente agli Stati Generali olandesi e al principe Maurice di Nassau per un sistema ottico in grado di ingrandire oggetti lontani, ottenendo una risposta piuttosto incerta: Sulla richiesta di Hans Lippershey, nato a Wesel e abitante a Middleburg, ottico, inventore di uno strumento per vedere a distanza, come verificato da questi Stati, che detto strumento venga mantenuto riservato e che a lui venga garantito il privilegio di esclusiva per trentanni affinché a nessuno venga permesso di imitarlo, o che invece gli venga garantita una pensione annua che gli permetta di costruire tali strumenti per l’uso di questo paese soltanto, senza venderlo a re o principi stranieri. È stato deciso che l’Assemblea nomini un comitato che prenda contatto con il richiedente circa la detta invenzione, investigando se non gli sia possibile migliorare lo strumento rendendo possibile il suo uso con i due occhi insieme, ed inoltre quale sia la cifra di rimunerazione che sarebbe di suo gradimento. A seguito di un rapporto su tali questioni, sarà deliberato se sia opportuno garantire al richiedente una remunerazione o un privilegio. Nello stesso anno altri due ottici olandesi presentarono analoghe richieste, James Metius di Alkmaaar e Zacharias Jansen di Middleburg. A causa della disputa di priorità e al fatto che ormai l’invenzione era divenuta di pubblico dominio, nessuna patente o esclusiva venne concessa, e liberamente la notizia si diffuse in tutta Europa. Nel maggio 1609 arrivò a Milano e poi a Padova e qui incontrò Galileo, la persona giusta per usarla scientificamente. Ancora dal Sidereus Nuncius: Circa dieci mesi fa ci giunse notizia che era stato costruito da un certo Fiammingo un occhiale, per mezzo del quale gli oggetti visibili, pur distanti assai dall’occhio di chi guarda, si vedevan distintamente come fossero vicini; e correvan voci su alcune esperienze di questo mirabile effetto, alle quali chi prestava fede, chi no. Questa stessa cosa mi venne confermata pochi giorni dopo per lettera dal nobile francese Iacopo Badovere, da Parigi; e questo fu causa che io mi volgessi tutto a cercar le ragioni e ad escogitare i mezzi per giungere all’invenzione di un simile strumento, che poco dopo conseguii, basandomi sulla dottrina delle rifrazioni. Preparai dapprima un tubo di piombo alle cui estremità applicai due lenti, entrambe piane da una parte, e dall’altra una convessa e una concava; posto l’occhio alla parte concava vidi gli oggetti abbastanza grandi e vicini, tre volte più vicini e nove volte più grandi di quanto non si vedano a occhio nudo. In seguito preparai uno strumento più esatto, che mostrava gli oggetti più di sessanta volte maggiori. E finalmente, non risparmiando fatiche e spese, venni a tanto da costruirmi uno strumento cosı̀ eccellente, che gli oggetti visti per il suo mezzo appaiono ingranditi quasi mille volte e trenta volte più vicini che visti a occhio nudo. Quanti e quali siano i vantaggi di un simile strumento, tanto per le osservazioni di terra che di mare, sarebbe del 36 C Galileo e il cannocchiale tutto superfluo dire. Ma lasciate le terrestri, mi volsi alle speculazioni del cielo; e primamente vidi la Luna cosı̀ vicina come distasse appena due raggi terrestri. Fig. C.2 Telescopio di Galileo (Firenze, Istituto e Museo di Storia della Scienza) In quegli anni simili sistemi ottici vennero costruiti e utilizzati, anche per l’astronomia, in Inghilterra da Thomas Harriot, Sir Walter Raleigh, Sir William Lower e in Olanda da Simon Marius, Johannes Fabricius, Cristoph Scheiner; molto entusiasmo dimostrò Keplero, che tuttavia non era uno sperimentale e non costruı̀ mai un telescopio egli stesso. Perché dunque il ruolo di Galileo viene considerato fondamentale? Anzitutto perché Galileo, pur con uno strumento primitivo (C.2), eseguı̀ osservazioni con metodo scientifico ed estrema accuratezza. Va notato che il cannocchiale galileiano aveva comunque un limitato potere di ingrandimento e soprattutto un campo di vista molto piccolo. In cielo permetteva di vedere una regione pari a metà delle dimensioni apparenti della Luna. Già solo puntare lo strumento su un oggetto come un pianeta o una stella e seguirne il moto del cielo era un’impresa non indifferente. Ma soprattutto bisognava avere un’idea di che cosa cercare e come interpretare i risultati. Ad esempio linglese Thomas Harriot disegnò una primitiva mappa della Luna alcuni mesi prima di Galileo, ma non si chiese che cosa significassero le regioni di varia colorazione. Galileo invece comprese di osservare montagne e valli sulla Luna e misurò le altezze delle montagne con lo studio delle ombre. Quindi puntò il disco di Giove e nel gennaio 1610, con un cannocchiale a 30 ingrandimenti, di cui egli stesso aveva lavorato le lenti, scoprı̀ i quattro satelliti Medicei e infine vide miriadi di stelle nella Via Lattea. Sempre dal Sidereus Nuncius: Ma oltre le stelle di sesta grandezza si vedrà col cannocchiale un cosı̀ gran numero di altre, invisibili alla Bibliografia 37 vista naturale, che appena è credibile: se ne possono vedere infatti più di quante ne comprendano le altre sei differenti grandezze; le maggiori di esse, che possiamo chiamare di settima grandezza o prima delle invisibili, con l’aiuto del cannocchiale appaiono più grandi e più luminose che le stelle di seconda grandezza viste a occhio nudo. Nell’autunno del 1610 Galileo osservò le fasi di Venere e nel 1611 le macchie solari; priorità nelle osservazioni delle macchie fu disputata dal gesuita Cristoph Scheiner, anche se in effetti la prima pubblicazione è di Johannes Fabricius. Ma la priorità non conta: nelle lettere scritte a Marc Welser circa le macchie solari Galileo interpretò scientificamente i loro moti e la loro natura. Nelle stesse lettere espresse anche il suo vero obiettivo: dare definitivo supporto osservativo alla teoria eliocentrica copernicana del sistema solare. E di qui nacquero le sue dispute con le filosofie e teologie contemporanee, dispute culminate con la sua condanna da parte della Chiesa cattolica. Galileo fu dunque la persona giusta ad usare il cannocchiale perché la sua preparazione e il metodo scientifico da lui stesso teorizzato — il metodo che la scienza usa tuttora — gli consentirono di usare il cannocchiale per studiare gli oggetti celesti e non solo per guardarli. Il suo percorso scientifico è ben illustrato nel Sidereus Nuncius e nelle successive grandi opere, prima fra tutte il Dialogo sopra i due massimi sistemi del mondo (1632). La sua definitiva conclusione era appunto che le osservazioni sul moto dei pianeti confermavano la teoria eliocentrica copernicana e che l’Universo delle stelle è molto più vasto del sistema solare. Sarà Isaac Newton a dare un fondamento dinamico teorico a queste conclusioni. Ma tutta la nuova astronomia iniziò da quel piccolo cannocchiale usato nel modo giusto e da quanto fu scritto in quel piccolo libretto, il Sidereus Nuncius. Bibliografia 1. Galileo Galilei – Sidereus Nuncius, nelle Opere Casa Editrice Riccardo Ricciardi, Collana La Letteratura Italiana, 1953 Appendice D Cenni di ottica geometrica La costruzione delle immagini attraverso un sistema ottico viene eseguita attraverso le tecniche dell’ottica geometrica che tengono conto delle leggi della rifrazione e riflessione. Come esempio studiamo il caso della formazione dell’immagine attraverso una lente convergente nell’ipotesi di lente sottile. Considerata una lente sottile biconvessa simmetrica (Fig. D.1), definiamo il piano della lente come il piano parallelo ai bordi rotondi della lente, e che la divide in due parti di simile forma, eventualmente con curvature diverse, circa simmetriche rispetto al piano stesso. Definiamo altresı̀ l’asse ottico come la retta perpendicolare al piano della lente che passa per il centro della lente stessa. Indichiamo il semispazio a sinistra della lente come spazio-oggetti e quello alla destra della lente come spazio-immagini. Si indichi con f la lunghezza focale della lente (o più brevemente la focale), che corrisponde alla distanza a cui la lente farà convergere in un unico punto, il fuoco, un fascio di raggi paralleli tra loro e paralleli all’asse ottico. Il valore della distanza focale può essere calcolato con l’equazione dell’ottico: 1 nλ 1 1 (nλ − 1) d = −1 + + (D.1) fλ n0λ R1 R2 nλ R1 R2 dove: • nλ è l’indice di rifrazione del materiale con cui è costituita la lente; • n0λ è l’indice di rifrazione dell’ambiente in cui la lente è immersa; • R1 e R2 sono i raggi di curvatura delle due superfici della lente, rispettivamente di quella dalla parte dello spazio-oggetti e di quella dello spazio-immagini; • d è la distanza tra i vertici delle due superfici o spessore della lente. Si noti che gli indici di rifrazione dipendono dalla lunghezza d’onda, il che causa effetti di aberrazione cromatica (vedi testo). Se d è piccolo rispetto a R1 e R2 , si ha la condizione di lente sottile: 1 1 1 n = 0 −1 + . (D.2) f n R1 R2 39 40 D Cenni di ottica geometrica Fig. D.1 Lente biconvessa; sono indicati l’asse ottico, il punto focale nello spazio delle immagini a destra della lente e i raggi di curvatura R1 e R2 delle due superfici convesse; f è la distanza focale, d lo spessore della lente Oltre al fuoco nello spazio-immagini esiste un fuoco anche nello spazio-oggetti simmetrico rispetto al piano della lente. Nell’ipotesi di lente sottile valgono le seguenti tre regole per tracciare i raggi tra oggetto e immagine: 1. i raggi che passano per il centro della lente proseguono senza cambiare direzione; 2. i raggi che entrano nella lente paralleli all’asse ottico, vengono convogliati da questa nel punto focale dello spazio-immagini; 3. i raggi che passano per il punto focale dello spazio-oggetti vengono trasformati dalla lente in raggi paralleli all’asse ottico. Prendiamo come oggetto una freccia posta a distanza S1 dal centro di una lente convergente di lunghezza focale f con S1 > f ; sia la freccia perpendicolare all’asse ottico con la coda sull’asse. Per disegnare l’immagine in questa semplice configurazione basta tracciare due raggi provenienti dalla punta della freccia (Fig. D.2): • un raggio che segue un cammino parallelo all’asse ottico e che viene rifratto dalla lente nel fuoco dalla parte opposta dell’oggetto; • un raggio che passa direttamente attraverso al centro della lente e che non viene deflesso. Nel caso in figura è indicato anche il raggio uscente dalla punta della freccia e che attraversando il fuoco nello spazio-oggetti esce dalla lente parallelo all’asse ottico. L’intersezione dei raggi rappresenta la punta della freccia-immagine (capovolta). Qualunque altro raggio uscente dalla punta della freccia-oggetto e che passi attraverso la lente viene concentrato in tale punto. La coda della freccia sta sull’asse ottico a distanza S2 dal centro della lente, e l’immagine è perpendicolare all’asse ottico. Con semplici proporzionalità tra gli angoli simili nello schema di figura, si ricava la relazione: D Cenni di ottica geometrica 41 Fig. D.2 Formazione dell’immagine in una lente convergente biconvessa simmetrica con il tracciamento di raggi 1 1 1 + = . S1 S2 f (D.3) Nel caso di sorgenti astronomiche S1 → ∞, per cui l’immagine si forma su piano focale. In tal caso per definire la punta della freccia-oggetto è sufficiente tracciare il raggio non deflesso passante per il centro della lente e indicarne l’intersezione con il piano focale. Sistemi ottici complessi, che sfruttino riflessioni su specchi e lenti correttive come discusse nel testo, richiedono calcoli estesi, anche per tener conto delle irregolarità. Esistono opportuni programmi numerici di tracciamento dei raggi (ray tracing) che permettono di ricavare le immagini attraverso un qualunque sistema ottico; essi sono utilizzati in astronomia per definire nel modo migliore le caratteristiche dei sistemi ottici dei telescopi a seconda delle esigenze osservative. Appendice E Diffrazione di un’apertura circolare Il calcolo della risoluzione angolare di un telescopio con apertura circolare fu per la prima volta risolto dall’astronomo inglese George Airy nel 1835. Si consideri un’apertura circolare di raggio R nel piano xy. Luce coerente attraversa l’apertura provenendo dalla direzione negativa dell’asse z (Fig. E.1). consideriamo i raggi che lasciano l’apertura parallelamente al piano xz ad un angolo θ rispetto all’asse x e studiamone l’interferenza su di uno schermo a grande distanza. Fig. E.1 Schema per il calcolo della diffrazione di un’apertura circolare La differenza di fase tra l’onda che esce dal centro dell’apertura e un punto generico (x, y) dipende dalla differenza di cammino s = x sin θ , e risulta δ= s 2π sin θ 2π = x = kx λ λ (E.1) 43 44 E Diffrazione di un’apertura circolare che dipende solo dalla coordinata x. La somma delle ampiezze delle onde provenienti da un elemento dell’apertura è proporzionale all’area dxdy. Dando all’ampiezza un significato vettoriale, si chiami da0 = dxdyî l’ampiezza dell’onda proveniente dal centro dell’apertura; conseguentemente l’ampiezza dell’onda proveniente dall’elemento generico in (x, y) sarà, tenendo conto della differenza di fase: da = dxdy(cos δ î + sin δ ĵ) (E.2) per cui, sommando su tutti gli elementi dell’apertura si avrà: √ Z Z Z x=R a= da = apertura Z x=R =2 √ y=− x=−R dx R2 −x2 y= dx R2 −x2 dy (cos kxî + sin kxĵ) = p R2 − x2 (cos kxî + sin kxĵ) (E.3) x=−R e poiché la funzione seno è dispari, l’integrale è non nullo solo lungo l’asse x: Z R a= p R2 − x2 cos kx (E.4) p 1 − t 2 cos pt . (E.5) dx 0 e con cambiamento di variabili Z 1 a∝ dt 0 Il valore dell’intensità della somma delle onde si annulla dove a = 0. Il primo zero si ha per p = 3.8317, cioè per sin θ = 3.8317 λ λ = 1.22 . 2πR D (E.6) Appendice F Orbite planetarie F.1 Lo studio delle orbite con gli integrali primi del moto Nel capitolo 5 sono discusse le caratteristiche dei moti dei pianeti intorno al Sole sotto l’azione della forza gravitazionale. In particolare si è dimostrato che il moto di di una massa m (pianeta) relativa a M (Sole) è equivalente a quello della massa m che si muove in un campo gravitazionale generato da una massa fissa (M + m): mr̈ = Gm(M + m) GmMtot r= r. r3 r3 (F.1) Le orbite dei pianeti sono ellissi; ma più in generale (ad esempio per le comete) sono possibili altri tipi di orbite coniche, cioè parabole e iperboli, tutte rappresentabili analiticamente nella forma in coordinate polari: r= p 1 + e cos θ (F.2) dove e è l’eccentricità: e=0 e<1 e=1 e>1 cerchio ellisse parabola iperbole . Il parametro p è legato all’eccentricità e e al semiasse maggiore della conica dalla relazione: p = a(1 − e2 ). (F.3) Corrispondentemente, come mostrato dalla geometria analitica, il semiasse a è positivo per l’ellisse, negativo per l’iperbole e tende ad infinito per la parabola. Il periastro, punto di maggior avvicinamento tra le sue masse, e l’apastro, punto di maggior allontanamento sono dati da: rp = p = a(1 − e) 1+e ra = p = a(1 + e) . 1−e (F.4) 45 46 F Orbite planetarie Nel caso della parabola il periastro è q = p/2 e l’apastro all’infinito; nel caso dell’iperbole il periastro è a(1 − e) > 0 mentre l’apastro è negativo. Le caratteristiche delle orbite nel problema a due corpi interagenti gravitazionalmente possono essere studiate a partire dagli integrali primi che si applicano in generale nel caso di forze centrali. Ricaviamo la legge di conservazione del momento della quantità di moto (o momento angolare) per la forza gravitazionale: r × mr̈ = r × mv̇ = dL GMtot d (r × mv) = = r×(− 3 )mr ≡ 0 dt dt r (F.5) per cui L = r × mv è un vettore costante: L = r × m(ṙ r̂ + rθ̇ θ̂ ) = mr2 θ̇ k̂ (F.6) k̂ = costante → orbita piana (F.7) 2 r θ̇ = C (F.8) che sono consistenti con la I e II legge di Keplero. Ricaviamo la legge di conservazione dell’energia: GMtot m d 1 2 ( mv ) = − v·r = dt 2 r3 GMtot m GMtot m d 1 =− (ṙr̂ + r θ̇ θ̂ ) · r = − ṙ = GM m tot r3 r2 dt r mv · r̈ = mv · v̇ = (F.9) e quindi d 1 2 GMtot m ( mv − )=0 dt 2 r 1 2 GMtot E v − = 2 r m dove E è l’energia totale del moto di m relativo a M. Questa espressione può essere riscritta: v2 = 2GMtot 2E + ; r m (F.10) (F.11) (F.12) notando che all’apastro e al periastro di (F.4) per definizione la velocità radiale si annulla e riscrivendo la velocità trasversa utilizzando la costante del momemto angolare, si ricava: 2E GMtot = (F.13) − a m per cui: 2 1 2 v = GMtot − (F.14) r a che esprime il modulo della velocità lungo le orbite. Confrontando le (F.11) e (F.14) si ottiene infine: F.1 Lo studio delle orbite con gli integrali primi del moto GMtot m 2a e il suo valore determina il tipo di orbite dei pianeti, comete, ecc.: E =− 47 (F.15) E < 0 a > 0 ellisse → stato legato E = 0 a → ∞ parabola → stato indifferente E > 0 a < 0 iperbole → stato non legato . Si può ricavare esplicitamente l’equazione della traiettoria nei tre casi utilizzando ancora gli integrali primi del moto: 2GMtot 2E + r m ṙ2 + r2 θ̇ 2 = v2 = C2 d 1 ṙ = −r , θ̇ 2 = 4 dt r r ( ) d 1 2 1 2GMtot 2E ṙ2 + r2 θ̇ 2 = C2 + 2 = + dθ r r r m 2 (F.16) (F.17) (F.18) e quindi: d dθ 2 2 1 2E 1 GMtot 2 G2 Mtot = + − − = A2 − S2 . r C2 m C4 r C2 (F.19) Poiché si può scrivere: d dθ 1 d 1 GMtot dS = − = r dθ r C2 dθ (F.20) si ricava: dS dθ dS 2 = A2 − S2 ±√ = dθ A2 − S2 ove, selezionando il segno positivo perchè A = e/p > 0, si ottiene: S arccos = θ − θ0 A (F.21) (F.22) (F.23) e invertendo la funzione arccos (S/A) si ha: S = A cos (θ − θ0 ) (F.24) C2 /GMtot r= 1 + (AC2 /GMtot ) cos (θ − θ0 ) (F.25) 48 F Orbite planetarie che è l’equazione di una conica. La soluzione dipende da tre costanti d’integrazione C, E (A), θ0 ; confrontando questa relazione con la (F.2), si ottiene: 2EC2 AC2 (F.26) = 1+ 2 2 e= GMtot G Mtot m che mette in relazione l’eccentricità della conica e l’energia totale del sistema: E < 0 e < 1 ellisse E = 0 e = 1 parabola E > 0 e > 1 iperbole . F.2 Energia totale su orbite ellittiche Si supponga di lasciar “cadere” una massa m da ferma su una massa M a partire da una circonferenza R = 2a: v20 = 2GMtot 2E + =0 2a m (F.27) GMtot m . 2a (F.28) E =− Pertanto: 2 1 v2 = GMtot ( − ) (F.29) r a e quindi si comprende come la velocità sia quella che la massa avrebbe su un ellisse di asse maggiore 2a. Quindi si avranno orbite co-periodiche: a3 1 )2 GMtot −1 2 v2 a= − r GMtot 2GMtot − 3 ) 2. P = 2π(v2 − r P = 2π( (F.30) (F.31) (F.32) Se si lancia una massa in un punto r con velocità v, la direzione della velocità determinerà la forma dell’ellisse, ma il periodo P è fissato e cosı̀ pure il semiasse maggiore a. F.3 Leggi temporali del moto Per completare la conoscenza del moto occorre ancora derivare la legge oraria. Si parte dalla relazione: F.3 Leggi temporali del moto 49 2GMtot 2E + r m con r2 θ̇ = C . ṙ2 + r2 θ̇ 2 = (F.33) (F.34) Si ottiene: s 2GMtot C2 2E dr =± + + 2 (F.35) dt m r r dove 2GMtot /r +C2 /r2 rappresenta il potenziale effettivo (gravitazionale + centrifugo). Pertanto ±dt = p rdr (2E/m) r2 + 2GMtot r − c2 rdr =p −r/a + 2r − a(1 − e2 ) (F.36) L’integrazione dipende dal valore di a−1 , cioè dal tipo di conica: r= p 1 + e cos θ Per l’ellisse: (F.37) p >0; 1 − e2 e<1 a= a= p →∞ 1 − e2 e>1 a= (F.38) per la parabola: e=1 per l’iperbole: r= p ; 2 cos2 θ p <0. 1 − e2 (F.39) (F.40) Si calcola: 1. caso ellittico a−1 > 0 r ±dt = a3/2 ±(t − T ) = √ GMtot a rdr √ GMtot −r2 + 2ar − a2 + a2 e2 s a−r a − r 2 arccos −e 1− ae ae (F.41) (F.42) 2. caso parabolico a−1 = 0 e q = p/2 1 rdr p ±dt = √ GMtot 2 (r − q) √ 2 (r + 2q) √ ± (t − T ) = √ r−q 3 GMtot (F.43) (F.44) 50 F Orbite planetarie 3. caso iperbolico a−1 < 0 r ±dt = −a rdr p 2 GMtot r − 2ar + a2 (1 − e2 ) s a − r 2 ± (t − T ) = √ e −1 ae GMtot s 2 a−r a−r + ± lg − 1 ae ae (F.45) (−a)3/2 (F.46) ove T é il tempo a cui la massa m passa al periastro. Per approfondire lo studio dei moti orbitali con riferimento anche ai voli spaziali si consulti il testo di Roy [1]. Bibliografia 1. A.E. Roy – Orbital Motion, Institute of Physics Publishing, 1991 Appendice G Equazioni cinetiche della fluidodinamica e derivazione delle equazioni macroscopiche G.1 Equazioni cinetiche La trattazione cinetica descrive l’evoluzione temporale di un sistema a grande numero di elementi attraverso la funzione distribuzione f (q, p,t) nelle variabili canoniche q e p e nel tempo t, tramite la quale si definisce la densità di particelle nello spazio delle fasi: numero di particelle in d 3 q d 3 p = = f (q, p,t) d 3 q d 3 p . (G.1) Tale descrizione non segue dunque le singole componenti (particelle) del sistema, ma rappresenta la dinamica globale utilizzando il concetto di funzione di campo nello spazio delle fasi. In tal senso le variabili canoniche sono variabili indipendenti, una rappresenta la posizione e l’altra il momento coniugato corrispondente, cioè la quantità di moto. La f (q, p,t) non è una grandezza direttamente misurabile. Le misure sperimentali macroscopiche permettono invece di misurare i suoi momenti sulle velocità v che corrispondono a grandezze macroscopiche ben note. Nel caso non-relativistico e normalizzando alla densità numerica nello spazio delle r: Z f d 3 v = n(r,t) . (G.2) I momenti misurabili sono: 51 52 G Equazioni cinetiche della fluidodinamica e derivazione delle equazioni macroscopiche −→ ρ(r,t) = m fRd 3 v −→ V(r,t) = n−1 v f d 3 v −→ u(r,t) = v R− V −→ pi jR(r,t) = mvi v j f d 3 v = mui u j d 3 u + ρViV j = Πi j + ρViV j pressioneRtermica + cinetica densità di energia termica −→ ε(r,t) = R 21 mu2 f d 3 v flusso termico −→ q(r,t) = 12 mu2 f d 3 v . densità di massa spaziale velocità di flusso velocità termica tensore di pressione R (G.3) G.1.1 Equazione di Liouville L’equazione fondamentale per la descrizione cinetica di insiemi di particelle con comportamento coerente (fluido) è l’equazione di continuità per la densità di particelle nello spazio delle fasi f (r, v) e nel tempo t più sopra definita; l’equazione deriva dall’imporre nell’evoluzione temporale del sistema la conservazione del numero totale di particelle in un qualunque dato volume dello spazio delle fasi quando non siano presenti interazioni che modifichino la quantità di moto in maniera discontinua. Ciò è rappresentato in Fig. G.1 per una rappresentazione in una sola coordinata spaziale e una sola della velocità. Un’evoluzione continua richiede che le particelle nel volume A si portino in un volume B di diversa forma, ma senza perdite o aggiunte. Fig. G.1 Teorema di Liouville Per particelle di massa m, le variabili canoniche nello spazio delle fasi (in condizioni non-relativistiche) sono: qi = xi , pi = mvi e la condizione di continuità può essere scritta: (G.4) G.1 Equazioni cinetiche Z B 53 Z F f r + vdt, v + dt,t + dt drdv = f (r, v,t) drdv m a (G.5) dove la funzione f è quindi una funzione di campo euleriana. Sviluppando in serie al prim’ordine l’integrando a sinistra, ricordando che r e v sono variabili indipendenti e assumendo che le F siano indipendenti dalle velocità, l’eguaglianza può essere scritta in forma locale: F ∂f + v · ∇r f + · ∇v f = 0 . ∂t m (G.6) Ricordando che v = dr/dt e F/m = a = dv/dt, e definendo la velocità di flusso nello spazio delle fasi: Fi dri dvi = vi , , i = 1, 2, 3 (G.7) U= , dt dt m si ricava la seguente forma compatta con l’operatore differenziale a sei dimensioni ∇r,v ≡ (∂ /∂ ri , ∂ /∂ r j ): ∂f + U · ∇r,v f = 0 (G.8) ∂t oppure: ∂f + ∇r,v · ( f U) = 0 (G.9) ∂t dove si è utilizzato il fatto che ∇r,v · U = ∇r · v + ∇v · F = 0. m (G.10) Il primo termine a destra è nullo perché, come già ricordato più sopra, r e v sono variabili indipendenti, mentre il secondo è nullo per le tipiche forze posizionali (gravitazionali, elettrostatiche, ecc.) e anche per le forze di Lorentz (∇v · (v × B) = 0). Un’altra forma utile, che prende il nome di equazione di Liouville è pertanto: Df =0 Dt (G.11) dove si utilizza l’operatore D/Dt ≡ (∂ /∂t + U · ∇r,v ). Quando intervengano effetti di collisioni a corto raggio che comportano evoluzioni discontinue nello spazio delle fasi, l’equazione di continuità si modifica: ∂ f dr F ∂f + · ∇r f + · ∇v f = , (G.12) ∂t dt m ∂t coll e il termine a destra dipende dalla microfisica delle collisioni. In assenza di collisioni l’equazione di Liouville prende il nome di equazione di Vlasov: ∂f ∂f Fi ∂ f + vi + =0. (G.13) ∂t ∂ xi m ∂ vi 54 G Equazioni cinetiche della fluidodinamica e derivazione delle equazioni macroscopiche In presenza di collisioni l’equazione di Liouville diventa l’equazione di Boltzmann: ∂f ∂f Fi ∂ f ∂f . (G.14) + vi + = ∂t ∂ xi m ∂ vi ∂t coll La descrizione cinetica richiede la soluzione di queste equazioni che in genere risultano complesse, in quanto le forze vengono a loro volta definite tramite la posizione e la velocità di tutte le particelle. Solo in alcuni casi è possibile ottenere soluzioni generali. G.2 Equazioni macroscopiche Le equazioni macroscopiche derivano dall’equazione di Boltzmann tramite il calcolo dei momenti sulle velocità, cioè passando a grandezze mediate sulla distribuzione delle velocità. In tal modo si ottengono relazioni tra grandezze macroscopiche misurabili. Si definisce il momento della forza: densità di forza → F = Z F f d3v . (G.15) Qualora la forza non dipenda da v, si ha immediatamente F = nF. Possiamo ora calcolare i primi tre momenti dell’equazione di Boltzmann utilizzando le funzioni macroscopiche massa per il momento di ordine zero, quantità di moto per il momento del prim’ordine ed energia per il momento del second’ordine: 1 ψ0 (v) = mv0 , ψ1 (v) = mv1 , ψ2 (v) = mv2 . 2 (G.16) Si moltiplica l’equazione di Boltzmann successivamente per le tre funzioni e si integra sull’intero spazio delle velocità, assumendo che nelle integrazioni le variabili q, p,t siano tra loro indipendenti, che le ψi (v) siano funzioni di v soltanto e che la f (q, p,t) sia isotropa e si annulli per v → ∞: ∂f 3 d v= ∂t Z ∂f 3 d v= ψ(v)vi ∂ xi Z Fi ∂ f 3 ψ(v) d v= m ∂ vi Z ψ(v) Z ∂ ψ f d3v ∂t Z ∂ ψ f vi d 3 v ∂ xi Z Z Fi ∂f 3 Fi ∂ ψ 3 ψ d v=− fd v . m ∂ vi m ∂ vi (G.17) (G.18) (G.19) Quest’ultima relazione vale sia per forze indipendenti da v, sia per la forza di Lorentz ∝ v ×B, ed è ottenuta tramite integrazione per parti in cui il fattore integrato si annulla all’infinito. G.2 Equazioni macroscopiche 55 Per quanto riguarda il termine di collisione, nel caso di urti binari elastici con piccola energia potenziale di interazione, i momenti sono trascurabili: Z Z ∂f ∂f 3 d v ' mv d3v m ∂t coll ∂t coll Z 1 2 ∂f ' mv d3v ' 0 . (G.20) 2 ∂t coll Il momento di ordine zero (ψ0 ) dell’equazione corrisponde alla conservazione della massa, cioè all’equazione di continuità nello spazio delle coordinate spaziali: ∂ρ + ∇ · (ρV) = 0 . ∂t (G.21) Il momento del prim’ordine (ψ1 ) corrisponde alla conservazione della quantità di moto: DV e e = nF +∇·Π (G.22) ρ Dt e e e è il tensore di pressione termica; per plasmi omogenei e isotropi ∇ · Π e→ dove Π ∇P. Infine il momento del second’ordine (ψ2 ) corrisponde alla conservazione dell’energia; dopo alcune trasformazioni algebriche, e utilizzando le due equazioni precedenti, si ottiene: Dε e e : ∇V = nF · hui , + ε∇ · V + ∇ · q + Π Dt (G.23) e e e ∇ · q è il termine di trasporto termico (il simbolo ” : ” indica dove ε = (1/2) Tr Π un prodotto scalare fra tensori). Il sistema (G.21), (G.22), (G.23) non è chiuso in forma consistente, in quanto il e e ε, q è superiore al numero di equazioni. numero dei momenti di f incogniti, ρ, V, Π, La sua chiusura richiede opportune assunzioni fisiche; le possibilità più comuni in idrodinamica sono: • definizione di un’equazione di stato P = P(ρ); • condizione di adiabaticità q = 0, corrispondente a: D(Pρ −γ )/Dt = 0, dove γ è l’indice adiabatico (5/3 nel caso di gas perfetti monoatomici). Quando si considera un gas perfetto in equilibrio maxwelliano: f = n (2πmkT )−3/2 e−mu 2 /2kT (G.24) consegue che: e e = ∇P, ∇·Π hui = q = 0 e le equazioni fluide si semplificano nel sistema delle equazioni di Eulero: (G.25) 56 G Equazioni cinetiche della fluidodinamica e derivazione delle equazioni macroscopiche ∂ρ + ∇ · (ρV) = 0 ∂t DV + ∇P = nF Dt 3 DT nk + P∇ · V = 0 2 Dt P = nkT . (G.26) (G.27) (G.28) (G.29) Appendice H Lo stato di plasma, equazioni cinetiche ed equazioni macroscopiche H.1 Lo stato di plasma Lo stato di plasma viene raggiunto spontaneamente nella materia in equilibrio termodinamico a T ≥ 104 K quando l’agitazione termica è sufficientemente energetica da permettere un’elevata ionizzazione; per sistemi fuori dall’equilibrio si può realizzare ogni qualvolta esistano agenti eccitatori, ad esempio fotoni o flussi di particelle, con energie sufficienti a produrre ionizzazione (sistemi con energia media ≥ 10−2 eV con coda di alta energia). La presenza di particelle cariche libere cambia drasticamente il comportamento della materia: intervengono le forze coulombiane a lungo range tra le cariche (r −1/3 ncar ), mentre gli urti delle particelle neutre dell’idrodinamica sono interazioni a −1/3 corto range (r nneu ). Di conseguenza, quando il sistema materiale è sufficientemente grande perché siano molte le particelle interagenti a lungo range, la materia acquista un comportamento collettivo che sovrasta l’agitazione termica e il moto browniano. Le particelle “sentono” il campo elettromagnetico medio e seguono moti mediamente ordinati. Il fattore essenziale per definire un plasma è la presenza di cariche libere: un plasma non sarà quindi caratterizzato fisicamente dalla densità e dalla temperatura separatamente, ma tramite una loro combinazione che assicuri la sostanziale presenza di processi di ionizzazione. In un gas ionizzato lo stato di prevalenza degli effetti collettivi è raggiungibile aumentando il numero di particelle cariche interagenti, in quanto, se le forze elettrostatiche, che consentono interazioni a lungo raggio, decrescono con la distanza ∝ 1/r2 , è però vero che il numero delle cariche interagenti cresce ∝ r3 . Pertanto è sempre possibile, per un numero sufficientemente grande di cariche, che i campi elettrici (e magnetici) dell’insieme delle cariche si sommino in maniera coerente dando origine a un comportamento a molti corpi, a differenza di quanto avviene in un gas neutro in cui le particelle interagiscono essenzialmente in urti a corto raggio. Si può fissare un criterio quantitativo per esprimere la prevalenza degli effetti collettivi sui moti casuali termici, considerando che in un insieme di cariche in 57 58 H Lo stato di plasma, equazioni cinetiche ed equazioni macroscopiche equilibrio gli effetti microscopici dell’interazione fra cariche sono schermate dalla distribuzione media della carica spaziale che si viene a formare intorno a ciascuna di esse. L’effetto è quello di creare un campo medio collettivo al di sopra di una certa distanza λD , mentre al di sotto prevalgono ancora gli effetti delle singole cariche. Tale distanza caratteristica può essere calcolata considerando la distribuzione del potenziale elettrico intorno a una qualunque carica q localizzata in una posizione r in un plasma in equilibrio con elettroni e ioni distribuiti in modo da assicurare una neutralità globale, ne = ∑i Zi ni = Zn, dove Z è il valore medio della carica ionica. Il campo intorno a una singola carica può essere scritto tramite l’equazione di Poisson: # " ∇2V = −4π qδ (r) − e ne eeV /kT + e ∑ Zi ni e−Zi eV /kT (H.1) i dove gli esponenziali sono i fattori di Boltzmann che rappresentano la probabilità di trovare una carica in un punto a potenziale V quando il suo moto termico corrisponda a una temperatura T . Linearizzando i fattori esponenziali (piccoli potenziali di interazione eV /kT 1) si ottiene: ∇2V − 1 (1 + Z)V = −4πqδ (r) λD2 con (H.2) r kT . 4πe2 n In configurazione a simmetria sferica, si risolve: λD = 1/2 q V = e−(r/λD )(1+Z) . r (H.3) (H.4) Il risultato indica che intorno ad ogni carica q il plasma crea una nuvola di carica spaziale che riduce il potenziale elettrico coulombiano ad un valore medio capace di annullare l’effetto di carica singola su distanze superiori a λD . In pratica a distanze L > λD si misurano solo gli effetti collettivi e non quelli delle singole cariche. La lunghezza λD prende il nome di lunghezza di Debye (dal fisico che la introdusse nello studio sulla teoria degli elettroliti). Nel caso in cui le cariche mobili siano essenzialmente gli elettroni, la lunghezza di Debye vale: r kT λD = 740 cm (H.5) n dove l’energia termica kT è espressa in eV (kT = 1 eV a T = 11.400 K) e n in cm−3 . H.1 Lo stato di plasma 59 H.1.1 Quasi-neutralità dei plasmi Un plasma del tipo testé discusso, con un solo tipo di carica, non è in equilibrio se non sotto l’azione di un campo esterno o altri agenti (pareti) capaci di controbilanciare la carica spaziale netta che crea campi repulsivi. Comunemente in natura si incontrano invece plasmi in cui sono presenti cariche di ambedue i segni, mescolate fra di loro in modo da portare ad una situazione di neutralità globale corrispondente a stati di equilibrio. Uno stato di equilibrio in presenza di cariche libere è caratterizzato quindi dal fatto che le differenze di energie elettrostatiche tra diversi punti generate da cariche spaziali siano inferiori all’energia media del moto termico; per elettroni: −e∆V kTe . (H.6) Considerando un plasma con densità di ioni positivi ni ed elettroni negativi ne , e cariche Zi e e −e, l’equazione di Poisson su una distanza tipica L comporta: ∇2V ≈ ∆V = −4πe(∑ Zi ni − ne ) . L2 (H.7) Tenendo conto della definizione di lunghezza di Debye, si ha come conseguenza che per L > λD : |ne − ∑ Zi ni | ne . (H.8) Questo risultato implica la quasi-neutralità di un plasma: da un punto di vista macroscopico ioni ed elettroni sono vincolati a muoversi senza apprezzabile separazione di carica, sono cioè sempre legati collettivamente da effetti di carica spaziale. H.1.2 La frequenza di plasma Una naturale implicazione del comportamento collettivo delle particelle di un plasma è che esso può essere modellato come un sistema di oscillatori accoppiati. è immediato ricavare una frequenza tipica di oscillazione del sistema, considerando il rapporto tra la velocità tipica del moto delle cariche (la velocità termica) e la lunghezza scala per i fenomeni collettivi (la lunghezza di Debye): r vth 4πq2 n ωp = = , (H.9) λD m che è appunto detta frequenza di plasma. Nell’espressione compare l’inerzia delle cariche che trasportano la carica spaziale, e quindi in linea di principio sono possibili varie frequenze tipiche di oscillazione. Tuttavia le cariche più mobili sono ovviamente gli elettroni e quindi la frequenza di plasma più importante è anche quella massima: √ ω pe = 5.6 104 ne rad s−1 (H.10) 60 H Lo stato di plasma, equazioni cinetiche ed equazioni macroscopiche con ne in cm−3 . H.1.3 La conduttività elettrica Il raggiungimento della quasi-neutralità in un plasma è legata alla capacità delle cariche elettriche a rispondere alla presenza di un campo elettrico pure in presenza di collisioni che ne ostacolino il moto. Questa caratteristica è misurata dalla conduttività elettrica σ , definita come il rapporto tra la densità di corrente che si genera e il campo elettrico che la induce: j = σ E. (H.11) In realtà la conduttività è un tensore in quanto i plasmi sono anistropi soprattutto in presenza di campi magnetici; ma nei casi più semplici (ad es. per plasmi omogenei non magnetizzati) si riduce a uno scalare. Si ottiene una semplice espressione per σ ricordando che il trasporto di carica è sempre effettuato dagli elettroni che hanno maggior mobilità: dv = −eE (H.12) j = −nev , m dt e utilizzando la frequenza di collisione νc come tempo scala su cui avviene l’accelerazione da parte del campo elettrico: mνc v = eE , (H.13) si può scrivere: σ= ne2 . mνc (H.14) Plasmi ad alta conduttività possono essere considerati sempre in condizioni di quasi-neutralità e sono modellati come un fluido elettricamente conduttore (modello magneto-idrodinamico). Nella Tabella H.1 sono riportati i valori delle grandezze ora definite per vari tipi di plasmi astrofisici e, per confronto, per i plasmi di laboratorio. H.2 Teoria cinetica Lo studio diretto di un plasma attraverso le equazioni del moto per ogni singola particella è del tutto inapplicabile in vista di verifiche sui dati sperimentali che si riferiscono a grandezze macroscopiche; esistono tre classi di trattazione dei plasmi: (1) la teoria cinetica, (2) la teoria fluida, in particolare la teoria magnetoidrodinamica, (3) la teoria delle orbite. H.2 Teoria cinetica Ionosfera Vento solare Corona solare Interni stellari Stelle neutroni Gas interstell. Gas intergal. Nuclei galattici Termonucleare 61 L ne cm cm−3 107 103÷6 1013÷15 1 ÷ 104 109÷11 108÷12 10÷12 10 1027 6 10 1042 10 ÷ 1022 10−3 ÷ 10 ≥ 1024 ≤ 10−5 ≤ 1015 ≤ 1012 102 1016 T K 102÷3 102÷3 106÷7 4 × 107 106÷9 102 105÷6 ≥ 108 108 λDe cm 0.1 ÷ 7 1 ÷ 200 0.01 ÷ 2 10−9 −17÷−16 10 20 ÷ 2000 ≥ 2 × 106 7 × 10−2 7 × 10−4 ν pe Hz 105÷7 104÷6 108÷110 3 × 1017 1025÷26 102÷4 ≤ 30 ≤ 1010 1012 νc Hz 101÷3 0.01 ÷ 6 8 2 × 1016 1023÷28 10−4 ≤ 10−11 30 2 × 105 σ s−1 109÷11 109÷11 7 × 1015 7 × 1018 1017÷21 6 × 1012 1014 ≥ 4 × 1018 6 × 1018 Tabella H.1 Scale, densità, temperature, lunghezze di Debye, frequenze di plasma, frequenze di collisione e conduttività di plasmi tipici Il primo metodo è il più completo e permette lo studio dettagliato del plasma, includendo fenomeni fuori dall’equilibrio termodinamico. Il secondo metodo consente di trattare la maggior parte dei fenomeni di plasma, ma esclude lo studio dell’evoluzione e della stabilità della funzione spettrale delle particelle. Il terzo metodo consente di comprendere la dinamica dei sistemi quando siano dominati dai campi esterni cosicchè tutte le particelle si comportino in modo uniforme. L’equazione fondamentale per la descrizione dell’evoluzione temporale della funzione distribuzione f (q, p,t) nello spazio delle fasi con variabili canoniche q e p è l’equazione di Liouville discussa nell’Appendice G. Si tratta dell’equazione di continuità nello spazio delle fasi, e impone la conservazione della funzione f (q, p,t) a meno che non siano presenti interazioni che modifichino la quantità di moto in maniera discontinua (collisioni): ∂f df ≡ + ∇q,p · ( f u) = 0 dt ∂t (H.15) ovvero: df + f ∇q,p · u = 0 dt dove u è il flusso di velocità nello spazio delle fasi: dqi d pi u= , , i = 1, 2, 3 dt dt e ∇q,p ≡ ∂ ∂ , ∂ qi ∂ pi (H.16) (H.17) . (H.18) e si tenga conto che per flussi non discontinui ∇ · u ≡ 0. Quando siano invece presenti collisioni che eludono la conservazione della densità f (q, p.t), l’espressione formale dell’equazione di Liouville risulta: 62 H Lo stato di plasma, equazioni cinetiche ed equazioni macroscopiche df + f ∇q,p · u = dt ∂f ∂t , (H.19) coll ove il termine a destra dev’essere scritto attraverso la fisica delle collisioni. Per particelle di carica e e massa m in presenza di campi elettromagnetici di potenziale vettore A e potenziale scalare φ , le variabili canoniche nello spazio delle fasi (in condizioni non-relativistiche) sono: e qi = xi , pi = mvi + Ai c (H.20) con hamiltoniana: 1 e (pi − Ai )2 + eφ . (H.21) 2m c Sostituendo queste espressioni nell’equazione di Liouville, si ottiene l’equazione di Vlasov: ∂f ∂f Fi ∂ f + vi + =0 (H.22) ∂t ∂ xi m ∂ vi con: H = ∂ φ e ∂ Ai e − + [v × (∇ × A)] ∂ xi c ∂t c e F = eE + v × B c 1 ∂A E=− − ∇φ , B = ∇×A . c ∂t Fi = −e (H.23) In presenza di collisioni l’equazione di Vlasov diventa l’equazione di Boltzmann: ∂f Fi ∂ f ∂f ∂f + vi + = . (H.24) ∂t ∂ xi m ∂ vi ∂t coll H.3 Teoria fluida Come nel caso dei fluidi, le equazioni macroscopiche derivano dalle equazioni cinetiche tramite il calcolo dei momenti sulle velocità. Nell’Appendice G sono già state individuate le grandezze macroscopiche che si ottengono come momenti della f (q, p,t). Per scrivere i momenti nel caso dei plasmi è usuale definire il momento della forza: Z densità di forza → F = F f d 3 v . (H.25) Qualora la forza non dipenda da v, F = nF. Le tre equazioni dei momenti sono l’equazione di continuità: ∂ρ + ∇ · (ρV) = 0 ∂t (H.26) H.3 Teoria fluida 63 l’equazione del moto: DV e e =F +∇·Π Dt (H.27) Dε e e : ∇V = 0 + ∇ · q + ε∇ · V + Π Dt (H.28) ρ e l’equazione dell’energia: e e → ∇p. Queste dove D/Dt = (∂ /∂t + V · ∇); per plasmi omogenei e isotropi ∇ · Π tre equazioni non formano un sistema chiuso, in quanto il numero di momenti di e e e è superiore al numero di equazioni; e la e q (ε = (1/2) Tr Π), f incogniti, ρ, V, Π, difficoltà non si risolve proseguendo nella derivazione di altri momenti, perché si incontra l’impossibilità di collegare i momenti di ordine superiore della f con quantità fisicamente misurabili. Come in fluidodinamica, il sistema di equazioni macroscopiche viene chiuso con opportune assunzioni fisiche; le possibilità più comuni nella fisica dei plasmi sono: • definizione di un’equazione di stato p = p(ρ); • condizione di adiabaticità q = 0, corrispondente a: (D/Dt)(pρ −γ ) = 0 (H.29) con γ indice adiabatico, γ = 5/3 nel caso di gas non relativistici e γ = 4/3 nel caso di gas relativistici. H.3.1 Modello a due fluidi In un plasma coesistono sempre almeno tre tipi di particelle, ciascuno con la propria funzione di distribuzione: particelle neutre, elettroni e ioni positivi. Ne segue che i modelli macroscopici dovrebbero essere sempre modelli a tre fluidi: in realtà, poiché nella maggior parte dei casi di interesse astrofisico i plasmi sono altamente ionizzati, si adotta spesso un modello a due fluidi, in termini di f − e f + in condizioni di equilibrio termodinamico, il che permette di esprimere la densità di energia in ∓ termini della temperatura ε ∓ = c∓ v T . Le equazioni macroscopiche precedenti sono riscritte introducendo i termini di scambio di quantità di moto (∆ p ∓± ) ed energia (∆ ε ∓± ) per collisioni tra le due componenti. Le equazioni separate per i due fluidi risultano: ∂ ρ∓ + ∇ · (ρ ∓ V∓ ) = 0 ∂t ∓ ∓ ∂ e e − n∓ e∓ E + V × B = ρ∓ + V∓ · ∇ V∓ + ∇ · Π ∂t c = ∆ p∓± (H.30) (H.31) 64 H Lo stato di plasma, equazioni cinetiche ed equazioni macroscopiche ∓ ∂ e ∓ ∓ ∓ ∓ ∓ ∓ e + V∓ · ∇ c∓ v T + cv T ∇ · V + ∇ · q + Π : ∇V = ∂t = ∆ ε ∓± . (H.32) Per giungere ad esprimere un modello in termini di grandezze misurabili, si opera una media sulle due distribuzioni secondo i seguenti pesi: densità di materia velocità media densità di carica densità di corrente → ρ = ρ + + ρ − = n+ m+ + n− m− → V = (ρ + V+ + ρ − V− )/(ρ + + ρ − ) → Q = n+ e+ + n− e− → J = n+ e+ V+ + n− e− V− → Jconv = QV = (n+ e+ + n− e− )V → j = J − Jconv = n+ e+ (V+ − V) + +n− e− (V− − V) . (H.33) Inoltre si può assumere, per urti elastici o con piccolo potenziale di interazione: ∆ p−+ + ∆ p+− ' 0 , ∆ ε −+ + ∆ ε +− ' 0 . (H.34) Sommando le due equazioni di continuità, si ottiene l’equazione di continuità della massa totale: ∂ρ + ∇ · (ρV) = 0 . (H.35) ∂t Moltiplicando le due equazioni di continuità per e∓ /m∓ rispettivamente e sommandole, si ottiene l’equazione di continuità della carica: ∂Q +∇·J = 0 . ∂t (H.36) Sommando le due equazioni del moto, si ottiene l’equazione del moto del fluido: ρ DV e e − QE − 1 J × B = 0 +∇·Π Dt c (H.37) − + e e e e . Sempre utilizzando le due equazioni del moto, moltiplicandole e +Π e =Π dove Π per e∓ /m∓ rispettivamente e sommandole, si ottiene, nel limite m− /m+ 1 (ioni “immobili”) e di pressione scalare isotropa: ∂J B e− + Ωe J × − − ∆ p−+ = ∂t B m n− e−2 V 1 − = E + × B − ∇p − m− c n− e− (H.38) −n− e− (V− · ∇)V− + n+ e+ (V+ · ∇)V+ dove Ωe = |(e− B)/(m− c)| = 1.8 107 B rad sec−1 è la frequenza di Larmor elettronica e p− la pressione elettronica. Le due assunzioni sui rapporti di cariche e masse sono H.3 Teoria fluida 65 accettabili in precise situazioni fisiche. Cosı̀ l’assunzione di isotropia di pressione si applica nel limite di Chapman-Enskog per grandi frequenze di collisioni, p+ ≈ p− ≈ p/2, oppure nel limite detto di plasma freddo, p+ ≈ p− ≈ 0. Per quanto riguarda l’espressione di ∆ p−+ per lo scambio di quantità di moto tra elettroni e ioni, essa può essere ricavata considerando che dipende dalla velocità relativa: 4p−+ ' νc n− m− (V+ − V− ) ' −νc n− m− (V− − V) (H.39) in quanto le velocità peculiari degli ioni pesanti sono trascurabili rispetto a quelle degli elettroni. La costante di proporzionalità rappresenta il numero di collisioni per unità di tempo (frequenza di collisione). Confrontando con l’espressione della densità di corrente j: j = n+ e+ (V+ − V) + n− e− (V− − V) ' n− e− (V− − V) si ottiene: 4p−+ ' − m− νc j. e− (H.40) (H.41) Nell’ulteriore ipotesi ∇Vi± ≈ 0, corrispondente all’assenza di correnti termoelettriche, si ottiene la legge di Ohm generalizzata: ∂J B e− n− e−2 V + Ωe J × − − ∇p + νc j = E+ ×B . (H.42) ∂t B 2m m− c È ovvia l’analogia con la legge di Ohm classica; in effetti il rapporto dei coefficienti di j e E corrisponde proprio alla conduttività elettrica classica alla Spitzer σ = n− e2 /m− νc , per cui j = σ E. I termini addizionali nella presente formulazione corrispondono alle caratteristiche funzioni del plasma rispetto al caso di un conduttore classico. Passiamo infine all’equazione dell’energia, sommando le due espressioni singole − + + per elettroni e ioni con cv = c− v T + cv T : e e : ∇V = (∂ /∂t + V · ∇) cv T + cv T ∇ · V + ∇ · q + Π V = j· E + × B . c (H.43) (H.44) Il termine a secondo membro rappresenta il riscaldamento Joule. I campi E, B in queste equazioni sono definiti attraverso le equazioni di Maxwell, ove correnti e cariche sono a loro volta definite dalle distribuzioni f − , f + del plasma. Si usano quindi le equazioni di Maxwell nel vuoto per chiudere il sistema: 1 ∂E 4π J+ c c ∂t 1 ∂B ∇×E = − c ∂t ∇ · E = 4π Q ∇×B = (H.45) 66 H Lo stato di plasma, equazioni cinetiche ed equazioni macroscopiche ∇ · B = 0. Solo le prime due equazioni di Maxwell sono effettivamente richieste per descrivere i campi, mentre le due rimanenti definiscono solo le condizioni iniziali e al contorno in termini delle cariche e delle correnti. In conclusione il sistema delle equazioni del modello a due fluidi è costituito da 15 equazioni scalari nelle 15 incognite scalari ρ, V, Q, J, p, E, B (viene dato per scontato che siano state fatte delle scelte su q, in particolare q = 0): ∂ρ + ∇ · (ρV) = 0 ∂t ∂Q +∇·J = 0 ∂t DV 1 ρ + ∇p − QE − J × B = 0 Dt c ∂J B e− n− e−2 V + Ωe J × − − ∇p + νc j = E + × B ∂t B 2m m− c D e e : ∇V− (cv T ) + cv T ∇ · V + ∇ · q + Π Dt V −j· E + × B = 0 c 4π 1 ∂E ∇×B = J+ c c ∂t 1 ∂B ∇×E = − . c ∂t (H.46) Si tratta di un sistema altamente nonlineare, che può essere risolto analiticamente solo in casi molto particolari. H.3.2 Equazioni magnetoidrodinamiche Un plasma con elevata frequenza di collisione ed elevata conduttività elettrica è sempre in grado di mantenersi in condizioni di quasi-neutralità e in equilibrio maxwelliano a data T nelle sue varie componenti. In tal caso si può porre: n+ ≈ n− , Q ≈ 0, p = p+ + p− ≈ 2p+ ≈ 2p− (H.47) 2 J ≈ j, V+ ≈ V− , p = cv T . 3 (H.48) Se inoltre si impone q ≈ 0, e si sceglie come tempo scala caratteristico ω −1 = L/V (L estensione del plasma, V velocità caratteristica dei moti fluidi), le equazioni del modello a due fluidi vengono scritte nell’approssimazione magnetoidrodinamica. Si parte dalla legge di scala suddetta in condizioni non relativistiche: H.3 Teoria fluida 67 ωL ωL ≈ 1, 1. V c (H.49) Dall’equazione di Maxwell per ∇ × E si ottiene quindi: ω E ≈ B, L c E ωL ≈ 1. B c (H.50) Dall’equazione di Maxwell per ∇ × B si ottiene quindi: ossia B J ω ωL ≈ + B L c c c (H.51) " # L ωL 2 ≈B , J ≈ B 1+ c c (H.52) cioè il termine delle correnti di spostamento è trascurabile. Con le suddette relazioni possiamo scalare i vari termini della legge di Ohm: ! 2 2 c2 ω 2 c2 ω Ω e cs ω c ω νc : : : =1:1 (H.53) 2 V 2 ω pe V 2 ω pe ω pe V 2 Ωi V 2 ω pe ω pe dove cs = (p/m+ n+ )1/2 è la velocità del suono e le altre quantità sono state precedentemente definite. I primi tre termini della legge di Ohm sono trascurabili rispettivamente quando: V ω , ω pe c ωΩe 2 ω pe 2 V , c ω Ωi 2 V . c (H.54) Se tutte queste relazioni sono soddisfatte, si ritorna alla legge di Ohm classica: V (H.55) J = σ E+ ×B . c Nelle ipotesi citate all’inizio del paragrafo, l’equazione dell’energia risulta pure semplificata; ponendo p = (3/2)cv T e utilizzando l’equazione di continuità: D p V 2 −5/3 = ρ J· E + × B . (H.56) Dt ρ 5/3 3 c Il sistema completo delle equazioni magnetoidrodinamiche risulta costituito da 14 equazioni scalari nelle 14 incognite scalari ρ, V, J, p, E, B: ∂ρ + ∇ · (ρV) = 0 ∂t DV 1 ρ = −∇p + J × B Dt c 68 H Lo stato di plasma, equazioni cinetiche ed equazioni macroscopiche V J = σ E+ ×B c p V D 2 −5/3 ρ J· E + × B = Dt ρ 5/3 3 c 4π ∇×B = J c 1 ∂B . ∇×E = − c ∂t (H.57) H.3.3 Equazioni magnetoidrodinamiche ideali Un caso speciale delle equazioni magnetoidrodinamiche, molto usato in astrofisica, è quello che si ottiene nel limite di conduttività infinita, σ → ∞, che comporta debba essere: V E+ ×B = 0 (H.58) c se si vogliono evitare correnti infinite. Il sistema delle equazioni magnetoidrodinamiche ideali è costituito dalle 11 seguenti equazioni scalari nelle 11 incognite scalari ρ, V, J, p, B: ∂ρ + ∇ · (ρV) = 0 ∂t DV 1 ρ = −∇p + J × B Dt c D p =0 Dt ρ 5/3 4π ∇×B = J c 1 ∂B ∇ × (V × B) = − . c ∂t (H.59) È questo un sistema di vasta applicazione in astrofisica, dove i plasmi sono sempre caratterizzati da alta conduttività elettrica. È importante notare che non compare più direttamente il campo elettrico, in quanto un plasma ad alta conduttività non possiede carica netta. Tuttavia il plasma è conduttore, trasporta correnti e crea campi magnetici. H.3 Teoria fluida 69 H.3.4 Il regime di plasma freddo In una gas neutro a temperatura zero sono impossibili condizioni per un comportamento coerente in quanto le particelle non interagiscono: λc → ∞. Le velocità delle particelle non sono correlate, i moti sono liberi (a meno che non intervengano altre forze che portino a effetti collettivi, ad esempio la gravitazione). In un plasma, per quanto piccole possano essere le velocità di agitazione termica rispetto alla velocità imposta dalla dinamica, cioè u V , i campi a lungo range continuano a mantenere la coerenza del sistema in quanto definiscono le velocità V . Da un punto di vista formale, utilizzando le relazioni del precedente paragrafo, quando vth ≈ T 1/2 → 0, risulta b0 → ∞; pertanto τc ∝ T 3/2 e logΛ ∝ log T 3/2 , per cui τc,lr e λc → 0. Pertanto le condizioni per una trattazione fluida sono soddisfatte per qualunque scala e per tempi maggiori di τc,lr . Le equazioni del plasma freddo discendono dalle equazioni macroscopiche a due fluidi trascurando trasporto termico, pressione e temperatura del plasma. Sono 14 equazioni scalari nelle 14 incognite scalari ρ, Q, V, J, E, B: ∂ρ + ∇ · (ρV) = 0 ∂t ∂Q + ∇ · (ρJ) = 0 ∂t DV 1 ρ = QE+ J × B Dt c 1 m+ m− ∂ J = E+ V×B 2 ρe ∂t c 4π 1 ∂E ∇ × B = J+ c c ∂t 1 ∂B ∇×E = − . c ∂t (H.60) H.3.5 Il regime di forte campo magnetico Ritorniamo al caso di pressioni del plasma non trascurabili, ma di lunghezze scala di collisione grandi rispetto alle scale del plasma, λc λ , cosicchè il plasma sia da considerare non collisionale; tuttavia si assuma che sia presente un forte campo magnetico, tale cioè che: mvc λc rgir = (H.61) eB dove rgir è il raggio di Larmor o di girazione. In tali condizioni è lecito utilizzare le equazioni della teoria delle orbite in quanto i campi determinano un comportamento simile per particelle dello stesso tipo. 70 H Lo stato di plasma, equazioni cinetiche ed equazioni macroscopiche È tuttavia possibile ancora utilizzare equazioni fluide. Se λ⊥ è la scala delle variazioni delle grandezze fisiche del plasma perpendicolarmente al campo magnetico, si può dire che il campo magnetico ”lega” le particelle alle linee di flusso, determinandone il comportamento collettivo, se: λ⊥ rgir . (H.62) In tale situazione il campo magnetico assume il ruolo delle collisioni, ma solo nel piano perpendicolare: il comportamento è fluido soltanto su due delle tre coordinate spaziali. Per la direzione lungo il campo magnetico spesso si utilizza l’ipotesi di moti termici trascurabili (plasma freddo longitudinale), in quanto ciò si accorda con l’ipotesi di poche collisioni. Il plasma in presenza di un forte campo magnetico tende dunque ad avere un comportamento anisotropo con p⊥ 6= pk , T⊥ 6= Tk , ecc. Si possono ottenere le seguenti equazioni dell’energia nel limite equivalente al caso magnetoidrodinamico (teoria doppia adiabatica di Chew, Goldberger e Low): D p⊥ =0 (H.63) Dt ρB ! D pk B2 =0 (H.64) Dt ρ3 H.4 Teoria delle orbite In questa trattazione si assume che i campi elettromagnetici delle sorgenti esterne siano dominanti rispetto a quelli prodotti dalle cariche e dalle correnti del plasma. Pertanto tutte le particelle hanno un comportamento comune e si possono studiare i processi dinamici in base allo studio delle particelle singole. La teoria delle orbite parte dall’equazione del moto di una particella di massa m e carica q soggetta alla forza di Lorentz; nel caso non-relativistico e utilizzando il sistema gaussiano per l’elettromagnetismo (secondo la tradizione dell’astrofisica) tale equazione risulta: du u m = q E+ ×B (H.65) dt c dove è trascurato l’effetto della forza di reazione di radiazione che risulta importante solo in alcuni casi specifici astrofisici. Come noto dalla fisica elementare, nel caso di campo elettrico nullo, E = 0, e di campo magnetico costante, B = cost, il moto perpendicolare alla direzione del campo magnetico è un moto circolare uniforme alla cosiddetta frequenza di girazione o frequenza ciclotrone: |q| B (H.66) ωc = mc H.4 Teoria delle orbite 71 e con raggio di girazione: rc = mu⊥ c . |q| B (H.67) Questo risultato si ricava dalla soluzione della (H.65) per u⊥ : du⊥ = u⊥ × ωc , dt (H.68) che può essere scritta nella forma: u⊥ = ωc rc (ê1 − iê2 ) e−iωc t r = r0 + irc (ê1 − iê2 ) e−iωc t (H.69) (H.70) con ê1 e ê2 versori degli assi coordinati nel piano normale al campo magnetico. La traiettoria circolare viene percorsa, per un osservatore allineato con il campo e con la testa nella direzione del campo stesso, in verso orario per cariche positive e antiorario per cariche negative. La componente uk della velocità parallela al campo magnetico non è invece influenzata dal campo magnetico, e dà origine ad una traslazione del moto circolare a velocità costante, creando una traiettoria elicoidale a passo costante. Ovviamente il lavoro della forza magnetica è nullo: Z Z q q u × B · ds = u × B · udt = 0 . (H.71) c c Nel caso relativistico l’equazione del moto utilizza il momento relativistico p =mγu, per cui si ottiene: u dp = q E+ ×B dt c (H.72) e la frequenza ciclotrone relativistica è: ωc,rel = |q| B . mγc (H.73) In Tabella H.2 sono riportati i valori dei campi magnetici caratteristici e le corrispondenti frequenze di ciclotrone per elettroni nel caso di plasmi astrofisici e di laboratorio. Anche quando il moto della carica non avvenga in un campo magnetico uniforme lo studio del moto può sempre essere considerato come composto da due componenti: (1) un moto di girazione intorno al centro di guida, cioè il centro istantaneo del moto di girazione, e (2) il moto del centro di guida (che nel caso del campo magnetico uniforme è un moto uniforme lungo l’asse della traiettoria elicoidale). La teoria delle orbite, introdotta da Alfvén nel 1940, si sviluppa nell’ipotesi che le disomogeneità spaziali e temporali dei campi magnetici abbiano scale molto maggiori, rispettivamente, del raggio del moto istantaneo di girazione rc e del periodo 72 H Lo stato di plasma, equazioni cinetiche ed equazioni macroscopiche B ωc Gauss Hz Ionosfera 0.1 2 × 106 Vento solare 10−6 ÷ 10−5 20 ÷ 200 Corona solare 10−5 ÷ 1 200 ÷ 6 × 106 Corone stelle magnetiche 103 2 × 1010 Stelle di neutroni 1012 2 × 1019 Gas interstellare 10−6 2 Gas intergalattico ≤ 10−8 ≤ 10−2 Nuclei galattici ≥ 105 ≥ 1011 Plasma termonucleare 105 2 × 1012 Tabella H.2 Campi magnetici e frequenze di ciclotrone elettroniche di plasmi tipici di girazione τc = 2π 2πmc . = |q| B ωc (H.74) In tal modo nel moto di girazione i campi possono essere considerati costanti, l’effetto delle loro variazioni intervenendo soltanto sul moto del centro di guida. Non esistono soluzioni generali per il moto del centro di guida, ma è possibile definire alcuni tipi fondamentali caratteristici. Ad esempio in Fig. H.1 sono riportate le traiettorie di particelle in un campo magnetico di dipolo: le linee tratteggiate sono Fig. H.1 Moto di una particella carica in un campo di dipolo magnetico; linea continua: moto del centro di guida calcolato da Alfvén; linea tratteggiata: moto calcolato in modo diretto da Störmer H.4 Teoria delle orbite 73 le traiettorie calcolate da Störmer (1950) integrando numericamente le equazioni complete (H.65), le linee continue rappresentano il moto del centro di guida calcolate da Alfvén. Si ricava una perfetta consistenza del metodo della teoria delle orbite. Il vantaggio sta ovviamente nella maggior semplicità della teoria delle orbite; oggi l’uso dei calcolatori numerici ad alte prestazioni ne riduce ovviamente l’importanza. Tuttavia è utile presentare i principi della teoria in quanto permette di acquisire una maggior comprensione dei moti delle particelle cariche in campi elettromagnetici che non è cosı̀ intuitiva come per la forza gravitazionale. H.4.1 Moti di deriva Consideriamo il moto di una particella carica in un campo magnetico uniforme B in presenza di una forza F perpendicolare al campo stesso. Successivamente indicheremo i casi in cui tale situazione si verifica. L’equazione del moto è: m q du = F+ u×B dt c (H.75) con F costante e perpendicolare a B. In assenza del campo magnetico il moto sarebbe uniformemente accelerato nella direzione di F, ma la presenza della girazione intorno alla direzione del campo magnetico modifica sostanzialmente il moto, come illustrato in Fig. H.2a. Poiché non esiste forza nella direzione del campo magnetico, il moto della carica nella direzione parallela a B sarà uniforme: uk = costante . (H.76) Per calcolare il moto perpendicolare eseguiamo una trasformazione di riferimento al sistema che si muove rispetto a quello di laboratorio con velocità costante uD : c F×B . q B2 (H.77) u⊥ = u0⊥ + uD ; (H.78) uD = Poniamo dunque: poiché (F × B) × B = −B2 F, m l’equazione del moto perpendicolare diventa: du0⊥ q q = F + u0⊥ + uD × B = u0⊥ × B dt c c (H.79) che mostra come il moto in questo sistema sia una semplice girazione. Pertanto la velocità uD risulta essere esattamente il moto del centro di guida nell’accezione data nel precedente paragrafo. Il moto perpendicolare della carica è dunque composta da un moto circolare uniforme e da un moto di deriva (in inglese drift) pure a velocità uniforme nella direzione perpendicolare sia al campo magnetico sia alla forza 74 H Lo stato di plasma, equazioni cinetiche ed equazioni macroscopiche Fig. H.2 Traiettoria di una particella carica positivamente soggetta ad un campo magnetico e ad una forza perpendicolare (sinistra); traiettoria di una carica positiva in un campo magnetico nonuniforme (destra) costante. La traiettoria perpendicolare sarà dunque una cicloide. Il verso della deriva dipende dal segno della carica e quindi, se la forza F non dipende a sua volta dal segno della carica, la deriva avviene in versi opposti per cariche positive e negative. H.4.2 Deriva elettrica Se la forza è dovuta ad un campo elettrico F = qE, la velocità di deriva è: uD,el = c E×B . B2 (H.80) Il verso della deriva non dipende dunque dal segno della carica. Questo caso si applica, ad esempio al moto di una carica in un campo elettromagnetico con vettori elettrico e magnetico perpendicolari come in un’onda piana. L’interpretazione della deriva elettrica è immediata. Consideriamo ad esempio una carica positiva che compia una girazione oraria (Fig. H.2a). Assumiano che inizialmente il moto avvenga concordemente con la forza, che quindi accelererà la carica aumentandone il raggio di girazione. Quando la girazione invertirà il moto da parallelo alla forza ad antiparallelo, la forza rallenterà la carica e ne diminuirà il raggio di girazione restringendo la curvatura della traiettoria. Alla successiva inversione da antiparallela a parallela la curvatura si allargherà e in totale si avrà un sistematico spostamento verso destra nella figura seguendo una cicloide percorsa in verso orario. Qualora la carica sia negativa, la girazione è antioraria, ma la forza elettrica agisce in modo contrario al caso precedente, frenando il moto nella direzione della forza e accelerandolo in quella contraria. Anche in tal caso la deriva sarà sempre verso destra, ma seguendo una cicloide a verso antiorario. Si può facilmente ricavare che l’espressione della velocità di deriva elettrica ora ottenuta vale anche nel limite relativistico. [1] H.4 Teoria delle orbite 75 H.4.3 Deriva di gradiente Consideriamo la situazione di Fig. H.2b in cui il campo magnetico B = Bz (y)ẑ abbia un gradiente nella direzione dell’asse y. Nell’ipotesi della teoria delle orbite di piccoli gradienti si può porre: Bz (y) ≈ B0 + dBz y dy e quindi la forza di Lorentz istantanea nella direzione y è: q dBz Fy = − ux B0 + y c dy (H.81) (H.82) mentre Fx è semplicemente quella che causa la girazione all’ordine zero. Poiché nelle nostre ipotesi il moto dominante è quello circolare, possiamo mediare queste forze sul periodo di girazione, trascurando il moto del centro di guida. Ovviamente la media della componente hFx i ∝ hquy B0 i = 0 perché huy i = 0. Analogamente in Fy la media del termine ∝ qux B0 è nulla perché hux i = 0. Invece hux yi = ± (1/2) u⊥ rc , dove il segno dipende dal verso di percorrenza dell’orbita di girazione (orario per cariche positive). Pertanto, in forma vettoriale: hFi = ∓ q u⊥ rc ∇B 2c (H.83) e sostituendo questa forza mediata nella (H.77) si ottiene l’espressione per la deriva causata dal gradiente del campo: 1 B × ∇B uD,grad = ± u⊥ rc . 2 B2 (H.84) Si noti che il verso della deriva di gradiente dipende dal segno della carica, per cui può generare una corrente in un plasma ionizzato muovendo elettroni e ioni positivi in versi opposti. H.4.4 Deriva di curvatura Quando il campo magnetico è costante in modulo ma le linee di forza abbiano un raggio di curvatura costante Rc , come illustrato in Fig. H.3, si può valutare che le cariche che si muovono lungo il campo a velocità costante subiscono una forza centrifuga media: Rc (H.85) Fc = −mu2k 2 Rc dove si è indicato con Rc il vettore del raggio di curvatura rivolto verso il centro di curvatura. Pertanto, sostituendo nella (H.68),l’espressione per la velocità di deriva 76 H Lo stato di plasma, equazioni cinetiche ed equazioni macroscopiche Fig. H.3 Traiettoria di una carica in un campo magnetico a curvatura costante di curvatura: uD,curv = − cmu2k Rc × B qB2 R2c . (H.86) Anche questa deriva produce una corrente in un plasma ionizzato, in quanto dipende dal segno della carica. In figura la velocità di deriva è nella direzione perpendicolare al disegno. H.4.5 Specchi (mirrors) magnetici Studiamo, sempre nel limite della teoria delle orbite, il moto di cariche elettriche in una configurazione magnetica a simmetria assiale in cui l’intensità del campo magnetico varia lentamente lungo l’asse di simmetria, con scala del gradiente molto grande rispetto al raggio di girazione. La rappresentazione in termini di linee di flusso magnetico è riportata in Fig. H.4. È naturale utilizzare coordinate cilindriche con l’asse z lungo l’asse di simmetria. La componente dominante del campo è Bz , ma esiste pure una componente Br che determina l’intensificazione del campo nella regione ove le linee di flusso si addensano. La condizione di solenoidalità del campo magnetico permette di ricavare il valore di Br : 1 ∂ ∂ Bz (rBr ) + =0 (H.87) r ∂r ∂z Fig. H.4 Configurazione a specchio magnetico (magnetic mirror) H.4 Teoria delle orbite 77 per cui, trascurando la variazione in r di ∂ Bz /∂ z nelle vicinanze dell’asse, si ricava: rBr = − Z r 0 r0 1 ∂ Bz ∂ Bz 0 dr = − r2 ∂z 2 ∂z (H.88) e infine 1 ∂ Bz Br = − r . (H.89) 2 ∂z Un carica generica compirebbe, in assenza della componente Br , un moto elicoidale lungo l’asse. Nel caso presente invece subisce l’effetto di una componente z della forza di Lorentz: q Fz = − uθ Br (H.90) c dove uθ = ∓u⊥ rappresenta il moto di girazione azimutale, positivo per cariche negative e negativo per cariche positive. Pertanto: Fz = ∓ ∂ Bz ∂ Bz q u⊥ rc = −µ 2c ∂z ∂z (H.91) dove abbiamo definito il momento magnetico associato con il campo indotto dalla girazione della carica che trasporta una corrente −qωc /2π [1]: µ =± q ωc 1 u⊥ rc = ± q · πrc2 · 2c 2π c (H.92) Il momento magnetico può anche essere scritto nella forma: µ= 1 2 2 mu⊥ B . (H.93) In conclusione il moto della carica in z è determinato dall’equazione del moto: m duk ∂ Bz = Fz = −µ dt ∂z che permette di ricavare l’integrale primo: duk d 1 2 dB ∂ Bz = muk = −µ u = −µ . muk dt dt 2 ∂z k dt (H.94) (H.95) in quanto dB ∂ B ∂ Bz = + (u · ∇) B = uk . (H.96) dt ∂t ∂z Poiché l’energia cinetica totale della carica non può cambiare in un campo magnetico statico perché il lavoro della forza magnetica è sempre nullo: d 1 2 d 1 2 =0 (H.97) mu + mu dt 2 k dt 2 ⊥ 78 H Lo stato di plasma, equazioni cinetiche ed equazioni macroscopiche dovrà essere: d dt 1 2 mu 2 ⊥ =µ dB dt (H.98) e per la definizione di momento magnetico (H.93): d dB (µB) = µ dt dt (H.99) ossia: dµ =0 (H.100) dt che stabilisce che il momento magnetico del moto di girazione si conserva nel moto del centro di guida. Quantità, come il momento magnetico della girazione, che sono costanti per variazioni lente dei parametri del problema sono detti invarianti adiabatici. Pertanto quando la carica si muova in una regione di induzione magnetica crescente, parimenti per la (H.93) deve crescere la sua energia cinetica nel moto trasverso, evidentemente a spese della sua energia cinetica nel moto longitudinale. Se l’induzione magnetica diventa sufficientemente grande da trasferire tutta l’energia cinetica longitudinale in trasversa, la carica non può procedere oltre quel punto, in quanto la sua velocità longitudinale si è annullata. La sola possibilità è quindi che la particella venga riflessa, e quindi il punto ove ciò avviene diventa uno specchio (mirror) magnetico. Il punto di specchio dipende dall’angolo di iniezione α della carica nel campo lontano dal punto di compressione, laddove il campo è solo lungo z, e dal fattore di compressione. Ad esempio se la carica ha soltanto velocità longitudinale, α = 0, il suo momento magnetico sarà nullo e non potrà mai essere riflessa. Invece, in generale con: uk0 = u0 cos α u⊥0 = u0 sin α (H.101) la costanza del momento magnetico prescrive che la riflessione avviene dove la velocità è divenuta tutta trasversa: u2⊥0 u2 = 0 B0 Bm (H.102) avendo indicato con Bm il valore del campo magnetico a cui avviene la riflessione. Ciò fissa il valore dell’angolo di iniezione minimo al di sotto del quale non è possibile la riflessione magnetica delle cariche per un dato rapporto di intensificazione del campo B0 /Bmax : u2⊥0 B0 ; (H.103) = sin2 αmin = Bmax u20 tale angolo minimo definisce un cono detto cono di perdita, in quanto tutte le particelle che entrano con tale angolo di iniezione non sono riflesse, ma possono attraversare la compressione del campo. H.5 Bottiglie magnetiche cosmiche, le fasce di Van Allen 79 H.5 Bottiglie magnetiche cosmiche, le fasce di Van Allen Con riferimento al precedente paragrafo, si consideri un campo magnetico a simmetria assiale in cui siano presenti due compressioni, per semplicità aventi lo stesso rapporto di intensificazione. Cariche, che vengano iniettate nelle regioni di campo meno intenso tra le compressioni e che abbiano angoli di iniezione al di fuori del cono di perdita, risultano intrappolate tra due punti di specchio e si muovono avanti indietro tra di essi. In laboratorio una simile configurazione è chiamata bottiglia magnetica e viene usata per confinare particelle in una data regione di spazio con forze magnetiche. In Fig. H.5 è rappresentata una configurazione magnetica non a simmetria assiale, ma di tipo dipolare. Le linee di flusso si addensano verso i poli magnetici e quindi possiamo pensare alle regioni polari come a due punti di specchio che danno origine ad una bottiglia magnetica ricurva. Pertanto le cariche iniettate in questo campo, al di fuori del cono di perdita, sono intrappolate tra le due regioni polari e si muovono avanti e indietro lungo le linee di flusso magnetico. Naturalmente in questo caso sono presenti effetti di deriva di curvatura e di gradiente, che tuttavia agiscono ambedue nella direzione azimutale. Il centro di guida pertanto, oltre a rimbalzare tra i punti di specchio, si muove anche azimutalmente intorno all’asse del dipolo. Cariche di segno opposto hanno moti azimutali contrari e danno quindi origine ad una corrente di deriva intorno al dipolo. Questa configurazione è all’origine delle cosiddette fasce di Van Allen, scoperte intorno alla Terra nel 1958 dalle prime sonde spaziali Explorer e Sputnik, e costituenti la magnetosfera chiusa del nostro pianeta. Nelle fasce si trovano elettroni con energie tra 40 keV e 1 MeV e protoni con energie tra 100 keV e 1 BeV, che hanno punti di specchio a latitudini intorno ai 70◦ e si estendono tra 1.5 e 5 volte il raggio terrestre; le particelle di più bassa energia sono intrappolate nelle regioni più esterne, quelle di alta energia arrivano al bordo superiore della ionosfera, intorno a qualche centinaio di km. I flussi di particelle variano tra 104 e 107 particelle cm−2 s−1 . Fig. H.5 (a) Configurazione a bottiglia magnetica; (b) Fascia di particelle cariche intrappolate in un campo magnetico dipolare 80 H Lo stato di plasma, equazioni cinetiche ed equazioni macroscopiche Le fasce sono formate dalla cattura di particelle cariche del vento solare che penetrano nella magnetosfera, ma anche da cariche energetiche evaporate dalla ionosfera terrestre; intense fasce di elettroni sono state osservate formarsi a seguito delle esplosioni nucleari in atmosfera. Le fasce variano irregolarmente in relazione all’attività solare; le particelle delle fasce si scaricano nei punti di specchio delle regioni polari per interazioni con le particelle dell’atmosfera terrestre, e sono responsabili dell’attività geomagnetica e delle aurore. I moti di deriva generano la cosiddetta corrente ad anello che scorre lungo le fasce in direzione azimutale. Bibliografia 1. J.D. Jackson – Classical Electrodynamics, Third Edition, John Wiley & Sons Inc., 1998 Appendice I Onde nei plasmi I plasmi sono sistemi collettivi a molti gradi di libertà in cui perturbazioni delle varie componenti materiali o dei campi elettrici e magnetici possono propagarsi e trasferire energia e, qualora siano instabili, portare alla perturbazione, ed eventualmente alla distruzione delle configurazioni. Lo studio delle onde è basato sulla ricerca delle relative relazioni di dispersione. Rispetto ai gas neutri i plasmi hanno più componenti fisiche che possono oscillare, per cui la varietà di onde è molto ricca. Nel seguito si ricavano le relazioni di dispersioni di alcuni tipi di onde di importanza in condizioni astrofisiche. I.1 Onde magnetoidrodinamiche Per semplicità si consideri il caso di un plasma incompressibile; le equazioni MHD ideali con ρ = costante sono: ρ ∇·V = 0 1 ∂ + V · ∇ V = −∇p + J × B ∂t c ∂B = ∇ × (V × B) = (B · ∇) V − (V · ∇) B ∂t 4π ∇×B = J. c Combinando la seconda e quarta equazione, si ottiene: 1 ∂ + V · ∇ V = −∇p − B× (∇ × B) = ρ ∂t 4π B2 1 = −∇ p + + (B · ∇) B . 8π 4π (I.1) (I.2) (I.3) (I.4) (I.5) 81 82 I Onde nei plasmi Si definisca uno stato di equilibrio iniziale in assenza di moto (V0 = 0) e con p0 , ρ0 , B0 spazialmente uniformi; si perturbi tale stato nel limite lineare: V = 0 + V0 , p = p0 + p0 , B = B0 + B0 , (I.6) ove le perturbazioni sono infinitesime del prim’ordine. Sostituendo nelle equazioni magnetoidroninamiche (MHD) ideali e linearizzando rispetto all’equilibrio, si ottiene: ∂ V0 B0 ·B0 1 0 ρ = −∇ p + + (B0 · ∇) B0 . (I.7) ∂t 4π 4π Applicando la divergenza ad ambo i membri: B0 ·B0 2 0 ∇ p+ =0. 4π (I.8) Tale relazione armonica implica che il termine in parentesi dev’essere nullo ovunque poiché lo è al di fuori della regione perturbata. Pertanto: ρ ∂ V0 1 = (B0 · ∇) B0 . ∂t 4π (I.9) Operando analogamente sull’equazione per B0 , si ottiene: ρ 1 ∂ B0 = (B0 · ∇) V0 . ∂t 4π (I.10) Quindi B0 e V0 debbono essere paralleli. Inoltre le due equazioni si combinano a dare: ∂ 2 V0 1 = (B0 · ∇)2 V0 ∂t 2 4π ∂ 2 B0 1 ρ 2 = (B0 · ∇)2 B0 . ∂t 4π ρ (I.11) (I.12) Scegliendo B0 = B0 ẑ: B2 ∂ 2 V0 = 0 2 ∂t 4πρ 2 0 B20 ∂ B = ∂t 2 4πρ ∂ 2 V0 , ∂ z2 (I.13) ∂ 2 B0 . ∂ z2 (I.14) Il plasma propaga dunque oscillazioni di velocità e campo magnetico tra loro parallele e trasversali a B0 . Tali onde sono dette onde di Alfvèn e posseggono velocità di fase: B0 VA = √ . 4πρ (I.15) I.2 Onde elettromagnetiche (E0 = B0 = 0) 83 Si usa spesso l’analogia di queste onde di plasma con le onde trasverse nelle corde vibranti, considerando come tali le linee di flusso del campo magnetico. Si tratta di onde diverse da quelle idrodinamiche, appunto perché si propagano anche in un mezzo incompressibile. Si ottiene la relazione di dispersione delle onde di Alfvén assumendo, per V0 , B0 l’andamento di onda piana, ad esempio del tipo ∝ exp[i(ωt − kz)], per cui ∂ /∂t → iω, ∂ /∂ z → −ik: ω 2 = VA2 k2 . (I.16) Si tratta di onde non dispersive. Nei plasmi astrofisici in molte situazioni risulta importante la compressibilità. Ripetendo i calcoli per il caso di un mezzo compressibile con p ∝ ρ γ si ottengono le onde magnetoidrodinamiche, che comprendono le onde MHD veloci e lente e le onde intermedie, rispettivamente con relazioni di dispersione: ω2 ' Vs2 +VA2 k2 2 2 Vs vA ω2 ' cos2 θ 2 k Vs2 +VA2 ω2 = VA2 cos2 θ k2 (I.17) (I.18) (I.19) p dove Vs = γ p0 /ρ0 è la velocità del suono, θ è l’angolo di propagazione rispetto alla direzione di B0 . Le onde intermedie sono onde di Alfvén che si propagano anche obliquamente alla direzione del campo magnetico. Le onde veloci e lente sono anche dette onde magnetoacustiche o onde di Alfvén compressionali. Nel caso di un plasma freddo (Vs → 0) le onde lente scompaiono e le onde intermedie sono dette onde di Alfvén di shear. I.2 Onde elettromagnetiche (E0 = B0 = 0) Si consideri ora lo stato di equilibrio di un plasma omogeneo, freddo (p = 0), neutro (n+ = n− , Q = 0) e a riposo (V0 = 0). Perturbando e linearizzando le equazioni di Maxwell del sistema di equazioni per plasmi freddi si ottiene: ∇2 E − ∇ (∇ · E) = 1 ∂ 2 E 4π ∂ J + 2 , c2 ∂t 2 c ∂t (I.20) dove E, J sono le perturbazioni (precedentemente indicate con apici). Utilizzando la legge di Ohm generalizzata e linearizzata: m+ m− ∂ J = E, ρe2 ∂t (I.21) 84 I Onde nei plasmi si ricava: ∇2 E − ∇(∇ · E) = 1 ∂ 2E 4πρe2 + E. c2 ∂t 2 m+ m− c2 (I.22) Analizzando in onde piane: E = E0 e−i(ωt+k·r) , ∇ ≡ −ik , (I.23) si ottiene la relazione algebrica: 2 −k E + k(k · E) = 2 ω 2 ω pe − 2 + 2 c c ! E (I.24) con 4πρe2 4πne2 ' , m+ m− m− c 2 già definita precedentemente come frequenza di plasma elettronica. 2 ω pe = (I.25) I.2.1 Propagazione k k E Si ottiene la relazione di dispersione per onde longitudinali: 2 ω 2 = ω pe , (I.26) che risultano non dispersive ed elettrostatiche: −k × E = ω B=0. c (I.27) Sono spesso chiamate onde di Langmuir; fisicamente si tratta non di onde, ma di oscillazioni di carica longitudinali con δ Q ' kE, ω pe ' 10vth /λD . La velocità di fase è ω pe /k, mentre la velocità di gruppo è nulla: le oscillazioni non propagano energia, almeno nella approssimazione di temperatura del plasma nulla. I.2.2 Propagazione k ⊥ E La relazione di dispersione per onde trasversali risulta: 2 ω 2 = ω pe + c2 k2 ; (I.28) si tratta di onde elettromagnetiche piane: −k × E = ω B 6= 0, k ⊥ B . c (I.29) Bibliografia 85 Le onde sono dispersive con indice di rifrazione: n2 = 2 2 ω 2 − ω pe ω pe c2 k 2 = = 1 − , ω2 ω2 ω2 (I.30) c c >c =q n 2 /ω 2 1 − ω pe (I.31) k dω = c2 = cn < c. dk ω (I.32) con velocità di fase: vf = e con velocità di gruppo: vg = È interessante il caso in cui un’onda elettromagnetica si propaghi in un plasma ove la densità elettronica cresce: la propagazione si arresterà quando ω = ω pe (punto di taglio o cut-off) e subirà una riflessione totale perché per k → 0 l’indice di rifrazione si annulla e lo smorzamento è nullo. Assorbimento totale si ha invece nel caso in cui si incontrino punti ove l’indice di rifrazione diverge e k → ∞ (punti di risonanza). I plasmi sono molto ricchi di modi propri di oscillazione, stabili e instabili. Per una completa analisi del problema si può fare riferimento, ad esempio, ai testi di Boyd & Sanderson [1], Stix [2], Clemmow & Dougherty [3]. Bibliografia 1. T.J. Boyd & J.J. Sanderson – The Physics of Plasmas, Cambridge University Press, 2003 2. T.H. Stix – Waves in Plasmas - Springer-Verlag, 1992 3. P.C. Clemmow & J.P. Dougherty – Electrodynamics of particles and plasmas, AddisonWesley Pub. Co., 1990 Appendice J Teoria dell’irraggiamento J.1 Frenamento di particelle cariche nella materia Particelle cariche che attraversano la materia perdono energia in collisioni coulombiane non-radiative in cui eccitano o ionizzano gli atomi, oppure in collisioni radiative in cui compiono transizioni tra differenti stati energetici emettendo fotoni. Nel caso di elettroni sono anche possibili perdite di ricombinazione quando essi passano dallo stato libero ad uno stato legato con emissione di un fotone. Quando si sia in presenza di un plasma ionizzato le particelle cariche possono anche perdere energia polarizzando il mezzo per eccitazione di onde di plasma o per effetto Čerenkov. J.2 Perdite per ionizzazione Le perdite per ionizzazione per unità di lunghezza di una carica Ze e massa M nell’attraversare con velocità v un mezzo neutro di densità elettronica ne = Z Nat sono date dalla formula relativistica di Bethe-Bloch-Fermi: 2 4πz2 e4 ZNat 2γ me v2 v 2 dE = ln − + f (J.1) − dx i me v2 I c dove I è il potenziale di ionizzazione degli atomi della materia attraversata mediato sui vari livelli energetici e f è un fattore di densità che riduce le perdite alle alte energie in mezzi densi [1]. La dipendenza logaritmica proviene dall’integrazione sui parametri d’urto degli elettroni con cui la particella interagisce nel suo cammino. Si calcola che l’energia massima trasferibile nell’urto dalla carica sull’elettrone è: Emax = 2γ 2 M 2 me v2 . 2 M + m2e + 2γMme (J.2) 87 88 J Teoria dell’irraggiamento In Fig. J.1 è rappresentato, per diverse particelle e diversi materiali, il cosiddetto stopping power 1/z2 dE/dξ = 1/ρz2 (dE/dx), definito come la perdita di energia per unità di massa attraversata ξ = ρx [2]. Nel caso di un mezzo altamente Fig. J.1 Perdite di energia per ionizzazione di elettroni e protoni in vari materiali in regime classico e relativistico. L’inserto illustra le perdite in aria in funzione della quantità di moto ionizzato, le perdite collisionali sono dovute alla creazione di onde di plasma e il potenziale di ionizzazione viene sostituito dall’energia dell’onda prodotta, tipicamente onda di plasma elettronica s 4πe2 ne I −→ hν pe = h . (J.3) me Per gli elettroni le perdite dipendono anche dal fatto conto che essi subiscono maggiori deviazioni dei protoni e dei nuclei. La formula completa per le perdite di ionizzazione degli elettroni ultrarelativistici è tuttavia simile a quella degli ioni pesanti [3]: dE 4πe4 ZN γ 2 me v2 Emax − = ln − dx i me v2 2I 2 # 2 1 1 1 1 2 − − ln 2 + 2 + 1− γ γ2 γ 8 γ (J.4) J.3 Calcolo con i potenziali ritardati di Liénard-Wiechert 89 dove Emax è la massima energia trasferibile dall’elettrone incidente ad un elettrone fermo: γ 2 me v 2 Emax = (J.5) γ +1 che corrisponde al trasferimento completo della sua energia cinetica (sia nel caso relativistico sia non-relativistico). Va notato che nel regime non-relativistico gli elettroni subiscono perdite minori degli ioni a parità di energia, perchè si muovono con velocità maggiori. Anche per gli elettroni le perdite in un mezzo completamente ionizzato comportano la creazione di onde di plasma (plasmoni), e la formula suddetta è applicabile con I −→ hν pe . Un’espressione generale per le perdite istantanee di ionizzazione degli elettroni nei limiti classico e relativistico è stata ricavata da Gould [4]: 4πe4 ZN dE = B (J.6) − dt i me v ove √ B = log Ekin / 2I + 1/2 − v2 /2c2 mezzo non ionizzato, caso non-relativistico √ log Ekin / 2hν pe + 1/2 mezzo ionizzato, caso non-relativistico √ 3/2 2 mezzo non ionizzato, caso ultrarelativistico log γ me c / 2I + 1/16 √ log γ 1/2 me c2 / 2hν pe + 9/16 mezzo ionizzato, caso ultrarelativistico J.3 Calcolo con i potenziali ritardati di Liénard-Wiechert Il calcolo dell’irraggiamento può essere presentato in modo formalmente più completo utilizzando la teoria dei potenziali ritardati [1]. Si consideri una carica che si muova lungo la traiettoria ` e si calcoli il campo elettromagnetico che essa genera per un generico osservatore P di coordinata r(t) al tempo t (Fig. J.2). L’effetto della carica sull’osservatore risulta ritardato in quanto il campo si propaga a velocità finita c. Le espressioni per i potenziali vettore e scalare del campo elettromagnetico per l’osservatore a r(t) vanno pertanto calcolati considerando la posizione della carica a un tempo precedente rispetto al tempo dell’osservatore, detto tempo ritardato t 0 = t − r − r00 /c = t − R(t 0 )/c corrispondente al punto r00 (t 0 ). Dalle equazioni di Maxwell si ricava che i potenziali sono legati alle densità di corrente J e di carica ρ dalle seguenti espressioni formali: J(r0 ,t 0 ) 3 0 d r R(t 0 ) Z ρ(r0 ,t 0 ) 3 0 φ (r,t) = d r. R(t 0 ) A(r,t) = 1 c Z (J.7) (J.8) 90 J Teoria dell’irraggiamento Fig. J.2 Schema del calcolo dei potenziali ritardati di Liénard-Wiechert Per una singola carica in moto si può porre: J(r,t) = qv δ r − r0 (t) ρ(r,t) = q δ r − r0 (t) (J.9) (J.10) da cui si ricava: 1 qv A(r,t) = cR (1 − v · n/c) ret 1 q φ (r,t) = R (1 − v · n/c) ret (J.11) (J.12) avendo indicato con n il versore dalla carica al punto di osservazione. Si ottengono quindi i campi elettromagnetici, che, usando la definizione g = 1 − v · n/c: " # (n − v/c) 1 − v2 /c2 E(r,t) = q g3 R2 ret q n d(v/c) + × (n − v/c) × (J.13) c g3 R dt ret B(r,t) = [n × E]ret . Il primo termine corrisponde al campo statico coulombiano, cui si riduce per v c; il secondo termine dipende dall’accelerazione ed è il tipico campo di radiazione. Lontano dalla carica accelerata, R → ∞, prevale sempre il campo di radiazione. Calcolando ora il flusso di Poynting: S= c E×B 4π (J.14) a grandi distanze dalla carica, cioè nella regione radiativa, si ricava l’espressione per il flusso di energia irraggiata (energia irraggiata per unità di area e unità di tempo): 2 c rad q2 n d(v/c) 2 S= × (n − v/c) × . E (r,t) = 4π 4πc g3 R dt ret (J.15) J.3 Calcolo con i potenziali ritardati di Liénard-Wiechert 91 Si distinguono per semplicità i due casi per v c e v → c. J.3.0.1 Caso non-relativistico, v c A grandi distanze dalla carica: i q hn {n × × v̇} c2 R ret B(r,t) = [n × E]ret E(r,t) = (J.16) e gli effetti di ritardo possono essere trascurati. Si ha pertanto: E =B= qv̇ sin θ c2 R (J.17) e il vettore flusso di Poynting risulta: S= q2 v̇2 sin2 θ c E×B = n. 4π 4πc3 R2 (J.18) L’energia emessa per unità di tempo entro l’angolo solido dΩ intorno alla direzione n si ottiene considerando il flusso attraverso l’area dA = R2 dΩ : − dE dA q2 v̇2 sin2 θ =S = dΩ dt dΩ 4πc3 (J.19) e la potenza integrando quindi sull’intero angolo solido: P= dE 2 q2 v̇2 = dt 3 c3 (J.20) che è appunto ancora la formula di Larmor. Come già citato, poiché v̇2 = (F/m)2 , a parità di forza agente l’irraggiamento è maggiore per le cariche di massa minore. J.3.0.2 Caso relativistico, v → c Nell’ipotesi di piccole accelerazioni (trascurando cioè la reazione di radiazione) e riferendosi al riferimento a riposo della particella, il tetravettore accelerazione della particella è nel sistema di laboratorio: h v·a i ∂ (γv) ∂ γ 2 4 v·a , = γ 2a + γ v, γ (J.21) (ai )lab ≡ γ ∂t ∂t c2 c2 con a = r̈, v = ṙ, mentre il tetravettore nel sistema proprio è: (ai )rest = [a0 , 0] (J.22) 92 J Teoria dell’irraggiamento con a0 = (r̈)0 . Eguagliando i moduli quadrati delle tetra-accelerazioni nei due riferimenti, che rappresentano un invariante, si ottiene con un po’ di algebra [4]: 2 2 4 2 2 v·a (J.23) a0 = γ a + γ c e quindi, applicando la formula di Larmor valida nel sistema proprio: dE dE 0 2q2 |a0 |2 − = − 0 = dt lab dt rest 3c3 2 2q2 γ 4 2 2 v·a = a + γ 3c3 c 2 4 2 2q γ |a⊥ |2 + γ 2 ak = 3 3c (J.24) (J.25) dove a, v, v/c, d(v/c)/dt, γ sono calcolati nel laboratorio. Alternativamente si può usare la formula relativistica covariante, usando il tetravettore velocità ui : dE 2q2 dui 2 − = dt lab 3c ds 2 dui d xi d vi = γ = 2 ds ds ds c du γ dp du0 γ dε = , = , ds mc dt ds mc2 dt (J.26) ε= pc2 v che comporta: " # dE v d(v/c) 2 2q2 γ 6 v̇2 . − − × = dt lab 3c3 c2 c dt (J.27) Quando si abbia a che fare con particelle la cui accelerazione deriva da campi elettromagnetici esterni: i dE 2q4 γ 2 h |E + β × B|2 − |β · E|2 . (J.28) − = 2 3 dt lab 3m c J.3.1 Distribuzione angolare Recentemente sono stati osservati vari oggetti astrofisici in cui è importante la collimazione della radiazione emessa. Questo effetto è facilmente spiegabile per particelle relativistiche che danno origine a distribuzioni della radiazione fortemente asimmetriche. J.3 Calcolo con i potenziali ritardati di Liénard-Wiechert 93 Nel sistema proprio della particella si consideri la radiazione dE 0 emessa istantaneamente entro l’angolo solido dΩ 0 = sin θ 0 dθ 0 dϕ 0 nella direzione che forma un angolo θ 0 con l’asse x0 . Si porrà nel seguito µ 0 = cos θ 0 per cui dΩ 0 = dµ 0 dϕ 0 . Corrispondentemente indicheremo con dE l’energia emessa istantaneamente entro l’angolo solido dΩ = dµdϕ nel sistema dell’osservatore. Dalle trasformazioni relativistiche degli angoli, si ottiene µ= µ0 + β 1 + β µ0 (J.29) e conseguentemente dµ = dΩ = dµ 0 γ 2 (1 + β µ 0 )2 dΩ 0 γ 2 (1 + β µ 0 )2 (J.30) . Inoltre la trasformazione del tensore energia-momento fornisce: dE = γ dE 0 + vd p0x = γ 1 + β µ 0 dE 0 . (J.31) Pertanto: 3 dE 0 dE = γ3 1 + β µ0 (J.32) dΩ dΩ 0 e per ottenere la potenza irraggiata occorre dividere dE e dE 0 per gli intervalli di tempo dt e dt 0 rispettivamente; questi due tempi sono legati dalla relazione dt = γ (1 − β µ) dt 0 , dove per dt si è scelto l’intervallo di tempo durante il quale la radiazione è ricevuta dall’osservatore nel sistema di laboratorio. La potenza ricevuta per unità di angolo solido misurata nel riferimento dell’osservatore è ancora calcolata in base al vettore di Poynting: dE c 2 2 q2 n d(v/c) 2 − = Eret R = × (n − v/c) × dtdΩ lab 4π 4πc g3 dt ret (J.33) mentre quella emessa va moltiplicata per dt/dt 0 = g. Nel caso relativistico con v/c → 1, si può scrivere: g = 1 − β cos θ ≈ 1 − v v θ2 + c c 2 (J.34) e quindi l’irraggiamento è fortemente piccato (∝ µ 5 ) sugli angoli tali che g → 0, e cioè θ 2 ∼ 2 (1 − v/c) /(v/c) ∼ 1/γ 2 : l’irraggiamento è cioè fortemente concentrato intorno alla direzione di propagazione istantanea. Inoltre a parità di accelerazione la radiazione è maggiore di un fattore γ 2 se l’accelerazione è trasversa: P⊥ = γ 2 Pk . (J.35) 94 J Teoria dell’irraggiamento Si può quindi in prima approssimazione calcolare l’irraggiamento considerando il moto della carica come circolare con raggio di curvatura rc = c2 /v̇. In Fig. J.3 sono dati i diagrammi di irraggiamento per il caso di accelerazione trasversa e longitudinale. Fig. J.3 Diagramma di radiazione per particelle accelerate longitudinalmente e trasversalmente alla velocità (lungo l’asse x). (a) Radiazione di dipolo da una particella non relativistica con velocità e acclerazione parallele. (b) Distribuzione angolare della radiazione emessa da una particella relativistica con velocità e accelerazione parallele. (c) Radiazione di dipolo da una particella non relativistica con velocità e acclerazione peprpendicolari. (d) Distribuzione angolare della radiazione emessa da una particella relativistica con velocità e accelerazione perpendicolari J.3 Calcolo con i potenziali ritardati di Liénard-Wiechert 95 J.3.2 Distribuzione spettrale Tenendo conto che l’irraggiamento è soprattutto legato all’accelerazione trasversa e considerando quindi il moto della carica come circolare con raggio di curvatura rc = c2 /v̇. Come mostrato in Fig. J.4, il segnale giunge all’osservatore solo per il tratto di traiettoria da 1 a 2 tale che θ ∼ 1/γ, per cui la durata dell’impulso è v θ 1− Ωc c Ω eB gir Ωc = = γmc γ 1 1 ∆t ∼ 3 ∼ 2 2γ Ωc 2γ Ωgir ta − tB = ∆t = (J.36) e quindi la frequenza tipica emessa sarà: νc ∼ γ 2 Ωgir . (J.37) Per un calcolo formale si applica l’analisi spettrale alla radiazione totale emessa da una carica: Z Z +∞ 2q2 +∞ dE |a(t)|2 dt (J.38) dt = 3 3c −∞ −∞ dt dove q2 n d(v/c) 2 |a(t)| ≡ × (n − v/c) × 4πc g3 dt ret 2 (J.39) con +∞ 1 a(t) = √ a(ω)e−iωt dω 2π −∞ Z +∞ 1 a(ω) = √ a(t)eiωt dt . 2π −∞ Z (J.40) (J.41) Il teorema di Parseval impone: Z +∞ |a(t)|2 dt = −∞ Z +∞ |a(ω)|2 dω . (J.42) −∞ Pertanto l’energia totale emessa è: Z +∞ dE −∞ dt dt = 4q2 3c3 Z +∞ |a(ω)|2 dω = 0 da cui : I (ω) = Z +∞ I(ω)dω (J.43) 0 4q2 |a (ω)|2 . 3c3 (J.44) 96 J Teoria dell’irraggiamento Fig. J.4 Coni di emissione lungo una traiettoria curva; solo per il tratto ∆ θ ∼ 1/γ l’osservatore riceve il segnale Bibliografia 1. 2. 3. 4. J.D. Jackson – Classical Electrodynamics, Third Edition, John Wiley & Sons Inc., 1998 A.M. Hillas – Cosmic Rays, Pergamon Press, 1972 M.S. Longair –High-Energy Astrophysics, Cambridge University Press, 1991 G.B. Rybicki, A.P. Lightman – Radiative Processes in Astrophysics, Wiley Interscience Publication, 1979 Appendice K Accelerazione dei raggi cosmici K.1 Accelerazione dei raggi cosmici I voli di palloni di Hess del 1912 mostrarono che la Terra è esposta a radiazioni ionizzanti provenienti dal di fuori dell’atmosfera, e quindi di origine extraterrestre. Quelli che furono chiamati raggi cosmici non sono in effetti raggi, bensı̀ particelle cariche di alta energia, principalmente elettroni, protoni e nuclei leggeri. Lo spettro del flusso dei raggi cosmici in funzione dell’energia si estende dai 103 ai 1021 eV; tra i 109 e i 1018 eV lo spettro segue una regolare legge di potenza (Fig. K.1): N(E)dE ∝ E −2.66 dE . (K.1) L’origine dei raggi cosmici è un problema ancora non risolto, sebbene oggi vi sia un consenso generale che esistano due componenti, una di origine galattica con particelle di energia fino a circa 1019 eV ed un’altra di origine extragalattica che raggiunge i 1021 eV. Un’indicazione che raggi cosmici siano prodotti anche in altre galassie è data dall’osservazione di radiazione sincrotrone, specialmente nelle radiogalassie estese, in cui elettroni relativistici debbono essere efficientemente prodotti in modo continuo sull’intera vita della sorgente. Nei nuclei delle galassie attive, quasars, blazars, ecc., la radiazione X e gamma richiedono inoltre la produzione di ioni di alta energia. Parte di queste particelle possono sfuggire dagli oggetti e riempire lo spazio intergalattico. La presenza diffusa di particelle di alta energia appare indicare che meccanismi di accelerazione debbono essere comuni e di tipo universale in molte sorgenti astrofisiche. Un utile testo di riferimento per l’approfondimento del problema astrofisico è stato pubblicato da Longair [1]. Fermi considerò, sulla base dei dati osservativi sul mezzo interstellare, che questo fosse composto di nuvole magnetizzate che si muovono in modo caotico, connesse tra loro da un campo magnetico medio diffuso e di bassa induzione. Particelle elettricamente cariche, elettroni e ioni, seguono traiettorie composte da moti di girazione e derive del centro di guida; in particolare possono essere intrappolate nel campo debole tra due nuvole magnetizzate, dove invece il campo medio è più intenso. Tuttavia le particelle possono essere diffuse non appena acquistano energia; quindi lo 97 98 K Accelerazione dei raggi cosmici Fig. K.1 Spettro dei raggi cosmici primari; sono anche indicate le massime energie raggiungibili con esperimenti di laboratorio schema generale dell’interazione sarà quello di una distribuzione isotropa di particelle che subiscono riflessioni a specchio con una distribuzione isotropa di nuvole magnetizzate. Precisamente nelle riflessioni va tenuta presente la presenza della velocità propria U della nuvola, che può essere concorde o discorde con la velocità u della carica di massa m lungo il campo. K.1 Accelerazione dei raggi cosmici 99 Poichè le energie dei raggi cosmici sono molto elevate è necessario sviluppare il calcolo nel limite relativistico. Consideriamo dunque una singola collisione tra una particella di energia E e momento p e una nuvola che si muove con velocità U, nell’ipotesi che la nuvola magnetizzata abbia massa infinita, per cui il sistema della nuvola coincide con il riferimento del centro di massa (Fig. K.2). Fig. K.2 (a) Collisione tra una particella di massa m e una nuvola di massa M m. (b) Illustrazione schematica del diverso numero di nuvole incontrate di opposta e concorde velocità (da Longair [1]) L’energia della particella in tale riferimento e la componente del suo momento parallela alla direzione della velocità U della nuvola saranno pertanto: E 0 = γ (E +U p cos θ ) UE p0x = p0 cos θ = γ p cos θ + 2 c (K.2) (K.3) −1/2 con γ = 1 −U 2 /c2 e θ angolo tra le direzioni di p dopo la riflessione ed 0 0 U. Nella collisione l’energia nel centro di massa si conserva Edopo = E prima , men0 0 tre il suo momento è invertito px,dopo = −px,prima , per cui trasformando al sistema dell’osservatore si ottiene: " 2 # 2Uu cos θ U E 00 = γ E 0 +U p0x = γ 2 E 1 + + (K.4) c2 c e quindi la variazione di energia calcolata fino a termini O U 2 /c2 è: " 2 # ∆E E 00 − E 2Uu cos θ U = = γ2 +2 . E E c2 c (K.5) 100 K Accelerazione dei raggi cosmici Il primo termine in parentesi è quello di ordine superiore perchè u U, ma naturalmente va considerato l’effetto dell’angolo di incidenza θ . Per θ = 0 (collisione head-on) si ha un guadagno di energia, per θ = π (collisione overtaking) una perdita. Dobbiamo ora eseguire una media sui possibili angoli θ di collisione assumendo che le velocità delle nuvole siano distribuite in modo casuale. D’altra parte va tenuto presente che per effetto geometrico esiste una maggior probabilità di collisioni con nuvole che si muovono contro le particelle rispetto a quella con nuvole che fuggono di fronte alle particelle. Precisamente per una particella con u ≈ c la probabilità di collisione ad angolo θ è ∝ γ [1 + (U/c) cos θ ], mentre la probabilità che l’angolo di collisione sia θ è ∝ sin θ dθ . Eseguendo quindi la media della (K.5) sugli angoli tra 0 e π: R +1 2U 2 U 2 2U cos θ −1 x [1 + (U/c) x] dx = = . (K.6) R +1 c c 3 c −1 [1 + (U/c) x] dx Pertanto il guadagno medio di energia per collisione (dopo un numero statisticamente significativo di collisioni e con u ≈ c) è: ∆E E = 2 3 U c 2 (K.7) che illustra il famoso risultato di Fermi che l’aumento medio di energia è del second’ordine rispetto a (U/c). Passiamo ora ad una valutazione della variazione media temporale dell’energia. Per questo occorre definire la distanza media tra le nuvole magnetizzate L e quindi L/ (u cos φ ) diventa il tempo medio fra collisioni dove φ è l’angolo di incidenza rispetto al campo magnetico. Anche in tal caso occorre mediare rispetto all’angolo φ per cui il tempo medio diventa L/2u ≈ L/2c. Pertanto il tasso di crescita dell’energia risulta: dE 4c = dt 3L U c 2 E = αE . (K.8) Ricaviamo ora lo spettro tipico che si ottiene attraverso il processo di accelerazione di Fermi. Si può ricavare in modo euristico l’equazione evolutiva dello spettro di particelle. Si supponga che al tempo t le particelle nell’intervallo di energia tra E e E + ∆ E siano F(E)∆ E; sulla base della (K.8) al tempo t + ∆t saranno state rimpiazzate da quelle che avevano al tempo t energia tra E 0 e E 0 + ∆ E 0 dove: E 0 = E − αE∆t 0 E + ∆ E 0 = (E + ∆ E) − α (E + ∆ E) ∆t . (K.9) (K.10) Sviluppando in serie di Taylor per piccoli ∆ E si ottiene: ∆ E0 = ∆ E − d (αE) ∆ E∆t . dE Pertanto la variazione di F(E)∆ E nell’intervallo di tempo ∆t è: (K.11) K.1 Accelerazione dei raggi cosmici ∆ F(E)∆ E = F(E − αE∆t,t)∆ E 0 − F(E,t)∆ E 101 (K.12) e sviluppando ancora per piccoli αE∆t: ∆ F(E)∆ E = − d (αE) dF(E) αE∆ E∆t − F(E) ∆ E∆t dE dE (K.13) ossia: ∂ F(E,t) ∂ =− [αEF(E,t)] . (K.14) ∂t ∂E Se le particelle rimangono confinate nella regione delle nuvole (la Galassia nel caso specifico) per un tempo tipico τ dopo il quale vengono perdute perchè aumentando la loro energia possono sfuggire dai punti a specchio, occorre aggiungere un termine di perdita: ∂ F ∂F =− (αEF) − , ∂t ∂E τ la cui soluzione in condizioni stazionarie, ∂ F/∂t ≡ 0, è: F = costante × E −1/(ατ)−1 . (K.15) (K.16) Questa relazione mostra che il meccanismo statistico di riflessione da parte di nuvole magnetizzate nel mezzo interstellare può generare spettri di potenza; questo è il più significativo risultato del modello proposto da Fermi. Vanno menzionati tuttavia alcuni punti di incertezza, pur tenendo conto della semplicità del modello. 1. α e τ debbono essere indipendenti dall’energia per produrre una legge di potenza; soprattutto una costanza di τ sembra difficile da giustificare, anche se ciò può avere effetto solo sulla parte di alta energia dello spettro. 2. Per spiegare gli indici spettrali osservati occorre che ατ ∼ 1 in tutti i casi, richiesta non ovvia tenendo conto della varietà di situazioni e parametri fisici. Nel caso dei raggi cosmici nella Galassia è stato proposto che, essendo paragonabili le densità di energia nei raggi cosmici e nella dinamica delle nuvole (equipartizione), la velocità delle nuvole si aggiusti in modo da produrre ατ ∼ 1; d’altra parte i valori stimati osservativamente per le due quantità non sembrano soddisfare questa richiesta del modello. 3. Il processo di collisione dev’essere effettivamente molto soffice e lento per evitare che i nuclei dei raggi cosmici si frantumino. 4. Una difficoltà comune a tutti i processi di tipo stocastico è la loro intrinseca anisotropia. La collisione tra particella energetica e nuvola fornisce energia parallela al campo magnetico, per cui la riflessione risulta sempre più difficile man mano che procede l’accelerazione. Per mantenere il processo serve dunque un ulteriore processo che ridistribuisca l’energia isotropicamente, come ad esempio le collisioni con onde turbolente isotrope. 5. Il processo di accelerazione compete anche con le perdite energetiche che precedentemente son state trascurate. In effetti esiste un’energia di soglia al di sotto 102 K Accelerazione dei raggi cosmici della quale le particelle perdono radiativamente più rapidamente di quanto guadagnino. Pertanto non si può pensare che il meccanismo di Fermi sia sufficiente: può essere in grado di accelerare particelle che già abbiano superato l’energia di soglia, per cui è richiesto un meccanismo di pre-accelerazione (Fig. K.3). Fig. K.3 Confronto tra tassi di accelerazione e perdite nel meccanismo di Fermi Il processo di Fermi è comunque piuttosto lento, essendo il tipico guadagno di energia proporzionale a (U/c)2 con la velocità media delle nuvole del gas interstellare U ≈ 15 km s−1 molto piccola rispetto alla velocità della luce. Una possibilità per rendere il processo più efficiente è quella di costruire situazioni in cui tutte le collisioni siano head-on. Ciò puoò ad esempio avvenire nei fronti delle onde d’urto ove irregolarità magnetiche su ambedue i lati del fronte possano funzionare da centri di riflessione che intrappolono particelle. Le particelle possono muoversi avanti e indietro attraverso il fronte e ad ogni passaggio subiscono collisioni head-on. In tal caso si mostra che il tasso di accelerazione dE/dt diventa proporzionale alla prima potenza del rapporto U/c, e si parla quindi di processo di Fermi del prim’ordine, mentre quello stocastico precedente viene indicato come processo di Fermi del second’ordine. Bibliografia 1. M.S. Longair –High-Energy Astrophysics, Vol. I, Cambridge University Press, 1991 Appendice L Evoluzione dello spettro di corpo nero nell’espansione dell’Universo L’espressione della legge di Planck dell’intensità della radiazione di corpo nero in termini di lunghezza d’onda ha la forma: I(λ ) = 2hc2 1 . 5 hc/λ kT − 1 λ e (L.1) Si assuma la legge di espansione adiabatica della componente radiativa dell’Universo nel modello del big-bang, cui corrispondono le seguenti proporzionalità: T ∝ R−1 λ= c ∝R. ν (L.2) Pertanto: λ T = costante (L.3) cioè la forma dello spettro rimane sempre di tipo corpo nero. 103