A02 40 In copertina: Fotografia (in falsi colori) della luce emessa da un convertitore parametrico (Paul Kwiat e Michael Reck, Institute of quantum optics and quantum information, Vienna). Luciano Cianchi / Marco Lantieri / Paolo Moretti Determinismo, realismo e località in fisica classica e quantistica Copyright © MMVII ARACNE editrice S.r.l. www.aracneeditrice.it [email protected] via Raffaele Garofalo, 133 A/B 00173 Roma (06) 93781065 ISBN 978–88–548–1243–7 I diritti di traduzione, di memorizzazione elettronica, di riproduzione e di adattamento anche parziale, con qualsiasi mezzo, sono riservati per tutti i Paesi. Non sono assolutamente consentite le fotocopie senza il permesso scritto dell’Editore. I edizione: luglio 2007 Ad Alessia, Lucia, Andrea e Giorgio … futuri benevoli lettori …we no longer find it unaccetable that physics, rather than being descriptive, should merely be predicitive of observations. And then the interpretational difficulties of quantum mechanics just simply vanish since the set of the quantum mechanical basic laws is in fact nothing else than a set of predictive rules, yelding the probabilites that, in such and such circumstances, we shall observe this or that… …non troveremo più inacettabile che la fisica, piuttosto che descrivere le osservazioni, le predica soltanto. Allora, le difficoltà d’interpretazione della meccanica quantistica semplicemente spariscono, poiché le sue leggi fondamentali non sono di fatto niente più che regole predittive, le quali dànno le probabilità che in certe circostanze si osservi questo o quello… Bernand d’Espagnat (2006) Indice Prefazione XIII 1. Determinismo e caos 1 1.1. Considerazioni generali 1 1.2. Equilibri instabili 3 1.3. Dipendenza sensibile dalle condizioni iniziali 4 1.4. Complessità del sistema 5 1.5. Caos, limiti del determinismo e realismo 7 2. Personaggi del mondo atomico 9 2.1. I costituenti dell’atomo 9 2.2. Quanti di luce: il fotone 10 3. Onde o particelle? 17 3.1. Onde di De Broglie 17 3.2. Esperimenti ideali di Feynman 18 3.3. Esperimenti reali 22 4. Principio d’indeterminazione 27 4.1. Il microscopio di Heisenberg 27 4.2. Dal microscopico al macroscopico 30 5. Digressione sulla fisica dell’atomo 37 5.1. Dimensioni atomiche 37 5.2. Spettri atomici 41 5.3. Struttura atomica e spin 42 5.4. Esperimento di Stern e Gerlach 49 6. Indeterminazione e complementarità 59 6.1. Esperimento delle due fenditure: qual è la traiettoria dell’elettrone? 59 6.2. Interferenza con luce diffusa da due atomi 61 6.3. Esperimento di Rochester 65 7. Teoria quantistica vs. teorie realistiche locali 73 7.1. Paradosso di Einstein–Podolski–Rosen 73 7.2. Il teorema di Bell 79 7.3. Una versione alternativa del teorema di Bell. L’esperimento di Aspect 82 8. Criptografia 87 8.1. Considerazioni generali 87 8.2. Il metodo Vernam 88 8.3. Sistemi a chiave pubblica 89 8.4. La criptografia quantistica di Bennet e Brassard 91 Appendice A: Richiami di fisica delle onde 97 A.1. Onde superficiali in un liquido 97 A.2. Interferenza 99 A.3. Diffrazione 101 A.4. Digressione sul potere risolutivo 102 A.5. La luce è un fenomeno ondulatorio 103 A.6. Polarizzazione della luce 105 Appendice B: Momento angolare 109 B.1. Momento angolare in fisica classica 109 B.2. Momento angolare in fisica quantistica 111 Appendice C: Filtro e analizzatore di spin 113 X Appendice D: Disuguaglianza di Clauser–Horne 117 Appendice E: Interferometro di Mach–Zender 119 Bibliografia 121 XI Prefazione Questo libro trae spunto da una serie di lezioni tenute nel 2005 e 2006 agli studenti delle ultime classi del Liceo Scientifico “Castelnuovo” di Firenze o, più precisamente, a quelli di loro che avevano manifestato l’intenzione di iscriversi, dopo il liceo, a facoltà scientifiche. Esso concerne la fisica atomica e la rivoluzione che la teoria quantistica produsse in alcuni fondamenti della fisica, quali determinismo, realismo e località. Nel presentare gli argomenti abbiamo adottato l’interpretazione canonica che, nell’ultima parte del secolo scorso, ha ricevuto una serie di conferme sperimentali. I paradossi di cui si sente parlare sono dovuti per lo più alla inadeguatezza del linguaggio formatosi nell’ambito dell’esperienza quotidiana, dove gli oggetti, anche quelli più piccoli con cui si ha a che fare, sono costituiti da una quantità innumerevole di atomi. Riguardo all’esposizione degli argomenti, abbiamo deciso di non entrare nel formalismo matematico della teoria, sia pure in modo marginale, e neanche di dare al testo un taglio troppo divulgativo. Nel primo caso, infatti, sarebbe un dialogo tra sordi, e nel secondo – ricorrendo a metafore per smussare gli spigoli ed evidenziare gli aspetti sensazionali – si rischierebbe di indurre nel lettore idee fuorvianti. Abbiamo, perciò, tentato una via di mezzo: quella di descrivere i fenomeni attraverso esperimenti ideali –– vale a dire con dispositivi idealizzati —, i quali in molti casi sono stati eseguiti realmente in seguito al progresso della tecnologia, che ha permesso di disporre di strumentazione adeguata. Gli esperimenti ideali si prestano bene ad illustrare, senza bisogno di affrontare argomenti troppo tecnici, ciò che succederebbe se l’esperimento potesse essere eseguito. In effetti, questa via non esclude del tutto il ricorso a qualche calcolo algebrico, ma in tal caso la matematica utilizzata può essere circoscritta all’ambito delle conoscenze di uno studente liceale. Il libro, tuttavia, non si rivolge esclusivamente a studenti di questo tipo, ma anche a insegnanti di materie scientifiche e di filosofia; più in generale, a un pubblico non specialistico ma dotato di istruzione universitaria. XIII Abbiamo trattato dapprima il determinismo della fisica classica, la sua crisi in relazione all’imprevedibilità pratica dei fenomeni caotici, e l’affermazione della concezione classica di realismo. Siamo, poi, entrati nel mondo atomico, descrivendone sommariamente i “personaggi” principali — fotoni, elettroni, protoni — e la loro natura duale onda-particella, ipotizzata da De Broglie. Inoltre, attraverso la descrizione di alcuni esperimenti ideali proposti da Feynman, abbiamo esposto l’interpretazione probabilistica delle onde di De Broglie e la conseguente capitolazione del realismo. Per la loro importanza, non solo didattica, abbiamo brevemente illustrato anche alcuni esperimenti reali sulla cosiddetta interferenza da due fenditure. A questo punto abbiamo trattato il principio di indeterminazione attraverso la discussione della misura di posizione per mezzo del microscopio di Heisenberg, e stabilendo la linea di confine tra fisica classica e quantistica. Di seguito, abbiamo inserito una digressione sulla fisica dell’atomo alla luce del principio d’indeterminazione e dei principi quantistici. Dopo di ciò, abbiamo enunciato il principio di complementarità, limitatamente ai due aspetti corpuscolare e ondulatorio, e posto il problema se tale complementarità fosse l’effetto dell’inevitabile perturbazione che l’osservazione produce sul sistema osservato, come sembra prescrivere il principio d’indeterminazione, oppure se essa costituisse un principio insito nella natura del mondo atomico. A questo proposito, abbiamo discusso alcuni esperimenti effettuati nei primi anni ’90, i quali mostrano che è vera la seconda ipotesi, e dalla cui interpretazione mediante la teoria quantistica emergerebbe, inoltre, una palese violazione del principio di località. Questi argomenti epistemologici sono stati, quindi, approfonditi discutendo il paradosso di Einstein, Podolsky e Rosen, il teorema di Bell e la sua verifica sperimentale di Aspect, i cui risultati sembrano contraddire in modo inequivocabile le cosiddette teorie realistiche locali. Infine, a testimonianza del notevole impatto pratico che può avere la fisica di base, abbiamo discusso i metodi per criptare un messaggio e come l’impiego di quantum-bit (qubit), permesso dalle moderne tecnologie di manipolazione dei fotoni, possa rendere la decifrazione di un messaggio criptato da parte di una spia praticamente impossibile. XIV 1 Determinismo e caos 1.1 Considerazioni generali Ci sono fenomeni che apparentemente non hanno regole, non sono soggetti ad alcuna legge, non manifestano ordine o simmetrie: ad esempio, l’infrangersi delle onde marine sugli scogli, il turbinio dell’aria e della pioggia in una tempesta, la scarica di un fulmine, la crescita irregolare dei rami degli alberi o dei fiori ed erbe in un prato di montagna. Invece, in altri fenomeni, l’ordine, la simmetria e la presenza di leggi sono evidenti: ad esempio, il ripetersi regolare del moto degli astri, o la distribuzione dei colori nell’arcobaleno, o anche il fatto che fenomeni apparentemente caotici, come per esempio i fulmini, sono accompagnati, ogni volta che hanno luogo, da circostanze costanti (tuoni, nuvole e temporali). Furono certo osservazioni di questo tipo che nell’antichità diedero origine ad una visione del mondo dialettica, in cui legge e ordine convivono col caos o, più precisamente, in cui le leggi delimitano il campo entro cui opera il caos. Figura 1.1: Nell’immagine del fulmine gli aspetti caotici nelle ramificazioni sono evidenti1. Al contrario, l’arcobaleno ci appare sempre con la stessa configurazione dei colori, con il rosso all’esterno e il viola dalla parte interna. Si può notare anche l’arco secondario, sebbene molto più debole, in cui l’ordine dei colori è invertito 2. 1 2 http://www.chaseday.com/lightning.htm © Gene Moore http://www.missouriskies.org/rainbow/february_rainbow_2006.html © Dan Bush 1 2 Capitolo I Così, guardando una foresta, un pensatore antico può essersi detto: «Tutti questi alberi sono costituiti ciascuno da un tronco, da rami e da foglie. Sono questi aspetti costitutivi che ci fanno classificare un albero come tale e distinguerlo da altri vegetali quali un fiore, un’alga etc. Tuttavia anche tra alberi della stessa specie la forma del tronco cambia irregolarmente dall’uno all’altro, lo stesso dicasi dei rami e delle foglie: le differenze, piccole o grandi che siano, appaiono senza regole, sono una manifestazione del caos.» L’antica concezione in cui l’ordine convive col caos mutò radicalmente con l’avvento della scienza moderna. Specialmente con lo sviluppo della meccanica astronomica andò man mano formandosi una visione del mondo affatto diversa, improntata al più rigoroso determinismo, in cui il moto di ogni corpo, dalla particella più piccola alle enormi galassie, è perfettamente determinato una volta che siano note le forze — da cui si determinano le accelerazioni — e le cosiddette condizioni iniziali (posizioni e velocità di tutte le particelle del sistema considerato ad un certo istante). Questa visione del mondo fu espressa in modo assai categorico dal matematico francese Pierre Simon de Laplace (1825). Ecco le sue parole: «Un’intelligenza che, ad un istante dato, conoscesse tutte le forze da cui la natura è animata e la situazione rispettiva degli esseri che la compongono, se fosse abbastanza vasta da sottoporre questi dati ad analisi abbraccerebbe nella stessa formula i moti dei corpi più grandi dell’universo e quelli dell’atomo più leggero: per essa non ci sarebbe nulla di incerto ed il futuro come il passato sarebbe presente ai suoi occhi». Con ciò, evidentemente, niente è dovuto al caso e si arriva a negare anche per l’uomo ogni possibilità di scelta. Infatti, dal momento che tutto è predeterminato, il libero arbitrio non può esistere. Il determinismo dominò incontrastato fino all’inizio del XX secolo. E anche chi sentiva il bisogno di salvaguardare il libero arbitrio, non arrivava ad abbandonarlo completamente, supponendo che valesse solo per il mondo inorganico. Tuttavia, per quanto si possa in astratto accettare l’idea dell’intelligenza sovrumana di Laplace, l’uomo rimane sempre vincolato a limiti pratici di conoscibilità. Ad esempio, per Determinismo e caos 3 scrivere i dati sulle posizioni e le velocità (condizioni iniziali) delle molecole contenute in un litro di aria ambiente non basterebbero le pagine di tutti i libri del mondo. Inoltre, le forze tra due molecole, dipendono dalle distanze e da altri parametri in modo complicatissimo. In pratica, se si escludono situazioni relativamente semplici, è impossibile fare delle previsioni certe sugli eventi quotidiani e la ricetta di Laplace, nella pratica delle cose, è inutilizzabile. Alla base di questa impossibilità troviamo, per l’appunto, il caos. Ma quali sono le ragioni del caos? Lo vedremo analizzando alcuni casi concreti. 1.2 Equilibri instabili Supponiamo di voler tenere in equilibrio sulla punta un solido a forma di cono. Si tratta di un’impresa oltremodo ardua, perché bisogna far sì che la verticale per il baricentro del cono, che si trova più in alto della punta, passi esattamente per quest’ultima, altrimenti, per quanto poco la verticale si discosti dalla punta, il cono cadrà. D’altra parte, per quanta cura si possa mettere, quando lo si lascia libero è facilissimo imprimergli una spinta, anche minima (basta un leggerissimo tremore della mano), che lo fa cadere. Inoltre, la punta e il piano d’appoggio avranno sempre delle piccole irregolarità le quali sono anch’esse cause di equilibrio precario. Ma supponiamo pure che, con certosina pazienza, si riesca a mettere per un attimo il cono in equilibrio. Basterà una piccolissima perturbazione: un refolo d’aria, delle vibrazioni irrisorie del piano d’appoggio – che possono essere prodotte da una miriade di cause diverse – per imprimere un piccolo impulso al cono e determinare la rottura dell’equilibrio. Ovviamente è molto difficile prevedere in che direzione cadrà il cono, perché non sappiamo prevedere la natura e la direzione d’azione della perturbazione. Ripetendo l’esperimento molte volte, se il cono è costruito a “regola d’arte”, nel senso che non vi sono asimmetrie né nella forma né all’interno del materiale (per esempio piccole cavità), si troverà che ogni volta il cono cade in una direzione diversa, senza regole apparenti, a caso. Vediamo, dunque, che una causa irrisoria può produrre un effetto ben evidente: la caduta del cono in una ben precisa, ma imprevedibile, direzione. 4 1.3 Capitolo I Dipendenza sensibile dalle condizioni iniziali Immaginiamo un biliardo ideale, dove le palle rotolano senza rallentare, sul quale sono fissati degli ostacoli cilindrici. Sponde e ostacoli sono perfettamente lisci e rigidi, cosicché le palle rimbalzano, senza perdere velocità, secondo un angolo uguale a quello di incidenza (v. Fig. 1.2a). In Figura 1.2b è indicato (linea nera) un possibile percorso di una palla, la quale incide, secondo un certo angolo, nel punto A di una sponda, qui rimbalza andando ad incidere sulla sponda opposta, poi di nuovo sulla prima, quindi sulla sponda laterale, finché viene ad urtare in successione due ostacoli che ne deviano la traiettoria un po’ meno di un angolo piatto ciascuno, e così via. Consideriamo ora una seconda traiettoria, incidente anch’essa in A, ma con un angolo di pochissimo diverso da quello considerato prima. Essa si discosta sempre più dalla prima; tuttavia, finché la palla urta solo con le sponde, l’angolo tra le due traiettorie rimane invariato. Se è quest’angolo, che abbiamo supposto molto piccolo, la distanza d tra le due traiettorie cresce in proporzione alla distanza L complessivamente percorsa, e precisamente d = L. Figura 1.2: a) Urto di una sferetta contro un ostacolo, entrambi perfettamente rigidi, elastici e lisci. In base alle leggi della meccanica classica, la velocità rimane invariata in valore, mentre la direzione cambia in modo che i = r. b) Le traiettorie nera e rossa incidono in A con un angolo leggermente diverso. Già dopo il primo urto contro un ostacolo cilindrico le due traiettorie divengono del tutto scorrelate. Determinismo e caos 5 All’atto di un urto con un ostacolo cilindrico la situazione cambia radicalmente, poiché il fatto che le traiettorie siano spostate fa sì che l’angolo d’incidenza e quindi quello di riflessione siano molto diversi. L’angolo tra le due traiettorie cresce quindi improvvisamente di una quantità che può essere molto maggiore di . In Figura 1.2b si vede, ad esempio, che, nell’urto col primo ostacolo, la prima traiettoria devia quasi di un angolo piatto, mentre la seconda devia di circa la metà di un angolo retto. Da questo punto in poi la seconda traiettoria non ha più niente a che vedere con la prima. Quindi, il cambiamento di una quantità piccolissima della direzione della velocità iniziale, cambia radicalmente il moto nei tempi successivi. Poiché la direzione iniziale può essere conosciuta solo con una certa approssimazione, per quanto elevata questa sia, la prevedibilità del moto a tempi lunghi risulta impossibile. Se misuriamo la posizione e la velocità della palla ad un dato istante e poi andiamo ad osservare la palla dopo un tempo sufficientemente lungo, quasi certamente non la troveremo nel punto del biliardo e con la velocità calcolati in base ai dati misurati, ma in un altro punto e con un’altra direzione di moto, punto e direzione di moto che possono essere diversissimi in relazione alla precisione con cui sono note le condizioni iniziali e al tempo trascorso. Si dice in tal caso che il sistema presenta una dipendenza sensibile dalle condizioni iniziali. 1.4 Complessità del sistema Per proseguire la nostra indagine sulle ragioni del caos analizzeremo ora un sistema complesso. Oggi l’aggettivo complesso può significare molte cose diverse e una definizione generale è impossibile. Qui ci atterremo a una definizione tradizionale, secondo cui un sistema complesso è un sistema costituito da un enorme numero di parti elementari (molecole, magneti atomici, particelle cariche, etc.) che possono interagire tra loro in molti modi. Tali sistemi mostrano talvolta un comportamento d’insieme che può essere descritto in modo semplice. Per esempio, il comportamento di un gas abbastanza rarefatto non dipende dalla natura delle sue molecole, siano esse costituite da un atomo, come i gas nobili, da due, come l’idrogeno e l’ossigeno, o 6 Capitolo I da più di due atomi, come, ad esempio, il metano e gli altri idrocarburi gassosi. Consideriamo dunque un gas rarefatto racchiuso in un recipiente. Poiché le proprietà d’insieme di un tale sistema sono indipendenti dalla natura delle molecole, per fissare le idee, possiamo raffigurarcele come minuscole sferette elastiche. Normalmente i sistemi gassosi con cui si ha a che fare contengono un numero enorme di molecole (dell’ordine di 1023, ossia 1 seguito da 23 zeri) in continuo movimento, con velocità comprese entro ampi limiti, ma in media, nelle condizioni dell’aria ambiente, dell’ordine di 500 m/s (v. Fig. 1.3). Uno stato microscopico del gas è definito dalla posizione e dalla velocità, in valore e direzione, di ciascuna molecola. Le molecole urtano incessantemente e frequentemente tra loro e con le pareti del contenitore percorrendo traiettorie a zig–zag. In Figura 1.3 ne sono rappresentate due che differiscono solo per la direzione della velocità iniziale (punto O) che, dall’una all’altra, cambia di un piccolissimo angolo. Si può stimare che ogni molecola di aria ambiente subisca in Figura 1.3: Due possibili moti di una molecola a partire da un punto O. Essi differiscono solo per la direzione della velocità iniziale che dall’uno all’altro cambia di un piccolissimo angolo. Dopo un certo numero di urti le due traiettorie finiscono in due punti diversi A e B con velocità diverse, completamente scorrelate tra loro. Determinismo e caos 7 media circa dieci miliardi (1010) di urti al secondo, percorrendo tra un urto e l’altro un tratto dell’ordine di qualche decina di volte le sue dimensioni. In un intervallo di tempo anche molto breve lo stato di moto delle molecole cambia quindi radicalmente numerose volte. Come nell’esempio del biliardo, ciascun urto incrementa infatti notevolmente quest’angolo. Se, per esempio, tale incremento fosse di un fattore 10, dopo due urti il fattore sarebbe 102, così dopo N urti, con N 1 , il fattore sarebbe un numero enorme: 10N. Si capisce allora che, nonostante la quasi identità delle condizioni iniziali dopo un po’ le posizioni (punti A e B in Fig. 1.3) sarebbero completamente scorrelate tra loro, tanto che potrebbero essere due punti qualsiasi, presi a caso. Nell’esempio considerato il “caos” dei possibili stati finali è dunque dovuto non soltanto alla dipendenza sensibile dalla direzione iniziale, ma anche all’enorme numero di urti subiti dalle molecole. 1.5 Caos, limiti del determinismo e realismo Possiamo dunque riassumere le ragioni del caos nei seguenti tre punti: • Imprevedibili cause irrisorie, che determinano effetti rilevanti • Dipendenza sensibile dallo stato iniziale. • Azione di innumerevoli piccole cause. Dalla discussione precedente emerge l’impossibilità per l’uomo di effettuare previsioni certe sull’evoluzione di molti fenomeni a tempi lunghi. Tuttavia, nella fisica classica l’impossibilità di una descrizione deterministica dipende sostanzialmente da motivi pratici, legati alle nostre limitate capacità di indagine sia teoriche sia sperimentali. Questi limiti, avendo natura pratica, non contraddicono il cosiddetto realismo che, in una delle possibili definizioni, recita così: I fenomeni nascono e si evolvono secondo precise regole indipendenti dall’osservazione. In altre parole, essi non sono mai indeterminati in sè, ma tutt’al più inconoscibili a causa di effetti caotici. In un certo senso, questa asserzione assegna alla natura la capacità di prescrivere con esattezza qualsiasi evento dell’universo. Vedremo, però, che tale concezione non è valida per i fenomeni atomici. 2 Personaggi del mondo atomico 2.1 I costituenti dell’atomo Nella seconda metà del XIX secolo furono effettuati studi determinanti sulla natura dell’elettricità e sui suoi legami con la materia. In particolare si scoprì che l’elettricità negativa è trasportata da particelle leggerissime, gli elettroni, presenti in tutti i materiali, mentre l’elettricità positiva è, per così dire, incastonata nella materia massiva. Gli esperimenti stabilirono che la massa degli elettroni è circa 1860 volte più piccola di quella dell’atomo di idrogeno, che è l’atomo più leggero. I valori, oggi conosciuti con gran precisione, della carica e della massa dell’elettrone sono: • e = 1.60217653(14) 10-19 C • me = 9.1093826(16) 10-31 kg Per quanto riguarda la struttura dell’atomo, una serie di esperimenti condotti da Rutherford (Brightwater Nuova Zelanda 1871, Cambridge 1937) nel 1911 portò alla scoperta del cosiddetto modello planetario (v. Fig. 2.1) in cui gli elettroni orbitano attorno a un piccolissimo nucleo, dov’è concentrata praticamente l’intera massa atomica e che porta una carica positiva uguale alla carica complessiva degli elettroni orbitanti, cosicché l’intera struttura risulta elettricamente neutra. Figura 2.1: Modello planetario dell’atomo, in cui i leggeri elettroni orbitano attorno a un piccolissimo nucleo massiccio. Nel nucleo sono presenti tante cariche positive, protoni (sferette rosse), quanti sono gli elettroni orbitanti, per cui l’atomo è complessivamente neutro. I neutroni sono rappresentati dalle sferette verdi. 9 10 Capitolo II La prova decisiva che il nucleo avesse una struttura si ebbe con la scoperta che l’emissione radioattiva produceva una trasmutazione del nucleo emettitore, cioè una trasformazione di questo nucleo in quello di un diverso elemento. La storia delle scoperte che svelarono la struttura del nucleo, è molto interessante, ma esula dal nostro contesto. Basterà dire che una prima tappa si concluse negli anni ’20 del secolo scorso, con la scoperta del protone come costituente del nucleo di tutti gli atomi. La massa del protone è circa 1860 volte quella dell’elettrone e la sua carica è positiva e di valore uguale a quella dell’elettrone. L’atomo dell’elemento più leggero, l’idrogeno, ha il nucleo formato da un singolo protone, l’elio ne ha due, e così via. La tappa finale si concluse, però solo 10 anni dopo, quando fu scoperto il neutrone, una particella neutra avente praticamente la stessa massa del protone. Con questa scoperta emerse l’immagine del nucleo valida ancora oggi: il nucleo di un atomo con numero di massa A e Z elettroni ha Z protoni e A-Z neutroni. Le masse di queste ultime particelle sono oggi note con grande precisione e risultano, rispettivamente: • mp = 1.67262171(29) 10-27 kg • mn = 1.67492728(29) 10-27 kg L’elettrone, il protone e il neutrone sono i cosiddetti costituenti stabili della materia. 2.2 Quanti di luce: il fotone L’esperimento di Young (Milverton 1773–Londra 1829) sull’interferenza della luce (v. A.5), dimostra incontestabilmente che la luce e, più in generale, la radiazione elettromagnetica hanno natura ondulatoria. Un’onda si propaga trasportando energia, la quale si distribuisce entro l’intera regione occupata via via dall’onda. La fisica classica dimostra che l’energia contenuta in un dato volume di questa regione è proporzionale al quadrato dell’ampiezza dell’onda. Pertanto, pur di ridurre opportunamente l’ampiezza, possiamo avere onde la cui energia per unità di volume è piccola quanto si vuole. In altre parole, l’energia di un’onda è una grandezza continua, ossia che può variare di quantità infinitesimali. Personaggi del mondo atomico 11 Alla fine del XIX secolo, durante lo studio della radiazione termica, la concezione che l’energia elettromagnetica potesse variare con continuità entrò in crisi. Ma che cos’è la radiazione termica? Prendiamo un ferro da stiro ben caldo e avviciniamo una mano, ad una certa distanza. Il calore proveniente dal ferro è chiaramente percepito dalla mano. In effetti, il ferro — come tutti i corpi caldi e tanto più quanto più sono caldi — irraggia energia elettromagnetica a scapito della propria energia interna e perciò si raffredda, mentre la mano assorbe la radiazione e si riscalda. L’energia della radiazione è distribuita in un certo modo caratteristico tra tutte le onde che la costituiscono, secondo una legge espressa da una funzione della temperatura e della frequenza e che dipende dalla natura del corpo e dal suo intorno. Nel caso di un recipiente chiuso, mantenuto ad una certa temperatura, si dimostra che la distribuzione dell’energia raggiante è indipendente dal materiale, dalle dimensioni e dalla forma della cavità ed è descritta da una funzione della temperatura e della frequenza. Sperimentalmente tale legge può essere determinata praticando un forellino nel recipiente e analizzando con metodi spettroscopici la poca radiazione che ne esce (v. Fig. 2.2). La legge di distribuzione che si ottiene è nota come legge del corpo nero, perché il forellino, a temperature non troppo alte, appare come una macchia nera sul corpo del recipiente. Risultò (siamo alla fine del XIX secolo) che i dati sperimentali contrastavano senza rimedio con l’affermazione classica per cui si possono assorbire o emettere quantità arbitrariamente piccole di radiazione di bassa come di elevata frequenza. Se ciò fosse vero, si dimostrerebbe infatti che entro il recipiente dovrebbero esserci soltanto radiazioni di frequenza elevatissima (catastrofe ultravioletta), il che è manifestamente assurdo: nessuno ha mai visto un corpo nero emettere fiotti di raggi X. Per interpretare i dati sperimentali sulla composizione della radiazione del corpo nero, il fisico tedesco Max Planck (Kiel 1858– Gottinga 1947) introdusse (1901) un’ipotesi radicalmente nuova, la quale, in contrasto con la fisica classica, asseriva che c’è un limite mi- 12 Capitolo II nimo per l’energia emessa o assorbita dalla materia e che tale limite è proporzionale alla frequenza della radiazione. Se è la frequenza ed la minima quantità di energia che la materia può scambiare con la radiazione di tale frequenza, si ha: = h , dove h è la cosiddetta costante di Planck, il cui valore è 6.6210-34 J·s. In breve, Planck, assumendo che gli scambi di energia radiante potessero avvenire solo per quanti finiti h, riuscì ad ottenere una formula che riproduceva perfettamente la composizione della radiazione termica. Successivamente (1905), Einstein (Ulma 1879–Princeton New Jersey 1955) ampliò l’ipotesi di Planck, giungendo a postulare che la radiazione di frequenza è costituita da quanti ovvero pacchetti di energia, quasi fossero corpuscoli, che si propagano con velocità c e ciascuno dei quali ha energia h. Questi quanti di energia radiante furono detti più tardi (1922) fotoni. Figura 2.2: a) La radiazione uscente dal forellino del recipiente mantenuto a temperatura T viene scomposta dal reticolo nelle sue componenti in modo che si possa misurare l’intensità di ciascuna. b) Andamento dell’intensità in funzione della frequenza per tre diverse temperature. La frequenza del massimo cresce linearmente con T e l’area sottesa da ciascuna curva (che dà l’energia per unità di volume del recipiente) è proporzionale a T 4. Personaggi del mondo atomico 13 Einstein chiamò la propria assunzione principio euristico (principio non rigoroso con cui si consegue un risultato plausibile, ma che necessita successivamente di essere verificato usando un metodo rigoroso). Infatti, egli lo utilizzò per fornire una semplicissima spiegazione di un altro fenomeno — sempre relativo agli scambi di energia tra radiazione e materia — che appariva in conflitto con la fisica classica: l’effetto fotoelettrico. L’effetto fotoelettrico è il fenomeno per cui, quando un fascio di luce incide sulla superficie di certi metalli, si liberano degli elettroni che sfuggono dal metallo. Sperimentalmente, si trovano le seguenti due leggi: 1. Per ogni metallo esiste una soglia fotoelettrica, ossia una frequenza 0 tale che, per frequenze minori non si ha l’effetto, qualunque sia l’intensità del fascio di radiazione. 2. Il numero di elettroni emessi in un dato tempo da una radiazione di frequenza >0 è proporzionale all’intensità della radiazione, ma gli elettroni sono emessi tutti con la stessa energia cinetica che dipende dalla frequenza, ma non dall’intensità. Figura 2.3: Dispositivo per la misura dell’energia cinetica dei fotoelettroni. La differenza di potenziale tra fotocatodo e placca viene regolata tramite il potenziometro fino ad annullare la corrente. Se V denota questa differenza di potenziale, sia ha: Ec = e V. L’energia cinetica in funzione della frequenza ha un andamento rettilineo la cui pendenza dà il valore di h. 14 Capitolo II In base alla fisica classica, l’esistenza di una soglia fotoelettrica è del tutto incomprensibile. Infatti, gli elettroni stanno normalmente all’interno del metallo e per estrarne uno occorre fornirgli una certa energia W (lavoro di estrazione) caratteristica di quel metallo. Secondo la fisica classica, la forza esercitata su un elettrone dal campo elettrico della radiazione incidente accelera l’elettrone conferendogli energia e si dimostra che questa è proporzionale all’intensità della radiazione. Pertanto, pur di usare radiazione di intensità sufficiente, secondo la fisica classica l’emissione dovrebbe avvenire qualunque sia la frequenza, in contrasto con l’esistenza di una soglia fotoelettrica. Sulla base del suo principio euristico, Einstein poté spiegare con grande semplicità le leggi dell’effetto fotoelettrico nel modo seguente. Un fotone di energia h, che incide su un metallo, può essere “assorbito” da un elettrone; se ciò accade il fotone scompare e l’energia dell’elettrone aumenta di h. Il fotone potrà, dunque, “liberare” un elettrone solo se h > W, se invece la frequenza è minore di 0 = W/h (frequenza di soglia), l’effetto non si produce. Se h > W l’elettrone viene liberato con l’eccesso di energia h – W sotto forma di energia cinetica Ec: Ec = h W 2-1 Einstein fece notare che, aumentando l’intensità della radiazione, aumenta il numero di fotoni che incidono sul metallo, perciò aumenterà in proporzione il numero di elettroni liberati, ma non la loro energia cinetica, in accordo con l’esperienza (punto 2). La verifica sperimentale della precedente equazione fu effettuata da Millikan all’Università di Chicago nel 1915. Il dispositivo usato è illustrato in Figura 2.3. Un’ampolla di vetro, vuotata dell’aria, contiene due elettrodi, uno di questi, il fotocatodo, illuminato con luce di frequenza nota, emette gli elettroni, l’altro, la placca, li raccoglie. La corrente è segnalata da un galvanometro in serie al circuito. Portando la placca ad un potenziale negativo V tale che eV > Ec la corrente si annulla. Ec si determina, dunque, misurando il potenziale minimo che annulla la corrente. Personaggi del mondo atomico 15 Millikan illuminò fotocatodi ricoperti da metalli alcalini utilizzando luce visibile, e precisamente alcune radiazioni emesse da una lampada a mercurio gassoso. Riportando in grafico Ec in funzione di , egli ottenne un andamento rettilineo in accordo con la (2-1). Il valore di h fu, inoltre, ottenuto dalla pendenza della retta e nell’articolo di Millikan pubblicato nel 1915 si legge in proposito: «la costante h di Planck è stata determinata per via fotoelettrica con una precisione dello 0,5% circa, ottenendo il valore 6,5710-27erg·s». Il principio euristico di Einstein e la conseguente teoria dell’effetto fotoelettrico furono accolti con scetticismo dal mondo scientifico. In sostanza, si accettava l’idea che gli scambi di energia tra materia e radiazione elettromagnetica potessero avvenire per quanti di energia, come aveva proposto Planck, mentre non si riusciva ad ammettere che la luce e, più in generale, le onde elettromagnetiche – le quali soddisfacevano alle ben consolidate leggi dell’elettromagnetismo per cui la radiazione è un fenomeno ondulatorio continuo – potessero consistere di quantità discrete: i fotoni, appunto. Indicativa di questo clima è la raccomandazione, del 1913, per la nomina di Einstein a membro dell’Accademia prussiana, da parte di alcuni eminenti membri della stessa, tra cui Planck: «... si può dire che non c’è quasi nessuno dei grandi problemi di cui la fisica moderna è così ricca al quale Einstein non abbia dato un contributo rilevante. Che possa a volte aver mancato il bersaglio, come per esempio, nel caso dell’ipotesi dei quanti di luce, non può essere considerato troppo grave: è impossibile infatti introdurre idee veramente nuove nelle più esatte delle scienze, senza correre a volte qualche rischio». Qui il rifiuto dei quanti di luce da parte delle autorità accademiche prussiane è espresso in modo categorico. Dovettero passare una ventina d’anni da questa dichiarazione prima che la teoria atomica conferisse al fotone la dignità di ente reale. Ironia della sorte: Einstein mantenne sempre dubbi su questa teoria. 3 Onde o particelle? 3.1 Onde di De Broglie Una conseguenza della teoria della relatività1 è che i fotoni, propagandosi con la velocità c della luce, devono avere massa nulla ed impulso p = E/c, dove E=h è l’energia, per cui: p= h c 3-1 Introducendo la lunghezza d’onda =c/, si ha anche: p= h 3-2 Queste equazioni sono interessanti poiché mettono in relazione una quantità caratteristica delle particelle, l’impulso, con una tipicamente ondulatoria, la frequenza o la lunghezza d’onda. Ispirandosi a questa relazione, De Broglie (Dieppe 1892–Parigi 1987) giunse a postulare che, come le onde elettromagnetiche possono manifestarsi come particelle, i fotoni, che trasportano l’impulso p=h/, così una particella massiva avente impulso p, può manifestarsi come un’onda avente lunghezza d’onda =h/p. Come abbiamo discusso, gli aspetti ondulatori si manifestano in modo tanto più evidente quanto più grande è la lunghezza d’onda. Nella tabella sotto sono riportate, a titolo comparativo, le lunghezze d’onda di De Broglie (espresse in nano-metri=10-9 m) di tre particelle del mondo atomico e di una partcella classica (pallino da caccia) in condizioni standard di moto. 1 v. MAX BORN, La sintesi einsteiniana, Boringhieri, Torino 1969, p. 343. 17 18 Capitolo III Si noti che a parità di energia un fotone ha una lunghezza d’onda circa mille volte più grande che l’elettrone. Inoltre, il pallino di piombo ha una lunghezza d’onda così piccola da rendere del tutto irrilevanti (e irrilevabili) gli aspetti ondulatori. Particella Massa (kg) Velocità (m/s) p (kg m/s) (nm) elettrone di energia 1 eV 9.1 10 -31 6.0 10 5 5.5 10 -25 1.0 fotone di energia 1 eV 0 3 1010 5.3 10 -28 1.2 10 3 O2 dell’aria 5.3 10 -26 500 2.6 10 -23 0.1 pallino di piombo sparato da un fucile da caccia. 10 -5 100 10 -3 6.6 10 -22 3.2 Gli esperimenti ideali di Feynman La differenza tra il comportamento delle particelle atomiche e quello delle particelle della fisica classica, può essere illustrata mediante una serie di semplici esperimenti ideali descritti da Feynman nel suo famoso libro Lectures on Physics2. Consideriamo il dispositivo illustrato nella Figura 3.1a. Un cannoncino spara entro un certo angolo minuscole sferette, parte delle quali attraversa i forellini del diaframma e va a conficcarsi nello schermo. Nell’attraversare il foro una sferetta può interagire col bordo ed essere deviata. La perturbazione che subisce dipende dalla traiettoria di entrata in modo critico: una piccola differenza nella traiettoria può determinare grosse differenze nella deviazione che subisce la sferetta. Siamo quindi nell’ambito dei moti caotici, cosicché non è possibile determinare il punto dello schermo dove la sferetta andrà a con2 R. FEYNMAN, La Fisica di Feynman, Zanichelli, Bologna 2001, vol. III. Onde o particelle? 19 ficcarsi. La distribuzione sullo schermo diviene regolare solo dopo che un gran numero di sferette vi si sono conficcate. L’andamento che si ottiene è illustrato in Figura 3.1a, dove l’ordinata P12 in un punto è proporzionale al numero di sferette che cadono in un piccolo intorno di quel punto. Analogamente P1 (P2) è la distribuzione che si ottiene quando il solo foro 1 (2) è aperto. Figura 3.1: Confronto tra i comportamenti classico e quantistico. a) Un cannoncino spara una rosa di minuscole sferette metalliche contro un diaframma con due fori. Parte delle sferette attraversano i due fori e vanno a conficcarsi nello schermo. P1 e P2 sono le distribuzioni delle sferette che sono passate dal foro 1 e dal foro 2 rispettivamente. P12 è la distribuzione complessiva. b) Analogo esperimento effettuato con elettroni. Il cannoncino è sostituito da un cannone elettronico che emette un fascio divergente di elettroni, tutti con la stessa velocità. Lo schermo è sostituito da una matrice di rivelatori ciascuno dei quali registra il numero di elettroni incidenti su esso. 20 Capitolo III Poiché i vari punti dello schermo sono colpiti dalle sferette in modo del tutto casuale, la distribuzione finale si può interpretare solo in termini di probabilità. La probabilità di un evento è definita come il rapporto tra il numero di casi favorevoli all’evento e il numero di casi possibili. Classico esempio: nel lancio di un dado, l’uscita di un numero prescelto, compreso tra 1 a 6, è il caso favorevole su 6 possibili; quindi la probabilità è 1:6 = 0,1666... ~ 0,17, ossia del 17%. Se si effettuano N lanci e un numero prescelto esce n volte, il rapporto n/N si chiama frequenza. Ebbene, si verifica sperimentalmente che al crescere del numero N di prove, la frequenza si avvicina al valore della probabilità. Nell’esperimento con le sferette, si divida la superficie dello schermo con una rete di piccoli quadratini. La probabilità che una sferetta si conficchi in un dato quadratino si ottiene approssimativamente dalla relativa frequenza, ossia dividendo il numero n di sferette che si sono conficcate all’interno del quadratino (eventi favorevoli) per il numero N totale di sferette conficcate nello schermo (eventi totali), con N grande abbastanza, ossia tale che la frequenza non cambi sensibilmente aumentandolo ulteriormente. In tal modo otteniamo la probabilità relativa ai punti di ciascun quadratino. La curva P12 ci dà l’andamento della probabilità in funzione del punto dello schermo nel caso che siano aperti entrambi i forellini, mentre le curve P1 e P2 danno le probabilità nel caso che sia aperto solo il foro 1 o il foro 2, rispettivamente. L’esperimento mostra che la curva P12 ottenuta con entrambi i fori aperti é semplicemente la somma di P1 e P2: P12=P1+P2. Ciò è del tutto ovvio, basta pensare che, con entrambi i fori aperti, il numero di sferette che giungono in un punto è la somma di quelle che provengono dal foro 1 più quelle che provengono dal foro 2. Consideriamo ora un secondo esperimento, simile al primo, in cui al posto delle sferette si usano particelle subatomiche, diciamo elettroni. La sorgente di elettroni è costituita da un filamento reso incandescente da una corrente elettrica, Figura 3.1b. Il filamento incandescente emette elettroni i quali, accelerati dalla tensione applicata alla canna, escono dal foro tutti con la stessa velocità. Lo schermo è costituito da una rete di rivelatori di elettroni. Quando un elettrone colpisce un rivelatore, l’evento è registrato in una memoria connessa al rivelatore Onde o particelle? 21 colpito ed eventualmente si può far sì che un altoparlante emetta un “tic”. Alla fine, analizzando le memorie di tutti i rivelatori, si può ricostruire la distribuzione di elettroni sullo schermo. Mantenendo la sorgente opportunamente distante dal diaframma, si può indebolire a piacere il fascio incidente e far sì che tra diaframma e schermo venga a trovarsi un elettrone per volta. L’arrivo di ciascun elettrone sullo schermo mostra un comportamento del tutto casuale, nel senso che il “tic” viene sempre emesso da un singolo rivelatore, ma non si può prevedere da quale, né quale rivelatore emetterà il successivo. Inoltre, i “tic” si susseguono ad intervalli irregolari. Se pensiamo agli elettroni come a microscopiche particelle, un tale comportamento è del tutto comprensibile. Infatti, un elettrone, nell’attraversare l’uno o l’altro dei due fori del diaframma, subirà una perturbazione che lo devia più o meno e in modo casuale dalla direzione originaria, per cui non si può dire in quale punto dello schermo andrà a finire. In sostanza, il risultato dovrebbe essere simile a quello dell’esperimento con le sferette sparate col cannoncino. Con uno solo dei due fori aperto, dopo che un gran numero di elettroni è giunto sullo schermo, si ottengono le distribuzioni di elettroni P1 e P2, che sono simili a quelle delle sferette descritte prima. Tuttavia, sorprendentemente, se entrambi i fori sono lasciati aperti, la distribuzione finale P12 degli elettroni non è la somma di P1 e P2, ma appare una figura di interferenza, proprio come se dai forellini uscissero non particelle, ma due onde coerenti, come nell’esperimento di Young (v. A.5). Calcolando la lunghezza d’onda dalla distanza tra due massimi troveremmo proprio il valore dato dalla relazione di De Broglie: =h/mv (m è la massa e v la velocità degli elettroni). Dal momento che l’esperimento è condotto in modo che lo schermo sia raggiunto da un solo elettrone alla volta, il quale, al pari di una particella, colpisce un singolo rivelatore, in modo del tutto casuale, la distribuzione finale P12, come nel caso delle sferette discusso prima, ci dà la probabilità che un elettrone finisca nei diversi punti dello schermo. Ma l’andamento di tale probabilità differisce in modo sostanziale da quella delle sferette “classiche”. Tale andamento è, infatti, quello della figura di interferenza di due onde coerenti che emergono dai fori e che possiamo chiamare onde di probabilità, poiché determinano le 22 Capitolo III probabilità delle possibili traiettorie degli elettroni. In sostanza, l’elettrone — ma le cose vanno allo stesso modo con tutte le particelle elementari — quando viene intercettato sullo schermo presenta un carattere corpuscolare, come attesta il fatto che finisce su un singolo rivelatore, mentre dovrebbe interessarne molti se avesse una distribuzione spaziale come le onde. Ma il suo comportamento è descritto da onde che hanno la configurazione delle onde classiche, ma non sono onde materiali, bensì onde di probabilità, in quanto forniscono le probabilità che gli elettroni colpiscano i vari punti dello schermo. Si tratta, quindi, di entità puramente matematiche. Le caratteristiche di tali onde dipendono dalle condizioni fisiche degli elettroni. Per esempio, dopo l’uscita dal cannone elettronico, l’onda di probabilità consiste di un’onda divergente, che all’uscita dai fori nel diaframma dà luogo a due onde diffratte coerenti, le quali, sovrapponendosi, producono la figura di interferenza sullo schermo. Notiamo che, secondo l’idea classica di particella, questa spiegazione è del tutto incomprensibile; infatti, come si è detto discutendo l’esperimento con le sferette, la probabilità con entrambi i fori aperti dovrebbe essere la somma delle probabilità relative ad un solo foro aperto, invece P12 P1+P2. 3.3 Esperimenti reali Non sarebbe semplice eseguire gli esperimenti descritti prima, così come sono stati descritti; essi vanno considerati piuttosto esperimenti ideali, ossia esperimenti che servono ad illustrare il comportamento del sistema — nella fattispecie le sferette e gli elettroni — . Tuttavia, esperimenti reali, cosiddetti delle due fenditure (two slits experiments), sono stati effettuati usando elettroni, neutroni, atomi e perfino grosse molecole. Verso la metà degli anni cinquanta G. Möllenstedt e H. Güker dell’Università di Tubinga costruirono un dispositivo (v. Fig. 3.2), che può essere considerato l’equivalente del biprisma di Fresnel in ottica, in grado di generare due onde elettroniche coerenti. Esso consiste di un sottilissimo filo di quarzo ricoperto da una pellicola d’oro che lo rende conduttore. Due placche metalliche, poste simmetricamente rispetto all’asse del filo e alla sorgente di elettroni S, sono collegate a Onde o particelle? 23 terra, mentre il filo è connesso ad un potenziale positivo. Gli elettroni, passando vicini al filo, sono attratti da questo e le loro traiettorie vengono deviate di un certo angolo che, come può essere dimostrato, è proporzionale al potenziale del filo e, in prima approssimazione, indipendente dalla distanza delle traiettorie dal filo stesso. A valle del filo, le traiettorie hanno perciò direzioni che convergono nei punti S1 e S2, che sono le immagini virtuali di S. Ora, S1 e S2 , essendo immagini della stessa sorgente di elettroni, sono coerenti, pertanto le onde elettroniche uscenti da esse formano oltre il filo una figura d’interferenza. Esperimenti di questo tipo confermarono i valori della lunghezza d’onda degli elettroni prescritta dalla relazione di De Broglie, e, trattandosi di lunghezze d’onda molto più piccole di quelle dei fotoni di pari energia, avviarono gli studi sulla microscopia elettronica per l’osservazione di oggetti troppo piccoli anche per i più potenti microscopi ottici. Il primo esperimento che mostrava le tipiche figure di interferenza formate dalla distribuzione dei singoli elettroni fu effettuato Figura 3.2: Apparato di Möllenstedt e Günker. 24 Capitolo III nel 1976 da tre scienziati italiani, G. F. Missiroli e G. Pozzi, dell’Università di Bologna, e P. G. Merli del CNR-LAMEL di Bologna. La risoluzione di immagine sufficiente a rivelare i punti di impatto dei singoli elettroni fu ottenuta osservando la figura d’interferenza prodotta dal dispositivo di Möllenstedt e Güker attraverso un microscopio elettronico e un intensificatore d’immagine. Le figure di interferenza corrispondenti a flussi elettronici crescenti erano osservate su un monitor TV e mostravano che, per bassi flussi, la distribuzione elettronica appariva casuale, mentre per flussi sufficientemente alti apparivano le frange caratteristiche dell’interferenza. Tredici anni più tardi, A. Tonomura e collaboratori effettuarono un esperimento simile, ma con un’apparecchiatura più raffinata che consentì di utilizzare un basso flusso di elettroni (un migliaio al secondo), per cui era molto improbabile che nell’apparato vi fosse più di un elettrone per volta. Ciò escludeva l’eventualità che le frange osservate fossero dovute a interazioni tra elettroni. Dunque gli elettroni arrivavano sullo schermo uno per volta lasciando tracce pressoché puntiformi le quali, finché erano poco numerose, apparivano distribuite a Figura 3.3: Immagini di singoli elettroni ottenute con un’esposizione complessiva di 20 per formare la figura d’interferenza nell’esperimento di Tonomura et al.: (a) 8 elettroni, (b) 270, (c) 2000, (d) 60000. 3 3 La figura è tratta da: A. Tonomura et al., Am. J. Phys., 57, 117 (1989). Onde o particelle? 25 caso, ma, via via che il loro numero cresceva,si delineava una figura d’interferenza sempre più netta (v. Fig. 3.3). Un altro interessante esperimento fu effettuato nel 1988 da A. Zeilinger et al. presso l’Istituto Laue-Langevin di Grenoble, usando neutroni. Con riferimento alla Figura 3.4, i neutroni del fascetto proveniente dal reattore hanno velocità diverse e quindi diverse lunghezze d’onda. Il monocromatore seleziona neutroni che hanno una prestabilita lunghezza d’onda, che può essere variata tra 1,5 e 3 nm. Il fascetto di neutroni monocromatici uscenti dal monocromatore entra in un tubo evacuato e incide sul diaframma con le due fenditure, da dove escono due fascetti divergenti che, sovrapponendosi, interferiscono tra loro. La doppia fenditura è costituita da due tronchi di cono di vetro al boro con le basi minori affacciate ad una certa distanza e da un filo di boro che lascia due aperture alle sue estremità. Il boro assorbe i neutroni, per cui questi passano solo dalle due aperture. Figura 3.4: Schema dell’apparato usato nell’esperimento di Grenoble, la figura d’intereferenza è ripresa dall’articolo di Zeilinger et al. 26 Capitolo III La figura di interferenza si ottiene spostando trasversalmente lo schermo mobile con un foro, dietro il quale si trova il contatore di neutroni. Quando uno di questi neutroni, attraversando il gas di fluoruro di boro (BF3) contenuto nel contatore, urta un nucleo di boro, quest’ultimo si spezza in due parti cariche che si allontanano velocemente tra loro. Queste, ionizzando il gas, producono una scarica elettrica che viene registrata. Per ogni posizione del foro dello schermo mobile fu registrato il conteggio ottenuto in un tempo prestabilito (125 minuti). In basso è riportato il grafico corrispondente (ossia i conteggi in funzione della posizione del foro). L’alternarsi dei massimi e dei minimi è caratteristico dell’interferenza di onde; al contrario, le scariche che registrano i singoli neutroni hanno breve durata e avvengono a caso; questi sono appunto caratteri distintivi delle particelle. Come si verifica facilmente, il tempo medio tra l’arrivo di un neutrone e l’arrivo del successivo è molto maggiore del tempo di volo, per cui è molto improbabile che nell’apparato interferenziale vi sia più di un neutrone per volta. Si può quindi dire paradossalmente che ogni neutrone “interferisce con se stesso”, così come facevano gli elettroni nell’esperimento di Tonomura. 4 Principio d’indeterminazione 4.1 Il microscopio di Heisenberg Secondo la meccanica classica, il moto di una particella è perfettamente definito quando siano noti, oltre alle forze agenti sulla particella, la posizione e la velocità (o l’impulso) all’istante iniziale. Infatti, dalle forze si ricava l’accelerazione e da questa l’incremento di velocità in un dato tempo t. Sommando tale incremento alla velocità iniziale si ottiene la velocità al tempo t; da questa si ottiene poi lo spostamento della particella e, nota la posizione iniziale, la posizione della particella al tempo t. Tutto ciò potrebbe valere anche per le particelle atomiche; sennonché, mentre la posizione e l’impulso di una particella classica possono essere determinati con precisione arbitraria, per le particelle atomiche c’è un limite alla precisione con cui si possono conoscere simultaneamente queste due grandezze. Precisamente, se x e px sono le indeterminazioni nelle misure della posizione e dell’impulso nella direzione x, il loro prodotto non può essere inferiore alla costante di Planck: x px h Figura 4.1: Microscopio di Heisenberg per la misura di posizione. 27 4-1 28 Capitolo IV È questo l’enunciato del famoso principio di indeterminazione di Heisenberg (Würzburg 1901–Monaco di Baviera 1976), formulato nel 1925, e illustrato dallo stesso fisico tedesco col seguente esempio. Si debba misurare la posizione di una particella che si muove in una direzione x con impulso p0 (v. Fig. 4.1). Per questo si utilizza un microscopio che, raccogliendo la luce diffusa dalla particella, ne forma l’immagine su quella di un righello graduato. In altri termini, perché la misura di posizione si realizzi occorre che almeno un fotone del fascetto luminoso sia diffuso dalla particella entro il microscopio per finire nel punto immagine, che, però, non è esattamente definito. Infatti a causa della diffrazione (v. A.4) l’immagine di un punto non è un punto, ma un dischetto di diametro d / sin 2 , dove è la metà dell’angolo di apertura del microscopio. La posizione della particella nella direzione x è, quindi, indeterminata della quantità x = d / sin 2 , da cui segue che la precisione della misura di posizione è tanto maggiore quanto più piccola è la lunghezza d’onda. D’altra parte, la deviazione di un fotone da parte della particella, può essere immaginata come effetto di un urto elastico tra la particella luminosa — il fotone, appunto — e la particella materiale, in cui la prima ha di solito una lunghezza d’onda molto maggiore della seconda (v. Par. 3.1) e quindi, in base alla relazione di De Broglie, un impulso molto minore. In queste condizioni, le leggi dell'urto elastico mostrano Figura 4.2: La variazione dell’impulso p è rappresentata dal vettore base del triangolo isoscele i cui lati sono gli impulsi del fotone prima e dopo la diffusione. L’angolo massimo di deviazione perché il fotone entri nel microscopio è pari a (v. Fig. 4.1). Principio d’indeterminazione 29 che l'energia e quindi la frequenza del fotone non cambiano sensibilmente. Ossia, il fotone deviato ha pressoché la stessa frequenza del fotone incidente, ma il cambiamento di direzione comporta un cambiamento dell'impulso p, come illustrato in Figura 4.2. Per il principio di conservazione dell’impulso, la particella subisce una variazione d’impulso uguale e contraria a p. Il valore di p cresce al crescere dell’angolo di deviazione che non è conosciuto: sappiamo solo che la direzione di diffusione è compresa nel cono di apertura 2. Per l’indeterminazione px della componente dell’impulso secondo x si ha quindi: px = h h sin 2 = sin 2 c 4-2 Segue che, al contrario della misura di posizione che diviene più precisa diminuendo la lunghezza d’onda, la misura dell’impulso ha un’indeterminazione px che cresce al diminuire di . Più precisamente, il prodotto delle indeterminazioni vale x px h, in accordo col principio di Heisenberg. Una cosa importante deve essere notata: il principio di Heisemberg riguarda il futuro, non il passato. Infatti, un elettrone di velocità nota passi attraverso un piccolo foro e poi da un secondo piccolo foro posto sul suo cammino. Dal momento che è passato dal secondo foro, noi possiamo dedurre con grande precisione quali erano la posizione e la velocità all’uscita del primo foro. Infatti, la posizione è quella del primo foro, la quale, essendo quest’ultimo molto piccolo, è ben definita. Riguardo alla velocità, il suo valore è quello che aveva all’origine e la direzione è quella definita dalla congiungente i due fori. Questi dati, però, riguardano il passato e non servono a predire il moto dell’elettrone all’uscita dal secondo foro, poiché, a causa della diffrazione, la direzione di moto sarà indeterminata nella misura dettata dal principio di Heisenberg. 30 Capitolo IV In sostanza, il principio di indeterminazione si riferisce ai valori della posizione e dell’impulso che sono assunti come condizioni iniziali per determinare il moto successivo. 4.2 Dal microscopico al macroscopico In molti esperimenti le particelle subatomiche e le stesse molecole si comportano come corpuscoli macroscopici. Per esempio, le traiettorie degli elettroni nei tubi catodici sono deviate da campi elettrici o magnetici secondo le leggi classiche del moto, mentre il moto degli elettroni in un atomo segue leggi quantistiche. Altro esempio: per rivelare le traiettorie delle particelle subatomiche si usano le camere a bolle, le quali consistono in un recipiente contenente un liquido (elio o idrogeno) che viene portato, con un brusco abbassamento della pressione, in una stato instabile appena sopra il punto di ebollizione. In queste condizioni, una particella carica che penetra nella camera lascia una traccia formata da minuscole bollicine di vapore distribuite lungo la traiettoria (v. Fig. 4.3). Dalla curvatura che subisce la traiettoria per effetto di un campo magnetico si possono ottenere informazioni sulla massa e sulla velocità della particella, in accordo con le leggi classiche. Figura 4.3: Traiettorie di particelle subatomiche in una camera a bolle d’elio (dall’archivio del CERN: http://www.bo.infn.it/antares/bolle_proc/foto.html) Principio d’indeterminazione 31 Infine, anche le molecole possono manifestare una natura ondulatoria, dando luogo a fenomeni d’interferenza, ma sappiamo anche che, applicando le leggi della meccanica classica alle molecole di un gas abbastanza rarefatto, si può ricavare l’equazione di stato dei gas perfetti, dalla cui deduzione emerge l’equivalenza tra temperatura ed energia cinetica media delle molecole. Chiediamoci allora: quali circostanze occorrono affinché una particella atomica o subatomica si comporti come un corpucolo classico? In altre parole, in quali contesti l’aspetto ondulatorio risulta inessenziale, tanto da lasciar emergere il solo aspetto corpuscolare? La risposta a queste domande ci viene fornita dal principio d’indeterminazione. Consideriamo, ad esempio, una particella che si muove lungo una traiettoria circolare di raggio R con impulso p (v. Fig. 4.4a). Affinché la traiettoria risulti definita con buona approssimazione, occorre che per ogni punto siano soddisfatte due condizioni: la prima concerne la posizione della particella, le cui indeterminazioni x, y e z devono essere molto minori di R; la seconda condizione riguarda la tangente alla traiettoria. Poiché nell’intorno del punto di tangenza la curva si confonde con la tangente, che coincide con la direzione dell’impulso, le indeterminazioni px, py e pz devono essere molto minori di p. Riassumendo deve essere: x R, y R, z R px p, py p, pz p 4-3 Moltiplicando ciascuna indeterminazione della posizione per la corrispondente dell’impulso, per il principio di indeterminazione, abbiamo: h xpx pR, ecc. 4-4 32 Capitolo IV Come applicazione della precedente relazione, consideriamo l’atomo d’idrogeno, costituito (v. Par. 2.1) da un nucleo pesante intorno al quale orbita un elettrone, e vediamo in quali condizioni l’elettrone si comporta come una particella classica che descrive una traiettoria definita di raggio r. Il prodotto pr (v. App. B) è il modulo del momento angolare orbitale, il quale è quantizzato, nel senso che può assumere solo valori che sono multipli interi di ( h 2 ): pr = l 4-5 dove l è un numero intero. Figura 4.4: a) Particella su una traiettoria circolare di raggio R. La traiettoria è definita se le indeterminazioni x, y e z sono piccole rispetto a R e, inoltre, le indeterminazioni p x , p y e pz sono piccole rispetto a p. b) Molecole di gas rarefatto entro un recipiente. I cubi di lato d contengono in media una molecola ciascuno ed hanno quindi il lato pari all’interdistanza media delle molecole. Per quanto concerne le traiettorie delle molecole, esse sono definite se le indeterminazioni x, y e z sono piccole rispetto a d e le indeterminazioni p x , p y e pz sono piccole rispetto a p. Principio d’indeterminazione 33 Tenendo conto della (4-4): pr >> h, dalla (4-5) ricaviamo che l’elettrone ha una traiettoria circolare definita solo se l >> 2. Nel moto su questa traiettoria, la forza centripeta coincide con la forza di attrazione coulombiana tra elettrone e nucleo: e2 p2 me2 2 = p = 4 0 r 2 mr 4 0 r 4-6 da cui otteniamo: pr = 2 me2 r 2 0h = l r = l 4 0 me2 4-7 La quantità a0 = 0 h2 me2 rappresenta il cosiddetto raggio di Bohr, che vale circa 0,5·10-10 m e misura il raggio atomico dell’idrogeno (cfr. (5-1)). In definitiva, la condizione di comportamento classico dà: r = l 2 a0 r a0 4-8 In conclusione, l’elettrone effettua un moto classico solo se la sua distanza dal nucleo è molto maggiore del raggio di Bohr. Come secondo esempio consideriamo un gas rarefatto racchiuso in un recipiente (v. Fig. 4.4 b). In questo caso perchè valga il modello corpuscolare, occorre che l’indeterminazione della posizione di una molecola sia piccola rispetto all’interdistanza d tra le molecole. Per quanto concerne la direzione della traiettoria, vale la stessa condizione di prima, ossia che l’indeterminazione sull’impulso deve essere molto minore del modulo dell’impulso stesso. L’interdistanza media tra le N molecole si può ottenere nel seguente modo: dividiamo il volume V 34 Capitolo IV del recipiente (che si può immaginare di forma cubica) in N piccoli cubi, il volume di ciascuno dei quali sarà V/N e il lato (V/N)1/3. Facendo un’istantanea del gas, si troverà che i cubicini conterranno in generale numeri diversi di molecole, ma ripetendo il conteggio su un gran numero di istantanee troveremo che in media ci sarà all’incirca una molecola per ognuno. L’interdistanza media tra le molecole sarà, perciò, pari al lato di un cubicino: d = (V/N)1/3. In definitiva, il modello corpuscolare è applicabile se pd 1 h 4-9 Per una stima grossolana, possiamo supporre che tutte le molecole abbiano lo stesso impulso p. D’altra parte, se T è la temperatura del gas, la teoria cinetica insegna che l’energia cinetica media delle molecole, p2/2m, è proporzionale a T1, più precisamente: p2 3 = kBT (kB costante di Boltzmann) 2m 2 4-10 da cui ricaviamo: p = 3mk BT 4-11 Indicando, inoltre, con n il numero di molecole nell’unità di volume: n = N/V , è: d= 1 3 N = V 3 1 n Vedi p. es. D. HALLIDAY, Fondamenti di Fisica, CEA, Milano 2006. 4-12 Principio d’indeterminazione 35 La condizione di validità del modello corpuscolare si traduce, quindi, nell’espressione: 3mkBT h3 n 1 4-13 Per l’aria nelle condizioni dell’ambiente terrestre, il primo membro è dell’ordine di 100, quindi la (4-13) è soddisfatta con ampio margine. Ciò è vero per tutti i gas in condizioni non troppo diverse da quelle dell’ambiente, e questo spiega il successo della teoria cinetica nel descrivere le proprietà della materia allo stato gassoso. Come risulta dalla (4-13), il modello corpuscolare classico cessa di valere quando si verifica uno, o più, dei seguenti casi: • • • masse molto piccole (es. elettroni); elevate densità di particelle; temperature molto basse. Nei casi in cui la disuguaglianza (4-13) non sia verificata, il gas è detto degenere. La teoria statistica dei gas degeneri, che tiene conto degli effetti quantistici, è stata sviluppata da Fermi (Roma 1901– Chicago 1954) e Dirac (Bristol 1902–Florida 1984) per i gas di elettroni e da Einstein e Bose (Calcutta 1894–1974) per i gas di fotoni2. 2 E.FERMI, Molecole e cristalli, Zanichelli, Bologna 1982 5 Digressione sulla fisica dell’atomo 5.1 Dimensioni atomiche Usando il principio d’indeterminazione si possono stimare le dimensioni degli atomi. In particolare, assumendo che gli atomi abbiano forma sferica, si può determinare l’ordine di grandezza del raggio, vale a dire, non il valore preciso, ma la potenza del 10 che esprime il suo valore in una qualche unità, per esempio in metri. Consideriamo l’atomo più semplice, quello dell’idrogeno, costituito dal nucleo fatto di un solo protone attorno al quale si muove un elettrone. Dire che a è il raggio atomico (v. Fig. 5.1) significa che la probabilità di trovare l’elettrone attorno al nucleo sarà grosso modo nulla fuori della superficie sferica con centro nel nucleo e raggio a. Perciò la posizione dell’elettrone in una direzione qualsiasi, x, è indeterminata di una quantità x 2a. L’impulso è del tutto indeterminato e quindi una sua componente è indeterminata di circa il doppio del suo massimo valore, p: p 2p . Per il principio d’indeterminazione si ha quindi: p h 4a 5-1 Figura 5.1: La regione sfumata in colore rappresenta lo spazio occupato dall’elettrone durante il suo moto; p denota l’impulso dell’elettrone. 37 38 Capitolo V L’energia dell’atomo consiste di due termini: l’energia cinetica Ecin p2 h2 = 2m 32ma 2 5-2 e l’energia potenziale di Coulomb, dovuta all’attrazione del nucleo, la quale è negativa (ricordiamo che l’energia potenziale è negativa se occorre compiere lavoro per allontanare l’oggetto dal punto ove si trova all’infinito; al contrario, è positiva se il lavoro è fatto dalle forze del campo): E pot = e2 e2 4 0 r 4 0 a 5-3 dove r è la distanza dell’elettrone dal nucleo. L’energia totale in funzione di a si può, quindi, approssimativamente scrivere nella forma h2 e2 E 32ma 2 4 0 a 5-4 Per determinare a si deve porre una condizione sull’energia dell’atomo. Per questo, notiamo che ogni sistema fisico, e in particolare il nostro atomo, tende a disporsi nello stato di energia minima e a rimanerci. Infatti, se la sua energia non è la minima possibile esso tenderà spontaneamente a perdere l’energia in eccesso sotto qualche forma, cedendola all’ambiente circostante. Consideriamo, ad esempio, una guida a forma di due cunette separate da un dosso con una sferetta in equilibrio sulla cima del dosso. Una minima perturbazione farà precipitare la sferetta in una delle due cunette dove effettuerà un moto oscillatorio, il quale però si ridurra via via di ampiezza fino alla quiete, quando tutta l’energia cinetica acquistata nella discesa si sarà trasfor- Digressione sulla fisica dell’atomo 39 mata per attrito in calore. Alla fine, quindi, la sferetta viene a trovarsi in quiete al fondo della cunetta e lì rimane, poiché l’energia non può ridursi ulteriormente. Analogamente, l’elettrone del nostro atomo, soggetto alla forza attrattiva del nucleo, fa un moto accelerato e quindi, come insegna la teoria di Maxwell, se non si trovasse nello stato di energia minima, irraggerebbe energia elettromagnetica a scapito della sua energia meccanica, finché la sferettta raggiunge uno stato la cui energia non può diminuire ulteriormente. Secondo la fisica classica, l’energia di un atomo non avrebbe mai un valore minimo, ma dovrebbe diminuire senza limite. Infatti, l’energia meccanica dell’atomo è data da E= p2 e2 2m 4 0 r 5-5 D’altra parte, assumendo per semplicità che l’elettrone percorra un’orbita circolare di raggio r intorno al nucleo, la forza attrattiva del nucleo uguaglia la forza centripeta: e2 p2 p2 e2 = = 4 0 r 2 mr 2m 8 0 r 5-6 L’energia meccanica dell’atomo si può, quindi, riscrivere nella forma: E= e2 8 0 r 5-7 Pertanto, diminuendo E per via dell’irraggiamento, dovrebbe diminuire anche r (attenzione: il secondo membro è negativo per cui una sua diminuzione comporta un aumento del suo valore assoluto), finché l’elettrone non finisce sul nucleo. In sostanza, nessun atomo potrebbe esistere stabilmente. 40 Capitolo V Fortunatamente per noi, il ragionamento classico porta ad una conclusione falsa. Infatti, in base al principio d’indeterminazione a non può diminuire senza che nel contempo cresca p, poiché, come si è visto, p h/4a. Questo ci ha portato a scrivere la (5-4) per l’energia totale dell’atomo, la quale ammette un valore minimo, che si ottiene uguagliandone a zero la derivata rispetto ad a. Abbiamo: dE h2 e2 + da 16ma 3 4 0 a 2 5-8 dE 0 h 2 =0a da 4me2 5-9 da cui segue: Sostituendo i valori numerici (0 9 10-12 F/m, h 7 10-34, m 10-30 kg, e 2 10-19 C) otteniamo: a 10 10 m mentre il valore esatto, ottenuto risolvendo l’equazione di Schrödinger è dato da: 0h2 a= = 0, 528 10 10 m 2 me detto anche raggio di Bohr. Vediamo dunque che la nostra precedente stima coglie il giusto ordine di grandezza del raggio atomico: il decimiliardesimo di metro (10-10 m), detto anche Angstrom (Å). Digressione sulla fisica dell’atomo 5.2 41 Spettri atomici La radiazione emessa dagli atomi eccitati consiste di tante onde elettromagnetiche sovrapposte aventi frequenze che dipendono dalla natura degli atomi, dal loro stato di aggregazione e dalle condizioni fisiche (temperatura, ecc.). Per analizzare questa radiazione, occore separare le diverse componenti in frequenza mediante un prisma o un reticolo di diffrazione, i quali investiti da un fascetto di radiazione deviano in modo diverso le componenti che poi vengono focalizzate in punti diversi di uno schermo. Si ottiene così lo spettro di emissione della sostanza. Gli spettri degli atomi allo stato gassoso consistono di righe, ciascuna corrispondente ad una precisa frequenza (colore). Ogni specie atomica ha uno spettro caratteristico che la contraddistingue dalle altre (v. Fig. 5.2). Facendo passare una radiazione continua — per esempio, emessa da una sostanza solida ad alta temperatura, la quale emette tutte le frequenze senza soluzione di continuità — attraverso un elemento allo stato gassoso, lo spettro continuo della radiazione all’uscita presenta delle righe nere in corrispondenza delle righe dello spettro di emissione: è questo lo spettro di assorbimento dell’elemento. Poiché la radiazione di frequenza consiste di fotoni di energia h, segue che h è la minima variazione di energia dell’atomo nell’emissione o nell’assorbimento di tale radiazione. Dunque l’energia dell’atomo può variare solo di quantità pari all’energie dei fotoni che può emettere o assorbire. Figura 5.2: a) Spettro di emissione del carbonio; b) spettro di assorbimento del carbonio. 42 Capitolo V In base a ciò, Niels Bohr (Copenhagen 1885–1962) fece l’ipotesi che anche l’energia degli atomi fosse quantizzata, ossia che ogni atomo non possa avere valori qualsiasi di energia, ma solo serie discrete. Secondo Bohr, l’emissione o l’assorbimento di radiazione da parte di un atomo è sempre la conseguenza di una transizione da uno stato di energia ad un altro. Ad esempio, se l’atomo passa da uno stato con energia E2 ad uno con energia minore E1 , si ha l’emissione di un fotone di energia h, tale che: h = E2 E1 5-10 la transizione inversa esige invece l’assorbimento di un fotone della stessa energia da parte dell’atomo. Il mondo atomico è dunque caratterizzato da sistemi (radiazione, atomi) la cui energia può variare per quantità discrete, o come anche si dice, per quanti. Da ciò il termine fisica quantistica dato alla disciplina che tratta di questo mondo. 5.3 Struttura atomica e spin Consideriamo l’equazione (5-7) che esprime la relazione tra l’energia dell’elettrone e la sua distanza dal nucleo nell’atomo d’idrogeno: E= e2 8 0 r 5-11 Essa è stata dedotta per un orbita circolare, ma, intendendo r come distanza media dell’elettrone dal nucleo, ha validità generale. Nel caso di un elettrone in moto attorno ad un nucleo con Z protoni, nella (511) occorre sostituire e2 con Ze2. Si è, inoltre, mostrato (v. Par. 5.2) che gli stati stazionari elettronici di un atomo hanno energie che costituiscono serie discrete. Se Ei de- Digressione sulla fisica dell’atomo 43 nota l’energia di uno stato stazionario di un atomo con un elettrone, la distanza media ri di quest’ultimo dal nucleo è: ri = Ze2 8 0 Ei 5-12 Perciò, misurando l’energia di ionizzazione, ossia l’energia necessaria per allontanare l’elettrone dall’atomo (uguale al valore assoluto dell’energia dello stato) si può calcolare la distanza media dell’elettrone dal nucleo. Per esempio, l’energia di ionizzazione dell’atomo di idrogeno nello stato fondamentale (lo stato di più bassa energia) è 13,6 eV e la corrispondente distanza media risulta dalla (512) a0 = 0,526 Å, ossia proprio il raggio di Bohr. Mostreremo ora come dalla misura delle energie di ionizzazione di un atomo, si possono trarre informazioni sulla distribuzione degli elettroni in quell’atomo. Poiché, allontanando elettroni, il resto dell’atomo diviene via via più positivo, quelli rimanenti sono sempre più legati al nucleo. In altre parole, l’energia di ionizzazione cresce col grado di ionizzazione. Sia r1 la distanza media dal nucleo del primo elettrone che è allontanato, r2 quella del secondo, e così via. Per una stima grossolana dell’energia di ionizzazione di un elettrone supporremo che gli altri elettroni stiano nel nucleo. Il primo elettrone che viene allontanato sarà quindi soggetto a una carica nucleare Z e – (Z–1) e = e. L’ energia di ionizzazione corrispondente è quindi: E1 = e2 8 0 r1 5-13 Il secondo elettrone allontanato è soggetto alla carica Z e – (Z–2) e = 2e e la corrispondente energia di ionizzazione vale: 44 Capitolo V E2 = 2e2 e2 = 8 0 r2 4 0 r2 5-14 Generalizzando, l’energia di ionizzazione dell’ i-esimo elettrone allontanato è approssimativamente: ie2 8 0 ri 5-15 ie2 ri = 8 0 Ei 5-16 Ei = Da cui: Segue da questa equazione che due elettroni con lo stesso rapporto i/|Ei| hanno all’incirca la stessa distanza media dal nucleo. Consideriamo l’atomo di elio, che segue l’idrogeno nella Tavola Periodica di Mendeleiev. Esso ha due elettroni (Z = 2) e le energie di prima e seconda ionizzazione sono 24,6 eV e 54,4 eV rispettivamente. I due elettroni hanno, dunque, all’incirca la stessa distanza dal nucleo, pari a 0,27 Å. Il litio, con tre elettroni (Z = 3) è l’atomo successivo. L’energie di ionizzazione e le corrispondenti distanze dal nucleo sono date da: E1 = 5,40 eV, E2 = 75,6 eV e E3 = 122 eV; r1 = 1,34 Å, r2 = 0,19 Å e r3 = 0,18 Å. L’atomo di litio ha quindi due elettroni formanti un guscio interno, che hanno pressappoco ugual distanza dal nucleo, e un elettrone esterno, a una distanza dal nucleo circa sette volte maggiore. Allo stesso modo si trova che gli elementi dal litio al neon (Z = 10) hanno, come il litio, due gusci, uno interno con due elettroni e l’altro, l’esterno, con tutti gli altri. L’atomo successivo, quello del sodio (Z = 11), ha anch’esso due gusci con 2 e 8 elettroni, rispettivamente, ma il rimanente elettrone è molto più distante dal nucleo. Digressione sulla fisica dell’atomo 45 Riassumendo, i valori sperimentali delle energie di ionizzazione di un atomo mostrano che gli elettroni sono distribuiti in gusci, che possono essere immaginati come sfere concentriche attorno al nucleo. Ognuno di questi gusci può contenere fino a un certo numero di elettroni: il guscio più vicino al nucleo, il cosiddetto guscio K, ne può contenere fino a 2. Il successivo, guscio L, fino a 8 e così pure il seguente guscio M, mentre il guscio N arriva a contenerne 18. Al crescere del numero di elettroni i gusci divengono sempre più popolati e vicini tra loro. La Figura 5.3 mostra la distribuzione degli elettroni negli atomi dei primi tre periodi della Tavola di Mendeleiev. Gli atomi di una colonna hanno lo stesso numero di elettroni nel guscio esterno, per cui, poiché essi, nonostante i diversi Z e le differenti masse, hanno proprietà chimiche simili, appare evidente che queste ultime dipendono dal numero di elettroni esterni. Per spiegare la struttura a gusci degli atomi, è necessario considerare le caratteristiche delle onde elettroniche corrispondenti agli stati con energia definita dell’atomo. Tali onde sono usualmente chiamate orbitali, dal nome delle traiettorie classiche degli elettroni nel modello planetario di Rutherford e dei pianeti intorno al sole, dette appunto orbite. Figura 5.3: Configurazione elettronica degli atomi delle prime tre righe del sistema periodico. 46 Capitolo V Come risulta dalla teoria quantistica, le caratteristiche geometriche degli orbitali sono le stesse per tutti gli atomi. Ci limiteremo a darne solo la descrizione. L’orbitale di energia più bassa è indicato con 1s, la corrispondente distribuzione di probabilità ha simmetria sferica e decresce al crescere della distanza dal nucleo (v. Fig. 5.4). In ordine di energia crescente, troviamo l’orbitale 2s avente, come l’1s, simmetria sferica, ma col massimo ad una certa distanza dal nucleo. Seguono tre orbitali, indicati con 2px, 2py e 2pz (v. Fig. 5.5), aventi la stessa energia. L’orbitale successivo, 3s, ha simmetria sferica e due massimi relativi, seguono poi gli orbitali 3px, 3py e 3pz. Qui ci limiteremo a considerare questi primi gruppi di orbitali. Aggiungiamo solo che per energie ancora maggiori troviamo orbitali sempre di tipo ns e np con n = 4, 5, … ma anche altri orbitali con simmetrie più complicate; in ogni caso la distanza media dell’elettrone che occupa un dato orbitale dipende soprattutto dal numero n, detto numero quantico principale. Si ha perciò che il guscio K consiste dell’orbitale 1s, mentre i gusci L e M consistono ognuno di quattro orbitali, 2s, 2px, 2py, 2pz e 3s, 3px, 3py, 3pz, rispettivamente. Poiché il numero massimo degli elettroni nel guscio K è 2 e nei gusci L ed M è 8, segue che in ciascun orbitale ci possono stare al più due elettroni. Così per ottenere lo stato di più bassa energia (stato fondamentale) dell’atomo, pensando di aggiungere al nucleo un elettrone alla volta, il primo elettrone occuperà l’orbitale 1s e lo stesso il secondo. Figura 5.4: Densità di probabilità relative agli orbitali 1s e 2s, entrambi di simmetria sferica. Digressione sulla fisica dell’atomo 47 Così, il guscio K sarà completamente riempito. Il terzo e quarto elettrone occuperanno l’orbitale 2s, che ha un’energia leggermente inferiore dei 2p, il quinto elettrone uno dei 2p e così via, fino a riempire il guscio L con otto elettroni. Lo stesso dicasi per il guscio M e così via. Perché un orbitale può essere occupato con al più due elettroni? Perché tutti gli elettroni non vanno ad occupare l’orbitale 1s che è quello di energia più bassa? Queste domande preoccuparono Niels Bohr per molto tempo. La risposta ad esse fu basata su una ipotesi statistica ad hoc. Anzitutto, era già noto che gli elettroni non fossero solo semplici particelle cariche, ma ruotassero come microscopiche trottole, cioè possedessero uno spin (v. B.2)1. Esperimenti effettuati da Otto Stern e Walther Gerlach tra il 1921 e il 1924 (v. Par. 5.4) mostrarono che, inaspettatamente, lo spin dell’elettrone può avere solo due componenti uguali ed opposte lungo una direzione data, come se, fissata una direzione, l’asse della “trottola elettronica” potesse orientarsi solo in un verso o in quello opposto (v. Fig 5.6). I valori della componente sono ± / 2 . La loro differenza è precisamente , cioè l’unità di momento angolare. Figura 5.5: Distribuzione polare degli orbitali px, py, pz: la lunghezza del raggio da un punto della superficie all’origine è proporzionale alla probabilità di trovare un elettrone nella direzione del raggio. 1 M. B ORN, Fisica atomica, Boringhieri, Bologna 1968. 48 Capitolo V L’ipotesi introdotta escludeva che in un atomo potessero esservi due elettroni con le stesse caratteristiche ed è espressa dal cosiddetto principio di Pauli (Vienna 1900–Zurigo 1958), o principio di esclusione: non più di due elettroni possono occupare lo stesso orbitale o, più in generale, avere la stessa funzione d’onda, e qualora due elettroni occupino lo stesso orbitale devono avere componenti dello spin opposte. Figura 5.6: Le due possibili orientazioni dello spin elettronico rispetto a una direzione prescelta. Figura 5.7: Al pari di due signore che, indossando lo stesso cappellino, tendono ad evitarsi, due elettroni con la stessa componente dello spin non potranno occupare il medesimo orbitale. Digressione sulla fisica dell’atomo 49 In accordo col principio di esclusione, l’atomo di elio con due elettroni nell’orbitale 1s ha spin totale nullo, poiché gli spin dei due elettroni sono opposti. L’atomo di litio ha due elettroni nell’orbitale 1s e solo uno nel 2s, cosicché lo spin totale è . L’atomo di berillio, che ne ha due di elettroni nell’orbitale 2s, ha spin nullo. Gli orbitali 2p cominciano a riempirsi col boro e si riempiono sempre più negli atomi successivi, fino all’atomo di neon, che ha 10 elettroni: due nell’1s, due nel 2s e sei nei 2p, cioè i gusci K e L sono completi e lo spin totale è nullo. Procedendo in questo modo nel riempimento dei gusci atomici si determinano le configurazioni elettroniche di tutti gli atomi. 5.4 Esperimento di Stern e Gerlach 5.4.1 Premessa Dall’elettromagnetismo è noto che una corrente elettrica che percorre una piccola spira chiusa è equivalente a un dipolo magnetico, nel senso che entrambi producono lo stesso campo magnetico (v. Fig. 5.8). Il dipolo magnetico può essere concepito come un piccolo magnete lineare, cioè due masse magnetiche, ±m, uguali ed opposte, a una certa (piccola) distanza, a, tra loro. Il cosiddetto momento magnetico del dipolo è definito come un vettore μ di modulo μ = ma e avente la direzione che va dalla massa magnetica sud (negativa) alla massa magnetica nord (positiva). Le masse magnetiche sono un’astrazione, i campi magnetici sono in realtà prodotti dalle correnti, sia quelle macroscopiche sia quelle dovute al moto degli elettroni negli atomi. Si dimostra che il momento magnetico di una corrente i che percorre una piccola spira che racchiude l’area ha modulo μ = i ed è diretto come la normale alla spira con verso tale che, guardando a ritroso lungo la normale, la corrente appare girare in senso antiorario. In breve, una spira e un dipolo aventi lo stesso momento magnetico producono lo stesso campo. Questo è il ben noto principio di Ampère. Consideriamo ora un elettrone che percorre una piccola traiettoria circolare di raggio r con frequenza n (numero di giri al secondo). Attraverso una piccola area ortogonale alla linea di moto l’elettrone pas- 50 Capitolo V sa n volte al secondo, per cui nel suo moto equivale a una corrente i = en (e = carica dell’elettrone) che percorre una spira di area r2. L’elettrone rotante possiede perciò un momento di dipolo μ = e n r2. Poiché v = n 2 r è la velocità dell’elettrone, tenendo conto che il modulo del suo momento angolare è dato da l = mvr e che di solito lo si mvr ), si ha: esprime in unità ( l = μ= e l 2m 5-17 da cui segue che il momento magnetico dell’elettrone è proporzionale al momento angolare e ha verso opposto (la carica dell’elettrone è negativa). Figura 5.8: Equivalenza tra un dipolo magnetico e una corrente circolare (principio di Ampère). Digressione sulla fisica dell’atomo 51 La precedente relazione vale per un elettrone in moto lungo una piccola traiettoria circolare. Per lo spin si è trovato che vale una relazione simile, con costante di proporzionalità doppia. μ= e s m 5-18 Analizziamo ora il comportamento meccanico di un dipolo magnetico posto in un campo magnetico, (v. Figg. 5.9 a e 5.9 b). Se il campo è costante nella regione occupata dal dipolo, le forze sulle due masse magnetiche sono uguali e contrarie. Sul dipolo agisce quindi una coppia che tende a far ruotare il dipolo attorno al vettore momento M della coppia stessa e a orientarlo nella direzione del campo. Figura 5.9: a) schema di dipolo magnetico e relativo momento di dipolo. b) Un dipolo magnetico posto in un campo magnetico (B0) è soggetto a una coppia che tende ad orientarlo nella direzione del campo. c) La rotazione del dipolo avviene in senso antiorario attorno al vettore (M) momento della coppia. d) Una coppia come quella agente sul dipolo agisce anche su un atomo avente momento magnetico, ma l'effetto è diverso, anziché una rotazione attorno ad M, si ottiene una precessione attorno a B0. 52 Capitolo V Nella configurazione in cui il dipolo è parallelo al campo il momento della coppia è nullo e il dipolo può rimanere in equilibrio o oscillare attorno alla direzione del campo. Diverso è l’effetto del campo su un elettrone o su un atomo dotato di momento angolare. Secondo le leggi classiche applicate al giroscopio (trottola) l’azione della coppia, il cui momento M è ortogonale al campo (v. Fig. 5.9 c), non produce, come prima, una rotazione di μ attorno ad M, bensì un moto di precessione del momento angolare l (o s), e quindi di μ , attorno alla direzione del campo (v. Fig. 5.9 d). Dunque, l’angolo tra μ e il campo rimane costante. Nell’esperimento di Stern e Gerlach fu usato un magnete con un polo piatto e l’altro a forma di cuneo in modo da creare un campo B fortemente disomogeneo, crescente dal basso verso l’alto (v. Fig. 5.10 a). In tal caso, se un dipolo magnetico forma l’angolo con la direzione del campo, la differenza z tra la quota della massa positiva e quella della massa negativa è z = a cos , cioè, se z è la quota della massa negativa, sul dipolo agisce, oltre alla coppia, una forza diretta verso l’alto data da: B(z + z) B(z) Fz =m [ B(z + z) B(z)] = m z z 5-19 Poiché a è molto piccolo, possiamo approssimare il rapporto incrementale con la derivata e scrivere: Fz =m z dB dB = ma cos dz dz 5-20 ovvero, essendo μz = ma cos la componente del momento magnetico nella direzione z del campo, Digressione sulla fisica dell’atomo Fz = μ z dB dz 53 5-21 Si dimostra che una identica espressione vale anche per gli elettroni e per gli atomi dotati di momento magnetico. Quindi un elettrone — o un atomo — posto in un campo magnetico disomogeneo acquista, oltre al moto di precessione del suo momento magnetico, anche una forza accelerante nel verso del gradiente del campo. Tale forza è proporzionale alla componente del momento magnetico μ lungo il campo, per cui se μ è ortogonale al campo la forza è nulla mentre è massima se μ è parallelo al campo. Figura 5.10: a) Linee magnetiche schematiche nel magnete di Stern–Gerlach; b) sdoppiamento del fascetto di atomi dovuto all’interazione del momento magnetico atomico col campo disomogeneo. 54 Capitolo V 5.4.2 Esperimento Nell’esperimento di Stern e Gerlach, dell’argento metallico era vaporizzato in un forno avente una serie di diaframmi, ognuno con un piccolo foro allineato a quello degli altri, in modo che dall’ultimo diaframma emergesse uno stretto fascetto di atomi d’argento che penetrava infine nel campo inomogeneo del magnete. Gli atomi d’argento hanno un solo elettrone nel guscio esterno, costituito dall’orbitale 4s, mentre tutti gli altri elettroni, occupanti i gusci interni, sono accoppiati con spin opposti. Perciò un atomo d’argento è una particella di spin , come l’elettrone, ma, a differenza di quest’ultimo, è elettricamente neutro. Fu pertanto possibile studiare l’azione di un campo magnetico inomogeneo su uno spin quantistico evitando la complicazione di deflessioni del fascetto dovute all’interazione di cariche in movimento col campo. Si osservò che nell’attraversare il campo il fascetto si divideva in due fascetti, i quali, come mostravano le macchie d’argento lasciate sullo schermo (v. Fig. 5.10 b), erano deflessi simmetricamente rispetto al fascetto entrante e, inoltre, avevano la stessa intensità. Questo significa che metà degli atomi avevano un momento magnetico parallelo a B e l’altra metà antiparallelo a B. 5.4.3 L’inconciliabile disaccordo con la fisica classica Questo risultato contrasta nettamente con quanto prevede la fisica classica. Per vederlo, supponiamo, com’è del tutto plausibile, che il fascetto uscente dal forno contenga atomi con spin orientati a caso. Riportando a partire da una stessa origine i momenti magnetici degli atomi, le loro estremità risulteranno distribuite uniformemente su una superficie sferica di raggio | μ | modulo del momento magnetico (v. Fig. 5.11). D’altra parte, come si è visto, i momenti magnetici degli atomi precedono attorno alla direzione del campo, per cui l’angolo che essi formano col campo non cambia e di conseguenza non cambia neppure la distribuzione dei loro estremi sulla predetta superficie sferica, nel senso che rimane costantemente isotropa. Immaginiamo la direzione del campo come asse polare della sfera in questione. Digressione sulla fisica dell’atomo 55 Considerando una striscia sottilissima di ampiezza angolare attorno ad un parallelo (v. Fig. 5.11), la sua area e, quindi, il numero dei punti al suo interno crescono al crescere dell’angolo da 0 a /2 per poi decrescere fino ad annullarsi di nuovo per = : per = /2 si ha la striscia equatoriale che ha area massima ed è quindi massimo il numero di punti ivi contenuti. In generale per un dato il numero N di punti entro la striscia corrispondente è proporzionale all’area della striscia: N 2 μ sin μ = 2 μ2 sin 5-22 Tuttavia, a noi interessa la dipendenza di N da , per cui porremo semplicemente N sin. D’altra parte gli atomi aventi l’estremo del vettore μ entro la striscia sono soggetti alla forza dB dB , perciò subiscono nel tempo di volo entro il Fz = μ z = μ cos dz dz magnete uno spostamento z proporzionale a Fz, ossia z = C cos , ove C è una costante data. Figura 5.11: La sfera è il luogo geometrico degli estremi dei momenti magnetici degli atomi del fascetto entrante nel magnete. 56 Capitolo V Dopo qualche semplice passaggio otteniamo perciò: N C 2 z 2 5-23 L’espressione a secondo membro ha un massimo per z = 0, quindi decresce al crescere di | z | annullandosi per z =±C. In conclusione, secondo la fisica classica gli atomi d’argento dovrebbero formare un’immagine singola con intensità massima al centro, cioè nella direzione del fascetto entrante, e quindi decrescente fino ad annullarsi per z =±C (v. Fig 5.12). Ciò in evidente contraddizione col risultato dell’esperimento. 5.4.4 L’interpretazione quantistica Come si è visto, la teoria quantistica stabilisce che il valore di una grandezza relativa ad un sistema atomico non è determinabile con precisione prima che la grandezza sia misurata (v. App. C). Se la misura concerne la componente dello spin di un atomo lungo un certo asse, diciamo l’asse z, lo stato dello spin prima della misura sarà descritto in termini dei possibili risultati, ovvero come sovrapposizione degli stati, ciascuno dei quali relativo ad un dato valore della componente lungo z, in modo che la probabilità di ciascuno di essi può essere valutata. Figura 5.12: Intensità dell’immagine sullo schermo del dispositivo di Stern–Gerlach secondo la fisica classica. Digressione sulla fisica dell’atomo 57 Solo dopo che la misura è stata effettuata, la componente dello spin possiede un valore determinato. In altre parole la misura determina la transizione dallo stato precedente, in cui la componente lungo z è indefinita, verso un stato corrispondente ad un preciso valore della componente di spin. Ripetendo la misura su un numero sufficientemente alto di atomi, si otterranno quindi tutte le possibili componenti dello spin nella direzione fissata, ognuna un numero di volte proporzionale alla corrispondente probabilità. Nell’esperimento di Stern e Gerlach è il campo magnetico inomogeneo che determina la misura delle componenti degli spin atomici, nel senso che esso devia il moto degli atomi a seconda del valore della loro componente di spin, cosicchè si formano tanti fascetti separati quante sono le componenti diverse dello spin. Nel caso degli atomi d’argento, che hanno spin , il fascio entrante è diviso in due fascetti, uno costituito di atomi con spin di componente + e l’altro di atomi con spin di componente –. Poiché le immagini che i due fascetti lasciano sullo schermo sono ugualmente intense, si deve inferire che un atomo in ingresso è in uno stato in cui le due componenti lungo il campo hanno la stessa probabilità di essere “attuate” dalla misura. 6 Indeterminazione e complementarità 6.1 Esperimento delle due fenditure: qual è la traiettoria dell’elettrone? Consideriamo di nuovo l’esperimento di interferenza elettronica, esposto nel Cap. III. Se fra il diaframma e lo schermo ci sono le due onde elettroniche diffratte dai due fori, è possibile che vi siano anche gli elettroni? Si può stabilire da quale foro proviene un elettrone rivelato in un dato punto dello schermo? Un esperimento che, in linea di principio, potrebbe rispondere a queste domande è il seguente, suggerito anch’esso da Feynman1. Figura 6.1: Esperimento ideale per determinare la traiettoria di un elettrone tra il diaframma e la matrice di rivelatori. 1 R. FEYNMAN, op. cit., vol. III. 59 60 Capitolo VI A valle del diaframma viene posta una sorgente di luce di piccola lunghezza d’onda, in modo che ogni elettrone illuminato diffonda la luce permettendo di osservare da quale foro è passato (Fig. 6.1). Se, per esempio, è passato dal foro 1, qualora la lunghezza d’onda sia abbastanza piccola da rendere sufficiente la risoluzione, noi vediamo la luce diffusa dall’elettrone provenire da una regione circostante a questo foro. Ebbene, l’esperimento mostrerebbe, com’è del tutto ovvio, che gli elettroni passano per metà da un foro e per metà dall’altro. Tuttavia, accendendo la luce, la figura di interferenza scompare e al suo posto si ottiene la stessa distribuzione che otterremmo chiudendo prima un foro e poi l’altro. Questo risultato può essere interpretato in base al principio di indeterminazione. Infatti, quando l’elettrone non è illuminato, poiché non sappiamo da quale foro è passato, la sua posizione a valle del diaframma ha un’indeterminazione dell’ordine della distanza tra i forellini. L’illuminazione, permettendoci di individuare il foro da cui l’elettrone è passato, riduce questa indeterminazione a una piccola regione nell’intorno di quel foro. Tuttavia, nello stesso tempo, l’illuminazione incrementa l’indeterminazione dell’impulso, perché i fotoni, “urtando” gli elettroni, ne deviano a caso le traiettorie sparpagliandoli sullo schermo. Ebbene, il calcolo mostra che lo sparpagliamento degli elettroni ha proprio l’effetto di distruggere la figura di interferenza. In sostanza, l’osservazione della traiettoria seguita dagli elettroni a valle del diaframma, ossia il loro aspetto corpuscolare, impedisce che si possa osservare allo stesso tempo l’aspetto ondulatorio, ossia la figura d’interferenza. In altre parole: I due aspetti corpuscolare e ondulatorio sono complementari, nel senso che una disposizione sperimentale atta a rivelarne uno preclude la possibilità di rivelare l’altro e viceversa. Questo è un enunciato particolare di un principio generale formulato da Niels Bohr e che va sotto il nome di principio di complementarità. Indeterminazione e complementarità 61 Per quanto detto, il principio di complementarità sarebbe quindi spiegato dalla perturbazione della luce sugli elettroni. Sorge allora la domanda: se l’informazione su quale foro è attraversato dall’elettrone si potesse ottenere senza arrecare alcuna perturbazione, la figura di interferenza permarrebbe? Molti esperimenti del genere sono stati immaginati fin dagli anni che seguirono la formulazione della teoria quantistica, ma la loro realizzazione era impedita dalla mancanza della tecnologia necessaria. Solo a partire dall’ultimo decennio del secolo scorso, con l’acquisizione di tecniche elettroniche superveloci e della manipolazione atomica, e col progresso dei laser si sono potuti progettare ed eseguire esperimenti atti a tale scopo. 6.2 Interferenza con luce diffusa da due atomi Uno di questi esperimenti fu eseguito nel 1993 da U. Eichmann dell’Università di Friburgo in collaborazione con ricercatori del NIST del Colorado e dell’Università del Texas. L’articolo, pubblicato sul n.16 del Vol. 70 (19 Aprile 1993) del Physical Review Letters, comincia così: «L’esperimento di Young delle due fenditure, nel contesto della dualità onda-particella, è spesso considerato come un paradigma per i fenomeni quantistici. Per alcuni esso “ha in sé il cuore della meccanica quantistica. In verità, contiene il solo mistero”. In questa lettera noi riportiamo, per la prima volta, una versione dell’esperimento di Young dove noi riveliamo l’interferenza di una luce laser debole diffusa da due atomi localizzati, i quali agiscono come due fenditure». I due atomi in questione sono ioni di mercurio (198Hg+), localizzati ad una distanza di qualche micron (milionesimo di metro) l’uno dall’altro per mezzo di una trappola ionica (v. Fig. 6.2). Ci interessano qui due livelli energetici dello ione: quello di più bassa energia, di tipo 2S e l’altro di tipo 2P. Nella Figura 6-3 ciascun livello è rappresenato da due segmenti orizzontali con freccette di verso opposto, ad indicare che per ogni livello ci sono due stati corrispondenti a valori opposti del momento angolare dell’atomo. 62 Capitolo VI La differenza di energia tra il livello 2P e il livello 2S è pari a 6.41 eV, per cui la lunghezza d’onda dei fotoni assorbiti nella transizione 2 S 2 P o emessi nella transizione inversa è data da: h = hc = 6.41 eV =194 nm Nell’esperimento in questione (v. Fig. 6.3), i due ioni di mercurio, posti nella trappola ionica ad una distanza di qualche micron (1 μ=10-6 m), sono investiti da un fascetto di luce laser, accordato alla lunghezza d’onda di 194 nm, avente polarizzazione lineare, ossia con il campo elettrico che oscilla in una direzione fissa (v. A.6); i corrispondenti fotoni sono detti fotoni . Quando un fotone è assorbito, l’atomo assorbitore passa dal livello 2S al livello 2P, senza che cambi l’orientazione del momento angolare (frecce rosse verso l’alto in Figura 6-3), ma poiché gli stati eccitati sono instabili, lo ione decade di nuovo nello stato più basso. Figura 6.2: Trappola ionica. Consiste di quattro piccoli cilindri (diametro 1,6 mm, lunghezza 12,6 mm). Ogni cilindro è diviso in due parti, elettricamente isolate, tra cui è applicata una tensione alternata. Inoltre, una tensione costante U è applicata alle parti più corte dei cilindri adiacenti e un voltaggio nullo tra quelle più lunghe. Con tale configurazione, nel centro della trappola, si crea un potenziale elettrico con due minimi nei quali i due ioni Hg+ possono stare stabilmente. La distanza tra i due minimi decresce al crescere di U ; usando il valore indicato essa è 3,6 μm. Indeterminazione e complementarità 63 La transizione di emissione (frecce rosse verso il basso) può avvenire in due modi sostanzialmente equiprobabili: nel primo viene emesso un fotone e quindi non cambia l’orientazione del momento angolare, nel secondo viene emesso un fotone , che ha polarizzazione circolare (la direzione di oscillazione del campo elettrico dell’onda ruota uniformemente lungo la direzione di propagazione). In questo caso la transizione è accompagnata dall’inversione del momento angolare. Quindi, se il fotone emesso è di tipo , è possibile conoscere, almeno in linea di principio, quale dei due atomi lo abbia emesso, poiché quest’atomo possiede alla fine del processo un momento angolare invertito rispetto a quello che aveva all’inizio. Se invece il fotone emesso è di tipo , non è possibile stabilire quale sia stato l’atomo emettitore. I fotoni del fascio incidente sono tutti nello stesso stato descritto da una onda piana di lunghezza d’onda pari, appunto, a 194 nm. Poiché non è dato di sapere quale dei due atomi assorbe il fotone incidente, l’onda fotonica diffusa consisterà di due onde divergenti, una uscente da uno ione e l’altra dall’altro. Figura 6.3: Le piccole freccette blu sulle linee dei livelli denotano le due opposte direzioni dello spin, mentre quelle rosse indicano le transizioni nell’assorbimento dei fotoni e nelle successive emissioni e . 64 Capitolo VI Nella configurazione sperimentale di Figura 6-4a, si ottiene sullo schermo un’immagine a cui contribuiscono sia fotoni sia fotoni . D’altra parte, si è detto che, per ogni fotone che giunge in un dato punto dello schermo, è possibile in linea di principio stabilire quale atomo lo abbia emesso e quindi individuarne la traiettoria, solo se si tratta di un fotone . Figura 6.4: Diffusione della luce laser da parte di due ioni 198Hg+. Il fascio incidente è inclinato rispetto alla perpendicolare allo schermo per evitare che l’immagine oscuri quella delle onde diffuse.L’aspetto di questa immagine, con massimi dell’intensità alternati a minimi, è quello di una tipica figura d’interferenza. Indeterminazione e complementarità 65 Pertanto, poiché lo scopo dell’esperimento è di verificare la possibilità di poter individuare simultaneamente l’aspetto corpuscolare (traiettoria) e quello ondulatorio (interferenza) dovremmo “eliminare” dall’immagine sullo schermo il contributo dei fotoni . Per questo si inserisce di fronte allo schermo un filtro che li blocca, in modo che la figura che si forma sullo schermo sia prodotta dai soli fotoni . Ebbene, con l’introduzione del filtro scompare immediatamente la figura di interferenza (v. Fig. 6.4b). In sostanza, l’aspetto ondulatorio si manifesta solo con i fotoni . Al contrario, il fatto che possa essere determinato l’atomo emettitore di fotoni e quindi la loro traiettoria, preclude la possibilità di osservarne l’aspetto ondulatorio. Si ricorderà che il principio di complementarità è stato all’inizio considerato una conseguenza del principio d’indeterminazione, per cui l’impossibilità di osservare simultaneamente i due aspetti sarebbe dovuta al fatto che l’osservazione di uno perturba il sistema in modo tale che l’osservazione dell’altro aspetto risulta impedita. L’esperimento descritto ora conferma la validità del principio di complementarità e mostra nel contempo che non è necessario osservare realmente uno degli aspetti perché sia preclusa l’osservazione dell’altro, ma è sufficiente che l’apparato sperimentale preveda tale osservazione, anche senza metterla in atto. Infatti, per far scomparire la figura d’interferenza è bastato che fosse possibile misurare l’orientazione del momento angolare dei due ioni, senza che occorresse misurarla effettivamente. 6.3 Esperimento di Rochester Nell’esperimento in questione si utilizza un dispositivo che produce due onde coerenti in modo diverso da quello delle due fenditure. 6.3.1 Interferenza di onde emergenti da un divisore di fascio Consideriamo un vetrino piano con un rivestimento d’argento di spessore tale che un fascetto di luce che incide a 45° è per metà trasmesso e per metà riflesso (specchio semiargentato) (v. Fig. 6.5). Tale dispositivo è detto divisore di fascio (beamsplitter). 66 Capitolo VI Naturalmente, il singolo fotone segue l’una o l’altra delle due strade, ma poiché non è dato di stabilire quale, l’onda fotonica si divide in due onde coerenti: una procede a diritto e una è riflessa. Le due parti, deviate di un angolo retto dalla riflessione sugli specchietti, incidono quindi sul beamsplitter Bs2. Pertanto, nel tratto Bs2A, la parte riflessa da Bs2 dell’onda superiore si sovrappone con la parte trasmessa dell’onda inferiore. Invece, nel tratto Bs2B, è la parte trasmessa da Bs2 dell’onda superiore che si sovrappone con la parte riflessa dell’onda inferiore. L’onda risultante dalla sovrapposizione delle due onde in ciascuno dei due rami dipende dalla fase relativa delle due onde. Al solito, se, ad esempio, i massimi di una coincidono coi massimi dell’altra si ha interferenza costruttiva e l’onda risultante ha ampiezza doppia e quindi intensità quattro volte quella delle due onde componenti; se, invece, i massimi di una coincidono coi minimi dell’altra si ha interferenza distruttiva e l’onda risultante ha ampiezza e quindi intensità nulle. Per tutte le altre fasi relative si hanno intensità intermedie tra la nulla e la massima. L’intensità risultante lungo i due cammini si ottiene dalla frequenza di conteggio dei fotomoltiplicatori (contatori di fotoni) A e B. La fase relativa delle due onde può essere cambiata con spostamenti microscopici di Bs2 in direzione ortogonale alla sua superficie. Figura 6.5: L’interferenza delle due onde uscenti dal divisore di fascio è rivelata dalle oscillazioni nei conteggi dei fotomoltiplicatori A e B. Indeterminazione e complementarità 67 In tal modo cambia infatti il punto e quindi la fase con cui ciascuna di esse incide su Bs2. Supponiamo di aver disposto le cose in modo che le onde risultanti lungo Bs2A e Bs2B abbiano la prima intensità nulla e la seconda massima. In tali condizioni B segnala il conteggio massimo mentre A non dà conteggio. Con spostamenti microscopici di Bs2, si cambiano le intensità delle onde nei due rami, cosicché il conteggio di B decresce fino ad annullarsi, mentre quello di A cresce fino al massimo, e così via. Queste oscillazioni dei conteggi, in funzione della posizione di Bs2 sono, appunto, rivelatrici dell’interferenza delle onde nei due rami. Questa disposizione sperimentale, in accordo col principio di complementarità, consente dunque di verificare l’aspetto ondulatorio dei fotoni, ma non di determinare quale cammino essi compiono. Ebbene, nell’esperimento che seguirà, l’apparato strumentale è predisposto in modo da determinare anche la traiettoria dei fotoni, senza con questo perturbarli direttamente, Lo scopo è quello di verificare se la figura d’interferenza viene distrutta anche in assenza di una perturbazione diretta. 6.3.2 Conversione parametrica Prima di analizzare l’esperimento, è utile descrivere un ulteriore dispositivo, che ha una funzione fondamentale. Si tratta del convertitore parametrico (v. Fig. 6.6), detto anche, con parola inglese, downconverter, che funziona così: quando un fascio di luce laser monocromatica, di frequenza 0, penetra in particolari cristalli birifrangenti, per esempio di LiIO3, c’è una piccola probabilità (dell’ordine di 1 su un milione) che uno dei fotoni del fascio decada spontaneamente e casualmente in due fotoni: uno detto segnale (s) e l’altro, con termine inglese, idler (i), che vuol dire pigro (dei due è quello più lento nel cristallo), i quali hanno entrambi polarizzazioni lineari, ma ortogonali tra loro (v. A.6). Ricordiamo che un fotone di frequenza trasporta energia h e impulso h/c(), dove nella fattispecie c() è la velocità della radiazione entro il cristallo, la quale dipende dalla frequenza e, in ogni caso, è minore della velocità della luce nel vuoto. Definendo vettore impulso 68 Capitolo VI k quel vettore che ha per modulo h/c() e per direzione quella di propagazione del fotone, valgono le relazioni: 0 = s + i k0 = ks + ki le quali esprimono la conservazione dell’energia e dell’impulso, rispettivamente, nel processo di decadimento del fotone incidente. 6.3.3 L’esperimento L’esperimento in questione fu eseguito dal gruppo di Leonard Mandel presso l’Università di Rochester (New York) nel 19912. Lo schema dell’apparato è illustrato in Fig. 6.7. Il fascetto di un laser ad argon, 0=351,1 nm, è diviso in due dal beamsplitter Bs1. Come si è già detto, il singolo fotone, segue una delle due strade ma non è dato sapere quale, per cui la rispettiva onda di probabilità (onda fotonica) si propaga lungo i due cammini c1 e c2. Figura 6.6: Un fotone di un fascio laser all’ultravioletto decade entro il cristallo in due fotoni, s e i, le cui direzioni giacciono su superfici coniche. 2 X.Y. Zou, L.J. Wang, and L. Mandel, Phys. Rev. Lett., 67, 318 (1991) Indeterminazione e complementarità 69 Su ciascuno di questi ultimi è posto un convertitore parametrico (CP), entro il quale una piccola percentuale dei fotoni incidenti decade in un fotone segnale, s=788,7 nm, e in un fotone idler, i=632,8 nm. Se un fotone decade in Cp1, il fotone segnale si propaga lungo s1 e il fotone idler lungo i1. Se invece decade in Cp2, i fotoni segnale e idler si propagano lungo s2 e i2 rispettivamente. Le onde fotoniche s1 e s2, sebbene abbiano la stessa frequenza, non sono coerenti, e lo stesso vale per le onde fotoniche i1 e i2. Il decadimento di un fotone in un convertitore parametrico è infatti un evento casuale per cui, anche se le onde fotoniche entranti in due diversi convertitori sono, come nel nostro caso, coerenti, le onde uscenti non lo sono. L’esperimento mostra infatti che, facendo incidere le onde fotoniche s1 e s2 sul beamsplitter Bs2 e conferendo a questo spostamenti micrometrici, il contatore Ds non segnala interferenza, ovvero il suo conteggio rimane invariato. Questo risultato è in accordo col principio di complementarità, poiché in queste condizioni è possibile stabilire il percorso dei fotoni. Infatti, i fotoni i2 e s2 sono creati insieme — così come i1 e s1 —; pertanto, assumendo che, i percorsi dal punto di creazione ai contatori Ds e Di siano di ugual lunghezza, i2 e s2 fanno scattare simultaneamente i rispettivi contatori. Figura 6.7: Schema della disposizione sperimentale di Mandel e collaboratori 70 Capitolo VI Quindi, un fotone c2 che decade in Cp2 fa sì che si registri uno scatto simultaneo in Ds e Di. Un fotone c1 che decade in Cp1 fa invece scattare, col fotone s1, solo il contatore Ds, poiché il fotone i1 non finisce su alcun contatore. Riassumendo, se simultaneamente a uno “scatto” del contatore Ds si ha anche uno scatto del contatore Di, vuol dire che il fotone originario è passato dal percorso c2. Se invece lo “scatto” di Ds non è accompagnato da un simultaneo scatto di Di, vuol dire che il fotone originario ha fatto il percorso c1. L’apparato viene ora modificato in modo che i fotoni idler i1 prodotti in Cp1 entrino in Cp2, e vi entrino proprio nella direzione i2 . Ebbene, appena l’allineamento è stabilito, il contatore Ds segnala il conteggio oscillante tipico dell’interferenza di onde coerenti. In breve, allineando esattamente i1 e i2 le onde lungo s1 e s2 divengono coerenti. Anche questo risultato si accorda perfettamente col principio di complementarità, poiché in queste condizioni viene meno la conoscenza dei percorsi fatti dai fotoni. Se i tratti i2 e i1 sono allineati non è infatti possibile dire se uno “scatto” di Di sia dovuto a un fotone idler i2 creato entro Cp2 o a un fotone idler i1 creato entro Cp1 e che attraversa Cp2 e incide su Di facendolo scattare. La scomparsa dell’interferenza, oltre che disallineando i1 e i2, può essere ottenuta anche interponendo uno schermo lungo i1 in modo da bloccare i fotoni in questo tratto ed eliminare così l’ambiguità su quale dei fotoni i1 e i2 fa scattare Di. Nel finale dell’articolo di Mandel e collaboratori si legge: «Dovrebbe essere notato che la scomparsa della figura d’interferenza non è qui il risultato di un ampio disturbo incontrollabile, nello spirito del microscopio a raggi di Heisenberg, ma semplicemente una conseguenza del fatto che i due possibili cammini dei fotoni s1 e s2 sono divenuti distinguibili». Poiché i fotoni di una coppia segnale-idler sono emessi insieme, una volta che la connessione i1, i2 è interrotta, diventa possibile determinare, dai conteggi di Di, se un fotone segnale rivelato da Ds provie- Indeterminazione e complementarità 71 ne da Cp1 o da Cp2, e ciò distrugge l’interferenza. Se questa misura con Di sia stata o meno fatta, o se questo rivelatore sia acceso oppure spento, non ha importanza. È sufficiente che la misura possa esser fatta e che il cammino dei fotoni diventi identificabile in linea di principio perché l’interferenza scompaia. Da questo esperimento emerge un altro aspetto peculiare delle particelle elementari, noto come non località, per cui, ad esempio, nello stesso preciso istante in cui si pone lo schermo lungo i1, distante dal percorso dei fotoni segnale, le onde fotoniche s1 e s2 diventano incoerenti, tanto che l’interferenza scompare. Sembra, quindi, che valga il seguente principio di non località: Un evento atomico o subatomico, che avviene in una data regione spaziale, può essere sostanzialmente ed istantaneamente modificato da un cambiamento dell’apparato sperimentale fatto al fine di acquisire informazioni su parti dello stesso sistema, anche distanti dal luogo dell’evento. Che l’acquisizione di un’informazione influisca radicalmente sull’evoluzione di un fenomeno fisico nell’istante preciso in cui viene acquisita può apparire sorprendente. Ma, gli eventi atomici e subatomici sono regolati da leggi probabilistiche, e la probabilità dipende dalla quantità di informazione sul sistema. Perciò se quest’ultima cambia in seguito ad un’istantanea modifica dell’apparato sperimentale, la funzione d’onda cambia – anche in modo sostanziale – istantaneamente. Nell’esperimento appena discusso, finché noi non conosciamo il cammino fatto dal fotone, le onde di probabilità presenti sui due cammini sono coerenti e si ha interferenza. Ma nel momento in cui introduciamo lo schermo nell’apparato sperimentale, in modo da determinare il cammino seguito dal fotone, le onde segnale s1 e s2 diventano incoerenti, per cui l’interferenza scompare. Questo fatto non sarebbe spiegabile se si trattasse di onde fisiche, come le onde sull’acqua, le onde sonore e le onde elettromagnetiche. Infatti, le azioni fisiche si propagano con velocità finita, non superiore 72 Capitolo VI a quella della luce nel vuoto, per cui l’azione dello schermo eserciterebbe la sua influenza solo dopo un certo tempo. L’interpretazione canonica è, come si è già accennato, che le onde di probabilità della meccanica quantistica non sono onde fisiche, nel senso suddetto, ma sono entità astratte, matematiche, che permettono di effettuare previsioni sui possibili eventi che possono manifestarsi in un dato contesto, e tanto basta. Le leggi della teoria quantistica permettono di determinare la distribuzione nello spazio e l’evoluzione temporale di tali onde, una volta che sia noto l’insieme delle condizioni fisiche (apparati sperimentali compresi). La teoria fornisce inoltre le regole per ricavare, dalla funzione d’onda, le probabilità degli eventi o dei risultati delle misurazioni. 7 Teoria quantistica vs. teorie realistiche locali 7.1 Paradosso di Einstein–Podolski–Rosen 7.1.1 Premessa La meccanica quantistica, mediante la conoscenza della funzione d’onda, consente di determinare le probabilità dei possibili risultati di una misura o dei possibili esiti di un esperimento. Tuttavia, essa non fornisce alcuna indicazione sul perché l’esperimento abbia dato proprio quel risultato: un’onda fotonica che incide su un divisore di fascio (beam-splitter) si biforca, ma la teoria quantistica non è in grado di stabilire a priori quale dei due rivelatori, posti alla fine di ciascun cammino, segnalerà la presenza del fotone. Al più varrà la previsione statistica per cui la probabilità è la stessa per ambo i cammini, pari al 50%. Ciò significa che ripetendo la misura con molti fotoni troveremo che, con buona approssimazione, il 50% seguiranno un cammino e il restante 50% l’altro. Nella teoria quantistica lo stato di un sistema è descritto in relazione alla misura che si deve attuare sul sistema, perciò coinvolgendone tutti i possibili risultati. Effettuando la misura si attua uno solo di tali risultati, e l’originario stato del sistema collassa istantaneamente in un nuovo stato inerente al risultato ottenuto. Per chiarire questo concetto fondamentale della teoria atomica riferiamoci ad un esempio concreto relativo alla misura di polarizzazione dei fotoni (v. A.6). Consideriamo un fascetto di fotoni polarizzato per mezzo di un filtro Polaroid, che viene fatto passare attraverso un cristallo di calcite il cui asse ottico forma un certo angolo con l’asse del filtro. Supponiamo che l’intensità del fascetto sia così bassa che un solo fotone alla volta attraversi l’analizzatore. Quello che si osserva è che (v. A.6), nonostante tutti i fotoni del fascetto entrante siano polarizzati nello stesso identico modo, la frazione sin2 dei fotoni esce dal canale ordinario, e quindi con polarizzazione ortogonale all’asse ottico, e il resto, cioè la frazione cos2 , dal canale straordinario, con polarizzazione parallela 73 74 Capitolo VII all’asse ottico. Ma qual è la causa per cui il singolo fotone finisce in un canale piuttosto che nell’altro? Secondo la teoria quantistica la domanda non ammette risposta, e dà dell’evento la seguente descrizione. Ricordiamo anzitutto che un’onda elettromagnetica monocromatica classica, di frequenza , descrive il comportamento di fotoni (v. Cap. 3) aventi energia . Inoltre la sua intensità, essendo proporzionale all’energia per unità di volume, è proporzionale alla densità dei fotoni. Quando una tale onda elettromagnetica, con polarizzazione obliqua, incide sull’analizzatore, il campo elettrico dell’onda viene scomposto secondo le due direzioni parallela e perpendicolare all’asse ottico: E = cos E// + sin E ed i quadrati cos2 e sin2 dei coefficienti danno le frazioni delle intensità delle onde uscenti dai due canali. Ma se l’onda, da un punto di vista classico, ha intensità così piccola da descrivere un singolo fotone, non possiamo interpretare i quadrati dei coefficienti suddetti come frazioni dell’intensità, perché non ha senso parlare della frazione di un fotone, dato che quest’ultimo passa o da un canale o dall’altro, non da entrambi. Nel caso di un fotone singolo la descrizione data dalla teoria quantistica è pertanto la seguente: prima che esso entri nell’analizzatore il suo stato di polarizzazione viene descritto, come il campo elettrico dell’onda classica, in base ai due possibili esiti, ossia come sovrapposizione dello stato di polarizzazione parallela e dello stato di polarizzazione perpendicolare all’asse ottico del cristallo. Ma in tal caso i quadrati dei coefficienti rappresentano le probabilità che il fotone passi in un canale o nell’altro. Questa è la massima conoscenza a priori che possiamo acquisire sugli esiti della misura. L’atto della misura elimina questa sorta di ambiguità, facendo collassare lo stato del fotone nell’uno o nell’altro dei due stati di polarizzazione, parallelo o perpendicolare all’asse ottico. Intuitivamente, è difficile accettare l’idea che il canale di uscita non sia determinato, per esempio da un’interazione casuale del fotone col cristallo di calcite; infatti, l’idea filosofica secondo cui ogni evento ha la sua causa, a volte conoscibile dall’uomo e a volte no (realismo), è profondamente radicata nel nostro modo di pensare. Con riferimento poi all’esperimento di Mandel discusso nel capitolo 6, è altrettanto difficile ammettere che l’introduzione dello schermo Teoria quantistica vs. teorie realistiche locali 75 sul cammino del fotone pigro distrugga istantaneamente la figura d’interferenza prodotta dai fotoni segnale. Infatti, secondo la teoria della relatività un’azione istantanea a distanza non è possibile: una perturbazione si propaga sempre con velocità finita, non superiore alla velocità della luce nel vuoto. Pertanto, l’istantanea scomparsa dell’interferenza come conseguenza di un evento lontano appare paradossale. La spiegazione data dalla teoria quantistica, secondo cui quello che si propaga non è un’entità fisica, ma l’informazione, ossia un’entità matematica, confligge fortemente col senso comune. 7.1.2 Il paradosso La difficoltà della fisica quantistica di conciliarsi con il realismo e il principio di località, due paradigmi della scienza classica, è chiaramente espressa da un celebre paradosso proposto nel 1935 da Einstein e due suoi collaboratori, Boris Podolski e Nathan Rosen, e noto come paradosso EPR. L’esperimento ideale da loro proposto avrebbe dovuto mostrare l’incompletezza della teoria quantistica, nel senso che, pur predicendo correttamente i risultati sperimentali, essa non rendeva conto delle loro ragioni che, sia pure nascoste, dovevano pur sempre esistere secondo la visione realistica. Nel 1951 David Bohm propose una variante concettualmente più semplice dell’esperimento EPR ed a questa ci riferiremo. Egli considerò una molecola costituita da due atomi, A e B, aventi spin di orientazione opposta, in modo che lo spin totale fosse nullo (v. Fig. 7.1a); suppose inoltre che la molecola si dissociasse conservando lo spin totale nullo. Quando gli atomi fossero stati abbastanza lontani l’uno dall’altro, da non interagire più tra loro, in nessun modo, si sarebbe misurata una data componente dello spin di uno di essi, p. es. dell’atomo A (v. Fig. 7.1b). Dato che lo spin totale era nullo, si deduceva che la stessa componente di spin dell’atomo B sarebbe stata opposta a quella dell’atomo A. In tal modo, una componente dello spin di B poteva essere ottenuta senza la necessità di misurarla. Secondo le leggi classiche il risultato può interpretarsi facilmente: ad ogni istante tutte le componenti dello spin di una particella risultano ben definite e, quindi, tutte le componenti dello spin dell’atomo B sono e restano opposte alle corrispondenti dell’atomo A. Perciò, una 76 Capitolo VII volta misurato il valore di una componente dello spin di A, si può subito dedurre che la corrispondente componente dell’atomo B ha valore opposto. L’interpretazione quantistica di tale risultato presenta, però, alcune difficoltà. Infatti, come si è visto nel paragrafo 5.4.4, in fisica quantistica solo una delle componenti dello spin può essere misurata, mentre le altre restano indeterminate. Scelta una direzione della componente di spin sono possibili due configurazioni per gli spin di A e B: componente positiva per A e negativa per B, o viceversa. Nello spirito della teoria quantistica, lo stato di spin dei due atomi prima della misura consiste nella combinazione (sovrapposizione) di queste due possibili configurazioni (v. Fig. 7.2a). Un tale stato è detto entangled. Nel caso in questione, dal momento che le due configurazioni di spin sono equivalenti, ognuna di esse ha probabilità di attuarsi. Abbiamo utilizzato il termine “attuarsi” dato che è solo la misura che attua in direzione e valore le componenti degli spin di A e B, mentre lo stato prima della misura non dà informazione sull’orientazione dello spin ma descrive solo le due configurazioni entangled di spin opposti. Figura 7.1: a) Molecola nello stato di singoletto che si dissocia in due atomi, mantenendo l’originario spin nullo; b) misura delle componenti di spin dei due atomi separati. Teoria quantistica vs. teorie realistiche locali 77 Per esempio, se la misura della componente z dello spin dell’atomo A dà , il sistema collasserà dallo stato entangled alla configurazione della Figura 7.2b, dove le componenti z dello spin sono: per A e - per B. Analogamente, misurando la componente z dell’atomo B, troveremmo -. Osserviamo che le componenti x e y restano del tutto indeterminate. In sostanza, l’impossibilità di conoscere due componenti diverse dello spin è analoga all’impossibilità di determinare la traiettoria delle particelle senza distruggere la figura d’interferenza: si tratta di quantità complementari. Il paradosso nell’interpretazione dell’esperimento di Bohm consiste in quanto segue. Per prima cosa non si può spiegare perché la misura di una componente di spin dell’atomo A, la cui direzione z può essere scelta quando i due atomi sono già molto distanti l’uno dall’altro, determina istantaneamente la componente di spin nella stessa direzione z dell’atomo B. Ciò accade nonostante che durante la misura l’atomo B non interagisca né con A né con l’apparato di misura. Secondariamente, se, insieme alla misura sull’atomo A, viene misurata la componente x (o y) dell’atomo B potremo dedurre che nello stesso momento l’atomo A avrà anche una componente definita nella direzione x (o y). Così le componenti x e z dello spin dei due atomi saranno determinate contemporaneamente contro il principio di complementarità. Figura 7.2: a) Stato di spin entangled dei due atomi; b) transizione dallo stato entangled allo stato prodotto indotta dalla misura della componente dello spin dell’atomo A. 78 Capitolo VII La teoria quantistica spiega il paradosso in questo modo: prima della misura dello spin dell’atomo A, lo spin totale è nello stato entangled (v. Fig. 7.2a) in cui le componenti dello spin di entrambi gli atomi sono indeterminate in direzione e verso. Se la misura della componente dello spin di A dà come risultato , lo stato collassa in uno stato semplice, non–entangled, (v. Fig. 7.2b) in cui i due atomi hanno componenti z dello spin ben determinate: per A e – per B. La misura della componente x dello spin dell’atomo B viene effettuata in questo stato, ottenendo . Ma la misura stavolta non influenza la componente di spin di A, poiché in uno stato non–entangled le componenti di spin dei due atomi non sono correlate. La precedente spiegazione del paradosso si basa esclusivamente sul paradigma quantistico secondo cui il valore di una grandezza non è preesistente alla misura della grandezza stessa, se non come uno dei possibili valori. Se il valore di una grandezza non esiste, però, prima della misura, Einstein, Podolski e Rosen si chiedevano come la componente z dell’atomo B potesse ottenersi con una semplice deduzione senza misurarla. E aggiungevano: poiché questa componente può dedursi in direzione e verso da quella dell’atomo A, le caratteristiche di spin dei due atomi debbono essere legate permanentemente ad una realtà più profonda e da scoprire, la quale fa sì che non si possa scegliere la direzione e il verso per uno dei due atomi senza che anche la direzione e il verso dell’altro rimangano determinati. La teoria quantistica esclude questo legame tra gli spin, rinunciando, quindi, a poter descrivere la realtà nascosta che sta alla base dei risultati degli esperimenti. In questo senso, d’accordo con Einstein, Podolski e Rosen, si tratta di una teoria incompleta. Se una tale realtà nascosta esistesse, anche le leggi del mondo atomico soddisferebbero ad una visione del mondo che il senso comune considera ovvia e naturale, essendo basata su due assunti: il realismo, secondo cui i fenomeni evolvono indipendentemente dall’osservazione dell’uomo e il principio di località di Einstein, il quale stabilisce che una perturbazione non può propagasi più velocemente della luce nel vuoto. Questi due concetti stanno alla base delle cosiddette teorie realistiche locali della natura. Teoria quantistica vs. teorie realistiche locali 7.2 79 Il teorema di Bell Ci chiediamo: è possibile effettuare esperimenti i cui risultati, come previsti dalla teoria quantistica, siano diversi da quelli previsti dalle teorie realistiche locali? Nel 1964 John S. Bell del CERN di Ginevra (Centro Europeo di Ricerche Nucleari) propose un esperimento ideale, in sostanza un’estensione di quello di Einstein, Podolski, Rosen, che risponde alla domanda precedente. Egli considerò una serie di tre misure, nelle quali N molecole biatomiche nello stato di singoletto si dissociano una dopo l’altra cosicché gli atomi componenti si muovono in direzione opposta. Scelte arbitrariamente tre direzioni A, B, C nel primo caso si orienta il filtro di spin lungo A per l’atomo 1 e lungo B per l’atomo 2, nel secondo lungo A e C rispettivamente e nel terzo lungo B e C (v. Fig. 7-3). In ogni misura si registra il numero dei casi in cui i due atomi escono dai rispettivi filtri, diviso per N. Nella prima misura l’atomo uscente da A ha componente di spin + lungo A, che indicheremo con A+. L’atomo uscente da B ha componente + lungo B, che indicheremo con B+. La frequenza di queste coppie sarà indicata con P(A+, B+) o, più semplicemente, P(A, B). Figura 7.3: Esperimento ideale di Bell: a) misura della frequenza delle coppie di atomi uscenti dai filtri A e B; b) e c) la stessa misura con i filtri A, C e B, C . 80 Capitolo VII Analogamente le frequenze nel caso della seconda e terza misura saranno indicate con P(B, C) e P(A, C), rispettivamente. Bell, seguendo le teorie realistiche locali, dimostrò che le tre frequenze soddisfano alla disuguaglianza: P(A,B) P(A,C)+ P(B,C) 7-1 la quale prende il nome di disuguaglianza di Bell. Eccone la dimostrazione. Sebbene non sia possibile misurare più di una delle componenti dello spin, si assume che ciascun atomo abbia le tre componenti di spin lungo A, B e C perfettamente definite (ipotesi realistica). Inoltre, poiché i due atomi di ciascuna molecola si trovano nello stato di singoletto, se sono assegnate le componenti dello spin di uno dei due atomi, possiamo dedurre che le corrispondenti componenti di spin dell’altro sono uguali e contrarie. Infine, allorché i due atomi sono sufficientemente distanti l’uno dall’altro, la misura delle componenti di spin di un atomo non influisce sulle componenti dello spin dell’altro atomo (principio di località). Con tali premesse le possibili componenti di spin degli atomi lungo le direzioni A, B e C sono le seguenti: Componenti Numero di atomi A+B+C+ A+B+C– A+B–C+ A+B–C– A–B+C+ A–B+C– A–B–C+ A–B–C– N1 N2 N3 N4 N4 N3 N2 N1 Gli atomi con componenti A+B–C+e A+B–C– hanno per compagni atomi con componenti A–B+C– e A–B+C+, rispettivamente, per cui Teoria quantistica vs. teorie realistiche locali 81 formano coppie (A+, B+). Essi sono in numero di N3+N4, per cui la frequenza di tali coppie è P(A, B) = (N3+N4)/N. Analogamente si trova: P(A, C) = (N2+N4)/N e P(B, C) = (N2+N3)/N, da cui segue subito la disuguaglianza di Bell. Effettuiamo, adesso, lo stesso calcolo usando la teoria quantistica. Poiché i due atomi della molecola dissociata hanno la direzione dello spin indeterminata, la probabilità che uno di essi emerga dal relativo filtro è . Supponiamo che l’atomo 1 esca dal filtro A, in tal caso esso avrà componente di spin A+, e di conseguenza l’atomo 2 A-. L’atomo 2 / 2) di uscire dal filtro B (v. App. C). ha, quindi, probabilità sin 2 (AB La probabilità che entrambi gli atomi escano dai rispettivi filtri è data AB 1 da P(A, B) = sin 2 . Analogamente si trova: 2 2 P(A,C) = 1 2 AC 1 2 BC sin sin e P(B,C) = 2 . 2 2 2 Per avere accordo con la disuguaglianza dev’essere, quindi: AB AC BC 2 2 sin 2 sin + sin 2 2 2 7-2 = 2 , AC = BC = , per Scegliendo, però, le tre orientazioni AB 0 < < 2 , la disuguaglianza non è soddisfatta. Lo scarto massimo si ha per =1.047 rad = 60° (v. Fig. 7-4). Come si vede, il teorema di Bell sposta la questione sulla completezza della teoria quantistica dal piano filosofico (realismo contro positivismo, località contro non–località) al piano sperimentale. Esso mostra, infatti, per la prima volta che esiste la possibilità di discriminare con esperimenti tra teoria quantistica e teorie realistiche locali. 82 7.3 Capitolo VII Una versione alternativa del teorema di Bell. L’esperimento di Aspect Oltre a quella riportata sopra, esistono altre versioni dell’esperimento di Bell, più adatte ad essere applicate a esperimenti specifici. Nel 1969 J.F. Clauser, M.A. Horne, A. Shimony e R.A. Holt proposero un esperimento in cui una sorgente genera una coppia di fotoni che hanno la medesima polarizzazione, sebbene di direzione indefinita. Nella teoria quantistica lo stato di polarizzazione della coppia è descritto da uno stato entangled; le due configurazioni componenti sono: una con i due fotoni polarizzati lungo z e l’altra con i fotoni polarizzati lungo una direzione x ortogonale a z (v. Fig. 7.5). Ciascun fotone della coppia incide su un dispositivo che scatta tra due diverse configurazioni: in una di esse il fotone colpisce un polarizzatore A(B) e nell’altra un polarizzatore differente A´(B´). Ognuna di queste coppie di polarizzatori equivale ad un singolo polarizzatore che scatta tra due differenti direzioni. Figura 7.4: Intervallo dei valori di in cui non è soddisfatta la disuguaglianza di Bell. Teoria quantistica vs. teorie realistiche locali 83 Indichiamo con P(A,B), P(A,B´), P(A´,B) e P(A´,B´) le frequenze dei segnali di conteggio che arrivano simultaneamente dai polarizzatori indicati in parentesi. Inoltre indichiamo con P(X) la frequenza con cui un fotone esce dal polarizzatore X, nel caso in cui sia stato eliminato l’latro polarizzatore su cui incide il fotone compagno. Si ottiene, allora, la disuguaglianza1: S= P(A, B) P(A, B ) + P( A, B) + P( A, B ) 1 P( A ) + P(B) 7-3 La dimostrazione è la seguente: sia N il numero di coppie di fotoni emessi dalla sorgente, siano N(A) e N(B) i conteggi dei rivelatori R1 e R2, e N(A,B) il numero di conteggi simultanei di R1 e R2. Le relative frequenze sono, quindi, date da: P(A) = N(A)/N, P(B) = N(B)/N, P(A,B) = N(A,B)/N. Non è possibile conoscere la direzione di polarizzazione di ogni coppia di fotoni; tuttavia, le teorie realistiche locali asseriscono che la polarizzazione è determinate al momento dell’emissione con precise probabilità. Indicando con p (i ) (A) e p (i ) (B) le probabilità dell’i–esima coppia, per il principio delle probabilità composte segue: p (i ) (A, B) = p (i ) (A)p (i ) (B) . Figura 7.5: Schema dell’esperimento di Aspect come descritto nel testo. 1 J.F. Clauser et al., Phys. Rev. D, 10, 526, 1974. 84 Capitolo VII D’altra parte, se N è sufficientemente grande, possiamo scrivere N N N i =1 i =1 i =1 N(A) = p (i ) (A), N(B) = p (i ) (B), N(A, B) = p (i ) (A)p (i ) (B) 7-4 e pertanto le frequenze di conteggio sono date da P(A) = 1 N (i ) 1 N p (A), P(B) = p (i ) (B), N i =1 N i =1 1 N (i ) P(A, B) = p (A)p (i ) (B) N i =1 7-5 Si può mostrare che, scelti quattro numeri xi (i=1,… 4) t.c. 0 xi 1 e avendo definito Z = x1 x2 x1 x4 + x2 x3 + x3 x4 x2 x3 , è soddisfatta la disuguaglianza 1 Z 0 (v. App. D). Posto x1 = p (i ) (A), x2 = p (i ) (B), x3 = p (i ) ( A ) e x4 = p (i ) ( B ) dalla disuguaglianza segue: N [ p (i ) (A)p (i ) (B) p (i ) (A)p (i ) ( B ) + p (i ) ( A )p (i ) (B) i =1 7-6 + p (i ) ( A )p (i ) ( B ) p (i ) ( A ) p (i ) (B)] 0 dalla quale, tenendo conto di (7-5), si ottiene (7-3). Vogliamo mostrare adesso che cosa prevede la teoria quantistica per la medesima quantità S. Dal momento che la direzione di polarizzazione è sconosciuta, la probabilità che uno dei due fotoni emerga dal filtro polarizzatore è pari a . Se il fotone 1 esce dal filtro A (cosicché risulta avere polarizzazione A), il fotone 2, avente la medesima pola di uscire dal filtro B. La probarizzazione A, avrà probabilità cos 2 AB bilità che entrambi i fotoni della coppia escano dai rispettivi filtri è, Teoria quantistica vs. teorie realistiche locali 85 /2 e, inoltre, P(A) = P(B) = . Tali quindi, data da P(A,B) = cos 2 AB relazioni valgono, chiaramente, mutatis mutandis, per ogni coppia di filtri. In un esperimento effettuato nel 1982 da Alain Aspect e collaboratori presso l’Istituto di Ottica Teorica e Applicata dell’Università d’Orsay di Parigi, furono scelte le quattro polarizzazioni riportate in Figura 7.5 e per le quali la teoria quantistica fornisce: 1 S = 3cos 2 cos 2 (3 ) ; per = /8 si ottiene S = 1,207 in contra2 sto con la relazione classica (7-3). Per una verifica sperimentale, il valore di 1,207 calcolato deve essere corretto per tenere conto delle imperfezioni dell’apparato strumentale: l’efficienza dei rivelatori, lo sparpagliamento della direzione fotonica e così via. Il valore corretto risulta, allora, S = 1,113 ± 0,005; il valore sperimentale ottenuto da Aspect risultò di 1,101 ± 0,020 il quale, entro gli errori, è in accordo con il valore fornito dalla teoria quantistica. L’esperimento di Aspect mostra che la teoria quantistica fornisce una descrizione corretta della realtà fisica del mondo microscopico. 8 Criptografia 8.1 Considerazioni generali Gli argomenti precedenti, oltre ad un profondo interesse epistemologico nei riguardi dei fondamenti scientifici del mondo atomico, lasciano intravedere applicazioni tecnologiche rivoluzionarie nel campo delle moderne comunicazioni. Questo è solo un esempio recente di come studi di scienza fondamentale, lungi dal rimanere sempre confinati nelle “torri d’avorio” degli specialisti, possono produrre cambiamenti epocali nel modo di vivere delle popolazioni. Per illustrare la peculiarità del legame tra comunicazione e leggi quantistiche ci riferiremo alla cosiddetta criptografia quantistica la cui attuazione è già oggi in una fase avanzata. La criptografia è la scienza che studia come può un emittente, usualmente chiamato Alice, inviare un messaggio attraverso un dato canale in modo che solo un ricevente autorizzato, usualmente chiamato Bob, possa intenderne il significato (v. Fig. 8.1). Il canale può avere diversa natura: da quella antica consistente in un messo a cavallo che trasporta il messaggio cifrato da Alice a Bob, ai moderni telefoni, fax, e–mail e così via. Figura 8.1: Alice cripta un messaggio abbinandolo a una chiave e lo invia a Bob. Questi lo decripta con la medesima chiave. Eve è una spiona. 87 88 Capitolo VIII La cosa essenziale, in ogni caso, è che una terza entità non autorizzata, usualmente chiamata Eve (dall’inglese eavedropper = colui che origlia), la quale riesce a leggere il messaggio, non sia in grado di decifrarlo e, se anche lo decifra, Alice e Bob lo vengano immediatamente a sapere e ne annullino gli effetti. Fino a tutto il XIX secolo il messaggio veniva criptato sostituendo alle lettere e agli spazi tra parole cifre e segni secondo regole note soltanto ad Alice e Bob: nell’affascinante racconto di E.A. Poe Lo scarabeo d’oro il protagonista, Legrand, decifra il messaggio indicatore del tesoro nascosto determinando la corrispondenza tra cifre e lettere attraverso l’analisi della lingua inglese. 8.2 Il metodo Vernam La nascita della criptografia moderna risale al 1935, quando Gilbert Vernam dei laboratori Bell propose un sistema noto come one–time pad. In questo sistema il messaggio viene trascritto in forma numerica facendo corrispondere numeri alle lettere, quindi si somma senza riporto a ciascuna cifra del messaggio un’altra cifra fissata a caso, la cui successione, detta chiave, è nota soltanto ad Alice e Bob. Il criptogramma che si ottiene non è in alcun modo decifrabile se non si conosce la chiave, essendo costituito da una successione di cifre rese casuali dall’aggiunta della chiave, anch’essa casuale, al messaggio da trasmettere. Alice Messaggio Chiave Testo criptato + 10011100011100001 01001110001101101 11010010010001100 Trasmissione Bob Testo criptato Chiave Messaggio – 11010010010001100 01001110001101101 10011100011100001 Criptografia 89 Quando Bob riceve il messaggio criptato lo decifra facilmente sottraendo senza riporto alle cifre del criptogramma quelle della chiave. La tabella precedente illustra il sistema Vernam nel caso usuale di codifica binaria, in cui tutti i numeri sono scritti con le cifre 0 e 1, per cui le stesse regole valgono per somma e sottrazione senza riporto: 1+1=0+0=0, 1+0=0+1=1, 1–1=0–0=0, 1–0=0–1=1. Si dimostra che, se la chiave è e rimane conosciuta solo da Alice e Bob ed è usata una sola volta, il metodo Vernam consente di costruire un criptogramma indecifrabile. Tuttavia è difficile assicurare sempre entrambe le condizioni: l’invio della chiave da Alice a Bob attraverso un qualche mezzo di comunicazione può presentare lacune che permettono ad Eve di impossessarsi della chiave. Inoltre, analizzando più criptogrammi diversi criptati con la stessa chiave si può riuscire a ricostruirla, c’è quindi l’esigenza inderogabile di usarla una sola volta, da cui il nome di one–time pad dato al metodo Vernam. Ritorneremo su questo metodo in seguito trattando della trasmissione quantistica della chiave. 8.3 Sistemi a chiave pubblica Una seconda classe di sistemi per criptare i messaggi è basata su un accorgimento che permette ad Alice e Bob di ricostruire ciascuno per conto suo la chiave segreta per criptare e decriptare il messaggio, inviando l’un l’altro, attraverso un canale pubblico, oltre al criptogramma, alcuni dati, la cosiddetta chiave pubblica. In effetti, anche dalla sola chiave pubblica Eve potrebbe risalire alla chiave segreta, ma al prezzo di un tempo lunghissimo, cosa che renderebbe la decifrazione inservibile. Per il lettore cuiroso nel riquadro seguente è descritto il primo dei cripto–sistemi a chiave pubblica, proposto nel 1976 da Whitfield Diffie e Martin Hellman della Università di Stanford (USA). Col progresso tecnologico degli ultimi anni si sono accresciute notevolmente le possibilità di decifrazione dei criptogrammi. Per ovviare a ciò, sono stati escogitati sistemi a chiave pubblica sempre più sofisticati e adattati al grado di segretezza e al canale di comunicazione. Un’altra promettente strada, su cui si stanno già effettuando intense 90 Capitolo VIII ricerche, è appunto quella di utilizzare le proprietà quantistiche delle particelle atomiche, più precisamente dei fotoni. Protocollo Diffide-Hellman Alice e Bob scelgono, d’accordo, un numero primo p e un numero naturale g (non necessariamente primo). Qui, per fare un esempio numerico, useremo numeri piccoli, diciamo p = 23 e g = 5, in modo da rendere semplici i calcoli. Alice sceglie un numero segreto a, diciamo a = 6, e invia a Bob, sul canale pubblico, il numero ga mod p – che, ricordiamolo, sta per il resto della divisione ga : p – (56 mod 23 = 8). Per parte sua, Bob sceglie un numero segreto b, diciamo b = 15, e invia ad Alice gb mod p (515 mod 23 = 19). Alice valuta (gb mod p)a mod p e Bob (ga mod p)b mod p; mostriamo che i due numeri sono uguali: (gb mod p)a = [(g g … g)b volte mod p]a. Ma g si può esprimere tramite il quoziente q e il resto r della divisione g:p, ossia: g = q p+r, per cui: (gb mod p)a = {[(q p+r) (q p+r) …(q p+r)]b volte mod p}a. Nello sviluppo dei prodotti in parentesi quadra tutti i termini contengono p a fattore, escluso il termine rb; pertanto […] mod p, ossia il resto della divisione […]:p, è proprio rb. In definitiva abbiamo: (gb mod p)a = ( rb)a = rab. Procedendo in modo identico si trova: (ga mod p)b = ( ra)b = rab, come si voleva dimostrare. Alice e Bob sono allora pervenuti allo stesso numero rab mod p = (ga mod p)b mod p = (ga mod p)b mod p che sarà impiegato da Alice come chiave segreta per criptare il messaggio e da Bob per decifrarlo. Nell’esempio numerico p = 23, g = 5, a = 6 e b = 15, abbiamo q = 0 e r = g = 5. Quindi la chiave segreta è (56 mod 23)15 mod 23 = 815 mod 23 = 2. D’altra parte, Eve conosce solo ciò che è stato trasmesso sul canale pubblico, ossia p, g, gb mod p e ga mod p e da questi dati deve ricavare gae gb, ossia dall’equazione ga mod p = r – con r intero noto – occorre ricavare a e una equazione simile va risolta per b. Ma, noto il resto r e il divisore p il dividendo ga è determinato a meno di un fattore intero. Se ga è un numero grande l’operazione di determinare il fattore giusto può richiedere moltissimo tempo, tanto da rendere l’operazione inutile. Tuttavia, data l’enorme potenzialità di calcolo dei moderni computer, la segretezza non può essere assicurata del tutto, nonostante che oggi molto più che in passato se ne abbia stringente necessità dato soprattutto lo sviluppo delle comunicazioni via internet. Criptografia 8.4 91 La criptografia quantistica di Bennet e Brassard Nell’ambito del metodo Vernam, poniamo che Alice trasmetta a Bob la chiave segreta utilizzando una trasmissione binaria classica; per esempio, inviando attraverso una fibra ottica una successione di impulsi luminosi laser di durata fissata (ordine del picosecondo) con la convenzione che l’assenza di impulso stia per la cifra binaria 0 e la presenza d’impulso per la cifra binaria 1 (v. Fig. 8.2). Eve, per parte sua, può “leggere” la successione di impulsi facendo si che una piccola frazione della luce di questi passi entro una sua fibra connessa opportunamente alla fibra di trasmissione. Se la frazione derivata da Eve è abbastanza piccola gli impulsi rimangono pressoché imperturbati e Bob può non accorgersi che la chiave segreta è stata violata. In effetti ciascun impulso laser contiene un numero di fotoni, che può variare anche nell’ordine di grandezza a seconda del laser usato, ma in ogni 4 caso di ordine non minore dei 10 , per cui Eve ne può catturarne una piccola frazione senza perturbare l’impulso in modo significativo. È su questo punto che fa la differenza la criptografia quantistica. Per capire come funziona, riferiamoci al metodo proposto nel 1984 da Charles Bennet della IBM e Gilles Brassard dell’Università di Montreal. A differenza dei metodi classici, i bit di informazione sono trasportati da fotoni singoli e detti perciò qubits. Alice usa un polarizzatore che può assumere quattro orientazioni; riferendoci ad un asse verticale, esse sono: 0, 45°, 90° e 135° (v. Fig. 8.3). Si conviene che i fotoni che attraversano il polarizzatore a 0 e 45° trasportano il qubit 1, mentre quelli che lo attraversano a 90° e 135° trasportano il qubit 0. Figura 8.2: Impulsi trasmessi da Alice a Bob. 92 Capitolo VIII Bob dispone invece di un analizzatore di fotoni (p.e. un cristallo di calcite) con asse ottico che può assumere l’orientazione verticale, nel qual caso, a seconda della polarizzazione in uscita, può distinguere tra polarizzazione verticale e orizzontale, oppure a 45° nel qual caso può distinguere tra polarizzazione a 45° e quella a 135°. Alice invia a Bob una successione di fotoni, scegliendo a caso per ognuno una delle quattro polarizzazioni, e Bob le analizza scegliendo a caso per ogni fotone in arrivo una delle due orientazioni del cristallo di calcite. Bob registra per ogni fotone sia l’orientazione dell’analizzatore sia il qubit corrispondente (0 o 1). Naturalmente, dal valore del qubit è possibile risalire alla polarizzazione del fotone inviato solo se Bob sceglie un’orientazione parallela o ortogonale alla polarizzazione del fotone stesso (scelta compatibile). In questo caso, infatti, il fotone è rivelato dai fotomoltiplicatori 1 (orientazione parallela) o 0 (orientazione ortogonale). In caso contrario, se l’asse dell’analizzatore forma un angolo di ±45° con la polarizzazione del fotone (scelta incompatibile), questo è rivelato o da uno o dall’altro dei fotomoltiplicatori con la stessa probabilità. In Figura 8.3 è riportato un esempio dell’invio di una sequenza di qubit da Alice a Bob. Figura 8.3: Apparato strumentale per la trasmissione della chiave da Alice a Bob usando qubits, come descritto nel testo. Criptografia 93 Alla fine Bob annuncia su un canale pubblico la successione delle orientazioni scelte per il suo analizzatore, ma non i risultati ottenuti. Per parte sua Alice comunica a Bob in quali casi la sua scelta è compatibile con la polarizzazione del fotone, senza tuttavia comunicare quest’ultima. Bob allora scarta tutti i risultati di scelta incompatibile; i rimanenti coincidono quindi con quelli inviati da Alice e vengono assunti da Bob come chiave segreta. Immaginiamo, ora, che Eve si inserisca nella linea con un sua analizzatore che può orientare, come quello di Bob, a 0° e 45° (v. Fig. 8.4). Poiché il fotone analizzato da Eve è distrutto, ella deve anche possedere un sistema sorgente-polarizzatore e riprodurre un fotone con la stessa polarizzazione di quello rivelato e inviarlo a Bob. Supponiamo che arrivi un fotone con polarizzazione verticale; se Eve e Bob hanno scelto entrambi l’analizzatore a 0° il fotone esce indisturbato dall’analizzatore di Eve e raggiunge Bob (v. Fig. 8.4a) senza che questi possa accorgersi che è stato analizzato da Eve; ma se Figura 8.4: Differenti orientazioni dell’analizzatore di qubits di Eve per intercettare il messaggio da Alice a Bob. 94 Capitolo VIII Eve sceglie l’orientazione a 45° il fotone uscirà con polarizzazione a 45° o 135° per cui esso può essere rivelato dai fotomoltiplicatori 0 o 1 di Bob con la stessa probabilità (v. Fig. 8.4b). La stessa conclusione vale se il fotone emesso ha polarizzazione orizzontale. Possiamo vedere ciò se Bob sceglie l’orientazione a 45° (scelta incompatibile). Se anche Eve fa la stessa scelta il fotone uscente dal suo analizzatore avrà polarizzazione a +45° o a –45° con la stessa probabilità (v. Fig. 8.4c), e sarà rivelato dai fotomoltiplicatori di Bob 0 o 1 sempre con la stessa probabilità. D’altra parte, se Eve sceglie l’orientazione a 0°, il risultato non cambia (v. Fig. 8.4d). In breve, se Bob fa una scelta incompatibile, non può accorgersi dell’interferenza di Eve. Ma le scelte incompatibile vengono escluse, per cui non influiscono nella formazione della chiave. Riguardo alle scelte compatibili Bob può accorgersi di Eve nel 25% di esse, ossia 1 su 4. Dopo aver analizzato un numero sufficientemente elevato di fotoni, Bob può accertarsi se la manipolazione è avvenuta o meno. Un differente modo di trasmissione quantistica che utilizza la fase dell’onda fotonica anziché la polarizzazione fu realizzato nel 1993 da Paul Townsend della British Telecom. Il principio è lo stesso ma, ovviamente, i dispositivi sperimentali sono diversi nei due casi. Ora Alice invia i fotoni della sorgente ad un interferometro di MachZehnder (v. App. E) con bracci di lunghezza diversa. Sul braccio più lungo è posto un rifasatore che aggiunge all’onda fotonica una fase scelta a caso da Alice tra le quattro seguenti: 0, T/4, T/2, 3T/4, ove T è il periodo dell’onda fotonica (v. Fig. 8.5). Figura 8.5: Trasmissione della chiave usando la fase dell’onda fotonica. Criptografia 95 Una delle uscite dal secondo beamsplitter viene dispersa e l’altra inviata a Bob, il quale dispone di un interferometro identico a quello di Alice, a parte il rifasatore, che, a scelta di Bob, può lasciare la fase invariata (aggiungere 0) o aggiungere una fase di T/4. All’uscita dell’interferometro di Bob, l’interferenza delle onde fotoniche seguenti sono analizzate: 1) l’onda proveniente dal braccio corto dell’interferometro di Alice e dal braccio lungo dell’interferometro di Bob. 2) L’onda proveniente dal braccio lungo dell’interferometro di Alice e dal braccio corto dell’interferometro di Bob. I due interferometri sono predisposti in modo che, se Bob e Alice scelgono la stessa fase (0 or T/4), è il rivelatore A che registra il fotone; invece, se Alice sceglie T/2 o 3T/4 e Bob 0 o T/4, rispettivamente, il fotone è registrato dal rivelatore B. In breve, se la differenza tra le fasi scelte è 0 o T/2, il fotone viene registrato da A o B, rispettivamente. In questi due casi, la scelta di Bob è compatibile con quella di Alice, nel senso che Bob può stabilire la scelta fatta da Alice: se A registra il fotone, Alice ha fatto la sua stessa scelta, altrimenti, se è B che registra il fotone la scelta di alice differisce di T/2 dalla sua. Un’ultima questione deve essere spiegata. Il funzionamento descritto si basa sull’interferenza dell’onda fotonica proveniente dal lato corto di Alice e lungo di Bob con quella proveniente dal lato lungo di Alice e corto di Bob, ma anche i fotoni provenienti da entrambi i lati lunghi (e corti) dei due interferometri sono rivelati da A e B. Tuttavia questi ultimi sono ben separati in tempo dagli altri e possono essere eliminati usando un opportuno filtro temporale. Precisate le differenze, la procedura di trasmissione della chiave è identica a quella descritta prima, cioè: Alice invia a Bob una successione di qubit; Bob risponde dicendo ad Alice quale fase ha scelto per ogni qubit; Alice confronta le scelte di Bob con le proprie e comunica a Bob per quali qubit le scelte sono compatibili; Bob infine, una volta scartate le scelte incompatibili, ottiene la chiave dalla successione delle rimanenti. Appendice A Richiami di fisica delle onde A.1 Onde superficiali in un liquido Gettando un sasso in uno stagno, si creano sulla superficie increspature circolari che hanno origine dal punto in cui il sasso penetra nell’acqua e si espandono radialmente: sono le cosiddette onde superficiali. Un piccolo sughero galleggiante in un punto della superficie, mosso dal liquido, effettua oscillazioni pressoché verticali; quindi le particelle di acqua non si muovono radialmente, ossia nel senso di espansione dell’onda, ma rimangono nell’intorno del punto che occupavano prima del passaggio dell’onda. Perciò, l’onda non trasporta materia bensì energia, nella fattispecie comunicando un moto oscilatorio alla materia delle regioni in cui si propaga. Figura A.1: a) Onda vista dall’alto prodotta sulla superficie di un liquido da un cilindretto oscillante parzialmente immerso: le linee più intense indicano i picchi mentre quelle più tenui le valli; b) Istantanea del profilo dell’onda; c) Spostamento radiale del profilo in relazione all’oscillazione verticale delle particelle liquide. 97 98 Appendice A Le onde della fisica classica consistono sempre di energia che si propaga sia attraverso un mezzo materiale sia attraverso lo spazio vuoto. Per esempio, la luce e, più in generale, le onde elettromagnetiche emesse dalle stelle (sorgenti di queste onde) si propagano attraverso enormi spazi vuoti giungendo fino a noi. Le onde superficiali nei liquidi consentono di mostrare, mediante un semplice apparato sperimentale, le principali proprietà delle onde. Nell’apparato, la sorgente delle onde è un cilindretto parzialmente immerso nell’acqua, che viene fatto oscillare con una data frequenza (v. Fig. A.1a). Sezionando idealmente l’acqua con un piano verticale passante per il centro dell’onda, ad un certo istante il profilo della superficie liquida apparirebbe come in Figura A.1b): la distanza tra due massimi si chiama lunghezza d’onda e l’altezza dei massimi riferita al pelo libero imperturbato, ampiezza. Si può dimostrare che in un dato punto la densità di energia dell’onda (energia per unità di volume) è proporzionale al quadrato dell’ampiezza. Le particelle liquide effettuano infatti un moto oscillatorio, dunque sono mosse da una forza elastica, grosso modo simile a quella di una molla, per la quale è noto che l’energia di oscillazione è costante e uguale all’energia potenziale ka2, ove k è una costante (costante elastica) ed a è, appunto, l’ampiezza dell’oscillazione. Come si è detto, le particelle di liquido effettuano oscillazioni verticali, che in questo caso seguono il moto del cilindretto ed hanno perciò frequenza . Fissiamo l’immagine dell’onda ad un certo istante che assumeremo convenzionalmente come t = 0 (v. Fig. A.1c). A questo istante nel punto A abbiamo il massimo livello, il punto B è al pelo libero, C al minimo livello, D è al pelo libero, in E abbiamo di nuovo il massimo livello, e così via. Dopo un tempo pari a un quarto del periodo di oscillazione T (T = 1/), nei punti dove si aveva il massimo o il minimo livello siamo al pelo libero, mentre i punti al pelo libero hanno il massimo (B e F) o il minimo (D) livello. Riassumendo, dopo un quarto di periodo la configurazione dell’onda è quella indicata in tratteggio nella Figura A.1c. Come si vede, è la stessa configurazione che avevamo a t = 0, solo che è spostata in avanti di un tratto pari ad un quarto di . Poiché tale spostamento avviene in un tempo pari a Richiami di fisica delle onde 99 T/4, la velocità c corrispondente, detta velocità di fase, è data da c = (/4)/(T/4) = /T, ovvero: c = . Fissato un punto, il suo spostamento y dal pelo libero si può esprimere matematicamente con una funzione sinusoidale. Per esempio se assumiamo come istante iniziale t = 0, uno di quelli in cui il punto considerato è al pelo libero (y = 0), al tempo t sarà: y(t) = a sin 2 t T A-1 La fase dell’onda in questo punto è l’argomento della funzione trigonometrica, ovvero il prodotto della frazione di periodo di oscillazione per 2 : per esempio, al tempo t = T/n, la fase è 2 /n . A.2 Interferenza L’interferenza è il risultato della sovrapposizione di più onde in una stessa regione spaziale. Riferiamoci ancora alle onde superficiali in un liquido e consideriamo due di queste onde prodotte da altrettanti cilindretti oscillanti in due punti A e B (v. Fig. A.2). Se oscillano con la stessa frequenza e senza interruzioni, essi producono onde coerenti, ossia tali che, se in un punto hanno entrambe massimo spostamento, dopo un quarto di periodo lo avranno entrambe nullo, e dopo un altro quarto di periodo entrambe minimo. Analogamente, se una ha spostamento nullo e l’altra massimo, dopo un quarto di periodo la prima lo avrà minimo e la seconda nullo e così via. Due onde coerenti producono una figura d’interferenza che non muta nel tempo. Nei punti della superficie ove i massimi delle due onde arrivano simultaneamente si ha un’oscillazione di ampiezza doppia (interferenza costruttiva), mentre i punti ove i massimi di un onda giungono simultaneamente ai minimi dell’altra stanno in quiete (interferenza distruttiva). In tutti gli altri punti l’oscillazione ha ampiezza intermedia tra zero e la massima. Quindi, l’energia delle due onde non è uniformemente ripartita sulla superficie liquida: lungo le linee i cui punti oscillano con ampiezza doppia la densità d’energia è quattro vol- 100 Appendice A te quella corrispondente ad una singola onda; lungo le linee i cui punti stanno in quiete la densità d’energia è nulla. Facciamo notare che se le onde non sono coerenti, o perché le frequenze sono diverse oppure perché le oscillazioni dei cilindretti sorgente si interrompono spesso e a caso, la distribuzione dei massimi e dei minimi sulla superficie liquida cambia frequentemente, col risultato che l’ampiezza è in media la stessa in tutti i punti. Riferendoci alla Figura A.2b, l’asse di AB è una linea d’interferenza costruttiva, i percorsi delle due onde sono infatti uguali per ciascuno dei punti dell’asse, per cui esse hanno in questi punti la stessa fase. Un’altra linea d’interferenza costruttiva è il luogo dei punti M1 tali che la distanza M1A differisce di una lunghezza d’onda da M1B: BM1–AM1 = . Tale linea è un ramo di iperbole il cui asintoto forma con l’asse di AB un angolo che si può calcolare nel seguente modo (posto MM1=R): Figura A.2: a) Interferenza di due onde superficiali generate da sorgenti oscillanti all’unisono: in M0, M1, … la differenza di fase delle due onde è nulla (interferenza costruttiva) inoltre in N1, … la differenza di fase è pari a (interferenza distruttiva); b) la linea colorata in verde è il luogo dei punti in cui la differenza di fase è pari a una lunghezza d’onda. Richiami di fisica delle onde da BM1=AM1+ e AM̂M1 = 101 – , BM̂M1 = + , segue 2 2 d2 d2 2 + R + Rd sin = + + R 2 – Rd sin R sin = A-2 4 4 d Ovviamente, una linea di interferenza distruttiva, interposta tra le due linee di interferenza costruttiva precedenti, è il luogo dei punti N1 tali che la distanza N1A differisce di mezza lunghezza d’onda da N1B. Si tratta di un ramo d’iperbole confocale con la precedente il cui asintoto forma con l’asse di AB un angolo , tale che sin = / 2d . A.3 Diffrazione Questo è un altro fenomeno tipico delle onde. Quando un’onda incontra un’apertura lungo il suo cammino, se la dimensione di questa è grande rispetto a , l’onda, a valle dell’apertura, non invade la zona d’ombra. Figura A.3: Diffrazione di un’onda piana da un’apertura. Se quest’ultima è grande rispetto a la sua ombra è netta, mentre se è comparabile l’onda si sparpaglia a valle del diaframma propagandosi anche lateralmente. 102 Appendice A Se però la dimensione d dell’apertura è confrontabile con , l’onda si sparpaglia a guisa di onda sferica, e ciò tanto più quanto più piccola è l’apertura (v. Figure A.3a e A.3b). Inoltre, un’onda è in grado di aggirare un ostacolo. Questi costituiscono, appunto, il fenomeno della diffrazione. La teoria della diffrazione esula dagli scopi di questi richiami, sarà sufficiente ricordare che essa è basata sul principio di Huygens-Fresnel, il quale stabilisce che, all’interno dell’apertura, i punti del fronte d’onda si comportano come sorgenti di onde sferiche la cui interferenza determina la forma dell’onda uscente dall’apertura. Dalla teoria segue che l’ampiezza angolare 2a dell’onda è tale che sin /d. A.4 Digressione sul potere risolutivo Consideriamo una particella luminosa posta nel fuoco di una lente convergente (v. Fig. A.4). L’ottica geometrica ci dice che i raggi luminosi emessi dalla particella, dopo che hanno attraversato la lente, si propagano paralleli tra loro, nella direzione dell’asse ottico. Questa però è un’approssimazione, perché non tiene conto della natura ondulatoria della luce. Infatti, se è la lunghezza d’onda della luce e D è il diametro della lente, per il fenomeno della diffrazione, i raggi emergenti dalla lente non formeranno un fascio perfettamente cilindrico ma leggermente conico, ossia con un piccolo angolo d’apertura dato da: Figura A.4: Diffrazione della luce emessa da una sorgente puntiforme situata nel fuco di una lente convergente. Richiami di fisica delle onde 103 2/D (il valore = 0 dell’ottica geometrica si ottiene o per = 0 oppure per D infinitamente grande). Il fascetto leggermente divergente uscente dalla lente è come se provenisse, anziché da una particella, da un dischetto luminoso posto nel piano focale avente un diametro d f , dove f è la distanza focale (v. Fig. A.4). Consideriamo ora due particelle luminose entrambe nel piano focale in prossimità dell’asse ottico. Per effetto della diffrazione le loro immagini è come se provenisssero da due dischetti del diametro suddetto e hanno un diametro pari al prodotto di d per l’ingrandimento (i punti oggetto vanno pensati non proprio nel piano focale ma in vicinanza di questo, in modo da ottenere immagini reali). In base alle leggi dell’ottica si trova che il diametro d delle immagini è dato da: d sin 2 A-3 Se l’interdistanza tra i centri delle immagini è minore di d, esse appariranno come due dischetti sovrapposti e non ben risolte. Per questo motivo il reciproco di d, si chiama potere risolutivo della lente. Il potere risolutivo è dunque tanto maggiore quanto più piccola è la lunghezza d’onda della luce e quanto più grande è il diametro della lente in rapporto alla distanza focale. Ovviamente un potere risolutivo più elevato consente di distinguere in maggior dettaglio la struttura microscopica degli oggetti: quella che ad occhio nudo appare come una superficie molto liscia, vista col microscopio ottico può mostrare rugosità, se queste sono più grandi di qualche decimo di micron, mentre arriviamo a rivelare la trama della disposizione atomica con un microscopio elettronico. A.5 La luce è un fenomeno ondulatorio Noi vediamo grazie alle radiazioni luminose emesse dagli oggetti, le quali, penetrando nei nostri occhi, determinano la percezione visiva 104 Appendice A fatta di forme e colori: tali radiazioni sono anche dette brevemente luce (dalla sensazione che producono). Per tutto il settecento convissero due concezioni contrastanti sulla natura della luce: quella newtoniana, secondo cui la luce consiste di sciami di minuscole particelle emesse dagli oggetti e quella di Huyghens che considerava la luce consistente di onde di piccola lunghezza d’onda. Entrambe, riuscivano a spiegare i fenomeni dovuti alla riflessione e rifrazione della luce — celebre risulta, ad esempio, la spiegazione di Newton dell’arcobaleno. Tali fenomeni non potevano perciò discriminare tra le due teorie. Fu solo quando nel 1802 Thomas Young, con un celebre esperimento, riuscì a produrre l’interferenza della luce che la teoria ondulatoria poté affermarsi. In questo esperimento, una sorgente di luce, di piccole dimensioni, molto intensa e monocromatica — vale a dire che emette luce di un dato colore — illumina un diaframma opaco con due forellini (v. Fig. A.5). Per effetto della diffrazione, la luce che emerge da ciascun forellino diverge in un cono e va a illuminare una zona estesa dello schermo. Le zone illuminate da ciascun forellino sono parzialmente sovrapposte, ma nella regione di sovrapposizione non si osserva una luminosità più intensa che sfuma verso i bordi — come ci aspetteremmo se la luce avesse natura corpuscolare —, bensì una figura di interferenza costituita da una successione di frange alternativamente luminose e scure. Figura A.5: Schema dell’esperimento di Young. Richiami di fisica delle onde 105 La distanza angolare tra la frangia luminosa centrale e la prima frangia luminosa laterale, in funzione di e della distanza d tra i fori, come si è visto, è data da: sin d A-4 Misurando l’angolo , dalla (A-4) si ottiene la lunghezza d’onda. La teoria elettromagnetica di Maxwell-Hertz mostra che la luce consiste di onde elettromagnetiche con lunghezze d’onda comprese in un intervallo caratteristico e che alla luce di un dato colore corrisponde una data lunghezza d’onda decrescente dal rosso al violetto. Le onde elettromagnetiche oggi conosciute e studiate occupano un intervallo amplissimo di lunghezze d’onda che prende il nome di spettro elettromagnetico (v. Fig. A.6). A.6 Polarizzazione della luce Le onde luminose e, in generale, le onde elettromagnetiche, al pari delle onde sulla superficie dei liquidi, sono onde trasversali, cioè le oscillazioni sono perpendicolari alla direzione di propagazione. Il piano formato dalla direzione di propagazione e da quella di oscillazione è detto piano di polarizzazione. Figura A.6: Spettro elettromagnetico. Le lunghezze d’onda sono espresse in nanometri (= nm = 10-9 m) e le frequenze corrispondenti in Hz (= oscillazioni al secondo). Notiamo che lo spettro visibile ha una larghezza di soli 300 nm, insignificante rispetto all’intero spettro che è più largo di 1013 nm. 106 Appendice A La luce naturale usualmente non è polarizzata, nel senso che la direzione di oscillazione cambia da un punto a un altro e, in un dato punto, cambia bruscamente e in modo caotico. Quando un fascetto di luce naturale passa attraverso una lastrina Polaroid™, il fascetto uscente è polarizzato. Polaroid™ è il nome commerciale del polimero bi-alcol polivinil impregnato di iodio, il quale, durante la preparazione, viene stirato in modo che le molecole del polimero si dispongano parallele tra loro (v. Fig. A.7a). La luce con polarizzazione parallela alle molecole del Polaroid™ è assorbita mentre quella con polarizzazione perpendicolare passa indisturbata. La direzione ortogonale alle molecole polimeriche è detta asse di polarizzazione. Supponiamo ora che un fascetto di luce polarizzata incida sul Polaroid™ in modo che la sua direzione di polarizzazione formi l’angolo con l’asse del Polaroid™. Figura A.7: a) Lastrina Polaroid™: l’asse di polarizzazione è ortogonale alle molecole orientate del polimero; b) se è l’angolo tra il piano di polarizzazione del campo e l’asse del Polaroid™, l’intensità dell’onda uscente è la frazione cos2 dell’intensità incidente; c) un’onda polarizzata ortogonalmente all’asse è completamente assorbita dal Polaroid™, mentre un’onda con polarizzazione parallela lo attraversa integralmente. Richiami di fisica delle onde 107 Le componenti dell’ampiezza dell’onda parallela e perpendicolare all’asse di polarizzazione sono date da E cos ed E sin , rispettivamente (v. Fig. A.7b), e i loro quadrati E2 cos2 ed E2 sin2 sono le corrispondenti intensità. La loro somma, pari a E2, è ovviamente l’intensità totale. Poiché la frazione sin2 dell’intensità del fascetto viene assorbita dal Polaroid™, il fascetto uscente ha polarizzazione diretta come l’asse del Polaroid™ e intensità E2 cos2 (v. Fig. A.7c) . Figura A.8: a) La luce con polarizzazione ortogonale all’asse ottico del cristallo, incidente normalmente alla faccia del cristallo, si propaga secondo una linea retta (raggio ordinario); b) la luce con polarizzazione parallela all’asse ottico esce spostata dal cristallo (raggio straordinario); c) se è l’angolo tra la direzione di polarizzazione e l’asse ottico, l’intensità del raggio ordinario è proporzionale a sin2 e quella del raggio straordinario a cos2 . 108 Appendice A Nel caso di un fascetto di luce naturale l’angolo cambia rapidamente e in modo caotico, per cui l’intensità del fascetto uscente si otterrà mediando su quella del fascetto con polarizzazione definita, 1 sarà quindi data da E 2 cos 2 = E 2 , ossia solo metà dell’intensità e2 sce dal Polaroid™. Inoltre, il fascetto uscente è polarizzato lungo l’asse del Polaroid™. Quando la luce entra in un monocristallo trasparente, si osserva spesso il fenomeno della doppia rifrazione. Per esempio, un raggio di luce che incide su un cristallo di calcite (CaCO3) si divide in due raggi rifratti che si propagano in direzioni diverse. Il cosiddetto raggio ordinario giace nel piano di incidenza (individuato dalla direzione d’incidenza e dalla normale alla superficie del cristallo) ed obbedisce alla legge di Snell, la quale stabilisce che il rapporto tra il seno dell’angolo d’incidenza e quello di rifrazione è costante. L’altro raggio rifratto, detto raggio straordinario, non soddisfa alla legge di Snell, poiché il rapporto tra i seni degli angoli d’incidenza e rifrazione cambia al cambiare dell’angolo d’incidenza. I cristalli di calcite hanno una direzione caratteristica, asse ottico, tale che un raggio che incide lungo tale direzione non si divide, ovvero i raggi ordinario e straordinario procedeno lungo la stessa direzione. Consideriamo ora un fascetto di luce che incide perpendicolarmente su una faccia parallela all’asse ottico di un spesso cristallo di calcite (v. Fig. A.8). In questo caso, dal cristallo escono due raggi ben separati, per cui è possibile determinare la loro polarizzazione mediante un Polaroid™. Si trova che entrambi i raggi sono polarizzati, con le polarizzazioni tra loro ortogonali: il raggio ordinario ha polarizzazione perpendicolare all’asse ottico e il raggio straordinario parallela (v. Figg. A.8a e A.8b). Se il fascetto polarizzato incide sul cristallo in modo che la sua direzione di polarizzazione formi l’angolo con l’asse ottico, l’intensità del raggio ordinario sarà la frazione sin2 di quella incidente e quella del raggio straordinario la frazione cos2 (v. Fig. A.8c). Appendice B Momento angolare B.1 Momento angolare in fisica classica Il momento angolare è una grandezza fisica realativa al moto dei corpi; la sua importanza nella descrizione moto sta nel fatto che, in certe circostanze, peraltro molto generali, essa non cambia nel tempo, ossia, come si dice, è una grandezza conservativa. Un esempio in cui si ha conservazione del momento angolare è il moto dei pianeti (v. Fig. B.1). La seconda legge di Keplero afferma che nel moto del pianeta lungo l’orbita ellittica intorno al Sole (che occupa uno dei fuochi) il raggio PS che congiunge il pianeta col Sole descrive aree uguali in tempi uguali. Nella Figura B.1, le due regioni triangolari colorate sono tracciate dal raggio vettore in un tempo t, a partire da punti diversi. Le loro aree sono date dal semiprodotto dello spostamento fatto dal pianeta nel t, ossia dalla base del triangolo, per l’altezza del triangolo, data dal segmento r che dal Sole cade perpendicolarmente sulla direzione di moto, e sono uguali. Indicando con v la velocità orbitale del pianeta, il suo spostamento nel tempo t è pari a v t, e quindi la corrispondente area risulta: Figura B.1: Moto ellittico di un pianeta intorno al Sole. 109 110 Appendice B A = 1 1 rvt = r pt 2 2m B-1 ove si è tenuto conto che v = p/m dove p è l’impulso e m la massa del pianeta. Vediamo dunque che, dovendo essere A costante, nei punti più lontani dal Sole, ovvero i punti con r più grande, la velocità e quindi l’impulso sono più piccoli, tali che rp = costante. Il prodotto rp rappresenta il modulo del momento dell’impulso p — in quanto prodotto del modulo di p per il relativo braccio r — detto brevemente momento angolare. Definito come vettore, il momento angolare ha direzione perpendicolare al piano dell’orbita con verso tale che, guardando a ritroso lungo essa il pianeta appare muoversi in senso antiorario. La seconda legge di Keplero si può perciò enunciare così: il vettore momento angolare di un pianeta nel suo moto orbitale è costante. La Terra e gli altri pianeti del sistema solare possono essere considerati puntiformi nel loro moto orbitale, poiché le loro dimensioni sono enormemente più piccole delle rispettive distanze dal Sole. La Terra possiede però anche un moto di rotazione attorno al suo asse (che passa per il centro di massa). Figura B.2: Momento angolare orbitale e spin di un pianeta in moto attorno al Sole. Momento angolare 111 Ogni particella del nostro pianeta possiede quindi un impulso di rotazione p = m r, dove m è la massa della particella, la velocità angolare della Terra (1 giro al giorno, ovvero 2/(24 3600) = 7.3 10–5 rad/s) e infine r è la distanza dall’asse di rotazione. Il momento angolare della particella rispetto al centro della sua orbita circolare ha quindi il modulo m r2 e direzione coincidente con l’asse terrestre. La somma dei momenti angolari di tutte le particelle di un pianeta è il cosiddetto momento angolare intrinseco di quel pianeta o brevemente lo spin (v. Fig. B.2). B.2 Momento angolare in fisica quantistica Naturalmente, nella fisica classica il momento angolare è una grandezza continua, per cui, ad esempio, un oggetto orbitante, sia esso un pianeta o un satellite o un granello di polvere cosmica, può avere un momento angolare di qualsiasi valore. Diverso è il caso delle particelle atomiche. Consideriamone una che effettua un moto circolare uniforme con impulso p. Si tratta di un moto periodico, tale cioè che si ripete identico ad ogni giro, e lo stesso deve valere per la corrispondente onda di De Broglie. Perché questa condizione sia soddisfatta occorre che la lunghezza d’onda stia un numero intero di volte nella circonferenza. Nella Figura B.3 sono mostrati, ad esempio, due casi: nel primo la circonferenza è esattamente pari a 5 lunghezze d’onda, e qui l’onda arriva alla fine del giro con la stessa identica fase che aveva all’inizio. Nel secondo caso la circonfe- Figura B.3: Onda di De Broglie su un’orbita circolare. La condizione necessaria a ottenere un’onda che si ripete identicamente ad ogni giro è che la circonferenza sia un multiplo intero della lunghezza d’onda. 112 Appendice B renza è invece pari a 4 onde intere più 6/10 di onda, per cui la fase alla fine del giro è diversa che all’inizio. In conseguenza della periodicità del moto deve quindi essere: 2r = n dove n è un numero intero. Poiché si ha = h/p, sostituendo nella precedente otteniamo: pr = n h = n 2 B-2 Questa relazione ci dice che il modulo del momento angolare orbitale (primo membro), non può avere un qualsiasi valore, ma deve essere un multiplo intero della costante di Planck divisa per 2, ossia di (unità di momento angolare), e non può quindi variare meno di un quanto . Appendice C Filtro e analizzatore di spin Disponendo due magneti di Stern-Gerlach in modo che diano campi opposti (v. Fig. C.1a), si ottengono in uscita due fascetti paralleli, uno costituito di atomi con spin su e l’altro con spin giù. Un tale dispositivo, che può essere usato per misurare componenti di spin (analizzatore di spin) è l’equivalente del cristallo di calcite usato nelle misure di polarizzazione dei fotoni. Inoltre, disponendo tre magneti come illustrato in Figura C.1b, dove i due magneti laterali hanno lunghezza metà e campi opposti di quello centrale, possiamo ottenere in uscita un fascetto avente la direzione di quello in ingresso ma contenente atomi con una determinata orientazione dello spin. Per questo è sufficiente porre entro l’apparato un piccolo schermo che intercetta gli atomi con polarizzazione opposta. Questo dispositivo, detto filtro di spin, è l’equivalente del filtro Polaroid™ per la polarizzazione dei fotoni. Supponiamo ora che un atomo con componente di spin + in una data direzione, diciamo la direzione z, penetri in un analizzatore – o in un filtro – di spin il cui asse z´ forma l’angolo con z (v. Fig. C.2). Figura C.1: a) Dispositivo per la separazione di fascetti di atomi con diverse componenti di spin; b) tre magneti di Stern-Gerlach, disposti in modo da ottenere un fascio di atomi con componente di spin definita e con la stessa direzione del fascio incidente. 113 114 Appendice C Se lo spin fosse un vettore classico, avrebbe componenti 1 2 cos lungo z´ e 1 2 sin perpendicolarmente a z´. Tuttavia, dal punto di vista della teoria quantistica lo spin dell’atomo ha componente definita ± solo lungo z´, poiché l’analizzatore può misurare solo una componente dello spin, quella lungo il proprio asse. Le probabilità p± che il singolo atomo esca dal canale + o dal canale -, rispettivamente, possono essere determinate dalla condizione che, se un fascetto formato da un gran numero di atomi penetra nell’analizzatore, il valore medio delle componenti di spin degli atomi uscenti dal canale +, cioè: p+– p–, deve essere uguale al valore classico cos . Da p+ – p– = cos, e dall’ovvia condizione p+ + p– = 1, otteniamo p+ = 1 + cos 1 cos = cos 2 , p = = sin 2 2 2 2 2 C-1 Figura C.2: L’analizzatore di spin misura le componenti di spin secondo la direzione del campo interno (freccetta rossa). Nel caso di spin , se la misura dà per la componente risultato +, l’atomo esce dal canale (+), altrimenti, se dà risultato –, esce l canale (-). Il filtro di spin blocca invece gli atomi aventi una determinata componente. Determinismo e caos 115 Segue che, se la componente dello spin della particella incidente è ortogonale alla direzione del filtro, il 50% delle particelle incidenti uscirà dal filtro. Inoltre se la componente è opposta alla direzione del filtro, da quest’ultimo non uscirà alcuna particella. Appendice D Disuguaglianza di Clauser–Horne Consideriamo quattro numeri x1, x2, x3, x4, tali che 0 xi 1 (i=1,…4). Mostreremo che Z = x1 x2 – x1 x4+ x2 x3+ x3 x4 – x2 – x3 soddisfa la disuguaglianza : –1 Z 0. Partendo dal limite superiore, consideramo il caso x1 > x3 e il suo opposto, x1< x3. Nel primo caso scriviamo Z nella forma: Z = (x1 1)x2 + (x2 1)x3 + (x3 x1 )x4 D-1 essendo i tre termini del secondo membro negativi, l’asserto è dimostrato. Nel secondo caso, scriviamo: Z = x1 x2 x1 x4 + x2 x3 + x3 x4 x2 x3 x1 x2 x3 x4 + x2 x3 + x3 x4 x2 x1 = x1 x2 + x2 x3 x2 x1 = x1 (x2 1) + x2 (x3 1) 0 D-2 da cui segue che la disuguaglianza rispetto al limite superiore è dimostrata. Considerando il limite inferiore, mostreremo che Z+1 0. Si vede facilmente che Z + 1 = x1 x2 x1 x4 + x2 x3 + x3 x4 x2 x3 + 1 = (1 x2 )(1 x3 ) + x1 x2 x1 x4 + x3 x4 = (1 x2 )(1 x3 ) + x1 (x2 x4 ) + x3 x4 = (1 x2 )(1 x3 ) + x1 x2 + x4 (x3 x1 ) D-3 Dalle due ultime espressioni segue Z+1 0 se x2 > x4 e Z+1 0 se x3> x1. Rimane quindi da dimostrare che Z+1 0 se x2< x4 e x3< x1. 117 118 Appendice D Aggiungendo e sottraendo x2x3 al penultimo membro della precedente, possiamo riscriverlo nella forma: Z + 1 = (1 x2 )(1 x3 ) + x1 (x2 x4 ) + x3 x4 x2 x3 + x2 x3 = (1 x2 )(1 x3 ) (x4 x2 )(x1 x3 ) + x2 x3 D-4 da cui vediamo che, poiché 1– x2 > x4 – x2 e 1– x3 > x1 – x3, i primi due termini danno un contributo positivo e la doppia disuguaglianza è dimostrata. Appendice E Interferometro di Mach–Zender L’interferometro di Mach–Zehnder usato nell’esperimento di Townsend è mostrato in Figura E.1. L’onda fotonica e divisa in due parti da un divisore di fascio. La parte trasmessa è a sua volta divisa in due da un secondo divisore di fascio; la parte trasmessa incide in successione su due specchi ciascuno dei quali la riflette ad angolo retto per poi incidere anch’essa sul secondo divisore di fascio. Alle uscite, due fotomoltoplicatori, A e B, misurano le frequenze di conteggio dei fotoni in accordo all’interferenza della coppia di onde che arriva su ciascuno di essi. Per determinare la differenza di fase delle due onde di ciascuna coppia, occorre tener conto delle regole seguenti. • Nelle riflessioni, quando l’onda rimane nel mezzo con indice di rifrazione più alto, la fase dell’onda non cambia, mentre si ha un incremento di fase di se l’onda rimane nel mezzo con indice di rifrazione più basso. • Le due onde attraversano lungo i loro cammini lo stesso spessore di vetro, per cui il corrispondente spostamento di fase è lo stesso per entrambe e non influisce sull’interferenza. Figura E.1: Schema dell’interferometro di Mach–Zender 119 120 Appendice E In base a queste regole, abbiamo: nel cammino più lungo, l’onda acquista una fase di (ovvero mezza lunghezza d’onda) in ciascuna delle tre riflessioni; la quarta riflessione lascia la fase invariata, per cui l’onda raggiunge A e B con un surplus di fase dovuto alle riflessioni di 3 (una lunghezza d’onda e mezzo). Nel cammino più corto, l’onda è riflessa verso A dal secondo divisore di fascio acquisendo in questa riflessione uno spostamento di fase di (mezza lunghezza d’onda). In breve, le due onde giungono in A con una differenza di fase dovuta alle riflessioni pari a 2 (quindi in fase), mentre tale differenza di fase è in B di 3 (quindi in opposizione di fase). Bibliografia Capitolo I a) b) c) d) e) Arnold V.I., Catastrophe Theory, Springer-Verlag, Berlino1986. Ruelle D., Caso e caos, Bollati Boringhieri, Torino1995. Horgan J., La fine della scienza, Cap.8, Adelphi, Milano 1998. Stewart I., Dio gioca ai dadi?, Bollati Boringhieri, Torino 1993. Buchanan M., Ubiquità, Mondadori, Milano 2001. Capitolo III a) Feynman R., La legge fisica, Boringhieri, Torino 1972. Capitolo IV a) Heisenberg W., I principi fisici della teoria dei quanti, Einaudi, Torino 1953. b) Siringo F.G. e Angiella G.G.N., Concetti fisici e applicazioni della meccanica quantistica, Aracne, Roma 2005. Capitolo VI a) Scully M.O., Englert B.-G., and Walther H., Quantum Optical Tests of Complementarity, Nature, 9 May 1991. b) Englert B.-G., Scully M.O., and Walther H., The Duality of Matter and Light, Scientific American, December 1994. c) Horgan J., Quantum Philosophy, Scientific American, July 1992. d) Dürr S., Nonn T., and Rempe G., Origin of quantum-mechanical complementarity probed by a ‘which-way’ experiment in an atom interferometer , Nature, 3 September 1998. e) Zeilinger A., Il velo di Einstein. Il nuovo mondo della fisica quantistica, Einaudi, Torino 2005. f) Styer D.F., Lo strano mondo della meccanica quantistica, Aracne, Roma 2005 121 122 Bibliografia Capitolo VII a) Albert D., Meccanica quantistica e senso comune, Adelphi, Milano 2000. b) Celebrazione 70° Compleanno Giancarlo Ghirardi, Special issue The Quantum Universe, JPA, vol. 40 n. 12, 23 March 2007. http://www.iop.org/EJ/toc/1751-8121/40/12 Capitolo VIII a) Mollin R.A., An introduction to Cryptography, Chapman & Hall/CRC Press Inc., Boca Raton USA 2000. AREE SCIENTIFICO–DISCIPLINARI Area 01 – Scienze matematiche e informatiche Area 02 – Scienze fisiche Area 03 – Scienze chimiche Area 04 – Scienze della terra Area 05 – Scienze biologiche Area 06 – Scienze mediche Area 07 – Scienze agrarie e veterinarie Area 08 – Ingegneria civile e Architettura Area 09 – Ingegneria industriale e dell’informazione Area 10 – Scienze dell’antichità, filologico–letterarie e storico–artistiche Area 11 – Scienze storiche, filosofiche, pedagogiche e psicologiche Area 12 – Scienze giuridiche Area 13 – Scienze economiche e statistiche Area 14 – Scienze politiche e sociali Le pubblicazioni di Aracne editrice sono su www.aracneeditrice.it Finito di stampare nel mese di agosto del dalla «ERMES. Servizi Editoriali Integrati S.r.l.» Ariccia (RM) – via Quarto Negroni, per conto della «Aracne editrice S.r.l.» di Roma