5 Digressione sulla fisica dell`atomo

annuncio pubblicitario
A02
40
In copertina: Fotografia (in falsi colori) della luce emessa da un convertitore parametrico (Paul Kwiat e Michael Reck, Institute of quantum optics and quantum
information, Vienna).
Luciano Cianchi / Marco Lantieri / Paolo Moretti
Determinismo, realismo e località
in fisica classica e quantistica
Copyright © MMVII
ARACNE editrice S.r.l.
www.aracneeditrice.it
[email protected]
via Raffaele Garofalo, 133 A/B
00173 Roma
(06) 93781065
ISBN
978–88–548–1243–7
I diritti di traduzione, di memorizzazione elettronica,
di riproduzione e di adattamento anche parziale,
con qualsiasi mezzo, sono riservati per tutti i Paesi.
Non sono assolutamente consentite le fotocopie
senza il permesso scritto dell’Editore.
I edizione: luglio 2007
Ad Alessia, Lucia, Andrea e Giorgio
… futuri benevoli lettori
…we no longer find it unaccetable that physics, rather
than being descriptive, should merely be predicitive of
observations. And then the interpretational difficulties
of quantum mechanics just simply vanish since the set
of the quantum mechanical basic laws is in fact
nothing else than a set of predictive rules, yelding the
probabilites that, in such and such circumstances, we
shall observe this or that…
…non troveremo più inacettabile che la fisica, piuttosto
che descrivere le osservazioni, le predica soltanto.
Allora, le difficoltà d’interpretazione della meccanica
quantistica semplicemente spariscono, poiché le sue
leggi fondamentali non sono di fatto niente più che
regole predittive, le quali dànno le probabilità che in
certe circostanze si osservi questo o quello…
Bernand d’Espagnat (2006)
Indice
Prefazione XIII
1. Determinismo e caos 1
1.1. Considerazioni generali 1
1.2. Equilibri instabili 3
1.3. Dipendenza sensibile dalle condizioni iniziali 4
1.4. Complessità del sistema 5
1.5. Caos, limiti del determinismo e realismo 7
2. Personaggi del mondo atomico 9
2.1. I costituenti dell’atomo 9
2.2. Quanti di luce: il fotone 10
3. Onde o particelle? 17
3.1. Onde di De Broglie 17
3.2. Esperimenti ideali di Feynman 18
3.3. Esperimenti reali 22
4. Principio d’indeterminazione 27
4.1. Il microscopio di Heisenberg 27
4.2. Dal microscopico al macroscopico 30
5. Digressione sulla fisica dell’atomo 37
5.1. Dimensioni atomiche 37
5.2. Spettri atomici 41
5.3. Struttura atomica e spin 42
5.4. Esperimento di Stern e Gerlach 49
6. Indeterminazione e complementarità 59
6.1. Esperimento delle due fenditure: qual è la traiettoria
dell’elettrone? 59
6.2. Interferenza con luce diffusa da due atomi 61
6.3. Esperimento di Rochester 65
7. Teoria quantistica vs. teorie realistiche locali 73
7.1. Paradosso di Einstein–Podolski–Rosen 73
7.2. Il teorema di Bell 79
7.3. Una versione alternativa del teorema di Bell. L’esperimento di
Aspect 82
8. Criptografia 87
8.1. Considerazioni generali 87
8.2. Il metodo Vernam 88
8.3. Sistemi a chiave pubblica 89
8.4. La criptografia quantistica di Bennet e Brassard 91
Appendice A: Richiami di fisica delle onde 97
A.1. Onde superficiali in un liquido 97
A.2. Interferenza 99
A.3. Diffrazione 101
A.4. Digressione sul potere risolutivo 102
A.5. La luce è un fenomeno ondulatorio 103
A.6. Polarizzazione della luce 105
Appendice B: Momento angolare 109
B.1. Momento angolare in fisica classica 109
B.2. Momento angolare in fisica quantistica 111
Appendice C: Filtro e analizzatore di spin 113
X
Appendice D: Disuguaglianza di Clauser–Horne 117
Appendice E: Interferometro di Mach–Zender 119
Bibliografia 121
XI
Prefazione
Questo libro trae spunto da una serie di lezioni tenute nel 2005 e
2006 agli studenti delle ultime classi del Liceo Scientifico “Castelnuovo” di Firenze o, più precisamente, a quelli di loro che avevano
manifestato l’intenzione di iscriversi, dopo il liceo, a facoltà scientifiche. Esso concerne la fisica atomica e la rivoluzione che la teoria
quantistica produsse in alcuni fondamenti della fisica, quali determinismo, realismo e località. Nel presentare gli argomenti abbiamo adottato l’interpretazione canonica che, nell’ultima parte del secolo scorso,
ha ricevuto una serie di conferme sperimentali. I paradossi di cui si
sente parlare sono dovuti per lo più alla inadeguatezza del linguaggio
formatosi nell’ambito dell’esperienza quotidiana, dove gli oggetti, anche quelli più piccoli con cui si ha a che fare, sono costituiti da una
quantità innumerevole di atomi.
Riguardo all’esposizione degli argomenti, abbiamo deciso di non
entrare nel formalismo matematico della teoria, sia pure in modo marginale, e neanche di dare al testo un taglio troppo divulgativo. Nel
primo caso, infatti, sarebbe un dialogo tra sordi, e nel secondo – ricorrendo a metafore per smussare gli spigoli ed evidenziare gli aspetti
sensazionali – si rischierebbe di indurre nel lettore idee fuorvianti.
Abbiamo, perciò, tentato una via di mezzo: quella di descrivere i fenomeni attraverso esperimenti ideali –– vale a dire con dispositivi idealizzati —, i quali in molti casi sono stati eseguiti realmente in seguito
al progresso della tecnologia, che ha permesso di disporre di strumentazione adeguata. Gli esperimenti ideali si prestano bene ad illustrare,
senza bisogno di affrontare argomenti troppo tecnici, ciò che succederebbe se l’esperimento potesse essere eseguito. In effetti, questa via
non esclude del tutto il ricorso a qualche calcolo algebrico, ma in tal
caso la matematica utilizzata può essere circoscritta all’ambito delle
conoscenze di uno studente liceale.
Il libro, tuttavia, non si rivolge esclusivamente a studenti di questo
tipo, ma anche a insegnanti di materie scientifiche e di filosofia; più in
generale, a un pubblico non specialistico ma dotato di istruzione universitaria.
XIII
Abbiamo trattato dapprima il determinismo della fisica classica, la
sua crisi in relazione all’imprevedibilità pratica dei fenomeni caotici, e
l’affermazione della concezione classica di realismo. Siamo, poi, entrati nel mondo atomico, descrivendone sommariamente i “personaggi” principali — fotoni, elettroni, protoni — e la loro natura duale onda-particella, ipotizzata da De Broglie. Inoltre, attraverso la descrizione di alcuni esperimenti ideali proposti da Feynman, abbiamo esposto
l’interpretazione probabilistica delle onde di De Broglie e la conseguente capitolazione del realismo. Per la loro importanza, non solo didattica, abbiamo brevemente illustrato anche alcuni esperimenti reali
sulla cosiddetta interferenza da due fenditure. A questo punto abbiamo trattato il principio di indeterminazione attraverso la discussione
della misura di posizione per mezzo del microscopio di Heisenberg, e
stabilendo la linea di confine tra fisica classica e quantistica. Di seguito, abbiamo inserito una digressione sulla fisica dell’atomo alla luce
del principio d’indeterminazione e dei principi quantistici.
Dopo di ciò, abbiamo enunciato il principio di complementarità,
limitatamente ai due aspetti corpuscolare e ondulatorio, e posto il problema se tale complementarità fosse l’effetto dell’inevitabile perturbazione che l’osservazione produce sul sistema osservato, come sembra
prescrivere il principio d’indeterminazione, oppure se essa costituisse
un principio insito nella natura del mondo atomico. A questo proposito, abbiamo discusso alcuni esperimenti effettuati nei primi anni ’90, i
quali mostrano che è vera la seconda ipotesi, e dalla cui interpretazione mediante la teoria quantistica emergerebbe, inoltre, una palese violazione del principio di località.
Questi argomenti epistemologici sono stati, quindi, approfonditi discutendo il paradosso di Einstein, Podolsky e Rosen, il teorema di Bell
e la sua verifica sperimentale di Aspect, i cui risultati sembrano contraddire in modo inequivocabile le cosiddette teorie realistiche locali.
Infine, a testimonianza del notevole impatto pratico che può avere la
fisica di base, abbiamo discusso i metodi per criptare un messaggio e
come l’impiego di quantum-bit (qubit), permesso dalle moderne tecnologie di manipolazione dei fotoni, possa rendere la decifrazione di
un messaggio criptato da parte di una spia praticamente impossibile.
XIV
1 Determinismo e caos
1.1
Considerazioni generali
Ci sono fenomeni che apparentemente non hanno regole, non sono
soggetti ad alcuna legge, non manifestano ordine o simmetrie: ad esempio, l’infrangersi delle onde marine sugli scogli, il turbinio
dell’aria e della pioggia in una tempesta, la scarica di un fulmine, la
crescita irregolare dei rami degli alberi o dei fiori ed erbe in un prato
di montagna. Invece, in altri fenomeni, l’ordine, la simmetria e la presenza di leggi sono evidenti: ad esempio, il ripetersi regolare del moto
degli astri, o la distribuzione dei colori nell’arcobaleno, o anche il fatto che fenomeni apparentemente caotici, come per esempio i fulmini,
sono accompagnati, ogni volta che hanno luogo, da circostanze costanti (tuoni, nuvole e temporali). Furono certo osservazioni di questo
tipo che nell’antichità diedero origine ad una visione del mondo dialettica, in cui legge e ordine convivono col caos o, più precisamente,
in cui le leggi delimitano il campo entro cui opera il caos.
Figura 1.1: Nell’immagine del fulmine gli aspetti caotici nelle ramificazioni sono
evidenti1. Al contrario, l’arcobaleno ci appare sempre con la stessa configurazione
dei colori, con il rosso all’esterno e il viola dalla parte interna. Si può notare anche
l’arco secondario, sebbene molto più debole, in cui l’ordine dei colori è invertito 2.
1
2
http://www.chaseday.com/lightning.htm © Gene Moore
http://www.missouriskies.org/rainbow/february_rainbow_2006.html © Dan Bush
1
2
Capitolo I
Così, guardando una foresta, un pensatore antico può essersi detto:
«Tutti questi alberi sono costituiti ciascuno da un tronco, da rami e da
foglie. Sono questi aspetti costitutivi che ci fanno classificare un albero come tale e distinguerlo da altri vegetali quali un fiore, un’alga etc.
Tuttavia anche tra alberi della stessa specie la forma del tronco cambia
irregolarmente dall’uno all’altro, lo stesso dicasi dei rami e delle foglie: le differenze, piccole o grandi che siano, appaiono senza regole,
sono una manifestazione del caos.»
L’antica concezione in cui l’ordine convive col caos mutò radicalmente con l’avvento della scienza moderna. Specialmente con lo sviluppo della meccanica astronomica andò man mano formandosi una
visione del mondo affatto diversa, improntata al più rigoroso determinismo, in cui il moto di ogni corpo, dalla particella più piccola alle enormi galassie, è perfettamente determinato una volta che siano note
le forze — da cui si determinano le accelerazioni — e le cosiddette
condizioni iniziali (posizioni e velocità di tutte le particelle del sistema
considerato ad un certo istante).
Questa visione del mondo fu espressa in modo assai categorico dal
matematico francese Pierre Simon de Laplace (1825). Ecco le sue parole:
«Un’intelligenza che, ad un istante dato, conoscesse tutte le forze da cui
la natura è animata e la situazione rispettiva degli esseri che la compongono,
se fosse abbastanza vasta da sottoporre questi dati ad analisi abbraccerebbe
nella stessa formula i moti dei corpi più grandi dell’universo e quelli
dell’atomo più leggero: per essa non ci sarebbe nulla di incerto ed il futuro
come il passato sarebbe presente ai suoi occhi».
Con ciò, evidentemente, niente è dovuto al caso e si arriva a negare
anche per l’uomo ogni possibilità di scelta. Infatti, dal momento che
tutto è predeterminato, il libero arbitrio non può esistere.
Il determinismo dominò incontrastato fino all’inizio del XX secolo.
E anche chi sentiva il bisogno di salvaguardare il libero arbitrio, non
arrivava ad abbandonarlo completamente, supponendo che valesse solo per il mondo inorganico. Tuttavia, per quanto si possa in astratto
accettare l’idea dell’intelligenza sovrumana di Laplace, l’uomo rimane
sempre vincolato a limiti pratici di conoscibilità. Ad esempio, per
Determinismo e caos
3
scrivere i dati sulle posizioni e le velocità (condizioni iniziali) delle
molecole contenute in un litro di aria ambiente non basterebbero le
pagine di tutti i libri del mondo. Inoltre, le forze tra due molecole, dipendono dalle distanze e da altri parametri in modo complicatissimo.
In pratica, se si escludono situazioni relativamente semplici, è impossibile fare delle previsioni certe sugli eventi quotidiani e la ricetta di
Laplace, nella pratica delle cose, è inutilizzabile. Alla base di questa
impossibilità troviamo, per l’appunto, il caos. Ma quali sono le ragioni
del caos? Lo vedremo analizzando alcuni casi concreti.
1.2
Equilibri instabili
Supponiamo di voler tenere in equilibrio sulla punta un solido a
forma di cono. Si tratta di un’impresa oltremodo ardua, perché bisogna far sì che la verticale per il baricentro del cono, che si trova più in
alto della punta, passi esattamente per quest’ultima, altrimenti, per
quanto poco la verticale si discosti dalla punta, il cono cadrà. D’altra
parte, per quanta cura si possa mettere, quando lo si lascia libero è facilissimo imprimergli una spinta, anche minima (basta un leggerissimo tremore della mano), che lo fa cadere. Inoltre, la punta e il piano
d’appoggio avranno sempre delle piccole irregolarità le quali sono
anch’esse cause di equilibrio precario.
Ma supponiamo pure che, con certosina pazienza, si riesca a mettere per un attimo il cono in equilibrio. Basterà una piccolissima perturbazione: un refolo d’aria, delle vibrazioni irrisorie del piano
d’appoggio – che possono essere prodotte da una miriade di cause diverse – per imprimere un piccolo impulso al cono e determinare la rottura dell’equilibrio. Ovviamente è molto difficile prevedere in che direzione cadrà il cono, perché non sappiamo prevedere la natura e la
direzione d’azione della perturbazione. Ripetendo l’esperimento molte
volte, se il cono è costruito a “regola d’arte”, nel senso che non vi sono asimmetrie né nella forma né all’interno del materiale (per esempio
piccole cavità), si troverà che ogni volta il cono cade in una direzione
diversa, senza regole apparenti, a caso. Vediamo, dunque, che una
causa irrisoria può produrre un effetto ben evidente: la caduta del cono
in una ben precisa, ma imprevedibile, direzione.
4
1.3
Capitolo I
Dipendenza sensibile dalle condizioni iniziali
Immaginiamo un biliardo ideale, dove le palle rotolano senza rallentare, sul quale sono fissati degli ostacoli cilindrici. Sponde e ostacoli sono perfettamente lisci e rigidi, cosicché le palle rimbalzano,
senza perdere velocità, secondo un angolo uguale a quello di incidenza (v. Fig. 1.2a). In Figura 1.2b è indicato (linea nera) un possibile
percorso di una palla, la quale incide, secondo un certo angolo, nel
punto A di una sponda, qui rimbalza andando ad incidere sulla sponda
opposta, poi di nuovo sulla prima, quindi sulla sponda laterale, finché
viene ad urtare in successione due ostacoli che ne deviano la traiettoria un po’ meno di un angolo piatto ciascuno, e così via. Consideriamo
ora una seconda traiettoria, incidente anch’essa in A, ma con un angolo di pochissimo diverso da quello considerato prima. Essa si discosta
sempre più dalla prima; tuttavia, finché la palla urta solo con le sponde, l’angolo tra le due traiettorie rimane invariato. Se è
quest’angolo, che abbiamo supposto molto piccolo, la distanza d tra le
due traiettorie cresce in proporzione alla distanza L complessivamente
percorsa, e precisamente d = L.
Figura 1.2: a) Urto di una sferetta contro un ostacolo, entrambi perfettamente rigidi,
elastici e lisci. In base alle leggi della meccanica classica, la velocità rimane invariata in valore, mentre la direzione cambia in modo che i = r. b) Le traiettorie nera e
rossa incidono in A con un angolo leggermente diverso. Già dopo il primo urto contro un ostacolo cilindrico le due traiettorie divengono del tutto scorrelate.
Determinismo e caos
5
All’atto di un urto con un ostacolo cilindrico la situazione cambia
radicalmente, poiché il fatto che le traiettorie siano spostate fa sì che
l’angolo d’incidenza e quindi quello di riflessione siano molto diversi.
L’angolo tra le due traiettorie cresce quindi improvvisamente di una
quantità che può essere molto maggiore di . In Figura 1.2b si vede,
ad esempio, che, nell’urto col primo ostacolo, la prima traiettoria devia quasi di un angolo piatto, mentre la seconda devia di circa la metà
di un angolo retto. Da questo punto in poi la seconda traiettoria non ha
più niente a che vedere con la prima. Quindi, il cambiamento di una
quantità piccolissima della direzione della velocità iniziale, cambia
radicalmente il moto nei tempi successivi. Poiché la direzione iniziale
può essere conosciuta solo con una certa approssimazione, per quanto
elevata questa sia, la prevedibilità del moto a tempi lunghi risulta impossibile. Se misuriamo la posizione e la velocità della palla ad un dato istante e poi andiamo ad osservare la palla dopo un tempo sufficientemente lungo, quasi certamente non la troveremo nel punto del biliardo e con la velocità calcolati in base ai dati misurati, ma in un altro
punto e con un’altra direzione di moto, punto e direzione di moto che
possono essere diversissimi in relazione alla precisione con cui sono
note le condizioni iniziali e al tempo trascorso. Si dice in tal caso che
il sistema presenta una dipendenza sensibile dalle condizioni iniziali.
1.4
Complessità del sistema
Per proseguire la nostra indagine sulle ragioni del caos analizzeremo ora un sistema complesso. Oggi l’aggettivo complesso può significare molte cose diverse e una definizione generale è impossibile.
Qui ci atterremo a una definizione tradizionale, secondo cui un sistema complesso è un sistema costituito da un enorme numero di parti
elementari (molecole, magneti atomici, particelle cariche, etc.) che
possono interagire tra loro in molti modi. Tali sistemi mostrano talvolta un comportamento d’insieme che può essere descritto in modo
semplice. Per esempio, il comportamento di un gas abbastanza rarefatto non dipende dalla natura delle sue molecole, siano esse costituite da
un atomo, come i gas nobili, da due, come l’idrogeno e l’ossigeno, o
6
Capitolo I
da più di due atomi, come, ad esempio, il metano e gli altri idrocarburi
gassosi.
Consideriamo dunque un gas rarefatto racchiuso in un recipiente.
Poiché le proprietà d’insieme di un tale sistema sono indipendenti dalla natura delle molecole, per fissare le idee, possiamo raffigurarcele
come minuscole sferette elastiche.
Normalmente i sistemi gassosi con cui si ha a che fare contengono
un numero enorme di molecole (dell’ordine di 1023, ossia 1 seguito da
23 zeri) in continuo movimento, con velocità comprese entro ampi limiti, ma in media, nelle condizioni dell’aria ambiente, dell’ordine di
500 m/s (v. Fig. 1.3).
Uno stato microscopico del gas è definito dalla posizione e dalla
velocità, in valore e direzione, di ciascuna molecola. Le molecole urtano incessantemente e frequentemente tra loro e con le pareti del
contenitore percorrendo traiettorie a zig–zag. In Figura 1.3 ne sono
rappresentate due che differiscono solo per la direzione della velocità
iniziale (punto O) che, dall’una all’altra, cambia di un piccolissimo
angolo. Si può stimare che ogni molecola di aria ambiente subisca in
Figura 1.3: Due possibili moti di una molecola a partire da un punto O. Essi differiscono solo per la direzione della velocità iniziale che dall’uno all’altro cambia di un
piccolissimo angolo. Dopo un certo numero di urti le due traiettorie finiscono in due
punti diversi A e B con velocità diverse, completamente scorrelate tra loro.
Determinismo e caos
7
media circa dieci miliardi (1010) di urti al secondo, percorrendo tra un
urto e l’altro un tratto dell’ordine di qualche decina di volte le sue dimensioni. In un intervallo di tempo anche molto breve lo stato di moto
delle molecole cambia quindi radicalmente numerose volte. Come
nell’esempio del biliardo, ciascun urto incrementa infatti notevolmente quest’angolo. Se, per esempio, tale incremento fosse di un fattore
10, dopo due urti il fattore sarebbe 102, così dopo N urti, con N 1 ,
il fattore sarebbe un numero enorme: 10N. Si capisce allora che, nonostante la quasi identità delle condizioni iniziali dopo un po’ le posizioni (punti A e B in Fig. 1.3) sarebbero completamente scorrelate tra loro, tanto che potrebbero essere due punti qualsiasi, presi a caso.
Nell’esempio considerato il “caos” dei possibili stati finali è dunque
dovuto non soltanto alla dipendenza sensibile dalla direzione iniziale,
ma anche all’enorme numero di urti subiti dalle molecole.
1.5
Caos, limiti del determinismo e realismo
Possiamo dunque riassumere le ragioni del caos nei seguenti tre
punti:
• Imprevedibili cause irrisorie, che determinano effetti rilevanti
• Dipendenza sensibile dallo stato iniziale.
• Azione di innumerevoli piccole cause.
Dalla discussione precedente emerge l’impossibilità per l’uomo di
effettuare previsioni certe sull’evoluzione di molti fenomeni a tempi
lunghi. Tuttavia, nella fisica classica l’impossibilità di una descrizione
deterministica dipende sostanzialmente da motivi pratici, legati alle
nostre limitate capacità di indagine sia teoriche sia sperimentali. Questi limiti, avendo natura pratica, non contraddicono il cosiddetto realismo che, in una delle possibili definizioni, recita così:
I fenomeni nascono e si evolvono secondo precise regole indipendenti dall’osservazione. In altre parole, essi non sono mai indeterminati in sè, ma tutt’al più inconoscibili a causa di effetti caotici.
In un certo senso, questa asserzione assegna alla natura la capacità
di prescrivere con esattezza qualsiasi evento dell’universo. Vedremo,
però, che tale concezione non è valida per i fenomeni atomici.
2 Personaggi del mondo atomico
2.1
I costituenti dell’atomo
Nella seconda metà del XIX secolo furono effettuati studi determinanti sulla natura dell’elettricità e sui suoi legami con la materia. In
particolare si scoprì che l’elettricità negativa è trasportata da particelle
leggerissime, gli elettroni, presenti in tutti i materiali, mentre
l’elettricità positiva è, per così dire, incastonata nella materia massiva.
Gli esperimenti stabilirono che la massa degli elettroni è circa 1860
volte più piccola di quella dell’atomo di idrogeno, che è l’atomo più
leggero. I valori, oggi conosciuti con gran precisione, della carica e
della massa dell’elettrone sono:
• e = 1.60217653(14) 10-19 C
• me = 9.1093826(16) 10-31 kg
Per quanto riguarda la struttura dell’atomo, una serie di esperimenti
condotti da Rutherford (Brightwater Nuova Zelanda 1871, Cambridge
1937) nel 1911 portò alla scoperta del cosiddetto modello planetario
(v. Fig. 2.1) in cui gli elettroni orbitano attorno a un piccolissimo nucleo, dov’è concentrata praticamente l’intera massa atomica e che porta una carica positiva uguale alla carica complessiva degli elettroni orbitanti, cosicché l’intera struttura risulta elettricamente neutra.
Figura 2.1: Modello planetario dell’atomo, in cui i leggeri elettroni orbitano attorno
a un piccolissimo nucleo massiccio. Nel nucleo sono presenti tante cariche positive,
protoni (sferette rosse), quanti sono gli elettroni orbitanti, per cui l’atomo è complessivamente neutro. I neutroni sono rappresentati dalle sferette verdi.
9
10
Capitolo II
La prova decisiva che il nucleo avesse una struttura si ebbe con la
scoperta che l’emissione radioattiva produceva una trasmutazione del
nucleo emettitore, cioè una trasformazione di questo nucleo in quello
di un diverso elemento. La storia delle scoperte che svelarono la struttura del nucleo, è molto interessante, ma esula dal nostro contesto. Basterà dire che una prima tappa si concluse negli anni ’20 del secolo
scorso, con la scoperta del protone come costituente del nucleo di tutti
gli atomi. La massa del protone è circa 1860 volte quella dell’elettrone
e la sua carica è positiva e di valore uguale a quella dell’elettrone.
L’atomo dell’elemento più leggero, l’idrogeno, ha il nucleo formato
da un singolo protone, l’elio ne ha due, e così via. La tappa finale si
concluse, però solo 10 anni dopo, quando fu scoperto il neutrone, una
particella neutra avente praticamente la stessa massa del protone. Con
questa scoperta emerse l’immagine del nucleo valida ancora oggi: il
nucleo di un atomo con numero di massa A e Z elettroni ha Z protoni e
A-Z neutroni. Le masse di queste ultime particelle sono oggi note con
grande precisione e risultano, rispettivamente:
• mp = 1.67262171(29) 10-27 kg
• mn = 1.67492728(29) 10-27 kg
L’elettrone, il protone e il neutrone sono i cosiddetti costituenti stabili
della materia.
2.2
Quanti di luce: il fotone
L’esperimento di Young (Milverton 1773–Londra 1829)
sull’interferenza della luce (v. A.5), dimostra incontestabilmente che
la luce e, più in generale, la radiazione elettromagnetica hanno natura
ondulatoria. Un’onda si propaga trasportando energia, la quale si distribuisce entro l’intera regione occupata via via dall’onda. La fisica
classica dimostra che l’energia contenuta in un dato volume di questa
regione è proporzionale al quadrato dell’ampiezza dell’onda. Pertanto,
pur di ridurre opportunamente l’ampiezza, possiamo avere onde la cui
energia per unità di volume è piccola quanto si vuole. In altre parole,
l’energia di un’onda è una grandezza continua, ossia che può variare
di quantità infinitesimali.
Personaggi del mondo atomico
11
Alla fine del XIX secolo, durante lo studio della radiazione termica, la concezione che l’energia elettromagnetica potesse variare con
continuità entrò in crisi.
Ma che cos’è la radiazione termica? Prendiamo un ferro da stiro
ben caldo e avviciniamo una mano, ad una certa distanza. Il calore
proveniente dal ferro è chiaramente percepito dalla mano. In effetti, il
ferro — come tutti i corpi caldi e tanto più quanto più sono caldi —
irraggia energia elettromagnetica a scapito della propria energia interna e perciò si raffredda, mentre la mano assorbe la radiazione e si
riscalda.
L’energia della radiazione è distribuita in un certo modo caratteristico tra tutte le onde che la costituiscono, secondo una legge espressa
da una funzione della temperatura e della frequenza e che dipende dalla natura del corpo e dal suo intorno.
Nel caso di un recipiente chiuso, mantenuto ad una certa temperatura, si dimostra che la distribuzione dell’energia raggiante è indipendente dal materiale, dalle dimensioni e dalla forma della cavità ed è
descritta da una funzione della temperatura e della frequenza. Sperimentalmente tale legge può essere determinata praticando un forellino
nel recipiente e analizzando con metodi spettroscopici la poca radiazione che ne esce (v. Fig. 2.2). La legge di distribuzione che si ottiene
è nota come legge del corpo nero, perché il forellino, a temperature
non troppo alte, appare come una macchia nera sul corpo del recipiente.
Risultò (siamo alla fine del XIX secolo) che i dati sperimentali contrastavano senza rimedio con l’affermazione classica per cui si possono assorbire o emettere quantità arbitrariamente piccole di radiazione
di bassa come di elevata frequenza. Se ciò fosse vero, si dimostrerebbe infatti che entro il recipiente dovrebbero esserci soltanto radiazioni
di frequenza elevatissima (catastrofe ultravioletta), il che è manifestamente assurdo: nessuno ha mai visto un corpo nero emettere fiotti
di raggi X.
Per interpretare i dati sperimentali sulla composizione della radiazione del corpo nero, il fisico tedesco Max Planck (Kiel 1858–
Gottinga 1947) introdusse (1901) un’ipotesi radicalmente nuova, la
quale, in contrasto con la fisica classica, asseriva che c’è un limite mi-
12
Capitolo II
nimo per l’energia emessa o assorbita dalla materia e che tale limite è
proporzionale alla frequenza della radiazione. Se è la frequenza ed la minima quantità di energia che la materia può scambiare con la radiazione di tale frequenza, si ha: = h , dove h è la cosiddetta costante di Planck, il cui valore è 6.6210-34 J·s. In breve, Planck, assumendo che gli scambi di energia radiante potessero avvenire solo per
quanti finiti h, riuscì ad ottenere una formula che riproduceva perfettamente la composizione della radiazione termica.
Successivamente (1905), Einstein (Ulma 1879–Princeton New
Jersey 1955) ampliò l’ipotesi di Planck, giungendo a postulare che la
radiazione di frequenza è costituita da quanti ovvero pacchetti di energia, quasi fossero corpuscoli, che si propagano con velocità c e ciascuno dei quali ha energia h. Questi quanti di energia radiante furono
detti più tardi (1922) fotoni.
Figura 2.2: a) La radiazione uscente dal forellino del recipiente mantenuto a temperatura T viene scomposta dal reticolo nelle sue componenti in modo che si possa misurare l’intensità di ciascuna. b) Andamento dell’intensità in funzione della frequenza per tre diverse temperature. La frequenza del massimo cresce linearmente con T e
l’area sottesa da ciascuna curva (che dà l’energia per unità di volume del recipiente)
è proporzionale a T 4.
Personaggi del mondo atomico
13
Einstein chiamò la propria assunzione principio euristico (principio
non rigoroso con cui si consegue un risultato plausibile, ma che necessita successivamente di essere verificato usando un metodo rigoroso).
Infatti, egli lo utilizzò per fornire una semplicissima spiegazione di un
altro fenomeno — sempre relativo agli scambi di energia tra radiazione e materia — che appariva in conflitto con la fisica classica: l’effetto
fotoelettrico. L’effetto fotoelettrico è il fenomeno per cui, quando un
fascio di luce incide sulla superficie di certi metalli, si liberano degli
elettroni che sfuggono dal metallo. Sperimentalmente, si trovano le
seguenti due leggi:
1. Per ogni metallo esiste una soglia fotoelettrica, ossia una
frequenza 0 tale che, per frequenze minori non si ha
l’effetto, qualunque sia l’intensità del fascio di radiazione.
2. Il numero di elettroni emessi in un dato tempo da una radiazione di frequenza >0 è proporzionale all’intensità della
radiazione, ma gli elettroni sono emessi tutti con la stessa
energia cinetica che dipende dalla frequenza, ma non
dall’intensità.
Figura 2.3: Dispositivo per la misura dell’energia cinetica dei fotoelettroni. La differenza di potenziale tra fotocatodo e placca viene regolata tramite il potenziometro
fino ad annullare la corrente. Se V denota questa differenza di potenziale, sia ha: Ec
= e V. L’energia cinetica in funzione della frequenza ha un andamento rettilineo la
cui pendenza dà il valore di h.
14
Capitolo II
In base alla fisica classica, l’esistenza di una soglia fotoelettrica è
del tutto incomprensibile. Infatti, gli elettroni stanno normalmente
all’interno del metallo e per estrarne uno occorre fornirgli una certa
energia W (lavoro di estrazione) caratteristica di quel metallo. Secondo la fisica classica, la forza esercitata su un elettrone dal campo elettrico della radiazione incidente accelera l’elettrone conferendogli energia e si dimostra che questa è proporzionale all’intensità della radiazione. Pertanto, pur di usare radiazione di intensità sufficiente, secondo la fisica classica l’emissione dovrebbe avvenire qualunque sia
la frequenza, in contrasto con l’esistenza di una soglia fotoelettrica.
Sulla base del suo principio euristico, Einstein poté spiegare con
grande semplicità le leggi dell’effetto fotoelettrico nel modo seguente.
Un fotone di energia h, che incide su un metallo, può essere “assorbito” da un elettrone; se ciò accade il fotone scompare e l’energia
dell’elettrone aumenta di h. Il fotone potrà, dunque, “liberare” un elettrone solo se h > W, se invece la frequenza è minore di 0 = W/h
(frequenza di soglia), l’effetto non si produce. Se h > W l’elettrone
viene liberato con l’eccesso di energia h – W sotto forma di energia
cinetica Ec:
Ec = h W
2-1
Einstein fece notare che, aumentando l’intensità della radiazione,
aumenta il numero di fotoni che incidono sul metallo, perciò aumenterà in proporzione il numero di elettroni liberati, ma non la loro energia
cinetica, in accordo con l’esperienza (punto 2).
La verifica sperimentale della precedente equazione fu effettuata da
Millikan all’Università di Chicago nel 1915. Il dispositivo usato è illustrato in Figura 2.3.
Un’ampolla di vetro, vuotata dell’aria, contiene due elettrodi, uno
di questi, il fotocatodo, illuminato con luce di frequenza nota, emette
gli elettroni, l’altro, la placca, li raccoglie. La corrente è segnalata da
un galvanometro in serie al circuito. Portando la placca ad un potenziale negativo V tale che eV > Ec la corrente si annulla. Ec si determina, dunque, misurando il potenziale minimo che annulla la corrente.
Personaggi del mondo atomico
15
Millikan illuminò fotocatodi ricoperti da metalli alcalini utilizzando
luce visibile, e precisamente alcune radiazioni emesse da una lampada
a mercurio gassoso. Riportando in grafico Ec in funzione di , egli ottenne un andamento rettilineo in accordo con la (2-1).
Il valore di h fu, inoltre, ottenuto dalla pendenza della retta e
nell’articolo di Millikan pubblicato nel 1915 si legge in proposito:
«la costante h di Planck è stata determinata per via fotoelettrica con
una precisione dello 0,5% circa, ottenendo il valore 6,5710-27erg·s».
Il principio euristico di Einstein e la conseguente teoria dell’effetto
fotoelettrico furono accolti con scetticismo dal mondo scientifico. In
sostanza, si accettava l’idea che gli scambi di energia tra materia e radiazione elettromagnetica potessero avvenire per quanti di energia,
come aveva proposto Planck, mentre non si riusciva ad ammettere che
la luce e, più in generale, le onde elettromagnetiche – le quali soddisfacevano alle ben consolidate leggi dell’elettromagnetismo per cui la
radiazione è un fenomeno ondulatorio continuo – potessero consistere
di quantità discrete: i fotoni, appunto.
Indicativa di questo clima è la raccomandazione, del 1913, per la
nomina di Einstein a membro dell’Accademia prussiana, da parte di
alcuni eminenti membri della stessa, tra cui Planck: «... si può dire che
non c’è quasi nessuno dei grandi problemi di cui la fisica moderna è
così ricca al quale Einstein non abbia dato un contributo rilevante. Che
possa a volte aver mancato il bersaglio, come per esempio, nel caso
dell’ipotesi dei quanti di luce, non può essere considerato troppo grave: è impossibile infatti introdurre idee veramente nuove nelle più esatte delle scienze, senza correre a volte qualche rischio».
Qui il rifiuto dei quanti di luce da parte delle autorità accademiche
prussiane è espresso in modo categorico. Dovettero passare una ventina d’anni da questa dichiarazione prima che la teoria atomica conferisse al fotone la dignità di ente reale. Ironia della sorte: Einstein
mantenne sempre dubbi su questa teoria.
3 Onde o particelle?
3.1
Onde di De Broglie
Una conseguenza della teoria della relatività1 è che i fotoni, propagandosi con la velocità c della luce, devono avere massa nulla ed impulso p = E/c, dove E=h è l’energia, per cui:
p=
h
c
3-1
Introducendo la lunghezza d’onda =c/, si ha anche:
p=
h
3-2
Queste equazioni sono interessanti poiché mettono in relazione una
quantità caratteristica delle particelle, l’impulso, con una tipicamente
ondulatoria, la frequenza o la lunghezza d’onda.
Ispirandosi a questa relazione, De Broglie (Dieppe 1892–Parigi
1987) giunse a postulare che, come le onde elettromagnetiche possono
manifestarsi come particelle, i fotoni, che trasportano l’impulso p=h/,
così una particella massiva avente impulso p, può manifestarsi come
un’onda avente lunghezza d’onda =h/p. Come abbiamo discusso, gli
aspetti ondulatori si manifestano in modo tanto più evidente quanto
più grande è la lunghezza d’onda. Nella tabella sotto sono riportate, a
titolo comparativo, le lunghezze d’onda di De Broglie (espresse in nano-metri=10-9 m) di tre particelle del mondo atomico e di una partcella
classica (pallino da caccia) in condizioni standard di moto.
1
v. MAX BORN, La sintesi einsteiniana, Boringhieri, Torino 1969, p. 343.
17
18
Capitolo III
Si noti che a parità di energia un fotone ha una lunghezza d’onda circa
mille volte più grande che l’elettrone. Inoltre, il pallino di piombo ha
una lunghezza d’onda così piccola da rendere del tutto irrilevanti (e
irrilevabili) gli aspetti ondulatori.
Particella
Massa (kg)
Velocità (m/s)
p (kg m/s)
(nm)
elettrone di energia
1 eV
9.1 10 -31
6.0 10 5
5.5 10 -25
1.0
fotone di energia 1 eV
0
3 1010
5.3 10 -28
1.2 10 3
O2 dell’aria
5.3 10 -26
500
2.6 10 -23
0.1
pallino di piombo sparato da un fucile da
caccia.
10 -5
100
10 -3
6.6 10 -22
3.2
Gli esperimenti ideali di Feynman
La differenza tra il comportamento delle particelle atomiche e quello delle particelle della fisica classica, può essere illustrata mediante
una serie di semplici esperimenti ideali descritti da Feynman nel suo
famoso libro Lectures on Physics2.
Consideriamo il dispositivo illustrato nella Figura 3.1a. Un cannoncino spara entro un certo angolo minuscole sferette, parte delle
quali attraversa i forellini del diaframma e va a conficcarsi nello
schermo. Nell’attraversare il foro una sferetta può interagire col bordo
ed essere deviata. La perturbazione che subisce dipende dalla traiettoria di entrata in modo critico: una piccola differenza nella traiettoria
può determinare grosse differenze nella deviazione che subisce la sferetta. Siamo quindi nell’ambito dei moti caotici, cosicché non è possibile determinare il punto dello schermo dove la sferetta andrà a con2
R. FEYNMAN, La Fisica di Feynman, Zanichelli, Bologna 2001, vol. III.
Onde o particelle?
19
ficcarsi. La distribuzione sullo schermo diviene regolare solo dopo che
un gran numero di sferette vi si sono conficcate. L’andamento che si
ottiene è illustrato in Figura 3.1a, dove l’ordinata P12 in un punto è
proporzionale al numero di sferette che cadono in un piccolo intorno
di quel punto. Analogamente P1 (P2) è la distribuzione che si ottiene
quando il solo foro 1 (2) è aperto.
Figura 3.1: Confronto tra i comportamenti classico e quantistico. a) Un cannoncino
spara una rosa di minuscole sferette metalliche contro un diaframma con due fori.
Parte delle sferette attraversano i due fori e vanno a conficcarsi nello schermo. P1 e
P2 sono le distribuzioni delle sferette che sono passate dal foro 1 e dal foro 2 rispettivamente. P12 è la distribuzione complessiva. b) Analogo esperimento effettuato
con elettroni. Il cannoncino è sostituito da un cannone elettronico che emette un fascio divergente di elettroni, tutti con la stessa velocità. Lo schermo è sostituito da
una matrice di rivelatori ciascuno dei quali registra il numero di elettroni incidenti su
esso.
20
Capitolo III
Poiché i vari punti dello schermo sono colpiti dalle sferette in modo
del tutto casuale, la distribuzione finale si può interpretare solo in termini di probabilità. La probabilità di un evento è definita come il rapporto tra il numero di casi favorevoli all’evento e il numero di casi
possibili. Classico esempio: nel lancio di un dado, l’uscita di un numero prescelto, compreso tra 1 a 6, è il caso favorevole su 6 possibili;
quindi la probabilità è 1:6 = 0,1666... ~ 0,17, ossia del 17%. Se si effettuano N lanci e un numero prescelto esce n volte, il rapporto n/N si
chiama frequenza. Ebbene, si verifica sperimentalmente che al crescere del numero N di prove, la frequenza si avvicina al valore della probabilità.
Nell’esperimento con le sferette, si divida la superficie dello
schermo con una rete di piccoli quadratini. La probabilità che una sferetta si conficchi in un dato quadratino si ottiene approssimativamente
dalla relativa frequenza, ossia dividendo il numero n di sferette che si
sono conficcate all’interno del quadratino (eventi favorevoli) per il
numero N totale di sferette conficcate nello schermo (eventi totali),
con N grande abbastanza, ossia tale che la frequenza non cambi sensibilmente aumentandolo ulteriormente. In tal modo otteniamo la probabilità relativa ai punti di ciascun quadratino. La curva P12 ci dà
l’andamento della probabilità in funzione del punto dello schermo nel
caso che siano aperti entrambi i forellini, mentre le curve P1 e P2
danno le probabilità nel caso che sia aperto solo il foro 1 o il foro 2,
rispettivamente. L’esperimento mostra che la curva P12 ottenuta con
entrambi i fori aperti é semplicemente la somma di P1 e P2:
P12=P1+P2. Ciò è del tutto ovvio, basta pensare che, con entrambi i fori aperti, il numero di sferette che giungono in un punto è la somma di
quelle che provengono dal foro 1 più quelle che provengono dal foro
2.
Consideriamo ora un secondo esperimento, simile al primo, in cui
al posto delle sferette si usano particelle subatomiche, diciamo elettroni. La sorgente di elettroni è costituita da un filamento reso incandescente da una corrente elettrica, Figura 3.1b. Il filamento incandescente emette elettroni i quali, accelerati dalla tensione applicata alla canna, escono dal foro tutti con la stessa velocità. Lo schermo è costituito
da una rete di rivelatori di elettroni. Quando un elettrone colpisce un
rivelatore, l’evento è registrato in una memoria connessa al rivelatore
Onde o particelle?
21
colpito ed eventualmente si può far sì che un altoparlante emetta un
“tic”. Alla fine, analizzando le memorie di tutti i rivelatori, si può ricostruire la distribuzione di elettroni sullo schermo. Mantenendo la
sorgente opportunamente distante dal diaframma, si può indebolire a
piacere il fascio incidente e far sì che tra diaframma e schermo venga
a trovarsi un elettrone per volta. L’arrivo di ciascun elettrone sullo
schermo mostra un comportamento del tutto casuale, nel senso che il
“tic” viene sempre emesso da un singolo rivelatore, ma non si può
prevedere da quale, né quale rivelatore emetterà il successivo. Inoltre,
i “tic” si susseguono ad intervalli irregolari. Se pensiamo agli elettroni
come a microscopiche particelle, un tale comportamento è del tutto
comprensibile. Infatti, un elettrone, nell’attraversare l’uno o l’altro dei
due fori del diaframma, subirà una perturbazione che lo devia più o
meno e in modo casuale dalla direzione originaria, per cui non si può
dire in quale punto dello schermo andrà a finire. In sostanza, il risultato dovrebbe essere simile a quello dell’esperimento con le sferette sparate col cannoncino. Con uno solo dei due fori aperto, dopo che un
gran numero di elettroni è giunto sullo schermo, si ottengono le distribuzioni di elettroni P1 e P2, che sono simili a quelle delle sferette descritte prima. Tuttavia, sorprendentemente, se entrambi i fori sono lasciati aperti, la distribuzione finale P12 degli elettroni non è la somma
di P1 e P2, ma appare una figura di interferenza, proprio come se dai
forellini uscissero non particelle, ma due onde coerenti, come
nell’esperimento di Young (v. A.5). Calcolando la lunghezza d’onda
dalla distanza tra due massimi troveremmo proprio il valore dato dalla
relazione di De Broglie: =h/mv (m è la massa e v la velocità degli
elettroni).
Dal momento che l’esperimento è condotto in modo che lo schermo sia raggiunto da un solo elettrone alla volta, il quale, al pari di una
particella, colpisce un singolo rivelatore, in modo del tutto casuale, la
distribuzione finale P12, come nel caso delle sferette discusso prima, ci
dà la probabilità che un elettrone finisca nei diversi punti dello schermo. Ma l’andamento di tale probabilità differisce in modo sostanziale
da quella delle sferette “classiche”. Tale andamento è, infatti, quello
della figura di interferenza di due onde coerenti che emergono dai fori
e che possiamo chiamare onde di probabilità, poiché determinano le
22
Capitolo III
probabilità delle possibili traiettorie degli elettroni. In sostanza,
l’elettrone — ma le cose vanno allo stesso modo con tutte le particelle
elementari — quando viene intercettato sullo schermo presenta un carattere corpuscolare, come attesta il fatto che finisce su un singolo rivelatore, mentre dovrebbe interessarne molti se avesse una distribuzione spaziale come le onde. Ma il suo comportamento è descritto da
onde che hanno la configurazione delle onde classiche, ma non sono
onde materiali, bensì onde di probabilità, in quanto forniscono le probabilità che gli elettroni colpiscano i vari punti dello schermo. Si tratta, quindi, di entità puramente matematiche. Le caratteristiche di tali
onde dipendono dalle condizioni fisiche degli elettroni. Per esempio,
dopo l’uscita dal cannone elettronico, l’onda di probabilità consiste di
un’onda divergente, che all’uscita dai fori nel diaframma dà luogo a
due onde diffratte coerenti, le quali, sovrapponendosi, producono la
figura di interferenza sullo schermo. Notiamo che, secondo l’idea
classica di particella, questa spiegazione è del tutto incomprensibile;
infatti, come si è detto discutendo l’esperimento con le sferette, la
probabilità con entrambi i fori aperti dovrebbe essere la somma delle
probabilità relative ad un solo foro aperto, invece P12 P1+P2.
3.3
Esperimenti reali
Non sarebbe semplice eseguire gli esperimenti descritti prima, così
come sono stati descritti; essi vanno considerati piuttosto esperimenti
ideali, ossia esperimenti che servono ad illustrare il comportamento
del sistema — nella fattispecie le sferette e gli elettroni — . Tuttavia,
esperimenti reali, cosiddetti delle due fenditure (two slits experiments), sono stati effettuati usando elettroni, neutroni, atomi e perfino
grosse molecole.
Verso la metà degli anni cinquanta G. Möllenstedt e H. Güker
dell’Università di Tubinga costruirono un dispositivo (v. Fig. 3.2), che
può essere considerato l’equivalente del biprisma di Fresnel in ottica,
in grado di generare due onde elettroniche coerenti. Esso consiste di
un sottilissimo filo di quarzo ricoperto da una pellicola d’oro che lo
rende conduttore. Due placche metalliche, poste simmetricamente rispetto all’asse del filo e alla sorgente di elettroni S, sono collegate a
Onde o particelle?
23
terra, mentre il filo è connesso ad un potenziale positivo. Gli elettroni,
passando vicini al filo, sono attratti da questo e le loro traiettorie vengono deviate di un certo angolo che, come può essere dimostrato, è
proporzionale al potenziale del filo e, in prima approssimazione, indipendente dalla distanza delle traiettorie dal filo stesso. A valle del filo,
le traiettorie hanno perciò direzioni che convergono nei punti S1 e S2,
che sono le immagini virtuali di S. Ora, S1 e S2 , essendo immagini della stessa sorgente di elettroni, sono coerenti, pertanto le onde elettroniche uscenti da esse formano oltre il filo una figura d’interferenza.
Esperimenti di questo tipo confermarono i valori della lunghezza
d’onda degli elettroni prescritta dalla relazione di De Broglie, e, trattandosi di lunghezze d’onda molto più piccole di quelle dei fotoni di
pari energia, avviarono gli studi sulla microscopia elettronica per
l’osservazione di oggetti troppo piccoli anche per i più potenti microscopi ottici. Il primo esperimento che mostrava le tipiche figure di interferenza formate dalla distribuzione dei singoli elettroni fu effettuato
Figura 3.2: Apparato di Möllenstedt e Günker.
24
Capitolo III
nel 1976 da tre scienziati italiani, G. F. Missiroli e G. Pozzi,
dell’Università di Bologna, e P. G. Merli del CNR-LAMEL di Bologna. La risoluzione di immagine sufficiente a rivelare i punti di impatto dei singoli elettroni fu ottenuta osservando la figura d’interferenza
prodotta dal dispositivo di Möllenstedt e Güker attraverso un microscopio elettronico e un intensificatore d’immagine. Le figure di interferenza corrispondenti a flussi elettronici crescenti erano osservate su
un monitor TV e mostravano che, per bassi flussi, la distribuzione elettronica appariva casuale, mentre per flussi sufficientemente alti apparivano le frange caratteristiche dell’interferenza.
Tredici anni più tardi, A. Tonomura e collaboratori effettuarono un
esperimento simile, ma con un’apparecchiatura più raffinata che consentì di utilizzare un basso flusso di elettroni (un migliaio al secondo),
per cui era molto improbabile che nell’apparato vi fosse più di un elettrone per volta. Ciò escludeva l’eventualità che le frange osservate
fossero dovute a interazioni tra elettroni. Dunque gli elettroni arrivavano sullo schermo uno per volta lasciando tracce pressoché puntiformi le quali, finché erano poco numerose, apparivano distribuite a
Figura 3.3: Immagini di singoli elettroni ottenute con un’esposizione complessiva di
20 per formare la figura d’interferenza nell’esperimento di Tonomura et al.: (a) 8
elettroni, (b) 270, (c) 2000, (d) 60000. 3
3
La figura è tratta da: A. Tonomura et al., Am. J. Phys., 57, 117 (1989).
Onde o particelle?
25
caso, ma, via via che il loro numero cresceva,si delineava una figura
d’interferenza sempre più netta (v. Fig. 3.3).
Un altro interessante esperimento fu effettuato nel 1988 da A. Zeilinger et al. presso l’Istituto Laue-Langevin di Grenoble, usando neutroni. Con riferimento alla Figura 3.4, i neutroni del fascetto proveniente dal reattore hanno velocità diverse e quindi diverse lunghezze
d’onda. Il monocromatore seleziona neutroni che hanno una prestabilita lunghezza d’onda, che può essere variata tra 1,5 e 3 nm. Il fascetto
di neutroni monocromatici uscenti dal monocromatore entra in un tubo evacuato e incide sul diaframma con le due fenditure, da dove escono due fascetti divergenti che, sovrapponendosi, interferiscono tra
loro. La doppia fenditura è costituita da due tronchi di cono di vetro al
boro con le basi minori affacciate ad una certa distanza e da un filo di
boro che lascia due aperture alle sue estremità. Il boro assorbe i neutroni, per cui questi passano solo dalle due aperture.
Figura 3.4: Schema dell’apparato usato nell’esperimento di Grenoble, la figura
d’intereferenza è ripresa dall’articolo di Zeilinger et al.
26
Capitolo III
La figura di interferenza si ottiene spostando trasversalmente lo
schermo mobile con un foro, dietro il quale si trova il contatore di
neutroni. Quando uno di questi neutroni, attraversando il gas di fluoruro di boro (BF3) contenuto nel contatore, urta un nucleo di boro,
quest’ultimo si spezza in due parti cariche che si allontanano velocemente tra loro. Queste, ionizzando il gas, producono una scarica elettrica che viene registrata. Per ogni posizione del foro dello schermo
mobile fu registrato il conteggio ottenuto in un tempo prestabilito (125
minuti). In basso è riportato il grafico corrispondente (ossia i conteggi
in funzione della posizione del foro). L’alternarsi dei massimi e dei
minimi è caratteristico dell’interferenza di onde; al contrario, le scariche che registrano i singoli neutroni hanno breve durata e avvengono a
caso; questi sono appunto caratteri distintivi delle particelle.
Come si verifica facilmente, il tempo medio tra l’arrivo di un neutrone e l’arrivo del successivo è molto maggiore del tempo di volo, per
cui è molto improbabile che nell’apparato interferenziale vi sia più di
un neutrone per volta. Si può quindi dire paradossalmente che ogni
neutrone “interferisce con se stesso”, così come facevano gli elettroni
nell’esperimento di Tonomura.
4 Principio d’indeterminazione
4.1
Il microscopio di Heisenberg
Secondo la meccanica classica, il moto di una particella è perfettamente definito quando siano noti, oltre alle forze agenti sulla particella, la posizione e la velocità (o l’impulso) all’istante iniziale. Infatti,
dalle forze si ricava l’accelerazione e da questa l’incremento di velocità in un dato tempo t. Sommando tale incremento alla velocità iniziale
si ottiene la velocità al tempo t; da questa si ottiene poi lo spostamento
della particella e, nota la posizione iniziale, la posizione della particella al tempo t. Tutto ciò potrebbe valere anche per le particelle atomiche; sennonché, mentre la posizione e l’impulso di una particella
classica possono essere determinati con precisione arbitraria, per le
particelle atomiche c’è un limite alla precisione con cui si possono conoscere simultaneamente queste due grandezze. Precisamente,
se x e px sono le indeterminazioni nelle misure della posizione e
dell’impulso nella direzione x, il loro prodotto non può essere inferiore alla costante di Planck:
x px h
Figura 4.1: Microscopio di Heisenberg per la misura di posizione.
27
4-1
28
Capitolo IV
È questo l’enunciato del famoso principio di indeterminazione di
Heisenberg (Würzburg 1901–Monaco di Baviera 1976), formulato nel
1925, e illustrato dallo stesso fisico tedesco col seguente esempio.
Si debba misurare la posizione di una particella che si muove in
una direzione x con impulso p0 (v. Fig. 4.1). Per questo si utilizza un
microscopio che, raccogliendo la luce diffusa dalla particella, ne forma l’immagine su quella di un righello graduato. In altri termini, perché la misura di posizione si realizzi occorre che almeno un fotone del
fascetto luminoso sia diffuso dalla particella entro il microscopio per
finire nel punto immagine, che, però, non è esattamente definito. Infatti a causa della diffrazione (v. A.4) l’immagine di un punto non è un
punto, ma un dischetto di diametro d / sin 2 , dove è la metà
dell’angolo di apertura del microscopio. La posizione della particella
nella direzione x è, quindi, indeterminata della quantità
x = d / sin 2 , da cui segue che la precisione della misura di posizione è tanto maggiore quanto più piccola è la lunghezza d’onda.
D’altra parte, la deviazione di un fotone da parte della particella,
può essere immaginata come effetto di un urto elastico tra la particella
luminosa — il fotone, appunto — e la particella materiale, in cui la
prima ha di solito una lunghezza d’onda molto maggiore della seconda
(v. Par. 3.1) e quindi, in base alla relazione di De Broglie, un impulso
molto minore. In queste condizioni, le leggi dell'urto elastico mostrano
Figura 4.2: La variazione dell’impulso p è rappresentata dal vettore base del triangolo isoscele i cui lati sono gli impulsi del fotone prima e dopo la diffusione.
L’angolo massimo di deviazione perché il fotone entri nel microscopio è pari a (v.
Fig. 4.1).
Principio d’indeterminazione
29
che l'energia e quindi la frequenza del fotone non cambiano sensibilmente. Ossia, il fotone deviato ha pressoché la stessa frequenza del fotone incidente, ma il cambiamento di direzione comporta un cambiamento dell'impulso p, come illustrato in Figura 4.2. Per il principio
di conservazione dell’impulso, la particella subisce una variazione
d’impulso uguale e contraria a p. Il valore di p cresce al crescere
dell’angolo di deviazione che non è conosciuto: sappiamo solo che la
direzione di diffusione è compresa nel cono di apertura 2. Per
l’indeterminazione px della componente dell’impulso secondo x si ha
quindi:
px =
h
h
sin 2 = sin 2
c
4-2
Segue che, al contrario della misura di posizione che diviene più
precisa diminuendo la lunghezza d’onda, la misura dell’impulso ha
un’indeterminazione px che cresce al diminuire di . Più precisamente, il prodotto delle indeterminazioni vale x px h, in accordo col
principio di Heisenberg.
Una cosa importante deve essere notata: il principio di Heisemberg
riguarda il futuro, non il passato. Infatti, un elettrone di velocità nota
passi attraverso un piccolo foro e poi da un secondo piccolo foro posto
sul suo cammino. Dal momento che è passato dal secondo foro, noi
possiamo dedurre con grande precisione quali erano la posizione e la
velocità all’uscita del primo foro. Infatti, la posizione è quella del
primo foro, la quale, essendo quest’ultimo molto piccolo, è ben definita. Riguardo alla velocità, il suo valore è quello che aveva all’origine e
la direzione è quella definita dalla congiungente i due fori. Questi dati,
però, riguardano il passato e non servono a predire il moto
dell’elettrone all’uscita dal secondo foro, poiché, a causa della diffrazione, la direzione di moto sarà indeterminata nella misura dettata dal
principio di Heisenberg.
30
Capitolo IV
In sostanza, il principio di indeterminazione si riferisce ai valori
della posizione e dell’impulso che sono assunti come condizioni iniziali per determinare il moto successivo.
4.2
Dal microscopico al macroscopico
In molti esperimenti le particelle subatomiche e le stesse molecole si
comportano come corpuscoli macroscopici. Per esempio, le traiettorie
degli elettroni nei tubi catodici sono deviate da campi elettrici o magnetici secondo le leggi classiche del moto, mentre il moto degli elettroni in un atomo segue leggi quantistiche. Altro esempio: per rivelare
le traiettorie delle particelle subatomiche si usano le camere a bolle, le
quali consistono in un recipiente contenente un liquido (elio o idrogeno) che viene portato, con un brusco abbassamento della pressione, in
una stato instabile appena sopra il punto di ebollizione. In queste condizioni, una particella carica che penetra nella camera lascia una
traccia formata da minuscole bollicine di vapore distribuite lungo la
traiettoria (v. Fig. 4.3). Dalla curvatura che subisce la traiettoria per
effetto di un campo magnetico si possono ottenere informazioni sulla
massa e sulla velocità della particella, in accordo con le leggi classiche.
Figura 4.3: Traiettorie di particelle subatomiche in una camera a bolle d’elio
(dall’archivio del CERN: http://www.bo.infn.it/antares/bolle_proc/foto.html)
Principio d’indeterminazione
31
Infine, anche le molecole possono manifestare una natura ondulatoria, dando luogo a fenomeni d’interferenza, ma sappiamo anche che,
applicando le leggi della meccanica classica alle molecole di un gas abbastanza rarefatto, si può ricavare l’equazione di stato dei gas perfetti,
dalla cui deduzione emerge l’equivalenza tra temperatura ed energia cinetica media delle molecole.
Chiediamoci allora: quali circostanze occorrono affinché una particella atomica o subatomica si comporti come un corpucolo classico? In
altre parole, in quali contesti l’aspetto ondulatorio risulta inessenziale,
tanto da lasciar emergere il solo aspetto corpuscolare?
La risposta a queste domande ci viene fornita dal principio
d’indeterminazione. Consideriamo, ad esempio, una particella che si
muove lungo una traiettoria circolare di raggio R con impulso p (v. Fig.
4.4a). Affinché la traiettoria risulti definita con buona approssimazione, occorre che per ogni punto siano soddisfatte due condizioni: la
prima concerne la posizione della particella, le cui indeterminazioni x,
y e z devono essere molto minori di R; la seconda condizione riguarda la tangente alla traiettoria. Poiché nell’intorno del punto di tangenza
la curva si confonde con la tangente, che coincide con la direzione
dell’impulso, le indeterminazioni px, py e pz devono essere molto
minori di p. Riassumendo deve essere:
x R, y R, z R
px p, py p, pz p
4-3
Moltiplicando ciascuna indeterminazione della posizione per la
corrispondente dell’impulso, per il principio di indeterminazione, abbiamo:
h xpx pR, ecc.
4-4
32
Capitolo IV
Come applicazione della precedente relazione, consideriamo
l’atomo d’idrogeno, costituito (v. Par. 2.1) da un nucleo pesante intorno al quale orbita un elettrone, e vediamo in quali condizioni
l’elettrone si comporta come una particella classica che descrive una
traiettoria definita di raggio r.
Il prodotto pr (v. App. B) è il modulo del momento angolare orbitale, il quale è quantizzato, nel senso che può assumere solo valori che
sono multipli interi di ( h 2 ):
pr = l
4-5
dove l è un numero intero.
Figura 4.4: a) Particella su una traiettoria circolare di raggio R. La traiettoria è definita se le indeterminazioni x, y e z sono piccole rispetto a R e, inoltre, le indeterminazioni p x , p y e pz sono piccole rispetto a p. b) Molecole di gas rarefatto
entro un recipiente. I cubi di lato d contengono in media una molecola ciascuno ed
hanno quindi il lato pari all’interdistanza media delle molecole. Per quanto concerne le traiettorie delle molecole, esse sono definite se le indeterminazioni x, y e
z sono piccole rispetto a d e le indeterminazioni p x , p y e pz sono piccole rispetto a p.
Principio d’indeterminazione
33
Tenendo conto della (4-4): pr >> h, dalla (4-5) ricaviamo che
l’elettrone ha una traiettoria circolare definita solo se l >> 2. Nel moto su questa traiettoria, la forza centripeta coincide con la forza di attrazione coulombiana tra elettrone e nucleo:
e2
p2
me2
2
=
p =
4 0 r 2 mr
4 0 r
4-6
da cui otteniamo:
pr =
2
me2 r
2 0h
= l r = l
4 0
me2
4-7
La quantità a0 = 0 h2 me2 rappresenta il cosiddetto raggio di
Bohr, che vale circa 0,5·10-10 m e misura il raggio atomico
dell’idrogeno (cfr. (5-1)). In definitiva, la condizione di comportamento classico dà:
r = l 2 a0 r a0
4-8
In conclusione, l’elettrone effettua un moto classico solo se la sua
distanza dal nucleo è molto maggiore del raggio di Bohr.
Come secondo esempio consideriamo un gas rarefatto racchiuso in
un recipiente (v. Fig. 4.4 b). In questo caso perchè valga il modello
corpuscolare, occorre che l’indeterminazione della posizione di una
molecola sia piccola rispetto all’interdistanza d tra le molecole. Per
quanto concerne la direzione della traiettoria, vale la stessa condizione
di prima, ossia che l’indeterminazione sull’impulso deve essere molto
minore del modulo dell’impulso stesso. L’interdistanza media tra le N
molecole si può ottenere nel seguente modo: dividiamo il volume V
34
Capitolo IV
del recipiente (che si può immaginare di forma cubica) in N piccoli
cubi, il volume di ciascuno dei quali sarà V/N e il lato (V/N)1/3.
Facendo un’istantanea del gas, si troverà che i cubicini conterranno
in generale numeri diversi di molecole, ma ripetendo il conteggio su
un gran numero di istantanee troveremo che in media ci sarà
all’incirca una molecola per ognuno. L’interdistanza media tra le molecole sarà, perciò, pari al lato di un cubicino: d = (V/N)1/3.
In definitiva, il modello corpuscolare è applicabile se
pd
1
h
4-9
Per una stima grossolana, possiamo supporre che tutte le molecole
abbiano lo stesso impulso p. D’altra parte, se T è la temperatura del
gas, la teoria cinetica insegna che l’energia cinetica media delle molecole, p2/2m, è proporzionale a T1, più precisamente:
p2 3
= kBT (kB costante di Boltzmann)
2m 2
4-10
da cui ricaviamo:
p = 3mk BT
4-11
Indicando, inoltre, con n il numero di molecole nell’unità di volume: n = N/V , è:
d=
1
3
N
=
V
3
1
n
Vedi p. es. D. HALLIDAY, Fondamenti di Fisica, CEA, Milano 2006.
4-12
Principio d’indeterminazione
35
La condizione di validità del modello corpuscolare si traduce, quindi, nell’espressione:
3mkBT
h3 n
1
4-13
Per l’aria nelle condizioni dell’ambiente terrestre, il primo membro
è dell’ordine di 100, quindi la (4-13) è soddisfatta con ampio margine.
Ciò è vero per tutti i gas in condizioni non troppo diverse da quelle
dell’ambiente, e questo spiega il successo della teoria cinetica nel descrivere le proprietà della materia allo stato gassoso.
Come risulta dalla (4-13), il modello corpuscolare classico cessa di
valere quando si verifica uno, o più, dei seguenti casi:
•
•
•
masse molto piccole (es. elettroni);
elevate densità di particelle;
temperature molto basse.
Nei casi in cui la disuguaglianza (4-13) non sia verificata, il gas è
detto degenere. La teoria statistica dei gas degeneri, che tiene conto
degli effetti quantistici, è stata sviluppata da Fermi (Roma 1901–
Chicago 1954) e Dirac (Bristol 1902–Florida 1984) per i gas di elettroni e da Einstein e Bose (Calcutta 1894–1974) per i gas di fotoni2.
2
E.FERMI, Molecole e cristalli, Zanichelli, Bologna 1982
5 Digressione sulla fisica dell’atomo
5.1
Dimensioni atomiche
Usando il principio d’indeterminazione si possono stimare le dimensioni degli atomi. In particolare, assumendo che gli atomi abbiano
forma sferica, si può determinare l’ordine di grandezza del raggio, vale a dire, non il valore preciso, ma la potenza del 10 che esprime il
suo valore in una qualche unità, per esempio in metri. Consideriamo
l’atomo più semplice, quello dell’idrogeno, costituito dal nucleo fatto
di un solo protone attorno al quale si muove un elettrone. Dire che a è
il raggio atomico (v. Fig. 5.1) significa che la probabilità di trovare
l’elettrone attorno al nucleo sarà grosso modo nulla fuori della superficie sferica con centro nel nucleo e raggio a. Perciò la posizione
dell’elettrone in una direzione qualsiasi, x, è indeterminata di una
quantità x 2a. L’impulso è del tutto indeterminato e quindi una sua
componente è indeterminata di circa il doppio del suo massimo valore, p: p 2p . Per il principio d’indeterminazione si ha quindi:
p
h
4a
5-1
Figura 5.1: La regione sfumata in colore rappresenta lo spazio occupato
dall’elettrone durante il suo moto; p denota l’impulso dell’elettrone.
37
38
Capitolo V
L’energia dell’atomo consiste di due termini: l’energia cinetica
Ecin
p2
h2
=
2m 32ma 2
5-2
e l’energia potenziale di Coulomb, dovuta all’attrazione del nucleo, la
quale è negativa (ricordiamo che l’energia potenziale è negativa se occorre compiere lavoro per allontanare l’oggetto dal punto ove si trova
all’infinito; al contrario, è positiva se il lavoro è fatto dalle forze del
campo):
E pot = e2
e2
4 0 r
4 0 a
5-3
dove r è la distanza dell’elettrone dal nucleo.
L’energia totale in funzione di a si può, quindi, approssimativamente scrivere nella forma
h2
e2
E
32ma 2 4 0 a
5-4
Per determinare a si deve porre una condizione sull’energia
dell’atomo. Per questo, notiamo che ogni sistema fisico, e in particolare il nostro atomo, tende a disporsi nello stato di energia minima e a
rimanerci. Infatti, se la sua energia non è la minima possibile esso tenderà spontaneamente a perdere l’energia in eccesso sotto qualche forma, cedendola all’ambiente circostante. Consideriamo, ad esempio,
una guida a forma di due cunette separate da un dosso con una sferetta
in equilibrio sulla cima del dosso. Una minima perturbazione farà precipitare la sferetta in una delle due cunette dove effettuerà un moto oscillatorio, il quale però si ridurra via via di ampiezza fino alla quiete,
quando tutta l’energia cinetica acquistata nella discesa si sarà trasfor-
Digressione sulla fisica dell’atomo
39
mata per attrito in calore. Alla fine, quindi, la sferetta viene a trovarsi
in quiete al fondo della cunetta e lì rimane, poiché l’energia non può
ridursi ulteriormente. Analogamente, l’elettrone del nostro atomo,
soggetto alla forza attrattiva del nucleo, fa un moto accelerato e quindi, come insegna la teoria di Maxwell, se non si trovasse nello stato di
energia minima, irraggerebbe energia elettromagnetica a scapito della
sua energia meccanica, finché la sferettta raggiunge uno stato la cui
energia non può diminuire ulteriormente.
Secondo la fisica classica, l’energia di un atomo non avrebbe mai
un valore minimo, ma dovrebbe diminuire senza limite. Infatti,
l’energia meccanica dell’atomo è data da
E=
p2
e2
2m 4 0 r
5-5
D’altra parte, assumendo per semplicità che l’elettrone percorra
un’orbita circolare di raggio r intorno al nucleo, la forza attrattiva del
nucleo uguaglia la forza centripeta:
e2
p2
p2
e2
=
=
4 0 r 2 mr
2m 8 0 r
5-6
L’energia meccanica dell’atomo si può, quindi, riscrivere nella forma:
E=
e2
8 0 r
5-7
Pertanto, diminuendo E per via dell’irraggiamento, dovrebbe diminuire anche r (attenzione: il secondo membro è negativo per cui una sua
diminuzione comporta un aumento del suo valore assoluto), finché
l’elettrone non finisce sul nucleo. In sostanza, nessun atomo potrebbe
esistere stabilmente.
40
Capitolo V
Fortunatamente per noi, il ragionamento classico porta ad una conclusione falsa. Infatti, in base al principio d’indeterminazione a non
può diminuire senza che nel contempo cresca p, poiché, come si è visto, p h/4a. Questo ci ha portato a scrivere la (5-4) per l’energia totale dell’atomo, la quale ammette un valore minimo, che si ottiene uguagliandone a zero la derivata rispetto ad a. Abbiamo:
dE
h2
e2
+
da
16ma 3 4 0 a 2
5-8
dE
0 h 2
=0a
da
4me2
5-9
da cui segue:
Sostituendo i valori numerici (0 9 10-12 F/m, h 7 10-34, m 10-30
kg, e 2 10-19 C) otteniamo:
a 10 10 m
mentre il valore esatto, ottenuto risolvendo l’equazione di Schrödinger
è dato da:
0h2
a=
= 0, 528 10 10 m
2
me
detto anche raggio di Bohr.
Vediamo dunque che la nostra precedente stima coglie il giusto ordine di grandezza del raggio atomico: il decimiliardesimo di metro
(10-10 m), detto anche Angstrom (Å).
Digressione sulla fisica dell’atomo
5.2
41
Spettri atomici
La radiazione emessa dagli atomi eccitati consiste di tante onde elettromagnetiche sovrapposte aventi frequenze che dipendono dalla
natura degli atomi, dal loro stato di aggregazione e dalle condizioni
fisiche (temperatura, ecc.). Per analizzare questa radiazione, occore
separare le diverse componenti in frequenza mediante un prisma o un
reticolo di diffrazione, i quali investiti da un fascetto di radiazione deviano in modo diverso le componenti che poi vengono focalizzate in
punti diversi di uno schermo. Si ottiene così lo spettro di emissione
della sostanza.
Gli spettri degli atomi allo stato gassoso consistono di righe, ciascuna corrispondente ad una precisa frequenza (colore). Ogni specie
atomica ha uno spettro caratteristico che la contraddistingue dalle altre
(v. Fig. 5.2). Facendo passare una radiazione continua — per esempio,
emessa da una sostanza solida ad alta temperatura, la quale emette
tutte le frequenze senza soluzione di continuità — attraverso un elemento allo stato gassoso, lo spettro continuo della radiazione all’uscita
presenta delle righe nere in corrispondenza delle righe dello spettro di
emissione: è questo lo spettro di assorbimento dell’elemento.
Poiché la radiazione di frequenza consiste di fotoni di energia h,
segue che h è la minima variazione di energia dell’atomo
nell’emissione o nell’assorbimento di tale radiazione. Dunque
l’energia dell’atomo può variare solo di quantità pari all’energie dei
fotoni che può emettere o assorbire.
Figura 5.2: a) Spettro di emissione del carbonio; b) spettro di assorbimento del carbonio.
42
Capitolo V
In base a ciò, Niels Bohr (Copenhagen 1885–1962) fece l’ipotesi
che anche l’energia degli atomi fosse quantizzata, ossia che ogni atomo non possa avere valori qualsiasi di energia, ma solo serie discrete.
Secondo Bohr, l’emissione o l’assorbimento di radiazione da parte di
un atomo è sempre la conseguenza di una transizione da uno stato di
energia ad un altro. Ad esempio, se l’atomo passa da uno stato con energia E2 ad uno con energia minore E1 , si ha l’emissione di un fotone
di energia h, tale che:
h = E2 E1
5-10
la transizione inversa esige invece l’assorbimento di un fotone della
stessa energia da parte dell’atomo.
Il mondo atomico è dunque caratterizzato da sistemi (radiazione,
atomi) la cui energia può variare per quantità discrete, o come anche si
dice, per quanti. Da ciò il termine fisica quantistica dato alla disciplina che tratta di questo mondo.
5.3
Struttura atomica e spin
Consideriamo l’equazione (5-7) che esprime la relazione tra
l’energia dell’elettrone e la sua distanza dal nucleo nell’atomo
d’idrogeno:
E=
e2
8 0 r
5-11
Essa è stata dedotta per un orbita circolare, ma, intendendo r come
distanza media dell’elettrone dal nucleo, ha validità generale. Nel caso
di un elettrone in moto attorno ad un nucleo con Z protoni, nella (511) occorre sostituire e2 con Ze2.
Si è, inoltre, mostrato (v. Par. 5.2) che gli stati stazionari elettronici
di un atomo hanno energie che costituiscono serie discrete. Se Ei de-
Digressione sulla fisica dell’atomo
43
nota l’energia di uno stato stazionario di un atomo con un elettrone, la
distanza media ri di quest’ultimo dal nucleo è:
ri =
Ze2
8 0 Ei
5-12
Perciò, misurando l’energia di ionizzazione, ossia l’energia necessaria per allontanare l’elettrone dall’atomo (uguale al valore assoluto
dell’energia dello stato) si può calcolare la distanza media
dell’elettrone dal nucleo. Per esempio, l’energia di ionizzazione
dell’atomo di idrogeno nello stato fondamentale (lo stato di più bassa
energia) è 13,6 eV e la corrispondente distanza media risulta dalla (512) a0 = 0,526 Å, ossia proprio il raggio di Bohr.
Mostreremo ora come dalla misura delle energie di ionizzazione di
un atomo, si possono trarre informazioni sulla distribuzione degli elettroni in quell’atomo. Poiché, allontanando elettroni, il resto dell’atomo
diviene via via più positivo, quelli rimanenti sono sempre più legati al
nucleo. In altre parole, l’energia di ionizzazione cresce col grado di
ionizzazione.
Sia r1 la distanza media dal nucleo del primo elettrone che è allontanato, r2 quella del secondo, e così via. Per una stima grossolana
dell’energia di ionizzazione di un elettrone supporremo che gli altri
elettroni stiano nel nucleo. Il primo elettrone che viene allontanato sarà quindi soggetto a una carica nucleare Z e – (Z–1) e = e. L’ energia
di ionizzazione corrispondente è quindi:
E1 =
e2
8 0 r1
5-13
Il secondo elettrone allontanato è soggetto alla carica Z e – (Z–2) e
= 2e e la corrispondente energia di ionizzazione vale:
44
Capitolo V
E2 =
2e2
e2
=
8 0 r2 4 0 r2
5-14
Generalizzando, l’energia di ionizzazione dell’ i-esimo elettrone allontanato è approssimativamente:
ie2
8 0 ri
5-15
ie2
ri =
8 0 Ei
5-16
Ei =
Da cui:
Segue da questa equazione che due elettroni con lo stesso rapporto
i/|Ei| hanno all’incirca la stessa distanza media dal nucleo.
Consideriamo l’atomo di elio, che segue l’idrogeno nella Tavola
Periodica di Mendeleiev. Esso ha due elettroni (Z = 2) e le energie di
prima e seconda ionizzazione sono 24,6 eV e 54,4 eV rispettivamente.
I due elettroni hanno, dunque, all’incirca la stessa distanza dal nucleo,
pari a 0,27 Å. Il litio, con tre elettroni (Z = 3) è l’atomo successivo.
L’energie di ionizzazione e le corrispondenti distanze dal nucleo sono
date da: E1 = 5,40 eV, E2 = 75,6 eV e E3 = 122 eV; r1 = 1,34 Å, r2 =
0,19 Å e r3 = 0,18 Å. L’atomo di litio ha quindi due elettroni formanti
un guscio interno, che hanno pressappoco ugual distanza dal nucleo, e
un elettrone esterno, a una distanza dal nucleo circa sette volte maggiore. Allo stesso modo si trova che gli elementi dal litio al neon (Z =
10) hanno, come il litio, due gusci, uno interno con due elettroni e
l’altro, l’esterno, con tutti gli altri. L’atomo successivo, quello del sodio (Z = 11), ha anch’esso due gusci con 2 e 8 elettroni, rispettivamente, ma il rimanente elettrone è molto più distante dal nucleo.
Digressione sulla fisica dell’atomo
45
Riassumendo, i valori sperimentali delle energie di ionizzazione di
un atomo mostrano che gli elettroni sono distribuiti in gusci, che possono essere immaginati come sfere concentriche attorno al nucleo.
Ognuno di questi gusci può contenere fino a un certo numero di elettroni: il guscio più vicino al nucleo, il cosiddetto guscio K, ne può
contenere fino a 2. Il successivo, guscio L, fino a 8 e così pure il seguente guscio M, mentre il guscio N arriva a contenerne 18. Al crescere del numero di elettroni i gusci divengono sempre più popolati e vicini tra loro.
La Figura 5.3 mostra la distribuzione degli elettroni negli atomi dei
primi tre periodi della Tavola di Mendeleiev. Gli atomi di una colonna
hanno lo stesso numero di elettroni nel guscio esterno, per cui, poiché
essi, nonostante i diversi Z e le differenti masse, hanno proprietà chimiche simili, appare evidente che queste ultime dipendono dal numero
di elettroni esterni.
Per spiegare la struttura a gusci degli atomi, è necessario considerare le caratteristiche delle onde elettroniche corrispondenti agli stati
con energia definita dell’atomo. Tali onde sono usualmente chiamate
orbitali, dal nome delle traiettorie classiche degli elettroni nel modello
planetario di Rutherford e dei pianeti intorno al sole, dette appunto orbite.
Figura 5.3: Configurazione elettronica degli atomi delle prime tre righe del sistema
periodico.
46
Capitolo V
Come risulta dalla teoria quantistica, le caratteristiche geometriche
degli orbitali sono le stesse per tutti gli atomi. Ci limiteremo a darne
solo la descrizione.
L’orbitale di energia più bassa è indicato con 1s, la corrispondente
distribuzione di probabilità ha simmetria sferica e decresce al crescere
della distanza dal nucleo (v. Fig. 5.4). In ordine di energia crescente,
troviamo l’orbitale 2s avente, come l’1s, simmetria sferica, ma col
massimo ad una certa distanza dal nucleo. Seguono tre orbitali, indicati con 2px, 2py e 2pz (v. Fig. 5.5), aventi la stessa energia. L’orbitale
successivo, 3s, ha simmetria sferica e due massimi relativi, seguono
poi gli orbitali 3px, 3py e 3pz. Qui ci limiteremo a considerare questi
primi gruppi di orbitali. Aggiungiamo solo che per energie ancora
maggiori troviamo orbitali sempre di tipo ns e np con n = 4, 5, … ma
anche altri orbitali con simmetrie più complicate; in ogni caso la distanza media dell’elettrone che occupa un dato orbitale dipende soprattutto dal numero n, detto numero quantico principale.
Si ha perciò che il guscio K consiste dell’orbitale 1s, mentre i gusci
L e M consistono ognuno di quattro orbitali, 2s, 2px, 2py, 2pz e 3s, 3px,
3py, 3pz, rispettivamente. Poiché il numero massimo degli elettroni nel
guscio K è 2 e nei gusci L ed M è 8, segue che in ciascun orbitale ci
possono stare al più due elettroni.
Così per ottenere lo stato di più bassa energia (stato fondamentale)
dell’atomo, pensando di aggiungere al nucleo un elettrone alla volta,
il primo elettrone occuperà l’orbitale 1s e lo stesso il secondo.
Figura 5.4: Densità di probabilità relative agli orbitali 1s e 2s, entrambi di simmetria
sferica.
Digressione sulla fisica dell’atomo
47
Così, il guscio K sarà completamente riempito. Il terzo e quarto elettrone occuperanno l’orbitale 2s, che ha un’energia leggermente inferiore dei 2p, il quinto elettrone uno dei 2p e così via, fino a riempire
il guscio L con otto elettroni. Lo stesso dicasi per il guscio M e così
via.
Perché un orbitale può essere occupato con al più due elettroni?
Perché tutti gli elettroni non vanno ad occupare l’orbitale 1s che è
quello di energia più bassa? Queste domande preoccuparono Niels
Bohr per molto tempo. La risposta ad esse fu basata su una ipotesi statistica ad hoc.
Anzitutto, era già noto che gli elettroni non fossero solo semplici
particelle cariche, ma ruotassero come microscopiche trottole, cioè
possedessero uno spin (v. B.2)1. Esperimenti effettuati da Otto Stern e
Walther Gerlach tra il 1921 e il 1924 (v. Par. 5.4) mostrarono che, inaspettatamente, lo spin dell’elettrone può avere solo due componenti
uguali ed opposte lungo una direzione data, come se, fissata una direzione, l’asse della “trottola elettronica” potesse orientarsi solo in un
verso o in quello opposto (v. Fig 5.6). I valori della componente sono
± / 2 . La loro differenza è precisamente , cioè l’unità di momento
angolare.
Figura 5.5: Distribuzione polare degli orbitali px, py, pz: la lunghezza del raggio da
un punto della superficie all’origine è proporzionale alla probabilità di trovare un
elettrone nella direzione del raggio.
1
M. B ORN, Fisica atomica, Boringhieri, Bologna 1968.
48
Capitolo V
L’ipotesi introdotta escludeva che in un atomo potessero esservi
due elettroni con le stesse caratteristiche ed è espressa dal cosiddetto
principio di Pauli (Vienna 1900–Zurigo 1958), o principio di esclusione: non più di due elettroni possono occupare lo stesso orbitale o,
più in generale, avere la stessa funzione d’onda, e qualora due elettroni occupino lo stesso orbitale devono avere componenti dello spin
opposte.
Figura 5.6: Le due possibili orientazioni dello spin elettronico rispetto a una direzione prescelta.
Figura 5.7: Al pari di due signore che, indossando lo stesso cappellino, tendono ad
evitarsi, due elettroni con la stessa componente dello spin non potranno occupare il
medesimo orbitale.
Digressione sulla fisica dell’atomo
49
In accordo col principio di esclusione, l’atomo di elio con due elettroni nell’orbitale 1s ha spin totale nullo, poiché gli spin dei due elettroni sono opposti. L’atomo di litio ha due elettroni nell’orbitale 1s e
solo uno nel 2s, cosicché lo spin totale è . L’atomo di berillio, che
ne ha due di elettroni nell’orbitale 2s, ha spin nullo. Gli orbitali 2p
cominciano a riempirsi col boro e si riempiono sempre più negli atomi
successivi, fino all’atomo di neon, che ha 10 elettroni: due nell’1s, due
nel 2s e sei nei 2p, cioè i gusci K e L sono completi e lo spin totale è
nullo. Procedendo in questo modo nel riempimento dei gusci atomici
si determinano le configurazioni elettroniche di tutti gli atomi.
5.4
Esperimento di Stern e Gerlach
5.4.1 Premessa
Dall’elettromagnetismo è noto che una corrente elettrica che percorre una piccola spira chiusa è equivalente a un dipolo magnetico, nel
senso che entrambi producono lo stesso campo magnetico (v. Fig.
5.8).
Il dipolo magnetico può essere concepito come un piccolo magnete
lineare, cioè due masse magnetiche, ±m, uguali ed opposte, a una certa
(piccola) distanza, a, tra loro. Il cosiddetto momento magnetico del dipolo è definito come un vettore μ di modulo μ = ma e avente la direzione che va dalla massa magnetica sud (negativa) alla massa magnetica nord (positiva). Le masse magnetiche sono un’astrazione, i campi
magnetici sono in realtà prodotti dalle correnti, sia quelle macroscopiche sia quelle dovute al moto degli elettroni negli atomi. Si dimostra
che il momento magnetico di una corrente i che percorre una piccola
spira che racchiude l’area ha modulo μ = i ed è diretto come la
normale alla spira con verso tale che, guardando a ritroso lungo la
normale, la corrente appare girare in senso antiorario. In breve, una
spira e un dipolo aventi lo stesso momento magnetico producono lo
stesso campo. Questo è il ben noto principio di Ampère.
Consideriamo ora un elettrone che percorre una piccola traiettoria
circolare di raggio r con frequenza n (numero di giri al secondo). Attraverso una piccola area ortogonale alla linea di moto l’elettrone pas-
50
Capitolo V
sa n volte al secondo, per cui nel suo moto equivale a una corrente i =
en (e = carica dell’elettrone) che percorre una spira di area r2.
L’elettrone rotante possiede perciò un momento di dipolo μ = e n r2.
Poiché v = n 2 r è la velocità dell’elettrone, tenendo conto che il modulo del suo momento angolare è dato da l = mvr e che di solito lo si
mvr
), si ha:
esprime in unità ( l =
μ=
e
l
2m
5-17
da cui segue che il momento magnetico dell’elettrone è proporzionale al momento angolare e ha verso opposto (la carica dell’elettrone è
negativa).
Figura 5.8: Equivalenza tra un dipolo magnetico e una corrente circolare (principio
di Ampère).
Digressione sulla fisica dell’atomo
51
La precedente relazione vale per un elettrone in moto lungo una
piccola traiettoria circolare. Per lo spin si è trovato che vale una relazione simile, con costante di proporzionalità doppia.
μ=
e
s
m
5-18
Analizziamo ora il comportamento meccanico di un dipolo magnetico posto in un campo magnetico, (v. Figg. 5.9 a e 5.9 b). Se il campo
è costante nella regione occupata dal dipolo, le forze sulle due masse
magnetiche sono uguali e contrarie. Sul dipolo agisce quindi una coppia che tende a far ruotare il dipolo attorno al vettore momento M della coppia stessa e a orientarlo nella direzione del campo.
Figura 5.9: a) schema di dipolo magnetico e relativo momento di dipolo. b) Un dipolo magnetico posto in un campo magnetico (B0) è soggetto a una coppia che tende
ad orientarlo nella direzione del campo. c) La rotazione del dipolo avviene in senso
antiorario attorno al vettore (M) momento della coppia. d) Una coppia come quella
agente sul dipolo agisce anche su un atomo avente momento magnetico, ma l'effetto
è diverso, anziché una rotazione attorno ad M, si ottiene una precessione attorno a
B0.
52
Capitolo V
Nella configurazione in cui il dipolo è parallelo al campo il momento della coppia è nullo e il dipolo può rimanere in equilibrio o oscillare attorno alla direzione del campo.
Diverso è l’effetto del campo su un elettrone o su un atomo dotato
di momento angolare. Secondo le leggi classiche applicate al giroscopio (trottola) l’azione della coppia, il cui momento M è ortogonale al
campo (v. Fig. 5.9 c), non produce, come prima, una rotazione di μ
attorno ad M, bensì un moto di precessione del momento angolare l (o
s), e quindi di μ , attorno alla direzione del campo (v. Fig. 5.9 d). Dunque, l’angolo tra μ e il campo rimane costante.
Nell’esperimento di Stern e Gerlach fu usato un magnete con un
polo piatto e l’altro a forma di cuneo in modo da creare un campo B
fortemente disomogeneo, crescente dal basso verso l’alto (v. Fig. 5.10
a). In tal caso, se un dipolo magnetico forma l’angolo con la direzione del campo, la differenza z tra la quota della massa positiva e
quella della massa negativa è z = a cos , cioè, se z è la quota della
massa negativa, sul dipolo agisce, oltre alla coppia, una forza diretta
verso l’alto data da:
B(z + z) B(z) Fz =m [ B(z + z) B(z)] = m z z
5-19
Poiché a è molto piccolo, possiamo approssimare il rapporto incrementale con la derivata e scrivere:
Fz =m z
dB
dB
= ma cos dz
dz
5-20
ovvero, essendo μz = ma cos la componente del momento magnetico
nella direzione z del campo,
Digressione sulla fisica dell’atomo
Fz = μ z
dB
dz
53
5-21
Si dimostra che una identica espressione vale anche per gli elettroni
e per gli atomi dotati di momento magnetico. Quindi un elettrone — o
un atomo — posto in un campo magnetico disomogeneo acquista, oltre al moto di precessione del suo momento magnetico, anche una forza accelerante nel verso del gradiente del campo. Tale forza è proporzionale alla componente del momento magnetico μ lungo il campo,
per cui se μ è ortogonale al campo la forza è nulla mentre è massima
se μ è parallelo al campo.
Figura 5.10: a) Linee magnetiche schematiche nel magnete di Stern–Gerlach; b)
sdoppiamento del fascetto di atomi dovuto all’interazione del momento magnetico
atomico col campo disomogeneo.
54
Capitolo V
5.4.2 Esperimento
Nell’esperimento di Stern e Gerlach, dell’argento metallico era vaporizzato in un forno avente una serie di diaframmi, ognuno con un
piccolo foro allineato a quello degli altri, in modo che dall’ultimo diaframma emergesse uno stretto fascetto di atomi d’argento che penetrava infine nel campo inomogeneo del magnete. Gli atomi d’argento
hanno un solo elettrone nel guscio esterno, costituito dall’orbitale 4s,
mentre tutti gli altri elettroni, occupanti i gusci interni, sono accoppiati
con spin opposti. Perciò un atomo d’argento è una particella di spin ,
come l’elettrone, ma, a differenza di quest’ultimo, è elettricamente
neutro. Fu pertanto possibile studiare l’azione di un campo magnetico
inomogeneo su uno spin quantistico evitando la complicazione di deflessioni del fascetto dovute all’interazione di cariche in movimento
col campo.
Si osservò che nell’attraversare il campo il fascetto si divideva in
due fascetti, i quali, come mostravano le macchie d’argento lasciate
sullo schermo (v. Fig. 5.10 b), erano deflessi simmetricamente rispetto
al fascetto entrante e, inoltre, avevano la stessa intensità. Questo significa che metà degli atomi avevano un momento magnetico parallelo a
B e l’altra metà antiparallelo a B.
5.4.3 L’inconciliabile disaccordo con la fisica classica
Questo risultato contrasta nettamente con quanto prevede la fisica
classica. Per vederlo, supponiamo, com’è del tutto plausibile, che il
fascetto uscente dal forno contenga atomi con spin orientati a caso.
Riportando a partire da una stessa origine i momenti magnetici degli
atomi, le loro estremità risulteranno distribuite uniformemente su una
superficie sferica di raggio | μ | modulo del momento magnetico (v.
Fig. 5.11). D’altra parte, come si è visto, i momenti magnetici degli
atomi precedono attorno alla direzione del campo, per cui l’angolo che
essi formano col campo non cambia e di conseguenza non cambia
neppure la distribuzione dei loro estremi sulla predetta superficie sferica, nel senso che rimane costantemente isotropa.
Immaginiamo la direzione del campo come asse polare della sfera
in questione.
Digressione sulla fisica dell’atomo
55
Considerando una striscia sottilissima di ampiezza angolare attorno ad un parallelo (v. Fig. 5.11), la sua area e, quindi, il numero dei
punti al suo interno crescono al crescere dell’angolo da 0 a /2 per
poi decrescere fino ad annullarsi di nuovo per = : per = /2 si ha
la striscia equatoriale che ha area massima ed è quindi massimo il numero di punti ivi contenuti. In generale per un dato il numero N di
punti entro la striscia corrispondente è proporzionale all’area della
striscia:
N 2 μ sin μ = 2 μ2 sin 5-22
Tuttavia, a noi interessa la dipendenza di N da , per cui porremo
semplicemente N sin. D’altra parte gli atomi aventi l’estremo del
vettore μ entro la striscia sono soggetti alla forza
dB
dB
, perciò subiscono nel tempo di volo entro il
Fz = μ z
= μ cos dz
dz
magnete uno spostamento z proporzionale a Fz, ossia z = C cos ,
ove C è una costante data.
Figura 5.11: La sfera è il luogo geometrico degli estremi dei momenti magnetici degli atomi del fascetto entrante nel magnete.
56
Capitolo V
Dopo qualche semplice passaggio otteniamo perciò:
N C 2 z 2
5-23
L’espressione a secondo membro ha un massimo per z = 0, quindi
decresce al crescere di | z | annullandosi per z =±C. In conclusione,
secondo la fisica classica gli atomi d’argento dovrebbero formare
un’immagine singola con intensità massima al centro, cioè nella
direzione del fascetto entrante, e quindi decrescente fino ad annullarsi
per z =±C (v. Fig 5.12). Ciò in evidente contraddizione col risultato
dell’esperimento.
5.4.4 L’interpretazione quantistica
Come si è visto, la teoria quantistica stabilisce che il valore di una
grandezza relativa ad un sistema atomico non è determinabile con precisione prima che la grandezza sia misurata (v. App. C). Se la misura
concerne la componente dello spin di un atomo lungo un certo asse,
diciamo l’asse z, lo stato dello spin prima della misura sarà descritto in
termini dei possibili risultati, ovvero come sovrapposizione degli stati,
ciascuno dei quali relativo ad un dato valore della componente lungo
z, in modo che la probabilità di ciascuno di essi può essere valutata.
Figura 5.12: Intensità dell’immagine sullo schermo del dispositivo di Stern–Gerlach
secondo la fisica classica.
Digressione sulla fisica dell’atomo
57
Solo dopo che la misura è stata effettuata, la componente dello spin
possiede un valore determinato. In altre parole la misura determina la
transizione dallo stato precedente, in cui la componente lungo z è indefinita, verso un stato corrispondente ad un preciso valore della componente di spin.
Ripetendo la misura su un numero sufficientemente alto di atomi, si
otterranno quindi tutte le possibili componenti dello spin nella direzione fissata, ognuna un numero di volte proporzionale alla corrispondente probabilità.
Nell’esperimento di Stern e Gerlach è il campo magnetico inomogeneo che determina la misura delle componenti degli spin atomici,
nel senso che esso devia il moto degli atomi a seconda del valore della
loro componente di spin, cosicchè si formano tanti fascetti separati
quante sono le componenti diverse dello spin. Nel caso degli atomi
d’argento, che hanno spin , il fascio entrante è diviso in due fascetti,
uno costituito di atomi con spin di componente + e l’altro di atomi
con spin di componente –. Poiché le immagini che i due fascetti lasciano sullo schermo sono ugualmente intense, si deve inferire che un
atomo in ingresso è in uno stato in cui le due componenti lungo il
campo hanno la stessa probabilità di essere “attuate” dalla misura.
6 Indeterminazione e complementarità
6.1
Esperimento delle due fenditure: qual è la traiettoria
dell’elettrone?
Consideriamo di nuovo l’esperimento di interferenza elettronica,
esposto nel Cap. III.
Se fra il diaframma e lo schermo ci sono le due onde elettroniche
diffratte dai due fori, è possibile che vi siano anche gli elettroni? Si
può stabilire da quale foro proviene un elettrone rivelato in un dato
punto dello schermo?
Un esperimento che, in linea di principio, potrebbe rispondere a
queste domande è il seguente, suggerito anch’esso da Feynman1.
Figura 6.1: Esperimento ideale per determinare la traiettoria di un elettrone tra il diaframma e la matrice di rivelatori.
1
R. FEYNMAN, op. cit., vol. III.
59
60
Capitolo VI
A valle del diaframma viene posta una sorgente di luce di piccola
lunghezza d’onda, in modo che ogni elettrone illuminato diffonda la
luce permettendo di osservare da quale foro è passato (Fig. 6.1). Se,
per esempio, è passato dal foro 1, qualora la lunghezza d’onda sia abbastanza piccola da rendere sufficiente la risoluzione, noi vediamo la
luce diffusa dall’elettrone provenire da una regione circostante a questo foro.
Ebbene, l’esperimento mostrerebbe, com’è del tutto ovvio, che gli
elettroni passano per metà da un foro e per metà dall’altro. Tuttavia,
accendendo la luce, la figura di interferenza scompare e al suo posto si
ottiene la stessa distribuzione che otterremmo chiudendo prima un foro e poi l’altro.
Questo risultato può essere interpretato in base al principio di indeterminazione. Infatti, quando l’elettrone non è illuminato, poiché non
sappiamo da quale foro è passato, la sua posizione a valle del diaframma ha un’indeterminazione dell’ordine della distanza tra i forellini. L’illuminazione, permettendoci di individuare il foro da cui
l’elettrone è passato, riduce questa indeterminazione a una piccola regione nell’intorno di quel foro. Tuttavia, nello stesso tempo,
l’illuminazione incrementa l’indeterminazione dell’impulso, perché i
fotoni, “urtando” gli elettroni, ne deviano a caso le traiettorie sparpagliandoli sullo schermo. Ebbene, il calcolo mostra che lo sparpagliamento degli elettroni ha proprio l’effetto di distruggere la figura di interferenza.
In sostanza, l’osservazione della traiettoria seguita dagli elettroni a
valle del diaframma, ossia il loro aspetto corpuscolare, impedisce che
si possa osservare allo stesso tempo l’aspetto ondulatorio, ossia la figura d’interferenza. In altre parole:
I due aspetti corpuscolare e ondulatorio sono complementari, nel senso che una disposizione sperimentale atta a rivelarne uno preclude la
possibilità di rivelare l’altro e viceversa.
Questo è un enunciato particolare di un principio generale formulato da Niels Bohr e che va sotto il nome di principio di complementarità.
Indeterminazione e complementarità
61
Per quanto detto, il principio di complementarità sarebbe quindi
spiegato dalla perturbazione della luce sugli elettroni. Sorge allora la
domanda: se l’informazione su quale foro è attraversato dall’elettrone
si potesse ottenere senza arrecare alcuna perturbazione, la figura di interferenza permarrebbe?
Molti esperimenti del genere sono stati immaginati fin dagli anni
che seguirono la formulazione della teoria quantistica, ma la loro realizzazione era impedita dalla mancanza della tecnologia necessaria.
Solo a partire dall’ultimo decennio del secolo scorso, con
l’acquisizione di tecniche elettroniche superveloci e della manipolazione atomica, e col progresso dei laser si sono potuti progettare ed
eseguire esperimenti atti a tale scopo.
6.2
Interferenza con luce diffusa da due atomi
Uno di questi esperimenti fu eseguito nel 1993 da U. Eichmann
dell’Università di Friburgo in collaborazione con ricercatori del NIST
del Colorado e dell’Università del Texas. L’articolo, pubblicato sul
n.16 del Vol. 70 (19 Aprile 1993) del Physical Review Letters, comincia così:
«L’esperimento di Young delle due fenditure, nel contesto della
dualità onda-particella, è spesso considerato come un paradigma per i
fenomeni quantistici. Per alcuni esso “ha in sé il cuore della meccanica quantistica. In verità, contiene il solo mistero”. In questa lettera noi
riportiamo, per la prima volta, una versione dell’esperimento di
Young dove noi riveliamo l’interferenza di una luce laser debole diffusa da due atomi localizzati, i quali agiscono come due fenditure».
I due atomi in questione sono ioni di mercurio (198Hg+), localizzati
ad una distanza di qualche micron (milionesimo di metro) l’uno
dall’altro per mezzo di una trappola ionica (v. Fig. 6.2).
Ci interessano qui due livelli energetici dello ione: quello di più
bassa energia, di tipo 2S e l’altro di tipo 2P. Nella Figura 6-3 ciascun
livello è rappresenato da due segmenti orizzontali con freccette di verso opposto, ad indicare che per ogni livello ci sono due stati corrispondenti a valori opposti del momento angolare dell’atomo.
62
Capitolo VI
La differenza di energia tra il livello 2P e il livello 2S è pari a 6.41
eV, per cui la lunghezza d’onda dei fotoni assorbiti nella transizione
2
S 2 P o emessi nella transizione inversa è data da:
h =
hc
= 6.41 eV =194 nm
Nell’esperimento in questione (v. Fig. 6.3), i due ioni di mercurio,
posti nella trappola ionica ad una distanza di qualche micron (1 μ=10-6
m), sono investiti da un fascetto di luce laser, accordato alla lunghezza
d’onda di 194 nm, avente polarizzazione lineare, ossia con il campo
elettrico che oscilla in una direzione fissa (v. A.6); i corrispondenti fotoni sono detti fotoni . Quando un fotone è assorbito, l’atomo assorbitore passa dal livello 2S al livello 2P, senza che cambi
l’orientazione del momento angolare (frecce rosse verso l’alto in Figura 6-3), ma poiché gli stati eccitati sono instabili, lo ione decade di
nuovo nello stato più basso.
Figura 6.2: Trappola ionica. Consiste di quattro piccoli cilindri (diametro 1,6 mm,
lunghezza 12,6 mm). Ogni cilindro è diviso in due parti, elettricamente isolate, tra
cui è applicata una tensione alternata. Inoltre, una tensione costante U è applicata
alle parti più corte dei cilindri adiacenti e un voltaggio nullo tra quelle più lunghe.
Con tale configurazione, nel centro della trappola, si crea un potenziale elettrico con
due minimi nei quali i due ioni Hg+ possono stare stabilmente. La distanza tra i due
minimi decresce al crescere di U ; usando il valore indicato essa è 3,6 μm.
Indeterminazione e complementarità
63
La transizione di emissione (frecce rosse verso il basso) può avvenire in due modi sostanzialmente equiprobabili: nel primo viene emesso un fotone e quindi non cambia l’orientazione del momento angolare, nel secondo viene emesso un fotone , che ha polarizzazione
circolare (la direzione di oscillazione del campo elettrico dell’onda
ruota uniformemente lungo la direzione di propagazione). In questo
caso la transizione è accompagnata dall’inversione del momento angolare. Quindi, se il fotone emesso è di tipo , è possibile conoscere, almeno in linea di principio, quale dei due atomi lo abbia emesso, poiché quest’atomo possiede alla fine del processo un momento angolare
invertito rispetto a quello che aveva all’inizio. Se invece il fotone emesso è di tipo , non è possibile stabilire quale sia stato l’atomo emettitore.
I fotoni del fascio incidente sono tutti nello stesso stato descritto da
una onda piana di lunghezza d’onda pari, appunto, a 194 nm. Poiché
non è dato di sapere quale dei due atomi assorbe il fotone incidente,
l’onda fotonica diffusa consisterà di due onde divergenti, una uscente
da uno ione e l’altra dall’altro.
Figura 6.3: Le piccole freccette blu sulle linee dei livelli denotano le due opposte
direzioni dello spin, mentre quelle rosse indicano le transizioni nell’assorbimento
dei fotoni e nelle successive emissioni e .
64
Capitolo VI
Nella configurazione sperimentale di Figura 6-4a, si ottiene sullo
schermo un’immagine a cui contribuiscono sia fotoni sia fotoni .
D’altra parte, si è detto che, per ogni fotone che giunge in un dato
punto dello schermo, è possibile in linea di principio stabilire quale
atomo lo abbia emesso e quindi individuarne la traiettoria, solo se si
tratta di un fotone .
Figura 6.4: Diffusione della luce laser da parte di due ioni 198Hg+. Il fascio incidente
è inclinato rispetto alla perpendicolare allo schermo per evitare che l’immagine oscuri quella delle onde diffuse.L’aspetto di questa immagine, con massimi
dell’intensità alternati a minimi, è quello di una tipica figura d’interferenza.
Indeterminazione e complementarità
65
Pertanto, poiché lo scopo dell’esperimento è di verificare la possibilità di poter individuare simultaneamente l’aspetto corpuscolare
(traiettoria) e quello ondulatorio (interferenza) dovremmo “eliminare”
dall’immagine sullo schermo il contributo dei fotoni . Per questo si
inserisce di fronte allo schermo un filtro che li blocca, in modo che la
figura che si forma sullo schermo sia prodotta dai soli fotoni . Ebbene, con l’introduzione del filtro scompare immediatamente la figura di
interferenza (v. Fig. 6.4b). In sostanza, l’aspetto ondulatorio si manifesta solo con i fotoni . Al contrario, il fatto che possa essere determinato l’atomo emettitore di fotoni e quindi la loro traiettoria, preclude la possibilità di osservarne l’aspetto ondulatorio.
Si ricorderà che il principio di complementarità è stato all’inizio
considerato una conseguenza del principio d’indeterminazione, per cui
l’impossibilità di osservare simultaneamente i due aspetti sarebbe dovuta al fatto che l’osservazione di uno perturba il sistema in modo tale
che l’osservazione dell’altro aspetto risulta impedita.
L’esperimento descritto ora conferma la validità del principio di
complementarità e mostra nel contempo che non è necessario osservare realmente uno degli aspetti perché sia preclusa l’osservazione
dell’altro, ma è sufficiente che l’apparato sperimentale preveda tale
osservazione, anche senza metterla in atto. Infatti, per far scomparire
la figura d’interferenza è bastato che fosse possibile misurare
l’orientazione del momento angolare dei due ioni, senza che occorresse misurarla effettivamente.
6.3
Esperimento di Rochester
Nell’esperimento in questione si utilizza un dispositivo che produce
due onde coerenti in modo diverso da quello delle due fenditure.
6.3.1 Interferenza di onde emergenti da un divisore di fascio
Consideriamo un vetrino piano con un rivestimento d’argento di
spessore tale che un fascetto di luce che incide a 45° è per metà trasmesso e per metà riflesso (specchio semiargentato) (v. Fig. 6.5). Tale
dispositivo è detto divisore di fascio (beamsplitter).
66
Capitolo VI
Naturalmente, il singolo fotone segue l’una o l’altra delle due strade, ma poiché non è dato di stabilire quale, l’onda fotonica si divide in
due onde coerenti: una procede a diritto e una è riflessa. Le due parti,
deviate di un angolo retto dalla riflessione sugli specchietti, incidono
quindi sul beamsplitter Bs2. Pertanto, nel tratto Bs2A, la parte riflessa
da Bs2 dell’onda superiore si sovrappone con la parte trasmessa
dell’onda inferiore. Invece, nel tratto Bs2B, è la parte trasmessa da
Bs2 dell’onda superiore che si sovrappone con la parte riflessa
dell’onda inferiore.
L’onda risultante dalla sovrapposizione delle due onde in ciascuno
dei due rami dipende dalla fase relativa delle due onde. Al solito, se,
ad esempio, i massimi di una coincidono coi massimi dell’altra si ha
interferenza costruttiva e l’onda risultante ha ampiezza doppia e quindi intensità quattro volte quella delle due onde componenti; se, invece,
i massimi di una coincidono coi minimi dell’altra si ha interferenza distruttiva e l’onda risultante ha ampiezza e quindi intensità nulle. Per
tutte le altre fasi relative si hanno intensità intermedie tra la nulla e la
massima. L’intensità risultante lungo i due cammini si ottiene dalla
frequenza di conteggio dei fotomoltiplicatori (contatori di fotoni) A e
B. La fase relativa delle due onde può essere cambiata con spostamenti microscopici di Bs2 in direzione ortogonale alla sua superficie.
Figura 6.5: L’interferenza delle due onde uscenti dal divisore di fascio è rivelata dalle oscillazioni nei conteggi dei fotomoltiplicatori A e B.
Indeterminazione e complementarità
67
In tal modo cambia infatti il punto e quindi la fase con cui ciascuna
di esse incide su Bs2. Supponiamo di aver disposto le cose in modo
che le onde risultanti lungo Bs2A e Bs2B abbiano la prima intensità
nulla e la seconda massima. In tali condizioni B segnala il conteggio
massimo mentre A non dà conteggio. Con spostamenti microscopici di
Bs2, si cambiano le intensità delle onde nei due rami, cosicché il conteggio di B decresce fino ad annullarsi, mentre quello di A cresce fino
al massimo, e così via. Queste oscillazioni dei conteggi, in funzione
della posizione di Bs2 sono, appunto, rivelatrici dell’interferenza delle
onde nei due rami. Questa disposizione sperimentale, in accordo col
principio di complementarità, consente dunque di verificare l’aspetto
ondulatorio dei fotoni, ma non di determinare quale cammino essi
compiono. Ebbene, nell’esperimento che seguirà, l’apparato strumentale è predisposto in modo da determinare anche la traiettoria dei fotoni, senza con questo perturbarli direttamente, Lo scopo è quello di verificare se la figura d’interferenza viene distrutta anche in assenza di
una perturbazione diretta.
6.3.2 Conversione parametrica
Prima di analizzare l’esperimento, è utile descrivere un ulteriore dispositivo, che ha una funzione fondamentale. Si tratta del convertitore
parametrico (v. Fig. 6.6), detto anche, con parola inglese, downconverter, che funziona così: quando un fascio di luce laser monocromatica, di frequenza 0, penetra in particolari cristalli birifrangenti, per
esempio di LiIO3, c’è una piccola probabilità (dell’ordine di 1 su un
milione) che uno dei fotoni del fascio decada spontaneamente e casualmente in due fotoni: uno detto segnale (s) e l’altro, con termine
inglese, idler (i), che vuol dire pigro (dei due è quello più lento nel cristallo), i quali hanno entrambi polarizzazioni lineari, ma ortogonali tra
loro (v. A.6).
Ricordiamo che un fotone di frequenza trasporta energia h e impulso h/c(), dove nella fattispecie c() è la velocità della radiazione
entro il cristallo, la quale dipende dalla frequenza e, in ogni caso, è
minore della velocità della luce nel vuoto. Definendo vettore impulso
68
Capitolo VI
k quel vettore che ha per modulo h/c() e per direzione quella di propagazione del fotone, valgono le relazioni:
0 = s + i
k0 = ks + ki
le quali esprimono la conservazione dell’energia e dell’impulso, rispettivamente, nel processo di decadimento del fotone incidente.
6.3.3 L’esperimento
L’esperimento in questione fu eseguito dal gruppo di Leonard
Mandel presso l’Università di Rochester (New York) nel 19912.
Lo schema dell’apparato è illustrato in Fig. 6.7. Il fascetto di un laser ad argon, 0=351,1 nm, è diviso in due dal beamsplitter Bs1. Come
si è già detto, il singolo fotone, segue una delle due strade ma non è
dato sapere quale, per cui la rispettiva onda di probabilità (onda fotonica) si propaga lungo i due cammini c1 e c2.
Figura 6.6: Un fotone di un fascio laser all’ultravioletto decade entro il cristallo in
due fotoni, s e i, le cui direzioni giacciono su superfici coniche.
2
X.Y. Zou, L.J. Wang, and L. Mandel, Phys. Rev. Lett., 67, 318 (1991)
Indeterminazione e complementarità
69
Su ciascuno di questi ultimi è posto un convertitore parametrico
(CP), entro il quale una piccola percentuale dei fotoni incidenti decade
in un fotone segnale, s=788,7 nm, e in un fotone idler, i=632,8 nm.
Se un fotone decade in Cp1, il fotone segnale si propaga lungo s1 e il
fotone idler lungo i1. Se invece decade in Cp2, i fotoni segnale e idler
si propagano lungo s2 e i2 rispettivamente. Le onde fotoniche s1 e s2,
sebbene abbiano la stessa frequenza, non sono coerenti, e lo stesso vale per le onde fotoniche i1 e i2. Il decadimento di un fotone in un convertitore parametrico è infatti un evento casuale per cui, anche se le
onde fotoniche entranti in due diversi convertitori sono, come nel nostro caso, coerenti, le onde uscenti non lo sono. L’esperimento mostra
infatti che, facendo incidere le onde fotoniche s1 e s2 sul beamsplitter
Bs2 e conferendo a questo spostamenti micrometrici, il contatore Ds
non segnala interferenza, ovvero il suo conteggio rimane invariato.
Questo risultato è in accordo col principio di complementarità, poiché
in queste condizioni è possibile stabilire il percorso dei fotoni. Infatti,
i fotoni i2 e s2 sono creati insieme — così come i1 e s1 —; pertanto, assumendo che, i percorsi dal punto di creazione ai contatori Ds e Di
siano di ugual lunghezza, i2 e s2 fanno scattare simultaneamente i rispettivi contatori.
Figura 6.7: Schema della disposizione sperimentale di Mandel e collaboratori
70
Capitolo VI
Quindi, un fotone c2 che decade in Cp2 fa sì che si registri uno scatto simultaneo in Ds e Di. Un fotone c1 che decade in Cp1 fa invece
scattare, col fotone s1, solo il contatore Ds, poiché il fotone i1 non finisce su alcun contatore. Riassumendo, se simultaneamente a uno
“scatto” del contatore Ds si ha anche uno scatto del contatore Di, vuol
dire che il fotone originario è passato dal percorso c2. Se invece lo
“scatto” di Ds non è accompagnato da un simultaneo scatto di Di, vuol
dire che il fotone originario ha fatto il percorso c1.
L’apparato viene ora modificato in modo che i fotoni idler i1 prodotti in Cp1 entrino in Cp2, e vi entrino proprio nella direzione i2 . Ebbene, appena l’allineamento è stabilito, il contatore Ds segnala il conteggio oscillante tipico dell’interferenza di onde coerenti. In breve,
allineando esattamente i1 e i2 le onde lungo s1 e s2 divengono coerenti.
Anche questo risultato si accorda perfettamente col principio di
complementarità, poiché in queste condizioni viene meno la conoscenza dei percorsi fatti dai fotoni. Se i tratti i2 e i1 sono allineati non
è infatti possibile dire se uno “scatto” di Di sia dovuto a un fotone idler i2 creato entro Cp2 o a un fotone idler i1 creato entro Cp1 e che attraversa Cp2 e incide su Di facendolo scattare.
La scomparsa dell’interferenza, oltre che disallineando i1 e i2, può
essere ottenuta anche interponendo uno schermo lungo i1 in modo da
bloccare i fotoni in questo tratto ed eliminare così l’ambiguità su quale
dei fotoni i1 e i2 fa scattare Di.
Nel finale dell’articolo di Mandel e collaboratori si legge: «Dovrebbe essere notato che la scomparsa della figura d’interferenza non
è qui il risultato di un ampio disturbo incontrollabile, nello spirito del
microscopio a raggi di Heisenberg, ma semplicemente una conseguenza del fatto che i due possibili cammini dei fotoni s1 e s2 sono divenuti distinguibili».
Poiché i fotoni di una coppia segnale-idler sono emessi insieme,
una volta che la connessione i1, i2 è interrotta, diventa possibile determinare, dai conteggi di Di, se un fotone segnale rivelato da Ds provie-
Indeterminazione e complementarità
71
ne da Cp1 o da Cp2, e ciò distrugge l’interferenza. Se questa misura
con Di sia stata o meno fatta, o se questo rivelatore sia acceso oppure
spento, non ha importanza. È sufficiente che la misura possa esser fatta e che il cammino dei fotoni diventi identificabile in linea di principio perché l’interferenza scompaia.
Da questo esperimento emerge un altro aspetto peculiare delle particelle elementari, noto come non località, per cui, ad esempio, nello
stesso preciso istante in cui si pone lo schermo lungo i1, distante dal
percorso dei fotoni segnale, le onde fotoniche s1 e s2 diventano incoerenti, tanto che l’interferenza scompare. Sembra, quindi, che valga il
seguente principio di non località:
Un evento atomico o subatomico, che avviene in una data regione
spaziale, può essere sostanzialmente ed istantaneamente modificato
da un cambiamento dell’apparato sperimentale fatto al fine di acquisire informazioni su parti dello stesso sistema, anche distanti dal luogo dell’evento.
Che l’acquisizione di un’informazione influisca radicalmente
sull’evoluzione di un fenomeno fisico nell’istante preciso in cui viene
acquisita può apparire sorprendente. Ma, gli eventi atomici e subatomici sono regolati da leggi probabilistiche, e la probabilità dipende
dalla quantità di informazione sul sistema. Perciò se quest’ultima
cambia in seguito ad un’istantanea modifica dell’apparato sperimentale, la funzione d’onda cambia – anche in modo sostanziale – istantaneamente.
Nell’esperimento appena discusso, finché noi non conosciamo il
cammino fatto dal fotone, le onde di probabilità presenti sui due cammini sono coerenti e si ha interferenza. Ma nel momento in cui introduciamo lo schermo nell’apparato sperimentale, in modo da determinare il cammino seguito dal fotone, le onde segnale s1 e s2 diventano
incoerenti, per cui l’interferenza scompare.
Questo fatto non sarebbe spiegabile se si trattasse di onde fisiche,
come le onde sull’acqua, le onde sonore e le onde elettromagnetiche.
Infatti, le azioni fisiche si propagano con velocità finita, non superiore
72
Capitolo VI
a quella della luce nel vuoto, per cui l’azione dello schermo eserciterebbe la sua influenza solo dopo un certo tempo.
L’interpretazione canonica è, come si è già accennato, che le onde
di probabilità della meccanica quantistica non sono onde fisiche, nel
senso suddetto, ma sono entità astratte, matematiche, che permettono
di effettuare previsioni sui possibili eventi che possono manifestarsi
in un dato contesto, e tanto basta. Le leggi della teoria quantistica
permettono di determinare la distribuzione nello spazio e l’evoluzione
temporale di tali onde, una volta che sia noto l’insieme delle condizioni fisiche (apparati sperimentali compresi). La teoria fornisce inoltre le
regole per ricavare, dalla funzione d’onda, le probabilità degli eventi o
dei risultati delle misurazioni.
7 Teoria quantistica vs. teorie realistiche locali
7.1
Paradosso di Einstein–Podolski–Rosen
7.1.1 Premessa
La meccanica quantistica, mediante la conoscenza della funzione
d’onda, consente di determinare le probabilità dei possibili risultati di
una misura o dei possibili esiti di un esperimento. Tuttavia, essa non
fornisce alcuna indicazione sul perché l’esperimento abbia dato proprio quel risultato: un’onda fotonica che incide su un divisore di fascio
(beam-splitter) si biforca, ma la teoria quantistica non è in grado di
stabilire a priori quale dei due rivelatori, posti alla fine di ciascun
cammino, segnalerà la presenza del fotone. Al più varrà la previsione
statistica per cui la probabilità è la stessa per ambo i cammini, pari al
50%. Ciò significa che ripetendo la misura con molti fotoni troveremo che, con buona approssimazione, il 50% seguiranno un cammino e
il restante 50% l’altro.
Nella teoria quantistica lo stato di un sistema è descritto in relazione alla misura che si deve attuare sul sistema, perciò coinvolgendone
tutti i possibili risultati. Effettuando la misura si attua uno solo di tali
risultati, e l’originario stato del sistema collassa istantaneamente in
un nuovo stato inerente al risultato ottenuto. Per chiarire questo concetto fondamentale della teoria atomica riferiamoci ad un esempio
concreto relativo alla misura di polarizzazione dei fotoni (v. A.6).
Consideriamo un fascetto di fotoni polarizzato per mezzo di un filtro
Polaroid, che viene fatto passare attraverso un cristallo di calcite il cui
asse ottico forma un certo angolo con l’asse del filtro. Supponiamo
che l’intensità del fascetto sia così bassa che un solo fotone alla volta
attraversi l’analizzatore. Quello che si osserva è che (v. A.6), nonostante tutti i fotoni del fascetto entrante siano polarizzati nello stesso
identico modo, la frazione sin2 dei fotoni esce dal canale ordinario, e
quindi con polarizzazione ortogonale all’asse ottico, e il resto, cioè la
frazione cos2 , dal canale straordinario, con polarizzazione parallela
73
74
Capitolo VII
all’asse ottico. Ma qual è la causa per cui il singolo fotone finisce in
un canale piuttosto che nell’altro?
Secondo la teoria quantistica la domanda non ammette risposta, e
dà dell’evento la seguente descrizione. Ricordiamo anzitutto che
un’onda elettromagnetica monocromatica classica, di frequenza , descrive il comportamento di fotoni (v. Cap. 3) aventi energia . Inoltre la sua intensità, essendo proporzionale all’energia per unità di volume, è proporzionale alla densità dei fotoni. Quando una tale onda elettromagnetica, con polarizzazione obliqua, incide sull’analizzatore,
il campo elettrico dell’onda viene scomposto secondo le due direzioni
parallela e perpendicolare all’asse ottico: E = cos E// + sin E ed i
quadrati cos2 e sin2 dei coefficienti danno le frazioni delle intensità
delle onde uscenti dai due canali. Ma se l’onda, da un punto di vista
classico, ha intensità così piccola da descrivere un singolo fotone, non
possiamo interpretare i quadrati dei coefficienti suddetti come frazioni
dell’intensità, perché non ha senso parlare della frazione di un fotone,
dato che quest’ultimo passa o da un canale o dall’altro, non da entrambi. Nel caso di un fotone singolo la descrizione data dalla teoria
quantistica è pertanto la seguente: prima che esso entri
nell’analizzatore il suo stato di polarizzazione viene descritto, come il
campo elettrico dell’onda classica, in base ai due possibili esiti, ossia
come sovrapposizione dello stato di polarizzazione parallela e dello
stato di polarizzazione perpendicolare all’asse ottico del cristallo. Ma
in tal caso i quadrati dei coefficienti rappresentano le probabilità che il
fotone passi in un canale o nell’altro. Questa è la massima conoscenza
a priori che possiamo acquisire sugli esiti della misura. L’atto della
misura elimina questa sorta di ambiguità, facendo collassare lo stato
del fotone nell’uno o nell’altro dei due stati di polarizzazione, parallelo o perpendicolare all’asse ottico.
Intuitivamente, è difficile accettare l’idea che il canale di uscita non
sia determinato, per esempio da un’interazione casuale del fotone col
cristallo di calcite; infatti, l’idea filosofica secondo cui ogni evento ha
la sua causa, a volte conoscibile dall’uomo e a volte no (realismo), è
profondamente radicata nel nostro modo di pensare.
Con riferimento poi all’esperimento di Mandel discusso nel capitolo 6, è altrettanto difficile ammettere che l’introduzione dello schermo
Teoria quantistica vs. teorie realistiche locali
75
sul cammino del fotone pigro distrugga istantaneamente la figura
d’interferenza prodotta dai fotoni segnale. Infatti, secondo la teoria
della relatività un’azione istantanea a distanza non è possibile: una
perturbazione si propaga sempre con velocità finita, non superiore alla
velocità della luce nel vuoto. Pertanto, l’istantanea scomparsa
dell’interferenza come conseguenza di un evento lontano appare paradossale. La spiegazione data dalla teoria quantistica, secondo cui quello che si propaga non è un’entità fisica, ma l’informazione, ossia
un’entità matematica, confligge fortemente col senso comune.
7.1.2 Il paradosso
La difficoltà della fisica quantistica di conciliarsi con il realismo e
il principio di località, due paradigmi della scienza classica, è chiaramente espressa da un celebre paradosso proposto nel 1935 da Einstein
e due suoi collaboratori, Boris Podolski e Nathan Rosen, e noto come
paradosso EPR. L’esperimento ideale da loro proposto avrebbe dovuto
mostrare l’incompletezza della teoria quantistica, nel senso che, pur
predicendo correttamente i risultati sperimentali, essa non rendeva
conto delle loro ragioni che, sia pure nascoste, dovevano pur sempre
esistere secondo la visione realistica.
Nel 1951 David Bohm propose una variante concettualmente più
semplice dell’esperimento EPR ed a questa ci riferiremo. Egli considerò una molecola costituita da due atomi, A e B, aventi spin di orientazione opposta, in modo che lo spin totale fosse nullo (v. Fig.
7.1a); suppose inoltre che la molecola si dissociasse conservando lo
spin totale nullo. Quando gli atomi fossero stati abbastanza lontani
l’uno dall’altro, da non interagire più tra loro, in nessun modo, si sarebbe misurata una data componente dello spin di uno di essi, p. es.
dell’atomo A (v. Fig. 7.1b). Dato che lo spin totale era nullo, si deduceva che la stessa componente di spin dell’atomo B sarebbe stata opposta a quella dell’atomo A. In tal modo, una componente dello spin
di B poteva essere ottenuta senza la necessità di misurarla.
Secondo le leggi classiche il risultato può interpretarsi facilmente:
ad ogni istante tutte le componenti dello spin di una particella risultano ben definite e, quindi, tutte le componenti dello spin dell’atomo B
sono e restano opposte alle corrispondenti dell’atomo A. Perciò, una
76
Capitolo VII
volta misurato il valore di una componente dello spin di A, si può subito dedurre che la corrispondente componente dell’atomo B ha valore
opposto.
L’interpretazione quantistica di tale risultato presenta, però, alcune
difficoltà. Infatti, come si è visto nel paragrafo 5.4.4, in fisica quantistica solo una delle componenti dello spin può essere misurata, mentre
le altre restano indeterminate. Scelta una direzione della componente
di spin sono possibili due configurazioni per gli spin di A e B: componente positiva per A e negativa per B, o viceversa. Nello spirito della teoria quantistica, lo stato di spin dei due atomi prima della misura
consiste nella combinazione (sovrapposizione) di queste due possibili
configurazioni (v. Fig. 7.2a). Un tale stato è detto entangled. Nel caso
in questione, dal momento che le due configurazioni di spin sono equivalenti, ognuna di esse ha probabilità di attuarsi. Abbiamo utilizzato il termine “attuarsi” dato che è solo la misura che attua in direzione e valore le componenti degli spin di A e B, mentre lo stato prima della misura non dà informazione sull’orientazione dello spin ma
descrive solo le due configurazioni entangled di spin opposti.
Figura 7.1: a) Molecola nello stato di singoletto che si dissocia in due atomi, mantenendo l’originario spin nullo; b) misura delle componenti di spin dei due atomi separati.
Teoria quantistica vs. teorie realistiche locali
77
Per esempio, se la misura della componente z dello spin dell’atomo
A dà , il sistema collasserà dallo stato entangled alla configurazione
della Figura 7.2b, dove le componenti z dello spin sono: per A e -
per B. Analogamente, misurando la componente z dell’atomo B, troveremmo -. Osserviamo che le componenti x e y restano del tutto indeterminate. In sostanza, l’impossibilità di conoscere due componenti
diverse dello spin è analoga all’impossibilità di determinare la traiettoria delle particelle senza distruggere la figura d’interferenza: si tratta
di quantità complementari.
Il paradosso nell’interpretazione dell’esperimento di Bohm consiste
in quanto segue. Per prima cosa non si può spiegare perché la misura
di una componente di spin dell’atomo A, la cui direzione z può essere
scelta quando i due atomi sono già molto distanti l’uno dall’altro, determina istantaneamente la componente di spin nella stessa direzione z
dell’atomo B. Ciò accade nonostante che durante la misura l’atomo B
non interagisca né con A né con l’apparato di misura. Secondariamente, se, insieme alla misura sull’atomo A, viene misurata la componente
x (o y) dell’atomo B potremo dedurre che nello stesso momento
l’atomo A avrà anche una componente definita nella direzione x (o y).
Così le componenti x e z dello spin dei due atomi saranno determinate
contemporaneamente contro il principio di complementarità.
Figura 7.2: a) Stato di spin entangled dei due atomi; b) transizione dallo stato entangled allo stato prodotto indotta dalla misura della componente dello spin dell’atomo
A.
78
Capitolo VII
La teoria quantistica spiega il paradosso in questo modo: prima della misura dello spin dell’atomo A, lo spin totale è nello stato entangled (v. Fig. 7.2a) in cui le componenti dello spin di entrambi gli atomi sono indeterminate in direzione e verso. Se la misura della componente dello spin di A dà come risultato , lo stato collassa in uno stato
semplice, non–entangled, (v. Fig. 7.2b) in cui i due atomi hanno componenti z dello spin ben determinate: per A e – per B. La misura
della componente x dello spin dell’atomo B viene effettuata in questo
stato, ottenendo . Ma la misura stavolta non influenza la componente
di spin di A, poiché in uno stato non–entangled le componenti di spin
dei due atomi non sono correlate.
La precedente spiegazione del paradosso si basa esclusivamente sul
paradigma quantistico secondo cui il valore di una grandezza non è
preesistente alla misura della grandezza stessa, se non come uno dei
possibili valori. Se il valore di una grandezza non esiste, però, prima
della misura, Einstein, Podolski e Rosen si chiedevano come la componente z dell’atomo B potesse ottenersi con una semplice deduzione
senza misurarla. E aggiungevano: poiché questa componente può dedursi in direzione e verso da quella dell’atomo A, le caratteristiche di
spin dei due atomi debbono essere legate permanentemente ad una realtà più profonda e da scoprire, la quale fa sì che non si possa scegliere la direzione e il verso per uno dei due atomi senza che anche la direzione e il verso dell’altro rimangano determinati. La teoria quantistica esclude questo legame tra gli spin, rinunciando, quindi, a poter descrivere la realtà nascosta che sta alla base dei risultati degli esperimenti. In questo senso, d’accordo con Einstein, Podolski e Rosen, si
tratta di una teoria incompleta. Se una tale realtà nascosta esistesse,
anche le leggi del mondo atomico soddisferebbero ad una visione del
mondo che il senso comune considera ovvia e naturale, essendo basata
su due assunti: il realismo, secondo cui i fenomeni evolvono indipendentemente dall’osservazione dell’uomo e il principio di località di
Einstein, il quale stabilisce che una perturbazione non può propagasi
più velocemente della luce nel vuoto. Questi due concetti stanno alla
base delle cosiddette teorie realistiche locali della natura.
Teoria quantistica vs. teorie realistiche locali
7.2
79
Il teorema di Bell
Ci chiediamo: è possibile effettuare esperimenti i cui risultati, come
previsti dalla teoria quantistica, siano diversi da quelli previsti dalle
teorie realistiche locali? Nel 1964 John S. Bell del CERN di Ginevra
(Centro Europeo di Ricerche Nucleari) propose un esperimento ideale,
in sostanza un’estensione di quello di Einstein, Podolski, Rosen, che
risponde alla domanda precedente. Egli considerò una serie di tre misure, nelle quali N molecole biatomiche nello stato di singoletto si dissociano una dopo l’altra cosicché gli atomi componenti si muovono in
direzione opposta. Scelte arbitrariamente tre direzioni A, B, C nel primo caso si orienta il filtro di spin lungo A per l’atomo 1 e lungo B per
l’atomo 2, nel secondo lungo A e C rispettivamente e nel terzo lungo B
e C (v. Fig. 7-3).
In ogni misura si registra il numero dei casi in cui i due atomi escono dai rispettivi filtri, diviso per N. Nella prima misura l’atomo uscente da A ha componente di spin + lungo A, che indicheremo con
A+. L’atomo uscente da B ha componente + lungo B, che indicheremo con B+. La frequenza di queste coppie sarà indicata con P(A+, B+)
o, più semplicemente, P(A, B).
Figura 7.3: Esperimento ideale di Bell: a) misura della frequenza delle coppie di atomi uscenti dai filtri A e B; b) e c) la stessa misura con i filtri A, C e B, C .
80
Capitolo VII
Analogamente le frequenze nel caso della seconda e terza misura
saranno indicate con P(B, C) e P(A, C), rispettivamente.
Bell, seguendo le teorie realistiche locali, dimostrò che le tre frequenze soddisfano alla disuguaglianza:
P(A,B) P(A,C)+ P(B,C)
7-1
la quale prende il nome di disuguaglianza di Bell. Eccone la dimostrazione.
Sebbene non sia possibile misurare più di una delle componenti
dello spin, si assume che ciascun atomo abbia le tre componenti di
spin lungo A, B e C perfettamente definite (ipotesi realistica). Inoltre,
poiché i due atomi di ciascuna molecola si trovano nello stato di singoletto, se sono assegnate le componenti dello spin di uno dei due atomi, possiamo dedurre che le corrispondenti componenti di spin
dell’altro sono uguali e contrarie. Infine, allorché i due atomi sono
sufficientemente distanti l’uno dall’altro, la misura delle componenti
di spin di un atomo non influisce sulle componenti dello spin
dell’altro atomo (principio di località).
Con tali premesse le possibili componenti di spin degli atomi lungo
le direzioni A, B e C sono le seguenti:
Componenti
Numero di atomi
A+B+C+
A+B+C–
A+B–C+
A+B–C–
A–B+C+
A–B+C–
A–B–C+
A–B–C–
N1
N2
N3
N4
N4
N3
N2
N1
Gli atomi con componenti A+B–C+e A+B–C– hanno per compagni
atomi con componenti A–B+C– e A–B+C+, rispettivamente, per cui
Teoria quantistica vs. teorie realistiche locali
81
formano coppie (A+, B+). Essi sono in numero di N3+N4, per cui la frequenza di tali coppie è P(A, B) = (N3+N4)/N. Analogamente si trova:
P(A, C) = (N2+N4)/N e P(B, C) = (N2+N3)/N, da cui segue subito la disuguaglianza di Bell.
Effettuiamo, adesso, lo stesso calcolo usando la teoria quantistica.
Poiché i due atomi della molecola dissociata hanno la direzione dello
spin indeterminata, la probabilità che uno di essi emerga dal relativo
filtro è . Supponiamo che l’atomo 1 esca dal filtro A, in tal caso esso
avrà componente di spin A+, e di conseguenza l’atomo 2 A-. L’atomo 2
/ 2) di uscire dal filtro B (v. App. C).
ha, quindi, probabilità sin 2 (AB
La probabilità che entrambi gli atomi escano dai rispettivi filtri è data
AB
1
da P(A, B) = sin 2 . Analogamente si trova:
2
2 P(A,C) =
1 2 AC
1 2 BC
sin sin
e
P(B,C)
=
2 .
2
2
2 Per avere accordo con la disuguaglianza dev’essere, quindi:
AB
AC
BC
2
2
sin 2 sin
+
sin
2 2 2 7-2
= 2 , AC
= BC
= , per
Scegliendo, però, le tre orientazioni AB
0 < < 2 , la disuguaglianza non è soddisfatta. Lo scarto massimo
si ha per =1.047 rad = 60° (v. Fig. 7-4).
Come si vede, il teorema di Bell sposta la questione sulla completezza della teoria quantistica dal piano filosofico (realismo contro positivismo, località contro non–località) al piano sperimentale. Esso
mostra, infatti, per la prima volta che esiste la possibilità di discriminare con esperimenti tra teoria quantistica e teorie realistiche locali.
82
7.3
Capitolo VII
Una versione alternativa del teorema di Bell. L’esperimento
di Aspect
Oltre a quella riportata sopra, esistono altre versioni
dell’esperimento di Bell, più adatte ad essere applicate a esperimenti
specifici. Nel 1969 J.F. Clauser, M.A. Horne, A. Shimony e R.A. Holt
proposero un esperimento in cui una sorgente genera una coppia di fotoni che hanno la medesima polarizzazione, sebbene di direzione indefinita. Nella teoria quantistica lo stato di polarizzazione della coppia è
descritto da uno stato entangled; le due configurazioni componenti
sono: una con i due fotoni polarizzati lungo z e l’altra con i fotoni polarizzati lungo una direzione x ortogonale a z (v. Fig. 7.5). Ciascun
fotone della coppia incide su un dispositivo che scatta tra due diverse
configurazioni: in una di esse il fotone colpisce un polarizzatore A(B)
e nell’altra un polarizzatore differente A´(B´). Ognuna di queste coppie di polarizzatori equivale ad un singolo polarizzatore che scatta tra
due differenti direzioni.
Figura 7.4: Intervallo dei valori di in cui non è soddisfatta la disuguaglianza di
Bell.
Teoria quantistica vs. teorie realistiche locali
83
Indichiamo con P(A,B), P(A,B´), P(A´,B) e P(A´,B´) le frequenze
dei segnali di conteggio che arrivano simultaneamente dai polarizzatori indicati in parentesi. Inoltre indichiamo con P(X) la frequenza con
cui un fotone esce dal polarizzatore X, nel caso in cui sia stato eliminato l’latro polarizzatore su cui incide il fotone compagno. Si ottiene,
allora, la disuguaglianza1:
S=
P(A, B) P(A, B ) + P( A, B) + P( A, B )
1
P( A ) + P(B)
7-3
La dimostrazione è la seguente: sia N il numero di coppie di fotoni
emessi dalla sorgente, siano N(A) e N(B) i conteggi dei rivelatori R1 e
R2, e N(A,B) il numero di conteggi simultanei di R1 e R2. Le relative
frequenze sono, quindi, date da: P(A) = N(A)/N, P(B) = N(B)/N,
P(A,B) = N(A,B)/N. Non è possibile conoscere la direzione di polarizzazione di ogni coppia di fotoni; tuttavia, le teorie realistiche locali asseriscono che la polarizzazione è determinate al momento
dell’emissione con precise probabilità. Indicando con p (i ) (A) e p (i ) (B)
le probabilità dell’i–esima coppia, per il principio delle probabilità
composte segue: p (i ) (A, B) = p (i ) (A)p (i ) (B) .
Figura 7.5: Schema dell’esperimento di Aspect come descritto nel testo.
1
J.F. Clauser et al., Phys. Rev. D, 10, 526, 1974.
84
Capitolo VII
D’altra parte, se N è sufficientemente grande, possiamo scrivere
N
N
N
i =1
i =1
i =1
N(A) = p (i ) (A), N(B) = p (i ) (B), N(A, B) = p (i ) (A)p (i ) (B) 7-4
e pertanto le frequenze di conteggio sono date da
P(A) =
1 N (i )
1 N
p (A), P(B) = p (i ) (B),
N i =1
N i =1
1 N (i )
P(A, B) = p (A)p (i ) (B)
N i =1
7-5
Si può mostrare che, scelti quattro numeri xi (i=1,… 4) t.c. 0 xi 1 e avendo definito Z = x1 x2 x1 x4 + x2 x3 + x3 x4 x2 x3 , è soddisfatta la disuguaglianza 1 Z 0 (v. App. D). Posto
x1 = p (i ) (A), x2 = p (i ) (B), x3 = p (i ) ( A ) e x4 = p (i ) ( B ) dalla disuguaglianza segue:
N
[ p
(i )
(A)p (i ) (B) p (i ) (A)p (i ) ( B ) + p (i ) ( A )p (i ) (B)
i =1
7-6
+ p (i ) ( A )p (i ) ( B ) p (i ) ( A ) p (i ) (B)] 0
dalla quale, tenendo conto di (7-5), si ottiene (7-3).
Vogliamo mostrare adesso che cosa prevede la teoria quantistica
per la medesima quantità S. Dal momento che la direzione di polarizzazione è sconosciuta, la probabilità che uno dei due fotoni emerga dal
filtro polarizzatore è pari a . Se il fotone 1 esce dal filtro A (cosicché
risulta avere polarizzazione A), il fotone 2, avente la medesima pola di uscire dal filtro B. La probarizzazione A, avrà probabilità cos 2 AB
bilità che entrambi i fotoni della coppia escano dai rispettivi filtri è,
Teoria quantistica vs. teorie realistiche locali
85
/2 e, inoltre, P(A) = P(B) = . Tali
quindi, data da P(A,B) = cos 2 AB
relazioni valgono, chiaramente, mutatis mutandis, per ogni coppia di
filtri. In un esperimento effettuato nel 1982 da Alain Aspect e collaboratori presso l’Istituto di Ottica Teorica e Applicata dell’Università
d’Orsay di Parigi, furono scelte le quattro polarizzazioni riportate in
Figura 7.5 e per le quali la teoria quantistica fornisce:
1
S = 3cos 2 cos 2 (3 ) ; per = /8 si ottiene S = 1,207 in contra2
sto con la relazione classica (7-3). Per una verifica sperimentale, il valore di 1,207 calcolato deve essere corretto per tenere conto delle imperfezioni dell’apparato strumentale: l’efficienza dei rivelatori, lo
sparpagliamento della direzione fotonica e così via. Il valore corretto
risulta, allora, S = 1,113 ± 0,005; il valore sperimentale ottenuto da
Aspect risultò di 1,101 ± 0,020 il quale, entro gli errori, è in accordo
con il valore fornito dalla teoria quantistica.
L’esperimento di Aspect mostra che la teoria quantistica fornisce
una descrizione corretta della realtà fisica del mondo microscopico.
8 Criptografia
8.1
Considerazioni generali
Gli argomenti precedenti, oltre ad un profondo interesse epistemologico nei riguardi dei fondamenti scientifici del mondo atomico, lasciano intravedere applicazioni tecnologiche rivoluzionarie nel campo
delle moderne comunicazioni. Questo è solo un esempio recente di
come studi di scienza fondamentale, lungi dal rimanere sempre confinati nelle “torri d’avorio” degli specialisti, possono produrre cambiamenti epocali nel modo di vivere delle popolazioni. Per illustrare la
peculiarità del legame tra comunicazione e leggi quantistiche ci riferiremo alla cosiddetta criptografia quantistica la cui attuazione è già oggi in una fase avanzata.
La criptografia è la scienza che studia come può un emittente, usualmente chiamato Alice, inviare un messaggio attraverso un dato
canale in modo che solo un ricevente autorizzato, usualmente chiamato Bob, possa intenderne il significato (v. Fig. 8.1). Il canale può avere
diversa natura: da quella antica consistente in un messo a cavallo che
trasporta il messaggio cifrato da Alice a Bob, ai moderni telefoni, fax,
e–mail e così via.
Figura 8.1: Alice cripta un messaggio abbinandolo a una chiave e lo invia a Bob.
Questi lo decripta con la medesima chiave. Eve è una spiona.
87
88
Capitolo VIII
La cosa essenziale, in ogni caso, è che una terza entità non autorizzata, usualmente chiamata Eve (dall’inglese eavedropper = colui che
origlia), la quale riesce a leggere il messaggio, non sia in grado di decifrarlo e, se anche lo decifra, Alice e Bob lo vengano immediatamente a sapere e ne annullino gli effetti.
Fino a tutto il XIX secolo il messaggio veniva criptato sostituendo
alle lettere e agli spazi tra parole cifre e segni secondo regole note soltanto ad Alice e Bob: nell’affascinante racconto di E.A. Poe Lo scarabeo d’oro il protagonista, Legrand, decifra il messaggio indicatore del
tesoro nascosto determinando la corrispondenza tra cifre e lettere attraverso l’analisi della lingua inglese.
8.2
Il metodo Vernam
La nascita della criptografia moderna risale al 1935, quando Gilbert
Vernam dei laboratori Bell propose un sistema noto come one–time
pad. In questo sistema il messaggio viene trascritto in forma numerica
facendo corrispondere numeri alle lettere, quindi si somma senza riporto a ciascuna cifra del messaggio un’altra cifra fissata a caso, la cui
successione, detta chiave, è nota soltanto ad Alice e Bob. Il criptogramma che si ottiene non è in alcun modo decifrabile se non si conosce la chiave, essendo costituito da una successione di cifre rese casuali dall’aggiunta della chiave, anch’essa casuale, al messaggio da
trasmettere.
Alice
Messaggio
Chiave
Testo criptato
+
10011100011100001
01001110001101101
11010010010001100
Trasmissione
Bob
Testo criptato
Chiave
Messaggio
–
11010010010001100
01001110001101101
10011100011100001
Criptografia
89
Quando Bob riceve il messaggio criptato lo decifra facilmente sottraendo senza riporto alle cifre del criptogramma quelle della chiave.
La tabella precedente illustra il sistema Vernam nel caso usuale di
codifica binaria, in cui tutti i numeri sono scritti con le cifre 0 e 1, per
cui le stesse regole valgono per somma e sottrazione senza riporto:
1+1=0+0=0, 1+0=0+1=1, 1–1=0–0=0, 1–0=0–1=1.
Si dimostra che, se la chiave è e rimane conosciuta solo da Alice e
Bob ed è usata una sola volta, il metodo Vernam consente di costruire
un criptogramma indecifrabile. Tuttavia è difficile assicurare sempre
entrambe le condizioni: l’invio della chiave da Alice a Bob attraverso
un qualche mezzo di comunicazione può presentare lacune che permettono ad Eve di impossessarsi della chiave. Inoltre, analizzando più
criptogrammi diversi criptati con la stessa chiave si può riuscire a ricostruirla, c’è quindi l’esigenza inderogabile di usarla una sola volta,
da cui il nome di one–time pad dato al metodo Vernam. Ritorneremo
su questo metodo in seguito trattando della trasmissione quantistica
della chiave.
8.3
Sistemi a chiave pubblica
Una seconda classe di sistemi per criptare i messaggi è basata su un
accorgimento che permette ad Alice e Bob di ricostruire ciascuno per
conto suo la chiave segreta per criptare e decriptare il messaggio, inviando l’un l’altro, attraverso un canale pubblico, oltre al criptogramma, alcuni dati, la cosiddetta chiave pubblica. In effetti, anche dalla
sola chiave pubblica Eve potrebbe risalire alla chiave segreta, ma al
prezzo di un tempo lunghissimo, cosa che renderebbe la decifrazione
inservibile.
Per il lettore cuiroso nel riquadro seguente è descritto il primo dei
cripto–sistemi a chiave pubblica, proposto nel 1976 da Whitfield Diffie e Martin Hellman della Università di Stanford (USA).
Col progresso tecnologico degli ultimi anni si sono accresciute notevolmente le possibilità di decifrazione dei criptogrammi. Per ovviare
a ciò, sono stati escogitati sistemi a chiave pubblica sempre più sofisticati e adattati al grado di segretezza e al canale di comunicazione.
Un’altra promettente strada, su cui si stanno già effettuando intense
90
Capitolo VIII
ricerche, è appunto quella di utilizzare le proprietà quantistiche delle
particelle atomiche, più precisamente dei fotoni.
Protocollo Diffide-Hellman
Alice e Bob scelgono, d’accordo, un numero primo p e un numero naturale g (non necessariamente primo). Qui, per fare un esempio numerico,
useremo numeri piccoli, diciamo p = 23 e g = 5, in modo da rendere semplici i calcoli. Alice sceglie un numero segreto a, diciamo a = 6, e invia a
Bob, sul canale pubblico, il numero ga mod p – che, ricordiamolo, sta per
il resto della divisione ga : p – (56 mod 23 = 8). Per parte sua, Bob sceglie
un numero segreto b, diciamo b = 15, e invia ad Alice gb mod p (515 mod
23 = 19). Alice valuta (gb mod p)a mod p e Bob (ga mod p)b mod p; mostriamo che i due numeri sono uguali:
(gb mod p)a = [(g g … g)b volte mod p]a. Ma g si può esprimere tramite il
quoziente q e il resto r della divisione g:p, ossia: g = q p+r, per cui: (gb
mod p)a = {[(q p+r) (q p+r) …(q p+r)]b volte mod p}a. Nello sviluppo dei
prodotti in parentesi quadra tutti i termini contengono p a fattore, escluso
il termine rb; pertanto […] mod p, ossia il resto della divisione […]:p, è
proprio rb. In definitiva abbiamo: (gb mod p)a = ( rb)a = rab. Procedendo in
modo identico si trova: (ga mod p)b = ( ra)b = rab, come si voleva dimostrare.
Alice e Bob sono allora pervenuti allo stesso numero rab mod p = (ga
mod p)b mod p = (ga mod p)b mod p che sarà impiegato da Alice come
chiave segreta per criptare il messaggio e da Bob per decifrarlo.
Nell’esempio numerico p = 23, g = 5, a = 6 e b = 15, abbiamo q = 0 e r =
g = 5. Quindi la chiave segreta è (56 mod 23)15 mod 23 = 815 mod 23 = 2.
D’altra parte, Eve conosce solo ciò che è stato trasmesso sul canale
pubblico, ossia p, g, gb mod p e ga mod p e da questi dati deve ricavare gae
gb, ossia dall’equazione ga mod p = r – con r intero noto – occorre ricavare a e una equazione simile va risolta per b. Ma, noto il resto r e il divisore
p il dividendo ga è determinato a meno di un fattore intero. Se ga è un numero grande l’operazione di determinare il fattore giusto può richiedere
moltissimo tempo, tanto da rendere l’operazione inutile.
Tuttavia, data l’enorme potenzialità di calcolo dei moderni computer,
la segretezza non può essere assicurata del tutto, nonostante che oggi molto più che in passato se ne abbia stringente necessità dato soprattutto lo
sviluppo delle comunicazioni via internet.
Criptografia
8.4
91
La criptografia quantistica di Bennet e Brassard
Nell’ambito del metodo Vernam, poniamo che Alice trasmetta a
Bob la chiave segreta utilizzando una trasmissione binaria classica;
per esempio, inviando attraverso una fibra ottica una successione di
impulsi luminosi laser di durata fissata (ordine del picosecondo) con la
convenzione che l’assenza di impulso stia per la cifra binaria 0 e la
presenza d’impulso per la cifra binaria 1 (v. Fig. 8.2). Eve, per parte
sua, può “leggere” la successione di impulsi facendo si che una piccola frazione della luce di questi passi entro una sua fibra connessa opportunamente alla fibra di trasmissione. Se la frazione derivata da Eve
è abbastanza piccola gli impulsi rimangono pressoché imperturbati e
Bob può non accorgersi che la chiave segreta è stata violata. In effetti
ciascun impulso laser contiene un numero di fotoni, che può variare
anche nell’ordine di grandezza a seconda del laser usato, ma in ogni
4
caso di ordine non minore dei 10 , per cui Eve ne può catturarne una
piccola frazione senza perturbare l’impulso in modo significativo. È
su questo punto che fa la differenza la criptografia quantistica.
Per capire come funziona, riferiamoci al metodo proposto nel 1984
da Charles Bennet della IBM e Gilles Brassard dell’Università di
Montreal. A differenza dei metodi classici, i bit di informazione sono
trasportati da fotoni singoli e detti perciò qubits. Alice usa un polarizzatore che può assumere quattro orientazioni; riferendoci ad un asse
verticale, esse sono: 0, 45°, 90° e 135° (v. Fig. 8.3). Si conviene che i
fotoni che attraversano il polarizzatore a 0 e 45° trasportano il qubit 1,
mentre quelli che lo attraversano a 90° e 135° trasportano il qubit 0.
Figura 8.2: Impulsi trasmessi da Alice a Bob.
92
Capitolo VIII
Bob dispone invece di un analizzatore di fotoni (p.e. un cristallo di
calcite) con asse ottico che può assumere l’orientazione verticale, nel
qual caso, a seconda della polarizzazione in uscita, può distinguere tra
polarizzazione verticale e orizzontale, oppure a 45° nel qual caso può
distinguere tra polarizzazione a 45° e quella a 135°.
Alice invia a Bob una successione di fotoni, scegliendo a caso per
ognuno una delle quattro polarizzazioni, e Bob le analizza scegliendo
a caso per ogni fotone in arrivo una delle due orientazioni del cristallo
di calcite. Bob registra per ogni fotone sia l’orientazione
dell’analizzatore sia il qubit corrispondente (0 o 1). Naturalmente, dal
valore del qubit è possibile risalire alla polarizzazione del fotone inviato solo se Bob sceglie un’orientazione parallela o ortogonale alla
polarizzazione del fotone stesso (scelta compatibile). In questo caso,
infatti, il fotone è rivelato dai fotomoltiplicatori 1 (orientazione parallela) o 0 (orientazione ortogonale). In caso contrario, se l’asse
dell’analizzatore forma un angolo di ±45° con la polarizzazione del
fotone (scelta incompatibile), questo è rivelato o da uno o dall’altro
dei fotomoltiplicatori con la stessa probabilità. In Figura 8.3 è riportato un esempio dell’invio di una sequenza di qubit da Alice a Bob.
Figura 8.3: Apparato strumentale per la trasmissione della chiave da Alice a Bob usando qubits, come descritto nel testo.
Criptografia
93
Alla fine Bob annuncia su un canale pubblico la successione delle
orientazioni scelte per il suo analizzatore, ma non i risultati ottenuti.
Per parte sua Alice comunica a Bob in quali casi la sua scelta è compatibile con la polarizzazione del fotone, senza tuttavia comunicare
quest’ultima. Bob allora scarta tutti i risultati di scelta incompatibile; i
rimanenti coincidono quindi con quelli inviati da Alice e vengono assunti da Bob come chiave segreta.
Immaginiamo, ora, che Eve si inserisca nella linea con un sua analizzatore che può orientare, come quello di Bob, a 0° e 45° (v. Fig.
8.4). Poiché il fotone analizzato da Eve è distrutto, ella deve anche
possedere un sistema sorgente-polarizzatore e riprodurre un fotone
con la stessa polarizzazione di quello rivelato e inviarlo a Bob.
Supponiamo che arrivi un fotone con polarizzazione verticale; se
Eve e Bob hanno scelto entrambi l’analizzatore a 0° il fotone esce indisturbato dall’analizzatore di Eve e raggiunge Bob (v. Fig. 8.4a) senza che questi possa accorgersi che è stato analizzato da Eve; ma se
Figura 8.4: Differenti orientazioni dell’analizzatore di qubits di Eve per intercettare
il messaggio da Alice a Bob.
94
Capitolo VIII
Eve sceglie l’orientazione a 45° il fotone uscirà con polarizzazione a
45° o 135° per cui esso può essere rivelato dai fotomoltiplicatori 0 o 1
di Bob con la stessa probabilità (v. Fig. 8.4b).
La stessa conclusione vale se il fotone emesso ha polarizzazione orizzontale. Possiamo vedere ciò se Bob sceglie l’orientazione a 45°
(scelta incompatibile). Se anche Eve fa la stessa scelta il fotone uscente dal suo analizzatore avrà polarizzazione a +45° o a –45° con la stessa probabilità (v. Fig. 8.4c), e sarà rivelato dai fotomoltiplicatori di
Bob 0 o 1 sempre con la stessa probabilità. D’altra parte, se Eve sceglie l’orientazione a 0°, il risultato non cambia (v. Fig. 8.4d). In breve,
se Bob fa una scelta incompatibile, non può accorgersi
dell’interferenza di Eve. Ma le scelte incompatibile vengono escluse,
per cui non influiscono nella formazione della chiave. Riguardo alle
scelte compatibili Bob può accorgersi di Eve nel 25% di esse, ossia 1
su 4. Dopo aver analizzato un numero sufficientemente elevato di fotoni, Bob può accertarsi se la manipolazione è avvenuta o meno.
Un differente modo di trasmissione quantistica che utilizza la fase
dell’onda fotonica anziché la polarizzazione fu realizzato nel 1993 da
Paul Townsend della British Telecom. Il principio è lo stesso ma, ovviamente, i dispositivi sperimentali sono diversi nei due casi. Ora Alice invia i fotoni della sorgente ad un interferometro di MachZehnder (v. App. E) con bracci di lunghezza diversa. Sul braccio più
lungo è posto un rifasatore che aggiunge all’onda fotonica una fase
scelta a caso da Alice tra le quattro seguenti: 0, T/4, T/2, 3T/4, ove T è
il periodo dell’onda fotonica (v. Fig. 8.5).
Figura 8.5: Trasmissione della chiave usando la fase dell’onda fotonica.
Criptografia
95
Una delle uscite dal secondo beamsplitter viene dispersa e l’altra
inviata a Bob, il quale dispone di un interferometro identico a quello
di Alice, a parte il rifasatore, che, a scelta di Bob, può lasciare la fase
invariata (aggiungere 0) o aggiungere una fase di T/4. All’uscita
dell’interferometro di Bob, l’interferenza delle onde fotoniche seguenti sono analizzate: 1) l’onda proveniente dal braccio corto
dell’interferometro di Alice e dal braccio lungo dell’interferometro di
Bob. 2) L’onda proveniente dal braccio lungo dell’interferometro di
Alice e dal braccio corto dell’interferometro di Bob. I due interferometri sono predisposti in modo che, se Bob e Alice scelgono la stessa
fase (0 or T/4), è il rivelatore A che registra il fotone; invece, se Alice
sceglie T/2 o 3T/4 e Bob 0 o T/4, rispettivamente, il fotone è registrato
dal rivelatore B. In breve, se la differenza tra le fasi scelte è 0 o T/2, il
fotone viene registrato da A o B, rispettivamente. In questi due casi, la
scelta di Bob è compatibile con quella di Alice, nel senso che Bob può
stabilire la scelta fatta da Alice: se A registra il fotone, Alice ha fatto
la sua stessa scelta, altrimenti, se è B che registra il fotone la scelta di
alice differisce di T/2 dalla sua.
Un’ultima questione deve essere spiegata. Il funzionamento descritto si basa sull’interferenza dell’onda fotonica proveniente dal lato
corto di Alice e lungo di Bob con quella proveniente dal lato lungo di
Alice e corto di Bob, ma anche i fotoni provenienti da entrambi i lati
lunghi (e corti) dei due interferometri sono rivelati da A e B. Tuttavia
questi ultimi sono ben separati in tempo dagli altri e possono essere
eliminati usando un opportuno filtro temporale.
Precisate le differenze, la procedura di trasmissione della chiave è
identica a quella descritta prima, cioè: Alice invia a Bob una successione di qubit; Bob risponde dicendo ad Alice quale fase ha scelto per
ogni qubit; Alice confronta le scelte di Bob con le proprie e comunica
a Bob per quali qubit le scelte sono compatibili; Bob infine, una volta
scartate le scelte incompatibili, ottiene la chiave dalla successione delle rimanenti.
Appendice A
Richiami di fisica delle onde
A.1 Onde superficiali in un liquido
Gettando un sasso in uno stagno, si creano sulla superficie increspature circolari che hanno origine dal punto in cui il sasso penetra
nell’acqua e si espandono radialmente: sono le cosiddette onde superficiali. Un piccolo sughero galleggiante in un punto della superficie,
mosso dal liquido, effettua oscillazioni pressoché verticali; quindi le
particelle di acqua non si muovono radialmente, ossia nel senso di espansione dell’onda, ma rimangono nell’intorno del punto che occupavano prima del passaggio dell’onda. Perciò, l’onda non trasporta
materia bensì energia, nella fattispecie comunicando un moto oscilatorio alla materia delle regioni in cui si propaga.
Figura A.1: a) Onda vista dall’alto prodotta sulla superficie di un liquido da un cilindretto oscillante parzialmente immerso: le linee più intense indicano i picchi mentre quelle più tenui le valli; b) Istantanea del profilo dell’onda; c) Spostamento radiale del profilo in relazione all’oscillazione verticale delle particelle liquide.
97
98
Appendice A
Le onde della fisica classica consistono sempre di energia che si
propaga sia attraverso un mezzo materiale sia attraverso lo spazio vuoto. Per esempio, la luce e, più in generale, le onde elettromagnetiche
emesse dalle stelle (sorgenti di queste onde) si propagano attraverso
enormi spazi vuoti giungendo fino a noi.
Le onde superficiali nei liquidi consentono di mostrare, mediante
un semplice apparato sperimentale, le principali proprietà delle onde.
Nell’apparato, la sorgente delle onde è un cilindretto parzialmente
immerso nell’acqua, che viene fatto oscillare con una data frequenza (v. Fig. A.1a). Sezionando idealmente l’acqua con un piano verticale
passante per il centro dell’onda, ad un certo istante il profilo della superficie liquida apparirebbe come in Figura A.1b): la distanza tra
due massimi si chiama lunghezza d’onda e l’altezza dei massimi riferita al pelo libero imperturbato, ampiezza.
Si può dimostrare che in un dato punto la densità di energia
dell’onda (energia per unità di volume) è proporzionale al quadrato
dell’ampiezza. Le particelle liquide effettuano infatti un moto oscillatorio, dunque sono mosse da una forza elastica, grosso modo simile a
quella di una molla, per la quale è noto che l’energia di oscillazione è
costante e uguale all’energia potenziale ka2, ove k è una costante
(costante elastica) ed a è, appunto, l’ampiezza dell’oscillazione.
Come si è detto, le particelle di liquido effettuano oscillazioni verticali, che in questo caso seguono il moto del cilindretto ed hanno perciò frequenza . Fissiamo l’immagine dell’onda ad un certo istante
che assumeremo convenzionalmente come t = 0 (v. Fig. A.1c). A questo istante nel punto A abbiamo il massimo livello, il punto B è al pelo libero, C al minimo livello, D è al pelo libero, in E abbiamo di nuovo il massimo livello, e così via. Dopo un tempo pari a un quarto del
periodo di oscillazione T (T = 1/), nei punti dove si aveva il massimo
o il minimo livello siamo al pelo libero, mentre i punti al pelo libero
hanno il massimo (B e F) o il minimo (D) livello. Riassumendo, dopo
un quarto di periodo la configurazione dell’onda è quella indicata in
tratteggio nella Figura A.1c. Come si vede, è la stessa configurazione
che avevamo a t = 0, solo che è spostata in avanti di un tratto pari ad
un quarto di . Poiché tale spostamento avviene in un tempo pari a
Richiami di fisica delle onde
99
T/4, la velocità c corrispondente, detta velocità di fase, è data da c =
(/4)/(T/4) = /T, ovvero: c = .
Fissato un punto, il suo spostamento y dal pelo libero si può esprimere matematicamente con una funzione sinusoidale. Per esempio se
assumiamo come istante iniziale t = 0, uno di quelli in cui il punto
considerato è al pelo libero (y = 0), al tempo t sarà:
y(t) = a sin 2
t
T
A-1
La fase dell’onda in questo punto è l’argomento della funzione trigonometrica, ovvero il prodotto della frazione di periodo di oscillazione per 2 : per esempio, al tempo t = T/n, la fase è 2 /n .
A.2 Interferenza
L’interferenza è il risultato della sovrapposizione di più onde in
una stessa regione spaziale. Riferiamoci ancora alle onde superficiali
in un liquido e consideriamo due di queste onde prodotte da altrettanti
cilindretti oscillanti in due punti A e B (v. Fig. A.2). Se oscillano con
la stessa frequenza e senza interruzioni, essi producono onde coerenti,
ossia tali che, se in un punto hanno entrambe massimo spostamento,
dopo un quarto di periodo lo avranno entrambe nullo, e dopo un altro
quarto di periodo entrambe minimo. Analogamente, se una ha spostamento nullo e l’altra massimo, dopo un quarto di periodo la prima lo
avrà minimo e la seconda nullo e così via.
Due onde coerenti producono una figura d’interferenza che non
muta nel tempo. Nei punti della superficie ove i massimi delle due onde arrivano simultaneamente si ha un’oscillazione di ampiezza doppia
(interferenza costruttiva), mentre i punti ove i massimi di un onda
giungono simultaneamente ai minimi dell’altra stanno in quiete (interferenza distruttiva). In tutti gli altri punti l’oscillazione ha ampiezza
intermedia tra zero e la massima. Quindi, l’energia delle due onde non
è uniformemente ripartita sulla superficie liquida: lungo le linee i cui
punti oscillano con ampiezza doppia la densità d’energia è quattro vol-
100
Appendice A
te quella corrispondente ad una singola onda; lungo le linee i cui punti
stanno in quiete la densità d’energia è nulla.
Facciamo notare che se le onde non sono coerenti, o perché le frequenze sono diverse oppure perché le oscillazioni dei cilindretti sorgente si interrompono spesso e a caso, la distribuzione dei massimi e
dei minimi sulla superficie liquida cambia frequentemente, col risultato che l’ampiezza è in media la stessa in tutti i punti.
Riferendoci alla Figura A.2b, l’asse di AB è una linea
d’interferenza costruttiva, i percorsi delle due onde sono infatti uguali
per ciascuno dei punti dell’asse, per cui esse hanno in questi punti la
stessa fase. Un’altra linea d’interferenza costruttiva è il luogo dei punti M1 tali che la distanza M1A differisce di una lunghezza d’onda da
M1B: BM1–AM1 = . Tale linea è un ramo di iperbole il cui asintoto
forma con l’asse di AB un angolo che si può calcolare nel seguente
modo (posto MM1=R):
Figura A.2: a) Interferenza di due onde superficiali generate da sorgenti oscillanti
all’unisono: in M0, M1, … la differenza di fase delle due onde è nulla (interferenza
costruttiva) inoltre in N1, … la differenza di fase è pari a (interferenza distruttiva);
b) la linea colorata in verde è il luogo dei punti in cui la differenza di fase è pari a
una lunghezza d’onda.
Richiami di fisica delle onde
da BM1=AM1+ e AM̂M1 =
101
– , BM̂M1 = + , segue
2
2
d2
d2
2
+ R + Rd sin = +
+ R 2 – Rd sin R
sin =
A-2
4
4
d
Ovviamente, una linea di interferenza distruttiva, interposta tra le
due linee di interferenza costruttiva precedenti, è il luogo dei punti N1
tali che la distanza N1A differisce di mezza lunghezza d’onda da N1B.
Si tratta di un ramo d’iperbole confocale con la precedente il cui asintoto forma con l’asse di AB un angolo , tale che sin = / 2d .
A.3 Diffrazione
Questo è un altro fenomeno tipico delle onde. Quando un’onda incontra un’apertura lungo il suo cammino, se la dimensione di questa è
grande rispetto a , l’onda, a valle dell’apertura, non invade la zona
d’ombra.
Figura A.3: Diffrazione di un’onda piana da un’apertura. Se quest’ultima è grande
rispetto a la sua ombra è netta, mentre se è comparabile l’onda si sparpaglia a valle
del diaframma propagandosi anche lateralmente.
102
Appendice A
Se però la dimensione d dell’apertura è confrontabile con , l’onda
si sparpaglia a guisa di onda sferica, e ciò tanto più quanto più piccola
è l’apertura (v. Figure A.3a e A.3b). Inoltre, un’onda è in grado di
aggirare un ostacolo. Questi costituiscono, appunto, il fenomeno della
diffrazione. La teoria della diffrazione esula dagli scopi di questi richiami, sarà sufficiente ricordare che essa è basata sul principio di
Huygens-Fresnel, il quale stabilisce che, all’interno dell’apertura, i
punti del fronte d’onda si comportano come sorgenti di onde sferiche
la cui interferenza determina la forma dell’onda uscente dall’apertura.
Dalla teoria segue che l’ampiezza angolare 2a dell’onda è tale che sin /d.
A.4
Digressione sul potere risolutivo
Consideriamo una particella luminosa posta nel fuoco di una lente
convergente (v. Fig. A.4). L’ottica geometrica ci dice che i raggi luminosi emessi dalla particella, dopo che hanno attraversato la lente, si
propagano paralleli tra loro, nella direzione dell’asse ottico. Questa
però è un’approssimazione, perché non tiene conto della natura ondulatoria della luce. Infatti, se è la lunghezza d’onda della luce e D è il
diametro della lente, per il fenomeno della diffrazione, i raggi emergenti dalla lente non formeranno un fascio perfettamente cilindrico ma
leggermente conico, ossia con un piccolo angolo d’apertura dato da:
Figura A.4: Diffrazione della luce emessa da una sorgente puntiforme situata nel fuco di una lente convergente.
Richiami di fisica delle onde
103
2/D (il valore = 0 dell’ottica geometrica si ottiene o per = 0
oppure per D infinitamente grande).
Il fascetto leggermente divergente uscente dalla lente è come se
provenisse, anziché da una particella, da un dischetto luminoso posto
nel piano focale avente un diametro d f , dove f è la distanza focale
(v. Fig. A.4). Consideriamo ora due particelle luminose entrambe nel
piano focale in prossimità dell’asse ottico. Per effetto della diffrazione
le loro immagini è come se provenisssero da due dischetti del diametro suddetto e hanno un diametro pari al prodotto di d per
l’ingrandimento (i punti oggetto vanno pensati non proprio nel piano
focale ma in vicinanza di questo, in modo da ottenere immagini reali).
In base alle leggi dell’ottica si trova che il diametro d delle immagini
è dato da:
d sin 2
A-3
Se l’interdistanza tra i centri delle immagini è minore di d, esse
appariranno come due dischetti sovrapposti e non ben risolte. Per questo motivo il reciproco di d, si chiama potere risolutivo della lente. Il
potere risolutivo è dunque tanto maggiore quanto più piccola è la lunghezza d’onda della luce e quanto più grande è il diametro della lente
in rapporto alla distanza focale. Ovviamente un potere risolutivo più
elevato consente di distinguere in maggior dettaglio la struttura microscopica degli oggetti: quella che ad occhio nudo appare come una superficie molto liscia, vista col microscopio ottico può mostrare rugosità, se queste sono più grandi di qualche decimo di micron, mentre arriviamo a rivelare la trama della disposizione atomica con un microscopio elettronico.
A.5 La luce è un fenomeno ondulatorio
Noi vediamo grazie alle radiazioni luminose emesse dagli oggetti,
le quali, penetrando nei nostri occhi, determinano la percezione visiva
104
Appendice A
fatta di forme e colori: tali radiazioni sono anche dette brevemente luce (dalla sensazione che producono).
Per tutto il settecento convissero due concezioni contrastanti sulla
natura della luce: quella newtoniana, secondo cui la luce consiste di
sciami di minuscole particelle emesse dagli oggetti e quella di Huyghens che considerava la luce consistente di onde di piccola lunghezza d’onda. Entrambe, riuscivano a spiegare i fenomeni dovuti alla riflessione e rifrazione della luce — celebre risulta, ad esempio, la spiegazione di Newton dell’arcobaleno. Tali fenomeni non potevano perciò discriminare tra le due teorie. Fu solo quando nel 1802 Thomas
Young, con un celebre esperimento, riuscì a produrre l’interferenza
della luce che la teoria ondulatoria poté affermarsi. In questo esperimento, una sorgente di luce, di piccole dimensioni, molto intensa e
monocromatica — vale a dire che emette luce di un dato colore — illumina un diaframma opaco con due forellini (v. Fig. A.5).
Per effetto della diffrazione, la luce che emerge da ciascun forellino
diverge in un cono e va a illuminare una zona estesa dello schermo. Le
zone illuminate da ciascun forellino sono parzialmente sovrapposte,
ma nella regione di sovrapposizione non si osserva una luminosità più
intensa che sfuma verso i bordi — come ci aspetteremmo se la luce
avesse natura corpuscolare —, bensì una figura di interferenza costituita da una successione di frange alternativamente luminose e scure.
Figura A.5: Schema dell’esperimento di Young.
Richiami di fisica delle onde
105
La distanza angolare tra la frangia luminosa centrale e la prima
frangia luminosa laterale, in funzione di e della distanza d tra i fori,
come si è visto, è data da:
sin d
A-4
Misurando l’angolo , dalla (A-4) si ottiene la lunghezza d’onda.
La teoria elettromagnetica di Maxwell-Hertz mostra che la luce
consiste di onde elettromagnetiche con lunghezze d’onda comprese in
un intervallo caratteristico e che alla luce di un dato colore corrisponde una data lunghezza d’onda decrescente dal rosso al violetto. Le onde elettromagnetiche oggi conosciute e studiate occupano un intervallo amplissimo di lunghezze d’onda che prende il nome di spettro elettromagnetico (v. Fig. A.6).
A.6 Polarizzazione della luce
Le onde luminose e, in generale, le onde elettromagnetiche, al pari
delle onde sulla superficie dei liquidi, sono onde trasversali, cioè le
oscillazioni sono perpendicolari alla direzione di propagazione. Il piano formato dalla direzione di propagazione e da quella di oscillazione
è detto piano di polarizzazione.
Figura A.6: Spettro elettromagnetico. Le lunghezze d’onda sono espresse in nanometri (= nm = 10-9 m) e le frequenze corrispondenti in Hz (= oscillazioni al secondo). Notiamo che lo spettro visibile ha una larghezza di soli 300 nm, insignificante
rispetto all’intero spettro che è più largo di 1013 nm.
106
Appendice A
La luce naturale usualmente non è polarizzata, nel senso che la direzione di oscillazione cambia da un punto a un altro e, in un dato
punto, cambia bruscamente e in modo caotico.
Quando un fascetto di luce naturale passa attraverso una lastrina
Polaroid™, il fascetto uscente è polarizzato. Polaroid™ è il nome
commerciale del polimero bi-alcol polivinil impregnato di iodio, il
quale, durante la preparazione, viene stirato in modo che le molecole
del polimero si dispongano parallele tra loro (v. Fig. A.7a).
La luce con polarizzazione parallela alle molecole del Polaroid™ è
assorbita mentre quella con polarizzazione perpendicolare passa indisturbata. La direzione ortogonale alle molecole polimeriche è detta asse di polarizzazione.
Supponiamo ora che un fascetto di luce polarizzata incida sul Polaroid™ in modo che la sua direzione di polarizzazione formi l’angolo con l’asse del Polaroid™.
Figura A.7: a) Lastrina Polaroid™: l’asse di polarizzazione è ortogonale alle molecole orientate del polimero; b) se è l’angolo tra il piano di polarizzazione del campo e l’asse del Polaroid™, l’intensità dell’onda uscente è la frazione cos2
dell’intensità incidente; c) un’onda polarizzata ortogonalmente all’asse è completamente assorbita dal Polaroid™, mentre un’onda con polarizzazione parallela lo attraversa integralmente.
Richiami di fisica delle onde
107
Le componenti dell’ampiezza dell’onda parallela e perpendicolare
all’asse di polarizzazione sono date da E cos ed E sin , rispettivamente (v. Fig. A.7b), e i loro quadrati E2 cos2 ed E2 sin2 sono le
corrispondenti intensità. La loro somma, pari a E2, è ovviamente
l’intensità totale. Poiché la frazione sin2 dell’intensità del fascetto
viene assorbita dal Polaroid™, il fascetto uscente ha polarizzazione
diretta come l’asse del Polaroid™ e intensità E2 cos2 (v. Fig. A.7c) .
Figura A.8: a) La luce con polarizzazione ortogonale all’asse ottico del cristallo, incidente normalmente alla faccia del cristallo, si propaga secondo una linea retta
(raggio ordinario); b) la luce con polarizzazione parallela all’asse ottico esce spostata dal cristallo (raggio straordinario); c) se è l’angolo tra la direzione di polarizzazione e l’asse ottico, l’intensità del raggio ordinario è proporzionale a sin2 e quella
del raggio straordinario a cos2 .
108
Appendice A
Nel caso di un fascetto di luce naturale l’angolo cambia rapidamente e in modo caotico, per cui l’intensità del fascetto uscente si otterrà mediando su quella del fascetto con polarizzazione definita,
1
sarà quindi data da E 2 cos 2 = E 2 , ossia solo metà dell’intensità e2
sce dal Polaroid™. Inoltre, il fascetto uscente è polarizzato lungo
l’asse del Polaroid™.
Quando la luce entra in un monocristallo trasparente, si osserva
spesso il fenomeno della doppia rifrazione. Per esempio, un raggio di
luce che incide su un cristallo di calcite (CaCO3) si divide in due raggi
rifratti che si propagano in direzioni diverse. Il cosiddetto raggio ordinario giace nel piano di incidenza (individuato dalla direzione
d’incidenza e dalla normale alla superficie del cristallo) ed obbedisce
alla legge di Snell, la quale stabilisce che il rapporto tra il seno
dell’angolo d’incidenza e quello di rifrazione è costante. L’altro raggio rifratto, detto raggio straordinario, non soddisfa alla legge di Snell,
poiché il rapporto tra i seni degli angoli d’incidenza e rifrazione cambia al cambiare dell’angolo d’incidenza. I cristalli di calcite hanno una
direzione caratteristica, asse ottico, tale che un raggio che incide lungo
tale direzione non si divide, ovvero i raggi ordinario e straordinario
procedeno lungo la stessa direzione.
Consideriamo ora un fascetto di luce che incide perpendicolarmente su una faccia parallela all’asse ottico di un spesso cristallo di calcite
(v. Fig. A.8). In questo caso, dal cristallo escono due raggi ben separati, per cui è possibile determinare la loro polarizzazione mediante un
Polaroid™. Si trova che entrambi i raggi sono polarizzati, con le polarizzazioni tra loro ortogonali: il raggio ordinario ha polarizzazione
perpendicolare all’asse ottico e il raggio straordinario parallela (v.
Figg. A.8a e A.8b).
Se il fascetto polarizzato incide sul cristallo in modo che la sua direzione di polarizzazione formi l’angolo con l’asse ottico, l’intensità
del raggio ordinario sarà la frazione sin2 di quella incidente e quella
del raggio straordinario la frazione cos2 (v. Fig. A.8c).
Appendice B
Momento angolare
B.1 Momento angolare in fisica classica
Il momento angolare è una grandezza fisica realativa al moto dei
corpi; la sua importanza nella descrizione moto sta nel fatto che, in
certe circostanze, peraltro molto generali, essa non cambia nel tempo,
ossia, come si dice, è una grandezza conservativa. Un esempio in cui
si ha conservazione del momento angolare è il moto dei pianeti (v.
Fig. B.1).
La seconda legge di Keplero afferma che nel moto del pianeta lungo l’orbita ellittica intorno al Sole (che occupa uno dei fuochi) il raggio PS che congiunge il pianeta col Sole descrive aree uguali in tempi
uguali. Nella Figura B.1, le due regioni triangolari colorate sono tracciate dal raggio vettore in un tempo t, a partire da punti diversi. Le
loro aree sono date dal semiprodotto dello spostamento fatto dal pianeta nel t, ossia dalla base del triangolo, per l’altezza del triangolo,
data dal segmento r che dal Sole cade perpendicolarmente sulla direzione di moto, e sono uguali. Indicando con v la velocità orbitale del
pianeta, il suo spostamento nel tempo t è pari a v t, e quindi la corrispondente area risulta:
Figura B.1: Moto ellittico di un pianeta intorno al Sole.
109
110
Appendice B
A =
1
1
rvt =
r pt
2
2m
B-1
ove si è tenuto conto che v = p/m dove p è l’impulso e m la massa
del pianeta.
Vediamo dunque che, dovendo essere A costante, nei punti più
lontani dal Sole, ovvero i punti con r più grande, la velocità e quindi
l’impulso sono più piccoli, tali che rp = costante.
Il prodotto rp rappresenta il modulo del momento dell’impulso p
— in quanto prodotto del modulo di p per il relativo braccio r — detto
brevemente momento angolare. Definito come vettore, il momento
angolare ha direzione perpendicolare al piano dell’orbita con verso tale che, guardando a ritroso lungo essa il pianeta appare muoversi in
senso antiorario.
La seconda legge di Keplero si può perciò enunciare così: il vettore
momento angolare di un pianeta nel suo moto orbitale è costante.
La Terra e gli altri pianeti del sistema solare possono essere considerati puntiformi nel loro moto orbitale, poiché le loro dimensioni sono enormemente più piccole delle rispettive distanze dal Sole. La Terra possiede però anche un moto di rotazione attorno al suo asse (che
passa per il centro di massa).
Figura B.2: Momento angolare orbitale e spin di un pianeta in moto attorno al Sole.
Momento angolare
111
Ogni particella del nostro pianeta possiede quindi un impulso di rotazione p = m r, dove m è la massa della particella, la velocità angolare della Terra (1 giro al giorno, ovvero 2/(24 3600) = 7.3 10–5
rad/s) e infine r è la distanza dall’asse di rotazione. Il momento angolare della particella rispetto al centro della sua orbita circolare ha
quindi il modulo m r2 e direzione coincidente con l’asse terrestre. La
somma dei momenti angolari di tutte le particelle di un pianeta è il cosiddetto momento angolare intrinseco di quel pianeta o brevemente lo
spin (v. Fig. B.2).
B.2 Momento angolare in fisica quantistica
Naturalmente, nella fisica classica il momento angolare è una grandezza continua, per cui, ad esempio, un oggetto orbitante, sia esso un
pianeta o un satellite o un granello di polvere cosmica, può avere un
momento angolare di qualsiasi valore.
Diverso è il caso delle particelle atomiche. Consideriamone una
che effettua un moto circolare uniforme con impulso p. Si tratta di un
moto periodico, tale cioè che si ripete identico ad ogni giro, e lo stesso
deve valere per la corrispondente onda di De Broglie. Perché questa
condizione sia soddisfatta occorre che la lunghezza d’onda stia un
numero intero di volte nella circonferenza. Nella Figura B.3 sono mostrati, ad esempio, due casi: nel primo la circonferenza è esattamente
pari a 5 lunghezze d’onda, e qui l’onda arriva alla fine del giro con la
stessa identica fase che aveva all’inizio. Nel secondo caso la circonfe-
Figura B.3: Onda di De Broglie su un’orbita circolare. La condizione necessaria a
ottenere un’onda che si ripete identicamente ad ogni giro è che la circonferenza sia
un multiplo intero della lunghezza d’onda.
112
Appendice B
renza è invece pari a 4 onde intere più 6/10 di onda, per cui la fase alla
fine del giro è diversa che all’inizio.
In conseguenza della periodicità del moto deve quindi essere: 2r =
n dove n è un numero intero. Poiché si ha = h/p, sostituendo nella
precedente otteniamo:
pr = n
h
= n
2
B-2
Questa relazione ci dice che il modulo del momento angolare orbitale (primo membro), non può avere un qualsiasi valore, ma deve essere un multiplo intero della costante di Planck divisa per 2, ossia di
(unità di momento angolare), e non può quindi variare meno di un
quanto .
Appendice C
Filtro e analizzatore di spin
Disponendo due magneti di Stern-Gerlach in modo che diano campi opposti (v. Fig. C.1a), si ottengono in uscita due fascetti paralleli,
uno costituito di atomi con spin su e l’altro con spin giù. Un tale dispositivo, che può essere usato per misurare componenti di spin (analizzatore di spin) è l’equivalente del cristallo di calcite usato nelle misure di polarizzazione dei fotoni. Inoltre, disponendo tre magneti come illustrato in Figura C.1b, dove i due magneti laterali hanno lunghezza metà e campi opposti di quello centrale, possiamo ottenere in
uscita un fascetto avente la direzione di quello in ingresso ma contenente atomi con una determinata orientazione dello spin. Per questo è
sufficiente porre entro l’apparato un piccolo schermo che intercetta gli
atomi con polarizzazione opposta. Questo dispositivo, detto filtro di
spin, è l’equivalente del filtro Polaroid™ per la polarizzazione dei fotoni.
Supponiamo ora che un atomo con componente di spin + in una
data direzione, diciamo la direzione z, penetri in un analizzatore – o in
un filtro – di spin il cui asse z´ forma l’angolo con z (v. Fig. C.2).
Figura C.1: a) Dispositivo per la separazione di fascetti di atomi con diverse componenti di spin; b) tre magneti di Stern-Gerlach, disposti in modo da ottenere un fascio
di atomi con componente di spin definita e con la stessa direzione del fascio incidente.
113
114
Appendice C
Se lo spin fosse un vettore classico, avrebbe componenti 1 2 cos lungo z´ e 1 2 sin perpendicolarmente a z´. Tuttavia, dal punto di vista
della teoria quantistica lo spin dell’atomo ha componente definita ±
solo lungo z´, poiché l’analizzatore può misurare solo una componente
dello spin, quella lungo il proprio asse. Le probabilità p± che il singolo
atomo esca dal canale + o dal canale -, rispettivamente, possono essere
determinate dalla condizione che, se un fascetto formato da un gran
numero di atomi penetra nell’analizzatore, il valore medio delle componenti di spin degli atomi uscenti dal canale +, cioè: p+– p–, deve essere uguale al valore classico cos . Da p+ – p– = cos, e
dall’ovvia condizione p+ + p– = 1, otteniamo
p+ =
1 + cos 1 cos = cos 2 , p =
= sin 2
2
2
2
2
C-1
Figura C.2: L’analizzatore di spin misura le componenti di spin secondo la direzione
del campo interno (freccetta rossa). Nel caso di spin , se la misura dà per la componente risultato +, l’atomo esce dal canale (+), altrimenti, se dà risultato –, esce l canale (-). Il filtro di spin blocca invece gli atomi aventi una determinata componente.
Determinismo e caos
115
Segue che, se la componente dello spin della particella incidente è
ortogonale alla direzione del filtro, il 50% delle particelle incidenti uscirà dal filtro. Inoltre se la componente è opposta alla direzione del
filtro, da quest’ultimo non uscirà alcuna particella.
Appendice D
Disuguaglianza di Clauser–Horne
Consideriamo quattro numeri x1, x2, x3, x4, tali che 0 xi 1
(i=1,…4). Mostreremo che Z = x1 x2 – x1 x4+ x2 x3+ x3 x4 – x2 – x3
soddisfa la disuguaglianza : –1 Z 0.
Partendo dal limite superiore, consideramo il caso x1 > x3 e il suo
opposto, x1< x3. Nel primo caso scriviamo Z nella forma:
Z = (x1 1)x2 + (x2 1)x3 + (x3 x1 )x4
D-1
essendo i tre termini del secondo membro negativi, l’asserto è dimostrato. Nel secondo caso, scriviamo:
Z = x1 x2 x1 x4 + x2 x3 + x3 x4 x2 x3
x1 x2 x3 x4 + x2 x3 + x3 x4 x2 x1
= x1 x2 + x2 x3 x2 x1 = x1 (x2 1) + x2 (x3 1) 0
D-2
da cui segue che la disuguaglianza rispetto al limite superiore è dimostrata.
Considerando il limite inferiore, mostreremo che Z+1 0. Si vede
facilmente che
Z + 1 = x1 x2 x1 x4 + x2 x3 + x3 x4 x2 x3 + 1
= (1 x2 )(1 x3 ) + x1 x2 x1 x4 + x3 x4
= (1 x2 )(1 x3 ) + x1 (x2 x4 ) + x3 x4
= (1 x2 )(1 x3 ) + x1 x2 + x4 (x3 x1 )
D-3
Dalle due ultime espressioni segue Z+1 0 se x2 > x4 e Z+1 0 se
x3> x1. Rimane quindi da dimostrare che Z+1 0 se x2< x4 e x3< x1.
117
118
Appendice D
Aggiungendo e sottraendo x2x3 al penultimo membro della precedente,
possiamo riscriverlo nella forma:
Z + 1 = (1 x2 )(1 x3 ) + x1 (x2 x4 ) + x3 x4 x2 x3 + x2 x3
= (1 x2 )(1 x3 ) (x4 x2 )(x1 x3 ) + x2 x3
D-4
da cui vediamo che, poiché 1– x2 > x4 – x2 e 1– x3 > x1 – x3, i primi
due termini danno un contributo positivo e la doppia disuguaglianza è
dimostrata.
Appendice E
Interferometro di Mach–Zender
L’interferometro di Mach–Zehnder usato nell’esperimento di
Townsend è mostrato in Figura E.1. L’onda fotonica e divisa in due
parti da un divisore di fascio. La parte trasmessa è a sua volta divisa in
due da un secondo divisore di fascio; la parte trasmessa incide in successione su due specchi ciascuno dei quali la riflette ad angolo retto
per poi incidere anch’essa sul secondo divisore di fascio. Alle uscite,
due fotomoltoplicatori, A e B, misurano le frequenze di conteggio dei
fotoni in accordo all’interferenza della coppia di onde che arriva su ciascuno di essi.
Per determinare la differenza di fase delle due onde di ciascuna
coppia, occorre tener conto delle regole seguenti.
• Nelle riflessioni, quando l’onda rimane nel mezzo con indice
di rifrazione più alto, la fase dell’onda non cambia, mentre si
ha un incremento di fase di se l’onda rimane nel mezzo con
indice di rifrazione più basso.
• Le due onde attraversano lungo i loro cammini lo stesso spessore di vetro, per cui il corrispondente spostamento di fase è lo
stesso per entrambe e non influisce sull’interferenza.
Figura E.1: Schema dell’interferometro di Mach–Zender
119
120
Appendice E
In base a queste regole, abbiamo: nel cammino più lungo, l’onda
acquista una fase di (ovvero mezza lunghezza d’onda) in ciascuna
delle tre riflessioni; la quarta riflessione lascia la fase invariata, per cui
l’onda raggiunge A e B con un surplus di fase dovuto alle riflessioni
di 3 (una lunghezza d’onda e mezzo). Nel cammino più corto, l’onda
è riflessa verso A dal secondo divisore di fascio acquisendo in questa
riflessione uno spostamento di fase di (mezza lunghezza d’onda). In
breve, le due onde giungono in A con una differenza di fase dovuta
alle riflessioni pari a 2 (quindi in fase), mentre tale differenza di fase
è in B di 3 (quindi in opposizione di fase).
Bibliografia
Capitolo I
a)
b)
c)
d)
e)
Arnold V.I., Catastrophe Theory, Springer-Verlag, Berlino1986.
Ruelle D., Caso e caos, Bollati Boringhieri, Torino1995.
Horgan J., La fine della scienza, Cap.8, Adelphi, Milano 1998.
Stewart I., Dio gioca ai dadi?, Bollati Boringhieri, Torino 1993.
Buchanan M., Ubiquità, Mondadori, Milano 2001.
Capitolo III
a) Feynman R., La legge fisica, Boringhieri, Torino 1972.
Capitolo IV
a)
Heisenberg W., I principi fisici della teoria dei quanti, Einaudi,
Torino 1953.
b) Siringo F.G. e Angiella G.G.N., Concetti fisici e applicazioni della meccanica quantistica, Aracne, Roma 2005.
Capitolo VI
a) Scully M.O., Englert B.-G., and Walther H., Quantum Optical
Tests of Complementarity, Nature, 9 May 1991.
b) Englert B.-G., Scully M.O., and Walther H., The Duality of Matter
and Light, Scientific American, December 1994.
c) Horgan J., Quantum Philosophy, Scientific American, July 1992.
d) Dürr S., Nonn T., and Rempe G., Origin of quantum-mechanical
complementarity probed by a ‘which-way’ experiment in an atom
interferometer , Nature, 3 September 1998.
e) Zeilinger A., Il velo di Einstein. Il nuovo mondo della fisica quantistica, Einaudi, Torino 2005.
f) Styer D.F., Lo strano mondo della meccanica quantistica, Aracne,
Roma 2005
121
122
Bibliografia
Capitolo VII
a) Albert D., Meccanica quantistica e senso comune, Adelphi, Milano 2000.
b) Celebrazione 70° Compleanno Giancarlo Ghirardi, Special issue
The Quantum Universe, JPA, vol. 40 n. 12, 23 March 2007.
http://www.iop.org/EJ/toc/1751-8121/40/12
Capitolo VIII
a) Mollin R.A., An introduction to Cryptography, Chapman &
Hall/CRC Press Inc., Boca Raton USA 2000.
AREE SCIENTIFICO–DISCIPLINARI
Area 01 – Scienze matematiche e informatiche
Area 02 – Scienze fisiche
Area 03 – Scienze chimiche
Area 04 – Scienze della terra
Area 05 – Scienze biologiche
Area 06 – Scienze mediche
Area 07 – Scienze agrarie e veterinarie
Area 08 – Ingegneria civile e Architettura
Area 09 – Ingegneria industriale e dell’informazione
Area 10 – Scienze dell’antichità, filologico–letterarie e storico–artistiche
Area 11 – Scienze storiche, filosofiche, pedagogiche e psicologiche
Area 12 – Scienze giuridiche
Area 13 – Scienze economiche e statistiche
Area 14 – Scienze politiche e sociali
Le pubblicazioni di Aracne editrice sono su
www.aracneeditrice.it
Finito di stampare nel mese di agosto del 
dalla «ERMES. Servizi Editoriali Integrati S.r.l.»
 Ariccia (RM) – via Quarto Negroni, 
per conto della «Aracne editrice S.r.l.» di Roma
Scarica