Diapositiva 1 - Dipartimento di Filosofia Comunicazione e Spettacolo

Dispense per il corso di Filosofia della
Fisica (parte III)
Le conseguenze filosofiche della meccanica
quantistica
Mauro Dorato, Dipartimento di Filosofia,
Università di Roma3
NB
•Le note che seguono sono per uso strettamente didattico
e non sono state ancora controllate in modo accurato. Si
prega quindi di non far circolare il materiale che segue e
di non usarlo per citazioni.
•Aggiornate al 04/06/2017
Struttura della 3 parte
1 L’esperimento della doppia fenditura e il
principio
di
indeterminazione
di
Heisenberg
2 Le posizioni filosofiche dei padri fondatori
3 Il dibattito Einstein-Bohr
4 La non-località come risultato
sperimentale dell’argomento EPR
5 Il problema della misura e le varie
interpretazioni della meccanica quantistica
Capitolo 1
L’esperimento della doppia
fenditura e il principio di
indeterminazione di Heisenberg
L’esperimento della doppia
fenditura
• Perché il “+” della sovrapposizione deve
essere interpretato come un “vel” e non come
un “aut”
• Il
dualismo
onda-corpuscolo
secondo
l’interpretazione
standard:
la
natura
potenziale
degli
stati
quantici
e
l’indeterminazione di Heisenberg
• La possibilità che onda e corpuscolo siano
elementi con-presenti: i “flashes” di Ghirardi
“Things on a very small scale behave neither like
particles nor like waves…all of direct, human
experience and intuition applies to large object.
We know how large objects will act, but things
on a small scale just do not act that way. We
choose to examine a phenomenon which is
impossible, absolutely impossible, to explain in
classical terms and which has in it the heart of
quantum mechanics. In reality, it contains the
only mystery”
(Feynman, Lectures in physics, vol.3, p. 1)
Dobbiamo comparare tre esperimenti, uno con proiettili, uno con
onde d’acqua e uno con elettroni. Cominciamo con i proiettili (1)
x
rivelatore
P12=P1+P2
x
2
P(x)
1
schermo
Con questo apparato si può rispondere sperimentalmente alla domanda: “con quale
probabilità P un proiettile che passa in uno dei due fori arriva in un punto dello schermo
a distanza x dal centro?”Questa probabilità, che dipende dal numero di proiettili che
colpiscono il punto x, è una funzione di x, P(x). Perché P12 -che è la probabilità che
dipende dal fatto che i proiettili possono essere passati attraverso 1 o 2- è massima per x
=0? Perché lì la somma di P1 (foro 2 chiuso) e P2 (foro 1 chiuso) è massima. In P1 (P2 ) il
massimo è allineato con il primo (secondo) foro rispettivamente.
2) esperimento: onde d’acqua
assorbitore
x
I12=|h1+ h2|2
I2 =|h2|2
2
1
P(x)
I1=|h1|2
L’onda originale generata dalla sorgente è diffratta ai due fori, che originano
un’altra serie di onde circolari che interferiscono. L’intensità del fenomeno
risultante I12 non è la somma delle intensità ricavabili dalla chiusura di uno dei due
fori Ii =|hi|2 (h altezza dell’onda). Nei punti in cui ci sono massimi in I12 le singole
onde interferiscono costruttivamente, nei punti di minima interferiscono
distruttivamente: I12= |h1|2 + |h2|2 +2 |h1 | |h2| cosd, con d differenza di fase tra I1 e I2
3) Esperimento con elettroni
x
P12=|f1+ f2|2
Cannone di
P2 =|f2|2
elettroni
2
1
P(x)
P1=|f1|2
1)Se mettiamo due rivelatori dopo lo schermo con le fenditure, solo uno dei due scatta e mai
entrambi contemporaneamente. 2) se abbassiamo la frequenza di emissione, il click non è
meno forte, ma solo meno frequente: ogni elettroni arriva in un pacchetto e viene assorbito
tutto e mai “a metà”. Sembrerebbe un comportamento da particella. E invece 3)la probabilità
che gli elettroni arrivino a una certa distanza x dal centro, che è proporzionale al numero di
arrivi in quel punto, è data dalla figura che avevamo trovato per le onde marine!
Ne concludiamo che quando entrambe le fenditure sono aperte,gli
elettroni si comportano come onde
Il punto è però che quando vengono assorbiti, si localizzano in
un punto piccolo dello schermo, come se fossero proiettili in
miniatura (arrivano in un pacchetto discreto). Sembrerebbe dunque
che passino o in una o nell’altra delle due fenditure.
Ma se fosse così, la curva complessiva dovrebbe essere ottenuta
sommando le due curve P1 e P2 che si ottengono chiudendo prima
una e poi l’altra delle due fenditure, ovvero contando gli elettroni
che passano in una, e quelli che passano nell’altra, come nel caso
dei proiettili (particelle)
Invece il risultato che si ottiene lasciando le due fenditure aperte
non è ciò che si ottiene sommando i risultati relativi ai due casi in
cui una delle due fenditure è chiusa: c’è interferenza: P12  P1  P2
Ci sono punti dello schermo nei quali arrivano meno elettroni
quando sono aperte entrambe le fenditure che quando ne è aperta solo
una: è come se chiudere una delle due fenditure aumenta il numero di
elettroni che passa per l’altra. D’altra parte, al centro del sistema la
probabilità quando sono aperte entrambe le fenditure è assai più che la
somma delle probabilità ottenibili tenendone una delle due chiusa. E
allora sembra che chiudendone una delle due diminuisce il numero di
elettroni che passa per l’altra. Entrambi gli effetti non possono essere
spiegati supponendo che un elettroni entri in 1 e poi anche in 2 girando
attorno allo schermo.
Dunque è falso affermare che l’elettrone passi o nell’una o nell’altra
delle due fenditure: lo stato di sovrapposizione non può essere
interpretato come un “o” esclusivo.
“Gli elettroni arrivano in pacchetti, come particelle, e la probabilità
di arrivo di questi pacchetti è distribuita come l’intensità di un’onda. È
in questo senso che un elettrone ‘si comporta talvolta come una
particella e talvolta come un’onda” (Feynman, vol 3 p. 6).
Si può azzardare l’ipotesi che è questa proprietà dei sistemi
quantistici che spinse Bohr a formulare il principio che i contrari
sono complementari (contraria sunt complementa): osservabili
mutuamente incompatibili nella misura (mutually exclusive in
measurement) sono tuttavia entrambi presenti, ma solo in potenza, in
un certo stato, e sono quindi entrambi necessari per la descrizione
del sistema (jointly exhaustive for the description of the system). I
microsistemi quindi non sono né onde né particelle
Ecco anche l’origine della lettura disposizionalistica di
Heisenberg:«Such a probability function [i.e. the statistical algorithm
of quantum theory] combines objective and subjective elements. It
contains statements on possibilities, or better tendencies (“potentiae
in Aristotelian philosophy), and such statement are completely
objective, as they don’t depend on any observer…the passage from
the “possible” to the real takes place during the act of observation»
(Heisenberg 1958, Physics and Philosophy, p. 67-69)
Contro Feynman, si deve però notare che nello stesso esperimento
l’elettrone sembra comportarsi come un’onda e come una particella,
in stadi diversi dell’evoluzione del sistema stesso.
Ovvero, quando entrambe le fenditure sono aperte, un elettrone
passa per entrambe, ed è quindi simile a un’onda d’acqua o a un
campo esteso, ma quando colpisce lo schermo si comporta come una
particella, e si localizza in suo punto preciso dello schermo
collassando in un autostato della posizione.
Tale versione dell’esperimento che qui suggerisco (“onda e
particella”) richiede però il passaggio dallo stato di sovrapposizione
che descrive il microsistema quando passa in entrambe le fenditure
aperte in uno solo dei due stati sovrapposti, che caratterizza una
particella localizzata.
In effetti, se provassimo a localizzare l’elettrone illuminandolo
dietro una delle due fenditure, sapremmo per quale delle due
fenditure è passato, eliminando però l’interferenza tipica delle onde
x
rivelatore
x
P’12=P’1+P’2
P’2
2
P(x)
P’1
1
schermo
Se osserviamo per quale fenditura è passato l’elettrone, anche quando
le fenditure sono tutte e due aperte, l’elettrone si comporta in modo
“particellare”: l’interferenza e dunque il suo carattere ondulatorio è
svanito o distrutto. La distribuzione degli elettroni nei due casi,
conclude Feynman, è diversa a seconda se guardiamo, e invece di
andare in un punto di massimo di P12 l’elettrone andrà in uno di
minimo
Poiché il momento di un fotone p=h/l, usando luce con
lunghezza d’onda maggiore diminuiremo l’impatto con l’elettrone
perché diminuiremmo p. Quindi disturberemo meno la traiettoria
dell’elettrone (il suo momento) Ma a un certo punto, diminuendo p,
non riusciremmo più a sapere per quale delle due fenditure è
passato l’elettrone (posizione), e ciò avverrà quando la lunghezza
d’onda della radiazione sarà dell’ordine della distanza tra le due
fenditure. E allora ritroveremo il pattern ondulatorio
dell’interferenza!
“È impossibile disegnare un apparato che determini per quale
fenditura sia passato l’elettrone senza al tempo stesso distruggere il
pattern dell’interferenza” PRINCIPIO DI INDETERMINAZIONE
(Feynman, p. 9). In questa forma, si vede che l’elettrone è dotato di
entrambe le nature (particellare e ondulatoria) in potenza, ma il tipo
di natura evidenziato dagli esperimenti in atto è sempre uno dei due
(particellare o ondulatorio) e mai entrambi.
Si può invece avanzare l’ipotesi di prima, ovvero che
un insieme di elettroni identicamente preparati di fatto
mostri sia il comportamento ondulatorio (interferenza)
sia quello particellare, evidenziato dalla localizzazione
discreta su un punto dello schermo.
Ma lo stato di sovrapposizione delle posizioni
nell’esperimento delle due fenditure non può interpretarsi
mai come un “aut”, ma solo come un “vel”.
Avanziamo l’ipotesi che gli elettroni (pace le
interpretazioni come quella di Bohm) in realtà passino in
entrambe le fenditure, anche se il loro diametro
“classicamente inteso” è assai più piccolo della distanza
tra le fenditure: ovvero non sono particelle, se non
quando le vado a misurare! Processo di localizzazione
Abbiamo sovrapposizione di posizioni distinte sia nel caso dell’esperimento di
Stern-Gerlach che nel caso di quello delle due fenditure. In entrambi i casi, lo
stato del sistema è una sovrapposizione lineare di due stati che corrispondono,
nella base delle coordinate spaziali, a funzioni d’onda che sono diverse da zero in
due precise e limitate regioni dello spazio, regioni che sono disgiunte.
Se uno schermo con due fenditure non registra l’arrivo di una particella, lo stato
del sistema a misura avvenuta è una funzione di x che è diversa da zero solo nelle
regioni corrispondenti alle due fenditure. Se l’apertura delle fenditure è d e c è la
funzione caratteristica che vale 1 se la particella è passata nella fenditura i e 0 se è
passata nell’altra. allora la funzione d’onda che descrive il passaggio nelle
fenditure è incompatibile con l’idea che la particella sia passata nell’una o
nell’altra delle due
1
1
1  c1 ( x)  1  c 2 ( x) 
dopo 
c1 ( x) 
c 2 ( x) 




2d
2d
2 d 
2 d 
I due singoli stati normalizzati corrispondono alla situazione in cui possiamo dire
che con certezza la particella è passata in una delle due fenditure. Come si vedrà
però, tale conoscenza distrugge il fenomeno della sovrapposizione e quindi
l’aspetto ondulatorio del fenomeno (l’interferenza). Illustrazione del dualismo
onda-corpuscolo. La sovrapposizione dei due stati di posizione non è una miscela
Heisenberg non derivò le sue relazioni nel modo visto ma propose
argomenti più qualitativi.(Ghirardi,1997, pp 413-4)
x
z
diffrazione
Immagine geometrica del
foro di ampiezza Dx: non
conosciamo la posizione della
particella lungo x ma la
componente verticale del
momento px è perfettamente
definita, perché è nulla
Se restringiamo l’ampiezza della fenditura fino a
renderla paragonabile a quella della lunghezza
d’onda l=h/p associata all’elettrone, allora
abbiamo un’indeterminazione piccola della
posizione x dell’elettrone, ma il suo momento px è
non nullo a causa della diffrazione (immagine
allargata del foro), in modo che il prodotto
DxDpx> h/4p
Spin e indeterminazione
σ x  x  1 x ;σ x x  1 x ;σ z  z  1 z ;σ z z  1 z
(Ghirardi p. 407)
x 
1 1
1 1
 1 ;    0 
;


;


  x
  z  0 z 1
 
 
2 1
2   1
sz=-1
sx=+1

z
x
sz= +1
x
Le proiezioni di  lungo gli assi degli autovettori danno, attraverso
il quadrato dei loro moduli, la probabilità di ottenere i vari esiti per
l’osservabile spin. Nella figura, tutte le proiezioni sono non nulle
sx=-1
Per rendere “quasi determinato” il valore di sz si deve partire da uno stato quasi
parallelo ai due autovettori di sz (un suo autostato), ma in questo caso le due
componenti di sx tendono a (2)1/2/2 e si ha dunque una massima indeterminazione per
l’osservabile sx (e viceversa). Il valor medio tra i due soli esiti (1 e –1) è 0, < sx > =
0, mentre lo scarto quadratico medio vale, secondo la formula già vista, proprio 1, che
è il massimo Dsx [1/2(1-0)2+1/2(-1-0)2]1/2 = 1
sz= -1
y
sx=+1
sz= +1
sx=-1
Le relazioni di indeterminazione di Heisenberg derivate
formalmente
Ricordiamo che lo scarto quadratico medio di A è
DA  [A-  A ]
Il prodotto dello scarto o indeterminazione delle due quantità A e B per un
insieme statistico associato a uno stato puro  sarà allora
DA  DB  [A-  A ]  [B-  B ]  dis.Schwarz
 [A-  A ] [B-  B ] 
Questo passaggio dipende dal fatto che il modulo
di un numero complesso è maggiore del modulo
della parte immaginaria
1
[A-  A ] [B-  B ]  [B-  B ] [A-  A ]
2
z  x  iy  zz*  x 2  y 2  y 2  z  y 2  y  Im z 
2
2
1
z  z*
2
Poiché gli operatori A-<A> e B-<B> sono entrambi simmetrici, si possono
portare a destra del prodotto scalare
1
DA  DB   [A-  A ][B-  B ]   [B-  B ][A-  A ] 
2
Indicando con le parentesi graffe il commutatore tra A-<A> e B->B> si
ha
1
1
 A-  A , B-  B   DA  DB   A, B
2
2
Poiché <A> e <B> sono numeri, essi commutano con qualunque
operatore, ciò che spiega perché l’espressione a sinistra nella
formula qui sopra si riduce a quella a destra. Per es., poiché il
commutatore tra posizione e quantità di moto vale ih/2p, si ha



Dx  Dp x  ; Dy  Dp y  ; Dz  Dp z 
2
2
2

DE  D t 
2
In relatività lo spazio x è
legato al tempo t come
l’impulso
p
è
legato
all’energia E
L’indeterminazione tempo-energia implica la conservazione
dell’energia. Se lo stato del sistema coincide al tempo t=0 con un
autofunzione propria dell’energia, ovvero se (0)= fj ove H|fj>= Ej
|fj> allora il sistema evolve in questo modo:
(t )  f j e
i
 E jt

in cui l’esponenziale è l’operatore unitario (al posto
dell’hamiltoniana H abbiamo messo il suo valore Ej). Ciò implica
che la probabilità di trovare l’esito Ej in una misura dell’energia è 1.
Ma se l’energia è perfettamente definita, allora il tempo è
indeterminato, cioè l’energia si mantiene uguale a se stessa assai a
lungo.
Capitolo 2
Le posizioni filosofiche dei
padri fondatori (1924-1926)
• L’atomo di Bohr, De Broglie e l’ipotesi
ondulatoria della materia (1924)
• Heisenberg e la meccanica matriciale
(1925)
• Schroedinger e la meccanica
ondulatoria (1926)
• Born e le due leggi dinamiche di
evoluzione (1926)
• Von Neumann e il teorema
sull’impossibilità del determismo (1932)
Lamine d’oro e particelle alfa
• Bombardando le prime con le seconde, Geiger e
Marsden scoprirono che mentre la maggior parte
delle particella alfa (due protoni) subiva deviazioni
minime dalla traiettoria iniziale, altre venivano
deviate in misura considerevole, se non addirittura
respinte dalla lamina. Nell'interpretare questo
esperimento, Rutherford nel 1911 ipotizzò che
l'atomo fosse composto da un centro massivo (il
nucleo) circondato da cariche negative: il modello
compatto “a plum cake” di Thomson, con cariche
positive e negative uniformemente sparse,
nell’atomo venne abbandonato.
L’atomo di Bohr (1913)
Un elettrone di carica e che si muove di velocità v attorno al
nucleo costituito da Z protoni classicamente può stare a
qualunque distanza dal nucleo.Basta che la forza centrifuga mv2/r
sia esattamente compensata dalla forza elettrostatica Ze2/r2 (forza
coulombiana esercitata dai Z protoni). Ne risulta che v2=
(Ze2/mr). La condizione di Bohr è che non tutte le orbite
classiche siano ammesse, ma solo quelle per cui il momento
angolare L= mrv sia multiplo intero di h/2p
L= mrv= nh/2p
n=1,2,3... mr(Ze2/mr)1/2 = nh/2p
I raggi ammissibili risultano allora
n 2 2
rn  2
e mZ
1 Ze 2
1 Z 2 me4
En  

2 rn
2 n 2 2
Etotale= Ecin+Epotenz=1/2mv2- Ze2/r
n=1,2,3...
La posizione di De Broglie
Il dualismo onda-corpuscolo di De Broglie
“Nella sua tesi, presentata all’università di Parigi nel 1924, de Broglie era partito
da un’idea che Einstein aveva suggerito — senza mai però svilupparla appieno e
pervenire ad un lavoro pubblicato — su come andasse intesa l’associazione tra fotoni
e onde elettromagnetiche. In base a questa idea, i campi elettrici e magnetici di
un’onda elettromagnetica svolgono il ruolo di “campi fantasma” che in qualche modo
“guidano” il moto dei fotoni nello spazio. De Broglie congetturò che dovessero esistere
campi analoghi che guidano il moto delle particelle nello spazio: una particella di
massa m e velocità v, e di conseguenza con impulso p = mv, è guidata da un’onda
che (per piccole velocità rispetto alla luce) ha una lunghezza d’onda data dalla formula
l =h/p.
(citato da Allori, Dorato, Laudisa, N. Zanghì, Metafisica Empirica, in corso di
pubblicazione, Carocci,)
«Questa ipotesi fornì una prima spiegazione non ad hoc della regola
di quantizzazione di Bohr: se quest’onda esiste, quando l’elettrone in
un atomo di idrogeno si muove lungo un’orbita circolare stabile di
raggio r, l’ onda deve essere stazionaria (le proprietà dell’atomo non
mutano nel tempo se l’atomo non è radioattivo) e devono quindi
essere soddisfatte le stesse condizioni in base a cui una corda di
chitarra può vibrare: ovvero la lunghezza totale dell’orbita l = 2pr sia
pari ad un multiplo intero di una lunghezza d’onda 2pr =nl, con
n=1,2,3,…n (si veda la figura di Zanghì nella pagina successiva): da
cui, sostituendo la formula di de Broglie per la lunghezza d’onda, si
ottiene
mrv =nh/2p ,
n = 1, 2, 3, . . .,
che è proprio la regola di quantizzazione di Bohr del momento
angolare«. (Zanghì, ibid.)
Quando l’elettrone in un atomo di idrogeno si muove lungo un’orbita
circolare stabile di raggio r devono essere soddisfatte le stesse condizioni che
permettono la vibrazione di una corda di chitarra di lunghezza l: che la
lunghezza totale dell’orbita, l = 2pr sia pari ad un multiplo intero di una
lunghezza d’onda. Poiché la lunghezza d’onda decresce al crescere della massa,
i corpi macroscopici non presentano aspetti ondulatori, visto che la lunghezza
d’onda ad essi associata dovrebbe incontrare ostacoli assai più piccoli delle
dimensioni che li caratterizzano
De Broglie influenzò moltissimo Schroedinger nella prima
formulazione delle meccanica ondulatoria. In una lettera di
Einstein a Lorentz del Dicembre del 1924, leggiamo:
“…De Broglie ha fatto un tentativo molto interessante di
interpretare le regole quantistiche di Bohr. Io credo che questo
rappresenti il primo debole raggio di luce sul peggiore dei nostri
enigmi nel campo della fsiica. Io stesso ho trovato qualcosa che
punta nella stessa direzione.”
Einstein non pubblicò i suoi risultati che però, come vedremo,
influenzarono sia Schroedinger che Max Born, l’autore
dell’interpretazione probabilistica della funzione d’onda. E poi, nel
1952, vennero riscoperti da David Bohm
La posizione di W. Heisenberg
Nel 1925, H. scrive: “è meglio …ammettere che
l’accordo parziale delle regole quantistiche con gli
esperimenti sia più o meno accidentale e provare a
sviluppare una meccanica quantistica teorica,
analoga alla meccanica classica, nella quale
compaiano
solo
relazioni
tra
quantità
osservabili”. Influsso dell’operazionismo di
Einstein (1905)
“Ueber quantentheoretische Umdeutung kinematischer and
mechanischer Beziuhungen”, Zeitschrift der Physik, 43, 172-198
“Sulla reinterpretazione delle relazioni cinematiche e meccaniche
operata dalla meccanica quantistica”
Più tardi però H. cambiò opinione. Per H. la  non è solo uno
strumento di calcolo, visto che egli si riferiva alle onde di
probabilità come ad una “the quantitative formulation of the
concept of dunmis, or, in the later Latin version, potentia, in
Aristotle’s philosophy. The concept that events are not determined
in a peremptory manner, but that the possibility or tendency for an
event to take place has a kind of reality – a certain intermediate
layer of reality, halfway between the massive reality of matter and
the intellectual reality of the idea or the image- this concept plays a
decisive role in Aristotle’s philosophy. In modern quantum theory
this concept takes a new form; it is formulated quantitatively as
probability and subject to mathematically expressible laws of
nature” Heisenberg, “Planck’s discovery and the philosophical
problems of atomic physics”, in On Modern Physics, Orion Press,
London, 1961, pp.9-10
La posizione di E.
Schroedinger (1926)
All’inizio S. pensava che la funzione d’onda da lui scoperta
corrispondesse, con il quadrato del suo modulo (che per Born
fornisce la probabilità), alla densità di massa o di carica
dell’elettrone cui è associata. L’elemento ontologico essenziale è per
lui l’onda: Schroedinger pensava ad un’onda che, a causa di effetti di
interferenza, al di fuori di una certa regione era nulla e simulava
dunque il comportamento di una particella.
“Non si deve attaccare alcun significato essenziale al cammino dell’elettrone…e
ancora meno alla posizione di un elettrone sul suo cammino [accenno a De
Broglie?]…l’onda…non solo riempie tutto il cammino simultaneamente, ma si
estende addirittura notevolmente in tutte le direzioni. Queste contraddizione è
sentita così fortemente che si è persino posto in dubbio che quello che accade in
un atomo possa inquadrarsi in uno schema spazio-temporale. Da un punto di vista
filosofico, io considererei una decisione conclusiva in questo senso come una resa
incondizionata. Infatti, poiché noi non possiamo assolutamente evitare di pensare
in termini di spazio e tempo [Kant?], quello che non possiamo ricondurre a siffatti
concetti, non possiamo comprenderlo affatto” (Ghirardi 1997, p.421)
Ben presto (1927) Heisenberg attaccò l’interpretazione puramente
ondulatoria di Schroedinger. Si consideri un elettrone libero il quale
al tempo t=0 si trova in uno stato la cui rappresentazione delle
coordinate è una funzione gaussiana di ampiezza Dx(0). Se si parte
con un’indeterminazione iniziale Dx(0) di 10-5 cm, risolvendo
l’equazione di Schroedinger, dopo un 1/3 di secondo il pacchetto che
rappresenta l’elettrone libero occupa circa un Km =105 cm! La
relazione tra l’indeterminazione iniziale e quella al tempo t è
h 2t 2
ht
3t
Dx(t )  Dx(0) 1 
cm 
cm 
cm
2
4
4m [Dx(0)]
2mDx(0)
Dx(0)
Dall’ultima formula sulla destra segue l’affermazione
di cui sopra, facendo le sostituzioni
Ma misurare l’elettrone implica sempre localizzarlo, dice G.
(1997, p.421);
Questa non è però l’unica difficoltà: il fatto è invece che varie
onde associate a n particelle richiedono uno spazio di
configurazione n-dimensionale
Lorentz preferiva l’interpretazione ondulatoria di Schroedinger
finché si aveva a che fare con una sola particella: “so long as one
only has to deal with the three coordinates x, y, z. If however,
there are more than three degrees of freedom then I cannot
intepret the waves and vibrations physically, and I must therefore
decide in favor of matrix mechanics”(M. Jammer, The
Philosophy of QM, p. 32).
Ma Jammer continua. “In rebuttal of this objection one could, of
course, point out that in the treatment of a macromechanical system
the vibrations, which undoubtely have real existence in the three
dimensional space, are most conveniently computed in terms of
normal coordinates in the 3n-dimensional space of Lagrangian
mechanics.”
Altre tre difficoltà di una lettura ondulatoria della , afferma
Jammer, sono: (1)  è una funzione a valori complessi; 2) 
dipende dal sistema di osservabili che viene impiegato per
rappresentare il sistema;3)  è soggetta al mutamento discontinuo
indotto dal processo di misura.
Esercizio: secondo te, quali di queste difficoltà è seria?
La posizione di Max Born
Per Schroedinger era necessario poter visualizzare i processi
quantistici salvando la descrizione spaziotemporale (visualizzare
e descrivere spaziotemporalmente qui sono sinonimi).
Born (1926) avanza l’interpretazione probabilistica del modulo
quadro della funzione d’onda, affermando che essa è la densità di
probabilità di trovare la particella in un certo punto se si esegue
una misura di posizione su di essa. |(x)|2 non è dunque la
probabilità che l’elettrone sia in una certa posizione, ma la
probabilità che esso sia in una certa posizione in dipendenza del
fatto che su di esso si è eseguita una particolare misura. Per
Born, esistono solo particelle, non onde, e sono rivelate dagli
esperimenti di scattering.
Come affermò Jordan, è l’osservatore che, “costringe
l’elettrone ad assumere una posizione definita; in precedenza esso
non era né qui né là”
Interessante che nel 1954, quando Born prese il Nobel per i
suoi contributi alla MQ, raccontò che esperimenti sulla collisione
di elettroni “appeared to me as new proof of the corpuscolar
nature of the electron” (Jammer 1974, p. 39). E nel saggio
originale scrisse queste parole profetiche rispetto al problema
della misura: “Die Bewegung der Partikel folgt
Wahrscheinlichkeitsgesetzen, die Warhscheinlichkeit selbst aber
breitet sich im Einklang mit dem Kausalgesetz aus”, (Il moto
delle particelle segue le leggi della probabilità, ma la probabilità
stessa si propaga invece in accordo con la legge della causalità)
Born, Die Quantenmechanich der Stossvorgaenge, 1926, p.804.
Si noti che da questa frase si evince che per Born esistono due
.tipi di evoluzione dinamica delle particelle, una probabilistica
che regola il moto delle particelle (all’atto di misura), una
deterministica che regola la propagazione nel tempo dell’onda di
probabilità (equazione di Schroedinger.)
Sempre nel 1954, Born disse che applicò l’idea del “campo
fantasma” di Einstein dai fotoni (in base alla quale l’intensità
dell’onda fantasma che guida i fotoni – ovvero il quadrato
dell’ampiezza – determina la probabilità di trovare un fotone) a tutta
la materia. Ecco ancora l’idea di De Broglie-Einstein.
Per Born, le probabilità quantistiche non sono dovute all’ignoranza
della situazione fisica (non sono come quelle della meccanica
statistica): sono ontiche.
Contrariamente al punto di vista di Schroedinger,  per Born non
descrive nulla di fisico, ma “solo la nostra conoscenza del sistema”.
Così il fatto che  nell’interpretazione originaria di Schroedinger si
sparpagliasse rapidamente non costituiva per lui alcuna difficoltà,
perché  non denota nulla di reale. Analogamente, per Born il
collasso della funzione d’onda non è una transizione fisica reale, ma
solo un mutamento della nostra conoscenza.
Ma la posizione particellarista di Born
non da conto dell’autointerferenza di un
singolo elettrone quando passa per uno
schermo con due fenditure, ovvero richiede
che il pattern ottenuto con due fenditure
aperte sia “la somma” dei singoli patterns
ottenuti con una sola delle due fenditure
aperte, il che, come è noto, non è. Ne segue
che la  rappresenta qualche cosa di fisico!
Il teorema di impossibilità di
von Neumann
Nessuna teoria predittivamente
equivalente alla MQ può assegnare
valori precisi (anche se sconosciuti,
o nascosti e inaccessibili) a tutte le
osservabili di un sistema fisico
(a)Se A e B sono operatori autoaggiunti, allora
ogni loro combinazione lineare con arbitrari
scalari reali è ancora un operatore autoaggiunto
C  A   B
[1]
(b)Se le osservabili A e B rappresentate da A e B
sono osservabili del sistema, allora c’è
un’osservabile C rappresentata da C :
C  A   B
[2]
(c) Se A è limitato, il sistema è in uno stato , P è
il proiettore sullo stato , e il valore medio
<|A|  Tr(PA) è simbolizzato da A, allora
vale
 C    A    B 
[3]
Indichiamo ora i valori di A, B e C con v(A), v(B), v(C)
rispettivamente e consideriamo una “variabile nascosta”
V che li determini. Nell’ottica di una teoria che assegna
valori definiti a tutte le variabili fisiche, i valori medi
<A> misurati dalla MQ saranno medie sui vari valori
nascosti ma definiti v(A), In generale però, i valori medi
“banali”, identificati con i valori posseduti <A>V = v(A)
non coincideranno con <A>
[4]
 A V  A 
Se però richiediamo che anche gli <A>V obbediscano alla
regola lineare [3] che vale per i valori medi, abbiamo
[5]
v(C) = αv(A) + βv(B).
La [5], insieme alle altre, è un’assunzione indispensabile
del teorema di von Neumann contro la possibilità di
variabili nascoste o contro l’esistenza di stati a dispersione
nulla, dove la dispersione è definita come il valor medio
dell’operatore (B - <B>)2, ovvero la media pesata con la
probabilità |cj|2 del quadrato dello scarto tra l’esito bj e il
valor medio di B.
Assumendo infatti che Si ci fi ; e che B fi=bi fi
y | (B -  B ) 2 y   ck k (B -  B ) 2 c j  j 
c *c
k
kj
j
kj
k (B -  B ) 2  j  ck * c j k (b j -  B ) 2  j 
kj
 c * c (b
k
kj
j
j
-  B ) k  j   ck * ck (b j -  B )   c j (b j -  B ) 2
2
2
2
j
j
Il teorema, che non vedremo in dettaglio
(cfr., I fondamenti
è
logicamente corretto, e se fossero vere le premesse, la
conclusione sarebbe ineccepibile
matematici della meccanica quantistica, capitolo 4, Il Poligrafo, 1998)
Il punto è che la [5] è irragionevole quando le tre
osservabili in questione non formano un insieme
compatibile, ovvero simultaneamente misurabile. Il
primo ad aver mostrato perché la [5] è irragionevole nel
caso di operatori non simultaneamente diagonalizzabili è
stato J.S. Bell nel 1966, dando il seguente semplicissimo
controesempio con le componenti di spin lungo x e y,
che come noto, obbediscono alla relazione
[6]
[sx, sy]=2i sz e permutazioni cicliche di queste
Controesempio di J.S. Bell
Sia A = σx e B = σy, allora l’operatore C
C = (σx + σy)/21/2
corrisponde all’osservabile della componente dello spin lungo la
direzione che biseca l’angolo dato da x e y. Poiché tutte le
componenti dello spin, in opportune unità di misura, hanno come
valori possibili solo ±1, ne segue che una teoria a variabili nascoste
deve assegnare ad A, B, C solo i valori ±1, e lo stesso deve fare con
i valori certi che le osservabili assumono come funzioni delle
variabili nascoste (valori medi triviali). Questo implica che la (5)
non possa essere soddisfatta, dato che
(1   1)
1 
2
Nulla impone che gli autovalori della somma dei due operatori, che coincidono con
i valori v(A), etc, siano combinazione lineare degli autovalori dei componenti
Come afferma Bell: “A measurement of a sum of
noncommuting observables cannot be made by combining
trivially the result of separate observations on the two
terms – it requires a quite distinct experiment. For example,
the measurement of sx must be made with a suitable
oriented Stern-Gerlach magnet. The measurement of sy
would require a different orientation, and that of (sx + sy) a
third and different orientation…There is no reason to
demand it [addivity] individually of the hypothetical
dispersion free states, whose function is to reproduce the
measurable peculiarities of quantum mechanics when
averaged over. (Bell, Speakable and unspeakable in QM,
1987, p.4)
• A causa dell’enorme prestigio di von Neumann,
questo teorema contro la possibilità di variabili
nascoste fu ritenuto per vari anni la prova decisiva
dell’impossibilità del determinismo, fino a quando
Bohm nel 1952 e poi Bell nel 1964 ne mostrarono
l’infondatezza, o meglio, la mancanza di generalità,
il primo con un controesempio costituito da una
nuova teoria fisica, il secondo con l’argomento
appena visto.
• Gleason (1957) e Kochen-Specker (1967)
rimediano a questo problema supponendo che la
[5] valga solo per osservabili compatibili, fatto che
non è messo in discussione nemmeno dai teorici
delle variabili nascoste.
I fondamenti concettuali e le implicazioni
epistemologiche della teoria
1) Il principio di sovrapposizione: è il cuore della meccanica
quantistica e per Dirac (The Principles of Quantum Mechanics,
1930, pp.10-18) rappresenta la maggiore differenza con la
meccanica classica. Esso afferma che dati due stati possibili di
un sistema, 1 e 2, ogni loro combinazione lineare 3  a1 +
b2 con due arbitrari scalari a e b è ancora un possibile stato del
sistema.
2) Abbiamo già visto che a causa della linearità dell’equazione di
Schroedinger, l’evoluzione temporale U di una combinazione
lineare di stati (o di una sovrapposizione di stati) è la
combinazione lineare delle evoluzioni temporali dei singoli stati
della sovrapposizione
U(3) = U(a1 + b2)  aU (1) + b U(2)
Completezza della descrizione quantistica: ogni elemento della realtà fisica
è colto dal formalismo della teoria: “every element of the physical reality
must have a counterpart in the physical theory” (EPR, Phys Rev.1935 p.777)
Nell’interpretazione standard, il formalismo viene considerato come
completo. Ovvero la conoscenza del vettore di stato (uno stato puro) viene
considerata come massimale, per cui l’informazione che esso contiene è
completamente esauriente. Sia  lo stato del sistema preparato con spin
lungo x uguale a +1, che è la combinazione lineare dei due autovettori relativi
a sz
1
1 1
1 1
1  0
S x   ; s x  1;  
1 
 0 
1
2
2 
2 
2 
P(s x  1 |   s x )  1; P(s x  1 |   s x )  0
2
 1 
 1 
P(s z  1 |   s x )  
 ; P(s z  1 |   s x )  

 2
 2
2
La teoria afferma che è solo quando lo stato del sistema (un
elettrone, per es.) è in un autostato dell’osservabile (spin x=+1
nell’esempio) che possiamo attribuire probabilità 1 all’esito di
misura, dato da sx|
 EPR codificano questo requisito affermando il loro principio di
realtà, che è una condizione sufficiente per l’esistenza di proprietà
indipendentemente dalla misura e dunque di proprietà
oggettivamente possedute: “Se, senza disturbare in alcun modo un
sistema, possiamo prevedere con certezza (cioè, con probabilità
uguale a 1) il valore di una quantità fisica, allora esiste un elemento
di realtà fisica che corrisponde a questa quantità fisica” (Einstein,
Podolsky Rosen ibid., 1935, 777)
Se la condizione di EPR è anche necessaria, allora se la proprietà è
posseduta prima della misura (“se esiste un elemento di realtà”) il
sistema è in un autostato dell’osservabile in questione.
Ci si può chiedere se il nostro elettrone possiede anche una proprietà
di avere spin definito lungo z oltre a quella data di avere spin nella
direzione x. Nel caso della sovrapposizione di due autovettori di spin
z, si può mostrare che non è così. Se l’insieme di risultati E fosse
quantisticamente inomogeneo, una miscela, avremmo la probabilità
epistemica che un sistema individuale scelto a caso abbia probabilità
½ di avere spin z = 1 e ½ di avere spin z=-1, dove gli autostati del
sistema potrebbero essere az e bz e si potrebbe pensare che ogni
membro individuale dell’insieme possiede oggettivamente un
preciso valore per l’osservabile spin lungo z, cosicché una
percentuale p+=1/2 dei sistemi siano nello stato az e il resto nello
stato bz (con p-=1/2) . Poiché ogni membro dell’insieme E è in uno di
questi due stati, lo sviluppo di questi stati in termini degli autostati di
sxè
1
1
1
1
az 
ax 
bx ; bz 
ax 
bx
2
2
2
2
Entrambi questi stati danno probabilità ½ per i due possibili esiti di
misura, contro l’ipotesi che lo stato del sistema sia tale che la
probabilità di trovare sx=1 è 1. Ne segue che non è possibile che il
sistema abbia valori definiti per sz e che sia in una miscela di stati
rispetto a sz se è in uno stato definito rispetto a sx
Ne segue che nello stato di sovrapposizione, il + che lo caratterizza
non è interpretabile con una disgiunzione, che andrebbe bene per le
miscele: non è vero che il sistema è o in uno stato o nell’altro, e
nemmeno che non è in nessuno dei due stati. In un certo senso il
sistema “è in entrambi gli stati”, anche se nella misura ne troviamo
solo uno dei due, visto che gli stati sono ortogonali. Questo
argomento vale per osservabili non commutanti, come sono le due
componenti di spin lungo x e lungo z.
E’ quindi possibile distinguere sperimentalmente uno stato puro
(sovrapposizione) da una miscela statistica
Un’altra importante implicazione concettuale è tratta da Ghirardi (1996, p. 401)
“la teoria implica che non si possano attribuire “troppe” proprietà a un sistema
fisico individuale: se la particella ha, per esempio, la proprietà di avere un “preciso
spin lungo l’asse x” allora non possiede proprietà relative alla componente dello
spin in altre direzioni. Il fatto che nel caso classico possa essere impossibile
conoscere perfettamente lo stato del sistema non implica che quest’ultimo non
abbia proprietà definite per ogni stato che definisce in modo massimale il sistema
stesso. E’ per questo che le probabilità di cui parla la fisica classica sono
epistemiche o dipendenti dalla nostra ignoranza. Ecco la differenza, secondo
l’interpretazione standard, con la MQ. Due osservazioni che qualificano questa
asserzioni di Ghirardi:
Per i bohmiani, tutte le probabilità della MQ non relativistica sono epistemiche.
Ma la teoria bohmiana della MQ relativistica è non ancora sufficientemente
sviluppata…
L’assunzione che per un qualunque stato  esiste sempre un’osservabile di cui
tale stato è autovettore con un preciso autovalore ci garantisce però che il sistema
possiede sempre qualche proprietà in modo oggettivo. Ciò è evidente nel caso di
una particella in un arbitrario stato di spin : è sempre possibile trovare una
direzione n rispetto alla quale  è autovettore con autovalore 1 (G. p. 402)
Il dibattito Bohr Einstein e le sue
varie fasi
La posizione filosofica di Bohr
 La preminenza del linguaggio della fisica
classica: poiché gli eventi del mondo quantistico
devono essere amplificati da apparati classici, la
fisica classica rimane un prerequisito per poter
parlare del mondo quantistico
 Per Bohr i microsistemi esistono (egli è un
realista sulle entità, ma un antirealista sulle
teorie): le proprietà non dinamiche dei
microsistemi, massa carica e spin sono
intrinseche ad essi, ma il possesso di quelle
dinamiche è puramente relazionale e dipende
dall’esperimento che intendiamo condurre
Il principio di complementarietà (in base al quale i concetti della
fisica classica, se applicati al mondo quantistico, sono mutuamente
esclusivi e congiuntamente esaustivi) per Bohr vale per ogni
dominio dell’indagine empirica, anche in biologia e nelle scienze
umane (“I quanti e la vita”).
La complementarietà (mutual exclusive and jointly exhaustive)
non riguarda tanto e solo l’aspetto onda e corpuscolo applicato
all’ontologia della MQ ma ha a che fare anche e soprattutto con la
complementarietà tra descrizione spazio-temporale del mondo e
l’applicazione delle leggi causali di conservazione: “il contrario di
una verità profonda è ancora una verità profonda”.
Ecco una buona sintesi del principio di complementarietà di
Bohr“Matter should be regarded as having potentialities for
developing either comparatively well-defined causal relationships
between poorly defined events or comparatively poorly defined
causal relationships between comparatively well-defined events,
but not both together.” (Bohm, Quantum Theory, 1951, p.157).
Molti dei cosiddetti problemi filosofici della MQ per Bohr sono
dovuti all’applicazione al mondo quantistico di categorie
classiche che funzionano solo in un altro ambito (appunto quello
classico). In questo senso il linguaggio della fisica classica è la
condizione trascendentale per poter parlare del mondo
quantistico. E la misura diventa una categoria essenziale della
fisica
Mentre Ghirardi sottolinea, in modo forse eccessivo, il debito di
Bohr nei confronti del neopositivismo logico (=enfasi sul
linguaggio), in realtà nel suo pensiero c’è anche una certa
componente kantiana, soprattutto considerando quel che si è
appena scritto sulle condizioni “sine quibus non”. Il mondo
quantistico considerato in sé è un noumeno, e se proviamo a
descriverlo
utlizzando
categorie
classiche
prima
e
indipendentemente dall’esperimento, otteniamo antinomie e
contraddizioni.
Per Bell, la vaghezza della separazione tra classico e quantistico è
il problema principale della interpretazione standard di Bohr
Bohr ha due possibili risposte a questa critica, che è alla base della
presentazione di teorie alternative alla MQ ortodossa: (1) non è
possibile specificare in modo chiaro e una volta per tutte la
separazione tra classico e quantistico, dato che la distinzione è
irrimediabilmente vaga e contestuale, ovvero dipende
dall’esperimento in questione; (2) lo strumento di misura classico e
il microsistema quantistico sono non-separabili a causa del quanto
di azione, che lega, nella sua indivisibilità, i due sistemi in ogni
scambio energetico.
Si noti però che la seconda risposta sembra suggerire un
trattamento unificato del micro e macro, che Bohr non ritiene
possibile
Bohr e il realismo scientifico
 Il ruolo indispensabile dell’indivisibilità del quanto d’azione: ogni correlazione tra
microsistemi e macrosistemi (interazione causale) lo presuppone, ma per Borh la
sua discontinuità, o atomizzazione, rende impossibile la descrizione nello spazio e
nel tempo dell’interazione stessa. E’ a causa dell’indivisibilità del quanto di azione
(energia x tempo) che non possiamo assegnare energia e momento ben definiti a
un sistema da una parte e simultaneamente descriverlo spazio-temporalmente
dall’altra: in più, i due sistemi non hanno realtà indipendente. A causa della
finitezza del quanto di azione, segue infatti che “poiché nell’osservazione dei
fenomeni [atomici], non possiamo trascurare l’interazione tra l’oggetto e lo
strumento di misura, la questione delle possibilità di osservazione viene di nuovo
in primo piano. Così, qui incontriamo, in una nuova luce, il problema
dell’oggettività dei fenomeni, che ha sempre attatto così tanta attenzione nelle
discussioni filosofiche” (Bohr, 1929, Il quanto di azione e la descrizione della
natura, citato in Faye, p.137)
 Due letture di Bohr sul ruolo della Y. Bohr viene a volte presentato come un
antirealista sulla teorie: la funzione di una teoria fisica è solo quella di specificare
predizioni empiriche su ciò che si può osservare; la Y non descrive nulla, anche se
le particelle esistono.
D’altra parte, in un’altra interpretazione del pensiero di Bohr,
Bohr e i fisici che lo seguono ritengono che la MQ sia completa,
ovvero che il vettore di stato fornisca una descrizione accurata e
completa della realtà fisica di un sistema, malgrado tale
descrizione non assegni valori simultaneamente definiti a
grandezze come posizione e momento o tempo e energia, o a
grandezze in sovrapposizione.
Ciò significa che, come abbiamo visto molte volte, uno stato
quantistico di sovrapposizione come questo
1/ 2 ( A  B )
(che se valesse l’interpretazione “a ignoranza” si riferirebbe al
fatto che c’è una “pallina” o nella scatola A o in B ma noi non
sappiamo dove) implica invece che prima della misura la pallina
non è né in A né in B, né in nessuna delle due e che quando
guardiamo è trovata in A o in B con probabilità 1/2
Cioè, l’interpretazione “a ignoranza” o epistemica delle
probabilità quantistiche in questo senso non funziona, perché in
uno stato scritto così
1/ 2 ( A  B )
ci sono effetti di interferenza: le proprietà disposizionali di uno stato
in sovrapposizione non sono quelle tipiche di uno stato in cui la
pallina è definitamente in A o in B.
Nella misura in cui c’è una certa tensione tra il sostenere che una
teoria non ha capacità descrittiva e il sostenere che essa è completa,
Bohr non può essere descritto come un antirealista sulle teorie
(contro Jan Faye, Niels Bohr, His heritage and legacy, Kluwer)
Ripasso Le relazioni di indeterminazione di Heisenberg
Ricordiamo che lo scarto quadratico medio di A è
DA  [A-  A ]
Il prodotto dello scarto o indeterminazione delle due quantità A e B per un
insieme statistico associato a uno stato puro  sarà allora
DA  DB  [A-  A ]  [B-  B ]  dis.Schwarz
 [A-  A ] [B-  B ] 
Questo passaggio dipende dalle proprietà del
prodotto scalare e dal fatto che il modulo di un
numero complesso è maggiore del modulo della
parte immaginaria
1
[A-  A ] [B-  B ]  [B-  B ] [A-  A ]
2
z  x  iy  zz*  x 2  y 2  y 2  z  y 2  y  Im z 
2
2
1
z  z*
2
Poiché gli operatori A-<A> e B-<B> sono entrambi simmetrici, si possono
portare a destra del prodotto scalare
1
DA  DB   [A-  A ][B-  B ]   [B-  B ][A-  A ] 
2
Indicando con le parentesi graffe il commutatore tra A-<A> e B-<B>
si ha
1
1
 A-  A , B-  B   DA  DB   A, B
2
2
Poiché <A> e <B> sono numeri, essi commutano con qualunque
operatore, ciò che spiega perché l’espressione a sinistra nella
formula qui sopra si riduce a quella a destra. Per es., poiché il
commutatore tra posizione e quantità di moto vale ih/2p, si ha



Dx  Dp x  ; Dy  Dp y  ; Dz  Dp z 
2
2
2

DE  D t 
2
In relatività lo spazio x è
legato al tempo t come
l’impulso
p
è
legato
all’energia E
L’indeterminazione tempo-energia implica la conservazione
dell’energia. Se lo stato del sistema coincide al tempo t=0 con un
autofunzione propria dell’energia, ovvero se (0)= fj ove H|fj>= Ej
|fj> allora il sistema evolve in questo modo:
(t )  f j e
i
 E jt

in cui l’esponenziale è l’operatore unitario (al posto
dell’hamiltoniana H abbiamo messo il suo valore Ej). Ciò implica
che la probabilità di trovare l’esito Ej in una misura dell’energia è 1.
Ma se l’energia è perfettamente definita, allora il tempo è
indeterminato, cioè l’energia si mantiene uguale a se stessa assai a
lungo.
Heisenberg non derivò le sue relazioni nel modo visto ma propose
argomenti più qualitativi. (Ghirardi,1997, pp 413-4)
x
z
diffrazione
Immagine geometrica del
foro di ampiezza Dx: non
conosciamo la posizione della
particella lungo x ma la
componente verticale del
momento px è perfettamente
definita, perché è nulla
Se restringiamo l’ampiezza della fenditura fino a
renderla paragonabile a quella della lunghezza
d’onda l=h/p associata all’elettrone, allora
abbiamo un’indeterminazione piccola della
posizione x dell’elettrone, ma il suo momento px è
non nullo a causa della diffrazione (immagine
allargata del foro), in modo che il prodotto
DxDpx> h/4p
Spin e indeterminazione
σ x  x  1 x ;σ x x  1 x ;σ z  z  1 z ;σ z z  1 z
x 
1 1
1 1
 1 ;    0 
;


;


  x
  z  0 z 1
 
 
2 1
2   1
sz=-1

sx=+1
sz= +1
Le proiezioni di  lungo gli assi degli autovettori danno, attraverso
il quadrato dei loro moduli, la probabilità di ottenere i vari esiti per
l’osservabile spin. Nella figura, tutte le proiezioni sono non nulle
sx=-1
Per rendere “quasi determinato” il valore di sz si deve partire da uno stato quasi
parallelo ai due autovettori di sz (un suo autostato), ma in questo caso le due
componenti di sx tendono a (2)1/2/2 e si ha dunque una massima indeterminazione per
l’osservabile sx (e viceversa). Il valor medio tra i due soli esiti (1 e –1) è 0, < sx > =
0, mentre lo scarto quadratico medio vale, secondo la formula già vista, proprio 1, che
è il massimo Dsx  [ Si pi( a- < a >) 2]1/2 = 1/2 [1/2(1-0)2+ 1/2(-1-0)2]1/2 = 1
sz= -1
y
sx=+1
sz= +1
sx=-1
Capitolo 6
Le critiche di Einstein alla
meccanica quantistica, ovvero il
dilemma tra incompletezza e nonlocalità
Sorgente e-
Pellicola fotografica
semisferica
your formulation of quantum mechanics “is certainly
imposing…but an inner voice tells me that it is not yet the real
thing (Einstein a Born 1926, 91)
Nel 1927 (5 conf. Solvay), E. avanza due interpretazioni della
(r) o dell’onda De-Broglie-Schroedinger, che in questo
esperimento si suppone colpisca la lastra fotografica
simultaneamente ma che poi si trova localizzata in un punto
specifico r, di cui la |(r) |2 determina solo la probabilità, in
funzione dell’intensità dell’onda in quel punto.
Le due ipotesi
I) incompletezza della teoria, ovvero, la meccanica quantistica non
descrive i processi singoli di diffrazione dell’onda e poi di
localizzazione, ma si riferisce a insiemi statistici di particelle non
tutte nello stesso stato, ognuna delle quali con condizioni iniziali
diverse. Le probabilità sarebbero allora epistemiche e i punti di
localizzazione si riferirebbero alla probabilità che in r ci sia qualche
particella dell’insieme;
II) non-località: la meccanica quantistica descrive processi singoli
ed è quindi completa, ma l’onda elettronica si trova in un istante su
tutta la lastra e l’istante successivo è localizzata in un punto, in
contraddizione con la relatività, dato che ogni singolo processo
elementare deve agire simultaneamente su due o più punti distinti
dello schermo, con un meccanismo che fa andare a 0 l’ampiezza in
tutti i punti del fronte d’onda tranne che in uno.
“Se |(r)|2 fosse semplicemente considerata la probabilità che
un processo elementare si trovi in un certo luogo a un certo
istante, potrebbe succedere che lo stesso processo elementare
agisca in due o più punti dello schermo. Ma l’interpretazione
secondo la quale |(r)|2 esprime la probabilità che questa
particella si trovi in un certo luogo presuppone un meccanismo
molto particolare di azione a distanza che impedirebbe all’onda
distribuita in modo continuo nello spazio di agire in due luoghi
dello schermo…Se si lavora soltanto con le onde di
Schroedinger, l’interpretazione II di |(r)|2 implica a mio avviso
una contraddizione con il postulato di relatività”
Einstein in Bohr, Collected Works, vol. 6, p. 102
Molti storici hanno insistito non su questo dilemma, ma sulle
critiche di Einstein al principio di indeterminatione di Heisenberg.
Come sono connessi questi due fatti? Vediamo la critica al
principio di Heisenberg
z
S1
Le critiche di Einstein (al
principio di indeterminazione?)
(1927)
S2
Un fascio monocromatico (con
particelle di uguale impulso
iniziale sparate una alla volta)
investe uno schermo mobile:
applicando la conservazione del
momento, si potrebbe determinare
in quale fenditura passa la
particella in S2, senza distruggere
l’interferenza. Si violerebbe così il
principio di indeterminazione di
Heisenberg: se il primo schermo si
sposta verso il basso, la particella
andrà verso la fenditura in alto di
S2, e viceversa
E’ solo l’interazione delle particelle con S1 che può deviare la
loro traiettoria, visto che prima avevano momento perpendicolare
nullo (pz =0). In linea di principio, anche se praticamente è quasi
impossibile, è possibile per Einstein misurare il rinculo
dell’apparecchio verso l’alto o verso il basso senza influire sul
moto della particella e stabilire quindi per quale fenditura questa
passa.
Bohr risponde che o si fissa S1 ad una base, e allora si sa con
precisione dove è la fenditura, oppure, per stabilire il verso del suo
rinculo (in alto o in basso) si deve avere un schermo sospeso con
molle e si deve poter misurare con estrema precisione la
componente della velocità lungo z. Ma allora, a causa del principio
di indeterminazione di Heisenberg, si deve avere una
corrispondente indeterminatezza nella posizione dello schermo
lungo z. Si deve allora mediare su tutte le posizioni dello schermo
S1 che rientrano nella indeterminazione della posizione, ciò che
corrisponde a fare una media di tutte le possibili figure di
interferenza che corrispondono ad ogni posizione. Fare tale media
comporta distruggere la figura di interferenza!
Scrive Bohr:” risulta decisivo che, contrariamente ai veri e propri
strumenti di misura, questi corpi [vale a dire il diaframma S1],
assieme alle particelle, costituirebbero, nel caso in esame, il
sistema cui deve applicarsi il formalismo quantistico. Per quanto
riguarda la precisazione delle condizioni sotto le quali si può
correttamente applicare il formalismo, risulta essenziale che si
tenga conto di tutto il dispositivo sperimentale” (cit. in Ghirardi,
p.426).
Si noti che però Bohr, che respinge l’obiezione di E., considera
il diaframma macroscopico S1, solo perché utilizzato nella
misura, come tale da cadere sotto l’applicazione del formalismo
quantistico. Sebbene sia un corpo chiaramente di dimensioni che
rientrano nella fisica classica. Il suo argomento potrebbe essere
difeso affermando che solo un corpo quantistico può misurare il
rinculo. Ma questa risposta esige di sapere a quali scale possiamo
usare la fisica classica e a quali no: e questo è proprio il problema
posto dalla tutta la filosofia di Bohr.
Ambiguità della separazione classico/quantistico (J. Bell). Bohr direbbe, con
termine più benevolo, “constestualità della separazione”. Il punto è che se tutti i
sistemi fisici, anche quelli macroscopici classici, possono essere descritti dalla
MQ, non ci si può più avvalere della separazione classico/quantistico per evitare
il problema della misura.
Per questo Bohr, conscio del problema, scrive:”..si deve aver ben chiaro che –
oltre che nella descrizione della disposizione nello spazio e nel tempo degli
strumenti che formano l’apparato sperimentale – l’uso non ambiguo di concetti
spazio-temporali nella descrizione dei fenomeni atomici va interamente limitato
alla registrazione di osservazioni che si riferiscono a immagini su una lastra
fotografica o ad analoghi effetti praticamente irreversibili di amplificazione, come
la formazione di una goccia d’acqua attorno a uno ione in una camera a nebbia
(Ghirardi, ibid.)
La nozione di irreversibile (e non più di macroscopico) diventa sinonimo di
classico
Ecco il legame tra il dilemma incompletezza/non-località non colto dagli
interpreti e il principio di indeterminazione, legame che non si evince affatto
dal resoconto di Bohr nel volume in onore di E. di Schilpp, che in parte non
capisce la critica di Einstein. E questo punto non viene colto nemmeno da
vari libri recenti su Bohr: il fatto essenziale è chela particella e il diaframma,
sia per B che per E, sono un sistema composto, e in più inseparabile, a causa
del fatto che tra le grandezze del sistema valgono le relazioni di
indeterminazione di Heisenberg.
Non possiamo dire che la particella ha una posizione definita se la velocità
lungo z del diaframma è non nulla; viceversa, se la velocità lungo z della
particella è non nulla, questo comporta che la posizione del diaframma sia
indeterminata, proprio perché deve essere definito il suo momento verticale. Il
punto centrale che muove E. a criticare il Principio di H. ha quindi a che fare
con la non-separabilità di sistemi spazialmente distanti che obbediscano al
principio di H. Bohr non capisce il legame tra principio di indeterminazione e
non-separabilità, malgrado teorizzi e comprenda forse per primo la seconda.
Ma la non-separabilità per Bohr riguarda le condizioni di possibilità
dell’attribuzione di una proprietà a un microsistema (è l’inevitabilità
dell’apparato di misura) e e non coinvolge minimamente la non-località
spaziotemporale, che E. invece coglie molto bene per primo.
In un saggio non pubblicato del 1927, studiato da D. Belousek
in SHPMP, 1996, 27, E. deriva una sorta di equazione di
Hamilton-Jacobi quantistica, in cui l’energia cinetica
complessiva del sistema è la somma dell’energia cinetica
assegnata alle sue n componenti, e tale che la velocità di ogni
componente è determinata a ogni istante e contribuisce
all’energia complessiva del sistema.
“l’assegnazione di moti completamente determinati a soluzioni
dell’equazione differenziale di Schroedinger è, almeno dal punto
di vista formale, possibile tanto quanto lo è l’assegnazione di
moti determinati dell’equazione di Hamilton-Jacobi della
meccanica classica” (Einstein, in Belousek 1996)
Ma poi ritira la pubblicazione, perché si rende conto che due
sottosistemi qualsiasi in questo schema sarebbero entangled, cioè
il moto di uno dipenderebbe strettamente da quelle dell’altro e
lui rifiuta tale non-separabilità non-locale.
• L’argomento di E. si può allora ricostruire così.
Supponiamo che si misuri la velocità e il verso del
moto di S1: allora, tramite il principio di
conservazione dell’impulso, possiamo calcolare
l’impulso della particella lontana senza disturbarla;
per il principio di H., la particella dovrà avere una
posizione indefinita. Ma se avessimo invece deciso di
misurare la posizione dello schermo dopo
l’interazione con la particella, avremmo reso
indefinito l’impulso della particella. Le due variabili
non sono simultaneamente misurabili, naturalmente,
ma come fa la realtà delle proprietà della particella
lontana (posizione e impulso) a dipendere dal tipo di
misura che decidiamo di effettuare sullo schermo,
che può essere separato da intervalli di tipo spazio
dalla particella?
L’argomento della scatola e del fotone (Solvay
1930)
La presentazione standard è la seguente:
Einstein
considera
una
scatola
contenente
radiazione
elettromagnetica, dotata di un orologio che fa aprire una fessura
dalla quale può uscire radiazione ad un tempo fissato. Se
ipotizziamo che idealmente T0, e che dall’apertura sia uscito un
solo fotone, pesando la scatola prima e dopo la fuoriscita della
particella, mediante la formula E= mc2 si può determinare, oltre al
tempo, anche l’energia emessa dalla scatola attraverso l’espulsione
del fotone, in contraddizione con la formula dell’indeterminazione
tempo-energia
DT DE > h/2p ,
(1)
Ghirardi, Un’occhiata alle carte di Dio, p. 145
La risposta di Bohr utilizza il principio di equivalenza della
Relatività generale. Al solito, per determinare il peso
della scatola, la velocità lungo la verticale
dell’indicatore deve essere nulla, e quindi si finisce con
l’avere una posizione lungo la verticale assai indefinita.
Questa incertezza si traduce in una indefinitezza del
peso, e perciò dell’energia
Unruh e Opat, nell’American Journal of Physics, 1979,
mostrano che la risposta di Bohr può evitare il ricorso al
principio di equivalenza, che sfrutta l’incertezza nella
posizione dell’orologio per affermare che diventa
incerta la sua quota e quindi la scansione temporale
dell’orologio
Come risposta, Bohr deriva la disuguaglianza (1) Bohr usando
queste formule:
E = m c2 ,
(2)
Dp Dq > h ,
(3)
Dp < Tg Dm ,
(4)
DT/T= (1/c2 )g Dq .
(5)
Sia T l’intervallo corrispondente al tempo necessario per le
procedure di peso, Dm l’accuratezza nella procedura di peso.
L’impulso mDv=Dp<FTDmgTTgc-2DE per la (2). La
disuguaglianza nella (4) per Bohr si giustifica perché
l’indeterminazione nel momento Dp è minore dell’impulso totale
dato dalla procedura di peso
Dp < Tgc-2DE  Dp < gc-2DE DT c2 /g Dq da cui seguono le
relazioni di indeterminazione per tempo e energia
h/2p < DpDq < DEDT
Spieghiamo la (5):gDq è energia potenziale, nel
nostro caso, differenza di potenziale legata
all’incertezza nella posizione; il red-shift
gravitazionale implica che l’orologio posto in
basso nel campo gravitazionale vada più
lentamente. Nell’esperimento di Briatore e
Leschiutta (1975), si trovò che un orologio a
Torino dopo 68 giorni perdeva 2,4 .10-6 s.
rispetto a quello sul Plateau Rosa. Se l è la
differenZa di quota, la differenza tra gli
intervalli di tempo è data dalla formula
DT’-DT DT(gl/c2)
Un critica contemporanea all’esperimento mentale del fotone
nella scatola
“Indeed, if the shutter is open during a vanishing time interval (for just one
photon to escape, Einstein thought) then the electromagnetic pulse must
be very sharp, ideally a Dirac delta. According to classical
electrodynamics, the Fourier components of such a pulse involve a wide
spectrum of frequencies. Therefore the electromagnetic pulse does not
have a precisely defined frequency. On the other hand the unique
escaping photon should have, according to Einstein, a precisely defined
energy, that is, a precisely defined frequency (E = hn) in contradiction with
the sharp pulse. At least in 1949, Einstein was well aware of this
contradiction as he stated that “...indivisible point-like localized quanta of
the energy hn (and momentum hn/c)...contradicts Maxwell’s theory” [6]. We
know today that the photon concept is compatible with Maxwell’s theory
provided that we abandon the simultaneous requirement of point-like
localization and precise energy-momentum.” (de La Torre et. al. 1999,
arXiv:quant-ph/9910040 v1 8 Oct 1999). Per gli autori, il fotone ipotizzato da
Einstein non può esistere
This is a hybrid set involving classical mechanics (4),
special relativity (2), quantum mechanics (3) and general
relativity (5). … this hybrid mixture is precisely the root of
the weakness of the argument. .. However, in order to
provide a proof of the inequality, the relations (2) to (5)
must be valid and the symbols used in these formulas
must have the same meaning as the one in the inequality
(1). We will see that these two requirements are not
satisfied by Bohr’s reply (de La Torre et. al. 1999,
arXiv:quant-ph/9910040 v1 8 Oct 1999)
In Bohr’s reply to Einstein, T is the “interval of balancing
procedure”, m is the “weighing... accuracy”, q is the
“position ... accuracy” and p is the “minimum latitude in the
control of the momentum of the box”. In these definitions
there is a mixture of classical uncertainties and quantum
indeterminacies. (de La Torre et. al. 1999, arXiv:quantph/9910040 v1 8 Oct 1999)
The first difficulty that we find with Bohr’s argument is that the
symbol T has not the same meaning in the set of relations (2)
to (5) as in relation (1). In Einstein’s argument, T is the
indeterminacy in the moment of escape of the “photon” (more
precisely, the time-width of the electromagnetic pulse) and in
Bohr it means the indeterminacy in the balancing time of the
box during the weighing procedure. These indeterminacies
need not be the same. The weighing of the box can, indeed,
be made a long time after the escape of the electromagnetic
pulse. We have here sufficient reason to take Bohr’s reply as
inconclusive. (de La Torre et. al. 1999, arXiv:quant-
ph/9910040 v1 8 Oct 1999)
Ma anche in questo caso, il punto che stava a cuore ad Einstein è
completamente diverso: riguardo all’incontro Solvay del 1930, gli
storici hanno troppo insistito sulla ricostruzione di Bohr. In una lettera
di Eherenfest a Bohr del 9.7.1931 leggiamo:
“[Einstein] mi disse che già da molto tempo non dubitava più
delle relazioni di indeterminazione, e che perciò egli non
aveva assolutamente inventato “la scatola a lampo di luce
pesabile “contra” le relazioni di indeterminazione, ma per
uno scopo completamente diverso”
In Howard D. (1990), Nicht sein kann was nicht sein darf or the prehistory of EPR,
1909-1935, in Sixty-Two Years of Uncertainty, a cura di A. I. Miller, New York,
Plenum Press
Vedi Laudisa (1998), p. 46: nella stessa lettera
Ehrenfest descrive una variante dell’esperimento della
“scatola a fotone pesabile”, in cui una macchina emette
un proiettile, che viene riflesso da uno specchio posto a
grande distanza (separazione di tipo spazio). Dopo
l’emissione, lavorando solo sulla macchina, è possibile
predire due valori non commutativi, a seconda di ciò
che scegliamo di misurare
Dice Ehrenfest: “E’ interessante chiarire il fatto che il
proiettile, che si muove già isolato e ‘per conto
proprio’, deve essere pronto a soddisfare predizioni
non commutative molto diverse, senza sapere ancora
quale di queste predizioni verrà fatta”.
Ovvero potrei misurare il tempo di andata e ritorno del proiettile o
la sua energia, senza in alcun modo influenzarlo. Devo quindi
assumere che entrambe le quantità sono misurabili, a meno di non
far dipendere la realtà delle proprietà del proiettile da ciò che faccio
sulla scatola, a distanza. In nuce, c’è EPR, e comunque di nuovo la
questione della non-separabilità tra macchina e proiettile, che
invoca il problema della completezza.
Se scegliessi di misurare l’osservabile E sulla macchina avrei una
funzione d’onda pro di un certo tipo, senza influenzare la realtà a
distanza del proiettile a causa del postulato di relatività; ma se
scegliessi di misurare T, avrei una funzione d’onda diversa ’pro,
senza che la realtà a distanza del proiettile sia modificata. Poiché
esistono due diverse rappresentazioni della medesima realtà, il
rapporto tra funzione d’onda e sistema rappresentato non è
biunivoco ed esiste dunque incompletezza, nella misura in cui per la
completezza la biunivocità tra funzione d’onda e realtà è CNES (c’è
un elemento di realtà che non è descritto dalla teoria, che si riferisce
allo stesso elemento).
Capitolo 4
Il problema della nonlocalità nella MQ
L’argomento EPR-Bohm-Bell
1
2
3
4
5
Stati Entangled
Esposizione qualitativa di EPR
Dimostrazione del teorema di Bell
Risultati sperimentali
Conseguenze
concettuali
implicazioni
filosofiche
e
7.1 Stati entangled
“Io considero l’entanglement non uno ma il tratto
più caratteristico della meccanica quantistica,
quello che implica il suo completo distacco da
qualsiasi
concezione
classica”
E. Schroedinger
Stati fattorizzati e non fattorizzati (Ghirardi p. 430 e ss)
Uno stato fattorizzato è uno stato  dello spazio composto H che
risulta il prodotto diretto (o tensoriale) di stati appartenenti ai
sistemi componenti H1 e H2:
(1)
( 2)

c
  (1)  c( 2)  [ ai i ]  [ b j c j ]   aib j [(1)  c( 2) j ]   cij [(1)  c( 2) j ]
(1)
i
( 2)
j
ij
ij
Nello spazio H associato al sistema composto esistono anche stati
non fattorizzati, che corrispondono a combinazioni lineari di stati
fattorizzati in cui i fattori sono autovettori con autovalori distinti. Il
problema concettuale principale in questo contesto è se e quando è
possibile attribuire proprietà definite o oggettive ai componenti di
uno stato non fattorizzato di H. Se lo stato fattorizzato ha come
fattori autovettori di osservabili A e B relative ai sistemi
componenti, allora i componenti possiedono proprietà oggettive.
Se lo stato fattorizzato è FF = (1) i  c( 2) j e
A(1) (1) i  ai (1) i ; B ( 2) c ( 2) j  b j c ( 2) j
allora gli stati componenti posseggono le proprietà ai e bj
indipendentemente da un processo di misura, dato che FF è
autostato di A(1)  I (2) e di
I (1)  B ( 2) (ciascun prodotto
tensore è un operatore autoaggiunto relativo a H) con gli
autovalori sopra riportati.
Se, “dato un qualsiasi stato di uno spazio di Hilbert esiste sempre
un operatore autoaggiunto di cui esso è autostato e se si assume
che ogni operatore autoaggiunto rappresenti un’osservabile,
allora può concludersi che nel caso di un sistema fisico
individuale (…) associato a uno stato fattorizzato, i costituenti
del sistema possiedono, ciascuno, una precisa proprietà
oggettiva” (Ghirardi p. 431)
~ (1, 2)
  a(1) i  c ( 2) j  b(1) r  c ( 2) s ; | a |2  | b |2  1
Ecco uno stato puro entangled (verschraenkt) del sistema
composto associato a H, in cui i fattori dei due termini della
sovrapposizione risultano autovettori delle osservabili A e B con
autovalori distinti.
Abbiamo quindi una probabilità |a|2 che dopo una misura i due
sistemi componenti rivelino l’autovalore ai per l’osservabile A e
l’autovalore bj per l’osservabile B (lato sinistro della
sovrapposizione) e probabilità |b|2 di rivelare invece gli
autovalori ar e bs per il sistema associato a H(1) e H(2)
rispettivamente ( con a e b diversi da 0 e 1)
Ne segue che le due parti del sistema composto (il “tutto”) il
cui stato è la sovrapposizione qui in alto non hanno proprietà
oggettive o definite!
È solo se si suppone che f(1)i e f(2)r siano autovettori relativi allo
stesso autovalore c di un operatore degenere C(1) - cosicché i due
autovettori appartengano alla stessa autovarietà - che il vettore di
stato del sistema composto è un autostato di un’osservabile e i
componenti hanno proprietà definite
~ (1, 2)
[C  I ]  [C (1)  I (2) ] ((1) i  c( 2) j  (1) r  c( 2) s ) 
(1)
 c
(2)
(1)
i
c
( 2)
j
 c
(1)
r
c
( 2)
s
~ (1, 2)
 c
Per un sistema composto in uno stato di sovrapposizione di due o
più stati fattorizzati, i costituenti del sistema non hanno proprietà
oggettive, anche se il sistema come un tutto ha sempre qualche
proprietà (c’è un osservabile di cui lo stato è un autostato). In
generale, se si lascia evolvere liberamente uno stato fattorizzato
dopo aver fatto interagire le sue parti, i costituenti perdono le
proprietà definite e solo il tutto le mantiene nel senso visto.
Dato che tutto interagisce prima o poi con tutto il resto, le
particelle che compongono il nostro corpo sono
inestricabilmente entangled con tutto il resto dell’universo
“L’universo indiviso” di cui parlano Bohm e Hiley (1989) è
una forma di olismo in cui solo la funzione d’onda che descrive
l’universo ha una sua definitezza, mentre tutte le sue
componenti non possiedono alcuna proprietà oggettiva
Dunque non è vero, come spesso pensano i filosofi che non
conoscono le scienze naturali ma ne pontificano spesso, che
l’olismo è una caratteristica che si ritrova solo nella mente o
nelle scienze umane.
Ovviamente, ci sono vari “olismo”: olismo delle credenze, del
significato, della conferma (Duhem-Quine), e l’olismo della MQ
è diverso da questi altri tipi di olismo
In tutti i casi, nell’olismo c’è l’idea che le proprietà delle parti dipendano da
quelle delle altre parti o addirittura da quelle del tutto. A volte c’è l’idea che il
tutto sia più della somma delle parti. Nel caso quantistico, l’olismo ha vari
significati, che apprezzeremo fino in fondo quando tratteremo la non-località. Per
ora, c’è l’idea che le parti di un tutto che hanno interagito e che sono in uno stato
non fattorizzato non possiedono proprietà definite prima della misura e le
acquisiscono “tutte insieme” con una misura.
ESERCIZIO (Si veda Ghirardi 1997, pp. 433-4)
Dopo aver ricordato la generica forma di un generico vettore di spin semintero
 a , a, b  C, | a |2  | b |2  1
b
 
dimostriamo per esercizio che per ogni stato  dello spazio di spin esiste
sempre una direzione n tale che  risulta autovettore dell’operatore sn (che da
la componente dello spin in quella direzione prescelta) con autovalore unitario
sn | +1 |sn>. Scriviamo il nuovo operatore in funzione del versore n =
(nx+ny+nz), “proiettando” quindi le matrici di Pauli s = (sx, sy ,sz) in quella
direzione,ovvero facendo il prodotto scalare tra n e s


2
2
2
n  (nx , n y , nz ), n x  n y  n z  1, n  versore
s n  s x nx  s y n y  s z nz
nx  in y 
 nz
0
1
0

i
1
0






s n  
nx  
ny  
nz  




 nz 
1 0
i 0 
 0  1
 nx  in y
nx  in y  a 
nz a  (nx  in y )b  a
 nz
a


|


   1  
2 
2 1
a
|
|
b
|
b
b
 nz  
  (nx  in y )a  nz b  b
 nx  in y
a *[nz a  (nx  in y )b]  aa* | a |2  nz | a |2 (nx  in y )a * b | a |2
b *[( nx  in y )a  nz b]  bb* | b |2  b * a(nx  in y )  nz | b |2 | b |2
Dopo aver moltiplicato entrambi i membri per i complessi coniugati di a e b, sommo
membro a membro, ottenendo 1 a destra perché il vettore di spin è normalizzato
nx (a * b  b * a)  n y i (b * a  a * b)  nz (| a |2  | b |2 )  1
1
1
Re[ b * a]  (b * a  a * b); Im[ b * a]  (b * a  ba*)
2
2i
nx (a * b  b * a)  nyi(b * a  a * b)  nz (| a |2  | b |2 )  1
I coefficienti che moltiplicano le componenti del versore n (le
espressioni tra parentesi) sono quindi(dx=2Re[ab*], dy= -2Im[ab*],
dz=1-2|b|2). Quadrando i coefficienti si ha dx2 + dy2+ dz2 =1, come
dev’essere per un vettore di spin
(a * b) 2  (b * a) 2  2 | a |2 | b |2 (b * a) 2  (b * a) 2  2 | a |2 | b |2 
 | a |4 2 | a |2 | b |2  | b |4 | a |4 2 | a |2 | b |2  | b |4  (| a |2  | b |2 ) 2  1
Sostituiamo ora i valori di d nella matrice trovata sz , ,verificando
quel che volevamo dimostrare, ovvero che esiste una direzione
rispetto alla quale lo stato di spin di componenti generiche (a, b) è
austostato con autovalore 1 (in unità di h/2p)
1  2 | b |2

sd  
 2a * b
2ab * 
a
a





s


1
b
d b
2 | b |2 1
 
 
QED!
Troviamo gli autovettori z e z dell’operatore sz
 nz  w nx  in y 
det( s z  wI)  det
  0 
 nx  in y  nz  w 
2
2
2
2
2
2
2
2
 nz  w  n x  n y  0  w  n x  n y  nz  1  w  1
Sostituiamo i due autovalori trovati nella matrice di cui sopra
 nz  1

 nx  in y

nx  in y   x   0 
(nz  1) x  (nx  in y ) y  0
     
 nz  1   y   0  (nx  in y ) x  (nz  1) y  0
w  1
(nz  1) x  (nx  in y ) y   x  (nx  in y );  y  (nz  1)
w  1
(nx  in y ) x  (nz  1) y   x  (nz  1);  y  (nx  in y )

n( w1)
1
1
 1  nz  
  (nx  in y ) 

 n  in ;  n( w1) 


y
2(1  nz )  x
2(1  nz )  1  nz 


n( w1)
 n( w1)

1
 1  nz 
 n  in 
y
2(1  nz )  x
1
  (nx  in y ) 


1

n
2(1  nz ) 
z

Scriviamo gli autovettori di sz
1
0



 z   ;  z   
 0
1
Poiché gli autovettori di sz sono una base completa dello spazio di
spin, possiamo esprimere gli autovettori di sn come loro
combinazione lineare
nx  in y
 (nx  in y )
1  nz
1  nz


n 
z 
 z ; n 
z 
z
2(1  nz )
2(1  nz )
2(1  nz )
2(1  nz )
(1)
F   a    c 
b
d 
( 2)
In uno stato fattorizzato di un sistema composto,
esistono per le ragioni viste una direzione relativa al
primo e una al secondo componente, con autovalore
+1, che ci consentono di dire che F è autostato di
entrambe e i componenti hanno proprietà di spin
definite
S
(1, 2 )
1 (1) ( 2) (1) ( 2 )
 [ z  z   z  z ]
2
In questo stato di singoletto, si ha uno stato entangled, e si ha
probabilità ½ di trovare la prima particella con spin lungo z in su
e la seconda con spin lungo z in giù, e ½ di trovare la situazione
opposta (la prima particella con spin lungo z in giù e la seconda
con spin lungo z in su). Queste conclusioni valgono per
qualunque direzione n si scelga:
S
(1, 2 )
1 (1) ( 2) (1) ( 2 )
 [ n  n   n  n ]
2
come si può verificare prima sostituendo alle espressioni per n e
n le espressioni trovate nella pagina precedente e poi facendo i
prodotti tensori che così si trovano
4.2 Esposizione qualitativa di EPR
a
A e B sono separati da intervalli di tipo spazio, ovvero
non sono connettibili da alcun segnale, nemmeno dalla
luce
A
b
B
Condizione di realtà di EPR
“Se, senza disturbare in alcun modo un sistema, è possible
prevedere con certezza (vale a dire, con probabilità pari a 1) il
valore di una quantità fisica, allora esiste un elemento di realtà
fisica che corrisponde a questa quantità”
Condizione di località di EPR
“Gli elementi di realtà fisica di un sistema non possono essere
influenzati istantaneamente a distanza”
Prendiamo due particelle a e b in uno stato entangled:

(1, 2 )
1
2
1
1
1

  
 
2
2
2
posizionate in due zone A e B distanti nello spazio, in cui ci siano
due apparati misuratori dello spin, e assumiamo la condizione di
(i) realtà di EPR e di (ii) completezza.
Allora il fatto di poter prevedere con certezza pari a 1, e prima di
eseguire la misura, che cosa si otterrà dall’altra parte
dell’esperiemento, basta, in base alla condizione di realtà
esplicitata nella pagina precedente, a concludere che esiste un
elemento di realtà oggettiva e definita che la teoria ufficiale non
descrive, dato che lo stato qui sopra è puro, ed è uno stato di
sovrapposizione privo di proprietà relative allo spin lungo una
direzione. Ne segue che o la MQ è non locale o incompleta ed
EPR optano per la incompletezza, senza proporre alcuna teoria
7.3 Il teorema di Bell (“On the
EPR paradox”, Physics 1, 1964)
È tra i risultati più importanti della fisica
della seconda metà del 900, e non solo da
un punto di vista concettuale e filosofica,
visto che ha aperto la strada a
numerosissimi
esperimenti
(vedi
Entanglement di A. Aczel, Cortina editore,
2004, per una storia divulgativa degli
esperimenti nati a partire dagli anni 70.)
a
A
A e B sono separati da intervalli di tipo spazio, ovvero
non sono connettibili da alcun segnale, nemmeno dalla
luce
b
B
Due particelle vengono sparate in direzioni opposte e misurate nelle regioni
spazio-temporali A e B, separate da intervalli di tipo spazio. Sia  il risultato di
misura effettuato sulla prima particella in A, sia a la direzione spaziale in cui si
effettua la misura e sia l la eventuale variabile nascosta; sia  il risultato di misura
in B effettuato nella direzione b sull’altra particella. Il requisito di località di Bell è
che la probabilità congiunta pAB di ottenere  da una parte dell’esperimento e 
dall’altra è dato dal prodotto delle due probabilità singolarmente considerate. Un
altro modo per descrivere tale località è quello di affermare che gli eventi dati dai
due risultati di misura sono probabilisticamente indipendenti l’uno dall’altro e il
risultato di misura in A dipende solo dal parametro locale a e dalla variabile
nascosta. Indichiamo con p(|*a) la probabilità condizionata di ottenere il risultato
 se si misura nella direzione a e nessuna misura viene eseguita dall’altra parte
(*). Analogamente per l’altra probabilità. Si ha allora
Bell ' slocality  plAB (   | a  b)  plA ( | *a) plA ( | *b)
LB= plAB(a,b;,)  plA(a,*;) plB(b,*;)
Questa formula rende precisa l’idea originale di EPR che se c’è
località il risultato da un parte dell’esperimento non deve
dipendere da ciò che si misura dall’altra parte e addirittura dal fatto
che si faccia una misura dall’altra parte.
se un esperimento di tipo EPR-Bohm deve essere localmente
spiegabile magari anche tramite variabili l che completino la
teoria standard, allora le probabilità dei risultati di misura alle due
ali A e B dell’esperimento devono essere statisticamente
indipendenti.
Per un semplice teorema del calcolo delle probabilità, ne segue che
una qualsiasi teoria che intenda descrivere lo stato del sistema a+b
in modo locale, deve assegnare una probabilità ai due eventi che
sia uguale al prodotto delle probabilità assegnate ai due eventi di
misura presi singolarmente.
Prendiamo due particelle 1 e 2 in uno stato non
fattorizzabile:

(1, 2 )
1
2
1
1
1

  
 
2
2
2
posizionate in due zone A e B distanti nello spazio,
in cui ci sono due apparati misuratori: uno che può
misurare lo spin di a in direzione a o c, e il secondo
che può misurare lo spin di b in direzione b o d.
Consideriamo la quantità che esprime la differenza tra risultati
discordi :
El(a,b)= plAB(a,b;up, up)- plAB(a,b;up, down) plAB(a,b;down, up)+ plAB(a,b;down, down)
Per LB, si ottiene:
El(a,b)= plA(a,*;up) plB(b,*;up)- plA(a,*;up) plB(b,*;down)plA(a,*;down) plB(b,*;up)+plA(a,*;down)
plB(b,*;down)
Da cui:
El(a,b)=[plA(a,*;up)- plA(a,*;down)] [plB(b,*;up)- plB(b,*;down)](1)
Ripetiamo il calcolo per la quantità per le due direzioni a (nella
regione A) e d (nella regione B):
El(a,d) = plAB(a,d;up, up)- plAB(a,d;up, down)- plAB(a,d;down,
up)+ plAB(a,d;down, down)
Che per LB diventa:
El(a,d)= plA(a,*;up) plB(d,*;up)- plA(a,*;up) plB(d,*;down)plA(a,*;down)plB(d,*;up)+ plA(a,*;down)plB(d,*;down)
E quindi
El(a,d)= [plA(a,*;up)- plA(a,*;down)] [plB(d,*;up)- plB(d,*;down)]
(2)
Sottraendo la quantità rossa da quella blu, ovvero la 2) dalla (1), si
ottiene la (3) qui sotto:
El(a,b)- El(a,d)= [plA(a,*;up)- plA(a,*;down)]
[[plB(b,*;up)- plB(b,*;down)]- [plB(d,*;up)- plB(d,*;down)]] (3)
Ma plA(a,*;up)+ plA(a,*;down)=1, per cui
plA(a,*;up)- plA(a,*;down)=1-2 plA(a,*;down)
Poiché però 0< plA(a,*;down)<1, allora
-1 < 1-2 plA(a,*;down) < 1 e dunque, prendendo il valore assoluto
|1- 2 plA(a,*;down)|< 1
(4)
Poiché il valore assoluto del prodotto di due numeri è uguale al
prodotto dei valori assoluti dei due numeri, applicando la (4), si ha:
|El(a,b)- El(a,d)| = |1-2plA(a,*;down)|
|[[plB(b,*;up)-plB(b,*;down)]-[plB(d,*;up)- plB(d,*;down)]]|
|El(a,b)- El(a,d)| < |[plB(b,*;up)- plB(b,*;down)]- [(plB(d,*;up)plB(d,*;down)]|
(5)
Consideriamo adesso l’altra direzione c lungo cui è possibile
misurare la particella nell’ala A dell’esperimento.
Con lo stesso ragionamento si riottiene la (5) dell’ultimo lucido, con
l’unica differenza data dalla variabile c al posto di a e dal segno +:
|El(c,b) + El(c,d)| < |[[plB(b,*;up)- plB(b,*;down)] + [plB(d,*;up)plB(d,*;down)]]|
(6)
Sommando la (5) e la (6) si ottiene:
|El(a,b)-El(a,d)| + |El(c,b)+El(c,d)| < |[[plB(b,*;up)plB(b,*;down)] - [plB(d,*;up)- plB(d,*;down)]]| +
+ |[[plB(b,*;up)- plB(b,*;down)]+ [plB(d,*;up)- plB(d,*;down)]]|
r
s
|El(a,b)-El(a,d)| + |El(c,b)+El(c,d)| < |r-s|+|r-s|
r+s
r-s
r
Positivo
Positivo
s
r+s + rs
2r
-2s
Positivo Positivo
Negativ
Negativ
o
o
Negativ Positivo
Positivo 2s
Si noti
o che nella prima fila si ha r-s + r-s = 2r, nella seconda r-s –r-s
= -2s,Negativ
nella terzaNegativ
–r+s+r+s=2s
e nell’ultima –2r. Ricordando
che
Negativ
-2r
o ], e s = [plB(d,*;up)- plB(d,*;down)]
r = [polB(b,*;up)-oplB(b,*;down)
e che |1- 2 plA(a,*;down)|< 1
si ha che sia r che s sono minori o uguali a 1. Ne segue la DB:
|El(a,b) - El(a,d)| + |El(c,b)+El(c,d)| < 2
La dimostrazione di Bell, però, vuole considerare la possibilità che
una eventuale completamente locale della MQ sia governata da
variabili l che noi non possiamo controllare, e di cui, perciò, non
conosciamo il valore se non in senso statistico.
Perché la disuguaglianza appena provata valga anche per una
teoria a variabili nascoste che riproduca le previsioni statistiche
quantistiche, dobbiamo fare una media pesata della quantità che è
argomento della disuguaglianza rispetto una distribuzione di
probabilità r(l) su l, che è poi l’unica quantità fisicamente
misurabile:
E(a, b ) 
 Eλ (a, b )r(l )dl
(7)
In questo caso r(l) è la funzione che riproduce la distribuzione di
probabilità che risulta dal procedimento di preparazione del sistema
Dimostriamo che anche la media E(a,b) soddisfa la disuguaglianza
vista prima, per cui
|E(a,b)-E(a,d)| + |E(c,b)+E(c,d)| < 2
Per la dimostrazione, oltre alla (7), usiamo il fatto che la funzione
r(l) è positiva e il suo integrale è unitario (è una probablità) e il
fatto che l’integrale di un modulo maggiora il modulo
dell’integrale:
E(a, b) - E(a, d)  E(c, b)  E(c, d) 
 dlr(l)[E (a, b) - E (a, d)]   dlr(l)[E (c, b) - E (c, d)] 
l
l
l
l
 dlr(l) [E (a, b) - E (a, d)]   dlr(l) [E (c, b) - E (c, d)] 
l
l
l
l
 dlr(l)( [E (a, b) - E (a, d)]  [E (c, b) - E (c, d)] )  2 dlr(l)  2
l
l
l
l
E(a, b) - E(a, d)  E(c, b)  E(c, d)  2
Questa è la disuguaglianza di Bell nella forma di Clauser, Horne,
Shimony e Holt (1969)
Tale disuguaglianza è violata dalla MQ. In MQ le probabilità
congiunte relative ai risultati delle misure in A e in B, relativi
all’angolo ab compreso tra le due direzioni a e b sono:
plAB(a,b;up, up)= plAB(a,b; down, down)=1/2 sin2(ab)
plAB(a,b;up, down)= plAB(a,b; down, up)=1/2 cos2(ab)
Da cui si deriva che per la MQ:
El (a,b) = 1/2 sin2(ab) + 1/2 sin2(ab) - 1/2 cos2(ab) -1/2 cos2(ab)
=-cos (2ab)
Se applichiamo alla quantità
El(a,b)-El(a,d) + El(c,b)+El(c,d)
queste probabilità su determinati angoli a=0°, b=22.5°, c=45°,
e d=67.5° , si ottiene un valore maggiore di 2, per cui si
dimostra che le probabilità della MQ violano la disuguaglianza
data.
Bell, infine dimostra che la differenza tra E(a,b)=-cos(a-b)
calcolato dalla MQ e E(a,b) calcolato da una teoria locale, non
può essere resa arbitrariamente piccola.
Per cui, conclude Bell, “the quantum mechanical expectation
value cannot be represented, either accurately, or arbitrarily
closely, in the form
E(a, b )   dlr (l )E λ (a, b )
“On the Einstein-Podolsky-Rosen paradox”, J. S. Bell. 1964.
In “Speakable and unspeakable in quantum mechanics”.
Rimane in effetti ancora una possibilità che salverebbe la
località della MQ.
Si può ipotizzare che la semplice sistemazione dell’apparato
misuratore di A in posizione a, piuttosto che in c, influenzi il
risultato della misura su B e che tale influenza sia locale. La
sistemazione di un apparato misuratore, infatti, non è
un’operazione eseguibile in un lasso di tempo abbastanza
breve da poter cominciare dopo l’emissione delle particelle e
terminare prima del loro arrivo agli apparati- va dunque
eseguita prima dell’emissione delle particelle dalla fonte.
Ciò significa che un segnale (un processo causale,
un’informazione..) mandato dall’apparato misuratore sino alle
particelle (o sino all’altro apparato) avrebbe tutto il tempo di
influenzare la misura all’altro capo dell’esperimento
mantenendo sempre una velocità al di sotto di quella della
luce.
C’è quindi la possibilità, che la MQ sia una teoria di limitata
validità:
“Essa si potrebbe applicare unicamente ad esperimenti in cui le
sistemazioni degli strumenti sono fatte sufficientemente in anticipo
per permettere ad essi di raggiungere qualche mutuo rapporto
tramite scambio di segnali con velocità minore o uguale a quella
della luce.”
Per dare una risposta definitiva a tale questione fu necessario
aspettare sino al 1982, quando l’esperimento di Alain Aspect
falsificò questa ipotesi.
Il risultato dell’esperimento di Aspect è che le previsioni della
MQ vengono nuovamente rispettate: questo esperimento è
considerato la prova definitiva che la MQ non può subire un
completamento locale.
7.4 Il significato concettuale
del teorema di Bell e degli
esperimenti ad esso seguiti
Si noti che la teoria a variabili nascoste considerata è del tutto generale,
nel senso che l fissa le probabilità dei risultati, e nulla impedisce che
tali probabilità siano sempre 0 o 1, e si abbia dunque a che fare con una
teoria deterministica. Nel caso in cui le disuguaglianze di Bell siano
violate sperimentalmente, come effettivamente accade, si è così
dimostrato che non può esistere una teoria a variabili nascoste
(stocastica o deterministica che sia) che sia anche locale nel senso di
Bell.
Più in generale e tornando a EPR, ne segue che se l’alternativa posta da
EPR era tra completezza e località della MQ, qualunque teoria che
riproduca le correlazioni quantistiche può essere completa solo se nonlocale nel senso di Bell! La prova formale di questa asserzione è data
nella pagina seguente. Ne segue, per esempio, che la luna c’è solo se la
si osserva, nel senso che se le proprietà di spin in una direzione non
preesistono alla misura; piuttosto, esse sono create a distanza dalla
misura, ovvero dall’atto di osservare!
Molti fisici asseriscono che la violazione sperimentale delle disuguaglianze di
Bell conferma la meccanica quantistica a scapito della teoria a variabili nascoste.
Ma una teoria a variabili nascoste non-locale è compatibile con i dati sperimentali
e non è refutata da questi. Inoltre, l’ipotesi di definitezza delle proprietà o
realismo non è necessaria per ricavare le disuguaglianze stesse, cosicché anche la
MQ è non-locale.
1)Anticorr 100% & LB  Determinismo (dimostrata nella p. seguente)
2)Determinismo & LB  Dis. Bell
(teorema di Bell)
3)MQ  -(Dis. Bell)
4) - Dis. Bell -Determinismo v –LB (dalla 2)
nella seconda alternativa QED da 3 e 4,per cui esaminiamo solo la prima alternativa
5)-Determinismo-Anticorr 100% v –LB (dalla 1)
ma la prima alternativa è falsa perché MQ implica Anticor 100% e rimane la seconda
6) MQ-LB
QED
Se valgono le anti-correlazioni perfette, per una stessa direzione
n, qualunque essa sia,non si hanno mai risultati identici, mentre è
equiprobabile ottenere +1 a destra e –1 a sinistra o viceversa
plAB (n, n | 1,1)  0  plAB (n, n | 1,1)
p
AB
l
1
(n, n | 1,1)   plAB (n, n | 1,1)
2
Dalla prima equazione a sinistra, applicando LB, e ricordando
A (n | *  1)
p
che i risultati
sono
1
o
–1,
si
ottiene
che
o
è
nullo
o
l
l
p (n | *  1)
è nullo B
. Non sono nulli entrambi per le ultime 2
equazioni della pagina, ovvero non si può avere –1 da entrambe
le parti con prob. 1, perché il prodotto deve dare 0
plAB (n, n | 1,1)  plA (n | *  1) plB (n | *  1)  0 
1) plA (n | *  1)  0  plA (n | *  1)  1 oppure
2) plB (n | *  1)  0  plB (n | *  1)  1
plAB (n, n | 1,1)  plA (n | *  1) plB (n | *  1)  0
Dalla 1) e da questa eq. si ricava che se plA (n | *  1)  1 allora
plB (n | *  1)  0 E quindi anche che plB (n | *  1)  1
In sintesi, dalla 1) si ricava che
plA (n | *  1)  0, plA (n | * 1)  1 plB (n | * 1)  0, plB (n | *  1)  1
Ragionando sulla 2) nell’identico modo, si hanno le seguenti
relazioni, che completano la dimostrazione:
plA (n | *  1)  0, plA (n | *  1)  1
plB (n | *  1)  0  plB (n | *  1)  1
ogni probabilità relativa a una sola misura può quindi assumere solo
i valori 1 e 0 e, nell’ipotesi di anticorr.100% e di LB, vale quindi il
determinismo
Riassumendo, la disuguaglianza di Bell, che è
tanto
semplice
matematicamente
quanto
concettualmente ricca, è deducibile solo da LB (la
condizione di località di Bell) e dalle predizioni di
anticorrelazione
quantistiche.
Poiché
la
disuguaglianza è violata sperimentalmente, se si
vogliono
riprodurre
le
predizioni
di
anticorrelazione, si deve abbandonare la nonlocalità di Bell. In questo senso, qualunque teoria
che riproduce le anticorrelazioni (e dunque anche
la MQ “ordinaria”) è non-locale nel senso di Bell.
È in questo senso che gli esperimenti hanno
provato che la natura stessa è non-locale: un
esempio di metafisica sperimentale
7.5 Non-località e segnali
superluminale
Ovvero, il rapporto tra QM e
relatività speciale: coesistenza
pacifica
Indichiamo con W(1,2) l’operatore statistico relativo a un
insieme composto S =S1 +S2 supponendo di avere a che
fare con un insieme statistico (non omogeneo) di tali
sistemi S. Restringiamo la nostra attenzione al sistema
S1 e ad una sua osservabile A1, costruendo l’operatore
relativo al sistema composto A1 I2 con A operatore
limitato di S1 e I operatore identità di S2. In generale,
ricordiamo che per un operatore B limitato e uno stato
puro  si ha
Tr (P B)   i P Bi idem.  i P 2  Bi  hermit.  P i P Bi 
i
i
i
 P 1   P B  herm. P  B   |B   B 
Per una miscela di stati puri, ognuno dei quali ha
probabilità pa ,il valor medio di un operatore B è dato dal
prodotto delle probabilità per i valori medi che possono
assumeri i sistemi nei vari stati a
<B>=Sa pa <a|B| a >= Sa pa Tr (PaB)=Tr(WB)
Dove W= Sa paPa
Valutando la traccia su una base fattorizzata f1c2
calcoliamo il valore medio o aspettato di S1I2
Tr[(S1 I2 )W]=

f1i  2 j ( A1  I 2 )W 1, 2 f1i  2 j
=
ij

i
fi A  
1
1
j
2
j
W 
1, 2 2
j
2
fi

1
1
i
~1 1
~1
1
fi A W fi  Tr ( A W )
1
1
1
L’operatore W1tilde= Sj  2 j W 1, 2 2 j
2
è un operatore di H1
Come si vede, la fisica dell’insieme statistico di S1 si può
descrivere utilizzando l’operatore statistico ridotto W1 tilde,
ottenuto facendo la traccia, nello spazio di Hilbert H2,
dell’operatore statistico W1,2 relativo all’insieme dei
sistemi composti (ciò corrisponde a porre lo stesso indice
e a sommare i valori degli indici del secondo sistema:
vedi nota 23, p. 440, Ghirardi)
~1
W  Tr ( 2)W 1, 2    2 r W 1, 2 2 r
5.3
r
Se S1 è omogeneo, W1,2 coincide con un proiettore P1,2
che proietta su uno stato monodimensionale 1,2
2
~1
1
2
1
,
2
2
1
,
2
2
W  Tr P y    r P y  r   pi Pi , pi   cij
r
i
j
P1 è l’operatore di S1 associato allo stato f1i.. Poiché se lo stato 1,2
non è fattorizzato l’ultima somma della pagina precedente contiene più
di un termine, l’operatore statistico W1 non è idempotente, e quindi dal
punto di vista del componente S1 l’insieme è come se fosse una
miscela statistica, malgrado lo stato composto S sia puro. Ne segue
che, per esempio, eseguendo misure solo su uno dei due stati di
singoletto, non si può distinguere lo stato puro da un’opportuna
miscela di stati puri di spin, mentre le misure di correlazione sui due
sistemi mostrano l’entanglement. Tornando ora al nostro problema, sia
Ps la famiglia di proiettori di un operatore discreto: la misura trasforma
l’operatore statistico Wprima nell’operatore
Wdopo = Ss Ps Wprima Ps
5.4
Supponiamo ora di misurare S2 e siano Ps(2) gli operatori di proiezione
sulle autovarietà corrispondenti:
W1,2 (misura) W#dopo1,2 = Ss Ps2 Wprima1,2 Ps2
5.5
D’altra parte, sulla base di ciò che abbiamo visto in 5.3,
qualunque informazione statistica relativa al sistema 1 si
ottiene considerando l’operatore statistico ridotto W#(1),
ottenuto facendo la traccia parziale sullo spazio H2
dell’operatore statistico del sistema composto W1,2
W#(1)=Tr (2)(W#dopo1,2 ) = Tr (2) (SsP2sW1,2prima P2s) =
Ss Tr(2) (P2sW1,2 P2s)=ciclicità traccia Ss Tr(2)(P2sP2sW1,2)=idempot P
Tr (2) (Ss P2s)W1,2 = Tr (2) IW1,2 = W1tilde per la 5.3
L’istantanea riduzione del pacchetto non consente effetti superluminali, visto che
l’operatore statistico W#(1) che si deve usare per valutare la probabilità di eventi
fisici relativi a S1 nel caso in cui l’altro composto è stato assoggettato a misura è
uguale all’operatore statistico W1tilde che andrebbe utilizzato per la descrizione del
sottosistema S1 prima che si sia effettuata una misura.(Ghirardi p. 461). Si tratta
quindi non di una azione ma di una passione a distanza
Per ciascuno di due osservatori ai lati di un
esperimento di tipo Aspect, fatto con spin o con fotoni
polarizzati, si ottiene una successione casuale sia che
si misuri la polarizzazione e lo spin anche dall’altra
parte sia che non si misuri: dunque c’è una “località di
tipo statistico,” perché dal tipo di successione che si
ottiene da una parte o dall’altra (perfettamente
random) non c’è modo di sapere se l’altro ha misurato
oppure no. In altre parole, ciascun osservatore, non
potendo controllare l’esito delle misure, non può
mandare segnali utilizzando la non-località.
Per concludere, osserviamo che la non località in questione NON
può essere utilizzata per mandare segnali istantanei a distanza: ne
segue che secondo molti studiosi (ma non tutti, vedi Maudlin,
Quantum nonlocality and relativity) si può parlare di una
“coesistenza pacifica” tra relatività speciale e meccanica quantistica,
malgrado la violazione della località secondo Bell, ovvero malgado
la non fattorizzabilità della probabilità di un sistema in stato di
singoletto.
La differenza che passa tra possibilità di segnalare e nonfattorizzabilità può anche vedersi come la differenza che c’è tra la
indipendenza dal parametro e la indipendenza dal risultato di
misura. Se ci fosse dipendenza del risultato di misura in A dal
parametro lontano in B, cambiando il tipo di misurazione potrei
inviare segnali a distanza. La dipendenza probabilistica tra i risultati
di misura implica invece solo una sorta di non-separabilità tra due
sistemi posti in un certo stato, indipendentemente dalla distanza cui
si trovano (questo rende la non-separabilità diversa dalla gravità
nella meccanica newtoniana).
Capitolo 8
Il problema delle variabili nascoste
• Nel
1952
Bohm
mostrò
che
un
completamento della meccanica quantistica
non-relativistica, da von Neumann ritenuto
impossibile, era invece realizzabile!
• Le variabile nascoste sono le posizioni delle
particelle, che non sono così nascoste, visto
che vengono rivelate da ogni misura.
• Le posizioni sono le uniche osservabili non
contestuali, mentre tutte le altre proprietà di
un microsistema dipendono dal contesto di
misurazione, proprio come aveva insegnato
Bohr
Riassumiamo nel simbolo l tutte le variabili addizionali o
nascoste. Se A è un’osservabile del microsistema in oggetto,
assegnata l, la funzione A(l) deve avere un valore preciso
appartenente allo spettro discreto o continuo dell’operatore stesso
Tutto il contenuto empirico della meccanica quantistica è espresso
dalla conoscenza del valore medio <A> dell’osservabile A. Si
assume quindi che le variabili nascoste l e L siano distribuite
secondo una funzione a valori reali e positiva r(l)  0, che è una
misura di probabilità (densità di probabilità) il cui integrale deve
dare 1. La probabilità che il valore l sia compreso tra l e dl è
r(l)dl
 r(l)dl  1
 A   A |    A(l)r(l)dl
L
Ancora sul teorema di
impossibilità di von Neumann
La conoscenza della variabile nascosta l, che caratterizza in
modo completo il sistema, permetterebbe di conoscere il valore
A(l) di ogni osservabile A del sistema in funzione di l. A(l)
deve appartenere allo spettro dell’operatore autoaggiunto A che
la teoria gli associa
 Le variabili sono però non accessibili in linea di principio e
quindi dobbiamo usare le probabilità, che diventano però
epistemiche, nello stesso identico senso in cui lo sono in
meccanica statistica classica. Si consideri un’osservabile che è
combinazione lineare di altre osservabili:
0 1
0  i
1 0 
nx  
n y  
nz
s n  
1 0
i 0 
 0  1
Più in generale, consideriamo un’osservabile C che è
combinazione lineare con coefficienti reali di altre due
osservabili C = aA +bB
In generale, vale anche in MQ come in meccanica classica che il valor medio
della combinazione lineare è la combinazione lineare dei valori medi dei
termini della combinazione
 |C   a  | A   b  |B 
Per il suo “no-go theorem” contro le variabili nascoste (contro l’idea che si
possano assegnare valori precisi a tutte le osservabili), von Neumann assunse
che un’eventuale teoria che completasse la MQ dovrebbe soddisfare le stesse
condizioni di linearità che soddisfano i valori medi anche per le variabili
nascoste. Ovvero, il suo teorema di impossibilità assume che in una teoria a
variabili nascoste in cui un’osservabile risulti combinazione lineare di altre, i
valori precisi o certi A(l), B(l), C(l) delle osservabili, che vengono assunti
quando si specificano le variabili nascoste, devono soddisfare le stesse
condizioni che valgono per i valori medi:
C(l) = aA(l) + bB(l)
*
Ma questa premessa è irragionevole se i valori A(l) devono
coincidere con gli autovalori. Nell’esempio dello spin, se
1
nx  n y  nz 
 sn (l)  [s x (l)  s y (l)  s z (l)] / 3
3
Poichè le quantità certe si (l) devono coincidere con gli autovalori
degli osservabili relativi alle matrici di spin, essi devono valere +1
cosicché
s n (l )  k /
3
k  3,1,1,3
Ma poiché deve valere anche per la componente di spin lungo n che
sn (l)  1
si ha un risultato impossibile! Ne segue che la premessa * è
irragionevole e Bohm (1952) fornì un controesempio al teorema di von
Neumann
Immaginiamo una particella che si muove in una
dimensione. |(x)|2 rappresenta come sappiamo la densità
di probabilità che la particella sia nel punto x se se ne
misura la posizione. L’idea di Bohm è che se si prepara un
sistema in modo identico n volte, a causa del fatto che non
si può gestirlo in modo assoluto, ogni volta la sua
posizione sarà leggermente diversa: esiste quindi sempre
un intervallo di imprecisione nella posizione, che
corrisponde, nella visione tradizionale della teoria,
all’intervallo in cui si troverebbe la particella se si andasse
a misurarla. Per Bohm la posizione di ogni particella è
però sempre oggettivamente e realmente posseduta, e la
distribuzione delle posizioni delle n particelle individuali
riproduce la densità di probabilità associata dalla funzione
d’onda a un unico sistema la cui posizione prima della
misura è indefinita
La meccanica bohmiana
Non vi è modo di preparare un sistema in cui la posizione sia determinata in
modo assoluto, per cui l’osservatore non la può conoscere: di qui l’uso della
probabilità. Si prendono N particelle e si definiscono N campi di velocità. La
velocità di una particella i dipende in modo non locale e olistico dalla posizione di
tutte le altre e soddisfa a una equazione differenziale che lega le velocità alle
posizioni, e che insieme all’eq.deterministica di Schroedinger, reinstaura il
determinismo completo della MQ non relativistica
(r1 , r2 ,.....rn , t ) n   2
i

Di (r1 , r2 ,...., rn , t )  V (r1 , r2 ,...., rn )(r1 , r2 ,.....rn , t ) 1
t
i 1 2M i
Prima si determina una soluzione (r1,r2,…rn,t) dell’equazione di
Schroedinger (qui sopra) rispetto a date condizioni iniziali e poi, in
funzione della soluzione ricavata, si definiscono N campi di velocità
   
vi
  
vi (r1 , r2 ,...rN , t ) 
dove
j (r1 , r2 ,...rN , t )
   2
1 (r1 , r2 ,...rN , t )
f 
f  f  f 
i
j
z
x
y
z
   
  
  
ih
j (r1 , r2 ,...rN , t ) 
[ (r1 , r2 ,...rN , t )i  *1 (r1 , r2 ,...rN , t ) 
   2 p2 M i   
  *1 (r1 , r2 ,...rN , t )i  (r1 , r2 ,...rN , t )]
dri 
 v i ( x1 , x2 ,...xn , t ) x r , x r ..., x r
1 1 2 2
n n
dt
2
Date la funzione d’onda al tempo t =0 e le posizioni
iniziali ri(0), la soluzione delle due equazioni
differenziali 1 e 2 determinano a ogni istante curve o
traiettorie ben definite nello spazio-tempo. Prendiamo
l’equazione a una particella e poi moltiplichiamo per *
a sinistra entrambi i membri
 (r , t )
i
i
[
D  V (r )] (r , t )
t
2m

 * (r , t )
 (r , t )
t
i
i
  * (r , t )[ D  V (r )] (r , t )
2m

Facciamo lo stesso per la complessa coniugata
dell’equazione di Schroedinger, moltiplicandola per  a
sinistra e poi sommiamo le due equazione così ottenute
 * (r , t )
t
 (r , t )
i
i
 [
D  V (r )] * (r , t )
2m

 * (r , t )
t
i
i
 (r, t )[ D  V (r )] * (r, t )
2m

 ( (r , t ) * (r , t ))
i

( (r , t ) * D ( r , t )   (r , t )D * (r , t ) 
t
2m

i
 div[
( (r , t ) *  ( r , t )   (r , t ) * (r , t ))]   divj ( r , t )
2m
Se v(r,t) e r(r,t) sono velocità e densità di un fluido, le
equazioni di conservazione della massa danno

r(r , t )
 divj (r , t )  0
t
j (r , t )  r(r , t )v(r , t )
Si osservi la corrispondenza formale tra densità del
fluido r e densità di probabilità ||2   * , che
obbediscono alla stessa equazione differenziale. Così
r(r,0) |(r,0|2 implica che la stessa eguaglianza vale
al tempo t.
L’insieme statistico che ha la distribuzione di posizioni
|(r,0|2 evolve dunque nell’insieme che corrisponde
all’evoluta dell’equazione di Schroedinger |(r,t|2
Derivazione delle equazioni di Bohm per una
particella
(1)
Cominciamo a scrivere l’equazione di Schroedinger (1) in forma
polare, scrivendo prima la funzione (r,t) in forma polare
(2)
Calcoliamo la derivata parziale rispetto al tempo (per la e, si applica
la chain rule, ovvero si deriva parzialmente la e rispetto a S e poi si
moltiplica per la parziale di S rispetto a t)
(3)
Per calcolare il laplaciano, calcoliamo prima il gradiente di 
(4)
E poi applichiamo di nuovo l’operatore “del”, per ottenere
(5)
Sostituendo la 3 e la 5 nell’equazione di Schroedinger, si ha
A i S
2 2
A
i
2
i(  A )   [ A  (S )  (2AS  A 2 S )]  UA
t  t
2m
2

(abbiamo diviso per il fattore esponenziale comune ai 2 membri)
Raccogliendo ora la parte reale e quella immaginaria della funzione
d’onda scritta in forma polare, si ottengono due equazioni:
(6)
Dividendo per A e raccogliendo i termini con S a sinistra, otteniamo
(7)
La parte immaginaria dà invece (dividendo per il fattore i):
(8)
Moltiplichiamo per
2A / 
e riscriviamo
Trasformazioni ausiliarie
A2 f A
A

 2A
t
A t
t
f  A2
 ( A. A) A
A
A

A A
 2A
t
t
t
t
DA2  D( A. A)  2 ADA
(9)
Eq. di Bohm
(10)
Come si vede immediatamente, nella (10), per
 0
si ottiene l’equazione classica di Hamilton-Jacobi per il moto
di una particella in un potenziale U, con il momento p2= (S ) 2
Eq. HamiltonJacobi classica
Richiamo su Hamilton-Jacobi
In generale, passando da variabili qi e pi definite nello spazio delle fasi ad altre
variabili Qi e Pi l’equazione di Hamilton non è preservata. Però, se la
trasformazione in questione è canonica, ovvero, se la funzione generatrice S
obbedisce alle seguenti relazioni:
pi 
S ( q, p, t )
S ( q, p, t )
S
; Qi 
; H  H ( q, p, t ) 
qi
Pi
t
allora le equazioni di Hamilton sono preservate. Se in più si ha che H=0,
allora le due eq. di Hamilton rispetto alla nuova funzione
H
H
Q i 
 0; Pi  
0
Pi
Qi
forniscono due costanti del moto.
Se si ha che le pi in S = (qi ,pi , t) sono date da questa relazione
Allora l’annullarsi della nuova hamiltoniana H è equivalente alla
seguente condizione
che è appunto l’equazione di Hamilton Jacobi cercata
Nella (10),
2 2 A
Q
2m A
è il potenziale quantistico
Cosicché l’equazione quantistica di Hamilton-Jacobi è
S (S ) 2

U  Q  0
t
2m
Mentre l’equazione del moto della particella è, ovviamente,
dv
m
 (U )  (Q)
dt
Dove, a fianco di una forza classica, c’è una forza quantistica
 (Q )
La particella è dunque guidata (e accelerata) dal campo quantistico!!!
A differenza di un campo classico, il campo quantistico non
può essere influenzato dalle particelle e non ha sorgenti
Moltiplicando il campo per una costante, la sua azione non
varia, perché A è sia a numeratore che a denominatore di Q:
2 2 A
Q
2m A
Ciò significa che l’effetto del potenziale quantistico dipende
solo dalla sua forma e non dalla sua intensità: un elettrone si
muove con la sua energia e il potenziale o l’onda lo guida e lo
dirige, come una macchinetta teleguidata
L’effetto del campo è altamente non-locale, cioè non dipende
dalla distanza, in un modo che è stato verificato
sperimentalmente
Il concetto di informazione attiva: qualcosa che ha poca energia
guida ciò che ha molta più energia e fa ciò in modo non meccanico!
Anche nel meccanismo di duplicazione del DNA, l’energia è data
dalla cellula, e dall’ambiente, ma la informazione attiva è data dalla
forma del DNA. La parte del DNA che non viene copiata è solo
potenzialmente attiva.
La capacità di compiere lavoro viene dalle particelle, e non si
origina nel campo; le prime potrebbero avere una struttura interna.
Poiché un sistema di fenditure diverso produce un campo Q
diverso, un esperimento quantistico e la meccanica quantistica sono
olistiche: detto semplicemente, il moto dell’elettrone non può essere
discusso astraendo da tutto il contesto sperimentale (Bohr)
Riprendiamo la forma polare della funzione d’onda
(r, t )  A(r, t )eiS / 
Poiché ||2*, la probab. di trovare la particella =P=A2
A2
S
P
S
2
 .( A
)0
 .( P
)0
t
2m
t
2m
La prima a sinistra del segno di conseg. logica è la (9), la seconda
è l’equazione di continuità per la densità di probabilità P, ma il
ruolo fondamentale di A = ||2 non è quello di determinare la
probabilità di trovare un’osservabile con un certo autovalore se si
va a fare una misura, ma di definire il potenziale quantistico Q.
La P in questa interpretazione è epistemica, e dunque simile alla
meccanica statistica classica
I teoremi limitativi dopo von
Neumann: la contestualità delle
teorie
a
variabili
nascoste:
VD+NC+MQ
=
contraddizione
VD= ogni sistema quantistico ha tutti i
valori delle osservabili simultaneamente
definiti (definitezza proprietà, o realismo)
NC ogni valore dell’osservabile di un
sistema non dipende da quali altri valori
sono misurati insieme ad esso (non
contestualità)
Gleason e Kochen-Specker rimediano all’assunzione troppo
forte del teorema di additività di Von neumann fatta per
qualunque osservabile supponendo che la [5] di quel teorema
(vedi p. 52 e vedi * p. 195) valga solo per osservabili
compatibili, tesi che non è messa in discussione dai teorici
delle variabili nascoste.
Teorema di Gleason:In uno spazio di Hilbert di dimensione >
3, le uniche possibili misure di probabilità sono le misure
[7]
μ (Pα) = Tr(Pα W),
in cui Pα è un operatore di proiezione, W è l’operatore
statistico che rappresenta lo stato del sistema e Tr l’operatore
traccia.
“The Pα can be understood as representing yes-no observables, i.e. questions
concerning whether a QM system represented by a Hilbert space of dimension
greater than or equal to 3 has a property α or not, and every possible property α
is associated uniquely with a vector |α> in the Hilbert space -- so, the task is to
unambiguously assign probabilities to all vectors in the space. Now, the QM
measure μ is continuous, so Gleason's theorem in effect proves that every
probability assignment to all the possible properties in a three-dimensional
Hilbert space must be continuous, i.e. must map all vectors in the space
continuously into the interval [0, 1]. On the other hand, an HV theory (if
characterized by VD + NC) would imply that of every property we can say
whether the system has it or not. This yields a trivial probability function which
maps all the Pi to either 1 or 0, and, provided that values 1 and 0 both occur
(which follows trivially from interpreting the numbers as probabilities), this
function must clearly be discontinuous” (C. Held, The Kochen-Specker
Theorem, p. 4) (Redhead 1987, Incompleteness and non-locality in QM, p.28)
Bell nel 1966 produce un teorema contro le variabili
nascoste che poi critica mettendone in discussione una
premessa. Egli prova che mentre la funzione di
probabilità quantistica μ richiede che due vettori |α> and
|α′> mappati in 1 e 0 non possano essere arbitrariamente
vicini, perché devono avere una certa separazione
angolare, la funzione che assume come valori delle
variabili nascoste richiede invece che i due vettori siano
arbitrariamente vicini. La contraddizione si elimina
mettendo
in
discussione
una
premessa
di
noncontestualità: “it was tacitly assumed that
measurement of an observable must yield the same value
independently of what other measurements may be made
simultaneously” (Bell, 1987, p. 9).
In altre parole, malgrado Gleason supponga compatibilità
tra coppie di osservabili che entrano nella [5], è possibile
che la stessa osservabile V prenda valori diversi se
misurata con W o se misurata con Y, anche se V e W
sono tra loro compatibili e V e Y pure.
La differenza tra Kochen-Specker e i due teoremi che
abbiamo sommariamente esposto è che mentre i primi
assumono un continuum di osservabili, KS indeboliscono
questo assunto mostrando che persino con un numero
finito di osservabili discrete si ha incompatibilità tra NC
(noncontestualità), Value Definiteness e QM. Si rimuove
così una possibile obiezione contro il no-go theorem di
Gleason.
Formulazione del teorema KS
Sia H è uno spazio di Hilbert di dimensioni x > 3, contenente
un numero finito y di osservabili in un insieme M, definite da
operatori corrispondenti su H. Allora per specifici valori di x e
di y, le due assunzioni qui riportate sono contraddittorie:
(KS1) Definitezza di valori: tutti i membri y di M hanno valori
simultanei, ovvero per tre osservabili qualsiasi A B e C, v(A),
v(B), v(C) sono numeri reali simultaneamenti definiti;
(KS2)
I valori delle osservabili obbediscono ai seguenti
vincoli:
(a) Se A, B, C sono tutte compatibili e C=A+B, allora
v(C)= v(A) + v(B);
(a) If A, B, C sono tutti compatibili e C=AB, allora v(C)=
v(A)v(B)
La regola della somma e quella del prodotto sono
conseguenze di un principio di composizione funzionale
chiamato FUNC, che a sua volta, come vedremo,
discende da un’ipotesi di non-contestualità.
Nel teorema originale di KS, x =3 e y = 117. Ci sono però
teorema più recenti, validi per x = 3 e y = 33 (Peres 1995,
pp.197-199) e Kernaghan (1994) per x = 4 e y =20,
quest’ultimo più debole degli altri due
Il teorema di Karnaghan (x=4 e y =20)
Come vedremo, dalla (KS2) si può derivare la seguente condizione
sugli operatori Pi , corrispondenti a quattro distinti autovalori q1, q2,
q3, q4 di un’osservabile Q su H4:
(VC1’) v(P1) + v(P2) + v(P3) + v(P4) = 1, dove
v(Pi) = 1 o 0 , per
i = 1, 2, 3, 4.
Passando a uno spazio di Hilbert con scalari nel campo reale (il
teorema vale lo stesso anche in questo caso, perché se
l’assegnazione di valori definiti è impossibili nello spazio di Hilbert
definito sui reali (R3), allora è impossibile su H3 definito sul
campo complesso), possiamo tradurre la condizione (VC’) nella
richiesta che in ogni quadrupla di raggi ortogonali in tale spazio
esattamente uno deve essere colorato in bianco - v(Pi) = 1 - e gli
altri tre in nero - v(Pi) = 0 - ciò che è impossibile
1,0,0,0 1,0,0,0
1,0,0,0
1,0,0,0 -1,1,1,1 -1,1,1,1
1,-1,1,1
1,1,-1,1 0,1,-1,0 0,0,1,-1
1,0,1,0
0,1,0,0 0,1,0,0
0,0,1,0
0,0,0,1 1,-1,1,1
1,1,-1,1 1,1,1,-1 1,0,0,-1 1,-1,0,0
0,1,0,1
0,0,1,0 0,0,1,1
0,1,0,1
0,1,1,0
0,1,1,0
1,1,-1,-1
1,1,-1,1
1,1,-1,1 1,0,1, 0
0,0,0,1 0,0,1,-1 0,1,0,-1 0,1,-1,0 1,1,1,-1 0,1,0,-1 1,0,0,-1
0,0,1,1
1,1,1,1
1,1,1,1
1,-1,0,0 1,-1,-1,1 1,1,-1,-1 1,-1,-1,1
Nella tabella, costituita da 44 elementi, ci sono 20 raggi distinti, perché 20 sono le
osservabili considerate. In ognuna delle 11 colonne ci sono 4 raggi ortogonali (x =
4= dimensioni dello spazio): ci sono dunque 44 elementi, alcuni dei quali sono
ripetuti 2 o 4 volte. Per specificare un raggio o una linea che passi per l’origine
basta dare le coordinate della retta che passa per l’origine (non specificata) e per il
punto. Per esempio, "1,0,0,0" denota l’asse x. Dato che il numero delle colonne è
dispari, e i quattro vettori di ogni colonna sono ortogonali, per la condizione VC1’ il
numero totale dei bianchi deve essere dispari (infatti in ogni insieme di vettori
ortogonali c’è solo un raggio colorato di bianco). D’altra parte, si vede che ogni
raggio è ripetuto nella tabella o 2 o 4 volte; poiché a causa della premessa di
noncontestualità, uno stesso raggio, anche se in colonne diverse, riceve sempre lo
stesso colore (valore), ne segue che ogni volta che uno di questi raggi in una
colonna è bianco (esattamente uno deve esserlo), dobbiamo colorare un numero
pari di raggi bianchi. Ne segue che il numero totali di raggi bianchi deve essere
pari, e quindi la contraddizione è provata!
L’idea del teorema di Kochen-Specker
L’idea del teorema, che presuppone uno spazio di Hilbert
di dimensioni x=3, è che, come prima, per ogni insieme di
triple ortogonali in H3, un raggio vale 1 e gli altri due 0 e
si pone dunque lo stesso problema di colorare due raggi di
nero e uno di bianco. Per ottenere queste condizioni, si
considera un arbitrario operatore Q, con autovettori |q1>,
|q2>, |q3>, e relativi autovalori distinti q1 q2 q3. Si
considerano 3 proiettori P1, P2, P3 che proiettano sui tre
autovettori di cui sopra e che sono ovviamente degli
osservabili “si-no”, dato che Pi corrisponde alla domanda
sperimentale: “il sistema ha il valore qi per l’osservabile
Q?”
Poiché i tre proiettori Pi sono per ipotesi mutualmente
compatibili, possiamo applicare ad essi la regola della
somma e del prodotto e derivare il seguente lemma, che ora
dimostriamo
(VC1) v(P1) + v(P2) + v(P3) = 1, dove v(Pi ) = 1 o 0,
i =1,2,3
(A) Pi2 = Pi (i proiettori Pi sono idempotenti);
(B) Se H è uno spazio di Hilbert di dimensione finita, e i
Pi sono operatori che proiettano su |qi>, dove gli
insiemi {|qi>} formano un base ortonormale di H,
allora Si Pi= I , ovvero i vari Pi formano ‘una
risoluzione dell’identità’).
Si consideri un arbitrario |>, un operatore non degenere Q con
autovettori |q1>, |q2>, |q3>, e relativi autovalori distinti q1 q2 q3. Si
considerino 3 proiettori P1, P2, P3 che proiettano sui tre autovettori di
cui sopra. Allora, per l’ortonormalità, si ha
[8]
P1 + P2 + P3 = I
Ora, poiché P1, P2, e P3 sono compatibili, dall’assunzione KS2 si ha
(a)(Regola della somma): v(P1) + v(P2) + v(P3) = v(I);
(b) Per la regola del prodotto, passiamo da Pi2 = PiPi a v(Pi)2 = v(Pi2);
per l’idempotenza, si ha v(Pi2) = v(Pi)  v(Pi)2 = v(Pi) = 1 o 0
Sia R un osservabile tale che v(R) sia diverso da 0 nello stato |>.
Da questa assunzione e KS2 (b) (Product Rule):
v(R) = v(I R) = v(I) v(R). Ne segue allora che v(I) = 1 e per la regola
della somma
[9]
(VC1) v(P1) + v(P2) + v(P3) = 1
In cui v(Pi) = 1 or 0, for i = 1, 2, 3. Qed
Ghirardi si chiede (1997, p. 481): “tenuto conto delle
motivazioni che animano i proponenti delle teorie a variabili
nascoste, il riconoscimento dell’inevitabile contestualità di almeno
alcune osservabili non entra in conflitto con la pretesa
“oggettività” delle proprietà possedute da un sistema? Se il valore
di verità (cioè il fatto che essa risulti vera o falsa) dell’asserzione
“A assume il valore A(l)” dipende dal fatto che, per esempio, un
osservatore decida (a suo libero arbitrio) se misurare l’osservabile
B o l’osservabile C (entrambi compatibili con A ma incompatibili
tra loro)…in che senso l’asserzione in esame può ritenersi avere
un valore oggettivo?
La risposta a questa domanda è non solo che si possono sempre
trovare osservabili non contestuali, ma che il mondo quantistico è
fondamentalmente e irriducibilmente relazionale e privo di
proprietà e dunque di identità definite: come un personaggio
pirandelliano (uno nessuno e centomila), le proprietà che le
microentità assumono dipendono dal contesto sperimentale
Ovvero, se persino nella teoria massimamente “realistica” (e cioè
che assume quanta più definitezza di proprietà è possibile
assumere) l’indefinitezza deve essere riconosciuta, questa
indefinitezza fa parte dell’ontologia della natura, visto che è
comune anche all’interpretazione standard, nonché ad altre
interpretazioni che verranno discusse
Questo metodo di lettura o di interpretazione di una teoria fisica
guarda a ciò che è comune a diverse interpretazioni di una teoria
o a diverse teorie che hanno in comune lo stesso ambito
sperimentale. Così come si deve dire che la non-località è una
caratteristica della natura, si deve aggiungere che l’indefinitezza
delle proprietà, il loro carattere non intrinseco ma relazionale è
parte della natura, perché è comune a tutte le interpretazioni
Tale relazionalità, a causa dell’entanglement non locale, è essa
stessa non locale. Con uno slogan potremmo dire: ontologia della
QM e dunque della fisica=relazionismo olistico non locale
(RONL)
Capitolo 9
Il problema della macro-oggettivazione
1. Molte storie decoerenti
2. L’interpretazione modale
3. Il programma GRW
Le varie opzioni (vettore di
stato, osservabili, dinamica)
• Completezza o incompletezza vettore di stato (se la
teoria è incompleta, allora ci sono variabili
nascoste, vedi Bohm come esempio)
• Se il vettore di stato è completo, si può assumere
che l’insieme di vettori di stato è formalmente
omogeneo
ma
fisicamente
disomogeneo
(assunzioni sulle osservabili, rottura della
connessione autovettore- proprietà, molti mondi)
• Insieme formalmente omogeneo e fisicamente
omogeneo (due principi dell’evoluzione o una sola
dinamica)
y 0  F 0  [ cr r ] F 0   cr  F r
misura
r
r
1) Nella teoria di Bohm, il postulato del collasso è
un’accurata approssimazione, nel senso che
trascurare l’effetto di uno dei due termini soppressi
può significare trascurare un effetto fisico reale sul
potenziale quantomeccanico: lo stato finale corretto
è quello di sovrapposizione scritto sopra
2) Tuttavia, il gatto nella teoria in questione è di fatto
vivo o morto, perché le posizioni delle particelle
nei due casi sono assai diverse: si usano le
equazioni irreversibili anche se quelle corrette sono
quelle reversibili.
Omogeneità o disomogeneità dei sistemi
nell’ipotesi di completezza di |
• La completezza “formale” di | non è
incompatibile con il fatto che, facendo opportune
assunzioni sulla misurabilità delle osservabili, si
abbia a che fare con sistemi fisicamente
disomogenei (ha senso parlare di completezza?)
• Supponiamo che non risulti possibile (o in linea di
principio o di fatto) misurare tutte le grandezze
fisiche che corrispondono a tutte gli operatori del
microsistema e che le sole quantità osservabili
dell’equazione precedente commutino tutte: allora
diventa impossibile distinguere uno stato puro da
una miscela statistica (si veda 8.7 Ghirardi 1996)
• Se la non misurabilità di osservabili incompatibili
fosse dovuta a ragioni di principio, ne
conseguirebbe che l’energia iniziale del sistema
dell’equazione di cui sopra e quella finale non
sarebbero misurabili, visto che la situazione iniziale
e quella finale sono macroscopicamente distinguibili
e corrispondono ad autovarietà distinte. Inoltre, non
si danno prescrizioni precise su come individuare le
osservabili compatibili, perché non si dà distinzione
precisa tra quantum e classico.
• Allora la non misurabilità deve essere di fatto: visto
per es. il rapido accoppiarsi del sistema all’ambiente
come misurare tutte le correlazioni finali del
microsistema con tutto ciò che lo circonda, in modo
da distinguere miscela e stato puro?
• L’ultima soluzione è accettabile a fini pratici, e per gli
strumentalisti, ma l’approssimazione in questione è
diversa da quella richiesta dalla teoria di Bohm. Per
quest’ultima, l’indice è di fatto in una posizione definita
e l’approssimazione che ci porta ad usare una miscela
è giustificata, come è giustificato usare approssimate
equazioni irreversibili per predire che un singolo gas si
sta espandendo, malgrado il teorema di ricorrenza di
Poincaré ci dica che le eq. corrette sono altre: non c’è
contraddizione tra il fatto che le equazioni corrette
sono quelle reversibili con l’uso nel presente di
equazioni approssimate irreversibili
• Nel caso della teoria che limita di fatto le osservabili
misurabili, se in tempi di ricorrenza di Poincaré si
riuscisse a misurare sovrapposizioni macroscopiche,
avremmo invece che ora la teoria in questione è falsa
Il teorema di decomposizione biortogonale di un
sistema composto asserisce che lo stato  di un
sistema composto da S e A può scriversi in un solo
modo come la combinazione lineare di stati
biortonormali. Indicati con pi gli autovalori comuni
ai due operatori statistici WS e WA ottenuti facendo
la traccia parziale su ciascuno dei due spazi
costituenti, si ha (tralasciando questioni legate alla
degenerazione)
 S  A  i
pS i  c Ai
(S i , S j )  di , j
(c Ai , c A j )  di , j
H  H 1  H 2  ...H N
1 M  N  H  H M  H N
 S  A (1,2,...N , t )  i p F S i (1,2,...M , t )  X ( M  1,...M  N , t )
Se siamo interessati al sottosistema SM scrivendo lo stato
puro del sistema composto in forma biortogonale possiamo
affermare che le due parti F e X hanno proprietà definite,
anche se lo stato del sistema non è in un autostato
dell’osservabile. Questo è tipico dell’interpretazione
modale, , che rompe il se e solo se del legame autovalore autostato. Tali
proprietà dipendono però dal tipo di decomposizione
prescelta. Se si ha un protone, un neutrone e un elettrone
con i loro spin, si potrebbe essere interessati alle proprietà
del primo lasciando gli altri due insieme, o a quelle dei
primi due e all’ultimo separatamente considerato
• Ne segue che se scegliamo una
decomposizione, il protone può avere spin
definito, se ne scegliamo un’altra, esso
nonavrà spin definito. Conclude Ghirardi:
“l’interpretazione
modale
offre
una
soluzione puramente formale al problema
di come siano possedute le proprietà” (p.
538, 1996, Boniolo et al.)
Molte storie decoerenti
Siano ,  le osservabili, mentre i loro autovalori siano
k(), j(); sia Pk() i proiettori associati all’autovalore
k(). Una storia è costituita da una successione di eventi,
ovvero da una successione di istanti temporali, t1, t2, ….tn e
dal fatto che a quegli istanti certi sistemi hanno certe
proprietà. La probabilità P di una storia è la probabilità che
si siano succeduti certi eventi:
P[t N , , m(),..., t2 , , j (), t1 , , k ()]
Per un dato
dell’identità

P
 k (  ) I
k ()
osservabile, vale
la
decomposizione
P  k (  ) P  m (  )  d k ,m
P[t N , , m(),..., t2 , , j (), t1 , , k ()] 
2
j
c
Pm( c) e iH (t N t N 1 ) /  ...Pj () e iH (t2 t1 ) /  Pk(  ) e iHt1 /  (0).
La teoria non si riferisce a riduzioni o a misure ma
interpreta le probabilità di successioni di eventi, o di date
storie. Si prenda ora un’osservabile  a un istante dato t.
Prendiamo ora la famiglia di tutte le storie  , t
che
affermano che a t il sistema in oggetto ha uno dei suoi
possibili autovalori k
La k-esima storia della famiglia è quella che afferma che a t vale
k(). Sommando su tutti i valori k() di questa osservabile, si ha che
la probabilità è 1, ma considerando altre osservabili  a quel tempo,
la somma per le probabilità associate a tutte le storie date dall’unione
delle due famiglie sarebbe >1.
Limitandosi a famiglie di storie alternative decoerenti, si
evitano problemi con la probabilità. Si consideri il
seguente funzionale di decoerenza
( (0), e
 iHt1 / 
 iH ( t 2 t1 ) / 

r ( )
P
e

s( )
P
...e
 iH ( t N t N 1 ) / 

Pm ( )
Pmc( c ) e iH (t N t N 1 ) /  ...Pj j(  ) e iH (t2 t1 ) /  Pk( ) e iHt1 /   (0))
Supponiamo che questa espressione risulti nulla ogni volta che
almeno uno tra gli indici corrispondenti è diverso (r da k, s da j,
etc.), allora l’insieme delle probabilità associate alla famiglia è
consistente (famiglia decoerente). Per l’espressione di cui sopra,
si tenga conto che Ghirardi 1996, p. 392)
Pa (t ) F  (a (t ), F)a (t )  (e iHt /  a (0), F)e iHt /  a (0) 
e iHt /  a (0)( a (0), e iHt /  F)  e iHt /  Pa (t ) e iHt /  F
GRW: l’evoluzione del vettore di stato è
deterministica, la riduzione del pacchetto è
non-lineare e stocastica
“Un corpo macroscopico deve avere sempre una
posizione quasi perfettamente definita in ogni descizione
oggettiva del mondo reale” (Einstein)
Consideriamo una sola particella e una funzione di
localizzazione Lr* (r) una gaussiana di ampiezza 1/1/2
centrata attorno al valore r*

Lr* (r )   
p
3/ 4
e

 ( r  r *)
2
N è un fattore di normalizzazione; la localizzazione
fa sì che tutti i valori di r in (r) che distano da r* più di
1/1/2 siano posti = 0
 (r )  r* (r )  NLr* (r ) (r )
Sia
Fr  Lr*(r)
per GRW la densità di probabilità che una localizzazione avvenga
in r* è data da |Fr|2; cioè le localizzazioni spontanee avvengono in
modo da rispettare la prescrizione probabilistica della teoria
standard. Ovvero la localizzazione può avvenire attorno a un
qualsiasi punto r* tale che la particella abbia secondo la teoria
standard una prob. non nulla di venir trovata in un volume 1/3/2
Se l è la frequenza media, la probabilità che si
verifichi un processo di localizzazione nell’intervallo Dt,
data da lDt, è irriducibile (stocasticità): non c’è una
causa per cui si verifica in uno piuttosto che in un altro
istante.
Dato che la probabilità dipende da |Fr|2 , il processo
non è lineare nel vettore di stato
l  10 16 sec 1
1 /   10 5
Due nuove
costanti di natura
1
 (r ) 
[r1 (r )  r 2 (r )]
2
I due stati di posizione (per una particella) sono localizzati
attorno ai due punti r1 e r2, la cui distanza è assai
maggiore di (1/)1/2 Poiché per come è costruito il
modello, la localizzazione può avvenire solo attorno a uno
dei due punti, ciò che costringe il sistema in
sovrapposizione a localizzarsi attorno a uno dei due punti
con probabilità 1/2