Dispense per il corso di Filosofia della Fisica (parte III) Le conseguenze filosofiche della meccanica quantistica Mauro Dorato, Dipartimento di Filosofia, Università di Roma3 NB •Le note che seguono sono per uso strettamente didattico e non sono state ancora controllate in modo accurato. Si prega quindi di non far circolare il materiale che segue e di non usarlo per citazioni. •Aggiornate al 04/06/2017 Struttura della 3 parte 1 L’esperimento della doppia fenditura e il principio di indeterminazione di Heisenberg 2 Le posizioni filosofiche dei padri fondatori 3 Il dibattito Einstein-Bohr 4 La non-località come risultato sperimentale dell’argomento EPR 5 Il problema della misura e le varie interpretazioni della meccanica quantistica Capitolo 1 L’esperimento della doppia fenditura e il principio di indeterminazione di Heisenberg L’esperimento della doppia fenditura • Perché il “+” della sovrapposizione deve essere interpretato come un “vel” e non come un “aut” • Il dualismo onda-corpuscolo secondo l’interpretazione standard: la natura potenziale degli stati quantici e l’indeterminazione di Heisenberg • La possibilità che onda e corpuscolo siano elementi con-presenti: i “flashes” di Ghirardi “Things on a very small scale behave neither like particles nor like waves…all of direct, human experience and intuition applies to large object. We know how large objects will act, but things on a small scale just do not act that way. We choose to examine a phenomenon which is impossible, absolutely impossible, to explain in classical terms and which has in it the heart of quantum mechanics. In reality, it contains the only mystery” (Feynman, Lectures in physics, vol.3, p. 1) Dobbiamo comparare tre esperimenti, uno con proiettili, uno con onde d’acqua e uno con elettroni. Cominciamo con i proiettili (1) x rivelatore P12=P1+P2 x 2 P(x) 1 schermo Con questo apparato si può rispondere sperimentalmente alla domanda: “con quale probabilità P un proiettile che passa in uno dei due fori arriva in un punto dello schermo a distanza x dal centro?”Questa probabilità, che dipende dal numero di proiettili che colpiscono il punto x, è una funzione di x, P(x). Perché P12 -che è la probabilità che dipende dal fatto che i proiettili possono essere passati attraverso 1 o 2- è massima per x =0? Perché lì la somma di P1 (foro 2 chiuso) e P2 (foro 1 chiuso) è massima. In P1 (P2 ) il massimo è allineato con il primo (secondo) foro rispettivamente. 2) esperimento: onde d’acqua assorbitore x I12=|h1+ h2|2 I2 =|h2|2 2 1 P(x) I1=|h1|2 L’onda originale generata dalla sorgente è diffratta ai due fori, che originano un’altra serie di onde circolari che interferiscono. L’intensità del fenomeno risultante I12 non è la somma delle intensità ricavabili dalla chiusura di uno dei due fori Ii =|hi|2 (h altezza dell’onda). Nei punti in cui ci sono massimi in I12 le singole onde interferiscono costruttivamente, nei punti di minima interferiscono distruttivamente: I12= |h1|2 + |h2|2 +2 |h1 | |h2| cosd, con d differenza di fase tra I1 e I2 3) Esperimento con elettroni x P12=|f1+ f2|2 Cannone di P2 =|f2|2 elettroni 2 1 P(x) P1=|f1|2 1)Se mettiamo due rivelatori dopo lo schermo con le fenditure, solo uno dei due scatta e mai entrambi contemporaneamente. 2) se abbassiamo la frequenza di emissione, il click non è meno forte, ma solo meno frequente: ogni elettroni arriva in un pacchetto e viene assorbito tutto e mai “a metà”. Sembrerebbe un comportamento da particella. E invece 3)la probabilità che gli elettroni arrivino a una certa distanza x dal centro, che è proporzionale al numero di arrivi in quel punto, è data dalla figura che avevamo trovato per le onde marine! Ne concludiamo che quando entrambe le fenditure sono aperte,gli elettroni si comportano come onde Il punto è però che quando vengono assorbiti, si localizzano in un punto piccolo dello schermo, come se fossero proiettili in miniatura (arrivano in un pacchetto discreto). Sembrerebbe dunque che passino o in una o nell’altra delle due fenditure. Ma se fosse così, la curva complessiva dovrebbe essere ottenuta sommando le due curve P1 e P2 che si ottengono chiudendo prima una e poi l’altra delle due fenditure, ovvero contando gli elettroni che passano in una, e quelli che passano nell’altra, come nel caso dei proiettili (particelle) Invece il risultato che si ottiene lasciando le due fenditure aperte non è ciò che si ottiene sommando i risultati relativi ai due casi in cui una delle due fenditure è chiusa: c’è interferenza: P12 P1 P2 Ci sono punti dello schermo nei quali arrivano meno elettroni quando sono aperte entrambe le fenditure che quando ne è aperta solo una: è come se chiudere una delle due fenditure aumenta il numero di elettroni che passa per l’altra. D’altra parte, al centro del sistema la probabilità quando sono aperte entrambe le fenditure è assai più che la somma delle probabilità ottenibili tenendone una delle due chiusa. E allora sembra che chiudendone una delle due diminuisce il numero di elettroni che passa per l’altra. Entrambi gli effetti non possono essere spiegati supponendo che un elettroni entri in 1 e poi anche in 2 girando attorno allo schermo. Dunque è falso affermare che l’elettrone passi o nell’una o nell’altra delle due fenditure: lo stato di sovrapposizione non può essere interpretato come un “o” esclusivo. “Gli elettroni arrivano in pacchetti, come particelle, e la probabilità di arrivo di questi pacchetti è distribuita come l’intensità di un’onda. È in questo senso che un elettrone ‘si comporta talvolta come una particella e talvolta come un’onda” (Feynman, vol 3 p. 6). Si può azzardare l’ipotesi che è questa proprietà dei sistemi quantistici che spinse Bohr a formulare il principio che i contrari sono complementari (contraria sunt complementa): osservabili mutuamente incompatibili nella misura (mutually exclusive in measurement) sono tuttavia entrambi presenti, ma solo in potenza, in un certo stato, e sono quindi entrambi necessari per la descrizione del sistema (jointly exhaustive for the description of the system). I microsistemi quindi non sono né onde né particelle Ecco anche l’origine della lettura disposizionalistica di Heisenberg:«Such a probability function [i.e. the statistical algorithm of quantum theory] combines objective and subjective elements. It contains statements on possibilities, or better tendencies (“potentiae in Aristotelian philosophy), and such statement are completely objective, as they don’t depend on any observer…the passage from the “possible” to the real takes place during the act of observation» (Heisenberg 1958, Physics and Philosophy, p. 67-69) Contro Feynman, si deve però notare che nello stesso esperimento l’elettrone sembra comportarsi come un’onda e come una particella, in stadi diversi dell’evoluzione del sistema stesso. Ovvero, quando entrambe le fenditure sono aperte, un elettrone passa per entrambe, ed è quindi simile a un’onda d’acqua o a un campo esteso, ma quando colpisce lo schermo si comporta come una particella, e si localizza in suo punto preciso dello schermo collassando in un autostato della posizione. Tale versione dell’esperimento che qui suggerisco (“onda e particella”) richiede però il passaggio dallo stato di sovrapposizione che descrive il microsistema quando passa in entrambe le fenditure aperte in uno solo dei due stati sovrapposti, che caratterizza una particella localizzata. In effetti, se provassimo a localizzare l’elettrone illuminandolo dietro una delle due fenditure, sapremmo per quale delle due fenditure è passato, eliminando però l’interferenza tipica delle onde x rivelatore x P’12=P’1+P’2 P’2 2 P(x) P’1 1 schermo Se osserviamo per quale fenditura è passato l’elettrone, anche quando le fenditure sono tutte e due aperte, l’elettrone si comporta in modo “particellare”: l’interferenza e dunque il suo carattere ondulatorio è svanito o distrutto. La distribuzione degli elettroni nei due casi, conclude Feynman, è diversa a seconda se guardiamo, e invece di andare in un punto di massimo di P12 l’elettrone andrà in uno di minimo Poiché il momento di un fotone p=h/l, usando luce con lunghezza d’onda maggiore diminuiremo l’impatto con l’elettrone perché diminuiremmo p. Quindi disturberemo meno la traiettoria dell’elettrone (il suo momento) Ma a un certo punto, diminuendo p, non riusciremmo più a sapere per quale delle due fenditure è passato l’elettrone (posizione), e ciò avverrà quando la lunghezza d’onda della radiazione sarà dell’ordine della distanza tra le due fenditure. E allora ritroveremo il pattern ondulatorio dell’interferenza! “È impossibile disegnare un apparato che determini per quale fenditura sia passato l’elettrone senza al tempo stesso distruggere il pattern dell’interferenza” PRINCIPIO DI INDETERMINAZIONE (Feynman, p. 9). In questa forma, si vede che l’elettrone è dotato di entrambe le nature (particellare e ondulatoria) in potenza, ma il tipo di natura evidenziato dagli esperimenti in atto è sempre uno dei due (particellare o ondulatorio) e mai entrambi. Si può invece avanzare l’ipotesi di prima, ovvero che un insieme di elettroni identicamente preparati di fatto mostri sia il comportamento ondulatorio (interferenza) sia quello particellare, evidenziato dalla localizzazione discreta su un punto dello schermo. Ma lo stato di sovrapposizione delle posizioni nell’esperimento delle due fenditure non può interpretarsi mai come un “aut”, ma solo come un “vel”. Avanziamo l’ipotesi che gli elettroni (pace le interpretazioni come quella di Bohm) in realtà passino in entrambe le fenditure, anche se il loro diametro “classicamente inteso” è assai più piccolo della distanza tra le fenditure: ovvero non sono particelle, se non quando le vado a misurare! Processo di localizzazione Abbiamo sovrapposizione di posizioni distinte sia nel caso dell’esperimento di Stern-Gerlach che nel caso di quello delle due fenditure. In entrambi i casi, lo stato del sistema è una sovrapposizione lineare di due stati che corrispondono, nella base delle coordinate spaziali, a funzioni d’onda che sono diverse da zero in due precise e limitate regioni dello spazio, regioni che sono disgiunte. Se uno schermo con due fenditure non registra l’arrivo di una particella, lo stato del sistema a misura avvenuta è una funzione di x che è diversa da zero solo nelle regioni corrispondenti alle due fenditure. Se l’apertura delle fenditure è d e c è la funzione caratteristica che vale 1 se la particella è passata nella fenditura i e 0 se è passata nell’altra. allora la funzione d’onda che descrive il passaggio nelle fenditure è incompatibile con l’idea che la particella sia passata nell’una o nell’altra delle due 1 1 1 c1 ( x) 1 c 2 ( x) dopo c1 ( x) c 2 ( x) 2d 2d 2 d 2 d I due singoli stati normalizzati corrispondono alla situazione in cui possiamo dire che con certezza la particella è passata in una delle due fenditure. Come si vedrà però, tale conoscenza distrugge il fenomeno della sovrapposizione e quindi l’aspetto ondulatorio del fenomeno (l’interferenza). Illustrazione del dualismo onda-corpuscolo. La sovrapposizione dei due stati di posizione non è una miscela Heisenberg non derivò le sue relazioni nel modo visto ma propose argomenti più qualitativi.(Ghirardi,1997, pp 413-4) x z diffrazione Immagine geometrica del foro di ampiezza Dx: non conosciamo la posizione della particella lungo x ma la componente verticale del momento px è perfettamente definita, perché è nulla Se restringiamo l’ampiezza della fenditura fino a renderla paragonabile a quella della lunghezza d’onda l=h/p associata all’elettrone, allora abbiamo un’indeterminazione piccola della posizione x dell’elettrone, ma il suo momento px è non nullo a causa della diffrazione (immagine allargata del foro), in modo che il prodotto DxDpx> h/4p Spin e indeterminazione σ x x 1 x ;σ x x 1 x ;σ z z 1 z ;σ z z 1 z (Ghirardi p. 407) x 1 1 1 1 1 ; 0 ; ; x z 0 z 1 2 1 2 1 sz=-1 sx=+1 z x sz= +1 x Le proiezioni di lungo gli assi degli autovettori danno, attraverso il quadrato dei loro moduli, la probabilità di ottenere i vari esiti per l’osservabile spin. Nella figura, tutte le proiezioni sono non nulle sx=-1 Per rendere “quasi determinato” il valore di sz si deve partire da uno stato quasi parallelo ai due autovettori di sz (un suo autostato), ma in questo caso le due componenti di sx tendono a (2)1/2/2 e si ha dunque una massima indeterminazione per l’osservabile sx (e viceversa). Il valor medio tra i due soli esiti (1 e –1) è 0, < sx > = 0, mentre lo scarto quadratico medio vale, secondo la formula già vista, proprio 1, che è il massimo Dsx [1/2(1-0)2+1/2(-1-0)2]1/2 = 1 sz= -1 y sx=+1 sz= +1 sx=-1 Le relazioni di indeterminazione di Heisenberg derivate formalmente Ricordiamo che lo scarto quadratico medio di A è DA [A- A ] Il prodotto dello scarto o indeterminazione delle due quantità A e B per un insieme statistico associato a uno stato puro sarà allora DA DB [A- A ] [B- B ] dis.Schwarz [A- A ] [B- B ] Questo passaggio dipende dal fatto che il modulo di un numero complesso è maggiore del modulo della parte immaginaria 1 [A- A ] [B- B ] [B- B ] [A- A ] 2 z x iy zz* x 2 y 2 y 2 z y 2 y Im z 2 2 1 z z* 2 Poiché gli operatori A-<A> e B-<B> sono entrambi simmetrici, si possono portare a destra del prodotto scalare 1 DA DB [A- A ][B- B ] [B- B ][A- A ] 2 Indicando con le parentesi graffe il commutatore tra A-<A> e B->B> si ha 1 1 A- A , B- B DA DB A, B 2 2 Poiché <A> e <B> sono numeri, essi commutano con qualunque operatore, ciò che spiega perché l’espressione a sinistra nella formula qui sopra si riduce a quella a destra. Per es., poiché il commutatore tra posizione e quantità di moto vale ih/2p, si ha Dx Dp x ; Dy Dp y ; Dz Dp z 2 2 2 DE D t 2 In relatività lo spazio x è legato al tempo t come l’impulso p è legato all’energia E L’indeterminazione tempo-energia implica la conservazione dell’energia. Se lo stato del sistema coincide al tempo t=0 con un autofunzione propria dell’energia, ovvero se (0)= fj ove H|fj>= Ej |fj> allora il sistema evolve in questo modo: (t ) f j e i E jt in cui l’esponenziale è l’operatore unitario (al posto dell’hamiltoniana H abbiamo messo il suo valore Ej). Ciò implica che la probabilità di trovare l’esito Ej in una misura dell’energia è 1. Ma se l’energia è perfettamente definita, allora il tempo è indeterminato, cioè l’energia si mantiene uguale a se stessa assai a lungo. Capitolo 2 Le posizioni filosofiche dei padri fondatori (1924-1926) • L’atomo di Bohr, De Broglie e l’ipotesi ondulatoria della materia (1924) • Heisenberg e la meccanica matriciale (1925) • Schroedinger e la meccanica ondulatoria (1926) • Born e le due leggi dinamiche di evoluzione (1926) • Von Neumann e il teorema sull’impossibilità del determismo (1932) Lamine d’oro e particelle alfa • Bombardando le prime con le seconde, Geiger e Marsden scoprirono che mentre la maggior parte delle particella alfa (due protoni) subiva deviazioni minime dalla traiettoria iniziale, altre venivano deviate in misura considerevole, se non addirittura respinte dalla lamina. Nell'interpretare questo esperimento, Rutherford nel 1911 ipotizzò che l'atomo fosse composto da un centro massivo (il nucleo) circondato da cariche negative: il modello compatto “a plum cake” di Thomson, con cariche positive e negative uniformemente sparse, nell’atomo venne abbandonato. L’atomo di Bohr (1913) Un elettrone di carica e che si muove di velocità v attorno al nucleo costituito da Z protoni classicamente può stare a qualunque distanza dal nucleo.Basta che la forza centrifuga mv2/r sia esattamente compensata dalla forza elettrostatica Ze2/r2 (forza coulombiana esercitata dai Z protoni). Ne risulta che v2= (Ze2/mr). La condizione di Bohr è che non tutte le orbite classiche siano ammesse, ma solo quelle per cui il momento angolare L= mrv sia multiplo intero di h/2p L= mrv= nh/2p n=1,2,3... mr(Ze2/mr)1/2 = nh/2p I raggi ammissibili risultano allora n 2 2 rn 2 e mZ 1 Ze 2 1 Z 2 me4 En 2 rn 2 n 2 2 Etotale= Ecin+Epotenz=1/2mv2- Ze2/r n=1,2,3... La posizione di De Broglie Il dualismo onda-corpuscolo di De Broglie “Nella sua tesi, presentata all’università di Parigi nel 1924, de Broglie era partito da un’idea che Einstein aveva suggerito — senza mai però svilupparla appieno e pervenire ad un lavoro pubblicato — su come andasse intesa l’associazione tra fotoni e onde elettromagnetiche. In base a questa idea, i campi elettrici e magnetici di un’onda elettromagnetica svolgono il ruolo di “campi fantasma” che in qualche modo “guidano” il moto dei fotoni nello spazio. De Broglie congetturò che dovessero esistere campi analoghi che guidano il moto delle particelle nello spazio: una particella di massa m e velocità v, e di conseguenza con impulso p = mv, è guidata da un’onda che (per piccole velocità rispetto alla luce) ha una lunghezza d’onda data dalla formula l =h/p. (citato da Allori, Dorato, Laudisa, N. Zanghì, Metafisica Empirica, in corso di pubblicazione, Carocci,) «Questa ipotesi fornì una prima spiegazione non ad hoc della regola di quantizzazione di Bohr: se quest’onda esiste, quando l’elettrone in un atomo di idrogeno si muove lungo un’orbita circolare stabile di raggio r, l’ onda deve essere stazionaria (le proprietà dell’atomo non mutano nel tempo se l’atomo non è radioattivo) e devono quindi essere soddisfatte le stesse condizioni in base a cui una corda di chitarra può vibrare: ovvero la lunghezza totale dell’orbita l = 2pr sia pari ad un multiplo intero di una lunghezza d’onda 2pr =nl, con n=1,2,3,…n (si veda la figura di Zanghì nella pagina successiva): da cui, sostituendo la formula di de Broglie per la lunghezza d’onda, si ottiene mrv =nh/2p , n = 1, 2, 3, . . ., che è proprio la regola di quantizzazione di Bohr del momento angolare«. (Zanghì, ibid.) Quando l’elettrone in un atomo di idrogeno si muove lungo un’orbita circolare stabile di raggio r devono essere soddisfatte le stesse condizioni che permettono la vibrazione di una corda di chitarra di lunghezza l: che la lunghezza totale dell’orbita, l = 2pr sia pari ad un multiplo intero di una lunghezza d’onda. Poiché la lunghezza d’onda decresce al crescere della massa, i corpi macroscopici non presentano aspetti ondulatori, visto che la lunghezza d’onda ad essi associata dovrebbe incontrare ostacoli assai più piccoli delle dimensioni che li caratterizzano De Broglie influenzò moltissimo Schroedinger nella prima formulazione delle meccanica ondulatoria. In una lettera di Einstein a Lorentz del Dicembre del 1924, leggiamo: “…De Broglie ha fatto un tentativo molto interessante di interpretare le regole quantistiche di Bohr. Io credo che questo rappresenti il primo debole raggio di luce sul peggiore dei nostri enigmi nel campo della fsiica. Io stesso ho trovato qualcosa che punta nella stessa direzione.” Einstein non pubblicò i suoi risultati che però, come vedremo, influenzarono sia Schroedinger che Max Born, l’autore dell’interpretazione probabilistica della funzione d’onda. E poi, nel 1952, vennero riscoperti da David Bohm La posizione di W. Heisenberg Nel 1925, H. scrive: “è meglio …ammettere che l’accordo parziale delle regole quantistiche con gli esperimenti sia più o meno accidentale e provare a sviluppare una meccanica quantistica teorica, analoga alla meccanica classica, nella quale compaiano solo relazioni tra quantità osservabili”. Influsso dell’operazionismo di Einstein (1905) “Ueber quantentheoretische Umdeutung kinematischer and mechanischer Beziuhungen”, Zeitschrift der Physik, 43, 172-198 “Sulla reinterpretazione delle relazioni cinematiche e meccaniche operata dalla meccanica quantistica” Più tardi però H. cambiò opinione. Per H. la non è solo uno strumento di calcolo, visto che egli si riferiva alle onde di probabilità come ad una “the quantitative formulation of the concept of dunmis, or, in the later Latin version, potentia, in Aristotle’s philosophy. The concept that events are not determined in a peremptory manner, but that the possibility or tendency for an event to take place has a kind of reality – a certain intermediate layer of reality, halfway between the massive reality of matter and the intellectual reality of the idea or the image- this concept plays a decisive role in Aristotle’s philosophy. In modern quantum theory this concept takes a new form; it is formulated quantitatively as probability and subject to mathematically expressible laws of nature” Heisenberg, “Planck’s discovery and the philosophical problems of atomic physics”, in On Modern Physics, Orion Press, London, 1961, pp.9-10 La posizione di E. Schroedinger (1926) All’inizio S. pensava che la funzione d’onda da lui scoperta corrispondesse, con il quadrato del suo modulo (che per Born fornisce la probabilità), alla densità di massa o di carica dell’elettrone cui è associata. L’elemento ontologico essenziale è per lui l’onda: Schroedinger pensava ad un’onda che, a causa di effetti di interferenza, al di fuori di una certa regione era nulla e simulava dunque il comportamento di una particella. “Non si deve attaccare alcun significato essenziale al cammino dell’elettrone…e ancora meno alla posizione di un elettrone sul suo cammino [accenno a De Broglie?]…l’onda…non solo riempie tutto il cammino simultaneamente, ma si estende addirittura notevolmente in tutte le direzioni. Queste contraddizione è sentita così fortemente che si è persino posto in dubbio che quello che accade in un atomo possa inquadrarsi in uno schema spazio-temporale. Da un punto di vista filosofico, io considererei una decisione conclusiva in questo senso come una resa incondizionata. Infatti, poiché noi non possiamo assolutamente evitare di pensare in termini di spazio e tempo [Kant?], quello che non possiamo ricondurre a siffatti concetti, non possiamo comprenderlo affatto” (Ghirardi 1997, p.421) Ben presto (1927) Heisenberg attaccò l’interpretazione puramente ondulatoria di Schroedinger. Si consideri un elettrone libero il quale al tempo t=0 si trova in uno stato la cui rappresentazione delle coordinate è una funzione gaussiana di ampiezza Dx(0). Se si parte con un’indeterminazione iniziale Dx(0) di 10-5 cm, risolvendo l’equazione di Schroedinger, dopo un 1/3 di secondo il pacchetto che rappresenta l’elettrone libero occupa circa un Km =105 cm! La relazione tra l’indeterminazione iniziale e quella al tempo t è h 2t 2 ht 3t Dx(t ) Dx(0) 1 cm cm cm 2 4 4m [Dx(0)] 2mDx(0) Dx(0) Dall’ultima formula sulla destra segue l’affermazione di cui sopra, facendo le sostituzioni Ma misurare l’elettrone implica sempre localizzarlo, dice G. (1997, p.421); Questa non è però l’unica difficoltà: il fatto è invece che varie onde associate a n particelle richiedono uno spazio di configurazione n-dimensionale Lorentz preferiva l’interpretazione ondulatoria di Schroedinger finché si aveva a che fare con una sola particella: “so long as one only has to deal with the three coordinates x, y, z. If however, there are more than three degrees of freedom then I cannot intepret the waves and vibrations physically, and I must therefore decide in favor of matrix mechanics”(M. Jammer, The Philosophy of QM, p. 32). Ma Jammer continua. “In rebuttal of this objection one could, of course, point out that in the treatment of a macromechanical system the vibrations, which undoubtely have real existence in the three dimensional space, are most conveniently computed in terms of normal coordinates in the 3n-dimensional space of Lagrangian mechanics.” Altre tre difficoltà di una lettura ondulatoria della , afferma Jammer, sono: (1) è una funzione a valori complessi; 2) dipende dal sistema di osservabili che viene impiegato per rappresentare il sistema;3) è soggetta al mutamento discontinuo indotto dal processo di misura. Esercizio: secondo te, quali di queste difficoltà è seria? La posizione di Max Born Per Schroedinger era necessario poter visualizzare i processi quantistici salvando la descrizione spaziotemporale (visualizzare e descrivere spaziotemporalmente qui sono sinonimi). Born (1926) avanza l’interpretazione probabilistica del modulo quadro della funzione d’onda, affermando che essa è la densità di probabilità di trovare la particella in un certo punto se si esegue una misura di posizione su di essa. |(x)|2 non è dunque la probabilità che l’elettrone sia in una certa posizione, ma la probabilità che esso sia in una certa posizione in dipendenza del fatto che su di esso si è eseguita una particolare misura. Per Born, esistono solo particelle, non onde, e sono rivelate dagli esperimenti di scattering. Come affermò Jordan, è l’osservatore che, “costringe l’elettrone ad assumere una posizione definita; in precedenza esso non era né qui né là” Interessante che nel 1954, quando Born prese il Nobel per i suoi contributi alla MQ, raccontò che esperimenti sulla collisione di elettroni “appeared to me as new proof of the corpuscolar nature of the electron” (Jammer 1974, p. 39). E nel saggio originale scrisse queste parole profetiche rispetto al problema della misura: “Die Bewegung der Partikel folgt Wahrscheinlichkeitsgesetzen, die Warhscheinlichkeit selbst aber breitet sich im Einklang mit dem Kausalgesetz aus”, (Il moto delle particelle segue le leggi della probabilità, ma la probabilità stessa si propaga invece in accordo con la legge della causalità) Born, Die Quantenmechanich der Stossvorgaenge, 1926, p.804. Si noti che da questa frase si evince che per Born esistono due .tipi di evoluzione dinamica delle particelle, una probabilistica che regola il moto delle particelle (all’atto di misura), una deterministica che regola la propagazione nel tempo dell’onda di probabilità (equazione di Schroedinger.) Sempre nel 1954, Born disse che applicò l’idea del “campo fantasma” di Einstein dai fotoni (in base alla quale l’intensità dell’onda fantasma che guida i fotoni – ovvero il quadrato dell’ampiezza – determina la probabilità di trovare un fotone) a tutta la materia. Ecco ancora l’idea di De Broglie-Einstein. Per Born, le probabilità quantistiche non sono dovute all’ignoranza della situazione fisica (non sono come quelle della meccanica statistica): sono ontiche. Contrariamente al punto di vista di Schroedinger, per Born non descrive nulla di fisico, ma “solo la nostra conoscenza del sistema”. Così il fatto che nell’interpretazione originaria di Schroedinger si sparpagliasse rapidamente non costituiva per lui alcuna difficoltà, perché non denota nulla di reale. Analogamente, per Born il collasso della funzione d’onda non è una transizione fisica reale, ma solo un mutamento della nostra conoscenza. Ma la posizione particellarista di Born non da conto dell’autointerferenza di un singolo elettrone quando passa per uno schermo con due fenditure, ovvero richiede che il pattern ottenuto con due fenditure aperte sia “la somma” dei singoli patterns ottenuti con una sola delle due fenditure aperte, il che, come è noto, non è. Ne segue che la rappresenta qualche cosa di fisico! Il teorema di impossibilità di von Neumann Nessuna teoria predittivamente equivalente alla MQ può assegnare valori precisi (anche se sconosciuti, o nascosti e inaccessibili) a tutte le osservabili di un sistema fisico (a)Se A e B sono operatori autoaggiunti, allora ogni loro combinazione lineare con arbitrari scalari reali è ancora un operatore autoaggiunto C A B [1] (b)Se le osservabili A e B rappresentate da A e B sono osservabili del sistema, allora c’è un’osservabile C rappresentata da C : C A B [2] (c) Se A è limitato, il sistema è in uno stato , P è il proiettore sullo stato , e il valore medio <|A| Tr(PA) è simbolizzato da A, allora vale C A B [3] Indichiamo ora i valori di A, B e C con v(A), v(B), v(C) rispettivamente e consideriamo una “variabile nascosta” V che li determini. Nell’ottica di una teoria che assegna valori definiti a tutte le variabili fisiche, i valori medi <A> misurati dalla MQ saranno medie sui vari valori nascosti ma definiti v(A), In generale però, i valori medi “banali”, identificati con i valori posseduti <A>V = v(A) non coincideranno con <A> [4] A V A Se però richiediamo che anche gli <A>V obbediscano alla regola lineare [3] che vale per i valori medi, abbiamo [5] v(C) = αv(A) + βv(B). La [5], insieme alle altre, è un’assunzione indispensabile del teorema di von Neumann contro la possibilità di variabili nascoste o contro l’esistenza di stati a dispersione nulla, dove la dispersione è definita come il valor medio dell’operatore (B - <B>)2, ovvero la media pesata con la probabilità |cj|2 del quadrato dello scarto tra l’esito bj e il valor medio di B. Assumendo infatti che Si ci fi ; e che B fi=bi fi y | (B - B ) 2 y ck k (B - B ) 2 c j j c *c k kj j kj k (B - B ) 2 j ck * c j k (b j - B ) 2 j kj c * c (b k kj j j - B ) k j ck * ck (b j - B ) c j (b j - B ) 2 2 2 2 j j Il teorema, che non vedremo in dettaglio (cfr., I fondamenti è logicamente corretto, e se fossero vere le premesse, la conclusione sarebbe ineccepibile matematici della meccanica quantistica, capitolo 4, Il Poligrafo, 1998) Il punto è che la [5] è irragionevole quando le tre osservabili in questione non formano un insieme compatibile, ovvero simultaneamente misurabile. Il primo ad aver mostrato perché la [5] è irragionevole nel caso di operatori non simultaneamente diagonalizzabili è stato J.S. Bell nel 1966, dando il seguente semplicissimo controesempio con le componenti di spin lungo x e y, che come noto, obbediscono alla relazione [6] [sx, sy]=2i sz e permutazioni cicliche di queste Controesempio di J.S. Bell Sia A = σx e B = σy, allora l’operatore C C = (σx + σy)/21/2 corrisponde all’osservabile della componente dello spin lungo la direzione che biseca l’angolo dato da x e y. Poiché tutte le componenti dello spin, in opportune unità di misura, hanno come valori possibili solo ±1, ne segue che una teoria a variabili nascoste deve assegnare ad A, B, C solo i valori ±1, e lo stesso deve fare con i valori certi che le osservabili assumono come funzioni delle variabili nascoste (valori medi triviali). Questo implica che la (5) non possa essere soddisfatta, dato che (1 1) 1 2 Nulla impone che gli autovalori della somma dei due operatori, che coincidono con i valori v(A), etc, siano combinazione lineare degli autovalori dei componenti Come afferma Bell: “A measurement of a sum of noncommuting observables cannot be made by combining trivially the result of separate observations on the two terms – it requires a quite distinct experiment. For example, the measurement of sx must be made with a suitable oriented Stern-Gerlach magnet. The measurement of sy would require a different orientation, and that of (sx + sy) a third and different orientation…There is no reason to demand it [addivity] individually of the hypothetical dispersion free states, whose function is to reproduce the measurable peculiarities of quantum mechanics when averaged over. (Bell, Speakable and unspeakable in QM, 1987, p.4) • A causa dell’enorme prestigio di von Neumann, questo teorema contro la possibilità di variabili nascoste fu ritenuto per vari anni la prova decisiva dell’impossibilità del determinismo, fino a quando Bohm nel 1952 e poi Bell nel 1964 ne mostrarono l’infondatezza, o meglio, la mancanza di generalità, il primo con un controesempio costituito da una nuova teoria fisica, il secondo con l’argomento appena visto. • Gleason (1957) e Kochen-Specker (1967) rimediano a questo problema supponendo che la [5] valga solo per osservabili compatibili, fatto che non è messo in discussione nemmeno dai teorici delle variabili nascoste. I fondamenti concettuali e le implicazioni epistemologiche della teoria 1) Il principio di sovrapposizione: è il cuore della meccanica quantistica e per Dirac (The Principles of Quantum Mechanics, 1930, pp.10-18) rappresenta la maggiore differenza con la meccanica classica. Esso afferma che dati due stati possibili di un sistema, 1 e 2, ogni loro combinazione lineare 3 a1 + b2 con due arbitrari scalari a e b è ancora un possibile stato del sistema. 2) Abbiamo già visto che a causa della linearità dell’equazione di Schroedinger, l’evoluzione temporale U di una combinazione lineare di stati (o di una sovrapposizione di stati) è la combinazione lineare delle evoluzioni temporali dei singoli stati della sovrapposizione U(3) = U(a1 + b2) aU (1) + b U(2) Completezza della descrizione quantistica: ogni elemento della realtà fisica è colto dal formalismo della teoria: “every element of the physical reality must have a counterpart in the physical theory” (EPR, Phys Rev.1935 p.777) Nell’interpretazione standard, il formalismo viene considerato come completo. Ovvero la conoscenza del vettore di stato (uno stato puro) viene considerata come massimale, per cui l’informazione che esso contiene è completamente esauriente. Sia lo stato del sistema preparato con spin lungo x uguale a +1, che è la combinazione lineare dei due autovettori relativi a sz 1 1 1 1 1 1 0 S x ; s x 1; 1 0 1 2 2 2 2 P(s x 1 | s x ) 1; P(s x 1 | s x ) 0 2 1 1 P(s z 1 | s x ) ; P(s z 1 | s x ) 2 2 2 La teoria afferma che è solo quando lo stato del sistema (un elettrone, per es.) è in un autostato dell’osservabile (spin x=+1 nell’esempio) che possiamo attribuire probabilità 1 all’esito di misura, dato da sx| EPR codificano questo requisito affermando il loro principio di realtà, che è una condizione sufficiente per l’esistenza di proprietà indipendentemente dalla misura e dunque di proprietà oggettivamente possedute: “Se, senza disturbare in alcun modo un sistema, possiamo prevedere con certezza (cioè, con probabilità uguale a 1) il valore di una quantità fisica, allora esiste un elemento di realtà fisica che corrisponde a questa quantità fisica” (Einstein, Podolsky Rosen ibid., 1935, 777) Se la condizione di EPR è anche necessaria, allora se la proprietà è posseduta prima della misura (“se esiste un elemento di realtà”) il sistema è in un autostato dell’osservabile in questione. Ci si può chiedere se il nostro elettrone possiede anche una proprietà di avere spin definito lungo z oltre a quella data di avere spin nella direzione x. Nel caso della sovrapposizione di due autovettori di spin z, si può mostrare che non è così. Se l’insieme di risultati E fosse quantisticamente inomogeneo, una miscela, avremmo la probabilità epistemica che un sistema individuale scelto a caso abbia probabilità ½ di avere spin z = 1 e ½ di avere spin z=-1, dove gli autostati del sistema potrebbero essere az e bz e si potrebbe pensare che ogni membro individuale dell’insieme possiede oggettivamente un preciso valore per l’osservabile spin lungo z, cosicché una percentuale p+=1/2 dei sistemi siano nello stato az e il resto nello stato bz (con p-=1/2) . Poiché ogni membro dell’insieme E è in uno di questi due stati, lo sviluppo di questi stati in termini degli autostati di sxè 1 1 1 1 az ax bx ; bz ax bx 2 2 2 2 Entrambi questi stati danno probabilità ½ per i due possibili esiti di misura, contro l’ipotesi che lo stato del sistema sia tale che la probabilità di trovare sx=1 è 1. Ne segue che non è possibile che il sistema abbia valori definiti per sz e che sia in una miscela di stati rispetto a sz se è in uno stato definito rispetto a sx Ne segue che nello stato di sovrapposizione, il + che lo caratterizza non è interpretabile con una disgiunzione, che andrebbe bene per le miscele: non è vero che il sistema è o in uno stato o nell’altro, e nemmeno che non è in nessuno dei due stati. In un certo senso il sistema “è in entrambi gli stati”, anche se nella misura ne troviamo solo uno dei due, visto che gli stati sono ortogonali. Questo argomento vale per osservabili non commutanti, come sono le due componenti di spin lungo x e lungo z. E’ quindi possibile distinguere sperimentalmente uno stato puro (sovrapposizione) da una miscela statistica Un’altra importante implicazione concettuale è tratta da Ghirardi (1996, p. 401) “la teoria implica che non si possano attribuire “troppe” proprietà a un sistema fisico individuale: se la particella ha, per esempio, la proprietà di avere un “preciso spin lungo l’asse x” allora non possiede proprietà relative alla componente dello spin in altre direzioni. Il fatto che nel caso classico possa essere impossibile conoscere perfettamente lo stato del sistema non implica che quest’ultimo non abbia proprietà definite per ogni stato che definisce in modo massimale il sistema stesso. E’ per questo che le probabilità di cui parla la fisica classica sono epistemiche o dipendenti dalla nostra ignoranza. Ecco la differenza, secondo l’interpretazione standard, con la MQ. Due osservazioni che qualificano questa asserzioni di Ghirardi: Per i bohmiani, tutte le probabilità della MQ non relativistica sono epistemiche. Ma la teoria bohmiana della MQ relativistica è non ancora sufficientemente sviluppata… L’assunzione che per un qualunque stato esiste sempre un’osservabile di cui tale stato è autovettore con un preciso autovalore ci garantisce però che il sistema possiede sempre qualche proprietà in modo oggettivo. Ciò è evidente nel caso di una particella in un arbitrario stato di spin : è sempre possibile trovare una direzione n rispetto alla quale è autovettore con autovalore 1 (G. p. 402) Il dibattito Bohr Einstein e le sue varie fasi La posizione filosofica di Bohr La preminenza del linguaggio della fisica classica: poiché gli eventi del mondo quantistico devono essere amplificati da apparati classici, la fisica classica rimane un prerequisito per poter parlare del mondo quantistico Per Bohr i microsistemi esistono (egli è un realista sulle entità, ma un antirealista sulle teorie): le proprietà non dinamiche dei microsistemi, massa carica e spin sono intrinseche ad essi, ma il possesso di quelle dinamiche è puramente relazionale e dipende dall’esperimento che intendiamo condurre Il principio di complementarietà (in base al quale i concetti della fisica classica, se applicati al mondo quantistico, sono mutuamente esclusivi e congiuntamente esaustivi) per Bohr vale per ogni dominio dell’indagine empirica, anche in biologia e nelle scienze umane (“I quanti e la vita”). La complementarietà (mutual exclusive and jointly exhaustive) non riguarda tanto e solo l’aspetto onda e corpuscolo applicato all’ontologia della MQ ma ha a che fare anche e soprattutto con la complementarietà tra descrizione spazio-temporale del mondo e l’applicazione delle leggi causali di conservazione: “il contrario di una verità profonda è ancora una verità profonda”. Ecco una buona sintesi del principio di complementarietà di Bohr“Matter should be regarded as having potentialities for developing either comparatively well-defined causal relationships between poorly defined events or comparatively poorly defined causal relationships between comparatively well-defined events, but not both together.” (Bohm, Quantum Theory, 1951, p.157). Molti dei cosiddetti problemi filosofici della MQ per Bohr sono dovuti all’applicazione al mondo quantistico di categorie classiche che funzionano solo in un altro ambito (appunto quello classico). In questo senso il linguaggio della fisica classica è la condizione trascendentale per poter parlare del mondo quantistico. E la misura diventa una categoria essenziale della fisica Mentre Ghirardi sottolinea, in modo forse eccessivo, il debito di Bohr nei confronti del neopositivismo logico (=enfasi sul linguaggio), in realtà nel suo pensiero c’è anche una certa componente kantiana, soprattutto considerando quel che si è appena scritto sulle condizioni “sine quibus non”. Il mondo quantistico considerato in sé è un noumeno, e se proviamo a descriverlo utlizzando categorie classiche prima e indipendentemente dall’esperimento, otteniamo antinomie e contraddizioni. Per Bell, la vaghezza della separazione tra classico e quantistico è il problema principale della interpretazione standard di Bohr Bohr ha due possibili risposte a questa critica, che è alla base della presentazione di teorie alternative alla MQ ortodossa: (1) non è possibile specificare in modo chiaro e una volta per tutte la separazione tra classico e quantistico, dato che la distinzione è irrimediabilmente vaga e contestuale, ovvero dipende dall’esperimento in questione; (2) lo strumento di misura classico e il microsistema quantistico sono non-separabili a causa del quanto di azione, che lega, nella sua indivisibilità, i due sistemi in ogni scambio energetico. Si noti però che la seconda risposta sembra suggerire un trattamento unificato del micro e macro, che Bohr non ritiene possibile Bohr e il realismo scientifico Il ruolo indispensabile dell’indivisibilità del quanto d’azione: ogni correlazione tra microsistemi e macrosistemi (interazione causale) lo presuppone, ma per Borh la sua discontinuità, o atomizzazione, rende impossibile la descrizione nello spazio e nel tempo dell’interazione stessa. E’ a causa dell’indivisibilità del quanto di azione (energia x tempo) che non possiamo assegnare energia e momento ben definiti a un sistema da una parte e simultaneamente descriverlo spazio-temporalmente dall’altra: in più, i due sistemi non hanno realtà indipendente. A causa della finitezza del quanto di azione, segue infatti che “poiché nell’osservazione dei fenomeni [atomici], non possiamo trascurare l’interazione tra l’oggetto e lo strumento di misura, la questione delle possibilità di osservazione viene di nuovo in primo piano. Così, qui incontriamo, in una nuova luce, il problema dell’oggettività dei fenomeni, che ha sempre attatto così tanta attenzione nelle discussioni filosofiche” (Bohr, 1929, Il quanto di azione e la descrizione della natura, citato in Faye, p.137) Due letture di Bohr sul ruolo della Y. Bohr viene a volte presentato come un antirealista sulla teorie: la funzione di una teoria fisica è solo quella di specificare predizioni empiriche su ciò che si può osservare; la Y non descrive nulla, anche se le particelle esistono. D’altra parte, in un’altra interpretazione del pensiero di Bohr, Bohr e i fisici che lo seguono ritengono che la MQ sia completa, ovvero che il vettore di stato fornisca una descrizione accurata e completa della realtà fisica di un sistema, malgrado tale descrizione non assegni valori simultaneamente definiti a grandezze come posizione e momento o tempo e energia, o a grandezze in sovrapposizione. Ciò significa che, come abbiamo visto molte volte, uno stato quantistico di sovrapposizione come questo 1/ 2 ( A B ) (che se valesse l’interpretazione “a ignoranza” si riferirebbe al fatto che c’è una “pallina” o nella scatola A o in B ma noi non sappiamo dove) implica invece che prima della misura la pallina non è né in A né in B, né in nessuna delle due e che quando guardiamo è trovata in A o in B con probabilità 1/2 Cioè, l’interpretazione “a ignoranza” o epistemica delle probabilità quantistiche in questo senso non funziona, perché in uno stato scritto così 1/ 2 ( A B ) ci sono effetti di interferenza: le proprietà disposizionali di uno stato in sovrapposizione non sono quelle tipiche di uno stato in cui la pallina è definitamente in A o in B. Nella misura in cui c’è una certa tensione tra il sostenere che una teoria non ha capacità descrittiva e il sostenere che essa è completa, Bohr non può essere descritto come un antirealista sulle teorie (contro Jan Faye, Niels Bohr, His heritage and legacy, Kluwer) Ripasso Le relazioni di indeterminazione di Heisenberg Ricordiamo che lo scarto quadratico medio di A è DA [A- A ] Il prodotto dello scarto o indeterminazione delle due quantità A e B per un insieme statistico associato a uno stato puro sarà allora DA DB [A- A ] [B- B ] dis.Schwarz [A- A ] [B- B ] Questo passaggio dipende dalle proprietà del prodotto scalare e dal fatto che il modulo di un numero complesso è maggiore del modulo della parte immaginaria 1 [A- A ] [B- B ] [B- B ] [A- A ] 2 z x iy zz* x 2 y 2 y 2 z y 2 y Im z 2 2 1 z z* 2 Poiché gli operatori A-<A> e B-<B> sono entrambi simmetrici, si possono portare a destra del prodotto scalare 1 DA DB [A- A ][B- B ] [B- B ][A- A ] 2 Indicando con le parentesi graffe il commutatore tra A-<A> e B-<B> si ha 1 1 A- A , B- B DA DB A, B 2 2 Poiché <A> e <B> sono numeri, essi commutano con qualunque operatore, ciò che spiega perché l’espressione a sinistra nella formula qui sopra si riduce a quella a destra. Per es., poiché il commutatore tra posizione e quantità di moto vale ih/2p, si ha Dx Dp x ; Dy Dp y ; Dz Dp z 2 2 2 DE D t 2 In relatività lo spazio x è legato al tempo t come l’impulso p è legato all’energia E L’indeterminazione tempo-energia implica la conservazione dell’energia. Se lo stato del sistema coincide al tempo t=0 con un autofunzione propria dell’energia, ovvero se (0)= fj ove H|fj>= Ej |fj> allora il sistema evolve in questo modo: (t ) f j e i E jt in cui l’esponenziale è l’operatore unitario (al posto dell’hamiltoniana H abbiamo messo il suo valore Ej). Ciò implica che la probabilità di trovare l’esito Ej in una misura dell’energia è 1. Ma se l’energia è perfettamente definita, allora il tempo è indeterminato, cioè l’energia si mantiene uguale a se stessa assai a lungo. Heisenberg non derivò le sue relazioni nel modo visto ma propose argomenti più qualitativi. (Ghirardi,1997, pp 413-4) x z diffrazione Immagine geometrica del foro di ampiezza Dx: non conosciamo la posizione della particella lungo x ma la componente verticale del momento px è perfettamente definita, perché è nulla Se restringiamo l’ampiezza della fenditura fino a renderla paragonabile a quella della lunghezza d’onda l=h/p associata all’elettrone, allora abbiamo un’indeterminazione piccola della posizione x dell’elettrone, ma il suo momento px è non nullo a causa della diffrazione (immagine allargata del foro), in modo che il prodotto DxDpx> h/4p Spin e indeterminazione σ x x 1 x ;σ x x 1 x ;σ z z 1 z ;σ z z 1 z x 1 1 1 1 1 ; 0 ; ; x z 0 z 1 2 1 2 1 sz=-1 sx=+1 sz= +1 Le proiezioni di lungo gli assi degli autovettori danno, attraverso il quadrato dei loro moduli, la probabilità di ottenere i vari esiti per l’osservabile spin. Nella figura, tutte le proiezioni sono non nulle sx=-1 Per rendere “quasi determinato” il valore di sz si deve partire da uno stato quasi parallelo ai due autovettori di sz (un suo autostato), ma in questo caso le due componenti di sx tendono a (2)1/2/2 e si ha dunque una massima indeterminazione per l’osservabile sx (e viceversa). Il valor medio tra i due soli esiti (1 e –1) è 0, < sx > = 0, mentre lo scarto quadratico medio vale, secondo la formula già vista, proprio 1, che è il massimo Dsx [ Si pi( a- < a >) 2]1/2 = 1/2 [1/2(1-0)2+ 1/2(-1-0)2]1/2 = 1 sz= -1 y sx=+1 sz= +1 sx=-1 Capitolo 6 Le critiche di Einstein alla meccanica quantistica, ovvero il dilemma tra incompletezza e nonlocalità Sorgente e- Pellicola fotografica semisferica your formulation of quantum mechanics “is certainly imposing…but an inner voice tells me that it is not yet the real thing (Einstein a Born 1926, 91) Nel 1927 (5 conf. Solvay), E. avanza due interpretazioni della (r) o dell’onda De-Broglie-Schroedinger, che in questo esperimento si suppone colpisca la lastra fotografica simultaneamente ma che poi si trova localizzata in un punto specifico r, di cui la |(r) |2 determina solo la probabilità, in funzione dell’intensità dell’onda in quel punto. Le due ipotesi I) incompletezza della teoria, ovvero, la meccanica quantistica non descrive i processi singoli di diffrazione dell’onda e poi di localizzazione, ma si riferisce a insiemi statistici di particelle non tutte nello stesso stato, ognuna delle quali con condizioni iniziali diverse. Le probabilità sarebbero allora epistemiche e i punti di localizzazione si riferirebbero alla probabilità che in r ci sia qualche particella dell’insieme; II) non-località: la meccanica quantistica descrive processi singoli ed è quindi completa, ma l’onda elettronica si trova in un istante su tutta la lastra e l’istante successivo è localizzata in un punto, in contraddizione con la relatività, dato che ogni singolo processo elementare deve agire simultaneamente su due o più punti distinti dello schermo, con un meccanismo che fa andare a 0 l’ampiezza in tutti i punti del fronte d’onda tranne che in uno. “Se |(r)|2 fosse semplicemente considerata la probabilità che un processo elementare si trovi in un certo luogo a un certo istante, potrebbe succedere che lo stesso processo elementare agisca in due o più punti dello schermo. Ma l’interpretazione secondo la quale |(r)|2 esprime la probabilità che questa particella si trovi in un certo luogo presuppone un meccanismo molto particolare di azione a distanza che impedirebbe all’onda distribuita in modo continuo nello spazio di agire in due luoghi dello schermo…Se si lavora soltanto con le onde di Schroedinger, l’interpretazione II di |(r)|2 implica a mio avviso una contraddizione con il postulato di relatività” Einstein in Bohr, Collected Works, vol. 6, p. 102 Molti storici hanno insistito non su questo dilemma, ma sulle critiche di Einstein al principio di indeterminatione di Heisenberg. Come sono connessi questi due fatti? Vediamo la critica al principio di Heisenberg z S1 Le critiche di Einstein (al principio di indeterminazione?) (1927) S2 Un fascio monocromatico (con particelle di uguale impulso iniziale sparate una alla volta) investe uno schermo mobile: applicando la conservazione del momento, si potrebbe determinare in quale fenditura passa la particella in S2, senza distruggere l’interferenza. Si violerebbe così il principio di indeterminazione di Heisenberg: se il primo schermo si sposta verso il basso, la particella andrà verso la fenditura in alto di S2, e viceversa E’ solo l’interazione delle particelle con S1 che può deviare la loro traiettoria, visto che prima avevano momento perpendicolare nullo (pz =0). In linea di principio, anche se praticamente è quasi impossibile, è possibile per Einstein misurare il rinculo dell’apparecchio verso l’alto o verso il basso senza influire sul moto della particella e stabilire quindi per quale fenditura questa passa. Bohr risponde che o si fissa S1 ad una base, e allora si sa con precisione dove è la fenditura, oppure, per stabilire il verso del suo rinculo (in alto o in basso) si deve avere un schermo sospeso con molle e si deve poter misurare con estrema precisione la componente della velocità lungo z. Ma allora, a causa del principio di indeterminazione di Heisenberg, si deve avere una corrispondente indeterminatezza nella posizione dello schermo lungo z. Si deve allora mediare su tutte le posizioni dello schermo S1 che rientrano nella indeterminazione della posizione, ciò che corrisponde a fare una media di tutte le possibili figure di interferenza che corrispondono ad ogni posizione. Fare tale media comporta distruggere la figura di interferenza! Scrive Bohr:” risulta decisivo che, contrariamente ai veri e propri strumenti di misura, questi corpi [vale a dire il diaframma S1], assieme alle particelle, costituirebbero, nel caso in esame, il sistema cui deve applicarsi il formalismo quantistico. Per quanto riguarda la precisazione delle condizioni sotto le quali si può correttamente applicare il formalismo, risulta essenziale che si tenga conto di tutto il dispositivo sperimentale” (cit. in Ghirardi, p.426). Si noti che però Bohr, che respinge l’obiezione di E., considera il diaframma macroscopico S1, solo perché utilizzato nella misura, come tale da cadere sotto l’applicazione del formalismo quantistico. Sebbene sia un corpo chiaramente di dimensioni che rientrano nella fisica classica. Il suo argomento potrebbe essere difeso affermando che solo un corpo quantistico può misurare il rinculo. Ma questa risposta esige di sapere a quali scale possiamo usare la fisica classica e a quali no: e questo è proprio il problema posto dalla tutta la filosofia di Bohr. Ambiguità della separazione classico/quantistico (J. Bell). Bohr direbbe, con termine più benevolo, “constestualità della separazione”. Il punto è che se tutti i sistemi fisici, anche quelli macroscopici classici, possono essere descritti dalla MQ, non ci si può più avvalere della separazione classico/quantistico per evitare il problema della misura. Per questo Bohr, conscio del problema, scrive:”..si deve aver ben chiaro che – oltre che nella descrizione della disposizione nello spazio e nel tempo degli strumenti che formano l’apparato sperimentale – l’uso non ambiguo di concetti spazio-temporali nella descrizione dei fenomeni atomici va interamente limitato alla registrazione di osservazioni che si riferiscono a immagini su una lastra fotografica o ad analoghi effetti praticamente irreversibili di amplificazione, come la formazione di una goccia d’acqua attorno a uno ione in una camera a nebbia (Ghirardi, ibid.) La nozione di irreversibile (e non più di macroscopico) diventa sinonimo di classico Ecco il legame tra il dilemma incompletezza/non-località non colto dagli interpreti e il principio di indeterminazione, legame che non si evince affatto dal resoconto di Bohr nel volume in onore di E. di Schilpp, che in parte non capisce la critica di Einstein. E questo punto non viene colto nemmeno da vari libri recenti su Bohr: il fatto essenziale è chela particella e il diaframma, sia per B che per E, sono un sistema composto, e in più inseparabile, a causa del fatto che tra le grandezze del sistema valgono le relazioni di indeterminazione di Heisenberg. Non possiamo dire che la particella ha una posizione definita se la velocità lungo z del diaframma è non nulla; viceversa, se la velocità lungo z della particella è non nulla, questo comporta che la posizione del diaframma sia indeterminata, proprio perché deve essere definito il suo momento verticale. Il punto centrale che muove E. a criticare il Principio di H. ha quindi a che fare con la non-separabilità di sistemi spazialmente distanti che obbediscano al principio di H. Bohr non capisce il legame tra principio di indeterminazione e non-separabilità, malgrado teorizzi e comprenda forse per primo la seconda. Ma la non-separabilità per Bohr riguarda le condizioni di possibilità dell’attribuzione di una proprietà a un microsistema (è l’inevitabilità dell’apparato di misura) e e non coinvolge minimamente la non-località spaziotemporale, che E. invece coglie molto bene per primo. In un saggio non pubblicato del 1927, studiato da D. Belousek in SHPMP, 1996, 27, E. deriva una sorta di equazione di Hamilton-Jacobi quantistica, in cui l’energia cinetica complessiva del sistema è la somma dell’energia cinetica assegnata alle sue n componenti, e tale che la velocità di ogni componente è determinata a ogni istante e contribuisce all’energia complessiva del sistema. “l’assegnazione di moti completamente determinati a soluzioni dell’equazione differenziale di Schroedinger è, almeno dal punto di vista formale, possibile tanto quanto lo è l’assegnazione di moti determinati dell’equazione di Hamilton-Jacobi della meccanica classica” (Einstein, in Belousek 1996) Ma poi ritira la pubblicazione, perché si rende conto che due sottosistemi qualsiasi in questo schema sarebbero entangled, cioè il moto di uno dipenderebbe strettamente da quelle dell’altro e lui rifiuta tale non-separabilità non-locale. • L’argomento di E. si può allora ricostruire così. Supponiamo che si misuri la velocità e il verso del moto di S1: allora, tramite il principio di conservazione dell’impulso, possiamo calcolare l’impulso della particella lontana senza disturbarla; per il principio di H., la particella dovrà avere una posizione indefinita. Ma se avessimo invece deciso di misurare la posizione dello schermo dopo l’interazione con la particella, avremmo reso indefinito l’impulso della particella. Le due variabili non sono simultaneamente misurabili, naturalmente, ma come fa la realtà delle proprietà della particella lontana (posizione e impulso) a dipendere dal tipo di misura che decidiamo di effettuare sullo schermo, che può essere separato da intervalli di tipo spazio dalla particella? L’argomento della scatola e del fotone (Solvay 1930) La presentazione standard è la seguente: Einstein considera una scatola contenente radiazione elettromagnetica, dotata di un orologio che fa aprire una fessura dalla quale può uscire radiazione ad un tempo fissato. Se ipotizziamo che idealmente T0, e che dall’apertura sia uscito un solo fotone, pesando la scatola prima e dopo la fuoriscita della particella, mediante la formula E= mc2 si può determinare, oltre al tempo, anche l’energia emessa dalla scatola attraverso l’espulsione del fotone, in contraddizione con la formula dell’indeterminazione tempo-energia DT DE > h/2p , (1) Ghirardi, Un’occhiata alle carte di Dio, p. 145 La risposta di Bohr utilizza il principio di equivalenza della Relatività generale. Al solito, per determinare il peso della scatola, la velocità lungo la verticale dell’indicatore deve essere nulla, e quindi si finisce con l’avere una posizione lungo la verticale assai indefinita. Questa incertezza si traduce in una indefinitezza del peso, e perciò dell’energia Unruh e Opat, nell’American Journal of Physics, 1979, mostrano che la risposta di Bohr può evitare il ricorso al principio di equivalenza, che sfrutta l’incertezza nella posizione dell’orologio per affermare che diventa incerta la sua quota e quindi la scansione temporale dell’orologio Come risposta, Bohr deriva la disuguaglianza (1) Bohr usando queste formule: E = m c2 , (2) Dp Dq > h , (3) Dp < Tg Dm , (4) DT/T= (1/c2 )g Dq . (5) Sia T l’intervallo corrispondente al tempo necessario per le procedure di peso, Dm l’accuratezza nella procedura di peso. L’impulso mDv=Dp<FTDmgTTgc-2DE per la (2). La disuguaglianza nella (4) per Bohr si giustifica perché l’indeterminazione nel momento Dp è minore dell’impulso totale dato dalla procedura di peso Dp < Tgc-2DE Dp < gc-2DE DT c2 /g Dq da cui seguono le relazioni di indeterminazione per tempo e energia h/2p < DpDq < DEDT Spieghiamo la (5):gDq è energia potenziale, nel nostro caso, differenza di potenziale legata all’incertezza nella posizione; il red-shift gravitazionale implica che l’orologio posto in basso nel campo gravitazionale vada più lentamente. Nell’esperimento di Briatore e Leschiutta (1975), si trovò che un orologio a Torino dopo 68 giorni perdeva 2,4 .10-6 s. rispetto a quello sul Plateau Rosa. Se l è la differenZa di quota, la differenza tra gli intervalli di tempo è data dalla formula DT’-DT DT(gl/c2) Un critica contemporanea all’esperimento mentale del fotone nella scatola “Indeed, if the shutter is open during a vanishing time interval (for just one photon to escape, Einstein thought) then the electromagnetic pulse must be very sharp, ideally a Dirac delta. According to classical electrodynamics, the Fourier components of such a pulse involve a wide spectrum of frequencies. Therefore the electromagnetic pulse does not have a precisely defined frequency. On the other hand the unique escaping photon should have, according to Einstein, a precisely defined energy, that is, a precisely defined frequency (E = hn) in contradiction with the sharp pulse. At least in 1949, Einstein was well aware of this contradiction as he stated that “...indivisible point-like localized quanta of the energy hn (and momentum hn/c)...contradicts Maxwell’s theory” [6]. We know today that the photon concept is compatible with Maxwell’s theory provided that we abandon the simultaneous requirement of point-like localization and precise energy-momentum.” (de La Torre et. al. 1999, arXiv:quant-ph/9910040 v1 8 Oct 1999). Per gli autori, il fotone ipotizzato da Einstein non può esistere This is a hybrid set involving classical mechanics (4), special relativity (2), quantum mechanics (3) and general relativity (5). … this hybrid mixture is precisely the root of the weakness of the argument. .. However, in order to provide a proof of the inequality, the relations (2) to (5) must be valid and the symbols used in these formulas must have the same meaning as the one in the inequality (1). We will see that these two requirements are not satisfied by Bohr’s reply (de La Torre et. al. 1999, arXiv:quant-ph/9910040 v1 8 Oct 1999) In Bohr’s reply to Einstein, T is the “interval of balancing procedure”, m is the “weighing... accuracy”, q is the “position ... accuracy” and p is the “minimum latitude in the control of the momentum of the box”. In these definitions there is a mixture of classical uncertainties and quantum indeterminacies. (de La Torre et. al. 1999, arXiv:quantph/9910040 v1 8 Oct 1999) The first difficulty that we find with Bohr’s argument is that the symbol T has not the same meaning in the set of relations (2) to (5) as in relation (1). In Einstein’s argument, T is the indeterminacy in the moment of escape of the “photon” (more precisely, the time-width of the electromagnetic pulse) and in Bohr it means the indeterminacy in the balancing time of the box during the weighing procedure. These indeterminacies need not be the same. The weighing of the box can, indeed, be made a long time after the escape of the electromagnetic pulse. We have here sufficient reason to take Bohr’s reply as inconclusive. (de La Torre et. al. 1999, arXiv:quant- ph/9910040 v1 8 Oct 1999) Ma anche in questo caso, il punto che stava a cuore ad Einstein è completamente diverso: riguardo all’incontro Solvay del 1930, gli storici hanno troppo insistito sulla ricostruzione di Bohr. In una lettera di Eherenfest a Bohr del 9.7.1931 leggiamo: “[Einstein] mi disse che già da molto tempo non dubitava più delle relazioni di indeterminazione, e che perciò egli non aveva assolutamente inventato “la scatola a lampo di luce pesabile “contra” le relazioni di indeterminazione, ma per uno scopo completamente diverso” In Howard D. (1990), Nicht sein kann was nicht sein darf or the prehistory of EPR, 1909-1935, in Sixty-Two Years of Uncertainty, a cura di A. I. Miller, New York, Plenum Press Vedi Laudisa (1998), p. 46: nella stessa lettera Ehrenfest descrive una variante dell’esperimento della “scatola a fotone pesabile”, in cui una macchina emette un proiettile, che viene riflesso da uno specchio posto a grande distanza (separazione di tipo spazio). Dopo l’emissione, lavorando solo sulla macchina, è possibile predire due valori non commutativi, a seconda di ciò che scegliamo di misurare Dice Ehrenfest: “E’ interessante chiarire il fatto che il proiettile, che si muove già isolato e ‘per conto proprio’, deve essere pronto a soddisfare predizioni non commutative molto diverse, senza sapere ancora quale di queste predizioni verrà fatta”. Ovvero potrei misurare il tempo di andata e ritorno del proiettile o la sua energia, senza in alcun modo influenzarlo. Devo quindi assumere che entrambe le quantità sono misurabili, a meno di non far dipendere la realtà delle proprietà del proiettile da ciò che faccio sulla scatola, a distanza. In nuce, c’è EPR, e comunque di nuovo la questione della non-separabilità tra macchina e proiettile, che invoca il problema della completezza. Se scegliessi di misurare l’osservabile E sulla macchina avrei una funzione d’onda pro di un certo tipo, senza influenzare la realtà a distanza del proiettile a causa del postulato di relatività; ma se scegliessi di misurare T, avrei una funzione d’onda diversa ’pro, senza che la realtà a distanza del proiettile sia modificata. Poiché esistono due diverse rappresentazioni della medesima realtà, il rapporto tra funzione d’onda e sistema rappresentato non è biunivoco ed esiste dunque incompletezza, nella misura in cui per la completezza la biunivocità tra funzione d’onda e realtà è CNES (c’è un elemento di realtà che non è descritto dalla teoria, che si riferisce allo stesso elemento). Capitolo 4 Il problema della nonlocalità nella MQ L’argomento EPR-Bohm-Bell 1 2 3 4 5 Stati Entangled Esposizione qualitativa di EPR Dimostrazione del teorema di Bell Risultati sperimentali Conseguenze concettuali implicazioni filosofiche e 7.1 Stati entangled “Io considero l’entanglement non uno ma il tratto più caratteristico della meccanica quantistica, quello che implica il suo completo distacco da qualsiasi concezione classica” E. Schroedinger Stati fattorizzati e non fattorizzati (Ghirardi p. 430 e ss) Uno stato fattorizzato è uno stato dello spazio composto H che risulta il prodotto diretto (o tensoriale) di stati appartenenti ai sistemi componenti H1 e H2: (1) ( 2) c (1) c( 2) [ ai i ] [ b j c j ] aib j [(1) c( 2) j ] cij [(1) c( 2) j ] (1) i ( 2) j ij ij Nello spazio H associato al sistema composto esistono anche stati non fattorizzati, che corrispondono a combinazioni lineari di stati fattorizzati in cui i fattori sono autovettori con autovalori distinti. Il problema concettuale principale in questo contesto è se e quando è possibile attribuire proprietà definite o oggettive ai componenti di uno stato non fattorizzato di H. Se lo stato fattorizzato ha come fattori autovettori di osservabili A e B relative ai sistemi componenti, allora i componenti possiedono proprietà oggettive. Se lo stato fattorizzato è FF = (1) i c( 2) j e A(1) (1) i ai (1) i ; B ( 2) c ( 2) j b j c ( 2) j allora gli stati componenti posseggono le proprietà ai e bj indipendentemente da un processo di misura, dato che FF è autostato di A(1) I (2) e di I (1) B ( 2) (ciascun prodotto tensore è un operatore autoaggiunto relativo a H) con gli autovalori sopra riportati. Se, “dato un qualsiasi stato di uno spazio di Hilbert esiste sempre un operatore autoaggiunto di cui esso è autostato e se si assume che ogni operatore autoaggiunto rappresenti un’osservabile, allora può concludersi che nel caso di un sistema fisico individuale (…) associato a uno stato fattorizzato, i costituenti del sistema possiedono, ciascuno, una precisa proprietà oggettiva” (Ghirardi p. 431) ~ (1, 2) a(1) i c ( 2) j b(1) r c ( 2) s ; | a |2 | b |2 1 Ecco uno stato puro entangled (verschraenkt) del sistema composto associato a H, in cui i fattori dei due termini della sovrapposizione risultano autovettori delle osservabili A e B con autovalori distinti. Abbiamo quindi una probabilità |a|2 che dopo una misura i due sistemi componenti rivelino l’autovalore ai per l’osservabile A e l’autovalore bj per l’osservabile B (lato sinistro della sovrapposizione) e probabilità |b|2 di rivelare invece gli autovalori ar e bs per il sistema associato a H(1) e H(2) rispettivamente ( con a e b diversi da 0 e 1) Ne segue che le due parti del sistema composto (il “tutto”) il cui stato è la sovrapposizione qui in alto non hanno proprietà oggettive o definite! È solo se si suppone che f(1)i e f(2)r siano autovettori relativi allo stesso autovalore c di un operatore degenere C(1) - cosicché i due autovettori appartengano alla stessa autovarietà - che il vettore di stato del sistema composto è un autostato di un’osservabile e i componenti hanno proprietà definite ~ (1, 2) [C I ] [C (1) I (2) ] ((1) i c( 2) j (1) r c( 2) s ) (1) c (2) (1) i c ( 2) j c (1) r c ( 2) s ~ (1, 2) c Per un sistema composto in uno stato di sovrapposizione di due o più stati fattorizzati, i costituenti del sistema non hanno proprietà oggettive, anche se il sistema come un tutto ha sempre qualche proprietà (c’è un osservabile di cui lo stato è un autostato). In generale, se si lascia evolvere liberamente uno stato fattorizzato dopo aver fatto interagire le sue parti, i costituenti perdono le proprietà definite e solo il tutto le mantiene nel senso visto. Dato che tutto interagisce prima o poi con tutto il resto, le particelle che compongono il nostro corpo sono inestricabilmente entangled con tutto il resto dell’universo “L’universo indiviso” di cui parlano Bohm e Hiley (1989) è una forma di olismo in cui solo la funzione d’onda che descrive l’universo ha una sua definitezza, mentre tutte le sue componenti non possiedono alcuna proprietà oggettiva Dunque non è vero, come spesso pensano i filosofi che non conoscono le scienze naturali ma ne pontificano spesso, che l’olismo è una caratteristica che si ritrova solo nella mente o nelle scienze umane. Ovviamente, ci sono vari “olismo”: olismo delle credenze, del significato, della conferma (Duhem-Quine), e l’olismo della MQ è diverso da questi altri tipi di olismo In tutti i casi, nell’olismo c’è l’idea che le proprietà delle parti dipendano da quelle delle altre parti o addirittura da quelle del tutto. A volte c’è l’idea che il tutto sia più della somma delle parti. Nel caso quantistico, l’olismo ha vari significati, che apprezzeremo fino in fondo quando tratteremo la non-località. Per ora, c’è l’idea che le parti di un tutto che hanno interagito e che sono in uno stato non fattorizzato non possiedono proprietà definite prima della misura e le acquisiscono “tutte insieme” con una misura. ESERCIZIO (Si veda Ghirardi 1997, pp. 433-4) Dopo aver ricordato la generica forma di un generico vettore di spin semintero a , a, b C, | a |2 | b |2 1 b dimostriamo per esercizio che per ogni stato dello spazio di spin esiste sempre una direzione n tale che risulta autovettore dell’operatore sn (che da la componente dello spin in quella direzione prescelta) con autovalore unitario sn | +1 |sn>. Scriviamo il nuovo operatore in funzione del versore n = (nx+ny+nz), “proiettando” quindi le matrici di Pauli s = (sx, sy ,sz) in quella direzione,ovvero facendo il prodotto scalare tra n e s 2 2 2 n (nx , n y , nz ), n x n y n z 1, n versore s n s x nx s y n y s z nz nx in y nz 0 1 0 i 1 0 s n nx ny nz nz 1 0 i 0 0 1 nx in y nx in y a nz a (nx in y )b a nz a | 1 2 2 1 a | | b | b b nz (nx in y )a nz b b nx in y a *[nz a (nx in y )b] aa* | a |2 nz | a |2 (nx in y )a * b | a |2 b *[( nx in y )a nz b] bb* | b |2 b * a(nx in y ) nz | b |2 | b |2 Dopo aver moltiplicato entrambi i membri per i complessi coniugati di a e b, sommo membro a membro, ottenendo 1 a destra perché il vettore di spin è normalizzato nx (a * b b * a) n y i (b * a a * b) nz (| a |2 | b |2 ) 1 1 1 Re[ b * a] (b * a a * b); Im[ b * a] (b * a ba*) 2 2i nx (a * b b * a) nyi(b * a a * b) nz (| a |2 | b |2 ) 1 I coefficienti che moltiplicano le componenti del versore n (le espressioni tra parentesi) sono quindi(dx=2Re[ab*], dy= -2Im[ab*], dz=1-2|b|2). Quadrando i coefficienti si ha dx2 + dy2+ dz2 =1, come dev’essere per un vettore di spin (a * b) 2 (b * a) 2 2 | a |2 | b |2 (b * a) 2 (b * a) 2 2 | a |2 | b |2 | a |4 2 | a |2 | b |2 | b |4 | a |4 2 | a |2 | b |2 | b |4 (| a |2 | b |2 ) 2 1 Sostituiamo ora i valori di d nella matrice trovata sz , ,verificando quel che volevamo dimostrare, ovvero che esiste una direzione rispetto alla quale lo stato di spin di componenti generiche (a, b) è austostato con autovalore 1 (in unità di h/2p) 1 2 | b |2 sd 2a * b 2ab * a a s 1 b d b 2 | b |2 1 QED! Troviamo gli autovettori z e z dell’operatore sz nz w nx in y det( s z wI) det 0 nx in y nz w 2 2 2 2 2 2 2 2 nz w n x n y 0 w n x n y nz 1 w 1 Sostituiamo i due autovalori trovati nella matrice di cui sopra nz 1 nx in y nx in y x 0 (nz 1) x (nx in y ) y 0 nz 1 y 0 (nx in y ) x (nz 1) y 0 w 1 (nz 1) x (nx in y ) y x (nx in y ); y (nz 1) w 1 (nx in y ) x (nz 1) y x (nz 1); y (nx in y ) n( w1) 1 1 1 nz (nx in y ) n in ; n( w1) y 2(1 nz ) x 2(1 nz ) 1 nz n( w1) n( w1) 1 1 nz n in y 2(1 nz ) x 1 (nx in y ) 1 n 2(1 nz ) z Scriviamo gli autovettori di sz 1 0 z ; z 0 1 Poiché gli autovettori di sz sono una base completa dello spazio di spin, possiamo esprimere gli autovettori di sn come loro combinazione lineare nx in y (nx in y ) 1 nz 1 nz n z z ; n z z 2(1 nz ) 2(1 nz ) 2(1 nz ) 2(1 nz ) (1) F a c b d ( 2) In uno stato fattorizzato di un sistema composto, esistono per le ragioni viste una direzione relativa al primo e una al secondo componente, con autovalore +1, che ci consentono di dire che F è autostato di entrambe e i componenti hanno proprietà di spin definite S (1, 2 ) 1 (1) ( 2) (1) ( 2 ) [ z z z z ] 2 In questo stato di singoletto, si ha uno stato entangled, e si ha probabilità ½ di trovare la prima particella con spin lungo z in su e la seconda con spin lungo z in giù, e ½ di trovare la situazione opposta (la prima particella con spin lungo z in giù e la seconda con spin lungo z in su). Queste conclusioni valgono per qualunque direzione n si scelga: S (1, 2 ) 1 (1) ( 2) (1) ( 2 ) [ n n n n ] 2 come si può verificare prima sostituendo alle espressioni per n e n le espressioni trovate nella pagina precedente e poi facendo i prodotti tensori che così si trovano 4.2 Esposizione qualitativa di EPR a A e B sono separati da intervalli di tipo spazio, ovvero non sono connettibili da alcun segnale, nemmeno dalla luce A b B Condizione di realtà di EPR “Se, senza disturbare in alcun modo un sistema, è possible prevedere con certezza (vale a dire, con probabilità pari a 1) il valore di una quantità fisica, allora esiste un elemento di realtà fisica che corrisponde a questa quantità” Condizione di località di EPR “Gli elementi di realtà fisica di un sistema non possono essere influenzati istantaneamente a distanza” Prendiamo due particelle a e b in uno stato entangled: (1, 2 ) 1 2 1 1 1 2 2 2 posizionate in due zone A e B distanti nello spazio, in cui ci siano due apparati misuratori dello spin, e assumiamo la condizione di (i) realtà di EPR e di (ii) completezza. Allora il fatto di poter prevedere con certezza pari a 1, e prima di eseguire la misura, che cosa si otterrà dall’altra parte dell’esperiemento, basta, in base alla condizione di realtà esplicitata nella pagina precedente, a concludere che esiste un elemento di realtà oggettiva e definita che la teoria ufficiale non descrive, dato che lo stato qui sopra è puro, ed è uno stato di sovrapposizione privo di proprietà relative allo spin lungo una direzione. Ne segue che o la MQ è non locale o incompleta ed EPR optano per la incompletezza, senza proporre alcuna teoria 7.3 Il teorema di Bell (“On the EPR paradox”, Physics 1, 1964) È tra i risultati più importanti della fisica della seconda metà del 900, e non solo da un punto di vista concettuale e filosofica, visto che ha aperto la strada a numerosissimi esperimenti (vedi Entanglement di A. Aczel, Cortina editore, 2004, per una storia divulgativa degli esperimenti nati a partire dagli anni 70.) a A A e B sono separati da intervalli di tipo spazio, ovvero non sono connettibili da alcun segnale, nemmeno dalla luce b B Due particelle vengono sparate in direzioni opposte e misurate nelle regioni spazio-temporali A e B, separate da intervalli di tipo spazio. Sia il risultato di misura effettuato sulla prima particella in A, sia a la direzione spaziale in cui si effettua la misura e sia l la eventuale variabile nascosta; sia il risultato di misura in B effettuato nella direzione b sull’altra particella. Il requisito di località di Bell è che la probabilità congiunta pAB di ottenere da una parte dell’esperimento e dall’altra è dato dal prodotto delle due probabilità singolarmente considerate. Un altro modo per descrivere tale località è quello di affermare che gli eventi dati dai due risultati di misura sono probabilisticamente indipendenti l’uno dall’altro e il risultato di misura in A dipende solo dal parametro locale a e dalla variabile nascosta. Indichiamo con p(|*a) la probabilità condizionata di ottenere il risultato se si misura nella direzione a e nessuna misura viene eseguita dall’altra parte (*). Analogamente per l’altra probabilità. Si ha allora Bell ' slocality plAB ( | a b) plA ( | *a) plA ( | *b) LB= plAB(a,b;,) plA(a,*;) plB(b,*;) Questa formula rende precisa l’idea originale di EPR che se c’è località il risultato da un parte dell’esperimento non deve dipendere da ciò che si misura dall’altra parte e addirittura dal fatto che si faccia una misura dall’altra parte. se un esperimento di tipo EPR-Bohm deve essere localmente spiegabile magari anche tramite variabili l che completino la teoria standard, allora le probabilità dei risultati di misura alle due ali A e B dell’esperimento devono essere statisticamente indipendenti. Per un semplice teorema del calcolo delle probabilità, ne segue che una qualsiasi teoria che intenda descrivere lo stato del sistema a+b in modo locale, deve assegnare una probabilità ai due eventi che sia uguale al prodotto delle probabilità assegnate ai due eventi di misura presi singolarmente. Prendiamo due particelle 1 e 2 in uno stato non fattorizzabile: (1, 2 ) 1 2 1 1 1 2 2 2 posizionate in due zone A e B distanti nello spazio, in cui ci sono due apparati misuratori: uno che può misurare lo spin di a in direzione a o c, e il secondo che può misurare lo spin di b in direzione b o d. Consideriamo la quantità che esprime la differenza tra risultati discordi : El(a,b)= plAB(a,b;up, up)- plAB(a,b;up, down) plAB(a,b;down, up)+ plAB(a,b;down, down) Per LB, si ottiene: El(a,b)= plA(a,*;up) plB(b,*;up)- plA(a,*;up) plB(b,*;down)plA(a,*;down) plB(b,*;up)+plA(a,*;down) plB(b,*;down) Da cui: El(a,b)=[plA(a,*;up)- plA(a,*;down)] [plB(b,*;up)- plB(b,*;down)](1) Ripetiamo il calcolo per la quantità per le due direzioni a (nella regione A) e d (nella regione B): El(a,d) = plAB(a,d;up, up)- plAB(a,d;up, down)- plAB(a,d;down, up)+ plAB(a,d;down, down) Che per LB diventa: El(a,d)= plA(a,*;up) plB(d,*;up)- plA(a,*;up) plB(d,*;down)plA(a,*;down)plB(d,*;up)+ plA(a,*;down)plB(d,*;down) E quindi El(a,d)= [plA(a,*;up)- plA(a,*;down)] [plB(d,*;up)- plB(d,*;down)] (2) Sottraendo la quantità rossa da quella blu, ovvero la 2) dalla (1), si ottiene la (3) qui sotto: El(a,b)- El(a,d)= [plA(a,*;up)- plA(a,*;down)] [[plB(b,*;up)- plB(b,*;down)]- [plB(d,*;up)- plB(d,*;down)]] (3) Ma plA(a,*;up)+ plA(a,*;down)=1, per cui plA(a,*;up)- plA(a,*;down)=1-2 plA(a,*;down) Poiché però 0< plA(a,*;down)<1, allora -1 < 1-2 plA(a,*;down) < 1 e dunque, prendendo il valore assoluto |1- 2 plA(a,*;down)|< 1 (4) Poiché il valore assoluto del prodotto di due numeri è uguale al prodotto dei valori assoluti dei due numeri, applicando la (4), si ha: |El(a,b)- El(a,d)| = |1-2plA(a,*;down)| |[[plB(b,*;up)-plB(b,*;down)]-[plB(d,*;up)- plB(d,*;down)]]| |El(a,b)- El(a,d)| < |[plB(b,*;up)- plB(b,*;down)]- [(plB(d,*;up)plB(d,*;down)]| (5) Consideriamo adesso l’altra direzione c lungo cui è possibile misurare la particella nell’ala A dell’esperimento. Con lo stesso ragionamento si riottiene la (5) dell’ultimo lucido, con l’unica differenza data dalla variabile c al posto di a e dal segno +: |El(c,b) + El(c,d)| < |[[plB(b,*;up)- plB(b,*;down)] + [plB(d,*;up)plB(d,*;down)]]| (6) Sommando la (5) e la (6) si ottiene: |El(a,b)-El(a,d)| + |El(c,b)+El(c,d)| < |[[plB(b,*;up)plB(b,*;down)] - [plB(d,*;up)- plB(d,*;down)]]| + + |[[plB(b,*;up)- plB(b,*;down)]+ [plB(d,*;up)- plB(d,*;down)]]| r s |El(a,b)-El(a,d)| + |El(c,b)+El(c,d)| < |r-s|+|r-s| r+s r-s r Positivo Positivo s r+s + rs 2r -2s Positivo Positivo Negativ Negativ o o Negativ Positivo Positivo 2s Si noti o che nella prima fila si ha r-s + r-s = 2r, nella seconda r-s –r-s = -2s,Negativ nella terzaNegativ –r+s+r+s=2s e nell’ultima –2r. Ricordando che Negativ -2r o ], e s = [plB(d,*;up)- plB(d,*;down)] r = [polB(b,*;up)-oplB(b,*;down) e che |1- 2 plA(a,*;down)|< 1 si ha che sia r che s sono minori o uguali a 1. Ne segue la DB: |El(a,b) - El(a,d)| + |El(c,b)+El(c,d)| < 2 La dimostrazione di Bell, però, vuole considerare la possibilità che una eventuale completamente locale della MQ sia governata da variabili l che noi non possiamo controllare, e di cui, perciò, non conosciamo il valore se non in senso statistico. Perché la disuguaglianza appena provata valga anche per una teoria a variabili nascoste che riproduca le previsioni statistiche quantistiche, dobbiamo fare una media pesata della quantità che è argomento della disuguaglianza rispetto una distribuzione di probabilità r(l) su l, che è poi l’unica quantità fisicamente misurabile: E(a, b ) Eλ (a, b )r(l )dl (7) In questo caso r(l) è la funzione che riproduce la distribuzione di probabilità che risulta dal procedimento di preparazione del sistema Dimostriamo che anche la media E(a,b) soddisfa la disuguaglianza vista prima, per cui |E(a,b)-E(a,d)| + |E(c,b)+E(c,d)| < 2 Per la dimostrazione, oltre alla (7), usiamo il fatto che la funzione r(l) è positiva e il suo integrale è unitario (è una probablità) e il fatto che l’integrale di un modulo maggiora il modulo dell’integrale: E(a, b) - E(a, d) E(c, b) E(c, d) dlr(l)[E (a, b) - E (a, d)] dlr(l)[E (c, b) - E (c, d)] l l l l dlr(l) [E (a, b) - E (a, d)] dlr(l) [E (c, b) - E (c, d)] l l l l dlr(l)( [E (a, b) - E (a, d)] [E (c, b) - E (c, d)] ) 2 dlr(l) 2 l l l l E(a, b) - E(a, d) E(c, b) E(c, d) 2 Questa è la disuguaglianza di Bell nella forma di Clauser, Horne, Shimony e Holt (1969) Tale disuguaglianza è violata dalla MQ. In MQ le probabilità congiunte relative ai risultati delle misure in A e in B, relativi all’angolo ab compreso tra le due direzioni a e b sono: plAB(a,b;up, up)= plAB(a,b; down, down)=1/2 sin2(ab) plAB(a,b;up, down)= plAB(a,b; down, up)=1/2 cos2(ab) Da cui si deriva che per la MQ: El (a,b) = 1/2 sin2(ab) + 1/2 sin2(ab) - 1/2 cos2(ab) -1/2 cos2(ab) =-cos (2ab) Se applichiamo alla quantità El(a,b)-El(a,d) + El(c,b)+El(c,d) queste probabilità su determinati angoli a=0°, b=22.5°, c=45°, e d=67.5° , si ottiene un valore maggiore di 2, per cui si dimostra che le probabilità della MQ violano la disuguaglianza data. Bell, infine dimostra che la differenza tra E(a,b)=-cos(a-b) calcolato dalla MQ e E(a,b) calcolato da una teoria locale, non può essere resa arbitrariamente piccola. Per cui, conclude Bell, “the quantum mechanical expectation value cannot be represented, either accurately, or arbitrarily closely, in the form E(a, b ) dlr (l )E λ (a, b ) “On the Einstein-Podolsky-Rosen paradox”, J. S. Bell. 1964. In “Speakable and unspeakable in quantum mechanics”. Rimane in effetti ancora una possibilità che salverebbe la località della MQ. Si può ipotizzare che la semplice sistemazione dell’apparato misuratore di A in posizione a, piuttosto che in c, influenzi il risultato della misura su B e che tale influenza sia locale. La sistemazione di un apparato misuratore, infatti, non è un’operazione eseguibile in un lasso di tempo abbastanza breve da poter cominciare dopo l’emissione delle particelle e terminare prima del loro arrivo agli apparati- va dunque eseguita prima dell’emissione delle particelle dalla fonte. Ciò significa che un segnale (un processo causale, un’informazione..) mandato dall’apparato misuratore sino alle particelle (o sino all’altro apparato) avrebbe tutto il tempo di influenzare la misura all’altro capo dell’esperimento mantenendo sempre una velocità al di sotto di quella della luce. C’è quindi la possibilità, che la MQ sia una teoria di limitata validità: “Essa si potrebbe applicare unicamente ad esperimenti in cui le sistemazioni degli strumenti sono fatte sufficientemente in anticipo per permettere ad essi di raggiungere qualche mutuo rapporto tramite scambio di segnali con velocità minore o uguale a quella della luce.” Per dare una risposta definitiva a tale questione fu necessario aspettare sino al 1982, quando l’esperimento di Alain Aspect falsificò questa ipotesi. Il risultato dell’esperimento di Aspect è che le previsioni della MQ vengono nuovamente rispettate: questo esperimento è considerato la prova definitiva che la MQ non può subire un completamento locale. 7.4 Il significato concettuale del teorema di Bell e degli esperimenti ad esso seguiti Si noti che la teoria a variabili nascoste considerata è del tutto generale, nel senso che l fissa le probabilità dei risultati, e nulla impedisce che tali probabilità siano sempre 0 o 1, e si abbia dunque a che fare con una teoria deterministica. Nel caso in cui le disuguaglianze di Bell siano violate sperimentalmente, come effettivamente accade, si è così dimostrato che non può esistere una teoria a variabili nascoste (stocastica o deterministica che sia) che sia anche locale nel senso di Bell. Più in generale e tornando a EPR, ne segue che se l’alternativa posta da EPR era tra completezza e località della MQ, qualunque teoria che riproduca le correlazioni quantistiche può essere completa solo se nonlocale nel senso di Bell! La prova formale di questa asserzione è data nella pagina seguente. Ne segue, per esempio, che la luna c’è solo se la si osserva, nel senso che se le proprietà di spin in una direzione non preesistono alla misura; piuttosto, esse sono create a distanza dalla misura, ovvero dall’atto di osservare! Molti fisici asseriscono che la violazione sperimentale delle disuguaglianze di Bell conferma la meccanica quantistica a scapito della teoria a variabili nascoste. Ma una teoria a variabili nascoste non-locale è compatibile con i dati sperimentali e non è refutata da questi. Inoltre, l’ipotesi di definitezza delle proprietà o realismo non è necessaria per ricavare le disuguaglianze stesse, cosicché anche la MQ è non-locale. 1)Anticorr 100% & LB Determinismo (dimostrata nella p. seguente) 2)Determinismo & LB Dis. Bell (teorema di Bell) 3)MQ -(Dis. Bell) 4) - Dis. Bell -Determinismo v –LB (dalla 2) nella seconda alternativa QED da 3 e 4,per cui esaminiamo solo la prima alternativa 5)-Determinismo-Anticorr 100% v –LB (dalla 1) ma la prima alternativa è falsa perché MQ implica Anticor 100% e rimane la seconda 6) MQ-LB QED Se valgono le anti-correlazioni perfette, per una stessa direzione n, qualunque essa sia,non si hanno mai risultati identici, mentre è equiprobabile ottenere +1 a destra e –1 a sinistra o viceversa plAB (n, n | 1,1) 0 plAB (n, n | 1,1) p AB l 1 (n, n | 1,1) plAB (n, n | 1,1) 2 Dalla prima equazione a sinistra, applicando LB, e ricordando A (n | * 1) p che i risultati sono 1 o –1, si ottiene che o è nullo o l l p (n | * 1) è nullo B . Non sono nulli entrambi per le ultime 2 equazioni della pagina, ovvero non si può avere –1 da entrambe le parti con prob. 1, perché il prodotto deve dare 0 plAB (n, n | 1,1) plA (n | * 1) plB (n | * 1) 0 1) plA (n | * 1) 0 plA (n | * 1) 1 oppure 2) plB (n | * 1) 0 plB (n | * 1) 1 plAB (n, n | 1,1) plA (n | * 1) plB (n | * 1) 0 Dalla 1) e da questa eq. si ricava che se plA (n | * 1) 1 allora plB (n | * 1) 0 E quindi anche che plB (n | * 1) 1 In sintesi, dalla 1) si ricava che plA (n | * 1) 0, plA (n | * 1) 1 plB (n | * 1) 0, plB (n | * 1) 1 Ragionando sulla 2) nell’identico modo, si hanno le seguenti relazioni, che completano la dimostrazione: plA (n | * 1) 0, plA (n | * 1) 1 plB (n | * 1) 0 plB (n | * 1) 1 ogni probabilità relativa a una sola misura può quindi assumere solo i valori 1 e 0 e, nell’ipotesi di anticorr.100% e di LB, vale quindi il determinismo Riassumendo, la disuguaglianza di Bell, che è tanto semplice matematicamente quanto concettualmente ricca, è deducibile solo da LB (la condizione di località di Bell) e dalle predizioni di anticorrelazione quantistiche. Poiché la disuguaglianza è violata sperimentalmente, se si vogliono riprodurre le predizioni di anticorrelazione, si deve abbandonare la nonlocalità di Bell. In questo senso, qualunque teoria che riproduce le anticorrelazioni (e dunque anche la MQ “ordinaria”) è non-locale nel senso di Bell. È in questo senso che gli esperimenti hanno provato che la natura stessa è non-locale: un esempio di metafisica sperimentale 7.5 Non-località e segnali superluminale Ovvero, il rapporto tra QM e relatività speciale: coesistenza pacifica Indichiamo con W(1,2) l’operatore statistico relativo a un insieme composto S =S1 +S2 supponendo di avere a che fare con un insieme statistico (non omogeneo) di tali sistemi S. Restringiamo la nostra attenzione al sistema S1 e ad una sua osservabile A1, costruendo l’operatore relativo al sistema composto A1 I2 con A operatore limitato di S1 e I operatore identità di S2. In generale, ricordiamo che per un operatore B limitato e uno stato puro si ha Tr (P B) i P Bi idem. i P 2 Bi hermit. P i P Bi i i i P 1 P B herm. P B |B B Per una miscela di stati puri, ognuno dei quali ha probabilità pa ,il valor medio di un operatore B è dato dal prodotto delle probabilità per i valori medi che possono assumeri i sistemi nei vari stati a <B>=Sa pa <a|B| a >= Sa pa Tr (PaB)=Tr(WB) Dove W= Sa paPa Valutando la traccia su una base fattorizzata f1c2 calcoliamo il valore medio o aspettato di S1I2 Tr[(S1 I2 )W]= f1i 2 j ( A1 I 2 )W 1, 2 f1i 2 j = ij i fi A 1 1 j 2 j W 1, 2 2 j 2 fi 1 1 i ~1 1 ~1 1 fi A W fi Tr ( A W ) 1 1 1 L’operatore W1tilde= Sj 2 j W 1, 2 2 j 2 è un operatore di H1 Come si vede, la fisica dell’insieme statistico di S1 si può descrivere utilizzando l’operatore statistico ridotto W1 tilde, ottenuto facendo la traccia, nello spazio di Hilbert H2, dell’operatore statistico W1,2 relativo all’insieme dei sistemi composti (ciò corrisponde a porre lo stesso indice e a sommare i valori degli indici del secondo sistema: vedi nota 23, p. 440, Ghirardi) ~1 W Tr ( 2)W 1, 2 2 r W 1, 2 2 r 5.3 r Se S1 è omogeneo, W1,2 coincide con un proiettore P1,2 che proietta su uno stato monodimensionale 1,2 2 ~1 1 2 1 , 2 2 1 , 2 2 W Tr P y r P y r pi Pi , pi cij r i j P1 è l’operatore di S1 associato allo stato f1i.. Poiché se lo stato 1,2 non è fattorizzato l’ultima somma della pagina precedente contiene più di un termine, l’operatore statistico W1 non è idempotente, e quindi dal punto di vista del componente S1 l’insieme è come se fosse una miscela statistica, malgrado lo stato composto S sia puro. Ne segue che, per esempio, eseguendo misure solo su uno dei due stati di singoletto, non si può distinguere lo stato puro da un’opportuna miscela di stati puri di spin, mentre le misure di correlazione sui due sistemi mostrano l’entanglement. Tornando ora al nostro problema, sia Ps la famiglia di proiettori di un operatore discreto: la misura trasforma l’operatore statistico Wprima nell’operatore Wdopo = Ss Ps Wprima Ps 5.4 Supponiamo ora di misurare S2 e siano Ps(2) gli operatori di proiezione sulle autovarietà corrispondenti: W1,2 (misura) W#dopo1,2 = Ss Ps2 Wprima1,2 Ps2 5.5 D’altra parte, sulla base di ciò che abbiamo visto in 5.3, qualunque informazione statistica relativa al sistema 1 si ottiene considerando l’operatore statistico ridotto W#(1), ottenuto facendo la traccia parziale sullo spazio H2 dell’operatore statistico del sistema composto W1,2 W#(1)=Tr (2)(W#dopo1,2 ) = Tr (2) (SsP2sW1,2prima P2s) = Ss Tr(2) (P2sW1,2 P2s)=ciclicità traccia Ss Tr(2)(P2sP2sW1,2)=idempot P Tr (2) (Ss P2s)W1,2 = Tr (2) IW1,2 = W1tilde per la 5.3 L’istantanea riduzione del pacchetto non consente effetti superluminali, visto che l’operatore statistico W#(1) che si deve usare per valutare la probabilità di eventi fisici relativi a S1 nel caso in cui l’altro composto è stato assoggettato a misura è uguale all’operatore statistico W1tilde che andrebbe utilizzato per la descrizione del sottosistema S1 prima che si sia effettuata una misura.(Ghirardi p. 461). Si tratta quindi non di una azione ma di una passione a distanza Per ciascuno di due osservatori ai lati di un esperimento di tipo Aspect, fatto con spin o con fotoni polarizzati, si ottiene una successione casuale sia che si misuri la polarizzazione e lo spin anche dall’altra parte sia che non si misuri: dunque c’è una “località di tipo statistico,” perché dal tipo di successione che si ottiene da una parte o dall’altra (perfettamente random) non c’è modo di sapere se l’altro ha misurato oppure no. In altre parole, ciascun osservatore, non potendo controllare l’esito delle misure, non può mandare segnali utilizzando la non-località. Per concludere, osserviamo che la non località in questione NON può essere utilizzata per mandare segnali istantanei a distanza: ne segue che secondo molti studiosi (ma non tutti, vedi Maudlin, Quantum nonlocality and relativity) si può parlare di una “coesistenza pacifica” tra relatività speciale e meccanica quantistica, malgrado la violazione della località secondo Bell, ovvero malgado la non fattorizzabilità della probabilità di un sistema in stato di singoletto. La differenza che passa tra possibilità di segnalare e nonfattorizzabilità può anche vedersi come la differenza che c’è tra la indipendenza dal parametro e la indipendenza dal risultato di misura. Se ci fosse dipendenza del risultato di misura in A dal parametro lontano in B, cambiando il tipo di misurazione potrei inviare segnali a distanza. La dipendenza probabilistica tra i risultati di misura implica invece solo una sorta di non-separabilità tra due sistemi posti in un certo stato, indipendentemente dalla distanza cui si trovano (questo rende la non-separabilità diversa dalla gravità nella meccanica newtoniana). Capitolo 8 Il problema delle variabili nascoste • Nel 1952 Bohm mostrò che un completamento della meccanica quantistica non-relativistica, da von Neumann ritenuto impossibile, era invece realizzabile! • Le variabile nascoste sono le posizioni delle particelle, che non sono così nascoste, visto che vengono rivelate da ogni misura. • Le posizioni sono le uniche osservabili non contestuali, mentre tutte le altre proprietà di un microsistema dipendono dal contesto di misurazione, proprio come aveva insegnato Bohr Riassumiamo nel simbolo l tutte le variabili addizionali o nascoste. Se A è un’osservabile del microsistema in oggetto, assegnata l, la funzione A(l) deve avere un valore preciso appartenente allo spettro discreto o continuo dell’operatore stesso Tutto il contenuto empirico della meccanica quantistica è espresso dalla conoscenza del valore medio <A> dell’osservabile A. Si assume quindi che le variabili nascoste l e L siano distribuite secondo una funzione a valori reali e positiva r(l) 0, che è una misura di probabilità (densità di probabilità) il cui integrale deve dare 1. La probabilità che il valore l sia compreso tra l e dl è r(l)dl r(l)dl 1 A A | A(l)r(l)dl L Ancora sul teorema di impossibilità di von Neumann La conoscenza della variabile nascosta l, che caratterizza in modo completo il sistema, permetterebbe di conoscere il valore A(l) di ogni osservabile A del sistema in funzione di l. A(l) deve appartenere allo spettro dell’operatore autoaggiunto A che la teoria gli associa Le variabili sono però non accessibili in linea di principio e quindi dobbiamo usare le probabilità, che diventano però epistemiche, nello stesso identico senso in cui lo sono in meccanica statistica classica. Si consideri un’osservabile che è combinazione lineare di altre osservabili: 0 1 0 i 1 0 nx n y nz s n 1 0 i 0 0 1 Più in generale, consideriamo un’osservabile C che è combinazione lineare con coefficienti reali di altre due osservabili C = aA +bB In generale, vale anche in MQ come in meccanica classica che il valor medio della combinazione lineare è la combinazione lineare dei valori medi dei termini della combinazione |C a | A b |B Per il suo “no-go theorem” contro le variabili nascoste (contro l’idea che si possano assegnare valori precisi a tutte le osservabili), von Neumann assunse che un’eventuale teoria che completasse la MQ dovrebbe soddisfare le stesse condizioni di linearità che soddisfano i valori medi anche per le variabili nascoste. Ovvero, il suo teorema di impossibilità assume che in una teoria a variabili nascoste in cui un’osservabile risulti combinazione lineare di altre, i valori precisi o certi A(l), B(l), C(l) delle osservabili, che vengono assunti quando si specificano le variabili nascoste, devono soddisfare le stesse condizioni che valgono per i valori medi: C(l) = aA(l) + bB(l) * Ma questa premessa è irragionevole se i valori A(l) devono coincidere con gli autovalori. Nell’esempio dello spin, se 1 nx n y nz sn (l) [s x (l) s y (l) s z (l)] / 3 3 Poichè le quantità certe si (l) devono coincidere con gli autovalori degli osservabili relativi alle matrici di spin, essi devono valere +1 cosicché s n (l ) k / 3 k 3,1,1,3 Ma poiché deve valere anche per la componente di spin lungo n che sn (l) 1 si ha un risultato impossibile! Ne segue che la premessa * è irragionevole e Bohm (1952) fornì un controesempio al teorema di von Neumann Immaginiamo una particella che si muove in una dimensione. |(x)|2 rappresenta come sappiamo la densità di probabilità che la particella sia nel punto x se se ne misura la posizione. L’idea di Bohm è che se si prepara un sistema in modo identico n volte, a causa del fatto che non si può gestirlo in modo assoluto, ogni volta la sua posizione sarà leggermente diversa: esiste quindi sempre un intervallo di imprecisione nella posizione, che corrisponde, nella visione tradizionale della teoria, all’intervallo in cui si troverebbe la particella se si andasse a misurarla. Per Bohm la posizione di ogni particella è però sempre oggettivamente e realmente posseduta, e la distribuzione delle posizioni delle n particelle individuali riproduce la densità di probabilità associata dalla funzione d’onda a un unico sistema la cui posizione prima della misura è indefinita La meccanica bohmiana Non vi è modo di preparare un sistema in cui la posizione sia determinata in modo assoluto, per cui l’osservatore non la può conoscere: di qui l’uso della probabilità. Si prendono N particelle e si definiscono N campi di velocità. La velocità di una particella i dipende in modo non locale e olistico dalla posizione di tutte le altre e soddisfa a una equazione differenziale che lega le velocità alle posizioni, e che insieme all’eq.deterministica di Schroedinger, reinstaura il determinismo completo della MQ non relativistica (r1 , r2 ,.....rn , t ) n 2 i Di (r1 , r2 ,...., rn , t ) V (r1 , r2 ,...., rn )(r1 , r2 ,.....rn , t ) 1 t i 1 2M i Prima si determina una soluzione (r1,r2,…rn,t) dell’equazione di Schroedinger (qui sopra) rispetto a date condizioni iniziali e poi, in funzione della soluzione ricavata, si definiscono N campi di velocità vi vi (r1 , r2 ,...rN , t ) dove j (r1 , r2 ,...rN , t ) 2 1 (r1 , r2 ,...rN , t ) f f f f i j z x y z ih j (r1 , r2 ,...rN , t ) [ (r1 , r2 ,...rN , t )i *1 (r1 , r2 ,...rN , t ) 2 p2 M i *1 (r1 , r2 ,...rN , t )i (r1 , r2 ,...rN , t )] dri v i ( x1 , x2 ,...xn , t ) x r , x r ..., x r 1 1 2 2 n n dt 2 Date la funzione d’onda al tempo t =0 e le posizioni iniziali ri(0), la soluzione delle due equazioni differenziali 1 e 2 determinano a ogni istante curve o traiettorie ben definite nello spazio-tempo. Prendiamo l’equazione a una particella e poi moltiplichiamo per * a sinistra entrambi i membri (r , t ) i i [ D V (r )] (r , t ) t 2m * (r , t ) (r , t ) t i i * (r , t )[ D V (r )] (r , t ) 2m Facciamo lo stesso per la complessa coniugata dell’equazione di Schroedinger, moltiplicandola per a sinistra e poi sommiamo le due equazione così ottenute * (r , t ) t (r , t ) i i [ D V (r )] * (r , t ) 2m * (r , t ) t i i (r, t )[ D V (r )] * (r, t ) 2m ( (r , t ) * (r , t )) i ( (r , t ) * D ( r , t ) (r , t )D * (r , t ) t 2m i div[ ( (r , t ) * ( r , t ) (r , t ) * (r , t ))] divj ( r , t ) 2m Se v(r,t) e r(r,t) sono velocità e densità di un fluido, le equazioni di conservazione della massa danno r(r , t ) divj (r , t ) 0 t j (r , t ) r(r , t )v(r , t ) Si osservi la corrispondenza formale tra densità del fluido r e densità di probabilità ||2 * , che obbediscono alla stessa equazione differenziale. Così r(r,0) |(r,0|2 implica che la stessa eguaglianza vale al tempo t. L’insieme statistico che ha la distribuzione di posizioni |(r,0|2 evolve dunque nell’insieme che corrisponde all’evoluta dell’equazione di Schroedinger |(r,t|2 Derivazione delle equazioni di Bohm per una particella (1) Cominciamo a scrivere l’equazione di Schroedinger (1) in forma polare, scrivendo prima la funzione (r,t) in forma polare (2) Calcoliamo la derivata parziale rispetto al tempo (per la e, si applica la chain rule, ovvero si deriva parzialmente la e rispetto a S e poi si moltiplica per la parziale di S rispetto a t) (3) Per calcolare il laplaciano, calcoliamo prima il gradiente di (4) E poi applichiamo di nuovo l’operatore “del”, per ottenere (5) Sostituendo la 3 e la 5 nell’equazione di Schroedinger, si ha A i S 2 2 A i 2 i( A ) [ A (S ) (2AS A 2 S )] UA t t 2m 2 (abbiamo diviso per il fattore esponenziale comune ai 2 membri) Raccogliendo ora la parte reale e quella immaginaria della funzione d’onda scritta in forma polare, si ottengono due equazioni: (6) Dividendo per A e raccogliendo i termini con S a sinistra, otteniamo (7) La parte immaginaria dà invece (dividendo per il fattore i): (8) Moltiplichiamo per 2A / e riscriviamo Trasformazioni ausiliarie A2 f A A 2A t A t t f A2 ( A. A) A A A A A 2A t t t t DA2 D( A. A) 2 ADA (9) Eq. di Bohm (10) Come si vede immediatamente, nella (10), per 0 si ottiene l’equazione classica di Hamilton-Jacobi per il moto di una particella in un potenziale U, con il momento p2= (S ) 2 Eq. HamiltonJacobi classica Richiamo su Hamilton-Jacobi In generale, passando da variabili qi e pi definite nello spazio delle fasi ad altre variabili Qi e Pi l’equazione di Hamilton non è preservata. Però, se la trasformazione in questione è canonica, ovvero, se la funzione generatrice S obbedisce alle seguenti relazioni: pi S ( q, p, t ) S ( q, p, t ) S ; Qi ; H H ( q, p, t ) qi Pi t allora le equazioni di Hamilton sono preservate. Se in più si ha che H=0, allora le due eq. di Hamilton rispetto alla nuova funzione H H Q i 0; Pi 0 Pi Qi forniscono due costanti del moto. Se si ha che le pi in S = (qi ,pi , t) sono date da questa relazione Allora l’annullarsi della nuova hamiltoniana H è equivalente alla seguente condizione che è appunto l’equazione di Hamilton Jacobi cercata Nella (10), 2 2 A Q 2m A è il potenziale quantistico Cosicché l’equazione quantistica di Hamilton-Jacobi è S (S ) 2 U Q 0 t 2m Mentre l’equazione del moto della particella è, ovviamente, dv m (U ) (Q) dt Dove, a fianco di una forza classica, c’è una forza quantistica (Q ) La particella è dunque guidata (e accelerata) dal campo quantistico!!! A differenza di un campo classico, il campo quantistico non può essere influenzato dalle particelle e non ha sorgenti Moltiplicando il campo per una costante, la sua azione non varia, perché A è sia a numeratore che a denominatore di Q: 2 2 A Q 2m A Ciò significa che l’effetto del potenziale quantistico dipende solo dalla sua forma e non dalla sua intensità: un elettrone si muove con la sua energia e il potenziale o l’onda lo guida e lo dirige, come una macchinetta teleguidata L’effetto del campo è altamente non-locale, cioè non dipende dalla distanza, in un modo che è stato verificato sperimentalmente Il concetto di informazione attiva: qualcosa che ha poca energia guida ciò che ha molta più energia e fa ciò in modo non meccanico! Anche nel meccanismo di duplicazione del DNA, l’energia è data dalla cellula, e dall’ambiente, ma la informazione attiva è data dalla forma del DNA. La parte del DNA che non viene copiata è solo potenzialmente attiva. La capacità di compiere lavoro viene dalle particelle, e non si origina nel campo; le prime potrebbero avere una struttura interna. Poiché un sistema di fenditure diverso produce un campo Q diverso, un esperimento quantistico e la meccanica quantistica sono olistiche: detto semplicemente, il moto dell’elettrone non può essere discusso astraendo da tutto il contesto sperimentale (Bohr) Riprendiamo la forma polare della funzione d’onda (r, t ) A(r, t )eiS / Poiché ||2*, la probab. di trovare la particella =P=A2 A2 S P S 2 .( A )0 .( P )0 t 2m t 2m La prima a sinistra del segno di conseg. logica è la (9), la seconda è l’equazione di continuità per la densità di probabilità P, ma il ruolo fondamentale di A = ||2 non è quello di determinare la probabilità di trovare un’osservabile con un certo autovalore se si va a fare una misura, ma di definire il potenziale quantistico Q. La P in questa interpretazione è epistemica, e dunque simile alla meccanica statistica classica I teoremi limitativi dopo von Neumann: la contestualità delle teorie a variabili nascoste: VD+NC+MQ = contraddizione VD= ogni sistema quantistico ha tutti i valori delle osservabili simultaneamente definiti (definitezza proprietà, o realismo) NC ogni valore dell’osservabile di un sistema non dipende da quali altri valori sono misurati insieme ad esso (non contestualità) Gleason e Kochen-Specker rimediano all’assunzione troppo forte del teorema di additività di Von neumann fatta per qualunque osservabile supponendo che la [5] di quel teorema (vedi p. 52 e vedi * p. 195) valga solo per osservabili compatibili, tesi che non è messa in discussione dai teorici delle variabili nascoste. Teorema di Gleason:In uno spazio di Hilbert di dimensione > 3, le uniche possibili misure di probabilità sono le misure [7] μ (Pα) = Tr(Pα W), in cui Pα è un operatore di proiezione, W è l’operatore statistico che rappresenta lo stato del sistema e Tr l’operatore traccia. “The Pα can be understood as representing yes-no observables, i.e. questions concerning whether a QM system represented by a Hilbert space of dimension greater than or equal to 3 has a property α or not, and every possible property α is associated uniquely with a vector |α> in the Hilbert space -- so, the task is to unambiguously assign probabilities to all vectors in the space. Now, the QM measure μ is continuous, so Gleason's theorem in effect proves that every probability assignment to all the possible properties in a three-dimensional Hilbert space must be continuous, i.e. must map all vectors in the space continuously into the interval [0, 1]. On the other hand, an HV theory (if characterized by VD + NC) would imply that of every property we can say whether the system has it or not. This yields a trivial probability function which maps all the Pi to either 1 or 0, and, provided that values 1 and 0 both occur (which follows trivially from interpreting the numbers as probabilities), this function must clearly be discontinuous” (C. Held, The Kochen-Specker Theorem, p. 4) (Redhead 1987, Incompleteness and non-locality in QM, p.28) Bell nel 1966 produce un teorema contro le variabili nascoste che poi critica mettendone in discussione una premessa. Egli prova che mentre la funzione di probabilità quantistica μ richiede che due vettori |α> and |α′> mappati in 1 e 0 non possano essere arbitrariamente vicini, perché devono avere una certa separazione angolare, la funzione che assume come valori delle variabili nascoste richiede invece che i due vettori siano arbitrariamente vicini. La contraddizione si elimina mettendo in discussione una premessa di noncontestualità: “it was tacitly assumed that measurement of an observable must yield the same value independently of what other measurements may be made simultaneously” (Bell, 1987, p. 9). In altre parole, malgrado Gleason supponga compatibilità tra coppie di osservabili che entrano nella [5], è possibile che la stessa osservabile V prenda valori diversi se misurata con W o se misurata con Y, anche se V e W sono tra loro compatibili e V e Y pure. La differenza tra Kochen-Specker e i due teoremi che abbiamo sommariamente esposto è che mentre i primi assumono un continuum di osservabili, KS indeboliscono questo assunto mostrando che persino con un numero finito di osservabili discrete si ha incompatibilità tra NC (noncontestualità), Value Definiteness e QM. Si rimuove così una possibile obiezione contro il no-go theorem di Gleason. Formulazione del teorema KS Sia H è uno spazio di Hilbert di dimensioni x > 3, contenente un numero finito y di osservabili in un insieme M, definite da operatori corrispondenti su H. Allora per specifici valori di x e di y, le due assunzioni qui riportate sono contraddittorie: (KS1) Definitezza di valori: tutti i membri y di M hanno valori simultanei, ovvero per tre osservabili qualsiasi A B e C, v(A), v(B), v(C) sono numeri reali simultaneamenti definiti; (KS2) I valori delle osservabili obbediscono ai seguenti vincoli: (a) Se A, B, C sono tutte compatibili e C=A+B, allora v(C)= v(A) + v(B); (a) If A, B, C sono tutti compatibili e C=AB, allora v(C)= v(A)v(B) La regola della somma e quella del prodotto sono conseguenze di un principio di composizione funzionale chiamato FUNC, che a sua volta, come vedremo, discende da un’ipotesi di non-contestualità. Nel teorema originale di KS, x =3 e y = 117. Ci sono però teorema più recenti, validi per x = 3 e y = 33 (Peres 1995, pp.197-199) e Kernaghan (1994) per x = 4 e y =20, quest’ultimo più debole degli altri due Il teorema di Karnaghan (x=4 e y =20) Come vedremo, dalla (KS2) si può derivare la seguente condizione sugli operatori Pi , corrispondenti a quattro distinti autovalori q1, q2, q3, q4 di un’osservabile Q su H4: (VC1’) v(P1) + v(P2) + v(P3) + v(P4) = 1, dove v(Pi) = 1 o 0 , per i = 1, 2, 3, 4. Passando a uno spazio di Hilbert con scalari nel campo reale (il teorema vale lo stesso anche in questo caso, perché se l’assegnazione di valori definiti è impossibili nello spazio di Hilbert definito sui reali (R3), allora è impossibile su H3 definito sul campo complesso), possiamo tradurre la condizione (VC’) nella richiesta che in ogni quadrupla di raggi ortogonali in tale spazio esattamente uno deve essere colorato in bianco - v(Pi) = 1 - e gli altri tre in nero - v(Pi) = 0 - ciò che è impossibile 1,0,0,0 1,0,0,0 1,0,0,0 1,0,0,0 -1,1,1,1 -1,1,1,1 1,-1,1,1 1,1,-1,1 0,1,-1,0 0,0,1,-1 1,0,1,0 0,1,0,0 0,1,0,0 0,0,1,0 0,0,0,1 1,-1,1,1 1,1,-1,1 1,1,1,-1 1,0,0,-1 1,-1,0,0 0,1,0,1 0,0,1,0 0,0,1,1 0,1,0,1 0,1,1,0 0,1,1,0 1,1,-1,-1 1,1,-1,1 1,1,-1,1 1,0,1, 0 0,0,0,1 0,0,1,-1 0,1,0,-1 0,1,-1,0 1,1,1,-1 0,1,0,-1 1,0,0,-1 0,0,1,1 1,1,1,1 1,1,1,1 1,-1,0,0 1,-1,-1,1 1,1,-1,-1 1,-1,-1,1 Nella tabella, costituita da 44 elementi, ci sono 20 raggi distinti, perché 20 sono le osservabili considerate. In ognuna delle 11 colonne ci sono 4 raggi ortogonali (x = 4= dimensioni dello spazio): ci sono dunque 44 elementi, alcuni dei quali sono ripetuti 2 o 4 volte. Per specificare un raggio o una linea che passi per l’origine basta dare le coordinate della retta che passa per l’origine (non specificata) e per il punto. Per esempio, "1,0,0,0" denota l’asse x. Dato che il numero delle colonne è dispari, e i quattro vettori di ogni colonna sono ortogonali, per la condizione VC1’ il numero totale dei bianchi deve essere dispari (infatti in ogni insieme di vettori ortogonali c’è solo un raggio colorato di bianco). D’altra parte, si vede che ogni raggio è ripetuto nella tabella o 2 o 4 volte; poiché a causa della premessa di noncontestualità, uno stesso raggio, anche se in colonne diverse, riceve sempre lo stesso colore (valore), ne segue che ogni volta che uno di questi raggi in una colonna è bianco (esattamente uno deve esserlo), dobbiamo colorare un numero pari di raggi bianchi. Ne segue che il numero totali di raggi bianchi deve essere pari, e quindi la contraddizione è provata! L’idea del teorema di Kochen-Specker L’idea del teorema, che presuppone uno spazio di Hilbert di dimensioni x=3, è che, come prima, per ogni insieme di triple ortogonali in H3, un raggio vale 1 e gli altri due 0 e si pone dunque lo stesso problema di colorare due raggi di nero e uno di bianco. Per ottenere queste condizioni, si considera un arbitrario operatore Q, con autovettori |q1>, |q2>, |q3>, e relativi autovalori distinti q1 q2 q3. Si considerano 3 proiettori P1, P2, P3 che proiettano sui tre autovettori di cui sopra e che sono ovviamente degli osservabili “si-no”, dato che Pi corrisponde alla domanda sperimentale: “il sistema ha il valore qi per l’osservabile Q?” Poiché i tre proiettori Pi sono per ipotesi mutualmente compatibili, possiamo applicare ad essi la regola della somma e del prodotto e derivare il seguente lemma, che ora dimostriamo (VC1) v(P1) + v(P2) + v(P3) = 1, dove v(Pi ) = 1 o 0, i =1,2,3 (A) Pi2 = Pi (i proiettori Pi sono idempotenti); (B) Se H è uno spazio di Hilbert di dimensione finita, e i Pi sono operatori che proiettano su |qi>, dove gli insiemi {|qi>} formano un base ortonormale di H, allora Si Pi= I , ovvero i vari Pi formano ‘una risoluzione dell’identità’). Si consideri un arbitrario |>, un operatore non degenere Q con autovettori |q1>, |q2>, |q3>, e relativi autovalori distinti q1 q2 q3. Si considerino 3 proiettori P1, P2, P3 che proiettano sui tre autovettori di cui sopra. Allora, per l’ortonormalità, si ha [8] P1 + P2 + P3 = I Ora, poiché P1, P2, e P3 sono compatibili, dall’assunzione KS2 si ha (a)(Regola della somma): v(P1) + v(P2) + v(P3) = v(I); (b) Per la regola del prodotto, passiamo da Pi2 = PiPi a v(Pi)2 = v(Pi2); per l’idempotenza, si ha v(Pi2) = v(Pi) v(Pi)2 = v(Pi) = 1 o 0 Sia R un osservabile tale che v(R) sia diverso da 0 nello stato |>. Da questa assunzione e KS2 (b) (Product Rule): v(R) = v(I R) = v(I) v(R). Ne segue allora che v(I) = 1 e per la regola della somma [9] (VC1) v(P1) + v(P2) + v(P3) = 1 In cui v(Pi) = 1 or 0, for i = 1, 2, 3. Qed Ghirardi si chiede (1997, p. 481): “tenuto conto delle motivazioni che animano i proponenti delle teorie a variabili nascoste, il riconoscimento dell’inevitabile contestualità di almeno alcune osservabili non entra in conflitto con la pretesa “oggettività” delle proprietà possedute da un sistema? Se il valore di verità (cioè il fatto che essa risulti vera o falsa) dell’asserzione “A assume il valore A(l)” dipende dal fatto che, per esempio, un osservatore decida (a suo libero arbitrio) se misurare l’osservabile B o l’osservabile C (entrambi compatibili con A ma incompatibili tra loro)…in che senso l’asserzione in esame può ritenersi avere un valore oggettivo? La risposta a questa domanda è non solo che si possono sempre trovare osservabili non contestuali, ma che il mondo quantistico è fondamentalmente e irriducibilmente relazionale e privo di proprietà e dunque di identità definite: come un personaggio pirandelliano (uno nessuno e centomila), le proprietà che le microentità assumono dipendono dal contesto sperimentale Ovvero, se persino nella teoria massimamente “realistica” (e cioè che assume quanta più definitezza di proprietà è possibile assumere) l’indefinitezza deve essere riconosciuta, questa indefinitezza fa parte dell’ontologia della natura, visto che è comune anche all’interpretazione standard, nonché ad altre interpretazioni che verranno discusse Questo metodo di lettura o di interpretazione di una teoria fisica guarda a ciò che è comune a diverse interpretazioni di una teoria o a diverse teorie che hanno in comune lo stesso ambito sperimentale. Così come si deve dire che la non-località è una caratteristica della natura, si deve aggiungere che l’indefinitezza delle proprietà, il loro carattere non intrinseco ma relazionale è parte della natura, perché è comune a tutte le interpretazioni Tale relazionalità, a causa dell’entanglement non locale, è essa stessa non locale. Con uno slogan potremmo dire: ontologia della QM e dunque della fisica=relazionismo olistico non locale (RONL) Capitolo 9 Il problema della macro-oggettivazione 1. Molte storie decoerenti 2. L’interpretazione modale 3. Il programma GRW Le varie opzioni (vettore di stato, osservabili, dinamica) • Completezza o incompletezza vettore di stato (se la teoria è incompleta, allora ci sono variabili nascoste, vedi Bohm come esempio) • Se il vettore di stato è completo, si può assumere che l’insieme di vettori di stato è formalmente omogeneo ma fisicamente disomogeneo (assunzioni sulle osservabili, rottura della connessione autovettore- proprietà, molti mondi) • Insieme formalmente omogeneo e fisicamente omogeneo (due principi dell’evoluzione o una sola dinamica) y 0 F 0 [ cr r ] F 0 cr F r misura r r 1) Nella teoria di Bohm, il postulato del collasso è un’accurata approssimazione, nel senso che trascurare l’effetto di uno dei due termini soppressi può significare trascurare un effetto fisico reale sul potenziale quantomeccanico: lo stato finale corretto è quello di sovrapposizione scritto sopra 2) Tuttavia, il gatto nella teoria in questione è di fatto vivo o morto, perché le posizioni delle particelle nei due casi sono assai diverse: si usano le equazioni irreversibili anche se quelle corrette sono quelle reversibili. Omogeneità o disomogeneità dei sistemi nell’ipotesi di completezza di | • La completezza “formale” di | non è incompatibile con il fatto che, facendo opportune assunzioni sulla misurabilità delle osservabili, si abbia a che fare con sistemi fisicamente disomogenei (ha senso parlare di completezza?) • Supponiamo che non risulti possibile (o in linea di principio o di fatto) misurare tutte le grandezze fisiche che corrispondono a tutte gli operatori del microsistema e che le sole quantità osservabili dell’equazione precedente commutino tutte: allora diventa impossibile distinguere uno stato puro da una miscela statistica (si veda 8.7 Ghirardi 1996) • Se la non misurabilità di osservabili incompatibili fosse dovuta a ragioni di principio, ne conseguirebbe che l’energia iniziale del sistema dell’equazione di cui sopra e quella finale non sarebbero misurabili, visto che la situazione iniziale e quella finale sono macroscopicamente distinguibili e corrispondono ad autovarietà distinte. Inoltre, non si danno prescrizioni precise su come individuare le osservabili compatibili, perché non si dà distinzione precisa tra quantum e classico. • Allora la non misurabilità deve essere di fatto: visto per es. il rapido accoppiarsi del sistema all’ambiente come misurare tutte le correlazioni finali del microsistema con tutto ciò che lo circonda, in modo da distinguere miscela e stato puro? • L’ultima soluzione è accettabile a fini pratici, e per gli strumentalisti, ma l’approssimazione in questione è diversa da quella richiesta dalla teoria di Bohm. Per quest’ultima, l’indice è di fatto in una posizione definita e l’approssimazione che ci porta ad usare una miscela è giustificata, come è giustificato usare approssimate equazioni irreversibili per predire che un singolo gas si sta espandendo, malgrado il teorema di ricorrenza di Poincaré ci dica che le eq. corrette sono altre: non c’è contraddizione tra il fatto che le equazioni corrette sono quelle reversibili con l’uso nel presente di equazioni approssimate irreversibili • Nel caso della teoria che limita di fatto le osservabili misurabili, se in tempi di ricorrenza di Poincaré si riuscisse a misurare sovrapposizioni macroscopiche, avremmo invece che ora la teoria in questione è falsa Il teorema di decomposizione biortogonale di un sistema composto asserisce che lo stato di un sistema composto da S e A può scriversi in un solo modo come la combinazione lineare di stati biortonormali. Indicati con pi gli autovalori comuni ai due operatori statistici WS e WA ottenuti facendo la traccia parziale su ciascuno dei due spazi costituenti, si ha (tralasciando questioni legate alla degenerazione) S A i pS i c Ai (S i , S j ) di , j (c Ai , c A j ) di , j H H 1 H 2 ...H N 1 M N H H M H N S A (1,2,...N , t ) i p F S i (1,2,...M , t ) X ( M 1,...M N , t ) Se siamo interessati al sottosistema SM scrivendo lo stato puro del sistema composto in forma biortogonale possiamo affermare che le due parti F e X hanno proprietà definite, anche se lo stato del sistema non è in un autostato dell’osservabile. Questo è tipico dell’interpretazione modale, , che rompe il se e solo se del legame autovalore autostato. Tali proprietà dipendono però dal tipo di decomposizione prescelta. Se si ha un protone, un neutrone e un elettrone con i loro spin, si potrebbe essere interessati alle proprietà del primo lasciando gli altri due insieme, o a quelle dei primi due e all’ultimo separatamente considerato • Ne segue che se scegliamo una decomposizione, il protone può avere spin definito, se ne scegliamo un’altra, esso nonavrà spin definito. Conclude Ghirardi: “l’interpretazione modale offre una soluzione puramente formale al problema di come siano possedute le proprietà” (p. 538, 1996, Boniolo et al.) Molte storie decoerenti Siano , le osservabili, mentre i loro autovalori siano k(), j(); sia Pk() i proiettori associati all’autovalore k(). Una storia è costituita da una successione di eventi, ovvero da una successione di istanti temporali, t1, t2, ….tn e dal fatto che a quegli istanti certi sistemi hanno certe proprietà. La probabilità P di una storia è la probabilità che si siano succeduti certi eventi: P[t N , , m(),..., t2 , , j (), t1 , , k ()] Per un dato dell’identità P k ( ) I k () osservabile, vale la decomposizione P k ( ) P m ( ) d k ,m P[t N , , m(),..., t2 , , j (), t1 , , k ()] 2 j c Pm( c) e iH (t N t N 1 ) / ...Pj () e iH (t2 t1 ) / Pk( ) e iHt1 / (0). La teoria non si riferisce a riduzioni o a misure ma interpreta le probabilità di successioni di eventi, o di date storie. Si prenda ora un’osservabile a un istante dato t. Prendiamo ora la famiglia di tutte le storie , t che affermano che a t il sistema in oggetto ha uno dei suoi possibili autovalori k La k-esima storia della famiglia è quella che afferma che a t vale k(). Sommando su tutti i valori k() di questa osservabile, si ha che la probabilità è 1, ma considerando altre osservabili a quel tempo, la somma per le probabilità associate a tutte le storie date dall’unione delle due famiglie sarebbe >1. Limitandosi a famiglie di storie alternative decoerenti, si evitano problemi con la probabilità. Si consideri il seguente funzionale di decoerenza ( (0), e iHt1 / iH ( t 2 t1 ) / r ( ) P e s( ) P ...e iH ( t N t N 1 ) / Pm ( ) Pmc( c ) e iH (t N t N 1 ) / ...Pj j( ) e iH (t2 t1 ) / Pk( ) e iHt1 / (0)) Supponiamo che questa espressione risulti nulla ogni volta che almeno uno tra gli indici corrispondenti è diverso (r da k, s da j, etc.), allora l’insieme delle probabilità associate alla famiglia è consistente (famiglia decoerente). Per l’espressione di cui sopra, si tenga conto che Ghirardi 1996, p. 392) Pa (t ) F (a (t ), F)a (t ) (e iHt / a (0), F)e iHt / a (0) e iHt / a (0)( a (0), e iHt / F) e iHt / Pa (t ) e iHt / F GRW: l’evoluzione del vettore di stato è deterministica, la riduzione del pacchetto è non-lineare e stocastica “Un corpo macroscopico deve avere sempre una posizione quasi perfettamente definita in ogni descizione oggettiva del mondo reale” (Einstein) Consideriamo una sola particella e una funzione di localizzazione Lr* (r) una gaussiana di ampiezza 1/1/2 centrata attorno al valore r* Lr* (r ) p 3/ 4 e ( r r *) 2 N è un fattore di normalizzazione; la localizzazione fa sì che tutti i valori di r in (r) che distano da r* più di 1/1/2 siano posti = 0 (r ) r* (r ) NLr* (r ) (r ) Sia Fr Lr*(r) per GRW la densità di probabilità che una localizzazione avvenga in r* è data da |Fr|2; cioè le localizzazioni spontanee avvengono in modo da rispettare la prescrizione probabilistica della teoria standard. Ovvero la localizzazione può avvenire attorno a un qualsiasi punto r* tale che la particella abbia secondo la teoria standard una prob. non nulla di venir trovata in un volume 1/3/2 Se l è la frequenza media, la probabilità che si verifichi un processo di localizzazione nell’intervallo Dt, data da lDt, è irriducibile (stocasticità): non c’è una causa per cui si verifica in uno piuttosto che in un altro istante. Dato che la probabilità dipende da |Fr|2 , il processo non è lineare nel vettore di stato l 10 16 sec 1 1 / 10 5 Due nuove costanti di natura 1 (r ) [r1 (r ) r 2 (r )] 2 I due stati di posizione (per una particella) sono localizzati attorno ai due punti r1 e r2, la cui distanza è assai maggiore di (1/)1/2 Poiché per come è costruito il modello, la localizzazione può avvenire solo attorno a uno dei due punti, ciò che costringe il sistema in sovrapposizione a localizzarsi attorno a uno dei due punti con probabilità 1/2