Ha destato un certo interesse, tanto da apparire anche sull’informazione generalista (come ad esempio qui: http://www.infooggi.it/articolo/la-formulazione-matematica-del-principio-di-heisenberg/64848/), la recente pubblicazione su Physical Review Letters di un lavoro intitolato Proof of Heisenberg’s errordisturbance relation (http://journals.aps.org/prl/abstract/10.1103/PhysRevLett.111.160405), da parte del matematico Paul Busch, dell’università di York, e dei fisici Pekka Lahti e Reinhard Werner, delle università di Turku e Hannover. Poiché le relazioni di indeterminazione di Heisenberg, alle quali evidentemente allude il titolo, risalgono al lontano 1927, e da allora costituiscono il fondamento della meccanica quantistica, sembra legittimo chiedersi quale possa essere la novità del lavoro in questione. E visto che, non sorprendentemente, i resoconti che si possono trovare sulla stampa non aiutano molto a rispondere alla domanda, vale forse la pena cercare di vederci più chiaro. Nel suo pionieristico articolo del 1927 su Zeitschrift für Physik, Heisenberg, alla ricerca di una solida fondazione per la descrizione matematica dei fenomeni atomici, che sfuggivano alle leggi della meccanica classica, analizzò da un punto di vista operativo le limitazioni intrinseche alla misurabilità simultanea di posizione e impulso di particelle subatomiche. In particolare mostrò, tramite esperimenti concettuali, che se si vuole determinare la posizione di un elettrone con una precisione ∆Q, è necessario, a causa dell’inevitabile interazione tra lo strumento di misura e l’elettrone stesso, modificare il suo impulso di una quantità almeno pari a ∆P , in modo che ∆Q ∆P ≥ ~ , 2 (1) dove ~ = 1.05·10−34 Js è la costante di Planck (ridotta), introdotta da quest’ultimo nel 1900 per descrivere la radiazione di corpo nero. Il valore di ~ è chiaramente trascurabile rispetto alle azioni comunemente in gioco quando si ha a che fare con sistemi meccanici “macroscopici”, e quindi in tal caso il secondo membro della (1) può essere sostituito, a tutti gli effetti pratici, con zero, mentre questo cessa di essere vero quando i fenomeni considerati sono alla scala atomica. Di conseguenza, mentre l’assunzione di poter determinare simultaneamente posizione e velocità di un punto materiale non è in contraddizione con la (1) nel campo di applicazione tipico della meccanica classica (nata per studiare i moti dei pianeti...), essa va decisamente abbandonata quando si voglia studiare la fisica atomica e delle particelle elementari. Per cercare di cogliere la novità dell’articolo di Busch, Lahti e Werner, conviene allora ricordare come la (1) sia stata incorporata nella successiva formulazione matematica della meccanica quantistica. Per rendere la discussione il più accessibile possibile, nel far questo cercheremo di evitare i tecnicismi tipici della materia, forse al prezzo di una certa vaghezza, rimandando gli eventuali lettori interessati alle note a pié di pagina (oltre che ovviamente ai lavori originali) per maggiori dettagli. In meccanica quantistica, data una qualunque quantità osservabile A, come ad esempio P o Q, e fissato lo stato del sistema, che indicheremo con ρ, resta determinata la distribuzione µA,ρ delle probabilità dei risultati della misurazione di A sul sistema nello stato ρ. Cioè per ogni intervallo I dell’insieme R dei numeri reali si ottiene un numero µA,ρ (I): la probabilità che, misurando l’osservabile A quando il sistema è nello stato ρ, si trovi un valore nell’insieme I.1 Come per ogni altra distribuzione di probabilità, anche per µA,ρ si potranno dunque considerare il valor medio hAiρ , e la deviazione standard q ∆ρ A = hA2 iρ − hAi2ρ , (2) che rappresenta la dispersione dei risultati delle misure di A attorno al loro valor medio. E allora l’usuale “dimostrazione” del principio di indeterminazione di Heisenberg, insegnata a tutti gli studenti di fisica del mondo (e a quelli di matematica più fortunati), consiste nel verificare che, come semplice conseguenza 1 Più in dettaglio, nel formalismo matematico le osservabili sono rappresentate da operatori autoaggiunti (non limitati) su uno spazio di Hilbert H, mentre gli stati del sistema fisico sono rappresentati da operatori positivi ρ tali che tr ρ = 1. Ricordando allora che il teorema spettrale associa a ogni operatore autoaggiunto A su H una misura su R a valori proiettori su H, I ⊂ R 7→ EA (I), tale che A si possa scrivere come l’integrale Z A= λ dEA (λ), R si ha che l’usuale misura di probabilità µA,ρ è definita da µA,ρ (I) = tr (ρEA (I)). 1 della struttura matematica delle osservabili Q e P , le loro dispersioni ∆ρ Q, ∆ρ P , in qualunque stato ρ, soddisfano la (1).2 Il punto di vista del lavoro di Busch, Lahti e Werner è un po’ differente. Osservano infatti che le dispersioni ∆ρ Q, ∆ρ P , fanno riferimento alle proprietà statistiche di misure separate di Q e P in uno stesso stato ρ, mentre l’argomento originale di Heisenberg riguardava gli errori intrinsecamente connessi ad una determinazione simultanea di Q e P . Cosa si intenda precisamente con l’aggettivo “simultanea” non è specificato: potrebbe essere un esperimento in cui si misura prima la posizione Q di un elettrone e poi il suo impulso P , o viceversa, o una qualunque altra procedura che permetta di ottenere due numeri ragionevolmente associati a posizione e impulso dell’elettrone. Cioè che viene specificato è che, così come una misura di una singola osservabile in uno stato fornisce una distribuzione di probabilità su R, una qualunque procedura di misura simultanea di Q e P sarà rappresentata da una distribuzione di probabilità νρ definita sull’insieme R2 delle coppie di numeri reali, cioè per ogni sottoinsieme I ⊂ R2 , si otterrà un numero νρ (I) rappresentante la probabilità che, effettuando la procedura sul sistema nello stato ρ, si ottenga una coppia di numeri appartenente all’insieme I.3 Le marginali di tale distribuzione congiunta νQ,ρ (I) e νP,ρ (J) (I, J ⊂ R) sono allora definite come le probabilità che in una misura simultanea il primo (rispettivamente, il secondo) numero della coppia sia nell’intervallo I (rispettivamente, J), e l’altro sia un numero qualunque. Pertanto, νQ,ρ e νP,ρ saranno interpretate come le rispettive distribuzioni dei valori di Q e P ottenute dalla procedura di misura simultanea. A questo punto, Busch, Lahti e Werner devono definire cosa intendono per “errore commesso nella misura di Q e P tramite una tale procedura di misura simultanea”. E lo fanno confrontando, al variare dello stato ρ, le distribuzioni νQ,ρ , νP,ρ ottenute in tale misura, con quelle µQ,ρ , µP,ρ ottenute misurando le due quantità separatamente. Pongono cioè ∆Q = sup D(νQ,ρ , µQ,ρ ), ∆P = sup D(νP,ρ , µP,ρ ), ρ (3) ρ dove con D(ν, µ) si indica una numero che fornisce una stima quantitativa di quanto le distribuzioni di probabilità ν e µ siano differenti, che si può quindi interpretare come una opportuna “distanza” tra ν e µ,4 variante di quella considerata per la prima volta nel 1781 dal matematico francese Gaspard Monge, in relazione al problema di ottimizzare i costi di trasporto di materiale per fortificazioni. Appare perfettamente ragionevole considerare queste come stime quantitative della perturbazione indotta dal processo di misura simultanea sulle distribuzioni dei valori di Q e P misurati separatamente. Vale anche la pena di notare che le quantità ∆Q, ∆P così definite non dipendono dallo stato ρ, come quelle definite tramite la (2), e sono quindi da considerarsi delle quantità caratteristiche solo della procedura di misura. Il punto centrale dell’articolo di Busch, Lahti e Werner consiste dunque nella dimostrazione del fatto, piuttosto notevole, che per le quantità ∆Q, ∆P definite dalla (3), vale ancora la (1). Questo viene fatto sostanzialmente in due passi. Dapprima essi dimostrano che per certi particolari procedure di misura simultanea, dette covarianti,5 si ha ∆Q = ∆σ Q, ∆P = ∆σ P , per un opportuno stato σ del sistema, e dunque la dimostrazione della (1) si riduce in questo caso a quella “classica”. Poi dimostrano, utilizzando tecniche avanzate di analisi funzionale, che per ogni procedura di misura simultanea di Q e P , ne esiste 2 Una volta stabilito il principio di indeterminazione (1), l’intuizione di Heisenberg, Born e Jordan, poi chiarita e sistematizzata da von Neumann, fu che la modificazione del formalismo della meccanica classica necessaria per riconciliarla con esso consistesse nel sostituire, nella descrizione delle osservabili fisiche (come appunto la posizione e l’impulso di un elettrone), l’algebra commutativa delle funzioni sullo spazio delle fasi con un’opportuna algebra non commutativa, generata da elementi Q, P soddisfacenti le relazioni di commutazione di Heisenberg [Q, P ] = i~1. Da queste, la (1) per ∆ρ Q, ∆ρ P segue tramite una semplice applicazione della disuguaglianza di Cauchy-Schwarz. 3 Analogamente al caso di singole osservabili, la misura ν è indotta da una misura a valori proiettori (o, più in generale, ρ operatori positivi) definita su R2 , I ⊂ R2 7→ F (I), tramite la νρ (I) = tr (ρF (I)). 4 È la 2-distanza di Wasserstein tra misure: Z D(ν, µ) = inf |x − y|2 dλ(x, y), λ R2 R2 essendo l’estremo inferiore preso su tutte le misure λ su che hanno ν e µ come marginali. 5 Queste sono caratterizzate da una specifica proprietà di trasformazione della misura F per traslazioni sullo spazio delle fasi R2 , che implica che F sia assolutamente continua rispetto alla misura di Lebesgue e che la sua densità sia univocamente determianta dal suo valore nell’origine, che è un operatore positivo σ di traccia pari a 1, e dunque rappresenta un opportuno stato del sistema. 2 una covariante i cui ∆Q, ∆P non sono maggiori di quelli della procedura di partenza,6 che dunque soddisfano anch’essi la (1). In conclusione sembra di poter dire che, al di là dei toni un po’ sensazionalistici usati dall’informazione non specializzata, i risultati di Busch, Lahti e Werner forniscono una nuova interessante formalizzazione matematica del principio di indeterminazione di Heisenberg che contribuisce a chiarirne il significato e la portata e probabilmente si avvicina all’intuizione del fisico tedesco più dell’usuale trattamento, anche se molto probabilmente, a differenza di questo, non potrà essere inserita in un curriculum fisico di base a causa della sua maggiore sofisticazione matematica. È infine il caso di notare che il lavoro in questione ha ridato fiato a un dibattito piuttosto vivace tra i fisici teorici sulla “giusta” definizione delle incertezze ∆Q e ∆P , ed è dunque probabile che l’ultima parola sull’argomento non sia ancora stata scritta. 6 Questo si ottiene considerando l’insieme delle procedure di misura simultanee i cui ∆Q, ∆P sono maggiorati da quelli della procedura considerata. Tale insieme risulta convesso e compatto in un’opportuna topologia debole, e su di esso agisce una famiglia commutativa di trasformazioni affini i cui punti fissi sono esattamente le procedure covarianti, che quindi si ottengono tramite un’applicazione diretta del teorema di Markov-Kakutani. 3