UNIVERSITA’ DELLA CALABRIA DIPARTIMENTO DI MATEMATICA E INFORMATICA CORSO DI LAUREA IN MATEMATICA Tesi di Laurea in Matematica Teorema di Gleason e probabilità quantistica Relatore Candidata Prof. Giuseppe Nisticò Francesca De Masi, matr. 135495 Anno Accademico 2013/2014 Indice Introduzione 5 1 Il teorema di Gleason 7 1.1 Nozioni preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Frame functions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.3 Il teorema di Gleason . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.4 Lemmi fondamentali . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.5 La dimostrazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2 Il ruolo del teorema di Gleason nella Teoria Quantistica 8 27 2.1 Concetti fisici di base della Teoria Quantistica . . . . . . . . . . . . . 27 2.2 Osservabili elementari 2.3 Lo sviluppo assiomatico della teoria . . . . . . . . . . . . . . . . . . . 29 . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3 Probabilità, frequenza e ragionevole aspettativa 31 3.1 Frequenza e ragionevole aspettativa come concetti principali . . . . . 31 3.2 Ragionevole aspettativa in relazione alla logica simbolica . . . . . . . 32 3.3 Probabilità e frequenza . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Riferimenti nella letteratura scientifica 4 40 Introduzione Il teorema di Gleason, formulato e dimostrato da A.M. Gleason nel 1957 [1], nasce come risposta al problema, posto dal matematico statunitense G. Mackey [2], di caratterizzare le misure di probabilità sui sottospazi chiusi di uno spazio di Hilbert reale o complesso di dimensione maggiore di due. Obbiettivo di questa tesi è fornire una prova del teorema che sia più accessibile di quella originale, seguendo il lavoro di Cook, Keane e Moran [3]. Il primo capitolo dell’elaborato è dedicato alla formulazione e alla dimostrazione del teorema. Dopo aver enunciato il teorema, dimostreremo che provare il teorema per R3 equivale a provarlo per uno spazio di Hilbert; studieremo una particolare classe di funzioni chiamate frame functions e quindi enunceremo e dimostreremo il teorema in R3 in termini di frame functions. Nel secondo capitolo vedremo come il teorema di Gleason, stabilendo quali sono i rappresentanti matematici degli stati quantistici, ricopra un ruolo di fondamentale importanza nello sviluppo della teoria quantistica. Insieme alle osservabili, infatti, gli stati quantistici, intesi come la probabilità di ottenere un determinato risultato nella misurazione di un osservabile, costituiscono i concetti principali della formulazione della teoria quantistica. Nel suo sviluppo assiomatico della teoria, von Neumann [4] stabilisce che ad ogni sistema fisico è possibile associare uno spazio di Hilbert complesso e separabile in modo che ad ogni osservabile corrisponda biunivocamente un operatore hermitiano. Il teorema di Gleason completa tale sviluppo, identificando gli oggetti matematici che devono rappresentare gli stati nella teoria. Da quanto trattato nel secondo capitolo emerge la necessità di dare un’interpretazione alla probabilità definita dagli stati quantistici. Nel terzo capitolo faremo vedere come in generale la probabilità ammette due possibili interpretazioni: una in 5 INTRODUZIONE termini di frequenza e l’altra in termini di “ragionevole aspettativa”. Evidentemente le due possibilità si applicano alla teoria quantistica. E’ allora importante studiare le relazioni tra le due interpretazioni della probabilità. Seguendo il ragionamento di Cox [5], dopo aver dato una definizione di probabilità come ragionevole aspettativa, vedremo come leggi di probabilità possano essere ricavate mediante l’utilizzo della logica simbolica. Infine, vedremo come la probabilità come misura della ragionevole aspettativa e la frequenza di un evento tendano a coincidere sotto determinate ipotesi. 6 Capitolo 1 Il teorema di Gleason Il teorema di Gleason determina gli stati su uno spazio di Hilbert, cioè su uno spazio vettoriale con prodotto interno, completo rispetto alla norma indotta dal prodotto interno. Uno stato è una funzione definita sull’insieme dei sottospazi chiusi di uno spazio di Hilbert H che assegna a ogni sottospazio chiuso un numero reale non negativo tale che se {Ai } è una successione di sottospazi mutualmente ortogonali e se B è il più piccolo sottospazio chiuso da essi generato, cioè B = ⊕i Ai , allora p(B) = X p(Ai), p(H) = 1. Teorema (di Gleason) Sia H uno spazio di Hilbert separabile di dimensione maggiore di 2 e sia p uno stato su H. Allora esiste un operatore positivo W di classe traccia con Tr(W)=1 tale che p(V ) = T r(W Pv ) dove V è un qualsiasi sottospazio chiuso di H e Pv è la proiezione ortogonale su V. Articoleremo la dimostrazione del teorema come segue. Nel primo paragrafo ricorderemo alcune definizioni relative alla teoria degli spazi di Hilbert, proseguiremo con quella di stato e di stato regolare, per poi dimostrare che provare il teorema per R3 equivale a provarlo in generale per uno spazio di Hilbert separabile, reale o complesso. Nel secondo paragrafo introdurremo una particolare classe di funzioni chiamate frame functions, descrivendone le proprietà e fornendone alcune esempi, in modo tale da poter enunciare, nel terzo paragrafo, il teorema di Gleason in termini frame functions. Il terzo paragrafo comprenderà anche altri due teoremi, di cui 7 CAPITOLO 1. IL TEOREMA DI GLEASON il secondo è una versione approssimata del primo, che ci servirà per dimostrare il teorema di Gleason in un caso particolare. Il paragrafo quattro sarà dedicato a tre lemmi fondamentali volti allo stesso scopo. Infine nell’ultimo paragrafo, dopo aver dimostrato che il teorema di Gleason è vero sotto due ulteriori ipotesi sulle frame functions e con l’ausilio di un teorema sulle frame functions limitate, saremo in grado di dimostrare il teorema di Gleason nel caso generale. 1.1 Nozioni preliminari Ricordiamo alcune definizioni. Definizione 1. Sia H uno spazio vettoriale complesso; si definisce prodotto interno (o hermitiano) un’applicazione < ·, · > : H × H → C tale che ∀x, y, z ∈ H e λ ∈ C a. < x, y > = < y, x > b. < x + y, z > = < x, z > + < y, z > e < x, y + z > = < x, y > + < x, z > c. < λx, y > = λ < x, y > d. < x, x > è un numero reale non negativo, e < x, x > = 0 se e solo se x è il vettore nullo in H. Definizione 2. Il prodotto interno induce una funzione || · || : H → R detta norma definita come ||x|| = √ < x, x > Definizione 3. Uno spazio vettoriale normato H si dice completo se e solo se ogni successione di Cauchy di H converge in norma ad un vettore in H. Definizione 4. (Spazio di Hilbert) Uno spazio di Hilbert è uno spazio vettoriale dotato di prodotto interno, completo rispetto alla norma indotta dal prodotto interno. Sia H uno spazio di Hilbert separabile reale o complesso e sia L l’insieme dei sottospazi chiusi di H. Se A ∈ L e B ∈ L sono ortogonali, scriveremo A ⊥ B. Indichiamo con O il sottospazio di H contenente il solo vettore nullo. Naturalmente O è ortogonale a tutti i sottospazi. Per Ai ∈ L, i ∈ I, indichiamo con ∨i∈I Ai il più piccolo sottospazio chiuso contenente Ai , ∀i ∈ I. Se x è un vettore in H, x̄ indica il sottospazio unidimensionale generato da x. 8 CAPITOLO 1. IL TEOREMA DI GLEASON Definizione 5. (Stato) Una funzione p : L → [0, 1] si dice stato se p(O) = 0 , p(H) = 1 e per ogni successione {Ai }αi=1 , Ai ∈ L, con Ai ⊥ Aj , per i 6= j : p α ∨ Ai i=1 = α X p(Ai ). i=1 Definizione 6. Un operatore A : H → H si dice hermitiano se < A(x), y >=< x, A(y) > ∀x, y ∈ H Definizione 7. Uno stato p è detto regolare se esiste un operatore hermitiano A di classe traccia su H tale che per ogni vettore unitario x ∈ H p(x̄) =< Ax, x > . Le seguenti proprietà sono equivalenti: (i) p è regolare (ii) Esiste una forma bilineare continua simmetrica B su H tale che p(x̄) = B(x, x). Il teorema di Gleason stabilisce che ogni stato su uno spazio di Hilbert reale o complesso di dimensione maggiore di due è regolare. Dimostriamo ora che la validità del teorema in R3 ne implica la validità in H. A tale scopo premettiamo due lemmi. Lemma 1. Se la restrizione di p a ogni sottospazio di dimensione 2 di H è regolare, allora p è regolare. Dimostrazione. Supponiamo dapprima che H abbia dimensione 3 e consideriamo un sottospazio H2 di dimensione 2 di H. Per ipotesi ∃A operatore hermitiano di classe traccia su H2 tale che per ogni vettore unitario x ∈ H2 p(x̄) =< Ax, x > . Per il teorema spettrale, esiste una base ortonormale {u1 , u2 } di H2 che diagonalizza A. La matrice A2 che rappresenta A rispetto a tale base sarà della forma λ1 0 A2 = 0 λ2 9 CAPITOLO 1. IL TEOREMA DI GLEASON con λ1 , λ2 ∈ R. Quindi se fissiamo un vettore unitario x = a1 u1 + a2 u2 di H2 , avremo che p(x̄) = |a1 |2 λ1 + |a2 |2 λ2 . Notando che λ1 = u1 |A2 |u1 = p(ū1 ) e λ2 = u2 |A2 |u2 = p(ū2 ) possiamo scrivere p(x̄) = |a1 |2 p(ū1 ) + |a2 |2 p(ū2 ). Consideriamo ora un vettore x ∈ H di coefficienti (a1 , a2 , a3 ) rispetto alla base ortonormale {u1 , u2 , u3 } e proiettiamolo su H2 . Sia u il versore avente la direzione di tale proiezione e siano (b1 , b2 ) i suoi coefficienti. Per ipotesi, la restrizione di p al sottospazio generato da {u, u3 } sarà regolare e dunque, come prima, avremo p(x̄) = |a|2 p(ū) + |a3 |2 p(ū3 ) dove (a, a3 ) rappresentano i coefficienti di x rispetto a {u, u3 }. Osservando che p(ū) = |b1 |2 p(ū1 ) + |b2 |2 p(ū2 ), in definitiva otteniamo che p(x̄) = |a1 |2 λ1 + |a2 |2 λ2 + |a3 |2 λ3 = x|A3 |x . Dunque p è regolare. Vogliamo ora dimostrare che p è regolare anche su uno spazio H di dimensione finita maggiore di 3. Procediamo per induzione, indicando con n la dimensione dello spazio. La tesi è vera per n = 1, supponiamola vera per n e dimostriamo che sia vera per n + 1. Consideriamo Hn+1 = H1 ⊕ Hn . Sia x ∈ Hn+1 e siano x1 e xn le rispettive proiezioni su H1 e Hn . Per la numerabile additività di p p(x̄) = p(x̄1 ) + p(x̄n ) poiché le restrizioni di p ad H1 e ad Hn sono regolari segue che p è regolare. Resta da mostrare il caso in cui H abbia dimensione infinita. Sia x un qualunque vettore unitario di H e sia {uk } una base ortonormale di H. Per ogni n sia Hn il sottospazio di dimensione n generato da (u1 , . . . , un ). Allora x = xn + rn dove xn è la proiezione di x su Hn e rn la proiezione sul complemento 10 CAPITOLO 1. IL TEOREMA DI GLEASON ortogonale di Hn . Per ogni n, p è regolare su Hn e p(ȳ) =< y|An |y >, per ogni y ∈ Hn con ||y|| = 1. Allora x appartiene al sottospazio di dimensione 2 generato da xn e rn , perciò p(x̄) = ||xn ||2 p(x̄n ) + ||rn ||2 p(r̄n ). Siccome ||rn ||2 → 0 se n → +∞ e p(r̄n ) 6 1 per definizione, p(x̄) = lim ||xn ||2 p(x̄n ) =< x| lim An |x > . n→∞ n→∞ Allora p è regolare. Definizione 8. Diremo che un sottospazio reale chiuso K di uno spazio di Hilbert H è completamente reale se il prodotto interno su K × K assume solo valori reali. Lemma 2. Se p è uno stato su uno spazio di Hilbert complesso di dimensione 2, e se p è regolare su ogni sottospazio completamente reale, allora p è regolare. Dimostrazione. Cominciamo col mostrare che per x appartenente a un sottospazio completamente reale c’è un sottospazio unidimensionale x̄ tale che p(x̄) sia massimale. Poniamo M = sup p(x̄) x∈H e scegliamo una successione xn ∈ H tale che limn→∞ p(x̄n ) = M . Siccome la sfera unitaria è compatta, esiste una sottosuccessione {yn } tale che limn→∞ yn = x. Chiaramente esiste {θn } tale che < eiθn yn , x > è reale e non negativo; passando di nuovo a due sottosuccessioni {αn } e {zn }, possiamo assumere che limn→∞ αn = θ e limn→∞ zn = x. Per la continuità del prodotto scalare il limite < eiθ x, x >= eiθ kxk2 è anche reale e quindi eiθ = 1. Dunque limn→∞ eiαn zn = x e ∀n i vettori x e eiαn zn appartengono allo stesso sottospazio completamente reale. Considerando la diseguaglianza |p(x̄) − M | = |p(x̄) − p(eiαn zn ) + p(z̄n ) − M | ≤ |p(x̄) − p(eiαn zn )| + |p(z̄n ) − M | notiamo che, per l’uniforme continuità degli stati regolari e poiché abbiamo supposto limn→∞ p(x̄n ) = M , entrambi i termini a destra della diseguaglianza tendono a zero, dunque p(x̄) = M . Per ogni y ∈ H esiste θ tale che < x, eiθ y > è reale dunque, notando che eiθ y =< x, eiθ y > x+ < z, eiθ y > z 11 con z ⊥ x CAPITOLO 1. IL TEOREMA DI GLEASON e che (< z, eiθ y >)2 = 1 − (< x, eiθ y >)2 , risulta che p(ȳ) = p(eiθ y) = M (< x, eiθ y >)2 + (1 − M )(1 − (< x, eiθ y >)2 ) = M | < x, y > |2 + (1 − M )(1 − | < x, y > |2 ) e quindi p è regolare. Teorema 1. Se ogni stato su R3 è regolare, allora ogni stato su uno spazio di Hilbert H separabile reale o complesso di dimensione maggiore di due è regolare. Dimostrazione. Ogni stato su H induce una forma bilineare simmetrica continua su ogni sottospazio completamente reale di dimensione tre, poiché ogni sottospazio completamente reale di dimensione due può essere immerso in un sottospazio completamente reale di dimensione tre, segue che la restrizione di uno stato su H a qualsiasi sottospazio completamente reale di dimensione due è regolare e, per i lemmi precedenti, segue che ogni stato su H è regolare. 1.2 Frame functions Indichiamo con S la sfera unitaria di uno spazio di Hilbert reale di dimensione tre. Definizione 9. Si definisce frame una terna ordinata (p, q, r) di elementi di S tale che p ⊥ q, p ⊥ r, q ⊥ r. Dato un frame (p, q, r) ogni elemento dello spazio vettoriale può essere espresso in modo unico come xp + yq + zr, con x, y, z ∈ R. Definizione 10. Una frame function è una funzione f : S → R tale che w(f ) = f (p) + f (q) + f (r) assume lo stesso valore per ogni frame (p, q, r) . Il numero w(f ) si chiama peso di f. Le frame functions godono delle seguenti proprietà 12 CAPITOLO 1. IL TEOREMA DI GLEASON (P1 ) L’insieme delle frame functions è uno spazio vettoriale e, per f,g frame function ∀α ∈ R w(αf ) = αw(f ), w(f + g) = w(f ) + w(g); (P2 ) f (−s) = f (s), ∀s ∈ S; (P3 ) se s, t, s0 , t0 ∈ S giacciono tutti sulla stessa circonferenza massima e s ⊥ t, s0 ⊥ t0 , allora f (s) + f (t) = f (s0 ) + f (t0 ); (P4 ) sia sup f (s) = M < ∞ e inf f (s) = m > −∞, sia ξ > 0 e s ∈ S tale che f (s) > M − ξ. Allora ∃t ∈ S con s ⊥ t e f (t) < m + ξ. Esempio 1. Le costanti sono frame functions. Esempio 2. Indichiamo con θ(s, s0 ) l’angolo tra i vettori s, s0 ∈ S. Fissato p0 ∈ S, per ogni frame (p, q, r) le “frame coordinate”di p0 rispetto a (p, q, r) sono date da (cosθ(p0 , p), cosθ(p0 , q), cosθ(p0 , r)) e, poiché p0 ∈ S, la somma dei quadrati delle tre coordinate è uguale a uno. Dunque f (s) = cos2 θ(p0 , s) è una frame function con w(f ) = 1. Esempio 3. Fissiamo un frame (p, q, r) e una terna di numeri reali (α, β, γ). Sia s ∈ S e siano (x, y, z) le frame coordinate di s rispetto a (p, q, r). Per quanto visto nell’esempio precedente, f (s) = αx2 + βy 2 + γz 2 (1.1) è una frame function con w(f ) = α + β + γ. Ricordiamo ora il seguente Teorema 2. Sia V uno spazio vettoriale complesso di dimensione finita maggiore di zero, e sia h una forma hermitiana su V. Esiste in V una base ortonormale diagonalizzante per h. 13 CAPITOLO 1. IL TEOREMA DI GLEASON Dunque, se Q è una forma quadratica sul nostro spazio di Hilbert, esisteranno un frame (p, q, r) e una terna (α, β, γ) di numeri reali, tale che la restrizione di Q ad S è data dalla (1.1). Abbiamo provato il primo punto della seguente Proposizione 1. (a) Sia A un operatore lineare da uno spazio di Hilbert in se stesso, e sia Q(s) =< s, As > la forma quadratica associata ad A. Allora la restrizione di Q ad S è una frame function il cui peso è la traccia di A. (b) Sia ψ : R → R tale che ψ(x + y) = ψ(x) + ψ(y) per ogni (x, y) ∈ R. Allora ψ(x) = cx (con c = f (1)) per ogni x ∈ Q. Se inoltre ψ è limitata, continua, o monotona su un intervallo allora ψ(x) = cx per ogni x ∈ R (v. J.Aczél, “Lectures on functional equations and their applications”). 1.3 Il teorema di Gleason A questo punto possiamo enunciare il teorema di Gleason in termini di frame functions, dove la restrizione a frame functions limitate risulta essenziale per quanto vedremo nell’ultimo paragrafo. Teorema 3. Sia f una frame function limitata. Definiamo M = sup f (s) m = inf f (s) α = w(f ) − M − m. Allora esiste un frame (p, q, r) tale che se (x, y, z) sono le frame coordinate di s ∈ S rispetto a (p, q, r), f (s) = M x2 + αy 2 + mz 2 (1.2) ∀s ∈ S. Il teorema precedente è equivalente al teorema di Gleason perché stabilisce che la frame function di un vettore unitario è della forma (1.2) che, per quanto visto precedentemente, è la forma quadratica associata all’operatore lineare rappresentato 14 CAPITOLO 1. IL TEOREMA DI GLEASON dalla matrice M 0 0 0 α 0. 0 0 m Allo scopo di chiarire l’idea che c’è dietro la dimostrazione del Teorema 3, enunciamo e dimostriamo il seguente teorema. Teorema 4. Sia f : [0, 1] → R una funzione limitata tale che per ogni a, b, c ∈ [0, 1] con a + b + c = 1, f (a) + f (b) + f (c) abbia lo stesso valore w̃ = w(f ). Allora f (a) = (w̃ − 3f (0))a + f (0) per ogni a ∈ [0, 1]. Dimostrazione. Supponiamo, a meno di una costante, che f (0) = 0, e scegliamo c = 0, b = 1 − a in modo da ottenere f (a) = w̃ − f (1 − a), dalla quale si evince f (1) = w̃, e successivamente c = 1 − (a + b) ottenendo f (a) + f (b) = w̃ − f (1 − (a + b)) = f (a + b) ∀ a, b, a + b ∈ [0, 1]. Allora, per quanto visto precedentemente, f (a) = w̃a per ogni a razionale, mentre per a ∈ [0, 1] qualsiasi e n ≥ 1 con na ≤ 1 vale f (na) = nf (a). Poiché f è limitata su [0, 1], lo è anche anche g(a) = f (a) − w̃a. Inoltre, poiché per ogni razionale r risulta g(r) = 0 e dunque g(a + r) = g(a), g è limitata su tutto R. Per a0 tale che g(a0 ) = A 6= 0, vale g(na0 ) = ng(a0 ) = nA. Quindi per n sufficientemente grande, g assumerà valori arbitrariamente grandi, in contraddizione con la sua limitatezza. Ma allora g(a) = 0 e dunque f (a) = w̃a per ogni a ∈ [0, 1]. Nella dimostrazione del teorema di Gleason useremo la seguente versione modificata del Teorema 4. 15 CAPITOLO 1. IL TEOREMA DI GLEASON Teorema 5. Sia C un sottoinsieme finito o numerabile di (0, 1). Sia f : [0, 1]rC → R una funzione tale che (1) f (0) = 0; (2) se a, b ∈ [0, 1] r C e a < b, allora f (a) 6 f (b); (3) se a, b, c ∈ [0, 1] r C e a + b + c = 1, allora f (a) + f (b) + f (c) = 1. Allora f (a) = a per ogni a ∈ [0, 1] r C. Dimostrazione. L’ insieme C̃ = {rc, r(1 − c) : c ∈ C, r razionale} è finito o numerabile, dunque esiterà un punto a0 ∈ (0, 1) con a0 ∈ / C̃. Supponiamo che r sia un numero razionale tale che ra0 ∈ [0, 1]. Allora, poiché a0 ∈ / C̃, né ra0 né 1 − ra0 apparterranno a C. Quindi, dalle ipotesi (1) e (3) possiamo concludere, come nella dimostrazione precedente, che f (ra0 ) + f (r0 a0 ) = f (r + r0 )a0 con r e r0 razionali e ra0 , r0 a0 , (r + r0 )a0 ∈ [0, 1], e dunque f (ra0 ) = rf (a0 ) per r razionale e ra0 ∈ [0, 1]. Dall’ipotesi (2) segue che f (a) = a per ogni a ∈ [0, 1] r C. 1.4 Lemmi fondamentali Dimostriamo ora un lemma fondamentale, una sua versione approssimata e un lemma geometrico che ci saranno utili in seguito. Fissato un punto p ∈ S, definiamo l’emisfero nord di S come l’ insieme n πo N = s ∈ S : θ(p, s) ≤ 2 e l’equatore come l’insieme E= s∈S:s⊥p . 16 CAPITOLO 1. IL TEOREMA DI GLEASON Figura 1.1: Polo nord, equatore Figura 1.2: l-esimo parallelo p rappresenterà il polo nord di N (Figura 1.1). Per ogni s ∈ N , definiamo la latitudine di s come l(s) = cos2 θ(p, s) e, per 0 ≤ l ≤ 1, l’l-esimo parallelo (Figura 1.2) come Ll = s ∈ N : l(s) = l Avremo, ad esempio, L1 = {p} e L0 = E. Per s ∈ N r {p}, esiste un unico vettore s⊥ ∈ N tale che s ⊥ s⊥ e l(s) + l(s⊥ ) = 1. Chiameremo discesa per s la semicirconferenza massima D s = t ∈ N : t ⊥ s⊥ . Lemma 3. (fondamentale) Sia f una frame function tale che (1) f (p) = sup f (s), e s∈S (2) f (e) ha lo stesso valore per ogni e ∈ E. Allora se s ∈ N r {p} e se s0 ∈ Ds , f (s) ≥ f (s0 ). Dimostrazione. Poniamo f (p) = M . La proprietà (P4 ) implica che f (e) = m = inf f (s). s∈S Sia s ∈ N r {p} e s0 ∈ Ds . Prendiamo t, t0 ∈ Ds con s ⊥ t e s0 ⊥ t0 . Per la proprietà (P3 ) risulta che f (s) + f (t) = f (s0 ) + f (t0 ) 17 CAPITOLO 1. IL TEOREMA DI GLEASON e, poiché t ∈ E, abbiamo che f (s) − f (s0 ) = f (t0 ) − f (t) = f (t0 ) − m ≥ 0 quindi la tesi. Lemma 4. (versione approssimata del lemma fondamentale) Siano f una frame function e ξ > 0 tali che (1) f (p) > sup f (s) − ξ, e s∈S (2) f (e) ha lo stesso valore per ogni e ∈ E. Allora se s ∈ N r {p} e se s0 ∈ Ds , f (s) > f (s0 ) − ξ. Dimostrazione. Come nel lemma precedente, (P4 ) implica f (e) < m + ξ, e per la stessa scelta di t e t0 otteniamo f (s) − f (s0 ) = f (t0 ) − f (t) > f (t0 ) − m − ξ ≥ −ξ. Lemma 5. (geometrico) Siano s, t ∈ N r {p} tali che l(s) > l(t). Allora esistono n > 1 e s0 , . . . , sn ∈ N r {p}, tale che s0 = s, sn = t e per ogni 1 6 i 6 n : si ∈ Dsi−1 . Dimostrazione. Per ipotesi, s e t si trovano a diverse latitudini : nel caso più semplice, sulla stessa circonferenza massima passante per p. Per facilitare i calcoli, trasferiamo il problema al piano tangente ad S in p, ivi proiettando, dal centro della sfera (che sceglieremo come origine), tutti i punti di N . I punti che hanno la stessa latitudine su S saranno proiettati su circonferenze centrate in p, le circonferenze massime su delle rette, e la discesa per s sulla retta tangente in s al parallelo passante per s (Figura 1.5). Nel caso più semplice, quindi, s e t si troveranno sullo stesso raggio dall’origine. Se in questo caso, scegliamo n = 2, poniamo s0 = s, s2 = t e fissiamo s1 come in Figura 1.3 avremo che s1 ∈ Ds0 e s2 ∈ Ds1 , e dunque la validità 18 CAPITOLO 1. IL TEOREMA DI GLEASON Figura 1.3: Lemma geometrico: caso più semplice Figura 1.4: Lemma geometrico: caso generico 19 CAPITOLO 1. IL TEOREMA DI GLEASON Figura 1.5: Piano prospettico della tesi. Fissiamo ora, s = s0 = (x, 0) e n > 1, e scegliamo s1 , . . . , sn in modo che si ∈ Dsi−1 e che l’angolo tra si e si+1 sia π n (Figura 1.4). Allora sn avrà coordinate (−y, 0). Vogliamo dimostrare che y − x → 0 se n → ∞. Indichiamo con di la distanza di si dall’origine. Quindi d0 = x e dn = y. Poiché, per ogni i, di+1 e di sono rispettivamente l’ipotenusa e un cateto di uno stesso triangolo rettangolo, avremo di+1 1 , = di cos πn e dunque n 16 1 y dn Y di 1 6 = = = π π2 n x d0 d cosn ( n ) (1 − 2n 2) i=1 i−1 che tende a 1 al tendere all’infinito di n. 1.5 La dimostrazione Adesso abbiamo quasi tutti gli strumenti necessari per dimostrare il teorema di Gleason. Cominciamo col provare che è vero sotto due ulteriori ipotesi sulle frame functions. 20 CAPITOLO 1. IL TEOREMA DI GLEASON Teorema 6. Sia f una frame function tale che per un punto p ∈ S (1) f (p) = M := supf (s), s∈S (2) f (e) assume il valore costante m per ogni e ∈ E. Allora f (s) = m + (M − m)cos2 θ(s, p) per ogni s ∈ S, dove m = infs∈S f (s). Dimostrazione. Per la proprietà (P4 ), m = inf s∈S f (s), dunque se M = m, la tesi è vera. Supponiamo allora che m 6= M e che (ponendo (1/(M − m))(f − m) al posto di f ) m = 0 e M = 1. Siano s, t ∈ N r {p} con l(s) > l(t). Allora, poiché per il geometric lemma t ∈ Ds , segue dal basic lemma che f (s) > f (t). Per ogni l ∈ [0, 1] definiamo: f¯(l) = sup{f (s) : s ∈ N, l(s) = l}, f (l) = inf{f (s) : s ∈ N, l(s) = l}. − Avremo quindi che f¯(1) = f (1) = 1, f¯(0) = f (0) = 0 e ∀ l, l0 ∈ [0, 1] con l < l0 − − f¯(l) 6 f (l0 ). (1.3) − Pertanto, l’insieme C := {l : f¯(l) > f (l)} è al più numerabile. − Per l ∈ [0, 1] r C definiamo f (l) = f¯(l) = f (l). − Se l, l0 , l00 ∈ [0, 1] con l + l0 + l00 = 1, esisterà un frame (q, q 0 , q 00 ) tale che l(q) = l, l(q 0 ) = l0 , l(q 00 ) = l00 . Quindi f soddisfa le ipotesi del Teorema 5 e risulta f (l) = l ∀ l ∈ [0, 1] r C. Ciò implica che C è vuoto, e quindi che per ogni s ∈ N , f (s) = f (l(s)) = l(s) = cos2 θ(s, p). (1.4) Poiché, per la proprietà (P2 ), la (1.4) vale per ogni s ∈ S, la dimostrazione è conclusa. 21 CAPITOLO 1. IL TEOREMA DI GLEASON Teorema 7. Le frame functions limitate assumono i propri valori estremanti. Dimostrazione. Sia f una frame function limitata con M = sups∈S f (s) e scegliamo una successione pn ∈ N tale che limn→∞ f (pn ) = M . Dato che N è un sottoinsieme chiuso di S, che è compatto, possiamo assumere passando a una sottosuccessione, che pn converga e porre p = limn→∞ pn . Vogliamo dimostrare che f (p) = M . Dividiamo la dimostrazione in quattro punti. 1. Al fine di considerare come polo nord pn per ogni n, piuttosto che p, scegliamo e fissiamo un punto e0 ∈ E e indichiamo con C0 l’arco di circonferenza massima che congiunge p ad e0 . Sia ρn : S → S il movimento rigido di S che porta p su pn e un punto di C0 , che chiameremo cn su p. Ovviamente lim cn = p. n→∞ Definiamo ora la successione di frame functions {gn } ponendo gn (s) = f (ρn (s)) con s ∈ S. Valgono le seguenti proprietà: (1) lim gn (p) = M. n→∞ (2) M = sup gn (s) e m = inf gn (s) ∀n > 1 s∈S s∈S (3) gn (cn ) = f (p) ∀n > 1. 2. Indichiamo con p̂ : S → S la rotazione di 90◦ in senso orario di S attorno al polo p. Per ogni n ≥ 1, poniamo hn (s) = gn (s) + gn (p̂(s)) con s ∈ S. {hn } è una successione di frame functions, per la proprietà (P1 ), e gode delle seguenti proprietà: (1) sup hn (s) 6 2M ∀n > 1. s∈S (2) inf hn (s) > 2m ∀n > 1. s∈S (3) lim hn (p) = 2M. n→∞ (4) ogni hn è costante su E. (5) hn (cn ) 6 M + f (p), 22 ∀n > 1. CAPITOLO 1. IL TEOREMA DI GLEASON 3. Consideriamo ogni hn come un punto dello spazio [2m, 2M ]S che è compatto sotto la topologia prodotto, allora la successione hn avrà un punto di accumulazione che indicheremo con h. Dunque (1) h(p) = 2M = sup h(s). s∈S (2) h è costante su E. (3) h è una frame function perchè le frame functions formano un sottospazio chiuso di [2m, 2M ]S . Allora per il Teorema 6 , h è continua. 4. Scegliamo > 0 e c ∈ C0 in modo che risulti h(c) > 2M − . Applicando ad hn la versione approssimata del basic lemma e notando che c e cn si trovano sulla stesso tratto di circonferenza massima passante per il polo e che quindi ci troviamo nel caso più semplice del geometric lemma, abbiamo che hn (cn ) > hn (c) − 2δn con δn > 2M − hn (p) che tende a zero per n tendente a infinito. Scegliamo adesso una sottosuccessione {hnj } tale che lim hnj (c) > 2M − j→∞ Ricordiamo che ((5) del punto 2) hn (cn ) 6 M + f (p), M + f (p) > lim inf hnj (cnj ) > lim hnj (c) − 2δnj > 2M − j→∞ j→∞ Pertanto f (p) > M − . Possiamo infine dimostrare il teorema di Gleason. Teorema Sia f una frame function limitata. Definiamo M = sup f (s) m = inf f (s) α = w(f ) − M − m. 23 CAPITOLO 1. IL TEOREMA DI GLEASON Allora esiste un frame (p, q, r) tale che se (x, y, z) sono le frame coordinate di s ∈ S rispetto a (p, q, r), f (s) = M x2 + αy 2 + mz 2 ∀s ∈ S. Dimostrazione. Per il Teorema 7 appena dimostrato, possiamo scegliere p ∈ S tale che f (p) = M e, grazie alla proprietà (P4 ), r ∈ S, r ⊥ p tale che f (r) = m. Scegliamo q perpendicolare a p e ad r, e poniamo f (q) = α. Indichiamo con p̂, q̂, r̂ le rotazioni di 90◦ in senso orario attorno a p, q, r . Prendendo p come polo nord, la funzione f (s) + f (p̂(s)) assumerà il valore costante m + α sull’equatore per la proprietà (P3 ) e, per il passo (3), raggiungerà il suo massimo 2M in p. Allora, per il Teorema 6, abbiamo che f (s) + f (p̂(s)) = 2M cos2 θ(s, p) + (m + α)(1 − cos2 θ(s, p)). Sia g(s) = M cos2 θ(s, p) + m cos2 θ(s, r) + α cos2 θ(s, q), dunque g(p̂(s)) = M cos2 θ(s, p) + m cos2 θ(s, q) + α cos2 θ(s, r), ricordando che cos2 θ(s, p) + cos2 θ(s, q) + cos2 θ(s, r) = 1 otteniamo f (s) + f (p̂(s)) = g(s) + g(p̂(s)). (1.5) f (s) + f (r̂(s)) = g(s) + g(r̂(s)). (1.6) Analogamente Indichiamo ora con (x, y, z) le frame coordinate di s ∈ S rispetto a (p, q, r). Vogliamo dimostrare che se le frame coordinate di s soddisfano determinate condizioni, allora, nel punto s, le funzioni f e g coincidono. Asserzione: (a) se x = y, x = z, o y = z, allora f (s) = g(s); (b) se x = −y, x = −z, o y = −z, allora f (s) = g(s). 24 CAPITOLO 1. IL TEOREMA DI GLEASON Prova (a) Notiamo che le operazioni r̂ e p̂ sono tali che r̂(x, y, z) = (−y, x, z) e p̂(x, y, z) = (x, −z, y). Dunque, applicandole in successione, otteniamo (p̂ ◦ p̂ ◦ r̂)(x, x, z) = (−x, −x, −z), (p̂ ◦ r̂ ◦ r̂)(x, z, z) = (−x, −z, −z), (r̂ ◦ p̂ ◦ p̂ ◦ p̂ ◦ r̂)(x, y, x) = (−x, −y, −x). Supponiamo s = (x, x, z). Dalle equazioni (1.5) e (1.6) risulta che f (s) + (f ◦ r̂)(s) = g(s) + (g ◦ r̂)(s), (f ◦ r̂)(s) + (f ◦ p̂ ◦ r̂)(s) = (g ◦ r̂)(s) + (g ◦ p̂ ◦ r̂)(s), (f ◦ p̂ ◦ r̂)(s) + (f ◦ p̂ ◦ p̂ ◦ r̂)(s) = (g ◦ p̂ ◦ r̂)(s) + (g ◦ p̂ ◦ p̂ ◦ r̂)(s); sottraendo la seconda equazione dalla somma della prima e della terza, e ricordando che f (s) = f (−s) e g(s) = g(−s), concludiamo che f (s) = g(s). Gli altri due casi in (a) si provano in maniera analoga. Per lo stesso motivo, dimostreremo solo il primo caso di (b). Supponiamo s = (x, −x, z). Poiché r̂(x, −x, z) = (x, x, z) giace sulla circonferenza massima x = y, sappiamo da (a) che (f ◦ r̂)(s) = (g ◦ r̂)(s), ma allora, per la (1.6), f (s) = g(s). L’asserzione è provata. Al fine di dimostrare che f coincide identicamente con g, definiamo la frame function h := g − f e mostriamo che è identicamente uguale a zero. L’asserzione implica che h(p) = h(q) = h(r) = 0, e quindi che il peso di h è zero. Sappiamo inoltre, che h assume valore zero sulle sei circonferenze massime x = ±y, x = ±z, y = ±z. Supponiamo che h non sia identicamente uguale a zero e poniamo M 0 := sup h = h(p0 ), m0 := inf h = h(r0 ), α0 := h(q 0 ); con q 0 ⊥ r0 , q 0 ⊥ p0 . Se h è non identicamente nulla devono valere le seguenti condizioni (i) − (iv). (i) M 0 = −m0 6= 0. Infatti, supponiamo che m0 > −M 0 . Allora α0 < 0 e, per la proprietà (P3 ), è il massimo valore che h assume sulla circonferenza massima ortogonale a p0 . Ma ciò non è possibile, considerando che la circonferenza massima x = y interseca la precedente in almeno due punti, e in questi due punti h assume valore zero. Allo stesso modo, 25 CAPITOLO 1. IL TEOREMA DI GLEASON si giunge a una contraddizione considerando −h e supponendo m0 < −M 0 . (ii) α0 = 0. Segue immediatamente da (i) e dal fatto che h ha peso zero. (iii) h(x0 , x0 , z 0 ) = M 0 (x0 )2 − (z 0 )2 , dove (x0 , y 0 , z 0 ) indicano le frame coordinate rispetto a (p0 , q 0 , r0 ). Infatti, dopo aver sostituito h al posto di f e M 0 (x0 )2 − (z 0 )2 al posto di g utilizzando i due punti precedenti, segue da (a). (iv) Sulla circonferenza massima x0 = y 0 , h assume valore zero esattamente nei quattro punti: (x0 , x0 , x0 ), (x0 , x0 , −x0 ), (−x0 , −x0 , x0 ), (−x0 , −x0 , −x0 ). Segue immediatamente da (iii). Verifichiamo che le condizioni (i) − (iv) sono contraddittorie. Le circonferenze massime x = y, x = z, y = z si intersecano nei due punti (x, x, x) e (−x, −x, −x). Poiché su queste circonferenze massime h è zero la circonferenza massima x0 = y 0 deve passare per i suddetti punti, altrimenti ci sarebbero sei punti su x0 = y 0 nei quali h è zero. Allo stesso modo, poiché le circonferenze massime x = −y e x = −z si intersecano in (x, −x, −x) e (−x, x, x) anche la x0 = y 0 le deve intersecare in questi punti, altrimenti le intersecherebbe ognuna in due punti distinti e i punti su cui h assume valore zero diventerebbero sei. Tuttavia, l’unica circonferenza massima che passa per i quattro punti (x, x, x), (−x, −x, −x), (x, −x, −x) e (−x, x, x) è y = z. Segue che x0 = y 0 e y = z coincidono, e quindi che h deve assumere valore zero in tutti punti x0 = y 0 . Ciò contraddice (iv) e dunque conclude la dimostrazione. 26 Capitolo 2 Il ruolo del teorema di Gleason nella Teoria Quantistica Lo scopo di questo capitolo è mettere in evidenza l’importanza del teorema di Gleason nella Teoria Quantistica. 2.1 Concetti fisici di base della Teoria Quantistica I concetti fisici di base nella formulazione della teoria quantistica di un sistema fisico sono i concetti di • osservabile, e • stato. Per “osservabile” si intende una qualunque grandezza misurabile su esemplari individuali del sistema, il cui valore misurato sia esprimibile come un numero reale. Facendo riferimento alla teoria classica, ad esempio la meccanica di un punto materiale, esempi di osservabile sono una componente della posizione, una componente della velocità, l’energia cinetica, etc. Nel concetto quantistico di osservabile è essenziale l’aggettivo “misurabile”. Una grandezza non è un’osservabile se non esiste una procedura sperimentale in grado di misurarne concretamente il valore. La spiegazione del concetto di stato richiede la nozione di procedura di preparazione. Una procedura di preparazione è una modalità di selezione di esemplari del sistema 27 CAPITOLO 2. IL RUOLO DEL TEOREMA DI GLEASON NELLA TEORIA QUANTISTICA fisico che consente la misurazione di una osservabile del sistema selezionato, scelta tra le osservabili che caratterizzano il sistema. Per una data procedura di preparazione π alcune osservabili A hanno un valore aspettato V(A) del risultato della misurazione, nel senso della teoria della probabilità. Due procedure di preparazione π1 e π2 si diranno equivalenti, π1 v π2 , se danno luogo allo stesso valore d’aspettazione: Vπ1 (A) = Vπ2 (A), ∀A. Uno stato (quantistico) è una classe di equivalenza {π}v di procedure di preparazione; pertanto uno stato è completamente individuato dall’unico valore di aspettazione corrispondente ad ogni procedura di preparazione nella classe {π}v . 2.2 Osservabili elementari Una osservabile P la cui misurazione può avere solo risultato 1 o 0 è detta osservabile elementare. Data un’osservabile A, per ogni boreliano ∆ ⊆ R possiamo definire l’osservabile X∆ (A) come l’osservabile la cui misurazione può essere effettuata misurando A e, ottenendo un risultato α, attribuendo a X∆ (A) il risultato 1 se α ∈ ∆ e il risultato 0 se α ∈ / ∆. Ovviamente X∆ (A) è un’osservabile elementare. L’osservabile A d’altra parte, è completamente determinata dalla famiglia {X∆ (A) | ∆ ∈ B(R)} di osservabili elementari. Indichiamo con E la famiglia di tutte le osservabili elementari. E’ evidente allora che due procedure di preparazione π1 e π2 sono equivalenti se e soltanto se Vπ1 (P) = Vπ2 (P), ∀P ∈ E. Pertanto uno stato è individuato dall’unico valore d’aspettazione V : E → R corrispondente a ogni procedura di preparazione appartenente a quello stato. Ora, siccome ∀P ∈ E i possibili risultati di una misurazione sono 0 o 1, avremo V(P) = 1 · p1 + 0 · p0 , dove p1 e p0 sono le probabilità di ottenere 1 e 0 in una misurazione di P. Allora V(P) = p1 : per un’osservabile elementare P il valore d’aspettazione coincide con la probabilità di ottenere il valore 1 come risultato di una misurazione. Quindi lo stato può essere individuato con la probabilità p(P) di ottenere il risultato 1 in una misurazione di 28 CAPITOLO 2. IL RUOLO DEL TEOREMA DI GLEASON NELLA TEORIA QUANTISTICA P, cioè con la probabilità p : E → [0, 1], 2.3 p(P) = p1 . Lo sviluppo assiomatico della teoria Lo sviluppo assiomatico della teoria quantistica operato da von Neumann [4] permette di ottenere i seguenti risultati. R.1 Ad ogni sistema fisico è possibile associare uno spazio di Hilbert complesso e separabile H in maniera che ad ogni osservabile A corrisponda biunivocamente un operatore hermitiano A di H. R.2 L’operatore hermitiano rappresentante un’ osservabile elementare P è un proiettore ortogonale P di H. Viceversa ogni proiettore ortogonale P di H rappresenta una qualche osservabile fisica elementare del sistema. A questo punto la teoria di von Neumann stabilisce, dunque, quali sono gli oggetti matematici che rappresentano gli oggetti appartenenti ad uno dei concetti fisici fondamentali della teoria, le osservabili, o, equivalentemente, le osservabili elementari: i rappresentanti matematici di queste ultime sono i proiettori ortogonali. Per completare la formulazione dell’apparato matematico della teoria occorre trovare i rappresentanti matematici degli stati quantistici. Il teorema di Gleason fornisce una risposta concettualmente e matematicamente rigorosa a questo problema. Data una qualunque osservabile elementare P, il proiettore ortogonale P che la rappresenta, è completamente determinato dal sottospazio S = P (H) su cui proietta. Infatti, se {s1 , s2 , . . . , sn , . . . } è una base ortonormale di S allora P = ∞ X < sj , x > sj , ∀x ∈ H. j=1 Ora, uno stato quantistico è una funzione p : E → [0, 1], P → p(P); ogni P ∈ E corrisponde biunivocamente al sottospazio S = P (H); pertanto lo stato p è completamente identificato dalla funzione p : L → [0, 1], 29 p(S) = p(P), CAPITOLO 2. IL RUOLO DEL TEOREMA DI GLEASON NELLA TEORIA QUANTISTICA dove S = P (H). Questa identificazione giustifica la definizione di stato data nel capitolo 1. Un altro risultato dello sviluppo assiomatico della teoria quantistica, che non abbiamo ancora riportato, può essere formulato nel modo seguente in termini di funzioni su sottospazi di H. R.3 Se {S1 , S2 , . . . , Sn , . . . } è una famiglia numerabile di sottospazi tali che Sj ⊥ Sk se j 6= k, le corrispondenti osservabili elementari Pk (cioè Sk = Pk (H)) sono mutualmente esclusive, cioè in una misurazione simultanea di una qualunque famiglia finita {Pk1 , . . . , Pkn }, solo un risultato è 1; gli altri sono tutti 0. Come conseguenza di R.3, se S è la somma diretta di tutti gli Sn , S = ⊕∞ k=1 Sk , dovremo avere p(S) = ∞ X p(Sk ). k=1 Pertanto lo stato della teoria quantistica è proprio lo stato definito nel capitolo 1, se H è preso come lo spazio di Hilbert della teoria. Il teorema di Gleason stabilisce quali sono i rappresentanti degli stati quantistici nell’apparato matematico della teoria. Grazie ad esso la formulazione matematica della teoria può essere completata con successo. 30 Capitolo 3 Probabilità, frequenza e ragionevole aspettativa 3.1 Frequenza e ragionevole aspettativa come concetti principali Il concetto di probabilità ha da sempre coinvolto due idee: quella di frequenza relativa a un ensemble e quella di ragionevole aspettativa. La scelta dell’una o dell’altra come significato principale di probabilità ha distinto le due più importanti scuole di pensiero nell’ambito di questa teoria. Chiariamo questi due concetti con un esempio. Se un’urna contiene due palline bianche e una nera, peraltro identiche, entrambe le scuole convengono che la probabilità che un uomo bendato peschi una pallina bianca è 2/3, mentre quella che ne peschi una nera è 1/3. Secondo la teoria frequenzista queste probabilità sono una caratteristica dell’ensemble. Per ensemble si intende un gran numero di copie di un sistema fisico, che in questo caso può essere costituito da un numero indefinitamente grande di urne aventi lo stesso contenuto, oppure da un numero indefinitamente grande di estrazioni con reimbussolamento dalla stessa urna. Il presupposto essenziale è che le condizioni iniziali siano suscettibili di infinite ripetizioni, perché si assume che l’esperimento possa essere riprodotto infinite volte. Che la probabilità di estrarre una pallina bianca è 2/3 significa semplicemente che di tutte le palline estratte dall’intero sistema, 2/3 saranno bianche. 31 CAPITOLO 3. PROBABILITÀ, FREQUENZA E RAGIONEVOLE ASPETTATIVA Secondo la teoria frequenzista, questa non è un previsione della teoria della probabilità, ma la definizione stessa di probabilità. Dall’esempio si evince che quando la probabilità è identificata con la frequenza relativa ad un ensemble le probabilità sono calcolate con l’aritmetica o, più in generale, con l’algebra. Per quanto riguarda la seconda teoria invece, affermare che la probabilità di pescare una pallina bianca è 2/3 mentre quella di pescarne una nera è 1/3 vuol significare che ottenere una pallina bianca come risultato di un’estrazione è “più probabile” che ottenerne una nera. Le due teorie non sono sempre identiche poiché vi sono probabilità in termini di ragionevole aspettativa per le quali non esiste alcun ensemble. Inoltre la teoria frequenzista ha un limite in quanto c’è un campo di deduzione probabilistica che non rientra nell’ambito della teoria. E il ricavare leggi di probabilità dalle caratteristiche dell’ensemble mediante l’algebra non può giustificare l’uso di tali regole in questo campo. Un originale sviluppo della teoria della probabilità è dovuto a Keynes [6], il quale concepisce la probabilità come una relazione tra un’ipotesi e una conclusione, corrispondente al grado di credibilità ragionevole, limitata dai valori di certezza e impossibilità. In particolare, la probabilità non può essere definita in termini di certezza, essendo la certezza stessa un caso particolare di probabilità. In tali ipotesi la teoria frequenzista risulta erronea perché dipendente dal concetto di certezza incluso nel fatto di conoscere il numero di esperimenti. 3.2 Ragionevole aspettativa in relazione alla logica simbolica Grazie all’algebra Booleana, di cui faremo un breve richiamo, è possibile ricavare le leggi di probabilità da due idee abbastanza semplici, indipendenti dal concetto di ensemble. L’algebra di Boole [7] è nata per elaborare matematicamente espressioni nell’ambito della logica proposizionale. Parlare in termini di probabilità di proposizioni piuttosto che di eventi, è più vantaggioso perché ci permette di mantenere un grado di generalità più alto e di non coinvolgere il concetto di successione nel tempo. Indichiamo le proposizioni con a, b, c . . . La proposizione not-a con v a, la propo32 CAPITOLO 3. PROBABILITÀ, FREQUENZA E RAGIONEVOLE ASPETTATIVA sizione a-and -b con a ∧ b e la proposizione a-or -b con a ∨ b. La proposizione not-a non è necessariamente l’opposto della proposizione a, ma una proposizione che rende a non completamente vera. L’ordine in cui a e b compaiono in a ∧ b e a ∨ b è quello in cui due proposizioni sono state affermate, non l’ordine cronologico in cui si sono verificati due eventi. Allo stesso modo a ∧ a indica semplicemente che la proposizione a è stata affermata due volte. L’“or” di a ∨ b non è esclusivo. Valgono le seguenti proprietà: (1) vv a = a, (2) a ∧ b = b ∧ a, (20 ) a ∨ b = b ∨ a, (3) a ∧ a = a, (30 ) a ∨ a = a, (4) a ∧ (b ∧ c) = (a ∧ b) ∧ c = a ∧ b ∧ c, (40 ) a ∨ (b ∨ c) = (a ∨ b) ∨ c = a ∨ b ∨ c, (5) v (a ∧ b) = v a ∨ v b, (50 ) v (a ∨ b) = v a ∧ v b, (6) a ∧ (a ∨ b) = a, (60 ) a ∨ (a ∧ b) = a. Esse non sono tutte indipendenti. Scegliendo una proprietà da ogni coppia di quelle numerate in modo simile e combinandole con la prima, è possibile ricavare le cinque rimanenti. Indichiamo ora con il simbolo b|a una “misura di credibilità” ragionevole della proposizione b quando sappiamo essere vera a. A causa della indefinitezza del termine non lo indentificheremo con la probabilità, bensı̀ chiameremo b|a “verosimiglianza” della proposizione b data l’ipotesi a. Tra le due idee menzionate all’inizio vi è quella di supporre che, qualunque sia la misura scelta, la verosimiglianza di (c ∧ b)|a è una funzione numerica delle due verosimiglianze b|a e c|(b ∧ a), ovvero (c ∧ b)|a = F [c|(b ∧ a), b|a]. (3.1) Sebbene la scelta della funzione F sia parzialmente convenzionale a causa dell’indefinitezza della misura usata per la verosimiglianza, non lo è del tutto in quanto deve rispondere alle leggi dell’algebra proposizionale. Facciamo quindi uso dell’equazione (4) per ricavare un’equazione per F . (4) (3.1) (d ∧ c ∧ b)|a = [(d ∧ c) ∧ b]|a = F [(d ∧ c)|(b ∧ a), c|(b ∧ a)], (3.1) (4) (d ∧ c)|(b ∧ a) = F [d|[c ∧ (b ∧ a)], c|(b ∧ a)] = F [d|(c ∧ b ∧ a), c|(b ∧ a)]. 33 CAPITOLO 3. PROBABILITÀ, FREQUENZA E RAGIONEVOLE ASPETTATIVA Quindi (d ∧ c ∧ b)|a = F [F (d|(c ∧ b ∧ a), c|(b ∧ a), b|a]. Inoltre (4) (3.1) (d ∧ c ∧ b)|a = [d ∧ (c ∧ b)]|a = F [d|[(c ∧ b) ∧ a], (c ∧ b)|a] (4), (3.1) = F [d|(c ∧ b ∧ a), F (c|(b ∧ a), b|a)]. Otteniamo dunque che F [F (d|(c ∧ b ∧ a), (c|(b ∧ a)), b|a] = F [d|(c ∧ b ∧ a), F (c|(b ∧ a), b|a)]. Con le sostituzioni d|(c ∧ b ∧ a) = x, c|(b ∧ a) = y e b|a = z otteniamo F [F (x, y), z] = F [x, F (y, z)] (3.2) per valori arbitrari di x, y, z. L’equazione (3.2) è soddisfatta se Cf [F (p, q)] = f (p)f (q) con f funzione arbitraria di una sola variabile e C costante arbitraria. Abbiamo allora Cf (c ∧ b)|a = f c|(b ∧ a) f (b|a). La scelta di f è puramente convenzionale, possiamo quindi scrivere, per semplicità C{(c ∧ b)|a} = {c|(b ∧ a)}{b|a} (3.3) Sia ora c = b e poiché dalla (3) b ∧ b = b, dividendo entrambi i membri per b|a otteniamo C = b|(b ∧ a). Dunque, quali che siano le ipotesi, la verosimiglianza ha valore costante. Infatti, la proposizione b sarà sicuramente vera se è vera b ∧ a. La costante C rappresenta, quindi, il valore dato alla certezza e, per far in modo di avvicinare quanto più possibile la verosimiglianza alla probabilità, le assegneremo il valore 1. A questo punto, possiamo riscrivere l’equazione (3.3) come (c ∧ b)|a = {c|(b ∧ a)}{b|a} (3.4) che ha la stessa forma dell’equazione che regola la probabilità di due eventi. Elevando ad m otteniamo {(c ∧ b)|a}m = {c|(b ∧ a)}m {b|a}m . 34 CAPITOLO 3. PROBABILITÀ, FREQUENZA E RAGIONEVOLE ASPETTATIVA La seconda assunzione che facciamo è che (v b)|a sia determinato da b|a e quindi (v b)|a = S(b|a). (3.5) Dalla (1) (vv b)|a = b|a, segue che S[S(b|a)] = b|a e quindi la funzione S è tale che S[S(x)] = x (3.6) dove x può assumere qualsiasi valore di verosimiglianza compreso tra la certezza e l’impossibilità. Considerando S[(c ∨ b)|a] possiamo ottenere un’altra equazione in S. (5) S[(c ∨ b)|a] = [v (c ∨ b)]|a = [(v c) ∧ (v b)]|a, (3.7) eliminiamo v c e v b in modo da ottenere un’equazione in a, b, c e S. Dunque (3.4) (3.5) [(v c) ∧ (v b)]|a = {(v c)|[(v b) ∧ a}{(v b)|a} = S(c|[(v b) ∧ a])S(b|a). Allora S [c ∨ b]|a = S c|[(v b) ∧ a] S(b|a) o anche S c|[(v b) ∧ a] = S [c ∨ b]|a /S(b|a). Per la (3.6) c|[(v b) ∧ a] = S S [c ∨ b]|a /S(b|a) . (3.8) Abbiamo dunque eliminato v c, provvediamo ora a fare lo stesso con v b: (3.4) c|[(v b) ∧ a] = {[c ∧ (v b)]|a}/[(v b)|a] (2) = {[(v b) ∧ c]|a}/[(v b)|a] (3.4) = {[(v b)|(c ∧ a)][c|a]}/[(v b)|a] (3.5) = {[S b|[c ∧ a] ][c|a]}/S(b|a). Sostituendo nella (3.8) otteniamo {[S(b|[c ∧ a])][c|a]}/S(b|a) = S[S((c ∨ b)|a)/S(b|a)] Allo scopo di avere a come ipotesi comune in tutte le verosimiglianze, osserviamo che (3.4) (2) b|(c ∧ a) = [(b ∧ c)|a]/[c|a] = [(c ∧ b)|a]/[c|a]; 35 CAPITOLO 3. PROBABILITÀ, FREQUENZA E RAGIONEVOLE ASPETTATIVA sostituendo nell’espressione precedente e moltiplicando per S(b|a) otteniamo S [[c ∧ b]|a]/[c|a] [c|a] = S S [c ∨ b]|a /S(b|a) S(b|a) (3.9) valida per significati arbitrari delle proposizioni a, b e c. Sia b = c ∧ d. Allora (60 ) c ∨ b = c ∨ (c ∧ d) = c e (4) (3) c ∧ b = c ∧ (c ∧ d) = (c ∧ c) ∧ d = c ∧ d. Sostituendo nella (3.9) otteniamo S [(c ∧ d)|a]/[c|a] (c|a) = S[S(c|a)/S(c ∧ d|a)]S(c ∧ d|a). Ponendo c|a = x e S(c ∧ d|a) = y e osservando che per la (3.6) (c ∧ d)|a = S[S(c ∧ d|a)] = S(y), possiamo riscrivere l’ultima equazione come xS[S(y)/x] = yS[S(x)/y]. (3.10) Se S è derivabile due volte S(p) = (1 − pm )1/m con m costante arbitraria. Otteniamo quindi per la (3.5) (b|a)m + (v b|a)m = 1. Ora, qualunque sia il valore di m, se b|a misura la credibilità di b data l’ipotesi a, lo stesso farà (b|a)m . Per semplicità poniamo m = 1. L’espressione precedente diventa (b|a) + (v b|a) = 1 (3.11) che ha la stessa forma dell’espressione che mette in relazione le probabilità di v b e b. Ponendo v b = a otteniamo (a|a) + (v a|a) = 1. Le due verosimiglianze sono adesso quelle di certezza e impossibilità. Avendo dato alla certezza il valore 1, l’impossibilità avrà valore zero. Ricaviamo ora altri due utili teoremi. (3.4) (c ∧ b)|a + (v c ∧ b)|a = [c|(b ∧ a) + (v c)|(b ∧ a)][b|a] 36 CAPITOLO 3. PROBABILITÀ, FREQUENZA E RAGIONEVOLE ASPETTATIVA Dalla (3.11) c|(b ∧ a) + (v c)|(b ∧ a) = 1 e quindi dalla (3.4) (c ∧ b)|a + [(v c) ∧ b]|a = b|a. (3.12) Per quanto riguarda il secondo teorema invece, consideriamo (50 ) (3.11) (3.12) (c∨b)|a = 1− v (c∨b)|a = 1−[(v c)∧(v b)]|a = 1−(v b)|a+[c∧(v b)]|a. Per la (3.11), 1 − (v b)|a = b|a, mentre (2) (3.12) (2) c ∧ (v b)|a = [(v b) ∧ c]|a = c|a − (b ∧ c)|a = c|a − (c ∧ b)|a. Vale quindi la relazione (c ∨ b)|a = c|a + b|a − (c ∧ b)|a (3.13) che ha la stessa forma di quella per la probabilità che tra due eventi se ne verifichi almeno uno. A questo punto, avendo mostrato che grazie alle convenzioni adottate la verosimiglianza è soggetta alle ordinarie leggi della probabilità, possiamo affermare che il simbolo b|a indica la probabilità della proposizione b data l’ipotesi a e non più una generica misura di credibilità ragionevole. Le relazioni ottenute, essendo relazioni tra probabilità, non assegnano valori numerici a probabilità specifiche di particolari problemi. Se però abbiamo n proposizioni delle quali, rispetto a un’ipotesi data, una e soltanto una può essere vera, e se l’ipotesi non dà ragioni per considerarne una più probabile piuttosto che un’altra, ognuna di esse avrà probabilità 1/n. 3.3 Probabilità e frequenza Vediamo ora che relazione c’è tra probabilità e frequenza di un evento. Supponiamo che due capsule contengano la stessa massa di radon, ma che dei due contenuti, uno sia stato prodotto da un recente decadimento di radio e l’altro sia stato estratto da un recipiente nel quale il radon è stato accumulato per molto tempo. Supponiamo che vi siano due contatori di ioni, ognuno dei quali riceve radiazioni da 37 CAPITOLO 3. PROBABILITÀ, FREQUENZA E RAGIONEVOLE ASPETTATIVA una capsula e che siano disposti nella stessa posizione rispetto alle rispettive capsule. Una delle due capsule emetterà per prima 1000 scariche nel suo contatore di ioni. Sia un fisico che una persona qualsiasi estranea all’ambiente, assegneranno la stessa probabilità di essere la prima a ognuna delle due capsule: il primo, perché sa che in questo caso l’età non incide, la seconda perché non sa quale delle due capsule contiene il radon più vecchio. Kemble chiama la prima probabilità oggettiva, la seconda primaria. Se si ripete l’esperimento più volte, una lunga serie di eventi in cui il campione più vecchio risulta essere il primo non cambierà le probabilità stimate dal fisico. La ragione per cui ha fatto la sua prima stima è cosı̀ forte che nessun ulteriore numero di esperimenti, non molto grande, può richiedere una nuova stima. Per scopi pratici le probabilità sono ritenute stabili. Una probabilità stabile è un limite che non è strettamente raggiungibile, ma che, in alcuni casi, può essere approssimato quanto necessario per usi pratici. Sia a un’ipotesi nella quale può essere esaminato un numero di esperimenti. Indichiamo con br il fatto che la proposizione b è vera nell’r-esima prova condotta sotto l’ipotesi a. A meno che l’ipotesi a stessa non assegni una probabilità stabile a b, bs |a, bs |(a ∧ br ) e bs |(a ∧ (v br )) saranno, in generale, diverse. Se invece includiamo nell’ipotesi una proposizione p che asserisce che la probabilità è stabile e uguale a un numero p compreso tra 0 e 1, risulterà che bs |(a ∧ p ∧ br ) = bs |(a ∧ p ∧ (v br )) = bs |(a ∧ p) = p. In più, dalle (3.4) e (3.11) otteniamo (bs ∧ br )|(a ∧ p) = p2 , (bs ∧ (v br ))|(a ∧ p) = p(1 − p), [(v bs ) ∧ (v br )]|(a ∧ p) = (1 − p)2 . Indichiamo con nN la proposizione asserente che il numero di volte in cui si verifica b in N casi di a è esattamente n. Dalle equazioni (3.4), (3.11) e (3.13) è possibile ricavare il noto risultato di Bernoulli nN |(a ∧ p) = N! pn (1 − p)N −n . n!(N − n)! Tale numero è massimo quando p = n/N ; tale massimo diviene più evidente al crescere di N. Ci si aspetta quindi, che la frequenza tenda, per N infinitamente grande, 38 CAPITOLO 3. PROBABILITÀ, FREQUENZA E RAGIONEVOLE ASPETTATIVA alla probabilità, nel caso in cui questa sia stabile. In alcuni casi capita di sapere che una data probabilità è stabile, ma di non conoscerne il valore. Schematizziamo il problema come segue. Supponiamo che in un ensemble di casi della proposizione a, un’altra proposizione b abbia una probabilità stabile incognita. Indichiamo con p la proposizione che afferma che la probabilità di b è stabile e pari a p, non inserendola però nell’ipotesi a, come nel caso precedente. La suddetta ipotesi contiene invece, una proposizione più debole che assegna alla proposizione p una probabilità per ogni valore di p. Supponiamo ancora che b sia risultata vera in n prove su N . Vogliamo calcolare la probabilità che b risulti vera nell’(N + 1)-esima prova. Dalle (3.4), (3.11) e (3.13) risulta P n+1 p (1 − p)N −n p|a bN +1 |(a ∧ nN ) = P n p (1 − p)N −n p|a dove le sommatorie sono intese su tutti i valori di p. Se siamo nel continuo e f (p)dp indica la probabilità di un valore tra p e p + dp l’equazione precedente diventa R1 pn+1 (1 − p)N −n f (p) dp . bN +1 |(a ∧ nN ) = R0 1 n (1 − p)N −n f (p) dp p 0 E’ stato assunto da Laplace che sia egualmente verosimile ogni valore compreso tra 0 e 1 di una probabilità incognita. Ciò implica che f (p) è una costante e dunque bN +1 |(a ∧ nN ) = n+1 . N +2 Per valori di n e N molto grandi bN +1 |(a ∧ nN ) = 39 n . N Riferimenti nella letteratura scientifica [1] A.M. Gleason, Measures on the closes subspaces of a Hilbert space, J. Math. Mech., Vol. n.6 (1957) 885. [2] G. Mackey, ‘ ‘Mathematical Foundation of Quantum Mechanics”, Addison Wesley, New York, 1963. [3] R. Cooke, M. Keane, W. Moran, An elementary proof of Gleason’s theorem, Math. Proc. Camb. Phil. Soc.,Vol. n. 98 (1985) 117. [4] J. von Neumann, “Mathematical Foundation of Quantum Mechanics”, Princeton University Press, Princeton, 1959. [5] R.T. Cox, Probability, Frequency and Reasonable Expectation, Am. J. Phys., Vol. n.14 (1946) 1. [6] J.M. Keynes, “A treatise on probability”, Macmillan, London, 1929. [7] G. Boole, “An investigation of the laws of thought”, Macmillan, London, 1854. 40