Chapter 4 Proprietà dell’equazione di Schrödinger Questo capitolo descrive proprietà fondamentali dell’equazione di Schrödingere degli operatori associati a grandezze fisiche. Molti risultati sono ottenuti in modo più formale nell’appendice A. Qui si usa invece il formalismo della funzione d’onda, più diffuso e probabilmente più semplice da capire. 4.1 Ortonormalità delle funzioni d’onda Si dice che un insieme di funzioni d’onda complesse ψn (x) sono fra loro ortonormali se Z ψn∗ (x)ψm (x)dx = δnm (4.1) Nel caso n = m questo esprime semplicemente la normalizzazione a 1 di una funzione d’onda, mentre nel caso m 6= n esprime una condizione di ortogonalità1 fra le due funzioni. Dato l’operatore hamiltoniano H=− h̄2 ∂ 2 + V (x), 2m ∂x2 (4.2) le cui autofunzioni (funzioni d’onda soluzione dell’equazione di Schrödinger) hanno un valore determinato (autovalore) En dell’energia: (4.3) Hψn (x) = En ψn (x), vogliamo far vedere che le ψn (x) sono fra loro ortonormali, ossia soddisfano alla (4.1). Per dimostrarlo, si considerino le due equazioni Hψm = Em ψm H ∗ ψn∗ = En∗ ψn∗ (4.4) La condizione di ortogonalità fra due vettori ordinari, ~a · ~b = i ai bi = 0 è analoga alla (4.1) qualora si consideri l’integrale come una “somma su tutti gli x”, e che la coniugazione complessa del primo termine è necessaria per far sı̀ che il prodotto scalare di un oggetto con se stesso sia una misura della sua “norma”. 1 P 35 Si moltiplichi a sinistra la prima per ψn∗ e la seconda per ψm e si integri: ψn∗ Hψm dx = EmR ψn∗ ψm dx ψm H ∗ ψn∗ dx = En∗ ψm ψn∗ dx R R R (4.5) Gli integrali nei membri a destra sono identici. Facciamo ora vedere che i membri a sinistra devono essere uguali fra loro. Ciò corrisponde a dimostrare l’hermiticità dell’operatore H, ovvero la seguente proprietà: Z ψn∗ Hψm dx = ∗ Z ∗ ψm Hψn dx . (4.6) L’identità è palese per quanto riguarda la parte di H relativa al potenziale, perchè V (x) è un semplice fattore moltiplicativo reale. Concentriamoci allora sul termine cinetico ed effettuiamo una integrazione per parti: Z x2 d2 ψm ∗ dψm − dx = ψ n dx2 dx x1 Z d2 ψn∗ dψn∗ x2 dx = ψ ψm − m dx2 dx x1 Z ψn∗ dψn∗ dψm dx dx dx (4.7) dψm dψn∗ dx dx dx (4.8) e analogamente Z Assumiamo che agli estremi di integrazione x1 e x2 la funzione d’onda e le sue derivate sia nulla (se cosı̀ non fosse, si immagini di racchiudere l’intero sistema, per quanto grande sia, in una scatola limitata da barriere infinite, e di far corrispondere gli estremi di integrazione con queste barriere). Se i termini integrati sono nulli, abbiamo trovato che Z d2 ψm dx = dx2 Z ψn∗ Hψm dx = Z ψn∗ d2 ψn∗ dx dx2 (4.9) ψm H ∗ ψn∗ dx (4.10) ψm e quindi che Z La (4.5) ci dà allora (Em − En∗ ) Z ψn∗ ψm dx = 0 (4.11) Quando m = n, l’integrale è 1, e quindi deve essere En∗ = En (4.12) ossia gli autovalori dell’energia sono senz’altro reali (da notare che tutte le grandezze fisiche misurabili, in quanto reali, sono rappresentate da operatori hermitiani). Supponiamo che sia m 6= n. Se anche Em 6= En , allora deve essere Z ψn∗ ψm dx = 0 (4.13) ossia autofunzioni corrispondenti ad autovalori diversi sono sicuramente ortogonali fra loro. Può però anche accadere che sia m 6= n ma Em = En : è il caso della degenerazione. 36 In questo caso la (4.13) potrebbe non essere soddisfatta, ma si possono sempre scegliere le autofunzioni in modo che lo sia. Supponiamo ad esempio che le prime p autofunzioni ψ1 , . . . , ψp appartengano allo stesso autovalore E e siano linearmente indipendenti (ossia nessuna di esse può essere espressa come combinazione lineare delle altre), ma non siano fra loro ortogonali. Ogni loro combinazione lineare è quindi anch’essa una soluzione appartenente allo stesso autovalore E. A partire dalle ψ1 , . . . , ψp possiamo allora costruire un nuovo insieme di autofunzioni del tutto equivalente ψ̂1 , . . . , ψ̂p , in cui le autofunzioni sono ortogonali fra loro. Si può ad esempio procedere in questo modo: ψ̂1 (x) = ψ1 (x) ψ̂2 (x) = a1 ψ̂1 (x) + a2 ψ2 (x) ψ̂3 (x) = b1 ψ̂1 (x) + b2 ψ̂2 (x) + b3 ψ3 (x) ... (4.14) dove a1 e a2 sono determinati da Z 0= ψ̂1∗ ψ̂2 dx Z = a1 2 |ψ̂1 | dx + a2 Z ψ̂1∗ ψ2 (x)dx (4.15) e dalla condizione di normalizzazione, e cosı̀ via (si tratta del metodo di ortonormalizzazione di Gram-Schmidt). Possiamo perciò interpretare la (4.13) nel senso che se gli autovalori delle due autofunzioni sono diversi esse devono essere ortogonali, mentre se sono uguali esse possono essere scelte in modo da essere ortogonali. 4.2 Sviluppo di una soluzione generica La linearità dell’equazione di Schrödinger ci assicura che, se ψn (x) sono le autofunzioni dell’equazione indipendente dal tempo, tutte le loro combinazioni lineari X Ψ(x, t) = cn ψn (x)e−iEn t/h̄ (4.16) n sono anche una soluzione. La (4.1) ci permette di dimostrare l’inverso, ossia che una generica soluzione Ψ(x, t) della (2.8) può sempre essere sviluppata secondo la (4.16) (proprità di completezza). Per dimostrare ciò, consideriamo l’istante t = 0 e poniamo Z cm = ∗ ψm (x)Ψ(x, 0)dx (4.17) e quindi consideriamo la funzione X cn ψn (x) (4.18) n Questa funzione è una soluzione (in quanto combinazione lineare di soluzioni), e all’istante t = 0 deve coincidere con Ψ(x, t). Infatti vale per ogni m l’identità cm = X n cn δmn = X Z cn ∗ ψm (x)ψn (x)dx n Z = " ∗ ψm (x) # X n 37 cn ψn (x) dx (4.19) P [si noti che abbiamo usato la (4.1)]. Questo è possibile solo se n cn ψn (x) coincide con Ψ(x, 0). Ma dato il valore di una funzione d’onda ad un certo istante, la sua evoluzione è completamente determinata dall’equazione di Schrödinger P temporale, e quindi l’evoluzione di Ψ(x, 0) dovrà essere la stessa di n cn ψn (x), cioè quella indicata dalla (4.16). 4.3 Valori medi Uno dei postulati della meccanica quantistica è che il valore medio di una qualsiasi grandezza fisica funzione delle coordinate generalizzate qi e dei corrispondenti momenti generalizzati (quantità di moto) pi , F (q, p), si ottiene costruendo un operatore differenziale dove ad ogni pi nell’espressione classica si sostituisce −ih̄∂/∂qi . Il valore medio di questa grandezza su uno stato descritto dalla funzione d’onda Ψ(q, t) sarà allora dato da hF i = Z Ψ∗ F Ψdq (4.20) dove F (un operatore hermitiano) agisce sulla funzione che sta alla sua destra, e l’integrazione è effettuata su tutte le coordinate del sistema. Se F è solo funzione delle coordinate, questa regola non è sorprendente: ci R dice che il valore medio è F (q)|Ψ|2 dq, ossia una normale media pesata sulla densità di probabilità. La situazione più interessante riguarda le dipendenze dalle quantità di moto. Consideriamo ad esempio l’energia cinetica T per una particella in tre dimensioni: T (p) = p2 /2m. Applicando la regola, otteniamo hT i = − h̄2 2m dove ∇2 = Z Ψ∗ ∇2 Ψ dx dy dz ∂2 ∂2 ∂2 + 2+ 2 2 ∂x ∂y ∂z (4.21) (4.22) Nel caso di una particella libera, l’energia cinetica è l’intero hamiltoniano e quindi l’equazione di Schrödinger è − ∂Ψ h̄2 2 ∇ Ψ(r, t) = ih̄ 2m ∂t (4.23) con soluzione (a meno di un fattore di normalizzazione) Ψ(r, t) = ei(k·r−Et/h̄) (4.24) dove E è una costante, e k un vettore costante legato ad E da h̄2 k 2 =E 2m (4.25) La (4.24) rappresenta un’onda piana che si propaga lungo la direzione del vettore d’onda k, con lunghezza d’onda λ = 2π/k e frequenza ω = E/h̄. 38 Applichiamo a questo caso il metodo per trovare la quantità di moto dell’onda, ad esempio lungo la direzione x: hpx i = −ih̄ Z Ψ∗ (r, t) ∂ Ψ(r, t) dx dy dz = h̄kx ∂x (4.26) In realtà una soluzione del genere ha un valore ben definito, ossia è una autofunzione, dell’operatore quantità di moto. Il punto fondamentale è che mentre l’informazione relativa alle coordinate si trova nelle ampiezze delle funzioni d’onda, l’informazione relativa alla quantità di moto si trova nelle fasi. Gli operatori differenziali in pratica accedono alla fase. 4.4 La formulazione matriciale Abbiamo visto che ogni soluzione dell’equazione di Schrödinger può essere espressa nella forma (4.16). Note le autofunzioni dell’hamiltoniano, una funzione d’onda è pertanto caratterizzata dai coefficienti (complessi) c0 , c1 , c2 , . . . (4.27) Possiamo pensare a questi numeri come alle componenti di un vettore in uno spazio dove ogni asse rappresenta una autofunzione dell’energia. Poichè la Ψ deve essere normalizzata, occorre che sia X |cn |2 = 1 (4.28) n Qual è l’energia media di Ψ? Utilizzando la (4.20) per l’operatore H, tenendo conto di (4.3) e (4.1), si trova hEi = X |cn |2 En (4.29) n Questo va interpretato nel senso che una misura dell’energia della funzione darà sempre come risultato uno degli autovalori En , e a ciascuno di essi è associata una probabilità |cn |2 . Supponiamo ora invece di voler calcolare il valor medio associato ad un generico operatore F : hF i = = = Z Ψ∗ (x, t)F Ψ(x, t)dx Z X c∗n ψn∗ (x)eiEn t/h̄ F (4.30) X cm ψm (x)e−iEm t/h̄ dx n m X ∗ i(En −Em )t/h̄ cn cm Fnm e nm dove si è definito Fnm ≡ Z ψn∗ (x)F ψm (x)dx (4.31) (4.32) (4.33) Questa quantità è detta elemento di matrice dell’operatore F fra le autofunzioni ψn e ψm . Cosı̀, in questa formulazione (sviluppata da Heisenberg prima della 39 scoperta della meccanica ondulatoria) gli stati sono rappresentati da vettori, e gli operatori da matrici. In un’altra notazione—sviluppata da Dirac—questo elemento di matrice è indicato con < n|F |m > (4.34) dove |m > rappresenta un autostato (generalizzazione del concetto di autofunzione) dell’hamiltoniano. La (4.32) ci dice che un valor medio, in generale, dipende dal tempo. Vediamo anche che se Fnm fosse una matrice diagonale il valor medio sarebbe una costante, in quanto non vi sarebbe più alcun fattore di fase oscillante con coefficiente non nullo. I fattori di fase oscillanti con frequenza (En − Em )/h̄ danno dei termini che sono legati a transizioni del sistema da uno stato ad un altro. Termini di questo tipo si trovano ad esempio quando si studiano i processi di emissione o assorbimento di radiazione elettromagnetica (fotoni) È da notare che—grazie alla doppia sommatoria su m e su n—tutti i termini sono in realtà reali in quanto per ogni termine viene sommato anche il suo complesso coniugato, corrispondente allo scambio di indici. Questo consente di continuare a interpretare i coefficienti che moltiplicano gli Fnm come delle probabilità. Un operatore F può essere applicato ad una funzione. In questa rappresentazione matriciale, questa operazione corrisponde ad applicare una matrice a P un vettore, ottenendo un altro vettore. Infatti, se ψ = n cn ψn (e ricordando la regola (4.17) per ottenere le “componenti del vettore”): Z (F ψ)m = Z = ∗ ψm F ψdx (4.35) ∗ ψm F cn ψn dx (4.36) ∗ ψm F ψn dx (4.37) X n = X Z cn n = X Fmn cn (4.38) n che è la consueta regola dell’algebra lineare. Notiamo anche che si può sviluppare F ψm = X a` ψ` (4.39) ` dove i coefficienti sono ottenuti con la consueta regola: Z a` = ψ`∗ (F ψm )dx = F`m (4.40) e quindi F ψm = X ` 40 F`m ψ` (4.41) Possiamo infine applicare due operatori F e G in sequenza, e mostrare come nella rappresentazione matriciale questa operazione corrisponda ad effettuare un prodotto tra le due matrici corrispondenti secondo le consuete regole dell’algebra lineare. Infatti, usando la (4.41) due volte: Z ψn∗ (x)F Gψm (x)dx (F G)nm = = XZ ψn∗ (x)F G`m ψ` (x)dx (4.42) (4.43) ` = X = X Z G`m ψn∗ (x)F ψ` (x)dx (4.44) ψn∗ (x)Fk` ψk (x)dx (4.45) ` Z G`m k` = X Fk` G`m δkn (4.46) Fn` G`m (4.47) k` = X ` che è appunto l’ordinaria regola per il prodotto di matrici. 4.5 Regole di commutazione Il valore medio del prodotto di operatori dipende dall’ordine in cui gli operatori vengono applicati. Prendiamo ad esempio una coordinata x e la quantità di moto ad essa coniugata p, e calcoliamo il valor medio del prodotto px nella rappresentazione delle coordinate: ∂ hpxi = Ψ −ih̄ (xΨ) dx ∂x Z ∂Ψ ∗ = −ih̄ Ψ Ψ + x dx ∂x = −ih̄ + hxpi Z ∗ (4.48) (4.49) (4.50) ovvero hxp − pxi = h[x, p]i = ih̄ (4.51) dove con la notazione [A, B] indichiamo l’operatore AB − BA che chiameremo commutatore tra A e B. Diremo che A e B commutano quando il loro commutatore è nullo, ossia quando è indifferente l’ordine con cui sono applicati su uno stato. Come abbiamo appena visto questo non è sempre vero. Il risultato (4.51) non dipende dallo stato, ed è quindi una identità a livello di operatore: (4.52) [x, px ] = ih̄ (dove si è aggiunto l’indice x in px per sottolineare che si tratta della quantità di moto coniugata a x). Si può far vedere che le variabili come x e px che non commutano sono quelle non misurabili simultaneamente. Invece, [x, y] = 0 41 (4.53) (non vi sono vincoli alla determinazione simultanea di diverse coordinate di posizione), [px , py ] = 0 (4.54) (lo stesso per le quantità di moto), e [x, py ] = 0 (4.55) (lo stesso per la coordinata in una direzione e la quantità di moto in un’altra). In generale, date due quantità osservabili A e B rappresentate in meccanica quantistica da operatori, |h[A, B]i|/2 rappresenta il limite inferiore al prodotto ∆A∆B, dove ∆A e ∆B sono gli scarti quadratici medi di misure effettuate simultaneamente su queste due variabili. Si tratta di una versione più generale del principio di indeterminazione. Se A e B non commutano, è impossibile determinarle entrambe simultaneamente con precisione assoluta. D’altra parte, si può vedere che se Φ è un’autofunzione comune di A e B: AΦ = aΦ , BΦ = bΦ (4.56) (dove a e b sono gli autovalori, ossia dei semplici numeri) allora ABΦ = AbΦ = bAΦ = baΦ (4.57) BAΦ = BaΦ = aBΦ = abΦ (4.58) e sono uguali, ossia [A, B]Φ = 0. Se questo è vero per un insieme completo di autofunzioni (ad esempio, per tutte le autofunzioni dell’energia ψn ), allora ne segue necessariamente [A, B] = 0. Si può dimostrare che è vero anche l’inverso: se A e B commutano, allora hanno un insieme completo di autofunzioni in comune. 4.6 Quantità conservate Vogliamo ora dimostrare che dato un operatore F , e definito l’operatore dF/dt in modo tale che per ogni stato dipendente dal tempo Ψ si abbia dF dt = d hF i dt (4.59) ossia il valor medio di dF/dt sullo stato sia pari alla derivata temporale del valor medio di F sullo stesso stato, allora vale la importante relazione dF = [F, H] (4.60) dt Questa relazione ci permette di identificare facilmente le quantità conservate, che cioè non variano nel tempo: sono quelle che commutano con l’hamiltoniano. Per dimostrarlo, consideriamo la (4.32) per il valor medio di F su uno stato Ψ sviluppato come somma di autofunzioni dell’energia, e deriviamola rispetto al tempo, ottenendo cosı̀ ih̄ dF dt = X d i hF i = c∗n cm (En − Em )Fnm ei(En −Em )t/h̄ dt h̄ nm 42 (4.61) Questo ci consente di identificare gli elementi di matrice dell’operatore dF/dt: dF dt = nm i (En − Em )Fnm h̄ (4.62) (questo fa sı̀ che la (4.32) valga anche per questo operatore, come deve essere!). Costruiamo ora invece l’elemento di matrice dell’operatore [F, H]: [F, H]nm = (F H − HF )nm Z = Z = ψn∗ F Hψm dx − (4.63) Z ψn∗ F Em ψm dx − ψn∗ HF ψm dx (4.64) ! Z ψn∗ H X F`m ψ` dx (4.65) ` Z = Em ψn∗ F ψm dx − X Z F`m ψn∗ E` ψ` dx (4.66) ` = Em Fnm − X F`m E` δn` (4.67) ` = (Em − En )Fnm (4.68) Confrontando la (4.62) con la (4.68) vediamo che ih̄ dF dt = [F, H]nm (4.69) nm Ma se questo vale per tutti gli elementi di matrice, l’uguaglianza deve avvenire a livello di operatore, ossia la (4.60) deve essere vera. Siamo ora in posizione di comprendere cosa dobbiamo fare per classificare in un modo utile gli stati di un sistema quantistico. • La prima cosa da fare è cercare gli autovalori En dell’hamiltoniana H. Questo ci fornisce dei numeri quantici n utili ai fini della classificazione. Sappiamo che le autofunzioni di H corrispondono a sono stazionari [vedere (2.13)], quindi questi numeri quantici non variano nel tempo: sono buoni numeri quantici. • Possono però esserci delle degenerazioni: ad un certo En possono corrispondere diversi stati. Questi stati differiranno per altri numeri quantici, che vorrei saper determinare. • Devo allora cercare un altro operatore A che commuti con H: [A, H] = 0. Questo garantisce che i suoi autovalori siano costanti nel tempo; e anche che siano determinabili con esattezza e simultaneamente agli autovalori di H. • Un solo operatore addizionale potrebbe non bastare a classificare gli stati. Cercherò allora un altro operatore B, che deve soddisfare anch’esso a [B, H] = 0. Ma non basta! Occorre anche che sia [A, B] = 0. Se cosı̀ non fosse, non potrei determinare simultaneamente gli autovalori di A e di B, e quindi un tale schema sarebbe inutile ai fini della classificazione. 43 • Ripeto il procedimento finchè sono riuscito a classificare tutti gli stati, e non esistono altri operatori che commutino con H e tutti gli altri. • Ho allora costruito un insieme di osservabili che determina univocamente lo stato del sistema. Nel caso dell’atomo di idrogeno, come si vedrà, si utilizzano quattro operatori: H, L2 , Lz e Sz , discussi in seguito. 44