Propriet`a dell`equazione di Schrödinger

Chapter 4
Proprietà dell’equazione di
Schrödinger
Questo capitolo descrive proprietà fondamentali dell’equazione di Schrödingere
degli operatori associati a grandezze fisiche. Molti risultati sono ottenuti in
modo più formale nell’appendice A. Qui si usa invece il formalismo della funzione d’onda, più diffuso e probabilmente più semplice da capire.
4.1
Ortonormalità delle funzioni d’onda
Si dice che un insieme di funzioni d’onda complesse ψn (x) sono fra loro ortonormali se
Z
ψn∗ (x)ψm (x)dx = δnm
(4.1)
Nel caso n = m questo esprime semplicemente la normalizzazione a 1 di una
funzione d’onda, mentre nel caso m 6= n esprime una condizione di ortogonalità1
fra le due funzioni.
Dato l’operatore hamiltoniano
H=−
h̄2 ∂ 2
+ V (x),
2m ∂x2
(4.2)
le cui autofunzioni (funzioni d’onda soluzione dell’equazione di Schrödinger)
hanno un valore determinato (autovalore) En dell’energia:
(4.3)
Hψn (x) = En ψn (x),
vogliamo far vedere che le ψn (x) sono fra loro ortonormali, ossia soddisfano alla
(4.1).
Per dimostrarlo, si considerino le due equazioni
Hψm = Em ψm
H ∗ ψn∗ = En∗ ψn∗
(4.4)
La condizione di ortogonalità fra due vettori ordinari, ~a · ~b = i ai bi = 0 è analoga alla
(4.1) qualora si consideri l’integrale come una “somma su tutti gli x”, e che la coniugazione
complessa del primo termine è necessaria per far sı̀ che il prodotto scalare di un oggetto con
se stesso sia una misura della sua “norma”.
1
P
35
Si moltiplichi a sinistra la prima per ψn∗ e la seconda per ψm e si integri:
ψn∗ Hψm dx = EmR ψn∗ ψm dx
ψm H ∗ ψn∗ dx = En∗ ψm ψn∗ dx
R
R
R
(4.5)
Gli integrali nei membri a destra sono identici. Facciamo ora vedere che i
membri a sinistra devono essere uguali fra loro. Ciò corrisponde a dimostrare
l’hermiticità dell’operatore H, ovvero la seguente proprietà:
Z
ψn∗ Hψm dx =
∗
Z
∗
ψm
Hψn dx
.
(4.6)
L’identità è palese per quanto riguarda la parte di H relativa al potenziale,
perchè V (x) è un semplice fattore moltiplicativo reale. Concentriamoci allora
sul termine cinetico ed effettuiamo una integrazione per parti:
Z
x2
d2 ψm
∗ dψm −
dx
=
ψ
n
dx2
dx x1
Z
d2 ψn∗
dψn∗ x2
dx
=
ψ
ψm
−
m
dx2
dx x1
Z
ψn∗
dψn∗ dψm
dx
dx dx
(4.7)
dψm dψn∗
dx
dx dx
(4.8)
e analogamente
Z
Assumiamo che agli estremi di integrazione x1 e x2 la funzione d’onda e le
sue derivate sia nulla (se cosı̀ non fosse, si immagini di racchiudere l’intero
sistema, per quanto grande sia, in una scatola limitata da barriere infinite, e di
far corrispondere gli estremi di integrazione con queste barriere). Se i termini
integrati sono nulli, abbiamo trovato che
Z
d2 ψm
dx =
dx2
Z
ψn∗ Hψm dx =
Z
ψn∗
d2 ψn∗
dx
dx2
(4.9)
ψm H ∗ ψn∗ dx
(4.10)
ψm
e quindi che
Z
La (4.5) ci dà allora
(Em − En∗ )
Z
ψn∗ ψm dx = 0
(4.11)
Quando m = n, l’integrale è 1, e quindi deve essere
En∗ = En
(4.12)
ossia gli autovalori dell’energia sono senz’altro reali (da notare che tutte le
grandezze fisiche misurabili, in quanto reali, sono rappresentate da operatori
hermitiani). Supponiamo che sia m 6= n. Se anche Em 6= En , allora deve essere
Z
ψn∗ ψm dx = 0
(4.13)
ossia autofunzioni corrispondenti ad autovalori diversi sono sicuramente ortogonali fra loro. Può però anche accadere che sia m 6= n ma Em = En : è il caso
della degenerazione.
36
In questo caso la (4.13) potrebbe non essere soddisfatta, ma si possono
sempre scegliere le autofunzioni in modo che lo sia. Supponiamo ad esempio
che le prime p autofunzioni ψ1 , . . . , ψp appartengano allo stesso autovalore E e
siano linearmente indipendenti (ossia nessuna di esse può essere espressa come
combinazione lineare delle altre), ma non siano fra loro ortogonali. Ogni loro
combinazione lineare è quindi anch’essa una soluzione appartenente allo stesso
autovalore E. A partire dalle ψ1 , . . . , ψp possiamo allora costruire un nuovo
insieme di autofunzioni del tutto equivalente ψ̂1 , . . . , ψ̂p , in cui le autofunzioni
sono ortogonali fra loro. Si può ad esempio procedere in questo modo:
ψ̂1 (x) = ψ1 (x)
ψ̂2 (x) = a1 ψ̂1 (x) + a2 ψ2 (x)
ψ̂3 (x) = b1 ψ̂1 (x) + b2 ψ̂2 (x) + b3 ψ3 (x)
...
(4.14)
dove a1 e a2 sono determinati da
Z
0=
ψ̂1∗ ψ̂2 dx
Z
= a1
2
|ψ̂1 | dx + a2
Z
ψ̂1∗ ψ2 (x)dx
(4.15)
e dalla condizione di normalizzazione, e cosı̀ via (si tratta del metodo di ortonormalizzazione di Gram-Schmidt).
Possiamo perciò interpretare la (4.13) nel senso che se gli autovalori delle due
autofunzioni sono diversi esse devono essere ortogonali, mentre se sono uguali
esse possono essere scelte in modo da essere ortogonali.
4.2
Sviluppo di una soluzione generica
La linearità dell’equazione di Schrödinger ci assicura che, se ψn (x) sono le autofunzioni dell’equazione indipendente dal tempo, tutte le loro combinazioni
lineari
X
Ψ(x, t) =
cn ψn (x)e−iEn t/h̄
(4.16)
n
sono anche una soluzione. La (4.1) ci permette di dimostrare l’inverso, ossia che
una generica soluzione Ψ(x, t) della (2.8) può sempre essere sviluppata secondo
la (4.16) (proprità di completezza).
Per dimostrare ciò, consideriamo l’istante t = 0 e poniamo
Z
cm =
∗
ψm
(x)Ψ(x, 0)dx
(4.17)
e quindi consideriamo la funzione
X
cn ψn (x)
(4.18)
n
Questa funzione è una soluzione (in quanto combinazione lineare di soluzioni),
e all’istante t = 0 deve coincidere con Ψ(x, t). Infatti vale per ogni m l’identità
cm =
X
n
cn δmn =
X
Z
cn
∗
ψm
(x)ψn (x)dx
n
Z
=
"
∗
ψm
(x)
#
X
n
37
cn ψn (x) dx (4.19)
P
[si noti che abbiamo usato la (4.1)]. Questo è possibile solo se n cn ψn (x) coincide con Ψ(x, 0). Ma dato il valore di una funzione d’onda ad un certo istante,
la sua evoluzione è completamente determinata dall’equazione di Schrödinger
P
temporale, e quindi l’evoluzione di Ψ(x, 0) dovrà essere la stessa di n cn ψn (x),
cioè quella indicata dalla (4.16).
4.3
Valori medi
Uno dei postulati della meccanica quantistica è che il valore medio di una qualsiasi grandezza fisica funzione delle coordinate generalizzate qi e dei corrispondenti momenti generalizzati (quantità di moto) pi , F (q, p), si ottiene costruendo
un operatore differenziale dove ad ogni pi nell’espressione classica si sostituisce
−ih̄∂/∂qi . Il valore medio di questa grandezza su uno stato descritto dalla
funzione d’onda Ψ(q, t) sarà allora dato da
hF i =
Z
Ψ∗ F Ψdq
(4.20)
dove F (un operatore hermitiano) agisce sulla funzione che sta alla sua destra,
e l’integrazione è effettuata su tutte le coordinate del sistema.
Se F è solo funzione delle
coordinate, questa regola non è sorprendente: ci
R
dice che il valore medio è F (q)|Ψ|2 dq, ossia una normale media pesata sulla
densità di probabilità. La situazione più interessante riguarda le dipendenze
dalle quantità di moto. Consideriamo ad esempio l’energia cinetica T per una
particella in tre dimensioni: T (p) = p2 /2m. Applicando la regola, otteniamo
hT i = −
h̄2
2m
dove
∇2 =
Z
Ψ∗ ∇2 Ψ dx dy dz
∂2
∂2
∂2
+ 2+ 2
2
∂x
∂y
∂z
(4.21)
(4.22)
Nel caso di una particella libera, l’energia cinetica è l’intero hamiltoniano e
quindi l’equazione di Schrödinger è
−
∂Ψ
h̄2 2
∇ Ψ(r, t) = ih̄
2m
∂t
(4.23)
con soluzione (a meno di un fattore di normalizzazione)
Ψ(r, t) = ei(k·r−Et/h̄)
(4.24)
dove E è una costante, e k un vettore costante legato ad E da
h̄2 k 2
=E
2m
(4.25)
La (4.24) rappresenta un’onda piana che si propaga lungo la direzione del vettore
d’onda k, con lunghezza d’onda λ = 2π/k e frequenza ω = E/h̄.
38
Applichiamo a questo caso il metodo per trovare la quantità di moto dell’onda,
ad esempio lungo la direzione x:
hpx i = −ih̄
Z
Ψ∗ (r, t)
∂
Ψ(r, t) dx dy dz = h̄kx
∂x
(4.26)
In realtà una soluzione del genere ha un valore ben definito, ossia è una autofunzione, dell’operatore quantità di moto. Il punto fondamentale è che mentre l’informazione relativa alle coordinate si trova nelle ampiezze delle funzioni
d’onda, l’informazione relativa alla quantità di moto si trova nelle fasi. Gli
operatori differenziali in pratica accedono alla fase.
4.4
La formulazione matriciale
Abbiamo visto che ogni soluzione dell’equazione di Schrödinger può essere
espressa nella forma (4.16). Note le autofunzioni dell’hamiltoniano, una funzione d’onda è pertanto caratterizzata dai coefficienti (complessi)
c0 , c1 , c2 , . . .
(4.27)
Possiamo pensare a questi numeri come alle componenti di un vettore in uno
spazio dove ogni asse rappresenta una autofunzione dell’energia.
Poichè la Ψ deve essere normalizzata, occorre che sia
X
|cn |2 = 1
(4.28)
n
Qual è l’energia media di Ψ? Utilizzando la (4.20) per l’operatore H, tenendo
conto di (4.3) e (4.1), si trova
hEi =
X
|cn |2 En
(4.29)
n
Questo va interpretato nel senso che una misura dell’energia della funzione darà
sempre come risultato uno degli autovalori En , e a ciascuno di essi è associata
una probabilità |cn |2 .
Supponiamo ora invece di voler calcolare il valor medio associato ad un
generico operatore F :
hF i =
=
=
Z
Ψ∗ (x, t)F Ψ(x, t)dx
Z X
c∗n ψn∗ (x)eiEn t/h̄ F
(4.30)
X
cm ψm (x)e−iEm t/h̄ dx
n
m
X
∗
i(En −Em )t/h̄
cn cm Fnm e
nm
dove si è definito
Fnm ≡
Z
ψn∗ (x)F ψm (x)dx
(4.31)
(4.32)
(4.33)
Questa quantità è detta elemento di matrice dell’operatore F fra le autofunzioni
ψn e ψm . Cosı̀, in questa formulazione (sviluppata da Heisenberg prima della
39
scoperta della meccanica ondulatoria) gli stati sono rappresentati da vettori, e
gli operatori da matrici. In un’altra notazione—sviluppata da Dirac—questo
elemento di matrice è indicato con
< n|F |m >
(4.34)
dove |m > rappresenta un autostato (generalizzazione del concetto di autofunzione) dell’hamiltoniano.
La (4.32) ci dice che un valor medio, in generale, dipende dal tempo. Vediamo anche che se Fnm fosse una matrice diagonale il valor medio sarebbe
una costante, in quanto non vi sarebbe più alcun fattore di fase oscillante con
coefficiente non nullo.
I fattori di fase oscillanti con frequenza (En − Em )/h̄ danno dei termini
che sono legati a transizioni del sistema da uno stato ad un altro. Termini di
questo tipo si trovano ad esempio quando si studiano i processi di emissione o
assorbimento di radiazione elettromagnetica (fotoni) È da notare che—grazie
alla doppia sommatoria su m e su n—tutti i termini sono in realtà reali in
quanto per ogni termine viene sommato anche il suo complesso coniugato, corrispondente allo scambio di indici. Questo consente di continuare a interpretare
i coefficienti che moltiplicano gli Fnm come delle probabilità.
Un operatore F può essere applicato ad una funzione. In questa rappresentazione matriciale, questa operazione corrisponde ad applicare una matrice a
P
un vettore, ottenendo un altro vettore. Infatti, se ψ = n cn ψn (e ricordando
la regola (4.17) per ottenere le “componenti del vettore”):
Z
(F ψ)m =
Z
=
∗
ψm
F ψdx
(4.35)
∗
ψm
F
cn ψn dx
(4.36)
∗
ψm
F ψn dx
(4.37)
X
n
=
X
Z
cn
n
=
X
Fmn cn
(4.38)
n
che è la consueta regola dell’algebra lineare.
Notiamo anche che si può sviluppare
F ψm =
X
a` ψ`
(4.39)
`
dove i coefficienti sono ottenuti con la consueta regola:
Z
a` =
ψ`∗ (F ψm )dx = F`m
(4.40)
e quindi
F ψm =
X
`
40
F`m ψ`
(4.41)
Possiamo infine applicare due operatori F e G in sequenza, e mostrare
come nella rappresentazione matriciale questa operazione corrisponda ad effettuare un prodotto tra le due matrici corrispondenti secondo le consuete regole
dell’algebra lineare. Infatti, usando la (4.41) due volte:
Z
ψn∗ (x)F Gψm (x)dx
(F G)nm =
=
XZ
ψn∗ (x)F G`m ψ` (x)dx
(4.42)
(4.43)
`
=
X
=
X
Z
G`m
ψn∗ (x)F ψ` (x)dx
(4.44)
ψn∗ (x)Fk` ψk (x)dx
(4.45)
`
Z
G`m
k`
=
X
Fk` G`m δkn
(4.46)
Fn` G`m
(4.47)
k`
=
X
`
che è appunto l’ordinaria regola per il prodotto di matrici.
4.5
Regole di commutazione
Il valore medio del prodotto di operatori dipende dall’ordine in cui gli operatori
vengono applicati. Prendiamo ad esempio una coordinata x e la quantità di
moto ad essa coniugata p, e calcoliamo il valor medio del prodotto px nella
rappresentazione delle coordinate:
∂
hpxi =
Ψ −ih̄ (xΨ) dx
∂x
Z
∂Ψ
∗
= −ih̄ Ψ Ψ + x
dx
∂x
= −ih̄ + hxpi
Z
∗
(4.48)
(4.49)
(4.50)
ovvero
hxp − pxi = h[x, p]i = ih̄
(4.51)
dove con la notazione [A, B] indichiamo l’operatore AB − BA che chiameremo
commutatore tra A e B. Diremo che A e B commutano quando il loro commutatore è nullo, ossia quando è indifferente l’ordine con cui sono applicati su uno
stato. Come abbiamo appena visto questo non è sempre vero.
Il risultato (4.51) non dipende dallo stato, ed è quindi una identità a livello
di operatore:
(4.52)
[x, px ] = ih̄
(dove si è aggiunto l’indice x in px per sottolineare che si tratta della quantità
di moto coniugata a x). Si può far vedere che le variabili come x e px che non
commutano sono quelle non misurabili simultaneamente. Invece,
[x, y] = 0
41
(4.53)
(non vi sono vincoli alla determinazione simultanea di diverse coordinate di
posizione),
[px , py ] = 0
(4.54)
(lo stesso per le quantità di moto), e
[x, py ] = 0
(4.55)
(lo stesso per la coordinata in una direzione e la quantità di moto in un’altra).
In generale, date due quantità osservabili A e B rappresentate in meccanica
quantistica da operatori, |h[A, B]i|/2 rappresenta il limite inferiore al prodotto
∆A∆B, dove ∆A e ∆B sono gli scarti quadratici medi di misure effettuate
simultaneamente su queste due variabili. Si tratta di una versione più generale
del principio di indeterminazione. Se A e B non commutano, è impossibile
determinarle entrambe simultaneamente con precisione assoluta.
D’altra parte, si può vedere che se Φ è un’autofunzione comune di A e B:
AΦ = aΦ
,
BΦ = bΦ
(4.56)
(dove a e b sono gli autovalori, ossia dei semplici numeri) allora
ABΦ = AbΦ = bAΦ = baΦ
(4.57)
BAΦ = BaΦ = aBΦ = abΦ
(4.58)
e
sono uguali, ossia [A, B]Φ = 0. Se questo è vero per un insieme completo di
autofunzioni (ad esempio, per tutte le autofunzioni dell’energia ψn ), allora ne
segue necessariamente [A, B] = 0. Si può dimostrare che è vero anche l’inverso:
se A e B commutano, allora hanno un insieme completo di autofunzioni in
comune.
4.6
Quantità conservate
Vogliamo ora dimostrare che dato un operatore F , e definito l’operatore dF/dt
in modo tale che per ogni stato dipendente dal tempo Ψ si abbia
dF
dt
=
d
hF i
dt
(4.59)
ossia il valor medio di dF/dt sullo stato sia pari alla derivata temporale del
valor medio di F sullo stesso stato, allora vale la importante relazione
dF
= [F, H]
(4.60)
dt
Questa relazione ci permette di identificare facilmente le quantità conservate,
che cioè non variano nel tempo: sono quelle che commutano con l’hamiltoniano.
Per dimostrarlo, consideriamo la (4.32) per il valor medio di F su uno stato
Ψ sviluppato come somma di autofunzioni dell’energia, e deriviamola rispetto
al tempo, ottenendo cosı̀
ih̄
dF
dt
=
X
d
i
hF i =
c∗n cm (En − Em )Fnm ei(En −Em )t/h̄
dt
h̄
nm
42
(4.61)
Questo ci consente di identificare gli elementi di matrice dell’operatore dF/dt:
dF
dt
=
nm
i
(En − Em )Fnm
h̄
(4.62)
(questo fa sı̀ che la (4.32) valga anche per questo operatore, come deve essere!).
Costruiamo ora invece l’elemento di matrice dell’operatore [F, H]:
[F, H]nm = (F H − HF )nm
Z
=
Z
=
ψn∗ F Hψm dx −
(4.63)
Z
ψn∗ F Em ψm dx −
ψn∗ HF ψm dx
(4.64)
!
Z
ψn∗ H
X
F`m ψ` dx
(4.65)
`
Z
= Em
ψn∗ F ψm dx −
X
Z
F`m
ψn∗ E` ψ` dx
(4.66)
`
= Em Fnm −
X
F`m E` δn`
(4.67)
`
= (Em − En )Fnm
(4.68)
Confrontando la (4.62) con la (4.68) vediamo che
ih̄
dF
dt
= [F, H]nm
(4.69)
nm
Ma se questo vale per tutti gli elementi di matrice, l’uguaglianza deve avvenire
a livello di operatore, ossia la (4.60) deve essere vera.
Siamo ora in posizione di comprendere cosa dobbiamo fare per classificare
in un modo utile gli stati di un sistema quantistico.
• La prima cosa da fare è cercare gli autovalori En dell’hamiltoniana H.
Questo ci fornisce dei numeri quantici n utili ai fini della classificazione.
Sappiamo che le autofunzioni di H corrispondono a sono stazionari [vedere
(2.13)], quindi questi numeri quantici non variano nel tempo: sono buoni
numeri quantici.
• Possono però esserci delle degenerazioni: ad un certo En possono corrispondere diversi stati. Questi stati differiranno per altri numeri quantici,
che vorrei saper determinare.
• Devo allora cercare un altro operatore A che commuti con H: [A, H] = 0.
Questo garantisce che i suoi autovalori siano costanti nel tempo; e anche
che siano determinabili con esattezza e simultaneamente agli autovalori
di H.
• Un solo operatore addizionale potrebbe non bastare a classificare gli stati.
Cercherò allora un altro operatore B, che deve soddisfare anch’esso a
[B, H] = 0. Ma non basta! Occorre anche che sia [A, B] = 0. Se cosı̀ non
fosse, non potrei determinare simultaneamente gli autovalori di A e di B,
e quindi un tale schema sarebbe inutile ai fini della classificazione.
43
• Ripeto il procedimento finchè sono riuscito a classificare tutti gli stati, e
non esistono altri operatori che commutino con H e tutti gli altri.
• Ho allora costruito un insieme di osservabili che determina univocamente
lo stato del sistema.
Nel caso dell’atomo di idrogeno, come si vedrà, si utilizzano quattro operatori: H, L2 , Lz e Sz , discussi in seguito.
44