M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI 1 Appunti sulla relazione di dispersione E(k) nei cristalli M. Rudan I. L A L quindi FUNZIONE LAGRANGIANA A legge del moto di un punto materiale di massa m si scrive F = ma , (1) in cui le componenti dell’accelerazione a saranno indicate nel seguito con ẍi (t), i = 1, 2, 3. La forza F dipende, nel caso più generale, dalle componenti xi (t) della posizione r del punto materiale, dalle componenti ẋi (t) della velocità u = ṙ di esso, e dal tempo t. Di conseguenza, le tre componenti scalari della legge del moto (1) hanno la forma ẍi = 1 Fi (r, ṙ, t) , m i = 1, 2, 3 . (2) Dal momento che nelle (2) la forma delle Fi è assegnata, le (2) costituiscono un sistema di tre equazioni differenziali del secondo ordine nel tempo, nelle incognite xi . Le tre equazioni sono tra loro accoppiate poiché i secondi membri contengono anche le componenti della posizione e della velocità con indici diversi da i. Le (2) sono lineari nelle derivate seconde ẍi , mentre sono lineari o meno nelle xi e ẋi a seconda della forma delle Fi . Le (2) possono riscriversi in una forma notevole introducendo la funzione lagrangiana L. Essa è una funzione scalare L = L(r, ṙ, t) tale che le tre equazioni differenziali d ∂L ∂L = , dt ∂ ẋi ∂xi i = 1, 2, 3 (3) siano ordinatamente identiche alle (2). Le (3) sono dette equazioni di Lagrange. Non è detto che per espressioni delle Fi assegnate ad arbitrio esista una lagrangiana. Tuttavia, se le forze derivano da un’energia potenziale V = V (r), cioè se Fi = Fi (r) = − ∂V , ∂xi (4) si verifica facilmente che la lagrangiana esiste e vale L=T −V , T = 1 1 mu2 = m(ẋ21 + ẋ22 + ẋ23 ) , 2 2 (5) essendo T l’energia cinetica del punto materiale. Infatti, osservando che V non dipende dalle componenti della velocità, si trova ∂T ∂L = = mẋi , (6) ∂ ẋi ∂ ẋi E. De Castro Advanced Research Center on Electronic Systems, e Dipartimento di Elettronica, Informatica e Sistemistica, Università di Bologna, Viale Risorgimento 2, I-40136 Bologna. d ∂L = mẍi . (7) dt ∂ ẋi Poi, osservando che T non dipende dalle componenti della posizione, si trova ∂V ∂L =− = Fi . (8) ∂xi ∂xi Uguagliando la (8) alla (7) si ottiene la (2) per ciascun indice i, il che dimostra che le (3) sono equivalenti alle (2). Si noti che nel caso particolare considerato come esempio (cioè Fi = −∂V /∂xi ) le componenti della forza non dipendono dalla velocità del punto materiale e non hanno una dipendenza esplicita dal tempo. Le (3) sono dette equazioni di Lagrange, e la funzione pi = pi (t) definita, per ogni indice i, dalla ∂L , (9) ∂ ẋi è detta momento coniugato alla coordinata xi . Le due funzioni xi (t) e pi (t) sono anche dette variabili canoniche coniugate. Quanto detto si generalizza al caso in cui, anziché un solo punto materiale, si considera un sistema di N punti materiali interagenti. Supponendo per semplicità che il sistema non sia soggetto a vincoli, i gradi di libertà di esso saranno s = 3N . Indicando con r j il vettore posizione del jmo punto materiale, j = 1, . . . , N , la componente della forza e la lagrangiana si scriveranno pi = Fi = Fi (r1 , ṙ1 , . . . , rN , ṙ N , t) , (10) L = L(r1 , ṙ 1 , . . . , r N , ṙN , t) , (11) dove l’indice i della componente della forza varia su tutti i gradi di libertà del sistema, cioè i = 1, . . . , s. La definizione del momento pi coniugato alla coordinata xi è data sempre dalla (9), e le equazioni di Lagrange sono identiche alle (3) con l’unica differenza che la lagrangiana dipende dalla posizione e dalla velocità di tutti i punti materiali, e l’indice i varia su tutti i gradi di libertà: ∂L d ∂L = , i = 1, . . . , s . (12) dt ∂ ẋi ∂xi Se la forza deriva da un’energia potenziale V (r 1 , . . . , rN ), si ha ∂V Fi = Fi (r 1 , . . . , rN ) = − , (13) ∂xi e vale ancora la (5) con T = N X 1 j=1 2 mj u2j , uj = |ṙj | . (14) M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI 2 Si può notare che applicando la (9) al caso in cui la forza deriva da un’energia potenziale si ottiene, per il punto materiale di indice j, pj = mj uj , dove pj è il vettore formato dalle tre componenti momento del punto materiale considerato. In altri termini, il momento di un punto materiale coincide con la quantità di moto di esso. Questo risultato non è generale, ma vale solo nel caso di forze derivanti da un’energia potenziale e se si adotta un sistema di coordinate cartesiane ortogonali. Dal momento che L dipende dalle qi e dalle q̇i , oltre che dal tempo, le (21,22) esprimono pi e ṗi in funzione delle qi , delle q̇i , e del tempo. Inoltre, dalla (19) si trova che II. C OORDINATE GENERALIZZATE Il sistema di coordinate cartesiane ortogonali non è l’unico possibile, e spesso è più conveniente usare un sistema diverso. Di conseguenza, è necessario determinare come si trasformano le relazioni del paragrafo I in seguito a una trasformazione di coordinate. Le nuove coordinate verranno indicate con qi , i = 1, . . . , s e saranno chiamate coordinate generalizzate. Le corrispondenti derivate rispetto al tempo, q̇i , saranno chiamate velocità generalizzate. Si noti che le qi non hanno necessariamente le dimensioni di una lunghezza (si pensi ad esempio al caso delle coordinate polari), e quindi le q̇i non hanno necessariamente le dimensioni del rapporto fra una lunghezza e un tempo. Le leggi di trasformazione dalle coordinate cartesiane ortogonali alle nuove coordinate sono relazioni del tipo qi = qi (x1 , . . . , xs , t) , i = 1, . . . , s. (15) Il tempo può apparire esplicitamente nelle (15) perché il nuovo sistema di riferimento può essere mobile rispetto al vecchio. Si suppone che le (15) siano invertibili, cioè che esistano le [qi ] [pi ] = [L] [t] , (23) dove si sono usate le parentesi quadre per indicare le dimensioni. Le dimensioni della lagrangiana nel sistema cartesiano ortogonale sono quelle di un’energia (si pensi all’esempio delle forze derivanti da un’energia potenziale). Dal momento che una trasformazione di coordinate non modifica le dimensioni della funzione trasformata, dalla (23) segue che il prodotto di due variabili canoniche coniugate ha sempre le dimensioni del prodotto di un’energia per un tempo. Tale prodotto viene chiamato azione. Nell’esempio del paragrafo I si ha pi = mẋi e la proprietà espressa dalla (23) si verifica immediatamente. III. L A FUNZIONE HAMILTONIANA Come si è detto prima, la (21) esprime pi in funzione delle qi , delle q̇i e del tempo: pi = pi (q1 , q̇1 , . . . , qs , q̇s , t) , i = 1, . . . , s . (24) Se il sistema delle (24) è invertibile, da esso si possono ricavare le q̇i in funzione delle qi , delle pi e del tempo: q̇i = q̇i (q1 , p1 , . . . , qs , ps , t) , i = 1, . . . , s . Si consideri ora la funzione definita dalla s X pi q̇i − L , H= (25) (26) i=1 xi = xi (q1 , . . . , qs , t) , i = 1, . . . , s. (16) Una volta assegnate le (15), si calcolano le q̇i = q̇i (x1 , ẋ1 , . . . , xs , ẋs , t) , i = 1, . . . , s (17) semplicemente applicando le regole della derivazione. Nello stesso modo, dalle (16) si calcolano le ẋi = ẋi (q1 , q̇1 , . . . , qs , q̇s , t) , i = 1, . . . , s . (18) A questo punto si possono introdurre le (16) e le (18) nella (12), ottenendo le equazioni di Lagrange espresse in funzione delle coordinate generalizzate. Il risultato notevole è che la forma delle equazioni resta identica: ∂L d ∂L = , dt ∂ q̇i ∂qi i = 1, . . . , s , (19) con L = L(q1 , q̇1 , . . . , qs , q̇s , t) . (20) Per il momento coniugato a qi si usa lo stesso simbolo introdotto nel caso delle coordinate cartesiane ortogonali: pi = ∂L , ∂ q̇i i = 1, . . . , s . (21) Combinando la (21) con la (19) si ottiene ṗi = ∂L , ∂qi i = 1, . . . , s . nella quale, grazie alle (25), le velocità generalizzate sono espresse in fuzione delle coordinate generalizzate qi e dei momenti coniugati pi . Ne risulta (22) H = H(q1 , p1 , . . . , qs , ps , t) . (27) La funzione H è detta funzione hamiltoniana del sistema di punti materiali considerato. Si può dimostrare che, usando la funzione hamiltoniana, si ottengono le equazioni di Hamilton q̇i = ∂H , ∂pi ṗi = − ∂H , ∂qi i = 1, . . . , s , (28) che sono equivalenti alle equazioni di Lagrange (19) per la descrizione della dinamica del sistema considerato. Si può notare che ogni coppia (28) rappresenta due equazioni differenziali del primo ordine nel tempo nelle incognite qi e pi , mentre ognuna delle (19) è un’equazione del secondo ordine nelle qi (che sia del secondo ordine è evidente dal fatto che la lagrangiana contiene le q̇i , e quindi la derivazione rispetto al tempo che appare al primo membro delle (19) produce le derivate seconde delle qi ). In altri termini, il sistema di s equazioni del secondo ordine della formulazione lagrangiana è sostituito da un sistema di 2s equazioni del primo ordine nella formulazione hamiltoniana. Le condizioni iniziali necessarie per risolvere il problema sono 2s sia nella formulazione lagrangiana che in quella hamiltoniana. Infatti, nel primo caso le equazioni da risolvere sono s, ma ciascuna richiede due condizioni perché è del secondo M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI 3 ordine (tipicamente qi (t = 0) e q̇i (t = 0)). Nel secondo caso le equazioni da risolvere sono 2s, ma ciascuna richiede solo una condizione perché è del primo ordine (qi (t = 0) per la prima equazione della coppia e pi (t = 0) per la seconda). Nel caso delle forze derivabili da un’energia potenziale V , e usando le coordinate cartesiane ortogonali, si trova in cui l’ultima relazione si trova dalla legge del moto F = ma esprimendo l’accelerazione come derivata della velocità. D’altra parte, l’ultimo termine a destra della (35) vale H =T +V , (29) dove nel caso del singolo punto materiale si ha T = 1 2 1 2 p = (p + p22 + p23 ) , 2m 2m 1 V = V (r) . (30) Invece, per un sistema di N punti materiali si ha T = N X 1 2 pj , 2m j j=1 V = V (r 1 , . . . , r N ) . (31) Per esempio, applicando le equazioni di Hamilton (28) alla (30) si trova, dalla prima, q̇i = ∂H ∂T = = ẋi , ∂pi ∂pi (32) ∂V ∂H =− = Fi . ∂qi ∂qi (33) e dalla seconda ṗi = − D’altra parte, come osservato nel paragrafo II, in questo caso si ha anche pi = mẋi . Quindi, inserendo questa relazione nella prima delle (32) e combinando il risultato con la (33), si trova la legge del moto mẍi = Fi . Lo stesso risultato si trova quando si considera un sistema di N punti materiali anziché un singolo punto materiale. Si noti che, nell’esempio della forza derivabile da un’energia potenziale, l’espressione dell’energia cinetica T della formulazione hamiltoniana in coordinate cartesiane ortogonali, data dalla prima delle (30) nel caso del singolo punto materiale, si ricava da quella della formulazione lagrangiana, cioè la prima delle (5), semplicemente sostituendo u2 con p2 /m2 . Analogamente, per un sistema di N punti materiali si passa dalla (14) alla (31) sostituendo u2j con p2j /m2j . Un’altra proprietà che si dimostra nel caso di forze derivabili da un’energia potenziale è che l’hamiltoniana non dipende esplicitamente dal tempo ed è una costante del moto. Usando le coordinate cartesiane ortogonali, H = H(x1 , p1 , . . . , xs , ps ) = cost . (34) In altri termini, nonostante che tutte le coordinate e tutti i momenti siano in generale variabili nel tempo, essi si combinano nell’hamiltoniana in modo tale che quest’ultima resti costante. Prendendo ad esempio il caso del singolo punto materiale, questa proprietà si dimostra facilmente considerando il lavoro esercitato dalla forza F durante un intervallo infinitesimo di tempo dt a partire dall’istante t, durante il quale il punto materiale varia la propria posizione della quantità dr. Osservando che dr = udt, dove u è la velocità del punto materiale all’istante t, il lavoro vale F • dr = F • udt = mu̇ • udt , (35) mu̇ • udt = 1 1 m d(u • u) dt = md(u2 ) = d(p2 ) . (36) 2 dt 2 2m Inoltre, ricordando che le componenti della forza sono le derivate dell’energia potenziale cambiate di segno, il primo termine a sinistra della (35) vale F • dr = − grad V • dr = −dV , (37) e quindi rappresenta la variazione dell’energia potenziale del punto materiale dovuta allo spostamento dr. Perciò la (35) implica che nell’intervallo di tempo dt sia nulla la variazione della quantità p2 /(2m) + V . Di conseguenza, la somma p2 /(2m)+V è una costante del moto. Come noto, tale costante è detta energia totale e viene di solito indicata col simbolo E. Un’ultima osservazione, sempre relativa a una forza derivabile da un’energia potenziale, è la seguente. Ciò che determina il moto di un punto materiale è la forza, mentre l’energia potenziale è una funzione ausiliaria che permette di esprimere le leggi del moto con un formalismo più generale. Dal momento che l’energia potenziale, se esiste, è quella funzione definita in modo tale che la forza ne sia il gradiente, è evidente che l’energia potenziale V è definita a meno di una costante additiva arbitraria. Al contrario, l’energia cinetica T è definita senza costanti arbitrarie. Di conseguenza, sempre nel caso in cui la forza deriva da un’energia potenziale, anche l’energia totale H = T + V = E è definita a meno di una costante additiva arbitraria. Il valore della costante non ha nessun effetto sulla descrizione del moto. Questa, infatti, è ottenuta con le equazioni di Hamilton (28), nelle quali la costante additiva viene comunque eliminata quando si calcolano le derivate parziali. In ogni caso, quando si studia un problema dinamico la costante additiva dell’energia potenziale viene automaticamente assegnata quando si prescrive la dipendenza funzionale di V dalle coordinate, e ciò fissa di conseguenza anche il valore dell’energia totale, che come ricordato prima è una costante del moto. IV. C OMMENTI La trattazione svolta finora ha introdotto concetti, in particolare quello di funzione lagrangiana e funzione hamiltoniana, la cui importanza non può essere apprezzata del tutto sulla base del semplice esempio delle forze ricavabili da un’energia potenziale. Infatti, tale esempio può essere trattato con le tecniche della fisica elementare, e le generalizzazioni descritte non sembrano apportare vantaggi sostanziali. Al contrario, la formulazione lagrangiana e hamiltoniana della meccanica sono estremamente importanti, perché si applicano senza modificazioni anche al caso di forze più generali di quelle esaminate nell’esempio, e in qualunque sistema di coordinate. Inoltre, esse consentono di ricavare direttamente informazioni importanti sul sistema in esame, ad esempio, sulle costanti del moto e sulle proprietà d’invarianza dovute a particolari simmetrie del sistema. Infine, il formalismo lagrangiano e hamiltoniano può essere esteso a sistemi che non sono formati M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI da particelle, ad esempio i campi, e allo studio dei problemi quantistici. Quanto detto nei precedenti paragrafi si riferisce a una descrizione della dinamica basata sul concetto di punto materiale e sull’ipotesi che gli effetti relativistici siano trascurabili. Quando si studiano i dispositivi a stato solido, si trova che gli effetti relativistici sono ancora trascurabili perché le velocità delle particelle all’interno di un materiale sono comunque molto piccole rispetto a quella della luce. Invece non sono più trascurabili gli effetti quantistici, dal momento che le particelle devono essere studiate su scala atomica. Di conseguenza è necessario generalizzare la trattazione dei precedenti paragrafi. Per procedere, è utile considerare la funzione hamiltoniana di un singolo punto materiale, nel caso di forze derivabili da un’energia potenziale. Essa è una costante del moto E che, secondo quanto detto alla fine del paragrafo III, può essere considerata completamente definita una volta che sia assegnata la dipendenza dell’energia potenziale V (r) dalle coordinate. Si può notare che per il calcolo della costante E è sufficiente assegnare le condizioni iniziali del moto. Infatti, assegnando i valori di p1 , p2 e p3 all’istante iniziale si fissa il valore iniziale dell’energia cinetica T , e assegnando i valori di x1 , x2 e x3 all’istante iniziale si fissa il valore iniziale di quella potenziale. A questo punto l’energia totale E = T + V è assegnata, e mantiene lo stesso valore indipendentemente dall’evoluzione successiva delle variabili dinamiche xi e pi . Si fissi ora un generico istante di tempo, e si consideri una posizione fissa r 0 dello spazio. L’energia potenziale si riduce perciò a una costante nota V0 e, di conseguenza, l’energia totale diventa una funzione delle sole componenti del momento: E = E(p) = 1 (p2 + p22 + p23 ) + V0 . 2m 1 (38) Naturalmente questa relazione non è più utile per descrivere la dinamica del punto materiale, dal momento che il tempo e il punto sono stati fissati. Lo scopo della (38) è quello di mettere in evidenza la relazione funzionale fra E e p. Per chiarirne il significato si può pensare che l’istante fissato sia quello iniziale, t = 0, e che il punto r 0 sia la posizione iniziale del punto materiale. Per completare l’assegnazione delle condizioni iniziali del moto devono essere fissate anche le componenti di p a t = 0. Dal momento che esse possono essere assegnate ad arbitrio, agl’infiniti valori iniziali possibili delle componenti di p corrispondono infiniti valori iniziali di T e quindi infiniti valori della costante E. La (38) fornisce appunto la relazione con cui si calcola E. Come si vedrà nel paragrafo V, è proprio la relazione E(p) che viene profondamente modificata quando si passa al caso della dinamica di un elettrone in un cristallo. Per questo, è opportuno mettere in evidenza alcune proprietà della (38): 1) Non ci sono limiti ai possibili valori delle componenti di p e, di conseguenza, non ci sono limiti ai valori di E maggiori o uguali a V0 . 2) La relazione E(p) è pari nelle componenti di p, cioè per ogni indice i si ha E(−pi ) = E(pi ). 3) Le componenti di p, e di conseguenza E, variano con continuità nei rispettivi domini. 4 V. D INAMICA DI UN ELETTRONE IN UN CRISTALLO Per quello che riguarda i cristalli, che sono oggetto di questa trattazione, si suppongono noti i seguenti concetti: 1) Con riferimento al reticolo diretto: nodo, vettore caratteristico ai , vettore di traslazione l, vettore generico r, cella elementare, volume τl = a1 • a2 ∧ a3 della cella elementare. 2) Con riferimento al reticolo reciproco scalato: nodo, vettore caratteristico 2πbi (con b1 = a2 ∧ a3 /τl ecc.), vettore di traslazione g, vettore generico k, cella elementare, volume τg = (2π)3 b1 • b2 ∧ b3 della cella elementare, zone di Brillouin. 3) Relazioni fra le grandezze elencate nei precedenti punti, ad esempio τl τg = (2π)3 . Dal momento che il volume τl non dipende dalla forma della cella elementare, si può sempre considerare il cristallo come formato dall’unione di celle elementari di forma prismatica aventi i lati di lunghezza uguale ai moduli di a1 , a2 e a3 rispettivamente. Indicando con N1 il numero di celle secondo la direzione di a1 , con N2 e N3 gli analoghi numeri secondo le altre due direzioni, il numero totale delle celle del cristallo sarà Nc = N1 N2 N3 , e il volume del cristallo sarà Ω = Nc τl . Quando si descrive la dinamica di un elettrone in un cristallo si può ancora assumere che su di esso agiscano forze derivabili da un’energia potenziale. A sua volta, questa energia potenziale è la somma di tre contributi: il primo è dovuto alla presenza del cristallo, ed è periodico con la stessa periodicità del reticolo diretto; il secondo è dovuto a eventuali perturbazioni esterne; il terzo è dovuto alle collisioni. La parte periodica dell’energia potenziale del singolo elettrone è prodotta principalmente dalla presenza dei nuclei, che in prima approssimazione si considerano fissi nelle posizioni di equilibrio. In realtà i nuclei vibrano intorno alle posizioni di equilibrio, e ciò rende più complicata l’interazione di essi con gli elettroni. Di ciò è possibile tener conto successivamente, e quindi le vibrazioni non verranno per ora considerate. Un secondo contributo al potenziale periodico è dovuto alla presenza di tutti gli altri elettroni del cristallo. Grazie al fatto che il numero di tali elettroni è molto grande, è possibile tener conto dell’effetto che il campo, da essi prodotto, ha sull’elettrone considerato, per mezzo di un campo medio che si somma a quello prodotto dai nuclei. Questo approccio è di fondamentale importanza perché permette di ridurre il calcolo alla soluzione del problema dinamico di una singola particella, anziché risolvere simultaneamente il problema di tutti gli elettroni accoppiati fra loro. Il secondo contributo all’energia potenziale è quello dovuto a eventuali perturbazioni esterne, che sono causate da un campo elettrico impresso e quindi sono derivabili da un potenziale. Il calcolo si estende senza difficoltà al caso in cui siano presenti anche forze magnetiche. La trattazione si basa sull’ipotesi, sempre verificata in pratica, che le forze esterne possano considerarsi spazialmente costanti nella regione in cui non è trascurabile la funzione d’onda della particella (a differenza di quelle dovute ai nuclei, che variano di molti ordini di grandezza all’interno di una distanza interatomica). In tal modo si può risolvere preventivamente il problema della M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI 5 dinamica in presenza dei soli nuclei, aggiungendo poi l’effetto delle forze esterne con una trattazione perturbativa rispetto al caso già risolto. Una volta conclusa la trattazione perturbativa, si ottiene la descrizione della dinamica del cosiddetto volo libero della particella, cioè del moto della particella nell’intervallo che intercorre tra due collisioni. Per “collisione” s’intende una qualunque delle possibili interazioni che la particella può subire nel suo moto attraverso il cristallo, ad esempio: trasporto nei semiconduttori in molti casi di rilevante interesse applicativo. La trattazione della parte statistica esula dagli scopi di questi appunti, che invece si propongono d’illustrare le relazioni che descrivono il volo libero della singola particella, mettendo in evidenza le differenze rispetto alla trattazione classica descritta nei paragrafi I, II, III, IV. Per cominciare, anche nel caso della particella in un cristallo è definibile una funzione hamiltoniana H = T + V , nella quale V = V (r) è l’energia potenziale dovuta alle sole forze esterne. L’effetto del potenziale periodico dei nuclei, considerati fissi, è invece inglobato nell’energia cinetica T . Come anticipato sopra, l’effetto delle collisioni non è qui considerato dal momento che si vuole descrivere la dinamica del volo libero. Il vettore r da cui dipende l’energia potenziale non rappresenta più la posizione istantanea della particella, ma il valor medio della posizione calcolato usando come funzione peso il quadrato del modulo della funzione d’onda della particella all’istante considerato. Il vettore r appartiene al reticolo diretto. A sua volta, l’energia cinetica T risulta essere una funzione del vettore k, detto vettore d’onda, che ha le dimensioni dell’inverso di una lunghezza e appartiene al reticolo reciproco scalato. Il prodotto h̄k, dove h̄ = h/(2π) è la costante di Planck ridotta e h la costante di Planck, è il valor medio del momento della particella calcolato anche qui con la funzione d’onda della particella all’istante considerato (in questo caso, tuttavia, la funzione peso non è il quadrato del modulo della funzione d’onda). Poichè il moto è conservativo, la funzione hamiltoniana è una costante del moto H = E, dove E è l’energia totale. Come si è fatto nel caso classico, si fissi ora un generico istante di tempo, e si consideri una posizione fissa r 0 del reticolo diretto. L’energia potenziale si riduce perciò a una costante nota V0 e, di conseguenza, l’energia totale diventa una funzione delle sole componenti del vettore d’onda: 1) Collisione con i nuclei. Come detto prima, i nuclei non sono fissi nelle posizioni di equilibrio, ma vibrano intorno a queste. Mentre delle interazioni con i nuclei considerati fissi si è già tenuto conto nei calcoli in cui l’energia potenziale viene considerata periodica, deve essere ora aggiunto il calcolo dell’effetto delle vibrazioni dei nuclei. L’esito della collisione di una particella, ad esempio un elettrone, con i nuclei, è descrivibile come un trasferimento di energia e momento fra l’elettrone e l’insieme di tutti i nuclei del cristallo. 2) Collisione con un’impurezza o un difetto presente nel cristallo. 3) Interazione con una radiazione elettromagnetica incidente. Questo effetto è descritto come una collisione della particella con un fotone, e viene trattato in modo simile all’interazione con i nuclei. 4) Interazione fra particelle, ad esempio l’interazione elettrone-elettrone. 5) Altri tipi, ad esempio l’interazione con un’interfaccia (molto importante nei dispositivi a canale superficiale). La trattazione delle collisioni è alquanto complicata non solo perché ci sono diversi tipi di collisione, ma anche perché le forze coinvolte sono molto intense (quindi non è applicabile una soluzione perturbativa) e non sono periodiche (quindi non sono applicabili le proprietà dei sistemi periodici che invece possono essere sfruttate nella parte di calcolo in cui i nuclei sono considerati fissi). D’altra parte, la trattazione delle collisioni è essenziale per descrivere correttamente il trasporto di corrente nei cristalli. Tipicamente, il completamento della trattazione si svolge in due passi: 1) A partire dalla dinamica della singola particella, si applica una descrizione statistica basata sulla funzione di distribuzione delle particelle. Il risultato di questo passo è l’equazione che descrive l’evoluzione della funzione di distribuzione in assenza di collisioni. 2) Vengono aggiunti gli effetti delle collisioni mediante un ulteriore termine, detto termine di collisione, che descrive la variazione nel tempo della funzione di distribuzione prodotta dalle collisioni. Il calcolo del termine di collisione è svolto con le tecniche proprie della meccanica quantistica, tipicamente usando una procedura di calcolo della probabilità di transizione fra due stati quantici che viene indicata come regola d’oro di Fermi. L’equazione complessiva cosı̀ ottenuta descrive l’evoluzione della funzione di distribuzione in presenza di collisioni e viene detta equazione del trasporto di Boltzmann. Si trova che tale equazione descrive con un ottimo grado di approssimazione le proprietà del E = E(k) = T (k) + V0 . (39) Naturalmente questa relazione non è più utile per descrivere la dinamica del punto materiale, dal momento che il tempo e il punto sono stati fissati. Lo scopo della (39) è quello di mettere in evidenza la relazione funzionale fra E e k. Tale relazione è profondamente diversa dalla E(p) del caso classico data dalla (38). Si ha infatti che: 1) La funzione E(k) è periodica con un intervallo di periodicità pari alla prima zona di Brillouin. In altri termini, se k è un vettore appartenente alla prima zona di Brillouin, allora per qualunque vettore di traslazione g si ha E(k+g) = E(k). La ragione di questa proprietà è che E(k) è l’autovalore di un’equazione differenziale i cui coefficienti sono periodici nel reticolo diretto. 2) La funzione E(k) è polidroma. In altri termini, per ogni k esistono diversi valori possibili dell’energia totale E1 (k), E2 (k), . . .. La ragione di questa proprietà è che la particella è confinata in un volume finito rappresentato dal reticolo diretto. Il minimo di E è strettamente maggiore del minimo di V . Per un generico indice r, la funzione Er (k) è detta ramo della E(k). L’insieme M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI dei valori coperti da Er al variare di k nella prima zona di Brillouin è detto banda di energia. A seconda del tipo di cristallo, possono esistere parti dell’asse delle energie non coperte da nessuna banda; tali parti si chiamano gap. Perciò, a differenza del caso classico in cui l’energia totale può assumere tutti i valori compatibili con quello dell’energia potenziale, nel caso quantistico esistono valori di energia che la particella non può avere, che sono appunto quelli che cadono nei gap. 3) La relazione E(k) è pari nelle componenti di k, cioè per ogni indice i si ha E(−ki ) = E(ki ). Questa proprietà è del tutto identica a quella già osservata nel caso classico. Essa deriva dall’invarianza della funzione hamiltoniana per inversione del tempo, che vale in tutti i casi. 4) A differenza del caso classico, in cui il momento p varia con continuità nel proprio dominio (che è infinito), il vettore d’onda k varia per salti discreti nel proprio dominio (che è la prima zona di Brillouin). La ragione è dovuta all’ipotesi che, per ciascuna direzione ai , le proprietà fisiche della prima faccia del cristallo (che è quella che passa per l’origine del sistema di riferimento r) siano uguali a quella dell’ultima faccia (che è quella che dista Ni ai dalla prima). Questa ipotesi, ragionevole dal punto di vista fisico, viene detta ipotesi delle condizioni al contorno periodiche. Essa conduce alla quantizzazione di k, che risulta funzione di tre indici interi n1 , n2 , n3 secondo la relazione k= n1 n2 n3 2π b1 + 2π b2 + 2π b3 , N1 N2 N3 (40) ni = 0, 1, 2, . . . , Ni − 1. Di conseguenza, non solo la funzione E(k) è ripartita in rami E1 (k), E2 (k), . . . contati da un indice discreto, ma anche i valori di energia di ciascuna banda Er (k) sono quantizzati. I valori quantizzati di energia di ciascuna banda (cioè le energie Er (n1 , n2 , n3 ) che si ottengono tenendo fisso r e variando gl’indici ni indipendentemente da 0 a Ni −1) sono detti livelli energetici della banda. Dal momento che ogni indice ni nella (40) può indipendentemente assumere Ni valori diversi, il numero di vettori k distinti all’interno della prima zona di Brillouin sarà N1 N2 N3 = Nc . I vertici di tali vettori formano all’interno della prima zona di Brillouin un insieme di punti che, per ciascuna direzione 2πbi , sono equidistanti, dato che si passa da uno qualunque di essi a quelli adiacenti modificando di un’unità l’indice intero ni . Dunque, la densità di tali punti si ottiene semplicemente dividendo Nc per il volume τg della prima zona di Brillouin. Il risultato Nc /τg viene anche pensato come la densità dei vettori k. Col termine stato elettronico s’intende l’insieme di quattro indici n1 , n2 , n3 , ns , dove i primi tre indici sono quelli che definiscono il vettore k nella (40), mentre ns è un indice associato allo spin dell’elettrone. Per assegnati valori degli altri tre indici, ns può assumere solo due valori distinti. Quindi, il numero di possibili stati elettronici distinti nella prima zona di Brillouin sarà il doppio del numero di vettori k distinti. Analogamente, la densità degli stati nello spazio del vettore k 6 sarà il doppio della densità dei vettori k: Qk = 2 Ω/τl Ω Nc =2 = 3. τg τg 4π (41) I calcoli che portano alla determinazione di E(k) sono sempre svolti nell’ipotesi che le proprietà fisiche del cristallo non dipendano dal punto. Di conseguenza, data una generica quantità estensiva dello spazio r, la corrispondente densità nello stesso spazio si ottiene semplicemente dividendo il valore della quantità estensiva in esame per il volume Ω del cristallo. In particolare, la densità degli stati nello spazio a sei dimensioni (r, k) si ottiene dalla (41) come Qk 1 = . (42) Ω 4π 3 Si potrebbe obiettare che in realtà l’andamento del drogante in un semiconduttore non è quasi mai costante, e quindi cade in difetto l’ipotesi di cristallo uniforme. In realtà la (42) continua a valere anche per un semiconduttore non uniforme, nel modo illustrato qui di seguito. Infatti, dal momento che la concentrazione degli atomi di drogante è comunque piccola rispetto a quella degli atomi del semiconduttore, si trova che gli stati elettronici di un semiconduttore drogato possono essere espressi come l’unione degli stati del semiconduttore non drogato, che danno luogo alla struttura a bande già discussa (quindi indipendente dalla posizione r e dotata della densità (42)), e di stati aggiuntivi introdotti dal drogante, la cui densità dipende dal punto secondo la distribuzione spaziale del drogante e la cui energia si colloca in un gap. In conclusione, la densità degli stati del semiconduttore drogato è la somma della (42) e di una funzione del punto, nota perché ricavabile dalla distribuzione del drogante. È opportuno aggiungere che, anche in una condizione di equilibrio del semiconduttore, in presenza di una concentrazione non uniforme di drogante le funzioni di distribuzione della banda di conduzione e di valenza diventano anch’esse funzioni del punto. In altri termini, in un caso non uniforme gli stati disponibili nelle bande sono gli stessi del caso uniforme, ma in generale gli elettroni si distribuiscono in essi con una concentrazione spaziale non uniforme. Di conseguenza, anche nel caso dell’equilibrio le grandezze che derivano dalla funzione di distribuzione quali, ad esempio, le concentrazioni degli elettroni e delle lacune, risultano essere funzioni del punto. La definizione di stato elettronico data sopra può apparire alquanto esoterica rispetto a quella classica, dove lo stato di una particella è definito come l’insieme dei valori delle variabili dinamiche che ne definiscono il moto a un certo istante, cioè le componenti della posizione e del momento all’istante considerato. In realtà la definizione quantistica è analoga a quella classica. Infatti, usando una definizione più generale, lo stato quantistico di una particella è costituito da una funzione d’onda calcolata a un certo istante. Usando le coordinate cartesiane e considerando una particella vincolata in una regione finita dello spazio, questa funzione dipende da r e da indici discreti. Se si prescinde dallo spin, che non ha un corrispettivo classico, gli altri indici forniscono k e, come detto in precedenza, h̄k è il valor medio del momento della particella calcolato usando la funzione d’onda. Q= M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI VI. M ASSA EFFICACE Come si è detto nel paragrafo V, anche nel caso della particella in un cristallo è definibile una funzione hamiltoniana H = T + V , nella quale V = V (r) è l’energia potenziale dovuta alle sole forze esterne. L’effetto del potenziale periodico dei nuclei, considerati fissi, è invece inglobato nell’energia cinetica T (k). L’hamiltoniana produce relazioni dinamiche valide all’interno di un volo libero. In coordinate cartesiane la forma di tali relazioni è ∂H ∂T ẋi = = = ui , (43) ∂h̄ki ∂h̄ki h̄k̇i = − ∂V ∂H =− = Fi . ∂xi ∂xi (44) La velocità di componenti ui = ẋi definita dalle (43) viene anche detta velocità di gruppo. Analogamente al caso classico, anche nel caso qui considerato la conservazione dell’energia si dimostra calcolando il lavoro esercitato dalla forza F durante un intervallo infinitesimo di tempo dt a partire dall’istante t, durante il quale il valor medio della posizione della particella varia della quantità dr. Osservando che dr = udt, con u calcolata all’istante t, il lavoro vale F • dr = F • u dt = h̄k̇ • u dt , (45) dove si è usata la (44). D’altra parte, h̄k̇dt = dh̄k. Combinando questa relazione con la (43) si trova F • dr = dh̄k • gradh̄k T = dT , (46) dove l’ultimo passaggio è reso possibile dal fatto che T dipende da k e non da r. Inoltre, ricordando che le componenti della forza sono le derivate dell’energia potenziale cambiate di segno, il primo termine a sinistra della (45) vale F • dr = − grad V • dr = −dV , (47) e quindi rappresenta la variazione dell’energia potenziale della particella materiale dovuta alla variazione dr. Perciò la (45) implica che nell’intervallo di tempo dt sia nulla la variazione della quantità T + V . Di conseguenza, la somma T + V è una costante del moto, che anche qui è l’energia totale della particella. Conviene notare che la derivazione che porta a questo risultato non richiede in nessun modo che venga prescritta la relazione funzionale T = T (k). La stessa osservazione poteva essere fatta anche nel caso classico, in cui il teorema dell’energia si sarebbe potuto dimostrare senza introdurre la relazione T = (p21 + p22 + p23 )/(2m). Invece, quello che viene meno nel caso qui considerato è la relazione di proporzionalità fra momento e velocità, che nel caso classico si scrive pi = mui ed è dovuta alla relazione quadratica fra T e le componenti di p. Invece T (k) non è quadratica, ma mostra una piú complicata relazione funzionale fra T e k, che dipende dal tipo di cristallo. Di conseguenza, i due vettori u e h̄k non sono in generale proporzionali fra loro: la relazione u = u(k) si calcola caso per caso a partire dalla (43) come u = (1/h̄) gradk H. È anche interessante determinare quale sia la relazione corrispondente alla F = ma del caso classico che, come si ricorderà, è ricavabile dalle equazioni di Hamilton usando la 7 definizione ai = u̇i e sfruttando la proporzionalità diretta fra pi e ui (che qui invece cade in difetto). Nel caso qui considerato, la generica componente ai dell’accelerazione si ricava derivando ui rispetto al tempo: ai = u̇i = ∂ui ∂ui ∂ui h̄k̇1 + h̄k̇2 + h̄k̇3 , ∂h̄k1 ∂h̄k2 ∂h̄k3 (48) dove si è moltiplicato e diviso per h̄ ogni termine in modo da mettere in evidenza le componenti della forza. Ricordando la u = (1/h̄) gradk H e usando la (44) si trasforma la precedente nella 2 1 ∂ H ∂2H ∂2H ai = 2 F1 + F2 + F3 . (49) ∂ki ∂k1 ∂ki ∂k2 ∂ki ∂k3 h̄ Nelle (48,49) i coefficienti delle componenti della forza hanno le dimensioni dell’inverso di una massa. Indicando con ζ̂ il tensore 3 × 3 simmetrico di componenti ζij = 1 ∂2H h̄2 ∂ki ∂kj (50) e invertendo ζ̂, si trova il tensore massa efficace m̂∗ = ζ̂ −1 , anch’esso simmetrico. In conclusione, la relazione F = ma del caso classico qui diventa F = m̂∗ a . (51) Naturalmente gli elementi di m̂∗ continuano a dipendere da k e quindi dal tempo, dato che nell’evoluzione del moto della particella il vettore k dipende dal tempo. Perciò la sostituzione della (51) alla coppia di equazioni di Hamilton (43,44) non comporta alcuna semplificazione del problema. D’altra parte occorre ricordare che le (43,44) sono applicabili solamente durante il volo libero della particella, il che di fatto restringe la validità di tali equazioni a intervalli di tempo estremamente brevi. Ad esempio, a temperatura ambiente il volo libero in un semiconduttore come il silicio ha una durata dell’ordine del ps o meno. Di conseguenza, si può ammettere che la variazione di k durante un volo libero sia abbastanza piccola da rendere accettabile la sostituzione di H con uno sviluppo in serie di potenze nelle componenti ki troncato al second’ordine, con le derivate calcolate nei valori delle ki all’istante iniziale del volo libero. In questo modo, le componenti del tensore di massa efficace diventano delle costanti proprie del volo libero considerato. Se per lo sviluppo di H troncato al second’ordine si sceglie un punto di minimo di un ramo di E(k), la situazione si semplifica ulteriormente dal momento che la parte al prim’ordine dello sviluppo si annulla, e la parte al second’ordine risulta una forma quadratica definita positiva. Come noto, una forma quadratica simmetrica e definita positiva è sempre diagonalizzabile con autovalori reali e positivi. Di conseguenza, è possibile passare dall’attuale sistema di riferimento nello spazio k a un nuovo riferimento, in cui il tensore massa efficace inverso assume la forma 0 0 1/m∗1 1/m∗2 0 , ζ̂ = 0 (52) 0 0 1/m∗3 M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI 8 in cui i termini diagonali m∗i sono strettamente positivi e hanno un valore che dipende dal minimo considerato. A sua volta, il tensore di massa assume la forma ∗ m1 0 0 m̂∗ = 0 m∗2 0 . (53) 0 0 m∗3 Considerazioni di carattere statistico mostrano che la maggior parte degli elettroni della banda di conduzione dei semiconduttori tendono a occupare stati prossimi ai minimi assoluti di tale banda. Perciò, lo sviluppo troncato al second’ordine nell’intorno dei minimi assoluti conduce effettivamente a una semplificazione dello studio della dinamica di tali elettroni. Ci si può chiedere se uno sviluppo troncato analogo a quello discusso qui sopra debba essere calcolato anche per la dipendenza di H dal punto r dovuta all’energia potenziale V . Ciò non è in realtà necessario, dal momento che la trattazione delle forze esterne si basa, come detto nel paragrafo V, su un approccio perturbativo. Tale approccio comporta che le forze esterne abbiano una dipendenza molto debole dal punto, tanto da poter essere considerate costanti all’interno del volo libero. Per concludere, si può osservare che uno sviluppo di E(k) troncato al second’ordine può essere calcolato anche nell’intorno di un massimo di una banda. Questo calcolo viene effettivamente svolto per descrivere la dinamica delle lacune, e conduce anche in questo caso a un tensore di massa diagonale. Considerazioni che esulano dallo scopo di questi appunti mostrano che nella descrizione della dinamica delle lacune è necessario introdurre un segno negativo nella definizione degli elementi del tensore di massa. Ciò compensa il fatto che nell’intorno di un massimo le derivate seconde di E(k) sono negative. Dal momento che l’operazione di diagonalizzazione comporta la scelta di un nuovo sistema di riferimento nello spazio k, è necessario scegliere contemporaneamente un nuovo riferimento nello spazio r. Infatti, i due gruppi di vettori caratteristici del reticolo diretto e del reticolo reciproco scalato dipendono l’uno dall’altro. Indicando con ka il vettore d’onda del minimo considerato, lo sviluppo troncato al secondo ordine (omettendo per semplicità l’indice del ramo) ha la forma E(k) ≃ Ea + h̄2 δk22 h̄2 δk32 h̄2 δk12 + + , 2ma1 2ma2 2ma3 (54) dove Ea = E(ka ), δki = ki − kai , e l’indice a delle masse indica che le derivate seconde della (50) sono calcolate per k = ka . Questo risultato viene anche indicato col termine approssimazione delle bande paraboliche. Confrontando la (54) con la (39) e osservando che nel minimo deve essere T = 0, si trova che si deve identificare Ea con V0 e la differenza E − Ea come lo sviluppo intorno a ka dell’energia cinetica dell’elettrone, troncato al second’ordine. Se la banda considerata è quella di conduzione, allora si usa il simbolo EC al posto di Ea per indicare il valore del minimo assoluto (o dei minimi assoluti, se ne esistono diversi), e si usa il simbolo Ee per indicare l’energia cinetica E − EC . Si può anche notare l’analogia formale fra la (54) e la (38) del caso classico. Usando la notazione tensoriale si può riscrivere la (54) come E(k) ≃ Ea + h̄2 δk • ζ̂δk , 2 (55) dove ζ̂ è dato dalla (52) con mi = mai . Inoltre, usando la u = (1/h̄) gradk H e osservando che gradk H = gradk E si ricava, dalla (55), h̄δk = m̂∗ u , (56) dove m̂∗ è dato dalla (53) con mi = mai . Combinando questo risultato con le equazioni di Hamilton (43,44) si trova Fi = h̄k̇i = m∗ia u̇i = m∗ia ẍi (57) cioè, in forma tensoriale, F = m̂∗ a con il tensore di massa costante. Si riconosce cosı̀ che nell’intorno di un minimo di una banda la relazione fra momento e velocità e quella fra forza e accelerazione sono lineari, come nel caso classico. Tuttavia, a causa del fatto che i termini di m̂∗ possono essere diversi fra loro, le (56,57) sono in generale anisotrope. Ciò implica, in particolare, che un elettrone soggetto a una forza esterna F non è necessariamente accelerato nella stessa direzione della forza. Questo risultato non è particolarmente sorprendente se si pensa che nella relazione T (k) è nascosto l’effetto del potenziale periodico, la cui forza agisce sull’elettrone simultaneamente a F . VII. D ENSIT À DEGLI STATI IN ENERGIA Si consideri un generico vettore k della prima zona di Brillouin, e un secondo vettore di componenti ki +dki ottenute variando di quantità infinitesime le componenti di k. In questo modo si definisce un volumetto d3 k = dk1 dk2 dk3 . Ricordando la (41), il numero di stati nel volumetto sarà dN = Qk d3 k. L’uso di infinitesimi potrebbe essere considerato improprio dal momento che le componenti di k dipendono da indici discreti. Tuttavia, si deve osservare che il numero di celle elementari del reticolo è molto grande: ad esempio, la concentrazione del silicio è dell’ordine di 5 × 1022 atomi/cm3 , pari a 50×109 atomi/µm3 , quindi la concentrazione di celle in una direzione è dell’ordine di 103 celle/µm. Di conseguenza è accettabile l’uso di quantità infinitesime e delle derivate che intervengono nelle considerazioni che seguono. Si consideri ora una terna di funzioni α = α(k1 , k2 , k3 ) β = β(k1 , k2 , k3 ) , (58) η = η(k1 , k2 , k3 ) che si suppongono invertibili, cioè tali che esistano le k1 = k1 (α, β, η) k2 = k2 (α, β, η) . k3 = k3 (α, β, η) (59) Se si considerano le (58) come le relazioni di una trasformazione di coordinate, vale come noto la d3 k = |J| dα dβ dη , (60) M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI 9 dove J(α, β, η) è il determinante jacobiano della trasformazione di coordinate: ∂k1 /∂α ∂k1 /∂β ∂k1 /∂η J = ∂k2 /∂α ∂k2 /∂β ∂k2 /∂η . (61) ∂k3 /∂α ∂k3 /∂β ∂k3 /∂η corredata da opportune condizioni al contorno e iniziali. In particolare, trattandosi di un’equazione del primo ordine nel tempo, deve essere prescritta la condizione iniziale Dal momento che Qk = Ω/(4π 3 ) è costante rispetto a k e quindi non è influenzato dalla trasformazione, si avrà dN = Qk d3 k = Qk |J| dα dβ dη . (62) La (62) mostra che il prodotto Qk |J| è la densità degli stati nello spazio (α, β, η). Se ora si integrano ambo i membri della (62) su α e β, ZZ ZZ dN = dη Qk |J| dα dβ , (63) il primo membro della (63) rappresenta, per costruzione, il numero di stati nell’intervallo dη. Di conseguenza, la quantità ZZ g(η) = Qk |J(α, β, η)| dα dβ (64) è la densità degli stati nello spazio η. Di particolare rilevanza è il caso in cui si sceglie η(k) = Er (k), in cui Er è un ramo di E(k). In questo caso, g = g(E) è la densità degli stati in energia del ramo considerato, e γ(E) = g(E)/Ω è la corrispondente densità degli stati in energia e volume. Le altre due funzioni α e β si scelgono in modo conveniente a seconda della forma di Er . Ad esempio, se il ramo ha simmetria sferica, cioè se Er (k) = Er (|k|), conviene scegliere una trasformazione in coordinate polari in cui α e β sono i due angoli. Si noti che la relazione (54) che si ottiene nell’approssimazione delle bande paraboliche può essere √ sempre ridotta a una forma sferica usando le quantità h̄ δki / 2mai come variabili ausiliarie. VIII. F UNZIONE D ’ ONDA Nei precedenti paragrafi si è usato il termine funzione d’onda e si sono descritte qualitativamente le operazioni di media con cui si calcolano alcune grandezze dinamiche d’interesse. In questo paragrafo e nei successivi sono esposti gli aspetti formali della teoria. Come in precedenza, si considera la dinamica di una singola particella di massa m, soggetta a una forza derivabile da un’energia potenziale V che in generale si suppone dipendere anche dal tempo. Per evitare conflitti di simboli, le coordinate spaziali saranno indicate qui con ξ ≡ (ξ1 , ξ2 , ξ3 ). Sarà perciò V = V (ξ, t). Una volta assegnata V , si definisce l’operatore hamiltoniano 2 h̄ . H=− ∇2 + V , (65) 2m ξ dove il pedice indica che le derivate sono calcolate rispetto alle variabili ξ. La dinamica della particella è descritta, nel modo che sarà meglio specificato più avanti, dalla funzione d’onda ψ = ψ(ξ, t). Tale funzione si determina risolvendo l’equazione di Schrödinger dipendente dal tempo Hψ = jh̄ ∂ψ , ∂t (66) ψ0 (ξ) = ψ(ξ, t = t0 ) , (67) dove t0 è un generico istante che può farsi coincidere con l’origine del tempo. Per quanto riguarda le coordinate spaziali, l’equazione di Schrödinger è del secondo ordine. Le condizioni al contorno sono prescritte caso per caso a seconda del problema considerato. A questo proposito conviene preliminarmente osservare alcuni aspetti dell’equazione: • La (66) ha i coefficienti complessi, quindi la soluzione ψ è complessa. • La (66) è omogenea. Dal momento che le condizioni al contorno, come risulterà subito, sono anch’esse omogenee, la soluzione è definita a meno di una costante moltiplicativa arbitraria. • Poiché la (66) è del secondo ordine rispetto alle coordinate spaziali, ψ e le sue derivate prime ∂ψ/∂ξi sono spazialmente continue. Invece, le derivate seconde possono essere discontinue, a seconda della forma di V . • La soluzione della (66) potrebbe contenere dei termini che ne fanno divergere il modulo. Se ciò avviene, tali termini vanno scartati perché sono incompatibili col significato fisico di ψ (quest’ultimo è discusso piú sotto). Date queste premesse, per discutere le condizioni al contorno è necessario considerare separatamente i possibili casi. 1) Il dominio spaziale della ψ è finito. In altri termini, è disponibile un’informazione sulla natura del problema trattato, che consente di affermare che ψ è identicamente nulla al di fuori di un certo dominio Ω. Di conseguenza, a causa della continuità, la funzione d’onda deve annullarsi sul contorno di Ω. La condizione al contorno è perciò omogenea. Una volta scartati gli eventuali termini divergenti, risulterà finito, oltre che reale, l’integrale R 2 2 |ψ| d ξ. Ω 2) Il dominio spaziale della ψ R è infinito, ma la forma di ψ è tale che l’integrale Ω |ψ|2 d2 ξ è finito. Se ciò avviene, è necessario che ψ sia evanescente quando il modulo di ξ diventa arbitrariamente grande. Anche in questo caso le condizioni al contorno sono omogenee (asintoticamente). È opportuno notare che, in linea di R principio, l’integrale Ω |ψ|2 d2 ξ di questo caso e del precedente dipende dal tempo. Di ciò sarà discusso piú sotto. 3) Il dominio spaziale della Rψ è infinito, e la forma di ψ è tale che l’integrale Ω |ψ|2 d2 ξ diverge. Se ciò avviene, non è a causa del fatto che |ψ|2 diverga (infatti, come detto prima, eventuali termini divergenti devono essere scartati a priori). Per far divergere l’integrale è sufficiente che ψ tenda asintoticamente a una costante, o addirittura sia asintoticamente evanescente, ma con un decadimento troppo debole. Questo caso può presentarsi, e va trattato a parte: tipicamente, l’analisi delle condizioni al contorno viene svolta usando un dominio finito, che poi viene fatto crescere indefinitamente. Si M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI 10 trova anche in questo caso che ψ è definita a meno di una costante moltiplicativa arbitraria. Nel paragrafo IX sono svolte alcune considerazioni che permettono d’identificare il significato fisico di ψ. di ψ. Si noti anche che la (76) stabilisce le dimensioni di ψ: infatti, |ψ|2 ha le dimensioni dell’inverso di un volume. L’esistenza della condizione di normalizzazione permette di ricavare il significato fisico di ψ nel modo che segue: • IX. E QUAZIONE DI CONTINUIT À Dall’equazione di Schrödinger (66) può ricavarsi un’equazione formalmente identica a un’equazione di continuità. Per questo, si considerano la (66) e la complessa coniugata. Osservando che H è reale si trova ∂ψ 1 = Hψ , ∂t jh̄ ∂ψ ∗ 1 = − Hψ ∗ . ∂t jh̄ (68) • Calcolando la derivata temporale di |ψ|2 = ψψ ∗ si ricava ∂|ψ|2 ∂ψ ∂ψ ∗ 1 = ψ∗ +ψ = (ψ ∗ Hψ − ψ Hψ ∗ ) . ∂t ∂t ∂t jh̄ (69) Sostituendo la (65) nella (69) e cancellando i termini contenenti V si trova ∂|ψ|2 jh̄ (70) ψ ∗ ∇2 ψ − ψ ∇2 ψ ∗ . = ∂t 2m D’altra parte vale l’identità ψ ∗ ∇2 ψ − ψ ∇2 ψ ∗ = div (ψ ∗ ∇ψ − ψ∇ψ ∗ ) (71) da cui, definendo il vettore . jh̄ (ψ∇ψ ∗ − ψ ∗ ∇ψ) , Jψ = 2m si ottiene l’equazione di continuità • (72) ∂|ψ|2 + div J ψ = 0 . (73) ∂t Si noti che nella definizione (72) di J ψ compare la differenza dei vettori ψ∇ψ ∗ e ψ ∗ ∇ψ, che sono l’uno il complesso coniugato dell’altro. La loro differenza è perciò immaginaria. Di conseguenza, l’unità immaginaria j della (72) rende J ψ reale, come deve essere osservando il primo membro della (73). Per discutere il significato della (73) conviene riprendere l’esame delle condizioni al contorno. Se si integra la (73) su un generico dominio Ω si trova Z Z Z ∂|ψ|2 3 d 2 3 d ξ= J ψ • ν dΣ , (74) |ψ| d ξ = − dt Ω Ω ∂t Σ dove Σ è il contorno di Ω e ν il versore normale uscente da Σ. Se si considerano i due casi di condizioni al contorno discusse prima, l’annullarsi di ψ al contorno comporta l’annullamento di J ψ su Σ. Perciò si annulla l’ultimo membro della (74) e si ha Z d ψ(ξ ∈ Σ, t) = 0 ⇒ |ψ|2 d3 ξ = 0 , (75) dt Ω R cioè Ω |ψ|2 d3 ξ = const. A questo punto si può usare la costante moltiplicativa arbitraria per imporre la condizione Z |ψ|2 d3 ξ = 1 , (76) ψ(ξ ∈ Σ, t) = 0 ⇒ Ω che viene chiamata condizione di normalizzazione. Si noti che, nei due casi considerati, Ω è l’intero dominio di definizione Si postula che la funzione d’onda ψ possa venire usata per la descrizione della dinamica della particella. Dunque essa deve fornire un’informazione, fra l’altro, sulla posizione istantantea di questa. Alla funzione d’onda è associata una quantità reale |ψ|2 che, con l’eccezione delR possibile caso di non normalizzabilità, ha la proprietà Ω |ψ|2 d3 ξ = 1. Questa proprietà è analoga a quella delle distribuzioni di probabilità. Si postula che l’integrando |ψ(ξ, t)|2 d3 ξ, che evidentemente è un numero compreso fra 0 e 1, sia la probabilità infinitesima che all’istante t la particella sia nel volume infinitesimo d3 ξ. Da ciò segue che |ψ|2 è la densità di probabilità. Inoltre, per un generico volume finito Ω′ ⊂ Ω, l’integrale Z |ψ|2 d3 ξ ≤ 1 (77) 0≤ Ω′ è la probabilità che all’istante t la particella sia nel volume Ω′ . Se si indica con Σ′ il contorno di Ω′ , applicando la (73) si trova anche Z Z d |ψ|2 d3 ξ = − J ψ • ν dΣ′ , (78) dt Ω′ Σ′ dove il secondo membro è in generale non nullo perché Ω′ è diverso da Ω. Questa relazione permette di individuare il significato di J ψ . Infatti, il primo membro della (78) è la variazione nel tempo della probabilità di localizzare la particella in Ω′ . Per analogia con l’equazione di continuità della dinamica macroscopica si pensa allora che la probabilità di localizzazione della particella fluisca attraverso il contorno di Ω′ . Il vettore J ψ viene perciò chiamato densità di flusso di probabilità. Conviene aggiungere che nel caso della dinamica macroscopica i concetti statistici si applicano a una collettività di particelle, mentre qui essi si applicano a una particella singola. Nonostante l’analogia formale, ci sono perciò differenze sostanziali fra i due casi. A conclusione di questa parte si può osservare che, nel caso di normalizzabilità della funzione d’onda, l’integrale di |ψ|2 su tutto il dominio di definizione è indipendente dal tempo. Ciò scioglie la riserva indicata sopra. Inoltre, l’interpretazione di |ψ|2 come densità di probabilità giustifica il fatto che eventuali soluzioni divergenti dell’equazione di Schrödinger debbano essere scartate. Le considerazioni fin qui svolte devono essere modificate nel caso in cui la funzione d’onda non sia normalizzabile. Se ciò avviene, infatti, l’integrale di |ψ|2 esteso a tutto lo spazio diverge. Tuttavia, convergono gl’integrali estesi su volumi finiti, ad esempio Ω′ e Ω′′ . È perciò possibile calcolare il rapporto di tali integrali, Z Z |ψ|2 d3 ξ = α |ψ|2 d3 ξ . (79) Ω′ Ω′′ M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI 11 Al rapporto α si attribuisce il significato di rapporto delle probabilità di localizzazione della particella nei due volumi indicati. generalizzare il calcolo dei valori di aspettazione al caso in cui le variabili dinamiche coinvolte non siano le coordinate. Il caso piú importante è quello del momento coniugato alla coordinata ξi . Per calcolarne il valore di aspettazione si deve introdurre l’operatore momento X. VALORI DI ASPETTAZIONE Una volta introdotto il significato probabilistico della funzione d’onda, esso può essere usato per determinare le medie statistiche di quantità dinamiche d’interesse. Per cominciare si considerano variabili dinamiche che dipendono solo dalle coordinate ξi . In particolare, il caso più semplice è quello delle coordinate stesse: la media statistica della coordinata ξi secondo una funzione d’onda normalizzabile ψ è definita da R 2 3 . Ω ξi |ψ| d ξ . (80) hξi i = R |ψ|2 d3 ξ Ω È importante rilevare che gl’integrali della (80) sono calcolati su tutto il dominio Ω di definizione di ψ, e che la (80) ha senso solo per funzioni d’onda normalizzabili. A questo punto si può sempre considerare ψ normalizzata, e la definizione assume la piú semplice forma Z . hξi i = ξi |ψ|2 d3 ξ . (81) Ω La media statistica definita dalle (80,81) è detta valore di aspettazione. Più in generale, il valore di aspettazione di una generica funzione f (ξ) che dipende solo dalle coordinate spaziali è definito da Z . f (ξ) |ψ|2 d3 ξ . (82) hf i = Ω Si noti che le quantità dinamiche di cui si calcolano i valori di aspettazione non contengono necessariamente il tempo. Tuttavia i loro valori di aspettazione dipendono in generale dal tempo, dato che ψ dipende dal tempo. Nel caso dell’energia potenziale V (ξ, t), il valore di aspettazione Z . V (ξ, t) |ψ|2 d3 ξ . (83) hV i = Ω dipende dal tempo a causa della dipendenza da esso sia di V che di ψ. A proposito del calcolo dei valori di aspettazione è opportuno specificare quanto segue. Nonostante la loro natura di coordinate spaziali, le quantità ξi non hanno il significato di “posizione della particella”. Esse sono semplicemente le coordinate in cui sono definite le funzioni trattate dalla teoria. Perciò, sarebbe fuorviante pensare tali quantità come se fossero funzioni del tempo, ξi = ξi (t), alla stregua delle componenti xi (t) della posizione di una particella in meccanica classica introdotte nel paragrafo I. Il significato di “posizione della particella” si ricupera attraverso il valore di aspettazione hξi i(t), come illustrato nell’esempio del paragrafo XI. Un’altra osservazione è che la (82) può essere riscritta Z . ψ ∗ f (ξ) ψ d3 ξ . (84) hf i = Ω Naturalmente non c’è alcuna differenza fra la (82) e la (84). Tuttavia, la forma (84) è piú utile perché permette di ∂ . p̂i = −jh̄ , ∂ξi (85) e usare la forma (84) del valore di aspettazione sostituendo p̂i a f: Z ∂ψ 3 . ψ∗ hp̂i i = −jh̄ d ξ. (86) ∂ξi Ω È evidente che se si fosse calcolato hp̂i i con la forma (82) si sarebbe ottenuto un risultato diverso, dato che ψ∗ ∂(ψψ ∗ ) ∂ψ 6= . ∂ξi ∂ξi (87) La forma corretta è la (84). Questa può allora essere generalizzata considerando, al posto della funzione f , un generico operatore A: Z . ψ ∗ Aψ d3 ξ , (88) hAi = Ω e la (86) può essere considerata un’applicazione della (88), con A = −jh̄ ∂/∂ξi . In generale, si assume che operatori A come quello introdotto sopra agiscano sulle coordinate spaziali, ma non sul tempo. Essi tuttavia possono contenere il tempo come parametro, come ad esempio nel caso dell’operatore hamiltoniano (65), che contiene il tempo attraverso l’energia potenziale V . Conviene aggiungere che la (88) è una relazione fisicamente accettabile solo se il primo membro è reale: esso deve infatti rappresentare una quantità misurabile sperimentalmente. La condizione che il primo membro della (88) sia reale impone che il secondo membro sia uguale al proprio complesso coniugato. Ciò limita la classe degli operatori accettabili a quelli che verificano la proprietà Z Z ∗ (Aψ) ψ d3 ξ = ψ ∗ Aψ d3 ξ . (89) Ω Ω Su questo aspetto saranno dati maggiori dettagli nel paragrafo XII. Conviene osservare che la (88) implica e quindi D hA − hAii = 0 , (90) E (A − hAi)2 = A2 − hAi2 , (91) dove il quadrato dell’operatore è definito dalla relazione . A2 ψ = A(Aψ). Come ulteriore esempio si possono considerare polinomi nelle componenti del momento. Ad esempio, il valore di aspettazione del quadrato di una componente del momento si calcola a partire dall’operatore ∂2 . p̂2i = p̂i p̂i = −h̄2 2 . ∂ξi (92) Dalla (92) si ricava h̄2 2 1 p̂21 + p̂22 + p̂23 = − ∇ , 2m 2m ξ (93) M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI che mostra come il primo termine dell’operatore hamiltoniano è l’operatore associato all’energia cinetica della particella. Di conseguenza, Z 1 2 h̄2 hp̂1 + p̂22 + p̂23 i = − ψ ∗ ∇2ξ ψ d3 ξ (94) 2m 2m Ω è il valore di aspettazione dell’energia cinetica. XI. PACCHETTO GAUSSIANO Una funzione d’onda normalizzabile è detta anche pacchetto d’onde. Usando per semplicità un dominio monodimensionale −∞ < ξ < +∞, un caso particolarmente importante è quello di un pacchetto che, a un fissato istante t0 , ha la forma " # 2 (ξ − x) 1 exp jkξ − , (95) ψ0 (ξ) = p√ 4s2 2π s dove x, s e k sono parametri assegnati, i primi due dei quali hanno le dimensioni di una lunghezza, il terzo ha le dimensioni dell’inverso di una lunghezza. Inoltre, s è definito positivo, mentre x e k possono assumere qualunque valore. Evidentemente, un’espressione come la (95) non contiene informazioni sufficienti a descrivere l’evoluzione di ψ negl’istanti successivi a t0 . Per determinare tale evoluzione è infatti necessario risolvere la (66) dopo aver prescritto l’energia potenziale V . La (95) può essere allora considerata una possibile condizione iniziale della (66). Si trova # " 2 1 (ξ − x) , (96) |ψ0 (ξ)|2 = √ exp − 2s2 2π s che è una gaussiana. Per questo, una funzione d’onda della forma (95) prende il nome di pacchetto gaussiano. Ricordando che Z +∞ √ (97) exp −µ2 dµ = π , −∞ si trova che il pacchetto è normalizzato: Z +∞ |ψ0 (ξ)|2 dξ = 1 . (98) −∞ Il valore di aspettazione di ξ si trova ponendo A = ξ nella (88): Z +∞ Z +∞ ∗ hξi = ψ0 ξψ0 dξ = (ξ − x + x) |ψ0 |2 dξ . (99) −∞ −∞ L’ultimo membro della (99) si spezza nella somma di due integrali, il primo dei quali ha nell’integrando il fattore ξ − x. Esso è nullo perché l’integrando è prodotto di una funzione pari e di una dispari, e l’intervallo d’integrazione è simmetrico rispetto all’origine. Il secondo integrale, grazie alla condizione di normalizzazione (98), fornisce hξi = x . (100) Il valore di aspettazione del momento si trova ponendo A = p̂ = −jh̄ d/dξ nella (88): Z +∞ dψ0 ∗ hp̂i = ψ0 −jh̄ dξ (101) dξ −∞ 12 in cui, per la (95), dψ0 −jh̄ = dξ ξ−x + h̄k ψ0 . jh̄ 2s2 (102) Anche la (101) si spezza nella somma di due integrali, il primo dei quali ha nell’integrando il fattore ξ − x. Procedendo come sopra si trova hp̂i = h̄k . (103) Le (100,103) forniscono il significato dei parametri x e k, rispettivamente, Per il significato di s, che è la deviazione standard della gaussiana (96), si può ricordare che √ Z +∞ π 2 2 µ exp −µ dµ = , (104) 2 −∞ da cui E D (ξ − hξi)2 = s2 , rD E (ξ − hξi)2 = s . (105) Ancora, il valore di aspettazione del quadrato del momento si trova ponendo A = p̂ p̂ nella (88): Z +∞ dψ0 d −jh̄ dξ . (106) hp̂2 i = ψ0∗ −jh̄ dξ dξ −∞ Grazie alla (102), la quantità fra parentesi quadre nella (106) vale ! 2 1 (ξ − x) ξ−x 2 2 k + 2− [. . .] = h̄ ψ0 . (107) + 2jk 2s 4s4 2s2 Inserendo la (107) nella (106) si trova che l’ultimo termine non contribuisce all’integrale perché contiene il fattore ξ − x. Usando la (104) si trova 1 2 2 2 k + 2 . hp̂ i = h̄ (108) 4s Combinando la (108) con la (103) si trova, grazie alla (91), h̄2 = p̂2 − hp̂i2 = 2 . (109) 4s Infine, combinando la (109) con la (105), si trova l’importante risultato rD E h̄ ED 2 2 (p̂ − hp̂i) = . (ξ − hξi) (110) 2 D 2 (p̂ − hp̂i) E Il calcolo che conduce alla (110) si può generalizzare al caso di una qualunque funzione d’onda ψ normalizzabile, e senza limitare l’analisi a un dominio monodimensionale. Si trova il seguente risultato: rD E h̄ ED (p̂i − hp̂i i)2 ≥ , (111) (qi − hqi i)2 2 dove qi è una generica coordinata canonica, p̂i è l’operatore associato al momento coniugato a qi , e il segno di uguaglianza vale per il pacchetto gaussiano. A differenza della (110), la (111) può essere dimostrata senza conoscere la forma del pacchetto, e rappresenta l’espressione matematica del principio di indeterminazione o principio di Heisenberg. M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI XII. O PERATORI HERMITIANI Un operatore A può essere usato per costruire un’equazione agli autovalori. In questo paragrafo, e nei successivi in cui si tratta di equazioni agli autovalori, si sottintende sempre che le uniche coordinate che compaiono nell’operatore siano quelle spaziali, o perché A opera su di esse, o perché dipende funzionalmente da queste. Perciò, e differenza del caso piú generale trattato nel paragrafo X, qui l’operatore A non contiene il tempo. L’insieme degli autovalori costituisce lo spettro dell’operatore. La forma dell’equazione è Avn = An vn , (112) dove An è l’autovalore e vn l’autofunzione. Poiché la (112) è omogenea, le autofunzioni sono definite a meno di una costante moltiplicativa arbitraria (alla (112) si applicano le stesse considerazioni sull’omogeneità delle condizioni al contorno svolte nel paragrafo VIII per l’equazione di Schrödinger). Dal momento che un operatore ha piú di un autovalore, anzi, in generale ne ha infiniti, si usa un indice n per contare gli autovalori. In realtà, a seconda dell’operatore, del dominio su cui viene risolta la (112), e delle condizioni al contorno, possono presentarsi diversi casi: ciascun autovalore può risultare identificato da un solo indice discreto, oppure da un gruppo di indici discreti (in tal caso si parla di spettro discreto); ovvero, ciascun autovalore può risultare identificato da un solo indice continuo, oppure da un gruppo di indici continui (spettro continuo); infine, può avvenire che una parte degli autovalori sia identificata da indici discreti, e l’altra parte sia identificata da indici continui (spettro misto). Un esempio semplicissimo è quello dell’operatore momento (85) in un dominio monodimensionale, per il quale l’equazione agli autovalori è p dv −jh̄ = pv ⇒ v = v(0) exp j ξ , (113) dξ h̄ con v(0) una costante arbitraria. Posto k = p/h̄ si può scrivere l’autovalore come p = h̄k e l’autofunzione come v = vk (ξ). Dal procedimento risolutivo dell’equazione non emerge nessun vincolo su k, che quindi può assumere qualunque valore reale. In conclusione, per il momento in una dimensione si ha un singolo indice continuo, che appunto è k. Un secondo esempio è il caso monodimensionale del quadrato dell’operatore momento introdotto con la (92), che si suppone agisca su autofunzioni non nulle in un intervallo 0 ≤ ξ ≤ a, e identicamente nulle altrove. Indicando l’autovalore con h̄2 k 2 , per l’equazione agli autovalori si trova r nπ 2 d2 v 2 2 − 2 = h̄ k v ⇒ vn = sin ξ , (114) dξ a a p dove n = 1, 2, . . . e la costante 2/a si ricava dalla normalizzazione. Dal procedimento risolutivo emerge un vincolo dal quale si ha k = nπ/a. Perciò l’autovalore h̄2 π 2 n2 /a2 è discreto. Per le considerazioni svolte in questi paragrafi la distinzione fra i tipi di spettri non è rilevante, e quindi si farà riferimento al caso dello spettro discreto in cui ogni autovalore è identificato da un solo indice. 13 Un’altra distinzione importante è la seguente: in certi casi la (112) associa a ciascun autovalore An una e una sola autofunzione vn (l’autovalore è allora detto semplice), in altri casi essa associa a ciascun autovalore An diverse autofunzioni (1) (2) vn , vn , . . . linearmente indipendenti (l’autovalore An è allora detto degenere). Nel caso di un autovalore degenere, il numero di autofuzioni linearmente indipendenti a esso associate può essere finito, ad esempio M (in tal caso si parla di autovalore degenere di ordine M), o infinito (in tal caso si parla di autovalore degenere di ordine infinito). Si noti che, mentre un autovalore può essere degenere, un’autofunzione è sempre semplice, cioè appartiene a uno e uno solo degli autovalori. Inoltre, le autofunzioni sono tutte fra loro linearmente indipendenti. Per le considerazioni svolte in questi paragrafi la distinzione fra autovalori semplici o degeneri non è rilevante, e quindi si farà riferimento al caso di quelli semplici. Nella meccanica quantistica gli autovalori degli operatori sono quantità sperimentalmente misurabili, e quindi devono essere reali. Per questo, come già notato nel paragrafo X, si deve limitare la classe degli operatori accettabili. Per procedere s’introduce la definizione di operatore hermitiano. Un operatore A è hermitiano se Z Z ∗ 3 ∗ (Ag) f d3 ξ (115) g Af d ξ = Ω Ω per ogni coppia di funzioni f, g per le quali esistono gl’integrali della (115). Come si vede, questa definizione generalizza la (89). Si trova subito che un operatore reale e puramente moltiplicativo, dipendente dalle sole coordinate spaziali e dal tempo (come ad esempio l’energia potenziale V ) è hermitiano. Inoltre sono hermitiani gli operatori p̂i e p̂2i , definiti rispettivamente dalle (85) e (92), e quindi è hermitiano l’operatore hamiltoniano (65). Posto f = g = vn , inserendo la (112) nella (115) si trova Z Z An |vn |2 d3 ξ = A∗n |vn |2 d3 ξ , (116) Ω Ω in cui gl’integrali sono strettamente positivi dal momento che vn , essendo un’autofunzione, non può essere identicamente nulla. Segue A∗n = An , cioè gli autovalori di un operatore hermitiano sono reali. Adesso si possono considerare due autovalori diversi, Am e An . Posto f = vn , g = vm si trova, con lo stesso procedimento di prima, Z Z 3 ∗ ∗ An vm vn d ξ = Am vm vn d3 ξ . (117) Ω Ω Dal momento che gl’integrali della (117) sono uguali, l’uguaglianza fra il primo e il secondo membro è verificata solo se Z ∗ vm vn d3 ξ = 0 , n 6= m . (118) Ω L’integrale a primo membro della (118) è detto prodotto scalare di vn e vm , e si indica anche col simbolo hvm |vn i. Quando il prodotto scalare di due funzioni è nullo, esse si dicono ortogonali. M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI 14 In conclusione, si è dimostrato che gli autovalori di un operatore hermitiano sono reali e che le autofunzioni appartenenti ad autovalori diversi sono fra loro ortogonali. Si può dimostrare che, nel caso di autovalori degeneri, le autofunzioni linearmente indipendenti appartenenti allo stesso autovalore si possono scegliere in modo da essere a due a due ortogonali. Perciò si può affermare che le autofunzioni di un operatore hermitiano sono sempre a due a due ortogonali. Se, inoltre, sono normalizzabili, cioè vale per ogni n la relazione hvn |vn i = 1, allora si dice che le autofunzioni costituiscono un sistema ortonormale di funzioni. Si dimostra facilmente che, per un operatore hermitiano A, il valore di aspettazione di A2 = AA è non negativo. Infatti, Z Z 2 (Aψ)∗ (Aψ) d3 ξ , (119) ψ ∗ A (Aψ) d3 ξ = A = Un insieme di funzioni vn che consente lo sviluppo (121) è detto completo. Dalla definizione (124) discende immediatamente che, per un dato insieme completo di funzioni vn , i coefficienti sn con cui si calcola lo sviluppo sono unici. Usando la (121) si può dimostrare che se un operatore ha gli autovalori reali, allora esso è hermitiano. Perciò, la condizione che A sia hermitiano è necessaria e sufficiente perché gli autovalori An siano reali. Sempre usando la (121) si trova X |ψ|2 = ψ ∗ ψ = s∗m (t)sn (t) vm (ξ)∗ vn (ξ) . (125) Ω Ω dove l’integrando dell’ultimo membro vale |Aψ|2 e quindi è non negativo. La proprietà vale evidentemente anche per l’operatore A − hAi. Perciò, ricordando la (91), si trova per un operatore A hermitiano la relazione 2 2 A ≥ hAi . (120) XIII. C OMPLETEZZA DELLE AUTOFUNZIONI È noto che funzioni che soddisfano opportuni vincoli di integrabilità possono essere sviluppate in serie o in integrale di Fourier. Ora, le funzioni seno e coseno non sono le uniche che consentono di ottenere lo sviluppo di una funzione. Si può dimostrare che possono essere usate, naturalmente cambiando opportunamente la definizione dei coefficienti dello sviluppo, le autofunzioni degli operatori hermitiani tipici della meccanica quantistica. Piú precisamente, sotto opportune condizioni di integrabilità della funzione d’onda, che qui si supporranno sempre verificate, quest’ultima può essere espressa con la serie X ψ(ξ, t) = sn (t) vn (ξ) , (121) mn Integrando la (125) su tutto il dominio e l’ortonormalità delle vn si trova Z X |ψ|2 d3 ξ = |sn (t)|2 , Ω N →∞ Ω n L’espressione dei coefficienti sn (t) si trova moltiplicando scalarmente la (121) per vm . Assumento che le autofunzioni siano normalizzate, per cui hvm |vn i = δmn , si trova Z X ∗ vm (ξ)ψ(ξ, t) d3 ξ = sn (t) δmn = sm (t) , (123) Ω n per ogni m, cioè sn (t) = hvn |ψi . (124) (126) n che generalizza una nota proprietà degli sviluppi di Fourier e prende il nome di teorema di Parseval. Ricordando quanto detto nel paragrafo IX, quando l’integrale viene calcolato su tutto il dominio il primo membro della (126) è indipendente dal tempo, e quindi anche il secondo membro si riduce a una costante. Se, inoltre, ψ è normalizzata, allora si ha X |sn (t)|2 = 1 . (127) n Questa relazione consente di attribuire un significato notevole ai coefficienti sn : ricordando che lo sviluppo (121) è svolto nelle autofunzioni di A, si trova che |sn (t)|2 è la probabilità che all’istante t la quantità dinamica associata ad A abbia il valore An . Inoltre, attraverso i coefficienti sn (t) si può dare un significato notevole al valore di aspettazione (88). Usando la (121) e ricordando che A non opera sul tempo si trova infatti X ∗ ψ ∗ Aψ = s∗m (t) sn (t) vm (ξ) Avn (ξ) = mn = X ∗ s∗m (t) sn (t) An vm (ξ) vn (ξ) , (128) mn n dove le vn sono le autofunzioni di un operatore hermitiano A. Come nel paragrafo XII si considera per semplicità il caso di autovalori semplici e identificati da un solo indice discreto, ma la (121) si generalizza agli altri casi. L’indice n corre su tutti i possibili valori, in modo che la serie (121) contenga tutte le autofuzioni vn . Tipicamente, la convergenza della serie si P(N ) verifica in media, nel senso che, indicando con una n somma ridotta di N termini della serie, si ha 2 Z (N ) X lim sn (t) vn (ξ) d3 ξ = 0 . (122) ψ(ξ, t) − usando da cui, integrando su tutto il dominio, X X hAi = s∗m (t)sn (t) An δmn = |sn (t)|2 An . mn (129) n Il valore di aspettazione dell’operatore A è perciò la media pesata degli autovalori di questo, in cui il peso dell’autovalore An è |sn (t)|2 . XIV. D INAMICA DEI VALORI DI ASPETTAZIONE Per determinare l’evoluzione temporale del valore di aspettazione si deve calcolare la (88) oppure la (129) a ogni istante. Di conseguenza, è necessario calcolare preventivamente la funzione d’onda a ogni istante, risolvendo l’equazione di Schrödinger dipendente dal tempo (66). È tuttavia possibile scrivere alcune relazioni che mettono in luce aspetti formali della teoria, senza la necessità di risolvere la (66). Per questo, si considerino preliminarmente due operatori hermitiani A e B, e un terzo operatore C definito dalla relazione ABf − BAf = j Cf , (130) M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI 15 valida per qualunque funzione f a cui possano applicarsi gli operatori (spesso l’indicazione esplicita della funzione f viene omessa). L’operatore C è detto commutatore di A e B. Si dimostra che C è anch’esso hermitiano. Se A e B sono tali che C = 0, allora essi vengono detti commutativi. Ad esempio, p̂ = −jh̄ d/dξ e p̂2 sono commutativi. Al contrario, ξ e p̂ non sono commutativi, dato che df d(ξf ) ξ −jh̄ + jh̄ = j h̄f , (131) dξ dξ In realtà l’analogia col caso classico non può essere sfruttata ai fini pratici: come si vede dalla (137), per conoscere la forza media hFi i bisogna conoscere la funzione d’onda, e quindi bisogna aver preventivamente risolto l’equazione di Schrödinger. Solo se la forza ha una variazione spaziale cosı̀ lenta da poter essere considerata costante nella regione in cui è significativa la funzione d’onda, allora si può usare la semplificazione (detta approssimazione di Ehrenfest) Z Z ∂V 3 ∂V |ψ|2 hFi i = − d ξ≃− |ψ|2 d3 ξ , (139) ∂ξi ∂ξi Ω Ω cioè in questo caso C = h̄ 6= 0. Per procedere, si consideri un operatore A che non contiene il tempo (l’estensione al caso in cui A contiene il tempo è immediata). La derivata rispetto al tempo del valore di aspettazione di A si trova a partire dalla definizione (88). Scambiando la derivata con l’integrale si ottiene Z ∗ ∂ψ ∂ψ d ∗ d3 ξ . (132) hAi = Aψ + ψ A dt ∂t ∂t Ω Usando le (68) si trasforma la (132) nella Z j d hAi = ψ ∗ (H A − A H) ψ d3 ξ . dt h̄ Ω (133) La (133) mostra che tutti gli operatori che non contengono il tempo e commutano con l’hamiltoniano hanno un valore di aspettazione che si conserva nel tempo. Un’applicazione notevole della (133) si ha scegliendo A = ξi oppure A = p̂i . Nel primo caso, si trova subito che ξi commuta con l’energia potenziale V e con gli addendi dell’operatore cinetico (93) che non contengono l’indice i. Perciò H ξi − ξi H = − h̄ h̄2 ∂ = p̂i . m ∂ξi jm (134) Inserendo questa nella (133) con A = ξi si trova d 1 hξi i = hp̂i i . (135) dt m Nel secondo caso, p̂i commuta con l’operatore cinetico (93), ma non con l’energia potenziale V . Perciò H p̂i − p̂i H = jh̄ ∂V . ∂ξi Inserendo questa nella (133) con A = p̂i si trova Z ∂V 3 d |ψ|2 d ξ = hFi i , hp̂i i = − dt ∂ξi Ω (136) (137) dove Fi = −∂V /∂ξi è la ima componente della forza. È interessante notare come le (135,137) somiglino alle relazioni dinamiche classiche. Infatti, se s’identifica dhξi i/dt con la ima componente della velocità del pacchetto e hp̂i i con la ima componente della sua quantità di moto, la (135) riproduce la relazione classica fra quantità di moto e velocità. A sua volta, la (137) generalizza la relazione classica fra la derivata temporale di una componente della quantità di moto e l’omologa componente della forza. Derivando rispetto al tempo la (135) e inserendo il risultato nella (137) si trova la generalizzazione della legge di Newton: 2 hFi i = m d hξi i . dt2 (138) dove le parentesi quadre Rindicano che la forza è calcolata in ξ = hξi. Ricordando che Ω |ψ|2 d3 ξ = 1 si ricava la legge di Newton. XV. E Q . DI S CHR ÖDINGER INDIPENDENTE DAL TEMPO Si consideri la (121), in cui per ora le funzioni vn (ξ) sono le autofunzioni di un generico operatore, e si sostituisca la serie nell’equazione di Schrödinger dipendente dal tempo (66). Ricordando che H non opera sul tempo si ottiene X n sn (t) Hvn (ξ) = X n jh̄ dsn (t) vn (ξ) . dt (140) Se ora si considera il caso conservativo, cioè quello in cui l’energia potenziale V non dipende dal tempo, l’operatore hamiltoniano risulta anch’esso indipendente dal tempo e quindi è origine di un’equazione agli autovalori. Le autofunzioni di H saranno indicate con wn per distinguerle da quelle degli altri casi. Gli autovalori, che hanno le dimensioni di un’energia, saranno indicati con En . In definitiva, Hwn (ξ) = En wn (ξ) . (141) La (141) è detta equazione di Schrödinger indipendente dal tempo. Dal momento che l’operatore hamiltoniano è associato all’energia totale, i suoi autovalori En sono possibili valori dell’energia totale della particella. Sostituendo la (141) nella (140) e raccogliendo, si trova X dsn En (142) +j sn wn = 0 . dt h̄ n Poiché il primo membro della (140) si annulla per ogni ξ, e le funzioni wn sono fra loro linearmente indipendenti, la (140) è verificata solo se si annullano individualmente i termini fra parentesi. In conclusione, En t . (143) sn (t) = cn exp −j h̄ Sostituendo la (143) nella (121), si trova per il caso conservativo X En ψ(ξ, t) = cn wn (ξ) exp −j t . (144) h̄ n Ricordando l’interpretazione dei coefficienti sn (t) data nel paragrafo XIII, la probabilità che l’autovalore (in questo caso l’energia totale della particella) sia En è data da |sn (t)|2 = M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI |cn |2 , quindi è indipendente dal tempo. Il valore di aspettazione dell’energia totale è in questo caso X En − Em hHi = c∗m cn En exp −j t δmn = h̄ mn X = |cn |2 En . (145) n La (145) mostra che nel caso conservativo il valore di aspettazione dell’energia totale è una costante del moto, come peraltro si poteva dedurre ponendo A = H nella (133) e osservando che un operatore commuta con sè stesso. Se, in seguito a un’ulteriore informazione (resa disponibile, ad esempio, da una misura), è noto che a un certo istante l’energia totale della particella è l’autovalore imo Ei , la (145) diviene compatibile con tale informazione ponendo |cn |2 = δin . In altri termini, la media degli autovalori dell’energia totale coincide con il singolo autovalore Ei . La relazione |ci |2 = 1 individua il numero complesso ci a meno della fase, che risulta indeterminata. Peraltro, la probabilità che l’energia totale della particella sia Ei è determinata solo dal modulo di ci , quindi la fase di ci non fornisce alcuna informazione. In conclusione, si può considerare nulla la fase di ci e porre ci = 1. Si consideri sempre il caso in cui è noto che a un generico istante t0 l’energia totale della particella assume il valore Ei . Se, negl’istanti successivi a t0 , la dinamica della particella continua a essere descritta dallo stesso hamiltoniano (in altri termini, se non intervengono perturbazioni), la funzione d’onda per t ≥ t0 si ottiene ponendo cn = δin nello sviluppo (144). Infatti, come detto in precedenza, lo sviluppo della funzione d’onda secondo un dato insieme di autofunzioni è unico. Perciò i coefficienti dello sviluppo, che in questo caso sono le costanti cn , devono coincidere con quelli dell’istante iniziale. Ponendo per semplicità t0 = 0 si trova Ei ψ(ξ, t) = wi (ξ) exp −j t . (146) h̄ In particolare, in questo caso il valore dell’energia totale resta sempre Ei , e il valore medio degli autovalori dell’energia totale coincide con Ei . Per concludere si può notare quanto segue: l’insieme delle autofunzioni wn di un hamiltoniano conservativo è completo, è quindi anch’esso può essere usato per lo sviluppo di una funzione d’onda piú generale (cioè corrispondente a un caso non conservativo). In altri termini, ricordando la (121), vale uno sviluppo della forma X ψ(ξ, t) = sn (t) wn (ξ) , sn (t) = hwn |ψi . (147) n In diverse considerazioni è utile far apparire nella (147), oltre che le autofunzioni wn , anche gli autovalori En a cui queste corrispondono. Ciò può ottenersi introducendo un insieme di funzioni ausiliarie an (t) definite da En . t , (148) an (t) = sn (t) exp j h̄ da cui ψ(ξ, t) = X n En t . an (t) wn (ξ) exp −j h̄ (149) 16 XVI. D EDUZIONE DELL’ EQUAZIONE DI S CHR ÖDINGER The method used by Schrödinger to determine the timeindependent equation (141) can be synthesized as follows. In classical mechanics, besides the Lagrangian and the Hamiltonian approaches, there is another method based upon the socalled Hamilton-Jacobi equation. The unknown of the latter is a function S = S(q, t), which is related to the components of the momentum by pi = ∂S . ∂qi (150) After replacing the components pi with ∂S/∂qi within the Hamiltonian function, the latter becomes a function of the generalized coordinates and time only. The dependence on the coordinates is both explicit and, through S, implicit. One can then demonstrate that the Hamilton equations can be replaced by the Hamilton-Jacobi equation ∂S ∂S ∂S ,..., ,t = 0, (151) + H q1 , . . . , qn , ∂t ∂q1 ∂qn where a system of particles with n degrees of freedom is considered. The above is a first-order differential equation in the unknown function S (called Hamilton principal function). The equation must be supplemented with n+1 integration constants because there are n+1 independent variables q1 , . . . , qn , t. One of these constants is necessarily an additive constant on S, because only the first derivatives of S appear in the equation. Once S is found, one is able to reconstruct the time evolution of all qi and pi . In the conservative case H(q1 , . . . , qn , p1 , . . . , pn ) = E = const one easily sees that the Hamilton-Jacobi equation can be separated by letting ∂W , ∂qi ∂W ∂W H q1 , . . . , qn , =E, ,..., ∂q1 ∂qn S = W − E t, pi = (152) (153) with W = W (q1 , . . . , qn ) the Hamilton characteristic function. Consider by way of example a single particle of mass m. Using the rectangular coordinates xi and a Hamiltonian function of the form p2 H= + V (x1 , x2 , x3 , t) , p2 = p21 + p22 + p23 , (154) 2m the Hamilton-Jacobi equation reads | grad S|2 ∂S + + V (x1 , x2 , x3 , t) = 0 . (155) ∂t 2m If V is independent of time, then H = E and the separation S = W − E t yields ∂S/∂t = −E, grad S = grad W = p. It follows | grad W |2 + V (x1 , x2 , x3 ) = E . (156) 2m On notes that W and S have the dimensions of the product of a momentum by a coordinate, that is, an action. Like S, also W is defined apart from an additive constant. Also, the form of | grad W | is uniquely defined by that of V − E. In turn, E is prescribed by the initial conditions of the particle’s motion. M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI 17 Now, consider the case where E ≥ V within a closed domain Ω whose boundary is ∂Ω. As grad W is real, the motion of the particle is confined within Ω, and grad W vanishes at the boundary ∂Ω. The Hamilton-Jacobi equation for W may be recast in a different form by introducing an auxiliary function w such that w = w0 exp(W/µ) , (157) where the prime indicates the derivative with respect to x. The left hand side of the equation may be considered the generating function g = g(w, w′ , x) of a functional, defined over an interval of the x axis that may extend to infinity: Z b 2 µ ′ 2 2 (163) (w ) + (V − E) w dx . G[w] = 2m a with µ a constant having the dimensions of an action. The other constant w0 is used for prescribing the dimensions of w. Apart from this, the choice of w0 is arbitrary due to the arbitrariness of the additive constant of W . Taking the gradient of both sides yields µ grad w = w grad W , with w 6= 0 due to the definition. As grad W vanishes at the boundary, grad w vanishes there as well. As a consequence, w is constant over the boundary. The Hamilton-Jacobi equation takes the form µ2 | grad w|2 + V (x1 , x2 , x3 ) = E , (158) 2m w2 which determines | grad w/w| as a function of V − E. Rearranging the above and observing that div(w grad w) = w∇2 w + | grad w|2 provides µ2 div(w grad w) − w∇2 w + (V − E) w2 = 0 . (159) 2m Integrating over Ω and remembering that grad w vanishes at the boundary one finds Z µ2 2 ∇ w + (V − E) w dΩ = 0 . (160) w − 2m Ω The term in brackets of the above equation does not necessarily vanish. In fact, the form of w is such that only the integral as a whole vanishes. On the other hand, by imposing that the term in brackets vanishes, and replacing µ with h̄, the Schrödinger equation independent of time is obtained: h̄2 2 ∇ w + (V − E) w = 0 . (161) 2m This result shows that the Schrödinger equation derives from a stronger constraint than that prescribed by the Hamilton-Jacobi equation. An immediate consequence of replacing the integral relation with the differential equation is that the domain of w is not limited any more by the condition E ≥ V , but may extend to infinity. As a consequence, it is not necessary any more that the boundary conditions of w are prescribed over ∂Ω. Another consequence is that, if the boundary conditions are such that w vanishes over the boundary (which, as said above, may also be placed at infinity), then the equation is solvable only for specific values of E, that form its spectrum of eigenvalues. Moreover it can be demonstrated, basing on the form of the Schrodinger equation, that the condition E ≥ Vmin must be fulfilled. It is interesting to note another relation between the Schrödinger and the Hamilton-Jacobi equations. For the sake of simplicity one takes the one-dimensional case of the Hamilton-Jacobi equation expressed in terms of w: − µ2 (w′ )2 + [V (x) − E] w2 = 0 , 2m (162) One finds d µ2 ′ ∂g d ∂g = w , = 2 (V − E) w , (164) ′ dx ∂w dx m ∂w showing that the Schrödinger equation is actually the EulerLagrange equation d ∂g ∂g = (165) ′ dx ∂w ∂w of the functional G. This result holds also in the higherdimensional cases. The conclusion of this reasoning is that the Hamilton-Jacobi equation provides the function w that makes G to vanish, whereas the Schrödinger equation provides the function (or the functions) w for which G has an extremum.