1 Meccanica statistica dell`equilibrio - Dipartimento di Fisica

Corso di Termodinamica e Meccanica Statistica
Anno Accademico 2011/2012 – Lezione 17
1
Meccanica statistica dell’equilibrio
Nella trattazione di un sistema termodinamico abbiamo considerato essenzialmente due
approcci:
• Approccio cinetico. Si cerca di derivare una equazione di evoluzione per la statistica
microscopica del sistema. Si ipotizza che i componenti microscopici del sistema (per
esempio le molecole di un gas) siano in prima approssimazione scorrelati e si finisce
per studiare l’evoluzione della distribuzione degli stati della singola componente.
Sotto certe condizioni di esistenza di equilibrio statistico, e l’entropia di Shannon
del sistema ha un buon comportamento, si può associare l’equilibrio statistico a
un equilibrio termodinamico del sistema e derivare tutte le più importanti relazioni
termodinamiche per lo stesso.
• Approccio termodinamico. Si tralascia ogni informazione sulle caratteristiche microscopiche del sistema e ci si limita a postulare l’esistenza di una funzione di stato
entropia e di una variabile intensiva temperatura che descrivono le proprietà di equilibrio termodinamico del sistema. Al contrario che nell’approccio cinetico, le leggi di
stato del sistema non vengono derivate e sono supposte date.
Vi è un terzo approccio, che è quello della meccanica statistica dell’equilibrio, o meccanica
statistica di Gibbs. In questo caso, come nell’approccio cinetico, si parte da un punto
di vista microscopico; viene però saltata accuratamente ogni considerazione su come il
sistema raggiunge l’equilibrio. Quello che ci si limita a fare è postulare l’esistenza di un
equilibrio statistico associato a un massimo di entropia del sistema. Da questa condizione
di massimo, unitamente ad alcune ipotesi importanti sulla struttura della PDF di equilibrio
ρ (la PDF nel Γ-spazio; tralasciamo il pedice N per alleggerire la notazione) e sul tipo di
partizione utilizzata nella definizione di entropia, viene poi derivata tutta la termodinamica
all’equilibrio.
I vantaggi di quest’ultimo approccio risiedono nella sua potenza nel trattare sistemi con
dinamica complicata o in presenza di regimi correlati. Un esempio importante sono i fenomeni critici (magneti alla temperatura critica, teorie di campo). La meccanica statistica
sarà in particolare in grado di trattare sistemi in cui gli effetti quantistici sono importanti.
Questa potenza va però a scapito dell’ambito di applicabilità del metodo, che è ristretto a
sistemi la cui dinamica microscopica è di tipo Hamiltoniano.
Consideriamo un sistema Hamiltoniano isolato con N gradi di libertà. Un tale sistema
sarà descritto da 2N coordinate canoniche {qi , pi ; i = 1, . . . N } (nel caso di un gas, per
la particella i-esima avremmo tre coordinate {qi1 , qi2 , qi3 } ≡ {xi1 , xi2 , xi3 } e tre momenti
1
coniugati {pi1 , pi2 , pi3 } ≡ m{vi1 , vi2 , vi3 }, cioè 3N gradi di libertà per 6N coordinate canoniche). La coordinate canoniche {qi , pi ; i = 1, . . . N } definiscono il nostro Γ-spazio e su di
esso definiamo la PDF ρ = ρ({qi , pi }; t).
Il fatto che il sistema isolato abbuia una dinamica di tipo Hamiltoniano ha alcune
importanti conseguenze:
• L’energia è conservata. Quindi, se inizialmente l’energia del sistema è U , la PDF ρ
avrà la forma ρ({qi , pi }; t) ∝ δ(H({qi , pi }) − U ), dove H({qi , pi }) è l’Hamiltoniana
del sistema. La condizione H({qi , pi }) = U individua la superficie a energia costante
lungo la quale evolvono le traiettorie del sistema isolato.
• Il volume nello spazio delle fasi è conservato (teorema di Liouville). Questo ha
per conseguenza il fatto che una distribuzione ρ uniforme è stazionaria.
• Siccome le traiettorie evolvono sulle varietà a energia costante, individuate dalla
relazione H({qi , pi }) = U per diversi valori di U , anche una PDF uniforme in gusci
compresi tra superfici con valori diversi di U sarà stazionaria. Prendendo il limite di
gusci infinitamente sottili, otteniamo il risultato importante, valido per un sistema
isolato, che una PDF dipendente solo dalla energia del sistema sarà stazionaria.
Ora, un sistema isolato avrà sempre un’energia ben definita. Ha quindi senso considerare
una PDF che è non nulla solo in uno di questi gusci a energia fissata:
(
∆Γ−1 , H({qi , pi }) ∈ [U, U + ∆U ]
ρM ({qi , pi }) =
0
altrimenti
dove ∆Γ = ∆Γ(U ) è il volume della regione di Γ-spazio compresa fra energie U e U + ∆U e
∆U è una scala energetica di coarse-graining arbitraria. La PDF indicata qui sopra gioca un
ruolo fondamentale nella meccanica statistica ed è detta distribuzione microcanonica.
Nota. Diamo qui la dimostrazione che una distribuzione uniforme su gusci a U costante è
stazionaria. Consideriamo una descrizione pienamente microscopica del sistema. In questa
maniera il dettaglio degli urti è completamente risolto e le variabili {qi , pi ; i = 1, . . . N } evolvono nel tempo in maniera continua. In queste condizioni, l’evoluzione della ρ è descritta
da una equazione di continuità, detta equazione di Liouville:
∂ρ
+ ∇{qi ,pi } · (ρV{qi ,pi } ) = 0
∂t
dove ∇{qi ,pi } e V{qi ,pi } sono rispettivamente il gradiente e il campo di velocità nel Γ-spazio:
∇{qi ,pi } ≡ (∂q1 , . . . ∂qN , ∂p1 , . . . ∂pN )
V{qi ,pi } ≡ (q̇1 , . . . q̇N , ṗ1 , . . . ṗN )
Allo stato stazionario, l’equazione di Liouville può essere scritta nella forma
V{qi ,pi } · ∇{qi ,pi } ρ = −ρ∇{qi ,pi } · V{qi ,pi }
2
e l’equazione di Liouville ammetterà una soluzione stazionaria uniforme nel Γ-spazio a
patto che il flusso nel Γ-spazio è incomprimibile: ∇{qi ,pi } · V{qi ,pi } = 0. La condizione di
incomprimibilità (cioè di conservazione del volume) nello spazio delle fasi è soddisfatta
grazie alle equazioni di Hamilton
q̇i =
∂H
;
∂pi
ṗi = −
∂H
;
∂qi
da cui ottengo
∇{qi ,pi } · V{qi ,pi } =
X ∂ q̇i
i
1.1
∂qi
+
∂ ṗi X ∂ ∂H
∂ ∂H −
=
=0
∂pi
∂q
∂p
∂p
∂q
i
i
i
i
i
Il concetto di ensemble
L’identificazione della distribuzione microcanonica ρM con la distribuzione di equilibrio del
sistema anche se intuitivamente ragionevole presenta una serie di problemi concettuali. Ne
diamo una rapida panoramica.
Una prima osservazione che è necessario fare riguarda la “misurabilità” di una PDF del
Γ-spazio. Una PDF nel µ-spazio può essere ottenuta contando il numero di molecole che si
trovano istantaneamente in una data celletta nello spazio 6-dimensionale (x, v). Ciascuna
molecola è quindi un campione e la PDF è ottenuta a partire dal limite di una frequenza
(ovvero media campionaria della funzione indicatrice della celletta). Alternativamente,
possiamo focalizzarci su una molecola e calcolare la PDF a partire da una media temporale,
cioè come frazione di tempo in cui la molecola in questione si trova nella cella data (media
temporale della funzione indicatrice della celletta).
Nel caso del Γ-spazio, le procedure descritte qui sopra diventano fisicamente irrealizzabili. Ciascun punto nel Γ-spazio non corrisponde infatti alla coordinata e velocità di una
molecola, bensı̀ allo stato dell’intero sistema isolato. I campioni che entrano nel calcolo
della ρ a partire da media campionaria sono quindi stati microscopici del sistema. Identicamente, il calcolo di una media temporale andrebbe fatto a priori osservando lo stato
dell’intero sistema.
L’insieme dei punti di fase corrispondenti ai diversi stati del sistema che entrano nel
calcolo delle medie campionarie vengono chiamate un ensemble. Per esempio, un insieme
di punti distribuiti come ρM è detto ensemble microcanonico.
Il fatto che entrambe le medie su Γ-spazio sono fisicamente irrealizzabili diventa evidente
contando le cellette che sarebbe necessario considerare per avere un campionamento minimo
dello spazio in questione. Supponendo di dividere in due in ciascuna direzione del Γ-spazio
(per dire, molecola 1 può stare a sinistra o a destra, con velocità positiva o negativa, e cosı̀
via in ogni direzione dello spazio fisico e per ogni molecola), ci ritroveremmo già cosı̀ un
numero di cellette pari a 2N , dove N è dell’ordine del numero di Avogadro: N ∼ 1023 .
Questo è il numero minimo di realizzazioni che sarebbero necessarie per campionare
decentemente il nostro Γ-spazio. Una determinazione alternativa tramite media temporale
3
soffre delle stesse limitazioni. In questo caso abbiamo un solo punto di fase (il nostro
sistema) che deve esplorare 2N cellette e il tempo necessario cresce quindi come 2N ∆t,
dove ∆t è il tempo di permanenza in ciascuna celletta. Ora il tempo ∆t può essere al più
dell’ordine del tempo di collisione diviso per il numero di molecole (in un tempo di collisione
τcoll ciascuna molecola del sistema farà tipicamente una collisione, quindi ci saranno N
collisioni nel sistema e il tempo fra ciascuna collisione sarà ∼ τcoll /N ). Un sistema, per
esplorare tutto il Γ spazio, richiederebbe pertanto un tempo molto superiore alla durata di
vita dell’universo.
Raggiungiamo quindi le seguenti conclusioni:
• Non è possibile fisicamente verificare la forma di una distribuzione nel Γ-spazio.
• Evidentemente questa forma non deve essere importante; di fatto le proprietà macroscopiche del sistema (per dire, l’energia di una sua parte macroscopica) devono
essere quasi costanti in gran parte del dominio in cui ρM è non nulla.
• Un’ipotesi ragionevole del tipo ρ = ρM permette quindi di calcolare medie di quantità
macroscopiche senza problemi e il principale vantaggio di una tale scelta è la facilità
nei conti.
1.2
Il problema ergodico
Legato alle difficoltà discusse qui sopra è il cosı̀ detto problema ergodico: siamo sicuri che
medie di ensemble e medie temporali coincidono nel Γ-spazio? Abbiamo visto a suo tempo
che una condizione per l’ergodicità di un processo stocastico x(t) è l’indecomponibilità del
suo spazio delle configurazioni: non devono esistere regioni del dominio di x inaccessibili
se x parte da qualche altra regione dello stesso dominio.
Nel caso di un sistema conservativo isolato, tale proprietà di indecomponibilità evidentemente non è soddisfatta: il sistema non può spostarsi fra regioni ad energia diversa. La
risposta a questo stato di cose è stato l’ensemble microcanonico. La questione ergodica è
precisamente cosa succederebbe se esistessero altre quantità conservate oltre l’energia (ed
eventualmente il momento lineare e il momento angolare del sistema).
Una risposta a questa domanda è stata fornita da Khinchin (A.I. Khinchin, “Mathematical foundations of statistical mechanics”) e si può riassumere (forse in maniera
leggermente tautologica) nelle seguenti due osservazioni:
• Se la quantità conservata ha un significato macroscopico, l’ensemble microcanonico
va generalizzato per tenere conto della presenza di tale quantità.
• Se la quantità non ha un significato macroscopico, allora la scelta della distribuzione dei possibili suoi valori può essere effettuata in maniera arbitraria e il risultato
delle medie delle grandezze macroscopiche, per definizione, non deve variare. In
particolare, la scelta in cui i valori di questa quantità sono distribuiti uniformentemente, corrispondente alla distribuzione microcanonica originaria, è perfettamente
accettabile.
4
Terminiamo la nostra analisi con alcune considerazioni riguardo il significato di equilibrio
statistico nel Γ-spazio. Ricordo che ρM è la distribuzione di equilibrio del sistema, se,
indipendentemente dalle condizioni iniziali ρ({qi , pi }, t = 0), questa è la soluzione a cui
tende a grandi t la PDF ρ({qi , pi }, t). Osserviamo di passaggio che perché questo equilibrio
statistico possa essere chiamato un equilibrio termodinamico del sistema, è necessario che
questo corrisponda a un massimo dell’entropia. L’analisi che abbiamo svolto nel caso di un
gas ideale ci ha portato a scoprire però che non esiste una definizione univoca di entropia.
D’altra parte, l’approccio all’equilibrio di un sistema corrisponde a una singola traiettoria
nello spazio Γ. Vedremo che la soluzione al problema è quella di utilizare una definizione
istantanea di entropia (del tipo di Sf˜ per intendersi), piuttosto che una di tipo statistico
standard.
2
Il concetto di entropia
La discussione che abbiamo portato avanti sembra suggerire che l’unica maniera di dare un
significato fisico a una PDF sul Γ-spazio è attraverso la media di grandezze macroscopiche.
In questo quadro, un ruolo centrale è svolto dal concetto di entropia. A questo scopo
introdurremo una nuova forma di entropia espressa in termini di grandezze macroscopiche
(entropia di Gibbs) che da un lato permetterà di stabilire una connessione fra statistica
(mondo microscopico) e termodinamica (mondo macroscopico), e dall’altro permetterà
di chiarire il significato dell’ensemble microcanonico, non solo come una distribuzione di
equilibrio (non solo quindi stazionaria).
Richiamiamo le varie definizioni di entropia che abbiamo incontrato sin’ora:
• L’entropia di Shannon −hln ∆Pk i, dove ∆Pk è la probabilità dell’elemento k della
partizione del nostro spazio dei campioni. Nel caso del Γ-spazio, la partizione naturale
era quella uniforme ∆P = ρ({qi , pi })δΓ, che ci permette di considerare in alternativa
una definizione di entropia tramite PDF (con tutti i caveat del caso). Il volume della
celletta δΓ, in meccanica classica, è arbitrario, e fissa il livello di coarse-graining del
nostro sistema (dovrebbe essere per lo meno a scala sufficientemente piccola da far sı̀
che le medie di quantità microscopiche – entropia a parte – ne risultino indipendenti.
3N
Invocando la meccanica quantistica il volume della
R celletta sarebbe δΓ = (2π~) ).
Otteniamo quindi per l’entropia S = −hln(ρ)i = dΓρ ln(ρδΓ), dove per ragioni che
diverranno ben presto chiare, preferiamo tenere conto del contributo delle cellette δΓ.
• Eliminando il contributo all’entropia dovuto a distinguere nella partizione configurazioni differenti solo per scambio di molecole, abbiamo ottenuto la forma alternativa
di entropia S̄N = hln(N !ρ)i. Questo ci ha permesso di soddisfare la proprietà di
addittività nell’entropia di sistemi di molecole identiche.
• Trascurando la dipendenza statistica fra le molecole ci ha permessoRdi scrivere l’entropia S in termini della entropia di una singola molecola S̄ ≃ Sf = d3 xd3 v f (x, v; t)
× ln(f (x, v; t)δµ), dove f (x, v; t) era la densità di molecole nel µ-spazio e δµ è il
volume della celletta nel µ-spazio.
5
• Abbiamo visto che quest’ultima forma di entropia (a meno di un fattore costante
dato dalla costante di Boltzmann) coincide con l’entropia termodinamica del sistema
e da qui siamo stati in grado di introdurre il concetto di temperatura attraverso una
condizione di massimo per l’entropia di un sistema composto da corpi in grado di
scambiare calore fra loro.
Un aspetto centrale della procedura è stato la possibilità di esprimere l’entropia di un
sistema composto da vari sottosistemi macroscopici come la somma delle entropie dei sottosistemi. Punto essenziale era la possibilità di trattare i singoli sottosistemi in equilibrio
con sé stessi, e quindi esprimere la loro entropia in funzione di parametri termodinamici
interni come temperatura e volume.
L’entropia di Gibbs usa questo come un punto di partenza. La dipendenza dell’entropia
dai parametri macroscopici del sistema è ottenuta a partire da una suddivisione del sistema
in parti macroscopiche, ciascuna contenente cioè un gran numero di molecole. Il vettore dei
parametri macroscopici mk che caratterizzano lo stato dei sottosistemi k = 1, 2, . . . definisce
lo stato macroscopico o macrostato del sistema. Per contro, un punto, o più precisamente
una celletta, nel Γ-spazio individua lo stato microscopico o microstato del sistema. A
volte (generando un po’ di confusione rispetto alla definizione usuale) ci si riferisce allo
spazio di definizione del vettore {mk } come µ-spazio del sistema. La coincidenza con la
definizione usuale si avrebbe considerando come sottosisistema una singola molecola (che
però, ovviamente, non è una parte macroscopica del sistema).
Notiamo immediatamente che la suddivisione in sottosistemi è arbitraria. Potremmo
accontentarci ad esempio di considerare il sistema in blocco, oppure interessarci del contenuto di energia di un volumetto del sistema. Potremmo anche considerare una suddivisione
non in volumetti, ma in intervalli di velocità molecolari, contando in questo caso il numero
di molecole in ciascuno di essi, come nel calcolo della funzione di distribuzione istantanea
f˜(x, v; t).
Il fatto che i sottosistemi siano macroscopici fa sı̀ che le molecole nell’uno siano indipendenti da quelle negli altri, e che sia possibile scrivere la PDF nel Γ-spazio nella
forma
Y
ρ=
ρk ;
k
(questo a patto di stare attenti ai problemi del tipo paradosso di Gibbs che vengono generati
se non si impone l’indistinguibilità delle moleocole). L’entropia del sistema può essere
espressa come una somma di entropie dei sottosistemi k:
Z
S̄k = − dΓk ρk (Γk ) ln(Nk !ρk δΓk )
(indichiamo per semplicità il punto nel Γ-spazio per il sottosistema con Γk e similmente per
il sistema isolato). A questo punto, si ipotizza che per ciascun valore di mk , la PDF ρk sia
di tipo microcanonico, e cioè uniforme per ciascun valore del parametro macroscopico mk
(questo corrisponde di fatto ad ipotizzare una condizione di massima entropia S̄k fissato il
parametro macroscopico mk , e quindi anche di massima entropia S̄ fissata la configurazione
{mk }).
6
• Detto in altri termini, si ipotizza che i microstati corrisponti al dato valore di mk
siano equiprobabili.
In alcune circostanze, come nel caso di una porzione di sistema contenuta in un certo
volume, questa condizione può essere interpretata come il risultato di un equilibrio interno,
che si suppone venga raggiunto più velocemente che quello con le altre porzioni di sistema.
(In altri casi, come quando si studiano insiemi di molecole con diverse energie, una tale
interpretazione non è chiaramente possibile).
Ora, essendo il sottosistema macroscopico, l’integrale per S̄k sarà dominato dai punti
di Γk in cui il parametro macroscopico mk assume il suo valore di equilibrio hmk i, e quindi:
S̄k ≃ − ln(Nk !ρM
k (hmk i)δΓk )
dove ρM
k (mk ) è la PDF uniforme nella regione di Γ-spazio del sottosistema corrispondente
al valore mk del parametro macroscopico. Indicando con ∆Γk (hmk i) il volume della reM
gione in cui ρM
k (mk ) è sostanzialmente differente da zero, possiamo scrivere ρk (hmk i) ≃
1/∆Γk (hmk i) e l’entropia prenderà la forma:
S̄k ≃ ln(∆Γk (hmk i)/(Nk !δΓk )) ≡ ln(∆Γ̄k (hmk i))
dove ∆Γ̄k (hmk i) è il numero di microstati (non contando configurazioni che differiscono solo
per scambio di molecole) che realizza il dato macrostato. A questo volume di Γ-spazio per
il sottosistema corrisponderà un intervallo ∆mk che descrive l’ampiezza delle fluttuazioni
intorno all’equilibrio del parametro mk .
Notiamo che, in maniera analoga con quanto fatto con l’entropia di Boltzmann Sf˜, che
era calcolata a partire dalla densità istantanea f˜ e non dal suo valore medio f , possiamo
definire l’entropia del sottosistema come funzione del valore istantaneo del parametro mk
S̄k (mk ) = ln(∆Γ̄k (mk )),
dove ∆Γ̄k (mk ) sarà il volume di ΓA corrispondente a una regione di larghezza ∆mk del
parametro macroscopico attorno a mk . La quantità S̄k (mk ) sarà in genere una funzione
fluttuante, che ci permette di descrivere situazioni di non-equilibrio. Abbiamo infatti,
grazie al fatto che le fluttuazioni ∆mk sono molto piccole:
S̄k ≃ S̄k (hmk i) ≃ hS̄k (mk )i
e la media coincide con il valore di S̄k (mk ) al suo massimo. In altre parole, l’equilibrio termodinamico è realizzato come massimo rispetto agli mk . dell’entropia S̄({mk }) =
P
(La funzione S̄({mk }) è talvolta chiamata entropia di Gibbs). Ragk S̄k (mk ).
giungiamo pertanto la seguente interpretazione statistica della condizione di equilibrio
termodinamico:
• L’equilibrio termodinamico corrisponde al macrostato che può essere realizzato attraverso il numero massimo di microstati.
7
Il comportamento dell’entropia che abbiamo descritto corrisponde a quello dell’entropia
termodinamica. La coincidenza è totale quando i sottosistemi sono associati a porzioni
fisiche per cui abbia senso parlare di un equilibrio interno. Per esempio, se la porzione
è il gas contenuto in un volume racchiuso da pareti conduttrici di calore all’interno del
sistema, e la variabile mk è la sua energia. In tal caso, l’entropia Sk (Uk ) coincide con
l’entropia termodinamica per il sottosistema. Notiamo come la dipendenza del volume
∆Γ̄k dal valore ∆mk sia praticamente irrilevante. Questo a causa del grande numero di
dimensioni del Γ-spazio che fa sı̀ che la maggior contributo al numero di microstati venga
dalla direzioni lungo la superfice a Uk costante e non dallo spessore finito ∆Uk . Questo ha
come risultato il fatto che nel calcolo dell’entropia S̄k (Uk ) è irrilevante se il sottosistema
ha energia Uk perché è in equilibrio con un bagno termico o è isolato (l’unica differenza è
di fatto che nel secondo caso, ∆Uk ha solo il significato di un coarse-graining).
8