Carlo Dariol STRUTTURA DELLA MATERIA Modulo di Fisica della Materia Condensata che si basa sugli appunti dei professori Roberto Raimondi, del Dipartimento di Matematica e Fisica dell’Università RomaTre e Luciana Di Gaspare, del Dipartimento di Scienze dell’Università RomaTre Descrizione generale Le applicazioni dell’elettricità e dell’elettronica sono presenti in moltissimi aspetti della nostra vita quotidiana. Tali applicazioni sono possibili grazie a una comprensione profonda e dettagliata delle proprietà elettriche dei solidi, in particolare dei metalli e dei semiconduttori. In queste lezioni esamineremo gli aspetti generali sui quali si fonda la nostra comprensione delle proprietà di conduzione elettrica nei solidi. Successivamente ci soffermeremo su alcuni fenomeni importanti per le applicazioni tecnologiche come la magnetoresistenza gigante in spintronica, la superconduttività e l’effetto Hall quantistico. Il modulo è diviso in due parti. La prima (tenuta dal professor Raimondi) si sviluppa su sei lezioni (sei capitoli) che trattano delle proprietà di conduzione elettrica dei dispositivi, attraverso una introduzione alla meccanica statistica classica e quantistica, al ruolo da essa giocato nello sviluppo della meccanica quantistica, l’illustrazione della teoria della conduzione elettrica basata sul modello classico di Drude, la descrizione degli stati elettronici nei solidi, il fenomeno della superconduttività, l’effetto di magneto-resistenza gigante e l’effetto Hall quantistico. Nella seconda parte (tre lezioni tenute dalla professoressa Di Gaspare), che tratta della Fisica dei Semiconduttori e alle Nanoscienze, si introducono le proprietà fondamentali degli stati elettronici dei semiconduttori e i principi del loro impiego nell’elettronica; quindi si introducono le nanoscienze, discutendo come le proprietà fisiche dipendono dalla dimensionalità dei sistemi. Attraverso alcuni esempi rilevanti si mostrerà come i progressi scientifici e tecnologici siano in questi ambiti altamente interconnessi e versatili, producendo risultati innovativi in diversi campii quali ad esempio l’ICT, la biomedica, i materiali. 1 PARTE I MAPPA CONCETTUALE DELLE LEZIONI Cap. 1 – La meccanica statistica pag. 5 1.1. La teoria cinetica dei gas. 1.2. La distribuzione di Maxwell delle velocità in un gas di particelle classiche. Il metodo combinatorio di Boltzmann. 1.3. Il metodo combinatorio applicato da Planck al problema della radiazione di corpo nero. La formula di Planck. 1.4. L’emergere del concetto di fotone nella termodinamica della radiazione di corpo nero. Il gas di fotoni. 1.5. Test ed esercizi Cap. 2 – La teoria dei metalli pag. 25 2.1. Il modello di Drude della conduzione elettrica nei metalli. 2.2. L’effetto Hall classico e sua descrizione nel modello di Drude. 2.3. La statistica quantistica di Fermi-Dirac e il gas di Fermi. 2.4. Approfondimento: il modello di (Drude–)Sommerfeld 2.5. Test ed esercizi Cap. 3 – I livelli elettronici nei solidi pag. 44 3.1. Il “solido” biatomico 3.2. Il solido unidimensionale 3.3. Il teorema di Bloch (il “cuore” della teoria dei livelli elettronici nei solidi) 2 3.4. La teoria delle bande 3.5. Appendice: Reticolo di Bravais. Reticolo reciproco. La zona di Brillouin (BZ). Il teorema di Bloch e la serie di Fourier. 3.6. Test ed esercizi Cap. 4 – La spintronica pag. 64 4.1 Cos’è la spintronica? Alcune idee sui sistemi paramagnetici e ferromagnetici. 4.2. La fenomenologia dell’effetto di magneto-resistenza gigante (GMR). 4.3. Il modello di conduzione a due canali 4.4. Interpretazione e teoria dell’effetto GMR 4.5. Applicazioni. Cenni sull’applicazione dell’effetto GMR alle memorie magnetiche. 4.6. Test ed esercizi Cap. 5 – L’effetto Hall quantistico pag. 82 5.1. Fenomenologia dell’effetto Hall quantistico. Densità degli stati. 5.2. Livelli di energia di Landau per una particella in presenza di un campo magnetico. 5.3. Trattazione matematica 5.4. Stati di bordo e quantizzazione della resistenza di Hall. 5.5. Appendice: argomento di Laughlin 5.6. Test ed esercizi Cap. 6 – La superconduttività pag. 107 6.1. Significato della superconduttività. L’effetto Meissner di espulsione del flusso magnetico da un superconduttore. 6.2. La teoria fenomenologia di London e (6.3.) la natura dello stato superconduttivo. 6.4. La teoria della superconduttività. Cenni alla teoria microscopica BCS della superconduttività. PARTE II C. Kittel, Introduzione alla Fisica dello Stato solido Casa Editrice Ambrosiana Sommario parte II pag. 130 Cap. 7 – Introduzione alla fisica dei semiconduttori 7.1. Bande di energia e classificazione dei solidi. Bande di valenza, bande di conduzione e gap diretta e indiretta nei semiconduttori. Occupazione delle bande a temperatura nulla e a temperatura finita in semiconduttori intrinseci. 3 7.2. Bande di energia nei semiconduttori. Conduzione elettrica in un semiconduttore. 7.3. Concetto di lacuna 7.4. Conduzione elettrica. Massa efficace nei solidi: applicazione alla banda di valenza e alla banda di conduzione. 7.5. Drogaggio e densità dei portatori dei semiconduttori. 7.6. Test ed esercizi. Cap. 8 – I semiconduttori nell’elettronica pag. 164 8.1. Drogaggio di tipo n e drogaggio di tipo p. Modello idrogenoide per le energie degli stati elettronici di impurezze droganti. Densità dei portatori intrinseci e estrinseci in funzione della temperatura. L’effetto Hall classico. Giunzione p-n all’equilibrio: diffusione, regione di deplezione. Polarizzazione diretta e inversa della giunzione p n. 8.2. Il diodo. 8.3. I diodi LED, la scelta del materiale semiconduttore. Barriere Schottky . 8.4. Principi di funzionamento del transistor. 8.5. Test ed esercizi. Cap. 9 – Nanoscienze e nanotecnologie pag. 182 9.1. I principi delle nanoscienze. Proprietà fisiche e dimensionalità: introduzione allo studio e alla manipolazione dei materiali, dei dispositivi e dei fenomeni fisico/chimici su scala nanometrica 9.2. Nanoscienze ed elettronica. Ingegneria di banda nei semiconduttori. Sistemi 2D: eterostrutture fra semiconduttori; buche per elettroni e buche per lacune Introduzione alle tecniche di imaging alla nanoscala. 9.3. Nanotecnologie. Introduzione alle tecniche di fabbricazione per le nanotecnologie 9.4. Imaging dei nanosistemi: come vedere le nanostrutture. Microscopi elettronici. Microscopie a scansione di sonda: microscopio a effetto tunnel (STM); microscopio a forza atomica (AFM) 9.5. Alcuni esempi di applicazione effetti quantistici in nanostrutture di semiconduttori e delle nanoscienze. Cenni sul grafene. 9.6. Test. 4 PARTE I Introduzione In ultima analisi le proprietà elettriche dei solidi sono dovute alle cariche elettriche libere di muoversi al loro interno. Un solido è fatto di atomi, a loro volta composti di un nucleo e di elettroni. Come vedremo più in dettaglio nel seguito, in un solido conduttore gli elettroni non sono associati ad un particolare atomo. Piuttosto, gli elettroni sono liberi di muoversi da un atomo all’altro e quindi di condurre una corrente elettrica. Gli elettroni quindi si comportano come un gas di particelle che riempie tutto il volume occupato dal solido. La descrizione del loro comportamento richiede quindi l’utilizzo dei concetti della meccanica statistica e della teoria cinetica dei gas. Dobbiamo quindi necessariamente partire da alcune idee fondamentali della meccanica statistica. Nell’esaminare gli aspetti fondamentali della meccanica statistica ci renderemo conto del ruolo fondamentale che hanno avuto nello sviluppo della meccanica quantistica. Capitolo 1 La Meccanica Statistica 1.1. La teoria cinetica dei gas Il classico libro “Fisica atomica” di Max Born contiene un’eccellente esposizione del ruolo della meccanica statistica nell’avvento della meccanica quantistica e la nascita della fisica dei solidi. Si consultino in particolare i paragrafi 1-8, 55-58, 60-61 La teoria cinetica dei gas (T.C.G.) fu formulata per la prima volta da Daniel Bernoulli (1700-1782) nel 1738 nel suo libro “Hydrodynamica”. 5 L’idea di base è quella mutuata dalla chimica, ovvero che la materia è fatta di costituenti elementari semplici: li chiameremo atomi o molecole, che nel caso dei gas sono costantemente in moto. Bernoulli intende spiegare la pressione nei termini dell’ipotesi atomica. Nella figura è rappresentato in modo schematico un gas, fatto di costituenti elementari, palline che si muovono all’interno di un contenitore: le linee tratteggiate rappresentano le traiettorie; le particelle rimbalzano sulle pareti del recipiente come sulle pareti di un biliardo. L’idea di Bernoulli fu quella di ricondurre la pressione che il gas esercita sulle pareti di un contenitore agli urti (elastici) che le molecole del gas compiono sulle pareti del contenitore: questo è l’esempio di una riduzione meccanica di un fenomeno termico: la temperatura è una misura dell’energia cinetica media. Vediamo come si fa il calcolo della pressione Consideriamo una parete (Wall) particolare del contenitore, perpendicolare all’asse x. Il gas è a sinistra della parete. Consideriamo l’urto di una molecola che impatta su tale parete. In un urto elastico la componente della velocità parallela alla parete si conserva, mentre cambia segno quella perpendicolare. In ogni urto la particella trasferisce alla parete una quantità di impulso pari alla differenza tra il suo impulso finale e quello iniziale: p x 2mv x In base alla seconda legge della dinamica di Newton, la forza esercitata sulla parete è pari all’impulso trasferito per unità di tempo: f x p x . t La forza esercitata è quindi dovuta all’effetto cumulativo degli urti che avvengono nell’unità di tempo. Il numero degli urti è dato dal numero di molecole che nell’unità di tempo vanno a collidere con la parete. Le molecole interessate sono quelle che si trovano in un cilindro (“cilindro collisionale”) con asse perpendicolare alla parete di altezza pari alla distanza percorsa nell’unità di tempo e di base A Calcoliamo il numero delle molecole contenute nel cilindro collisionale. 6 Numero molecole = densità x volume cilindro N Av x t V Il numero delle molecole che vanno a sbattere è il numero degli urti. Infine ricordiamo che la pressione è definita come la forza esercitata per unità di superficie. Quindi dividendo per la base del cilindro otteniamo la pressione N N P 2mv x v x 2mv x2 V V Per rendere il precedente argomento indipendente dal valore particolare della velocità, possiamo considerare il valor medio della velocità. Per simmetria, valori positivi della velocità sono ugualmente probabili. Inoltre, se assumiamo l’isotropia dello spazio, i valori medi delle velocità sono uguali per le tre direzioni. I valori positivi contribuiscono per metà: v x 2 1 2 vx 2 Possiamo quindi generalizzare a tutte e tre le dimensioni dello spazio, che devono essere 1 2 v 3 1N 2E m v2 La pressione è proporzionale all’energia cinetica media: P 3V 3V 2 2 2 equivalenti per l’isotropia dello spazio: v x v y v z La legge dei gas perfetti Il comportamento sperimentale dei gas è descritto dalla legge di Boyle dei gas perfetti secondo la quale la pressione e il volume sono inversamente proporzionali. Per una mole di gas, il numero di molecole è pari al numero di Avogadro NA=6,022x1023. N PV nmoli RT RT NA R = 8,314 J/(K mol) è detta costante dei gas. Il significato della temperatura 2 3 Se confrontiamo l’espressione di Bernoulli ( PV E ) con la legge di Boyle richiamata sopra ( PV nmoli RT ), otteniamo l’espressione della temperatura come una misura dell’energia cinetica media: 2 2 N 2 E R E nRT E RT T 3 3 NA 3 N NA Il rapporto tra la costante R dei gas e il numero di Avogadro definisce la costante di Boltzmann kB: 7 2 E 2 mv 2 k BT 3N 3 2 kB R 1,3807 10 23 J K 1 NA Il teorema di equipartizione La relazione tra energia cinetica media e temperatura rappresenta un caso particolare di un teorema generale della meccanica statistica: il teorema di equipartizione: E 3 N A k BT 2 Ogni grado di libertà ha, in media, un’energia pari a 1 k BT 2 Domande 1) Perché la pressione esercitata dalle molecole del gas dipende dal quadrato della velocità? 2) Qual è la definizione della costante di Boltzmann? 3) Cosa afferma il teorema di equipartizione? 1.2. La distribuzione di Maxwell L’argomento di Bernoulli non spiega come si effettua la media. Per calcolare le medie in meccanica statistica occorre qualcosa di più. Per questo Maxwell introduce il concetto di funzione di distribuzione nello spazio delle fasi. Qui sotto abbiamo una rappresentazione “pittorica” di un caso abbastanza semplice, quello in cui le particelle si possono muovere in una sola direzione. La generalizzazione al caso tridimensionale è tuttavia abbastanza facile. Ogni puntino rosso indica una particella con date posizione e velocità. Questa distribuzione di punti è quella che si chiama una “distribuzione nello spazio delle fasi”. Per particelle che si muovono nelle tre dimensioni lo spazio delle fasi ha sei dimensioni. 8 Macrostati e microstati La completa conoscenza del microstato del sistema corrisponde a sapere, a ogni istante, la posizione e velocità di ogni particella (microstato). Una conoscenza statistica si accontenta di sapere qual è il numero di particelle che hanno un determinato valore (o intervallo di valori) della posizione e un determinato valore (o intervallo di valori) della velocità, cioè di sapere come sono distribuite le particelle nello spazio delle fasi (macrostato). Questo è lo stesso approccio delle società assicuratrici. La funzione di distribuzione descrive quindi un macrostato. Esempio: una particella A che ha velocità 5 e una particella B che ha velocità 10 sono un microstato diverso da quello in cui A ha velocità 10 e B ha velocità 5… ma le due particelle insieme, nel primo e nel secondo caso, individuano lo stesso macrostato: una particella con velocità 5 e l’altra 10. I due microstati concorrono allo stesso macrostato. Il numero di microstati che concorrono a formare lo stesso macrostato determinerà il peso statistico di quel macrostato. La distribuzione di Maxwell La distribuzione delle velocità nello spazio delle fasi per quanto riguarda un gas fu dedotta da James Clerk Maxwell (1831 – 1879) nel 1866, più di un secolo dopo il lavoro pioneristico di Bernoulli. Quella a destra è la distribuzione delle velocità dell’ossigeno a diverse temperature Quella sotto è la formula che Maxwell ricavò (e che tra poco andremo a derivare) e dà il numero di particelle che hanno velocità compresa tra v e v+dv. 32 m 2 mv 2 2 k BT v e f v N 4 2k B T In tale formula compare il numero totale di particelle, N; compare la massa delle particelle, m; e per quanto riguarda la velocità, compaiono due fattori con v2, una potenza e un’esponenziale negativo. Il massimo della curva è in corrispondenza della velocità più probabile. 9 Il parametro T (temperatura) fa cambiare forma alla curva. Derivazione della distribuzione La forma della distribuzione può essere ricavata, come fece Maxwell, con considerazioni di simmetria basate sull’isotropia dello spazio. A tale scopo si fanno le seguenti ipotesi: 1. la distribuzione della componente i-esima della velocità è identica per tutti gli i=x,y,z. 2. le distribuzioni per componenti diverse sono reciprocamente indipendenti; 3. la distribuzione della velocità totale dipende solo dal suo modulo. La formulazione matematica di queste ipotesi è la seguente equazione funzionale, evidentemente soddisfatta dalla distribuzione di Maxwell ricordando le proprietà della funzione esponenziale: g v x g v y g v z G v x2 v y2 v z2 Dobbiamo determinare le funzioni g (distribuzioni delle singole componenti, tutte uguali tra di loro per l’ipotesi 1.) e la funzione G (distribuzione delle velocità quadratiche in modulo). A sinistra abbiamo il prodotto delle g quale conseguenza dell’ipotesi 2. Prendiamo il logaritmo di entrambi i membri lng vx g v y g vz ln G vx2 v y2 vz2 e deriviamo rispetto a una delle variabili, ad esempio, rispetto a g ' v x G ' v 2 2v x g v x G v 2 ovvero vx : 1 g ' v x G ' v 2 2v x g v x G v 2 Poiché i due membri dipendono da variabili diverse, devono essere uguali ad una stessa costante. Integrando si ottiene la distribuzione di Maxwell. Domanda - La funzione di distribuzione nello spazio delle fasi fornisce: a. la posizione e la velocità di ogni singola particella a un dato istante. b. la densità media di particelle che hanno una data velocità e una data posizione, a un dato istante. c. la velocità media delle particelle ad un dato istante. [La risposta corretta è la b.] 10 Arriva Boltzmann sulla scena Nel 1872, ovvero sei anni dopo che Maxwell ebbe proposto la sua distribuzione delle velocità, irruppe sulla scena Ludwig Boltzmann (1844-1906). Per approfondire l’opera di Boltzmann è consigliata la lettura di The Man Who Trusted Atoms, di Carlo Cercignani Il programma di Boltzmann è quello di comprendere non solo la funzione di distribuzione in equilibrio, ma come l’equilibrio viene raggiunto. I suoi ingredienti sono: 1. argomenti probabilistici; 2. grandi numeri; 3. condizioni iniziali. All’epoca, l’uso delle probabilità in fisica non era così diffuso. Riportiamo qui sotto un brano dello stesso Boltzmann in proposito. “L’uso del calcolo delle probabilità in un caso particolare non può essere giustificato in modo rigoroso… Nonostante ciò, ogni compagnia assicurativa fa affidamento su di esso… L’assunzione che questi eventi rari non sono osservati in natura non è strettamente dimostrabile (né lo è l’intera rappresentazione meccanica stessa), ma alla luce di ciò che si è detto, è così naturale ed ovvio, e così in accordo con tutta l’esperienza con le probabilità, . . . che nessun dubbio su questo punto può mettere in discussione la validità della teoria quando risulta d’altronde così utile. È completamente incomprensibile per me come si possa vedere una confutazione dell’uso del calcolo delle probabilità nel fatto che qualche altro argomento mostra che delle eccezioni devono presentarsi adesso e dopo un’eternità di tempo; infatti il calcolo delle probabilità ci insegna esattamente questo.” (Ludwig Boltzmann, Ann.der.Physik, 60,392 (1897)) Abbiamo accennato prima che diversi microstati concorrono a formare lo stesso macrostato e quindi ne determinano il peso statistico. Come si calcola? Peso statistico dei macrostati 1. Si divide lo spazio delle fasi in K celle. K è scelto arbitrariamente e opportunamente, di caso in caso. 2. Ogni cella contiene un certo numero di particelle (immaginiamo di dividere il piano cartesiano usato prima in celle). 3. L’insieme dei numeri di occupazione definisce un macrostato 4. Più microstati corrispondono a un macrostato I riquadri verdi sono le celle, che abbiamo numerato in blu: 1, 2, 3, …, 14, …, 23, …, 30. Osserviamo, ad esempio, che nel range di valori corrispondente alla cella 23 cadono 3 particelle. 11 N1, N2, …, Nk è un particolare macrostato… ovvero una maniera rapida per dare la distribuzione delle particelle nello spazio delle fasi; nel caso sopra k=30 e il macrostato è 1, 1, 1, 1, 0, 0, 2, 0, 2, …, 3, 1, 2, 1, 1, 1, 2, 2. I numeri appena scritti sono i numeri di occupazione. La loro somma è N=42 Il metodo combinatorio 1. Le proprietà fisiche dipendono dalla funzione di distribuzione dei numeri di occupazione. 2. Il problema è di determinare quale scelta ha la maggiore probabilità di presentarsi tenendo costante la somma dei numeri di occupazione. 3. Il problema è ridotto a un problema di calcolo combinatorio. Vediamo qui sotto un esempio con numero di celle K=2 e numero totale di particelle N=2. L’esempio è irrealistico ma serve a chiarire le idee; le due particelle le abbiamo indicate con colori diversi per distinguerle: una blu e una verde. Osservazione: il macrostato corrispondente a N=1 e N=1 può essere realizzato in due microstati diversi e ha un peso statistico, W, doppio rispetto a quello degli altri macrostati. 12 La distribuzione più probabile? Il volume dello spazio delle fasi è ripartito in celle K i i 1 Le i sono i volumetti delle singole celle. rappresenta dunque la generalizzazione dello spazio cartesiano visto prima (dove il “volume” delle celle era l’area delle celle). Ad ogni cella i-esima corrisponde un’energia media associata al valore medio dell’impulso nella cella pi2 i 2m I vincoli da osservare Il nostro scopo è determinare, tra tutte quelle possibili, la distribuzione più probabile, compatibilmente con i vincoli dettati dalla legge di conservazione dell’energia e del numero di particelle: K K N Ni E N i i i 1 i 1 Spazio delle fasi a N molecole Lo spazio delle fasi per N molecole è pari al volume dello spazio delle fasi di una molecola elevato al numero totale delle molecole N ... N Dato un insieme di numeri di occupazione, cioè un macrostato, vogliamo determinare quale volume occupa nello spazio delle fasi di N molecole. Volume per una cella Il volume nello spazio delle fasi di N particelle occupato dalle particelle in una data cella si ottiene moltiplicando il volume della cella per se stesso tante volte quante sono le particelle nella cella: i i i ... i i N i Tanto maggiore sarà questo volume (nello spazio delle fasi) tanto maggiore sarà il peso statistico di tale macrostato. 13 Volume per tutte le celle Il peso statistico nello spazio delle fasi a N particelle per una certa distribuzione è dato prendendo il prodotto su tutte le celle iK1 iN i Fattore combinatorio Boltzmann osserva che il peso statistico di una certa distribuzione di numeri di occupazione si ottiene infine moltiplicando il suo volume nello spazio per il numero di modi possibili di ripartire le particelle tra le celle dopo aver fissato i numeri di occupazione N! iK1 N i ! [è l’analogo che calcolare gli anagrammi di una sequenza di lettere (macrostato): scambiare di posto tra loro due lettere (microstati) uguali non fa variare la parola, cioè il macrostato] Scelti i numeri di un certo macrostato, N i N! Ni K i 1 i iK1 N i ! rappresenta il peso di quel macrostato. Problema Determinare per quale scelta dei numeri di occupazione il volume nello spazio delle fasi N i N! Ni K i 1 i iK1 N i ! è massimo con le condizioni K N Ni i 1 K E N i i i 1 Boltzmann, usando la tecnica dei moltiplicatori di Lagrange per i massimi vincolati (α per N e β per E), determina l’insieme dei numeri di occupazione che determina il massimo del logaritmo del volume nello spazio delle fasi. 14 In meccanica statistica, poiché i numeri in gioco sono molto grandi (abbiamo a che fare con un numero di Avogadro di particelle), è utile usare la formula di Stirling per approssimare il fattoriale: N! 2N N N e N per N>>1 Ci servirà anche l’approssimazione del Log (N!) Log N! NLog N N per N>>1 Dopo aver scritto la lagrangiana (funzione da massimizzare sommata ai vincoli, ciascuno moltiplicato per un moltiplicatore di Lagrange) passiamo a calcolare le derivate parziali rispetto a ciascuna delle variabili, ossia i numeri di occupazione Ni: N i K K K iNi ln N ! N N E N i i i N ! i 1 i 1 i 1 i N i N i ln iNi ln N N i i i Ni i 1 K K N i Ni i 1 i ln N i N i i N i Ni i i 0 L’ultima equazione ci dice che, per fissati valori dei vincoli, cioè per fissati valori di i , è determinato un particolare valore di N i . Boltzmann dimostra, quindi, che la distribuzione con il maggior peso statistico (cioè i numeri di occupazione N i che rendono massima il peso del macrostato) è: i N i Ce con le costanti da determinare imponendo i vincoli. N i dipende esponenzialmente dall’energia della cella i-esima corrispondente. Esplicitando il moltiplicatore di Lagrange corrispondente (β) e ricordando che l’energia della cella è l’energia cinetica media della cella, si ritrova che questa è proprio la distribuzione di Maxwell, interpretandola però come la distribuzione che ha il maggior peso statistico nello spazio delle fasi. 15 L’entropia secondo Boltzmann Inoltre, Boltzmann definisce il logaritmo del volume nello spazio delle fasi come l’entropia del macrostato: S ln Ni ovvero l’entropia termodinamica di un sistema è proporzionale al logaritmo del peso statistico per una scelta di numeri di occupazione. In questo modo si giustifica la seconda legge della termodinamica, secondo la quale un sistema evolve verso stati di entropia maggiore che sono quelli a peso statistico maggiore. Questo collegamento tra entropia e peso statistico di un macrostato non è campata in aria, ma è facilmente verificabile, almeno nel caso dei gas perfetti: se esplicitiamo il peso statistico di un macrostato (riscrivendolo come una produttoria) e sviluppiamo il logaritmo Ni i i i i S ln N ln N! N i i i ln i N i i 1 otteniamo l’espressione qui sopra. Se ora prendiamo le celle nello spazio delle fasi arbitrariamente piccole (in modo da rendere continua la distribuzione (che è discreta)) la sommatoria sulle celle diventa un integrale nello spazio delle fasi: Ni la diventa la f v di Maxwell, e la formula sopra diventa i V S d vf v ln f v N ln N … e questa è esattamente la 3 dipendenza dell’entropia di un gas perfetto. È utile concludere questo paragrafo citando le parole dello stesso Boltzmann sulla numerosità degli STATI MAXWELLIANI: “La distribuzione di Maxwell è caratterizzata dal fatto che la stragrande maggioranza delle distribuzioni possibili ha le proprietà della distribuzione di Maxwell, e in rapporto a questa maggioranza c’è un numero relativamente piccolo di possibili distribuzioni che deviano in modo significativo da quella di Maxwell. Laddove Zermelo sostiene che il numero di (micro)stati che infine evolvono verso un (micro)stato maxwelliano è piccolo in rapporto all’insieme di tutti i possibili (micro)stati, io sostengo al contrario che la 16 stragrande maggioranza di (micro)stati sono maxwelliani e che il numero di quelli che deviano dallo stato maxwelliano è incomparabilmente piccolo.” (Ludwig Boltzmann, Ann. der Physik, 57, 773(1896) ) La distribuzione di Maxwell – Domande e test 1) Come si sposta il massimo della distribuzione delle velocità al variare della temperatura? 2) Qual è la differenza tra microstato e macrostato? 3) Qual è la definizione di entropia di Boltzmann? 4) Secondo la teoria proposta da Boltzmann, il peso statistico di un dato macrostato è dato: a. dal numero di possibili microstati ad esso associati. b. dal numero di particelle presenti. c. dal numero di particelle che hanno una velocità prefissata. [La risposta esatta è la a.] 1.3. La formula di Planck In questo paragrafo vedremo il contributo dato dalla meccanica statistica alla meccanica quantistica. Il problema del corpo nero L’esigenza di spiegare lo spettro di corpo nero segna la crisi della fisica classica, che funziona solo alle basse frequenze. Il cuore del problema è la determinazione della distribuzione spettrale della densità di energia della radiazione in equilibrio termico con la materia. Planck considera il problema nella maniera più semplice possibile schematizzando la materia come un insieme di oscillatori che, vibrando, emettono ed assorbono radiazione. La novità del suo lavoro del dicembre del 1900 è di ricercare la distribuzione di energia tra gli oscillatori utilizzando il metodo combinatorio di Boltzmann, senza fare riferimento esplicito alle leggi dell’elettromagnetismo. Le parole di Planck “…a me oggi importa... di esporvi nel modo più chiaro possibile il vero punto centrale di tutta la teoria, e ciò può avvenire nel modo migliore col descrivervi qui un nuovo procedimento del tutto elementare, col quale, senza sapere alcunché di una formula spettrale o anche di una qualsiasi teoria, è possibile calcolare numericamente la ripartizione di una data quantità di energia nei singoli colori dello spettro normale con l’aiuto di un’unica costante naturale, e poi con l’aiuto di una seconda costante anche la temperatura di questa energia raggiante.” Planck, Verhandlungen der Deutschen Physikalischen Gesellschaft, 2, 237(1900) La seconda costante è quella di Boltzmann: è Planck a darle il nome con cui oggi è conosciuta. 17 Formulazione del problema A ogni frequenza dello spettro corrisponde un oscillatore che vibra alla stessa frequenza. In equilibrio termico l’energia totale è ripartita tra la radiazione e la materia (oscillatori) Etot Erad E1 ... Ei ... E i = Energia degli oscillatori con particolare frequenza i N i = Numero di oscillatori con frequenza particolare i L’ipotesi di Planck Determinare la distribuzione d’equilibrio significa conoscere la distribuzione dell’energia tra gli oscillatori di diversa frequenza. Planck ipotizza che esista un’energia minima, per ciascuna frequenza, posseduta da ciascun oscillatore i In tal modo ad ogni frequenza corrisponde un numero di pacchetti (celle nel linguaggio di Boltzmann) di energia che devono essere distribuiti tra gli oscillatori di quella frequenza i Ei i Il calcolo combinatorio Quanti sono i modi di distribuire gli i pacchetti (le palline) tra gli N i oscillatori (le scatole) con frequenza i ? o oo ooo o oo In base al calcolo combinatorio tale numero corrisponde ai modi di ordinare le linee rosse (che separano gli oscillatori) e le palline (i pacchetti). Nell’esempio in figura (dove i pacchetti sono 9 e gli oscillatori sono 6), si deve intendere che al primo oscillatore spetta un pacchetto, due toccano al secondo, zero al terzo, etc. i N i i 1! i ! N i 1! Confronto con Boltzmann Nel caso classico (il conteggio di Boltzmann) si calcola come le particelle si distribuiscono tra le celle dello spazio delle fasi. Il conteggio classico corrisponde, come si ricorderà, a moltiplicare, nel caso di due particelle, il numero di stati a disposizione della prima particella per il numero di stati a disposizione della seconda particella. In tal modo si considerano come stati differenti quelli in cui sono particelle diverse ad occupare lo stesso stato. Nel conteggio di Planck, che diventerà quello quantistico, si calcola come le celle (pacchetti) dello spazio delle fasi si distribuiscono tra le particelle (oscillatori). Nel far questo le particelle diventano “indistinguibili”, poiché perde senso 18 seguire il moto di ogni particella nello spazio delle fasi, ma è possibile solo dichiarare il numero di particelle in una data cella nello spazio delle fasi. Il limite classico Si riottiene il caso classico quando il numero di stati a disposizione è molto maggiore del numero degli oscillatori. Chiaramente, se l’energia di ogni pacchetto i è presa infinitamente piccola, il numero di stati i diventa infinitamente grande. N i i 1! iN i i ! N i 1! Ni! i se N i i La distribuzione più probabile Una volta stabilito il numero di pacchetti e quale sia il numero di modi in cui quel numero di pacchetti si può dividere tra gli oscillatori, la tecnica di Planck è la stessa di Boltzmann: stabilire il massimo di questa quantità. Una volta stabilito qual è il peso relativo a una particolare scelta di pacchetti, Planck segue Boltzmann nell’identificare l’entropia degli oscillatori col logaritmo del numero dei modi di distribuire i pacchetti: Si N i k B 1 i Ni i ln1 Ni i i ln N Ni i Questa Si è l’entropia degli oscillatori con energia con frequenza i. L’entropia totale sarà la somma su i. In equilibrio l’entropia deve essere massima (facendo variare gli i ); ancora una volta si tratta di un problema di massimo vincolato e Planck ottiene, usando il metodo di Boltzmann, il numero medio di pacchetti per oscillatore che rende massima l’entropia: i Ni 1 e i 1 (qui β è un moltiplicatore di Lagrange e, come nel caso classico, acquista il significato dell’inverso di una temperatura). La formula di corpo nero L’ultimo passo di Planck consiste nel mettere in relazione la densità spettrale di energia della radiazione e l’energia media dell’oscillatore usando la teoria elettromagnetica classica e prendendo l’energia dei pacchetti proporzionale alla frequenza dell’oscillatore iesimo. 8 i2 i 8 i2 i u i 3 i 3 c Ni c e i 1 i h i 19 k B T 1 8 i2 Il primo termine, , viene dedotto con le leggi dell’elettromagnetismo classico ed è c3 legato alla geometria del problema. È dunque un ragionamento statistico che guida Planck verso la deduzione della legge spettrale del corpo nero, che apre la strada alla teoria quantistica. La formula di Planck – Domande e test 1) In che senso Planck segue il metodo combinatorio di Boltzmann? 2) Qual è la differenza tra il modo di conteggio degli stati di Boltzmann e quello di Planck? 3) Dove interviene, nel ragionamento di Planck, la teoria dell’elettromagnetismo classico? 4) Secondo la teoria di Planck del corpo nero, ad ogni frequenza dello spettro della radiazione è a. associato un numero minimo di oscillatori che vibrano a quella frequenza, con costante di proporzionalità pari al numero di Avogadro. b. associato un numero minimo di oscillatori che vibrano a quella frequenza, con costante di proporzionalità pari alla costante di Boltzmann. c. associata un’energia minima proporzionale alla frequenza stessa, con costante di proporzionalità pari alla costante di Planck. [La risposta esatta è la c.] 1.4. Il gas di fotoni Il concetto di “fotone” fu introdotto da Einstein cinque anni dopo il lavoro di Planck. Anche lui intuisce, utilizzando un ragionamento termodinamico, una conseguenza interessante del lavoro di Planck. Planck aveva basato la sua distribuzione di pacchetti di energia esclusivamente sugli oscillatori, ovvero sulla materia, e non aveva fatto alcuna ipotesi sulla radiazione. È Einstein che fa un passo avanti fondamentale dando un significato fisico alla costante di Planck. Vediamo il ragionamento di Einstein. La formula di corpo nero inversa Consideriamo la legge di Planck nel limite di Wien, cioè alle alte frequenze o basse densità di radiazione dove la teoria classica (legge di Raleygh-Jeans) non funziona: 8h 3 h u , T e c3 k BT Fissata la frequenza, questa formula può essere esplicitata rispetto alla temperatura 1 k B c 3u ln 3 T h 8h 20 Il ragionamento termodinamico di Einstein parte da una relazione generale della termodinamica, che lega la derivata dell’entropia rispetto all’energia all’inverso della temperatura. In base alla termodinamica, introducendo la densità spettrale di entropia s in analogia alla densità spettrale di energia u, si ha la seguente generale relazione: ds 1 du T Si tratta ora di legare T a u. Usando la formula di Wien inversa e la relazione termodinamica precedente, k B c 3u ds ln du h 8h 3 (quella sopra è un’equazione differenziale che si integra facilmente) Einstein ottiene una relazione tra la densità spettrale di entropia e la densità spettrale di energia (a meno di una costante di integrazione): entropia della radiazione s kB u ln u u h (mentre Planck aveva trovato l’entropia associata agli oscillatori nella materia). Se adesso riesprimiamo la densità di energia in funzione dell’energia totale U divisa per il volume V ( u U V ), la relazione di Einstein implica la dipendenza dell’entropia della radiazione dal volume S kB U U U ln 1 k B lnV h V h dove, nel passaggio finale, si è tenuto conto dell’unico termine che dipende dal volume: l’entropia S è proporzionale a lnV. Quindi Einstein si ricorda che, per un gas perfetto, descritto dalla distribuzione di Maxwell-Boltzmann, la dipendenza dell’entropia dal volume è S k B N ln V (dove N è il numero di molecole di un gas) indipendentemente dalle leggi che regolano il moto delle molecole del gas. Il concetto di fotone Einstein propone allora di interpretare euristicamente la formula dell’entropia della radiazione come quella di un gas di corpuscoli di energia o quanti di energia pari a hν: il numero di tali quanti è N U h 21 in modo che la formula diventi S k B N ln V , la stessa dei gas perfetti. Così come nel caso di Planck, è il ragionamento statistico che guida Einstein verso l’introduzione dei quanti di radiazione, che diverranno i fotoni. Gas di fotoni – Domande e test 1) Qual è la relazione termodinamica usata da Einstein per introdurre il concetto di fotone? 2) Qual è la dipendenza dell’entropia dal volume per un gas classico descritto dalla distribuzione di Maxwell-Boltzmann? 3) Qual è la relazione tra energia e frequenza del fotone? 4) Einstein interpreta i risultati di Planck sul corpo nero: a. assumendo che gli oscillatori armonici che rappresentano la materia abbiano energia hν b. assumendo che la radiazione sia composta da particelle di energia hν. c. assumendo che l'energia totale della radiazione divisa per hν dia il numero di oscillatori che oscillano alla frequenza ν. [La risposta corretta è la b.] 1.5. Test ed esercizi La meccanica statistica – Domande conclusive 1) Che cosa s’intende per funzione di distribuzione? 2) Perché l’entropia di un gas non dipende dai dettagli delle leggi del moto? 3) Qual è stato il ruolo della meccanica statistica nella nascita della meccanica quantistica? In base al calcolo combinatorio, qual è il numero di modi di 6 oggetti in 3 contenitori, inserendo 3 oggetti nel primo contenitore, 2 nel secondo e 1 nel terzo? a. 60 b. 720 c. 180 d. 120 e. 240 6 3 1 [La risposta corretta è = 60.] 3 2 1 In base al ragionamento combinatorio di Planck, quanti sono i modi di distribuire ω i=4 pacchetti di energia ϵi tra Ni=3 oscillatori? a. b. c. d. e. 30 15 20 35 8 4 3 1 [La risposta corretta è = 15.] 4 Quale delle seguenti affermazioni meglio descrive l'intento di Planck nel suo lavoro fondamentale sullo spettro del corpo nero? a. L’intento di Planck è di ricercare la distribuzione di energia tra gli oscillatori della materia senza utilizzare il metodo combinatorio di Boltzmann. 22 b. L’intento di Planck è di ricercare la distribuzione di energia tra gli oscillatori della materia utilizzando solamente le leggi dell’elettromagnetismo. c. L’intento di Planck è di ricercare la distribuzione di energia tra gli oscillatori della materia utilizzando il metodo combinatorio di Boltzmann, senza fare riferimento esplicito alle leggi dell’elettromagnetismo. d. L’intento di Planck è di ricercare la distribuzione di energia tra gli oscillatori della materia utilizzando i metodi della meccanica quantistica. e. L’intento di Planck è di ricercare la distribuzione di energia tra gli oscillatori della materia utilizzando il metodo combinatorio di Boltzmann basato sulle leggi dell’elettromagnetismo. [La risposta esatta è la c.] In base al teorema di equipartizione, qual è l’energia media di un gas con N particelle? a. b. c. d. e. (3kBT/2) (NkBT/2) (3NkBT/2) (6NkBT) (3NkBT) [La risposta esatta è la c. Si fa evidentemente riferimento a un gas monoatomico.] Perché la pressione che un gas esercita sulle pareti del recipiente che lo contiene dipende dal quadrato della velocità media delle particelle? a. La dipendenza dal quadrato della velocità segue dall’uguaglianza tra energia cinetica ed energia potenziale durante gli urti. b. La dipendenza dal quadrato della velocità ha origine dal fatto che gli urti avvengono in modo anelastico. c. La dipendenza da vx2 ha origine dal prodotto di due fattori: (i) vx è la velocità prima di ogni urto; (ii) (N/V)AvxΔt il numero di urti nel tempo Δt. In media si ha vx2 →⟨v2⟩/3 d. La dipendenza dal quadrato della velocità segue dalla conservazione del momento angolare durante gli urti. .e. La dipendenza da vx2 ha origine dal prodotto di due fattori: (i) 2mvx è l’impulso trasferito in ogni urto; (ii) (N/V)Avx Δt il numero di urti nel tempo Δt. In media si ha vx2 →⟨v2⟩/3 [La risposta esatta è la e.] In base al metodo delle celle nello spazio delle fasi introdotto da Boltzmann, a cosa corrisponde la distribuzione di Maxwell? a. La distribuzione di Maxwell corrisponde all’insieme più probabile di numeri d’occupazione che soddisfano i vincoli ∑Ki=1Ni=N e ∑Ki=1ϵiNi=E b. La distribuzione di Maxwell corrisponde all’insieme di numeri d’occupazione che soddisfano i vincoli ∑Ki=1Ni=N e ∑Ki=1ϵiNi=E c. La distribuzione di Maxwell corrisponde all’insieme meno probabile di numeri d’occupazione. d. La distribuzione di Maxwell corrisponde all'insieme meno probabile di numeri d'occupazione che soddisfano i vincoli ∑Ki=1Ni=N e ∑Ki=1ϵiNi=E e. La distribuzione di Maxwell corrisponde all'insieme più probabile di numeri d'occupazione. [La risposta esatta è la a.] Qual è il contributo di Einstein alla comprensione della densità spettrale della radiazione del corpo nero? a. Einstein propose di interpretare la formula dell'entropia della radiazione come quella di un gas di particelle con velocità data dalla distribuzione di Maxwell. 23 b. Einstein propose di interpretare la formula dell'entropia della radiazione come quella di un gas di corpuscoli di energia pari a mc2, dove c è la velocità della luce e m è la massa a riposo dei corpuscoli. c. Einstein propose di interpretare la formula dell'entropia della radiazione come quella di un gas di corpuscoli di energia pari a 1/2 mc2, dove c è la velocità della luce e m è la massa relativistica dei corpuscoli. d. Einstein propose di interpretare la formula dell’entropia della radiazione come quella di un gas di corpuscoli di energia pari ad hν, dove h è la costante di Planck e ν è il numero di occupazione medio della cella con energia pari all'energia totale del gas. e. Einstein propose di interpretare la formula dell'entropia della radiazione come quella di un gas di corpuscoli di energia pari ad hν, dove h è la costante di Planck e ν è la frequenza della radiazione. [La risposta corretta è la e.] 24 Cap. 2 Teoria elementare dei metalli I primi tre capitoli del classico libro Solid State Physics di N. W. Ashcroft e N. D. Mermin sono una delle migliori introduzioni alla teoria elementare dei metalli. Argomenti di questo capitolo: 2.1. Il modello di Drude della conduzione elettrica nei metalli 2.2. L’effetto Hall e sua descrizione nel modello di Drude 2.3. La statistica quantistica di Fermi-Dirac e il gas di Fermi 2.1. Il modello di Drude La scoperta dell’elettrone Nel 1897 Joseph John Thomson a Cambridge mostra che i raggi catodici emessi in un tubo a vuoto quando una differenza di potenziale è applicata tra due placche metalliche, consistono in particelle. Tali particelle, che trasportano l’elettricità, sono gli elettroni. Thomson conclude inoltre che gli elettroni sono parte degli atomi. Il modello di Drude Tre anni dopo (cioè nel 1900), Paul Drude propone un modello per spiegare le proprietà di trasporto degli elettroni nei materiali, in particolare la conduzione nei metalli. Drude applica la teoria cinetica dei gas agli elettroni in un solido, con l’aggiunta di alcune ipotesi. In quel momento non sono ancora disponibili le teorie quantistiche ma molti anni dopo si concluderà che effettivamente gli elettroni all’interno di un metallo costituiscono un gas. Annalen der Physik 1, 566 e 3, 369 (1900) 25 Rappresentazione del modello Qui sotto è rappresentato il modello di Drude: ci sono gli atomi (i punti neri) e gli elettroni possono muoversi rapidamente tra di essi come le particelle di un gas all’interno di un solido, ogni tanto urtando gli atomi. Le ipotesi di Drude 1. Gli elettroni all’interno di un solido metallico costituiscono un gas di particelle di massa m e carica unitaria negativa –e. 2. Gli elettroni si muovono liberamente tra una collisione e la successiva con gli ioni del solido. La probabilità di collisione per unità di tempo è l’inverso del tempo medio τ tra un urto e il successivo. 3. In analogia con la teoria cinetica dei gas, gli elettroni, attraverso gli urti, sono in equilibrio termico con gli ioni del solido. 4. Come in un gas, gli elettroni raggiungono l’equilibrio termico attraverso le collisioni. Formulazione matematica In base alla legge fondamentale della dinamica, l’equazione del moto di un elettrone si ottiene considerando la forza esercitata dal campo elettrico sulla carica. L’equazione per la componente della velocità lungo la direzione del campo risulta quindi dv m eE dt Tra un urto e il successivo la velocità aumenta linearmente con il tempo essendo un moto uniformemente accelerato, e la velocità che raggiunge l’elettrone tra un urto e l’altro (tra i quali scorre un tempo τ) è v eE m 26 Formula di Drude La densità di corrente totale, cioè la corrente per unità di superficie, si ottiene moltiplicando la velocità per la densità degli elettroni e per la loro carica. In tal modo si ottiene una relazione lineare tra densità di corrente e campo elettrico eE j env en m 2 e n E E m e 2 n m Significato della formula Il modello di Drude è la prima spiegazione microscopica della legge sperimentale scoperta da Georg Ohm nel 1827. La legge di Ohm connette il valore della corrente elettrica al campo elettrico applicato tramite un coefficiente detto conducibilità elettrica σ. La formula per la conducibilità di Drude dipende dalla densità delle cariche (più densità = più corrente) e inversamente dalla massa degli elettroni (dato che occorre accelerarli), e dipende dal tempo tra due urti (meno urti = tempo medio tra due urti più lungo = più corrente). Dalla misura sperimentale della conducibilità σ e conoscendo la massa dell’elettrone si può stimare il valore del tempo tra due urti. Stima del tempo tra due urti 106 1 m 1 n 10 28 m 3 densità tipica di un solido m 10 30 kg e 10 19 Coulomb massa dell’elettrone (sono considerati solo gli ordini di grandezza) 14 Usando la formula di Drude si ricava l’ordine di grandezza di 10 s . Il tempo tra due urti è stato introdotto in modo fenomenologico. La domanda è: possiamo stimare anche teoricamente l’ordine di grandezza di τ? Questo può essere fatto, sempre nell’ambito della meccanica statistica, introducendo il concetto di Cammino libero medio Ancora in analogia con la teoria cinetica, Drude utilizza il concetto di cammino libero medio per caratterizzare gli urti con gli ioni. Per comprendere il concetto di cammino libero medio, possiamo usare un argomento simile a quello usato per il calcolo della pressione di un gas. Numero di urti Assumiamo che lo ione contro cui collidono gli elettroni abbia una certa sezione d’urto S. Il numero di collisioni in un dato intervallo di tempo è dato dal numero di ioni in un cilindro (il cilindro “collisionale”) di base pari alla sezione d’urto S e altezza pari alla distanza percorsa nell’intervallo di tempo. 27 Se moltiplichiamo il volume di questo cilindro per il numero di ioni per unità di volume presenti nel solido avremo una stima degli ioni che l’elettrone incontrerà nel suo cammino, ovvero del numero di urti che lo interesseranno: # urti nioni vtS Eliminando l’intervallo di tempo otteniamo gli urti in un secondo # urti / sec ondo nioni vS Formula per il tempo tra due urti Il cammino libero medio è dato dal prodotto della velocità per la probabilità di un urto, che è l’inverso del numero di urti al secondo l v v 1 # urti / sec ondo nioni vS nioni S Il tempo tra due urti si ottiene dividendo l per la velocità media: l v In base al teorema di equipartizione della meccanica statistica, possiamo esprimere la velocità media in termini della temperatura (questo era quello che si poteva immaginare al tempo di Drude). l 1 v nioni S m 3kT Stima del tempo tra due urti con la formula microscopica Usando la formula appena trovata per fare una stima della grandezza trovata in precedenza e considerando S 1020 m 2 (sezione d’urto pari alla dimensione atomica) nioni 1028 m 3 (densità tipica della materia) 8 Drude ricava un cammino libero medio pari a l 10 m 5 1 Stimando la velocità con la temperatura e la massa elettronica: v 10 ms trova infine una stima di del tempo medio tra due urti pari a 10 quella stimata precedentemente. Il modello di Drude funziona abbastanza bene. 28 13 s non molto diversa da Domande e test 1) In quale aspetto il modello di Drude rappresenta un miglioramento della legge già scoperta da Ohm? a. Permette di calcolare il valore della carica elettrica degli elettroni. b. Stabilisce un legame di proporzionalità inversa tra campo elettrico applicato e corrente. c. Fornisce una giustificazione microscopica della legge di Ohm. 2) Cosa s’intende per derivazione microscopica della legge di Ohm? 3) Come può essere spiegata la formula del cammino libero medio usando argomenti dimensionali? 4) Qual è il ruolo della meccanica statistica nel modello di Drude? APPROFONDIMENTO Nel modello di Drude la velocità di deriva degli elettroni è ricavata da un bilancio della quantità di moto; la particella risente del gradiente di un potenziale elettrico ∇V (cioè di un campo elettrico e di un attrito viscoso (che dipende dalla velocità media degli elettroni) caratterizzata da un coefficiente γ: la formula più generale è dunque dv m qV v dove dt v indica la velocità di deriva, m la massa efficace e q la carica elettrica. dv 0 ) per questa equazione differenziale è La soluzione stazionaria (per la quale vale dt q v V V dove τ = m/γ è il tempo di rilassamento, e μ è la mobilità. La densità m di corrente è data da j nq v dove n è la densità di elettroni per unità di volume. Si può ricavare allora la legge di Ohm con conducibilità elettrica σ nq 2 j V V m Lo stesso modello può essere usato per ricavare la conduttività nel caso di un potenziale elettrico alternato con frequenza angolare ω: 0 1 i Questo semplice modello fornisce una buona spiegazione per la conduttività in corrente continua e alternata, l’effetto Hall e la conducibilità termica nei metalli. Inoltre spiega la legge di Wiedemann-Franz del 1853. Tuttavia, sovrastima le capacità termiche dei metalli. Benché il modello possa essere applicato anche a portatori positivi (lacune), come dimostrato con l’effetto Hall, non predice la loro esistenza. 29 2.2. L’effetto Hall Un miglioramento della comprensione della conduzione elettrica nei metalli venne dalla scoperta dell’effetto Hall. Nel 1879 Edwin Herbert Hall (durante il suo lavoro di tesi in dottorato) scopre che tra i lati di un conduttore, (in verde, sotto) percorso da corrente e immerso in un campo magnetico costante, si genera una differenza di potenziale perpendicolare alla corrente e al campo. Am. J. Math.2, 287(1879) Hendrik Antoon Lorentz fu tra i primi a comprendere che l’effetto Hall può essere spiegato nell’ambito del modello di Drude aggiungendo l’azione della forza (che porta il suo nome) di Lorentz, esercitata da un campo magnetico su una particella carica in moto. F qv B La forza di Lorentz spinge le cariche in direzione y creando il potenziale trasverso. La teoria dell’effetto Hall Le equazioni del moto contengono l’effetto combinato dei campi elettrico e magnetico. dv m m x eEx ev y Bz v x dt m dv y dt eE y evx B z m vy Nelle equazioni del moto abbiamo aggiunto un terzo termine proporzionale alla velocità che è un termine di dissipazione che considera l’effetto degli urti analizzati prima (una sorta di attrito viscoso che dipende dalla velocità). Ricordiamo che la velocità può essere collegata alla corrente tramite la formula i nevA 30 La costante di Hall Risolvendo le equazioni del moto in condizioni stazionarie (cioè indipendenti dal tempo: a tale scopo è sufficiente uguagliare a zero i membri di sinistra delle equazioni, cioè le derivate rispetto al tempo, ottenendo così un sistema lineare delle correnti in funzione dei campi) si ottiene la relazione tra le correnti e i campi. Posto quindi che la corrente trasversa sia zero, si ottiene l’espressione del campo elettrico trasverso indotto E x cE y 2 1 c cE x E y jy 2 1 c jx In queste due equazioni si è utilizzato il coefficiente di conducibilità Drude, e si è introdotta c introdotto da eB detta PULSAZIONE DI CICLOTRONE. m Quando il campo B è nullo (e la pulsazione di ciclotrone è nulla a sua volta) le densità di corrente sono indipendenti l’una dall’altra e ciascuna dipende solo dalla componente omologa del campo elettrico applicato: j x E x e j y E y . Quando invece è presente un campo magnetico (diretto secondo z) le due equazioni sono accoppiate e la soluzione del sistema porge (per Ey, ad esempio) 1 E y j y c jx La teoria dell’effetto Hall consiste in questo: la corrente in direzione x produce un campo elettrico in direzione y per effetto della forza di Lorenz che agisce sulle cariche, e tale campo è quello che dà luogo alla differenza di potenziale trasversa osservata da Hall Dl punto di vista sperimentale tale dipendenza è espressa dalla COSTANTE DI HALL: Ey c B j x RH j x en RH B en La misura della costante RH di Hall consente di misurare la densità elettronica. Domande e test 1) Come è definita la pulsazione di ciclotrone? 2) Qual è la dipendenza della resistenza di Hall dal campo magnetico? 3) Come è collegata la resistenza di Hall al segno della carica elettrica? 4) Quali informazioni ci permette di ricavare la misura della costante di Hall? a. Il campo magnetico microscopico prodotto dagli elettroni. b. Il tempo medio tra un urto e il successivo. c. La densità dei portatori di carica. 31 2.3. Il gas di Fermi Funziona il modello di Drude? Se combiniamo l’espressione della conducibilità elettrica derivata nel modello di Drude 1 e 2 n e inseriamo l’espressione del tempo tra due urti m nioni S m , otteniamo 3kT un’espressione per la dipendenza in temperatura della stessa conducibilità T 1 2 T 1 2 Tale andamento non è però osservato. In modo simile al caso dei fotoni tale discrepanza è da attribuirsi alla natura quantistica degli elettroni. Le statistiche quantistiche Abbiamo visto che Planck riesce a dedurre la legge del calore radiante modificando il calcolo combinatorio di Boltzmann. Nel 1924 Bose ed Einstein estendono il calcolo combinatorio di Planck anche a particelle con massa, diverse dai fotoni. Nasce dunque la cosiddetta meccanica statistica quantistica. Nel 1925 al fine di spiegare le regolarità degli spettri atomici, Pauli formula il suo principio di esclusione per gli elettroni: ogni stato può essere occupato al più da un solo elettrone. Nel 1926 Fermi e Dirac derivano la statistica per gli elettroni a partire dal principio di esclusione. Analisi combinatoria o o o o A causa del principio di esclusione, il calcolo combinatorio si riduce a calcolare il numero di modi in cui scegliere un certo numero di stati occupati tra quelli disponibili in una data cella. Nell’esempio il numero di stati occupati, corrispondenti alle particelle, è 4, mentre 6 è il numero degli stati nella cella. Quattro fermioni vanno a occupare quattro dei sei posti a disposizione. Dal punto di vista dell’analisi combinatoria il problema si riduce a calcolare in quanti modi si possono scegliere 4 oggetti da 6 disponibili. i i ! N i ! i N i ! è il numero generale di combinazioni possibili 32 LA STATISTICA DI FERMI-DIRAC L’idea è ancora una volta quella di calcolare l’entropia come il logaritmo del numero delle combinazioni possibili (attraverso la costante di Boltzmann quale fattore di proporzionalità). Usando la formula di Stirling si ottiene: N S i i k B ln1 i i N ln1 i i Ni Ni ln i i In equilibrio, come nel caso dei fotoni, l’entropia deve essere massima (anche qui servono due moltiplicatori di Lagrange, perché, oltre all’energia, si conserva anche il numero di particelle). Il valore che rende massima l’entropia è: Ni i 1 e i 1 dove i è l’energia del livello i-esimo Il modo in cui uno stato è occupato dipende, in media, oltre che dall’energia, dalla temperatura; ma vi dipende in maniera del tutto diversa da quella che era la statistica classica di Maxwell e Boltzmann. Questa funzione (detta funzione di Fermi-Dirac) ha questa caratteristica, che può variare tra 0 e 1; in altre parole: il valore medio statistico di occupazione di uno stato in una cella non può mai essere superiore a 1. Se ogni stato può essere occupato al più da una particella statistica, in media ogni stato sarà occupato da un numero frazionario di particelle che vari atra 0 e 1. Vediamo come varia questa funzione (di Fermi) alle varie temperature. La funzione di Fermi A temperatura nulla, tutti gli stati con energia inferiore a una data energia, detta energia di Fermi, sono occupati. L’energia, in ascissa, è appunto espressa in unità di Energia di Fermi. L’energia del livello occupato più alto è l’ENERGIA DI FERMI. 33 Se T=0 la funzione di distribuzione assume una forma molto semplice: il valor medio di occupazione è identicamente 1 per gli stati occupati ed è identicamente 0 per gli stati vuoti (funzione a gradino nel grafico sopra; in ascissa l’energia in unità di Fermi). Tramite la costante di Boltzmann introduciamo la TEMPERATURA DI FERMI TF EF k B Anche la temperatura può essere definita in unità della temperatura di Fermi. Definiremo d’ora in poi le temperature “basse” se sono basse rispetto alla temperatura di Fermi, “alte” se sono alte rispetto alla temperatura di Fermi. Si dice anche che il gas di Fermi si trova in uno stato degenere quando si trova a temperature “basse”, ovvero in regime completamente quantistico. Si vede allora che man mano che la temperatura sale la distribuzione si avvicina sempre di più a quella classica. Stati di impulso Finora non abbiamo fatto nessuna ipotesi sulla natura degli stati. Adesso diciamo che sono gli stati di una particella libera confinata in una scatola. Immaginiamo cioè di avere un gas di fermioni confinato in una scatola di lunghezza L. Qual è la regola di quantizzazione per particelle confinate in un segmento di lunghezza L? La lunghezza d’onda è un sottomultiplo di L : n L (questo in tutte le dimensioni, anche se noi ci concentriamo su una dimensione). Questa regola di quantizzazione si riflette anche sull’impulso attraverso la relazione di De Broglie. Utilizzando la regola di quantizzazione vista sopra otteniamo per l’impulso la seguente relazione p k 2 2 n L Somme integrali In base al principio di Pauli, ogni elettrone occupa un diverso stato d’impulso. Bisogna quindi sommare sugli stati d’impulso. Per lunghezze grandi rispetto a quelle microscopiche si possono sostituire le somme con gli integrali. Esiste una tecnica ben consolidata per trasformare delle somme in integrali: notando che tra un livello e l’altro di una certa grandezza (in questo caso dei valori dell’impulso) c’è una certa differenza, p 2 L distanza tra un valore di impulso e il successivo il trucco consiste nel fare in modo che in ogni regione di integrazione ci sia la stessa densità di punti discreti in media che si avevano nella sommatoria L’inverso del valore tra un impulso e l’altro è esattamente questa densità: dp dp ... p ... L 2 ... n 34 Vediamo un esempio del suo utilizzo. Se vogliamo scoprire, a temperatura T=0, quante particelle abbiamo, un numero proporzionale al numero di stati occupati (per il principio di esclusione), dobbiamo appunto calcolare il numero degli stati occupati. Ma calcolare il numero di stati occupati vuol dire fare una somma sugli interi nx, ny ed nz… fino all’energia di Fermi. Questa somma può essere trasformata in un integrale… ma siccome è una somma su tre interi la possiamo far diventare un integrale triplo, cioè di volume: In tre dimensioni bisogna fare un integrale di volume nello spazio tridimensionale degli impulsi d3p ... V ... 3 2 nx ,n y ,nz Tutti i valori dell’impulso corrispondenti a un’energia inferiore all’energia di Fermi si trovano nella cosiddetta SFERA DI FERMI, individuata dalla condizione px2 p y2 pz2 2m EF (l’energia non dipende dalla direzione ma solo dal modulo quadro dell’impulso) Tale sfera ha evidentemente RAGGIO rF p x p y p z 2mE F L’integrale all’interno della sfera di Fermi ci dà il numero di stati all’interno della sfera di Fermi, ovvero il numero di stati che possono essere occupati, ovvero il numero di fermioni. DISTRIBUZIONI DI FERMI 2 f p 2 2 1 e p2 2m 1 è la distribuzione di fermioni in una scatola, ovvero il numero medio di elettroni con impulso dato alla temperatura T; tale distribuzione di fermioni in una scatola generalizza la distribuzione di Maxwell vista in precedenza. Si nota che alle alte temperature, dove vale la meccanica statistica classica e dove il potenziale chimico μ tende a un valore grande e negativo, l’esponenziale a denominatore diventando molto più grande dell’addendo +1 (che quindi può essere trascurato) può essere portato a numeratore, facendoci ritrovare così la distribuzione di Maxwell-Boltzmann. La statistica di Fermi ad alte temperature riproduce la statistica di Maxwell. 35 A questo punto, scrivere l’espressione della densità di corrente (che dipende dalla velocità) è molto semplice: non dobbiamo far altro che associare a uno staro di p una corrente, ricordando che la velocità è legata a un certo impulso tramite p m. Sommiamo sugli impulsi e sulle due possibili orientazioni dello spin (dato che ogni stato può essere occupato da due fermioni con spin opposto). Ricapitolando: f p distribuzione di Fermi, ossia numero di fermioni aventi un certo un impulso alla temperatura T p m è la velocità posseduta da tali fermioni (elettroni) d3p 2 3 numero totale di tutti gli stati e carica di un elettrone p possibili 2 gli elettroni che possono occupare un certo stato, ciascuno con il suo spin; La j ev N diviene allora d3p p j 2 e f p 3 2 m In equilibrio la corrente è nulla: infatti impulsi opposti sono equiprobabili e l’integrale p sulla grandezza vettoriale diventa nullo. Una corrente è possibile se un campo m elettrico rompe l’isotropia dello spazio e rende più probabili gli stati di impulso di una certa direzione piuttosto che della direzione opposta La statistica quantistica di Fermi-Dirac completa quindi il modello di Drude dando vita a quello che è conosciuto come Modello di Sommerfeld (o di Drude-Sommerfeld) Sommerfeld riprende il modello di Drude (che considera gli elettroni come un gas ideale che obbedisce alla statistica classica) modificandolo con la statistica di Fermi-Dirac per tener conto della natura quantistica degli elettroni. Queste le ipotesi di Sommerfeld: 1. Gli elettroni all’interno di un solido metallico costituiscono un gas quantistico di particelle di massa m e carica unitaria negativa –e. 36 2. In assenza di urti, gli elettroni occupano stati di impulso ben definito. Le regole della meccanica quantistica consentono di calcolare la probabilità per unità di tempo che un elettrone possa fare una transizione da uno stato di impulso a un altro. 3. L’inverso di questa probabilità è il tempo di collisione da usare nella formula di Drude. Ora ci sono vari modi per calcolare questo tempo di collisione, ad esempio la regola di Fermi, sulla quale però non ci soffermiamo. Ci interessa invece dare una stima del tempo tra due urti per il gas di Fermi 20 S 10 m sezione d’urto (la stessa che nel caso classico) nioni 1028 m 3 (T 300K ) 1026 m 3 (T 4K ) (stessi numeri che nel caso classico) 2 l 108 m(T 300K ) 106 m(T 4 K ) quello che cambia è che anziché usare la velocità classica (ricavata dal teorema di equipartizione e che dava la sua dipendenza dalla radice quadrata di T) si usa la velocità di Fermi, ovvero quella che possiede l’elettrone quando si trovi alla superficie della sfera di Fermi, cioè al livello più alto occupato. Usando tale valore, che in un metallo è v F 106 ms 1 , e facendo il rapporto tra l e vF , si ottiene 1014 sT 300K 1012 sT 4 K dell’ordine di Domande sul gas di Fermi 1) Come si tiene conto del principio di esclusione nella statistica quantistica di Fermi-Dirac? 2) Che cos’è l’energia di Fermi? 3) Qual è il ruolo della temperatura nella forma della funzione di distribuzione di Fermi-Dirac? 4) Come si passa dalla somma sugli impulsi all’integrale? 5) Ad alte temperature la meccanica statistica classica è in grado di descrivere in modo soddisfacente il comportamento dei metalli. In quelle condizioni la distribuzione di Fermi-Dirac riproduce quella di Maxwell, a causa del fatto che il potenziale chimico diventa... a. grande in modulo e negativo. b. grande in modulo e positivo. c. pari a zero. [La risposta corretta è la a.] Domande sulla teoria dei metalli 1) Quali sono le ipotesi del modello di Drude per la conduzione elettrica nei metalli? 2) Qual è la relazione tra il modello di Drude e quello di Sommerfeld? 3) Cos’è la sfera di Fermi? 37 2.4. APPROFONDIMENTO: IL MODELLO DI SOMMERFELD Il modello di (Drude–)Sommerfeld, pur essendo molto semplice, riesce a dare una soddisfacente spiegazione della: conduttività elettrica; legge di Wiedemann-Franz che mette in relazione la conducibilità termica alla conduttività elettrica; dipendenza dalla temperatura del calore specifico elettronico; dipendenza approssimativa dall’energia della densità degli stati; dell'energia di coesione dei metalli; cammino libero medio Ipotesi del modello di Sommerfeld Gli elettroni di valenza sono considerati completamente liberi e costituiscono a tutti gli effetti un gas ideale di elettroni. Come nel caso di un gas ideale la interazione elettroneelettrone è completamente trascurata. La struttura cristallina non è tenuta in considerazione. L’unico limite del modello è dato dalla scatola cubica di lato L in cui sono contenuti gli elettroni. La statistica a cui obbedisce tale gas quantistico è la statistica di Fermi-Dirac. Modello stazionario Consideriamo una scatola cubica di lato L dentro cui sono contenute N elettroni non interagenti. Si può dimostrare che la forma della scatola modifica i risultati finali in maniera irrilevante. Immaginiamo che il potenziale sia infinito all’esterno della scatola, di conseguenza la funzione d’onda deve essere nulla all’esterno della scatola stessa. Se scegliamo l’origine delle coordinate coincidente con un vertice del cubo e gli assi cartesiani orientati come i suoi spigoli, la funzione d'onda soddisferà per ragioni di continuità le equazioni: ψ(0,y,z)=ψ(L,y,z)=0 ψ(x,0,z)=ψ(x,L,z)=0 ψ(x,y,0)=ψ(x,y,L)=0 La soluzione del problema è la combinazione lineare di onde piane viaggianti in direzioni ik r ik r opposte: x, y, z A e e Tale equazione può essere riscritta come: x, y, z 2iAsinkx xsink y y sinkz z La necessità che vengano soddisfatte le condizioni al contorno richiede che le componenti di k debbano assumere solo dei valori discreti: kx = nx π/L ky = ny π/L kz = nz π/L 38 dove nx, ny ed nz devono essere numeri positivi ed interi. Non sono soluzioni possibili quelle per cui anche uno solo degli ni è nullo: verrebbe infatti violato il principio di indeterminazione in quella direzione. Se noi disegniamo, nello spazio k , l’insieme dei punti-soluzioni del problema di N particelle nella scatola cubica di lato L, otteniamo un reticolo cubico semplice di punti in un solo ottante di tale spazio. Allo zero assoluto ci si aspetta che siano occupati solo gli stati con minore energia rispettando il principio di esclusione di Pauli. Il numero di elettroni nei solidi macroscopici è molto elevato per cui se andiamo a disporre gli N elettroni negli stati k possibili riempiendo prima gli stati con basso (bassa energia) e poi via via quelli con k più elevato (grande energia), dato che il numero N è molto elevato si può trascurare la discretizzazione degli stati. Nello spazio k gli stati possibili occupano i punti di un reticolo cubico semplice. La distanza tra punti adiacenti di tale reticolo vale ovviamente: a = π/L. Nei reticoli cubici semplici di parametro reticolare a, la densità dei punti reticolari vale ovviamente n = a−3. Abbiamo che la densità dei punti nello spazio k vale: L 3 V n k 3 dove V è il volume del cubo. Abbiamo calcolato tale densità di punti, ma ogni stato può essere occupato da due soli elettroni a causa del principio di esclusioni di Pauli, avendo gli elettroni un ulteriore grado di libertà interno dovuto allo spin semintero. Quindi per ogni stato permesso alla funzione d’onda di un elettrone, ci sono due stati elettronici, che corrispondono alle due possibili direzioni verso cui può puntare il momento angolare di un elettrone. V Quindi la densità g k di stati elettronici nello spazio k vale: g k 2n k 2 3 . Il significato fisico di g k (estendendo la sua definizione dallo spazio discreto a quello 3 continuo) è che vi sono nel volume d 3 k un numero dn g k d k di elettroni. Possiamo determinare il raggio kF dell’ottavo di sfera contenente gli N elettroni del metallo: 1 4 3 Vk F3 Ngk k F 2 83 3 Si noti come si faccia un errore, tuttavia trascurabile, includendo i punti sui tre piani cartesiani. Dalla equazione si ricava che: 1 3 k F 3 N Il raggio kF del settore sferico viene detto vettore d’onda di Fermi. Al contrario del caso classico quindi gli elettroni in un metallo anche a temperatura bassissima hanno un vasto range di valori di vettori d’onda e di conseguenza di energie cinetiche fino ad un certo valore massimo dipendente soltanto dalla densità degli elettroni. 2 39 La scelta della condizione al contorno a) Condizione al contorno nulla La condizione data sulla funzione d’onda, che imponeva il suo annullarsi sulla superficie del cubo, è nella pratica poco soddisfacente, infatti porta come conseguenza che le soluzioni del problema siano onde stazionarie. Nei solidi macroscopici l’interazione degli elettroni con gli estremi del solido è spesso trascurabile nei fenomeni di trasporto di energia e carica: soluzioni quindi propagantesi descrivono meglio i fenomeni fisici di interesse (tranne che per i k al limite della I zona di Brillouin… vedi appendice del capitolo successivo, ma nel modello la periodicità del reticolo è trascurata). Le proprietà generali di un solido macroscopico (è possibile dimostrarlo in maniera rigorosa) non dipendono dalle condizioni al contorno. b) Condizione al contorno periodica Una scelta più soddisfacente delle condizioni al contorno è quella di una condizione al contorno periodica, detta anche condizione al contorno di Born-Von Karman: si immagina che ogni faccia del cubo sia unita alla superficie opposta, in maniera tale che ogni elettrone che arrivi su una superficie non sia riflesso dalla superficie stessa, ma lasci il metallo entrando di nuovo dalla faccia opposta. Una condizione di tale tipo impone che la densità degli elettroni non vari lungo il solido. In tali termini la condizione sulla funzione d'onda è del tipo: ψ(x,y,z,t)=ψ(x+L,y,z,t) ψ(x,y,z,t)=ψ(x,y+L,z,t) ψ(x,y,z,t)=ψ(x,y,z+L,t) Le soluzioni del problema sono in tale caso semplicemente delle onde piane: x, y, z, t Ae i k r t La necessità che vengano soddisfatte le condizioni al contorno richiede che le componenti di k possono assumere solo dei valori discreti: kx = nx 2π/L ky = ny 2π/L kz = nz 2π/L dove nx, ny ed nz devono essere numeri interi positivi o negativi, ma non tutti nulli. Nello k spazio tali punti costituiscono un reticolo cubico. La distanza tra i punti del reticolo cubico semplice degli stati permessi, è due volte più grande rispetto alla precedente condizione al contorno. Quindi nello spazio k l’insieme dei punti-soluzione del problema di N particelle nella scatola periodica di lato L è un reticolo cubico semplice di punti di tale spazio, ma disposti simmetricamente intorno agli assi delle coordinate. Ma la distanza tra i punti del reticolo nello spazio k normalmente non provoca nessun effetto misurabile nei solidi macroscopici. Tale condizioni portano alla stessa soluzione per quanto riguarda il vettore d’onda di Fermi kF, raggio della sfera occupata. Infatti ripetendo i ragionamenti nel caso T = 0: 40 V g k 2n k 2 2 3 Gli N elettroni andranno quindi a riempire una sfera di raggio kF (non più un ottavo di 4 3 Vk F3 sfera): N g k k F 2 3 3 che è la stessa equazione di quella derivata precedentemente. Quindi il vettore d’onda di Fermi è identico con tale condizione al contorno. La regione nello spazio k permessa agli stati di un elettrone è una sfera. 2.4. Test ed esercizi Quale forza fornisce una spiegazione dell’effetto Hall? a. La forza di Lorentz F=q B dove q è la carica di una particella in un campo magnetico B. b. La forza di Lorentz F =q v⋅B dove q è la carica di una particella in moto con velocità v in un campo magnetico B. c. La forza di Lorentz F =q v×E dove q è la carica di una particella in moto con velocità v in un campo elettrico E d. La forza di Lorentz F =q v×B dove q è la carica di una particella in moto con velocità v in un campo magnetico B e. La forza di Coulomb esercitata dagli atomi del solido sugli elettroni che trasportano la corrente. [La risposta esatta è la d.] Qual è il numero di stati in cui possiamo accomodare 4 fermioni in 6 stati, in accordo con il principio di esclusione di Pauli? a. b. c. d. e. (6+4−1)!/4!(6−1)!=126 64/4!=54 6!/4!(6−4)!=15 6!/4!=30 4⋅6=24 6 [La risposta esatta è , cioè la c.] 4 Perché in un gas di Fermi in equilibrio la corrente è nulla? d3p p f p , dove f(p⃗) è a. L’espressione della corrente è data dalla seguente formula: j 2 e 2 3 m diversa da zero solo per p⃗≠0. b. In equilibrio gli urti confinano gli elettroni in una regione finita intorno ad un particolare atomo. d3p p f p , dove f(p⃗) è c. L’espressione della corrente è data dalla seguente formula: j 2 e 2 3 m la distribuzione di Fermi. Quest’ultima è isotropa e quindi l’integrale sulle direzioni di p⃗ produce un risultato nullo. 41 d. A causa del principio di esclusione di Pauli, gli elettroni non possono muoversi tutti insieme nella stessa direzione. e. In equilibrio gli elettroni, che sono i portatori della corrente, sono fermi e quindi non possono portare la corrente. [La risposta esatta è la c.] Che cos’è l’energia di Fermi? a. In un metallo, l’energia di Fermi corrisponde all’energia media degli elettroni. b. In un gas di Fermi, l’energia minima necessaria per eccitare un elettrone tramite l’assorbimento di radiazione. c. In un gas di Fermi allo zero assoluto, l’energia di Fermi corrisponde al massimo livello energetico occupato. d. In un gas di Fermi allo zero assoluto, l’energia di Fermi corrisponde al minimo livello energetico occupato. e. In un metallo, l’energia di Fermi corrisponde all’energia acquistata dagli elettroni tra un urto ed il successivo. [La risposta esatta è la c.] Da quali caratteristiche di un solido metallico dipende il cammino libero medio degli elettroni nel modello di Drude? a. Il rapporto tra la sezione d’urto elettrone-ione, S, e la densità degli elettroni n, definisce il cammino libero medio: l =S/n b. Il prodotto della densità degli ioni, nioni per la sezione d’urto della collisione elettrone-ione, S, ha le dimensioni di una lunghezza. Tale lunghezza definisce il cammino libero medio: l =(nioniS) c. La sezione d’urto elettrone-ione, S, definisce il quadrato del cammino libero medio: l = √ S d. L’inverso della radice cubica della densità degli ioni, nioni , definisce il cammino libero medio: l =(nioni)−1/3 e. Il prodotto della densità degli ioni, nioni , per la sezione d’urto della collisione elettrone-ione, S, ha le dimensioni dell’inverso di una lunghezza. Tale lunghezza definisce il cammino libero medio: l =(nioniS)−1 [la risposta corretta è la e.] Qual è l’espressione della costante di Hall RH nel modello di Drude? (B è l’intensità dell’induzione magnetica, n è la densità elettronica, e è la carica unitaria, m è la massa elettronica, ωc, è la pulsazione di ciclotrone, τ il tempo di volo tra un urto e il successivo, σ la conducibilità elettrica) a. RH = (ne)/B,. b. RH = −B/(ne) c. RH = eB/m d. RH = ne2B/m e. RH = (ωcτ)/σ [La risposta corretta è la b.] Qual è la differenza tra i modelli di Drude e di Sommerfeld per la descrizione dei metalli? a. Il modello di Sommerfeld modifica quello di Drude per tener conto della natura quantistica degli elettroni. Entrambi si basano sul concetto di gas elettronico. b. I modelli differiscono per il segno della carica elettronica. c. Mentre il modello di Drude si basa sulla teoria cinetica dei gas, quello di Sommerfeld considera la teoria degli spettri atomici. d. A differenza di quello di Drude, il modello di Sommerfeld descrive gli elettroni come dipoli oscillanti intorno alle posizioni d’equilibrio individuate dagli atomi del solido. 42 e. Nel modello di Drude la conducibilità dipende dagli urti tra gli elettroni e gli ioni; nel modello di Sommerfeld invece vengono considerati gli urti degli elettroni tra di loro. [La risposta corretta è la a.] Che cos’è la sfera di Fermi? a. Un dispositivo sperimentale metallico di forma sferica ideato da Enrico Fermi per misurare l’elettricità statica. b. In presenza di un potenziale a simmetria sferica, è il volume di spazio nel quale si trovato confinati gli elettroni intorno a un atomo. c. Il luogo geometrico degli stati elettronici con energia nulla. d. Nello spazio tridimensionale degli impulsi, è il volume delimitato dalla condizione (px2+py2+pz2)/(2m)≤EF, dove EF è l’energia di Fermi. e. Nello spazio tridimensionale degli impulsi, è il volume delimitato dalla condizione (px2+py2+pz2)/(2m)>EF, dove EF è l’energia di Fermi. [La risposta corretta è la d.] 43 Cap. 3 I livelli elettronici nei solidi Il capitolo 8 del libro Solid State Physics di N. W. Ashcroft e N. D. Mermin contiene un’approfondita discussione del teorema di Bloch e della teoria dei livelli elettronici nei solidi. 3.1. Il “solido” biatomico 3.2. Il solido unidimensionale 3.3. Il teorema di Bloch (il cuore della teoria dei livelli elettronici nei solidi) 3.4. La teoria delle bande 3.5. Appendice. Reticolo di Bravais. Reticolo reciproco. Zona di Brillouin (BZ). Il teorema di Bloch e la serie di Fourier. 3.6. Test ed esercizi 3.1. Il “solido” biatomico Definizione di solido Un solido è fatto di atomi, che si dispongono in modo ordinato. Ogni atomo occupa un sito di un reticolo la cui forma è determinata dalla natura delle forze che tengono insieme gli atomi. Un reticolo ideale si estende indefinitamente in tutte le direzioni. Un esempio è un reticolo cubico (una serie di cubi l’uno accanto all’altro, di cui gli atomi occupano i vertici; vogliamo sfruttare la simmetria del problema per ricavare delle informazioni). Il problema della fisica dei solidi Il problema della fisica dei solidi è di determinare i livelli elettronici a partire dal tipo di reticolo cristallino considerato. In quest’analisi occupano un ruolo essenziale gli argomenti basati sulle proprietà di simmetria del reticolo. Un solido esibisce un tipo di simmetria traslazionale discreta, cioè sono equivalenti punti che differiscono di multipli di vettori di traslazione caratteristici per un dato tipo di reticolo. Tali vettori sono detti primitivi. 44 Perché il solido biatomico? Il solido costituito da due soli atomi uguali è un modello irrealistico ma semplice e istruttivo. Atomi lontani: prima che il solido si formi possiamo pensare che ciascuno dei due abbia un elettrone (informazione che vale a qualificarli come atomi di idrogeno); le funzioni d’onda sono localizzate sui nuclei. I due atomi sono identici: i due elettroni occupano stati diversi ma completamente identici dal punto di vista energetico. Secondo la meccanica quantistica, quando gli atomi sono lontani gli stati elettronici sono quelli dei due atomi isolati. Ogni stato elettronico è quindi doppiamente degenere (i due stati sono identici). Che succede ai due livelli atomici avvicinando i due atomi? Ipotesi semplificatrici Supponiamo che il problema atomico sia unidimensionale e che il potenziale atomico sia simmetrico per inversione rispetto alla posizione dell’atomo. Assumiamo anche che la funzione d’onda sia simmetrica rispetto alla posizione dell’atomo. Se l’atomo è posto nell’origine assumiamo quindi che Vatomico x Vatomico x il potenziale ha un andamento simmetrico rispetto all’atomo atomica x atomica x Formazione del solido Se i due atomi sono vicini le funzioni d’onda sono sovrapposte Quando gli atomi sono a una distanza comparabile con quella dell’estensione spaziale della funzione d’onda atomica, comincia a perdere senso attribuire un elettrone a un dato atomo, dato che i due atomi condividono i due elettroni. La funzione d’onda stessa deve 45 essere ricalcolata tenendo conto dei due centri di attrazione. Le due funzioni d’onda cominciano a sovrapporsi (ed è quello che tiene legati i due atomi). Entrambi gli atomi possiedono entrambi gli elettroni, su due livelli separati. Combinazione di orbitali atomici Quando gli atomi sono vicini e le funzioni d’onda si sovrappongono, i nuovi stati elettronici possono essere ottenuti come una combinazione lineare degli stati corrispondenti alla situazione in cui gli atomi sono lontani. È l’idea alla base della meccanica quantistica. Concettualmente, la situazione è analoga al caso dell’esperimento della doppia fenditura quando entrambe le fenditure permettono il passaggio delle particelle: la particella può passare dall’una o dall’altra ma esiste anche lo stato in cui la particella passa per entrambe le fenditure. In questo caso, quando i due atomi sono vicini, ogni elettrone si troverà in uno stato che è una combinazione degli stati che ci sono quando gli atomi sono isolati. Come si applica il principio della combinazione lineare? La generica combinazione avrà forma a 1 b 2 con a b 1 (la funzione d’onda dev’essere normalizzata) e con a e b appartenenti ai complessi. Inoltre a e b in modulo devono essere uguali perché abbiamo preso due atomi identici e non c’è motivo di differenziare un atomo dall’altro. Se a e b avessero modulo diverso questo indicherebbe una diversità dei due atomi. Poiché gli atomi sono identici i moduli dei coefficienti devono essere uguali, quindi a b 2 2 1 e resta da esplicitare una fase per a e b. 2 1 ia e 1 e ib 2 2 Poiché la funzione d’onda è determinata a meno di un fattore di fase (quello che c’interessa è infatti il modulo quadro della funzione d’onda) possiamo considerare solo la FASE RELATIVA, ovvero raccogliere (ed eliminare) e 1 1 ei 2 2 i a : Vogliamo determinare la fase relativa. A questo proposito osserviamo che dobbiamo aspettarci due possibili valori della fase, uno per ciascuno stato: infatti il numero delle possibili combinazioni lineari deve essere pari al numero degli stati corrispondenti agli atomi isolati. Per semplicità immaginiamo un problema unidimensionale. Le funzioni d’onda atomiche sono identiche per i due atomi, ma localizzate in posizioni diverse 46 1 atomica x x0 ei atomica x x0 2 La funzione d’onda è la combinazione della funzione d’onda dell’atomo che si trova centrato in x0 e di quella dell’atomo che si trova in x 0 . Uso della simmetria Secondo la meccanica quantistica, operatori che commutano con l’operatore hamiltoniano sono diagonalizzabili simultaneamente, ossia condividono con lui gli autostati. Se l’operatore hamiltoniano è simmetrico per inversione, l’operatore di inversione spaziale, detto operatore di parità, deve avere gli stessi autovettori dell’operatore hamiltoniano. Poiché il quadrato dell’operatore di parità è l’identità, i suoi autovalori possono essere +1 oppure –1, corrispondenti a funzioni d’onda simmetriche o antisimmetriche. Poiché il sistema dei due atomi è simmetrico per inversione rispetto all’origine, le funzioni d’onda possibili devono essere simmetriche (S) o antisimmetriche (AS) rispetto a un cambiamento di segno della variabile spaziale. Questa richiesta è sufficiente a determinare i possibili valori della fase relativa: S x S x S 0 AS x AS x AS Dimostrazione: usando il fatto che la funzione d’onda atomica è simmetrica o antisimmetrica nel suo argomento 1 atom x x0 ei atom x x0 2 1 atom x x0 ei atom x x0 2 ei atom x x0 e i atom x x0 2 x x 0 x x x Se Se Ora vogliamo capire come le due combinazioni (simmetrica o antisimmetrica) sono legate all’energia dei due stati. 47 Nel primo caso ( x x 0 ) la funzione d’onda (simmetrica) è detta “legante” e non ha zeri. Nel secondo caso ( x x ) la funzione d’onda (antisimmetrica) è detta “antilegante” e ha uno zero a metà della distanza tra i due atomi Energie dei livelli “legante” e “antilegante” Dalla meccanica quantistica sappiamo che più la funzione d’onda presenta oscillazioni e maggiore è l’energia associata. L’energia del livello antilegante, la cui funzione d’onda ha un nodo (uno zero) è superiore a quella del livello legante in accordo con le regole generali della meccanica quantistica. L’idea di legare i livelli di energia agli zeri della funzione d’onda è una delle idee importanti nel determinare i livelli elettronici degli elettroni nei solidi. Il “solido” biatomico – Domande e test 1) Qual è il ruolo della simmetria nel determinare la funzione d’onda del “solido” biatomico? 2) Perché una funzione d’onda con un nodo ha un’energia maggiore di una funzione d’onda senza nodi? 48 3) Quali sono i due soli valori possibili per la fase relativa tra le funzioni d’onda di singolo atomo nel modello del solido biatomico? A cosa corrispondono? a. +1 e -1, e corrispondono a funzioni d’onda simmetriche o antisimmetriche per il sistema dei due atomi. b. +1 e 0, e corrispondono a funzioni d’onda simmetriche o antisimmetriche per il sistema dei due atomi. c. 0 e π, e corrispondono a funzioni d’onda simmetriche o antisimmetriche per il sistema dei due atomi. 3.2. Il solido unidimensionale La simmetria del solido Un solido è costituito da una disposizione regolare di atomi. Consideriamo ad esempio il caso unidimensionale dove N atomi sono disposti a una distanza a, detta passo reticolare, l’uno dall’altro. Nel caso illustrato il solido è lungo L=Na. Come termina il solido? Di solito, se si vuole analizzare come si comporta un solido non interessa sapere quali sono i particolari effetti di superficie o di bordo. Supponiamo allora che il sito N-esimo sia collegato, idealmente, al sito 1 in modo da realizzare condizioni al contorno periodiche (è come se gli atomi fossero equispaziati lungo una circonferenza). Qual è la simmetria che vogliamo sfruttare in questo caso? Non la simmetria per inversione, ma la simmetria dell’invarianza traslazionale. La particolare simmetria del solido, rispetto a quella della molecola biatomica considerata in precedenza, consiste nel fatto che ogni sito è equivalente a tutti gli altri. In particolare la relazione tra il valore della funzione d’onda al sito i e quello della funzione d’onda al sito i+1 è sempre la stessa per tutti i siti. xi1 ei xi Non ha importanza quale sia il fattore di fase relativo, quello che preme è osservare che tale fattore di fase relativo per un sito e per il successivo è sempre lo stesso: se così non fosse una particolare coppia di siti consecutivi si distinguerebbe dalle altre. L’identificazione del sito 1 con il sito N+1 determina l’equazione per i possibili valori della fase relativa xN 1 xi eiN xi 49 relazione ottenuta applicando N volte la relazione in alto. Questo ci dice che eiN 1 i valori permessi della fase relativa sono le radici N-esime dell’unità n 2 n con n = 0, 1, …, N – 1 N Se N = 2 ritroviamo i due valori di fase del “solido” biatomico, caso particolare del solido unidimensionale. Il valore di n compreso tra 0 e N – 1 determina la funzione d’onda del solido. Quando n = 0 (e quando n = N) la funzione d’onda è in fase in tutti i siti atomici n0 x atom x atom x a atom x 2a ... Quando n = 1 la differenza di fase tra un sito e il successivo è pari all’angolo giro diviso per il numero di siti: 2 N n1 x atom x e atom x a e i i 2 2 N atom x 2a ... Data una scelta della fase relativa tra due siti, ad essa possiamo associare una lunghezza d’onda. Nel caso n = 1 possiamo dire che la lunghezza d’onda della variazione di fase tra un sito e il successivo è pari al passo reticolare moltiplicato per il numero dei siti 1 Na Il VETTORE D’ONDA è definito dal reciproco della lunghezza d’onda moltiplicata per l’angolo giro k1 2 Na Classificazione delle combinazioni il base al numero n che determina la fase relativa, e quindi λ e quindi k, (ogni k determina quindi una fase relativa) possiamo classificare le diverse funzioni d’onda Possiamo quindi classificare le diverse combinazioni delle funzioni d’onda atomiche in base al loro vettore d’onda: 2 n , e indicato il sito i-esimo con xi i 1a i = 1, …, N detto k n Na ikn xi ogni fattore di fase diventa e . Una particolare funzione d’onda riferita a una particolare scelta di fase relativa che identifica un particolare vettore d’onda può allora essere scritta 50 N kn x e ikn xi atom x xi i 1 Nei grafici sotto abbiamo preso una funzione d’onda gaussiana (simmetrica rispetto al sito) combinata con diverse fasi relative (per un solido lungo L=10 a.) N = 10. n = 0, 1, 2, …, 9 La parte reale per n = 0 (blu) non ha zeri n =1 (gialla) ha 2 zeri n =2 (verde) ha 4 zeri La parte reale per n = 3 (blu) ha 6 zeri n =4 (gialla) ha 8 zeri n =5 (verde) ha 10 zeri Si noti che in funzione dell’n scelto (e quindi del relativo vettore d’onda k) varia il numero degli zeri della funzione d’onda. All’aumentare di n dapprima il numero degli 51 zeri aumenta… ma all’aumentare ancora il numero n il numero degli zeri comincia a diminuire. n = 6 (blu) ha 8 zeri n =7 (gialla) ha 6 zeri n =8 (verde) ha 4 zeri n =9 (ocra) ha 2 zeri In questo esempio n = 10; per n = 10 si ottiene la stessa funzione che per n = 0. Relazione di dispersione Il valore del vettore d’onda determina il numero di nodi della funzione d’onda e quindi la sua energia. In questo modo a ogni valore del vettore d’onda corrisponde un valore di energia, determinando la cosiddetta RELAZIONE DI DISPERSIONE dello spettro elettronico del solido E k n Esempio: per una particella libera 2k 2 E k 2m l’energia è crescente in funzione di k, e cresce sempre all’aumentare di k (cioè di n). Nel caso di un solido invece 52 Il numero di zeri (asse y) è periodico con n che varia da 0 a 9. Quindi l’energia (che dipende dagli zeri) è una funzione periodica del vettore d’onda (asse x). Questa periodicità è immagine della simmetria del solido. Il solido unidimensionale – Domande 1) Qual è la condizione di periodicità imposta alla funzione d’onda di un solido unidimensionale? 2) Qual è il numero quantico che classifica gli stati elettronici di un solido unidimensionale? [risposta: il vettore d’onda kn] 3) Cosa viene fornito dalla relazione di dispersione? a. La dipendenza funzionale dell’energia dal valore del vettore d’onda. b. Il tipo di simmetria del reticolo cristallino. c. Il numero di zeri della funzione d’onda. [La risposta corretta è la a.] 3.3. Il teorema di Bloch Osservazione Risulta utile introdurre la seguente funzione uk(x) in termini di combinazioni di funzioni d’onda atomiche (k è numero d’onda che dipende dalla scelta della fase relativa.) Tale funzione è periodica nella variabile x con periodo pari al passo reticolare a. N u kn x e ikn x xi atom x xi , i 1 xi i 1a , kn 2 n Na funziona d’onda atomica moltiplicata per un fattore di fase il cui argomento nella x è lo stesso della funzione d’onda. xi i 1a è la posizione del sito i-esimo. La periodicità di u k x di periodo a [ovvero tale che u k x a u k x ] può essere Ricordiamo che n n n dimostrata sfruttando le condizioni periodiche al contorno del nostro reticolo unidimensionale. Tale dimostrazione viene lasciata come esercizio. 53 Il teorema di Bloch In termini della funzione uk(x) è possibile riscrivere la funzione per uno stato elettronico del solido unidimensionale nella forma di un’onda piana modulata da una funzione periodica con la periodicità del reticolo. Tale forma costituisce un caso particolare del cosiddetto teorema di Bloch, che può essere espresso quindi nella forma seguente: kn x eikn x ukn x con ukn x a ukn x Il teorema può essere dimostrato in generale mediante la teoria delle serie di Fourier. (per la dimostrazione vedi l’appendice al capitolo 3.) Il significato del teorema di Bloch Il teorema di Bloch ha un significato profondamente connesso con la simmetria del cristallo. Mentre nello spazio vuoto la simmetria traslazionale porta alla conservazione dell’impulso i cui autostati sono le onde piane, nel cristallo la simmetria traslazionale è discreta e porta alla conservazione del momento cristallino k (che quindi è definito come numero quantico) che classifica i livelli elettronici in presenza di un potenziale periodico. Questi livelli hanno la forma di un’onda piana ulteriormente modulata da una funzione periodica uk(x). Tale funzione ha il compito di “pesare” l’ampiezza di probabilità in relazione ai punti di minimo e massimo del potenziale periodico (in altre parole: quando l’elettrone transiterà vicino ai nuclei sentirà un’attrazione più forte che non quando transiterà lontano da essi). Bloch sviluppò il suo teorema durante il suo lavoro di dottorato. Questo è quello che concluse: Felix Bloch (1905 – 1983) Stanford University ‘When I started to think about it, I felt that the main problem was to explain how the electrons could sneak by all the ions in a metal…. By straight Fourier analysis I found to my delight that the wave differed from the plane wave of free electrons only by a periodic modulation’ F. BLOCH Conseguenze per il modello di Drude (-Sommerfeld) A questo punto possiamo tornare un momento al modello di Drude per sottolineare che la principale sorgente che causa le collisioni degli elettroni non sono gli ioni disposti ordinatamente. Un reticolo ordinato di ioni non cambia il vettore d’onda, provoca una modulazione di ampiezza. L’effetto globale degli ioni è inglobato in questa modulazione periodica. Nell’urto ci aspettiamo che un’onda piana con un certo vettore d’onda venga modificato in un’altra onda piana con diverso vettore d’onda (un impulso viene cambiato 54 in un altro impulso), in base al teorema di Bloch questo non può accadere. Il vettore reticolare di Bloch non è cambiato dalla presenza degli ioni. Eppure il modello di Drude dà delle predizioni confrontabili con l’esperienza: le collisioni col reticolo non sono un’astrazione… Come si spiegano? Le dobbiamo imputare alle imperfezioni del reticolo. Se nel reticolo sono presenti imperfezioni (se ad esempio manca un atomo nel reticolo, o è presente un atomo di una specie diversa, oppure…), che rompono la simmetria del reticolo, allora il vettore d’onda cristallino non è più un buon numero quantico. Concludiamo dunque che il tempo medio τ tra due urti successivi e, conseguentemente, il cammino libero medio l in un metallo sono determinati dalle imperfezioni del reticolo: per calcolare τ o l non dobbiamo più prendere la densità degli ioni del reticolo ma la densità delle imperfezioni. Questo è stato anche un suggerimento per migliorare le proprietà di conduzione di un metallo: per costruire il metallo più conduttore possibile dobbiamo costruire un metallo col minor numero di imperfezioni possibile (cosa che può essere realizzata con una serie di tecniche che non interessa qui raccontare). Il teorema di Block – Test e domande 1) Secondo il Teorema di Bloch, la funzione d’onda elettronica per un solido (unidimensionale) può essere scritta nella forma kn x e ikn x u kn x , con u tale che uk x a uk x, mentre a è il n n passo reticolare. Qual è il ruolo della funzione u ? a. Quello di tener conto della relazione di dispersione tra il vettore d’onda cristallino e l’energia dei livelli. b. Quello di modulare l’onda piana con una funzione che ha la stessa periodicità del reticolo. c. Quello di inserire un numero opportuno di zeri nelle funzioni d’onda elettroniche per individuare i vari livelli energetici. [La risposta corretta è la b.] 1) Che cosa afferma il teorema di Bloch? 2) Mostrare la proprietà uk(x+a)=uk(x). 3.4. La teoria delle bande Estensione a tre dimensioni Il ragionamento fatto per il solido unidimensionale può essere esteso a qualunque solido con le seguenti modifiche: 1. vi è un vettore d’onda per ogni direzione spaziale: nello spazio tridimensionale avremo kx ky kz . 2. vi sono infiniti orbitali atomici per ogni sito e quindi l’orbitale localizzato su ogni sito è, in generale, una combinazione lineare degli orbitali atomici dell’atomo: dovremo calcolare la combinazione lineare di funzioni d’onda centrate su atomi diversi e funzioni d’onda che coinvolgono più orbitali dello stesso atomo. Il problema diventa estremamente complesso (e lo è: la teoria delle bande è una specializzazione in fisica 55 dello stato solido, per farlo bisogna essere dei professionisti del settore… anche se tali idee più raffinate oggi possono essere sviluppate tramite calcolatore); ma le idee di base restano le stesse. Infine: 3. un solido può essere formato da più di un tipo di atomo. Le funzioni d’onda e i livelli elettronici nei solidi sono quindi classificati da tre vettori d’onda kx ky kz e un indice di “banda” n che si riferisce al tipo di orbitale localizzato En k x , k y , k z (avremo quindi 4 numeri quantici per definire una banda n) I livelli con lo stesso valore di n formano appunto una banda di energia permessa (i livelli sono in realtà discreti ma così fitti da formare una BANDA), mentre i valori di energia non appartenenti a nessun valore di n individuano le gap di energia Vediamo qui sotto le bande di energia per il silicio. Sull’asse x è rappresentato il vettore d’onda: le varie lettere sono un modo per indicare come ci si muove nello spazio k nelle varie direzioni; le linee continue sono i livelli energetici in funzione del vettore d’onda; quella che vediamo è cioè l’estensione al caso n-dimensionale del caso unidimensionale del solido biatomico, dove vi erano unicamente due linee; qui le linee sono tante e molto fitte da dar vita a delle bande. Si noti la BAND GAP, un intervallo di energia in cui non ci sono livelli (gap = mancanza) 56 Stato fondamentale di un solido Per gli elettroni vale il principio di esclusione di Pauli, in base al quale i livelli disponibili sono riempiti al più da un solo elettrone. Lo stato fondamentale della configurazione elettronica di un solido si ottiene quindi occupando (a temperatura T=0K) tutti i livelli elettronici a partire da quello di più bassa energia fino a quando ci sono elettroni disponibili. Tale principio permette di classificare i solidi in base al grado di riempimento dei livelli in ciascuna banda di energia. Il livello pieno di più alta energia individua l’ENERGIA DI FERMI del solido. Ricordiamo che per i solidi ordinari l’energia di Fermi è di qualche elettronvolt, energia che corrisponde a una temperatura TF=10.000 Kelvin; a temperatura ambiente (T=300K) possiamo considerare i livelli energetici dei solidi come se fossero a temperatura T=0K, e quindi il riempimento dei livelli è molto simile a quando abbiamo temperatura nulla. Ai tempi di Drude, il modello di Drude spiegava bene come un metallo conduceva ma era totalmente incapace di spiegare perché un materiale fosse conduttore e un altro fosse isolante. La teoria delle bande, in base al teorema di Bloch, permette invece di capire questa differenza… Aver compreso la differenza tra conduttori e isolanti rappresenta un successo della meccanica quantistica applicata alla fisica dei solidi. Questo modo di riempire le bande di energia dei solidi ci permette di classificare i vari tipi di solidi. Il disegno a sinistra mostra i livelli di energia (segnata sull’asse verticale) che possono essere occupati o meno. Tanto più il semicerchio è bombato verso destra tanto più è densa la numerosità degli stati per quel livello di energia. In un ISOLANTE la banda indicata dal livello di Fermi è completamente piena. In un isolante, cioè, le bande sono tutte piene o tutte vuote. Un conduttore invece ha l’ultima banda occupata parzialmente piena. In un CONDUTTORE vi sono stati vuoti vicini in energia al livello di Fermi e gli elettroni possono fare transizioni di bassa energia. Quando applichiamo un campo elettrico per avere una conduzione in un sistema, attraverso il campo elettrico compiamo un lavoro sulla particella carica, ma quantisticamente l’elettrone può assorbire solo grani discreti di energia passando da un livello elettronico a uno più energetico; nel caso di un isolante, dove la banda è completamente piena, gli elettroni per poter assorbire energia da un campo elettrico devono passare alla banda successiva; ma se la banda successiva è ben lontana (in energia) l’energia che fornisce il campo (il campo che ordinariamente si usa per effettuare misurazioni) non è sufficiente a far compiere agli elettroni tali transizioni energetiche, gli elettroni restano dove sono e il sistema si comporta come un isolante. 57 Nel conduttore invece il livello di Fermi capita a metà di una banda e ci sono stati liberi vicini nei quali l’elettrone, anche debolmente energizzato/eccitato, può finire… e questo è alla base della conduzione. La teoria delle bande – Domande e test 1) Cos’è una banda di livelli d’energia? 2) In cosa consistono le “bande” utilizzate nella descrizione dei metalli? a. In regioni di energia densamente popolate di livelli disponibili per gli elettroni. b. In regioni spaziali del solido determinate dalla simmetria del reticolo dove è maggiore la probabilità di trovare gli elettroni. c. In funzioni d’onda elettroniche che presentano periodicamente dei picchi in corrispondenza degli ioni del reticolo. 3) Quali sono i numeri quantici in un solido tridimensionale? I livelli elettronici nei solidi – Domande 1) Cos’è un gap d’energia? 2) In che modo la teoria delle bande permette la classificazione dei solidi in conduttori e isolanti? 3.5. Appendice. Reticolo di Bravais. Reticolo reciproco. Zona di Brillouin. Il teorema di Bloch e la serie di Fourier In geometria e in cristallografia, un RETICOLO CRISTALLINO (o “RETICOLO DI BRAVAIS”, dal francese Auguste Bravais che per primo lo descrisse, nel 1848) è un insieme infinito di punti con una disposizione geometrica sempre uguale in tutto lo spazio. I punti del reticolo sono costituiti da una “base” (racchiusa all’interno di una cella unitaria), cioè da un insieme di uno o più entità molecolari (atomi, molecole o ioni), per cui la struttura atomica dei cristalli è definita dal reticolo e dalla base del reticolo.] La teoria dei gruppi permette di definire il numero di reticoli di Bravais possibili per ogni dimensione dello spazio. In un reticolo cristallino, la CELLA DI WIGNER-SEITZ è una cella primitiva che gode di tutte le proprietà di simmetria della struttura cristallina. Essa è definita come la regione di spazio, costruita intorno a un nodo reticolare del reticolo di Bravais, formata da quei punti che sono più vicini a quel nodo rispetto a qualunque altro; tale zona è descritta geometricamente dal più piccolo poliedro individuato dai piani che bisecano ortogonalmente i segmenti che congiungono il nodo a ciascuno dei “primi vicini” (anche se in pratica, per costruire tale poliedro, è sufficiente considerare solo pochi nodi tra quelli più vicini a quello di partenza). Generalizzando, questa regione può essere introdotta per un qualsiasi insieme discreto di punti indipendentemente dalla periodicità dell’insieme di punti considerato, e in generale, prende il nome di poliedro di Voronoi. Il poliedro di Voronoi, nel caso particolare del reticolo di Bravais, si riduce alla cella di Wigner-Seitz. 58 Consideriamo un set di punti R che costituiscono un reticolo di Bravais e un’onda piana ik r definita da e . Tale onda piana per alcuni valori di k ha la periodicità del reticolo di Bravais. L’insieme dei vettori d’onda k che descrive onde piane con la periodicità di un dato reticolo di Bravais si chiama RETICOLO RECIPROCO. Tale condizione da un punto di vista algebrico corrisponde a scrivere e ik r R eik r , e dovendo tale relazione valere per qualsiasi r segue che l’insieme dei vettori del reticolo reciproco soddisfa la relazione: e ik R 1 per tutti i punti R del reticolo di Bravais. Infine, in fisica dello stato solido, si chiama prima ZONA DI BRILLOUIN la cella di Wigner-Seitz del reticolo reciproco. Il contorno della zona di Brillouin si ottiene tracciando la bisettrice delle linee congiungenti i primi vicini nel reticolo reciproco. In tre dimensioni alle rette bisettrici si sostituiscono i piani bisettori.1 Si definiscono inoltre la seconda, la terza e le successive zone di Brillouin, corrispondenti a una sequenza di zone nello spazio reciproco non sovrapposte e a maggior distanza dall’origine; tali zone hanno un interesse minore, per questa ragione con “zona di Brillouin” si identifica la prima. Perché abbiamo dato questa serie di definizioni? L’importanza della (prima) zona di Brillouin dipende dalla descrizione mediante funzioni di Bloch delle onde in un mezzo periodico: in tale rappresentazione si trova che le soluzioni possono essere completamente caratterizzate dal loro comportamento in una sola zona di Brillouin. E veniamo infine alla dimostrazione del Teorema di Bloch Il teorema di Bloch, che abbiamo derivato in modo intuitivo partendo da combinazioni di funzioni d’onda atomiche, può essere dimostrato matematicamente usando la trasformata/serie di Fourier. A tale scopo ricordiamo alcune proprietà per una funzione definita nell’intervallo (0,L), dove L=Na. f x f k eikx , k k 2 2 n n L Na , n 0,1,2,... Introduciamo i vettori d’onda G, chiamati vettori di reticolo reciproco e definiti da G 2 l, a l intero Si dimostra, ad esempio, che, essendo il reticolo reciproco di un reticolo cubico semplice ancora un reticolo cubico, la zona di Brillouin di un reticolo cubico è un cubo. Al contrario essendo il reticolo reciproco del cubico a corpo centrato un reticolo cubico a facce centrate la prima zona di Brilluoin è un dodecaedro rombico. Mentre per un reticolo cubico a facce centrate il reticolo reciproco è cubico a corpo centrato quindi la prima zona di Brilluoin è un ottaedro tronco. 1 59 Tali vettori godono della proprietà che, per ogni vettore del reticolo R=ma, si ha GR 2q , q intero (sono i vettori per cui la funzione d’onda ha la stesa periodicità del reticolo) Lo sviluppo di f(x) può, in generale, essere scritto come una doppia somma f x f k Geik G x k BZ G 2 n Na , n 0,1,2,..., N 1 Gli N valori di k definiscono la ZONA DI BRILLOUIN (BZ). Il problema di un elettrone in un solido può essere schematizzato come quello di una particella in un potenziale V(x) periodico, cioè tale che V(x)=V(x+a), con a il passo reticolare. In virtù della periodicità, lo sviluppo di Fourier di V(x) ammette solo vettori di reticolo reciproco, cioè V x VG eiGx G Questo è evidente notando che Ga è pari a un multiplo di 2π. In una dimensione l’equazione di Schrödinger si scrive 2 2 x V x x E x 2m x 2 Facendo la trasformata di Fourier dell’equazione si ottiene 2k 2 k VG k G E k 2m G In assenza di V(x), ogni componente di Fourier è indipendente dalle altre. In presenza di V(x), le componenti di Fourier che differiscono di un vettore G, sono accoppiate. In generale, in presenza di un potenziale V(x) arbitrario, tutte le componenti di Fourier sono accoppiate. Nel caso di un potenziale periodico, il problema si scompone in N problemi distinti, ciascuno corrispondente a un valore di k nella BZ. La funzione d’onda ha quindi lo sviluppo seguente: k x k G ei k G x eikx k G eiGx eikxuk x G G Tale sviluppo riproduce il contenuto del teorema di Bloch. 60 3.6. Test ed esercizi In che modo si utilizza il principio di esclusione di Pauli per determinare lo stato fondamentale di un solido? a. L’energia di Fermi assume valori discreti. b. Elettroni che occupano stati con vettore d’onda opposto devono avere spin opposto. c. I livelli energetici elettronici del solido, a temperatura nulla, sono riempiti a partire dal più basso in energia fino ad accomodare tutti gli elettroni, uno per livello, fino all’energia di Fermi. d. In un solido a temperatura nulla, si può avere un solo elettrone per sito reticolare. e. I livelli energetici elettronici del solido, a temperatura nulla, sono riempiti a partire dal più basso in energia fino ad accomodare tutti gli elettroni, facendo in modo che ogni livello sia o occupato da un solo elettrone o vuoto. [La risposta esatta è la c.] Che cos’è la relazione di dispersione per gli elettroni in un solido? a. La relazione nello spazio tra due stati elettronici localizzati su siti reticolari primi vicini. b. Il modo in cui la funzione d’onda si distribuisce nello spazio determina la relazione di dispersione. c. La dipendenza dell’energia di un livello elettronico in un solido dal vettore d’onda che caratterizza tale livello determina la relazione di dispersione. d. La dipendenza dell’energia di un livello elettronico dal raggio di Bohr efficace della funzione d’onda. e. La dipendenza dell'energia dal quadrato dell'impulso dello stato elettronico. [La risposta corretta è la c.] In cosa consistono le condizioni al contorno periodiche per un solido monoatomico unidimensionale? a. b. c. d. e. In un reticolo di N atomi, atomi che differiscono di due passi reticolari sono equivalenti. N atomi ugualmente spaziati, dove l’atomo nel sito N-esimo è collegato all’atomo nel primo sito. La funzione d’onda può assumere solo valori interi. In un reticolo di N atomi ugualmente spaziati, i siti 1 e N sono equivalenti. La funzione d’onda ai siti estremi 1 e N si annulla. [La risposta esatta è la b.] Quale tra le seguenti affermazioni è in accordo con il teorema di Bloch? a. Il teorema di Bloch giustifica il modello di Drude precisando come il cammino libero medio sia dovuto alle collisioni con gli ioni del reticolo. b. In un reticolo ordinato, le autofunzioni d’onda sono onde piane come nello spazio vuoto. c. In un reticolo ordinato, le collisioni degli elettroni con gli ioni sono modulate da una funzione periodica uk(x) d. In un reticolo ordinato il vettore d’onda cristallino è un numero quantico conservato. Imperfezioni del reticolo sono causa della non conservazione del vettore d’onda cristallino e deviano gli elettroni. e. In un reticolo ordinato il vettore d’onda cristallino è un numero quantico non conservato. Le collisioni degli elettroni avvengono con gli atomi posti ai siti reticolari. [La risposta esatta è la d.] Che cosa afferma il teorema di Bloch relativamente agli autostati di un reticolo unidimensionale di passo reticolare a? a. ψk(x) = eikx uk(x), b. ψk(x) = A eikx +Be−ikx, uk(x+a)=−uk(x) con A, B complessi. 61 c. ψk(x) = eikx d. ψk(x) = eikx uk(x), e. ψk(x) = eikx uk(x), uk(x+a)=uk(x) uk(x)=uk(−x) [La risposta corretta è la d.] Che cos’è la zona di Brillouin in un solido unidimensionale? (vedi appendice 3.5) a. In un reticolo, la zona di Brillouin è la regione intorno a ogni sito reticolare. L’intero reticolo può essere pensato come la somma di N zone di Brillouin. b. La zona di Brillouin definisce l’insieme dei vettori d’onda G detti di reticolo reciproco, che soddisfano RG=2πq con q intero. c. Nello spazio dei vettori d’onda, la zona di Brillouin definisce i valori permessi del vettore d’onda. d. La zona di Brillouin definisce i vettori d’onda che appaiono nello sviluppo di Fourier di una funzione con la periodicità del reticolo, f(x+a)=f(x) e. In un reticolo con N siti e con sito reticolare generico R=ma (a passo reticolare), ogni vettore d’onda può essere scritto nella forma q=k+G dove i vettori di reticolo reciproco G soddisfano RG=2πj, con j intero, e k=n(2π)/(Na) con n=0,1,2,…,N−1. I valori di k definiscono la zona di Brillouin. [la risposta corretta è la e…?] Quali sono, in generale, i numeri quantici che identificano i livelli elettronici nei solidi? a. Come nel caso della particella libera, i numeri quantici sono i valori dell’impulso. b. Sono quelli corrispondenti agli atomi di cui è costituito il solido. c. Non esistono regole generali, i numeri quantici dipendono dal tipo di solido. d. In generale, la simmetria traslazionale discreta di un solido richiede tre vettori d'onda discreti (uno per ogni direzione spaziale) e uno o più indici di banda, connessi al tipo di atomi costituenti il reticolo. e. In generale, la simmetria traslazionale discreta di un solido richiede due vettori d'onda discreti (scelti fra i tre possibili) ed un indice di spin. [La risposta corretta è la d.] In un solido unidimensionale monoatomico con N siti, il valore della funzione d’onda tra due siti successivi varia per un fattore di fase costante ϕ. Quale tra le seguenti equazioni determina il valore di tale fase? a. eiNϕ = 1 b. eiNϕ = π c. eiNϕ = −1 d. eiNϕ = i e. e−Nϕ = 1 [La risposta corretta è la a.] In base alla teoria delle bande, qual è la differenza tra un conduttore metallico e un isolante? a. Dal punto di vista della teoria delle bande non vi è alcuna differenza. b. Un isolante ha un numero pari di bande piene, mentre un conduttore ne ha un numero dispari. c. Un conduttore ha le sue bande d'energia o esattamente piene o esattamente vuote, mentre un isolante ha bande d'energia parzialmente riempite. d. Nel caso degli isolanti, il principio di esclusione di Pauli è irrilevante. e. Un isolante ha le sue bande d'energia o esattamente piene o esattamente vuote, mentre un conduttore ha bande d'energia parzialmente riempite. [La risposta corretta è la e.] 62 In cosa consiste la simmetria traslazionale di un reticolo cristallino? a. Punti dello spazio che differiscono di multipli di vettori di traslazione caratteristici per un dato reticolo sono equivalenti. b. La funzione d’onda soddisfa condizioni periodiche. c. I punti del reticolo tornano in se stessi dopo una rotazione di 180 gradi intorno ad un asse passante per due punti del reticolo. d. Le coordinate dei punti del reticolo assumono solo valori interi. e. Ogni punto dello spazio è equivalente ad ogni altro punto. [La risposta corretta è la a.] Cosa comporta la presenza di un reticolo cristallino perfetto (privo di impurezze) per il modello di Drude? a. In un reticolo perfetto gli urti tra elettroni e ioni non sono in grado di cambiare il vettore d’onda cristallino; in queste condizioni, il metallo sarebbe sempre all’equilibrio e non potrebbe condurre una corrente elettrica. b. La presenza di un reticolo perfetto è una delle ipotesi del modello di Drude: in presenza di impurezze non si potrebbe avere conduzione elettrica. c. In un reticolo perfetto gli urti tra elettroni e ioni fanno cambiare il vettore d’onda cristallino; in queste condizioni, il metallo non raggiungerebbe mai l’equilibrio e non potrebbe condurre una corrente elettrica. d. In un reticolo perfetto gli urti tra elettroni e ioni non sono in grado di cambiare il vettore d’onda cristallino; in queste condizioni, il metallo non raggiungerebbe mai l’equilibrio tramite le collisioni e si otterrebbe una stima della conducibilità non soddisfacente. e. In un reticolo perfetto gli urti tra elettroni e ioni fanno cambiare il vettore d’onda cristallino; in queste condizioni, il metallo non raggiungerebbe mai l’equilibrio tramite le collisioni e si otterrebbe una stima della conducibilità non soddisfacente. [La risposta corretta è la d.] 63 Cap. 4 La spintronica In questo capitolo affronteremo il concetto della spintronica. Approfondiremo alcune idee sui sistemi paramagnetici e ferromagnetici. Studieremo la fenomenologia dell’effetto di magneto-resistenza gigante (GMR), quindi il modello di conduzione a due canali. Daremo una interpretazione dell’effetto GMR e alcuni cenni sull’applicazione dell’effetto GMR alle memorie magnetiche. 4.1 Cos’è la spintronica 4.2. L’effetto GMR 4.3. Il modello a due canali 4.4. Teoria dell’effetto GMR 4.5 Applicazioni 4.6. Test ed esercizi 4.1. Cos’è la spintronica Che cosa significa spintronica? “Spin transport electronics” (elettronica basata sul trasporto di spin) oppure “Spin based electronics” secondo la definizione di S. A. Wolf e altri. Science 294, 1488 (2001) Nell’elettronica tradizionale si usa solo la carica tradizionale, mentre lo spin è un grado di libertà “inerte”. Esso diventa invece fondamentale nella spintronica Grande impatto sulla scienza di base: il Premio Nobel 2007 ad Albert Fert (francese) e Peter Grünberg (tedesco) per la scoperta dell’effetto di magnetoresistenza gigante (GMR) (avvenuta nel 1988) ha catalizzato moltissima ricerca sull’argomento; ma fin da subito la scoperta ebbe impatto sulla tecnologia: già qualche anno dopo la scoperta dell’effetto GMR si trovò modo di utilizzarla per rivoluzionare le tecniche di fabbricazione dei dischi rigidi dei computer consentendo un notevole aumento della densità di immagazzinamento dei dati; l’EPS’s Hewlett-Packard Europhysics Prize 1997 fu consegnato a Stuart Parkin (allora e tuttora ricercatore dell’IBM) appunto per il suo lavoro pionieristico nella tecnologia GMR per i dischi rigidi. La spintronica è un terreno d’incontro ideale tra scienza di base e applicata “Gli scopi centrali della spintronica sono quelli di comprendere i meccanismi attraverso i quali è possibile ottenere un efficiente controllo elettronico delle correnti di spin e delle configurazioni di spin, e di scoprire i materiali nei quali questi meccanismi sono presenti in modo preminente. A causa della ovvia relazione con le tecniche magnetiche di archiviazione dell’informazione, la possibilità di nuove applicazioni è sempre presente nel contesto degli argomenti di ricerca in spintronica e talvolta balza in primo piano con 64 effetti spettacolari. Ciò nondimeno, i problemi che sorgono in questo campo sono spesso affascinanti da un punto di vista fondamentale e parecchi argomenti sono studiati per il loro interesse intrinseco.” Pesin e Mac Donald (due fisici teorici) in Nature Materials 11,409 (2012) L’attore principale: l’elettrone Una breve biografia dell’elettrone: Data di nascita: 1897 (per opera di J J Thomson con i raggi catodici) Massa: m = 9.10938291 X 10 – 31 Kg (e/m più grande del valore atteso) Carica: e = 1.602176665 X 10 – 19 C (per opera di R A Millikan con l’esperimento delle goccioline d’olio 1909) Spin: s = ħ/2, ħ =1.054571726 X 10 – 34 Js (Stern-Gerlach 1922, Uhlenbeck and Goudsmit 1925, Pauli 1927) Lo spin è momento angolare intrinseco. I fermioni hanno spin semintero e gli elettroni hanno lo spin minimo possibile, ½ in unità di ħ. Corrente di carica (l’elettrone, muovendosi, si porta dietro la sua carica) ji e vi è un vettore che si porta dietro le caratteristiche della velocità e pertanto dipende da un indice i che individua la direzione in cui fluisce la corrente e che può essere x, y o z. Introduciamo ora un concetto nuovo rispetto all’elettronica tradizionale, che è la corrente di spin: poiché l’elettrone si muove ed è dotato di spin può trasferire momento angolare da una regione a un’altra; quindi, esattamente come per la carica, possiamo introdurre la corrente di spin: la velocità moltiplicata per lo spin… ma lo spin non è una grandezza scalare, e perciò essa deve dipendere da due indici, il primo legato alla direzione della velocità e il secondo che indica la direzione verso cui punta lo spin che l’elettrone si porta appresso. jij s j vi Possiamo pertanto dire, in termini matematici, che la corrente di spin è una quantità tensoriale. Rappresentiamo varie possibili situazioni: indicheremo con le frecce nere più spesse il flusso di elettroni e con le frecce colorate più sottili lo stato di spin o di polarizzazione. Come è noto dalle regole generali della meccanica quantistica lo stato di spin può essere o positivo o negativo: +ħ/2 oppure –ħ/2. Nell’elettronica tradizionale gli spin SU (rossi) e GIÙ (blu) sono presenti in egual numero. 65 Nel I caso lo spin totale è nullo, non c’è trasporto di momento angolare e la corrente di spin è a sua volta nulla. Nel II caso abbiamo soltanto gli elettroni con un certo spin, ad esempio SU: oltre al trasporto di carica associato agli elettroni ci sarà anche trasporto di momento angolare: entrambe le correnti sono diverse da zero. Nel III caso abbiamo di nuovo elettroni con spin SU ed elettroni con spin GIÙ, ma per un qualche motivo siamo riusciti a farli andare in direzioni opposte (questo non si riesce a fare con un campo elettrico standard): la carica totale trasportata verso destra o verso sinistra è dunque nulla, ma il fatto che lo spin SU venga portato da sinistra verso destra e che lo spin GIÙ venga portato da destra verso sinistra comporta che ci sia un accumulo di spin SU verso destra e un accumulo di spin GIÙ verso sinistra: c’è un trasporto netto di spin da sinistra verso destra, e la corrente di spin è diversa da zero. TEST. La corrente di spin a. quantifica la velocità degli elettroni per la carica trasportata; a differenza della corrente di carica è una grandezza scalare. b. quantifica la velocità degli elettroni per lo spin trasportato; come la corrente di carica, è una grandezza tensoriale. c. quantifica la velocità degli elettroni per lo spin trasportato; a differenza della corrente di carica è una grandezza tensoriale. [La risposta corretta è la c.] 4.2. L’effetto GMR (gyant magneto-resistance) Come si manipola lo spin elettronico? Vediamo intanto come si può intervenire sulle caratteristiche di un elettrone: massa, carica, spin. Intervenire sulla massa? La forza gravitazionale nell’elettronica tradizionale è sempre trascurata in quanto è troppo debole: il confronto tra attrazione gravitazione e repulsione coulombiana è praticamente zero: Gm 2 6.67 1011 9.1 1062 43 10 2 ke2 9 109 1.6 1038 2 66 La carica è invece la proprietà che maggiormente si sfrutta nell’elettronica standard per controllare il moto degli elettroni; in un metallo lo si fa attraverso l’uso del campo elettrico. In un metallo gli elettroni come fermioni obbediscono al principio di esclusione di Pauli; gli elettroni che rispondono al campo elettrico sono quelli vicini al livello di 19 Fermi; l’energia dello stato occupato più alto EF 1eV 10 J Il campo elettrico permette la transizione tra stati appena sotto il livello di Fermi e stati vuoti sopra tale livello. Come si può manipolare lo spin? Una carica in moto circolare è equivalente a un dipolo magnetico. Si può associare un dipolo magnetico anche allo spin dell’elettrone, che possiamo immaginare come una trottola, anche se è chiaramente una descrizione di fantasia. Il campo magnetico agisce sul dipolo magnetico μ associato allo spin elettronico. In particolare si definisce “magnetone di Bohr” il momento magnetico dell’elettrone: e 1.6 1019 34 1 B 10 JT 1023 JT 1 31 2m 9.110 In un campo di 1 Tesla abbiamo un’energia di 10–23 J, e osserviamo che 1023 J 104 eV : in un campo di 1 Tesla abbiamo delle energie in gioco che sono molto piccole rispetto all’energia di Fermi. Tuttavia non sono trascurabili. Un ferromagnete è un materiale che ha al suo interno un campo magnetico intrinseco che può essere stimato calcolando l’intensità prodotta da un numero di magnetoni di Bohr per unità di volume pari alla densità della materia standard. In un ferromagnete il campo interno vale dunque Bint 0 B n 4 107 1023 1029 T 1T e può produrre un effetto sul momento magnetico di dipolo associato allo spin dell’elettrone. Paramagneti e ferromagneti Come insegna l’elettromagnetismo classico, l’induzione magnetica B e il campo magnetico H sono legati tra loro dalla magnetizzazione M. Quest’ultima è funzione del campo magnetico H e tale funzione determina la cosiddetta RELAZIONE COSTITUTIVA DEL MEZZO B H M H Nel vuoto B ed H coincidono. In un mezzo dobbiamo introdurre la magnetizzazione M che esprime come il mezzo materiale risponde alla presenza di un campo magnetico esterno. Non ci addentreremo a capire come questo avviene, lo prenderemo come un dato di fatto: ci sono alcuni materiali che immersi in un campo producono una M trascurabile e ce ne son altri che producono una M apprezzabile. Nel limite di campo esterno H nullo, una magnetizzazione nulla o finita determina se un materiale è paramagnetico o ferromagnetico, e rispettivamente è 67 PARAMAGNETE se lim M H 0 FERROMAGNETE se lim M H 0 H 0 H 0 In questo caso il valore ottenuto rappresenta la magnetizzazione residua. La parte della fisica che andiamo a discutere si basa sulla combinazione di materiali ferromagnetici e materiali paramagnetici. Cos’è l’effetto GMR? L’effetto GMR, ricordiamo, fu scoperto da Albert Fert e Peter Grünberg nel 1988. I due studiarono i materiali a molti strati (in inglese: magnetic multileaves). Qui sopra vediamo un’immagine tratta dalla conferenza tenuta da Fern in occasione del conferimento del premio Nobel. Le parti chiare della figura a destra rappresentano un metallo normale di materiale paramagnetico, le parti più scure rappresentano metalli ferromagnetici; sia in alto che in basso si vede un sandwich costituito di materiali ferromagnetici che racchiudono un materiale paramagnetico all’interno. Fert e Grünberg studiarono la conduzione elettrica di questi sistemi compositi. Mandando una corrente ad esempio dall’alto verso il basso, gli elettroni si trovano ad attraversare prima una regione ferromagnetica, poi una regione paramagnetica, poi di nuovo una regione ferromagnetica. Ricordiamo che un ferromagnete si comporta come un enorme dipolo ferromagnetico, dovuto al fatto che tutti i momenti magnetici elementari si orientano tutti allo stesso modo. La resistenza di un sistema multistrato, in cui strati magnetici e paramagnetici sono alternati, dipende dall’orientazione parallela o antiparallela degli strati magnetici. 68 Com’è che si varia la magnetizzazione nei due casi? Quello che si è scoperto, soprattutto grazie ai lavori di Grünberg, è che se abbiamo due strati magnetici e una regione non magnetica (paramagnetica) in mezzo, i dipoli magnetici dei due materiali ferromagnetici tendono a disporsi naturalmente in una configurazione antiparallela (che è il caso mostrato in alto). Se in questa situazione a questo sandwich applichiamo un campo magnetico esterno orientato ad esempio secondo uno dei due versi di magnetizzazione, se tale campo magnetico è sufficientemente intenso tenderà a orientare non solo la magnetizzazione che è già concorde con lui ma anche la magnetizzazione del secondo ferromagnete; quindi con un campo magnetico esterno sufficientemente intenso possiamo avere una magnetizzazione parallela dei due ferromagnetici, ossia passare da una configurazione antiparallela a una parallela. Quello che i due fisici osservarono misurando la corrente che passa in questo sistema è che c’è una differenza di proprietà di conduzione a seconda che la configurazione sia antiparallela o parallela; in particolare (ed è quello che dice il grafico di sinistra) a campo nullo la configurazione è antiparallela, aumentando il campo la resistenza comincia a diminuire e dopo una caduta relativamente brusca tende a saturare a un valore costante che corrisponde al completo allineamento parallelo dei due ferromagneti. La differenza percentuale di variazione della resistenza per l’applicazione del campo può arrivare anche a valori dell’ordine dell’80%. A questo effetto si dà il nome di GMR. TEST. L’effetto GMR trae il suo nome dal fatto che a. applicando un campo magnetico esterno è possibile far scendere il valore della resistenza di un sandwich ferromagnete-paramagnete-ferromagnete attraversato ortogonalmente da una corrente fino a circa l’80%, raggiungendo un valore di saturazione della resistenza. b. applicando un campo magnetico esterno è possibile far aumentare il valore della resistenza di un sandwich ferromagnete-paramagnete-ferromagnete attraversato ortogonalmente da una corrente fino a circa l’80%, raggiungendo un valore di saturazione della resistenza. c. applicando un campo magnetico esterno è possibile far scendere il valore della resistenza di un sandwich ferromagnete-paramagnete-ferromagnete attraversato ortogonalmente da una corrente fino a circa l’80% e, anche aumentando la differenza di potenziale, la corrente raggiunge un valore di saturazione. [La risposta corretta è la a.] 4.3. Il modello a due canali In questo paragrafo affronteremo il modello a due canali che è un modello interpretativo dell’effetto GMR. Tale modello a due canali corrisponde a un modello con due gas di Fermi; in altre parole quello che facciamo è associare a ogni orientazione possibile dello spin elettronico un diverso gas di Fermi. La situazione è illustrata nella figura sotto. Quando non c’è un campo magnetico (esterno) possiamo rappresentare la dispersione elettronica in funzione dell’impulso p o di k. 69 Consideriamo ad esempio la dispersione della particella libera. Considerare un solido reale non porta a considerazioni molto diverse. Per semplicità immaginiamo di avere un elettrone in una scatola: la relazione energia-impulso è E = p2/2m. Normalmente gli elettroni con spin SU e quelli con spin GIÙ hanno la stessa dipendenza dell’energia dall’impulso (abbiamo cioè degenerazione dei due stati di spin). Gli elettroni in un ferromagnete possono essere divisi in due gruppi in base alla proiezione dello spin. Poiché l’elettrone in virtù dello spin possiede un momento di dipolo magnetico, applicando un campo magnetico abbiamo quello che si chiama effetto Zeeman: c’è interazione tra il dipolo magnetico dell’elettrone e il campo magnetico; per una data proiezione di spin l’energia dipende dall’impulso: elettroni con dipolo magnetico concorde con il campo magnetico tendono ad avere energia più bassa di quelli con impulso discorde. Questo può essere rappresentato spostando le due curve di dispersione una verso il basso (quella con spin concorde) e una verso l’alto (quella con spin discorde). Quando andremo a costruire lo stato fondamentale del nostro sistema cominceremo a riempire lo stato più basso che corrisponde a elettroni con spin SU. Come si vede dalla figura, possiamo andare a riempire diversi livello con spin SU senza andare a toccare quelli con spin GIÙ. Arriverà un momento in cui stati di elettrone con spin SU sono degeneri con stati di elettrone con spin GIÙ, che però hanno impulso diverso: da quel momento in poi andremo a riempire entrambe le curve di dispersione fino all’energia massima possibile, cioè fino a quando abbiamo elettroni a disposizione. I due stati con spin SU e spin GIÙ è come se costituissero due gas di Fermi con sfere di Fermi separate, corrispondenti al fatto che c’è una diversa popolazione di elettroni con spin SU e con spin GIÙ. Dunque, a differenza che in un metallo paramagnetico, in un metallo ferromagnetico abbiamo uno sbilanciamento di popolazione e potremo chiamare “elettroni maggioritari” gli elettroni con lo spin SU e “minoritari” quelli con lo spin GIÙ. L’idea del modello a due canali che andremo a utilizzare è quella di pensare alle proprietà di trasporto di un metallo ferromagnetico (anche in un dispositivo composto) come alla conduzione in parallelo di due gas di Fermi ciascuno corrispondente ai due stati di spin. Dobbiamo però prima analizzare alcune proprietà dello spin. 70 Il rilassamento dello spin Lo spin, a differenza della carica, non è una quantità conservata. Questo significa che, se in una certa regione di spazio siamo riusciti a creare una certa quantità di spin, tale flusso di spin tende a degradarsi durante la sua propagazione. Lo spin di un elettrone può interagire con lo spin di qualche imperfezione atomica o dei nuclei stessi. Ci possono essere effetti relativistici che producono quella che viene chiamata l’interazione spin orbita di cui avremo occasione di parlare a proposito degli spettri atomici. Non è importante entrare nei dettagli di questi meccanismi che possono essere anche molto molto complessi. Quello che conta notare è che lo spin non si conserva e tende a degradarsi. Nel gaso dei due gas di Fermi tale degradarsi corrisponde a uno scambio reciproco di elettroni tra i due gruppi di spin. Nei metalli il degradarsi del flusso di spin ha una decrescita esponenziale su una scala detta lunghezza di rilassamento di spin Ls. Essa dipende da tanti parametri e dipende dalla tipologia del materiale in esame. Tale lunghezza varia nell’intervallo tra pochi nanometri fino a parecchie decine di nanometri. La strada per la realizzazione di dispositivi che sfruttano il flusso di spin richiede lo sfruttamento di fenomeni su scale spaziali dell’ordine di Ls. La giunzione ferromagnete-paramagnete L’elemento base per comprendere la fisica dell’effetto GMR è la giunzione tra un metallo ferromagnetico e uno paramagnetico: questo è il mattoncino teorico più semplice da esaminare. Supponiamo che l’interfaccia tra i due si trovi nell’origine di un sistema di riferimento. LF e LN sono le lunghezze di rilassamento di spin nell’uno e nell’altro metallo. Nel ferromagnete c’è uno sbilanciamento di popolazione: gli elettroni maggioritari con spin SU sono molti di più di quelli con spin GIÙ: se facciamo passare della corrente elettrica, nel ferromagnete la maggior parte della corrente è trasportata dagli elettroni “maggioritari” con spin SU (la freccia relativa è molto più spessa), mentre nel metallo paramagnetico la corrente è trasportata in modo paritario dalle due componenti di spin 71 (le frecce relative alla corrente trasportata dagli elettroni con spin SU e alla corrente trasportata dagli elettroni con spin GIÙ sono identiche). Questo è quello che succede in un ferromagnete isolato o in un paramagnete isolato. Ma cosa succede se giuntiamo i due sistemi? Dobbiamo passare dalla situazione a sinistra (in cui c’è sbilanciamento tra le due correnti) alla situazione di destra (in cui le due correnti sono bilanciate). Come avviene la transizione tra la situazione “sbilanciata” e quella “bilanciata”? Dobbiamo aggiungere una quantità nuova indicata alla giunzione da quel riferisce all’accumulo di spin, che adesso andiamo a spiegare. 0 che si L’accumulazione di spin (La figura sotto è sempre tratta dalla conferenza tenuta in occasione dell’assegnazione del Nobel) Per comprendere il funzionamento della giunzione, bisogna considerare che parte della popolazione dei maggioritari si deve convertire nei minoritari. Nella regione della giunzione i primi devono rallentare, mentre i secondi accelerare. I primi vedono quindi un ostacolo, una barriera di potenziale che tende a rallentarli (una cresta), mentre i secondi devono vedere una buca di potenziale (una valle). Qui a sinistra sono rappresentati i potenziali elettrici “visti” dalle due popolazioni: gli elettroni con spin SU vedono la curva blu, quelli con spin GIÙ vedono la curva rossa. La differenza è detta “potenziale di spin” o ACCUMULO DI SPIN (che non esiste nell’elettronica tradizionale), che resta finito sulla scala del rilassamento di spin ed è il motore che fa funzionare queste due correnti. Tale effetto esiste solo in presenza di una corrente, ossia di un campo elettrico applicato: se non ci fosse una corrente non ci sarebbe nessun bisogno di bilanciare le due correnti. Per dare una qualche nozione quantitativa sul fenomeno si introduce… il modello con le resistenze efficaci Il funzionamento della giunzione può essere spiegato usando il modello delle resistenze efficaci. In questo modello la conduzione nel metallo ferromagnetico è descritta come una conduzione in parallelo delle correnti trasportate dagli elettroni con spin su e con 72 spin giù, rispettivamente. A questi due canali di conduzione vengono associate due resistenze diverse. Sappiamo che R L A (II legge di Ohm) Quello che si può dimostrare (anche se la dimostrazione esula dallo scopo di queste lezioni) è che se noi introduciamo delle resistenze “efficaci” in cui la lunghezza del conduttore non è la vera lunghezza ma è la distanza del rilassamento di spin che abbiamo introdotto prima, allora possiamo modellizzare il nostro sistema complicato in termini di resistenze. Il vantaggio è che poi possiamo usare le regole dei circuiti standard. La resistenza maggiore è quella associata agli elettroni minoritari, che essendo meno numerosi, possono trasportare una quantità inferiore di corrente. R LsF A resistenza degli spin su maggioritari R LsF A resistenza degli spin giù minoritari Conseguenze del modello In modello a due canali è quindi un parallelo di due canali: in quello superiore corrono gli elettroni con spin SU, in quello inferiore quelli con spin GIÙ. Nel metallo normale le due resistenze RN sono identiche, mentre, per quanto detto sopra, R R (la conducibilità è legata al numero di portatori e nei due casi vi è un diverso numero di portatori) Il problema è adesso calcolare come si ripartisce la corrente nei due canali. Il risultato è facile da calcolare. I RF RN I RF RN RF RN I Tra le due correnti vi è una differenza pari a 73 RF RN I RF RN RF RN RF RF I I I RF RN RF RN Nel metallo normale, dove in generale non vi è sbilanciamento delle due correnti, per effetto della contiguità del ferromagnete si produce una differenza tra le due correnti. Tale effetto è chiamato “spin injection”. A parità di differenza di potenziale applicata tale spin injection è regolato dalla differenza delle resistenze efficaci. Per avere una buona efficienza della giunzione, la resistenza del metallo normale deve essere confrontabile con quella del ferromagnete. Caduta di potenziale di spin La caduta di potenziale per i due canali efficaci di conduzione è diversa; nel ferromagnete è più accentuata per gli spin GIÙ (linea rossa) che incontrano maggior resistenza. Gli spin SU (blu) maggioritari vedono un potenziale più alto alla giunzione degli spin GIÙ (rosso). VG VG RN RF RN RF I RF RN RF RN Questa differenza è l’accumulazione di spin, una nuova grandezza che controlla il funzionamento di questi dispositivi ibridi. TEST. In un ferromagnete: a. la presenza del campo magnetico genera una differenza tra il potenziale a cui sono sottoposte le due specie di spin; da ciò risulta che la corrente di spin non può essere conservata su distanze più grandi della lunghezza di rilassamento. b. la presenza del campo magnetico genera una differenza tra il potenziale a cui sono sottoposte le due specie di spin; ciò ostacola la formazione di correnti di spin. c. la presenza del campo magnetico genera una differenza tra il potenziale a cui sono sottoposte le due specie di spin; da ciò, risulta uno sbilanciamento nelle due popolazioni di spin. [La risposta corretta è la c.] 74 4.4. Teoria dell’effetto GMR La giunzione F-N-F Il meccanismo GMR può essere compreso studiando il comportamento di due giunzioni F–N accoppiate. Il requisito fisico è che la lunghezza dello strato di metallo normale sia comparabile (o inferiore) con la lunghezza di rilassamento di spin. Quando tale lunghezza è maggiore della lunghezza di rilassamento di spin c’è il disaccoppiamento delle due giunzioni e il dispositivo non può funzionare in modalità GMR. Il modello delle resistenze efficaci Anche per la doppia giunzione possiamo introdurre delle resistenze efficaci relative ai canali di conduzione dei due ferromagneti e dello strato normale. Resistenza totale Per mezzo delle regole standard dei circuiti si ottiene la resistenza totale Rtot R F1 RF2 RN RF1 RF2 RN RF1 RF2 RN RF1 RF2 RN 75 Configurazione antiparallela è quella che esiste tra i due ferromagneti in assenza di campo magnetico applicato; conveniamo di chiamare le seguenti resistenze uguali tra loro I maggioritari nel primo ferromagnete diventano i minoritari nel secondo ferromagnete RF1 RF2 (conveniamo di chiamare tali resistenze efficaci) R e viceversa: i minoritari nel primo ferromagnete diventano i maggioritari nel secondo; RF1 RF2 R con queste due posizioni otteniamo Rtot R R RN 2 Configurazione parallela RF1 RF2 R RF1 RF2 R Rtot 2R RN 2 R RN 2R RN R Teoria dell’effetto GMR La variazione percentuale della resistenza tra le due configurazioni dipende dalla differenza di resistenza tra i canali di spin su e spin giù. R R Rtot Rtot R RN R 2 Rtot 2 Tale variazione percentuale può arrivare all’80%. Nel caso limite in cui gli spin minoritari siano molto resistivi, la variazione percentuale può arrivare quasi al cento per cento. Negli esperimenti si possono avere anche molti più strati ferromagnetici intervallati da strati normali. Si può anche studiare l’influenza del numero di strati. Ma il principio base è quello qui descritto. Questo modello efficace è giustificato da una teoria microscopica molto più raffinata ma il principio di funzionamento è ben descritto da questo semplice modello. Prima di chiudere il paragrafo facciamo un confronto dei profili di potenziale nei due casi. 76 Confronto dei profili di potenziale Anche questo si può calcolare col modello delle resistenze efficaci. La curva blu è la curva degli spin maggioritari, quella rossa degli spin minoritari. Tali curve sono delle spezzate perché nel modello a resistenze efficaci il comportamento è completamente ohmico: la caduta di potenziale varia linearmente con la distanza e la pendenza è un indice della resistenza in quel tratto di metallo. Le differenze di valori tra la curva blu e la curva rossa alle giunzioni sono quelle che abbiamo definito “accumulo di spin”. Nella configurazione antiparallela (a sinistra) il segno dell’accumulazione di spin alle due giunzioni è concorde: gli spin che sono maggioritari nella prima giunzione diventano minoritari nella seconda; quello che fanno le due giunzioni in modo concorde è ritardare i portatori con spin SU e accelerare quelli con spin GIÙ, che sono alternativamente maggioritari e minoritari. Le pendenze ci dicono che gli spin SU incontrano minore resistenza degli spin GIÙ nel primo ferromagnete e viceversa nel secondo ferromagnete Nell configurazione parallela c’è sempre un canale (il canale SU nella figura sopra) che è meno resistivo dell’altro. Alle giunzioni vi sono accumuli di spin opposti in segno. La resistenza globale è comunque inferiore che nella configurazione antiparallela. TEST. Il modello a due canali permette di spiegare l’effetto GMR; in esso a. per ogni specie di spin è possibile stabilire un canale elettrico con resistenze differenti a seconda che il ferromagnete sia polarizzato concordemente o meno col metallo normale. b. per ogni specie di spin è possibile stabilire un canale elettrico con resistenze differenti a seconda che il ferromagnete sia polarizzato parallelamente o antiparallelamente alla specie considerata. c. per ogni specie di spin è possibile stabilire un canale elettrico con resistenze differenti a seconda che il metallo normale sia più lungo o più corto della lunghezza di rilassamento di spin. [La risposta corretta è la b.] 77 4.5 Applicazioni del principio del GMR Si invita a cliccare sul sito dei premi Nobel del 2007 che rinvia al sito dell’IBM, la prima azienda che applicò su scala industriale i principi del GMR: http://www.research.ibm.com/research/gmr.html Come si legge un bit? L’effetto GMR può essere utilizzato per realizzare un modo nuovo di leggere un bit d’informazione. In tale schema, la testina di lettura è costituita da un sensore GMR (il parallelepipedo multicolore disegnato qui sotto). Questo è fatto di diversi strati diversi. Lo strato bloccante fornisce un campo magnetico parallelamente al quale si allinea la magnetizzazione dello strato bloccato. Lo strato bloccato è il primo ferromagnete del sensore GMR. Successivamente vi è uno strato spaziatore, che svolge il ruolo del metallo normale. Infine vi è lo strato libero, che svolge il ruolo del secondo ferromagnete del sensore GMR. La magnetizzazione dello strato libero si orienta parallelamente a quella del bit da “leggere”. La testina di lettura costituita dal sensore GMR passa vicino ai bit da leggere (le regioni arancioni). Lo strato verde e lo strato azzurro (i due ferromagneti) possono mettersi in configurazione parallela o antiparallela a seconda di quello che lo strato libero (verde) legge nel BIT che gli scorre sotto. Attraverso la testina GMR scorre corrente. Le variazioni di resistenza corrispondono a variazioni della magnetizzazione dei bit. Aumento della capacità di archiviazione La nuova tecnologia introdotta dall’effetto GMR ha rivoluzionato l’industria dell’archiviazione dell’informazione aumentando la capacità dei dispositivi di memoria. La variazione “gigante” di resistività ha infatti aumentato la sensibilità di un sensore GMR, permettendo così di rendere più piccole le regioni che definiscono i bit da leggere. Questo si traduce in un aumento della densità areale di registrazione, che si misura in bit per centimetro quadro. Si stima che l’avvento dei dischi rigidi con tecnologia GMR nel 1997 abbia condotto a un aumento di circa due ordini di grandezza della densità areale di registrazione da circa 0,16 Gbit/cm2 a 16 Gbit/cm2. (Albert Fert, Review of Modern Physics, 80, 1517 (2008)). 78 Osservazioni conclusive L’effetto GMR è uno di quei casi in cui la comprensione di un affascinante nuovo fenomeno ha comportato un impatto sulla tecnologia che coinvolge la vita quotidiana delle persone. Inoltre la scoperta dell’effetto GMR ha aperto un intero nuovo campo di ricerca, usualmente indicato come spintronica dove sono importanti gli aspetti interdisciplinari tra diversi settori della fisica come il magnetismo, l’elettronica e la fisica dello stato solido. I principi di funzionamento dei nuovi dispositivi spintronici sono profondamente basati sulla natura quantistica degli elettroni e la loro dettagliata comprensione rappresenta una delle sfide più eccitanti non solo della fisica applicata ma anche di quella teorica. TEST. L’effetto GMR ha permesso di aumentare la capacità dei dischi rigidi; lo schema di funzionamento è il seguente: a. i bit sono implementati da regioni che possono contenere due diversi valori di quantità di carica; l'unità di lettura è costituita da un elemento che si polarizza concordemente alla regione che implementa il bit, un metallo normale e un ferromagnete con magnetizzazione opportunamente bloccata; facendo scorrere una corrente è possibile misurare la quantità di carica presente nella regione che implementa il bit. b. i bit sono implementati da regioni magnetizzate in due possibili direzioni; l’unità di lettura è costituita da un elemento che si polarizza concordemente alla regione magnetizzata, un metallo normale e un ferromagnete con magnetizzazione opportunamente bloccata; facendo scorrere una corrente è possibile misurare la quantità di carica presente nella regione che implementa il bit. c. i bit sono implementati da regioni magnetizzate in due possibili direzioni; l’unità di lettura è costituita da un elemento che si polarizza concordemente alla regione magnetizzata, un metallo normale e un ferromagnete con magnetizzazione opportunamente bloccata; facendo scorrere una corrente è possibile misurare la resistenza del sandwich stabilendo la direzione di magnetizzazione della regione che implementa il bit. [La risposta esatta è la c.] La spintronica – Domande 1) Qual è la differenza tra un paramagnete e un ferromagnete? 2) In cosa consiste il modello a due canali per la conduzione elettrica nei metalli ferromagnetici? 3) Che cos’è l’accumulazione di spin? 4) Qual è l’applicazione più famosa dell’effetto GMR? 79 4.6. Test e quesiti Come si definisce la lunghezza di rilassamento di spin? a. b. c. d. e. La media geometrica delle lunghezze degli strati magnetici di un dispositivo F-N-F. La lunghezza ottimale per lo strato non magnetico di un dispositivo F-N-F. La lunghezza ottimale del primo strato magnetico di un dispositivo F-N-F. In un decadimento esponenziale, è la lunghezza sulla quale l’accumulazione di spin si riduce di e−1. La lunghezza ottimale del secondo strato magnetico di un dispositivo F-N-F. [La risposta corretta è la d.] Che cos’è l’accumulazione di spin in una giunzione F−N? a. A causa del campo magnetico interno in un ferromagnete, gli spin del metallo normale tendono ad avvicinarsi alla regione di giunzione, determinando l'accumulazione di spin. b. Poiché in un ferromagnete la corrente elettrica è trasportata in misura uguale dagli elettroni con spin opposto, nella regione di giunzione F−N, deve avvenire un trasferimento di elettroni dalla popolazione di spin minoritaria verso quella maggioritaria. Le due popolazioni di spin sperimentano quindi un potenziale di segno opposto. La differenza tra i due potenziali è detta accumulazione di spin. c. L’accumulazione di spin corrisponde alla quantità di spin acquistata dagli elettroni di conduzione in un ferromagnete. d. In una giunzione F−N l’accumulazione di spin corrisponde alla quantità d’informazione che può essere accumulata. e. Poiché in un ferromagnete la corrente elettrica è trasportata in misura diversa dagli elettroni con spin opposto, nella regione di giunzione F−N deve avvenire un trasferimento di elettroni dalla popolazione di spin maggioritaria verso quella minoritaria. Le due popolazioni di spin sperimentano quindi un potenziale di segno opposto. La differenza tra i due potenziali è detta accumulazione di spin. [La risposta corretta è la e.] Qual è la resistenza, nel modello a due canali, per la configurazione antiparallela della giunzione F−N−F ? Si assuma che i due ferromagneti siano uguali con resistenze R↑ e R↓ per gli spin maggioritari e minoritari e che RN sia la resistenza del metallo normale. a. b. c. d. e. (R↓+R↑+R N)/2 2/(R↓+R↑+RN) (R↑+R↓+R N)/2(2R↓+R N) (2R↑+R N) (2R↓+R N) (2R↑+R N)/2(R↑+R↓+R N) 2(R↓+R↑+R N) [La risposta corretta è la a.] Quale tra le seguenti affermazioni definisce il modello a due canali usato in spintronica? a. A causa del campo magnetico interno, gli elettroni di conduzione di un ferromagnete possono essere divisi in due gruppi individuati dalla proiezione dello spin lungo il campo magnetico interno. I due gruppi costituiscono due conduttori in parallelo. b. In una giunzione ferromagnete-metallo (F−N), i due canali corrispondono alla conduzione degli elettroni nel ferromagnete e nel metallo normale, rispettivamente. c. In un ferromagnete gli elettroni portatori di corrente possono essere divisi in due gruppi a seconda del segno della proiezione dell’impulso sull’asse che individua la direzione della corrente elettrica. d. A causa del campo magnetico interno, gli elettroni di conduzione di un ferromagnete possono essere divisi in due gruppi individuati dalla proiezione dello spin lungo il campo magnetico interno. I due gruppi costituiscono due conduttori in serie. 80 e. I due canali individuano le regioni dove la corrente scorre in senso opposto. [La risposta corretta è la a.] Che cos’è la relazione costitutiva di un mezzo materiale con proprietà magnetiche? a. La relazione che definisce il grado di resistenza del mezzo in presenza di un campo magnetico. b. Il valore del campo magnetico esterno necessario per invertire la magnetizzazione del mezzo. c. La relazione che definisce il valore del campo magnetico esterno necessario per magnetizzare il mezzo. d. La relazione che definisce la dipendenza della magnetizzazione dal campo magnetico, M(H). e. La relazione B=H+M(H) che lega l’induzione B con la magnetizzazione M e il campo magnetico H. [La risposta corretta è la e.] Se indichiamo con Ri,↑ e Ri,↓ le resistenze dei portatori maggioritari e minoritari del ferromagnete i-esimo con i =1,2, qual è la configurazione parallela? a. b. c. d. e. R1,↑=R2,↑ e R1,↓=R2,↓ R1,↑=R2,↓ e R1,↓=R2,↑ R1,↑=R2,↑=R1,↓=R2,↓ R1,↑=R2,↓ e R1,↓=R2,↓ R1,↑=R2,↑ e R1,↓=R2,↑ [La risposta corretta è la a.] 81 Cap. 5 L’effetto Hall quantistico 5.1. Fenomenologia dell’effetto Hall quantistico. Densità degli stati. 5.2. Livelli di energia di Landau per una particella in presenza di un campo magnetico. 5.3. Trattazione matematica 5.4. Stati di bordo e quantizzazione della resistenza di Hall. 5.5. Appendice: argomento di Laughlin 5.6. Test ed esercizi 5.1. Fenomenologia dell’effetto Hall quantistico Effetto Hall Quantistico (QHE) Nel 1985 viene assegnato il premio Nobel per la fisica a Klaus von Klitzing per la sua scoperta, avvenuta nel 1980, dell’effetto Hall quantistico in un gas elettronico bidimensionale. È uno dei premi Nobel più veloci della storia della fisica: questo a testimoniare l’importanza della scoperta, subito compresa da tutta la comunità scientifica. Klitzing tra l’altro era relativamente giovane, non aveva ancora quarant’anni. Vedi anche il sito della Nobel Foundation. Abstract. L’effetto Hall quantistico è l’equivalente quantistico dell’effetto Hall classico. L'effetto Hall quantistico è osservato in sistemi elettronici bidimensionali ad alta mobilità e basso disordine. Un tale sistema elettronico raffreddato a temperature inferiori a 1 K e sottoposto a un forte campo magnetico mostra delle sconcertanti deviazioni rispetto al comportamento previsto dalla teoria classica. In primo luogo, la resistenza di Hall in tali condizioni non è più una funzione lineare del campo magnetico ma rimane costante in corrispondenza di alcuni intervalli del valore del campo. In secondo luogo, la resistenza longitudinale (definita come il rapporto tra differenza di potenziale alle estremità di uno stesso lato del sistema elettronico e la corrente iniettata nello stesso) si annulla in corrispondenza degli stessi intervalli del valore del campo, pertanto il sistema elettronico si comporta come se fosse un superconduttore in quanto supporta un flusso di corrente non dissipativo. Gli intervalli del valore del campo magnetico B per i quali si osservano questi effetti sono centrati intorno a valori di B tali che: nh B 0 , dove e indica la carica elementare dell’elettrone, h è la costante di Planck e il numero e quantico ν (detto fattore di riempimento) prende valori interi (1, 2, 3, ...). La larghezza di tali intervalli cresce all’aumentare del livello di disordine presente nel sistema elettronico. In corrispondenza di tali intervalli il sistema è quantizzato, in quanto il suo comportamento a livello macroscopico dipende in modo critico da effetti quantistici (come avviene per esempio nei 82 superconduttori o nei superfluidi). La quantizzazione del sistema ha l'effetto di annullare la probabilità di urti dissipativi tra portatori di carica e reticolo cristallino e di conseguenza di azzerare la resistenza longitudinale; allo stesso tempo la conduttanza di Hall σ del sistema (definita come il reciproco della resistenza di Hall) può assumere solo valori multipli interi di un quanto fondamentale di conduttanza: e2 h Nell’effetto Hall quantistico ordinario, o intero, il numero quantico ν (detto fattore di riempimento) prende valori interi (1, 2, 3, ...). Mentre in un altro tipo di effetto Hall quantistico, conosciuto come frazionario, la ν assume valori di frazioni con numeratore intero e denominatore intero dispari. Il gas bidimensionale in un mosfet La scoperta dell’effetto Hall quantistico avviene in un sistema conduttivo che viene chiamato gas elettronico bidimensionale, dove sostanzialmente gli elettroni sono confinati in due dimensioni. Come avviene tutto ciò? Si utilizza un dispositivo composto di più parti, un MOSFET. Un MOSFET (metal-oxide field-effect transistor) è costituito da un campione di silicio semiconduttore (tridimensionale, indicato in verde) cui è sovrapposto uno strato di ossido isolante (ossido di silicio SiO2) seguito da uno strato metallico carico positivamente. Se si applica una tensione positiva allo strato metallico si viene a creare un campo elettrico diretto verso il basso, concorde con l’asse z segnato in figura. Gli elettroni del silicio semiconduttore sono attratti verso l’alto, verso il metallo, ma non possono entrare nell’isolante a causa del gap d’energia, e sono quindi schiacciati e confinati in un sottile strato, dove le cariche hanno la possibilità di muoversi soltanto nelle due direzioni x e y. Questo strato è il gas bidimensionale. In prima approssimazione è come se prendessimo gli elettroni in una scatola ed eliminassimo una delle coordinate (la coordinata z in questo caso). L’energia cinetica, ad esempio, diventa E cinetica p x2 p y2 2m 83 In che cosa consiste la scoperta di Von Klitzing? Nella quantizzazione della resistenza di Hall, che abbiamo incontrato nel cap. 2, dedicato al modello di Drude. Abbiamo visto che l’effetto Hall, scoperto da Edwin Hall nel 1879, cento anni prima della scoperta del suo omologo quantistico, consiste nel fatto che, se facciamo scorrere corrente in un conduttore immerso in un campo magnetico con direzione perpendicolare alla direzione di scorrimento della corrente, si osserva una differenza di potenziale ai lati del conduttore; questa differenza di potenziale è legata alla corrente da una resistenza, chiamata appunto resistenza di Hall. Quello che scopre Von Klitzing nel 1980 lavorando su dispositivi MOSFET è la quantizzazione della resistenza di Hall Nell’effetto Hall standard, utilizzando il modello di Drude, abbiamo determinato che la resistenza di Hall è lineare nel campo magnetico. A campi magnetici intensi dell’ordine di decine di Tesla, la resistenza di Hall assume valori che sono gli inversi di multipli del quadrato della carica elettrica diviso per la costante di Planck Si noti che h/e2 ha proprio le dimensioni fisiche di una resistenza. Quello che l’effetto Hall quantistico fa vedere è che la resistenza di Hall è quantizzata con inversi di interi di una resistenza fondamentale che dipende solo da costanti universali. La cosa estremamente sorprendente è che questa quantizzazione è la stessa per tutti i materiali ed è indipendente dalla bontà del materiale. Mentre la teoria della conduzione elettrica nei solidi e nei metalli ci aveva abituato al fatto che la resistenza varia da materiale a materiale e può essere migliorata o peggiorata a seconda di come il materiale viene preparato, l’effetto Hall fa vedere che si ottengono dei valori per la resistenza di Hall indipendenti da qualsiasi dettaglio particolare, per cui la spiegazione di questo effetto deve essere ricercata in qualcosa di estremamente generale e di estremamente fondamentale. Giustamente questo esperimento richiamò l’attenzione di tutta la comunità scientifica della fisica dello stato solido. Tra l’altro ebbe un’importanza notevolissima anche dal punto di vista tecnologico perché fornisce uno standard di resistenza. Non è un caso che 84 Von Klitzing all’epoca collaborasse attivamente con l’Istituto Metrologico Tedesco a Braunschweig. Fenomenologia del QHE - Domande 1) Quali sono le dimensioni fisiche della combinazione e2/h? 2) Qual è la differenza tra effetto Hall classico e quantistico? 5.2. I livelli di Landau Ripartiamo dalla descrizione dell’effetto Hall classico. Elettroni in campo magnetico Abbiamo scritto le equazioni del moto per gli elettroni dv m x eBv y dt d 2 v x, y eB m c2 v x , y dove c è la pulsazione di ciclotrone dv y 2 m dt m eBv x dt Le equazioni del moto sono quelle di un oscillatore armonico con pulsazione di ciclotrone (cfr. lez. 2). Gli elettroni confinati in un piano compiono, classicamente, orbite circolari e le componenti x e y della velocità tendono a fare dei moti armonici. Nella descrizione quantistica sarà dunque necessario quantizzare il moto di oscillatore armonico. Livelli di Landau I livelli energetici di una particella quantistica carica in presenza di un campo magnetico sono detti livelli di Landau perché Landau fu il primo a trattare il problema 85 negli anni Trenta del XX secolo. Essi sono espressi dalla formula standard dei livelli dell’oscillatore armonico, ma con la pulsazione di ciclotrone al posto di quella classica: 1 E n c n con n=0, 1, 2, … 2 Questa formula dipende da un unico numero quantico, n, dell’oscillatore. Questo fatto deve indurre a qualche riflessione perché in realtà noi stiamo trattando un problema in due dimensioni. In assenza di campo B i livelli energetici devono essere quelli della particella libera: dobbiamo pertanto confrontare/mettere-in-relazione la formula appena scritta con quella dei livelli energetici per gli stati elettronici in due dimensioni a campo nullo E nx n y 4 2 2 2 2 n n x y 2 2mL In questa seconda formula l’energia dipende da due numeri quantici, uno per la direzione x (nx) e uno per la direzione y (ny) Se in assenza di campo magnetico abbiamo due numeri quantici mentre in presenza di un campo magnetico abbiamo un unico numero quantico questo significa che in presenza di un campo magnetico esiste un numero quantico che non appare esplicitamente nell’espressione dell’energia: quando un numero quantico non appare esplicitamente nell’espressione dell’energia significa che i livelli energetici (i livelli di Landau) devono essere degeneri rispetto a quel numero quantico. E quindi possiamo dire che i livelli di Landau sono caratterizzati da un certo grado di degenerazione. Cerchiamo di capire l’origine di questa degenerazione. Per far questo dobbiamo sviluppare alcuni argomenti relativi allo spazio delle fasi introdotto nel Capitolo 1. Spazio delle fasi Classicamente gli stati di una particella sono individuati dal valore delle componenti cartesiane della posizione e dell’impulso. Il numero totale di queste componenti determina la dimensione del cosiddetto spazio delle fasi. Nel caso di un moto libero in due dimensioni vincolato in un quadrato di lato L, il volume dello spazio delle fasi a disposizione delle particelle sarà il prodotto del volume del sottospazio delle coordinate spaziali per il volume del sottospazio delle coordinate impulso. Il volume di quest’ultimo dipende dall’energia delle particelle. Un modo per passare dalla meccanica classica a quella quantistica è quello di discretizzare lo spazio delle fasi classico, introducendo delle celle di dimensione unitaria pari alla costante di Planck per ogni grado di libertà. Questo argomento è già apparso alla fine del Cap. 3 quando siamo passati dalle sommatorie agli integrali. 86 Numero di stati quantistici In meccanica quantistica, il numero di stati si ottiene dividendo il volume dello spazio delle fasi per quello della cella elementare. Il prodotto di un impulso per una coordinata ha le dimensioni fisiche di un’energia per un tempo. Queste dimensioni fisiche sono quelle della costante di Planck. La cella elementare è dunque determinata dalla costante di Planck elevata a una potenza pari al numero di coppie coordinataimpulso necessarie per descrivere il moto. Nel caso di un moto in due dimensioni, la cella elementare è data quindi dalla costante di Planck al quadrato. h 2 2 2 Densità degli stati Se consideriamo un cerchio di raggio p nel sottospazio degli impulsi, la sua area moltiplicata per l’area del quadrato di lato L (superficie della scatola, che corrisponde al “volume” della parte spaziale dello spazio delle fasi) e divisa per la costante di Planck al quadrato determina il numero di stati con valore dell’impulso uguale o minore di p. Se vogliamo, ad esempio, calcolare il numero di stati quantistici che si trovano in una corona circolare compresa tra i cerchi di raggio p e p+dp dobbiamo calcolare l’area della corona, moltiplicarla per L2 (“volume” della parte spaziale dello spazio delle fasi) e dividerla per h2. il numero di stati (disponibili) con valore dell’impulso tra p e p+dp è dunque pari a: 2 p dp p2 2 L 2 2 87 L2 2 pdp 2 2 Densità degli stati N(E) Poiché l’energia non dipende dalla direzione dell’impulso ma solo dal suo modulo, tutti gli stati che si trovano sulla stessa circonferenza (che hanno cioè lo stesso modulo) hanno la stessa energia; e poiché, viceversa, il modulo dell’impulso è funzione dell’energia, possiamo chiederci quanti sono gli stati con energia compresa tra E e E+dE. Usando il fatto che l’energia è una funzione quadratica dell’impulso, ricaviamo che il numero di stati con energia compresa tra E (corrispondente a impulso p) e E+dE (corrispondente a impulso p + dp) e lo stesso del numero di stati per l’impulso compreso tra p e p + dp: 2 pdp mL2 N E dE L dE 2 2 2 2 2 dove si è tenuto conto del fatto che p2 p E dE dp 2m m Nel caso in esame bidimensionale, si noti che N(E) non dipende da E. Come possiamo utilizzare tale risultato? Degenerazione dei livelli di Landau A sinistra è mostrato lo spettro dei livelli energetici quando il campo B è assente. Questi sono dei livelli discreti ma nei limiti delle dimensioni macroscopiche della regione di spazio in cui gli elettroni sono confinati tali livelli tendono a diventare così fitti da diventare un continuo; qui sono stati tracciati in maniera discreta per comodità di lettura. 88 Cosa accade quando “accendiamo” un campo magnetico? L’energia assume i valori dei livelli di oscillatore armonico, i quali sono spaziati dalla quantità c eB dove c . m Se il campo B è abbastanza intenso la spaziatura tra i livelli sarà piuttosto marcata (come segnato nella figura sopra, nella parte destra). Poiché il numero di stati non può dipendere dal valore del campo magnetico, in ogni livello di Landau (di oscillatore armonico) si “addensano” più livelli. Il grado di addensamento determina la “degenerazione dei livelli di Landau” (si deve intendere “degenerazione” come occupazione dello stesso livello energetico da parte di più stati, per cui il livello risulta dotato di una “molteplicità”). Se siamo in grado di calcolare esattamente quanti sono gli stati che vanno a condensarsi in un unico livello di oscillatore armonico siamo in grado di calcolare la “degenerazione dei livelli di Landau”. Applicando l’idea del “principio di conservazione degli stati” (gli stati non possono sparire!) e assumendo come ragionevole che questo raggruppamento sia uniforma lungo l’asse delle energie (N.d.C.: che la “molteplicità” sia la stessa per ogni livello di Landau), possiamo calcolare che in un intervallo c (distanza tra un livello di Landau e il successivo) ci sarà un numero di stati pari a questa distanza di energia per la numerosità degli stati in assenza di campo magnetico. (qui la numerosità è da intendersi come dn/dE che corrisponde all’N(E) visto sopra) Il valore g della degenerazione dei livelli di Landau si ottiene moltiplicando N(E) per l’intervallo energetico tra un livello di Landau e il successivo quando il campo è diverso da zero: mL2 2 eB g N E c L c 2 2 h cioè: maggiore è il campo B maggiore è la degenerazione dei livelli di Landau. Siamo ora in grado di definire quello che viene chiamato fattore di riempimento Il fattore di riempimento è definito come il rapporto tra il numero di elettroni nel sistema e il numero di stati in un livello di Landau, cioè la degenerazione g che abbiamo calcolato (esso ci dice in sostanza quanti elettroni possono andare a occupare lo stesso livello di Landau). Il numero di elettroni in un sistema bidimensionale è dato dal prodotto della densità superficiale n di elettroni per l’area del sistema, che corrisponde all’area del quadrato di lato L che stiamo considerando. nL2 hn v Fattore di riempimento eB h L2 eB Esso indica quanti livelli di Landau sono stati riempiti. 89 Siamo ora in grado di capire una parte dell’origine della quantizzazione della resistenza di Hall Supponiamo ora di avere un numero di elettroni tale da riempire un numero intero di livelli di Landau, cioè tale da avere livelli di Landau o completamente pieni o completamente vuoti, ovvero il numero di elettroni deve essere un multiplo della degenerazione dei livelli di Landau, il che è lo stesso che dire che il fattore di riempimento (che indica quanti livelli di Landau sono stati riempiti) è pari a un numero intero. Questo valore del fattore di riempimento (un numero intero) determina una relazione tra il campo magnetico e la densità: v hn . Se prendiamo l’espressione classica della eB B R resistenza di Hall, quella ricavata dal modello di Drude, H en , e, nell’ipotesi che abbiamo un numero intero di livelli di Landau riempito, esprimiamo il campo B utilizzando il fattore di riempimento visto sopra ( B hn ) ev otteniamo RH B 1 hn h 1 en en ev e 2 v formula in cui la densità n, che è una caratteristica del materiale, si semplifica e sparisce. La RESISTENZA DI HALL QUANTIZZATA assume esattamente il valore osservato negli esperimenti: è quantizzata nel senso che il suo inverso è pari a un numero intero per una costante. Tale costante è pari al quadrato della carica divisa per la costante di Planck. Introduciamo ora la costante di Von Klitzing Nel SI (sistema internazionale) delle unità di misura una resistenza è misurata in Ohm, corrispondente dimensionalmente a V 1 J 1 1 m 2 Kg m 2 Kg m 2 Kgs 1 h 2 3 2 2 2 A A C A As s As As e La combinazione di costanti fondamentali come la costante di Planck e la carica dell’elettrone determina un quanto naturale di resistenza o del suo inverso, cioè la conduttanza. L’effetto Hall quantistico introduce la costante di von Klitzing h RK 25812.807 2 e 90 Robustezza della Quantizzazione Finora abbiamo visto che la quantizzazione della resistenza di Hall è la conseguenza di due fatti: 1. quantizzazione delle orbite di ciclotrone; 2. il fattore di riempimento è un numero intero. Il fattore di riempimento dipende dal campo magnetico specifico; ci si può aspettare che solo per determinati valori del campo magnetico si verifichi la quantizzazione della resistenza di Hall. In altre parole, in un grafico BRH dovremmo vedere questa quantizzazione soltanto a punti isolati di B. Invece, quello che gli esperimenti fanno vedere è che la quantizzazione “è robusta”: si estende su tratti estesi di valori del campo magnetico. Quello che ancora non riusciamo a spiegare è la “robustezza della quantizzazione”, il fatto cioè che la quantizzazione rimanga anche facendo variare il campo B. Cosa succede esattamente quando facciamo variare il campo B? Cosa accade cioè se il fattore di riempimento non è intero (che è quel che accade se, a numero di elettroni fissato, vi è una minima variazione del campo magnetico)? In base a quanto detto, non ci sarebbe la quantizzazione. Eppure l’esperimento mostra una quantizzazione robusta su intervalli finiti di campo magnetico! Il motivo cercheremo di spiegarlo nel prossimo paragrafo. Livelli di Landau – Test e domande 1) I livelli di Landau sono dati dalla quantizzazione delle orbite di ciclotrone di particelle cariche in un campo magnetico. Tali livelli sono degeneri e il numero di elettroni diviso per la degenerazione dei livelli di Landau a. è inversamente proporzionale alla intensità del campo magnetico. b. non dipende dalla intensità campo magnetico. c. è direttamente proporzionale alla intensità del campo magnetico. 2 eB [La domanda chiede in sostanza l’espressione n g n L . La risposta corretta è la a.] h 2) Che cos’è la densità degli stati? 3) Che cos’è il fattore di riempimento? 5.3. Trattazione matematica Per la trattazione matematica dei livelli di Landau dobbiamo ricorrere al formalismo generale della meccanica quantistica Formulazione matematica Equazione di Schrodinger H E per determinare i livelli energetici stazionari 91 Dato che la particella si muove sotto l’azione del campo magnetico, l’operatore Hamiltoniano di una particella carica è scritto in termini del potenziale vettore A, il cui rotore è il campo magnetico. Sappiamo che esistono diverse possibili scelte del potenziale vettore A. Consideriamo la situazione di una particella confinata a muoversi in un piano, che scegliamo essere il piano xy. Il campo magnetico è diretto lungo l’asse z. L’invarianza di gauge ci dice inoltre che esistono diverse scelte del potenziale vettore A il cui rotore dà sempre il medesimo campo B. Nel formalismo hamiltoniano dobbiamo far entrare il potenziale vettore A, la cui funzione risulta quella di “spostare” l’impulso. Hamiltoniana in presenza di un campo magnetico H 1 i x eAx 2 i y eAy 2 2m B rotA Formalmente essa ha l’aspetto dell’hamiltoniana di una particella in due dimensioni: riconosciamo, ad esempio, che i x è la componente dell’operatore impulso lungo la direzione x e che i y è la componente dell’impulso lungo la direzione y; entrambe sono spostate di quantità proporzionali alle componenti x e y rispettivamente del potenziale vettore moltiplicato per la carica. Questa formulazione hamiltoniana della meccanica classica è equivalente alla forza di Lorentz. Non ci interessa sapere come ci siamo arrivati; noi sappiamo che B è il rotore di A e che A entra nell’hamiltoniana in questo modo. Partiamo da qua: ci interessa risolvere l’equazione. L’invarianza di gauge ci permette, per un certo B, diverse scelte di A… e dobbiamo operare una scelta opportuna di A. Bx y Az z Ay By z Ax x Az B rotA equivale a Bz x Ay y Ax Gauge di Landau L’invarianza di gauge consente di avere diverse scelte del potenziale vettore che corrispondono allo stesso campo magnetico. Poiché il campo magnetico nel nostro esempio è uniforme ed è diretto lungo l’asse z, una scelta possibile per A è la cosiddetta gauge di Landau (così chiamata perché introdotta da lui stesso) Ax 0 Ay Bx Az 0 Si verifica facilmente che il rotore di questo A è proprio un campo B uniforme diretto secondo l’asse z. 92 Funzione d’onda Se usiamo la gauge di Landau, l’operatore Hamiltoniano dipende dai due impulsi px e py e dalla sola coordinata x. H 1 i x 2 i y eBx2 2m Dato che Ax 0 la parte di operatore hamiltoniano che dipende dall’impulso in direzione x assume la forma standard delle particelle in una scatola mentre la parte che dipende dall’operatore impulso in direzione y risulta spostata di una quantità eBx. L’osservazione importante è che per questa scelta di gauge l’operatore hamiltoniano dipende da px e py e dalla sola coordinata x: il fatto che non ci sia dipendenza dalla coordinata y ci dice che il nostro sistema è invariante per traslazioni lungo la direzione y. Gli autostati di un sistema invariante per traslazioni sono le onde piane; ovvero, per quel che riguarda la coordinata y la nostra funzione d’onda soluzione dell’equazione sopra deve essere un’onda piana. Questo permette di cercare la soluzione per la funzione d’onda nella forma di un prodotto di un’onda piana lungo la direzione y per una funzione della variabile x. Chiameremo p il vettore d’onda lungo la direzione y (è il parametro che indicizza l’onda piana) x, y eipy x Oscillatore armonico Facendo agire l’operatore Hamiltoniano sulla funzione d’onda così ottenuta, si ricava x che dobbiamo determinare. H x x E x un’equazione di Schrödinger efficace per la Quest’equazione corrisponde a quella di un oscillatore armonico con pulsazione di ciclotrone. 1 2 2 mc2 2 2 i x p eBx x x xc 2 Hx 2m 2m 2 p x L’origine dell’oscillatore non è nell’origine ma è in c eB , determinata cioè dal valore del numero quantico p che descrive l’onda piana nella direzione y. Otteniamo dunque che il problema dell’hamiltoniano di una particella carica in presenza di un campo magnetico si è ridotto al moto di onda piana lungo la direzione y e al moto di un oscillatore armonico lungo la direzione x. I numeri quantici che descrivono questo problema sono due, esattamente come dovevamo aspettarci da ragionamenti fatti in precedenza… e sappiamo associarli a una funzione d’onda particolare: il primo di tali numeri è quello che caratterizza 93 l’hamiltoniana, l’impulso p dell’onda piana; l’altro è il numero quantico associato all’oscillatore armonico (con pulsazione di ciclotrone) (n=0, 1, 2, …) che indica il livello energetico della particella carica in campo magnetico. Ogni livello energetico è degenere e la degenerazione è descritta dall’impulso dell’onda piana p, che determina l’origine del potenziale di oscillatore per ogni stato. La degenerazione, che prima abbiamo calcolato con argomenti euristici e intuitivi, può essere riottenuta calcolando quanti sono i possibili valori di p che caratterizzano l’onda piana, e questo si può fare facilmente perché se consideriamo che il moto lungo la direzione x è confinato entro una distanza L, i valori del centro possibile sono spaziati di xc p eB Il valore della degenerazione g si riottiene considerando quanti centri di oscillatore possono essere inseriti lungo la direzione x di estensione L: L LeB LeB eBL2 g xc p h L h TEST. L’equazione di Schrodinger per un elettrone in un piano (x,y) sottoposto a un campo magnetico uniforme ortogonale al piano stesso può essere ridotta a. all’equazione dell’elettrone libero lungo la componente y e a quella di un oscillatore armonico lungo x che oscilla intorno a un punto di coordinata proporzionale all’intensità del campo magnetico. b. all’equazione dell’elettrone libero lungo la componente y e a quella di un oscillatore armonico lungo x che oscilla intorno a un punto di coordinata proporzionale all’impulso totale dell’elettrone. c. all’equazione dell'elettrone libero lungo la componente y e a quella di un oscillatore armonico lungo x che oscilla intorno a un punto di coordinata proporzionale all’impulso dell’elettrone lungo y. [La risposta esatta è la c.] 5.4. Gli stati di bordo Effetto del confinamento Abbiamo visto che l’energia dei livelli di Landau non dipende dal numero quantico p, cioè dalla posizione del centro xc dell’oscillatore. Questo è vero però solo in un sistema infinito dove ogni punto dello spazio è equivalente ad ogni altro: in tal caso possiamo mettere l’oscillatore dove vogliamo e non varierà l’energia dei livelli. Se il sistema (l’oscillatore armonico, che ha un potenziale quadratico) è confinato la situazione cambia: la posizione dell’oggetto può influire sull’energia dei livelli. Questo può essere compreso nel caso semplice di un oscillatore armonico confinato sulla semiretta positiva. Ripensiamo per un attimo all’oscillatore armonico classico centrato nell’origine per il quale i livelli di energia dono dati da En n 1 2 . Tali livelli di energia sono 94 classificati in “pari” e “dispari”: sono “pari” quelli per cui la relativa funzione d’onda è una funzione pari, “dispari” quelli per cui la relativa funzione d’onda è dispari. Se perturbiamo il nostro oscillatore confinandolo sulla semiretta positiva (ovvero se innalziamo sull’origine una barriera di potenziale infinita per cui l’oscillatore può stare soltanto, per esempio, nelle x positive), si possono calcolare i nuovi livelli energetici dell’oscillatore confinato semplicemente selezionando dai livelli energetici originari quelli che corrispondono a funzioni d’onda dispari rispetto al centro dell’oscillatore, livelli che sono dati dalla seguente formula. En c 2n 3 2 L’energia di ogni livello risulta innalzata, in particolare quello stato fondamentale corrispondente a n=0. Vediamo qui sotto la funzione d’onda per i primi due livelli (n=0 e n=1) dell’oscillatore armonico: per n=0 la funzione d’onda del livello fondamentale non deve avere zeri e non deve avere nodi; per n=1 la funzione d’onda ha un nodo e, per simmetria, questo nodo è nell’origine. Se l’oscillatore è confinato ai valori positivi della x (una barriera di potenziale infinita nell’origine), la funzione d’onda deve aggiustarsi con le nuove condizioni nell’origine; solo il livello n=1 è permesso, in quanto la sua funzione d’onda si annulla nell’origine. Questo è vero per tutti i valori dispari di n, che continuano ad essere dunque “buone” funzioni d’onda per il nuovo problema “confinato”. (Nota: l’n=0 della nuova formula coincide con l’n=1 della primitiva, l’n=1 corrisponde all’n=3 della primitiva, l’n=2 corrisponde all’n=5 della primitiva) Il fatto che i livelli energetici dell’oscillatore risultino aumentati per effetti di bordo si traduce nella seguente figura: 95 La figura mostra a titolo di esempio l’andamento dei primi quattro livelli di Landau nel caso in cui le particelle sono confinate lungo la direzione x. Per valori di xc (centro di oscillazione dell’oscillatore armonico) lontani dal bordo sono possibili tutti i valori di energia dell’oscillatore armonico e i livelli di energia sono quelli soliti, equispaziati tra loro. Si noti come l’energia del livello vari invece in modo pronunciato in prossimità dei bordi. La pendenza potrà essere più o meno brusca a seconda delle situazioni. Relazione tra energia e velocità Per effetto del confinamento, l’energia dei livelli di Landau (perde la degenerazione dovuta al numero p e) acquista una dipendenza dalla posizione del centro dell’oscillatore xc, e quindi anche dal numero quantico p. En, p (n indica il livello di Landau) La derivata dell’energia rispetto al numero quantico p (che parametrizza l’onda piana lungo la direzione y) determina la velocità lungo la direzione y dello stato individuato dalla coppia n e p. v y n, p E n, p p Come utilizziamo questo risultato? 96 Corrente di un livello di Landau La corrente di un livello di Landau (indicato da n) è data dalla velocità lungo la direzione y integrata sui valori del numero quantico p. La corrente risulta quindi pari alla frazione (e/h) per l’intervallo di energie coinvolte. J n, y e dp dp E n, p e e v y n, p e dE E h h p h h Questo è il primo passo verso la comprensione dell’effetto Hall quantistico. TEST. Se consideriamo un oscillatore armonico e imponiamo che sia confinato in una opportuna regione di spazio: a. i livelli energetici dell’oscillatore si alzano; l’effetto è più marcato se il centro di oscillazione è vicino ai bordi della regione di spazio. b. i livelli energetici dell’oscillatore si abbassano; l’effetto è più marcato se il centro di oscillazione è vicino ai bordi della regione di spazio. c. i livelli energetici dell’oscillatore si alzano; l’effetto è più marcato se il centro di oscillazione è lontano dai bordi della regione di spazio. Cerchiamo di dare una rappresentazione intuitiva di quanto visto finora. Stati di bordo Poiché la corrente è diversa da zero per gli stati per cui la derivata dell’energia rispetto a p è diversa da zero, la corrente nel regime di effetto Hall quantistico è dovuta principalmente agli stati di bordo. Dal punto di vista classico possiamo interpretare questo fatto come illustrato nella figura. L’elettrone vicine al bordo non potrà completare la sua orbita e subirà una riflessione. Le orbite che si propagano lungo i bordi riescono a mantenere sempre lo stesso verso medio di propagazione, a differenza per quanto accade per le orbite lontane dai bordi al centro del sistema, classicamente circolari. 97 Queste orbite che scivolano (verso il basso o verso l’alto a seconda della parete considerata) sono dette in inglese skipping orbits. Nella figura sotto a sinistra sono rappresentate tratteggiate. La velocità (derivata dell’energia rispetto alla quantità di moto) ha segno opposto agli opposti confini della regione di confinamento, le diverse velocità sono i diversi sensi di scorrimento degli stati di bordo. Stati di bordo ed effetto Hall Quando si effettua una misura Hall essenzialmente si “contattano” i due bordi del conduttore e si misura la corrente che scorre nel sistema. In assenza di potenziale di Hall entrambi i bordi si trovano alla stessa energia che è l’energia di Fermi che è quella di equilibrio. Quando applichiamo (leggi: si misura) una differenza di potenziale significa che un bordo avrà stati popolati a un’energia leggermente superiore pari al potenziale di Hall moltiplicato per la carica unitaria. Gli stati di bordo a destra portano una corrente positiva fino all’energia E F. Gli stati sul bordo opposto, una corrente negativa fino all’energia EF+eVH. Nella figura di destra sono riportati in rosso i due livelli di Landau più bassi. Delle due linee tratteggiate, quella nera più in basso rappresenta l’energia di Fermi quando non è applicata nessuna differenza di potenziale: il numero di stati di bordo che vanno in una direzione è lo stesso del numero di stati di bordo che vanno nell’altra direzione. In situazione di equilibrio non si ha corrente. Quando si applica (leggi: si misura) una differenza di potenziale VH tra i due bordi si popolano in maniera diversa gli stati di bordo. Gli stati di energia tra EF ed EF+eVH sono popolati solo da un lato: questi non possono essere compensati e danno origine a una corrente netta. Quanto vale tale corrente? e e e2 J E eVH VH h h h 98 la costante di proporzionalità tra corrente e potenziale di Hall è proprio l’inverso della resistenza di Hall. Non abbiamo però ancora spiegato la Robustezza della quantizzazione della resistenza di Hall Supponiamo che il potenziale chimico, cioè l’energia di Fermi, si trovi al livello più basso (retta tratteggiata più in basso nella figura sotto). In questa situazione soltanto il livello di Landau più basso interseca l’energia di Fermi. Quindi, se facciamo una misura di Hall, alla corrente parteciperanno soltanto gli stati di bordo relativi al livello di Landau più basso. E se facciamo il ragionamento della diapositiva precedente ritroviamo la quantizzazione. Che cosa accade se variamo l’energia di Fermi? Variare l’energia di Fermi significa variare il numero di elettroni a disposizione, e questo significa popolare un livello di Landau rispetto a un altro; matematicamente questo è equivalente a variare il campo magnetico perché il campo magnetico controlla la degenerazione dei livelli, quindi se, fissato il numero di elettroni, variamo il campo magnetico variamo come i livelli vengono popolati; se invece manteniamo fisso il campo magnetico allora variare il numero di livelli riempiti significa variare il numero di elettroni. Per comodità è più semplice pensare di aggiungere elettroni. Se dunque, aggiungendo elettroni, cominciamo a riempire altri stati di bordo sempre più in alto a un certo punto si incontra il secondo livello di Landau. Appena incontrato il secondo livello di Landau dovrebbe cambiare il valore della quantizzazione. In realtà la situazione è più complessa perché in un sistema reale – diverso da quello ideale considerato fin qui – possono esistere imperfezioni, atomi che mancano che in un sito reticolare, possono quindi esistere una serie di termini nell’hamiltoniana che rompono l’invarianza traslazionale considerata fino ad adesso; questo significa che invece di avere un livello di Landau completamente degenere anche al centro del nostro sistema, questo livello di Landau può spezzettarsi, scindersi in livelli non degeneri. Questo spezzettarsi del livello originario è rappresentato nella figura qui sopra a sinistra dalle regioni tratteggiate che rappresentano appunto un insieme di livelli che si trovano in quella regione di energia. 99 In generale, dunque, la presenza di imperfezioni nei materiali determina una parziale rimozione della degenerazione dei livelli di Landau all’interno del sistema in modo da creare una banda di livelli. L’assunzione che allora si fa (giustificata da considerazioni teoriche più avanzate) è che questi livelli non degeneri siano localizzati al centro del sistema e non siano in grado di portare corrente. Quindi, quel che accade quando aumentiamo il numero di elettroni, il potenziale chimico ovvero l’energia di Fermi comincia a spostarsi verso l’alto; quando incontra il secondo livello di Landau per prima cosa incontra degli stati localizzati (al centro) che non conducono corrente: comincia a popolarli ma non cambia il numero di stati bordo che partecipa alla corrente; e quindi non cambia la quantizzazione. In prossimità dei bordi resta dominante il potenziale di confinamento e permangono gli stati di bordo. Una variazione della popolazione dei livelli, fintanto che è limitata ai livelli interni al sistema non disturba la quantizzazione che rimane dunque “robusta”. Naturalmente, quando l’energia di Fermi sale ancora e la linea tratteggiata più in alto arriverà a toccare gli stati di bordo del secondo livello di Landau, allora questi stati di bordo cominceranno anch’essi a condurre e allora la quantizzazione passerà a un livello di quantizzazione diversa, cioè al gradino successivo. Questa cosa si ripete, continuando ad aumentare il numero di elettroni, per tutti i livelli di Landau; di qui l’aumento a gradini della resistenza di Hall e quindi la robustezza al variare del campo magnetico. Perché RH varia a tratti? Siamo ora in grado di capire perché la resistenza di Hall ha un andamento a tratti. A un dato valore del campo magnetico, e quindi a un determinato valore della degenerazione dei livelli di Landau, solo un numero finito di livelli di bordo si trova all’energia di Fermi. Tale numero determina la quantizzazione della resistenza di Hall. Al variare del campo magnetico, il livello di Fermi si sposta e altri stati possono essere o popolati o svuotati. Fintanto che gli stati coinvolti sono quelli lontani dai bordi, il valore della resistenza di Hall non cambia, determinando un andamento piatto. La resistenza di Hall può solo cambiare per l’occupazione o lo svuotamento di uno stato di bordo. Osservazioni conclusive L’effetto Hall quantistico è una spettacolare manifestazione di un comportamento quantistico su scala macroscopica. Ciò può avvenire in quanto la degenerazione dei livelli di Landau indotta dal campo magnetico permette che un numero macroscopico di elettroni si trovi alla stessa energia e che non sia possibile la dissipazione a causa di un gap d’energia tra lo stato fondamentale egli stati eccitati. Lo stato fondamentale rimane dunque assai stabile. Dal punto di vista della resistenza longitudinale, un sistema Hall quantistico può definirsi un isolante: cioè, quando la resistenza Hall (trasversa) è quantizzata quella longitudinale è pari a zero. 100 Gli stati di bordo – Test e domande 1) Quando per descrivere l’effetto Hall quantistico si considera una situazione più realistica in cui possono essere presenti delle imperfezioni nei materiali: a. parte della degenerazione degli stati di oscillatore che oscillano lontani dal bordo è rimossa; gli elettroni in tali stati conducono corrente e quando l’energia di Fermi raggiunge uno di essi cambia il valore della resistenza. b. parte della degenerazione degli stati di oscillatore che oscillano lontani dal bordo è rimossa; gli elettroni in tali stati non conducono corrente; al contrario, per gli stati di bordo continua a dominare il potenziale di confinamento. c. parte della degenerazione degli stati di oscillatore che oscillano in prossimità del bordo è rimossa; gli elettroni in tali stati non conducono corrente, al contrario degli elettroni negli stati di oscillatori lontani bordo. [La risposta corretta è la b.] 2) Perché il confinamento aumenta l’energia dei livelli elettronici? 3) Che cosa determina la direzionalità degli stati di bordo? 4) Che cosa determina il comportamento a tratti della resistenza di Hall? 5.5. Appendice: argomento di Laughlin Un potente argomento dovuto a Robert Laughlin mostra che la quantizzazione della resistenza di Hall è il risultato di alcuni principi molto generali. Questi sono: 1. La legge di Faraday in base alla quale una variazione di flusso concatenato con un circuito induce in quest’ultimo una forza elettromotrice. 2. Il comportamento della funzione d’onda per una trasformazione di gauge. 3. L’ipotesi che il sistema si trovi in un cosiddetto gap di mobilità, cioè l’energia di Fermi si trovi in una regione d’energia senza stati o con stati localizzati. Consideriamo un elettrone in campo magnetico. L’equazione d’onda è 2 1 i eA E 2m 2 1 i i 0 E 0 Cerchiamo la soluzione nella forma e 0 con 2m La fase può essere scelta come l’integrale di linea del potenziale vettore, a patto che questi sia longitudinale, cioè sia pura gauge r r 2 2 r dr ' Ar ' dr ' Ar ' h e r0 0 r0 101 Immaginiamo una struttura anulare. Nella corona circolare è presente un campo magnetico B perpendicolare. Tra i bordi esterno ed interno è presente una differenza di potenziale VH e una corrente I scorre in direzione azimutale. Inoltre supponiamo di concatenare, mediante un solenoide, un flusso all’interno dell’anello, come mostrato. Il campo magnetico del solenoide quindi non è presente nella corona circolare dove si trovano gli elettroni. Benché gli elettroni nella corona non sentano il campo magnetico del solenoide, le loro funzioni d’onda sentono il flusso da esso creato. Ora bisogna distinguere due casi. Se la funzione d’onda è localizzata in una regione piccola, allora il flusso può essere eliminato mediante una trasformazione di gauge. Se la funzione è delocalizzata su tutto la corona circolare, la trasformazione di gauge è possibile solo se si garantisce che la funzione d’onda sia ad un sol valore. Per questo si richiede che la variazione di flusso debba essere un multiplo del quanto Φ0=h/e. Il potenziale vettore responsabile del flusso è puramente azimutale A eˆ 2r La derivata dell’operatore Hamiltoniano è quindi espressa in termini dell’operatore corrente lungo la direzione azimutale H ˆ J r eˆ 2r Ricordiamo il teorema di Feynman-Hellman da cui E H H H H E H ˆ r eˆ J E H 1 2r 102 La variazione di flusso induce nel circuito una forza elettromotrice che compie lavoro sulla corrente che scorre in direzione azimutale. Tale lavoro, in assenza di dissipazione a causa del gap di mobilità, deve risultare in energia assorbita dal sistema. Poiché la variazione di un quanto di flusso risulta in una trasformazione di gauge, lo spettro del sistema resta invariato. L’energia assorbita deve quindi corrispondere ad una diversa distribuzione degli elettroni nei livelli energetici, cioè in un trasferimento di un numero intero di elettroni da un bordo all’altro con variazione di energia E neVH Applicando la relazione del teorema di Feynman-Hellman e valutando la derivata come il rapporto tra la variazione di energia e la variazione di flusso, si ottiene la quantizzazione della resistenza di Hall E neVH e2 I n VH he h I 5.6. Test ed esercizi Qual è il principio mediante il quale si realizza un gas elettronico bidimensionale in un dispositivo MOSFET? a. In un dispositivo MOSFET si ha un sistema composto metallo-isolante-semiconduttore. Gli elettroni non possono passare dal metallo all’isolante e formano nel metallo uno gas bidimensionale. b. In un dispositivo MOSFET, un semiconduttore è immerso in un gas, la cui pressione esercita una forza sugli elettroni obbligandoli a restare vincolati alla superficie del semiconduttore. c. In un dispositivo MOSFET, un semiconduttore è in contatto con un isolante, cui è sovrapposto un metallo carico negativamente. Gli elettroni sono quindi respinti verso l’interfaccia isolantesemiconduttore, ma non possono oltrepassarla a causa della gap d’energia nell’isolante. d. In un dispositivo MOSFET, un semiconduttore è in contatto con un isolante, cui è sovrapposto un metallo carico positivamente. Gli elettroni sono quindi attratti verso l’interfaccia isolantesemiconduttore, ma non possono oltrepassarla a causa della gap d’energia nell’isolante. e. In un dispositivo MOSFET si ha un metallo molto sottile compreso tra un isolante ed un semiconduttore. Nel metallo si crea un gas elettronico bidimensionale. [La risposta corretta è la d.] Quali sono le costanti fisiche fondamentali che appaiono nell’espressione della resistenza di Hall quantizzata? a. b. c. d. e. La costante di Planck h e la carica unitaria e. La costante di Planck h e la velocità della luce c. La costante di Planck h e la costante di Boltzmann kB. La costante di Planck h e la massa dell’elettrone m. La carica unitaria e, la costante dielettrica del vuoto ϵ0 e la velocità della luce c. [La risposta corretta è la a.] 103 Quali sono le equazioni del moto classiche di una particella di carica q vincolata a muoversi su un piano (piano xy) in presenza di un campo magnetico perpendicolare al piano stesso? a. b. c. d. e. m dvx/dt=q vx Bz, m dvx/dt=q vy/ Bz m dvx/dt = q Bz (1/m) dvx/dt =q vy Bz m dvx/dt =q vy Bz m dvy /dt=−q vy Bz m dvy /dt=−q vx/Bz m dvy /dt=−q Bz (1/m) dvy/dt=−q vx Bz m dvy /dt=−q vx Bz dvx eBv y dt [la risposta corretta è con q al posto di – e. ] dv y m eBv x dt Quale delle seguenti espressioni descrive la funzione hamiltoniana in un campo magnetico di una particella di carica q e vincolata a muoversi in un piano? m a. b. c. d. e. H=1/2m [(−iℏ∂x−qAx)2+(−iℏ∂y−qAy)2], con A=rotB. H=1/2m [(−iℏ∂x−qAx)2+(−iℏ∂y−qAy)2], con B=rotA. H=1/2m [(−iℏ∂x−qAy)2+(−iℏ∂y+qAz)2], con B=rotA. H=1/2m [(−iℏ∂x−qBx)2+(−iℏ∂y−qBy)2]. H=1/2m [(−iℏ∂x)2+(−iℏ∂y)2]+ B ⋅ rotA . [La risposta corretta è la b.] Cosa sono i “livelli di Landau”? a. I valori massimi dei raggi delle orbite di una particella quantistica in un campo magnetico applicato. b. Le massime ampiezze della funzione d’onda di una particella quantistica carica in un campo magnetico. c. I livelli energetici per gli elettroni in un gas bidimensionale. d. I livelli energetici di una particella quantistica carica in moto in presenza di un campo magnetico applicato. e. I valori energetici per i quali la resistenza di Hall è quantizzata. [La risposta corretta è la d.] Qual è il valore della distanza in energia tra due livelli di Landau in funzione del campo magnetico? a. b. c. d. e. eB/ℏm ℏmeB (e/ℏ)mB ℏeB/m me/ℏB [La distanza vale c dove c eB ] m Quale tra i seguenti potenziali vettori corrisponde alla gauge di Landau? a. b. c. d. e. Ax=−y/2, Ax=By/2, Ax=0, Ax=0, Ax=Bx, Ay=Bx/2, Ay=Bx, Ay=0, Ay=Bx, Ay=By, Az=0. Az=0. Az=0. Az=0. Az=Bz. [La risposta corretta è la d.] 104 Come si calcola la degenerazione di un livello di Landau? a. Il valore della degenerazione g si ottiene considerando il rapporto tra la distanza tra due centri consecutivi di oscillatore e la distanza L tra i bordi: g=Δxc/L=heBL2 b. La degenerazione è pari al numero dei diversi stati di spin in cui può trovarsi un elettrone. c. Il valore della degenerazione g si ottiene considerando quanti centri di oscillatore possono essere inseriti lungo la direzione x di estensione L: g=L/Δxc=LeB/Δp=LeB/(h/L)=eBL2/h d. La degenerazione si ottiene dividendo l’energia di Fermi per la distanza in energia tra due livelli di Landau successivi. e. Il valore della degenerazione g si ottiene considerando quanti centri di oscillatore possono essere inseriti lungo la direzione x di estensione L: g=L/Δxc=Δp/LeB=(h/L)/LeB=h/eBL2 L LeB LeB eBL2 ] xc p h L h Supponendo che tutti gli elettroni di un gas bidimensionale abbiano la stessa componente di spin parallela al campo magnetico esterno, quanti posso accomodarne in un livello di Landau completamente pieno? [Si ricordi che g a. Posso accomodarne un numero pari all’inverso della degenerazione (h/eBA), dove A è l’area della regione di piano che contiene il gas elettronico. b. Posso accomodarne un numero pari alla degenerazione (eB/h)A, dove A è l’area della regione di piano che contiene il gas elettronico. c. Posso accomodarne un numero pari al prodotto della densità per l’area A della regione di piano che contiene il gas elettronico. d. Posso accomodarne un numero pari alla degenerazione (eh/B)A, dove A è l’area della regione di piano che contiene il gas elettronico. e. (errata) Posso accomodarne un numero pari alla metà della degenerazione (eB/h)A, dove A è l’area della regione di piano che contiene il gas elettronico. [La risposta corretta è la ...] Perché l’energia dei livelli dei Landau in prossimità dei bordi è maggiore di quella dei livelli di Landau al centro del volume del sistema? a. Perché i centri degli oscillatori degli stati in prossimità dei bordi risentono dell’interazione coulombiana tra gli elettroni. b. Perché per gli stati di bordo non sono permessi i numeri quantici più bassi. c. I livelli di Landau, che hanno il loro centro in prossimità dei bordi, risentono maggiormente del confinamento, che tende ad aumentare l’energia degli stati. d. I livelli di Landau, che hanno il loro centro in prossimità dei bordi, risentono in modo minore del confinamento, che tende a diminuire l’energia degli stati. e. Perché corrispondono a numeri quantici maggiori. [La risposta corretta è la c… anche se, a rigor di termini, non i livelli di Landau ma gli oscillatori hanno centro in una zona geometrica.] L’energia di un livello di Landau E(n,p) dipende dai numeri quantici n (stato di oscillatore) e p (connesso alla distanza del centro dell’oscillatore dai bordi). Perché stati su bordi opposti hanno la componente della velocità parallela ai bordi di segno contrario? a. La velocità di un livello di Landau è data da v=∂E(n,p)/∂p e la derivata ha segno contrario in virtù dell’opposto andamento del potenziale di confinamento. b. Perché vale la relazione E(n,p)=−E(n,−p). c. Perché E(n,p) ha un massimo e un minimo, come funzione di p, ai due bordi. 105 d. La velocità di un livello di Landau è data da v=(∂E(n,p)/∂p)−1 e la derivata ha segno contrario in virtù dell’opposto andamento del potenziale di confinamento. e. La velocità di un livello di Landau è data da v=−∂E(n,p)/∂p e la derivata ha segno contrario in virtù dell’opposto andamento del potenziale di confinamento. [La risposta corretta è la a.] In che modo gli stati di bordo determinano la quantizzazione della resistenza di Hall? a. Poiché gli stati su bordi opposti trasportano correnti di segno contrario, una differenza di potenziale VH tra i bordi implica una corrente pari a J=(e/h) eVH dove (e/h) è la corrente di uno stato di bordo per unità di intervallo di energia. b. Poiché gli stati su bordi opposti trasportano correnti che differiscono di e/h, una differenza di potenziale VH tra i bordi implica una corrente pari a J=(e/h) eVH. c. Poiché gli stati su bordi opposti trasportano correnti di segno contrario, una differenza di potenziale VH tra i bordi implica una corrente pari a J=(h/e 2 )VH dove (h/e) è la corrente di uno stato di bordo per unità di intervallo di energia. d. Poiché le energie sono quantizzate, la differenza di potenziale tra stati su bordi opposti può solo assumere valori determinati. e. Poiché gli stati su bordi opposti trasportano correnti di segno concorde, una differenza di potenziale VH tra i bordi implica una corrente pari a J=−(e/h)eVH dove (e/h) è la corrente di uno stato di bordo per unità di intervallo di energia. [La risposta corretta è la a.] 106 Cap. 6 La superconduttività Significato della superconduttività. L’effetto Meissner di espulsione del flusso magnetico da un superconduttore. La teoria fenomenologica di London e la natura dello stato superconduttivo. Cenni alla teoria microscopica BCS della superconduttività. 6.1. Cos’è la superconduttività 6.2. Fenomenologia 6.3. Lo stato superconduttivo 6.4. La teoria della superconduttività Un’introduzione non troppo matematica la si trova nel libro Introduzione alla fisica dello stato solido di Charles Kittel. Una trattazione più avanzata è nel libro Solid State Physics di Giuseppe Grosso e Giuseppe Pastori Parravicini. 6.1. Cos’è la superconduttività Il fenomeno della superconduttività Un po’ di storia. In diversi materiali metallici la resistenza elettrica si annulla bruscamente al di sotto di una temperatura critica. Questo fenomeno fu osservato per la prima volta nel 1911 da Kamerling-Onnes (nella figura a destra, ritratto nel suo laboratorio), che misurò una Tc=4.2K nel mercurio 107 Più della metà degli elementi sono superconduttori (alcuni a temperature molto basse o a pressioni molto alte) In giallo oro gli elementi superconduttori, in marrone quelli che lo possono diventare in appropriate condizioni di pressione. Oltre agli elementi puri ci sono materiali superconduttori che sono leghe o composti. Insomma, quello della superconduttività è un fenomeno piuttosto diffuso. Negli ultimi venti-trent’anni si è aperto anche un importante filone per quel che riguarda le applicazioni tecnologiche che va sotto il nome di “superconduttività ad alta temperatura critica”: sono stati infatti scoperti materiali che diventano superconduttori a temperature ben più alte della temperatura critica del mercurio. Però per questi materiali superconduttori ad alta temperatura critica la situazione teorica non è stata ancora ben chiarita e perciò non ne parleremo in questa lezione. Ma prima di entrare nel vivo della fisica della superconduttività vogliamo menzionare il fatto che la superconduttività, oltre ad essere un argomento estremamente importante dal punto di vista della scienza di base, è anche importante per diverse applicazioni. 108 Può essere utile la superconduttività? Segnaliamo solo un’applicazione, per attirare la curiosità: i superconduttori vengono utilizzati per la costruzione di grandi strutture diagno-magnetiche aperte grazie al fatto che, non essendoci dissipazione energia, è possibile ottenere campi magnetici intensi, omogenei e stabili in strutture aperte che hanno il loro utilizzo nella diagnostica medica: è il caso della risonanza magnetica nucleare (NMR), che permette di avere la risoluzione e la precisione necessarie per la determinazione della struttura chimica dei tessuti. Che cos’è la superconduttività? – Domande 1) In cosa consiste la superconduttività? 2) Qual è la differenza tra un metallo normale e uno superconduttore? 6.2. Fenomenologia della superconduttività Ovvero: quali sono gli aspetti sperimentali più importanti sui quali si focalizza l’attenzione del teorico per tentare di ricavare una spiegazione. Fatti sperimentali rilevanti: 1. Resistenza nulla per T<Tc. 2. Lo stato superconduttivo è sensibile alla presenza di un campo esterno. Per ogni T, esiste un campo critico Hc(T) al di sopra del quale lo stato superconduttivo è soppresso. 3. Un materiale superconduttore, quando viene immerso in un campo magnetico di intensità inferiore a un certo valore critico, si comporta come un diamagnete perfetto, cioè all’interno del superconduttore vi è “espulsione di B”, ossia una completa soppressione del flusso magnetico: B=0; e poiché H non è zero (H è il campo esterno) questo significa che nel superconduttore la magnetizzazione acquista un valore tale da compensare l’effetto di H. Questo è l’effetto Meissner-Ochsenfeld (noto anche più semplicemente come effetto Meissner) scoperto da Walther Meissner e Robert Ochsenfeld nel 1933. Ciò avviene tramite la generazione di correnti superficiali che inducono, all’interno del superconduttore, un campo magnetico opposto a quello applicato. 109 Nel loro esperimento Meissner e Ochsenfeld raffreddarono campioni di stagno e piombo fin sotto la temperatura di transizione allo stato superconduttivo, in presenza di un campo magnetico. Essi trovarono che il campo esterno aumentava dopo la transizione; e poiché il flusso magnetico è conservato da un superconduttore, questo aumento del campo esterno doveva essere dovuto alla riduzione di quello interno al campione. 4. A basse temperature il calore specifico si annulla in modo esponenziale: c e kBT il calore specifico in un solido indica la sua capacità di assorbire calore quando si fa una variazione di temperatura. Lo studio del calore specifico è ragionevolmente è un indizio su come il sistema può assorbire o meno energia. Poiché l’assorbimento di energia a livello quantistico è legato alla struttura dello spettro dei livelli, lo studio del calore specifico è un modo per capire com’è fatto lo spettro dei livelli. Gli esperimenti mostrano che il calore specifico di un superconduttore a basse temperature ha un andamento con la temperatura di decadimento esponenziale secondo un fattore di Boltzmann. Questo decadimento esponenziale è indice del fatto che esiste una gap nello spettro delle eccitazioni, vale a dire che lo stato fondamentale è separato dal primo stato eccitato da una gap di energia: per poter eccitare un superconduttore dobbiamo fornirgli un’energia che dev’essere almeno pari a quella della gap; e questa è l’origine della capacità di un superconduttore di condurre corrente senza dissipazione. La teoria della superconduttività deve essere una teoria in grado di mettere assieme in maniera coerente i quattro elementi elencati sopra. La teoria della superconduttività è stata sviluppata lungo un arco piuttosto esteso di tempo: è cominciata negli anni Trenta e la teoria definitiva che vedremo nell’ultima parte della lezione è arrivata verso la fine degli anni Cinquanta (teoria BCS). Il diagramma di fase di una sostanza magnetica Quando si studia una fase nuova della materia (e la superconduttività è una nuova fase della materia) (le fasi, ad esempio, sono gli stati di aggregazione: la fase liquida, la fase solida, la fase gassosa) diventa utile utilizzare un opportuno diagramma che mostri sotto quali condizioni lo stato metallico “transisce” verso la nuova fase, appunto la fase superconduttore. Tale diagramma T-H, detto diagramma di fase. riporta in ascissa la temperatura T (la superconduttività dipende dalla temperatura), e in ordinata il campo magnetico H che influenza il comportamento superconduttivo. Quando si applica un campo magnetico esterno H via via più intenso la temperatura di transizione allo stato superconduttivo si sposta verso il basso. 110 Se calcoliamo, per ogni valore di H, la temperatura a cui avviene la transizione verso lo stato superconduttivo si ottiene una linea (la linea blu del diagramma precedente), che separa le due fasi di conduttore Normale e Superconduttore. Tale linea è tracciata a mano perché è indicativa di quello che avviene nella realtà. Nel diagramma delle fasi più noto le linee separano, ad esempio, la fase liquida dalla fase gassosa. L’analogia con tale diagramma più famoso ci permette di trarre alcune importanti conclusioni. L’equazione di Clausius-Clapeyron permette di determinare la forma analitica di questa curva di separazione in termini di quantità fisiche misurabili. La pendenza di questa curva (matematicamente: la derivata di H rispetto a T) può essere scritta come il rapporto di due quantità caratteristiche delle due fasi: S SS dH N dT M S M N formula in cui al numeratore abbiamo la differenza delle entropie dei due materiali e al denominatore la differenza delle due magnetizzazioni. Dal punto di vista sperimentale sappiamo che la magnetizzazione nel sistema normale è qualcosa di molto piccolo, quindi in prima approssimazione possiamo trascurarlo. Inoltre, a causa dell’effetto Meissner, il superconduttore è un diamagnete perfetto: questo significa che MS è l’opposto del campo magnetico esterno. Quindi, in prima approssimazione: dH S SS S SS N N dT M S M N H L’informazione sperimentale ci dice che la curva ha la forma indicata in figura, ovvero che la pendenza è negativa. E poiché H è positivo questo significa che SN – SS è positiva; cioè l’entropia dello stato Normale è maggiore è maggiore dell’entropia dello stato Superconduttore: il sistema, nel passare dallo stato normale a quello superconduttivo si ordina, diventa più ordinato. Ciò non è sorprendente in altri casi: anche passando dalla fase gassosa alla fase liquida abbiamo una minore entropia e un certo ordinamento; e lo stesso accade quando passiamo dalla fase liquida alla fase solida: il solido, come abbiamo visto nel capitolo 3, è una struttura ordinata. Non è quindi sorprendente che nel passare da una fase all’altra ci sia un salto di entropia perché c’è un ordinamento. Nel passaggio dalla fase normale alla fase superconduttore… in cosa consiste il maggior ordinamento? Dal punto di vista dell’ordinamento spaziale, se andiamo a guardare come sono disposti gli atomi di un superconduttore rispetto agli atomi del conduttore dello stato normale non vediamo alcuna differenza. Pertanto l’ordinamento dev’essere più “nascosto”. Vedremo che questo ordinamento è legato a come il superconduttore si organizza a livello quantistico, in particolare come si organizzano i suoi elettroni di conduzione. 111 La teoria dei London Negli anni Trenta del Novecento i fratelli London compirono un primo importante passo verso lo sviluppo della teoria della superconduttività, che troverà il suo compimento solo nel 1957. L’analisi teorica dei fratelli London prende le mosse dalle seguenti caratteristiche sperimentali di un superconduttore: 1. ha un comportamento conduttivo perfetto (assenza di resistenza); 2. ha un comportamento diamagnetico perfetto (effetto Meissner). Queste due caratteristiche insieme alle equazioni di Maxwell e a un’ulteriore ipotesi, introdotta dai London, permettono di caratterizzare la fenomenologia dei superconduttori e indicano la strada verso la teoria microscopica. Il conduttore perfetto Abbiamo visto (modello di Drude) che un conduttore può essere visto come un gas di conduttori aventi una certa carica e una certa massa. Un conduttore perfetto può condurre elettricità senza dissipare energia. Non immaginando cosa avviene in un superconduttore ma ipotizzando che vi sia comunque un trasporto di carica e di massa, indichiamo con e* e m* la carica elettrica e la massa dei portatori responsabili del comportamento superconduttivo. Esse non coincidono con quelle dei portatori. In seguito discuteremo come questi portatori sono collegati agli elettroni che conducono la corrente nei metalli ordinari. Come nell’analisi svolta da Drude per il trasporto elettrico ordinario (il modello che si aveva a disposizione negli anni Trenta) possiamo partire dall’equazione del moto in un campo elettrico. 2 dv dj ne * m* e * E E dt dt m* con j e * nv Un commento Può essere utile confrontare la relazione ottenuta tra la corrente e il campo elettrico con quella corrispondente nel caso di un metallo ordinario, come sviluppata nel modello di Drude. 2 dj ne * E dt m* ne2 j E m Conduttore perfetto Conduttore ordinario Nel conduttore ordinario è la densità di corrente ad essere proporzionale al campo elettrico; nel conduttore perfetto, secondo il modello dei London, è la derivata della densità di corrente ad essere proporzionale al campo elettrico. Questo ci dice che in un conduttore perfetto, in condizioni stazionarie, a differenza di quanto accade in un 112 metallo ordinario, una corrente può essere sostenuta in assenza di campo elettrico; in altre parole, se generiamo una corrente e poi non applichiamo più un campo elettrico la corrente può scorrere indefinitamente; fu fatto una volta un esperimento in cui si provò a vedere quanto durasse la corrente in un superconduttore… La corrente andò avanti due anni, poi gli sperimentatori si sono stancati di osservarla girare. 2 dj ne * E con le Combiniamo l’equazione del conduttore perfetto dt m* equazioni di Maxwell-Faraday L’equazione dell’induzione magnetica di Maxwell-Faraday, che connette i campi elettrico e magnetico, ci permette di trovare una relazione tra la corrente e il campo magnetico. B E t 2 dj ne * E dt m* Equazione di Maxwell-Faraday Conduttore perfetto Entrambe le equazioni contengono il campo elettrico: possiamo unificarle eliminando il campo elettrico: B m * dj m* 0 ossia B j 0 2 2 da cui t dt t n e * n e * L’equazione ottenuta (il primo passo della teoria dei London) contiene la corrente e il campo magnetico. Non è ancora sufficiente per risolvere il problema. Per risolverla dobbiamo usarla insieme all’equazione di Ampére-Maxwell che connette le medesime due quantità. m* B j 0 2 t ne * 1 B j 0c 2 Conduttore perfetto Equazione di Ampére-Maxwell Eliminiamo la densità di corrente, calcolando nell’eq. di Ampére-Maxwell il rotore a destra e a sinistra: B 1 2 j per cui l’equazione di conduttore perfetto 0c 2 m * 0c 2 ne * B B B B 0 0 diventa 2 2 t m * c t t ne * 0 Integrando rispetto al tempo e usando l’identità vettoriale a 2 a a e osservando che l’ultimo termine è nullo, otteniamo 2 ne * 2 B B0 B B0 , m * 0c 2 113 con B0 il campo a t = 0 Ma noi sappiamo che un superconduttore gode dell’effetto Meissner. Condizione di espulsione di B L’equazione per il campo magnetico appena scritta ammette la soluzione B B0 Tale soluzione però non è compatibile con l’evidenza sperimentale dell’effetto Meissner che richiede un campo magnetico nullo nel superconduttore. I fratelli London quindi conclusero che l’unico modo per soddisfare l’effetto Meissner fosse quello di ipotizzare un’ulteriore condizione tra campo magnetico e corrente: m* B j 0 2 ne * (ossia non solo la derivata rispetto al tempo di tale quantità doveva essere zero, come imponeva la condizione di conduttore perfetto, ma la combinazione stessa doveva essere zero). Tale condizione equivale infatti a imporre che sia B=0. Tale condizione contiene in sé le condizioni del diamagnete perfetto (la nullità della combinazione implica B=0) e del conduttore perfetto (la sua derivata è nulla) Fenomenologia della superconduttività – Domande 1) Perché si parla di transizione superconduttiva? 2) Qual è la relazione tra campo magnetico e superconduttività? 3) In cosa consiste la relazione dei London tra corrente e campo magnetico? 6.3. Lo stato superconduttivo Conseguenze dell’equazione dei London In presenza di un potenziale vettore, l’impulso viene spostato dal potenziale vettore: si ha p m * v e * A (è ciò che abbiamo usato nella lezione dedicata all’effetto Hall quantistico ed è un modo in cui a livello hamiltoniano si ottiene la forza di Lorentz) p Distinguiamo quindi tra impulso canonico e impulso cinematico m * v , legati tra loro dal potenziale vettore. Se analizziamo la relazione di London ottenuta nel paragrafo precedente m* B j 0 ), che lega l’induzione magnetica B al rotore della corrente, e se ( 2 ne * ricordiamo che B A allora la relazione dei London si può scrivere come: m* m* A j 0 A j 0 2 2 ne * n e * 114 2 ne * A. Da cui j m* j e * n v E se ricordiamo che è otteniamo e* v A m* Tale relazione, sostituita nella p m * v e * A , implica un valore nullo della quantità di moto per tutti i portatori di corrente. I portatori responsabili della superconduttività si trovano in uno stato di impulso zero. Questo fatto, per chi conosce la meccanica quantistica, è un campanello d’allarme molto chiaro di qualcosa legato alla BEC (Bose-Einstein Condensation). In meccanica quantistica l’occupazione dello stesso stato quantico da parte di tutte le particelle si presenta infatti nel fenomeno della condensazione di Bose-Einstein (BEC). La BEC non spiega la superconduttività ma fornisce alcuni indizi utili per la sua comprensione. Superconduttività a BEC In meccanica quantistica distinguiamo le particelle in bosoni e fermioni. Per i secondi vale il principio di esclusione di Pauli, che impedisce a due o più fermioni di occupare lo stesso stato. Due o più bosoni invece possono occupare lo stesso stato. In particolare a temperatura nulla, lo stato di minima energia di un sistema di bosoni si ottiene disponendo tutte le particelle nel livello di energia più basso. Tipicamente tale stato corrisponde a quello di impulso nullo. Le particelle quindi risultano “ordinate” nel senso di occupare tutte lo stesso stato nello spazio degli impulsi. Tale condensazione non avviene nello spazio fisico ma nello spazio astratto degli stati di impulso. Quest’ordinamento deve portare a livello termodinamico a una diminuzione dell’entropia. Si può mostrare che, anche a temperature diverse dallo zero assoluto ma non troppo alte, un numero macroscopico di bosoni continua a occupare il livello di energia più basso. La BEC è la rappresentazione macroscopica di un effetto quantistico… L’equazione di London dice che nei superconduttori si verifica qualcosa di p 0 ; la superconduttività può simile, dato che i portatori si trovano tutti nello stato essere dunque considerato la manifestazione macroscopica di un fenomeno quantistico. L’accettazione di tale punto di vista presenta però alcune difficoltà, che andiamo a discutere. Tuttavia è vero che la transizione allo stato superconduttivo è caratterizzata da un ordinamento che porta al salto di entropia osservato sperimentalmente. Perché la superconduttività non è BEC? Le ragioni sono principalmente due: 1. i portatori della superconduttività sono gli elettroni, che in quanto fermioni non possono esibire il fenomeno della BEC; 115 2. anche un sistema di bosoni, che esibisca il fenomeno della BEC, non è superconduttivo, cioè non conduce senza dissipare. Per ovviare a questi due tipi di problemi è nata la teoria standard, detta poi BCS dalle iniziali del cognome di Bardeen, Cooper e Schrieffer che la formularono nel 1957, la quale spiega come sia possibile sviluppare una teoria per un sistema di fermioni, che senza violare il principio di esclusione di Pauli, conservi alcuni aspetti del fenomeno BEC in accordo con l’analisi dei fratelli London. Prima però spieghiamo perché un sistema di bosoni che esibisca il fenomeno della BEC non è necessariamente superconduttivo. Il criterio di Landau Il motivo perché un sistema di bosoni che esibisca la BEC non sia necessariamente superconduttivo fu compreso da Landau che formulò un criterio in proposito. Lo determinò usando il principio di relatività galileiano, cioè il fatto che si può descrivere un sistema fisico secondo un qualunque sistema di riferimento inerziale (i sistemi inerziali sono legati l’uno all’altro da una trasformazione di Galileo). Se si ha un sistema di bosoni, superfluido e che scorra a una velocità costante, possiamo anche pensare di osservare questo sistema da un sistema che sia solidale col fluido che scorre, un sistema cioè nel quale il fluido appaia fermo: in questo sistema l’energia cinetica dovuta allo scorrimento è assente. Ora, se il sistema comincia a dissipare, cioè a perdere parte delle proprietà superconduttive, significa che il sistema si sta eccitando: matematicamente questo può essere descritto dicendo che il sistema sta acquistando una energia ε e un certo impulso p. In termini quantistici possiamo indicare una qualunque eccitazione come individuata da una relazione di ENERGIA p in funzione p k dell’IMPULSO ( ) nominata RELAZIONE DI DISPERSIONE. Superconduttività significa assenza di dissipazione. Questa si manifesta perché durante il moto dei portatori il sistema si riscalda, cioè parte dell’energia cinetica si converte in energia termica. Matematicamente questo si può descrivere dicendo che il sistema è passato da uno stato di minima energia a uno stato di energia più elevata caratterizzata da un impulso corrispondente al vettore d’onda che descrive la variazione spaziale rispetto al sistema in assenza di dissipazione. Tale stato di energia più elevata è detto costituire un’eccitazione elementare del sistema. L’idea di Landau fu quella di collegare la presenza di un’eccitazione osservata nel sistema solidale al fluido col sistema di laboratorio. Nel far questo si possono usare le trasformazioni di Galileo. Velocità critica Consideriamo il sistema di portatori in moto con velocità v e consideriamo la comparsa di un’eccitazione. In un sistema di riferimento in quiete con il sistema di portatori, 116 l’energia e la quantità di moto sono quelle dell’eccitazione elementare. Usando le trasformazioni di Galileo otteniamo l’energia e la quantità di moto nel sistema del laboratorio. In questo sistema, se c’è dissipazione, l’energia deve diminuire. Quindi la comparsa dell’eccitazione richiede che la velocità di conduzione sia superiore a una velocità critica. 1 2 E Mv p v p La formula nel riferimento del laboratorio diventa 2 dove M è la massa totale del fluido, v è la velocità che collega i due sistemi di riferimento inerziali, p è l’impulso dell’eccitazione ed ε la sua energia. Analogamente esiste una legge di trasformazione dell’impulso, che è la seguente: P Mv p dove P è l’impulso osservato nel sistema di laboratorio, p è l’impulso osservato nel sistema solidale con il fluido e Mv è l’impulso del fluido che scorre complessivamente. Affinché ci sia dissipazione il contributo aggiuntivo all’energia cinetica del fluido visto nel sistema del laboratorio, cioè la quantità p v p deve essere negativa (affinché ci sia un decremento rispetto all’energia cinetica). Questa condizione implica l’esistenza di una velocità critica, definita come il minimo, tra tutti i possibili valori dell’impulso, del rapporto p p : p p v p 0 v vc min p Immediatamente si vede da questa relazione che se la dispersione p è quella di un p2 sistema libero, cioè quello di una particella libera in una scatola, cioè p 2m , p p allora p 2m e il minimo per p di un sistema lineare in p è zero, un sistema di bosoni liberi ha una velocità critica nulla, questo vuol dire che a qualunque velocità il sistema presenta eccitazione e non è più superfluido. Il criterio di Landau ci dice cioè che un gas di bosoni liberi non può essere superconduttivo. Deve perciò esistere una modifica importante nella relazione di dispersione: per esempio la presenza di una gap nello spettro di oscillazione può portare a una velocità critica diversa da zero. Questa è una cosa che dobbiamo tenere a mente perché abbiamo visto dalle misure di calore specifico quando abbiamo parlato degli aspetti generali che nel caso dei superconduttori lo spettro delle eccitazioni è caratterizzato da una gap. 117 Coppie di Cooper Gli elettroni non possono condensare nello stesso stato, perché sono fermioni ed obbediscono al principio di esclusione di Pauli. Come dunque possono gli elettroni dar luogo a un’occupazione macroscopica di uno stato quantistico? L’idea di base è relativamente semplice (anche se poi l’implementazione formale richiese molto lavoro): gli elettroni formano delle coppie il cui spin totale è la somma di quello dei due elettroni componenti (1/2+1/2=1). In tal modo la coppia si comporta come un bosone e può dar luogo a un fenomeno tipo BEC. Quindi non dobbiamo pensare a una condensazione di elettroni ma a una condensazione di coppie. La domanda quindi diventa: come fanno gli elettroni a formare una coppia stabile in presenza della repulsione coulombiana? Da dove arriva l’attrazione che porta a uno stato legato? È una domanda a cui è difficile rispondere e la teoria corrente lo fa ma usando un apparato formale estremamente complesso; si può tuttavia avere una intuizione fisica di quello che succede con alcuni semplici ragionamenti. Non dobbiamo dimenticare il fatto che gli elettroni non vivono nel vuoto ma si trovano immersi in un solido dove sono presenti gli ioni da cui provengono. Interazione elettrone-reticolo Gli elettroni di un solido si muovono in un reticolo di ioni carichi positivamente. Semplificando un po’, possiamo pensare che un elettrone che passi vicino ad un ione del reticolo eserciti un’attrazione sullo ione. Quest’ultimo quindi si sposta rispetto alla sua posizione di equilibrio. Nella figura sotto, esagerando il fenomeno, è mostrato come gli ioni sono attratti al passaggio dell’elettrone (il pallino verde) Ora immaginiamo un altro elettrone che si muova nelle vicinanze dello ione che si è mosso per il passaggio del primo elettrone. Questo elettrone sarà dunque attratto verso la mutata posizione dello ione, nella regione dove c’è una mancanza di carica positiva. Interazione elettrone-elettrone 118 In definitiva il secondo elettrone sarà attratto verso la regione di spazio dove è passato il primo elettrone: è esattamente questa attrazione “efficace” di elettroni che porta alla formazione delle coppie di Cooper. Condensazione delle coppie Senza preoccuparci per il momento di come si formino le coppie di elettroni, possiamo chiederci quali conseguenze possono esserci a causa della loro condensazione. Ipotizziamo che le coppie di elettroni (che si comportano come bosoni) vadano a occupare lo stesso stato quantistico descritto da una funzione d’onda, normalizzata in modo tale che il modulo quadro dia la densità delle coppie (il modulo quadro della funzione d’onda dovrebbe dare la densità di probabilità… ma siccome abbiamo un numero macroscopico di coppie di elettroni che si trovano nello stesso stato quantico della funzione d’onda, il modulo quadro della funzione d’onda finisce per darci la densità delle coppie di elettroni; possiamo cioè costruire una teoria dal punto di vista euristico identificando il modulo quadro della funzione d’onda con la densità degli elettroni): r , t ns r , t 2 questa funzione d’onda deve però obbedire all’equazione di Schroedinger associata. Equazione di Schrödinger In presenza di un potenziale vettore, possiamo scrivere l’equazione di Schrödinger attraverso la sostituzione minimale. 2 1 i e * A t 2m * i m* ed e* sono la massa e la carica dei portatori: m* 2m e* 2e la carica e la massa di una coppia sono quelle corrispondenti a due elettroni. Come usiamo quest’idea della funzione d’onda che obbedisce all’equazione di Schrödinger per arrivare alla teoria della superconduttività? Corrente delle coppie In base alle regole della meccanica quantistica possiamo scrivere l’espressione della corrente delle coppie * e* * i * J e * A m* 2m * In assenza del campo magnetico (A=0), la funzione d’onda ha un’espressione semplice: nS Se, in presenza di campo magnetico, potessimo trascurare il primo termine della corrente, 119 e* * J e * A ovvero l’equazione diventerebbe m* e *2 J nS A m* avremmo cioè riottenuto la relazione dei London. Ragionare sulle coppie conduce quindi alla relazione dei London che era stata ricavata su basi puramente fenomenologiche. Questo è un indizio che siamo sulla strada giusta. Ma perché possiamo trascurare il primo termine della relazione sopra? Rigidità della funzione d’onda La regione per cui possiamo trascurare il primo termine è indicata solitamente come “rigidità” della funzione d’onda delle coppie. In assenza di potenziale vettore la funzione d’onda è una costante che ha a che fare con la densità: nS Com’è che quando viene introdotto il campo magnetico (cioè il potenziale vettore), la funzione d’onda non varia, resta cioè “rigida”? Ciò può essere compreso assumendo che esista un gap di energia tra lo stato fondamentale e gli stati eccitati e usando la teoria delle perturbazioni, la quale dice che, se voglio studiare un problema complicato, posso andare per gradi, posso prima risolvere un problema più semplice, poi aggiungere una perturbazione e procedere nell’analisi per fasi successive… Senza entrare nei dettagli, la formula importante di questa teoria delle perturbazioni è la seguente: 01 0 n Vn 0 E0 E n La funzione d’onda in presenza di una prima perturbazione (che indichiamo genericamente con V) è dunque uguale a 0 (la funzione d’onda in assenza della perturbazione) + una correzione. Quello che ci dice la teoria quantistica è che questa correzione è lineare nella perturbazione (e questo non sorprende) e poi dipende da un denominatore che è la differenza di energia tra lo stato imperturbato che stiamo considerando e gli altri stati imperturbati del sistema. Ora la funzione d’onda sarà rigida, cioè cambierà poco in presenza di una perturbazione, quando il denominatore E0 En è molto grande. 01 0 n Vn 0 0 E0 E n se Vn 0 1 E0 En Ma questo cosa vuol dire? Siccome E0 è lo stato fondamentale ed En sono gli stati eccitati, se esiste una gap nello spettro energetico del nostro superconduttore quel denominatore tenderà ad essere 120 grande e la frazione ad essere piccola; quindi, se esiste una gap possiamo trascurare questa correzione. Quindi la rigidità della funzione d’onda che ci serve per derivare la relazione di London dalla meccanica quantistica funziona se abbiamo una gap nello spettro di energia… Ma effettivamente, come ci mostra l’andamento del calore specifico, è proprio il caso del superconduttore. Lo stato superconduttivo – Domande e test 1) In che senso la superconduttività implica una condensazione tipo Bose-Einstein? 2) Che cosa afferma il criterio di Landau? 3) Cosa sono le coppie di Cooper? a. Coppie di bosoni che si comportano, complessivamente, come fermioni, per i quali può avere luogo il fenomeno della superconduttività. b. Coppie di elettroni che si comportano, complessivamente, come bosoni, per i quali può avere luogo la condensazione di Bose-Einstein. c. Coppie di elettroni che si spostano assieme, nello stesso livello di energia ma con spin opposto, in accordo col principio di esclusione di Pauli per i fermioni. [La risposta esatta è la b.] 4) Cos’è la rigidità della funzione d’onda? Possiamo finalmente mettere insieme tutti i pezzi del puzzle fin qui accumulato per illustrare la 6.4. La teoria della superconduttività Per far questo ci manca un ultimo passaggio formale, un teorema di meccanica quantistica Consideriamo M stati quasi degeneri in presenza di una perturbazione. Problema imperturbato H 0i E0i L’indice i va da 1 a N Problema con perturbazione H 0 U E , U è la perturbazione e H 0 U è il nuovo hamiltoniano. La soluzione la possiamo trovare come combinazione lineare delle soluzioni del problema imperturbato: M aii i 1 , che deve soddisfare alla condizione di M normalizzazione ai 1 i 1 121 2 La perturbazione può “mescolare” gli stati ed eliminare la degenerazione. In base alle regole della meccanica quantistica, l’energia di un nuovo autostato è il valore di aspettazione dell’operatore Hamiltoniano E H0 U M M a a i , j 1 * i j i H 0 U j M E0 ai ai*a j i U j 2 i 1 i , j 1 Il termine a destra è quello risultante dalla perturbazione. Assumiamo che la perturbazione sia negativa e che abbia elementi di matrice tutti uguali i U j V i, j 1,..., M Ricordiamo la nota disuguaglianza di Cauchy-Schwarz per cui M M 2 ai ai 1 M i 1 j 1 i1 M Otteniamo quindi per l’energia dell’autostato M 2 E E0 V ai E0 VM i 1 Il valore minimo dell’energia si ottiene quando tutti i coefficienti sono uguali ai 1 M Uno stato si “stacca” dagli altri e forma una gap anche per una piccola V. Questo meccanismo (per cui uno stato si stacca dagli altri) è quello che controlla la teoria BCS. 122 La teoria BCS The Nobel Prize in Physics 1972 was awarded jointly to John Bardeen, Leon Neil Cooper and John Robert Schrieffer “for their jointly developed theory of superconductivity, usually called the BCS theory”. (ottennero il Nobel 15 anni dopo la pubblicazione del loro articolo nel 1957) A quali stati va applicato il teorema di meccanica quantistica visto sopra? Ricordiamo la struttura dello stato fondamentale di un gas di Fermi. Gli stati di singola particella sono onde piane, come le particelle “confinate in una scatola”. I numeri quantici sono il vettore d’onda e la proiezione dello spin. Nello stato fondamentale del gas di Fermi, se uno stato con dati impulso e proiezione di spin è occupato, sarà occupato anche lo stato con impulso e proiezione di spin opposti. Questi due stati infatti sono connessi dalla simmetria per inversione del tempo e in virtù del Teorema di Kramers hanno la stessa energia e sono quindi degeneri. T k , k , Ek , Ek , T è l’operazione di inversione temporale: invertire la direzione del tempo significa invertire la direzione della velocità, e quindi dell’impulso. E se pensiamo allo spin SU come a un moto rotatorio in una certa direzione, invertendo la direzione del tempo si inverte la direzione di rotazione. 123 Lo stato fondamentale del gas di Fermi può essere descritto dicendo che tutte le coppie di stati che sono connessi dall’operazione di inversione temporale sono o occupati o vuoti. L’idea di base della teoria BCS è che, quando si consideri l’interazione attrattiva tra gli elettroni dovuta alla presenza del reticolo, si può ottenere uno stato di più bassa energia considerando una situazione intermedia. BCS u vuoto v k , ; k , k k k ovvero, per ogni k, anziché dire che lo stato è doppiamente occupato o completamente vuoto, possiamo pensare che il sistema si trovi in una situazione intermedia, ovvero una combinazione lineare di queste possibilità. Lo stato del gas di Fermi corrisponde alla situazione in cui fino all’impulso di Fermi gli stati sono occupati (v=1, u=0) e per gli impulsi successivi gli stati sono vuoti (v=0, u=1). Facendo variare i coefficienti u e v per tutti i valori dell’impulso si ottiene l’insieme degli stati da cui scegliere lo stato fondamentale (ossia l’energia la minima possibile). Una volta trovati gli u e v che determinano l’energia minima possibile abbiamo ricavato lo stato BCS. (Nel teorema di prima questo equivaleva a scegliere i coefficienti a dello stato che si stacca dagli altri). Gli stati di quest’insieme saranno “mescolati” dall’interazione tra gli elettroni e, in virtù del teorema di meccanica quantistica, uno di questi stati può separarsi dagli altri e creare un gap d’energia. Quello che dobbiamo fare a livello quantitativo è stimare l’energia di questo stato fondamentale. Quello che dobbiamo ricordare, dal teorema visto prima, è che il guadagno di energia (la gap) dev’essere dell’ordine della perturbazione moltiplicata per il numero degli stati. Dall’evidenza sperimentale sappiamo che l’energia di Fermi di un metallo standard è dell’ordine dell’elettrovolt (tradotto in temperature sono 10.000 Kelvin), mentre la temperatura di transizione critica è dell’ordine di qualche Kelvin (nell’intervallo 1-10 K). La teoria BCS ipotizza che la perturbazione introdotta dal reticolo debba coinvolgere solo stati che differiscano in energia di una quantità dell’ordine della temperatura critica moltiplicata per la costante di Boltzmann. Quindi si assume che l’energia del gap d’energia deve essere dell’ordine della temperatura critica (moltiplicata per la costante di Boltzmann) e quindi molto più piccola dell’energia di Fermi tipica di un metallo. k BTc EF Nell’esaminare tutti i possibili stati della forma BCS, possiamo quindi limitarci a quelli dove i coefficienti u e v della componente piena e della componente vuota differiscano dal caso dello stato fondamentale del gas di Fermi (quello per il quale la u e v nei grafici sotto hanno la forma della funzione tratteggiata, a gradino) soltanto in una regione d’energia di larghezza dell’ordine del gap di energia e centrata all’energia di Fermi. 124 La teoria BCS consiste cioè nello scegliere valori di u e v che danno origine a distribuzioni “più dolci” delle funzioni tratteggiate a gradino, distribuzioni che assumano valori diversi da 1 e 0 in una regione di energia intorno alla superficie di Fermi dell’ordine della gap ossia della temperatura critica (moltiplicata per costante di Boltzmann). Il numero di stati di coppia per intervallo di energia è mediamente dato dalla densità degli stati (data dal rapporto tra numero di elettroni (N) ed energia media degli stati occupati (EF)), moltiplicata per l’intervallo di energia dove gli stati di coppia si mescolano (Δ). L’energia media degli stati occupati è dell’ordine dell’energia di Fermi. Quindi il guadagno di energia dello stato fondamentale, in virtù del teorema di meccanica quantistica discusso precedentemente, sarà il prodotto degli stati di coppia coinvolti per l’energia tipica della perturbazione, che è anch’essa dell’ordine del gap d’energia. N N 2 EBCS EFG EFG E E F F Benché ci siamo lasciati guidare dall’idea delle coppie di elettroni nel costruire la teoria BCS, tali coppie hanno un carattere particolare che può essere messo in risalto da alcune stime di ordini di grandezza. Risulta infatti che la dimensione tipica di una coppia è molto più grande delle dimensioni dei singoli elettroni che formano la coppia. Tale dimensione tipica è detta distanza di coerenza vF : EF EF 1 E F F 1 pF kF F Le coppie di Cooper sono dunque molto lontane tra loro: le coppie tra loro possono intersecarsi… 125 Osservazioni conclusive Possiamo brevemente riassumere i capisaldi della nostra comprensione del fenomeno della superconduttività: 1. L’interazione degli elettroni con il reticolo induce un’attrazione tra gli elettroni. 2. L’interazione attrattiva tra gli elettroni porta alla formazione di coppie tra gli elettroni. 3. Le coppie hanno un “carattere” bosonico e al di sotto di una temperatura critica occupano macroscopicamente lo stesso stato quantico. 4. Lo stato fondamentale BCS presenta un gap d’energia che rende “rigida” la funzione d’onda e porta alla relazione di London e all’espulsione del flusso. La teoria della superconduttività – Domande 1) Quali sono le assunzioni della teoria BCS? 2) Qual è la differenza dell’occupazione nello spazio degli impulsi tra lo stato fondamentale del gas di Fermi e quello dello stato superconduttivo? 3) Quale idea hanno usato Bardeen, Cooper e Schrieffer (BCS) per spiegare il fenomeno della superconduttività? a. L’interazione attrattiva risultante dall’interazione degli elettroni con gli ioni del reticolo modifica lo stato fondamentale del metallo rispetto alla trattazione del gas di Fermi, rendendo possibile la creazione di uno stato di energia minore. b. L’interazione repulsiva dovuta alle forze coulombiane tra gli elettroni modifica lo stato fondamentale del metallo rispetto alla trattazione del gas di Fermi, rendendo possibile la creazione di uno stato di energia minore. c. L’interazione attrattiva risultante dall’interazione degli elettroni con gli ioni del reticolo modifica lo stato fondamentale del metallo rispetto al caso della condensazione di BoseEinstein, rendendo possibile la creazione di uno stato di energia minore. [La risposta corretta è la a.] 6.5. Test In cosa consiste l’effetto Meissner nei superconduttori? a. Un materiale superconduttore si comporta come un paramagnete perfetto, cioè all’interno del superconduttore si ha un aumento del flusso magnetico. b. Un materiale superconduttore si comporta come un diamagnete perfetto, cioè all’interno del superconduttore si ha un aumento esponenziale del flusso magnetico. c. Un materiale superconduttore si comporta come un ferromagnete, cioè all’interno del superconduttore si ha flusso magnetico anche senza campo magnetico esterno. d. Un materiale superconduttore si comporta come un diamagnete, cioè all’interno del superconduttore si ha una parziale soppressione del flusso magnetico. e. Un materiale superconduttore si comporta come un diamagnete perfetto, cioè all’interno del superconduttore si ha una completa soppressione del flusso magnetico. [La risposta corretta è la e.] 126 Quale aspetto della superconduttività viene messo in luce dall’analisi del diagramma di fase? a. Nel diagramma di fase T−H per ogni T esiste un campo critico Hc(T) al di sopra del quale lo stato normale è soppresso. b. Nel diagramma di fase T−H, per ogni T esiste un campo critico Hc(T) al di sopra del quale lo stato superconduttivo è massimo. c. Nel diagramma di fase T−H, per ogni H esiste un campo critico Hc(T) al di sopra del quale lo stato superconduttivo è soppresso. d. Nel diagramma di fase T−H, per ogni T esiste un campo critico Hc(T) al di sotto del quale lo stato superconduttivo è soppresso. e. Nel diagramma di fase T−H, per ogni T esiste un campo critico Hc(T) al di sopra del quale lo stato superconduttivo è soppresso. [La risposta corretta è la e.] La transizione superconduttiva può essere vista come la manifestazione macroscopica di un comportamento quantistico mediante l’occupazione coerente dello stesso stato quantico da parte di un numero macroscopicamente grande di costituenti elementari. Da questo punto di vista, si può parlare di condensazione di Bose-Einstein del gas elettronico? a. No, a causa della repulsione coulombiana tra gli elettroni. b. No, perché gli elettroni hanno natura fermionica. Coppie di elettroni hanno però carattere bosonico e possono condensare nello stesso stato quantico. c. Sì, perché la relazione di dispersione degli elettroni soddisfa il criterio di Landau per la superfluidità. d. No, perché la relazione di dispersione degli elettroni non soddisfa il criterio di Landau per la superfluidità. e. Sì, perché gli elettroni obbediscono al principio di esclusione di Pauli. [La risposta corretta è la b.] B E insieme alla condizione di conduttore perfetto L’equazione di Maxwell t 2 dj ne * E conduce ad una relazione tra flusso magnetico B e densità di corrente J. Quale dt m* tra le seguenti è tale relazione? a. b. c. d. e. m* B j 0 2 t ne * m* j B 0 2 t ne * m* B j 0 2 t ne * m* B j 0 2 t ne * m* B j 0 2 t ne * [La risposta corretta è la a.] 127 Qual è la relazione dei London tra flusso magnetico B e densità di corrente? m* 1 j j 2 0 ne * m* B j 0 2 ne * m* B j 0 2 t ne * m* B j 0 2 ne * m* 1 B j j 2 0 ne * a. B b. c. d. e. [La risposta corretta è la d.] A proposito del significato dell’equazione dei London, quale tra le seguenti affermazioni è corretta? 2 ne * A (dove A è il potenziale vettore), implica un valore a. La relazione dei London, j m* negativo della quantità di moto p⃗ per tutti i portatori di corrente. 2 ne * A (dove A è il potenziale vettore), tutti i portatori di b. In base alla relazione dei London j m* corrente hanno velocità nulla. 2 ne * A (dove A è il potenziale vettore), implica un valore nullo c. La relazione dei London, j m* della quantità di moto p⃗ per tutti i portatori di corrente. 2 ne * B (dove B è il flusso magnetico), tutti i portatori di d. In base alla relazione dei London j m* corrente hanno velocità nulla. 2 ne * A (dove A è il potenziale vettore), implica un valore positivo e. La relazione dei London, j m* della quantità di moto p⃗ per tutti i portatori di corrente. [La risposta corretta è la c.] La corrente delle coppie di elettroni può essere espressa in termini della funzione d'onda delle e* * i * * A . coppie in accordo con la meccanica quantistica J e * m* 2m * In che modo l’assunzione della rigidità della funzione d’onda permette di ottenere la relazione dei London? a. In presenza di un gap d’energia nello spettro delle eccitazioni elementari, la funzione d’onda dello stato superconduttivo, nS , non è perturbata dalla presenza di un campo magnetico esterno e soltanto il primo termine contribuisce alla corrente. b. Il primo termine della corrente può essere trascurato, perché la funzione d’onda può essere scelta reale. 128 c. In presenza di un gap d’energia nello spettro delle eccitazioni elementari, la funzione d’onda dello stato superconduttivo, nS , non è perturbata dalla presenza di un campo magnetico esterno e soltanto il secondo termine contribuisce alla corrente. d. Il primo termine della corrente si può trascurare perché la funzione d'onda è uniforme. e. In assenza di un gap d'energia nello spettro delle eccitazioni elementari, la funzione d’onda dello stato superconduttivo, nS , è perturbata dalla presenza di un campo magnetico esterno e soltanto il primo termine contribuisce alla corrente. [La risposta corretta è la c.] Secondo la teoria BCS della superconduttività si può ottenere uno stato di più bassa energia uk vuoto vk k , ; k , mediante il seguente stato fondamentale BCS e k scegliendo opportunamente le funzioni la scelta BCS di queste funzioni? a. u 0 k e v 1 per k b. Le funzioni u k e del gap d’energia Δ. c. Le funzioni Fermi. u k v k e k kF u k mentre e v k . Quale tra le seguenti affermazioni descrive u 1 e v 0 k k per k kF differiscono da quelle del gas di Fermi solo in una regione d’energia d’ordine v k nello stato BCS acquistano un valore complementare a quello del gas di d. u k 0 e v k 1 per k k F e. u k 0 e v k 1 mentre u k 1 e v k 0 per k kF [La risposta corretta è la b.] 129 PARTE II Sommario parte II Cap. 7 Introduzione alla fisica dei semiconduttori 7.1. Bande di energia e classificazione dei solidi. Bande di valenza, bande di conduzione e gap diretta e indiretta nei semiconduttori. Occupazione delle bande a temperatura nulla e a temperatura finita in semiconduttori intrinseci. 7.2. Bande di energia nei semiconduttori. Conduzione elettrica in un semiconduttore. 7.3. Concetto di lacuna. 7.4. Conduzione elettrica. Massa efficace nei solidi: applicazione alla banda di valenza e alla banda di conduzione. 7.5. Drogaggio e densità dei portatori dei semiconduttori. 7.6. Test ed esercizi. Cap. 8 I semiconduttori nell’elettronica 8.1. Drogaggio di tipo n e drogaggio di tipo p. Modello idrogenoide per le energie degli stati elettronici di impurezze droganti. Densità dei portatori intrinseci e estrinseci in funzione della temperatura. L’effetto Hall classico. Giunzione p-n all’equilibrio: diffusione, regione di deplezione. Polarizzazione diretta e inversa della giunzione p-n. 8.2. Il diodo. 8.3. I diodi LED, la scelta del materiale semiconduttore. 8.4. Principi di funzionamento del transistor. 8.5. Test ed esercizi. Cap. 9 Nanoscienze e nanotecnologie 9.1. I principi delle nanoscienze. Proprietà fisiche e dimensionalità: introduzione allo studio e alla manipolazione dei materiali, dei dispositivi e dei fenomeni fisico/chimici su scala nanometrica 9.2. Nanoscienze ed elettronica. Ingegneria di banda nei semiconduttori. Sistemi 2D: eterostrutture fra semiconduttori; buche per elettroni e buche per lacune Introduzione alle tecniche di imaging alla nanoscala. 9.3. Nanotecnologie. Introduzione alle tecniche di fabbricazione per le nanotecnologie 9.4. Imaging dei nanosistemi: come vedere le nanostrutture. Microscopi elettronici. Microscopie a scansione di sonda: microscopio a effetto tunnel (STM); microscopio a forza atomica (AFM) 9.5. Alcuni esempi di applicazione effetti quantistici in nanostrutture di semiconduttori e delle nanoscienze. Cenni sul grafene. 130 Cap. 7 Introduzione alla fisica dei semiconduttori Argomenti del capitolo: 7.1. Bande di energia e classificazione dei solidi. Bande di valenza, bande di conduzione e gap diretta e indiretta nei semiconduttori. Occupazione delle bande a temperatura nulla e a temperatura finita in semiconduttori intrinseci. 7.2. Bande di energia nei semiconduttori. Conduzione elettrica in un semiconduttore. 7.3. Concetto di lacuna. 7.4. Conduzione elettrica. Massa efficace nei solidi: applicazione alla banda di valenza e alla banda di conduzione. 7.5. Drogaggio e densità dei portatori dei semiconduttori. 7.1. Bande di energia e classificazione dei solidi. Bande di valenza, bande di conduzione e gap diretta e indiretta nei semiconduttori. Occupazione delle bande a temperatura nulla e a temperatura finita in semiconduttori intrinseci. In un solido cristallino le energie degli elettroni e le corrispondenti funzioni d’onda sono individuati • dall’indice di banda n • dal momento cristallino k L’indice di banda n è una variabile discreta, il momento cristallino k è invece una variabile continua. 131 La banda di energia En(k) è costituita dall’insieme dei valori di energia permessi che hanno lo stesso valore di n (n-esima banda di energia). Nella figura sono riportate le bande di energia del silicio. Lungo l’asse x è riportato il valore del momento cristallino nelle direzioni significative dello spazio k, mentre le rispettive energie sono riportate sull’asse verticale. Ricordiamo che il momento cristallino di un conduttore solido è una variabile tridimensionale, anche se, per semplicità, a volte la si considera unidimensionale. Bande di energia En(k) Una banda di energia è costituita dall’insieme dei valori di energia permessi che hanno lo stesso valore di n. Bande distinte hanno valori distinti di n e all’interno di ciascuna banda ciascuna energia è individuata dal valore del momento cristallino k. Le bande di energia di un solido si originano dai livelli atomici degli atomi che compongono il solido. In forma semplificata possiamo immaginare che da ciascun livello di energia degli atomi che costituiscono il solido si genera una banda di energia En(k) individuata dal numero quantico n, come riportato nella figura sotto a destra. La proprietà dei livelli atomici per cui al crescere del numero quantico principale n aumenta l’energia degli elettroni si riflette sugli stati elettronici del solido, per cui all’aumentare dell’indice di banda n aumenta l’energia. 132 Ciascuna banda è rappresentata da un intervallo di energie permesse che si distinguono per il valore del momento k. La funzione E(k) rappresenta la dispersione della banda di energia: fissata la banda considerata, la dispersione che ne segue di k , E(k), è una funzione continua e periodica in k. La periodicità in k è una proprietà che è legata alla simmetria con cui gli atomi in un solido sono disposti nello spazio: grazie alla periodicità è possibile rappresentare le bande in un intervallo ristretto di momenti k che sono quelli che rappresentano stati fisicamente distinti. Gli intervalli di energia permessi (bande permesse) sono separati da intervalli di energie proibite, che vengono dette gap proibite. La presenza di gap proibite si vede anche nella rappresentazione dello spazio dei momenti (figura a destra) e rappresentano le energie comprese tra due estremi di due bande successive. Questi estremi sono i massimi e i minimi e possono verificarsi allo stesso valore di k oppure per valori di k diversi. Banda di valenza e banda di conduzione Gli stati elettronici. e quindi le bande, sono occupati in base al principio di esclusione di Pauli. Lo stato fondamentale (a temperatura nulla) della configurazione elettronica di un solido si ottiene quindi occupando tutti i livelli a partire da quello di minor energia fino a quando ci sono elettroni disponibili. Ricordiamo che, nel caso dei solidi, essendo k il numero quantico che individua lo stato elettronico potremo allocare al massimo due elettroni (con spin opposto) in ogni stato k. Molte delle proprietà che manifestano i solidi sono legate all’occupazione delle bande a maggior energia. Definiamo quindi, riferendoci sempre allo stato fondamentale, la banda di valenza e la banda di conduzione come in figura sotto. 133 Banda di conduzione banda E(k) vuota o parzialmente occupate di minor energia Banda di valenza banda E(k) completamente occupata a più alta energia L’occupazione delle bande è riferita allo stato fondamentale (T=0K). I solidi si suddividono in conduttori, semiconduttori e isolanti in base all’occupazione nello stato fondamentale (T=0K) della banda di valenza e di conduzione e al valore dell’energia di gap. I conduttori sono i metalli in cui la banda di conduzione è semipiena. Al contrario, nei semiconduttori e negli isolanti la banda di conduzione è completamente vuota e quella di valenza è completamente piena; ciò che li distingue è la distanza tra la sommità della banda di valenza e il fondo della banda di conduzione, che si chiama gap proibita. Energia di gap proibita EG L’energia di gap EG è la distanza in energia fra il massimo della banda di valenza e il minimo di quella di conduzione. Indicativamente 134 Trasporto elettrico Metalli, isolanti e semiconduttori rispondono diversamente ad un campo elettrico esterno e la loro resistività varia con la temperatura. In un isolante la resistività è molto elevata e non varia con la temperatura. Al contrario, in un metallo la resistività è molto più piccola (i metalli sono conduttori) e la resistività decresce al decrescere della temperatura; per i semiconduttori il comportamento è più complesso: a bassa temperatura si comportano come isolanti; aumentando la temperatura la resistività diminuisce e i semiconduttori sono in grado di condurre corrente; la loro resistività diminuisce all’aumentare della temperatura anche se non arriva mai ai valori che si osservano nei metalli. Dal punto di vista qualitativo questi diversi comportamenti sono legati all’occupazione delle bande. Si ha conduzione solo in presenza di stati vuoti nella banda di energia: gli stati vuoti possono essere occupati dagli elettroni che acquisiscono extra energia dal campo elettrico applicato. Le bande piene non contribuiscono alla conducibilità elettrica (isolanti e semiconduttori a T=0K) Struttura a bande dei semiconduttori Tra i vari semiconduttori disponibili possiamo riconoscere delle caratteristiche comuni nella loro struttura a bande, in particolare nella banda di valenza e nella banda di conduzione. Banda di conduzione con curvatura positiva intorno al minimo Banda di valenza con curvatura negativa e massimo a k=0 (momento cristallino nullo) 135 Riguardo al minimo della banda di conduzione sono possibili due casi: semiconduttori a gap diretta Il minimo della banda di conduzione e il massimo di quella di valenza sono allo stesso valore del momento cristallino k, in k=0 semiconduttori a gap indiretta Il minimo della banda di conduzione e il massimo di quella di valenza sono ad un diverso valore del momento cristallino k Queste due tipologie di semiconduttori hanno comportamento diverso quando si va a parlare di emissione di luce. Come esempio di bande reali, nella figura seguente è riportata la dispersione in varie direzione dello spazio k della bande di valenza e conduzione in germanio, silicio e arseniuro di gallio. • Ge e Si sono semiconduttori a gap indiretta • Il GaAs è un semiconduttore a gap diretta 136 Energie di gap in diversi semiconduttori Pallini pieni e vuoti indicano rispettivamente gap diretta e indiretta. Sovrapposta all’energia di gap dei vari materiali è riportata una banda colorata: il colore di questa banda rappresenta il colore della luce qualora si considerino fotoni con energia pari all’energia di gap; ovviamente soltanto per quei semiconduttori che hanno energie di gap che corrisponderebbero a un fotone nella banda del visibile. Sopra la banda colorata ci sono materiali che vengono considerati semiconduttori ma che hanno energie di gap che corrispondono all’ultravioletto; al di sotto troviamo il silicio e il germanio che sono conduttori la cui energia di gap corrisponde a un fotone nell’infrarosso. TEST. Cosa differenzia un semiconduttore da un conduttore (metallo)? a. Nello stato fondamentale sia i metalli sia i semiconduttori hanno la banda di conduzione parzialmente piena, ma in un metallo la densità di elettroni è molto più alta rispetto ad un semiconduttore. b. Nello stato fondamentale la banda di conduzione di un metallo è parzialmente piena mentre in un semiconduttore è completamente vuota. c. Nello stato fondamentale sia in un metallo sia in un semiconduttore la banda di conduzione è vuota ma la l’energia di gap di un metallo è inferiore a 2 eV. [La risposta corretta è la b.] 7.2. Occupazione delle bande e densità di corrente nei semiconduttori. Occupazione delle bande nello spazio k a T=0K A T=0K in un semiconduttore la banda di valenza (e tutte le bande a minore energia) è completamente occupata: ogni stato k per il principio di Pauli è occupato da 2 elettroni con spin opposto. La banda di conduzione è completamente vuota 137 I semiconduttori a temperatura finita T>0 A temperatura finita, grazie al relativamente piccolo valore della energia di gap, gli elettroni sono termicamente eccitati dalla banda di valenza alla banda di conduzione (elettroni intrinseci) lasciando stati vuoti in banda di valenza. Rappresentiamo quanto abbiamo appena detto nello spazio k. Gli elettroni che saltano in banda di valenza vanno a occupare gli stati più vicini al minimo di energia. 138 La conduzione elettrica A T=0K i semiconduttori sono isolanti: applicando un campo elettrico esterno non c’è conduzione elettrica. Infatti, nella banda di valenza non ci sono stati vuoti che possano essere occupati dagli elettroni che driftano per effetto del campo elettrico (cambiano il valore del loro momento k) A T non nulla il semiconduttore è in grado di condurre. In presenza di un campo elettrico gli elettroni driftano, cioè cambiano la loro velocità, ovvero il loro momento cristallino, grazie all’effetto del campo elettrico e quindi da uno stato k vanno a occupare lo stato k’, e lo stesso fanno gli elettroni in banda di valenza, dove però potremmo pensare che si è spostato lo stato vuoto. Alla conduzione contribuiscono sia gli stati in banda di valenza che quelli in banda di conduzione, entrambe solo parzialmente piene. 139 A questo punto siamo pronti per il calcolo della densità di corrente Per il calcolo della corrente possiamo utilizzare la formula che è stata introdotta nel corso di fisica dei solidi: le vk sono le velocità dei portatori presenti nella banda, ciascuno moltiplicata per la carica elementare e il tutto diviso per il volume del sistema. Questa sommatoria va calcolata sia per gli elettroni in banda di conduzione sia (separatamente) per gli elettroni in banda di valenza. Contributo degli elettroni in banda di conduzione j e 1 V Contributo degli elettroni in banda di valenza j e k k _ occupati banda _ conduzione 1 V k k _ occupati banda _ di _ valenza Semplifichiamo la procedura matematica mediante alcune osservazioni di simmetria. Alcune proprietà degli stati elettronici dei solidi Gli stati con momento cristallino k e –k (uguali in modulo e verso opposto) hanno la stessa energia, cioè sono degeneri in energia Gli elettroni negli stati con momento k e –k hanno stessa energia ma velocità opposte 𝒗𝒌= – 𝒗−𝒌 Si ritrova quindi che una banda completamente occupata non contribuisce alla densità di corrente j e 1 V v k k _ banda 0 Se suddividiamo tutti i k possibili in una banda di energia in due insiemi che chiamiamo koccupati e kvuoti k_banda = koccupati + kvuoti dalla espressione della densità di corrente in una banda piena (che vale zero) si ricava che e 1 V v k k _ banda 0 e 1 V 1 v e V v k k _ occupati k k _ vuoti Quindi per la densità di corrente dovuta agli elettroni nella banda di valenza parzialmente occupata 140 j e 1 V vk e k _ occupati 1 V v k k _ vuoti Da cui segue immediatamente che per il calcolo di j possiamo utilizzare in alternativa alla sommatoria sugli stati occupati la sommatoria sugli stati vuoti a patto di cambiare il segno dell’espressione. I semiconduttori nello stato fondamentale sono isolanti. Perché? a. Perché la banda di valenza è completamente occupata e la banda di conduzione è vuota. b. Perché la a banda di conduzione contiene un numero di elettroni estremamente basso, tale da non generare conduzione elettrica. c. Perché la conduzione dovuta agli elettroni in banda di valenza compensa esattamente quella dovuta agli elettroni in banda di conduzione. [La risposta corretta è la a.] 7.3. Le lacune e le loro proprietà Concetto di LACUNA Abbiamo appena visto che j e 1 V 1 v eV v k k _ occupati k k _ vuoti La corrente prodotta da elettroni che occupano un insieme di stati in una banda è analoga a quella che si ottiene se si considerano quell’insieme di stati come vuoti e tutti i restanti stati realmente vuoti della banda come occupati da particelle con carica positiva pari a +e: le lacune Le proprietà di trasporto dovuta agli stati occupati in banda di valenza si descrivono efficacemente in termini di lacune, particelle positive di carica +e che occupano gli stati vuoti della banda. In una banda di valenza il numero degli stati vuoti è piccolo rispetto a quello degli stati occupati e quindi diventa più comodo descrivere le proprietà di trasporto dovute agli stati occupati in termini di lacune. Le lacune rispondono ai campi elettrici e magnetici come particelle di carica positiva +e. Vediamo ora le proprietà delle lacune, a cominciare dalla loro energia. Nei diagrammi delle bande si riporta sempre la dispersione E(k) degli elettroni. Le energie degli elettroni crescono verso l’alto. 141 Assumiamo che lo zero sia in corrispondenza del massimo della banda di valenza. Osservando che le lacune hanno carica positiva, l’energia delle lacune è uguale ed opposta a quella degli elettroni e cresce nella direzione verticale verso il basso (vedi figura sotto) Se Ee è l’energia elettronica dello stato vuoto di vettore d’onda k, e con El l’energia della lacuna corrispondente si ha che El k Ee k Per capire questa proprietà basta osservare la seguente immagine, dove è mostrata la banda di valenza. Sia nel caso a sia nel caso b, per generare una lacuna è stato rimosso un elettrone Più l’elettrone mancante era legato (stato vuoto lontano dal massimo della banda di valenza) maggiore lavoro è stato necessario per rimuoverlo: pertanto l’energia delle lacune aumenta nella direzione opposta di quella deli elettroni. Sia gli elettroni che le lacune tendono ad occupare gli stati con minor energia. 142 Nel diagramma a bande - gli elettroni tendono a scendere - le lacune tendono a galleggiare Struttura delle energie di banda del GaAs (Arseniuro di gallio) e del Si (Silicio) TEST. Cosa sono le lacune in un semiconduttore? a. Le lacune sono particelle di carica positiva +e con le quali descrivere le proprietà della banda di conduzione. b. Le lacune sono particelle di carica negativa – e con le quali descrivere le proprietà della banda di conduzione. c. Le lacune sono particelle di carica positiva +e con le quali descrivere le proprietà della banda di valenza. [La risposta corretta è la c.] 7.4. Conduzione elettrica. Massa efficace nei solidi: applicazione alla banda di valenza e alla banda di conduzione. Gli elettroni in un cristallo rispondono ai campi esterni applicati come se avessero una massa m* diversa da quella dell’elettrone libero m=9 x 10 – 31 Kg Tale valore prende il nome di m* = massa efficace Il valore m* è determinato dalla forma della dispersione delle bande nello specifico stato occupato dall’elettrone, individuato dai numeri quantici n e k. Per comprendere da dove arriva questa proprietà dei solidi possiamo fare delle semplici osservazioni considerando la forma della dispersione della banda di conduzione e poi della banda di valenza. Non è una teoria rigorosissima da un punto di vista matematico ma ci permette di comprendere l’origine fisica di questa proprietà. 143 Cominciamo a osservare la banda di conduzione in un semiconduttore a gap diretta (questo vale anche per un semiconduttore a gap indiretta): gli elettroni occuperanno stati vicini al fondo della banda di conduzione; in prossimità del minimo della banda di conduzione la relazione di dispersione è ben approssimabile con un andamento parabolico. Sviluppando quindi l’espressione di Ec(K) in serie di Taylor fino al termine quadratico e ponendo lo zero dell’energia sulla sommità della banda di valenza si ottiene: Ee k EG Ak 2 1 d 2E A dove A è una costante positiva pari a : 2 dk 2 k k min Confrontiamo questa espressione con l’energia di un elettrone libero Eelettronelibero p 2 2k 2 2m 2m Possiamo pertanto riscrivere la dispersione della banda di conduzione intorno al minimo come: 2k 2 Ee k EG Ak EG 2me* 2 2 Si vede che A ha le dimensioni di divisa due volte una massa; tale massa efficace ha le dimensioni fisiche di una massa ma numericamente non coincide con la massa 144 dell’elettrone libero; sarà invece determinata dalla curvatura della dispersione dell’energia elettronica; ovviamente me 0 in quanto la curvatura della dispersione è positiva. Si ottiene una espressione analoga a quella che si ha per gli elettroni liberi, pur di sostituire la massa dell’elettrone me con me*, che è la massa efficace dell’elettrone in banda di conduzione nel semiconduttore. * Anche per le lacune che occupano gli stati alla sommità della banda di valenza la dispersione dell’energia E(k) si può sviluppare intorno al massimo 2k 2 El k Ee k A' k 2ml* 2 1 d 2E dove A' è una costante positiva pari a : A' 2 dk 2 k 0 con ml 0 massa efficace delle lacune in banda di valenza. Notiamo come nei semiconduttori la descrizione degli stati in prossimità del massimo della banda di valenza in termini di elettroni e non di lacune porterebbe ad una relazione di dispersione fra energia e momento tale che la massa efficace sarebbe negativa. * Massa efficace e bande di energia Riassumendo: le masse efficaci degli elettroni e delle lacune in un semiconduttore sono legate alla forma della dispersione, in particolare alla derivata seconda della dispersione; ovviamente il loro valore numerico dipende non solo dalla forma ma anche dal valore specifico in cui appare il minimo o il massimo delle bande. Pertanto rappresenteremo la banda di conduzione come occupata da elettroni di carica (–e) e massa pari alla massa efficace me* la banda di valenza come occupata da lacune di carica (+e) e massa pari alla massa efficace ml* 2 m 2 d Ee dk 2 k min 2 m 2 d El dk 2 k max * e * l 145 Significato della massa efficace La relazione di dispersione dell’energia è formalmente simile a quella dell’elettrone libero: in realtà gli elettroni non sono liberi in quanto interagiscono con gli atomi del reticolo cristallino. L’effetto dell’interazione con le cariche del solido è dentro il valore della massa efficace. Gli elettroni nel cristallo rispondono ai campi elettrici e magnetici come se fossero particelle libere con massa pari alla massa efficace, determinata dalla curvatura della banda di energia. L’uso della massa efficace ci permette di non far comparire esplicitamente le interazioni fra gli elettroni di conduzione e di valenza e le restanti cariche del cristallo. Nella figura sono riportate schematicamente la tipica struttura della sommità della banda di valenza e del fondo della banda di conduzione di un semiconduttore. Sono presenti 3 bande di valenza, tutte con curvature negative. Le due bande degeneri a k=0 rappresentano le energie di: • lacune pesanti (heavy hole band, banda con curvatura minore) • lacune leggere (light hole band, banda con curvatura maggiore). A maggiore energie per le lacune si ha la terza banda di valenza (split-off band), separata dalle precedenti dall’energia di interazione spin-orbita. Massa efficace degli elettroni: tipici valori Silicio: mt*=0.2m (m massa elettrone libero), mL*=0.98 m Germanio: mt*=0.08 m, mL*1.6m GaAs: m*=0.067 m m*t, m*L sono la massa efficace degli elettroni per due diverse direzioni del momento cristallino (trasverso e longitudinale). La massa efficace dell’elettrone può essere più grande o più piccola della massa dell’elettrone libero e può dipendere dalla direzione dello spazio k che si sta considerando (questo in particolare è vero per i semiconduttori a gap indiretta mentre nell’arseniuro di gallio, a gap diretta, la massa mostra una 146 maggiore isotropia e ha un unico valore indipendentemente dalla direzione di k che stiamo considerando). Massa efficace delle lacune: tipici valori Silicio: mlp*=0.49m , mll*=0.16 m Germanio: mlp*=0.28 m, mll*=0.044m GaAs: mlp*=0.45 m, mll*=0.082m mlp* e mll* sono le masse efficaci delle lacune pesanti e leggere in banda di valenza. Dinamica del trasporto elettrico Ciò che ci interessa è trovare l’equazione del moto in presenza di un campo elettrico e/o magnetico esterno Campo elettrico F Campo magnetico B Equazione del moto dv dk m e F v B dt dt Scriviamo l’equazione del moto per le lacune e gli elettroni in banda di valenza e conduzione rispettivamente: ELETTRONI LACUNE 2k 2 Ee k EG 2me* 2k 2 El k Ee k A' k 2ml* 2 in presenza di campo elettrico (caso 1D per semplicità) la velocità e l’accelerazione sono: v 1 1 dE k me* dk v dv d 1 dE 1 d 2 E dk e am F dt dt dk dk 2 dt me* 1 1 dE k ml* dk dv d 1 dE 1 d 2 E dk e am F dt dt dk dk 2 dt ml* Come ci aspettiamo per una particella di carica Come ci aspettiamo per una particella di (–e) e massa positiva l’accelerazione è diretta carica (+e) e massa positiva l’accelerazione è concorde con il verso del campo elettrico in verso opposto al campo elettrico 147 A questo punto abbiamo tutti gli ingredienti necessari per poter definire la conducibilità elettrica in un semiconduttore. Calcolo della conducibilità elettrica in un semiconduttore Un semiconduttore a temperatura non nulla mostra una conducibilità elettrica dovuta sia agli elettroni in banda di conduzione sia alle lacune in banda di valenza. Grazie al modello di Drude mettiamo in relazione la densità di corrente e il campo elettrico utilizzando per la velocità e l’accelerazione le espressioni determinate con le equazioni del moto di elettroni e lacune v a j qne ,l v qne ,l a τ tempo medio di collisione a accelerazione dovuta al campo elettrico Indicando con n la densità di elettroni e con p la densità di buche e ne2 Contributo degli elettroni: je enve ne m* F e m* e F e F e e ne2 con e m* e e pe2 Contributo delle lacune je epvl m* l F l F l pe2 con l m* l l Dobbiamo ora capire come sommare i due contributi. Supponiamo di avere un campo elettrico F diretto come in figura. Moto degli elettroni in banda di conduzione in presenza di un campo elettrico F Moto delle lacune in banda di valenza in presenza di un campo elettrico F Le velocità di deriva degli elettroni e delle buche hanno verso opposto, ma le densità di corrente hanno lo stesso verso, concorde con il campo elettrico. Pertanto le densità di corrente vanno sommate: j je jl 148 Legge di Ohm nei semiconduttori ne2 pe2 j je jl * e * l F F ml me ne2 pe2 1 e l è la conducibilità del sistema. dove me* ml* Questa espressione mostra attraverso quali fattori la conducibilità (o la resistività) di un semiconduttore dipende dalla temperatura: - τ aumenta al diminuire di T - n e p diminuiscono al diminuire di T (è un processo di eccitazione termica che li genera; al contrario in un metallo la densità di portatori è costante al variare di T) Anziché dare come parametro la conducibilità, spesso si preferisce dare la mobilità elettronica Il rapporto fra la velocità di deriva e il campo elettrico applicato che l’ha generata è una grandezza che dipende dalle caratteristiche del materiale ed è chiamato mobilità elettronica μ. Avremo un valore di mobilità per gli elettroni e uno per le lacune e ve e e * e T F me l vl e l l T F ml* La mobilità così come la conducibilità dipende dalla temperatura ne2 pe2 * e * l nee pel me ml Mobilità degli elettroni in banda di conduzione: valori tipici a temperatura ambiente Silicio: μe =1400 cm2 V – 1 s – 1 Germanio: μe =3900 cm2 V – 1 s – 1 GaAs: μe =3500 cm2 V – 1 s – 1 Mobilità delle lacune in banda di valenza: valori tipici a temperatura ambiente Silicio: μe =450 cm2 V – 1 s – 1 Germanio: μe =190 cm2 V – 1 s – 1 GaAs: μe =400 cm2 V – 1 s – 1 Si osserva che gli elettroni sono molto più “mobili” delle lacune. Tali valori della mobilità sono dati in una unità di misura “intermedia” ai due sistemi SI e c.g.s., ma che è comunque quella in cui vengono dati. 149 TEST. Nella legge di Ohm per un semiconduttore la conducibilità è determinata: a. dalla somma del contributo degli elettroni in banda di conduzione e da quello delle lacune in banda di valenza e i due contributi hanno segno discorde. b. solamente dagli elettroni in banda di conduzione. c. dalla somma del contributo degli elettroni in banda di conduzione e da quello delle lacune in banda di valenza e i due contributi hanno segno concorde. [La risposta esatta è la c.] Densità dei portatori in funzione della temperatura Calcolo della densità dei portatori intrinseci SEMICONDUTTORE INTRINSECO: assenza di impurezze che contribuiscono alla densità di portatori. In altre parole, gli elettroni in banda di conduzione sono solamente quelli eccitati termicamente a partire dalla banda di valenza. è evidente che nei semiconduttori intrinseci la densità di elettroni in banda di conduzione è uguale alla densità di lacune in banda di valenza: le due sono legate intrinsecamente dal meccanismo che li produce. Le concentrazioni di elettroni n in banda di conduzione e di lacune p in banda di valenza dipendono dalla temperatura. In un semiconduttore intrinseco n(T) = p(T) Come si determina la densità di portatori in una banda di energia (ad esempio in banda di conduzione) Ci aiuta la meccanica statistica: Cominciamo con l’analizzare f(E) 150 La funzione di distribuzione di Fermi-Dirac, f(E), determina come gli elettroni occupano gli stati nella banda. Tale funzione è riportata qui sotto. In un solido a temperatura T e potenziale chimico μ (energia di Fermi) la probabilità di occupazione dello stato di energia E è data da f E 1 e E k BT 1 A temperatura nulla la funzione di Fermi-Dirac è una funzione a gradino che vale 1 per tutti gli stati elettronici che hanno energie inferiore al potenziale chimico e vale 0 per tutti gli stati che hanno energia maggiore al potenziale chimico. A temperatura non nulla avremo una certa probabilità diversa da zero anche per gli stati con energia maggiore del potenziale chimico. Cerchiamo ora di calcolare il valore della funzione di distribuzione di Fermi–Dirac per gli elettroni e le lacune In banda di conduzione: la probabilità che un elettrone occupi lo stato a energia E è f(E) In banda di valenza: la probabilità che una lacuna occupi lo stato a energia E corrisponde alla probabilità che quello stato sia vuoto, perciò è pari a 1 – f (E). Per valutare effettivamente f(E) e 1 – f(E) dobbiamo conoscere il potenziale chimico in un semiconduttore intrinseco n = p per ogni temperatura Supponiamo che il numero di stati (in un dato intervallo di energia) nell’intorno del minimo della banda di conduzione Ec sia uguale a quello nell’intorno massimo della banda di valenza Ev . Probabilità che elettroni occupino stati a Ec = Probabilità di lacune occupino stati a Ev f(Ec) = 1 – f(Ev) Da cui segue, essendo Ec – Ev il valore dell’energia di gap EG , che il potenziale chimico di un semiconduttore vale EG 2 151 In un semiconduttore intrinseco il potenziale chimico è all’incirca a metà gap In rosso le energie in banda di conduzione. In blu quelle relative alla banda di valenza A fianco la funzione di distribuzione, in rosso per gli elettroni, in blu per le lacune con il flesso al potenziale chimico che si trova a metà gap Guardando questi grafici troviamo che sia per gli elettroni (E>Ec) che per le lacune (E<Ev) vale la relazione E semiconduttori non degeneri) kBT (quando vale questa relazione si parla di La funzione di distribuzione di Fermi-Dirac in un semiconduttore non degenere è approssimabile con f E 1 e E kBT e E kBT 1 Densità degli elettroni e delle lacune n ni N c e EG 2 k BT p pi N v e EG 2 k BT Se facciano il prodotto np otteniamo la densità di portatori intrinseci al quadrato, un’espressione che dipende soltanto dalla temperatura, fissato il semiconduttore, ovvero la sua energia di gap. Questa relazione si chiama 152 Legge dell’azione di massa np ni2 N v N p e EG kBT In un semiconduttore intrinseco, a temperatura ambiente: ni 1010 cm3 Questo numero così piccolo è sufficiente per avere una conducibilità adeguata per utilizzare i semiconduttori nell’elettronica o comunque come conduttori? Germanio Silicio Arsenio di Gallio 13 9 300 K 2.02 x 10 8.72 x 10 2.03 x 10 6 400 K 1.38 x 10 15 4.52 x 10 12 5.98 x 10 9 500 K 1.91 x 10 16 2.16 x 10 14 7.98 x 10 11 600 K 1.18 x 10 17 3.07 x 10 15 2.22 x 10 13 In realtà questi numeri non sono sufficienti; e infatti, perché sia possibile usare i semiconduttori dobbiamo fare qualcosa… quel qualcosa è “drogarli”. 7.5. Drogaggio e densità dei portatori dei semiconduttori. DROGAGGIO DI UN SEMICONDUTTORE: introduzione di impurezze opportune nel cristallo semiconduttore per variare intenzionalmente e in modo controllato la densità di elettroni o lacune. La variazione della densità dei portatori si riflette in una variazione di conducibilità del semiconduttore. Tale processo di modulazione della densità dei portatori è molto efficiente: anche introducendo 1 impurezza ogni 105 atomi si può ottenere un aumento della conducibilità di un fattore 103. Dobbiamo innanzitutto richiamare alcune nozioni relativi alla struttura cristallina e ai legami nei semiconduttori. Ci riferiremo al silicio che è alla base dell’elettronica e della microelettronica attuale. 153 Struttura cristallina e legame nei semiconduttori Semiconduttori tipici: Si, Ge. Il Si e il Ge, atomi tetravalenti, cristallizzano nella struttura del diamante; in ciascun atomo i 4 elettroni di valenza (in stati ibridizzati sp3) formano 4 legami covalenti con i primi vicini. Rappresentazione bidimensionale del reticolo del silicio: ciascun atomo forma 4 legami con gli altri atomi del cristallo (immagine bidimensionale Drogaggio di tipo n e drogaggio di tipo p Sono possibili due tipi di drogaggi. Drogaggio di tipo n tramite introduzione di impurezze donori: aumento della densità di elettroni in banda di conduzione Drogaggio di tipo p tramite introduzione di impurezze accettori: aumento della densità di lacune in banda di valenza 154 DROGAGGIO DI TIPO n ATOMI DONORI I donori sono impurezze pentavalenti (un donore, ad esempio, è il fosforo P) che sostituiscono un atomo di Silicio nel reticolo Dei 5 elettroni di valenza del donore, 4 elettroni formano i legami covalenti con i rispettivi atomi di Si primi vicini nel cristallo; il 5° elettrone di valenza è un elettrone extra per il semiconduttore e rimane spaiato. Effetto dell’introduzione nel cristallo di impurezze donori: • Il semiconduttore rimane neutro nel suo insieme • ma è come se localmente nel reticolo avessimo messo una carica fissa addizionale pari a +e • intorno alla quale c’è una carica negativa in più, un elettrone extra nel semiconduttore L’elettrone extra risente del potenziale coulombiano generato dallo ione impurezza di carica +e immerso nel semiconduttore di costante dielettrica εr V r e2 40 r r Questo elettrone extra rimane confinato nella regione attorno allo ione donore o partecipa alla conduzione? L’energia di ionizzazione del donore può essere stimata utilizzando il modello di Bohr per la rappresentazione del legame fra lo ione impurezza e l’elettrone extra. Il modello di Bohr è analogo al modello dello ione con l’elettrone spaiato. Modello di Bohr per l’atomo di idrogeno 1 2 e2 E T V mv 2 4 0 r mvr n Quantizzazione del momento angolare Energia dell’elettrone nell’atomo di Bohr e4m Elegame n 1 13.6eV 2 24 0 Raggio di Bohr: 4 2 0 a0 2 0.53Angstrom em 155 Energia dei donori Utilizzando il modello di Bohr per la rappresentazione del legame fra lo ione impurezza e l’elettrone extra, è necessario considerare la costante dielettrica εr del semiconduttore e la massa efficace m* dell’elettrone; 1 * 2 e2 E T V me v 2 40 r r Energia di ionizzazione del donore: Raggio di Bohr del donore: e 4 me* 1 me* ED 13.6 2 eV 2 r m 24 0 r 4 2 0 r m aD 0 . 53 Angstrom r e 2 me* me* Per il silicio r 16 , m* 0.2m 0.2 eV poche decine di meV 2 16 16 aD 0.53 r 4nm 0 .2 ED 13.6 Le tipiche energie dei donori sono tali che a temperatura ambiente il donore è ionizzato, cioè l’elettrone extra non è in uno stato legato confinato intorno all’impurezza, ma si può considerare «libero» di partecipare alla conduzione del cristallo. È proprio questo il meccanismo che consente l’aumento di densità di elettroni in banda di conduzione in cado di drogaggio n. Ionizzazione dei donori e aumento della densità di elettroni Gli elettroni extra debolmente legati alle impurezze sono ionizzati e promossi in banda di conduzione grazie all’energia termica. La densità di elettroni è pertanto maggiore di quella che si avrebbe in un semiconduttore intrinseco. 156 DROGAGGIO DI TIPO p ATOMI ACCETTORI Gli accettori sono impurezze trivalenti (atomo accettore, ad esempio, è il boro, B) che sostituiscono un atomo di Silicio nel reticolo. I 3 elettroni di valenza dell’accettore formano tre legami covalenti con i rispettivi degli atomi di Si primi vicini nel cristallo. Localmente dove è presente l’impurezza manca un elettrone per saturare il legame: l’elettrone mancante proviene dalla banda di valenza del Si generando quindi una lacuna. Effetto dell’introduzione nel cristallo di impurezze accettori • Il semiconduttore rimane neutro nel suo insieme. • carica fissa addizionale pari a –e • una lacuna extra nel semiconduttore La lacuna extra risente del potenziale coulombiano generato dallo ione impurezza di carica –e immerso nel semiconduttore di costante dielettrica εr V r e2 40 r r La costante dielettrica relativa è quella del silicio, che ospita l’atomo accettore. L’energia di ionizzazione degli accettori può essere stimata utilizzando il modello di Bohr per l’atomo di idrogeno per il legame fra lo ione impurezza e la lacuna, così come visto per il caso dei donori. e 4 ml* 1 ml* 13.6 2 eV 2 Energia di ionizzazione dell’accettore: E A m 24 0 r r 4 2 0 r m a 0 . 53 Angstrom A r 2 * * Raggio di Bohr dell’accettore: e ml ml La stima numerica per gli accettori fornisce valori analoghi a quelli dei donori: E A qualche decina di meV aA qualche nanometro Abbiamo dunque individuato il meccanismo che consente ai semiconduttori drogati p un aumento delle lacune in banda di valenza. 157 Affinché si generi una lacuna nella banda di valenza l’impurezza deve essere «ionizzata» (analogamente al caso dei donori). Ciò significa che per effetto dell’energia termica un elettrone lascerà la banda di valenza occupando il livello dell’accettore (a più alta energia per l’elettrone) liberando così la lacuna in banda di valenza. In presenza di impurezze accettori ionizzate: la densità di lacune è maggiore di quella che si avrebbe in un semiconduttore intrinseco Energia delle impurezze Energia di ionizzazione ED per impurezze pentavalenti in Si e Ge, in meV: Energia di ionizzazione EA per impurezze trivalenti in Si e Ge, in meV: P As Sb Si 45 49 39 Ge 12.0 12.7 9.6 P As Sb Si 45 57 65 Ge 10.4 10.2 10.8 LEGGE DI AZIONE DELLA MASSA In ogni semiconduttore, indipendentemente dal drogaggio, il prodotto np è una costante che dipende solo dalla temperatura np n N N p e 2 i EG kT const(T ) Semiconduttori drogati n: in presenza di donori ionizzati aumenta la concentrazione di elettroni (portatori maggioritari) e diminuisce quella delle lacune (portatori minoritari) rispetto al caso dei semiconduttori intrinseci. Semiconduttori drogati p: in presenza di accettori ionizzati aumenta la concentrazione di lacune (portatori maggioritari) e diminuisce quella degli elettroni (portatori minoritari). Oltre che il meccanismo qualitativo è importante capire quanti sono effettivamente gli elettroni che possono essere promossi in banda di conduzione e quante sono le lacune in banda di valenza grazie alla ionizzazione delle impurezze donori o accettori. È un processo di attivazione termica. 158 Dipendenza dalla temperatura Il numero di impurezze ionizzate e quindi il numero di portatori promossi in banda di conduzione o di valenza è fornito dalle leggi della meccanica statistica, cosi come nel caso intrinseco. Contributo delle impurezze a temperatura ambiente A temperatura ambiente gli atomi donori (gli atomi accettori) sono ionizzati: Drogaggio di tipo N: nestrinseci = ND Drogaggio di tipo P: pestrinseci = NA Contributo delle impurezze a bassa temperatura A bassa temperatura la densità di elettroni (lacune) estrinseci dipende esponenzialmente dalla temperatura ne N D e 12 ED 2 k BT pe N A e 12 EA 2 k BT All’esponente non è presente l’energia di gap ma l’energia di ionizzazione termica del donore o dell’accettore. Portatori in funzione della temperatura Mettiamo assieme tutte le informazioni via via introdotte fin qui per vedere come varia la densità dei portatori in funzione della temperatura. Cominciamo con un semiconduttore drogato n. Quello che diremo vale anche per un semiconduttore drogato p. 159 Densità di elettroni in un semiconduttore vs temperatura BASSA T: kBT<< ED (ED = energia di ionizzazione dei donori) Regione di congelamento L’energia termica è insufficiente a ionizzare le impurezze e a maggior ragione a promuovere gli elettroni intrinseci dalla banda di valenza a quella di conduzione. Il semiconduttore tende ad un isolante Temperatura ambiente: kBT ~ ED Regione estrinseca La densità di portatori è determinata dai portatori estrinseci promossi in banda di conduzione dovuta alla ionizzazione dei donori. Per una ionizzazione completa n=ND e la densità non dipende dalla temperatura. I portatori intrinseci sono congelati. Temperatura ALTA: kBT>> EG Regione intrinseca La densità dei portatori è dovuta ai portatori intrinseci eccitati termicamente dalla banda di valenza alla banda di conduzione. 160 Valori tipici a temperatura ambiente All’aumentare della densità di portatori in un semiconduttore non degenere - in funzione del drogaggio: da 10 13 a 10 18 cm – 3 ND, NA: 1013-1018 impurezze cm – 3 - in un metallo: 1022 cm – 3 diminuisce la ρ (resistività elettrica) - in Silicio: da 10 3 a 10 – 2 Ohm m - in un metallo: 10 – 8 -10 – 7 Ohm m 7.6. Test ed esercizi In un metallo all’aumentare della temperatura: a. Il numero di elettroni in banda di conduzione non varia. b. Aumenta il numero di lacune in banda di valenza. c. Aumentano in eguale misura sia il numero di elettroni in banda di conduzione sia il numero di lacune in banda di valenza. d. Diminuisce il numero di elettroni in banda di conduzione. e. Aumenta il numero di elettroni in banda di conduzione. [La risposta corretta è la a.] Calcolare la velocita di deriva delle lacune in un semiconduttore indotta da un campo elettrico di intensità F=1V/cm, se la massa efficace delle lacune è m∗=1.2m e il tempo medio di collisione τ=2 10−12. a. b. c. d. e. 1 m/s. 100 m/s. 3 10 6 m/s. 29 m/s 5 10 5 m/s [La risposta corretta è la d: v=aτ=(e/m*)Fτ. Si ricordi che e/m=1,759 10 11 C/Kg] In un semiconduttore intrinseco il potenziale chimico μ: a. Si trova all’interno della banda di valenza. b. Si trova all’interno della banda di conduzione. c. Si trova all’interno della gap. d. Si sposta dalla banda di valenza a quella di conduzione a seconda della sua energia di gap e delle masse efficaci. e. Si sposta dalla banda di valenza a quella di conduzione in funzione della temperatura. [La risposta corretta è la c.] In un semiconduttore intrinseco all’aumentare della temperatura: a. Aumenta sia il numero di elettroni che il numero di lacune in modo che n=p. 161 b. Aumenta il numero di elettroni in banda di conduzione in modo che gli elettroni siano in numero maggiore rispetto alle lacune. c. Aumenta il numero di elettroni in banda di conduzione a spese delle lacune in banda di valenza, il cui numero diminuisce. d. Aumenta il numero di lacune in banda di valenza in modo che le lacune siano in numero maggiore rispetto agli elettroni. e. La temperatura non influisce il numero di elettroni in un semiconduttore intrinseco ma solo su quello in un semiconduttore drogato. [La risposta corretta è la a.] Le bande di conduzione e di valenza di due semiconduttori sono ben esprimibili intorno ai loro rispettivi estremi con le seguenti espressioni (Nota: le energie sono in eV): 1) EV(k)=−C1k2 e EC(k)=2+C2k2, con C1=6.2 10−20eVm2 e C2=3 10−20eVm2, 2) EV(k)=−C+Dcos(ka) e EC(k)=A−Bcos(ka), con A=4.6eV, B=4.0eV, C=3.0eV, D=2.9eV e a=2angstrom. Quanto valgono le energie di gap nei due semiconduttori? a. (1) 1.6 10−19J e (2) 1.6eV. b. (1) 3.2 10−19J e (2) 0.7eV. c. (1) 1.8 10−11J e (2) 0.5eV. d. (1) 3.8 10−11J e (2) 0.9eV. e. (1) 1.1J e (2) 1.1eV. [La differenza fra il minimo di EC(k) e il massimo di EV(k) si ottiene per k=0 in entrambi i casi e vale nel caso (1) EG=2eV mentre vale (A – B) – (– C+D) nel caso (2). La risposta esatta è la b.] La densità di elettroni in un semiconduttore intrinseco è 3 10 15cm−3. Sapendo che la mobilità elettronica è pari a 2500cm2 V −1s−1 ed è doppia di quella delle lacune, calcolare il valore della conducibilità del semiconduttore. a. 180 Ω−1m−1. b. 30 Ω−1m−1. c. 120 Ω−1m−1. d. 240 Ω−1m−1. e1. 60 Ω−1m−1. [La formula è nee pel . Ricordare che n=p. 1 2 In un semiconduttore intrinseco la conducibilità elettrica (σ) dovuta agli elettroni è pari a 45 Ω−1m−1. Sapendo che le lacune hanno mobilità pari a 1/3 di quella elettronica, quale è il valore della conducibilità del semiconduttore? ne e e . La risposta corretta è la a.] a. b. c. d. e. 30 Ω−1m−1. 60 Ω−1m−1. 45 Ω−1m−1. 90 Ω−1m−1. 120 Ω−1m−1. [(1+1/3)σ = (4/3)σ. La risposta corretta è la b.] Nel drogaggio di tipo p di un semiconduttore: a. si introducono impurezze donori nel reticolo con lo scopo di aumentare la densità di elettroni rispetto al caso intrinseco. b. si introducono impurezze accettori nel reticolo con lo scopo di aumentare la densità di lacune rispetto al caso intrinseco. 162 c. si introducono impurezze accettori nel reticolo con lo scopo di aumentare la qualità cristallina del semiconduttore. [La risposta corretta è la b.] Un semiconduttore con energia di gap pari a 1.4eV, drogato p con accettori aventi energia di ionizzazione di 35meV e densità NA=3 10 17 cm−3 è posto a temperatura T=370K. In queste condizioni, quale delle seguenti affermazioni sui valori della densità di elettroni in banda di conduzione e di lacune in banda di valenza è corretta? a. la densità di lacune in banda di valenza è pari a p=3 10 17cm−3 e un ugual numero di elettroni sono in banda di conduzione. b. (sbagliata) la densità di lacune in banda di valenza è pari a p=3 10 17cm−3 e non ci sono elettroni in banda di conduzione c. la densità di lacune p è uguale alla densità n di elettroni e entrambe sono uguali al valore intrinseco, perché le impurezze accettori non sono ionizzate alla temperatura data. d. la densità di lacune in banda di valenza è pari a p=3 10 17cm−3 e quella di elettroni in banda di conduzione è molto inferiore a quella delle lacune. e. la densità di lacune in banda di valenza è pari a p=3 10 17cm−3 e quella di elettroni è pari alla densità di elettroni che si avrebbe in un semiconduttore intrinseco posto alla stessa temperatura. [La risposta esatta ha l’aria di essere la e.] 163 Cap. 8 I semiconduttori nell’elettronica C. Kittel, Introduzione alla Fisica dello Stato solido Casa Editrice Ambrosiana 8.1. La giunzione p-n Giunzione fra due semiconduttori drogati p e n Nella regione di tipo P i portatori maggioritari sono le lacune pp. Gli accettori ionizzati NA costituiscono le cariche negative «fisse». Nella regione di tipo N i portatori maggioritari sono gli elettroni nn. I donori ionizzati ND costituiscono le cariche positive «fisse» Alla formazione della giunzione P-N l’equilibrio è raggiunto mediante la diffusione attraverso l’interfaccia di elettroni verso la regione P e lacune verso la regione N. La DIFFUSIONE è dovuta alla diversa concentrazione delle due tipologie di cariche nelle due regioni della giunzione. Il trasferimento di carica lascia all’interfaccia della giunzione una regione di carica spaziale fissa costituita dalle impurezze cariche non più neutralizzate da elettroni e lacune. La regione all’interfaccia in cui è presente la carica fissa è detta REGIONE DI SVUOTAMENTO O DI DEPLEZIONE. Questa densità di carica all’interfaccia 164 genera un campo elettrico che si oppone alla diffusione di elettroni verso la zona P e di lacune verso la regione N, permettendo alla giunzione di raggiungere l’equilibrio. Il campo elettrico nella regione di svuotamento genera una differenza di potenziale fra la regione P e la regione N che è detta potenziale di built-in ΔVbi Densità dei portatori, carica spaziale, campo elettrico e potenziale elettrostatico Le regioni n e p del semiconduttore lontane dall’interfaccia sono neutre Profilo della densità di carica spaziale fissa: densità ND nella regione n, NA nella regione p. Estensione: da qualche nm al mm. Profilo del campo elettrico Profilo del potenziale elettrico: il potenziale di built-in ΔVbi è la caduta di tensione ai capi della regione di svuotamento. 165 Distribuzione dei portatori maggioritari e minoritari nella giunzione pp cariche maggioritarie nn cariche maggioritarie np elettroni minoritari generati termicamente pn lacune minoritarie generate termicamente Le concentrazioni di elettroni e lacune sono legate dalla relazione np ni2 ni2 T All’equilibrio, quindi in assenza di tensione applicata ai capi della giunzione, la corrente totale sia di elettroni che di lacune attraverso la giunzione è nulla je 0 jl 0 je 0 : densità di corrente di elettroni nulla significa che la corrente netta degli elettroni che attraversano la giunzione da n a p e viceversa è nulla. jl 0 : lo stesso vale per la corrente delle lacune. 166 Due contributi: corrente di ricombinazione e corrente di generazione CORRENTE DI RICOMBINAZIONE: corrente di elettroni maggioritari che dalla regione n vanno verso la p. La differenza di potenziale ΔVbi ai capi della regione di svuotamento (=della giunzione) si oppone al flusso della corrente di ricombinazione. CORRENTE DI GENERAZIONE: corrente di elettroni minoritari che sono generati termicamente nella regione p e che sono «spinti» da ΔVbi nella regione n. je je,r je,g 0 CORRENTE DI RICOMBINAZIONE: corrente di lacune maggioritarie che dalla regione p vanno verso la n. La differenza di potenziale ΔVbi ai capi della regione di svuotamento (=della giunzione) si oppone al flusso della corrente di ricombinazione. CORRENTE DI GENERAZIONE: corrente di lacune minoritarie che sono generate termicamente nella regione n e che sono «spinti» da ΔVbi nella regione p. jl jl ,r jl ,g 0 Le correnti di ricombinazione dovute ad elettroni e lacune si sommano. Le correnti di generazione dovute ad elettroni e lacune si sommano. 167 Polarizzazione della giunzione p-n Si supponga di applicare una d.d.p. ΔV alla giunzione con potenziale positivo sulla regione p: si è in condizioni di POLARIZZAZIONE DIRETTA. La tensione applicata ΔV cade ai capi della regione di svuotamento (responsabile della resistenza del sistema) e ha segno discorde al potenziale di built-in. La tensione positiva applicata riduce l’estensione della regione di svuotamento favorendo il movimento delle cariche maggioritarie. Attraverso la giunzione fluisce una corrente di ricombinazione dovuta alle cariche maggioritarie, favorita appunto dalla tensione applicata, mentre la corrente di generazione dovuta ai portatori minoritari di fatto non è significativamente influenzata dalla tensione stessa. 168 Si supponga di applicare una ddp alla giunzione con potenziale negativo sulla regione p: si è in condizioni di POLARIZZAZIONE INVERSA. La tensione applicata ΔV cade anche in questo caso ai capi della regione di svuotamento ma ora è concorde con il potenziale di built-in La tensione negativa applicata aumenta l’estensione della regione di svuotamento sfavorendo il movimento delle cariche maggioritarie. Attraverso la giunzione è inibito il fluire della corrente di ricombinazione dovuta alle cariche maggioritarie. La corrente di generazione dovuta ai portatori minoritari non è influenzata dalla tensione applicata. 169 8.2. Il diodo. Il diodo è un componente elettronico non lineare a due terminali costituito da una giunzione p-n. Il DIODO è un elemento non lineare: fra tensione applicata e corrente che fluisce nel componente non vi è una relazione di tipo lineare Ogni componente elettronico è identificato dalla sua caratteristica, cioè dalla relazione fra la tensione ai capi del componente e la corrente che vi fluisce. La resistenza, ad esempio, è l’oggetto lineare per eccellenza. Qual è la legge che lega la differenza di potenziale applicata al diodo e la corrente che vi fluisce attraverso? 170 Applicando una tensione positiva sull’anodo la giunzione p-n è POLARIZZATA IN DIRETTA. Correnti nel diodo Jr: corrente di ricombinazione dovuta alle cariche maggioritarie favorita dalla polarizzazione diretta. Il suo valore aumenta rispetto al caso non polarizzato di un fattore che dipende esponenzialmente dal ΔV applicato. e eV k BT J0: la corrente di generazione dovuta alle cariche minoritarie non è influenzata dalla tensione applicata. Il verso della corrente è dall’anodo (p) verso il catodo (n). Applicando una tensione negativa sull’anodo la giunzione p-n è POLARIZZATA IN INVERSA. Corrente nel diodo Jr: La corrente di ricombinazione dovuta alle cariche maggioritarie è ora sfavorita dalla polarizzazione inversa. Il suo valore diminuisce rispetto al caso non polarizzato di un fattore che dipende esponenzialmente dal ΔV applicato, dove ora ΔV<0. e eV k BT J0: la corrente di generazione dovuta alle cariche minoritarie non è influenzata dalla tensione applicata. La corrente totale è dovuta alla somma dei due termini, che hanno segno opposto ekTV B j j0 e 1 Termine a sinistra: di ricombinazione Termine a destra: di generazione polarizzazione diretta ΔV>0: la corrente nel diodo è dominata dal termine di ricombinazione, che scorre dall’anodo verso il catodo. polarizzazione inversa ΔV<0: la corrente nel diodo è dominata dal termine di generazione, che scorre dal catodo verso l’anodo. La corrente in inversa è molto più piccola di quella in diretta. 171 Caratteristica I-V del diodo ekTV B j j0 e 1 Caratteristica del diodo Schematizzazione ideale Uso del diodo nei circuiti elettronici Il diodo è un rettificatore: applicando una tensione positiva sull’anodo nel dispositivo scorre corrente. Per tensione con polarità opposta può fluire solo una piccola corrente. 172 In caso di segnale di tensione alternato la corrente scorre (in una sola direzione) solo quando il segno della tensione corrisponde alla polarizzazione diretta della giunzione: il diodo ha agito da rettificatore. TEST. In una giunzione p-n polarizzata in diretta la regione di svuotamento all’interfaccia: a. è ridotta rispetto al caso della giunzione non polarizzata. b. è aumentata rispetto al caso della giunzione polarizzata in inversa. c. è aumentata rispetto al caso della giunzione non polarizzata. [La risposta corretta è la c.] 8.3. I diodi LED (Light Emitting Diode). Il diodo LED è costituito da una giunzione p-n che emette luce quando attraversata da corrente. La giunzione p-n del diodo è polarizzata in diretta, quindi gli elettroni sono iniettati dalla regione n alla p e le lacune dalla regione p alla n. Elettroluminescenza L’elettroluminescenza è l’emissione di luce a seguito del processo di ricombinazione di elettroni e lacune all’interfaccia della giunzione 173 Meccanismo di ricombinazione e generazione della luce Gli elettroni occupano gli stati in banda di conduzione, mentre le lacune sono in banda di valenza. La banda di conduzione e quella di valenza sono separati dalla energia di gap E G. Il processo di ricombinazione elettrone-lacuna pertanto comporta la cessione di energia pari all’energia di gap. Nel caso tale energia sia liberata tramite emissione di fotoni si ha la ricombinazione radiativa alla base del funzionamento dei LED. I processi di ricombinazione radiativa sono fortemente probabili nei semiconduttori a gap diretta e molto improbabili in quelli a gap indiretta (non utilizzabili nei LED) Al processo di ricombinazione radiativa si applicano le leggi di conservazione dell’energia e del momento includendo l’elettrone, la lacuna e il fotone. p fotone k fotone Momento e energia del fotone 2 hc energia h fotone fotone Momento e energia dell’elettrone e della lacuna 2 pelettrone / lacuna k dove k è il momento cristallino, legato al parametro a Eelettrone EC reticolare a del cristallo. Elacuna EV Essendo il parametro reticolare a (ossia la distanza fra gli atomi del semiconduttore quindi dell’ordine di qualche Angstrom) molto minore della lunghezza d’onda p fotone pelettrone/ lacuna si trascura il momento del fotone rispetto a quello di elettroni e lacune. a 174 Ricombinazione radiativa nei semiconduttori a gap diretta L’elettrone e la lacuna che entrano nel processo di ricombinazione radiativa hanno lo stesso momento. Nello spazio dei momenti quindi il processo di ricombinazione radiativa è una transizione diretta fra elettrone e lacuna (fortemente probabile nei semiconduttori a gap diretta) Per la conservazione dell’energia il fotone emesso ha energia pari alla gap del semiconduttore h EGap Ricombinazione radiativa nei semiconduttori a gap indiretta Nei semiconduttori a gap indiretta (Si, Ge) le leggi di conservazione del momento richiedono l’intervento di una terza particella oltre all’elettrone e lacuna. Il momento mancante è fornito dagli atomi del reticolo cristallino. Il processo di ricombinazione radiativa elettrone-lacuna è ora una transizione indiretta ed è improbabile. Per questo motivo la ricombinazione radiativa è un processo poco efficiente nei semiconduttori a gap indiretta, che pertanto non possono essere utilizzati per costruire LED. LED: Semiconduttori a gap diretta Il colore della luce LED è determinato dalla energia di gap del semiconduttore utilizzato. Ogni semiconduttore emette luce di un solo colore. I LED sono dispositivi caratterizzati da alta efficienza e pertanto hanno un grande impatto sulla società per le possibilità di risparmio energetico 175 Efficienza luminosa in lumen/Watt (flusso luminoso generato/potenza in ingresso) lampadina a incandescenza: 70 LED: 300 L’utilizzo di LED come sorgente luminosa è ora possibile grazie alla disponibilità di semiconduttori con energia di gap in grado di coprire tutte le regioni dello spettro elettromagnetico di interesse. In particolare per il visibile ora è possibile generare luce bianca mescolando i tre colori fondamentali: rosso, verde e blu. La possibilità di avere luce blu (cioè LED che nel processo di ricombinazione radiativa emettono nel blu) si è avuta solo recentemente grazie ai progressi nella crescita di materiali semiconduttori. La luce blu si è ottenuta in diodo LED in semiconduttori basati su GaN (nitruro di gallio) e loro leghe (InGaN) quando il progresso scientifico-tecnologico ha permesso la deposizione di questi semiconduttori con elevata qualità. Ai ricercatori che hanno messo a punto il processo di crescita del nitruro di gallio è stato assegnato il Nobel del 2014. “Per l’invenzione di diodi efficienti che emettono luce blu, che ha permesso lo sviluppo di sorgenti di luce bianca luminose ed energeticamente economiche”. (Tabelle della produzione dei led) TEST. In un semiconduttore a gap diretta nel processo di ricombinazione radiativa: a. è emesso un fotone con energia pari alla metà dell’energia di gap. b. è emesso un fotone con energia pari all’energia di gap. c. i processi di ricombinazione radiativa sono fortemente probabili solamente in semiconduttori a gap indiretta. [La risposta corretta è la b.] 176 8.4. Principi di funzionamento del transistor Nel 1947 tre ricercatori dei Bell Labs (USA) inventano il transistor: sono William Shockley, Walter Brattain e John Bardeen. Nel 1956 i tre ricercatori vengono insigniti del premio Nobel per la Fisica con la motivazione «per le ricerche sui semiconduttori e per la scoperta dell’effetto transistor». Il primo transistor in germanio Il transistor cambia il mondo: inizia l’era della moderna elettronica a cui seguirà quella della miniaturizzazione. Da alcuni è giudicata come l’invenzione più importante del ventesimo secolo. I suoi principali impieghi nell’elettronica sono come componente amplificante e come switch (cioè come interruttore). 177 Il TRANSISTOR (BJT: transistor a giunzione bipolare) è costituito da due giunzioni p-n con un elemento in comune (detto base). La sequenza può essere p-n-p oppure n-p-n. Il transistor è un componente elettronico non-lineare a tre terminali: oltre alla base abbiamo l’emettitore e il collettore che sono costituiti dalle altre due regioni distinte delle giunzioni Simboli circuitali del transistor Polarizzazione del transistor Nel normale funzionamento di un transistor la giunzione Emettitore–Base è polarizzata in diretta e la giunzione Base–Collettore in inversa. Per polarizzare un transistor bisogna quindi usare tensioni i cui segni dipendono dalla sequenza (npn o pnp) che costituisce il componente, cioè dalla sequenza di drogaggio utilizzato. 178 La corrente di emettitore IE costituita da lacune maggioritarie fluisce nella base favorita dalla polarizzazione diretta della giunzione E-B. Queste lacune partecipano alla corrente di cariche minoritarie che fluiscono verso il collettore IC, attraverso la giunzione B-C polarizzata in inversa. Parte delle lacune provenienti dall’emettitore sono perse a causa della ricombinazione con gli elettroni della base, drogata n. Gli elettroni per la ricombinazione sono forniti dalla corrente di base IB; parte degli elettroni dovuti alla corrente IB sono iniettati nell’emettitore dalla polarizzazione diretta della giunzione E-B Le lacune generate termicamente nella base raggiungono il collettore e contribuiscono alla corrente di collettore. Gli elettroni generati termicamente nel collettore raggiungono la base. 179 Utilizzo del transistor nell’elettronica A livello macroscopico noi abbiamo tre terminali: Base, Emettitore, Collettore e tre correnti che scorrono verso il dispositivo stesso. Esistono diverse configurazioni. L’ingresso del dispositivo è fra il terminale di base e emettitore (configurazione ad emettitore comune) Il segnale di uscita VCE si raccoglie fra il terminale del collettore e quello dell’emettitore. Macroscopicamente, le correnti che fluiscono attraverso i tre terminali del transistor (Emettitore, Base e Collettore) sono legate da I E I B IC Lo stato di conduzione si controlla agendo sulla corrente IB. Il transistor come interruttore Perché operi come interruttore (switching) il transistor deve presentare due stati di conduzione elettrica in uscita: OFF: circuito aperto fra collettore ed emettitore ON: «corto circuito» fra collettore ed emettitore Stato di OFF: il BJT è posto in interdizione (cut-off) ponendo IB a zero o negativa, cioè ponendo la giunzione base-emettitore in polarizzazione inversa. La corrente IC, così come IE è perciò nulla (perché non c’è più iniezione dall’emettitore al collettore): l’uscita fra collettore e emettitore equivale a un interruttore aperto. Stato di ON: il BJT è portato in saturazione polarizzando in diretta entrambe le giunzioni (sia quella tra emettitore e base, sia quella tra base e collettore); per far questo bisogna aumentare la corrente di base IB fino a che la giunzione base-collettore va in polarizzazione diretta e scorre una elevata corrente tra emettitore e collettore, ottenendo una significativa caduta di tensione ai capi dei due terminali (VCE quasi nulla e una corrente IB grande). La corrente IC scorre da C verso E in una regione di bassa resistenza: l’uscita fra collettore e emettitore equivale a un interruttore chiuso. 180 8.5. Test ed esercizi Quanto vale la densità delle cariche fisse nella regione all’interno della regione di svuotamento di una giunzione p-n? a. b. c. d. e. ND−NA (sbagliata). ND . Dipende dal rapporto fra ND e NA. È nulla. Dipende dalla estensione della regione di svuotamento. [La risposta esatta è la c.] Si considerino due diodi in serie in cui i due catodi sono connessi insieme. Applicando una tensione alla serie si osserva passaggio di corrente quando: a. solamente per tensione negative, quando il primo diodo è polarizzato in inversa. b. sempre, perché in questa configurazioni i due diodi sono sempre polarizzati entrambi in diretta. c. mai, perché qualsiasi sia il segno della tensione applicata uno dei due diodi è sempre polarizzato in inversa. d. sempre, perché qualsiasi sia il segno della tensione applicata uno dei due diodi è sempre polarizzato in diretta. e. solamente per tensione positive, quando il primo diodo è polarizzato in diretta. [La risposta corretta è la c.] In un transistor BJT pnp polarizzato in modo standard (EB in diretta e BC in inversa) le lacune iniettate dall’emettitore: a. tutte ricombinano nella base. b. tutte raggiungono il collettore dopo aver attraversato la base. c. raggiungono il collettore, ma parte ricombinano nella base. d. il comportamento cambia a seconda se la base ha o meno la stessa tipologia di drogaggio dell’emettitore (entrambi n o entrambi p). e. dipende dal tipo di drogaggio della base rispetto al collettore. [La risposta corretta è la c.] 181 Cap. 9 Nanoscienze e nanotecnologie 9.1. I principi delle nanoscienze. Proprietà fisiche e dimensionalità: introduzione allo studio e alla manipolazione dei materiali, dei dispositivi e dei fenomeni fisico/chimici su scala nanometrica 9.2. Nanoscienze ed elettronica. Ingegneria di banda nei semiconduttori. Sistemi 2D: eterostrutture fra semiconduttori; buche per elettroni e buche per lacune Introduzione alle tecniche di imaging alla nanoscala. 9.3. Nanotecnologie. Introduzione alle tecniche di fabbricazione per le nanotecnologie 9.4. Imaging dei nanosistemi: come vedere le nanostrutture. Microscopi elettronici. Microscopie a scansione di sonda: microscopio a effetto tunnel (STM); microscopio a forza atomica (AFM) 9.5. Alcuni esempi di applicazione effetti quantistici in nanostrutture di semiconduttori e delle nanoscienze. Cenni sul grafene. C. Kittel, Introduzione alla Fisica dello Stato solido Casa Editrice Ambrosiana 9.1. I principi delle nanoscienze. Introduzione agli effetti alla nanoscala. Effetti di superficie ed effetti di confinamento. Cosa significa “nanoscienze” e cosa si intende per nanoscienze e nanotecnologie? Le nanoscienze e le nanotecnologie sono lo studio, la manipolazione e la progettazione dei materiali, dei fenomeni chimico/fisico e dei dispositivi su scala nanometrica. È evidente dalla definizione che le nanoscienze e le nanotecnologie sono intrinsecamente multidisciplinari e coinvolgono ambiti quali la fisica, la chimica, la biologia molecolare, la scienza dei materiali, l’ingegneria meccanica, chimica ed elettronica, la bioingegneria e la medicina. La scala nanometrica: quanto è piccola? Il prefisso nano significa “un miliardesimo” ed è usato per indicare la quantità pari alla miliardesima parte dell’unità: 1 nm: 10 – 9 metri = 0.000000001 m 1 ngr: 10 – 9 grammi = 0.000000001 gr 1 ns: 10 – 9 secondi = 0.000000001 s Con la parola nanoparticella si intende qualcosa dell’ordine di 100 nm o meno: le molecole della vita, il DNA 182 Osserviamo in dettaglio nella scala delle dimensioni la transizione da micro a nano sia per gli oggetti «naturali» (a sinistra) che per quelli creati dall’uomo (a destra). Scala dei micron Globuli bianchi (10 – 5 metri = 10 μm) Globuli rossi Dispositivi MicroElettroMeccanici (10-100 μm ) Scala dei nanometri DNA: 2.5 nm Atomi di silicio: 0.078 nm Dispositivi elettronici Nanotubi di carbonio Le nanoscienze studiano e manipolano sistemi che contengono da qualche decina a migliaia di atomi; raggio di Bohr = 0.5292Å ≈ 0.05 nm atomo di C ≈ 0.17 nm In una linea di 1nm : 3 atomi di C In una superficie di 1nm2: 9 atomi di C In un volume di 1nm3: 27 atomi di C In un volume di 10 nm3: 270 atomi di C Quando di parla di nano sistemi ci si riferisce ordinariamente a qualche migliaio di atomi. Macro: In un volume di 1m3 : 2.7·1028 atomi di C L’interesse per le nanoscienze e nanotecnologie Alla nanoscala emergono NUOVE PROPRIETÀ dei materiali rispetto al caso macroscopico. Emergono e diventano predominanti gli EFFETTI QUANTISTICI E DI SUPERFICIE che permettono quindi di implementare sistemi e dispositivi con nuove proprietà. Sono inoltre tecnologicamente vantaggiose perché leggere veloci occupano meno spazio consumano meno energia Il comportamento degli oggetti alle nanoscale sono determinati dagli Effetti di superficie Gli effetti di superficie sono dovuti alle particelle che sono presenti sulla superficie e possono dominare il comportamento dei nanosistemi e delle nanoparticelle perché nel «piccolo» il numero di atomi presenti sulla superficie cresce percentualmente rispetto a quelli interni di volume 183 Area L2 Volume L3 Area 1 Volume L Nella figura sotto vediamo delle nanoparticelle composte da un diverso numero di atomi. Più è piccola la particella e maggiore è la percentuale di atomi che sta sulla superficie. Nel caso della particella più piccola, su 12 atomi, 9 sono sulla superficie, pari al 75%. Effetti di superficie in natura Insetti e gechi (che riescono a camminare su pareti verticali) hanno sviluppato sotto le loro zampe delle «nanostrutture» (spatole di centinaia di nm) che aumentando la superficie di adesione permettono loro di camminare su pareti verticali. La presenza di queste nanostrutture sulle zampette degli animali è stata visualizzata nel microscopio a elettroni La nanostrutturazione della superficie delle zampe diventa via via più piccola man mano che l’insetto diventa più grande (la densità di nanofibre aumenta con la massa dell’utilizzatore): vi è una sorta di ottimizzazione dell’ingegnerizzazione da parte della natura. Ovviamente abbiamo provato a copiare questi effetti dando vita a quella che si chiama nanotecnoligia bio-inspired, e un esempio abbastanza divertente è rappresentato dallo sviluppo di adesivi con grande capacità di adesione: si tratta di adesivi progettati (la cui superficie è nanostrutturata) come le setole del geco; in questo modo si riesce a ottenere che con una superficie di pochi centimetri quadrati si è in grado di sostenere un uomo di corporatura media. 184 Effetti quantistici La meccanica quantistica domina le proprietà dei nanosistemi: le proprietà ottiche, elettriche e meccaniche dipendono infatti dalla dimensione (delle nanostrutture) in cui sono confinati i portatori. In particolare, alle nanoscale (sistemi le cui dimensioni sono confrontabili con le loro dimensioni) gli elettroni manifestano la loro natura ondulatoria Un esempio piuttosto eclatante di questi effetti è dato da un esperimento – effettuato all’IBM americana negli anni ’90 – in cui, grazia alla capacità di manipolare gli atomi, è stato costruito quello che viene definito un recinto quantistico per gli elettroni formato da 48 atomi di Fe (ferro) su una superficie di Cu (rame). Confinement of electrons by quantum corrals on metal surface M. F. Crommie, C. P. Lutz, D.M. Eigler, Science, 262, 218 (1993) I 48 atomi di ferro sono quella sorta di palizzata rappresentata nell’immagine sopra. Cosa succede sulla superficie? La presenza degli atomi di ferro in forma chiusa di fatto genera un potenziale di confinamento per gli elettroni della superficie all’interno del recinto stesso: gli elettroni sulla superficie subiscono quindi il potenziale di confinamento del recinto quantistico e vengono pertanto localizzati all’interno del recinto con una distribuzione di carica che sappiamo essere proporzionale al modulo quadro della funzione d’onda (onda stazionaria, visualizzata nell’immagine) che è esattamente quella prevista dalla soluzione dell’equazione di Schrödinger. Cambiando la forma del recinto cambia la distribuzione spaziale della carica e dunque cambia la forma della funzione d’onda. Sono state fatte delle prove con recinti di forma diversa, ad esempio lo stadio, l’esagono, il triangolo equilatero, il quadrato… e di volta in volta si ottengono delle distribuzioni di cariche confinate diverse a seconda appunto della forma del potenziale confinante. Nanoscienze e nanotecnologie puntano dunque a costruire il recinto quantistico e a rivelare le onde elettroniche 185 Proprietà ottiche e confinamento quantistico Anche le proprietà ottiche sono dominate dagli effetti quantistici nei nanosistemi. Nanoparticelle di semiconduttore assorbono la luce e la riemettono luce con diverso colore (diversa energia del fotone) a seconda della loro dimensione. Nelle provette sono presenti soluzioni contente nanocristalli di semiconduttore (CdSe) di diversa grandezza (dai 2 agli 8 nm), eccitate con una luce ultravioletta Illuminate con luce ultravioletta, la luce trasmessa dalle soluzioni cambia colore a seconda delle dimensioni delle nanoparticelle presenti in soluzione; in particolare si osserva che la luce tende verso il blu, ovvero verso le lunghezze d’onda minori, man mano che decresce la dimensione delle particelle presenti in soluzione. È un effetto quantistico. La meccanica quantistica infatti ci insegna - che al decrescere delle dimensioni gli effetti di confinamento quantistico diventano più rilevanti (si allontanano i livelli energetici degli elettroni presenti nella nanostruttura): gli elettroni confinati quantisticamente in una buca di potenziale a parete infinita hanno valori di energie discrete che dipendono dalla «grandezza» della regione in cui sono confinati: En 2 2 2mL2 n2 m è la massa, L la larghezza della buca di altezza infinita Man mano che le dimensioni della buca diminuiscono le energie possibili via via si allontanano tra loro. Ed è esattamente quello che succede nelle soluzioni di cui sopra: al diminuire delle dimensioni dei nanocristalli semiconduttori presenti nella soluzione si allontanano tra loro i livelli di energia. In un semiconduttore macroscopico gli elettroni in banda di conduzione hanno energia EC, mentre le lacune sono in banda di valenza e hanno energia EV. In un processo di ricombinazione che prevede emissione di luce avremo che il fotone emesso avrà energia proprio pari alla differenza EC – EV, energia di gap del semiconduttore. 186 Nel caso di nanocristalli di semiconduttore gli elettroni al loro interno sono confinati e gli elettroni in banda di conduzione non avranno più energia EC ma, esattamente come nel caso di una buca, avranno una energia più grande perché lo stato permesso non è più coincidente col fondo della banda di conduzione; analogamente le lacune in banda di valenza non avranno più energia EV ma energia più grande perché anche loro subiscono il confinamento dovuto alle ridotte dimensioni del nanocristallo; di fatto questo significa che quando si va a considerare l’emissione di un fotone dovuto al processo di ricombinazione, la distanza di energia tra gli elettroni in banda di conduzione e le lacune in banda di valenza (la gap del semiconduttore) è aumentata; ed è tanto più grande quanto più piccole sono le particelle. Ecco perché l’emissione di luce si sposta verso il blu (maggior energia del fotone) al diminuire delle dimensioni delle nanoparticelle. La coppa di Licurgo e le nanotecnologie romane La coppa di Licurgo (del IV secolo, conservata al British Museum), costruita da artigiani romani, appare verde se la luce è riflessa, rossa se trasmessa. Si è cercato di capire donde derivasse questa proprietà e si è scoperto che fu ottenuta dagli artigiani romani inserendo nel vetro nanoparticelle di Au e Ag aventi dimensioni inferiori ai 100nm: primo esempio di uso (inconsapevole) di nanotecnologie per ottenere proprietà innovative. 187 9.2. – 9.5. NANOSCIENZE ED ELETTRONICA Modeling di materiali e dispositivi (9.2), fabbricazione (9.3) e caratterizzazione (9.4) sono fortemente interconnessi e inseparabili nelle nanoscienze e nanotecnologie. 9.2. Materiali e dispositivi. Ingegneria di banda nei semiconduttori I progressi delle nanoscienze e delle nanotecnologie hanno permesso la realizzazione di sistemi a ridotta dimensionalità 2D, 1D o addirittura 0D («atomi artificiali») in cui i portatori di carica sono confinati quantisticamente in 2 o 1 direzioni spaziali. Come si ottengono questi sistemi? Con l’ingegneria di banda. Ingegneria di banda I sistemi a ridotta dimensionalità sono realizzabili efficacemente con i semiconduttori (quindi utilizzabili in elettronica): si deposita una sequenza artificiale (non disponibile in natura) di semiconduttori diversi, con spessori controllati, anche dell’ordine di qualche nanometro. Che cosa succede quando si va a depositare questa sequenza? 188 Eterogiunzione fra semiconduttori A e B All’interfaccia fra i due semiconduttori si creano delle discontinuità di energia in banda di valenza e in banda di conduzione per accomodare il diverso valore dell’energia di gap. In particolare sono possibili diverse tipologie di allineamento La differenza fra le energie di gap produce tre tipologie possibili di allineamento fra le bande di valenza e di conduzione all’interfaccia fra i due materiali, chiamate convenzionalmente “di tipo I”, “di tipo II”, “di tipo III”. Allineamento di tipo I L’energia di gap minore è completamente contenuta all’interno della gap più grande. Nel materiale con gap minore (B nel disegno) sia gli elettroni sul fondo della banda di conduzione che le lacune in cima alla banda di valenza hanno energia minore rispetto a quelli nel materiale A Allineamento di tipo II Nel materiale B gli elettroni sul fondo della banda di conduzione hanno energia minore rispetto a quelli nel materiale A. Viceversa, sono le lacune nel materiale A ad avere la minor energia. 189 Allineamento di tipo III L’allineamento è tale che non ci sono intervalli energetici in cui si sovrappongono le energie dei portatori del materiale A e B. Nel caso riportato nel disegno gli elettroni del materiale B hanno energia minore delle lacune in A. Ogni coppia di semiconduttori A e B possiede il suo specifico allineamento di banda all’interfaccia A-B: il profilo di banda risultante lungo la direzione di crescita genera buche e/o barriere per elettroni e lacune. Immaginiamo una sequenza di tre semiconduttori: A-B-A. Supponiamo che la gap del semiconduttore B sia completamente contenuta all’interno della gap del semiconduttore A. Il profilo di banda che ne risulta – sia per gli elettroni in banda di conduzione sia per le lacune in banda di valenza – è quella riportata nel disegno a sinistra. Elettroni e lacune sono confinati nel materiale B in una buca avente - larghezza: spessore del materiale B. - altezza: discontinuità di banda (per gli elettroni) ΔEC e (per le lacune) ΔEV. Se lo spessore del materiale B è di pochi nanometri i portatori sono confinati quantisticamente nella buca; in altre parole è possibile creare quello che in precedenza abbiamo definito sistema bidimensionale 2D Il profilo dell’ingegneria di banda genera una buca di potenziale per i portatori lungo z, le cariche sono libere Sopra l’asse z un esempio: elettroni confinati in una buca solo nel piano xy, cioè possono muoversi nel materiale B ma non possono raggiungere le zone A né a sinistra di altezza ΔEC e larghezza L né a destra perché inibite dalla presenza di una barriera data dalla discontinuità in banda di conduzione per gli elettroni e dalla discontinuità in banda di valenza per le lacune. 190 Utilizzare l’ingegneria di banda significa scegliere opportunamente la sequenza di semiconduttori per generare il profilo desiderato della banda di conduzione (o della banda di valenza, o entrambe) lungo la direzione di crescita (direzione z) La combinazione opportuna nella sequenza di crescita permette di realizzare i profili di banda desiderati lungo la direzione di crescita. Buche quantiche, barriere, superreticoli Cos’è che ci permette o ci impedisce di ottenere un profilo arbitrario? Va tenuto conto che non tutti i semiconduttori possono essere depositati uno sull’altro: è necessario che ci sia una sorta di compatibilità tra i due materiali. La prima compatibilità è di tipo chimico: in qualche modo dev’essere compatibile la loro coesistenza; vi è poi un fattore molto importante legato al valore del parametro reticolare dei due materiali che sto crescendo l’uno sull’altro; in altre parole le due strutture cristalline non devono essere troppo diverse. In altre parole, per ottenere la deposizione di eterostrutture di elevata qualità, i costituenti devono avere struttura cristallina simile e parametro reticolare “non troppo differente” affinché sia possibile un adattamento delle celle cristalline. Parametro reticolare vs energia di gap per i diversi semiconduttori in natura 191 Eterostrutture con disaccordo reticolare Supponiamo che il parametro reticolare del materiale A sia diverso da quello del materiale B. Quando li vado a mettere l’uno sull’altro possono accadere due cose: Crescite rilassate Nella crescita l’epistrato si deposita con il suo parametro reticolare, il disaccordo reticolare presente genera dei difetti all’interfaccia fra i due materiali che vanno a danneggiare le prestazioni del materiale stesso. È però anche possibile che durante la crescita di un materiale B su A succeda qualcosa di diverso: Crescite coerenti (stressate) Nella deposizione l’epistrato si adatta al passo reticolare del substrato deformandosi (tensilmente o compressivamente) La tipologia di crescita modifica la simmetria del reticolo cristallino (da cubica a tetragonale) quindi modifica anche le proprietà elettroniche. Le proprietà elettroniche sono infatti correlate e direttamente determinate dalla simmetria del sistema, per cui, se 192 variamo la simmetria del sistema, di fatto variamo le proprietà e gli stati energetici del sistema stesso. Lo sviluppo di LED nel blu (utili per creare la luce bianca) è stato possibile grazie al controllo dei processi di crescita epitassiali e di drogaggio di semiconduttori quali il GaN (nitruro di gallio) su opportuni substrati. TEST. Cosa è necessario per confinare elettroni in un strato di materiale A utilizzando l’ingegneria di banda? a. Che il minimo della banda di conduzione in A sia alla stessa energia che nei materiali adiacenti. b. Che il minimo della banda di conduzione in A sia a energia maggiore che nei materiali adiacenti. c. Che il minimo della banda di conduzione in A sia a energia minore che nei materiali adiacenti. [La risposta corretta è la c.] 9.3. I metodi di fabbricazione imaging dei nanosistemi: le microspie a scansione di sonda Sono possibili due approcci per la fabbricazione di nanostrutture Approccio Top-Down Le nanostrutture sono ottenute mediante riduzione delle dimensioni e della dimensionalità di oggetti macroscopici utilizzando processi di nanofabbricazione. Questo è il tipico approccio che viene usato per definire i dispositivi elettronici, di fatto utilizzato nella microelettronica, dove oggetti piccoli vengono ottenuti a partire da oggetti grandi, ottenendo una ideale riduzione delle dimensioni da macro a nano. Approccio Bottom-Up Le nanostrutture sono ottenute mediante connessioni macroscopiche a nanostrutture pre-esistenti in natura (nanotubi di carbonio, nanofili, aggregati di molecole …). In entrambi i casi è necessario un processo di fabbricazione che prende il nome di litografia. La litografia per la fabbricazione di nanosistemi Litografia: creazione di strutture con profili tridimensionali mediante il trasferimento di un disegno (pattern) bidimensionale sulla superficie da strutturare utilizzando un resist Resist: polimero che a seguito di esposizione a radiazione UV o elettroni subisce una reazione fotochimica che ne modifica la solubilità in un solvente. A seconda della dimensione delle strutture che si intendono fabbricare la litografia può essere ottica oppure elettronica: 193 Litografia ottica: uso di fotoni UV per esporre il resist. Il limite inferiore della dimensione delle strutture realizzabili è fornito dal limite di diffrazione della luce. Se si vogliono ottenere oggetti più piccoli si utilizza la Litografia elettronica EBL: uso di elettroni per esporre il resist. È possibile fabbricare strutture di dimensioni fino al nm. In entrambi i casi il processo di litografia, e quindi di fabbricazione, si può schematizzare come nella seguente immagine: si ha un campione (il rettangolo verde) sul quale viene deposto il resist, cioè il polimero; sul campione si pone una maschera (una sequenza di zone opache e zone trasparenti) e la sonda (la radiazione o gli elettroni) incide sul resist attraverso la maschera. A questo punto, a seconda che il resist sia positivo o negativo, dopo lo sviluppo chimico rimarrà sul campione o il solo resist che è stato esposto (resist negativo) oppure il resist che non è stato esposto (resist positivo) Si è quindi trasferito il disegno che volevamo sulla superficie del campione. Per poter poi andare a definire il nostro dispositivo sono necessari ulteriori processi. In realtà la sequenza di fabbricazione è molto complessa. Qui stiamo definendo solo i principi di base che però ci permettono di comprendere le difficoltà e le tipologie. Le tipologie di processo Dopo l’esposizione si procede alla sagomatura tridimensionale del campione mediante due classi di procedure: - processi di tipo sottrattivo (etching o attacco); - processi di tipo additivo (lift-off). 194 Processo sottrattivo: Etching Viene tolto del materiale fino a che ciò che rimane ha la forma che vogliamo: per sagomare il film sovrapponiamo il resist, lo esponiamo e sviluppiamo… Quindi portiamo una serie di attacchi (di tipo chimico, secchi o a bagnate) che vanno a rimuovere il film soltanto dove non è coperto dal resist. Infine si rimuove il resist, avendo sagomato il film con un disegno direttamente legato a quello del resist. Processo additivo: Lift-off Viene aggiunto del materiale (il film) della forma che vogliamo, Si parte dal substrato, gli si pone sopra il resist, si passa alla litografia e allo sviluppo; di nuovo abbiamo il resist della forma voluta (il negativo di ciò che vogliamo rimanga); si deposita sopra il film; quindi si fa evaporare il resist su tutta la superficie del substrato: dove è presente il resist il film verrà via insieme al resist e dove il resist non è presente il film rimane sul substrato. Combinando opportunamente queste due procedure in modo più o meno complesso con una certa professionalità, di fatto è possibile realizzare qualsiasi forma e qualsiasi struttura. A sinistra vediamo qualche esempio: una macchina di formula1 delle dimensioni di qualche centinaio di micron e un London Bridge di qualche micron. 195 Infine un esempio di contattatura su un dispositivo elettronico nanometrico: a sinistra vediamo dei contatti metallici su un foglio di grafene; a destra dei contatti metallici di qualche nanometro nella regione terminale su un canale conduttivo largo a sua volta qualche decina di nanometri. 9.4. Imaging dei nanosistemi: come vedere le nanostrutture “Vedere” le cose piccole è uno degli aspetti più interessanti delle nanotecnologie. Un po’ di storia del microscopio La scienza ha sviluppato nel corso dei secoli gli strumenti per «vedere» cose piccole che funzionano su diversi principi 1700: Microscopio ottico 1931: Microscopio a trasmissione di elettroni (TEM) 1942: Microscopio a scansione di elettroni (SEM) 1981: Microscopio a effetto tunnel (STM) 1986: Microscopio a forza atomica (AFM) Microscopio ottico Il potere risolutivo dovuto al limite di diffrazione della luce di lunghezza d’onda λ è quantificato dal criterio di Rayleigh R 1.22 2n sin n è l’indice di rifrazione del mezzo in cui è posto l’oggetto, θ è l’angolo con cui è visto l’oggetto Con la luce nel visibile si può arrivare a 300 nm. Microscopi elettronici Per vedere cose più piccole è necessario cambiare sonda, non più fotoni ma elettroni. Gli elettroni sono alla base del funzionamento di microscopi essenzialmente di due tipi: - microscopi a trasmissione di elettroni TEM - microscopi a scansione di elettroni SEM 196 La sonda è costituita da elettroni (che sostituiscono le onde elettromagnetiche dei microscopi ottici), con energie tipicamente dai keV a centinaia di keV, a seconda del tipo di applicazione Sono strumenti complessi che funzionano in vuoto. TEM: Microscopio a trasmissione di elettroni Energia ~100 keV L’immagine è formata dal fascio di elettroni trasmesso dal campione. È possibile costruire immagini 3D del campione. La risoluzione che si può ottenere è legata all’energia degli elettroni che si utilizzano. Infatti la lunghezza d’onda degli elettroni dipende dalla loro energia attraverso la relazione di De Broglie: h mv h 2mE per E=100 keV λ~ picom È possibile ottenere risoluzioni inferiori ai nm, cioè risoluzione atomica. Alcune immagini TEM Piani atomici in una eterostruttura di semiconduttori costituita da ALGaAs e AlAs in sequenza: l’uso del TEM ha permesso di distinguere i vari piani atomici e gli atomi ivi presenti. Apparato del Golgi e mitocondri Virus dell’Ebola SEM: Microscopio a elettroni secondari L’imaging della superficie è ottenuta dagli elettroni secondari emessi dal campione investito dal fascio elettronico. La microscopia SEM è eseguibile su conduttori e semiconduttori, non su isolanti. 197 Utilizzando elettroni con energia dell’ordine dei keV è possibile ottenere risoluzioni fino ai nm. Alcune immagini SEM Pistilli del fiore Nanofili di semiconduttori Microscopie a scansione di sonda Negli anni ’80 le microscopie a scansione di sonda hanno rivoluzionato la capacità di vedere «cose piccole» (Nobel Prize 1986 a Ernst Ruska (50%), Gerd Binning (25%) e Heinrich Rohrer (25%) “per la loro progettazione del microscopio a scansione per effetto tunnel”) La loro rapida evoluzione ha permesso e permette oggi non solo di vedere gli atomi ma anche la loro manipolazione. La sonda è una “punta” che scansiona la superficie del campione. L’immagine della superficie si ottiene dalla misura dell’interazione tra sonda e campione durante la scansione della superficie stessa del campione. La punta ha dimensioni nanometriche nella regione terminale: è così possibile ottenere una sensibilità alla topografia della superficie sub nanometrica lungo la direzione z Risoluzione Z ~0.1 nm 198 La posizione della sonda è controllata con estrema precisione da scanner piezoelettrici, sia in x-y (da nanometri a decine di micron) che lungo z (con sensibilità fino ai subnanometri). Schema di un microscopio a scansione di sonda Vediamo due esempi di microscopi a scansione di sonda Microscopio a effetto tunnel (STM) - Il microscopio a effetto tunnel è il primo microscopio a scansione di sonda. Il suo principio di funzionamento si basa sull’effetto tunnel. - Può essere utilizzare per l’imaging di superfici sia di campioni conduttori che semiconduttori, non isolanti. - Permette di ottenere risoluzioni atomiche. - Opera sia in modalità topografica che spettroscopica. Nel microscopio ad effetto tunnel la sonda è una punta metallica (tungsteno) la cui regione finale ha dimensioni corrispondenti a pochi atomi. 199 L’interazione fra punta e campione è rappresentata dalla corrente di tunnel degli elettroni che passano dalla punta al campione quando la punta è posta in prossimità della superficie a distanza dell’ordine degli Angstrom. L’effetto tunnel è il fenomeno quantistico per cui gli elettroni hanno una probabilità non nulla di superare una barriera di altezza superiore alla loro energia. Elettroni nella punta: Gas di Fermi con energia EF1 Elettroni sulla superficie del campione: Gas di Fermi con energia EF2 La barriera è costituita dal potenziale che tiene confinati gli elettroni all’interno di un solido e la larghezza della barriera è la distanza tra punta e campione. 200 Applicando una tensione fra punta e campione (che deve essere metallico o semiconduttore) l’effetto tunnel produce una corrente di tunnel, che costituisce il segnale misurato risultante dalla interazione punta-campione. La corrente di tunnel dipende esponenzialmente dalla larghezza della barriera, cioè nel caso dell’STM dalla distanza punta-campione. L’effetto tunnel si verifica per distanze punta-campione dell’ordine o inferiore ai nm. I tunnel exp 2kd dove k B 2mB h2 d = distanza punta campione altezza barriera La legge esponenziale permette di avere una variazione di corrente di un ordine di grandezza per variazioni della distanza di 0.1 nm La misura della corrente di tunnel durante la scansione della superficie permette di determinare la variazione di altezza delle strutture presenti sulla superficie stessa: si ottiene la topografia del campione. Con questa tipologia si sono visualizzati per la prima volta gli atomi presenti sulla superficie del campione. Immagini STM Atomi sulla superficie di silicio (20 Angstrom) Alcune delle prime immagini del DNA, in scala via via più piccola fino a visualizzare gli atomi del DNA 201 L’altro fondamentale e importante microscopio a scansione di sonda è il Microscopio a forza atomica (AFM) - Il microscopio a forza atomica si basa sulla forza di interazione fra gli atomi della punta e quelli sulla superficie del campione. - (Al contrario dell’STM) si può utilizzare l’AFM sia con metalli che con isolanti. - La sonda AFM è montata su un cantilever che subisce delle deflessioni al variare della forza di interazione fra la punta e la superficie durante la scansione del campione. - Dalla misura della deflessione del cantilever attraverso la gestione dell’elettronica di controllo si risale alla morfologia della superficie scansionata. Il microscopio AFM opera in aria. La deflessione del cantilever a seguito della interazione punta-superficie è rivelata dallo spostamento del riflesso di un fascio laser incidente sul dorso del cantilever stesso. Il fotodiodo è in grado di rilevare gli spostamenti del fascio riflesso e quindi del cantilever. Vediamo ora quali sono le forze in gioco tra campione e punta in questo tipo di microscopio. 202 Potenziale di interazione fra punta e campione A grandi distanze le forze sono di tipo attrattivo (essenzialmente forze di Van der Waals). Quando gli atomi si avvicinano oltre la posizione di equilibrio le forze diventano fortemente repulsive dovuto al fatto che gli atomi non possono penetrarsi l’uno con l’altro. Questo ci dice che il microscopio AFM può funzionare in due modi. Il primo modo è “in contatto”; il secondo è “in non-contatto”. Microscopia AFM «in contatto» Nella modalità in contatto la punta è tenuta forzatamente in contatto sulla superficie del campione e l’AFM lavora nell’intervallo delle forze repulsive. Si ottiene la risoluzione migliore, ma la superficie del campione deve essere sufficientemente «dura» da non essere modificata dalla forza esercitata dalla punta. 203 Microscopia AFM «in non contatto» Nella modalità in non-contatto la distanza punta –campione, dell’ordine di 1-10 nm, è mantenuta nella regione in cui l’interazione punta-campione è di tipo attrattivo. Questa modalità, non prevedendo il contatto, non modifica le nanostrutture che si vogliono visualizzare. Risulta particolarmente utile ad esempio nell’analisi di campioni biologici. La risoluzione finale ottenibile con il microscopio AFM dipende anche dalla forma della punta e dalla sua integrità (usura e/o danni). È possibile con gli strumenti più moderni ottenere risoluzioni «atomiche». La forma specifica e il tipo di materiale con cui sono costruite le punte variano con le modalità operative. 9.5. Il grafene Uno dei materiali più interessanti che trovano utilizzo nelle nanotecnologie è il grafene. Il grafene fu scoperto nel 2004 da Andre Geim e Konstantin Novoselov (Università di Manchester) sfogliando la grafite con lo scotch. Nel 2010 i due ricevettero il Nobel per la fisica “for groundbreaking experiments regarding the two-dimensional material graphene”. Il grafene è un singolo strato di atomi di carbonio: è un sistema bidimensionale (Sistema 2D) perfetto. 204 Configurazione dell’atomo di carbonio (6 elettroni): C: 1s2, 2s2, 2p2 Il carbonio ibridizza in diversi stati: sp, sp2, sp3 Dopo l’ibridizzazione è in grado di formare legami con altri elementi o con se stesso con proprietà diverse; quando si presenta come diamante è ibridizzato sp3, quando si presenta come grafite è ibridizzato sp2. L’ibridizzazione determina di fatto orbitali di legame completamente diversi che si manifestano poi in proprietà diverse. Concentriamo sull’ibridizzazione sp2, che è quella che interessa il grafene. Ibridizzazione sp2: 3 orbitali disposti nel piano a 120° 1 orbitale pz perpendicolare. È quella che caratterizza la grafite: gli orbitali sul piano danno origine a legami covalenti i cui atomi sono disposti ai vertici di un esagono e i vari piani della grafite sono in interazione fra di loro attraverso l’orbitale pz perpendicolare ai primi tre. Come si arriva dalla grafite al grafene? Dal carbonio ibridizzato sp2 al grafene Il carbonio in sp2 non si presenta solo come grafite o come grafene: sono stati scoperti nel corso degli anni anche altre forme molto interessanti: ad esempio i fullereni: un singolo foglio di atomi di carbonio è racchiuso a forma di sfera, oppure i nanotubi di carbonio in cui vi è un foglio arrotolato a formare una sorta di tubo. 205 Grafite Come è stato ottenuto il grafene? Con la tecnica dello scotch (tecniche meccaniche: scotch-tape): si sono via via sfogliati degli strati di grafite finché sullo scotch è rimasto un solo foglio della grafite stessa. Si ottengono in questo modo materiali di elevata qualità per ricerche di base… ma ovviamente questo non è un sistema utilizzabile a livello applicativo o di sviluppo industriale. Successivamente alla scoperta del grafene si sono avviati tutta una serie di studi per riuscire a ottenerlo con dei sistemi più convenzionali e più adeguati a un processo applicativo, essenzialmente per deposizione chimica nella fase vapore. 206 Grafene: monolayer, bilayer Per ottenere materiale in quantità adeguate per processi applicativi: tecniche di tipo chimico. Il grafene è: - il materiale più sottile al mondo (uno solo strato atomico) - il più leggero (1 mq ha una massa di 0.0077 gr e è capace di sostenere un peso di 4 kg) - 200 volte più resistente dell’acciaio ma più flessibile della gomma - trasparente - un conduttore elettrico e termico di qualità superiore - una barriera perfetta: neanche l’elio lo può attraversare Tutte queste proprietà (e altre che ancora non sono note) sono legate alle proprietà del legame del carbonio. Gli orbitali sp2 del piano formano dei legami covalenti con gli atomi di carbonio sul piano stesso e ciascuno degli orbitali può ospitare due elettroni con spin opposto. La banda di conduzione e la banda di valenza del grafene sono invece formati dai due orbitali pz Le bande del grafene Bande π (di valenza, completamente piena) e π*(di conduzione, completamente vuota) che si originano dagli orbitali pz del C ibridizzato Le bande σ che si generano dai legami sigma nel piano sono completamente occupate 207 Banda π e π* in un particolare punto dello spazio k (attorno al punto K) sono degeneri, cioè hanno la stessa energia; in corrispondenza del punto di degenerazione hanno una relazione di dispersione lineare! E k F k La costante di proporzionalità è la velocità di Fermi degli elettroni, ovvero la velocità degli elettroni che hanno l’energia di Fermi. Questa proprietà è una proprietà rivoluzionaria rispetto a quella che normalmente presentano gli elettroni nei solidi, quando l’energia e il momento cristallino sono legati tra loro da una relazione di tipo quadratico. Quali altre particelle presentano una relazione lineare tra l’energia e il momento? Sono essenzialmente le particelle a massa nulla. Ma questi non sono fotoni: questi sono elettroni! Quindi, nel grafene, gli elettroni si comportano come fermioni a massa nulla. Questa tipologia di particelle prende il nome di FERMIONI DI DIRAC: fermioni a massa nulla. Questa proprietà ha delle conseguenze notevoli, sia sulle proprietà che manifesta il grafene sia per quel che riguarda le ricerche scientifiche di base (ed è il motivo per cui fisici e scienziati sono così interessati a questo materiale). 208 A: Portatori di carica: Equazione di Schrödinger con massa efficace m* diversa dalla massa elettronica B: Particelle relativistiche nel limite di zero massa a riposo. Equazione di Dirac (c=velocità della luce, σ =Matrici di Pauli) C: Portatori di carica nel grafene: “Massless Dirac Fermions” (vF ha il ruolo di c, σ = 2D-Pseudospin Matrix ) Normalmente, in un solido, abbiamo che la relazione tra energia e momento è di tipo quadratico; nel caso dei fotoni la relazione tra energia e momento è di tipo lineare… ma i fotoni sono particelle relativistiche (la loro velocità è quella della luce). Nel caso del grafene abbiamo una relazione mista: gli elettroni hanno una relazione tra energia e momento di tipo lineare – esattamente come le particelle relativistiche – ma non vanno alla velocità della luce, bensì alla velocità di Fermi: da questa proprietà derivano tutta una serie di caratteristiche sia dal punto di vista applicativo sia da un punto di vista scientifico. Ad esempio comporta eccezionali proprietà di trasporto elettrico, alta mobilità elettronica anche a temperatura ambiente (non osservabile in altri materiali) e questo apre tutta una serie di >Applicazioni in elettronica Dal punto di vista della scienza fondamentale gli elettroni del grafene permettono di studiare >Effetti quantistici relativistici …in laboratorio Cosa possiamo fare con il grafene Materiali resistenti Vernici Celle solari Elettronica Conduttori termici … in realtà la ricerca procede e scopre le sue peculiari e uniche proprietà 209 Nanoscienze e nanotecnologie 9.6. Test Consideriamo i processi di ricombinazione radiativa in nanoparticelle di semiconduttore a gap diretta. Questi processi origineranno fotoni con: a. con energia diversa dall'energia di gap del semiconduttore non soggetto a confinamento quantico, con segno (variazione positiva o negativa) dipendente dalle dimensioni delle nanoparticelle. b. energia minore della energia di gap del semiconduttore non soggetto a confinamento quantico perché il confinamento quantistico diminuisce l’energia sia degli elettroni sia delle lacune. c. con energia corrispondente all’energia di gap del semiconduttore non soggetto a confinamento quantico perché l’energia di gap è una proprietà del materiale non modificabile nella nanostrutturazione. d. con energia diversa dall'energia di gap del semiconduttore non soggetto a confinamento quantico, con segno (variazione positiva o negativa) dipendente dal valore delle masse efficaci degli elettroni e delle lacune del semiconduttore. e. energia maggiore della energia di gap del semiconduttore non soggetto a confinamento quantico perché il confinamento quantistico aumenta l’energia sia degli elettroni sia delle lacune. [La risposta corretta è la e.] Utilizzando l’ingegneria di banda per creare una sequenza di materiali BAB in cui sia gli elettroni sia le lacune siano liberi di muoversi solamente nel piano del materiale A e siano 210 quindi confinati nella direzione perpendicolare è necessario che (Nota: si chiede di determinare una condizione necessaria non sufficiente): a. la costante reticolare del materiale A deve essere maggiore di quella del materiale B. b. il materiale A abbia energia di gap maggiore di quella del materiale B. c. la massa efficace degli elettroni e delle lacune nel materiale A deve essere maggiore dei corrispettivi valori nel materiale B. d. il materiale A abbia energia di gap minore di quella del materiale B. e. i due materiali devono avere la stessa energia di gap. [La risposta corretta è la d.] Nella microscopia a forza atomica le forze di interazione fra gli atomi della punta e gli atomi sulla superficie del campione generano un segnale che viene utilizzato per determinare la topografia. Quale tipo di segnale? a. Le forze repulsive di interazione producono una deformazione della punta che viene ricondotta alla topografia attraverso il segno della variazione della corrente che scorre fra la punta e la superficie. b. Le forze di interazione producono una deflessione del cantilever che sostiene la punta, rivelata dallo spostamento di un fascio di luce riflesso. c. Le forze attrattive di interazione producono una deformazione della punta che viene ricondotta alla topografia attraverso il segno della variazione della corrente che scorre fra la punta e la superficie. d. Le forze attrattive di interazione fra la punta e il campione generano una corrente proporzionale alla distanza fra la punta e la superficie del campione. e. Le forze repulsive di interazione allontanano la punta dalla superficie annullando la corrente che scorre fra la punta e la superficie. [La risposta corretta è la b.] Si consideri una eterostruttura fra due semiconduttori di diversa natura A e B (diversa energia di gap, diverso parametro reticolare, ma stessa simmetria cristallina). Quali delle seguenti affermazioni è corretta? a. È sempre possibile depositare il materiale B sul materiale A senza difetti indipendentemente dallo spessore del materiale B. b. È possibile solamente la deposizione del materiale B deformato tensilmente affinché si adegui al parametro reticolare del substrato. c. La deposizione del materiale B sul materiale A provoca una deformazione del substrato A che adegua il suo parametro reticolare a quello dell’epistrato B. d. Il materiale B può depositarsi sul materiale A privo di difetti per spessori inferiori ad uno spessore critico di rilassamento se si deforma tensilmente o compressivamente (a seconda della grandezza relativa dei parametri reticolari) per adattarsi al substrato. e. È possibile solamente la deposizione del materiale B deformato compressivamente affinché si adegui al parametro reticolare del substrato. [La risposta corretta è la d.] Nella microscopia a forza atomica è possibile osservare la topografia fino alla risoluzione atomica di una superficie grazie a: a. esclusivamente la regione repulsiva delle forze di interazione del tipo di Van der Waals fra la punta e la superficie isolante del campione. b. le forze elettriche presenti fra la punta metallica e la superficie metallica o semiconduttrice del campione. c. esclusivamente la regione attrattiva delle forze di interazione del tipo di Van der Waals fra la punta e la superficie del campione. d. le forze di attrito fra la punta e la superficie metallica del campione. 211 e. le forze di interazione del tipo di Van der Waals fra la punta e la superficie del campione sia essa metallica o isolante. [La risposta corretta è la e.] Gli elettroni nel grafene sono fermioni di Dirac, cioè fermioni senza massa. Da quale proprietà delle bande di energia del grafene discende questa proprietà: a. b. c. d. e. dispersione lineare delle bande di energia intorno al punto K. velocità degli elettroni pari alla velocità di Fermi come in un metallo. dispersione quadratica delle bande di energia intorno al punto K. velocita degli elettroni nel grafene pari alla velocità della luce c. mancanza di dispersione nella struttura a bande del grafene. [La risposta corretta è la a.] 212