Ing. Giovanni Secondulfo Università di Salerno Corso di Fondamenti di Informatica Le Memorie a Semiconduttore Le Memorie a Semiconduttore Corso di Laurea Ingegneria Corso B A.A. 2010-2011 1 Ing. Giovanni Secondulfo Università di Salerno Corso di Fondamenti di Informatica Le Memorie a Semiconduttore Indice Introduzione Classificazione delle memorie Struttura base di una memoria Tecnologia delle Memorie Corso di Laurea Ingegneria Corso B A.A. 2010-2011 2 Ing. Giovanni Secondulfo Università di Salerno Corso di Fondamenti di Informatica Le Memorie a Semiconduttore Introduzione Negli ultimi cinquant anni la microelettronica, o elettronica dei semiconduttori, è stata caratterizzata da enormi innovazioni in termini di prodotto e di tecnologia di processo. La continua ricerca in termini di nuove soluzioni tecnologiche e di processi produttivi più efficienti ha portato all introduzione di nuovi dispositivi elettronici in grado di poter essere utilizzati in un sempre maggior numero di applicazioni. Inoltre la nascita di tecnologie in grado di poter essere utilizzate in molteplici settori ha determinato un aumento sia del numero dei potenziali fruitori che del numero di aziende interessate allo sviluppo di tali tecnologie. Negli ultimi anni la ricerca si è indirizzata verso dispositivi sempre più miniaturizzati e più veloci, oltre che in grado di ridurre il consumo di energia; tutto ciò ha permesso la realizzazione di circuiti integrati (IC) con un numero crescente di transistor per unità d area ed in grado di realizzare funzioni via via sempre più complesse. L aumento delle prestazioni assolute dei dispositivi realizzati (dimensioni, velocità, consumi) è stata così regolare negli anni che già nel 1975 Gordon E. Moore propose la sua omonima legge , dopo aver osservato che il numero di transistor per circuito integrato era aumentato, dalla data della loro invenzione, di un fattore due ogni anno su un arco temporale di 16 anni. L iniziale analisi di Moore aveva indicato, quali fattori concorrenti allo sviluppo esponenziale della complessità1, l aumento dell area del chip, la riduzione delle dimensioni delle strutture elementari che componevano i circuiti integrati, il miglioramento della capacità di progettare i dispositivi (fossero essi transistori bipolari o di tipo MOS) e la realizzazione di circuiti più efficienti. Moore stesso riconosceva che alcuni di questi fattori avrebbero avuto negli anni seguenti un impatto limitato e quindi l evoluzione ulteriore sarebbe dipesa essenzialmente dal solo ridursi delle dimensioni critiche, rallentando, di conseguenza, il suo ritmo. L analisi è stata sostanzialmente confermata dagli sviluppi successivi: l area del chip è aumentata di un fattore quattro dal 1965 al 1975, grazie a un generale miglioramento della qualità dei materiali, ma è poi stata limitata dalla necessità di garantire un costo accettabile dei prodotti (il costo per unità d area dei circuiti integrati, espresso in dollari/cm2, è rimasto sostanzialmente stabile nel tempo); la dimensione lineare minima definita sulle strutture MOS si è ridotta di un fattore tre ogni dieci anni ed ha fornito il contributo principale; il miglioramento nella capacità di progettare dispositivi complessi si è concentrato essenzialmente sul tempo di progettazione, con l introduzione di tecniche automatizzate (librerie di funzioni logiche, sintesi logica), a scapito della densità dei circuiti; . nel caso delle memorie, tecniche di auto-allineamento e di sviluppo tridimensionale dei dispositivi hanno permesso di ridurre ulteriormente l ingombro. Tabella 1: La legge di Moore. Di conseguenza comprendere le cause di uno sviluppo quasi esponenziale non è difficile. Classificazione delle memorie Le memorie a semiconduttore sono dispositivi elettronici costituiti da un insieme di celle elementari, ciascuna delle quali è in grado di immagazzinare un informazione binaria. Questo 1 La complessità è rappresentata dal numero di componenti necessari alla realizzazione di una funzione all interno di un circuito integrato Corso di Laurea Ingegneria Corso B A.A. 2010-2011 3 Ing. Giovanni Secondulfo Università di Salerno Corso di Fondamenti di Informatica Le Memorie a Semiconduttore insieme di celle elementari è dotato di apposite linee di comunicazione che permettono di accedere al singolo dato. Le memorie possono essere classificate sotto diversi punti di vista. Ad esempio esse possono venire identificate a livello di sistema a seconda del tipo di accesso che consentono. Si parla allora di memorie ad accesso sequenziale o di memorie ad accesso diretto (dette spesso in modo improprio ad accesso casuale). Nel primo caso i dati vengono accodati l uno rispetto all altro in fase di scrittura, mentre in fase di lettura l organizzazione della memoria è tale che il primo dato leggibile sia quello che è stato scritto per primo (in questo caso si parla di memorie first in first out o FIFO). Oppure può avvenire che il primo dato leggibile sia l ultimo scritto e in tal caso si parla di organizzazione a pila (o a stack). Vi possono essere poi ancora altre organizzazioni, ma, comunque sia, nelle memorie ad accesso sequenziale per recuperare un dato e necessario scorrere tutti i dati che in fase di lettura precedono quello voluto. Molto spesso tuttavia risulta necessario poter accedere direttamente ad un particolare dato; tale operazione è appunto possibile nelle memorie ad accesso diretto, nelle quali attraverso un indirizzo si può direttamente individuare l informazione desiderata. Nelle memorie ad accesso sequenziale l indirizzo non è necessario, o meglio è implicito. E opportuno tuttavia notare che esistono metodi di accesso più complessi di quelli citati. Ad esempio esistono le memorie ad accesso multiplo (il più delle volte doppio), in cui esistono più canali di accesso in modo da renderle disponibili a più processi contemporaneamente, rendendo la memoria una risorsa condivisa. Rimanendo nell ambito delle memorie ad accesso casuale una prima grande suddivisione è quella che divide le memorie in quelle di lettura e scrittura (RAM random access memory) e in quelle a prevalente lettura (ROM read only memory). Nelle prime un dato può essere scritto e letto in qualsiasi cella, con un tempo di accesso che è praticamente lo stesso sia che l operazione sia di scrittura che quando l operazione è di lettura. Nelle seconde l operazione normale è solo quella di lettura poiché quella di scrittura o non è permessa o richiede un tempo molto più lungo che non quella di lettura. Un vantaggio delle ROM tuttavia risiede nel fatto che l informazione si conserva anche quando l alimentazione viene a mancare, a differenza delle RAM in cui l informazione viene persa. Per tale motivo le ROM vengono anche chiamate memorie non volatili. Per la verità esistono anche RAM non volatili, ottenute con opportuni espedienti; ad esempio le ZRAM (zero power RAM) utilizzano batterie tampone per mantenere alimentati i dispositivi anche in fase di assenza dell alimentazione primaria, o ancora le informazioni vengono duplicate su una memoria non volatile in modo da poterle ripristinare quando necessario oppure si sfruttano opportuni fenomeni quali l isteresi ferroelettrica per ottenere una memorizzazione permanente. In ogni caso una suddivisione di massima delle memorie ad accesso diretto è riportata in Tabella 2, nella quale, a titolo orientativo è riportata anche la tecnologia con cui ciascun tipo di memoria viene realizzato. Tabella 2: Classificazione delle Memorie E opportuno tuttavia accennare ad alcune delle caratteristiche più importanti dei vari tipi di ROM. ROM a maschera. Sono memorie a sola lettura nelle quali i dati vengono immagazzinati mediante un opportuno processo di mascheratura durante la fabbricazione. L utente all atto dell ordinazione Corso di Laurea Ingegneria Corso B A.A. 2010-2011 4 Ing. Giovanni Secondulfo Università di Salerno Corso di Fondamenti di Informatica Le Memorie a Semiconduttore deve specificare con un opportuna codifica tutta l informazione che deve venir scritta nella memoria. La struttura fisica del componente e particolarmente semplice e l organizzazione di tale tipo di memoria è sempre a matrice. In commercio si possono trovare ROM a maschera con diversi gradi di parallelismo, di cui i più comuni sono comunque 4 e 8. PROM o ROM programmabili. Sono anch esse memorie a sola lettura in cui tuttavia i dati vengono inseriti dall utente finale. La scrittura di un dato avviene o per fusione di opportuni collegamenti o con la perforazione di una giunzione. Il dato, una volta scritto, non può essere un alcun modo cancellato. Vantaggio sostanziale rispetto alle ROM a maschera è l eliminazione dei tempi di attesa tra ordinazione e consegna della ROM, malgrado che il loro costo unitario sia superiore. E tuttavia necessario tenere presente che la produzione di ROM a maschera non è economicamente conveniente per quantitativi inferiori al migliaio di pezzi. EPROM. Sono memorie a prevalente lettura, utilizzate quando siano necessarie memorie non volatili, ma in cui i dati memorizzati possano venire di volta in volta modificati. In questo casi i dati, scritti con mezzi elettrici, possono venire cancellati, rendendo la memoria nuovamente disponibile, con l esposizione del chip a radiazione ultravioletta attraverso un apposita finestra in vetro di quarzo. EEPROM. Sono memorie molto simili alle EPROM, ma la cancellazione di un dato viene effettuata elettricamente, permettendo di mantenere il dispositivo nel sistema in cui è installato. Le operazioni di scrittura tuttavia sono normalmente molto più lente che non quelle di lettura. Dal punto di vista dell impiego e delle terminazione EPROM e EEPROM sono del tutto analoghe alle ROM e alle PROM. Per alcuni modelli addirittura esiste con queste ultime una completa compatibilita sia elettrica che meccanica (compatibilità pin to pin). Struttura base di una memoria Una memoria e essenzialmente costituita delle seguenti parti: una matrice di celle; un decodificatore di indirizzo un circuito di controllo di ingresso e di uscita. In memorie di piccole dimensioni, ad esempio in memorie da 16 celle, il circuito di indirizzamento può essere realizzato con un semplice selettore (linear select), come illustrato in Figura 1. Figura 1 E opportuno notare in questa struttura circuitale la complessità dovuta alla presenza dei 2n collegamenti elettrici necessari all abilitazione delle singole celle. Tale complessità inoltre aumenta esponenzialmente al crescere del numero n di bit di indirizzo. Corso di Laurea Ingegneria Corso B A.A. 2010-2011 5 Ing. Giovanni Secondulfo Università di Salerno Corso di Fondamenti di Informatica Le Memorie a Semiconduttore Una valida alternativa è l indirizzamento a matrice illustrato in Figura 2 (coincident select). Figura 2 Si ottiene in tal modo una notevole semplificazione della rete dei collegamenti. Si può ritenere pertanto che, tranne per memorie di minime dimensioni, la struttura di base sia quella di Figura 3. Figura 3 Il decodificatore di riga seleziona un intera riga di celle. I dati immagazzinati nelle celle connesse con la riga selezionata sono trasferiti al circuito di controllo di ingresso e uscita. A questo punto il dato che interessa viene trasferito all uscita selezionandolo con il decodificatore di colonna. Ogni dispositivo di memoria possiede almeno i seguenti segnali: Indirizzo (address) composto dai segnali da applicare ai decodificatori. All utente non è normalmente possibile distinguere tra i bit di selezione di riga e di colonna. L indirizzo deve pertanto essere considerato come un tutto unico. Lettura/scrittura (read/write). E presente ovviamente solo quando necessario e permette di scegliere tra un operazione di scrittura o una di lettura in o da una determinata cella. Selezione di chip (chip select) che permette o no di abilitare la memoria in questione. Tale segnale si rende indispensabile quando si vogliano realizzare memorie di grandi dimensioni, superiori a quelle del singolo chip, oppure quando memorie accedono assieme ad altri dispositivi allo stesso bus per il trasferimento dei dati. Segnali di ingresso e di uscita (I/O). In certe realizzazioni le linee su cui viaggiano tali segnali possono coincidere. Alimentazione (supply). Alcune realizzazioni, quali EPROM e EEPROM possono richiedere più di una tensione di alimentazione, tuttavia nella maggior parte dei casi è sufficiente un unica tensione. La combinazione di tutti questi segnali organizza il dispositivo di memoria. Piu matrici del tipo descritto possono poi essere utilizzate per accedere ad informazioni di lunghezza superiore al bit. Si avranno ovviamente tante linee di I/O quanti sono i bit di informazione cui si vuol accedere Corso di Laurea Ingegneria Corso B A.A. 2010-2011 6 Ing. Giovanni Secondulfo Università di Salerno Corso di Fondamenti di Informatica Le Memorie a Semiconduttore contemporaneamente. Si parla in tal caso di parallelismo della memoria, intendendo con tale termine il numero di bit per parola, dove parola e l insieme di bit cui si accede contemporaneamente con un unico indirizzo. Nelle memorie standard il grado di parallelismo e di solito una potenza di 2. Tecnologia delle Memorie Prima di descrivere i principi di funzionamento di una memoria RAM è opportuno accennare alle regole ispiratrici fondamentali nel progetto di una cella di memoria. 1) Una cella di memoria deve occupare sul chip la minima superficie possibile. 2) I processi di fabbricazione per la sua realizzazione devono essere i più semplici possibile. 3) Le operazioni di lettura e scrittura devono essere le più rapide possibile. 4) La potenza dissipata va minimizzata I primi due punti sono di carattere prevalentemente economico, mentre gli ultimi due riguardano le prestazioni del dispositivo. L elemento base su cui si è fondata la rivoluzione della microelettronica e che costituisce la maggior parte dei circuiti integrati, è il transistor MOSFET (MOSFET: Metal Oxide Semiconductor Field Effect Transistor) il quale si basa sulla tecnologia MOS. I principali fattori che hanno permesso alla tecnologia MOS di avere un enorme successo sono: la semplicità della struttura; la scalabilità intrinseca del transistor, che ha reso possibile l aumento della complessità senza richiedere innovazioni significative della struttura base del dispositivo; la possibilità, grazie all architettura CMOS (CMOS: Complementary MOS), di realizzare circuiti integrati che dissipano solo durante il funzionamento e non in quiescenza, con evidenti risparmi di energia. In termini elementari, la scalabilità consiste nel fatto che, se un transistor di certe dimensioni funziona, è possibile costruirne uno di dimensioni ridotte e funzionante allo stesso modo scalando opportunamente le sue dimensioni fisiche. Lo scaling dei dispositivi è motivato dal presupposto che un transistore più piccolo è in grado di offrire prestazioni migliori rispetto ad uno più grande in termini di velocità, consumo, affidabilità e spazio occupato, nonché del costo del circuito elettronico che si andrà a costruire. Essendo il MOSFET la struttura base dell elettronica digitale è opportuno descriverne a grandi linee il funzionamento. Come illustrato in Fig. 4, il transistor MOSFET (nel caso specifico un nMOSFET) è composto da quattro elettrodi; due, il source ed il drain sono realizzati attraverso due tasche fortemente drogate di tipo n2, ricavate tramite diffusione o impiantazione ionica, su un substrato di silicio monocristallino drogato di tipo p. Le zone di source e drain sono in contatto ohmico con le relative metallizzazioni, per cui è possibile stabilire una differenza di potenziale tra queste ultime e il substrato (detto anche body o bulk). 2 Il drogaggio (iniezione di impurità con caratteristiche elettriche opportune) permette di alterare le proprietà elettriche dei materiali semiconduttori. Un semiconduttore si definisce di tipo n quando il drogaggio fornisce caratteristiche conduttive dovute alla presenza di cariche negative (elettroni) libere; di tipo p quando il drogaggio fornisce caratteristiche conduttive equivalenti alla presenza di cariche positive (chiamate lacune) libere; n+ (p+) rappresentano semiconduttori di tipo n (p) molto drogati percui le loro caratteristiche elettriche si avvicinano a quelle dei metalli. Corso di Laurea Ingegneria Corso B A.A. 2010-2011 7 Ing. Giovanni Secondulfo Università di Salerno Corso di Fondamenti di Informatica Le Memorie a Semiconduttore Figura 4: Sezione verticale di un transistor MOS a canale n Il terzo elettrodo, il gate, ricopre il substrato di tipo p, da cui è separato tramite un sottile strato isolante (tipicamente ossido di silicio), ed è costruito in modo da sovrastare la zona di substrato che separa il source dal drain (detta zona di canale). Il gate può essere di metallo (ad es. alluminio) oppure, come nella maggior parte dei casi, di silicio policristallino molto drogato (detto poly). Variando la tensione del gate (VG) è possibile richiamare portatori minoritari all interfaccia ossidosemiconduttore e quindi creare un canale conduttivo tra source e drain che altrimenti risulterebbero isolati tra di loro. Variando VG è possibile modulare la conducibilità del suddetto canale. Se il substrato è di tipo p i portatori minoritari sono gli elettroni e si crea dunque un canale di tipo n, da cui la denominazione nMOSFET. Alzando dunque la tensione di gate al di sopra di un valore limite detto tensione di soglia gli elettroni vengono attirati alla superficie formando il canale tra source e drain, tra i quali può quindi fluire una corrente elettrica in presenza di una tensione tra i due elettrodi. La struttura caratteristica di un MOSFET è rappresentata in Fig. 4: LG è la lunghezza di gate, Leff è la lunghezza effettiva del canale, tox è lo spessore dell ossido di gate, xj è la profondità di giunzione e Ws e Wd sono gli spessori delle zone svuotate (zone prive di portatori liberi), rispettivamente di source e di drain. Se da un lato la progettazione di transistor sempre più piccoli porta a innegabili vantaggi in termini di densità di integrazione, velocità e bassi consumi, dall altro enfatizza problematiche connesse alla realizzazione pratica; infatti le lunghezze d onda dei raggi ultravioletti impiegati nei processi litografici utilizzati nella definizione della struttura MOSFET diventano confrontabili con le dimensioni caratteristiche del transistor e generano problemi nella definizione stessa. Inoltre la riduzione delle dimensioni influisce anche sull affidabilità del dispositivo, in quanto l impossibilità di ridurre le tensioni d esercizio di un fattore uguale alla riduzione delle dimensioni geometriche (come vorrebbe la teoria dello scaling a campo costante) portano all aumento dei campi elettrici e all insorgere di un insieme di problemi che prendono il nome di effetti di canale corto (SCE: Short Channel Effects); tra questi possiamo citare il punch-through (Le zone svuotate di drain e di source si avvicinano sino a toccarsi) ed il DIBL3. Tali effetti vengono ridotti aumentando il drogaggio del substrato (si riducono gli spessori delle zone svuotate) e diminuendo lo spessore dell ossido tox e le profondità di giunzione xj . L aumento dei drogaggi però induce un aumento dei campi elettrici all interno della struttura, che risultano problematici dal punto di vista dell affidabilità del dispositivo a causa di quelli che vengono chiamati effetti di portatori caldi (HCE: Hot Carrier Effects). I due principali effetti del riscaldamento dei portatori (elettroni e lacune acquistano molta energia) sono l intrappolamento di 3 DIBL: Drain Induced Barrier Lowering. Un incremento della tensione di drain determina una riduzione della barriera di potenziale source-canale, provocando un incremento della corrente di drain; l effetto può essere modellato come una riduzione della tensione di soglia Vth causato dall aumento della tensione di drain Vds. Corso di Laurea Ingegneria Corso B A.A. 2010-2011 8 Ing. Giovanni Secondulfo Università di Salerno Corso di Fondamenti di Informatica Le Memorie a Semiconduttore carica nell ossido, con un conseguente aumento della tensione di soglia e una diminuzione della trasconduttanza dovuta alla saturazione della velocità dei portatori di carica e danneggiamento dell interfaccia tra ossido e silicio. L aumento del campo elettrico può essere contrastato riducendo il gradiente di concentrazione di drogante nel passaggio da drain a canale (LDD: Lightly doped drain). Una categoria di dispositivi la cui evoluzione è stata fondamentale per tutte le applicazioni portatili (cellulari, PC portatili, etc.) sono le memorie non volatili (NVM: Not Volatile Memory), elementi capaci di mantenere un dato memorizzato per molto tempo anche in assenza di alimentazione del componente. Inoltre le performance raggiunte, negli ultimi anni, in termini di densità, velocità, affidabilità e costi, hanno permesso alle NVM di occupare nuovi segmenti di mercato e di poter competere nel settore dei supporti magnetici ove è richiesto un basso consumo ed una elevata robustezza meccanica. Figura 5: Memorie a semiconduttore - tecnologia CMOS Un primo gruppo di memorie non volatili (Fig. 5) è costituito dalle EPROM (Electrically Programmable Read Only Memory) in cui la cancellazione avviene tramite irraggiamento UV dell intero chip montato in un package dotato di una finestrella di quarzo ed il meccanismo di programmazione invece risulta essere selettivo. I costi e, soprattutto, la mancanza di flessibilità rendono obsoleto questo tipo di memoria. Nelle EEPROM (Erasable Electrically Programmable Read Only Memory), invece è possibile scrivere e cancellare in modo selettivo una singola cella (o un byte di celle). Purtroppo l utilizzo di due transistor per cella (selezione e memorizzazione), con conseguente calo di densità, relegano le EEPROM ad essere usate solo per specifici utilizzi. Figura 6: Sezione verticale di una cella di memoria FLASH a gate flottante Corso di Laurea Ingegneria Corso B A.A. 2010-2011 9 Ing. Giovanni Secondulfo Università di Salerno Corso di Fondamenti di Informatica Le Memorie a Semiconduttore La tipologia di NVM che in assoluto rappresenta il miglior compromesso in termini di prestazioni è quella delle memorie FLASH. caratteristiche quali le ridotte dimensioni della cella, la semplicità della struttura, l alimentazione singola, la programmazione a singolo bit e la cancellazione veloce a blocchi, permettono di creare settori di memoria ad alta densità, particolarmente adatti ad essere integrati in sistemi logici (es. NVM embedded4). Le applicazioni delle memorie FLASH sono principalmente due: 1. l integrazione in sistemi logici, principalmente microprocessori. Possibili utilizzi: software aggiornabili (es. firmware), memorizzazione di codici d identificazione (SN, PIN, etc.), smart card, riconfigurazioni del sistema on the fly. 2. la creazione di memorie di massa di stato solido (ad es. banchi di memoria, o dispositivi stand alone quali hard disk allo stato solido). Vantaggi: portabilità, piccole dimensioni, consumo ridotto, nessun componente mobile e quindi maggiore robustezza. Le FLASH combinano la capacità di ritenzione delle ROM con il tempo d accesso delle DRAM, permettendo così l esecuzione diretta di microcodici. Interessanti applicazioni si trovano nella gestione dei personal computer o nella telefonia dove i programmi possono essere memorizzati in flash chip, e quindi eseguiti direttamente, senza la necessità di dover essere continuamente caricati/scaricati. Le memorie FLASH standard attualmente in commercio sono quelle a gate flottante con architettura NOR (Fig. 6). Esse sono costituite da un transistor MOSFET in cui sono presenti due metallizzazioni di gate, una superiore contattata ed una isolata posta tra la prima e l ossido che sovrasta il canale; questa seconda metallizzazione, che prende il nome di floating gate, è separata dalla prima attraverso un altro strato di ossido isolante e può schermare gli effetti sul canale della prima metallizzazione, chiamata control gate. La capacità di mantenere un dato è dovuto al fatto che, se nel floating gate viene introdotta della carica, essa vi rimane facendo traslare la soglia del transistor visibile dal control gate (Fig. 7). Figura 7: Tensione di soglia in una cella Flash programmata ed in una cancella. Applicando al gate la tensione di lettura (Vread), il valore della corrente di drain discrimina tra stato 1 e stato 0 . Esistono diverse soluzioni per trasferire la carica nel e dal floating gate; il problema è fare in modo che la carica passi attraverso la barriera di energia creata dallo strato di materiale isolante, evitando di danneggiare o alterare la struttura del reticolo dell ossido. Allo stato dell arte le memorie FLASH di uso più comune sono: cancellate per effetto tunnel (FN5); programmate per CHE (Channel Hot Electron). 4 Con NVM embedded ci si riferisce ad un circuito integrato che contiene un microcontrollore o un microprocessore e una memoria non volatile di tipo FLASH, EPROM, o EEPROM 5 FN: Fowler-Nordheim. Indica il passaggio, mediante fenomeni quantistici di tunneling, di cariche elettriche attraverso una barriera di potenziale (generalmente creata dall ossido). Corso di Laurea Ingegneria Corso B A.A. 2010-2011 10 Ing. Giovanni Secondulfo Università di Salerno Corso di Fondamenti di Informatica Le Memorie a Semiconduttore Il CHE è un meccanismo di iniezione di elettroni verso il gate, che utilizza il riscaldamento dei portatori di canale. Applicando una differenza di potenziale tra drain e source gli elettroni vengono accelerati (scaldati) dal campo longitudinale in tal modo viene loro fornita un energia sufficiente al superamento della barriera tra substrato ed ossido (3,15 eV); il campo verticale contribuisce ad iniettare la carica nel floating gate attraverso il sottile strato di ossido. La scalabilità, a tensioni di alimentazione di 3,3 V o inferiori, è resa difficile dal drammatico calo di efficienza di iniezione, che si verifica quando la tensione applicata al drain scende al di sotto di quella corrispondente all energia di barriera tra silicio ed ossido. Nelle FLASH moderne, aventi tecnologie aggiornate, l efficienza (definita come rapporto tra la corrente utile per la programmazione e la corrente massima nel dispositivo) raggiunge, per una tipica cella di tecnologia 0,3 m polarizzata con VDS = 4,5 V , solo valori prossimi a = (1 - 4) * 10-5. La necessità di avere tensioni elevate al drain porta a dover realizzare opportune circuiti a pompa di carica in grado di fornire tensioni maggiori di quelle dell alimentazione. Queste tecniche circuitali, oltre allo svantaggio in termini di area occupata, pongono un limite massimo alla corrente che può essere assorbita dal drain. Se ne deduce che bassi valori di corrente di drain (ID) ed alti valori d efficienza d iniezione6 sono importanti figure di merito per la cella di memoria. Recentemente, per aumentare l efficienza d iniezione è stato proposto l utilizzo di un meccanismo d iniezione detto CHISEL (CHannel Initiated Substrate Electron) che viene attivato dall applicazione di una tensione di substrato durante l operazione di scrittura. Nel CHISEL l iniezione di elettroni caldi attraverso l interfaccia ossido-silicio è dovuta a portatori terziari. Il campo elettrico laterale lungo il canale accelera gli elettroni, i quali, una volta acquisita un energia maggiore di 1,6 eV, possono generare per ionizzazione da impatto (II: Impact Ionization) coppie elettrone-lacuna. Le lacune prodotte vengono attirate verso il bulk ed acquistano, grazie al campo verticale generato dalla tensione di bulk, sufficiente energia per poter generare un ulteriore coppia elettrone-lacuna (IIF: Impact Ionization Feedback). Questi elettroni generati in profondità nel bulk, detti anche elettroni terziari, vengono accelerati dal campo elettrico verticale verso l interfaccia e possono essere in grado di superare la barriera energetica tra ossido e silicio. L iniezione di elettroni terziari, se incentivata dall applicazione di una tensione negativa al substrato, può arrivare a dominare completamente il processo di iniezione. Dunque nel CHISEL il processo di iniezione è il frutto di tre processi distinti in cascata: 1) la generazione delle lacune secondarie per II da parte degli elettroni di canale. 2) la generazione degli elettroni terziari (IIF) in profondità nel substrato della cella da parte delle lacune in moto verso il substrato. 3) il riscaldamento degli elettroni terziari in moto verso l interfaccia e loro iniezione nel gate attraverso l ossido di tunnel. Ognuno di questi processi ha un efficienza che influisce sull efficienza totale del meccanismo di CHISEL. In passato sono state proposte diverse soluzioni alternative di celle in cui, per aumentare l efficienza, si utilizza l iniezione di elettroni caldi da substrato. Queste tecniche si basano sull integrazione di opportuni iniettori di elettroni nel substrato e sulla raccolta di tali portatori all interno della regione svuotata sotto il gate della cella. Questi iniettori possono essere realizzati o tramite diffusioni sepolte o tramite transistori bipolari laterali. Tuttavia queste soluzioni presentano uno o più dei seguenti svantaggi: la regione svuotata sotto il gate raccoglie in modo poco efficiente i portatori iniettati, in quanto molti di essi vengono raccolti direttamente dalle regioni di source e di drain; l efficienza cala con lo scaling del transistore, in quanto l area del source e del drain diventa una frazione percentualmente più rilevante dell area totale del dispositivo; il processo d iniezione è poco o punto selettivo. 6 Per una FLASH a gate flottante con architettura NOR, l efficienza d iniezione tramite CHE è definita come Corso di Laurea Ingegneria Corso B A.A. 2010-2011 = [IG/ID] 11 Ing. Giovanni Secondulfo Università di Salerno Corso di Fondamenti di Informatica Le Memorie a Semiconduttore Un nuovo tipo di cella NVM con architettura NOR avente alta efficienza d iniezione è la BipFlash (Bipolar Flash). L idea di base è quella di implementare un meccanismo che, diminuendo da tre a due i processi elementari necessari per l iniezione di elettroni, consenta di ottenere, a parità di tecnologia e tensioni acceleranti, un efficienza d iniezione molto superiore a quella del CHISEL, mantenendo al tempo stesso la selettività dell operazione di scrittura. Figura 8: Sezione verticale della cella di memoria BipFlash Come illustrato in Fig. 8, alla classica cella FLASH sono state aggiunte due diffusioni che hanno permesso di ricavare un transistore bipolare PNP all interno della struttura: una diffusione di tipo n (base) è posta in contatto lateralmente alla la regione di drain, ed un altra, molto sottile e di tipo p+ (emettitore), è ricavata all interno della stessa regione. L operazione di scrittura della BipFlash avviene polarizzando la giunzione p+/n in diretta. Le lacune provenienti dall emettitore, dopo aver evitato la ricombinazione in base, vengono accelerate verso il collettore e generano per II elettroni secondari nella regione di carica spaziale associata alla giunzione tra regione n e substrato. Gli elettroni secondari vengono a loro volta accelerati verso l interfaccia e alcuni di essi possono arrivare al gate con un meccanismo di iniezione simile al CHISEL. Nella cella BipFlash l inefficiente generazione di lacune da parte degli elettroni di canale (II) viene quindi sostituita quindi da un iniezione diretta delle lacune nella regione d interesse. In questo modo non vi è più la necessità di una corrente di canale durante l operazione di programmazione, essendo sufficiente mantenere il source e il drain allo stesso potenziale. Con una tensione di floating gate maggiore di quella della base si otterrà un elevato valore d iniezione di elettroni secondari. Non si entrerà nel merito di tale tecnologia ma si può dire che l efficienza della cella si stima essere due ordini di grandezza superiore a quella ottenibile dall iniezione CHISEL. Il vantaggio in termini di efficienza in scrittura può essere utilizzato per ottenere basse tensioni di alimentazione, bassi consumi o minori tempi di programmazione. Corso di Laurea Ingegneria Corso B A.A. 2010-2011 12