Il CERN, l`organizzazione europea per la ricerca nucleare

Case study tecnico
Il CERN, l'organizzazione europea
per la ricerca nucleare
Scopriamo in che modo i fisici del CERN hanno svelato i
segreti dell’universo facendo leva sui database Oracle e lo
storage NetApp.
Seguire i dati fino alla scoperta e alla conoscenza
I fisici del CERN hanno lavorato duramente per ampliare la comprensione
generale del mondo, superando i limiti della conoscenza al fine di scandagliare
l’universo in cerca di segreti. Spinta dalla curiosità e dalla ricerca della
conoscenza pura, la community scientifica del CERN si occupa di ricerche di
base e indirizzate dai dati, in cerca di prove e scoperte sul funzionamento
dell'universo.
Ciò non esclude che la ricerca del CERN offra applicazioni pratiche e spesso
rivoluzionarie nella vita quotidiana. Nel 1989, ad esempio, Tim Berners-Lee, uno
scienziato del CERN, ha inventato il World Wide Web, sistema concepito e
sviluppato per soddisfare le esigenze di condivisione automatica delle
informazioni nella community della fisica ad alta energia a livello globale. Il
CERN è stato anche un'incubatrice per lo sviluppo dei touch screen capacitivi,
inventati nel 1973 da Bent Stumpe e dal suo team per l'utilizzo nella stanza di
controllo dell'acceleratore SPS del CERN. Queste innovazioni, che è possibile
considerare come derivate dalla ricerca applicata, hanno trasformato le
comunicazioni moderne.
Il lavoro al CERN
Oltre a cercare risposte alle domande sull'universo, la community del CERN
lavora allo scopo di:
• Favorire la collaborazione globale, avvicinando le nazioni grazie alla scienza.
• Istruire, offrendo formazione avanzata ai dipendenti e diffondendo la
passione per la fisica nella prossima generazione di scienziati.
• Sviluppare le frontiere della tecnologia, collaborando con il settore industriale
per lo sviluppo di nuove tecnologie.
Le aziende fondate su NetApp
vanno più lontano, più velocemente
Ricerca dei componenti di base dell'universo
Il CERN dispone di strutture fra le più tecnologicamente avanzate al mondo
per la ricerca dei componenti di base dell'universo. Si tratta di acceleratori di
particelle e macchinari specializzati per dimostrare l'esistenza della forma di
materia più sfuggente. Nelle strutture del CERN, la ricerca può essere
suddivisa in tre principali aree di studio:
• Origine della massa. Gli studi in questo campo comprendono le ricerche
della particella di Higgs, un'ipotetica particella elementare prevista dal
Modello Standard (MS) della fisica delle particelle. La particella di Higgs
appartiene alla classe dei bosoni, che sono considerati la chiave per la
spiegazione dell'esistenza di una massa delle particelle.
• Materia oscura. Le galassie si comportano come se possedessero una
massa superiore rispetto a quella osservabile. Secondo le teorie del Modello
Standard, ciascuna particella è accompagnata da un'altra. Queste particelle,
denominate particelle supersimmetriche, potrebbero essere costituite da
materia oscura invisibile.
• Il Big Bang. Che cosa è successo subito dopo la nascita dell'universo? In
base alla teoria secondo la quale l'universo sarebbe costituito in origine da
una mistura densa e calda di quark e gluoni (denominata "plasma di quark e
gluoni"), gli scienziati stanno cercando di ricreare condizioni analoghe per
analizzare le proprietà di tale mistura.
Informazioni sul Large Hadron Collider
Il complesso del CERN ospita una serie di acceleratori di particelle, ciascuno
in grado di raggiungere energie progressivamente superiori. L'ultimo arrivato
nel complesso è il Large Hadron Collider (LHC), l'acceleratore di particelle più
grande e potente al mondo. Il centro di controllo del CERN, che si trova nei
pressi di Ginevra, in Svizzera, ospita tutti i controlli dell'acceleratore, i relativi
servizi e l'infrastruttura tecnica.
"La nostra sfida principale
consiste nel gestire il
volume e il tasso di
crescita dei dati".
Frédéric Hemmer
Capo del reparto IT
CERN
L'LHC, inaugurato nel 2008, è installato a circa 100 metri nel sottosuolo e
forma un cerchio di 27 km di diametro che attraversa il confine di Francia e
Svizzera. L'anello è costituito da magneti superconduttori con alcune strutture
acceleratrici in grado di aumentare l'energia delle particelle. Viaggiando in
direzione opposta all'interno di tubi separati, i raggi contenuti all'interno
dell'LHC vengono guidati lungo l'acceleratore mediante un campo magnetico
ottenuto con magneti superconduttori e pre-raffreddati con azoto liquido, che
vengono successivamente riempiti con elio liquido al fine di ridurre la
temperatura a -271 °C, inferiore a quella dello spazio profondo. I raggi
vengono indirizzati in modo da scontrarsi lungo l'anello, nei punti che
coincidono con la posizione dei rilevatori di particelle dell'LHC. Al momento
sono in atto collaborazioni internazionali su quattro importanti esperimenti,
ciascuno caratterizzato da uno specifico rilevatore di particelle, atti a studiare
le collisioni dell'LHC e le proprietà della materia in esse prodotta.
L'LHC è in grado di creare 600 milioni di collisioni al secondo, che producono
dati non elaborati alla velocità di 1 milione di gigabyte al secondo. Il software
converte i dati non elaborati in oggetti dati leggibili per la successiva analisi
degli eventi. Gli attuali esperimenti producono oltre 20 PB di nuovi dati
all'anno, che consentono agli scienziati del CERN di sviluppare le conoscenze
e di rispondere alle domande sulle leggi di base della natura.
Il ruolo del reparto IT
Il reparto IT del CERN gestisce l'infrastruttura di supporto per un personale di
circa 2.500 unità e una community di ricerca globale di oltre 10.000 scienziati e
studenti a rappresentanza di 608 università e 113 nazioni. Le responsabilità del
personale tecnico e scientifico del CERN comprendono la progettazione, la
costruzione e il mantenimento del corretto funzionamento degli acceleratori di
particelle, oltre alla preparazione, all'utilizzo, all'analisi e all'interpretazione dei
dati raccolti durante gli esperimenti scientifici.
2
Il reparto offre una vasta gamma di dati e servizi IT a un'esigente community
scientifica costituita da circa metà di tutti i fisici delle particelle esistenti al
mondo. "Tireranno la corda fino a quando non si rompe", sottolinea Frédéric
Hemmer, capo del reparto IT del CERN. "Tuttavia, la risoluzione dei problemi
posti dai nostri utenti è uno degli aspetti che rende più gradevole la vita al
CERN. Adattiamo l'IT, spesso anche a cadenza settimanale, per semplificare la
collaborazione e la comunicazione, nonché gestire le sempre maggiori velocità
e quantità di dati sperimentali in arrivo".
Equilibrare le richieste di performance, scalabilità e affidabilità con
limiti in termini di costi
L'avanzata ricerca scientifica del CERN presenta problematiche di pari livello
anche in termini di gestione di grandi quantità di dati. L'IT deve prevedere le
esigenze degli utenti creativi che eseguono esperimenti basati su requisiti
spesso imprevedibili. Per restare al passo, Hemmer e il suo team devono
diventare innovatori a loro volta, offrendo soluzioni IT in maniera rapida ed
efficiente per fornire i giusti tool alla community di ricerca del CERN. L'IT del
CERN offre questo tipo di funzionalità cercando nel contempo di fornire un
maggior numero di servizi con una disponibilità finanziaria limitata e con
risorse amministrative e del data center costanti o in diminuzione. Nella scelta
degli elementi di base dello stack tecnologico dell'infrastruttura IT, il CERN
deve equilibrare continuamente le richieste tecniche in termini di performance,
affidabilità e scalabilità con sistematici vincoli di natura finanziaria.
All'interno del team IT, i servizi dei database si occupano del database
essenziale e delle relative tecnologie storage. Il CERN ha iniziato a utilizzare
tool e database Oracle a partire dal 1982. Attualmente, la tecnologia Oracle
viene utilizzata nell'intera organizzazione e ricopre un ruolo fondamentale nei
sistemi di controllo dell'acceleratore, nelle applicazioni tecnico-amministrative
e negli esperimenti dell'LHC. La tecnologia Oracle offre tutte le funzionalità
necessarie allo scopo, come alta disponibilità, scalabilità e performance,
attraverso completi tool per la distribuzione, la protezione e la gestibilità dei
dati.
Dal punto di vista dello storage, i requisiti di base comprendono la gestibilità,
la disponibilità e la scalabilità che occorrono per rispondere a requisiti
imprevedibili o in continuo e rapido cambiamento. Ad esempio, gli ioni pesanti
di piombo causano collisioni particolarmente complesse che possono rendere
inaffidabili le stime delle velocità dei dati. In un caso specifico, le velocità dei
dati in ingresso si sono rivelate cinque volte superiori rispetto alle previsioni.
Hemmer quantifica ulteriormente: "I dati che è possibile introdurre nel nostro
data center possono arrivare a velocità di 6 GB/s, ovvero l'equivalente del
contenuto di due DVD ogni tre secondi. Il nostro lavoro consiste nel garantire
la leggibilità e la disponibilità continua di questi dati per la nostra community di
fisici. I dati rappresentano la nostra esistenza. La nostra sfida più grande
consiste nel gestire il volume e il tasso di crescita dei dati".
Una Agile Data Infrastructure intelligente, immortale e infinita
Il team di Hemmer deve costruire una Agile Data Infrastructure in grado di: 1)
offrire un impatto rapido attraverso una gestione intelligente dei dati, 2) fornire
una disponibilità dei dati "immortale" che comprenda aggiornamenti senza
interruzioni per sfruttare gli sviluppi tecnologici senza introdurre downtime per i
tool e le attività scientifiche a ciclo continuo del CERN e 3) fornire una
scalabilità dei dati quasi infinita, per consentire alla capacità e alle performance
storage di crescere insieme ai requisiti e ai database di ricerca del CERN.
Nel 2007, dopo un'asta pubblica, il CERN ha scelto la tecnologia NetApp® per
il database di registrazione dell'LHC, basato su database Oracle con
tecnologia RAC (Real Application Clusters). Da quel momento in poi, il CERN
ha unificato la propria infrastruttura Oracle su NetApp e oggi archivia il 99%
dei dati Oracle su soluzioni NetApp. L'abbordabile costo iniziale di NetApp e la
scalabilità lineare in termini di performance e capacità hanno consentito al
CERN di ampliare il proprio footprint storage alla velocità richiesta dai
ricercatori.
3
Secondo Eric Grancher, database services architect dell'IT del CERN, le
funzionalità di NetApp offrono numerose possibilità concrete per l'ambiente
Oracle: "La certificazione di NetApp con la tecnologia RAC Oracle via NFS è
una risorsa importante. NetApp offre anche funzionalità esclusive come il
supporto di Ethernet 10 gigabit (10 GbE), le snapshot e il cloning a impatto
contenuto, la possibilità di offrire capacità e performance a prezzi contenuti
(attraverso il caching intelligente di NetApp Flash Cache unito alle unità disco
SATA a elevata capacità), il supporto dei file di grandi dimensioni (fino a 16 TB)
e il recente sistema operativo Data ONTAP® Cluster-Mode, per una mobilità dei
dati più efficiente. Abbiamo subito adottato Data ONTAP Cluster-Mode, che
consente di spostare i dati per eseguire il bilanciamento del carico, il
trasferimento dei dati meno utilizzati (o inattivi) su unità disco più economiche
o gli aggiornamenti tecnologici senza dover arrestare le applicazioni".
Oracle su NetApp nell'intera organizzazione
Attualmente, il CERN utilizza quasi 100 database Oracle su storage NetApp. Il
reparto IT del CERN offre servizi Oracle per:
• Operazioni di controllo e registrazione dell'LHC
• Esperimenti online
• Esperimenti offline
• Amministrazione, come ad esempio i servizi di gestione paghe
• Servizi tecnici
Grancher sottolinea la natura critica dei database Oracle del CERN utilizzati su
NetApp: "La nostra infrastruttura Oracle su NetApp si occupa delle operazioni
di fisica e business del CERN. Il CERN utilizza i database Oracle per
mantenere in funzionamento l'LHC e garantire la disponibilità dei database
amministrativi: se i sistemi dovessero diventare non disponibili, il lavoro di
centinaia di persone potrebbe essere a rischio. Una delle principali decisioni
da noi prese durante la costruzione dell'infrastruttura ad alta affidabilità è stata
l'implementazione di uno storage affidabile e semplice da gestire su cui
costruire tutto il resto. Lo storage è un elemento molto importante per noi, una
risorsa essenziale per offrire un servizio stabile su cui basare i servizi applicativi
e di database".
Flussi
Flussi
Database online di
sperimentazione
Gruppo IT/DB
Database offline di
sperimentazione
Centri di tier-1
Dati
Esperimenti LHC
CASTOR (CERN Advanced
STORage Manager)
Dati non elaborati
Operazioni LHC
Middleware
ACC acceleratori
Database tecnici,
IT e amministrativi
Figura 1) Operazioni sperimentali e dell'LHC del CERN.
4
Gestire i problemi tecnici di un ambiente altamente scalabile
Per restare al passo con l'incredibile crescita dei dati, i servizi dell'infrastruttura
IT del CERN devono essere continuamente disponibili e altamente scalabili.
La scienza del CERN non si ferma mai: mantenere online l'LHC
Qualsiasi problema di ricezione o gestione dei dati può causare l'arresto del
sistema, interrompendo il raggio di particelle presente all'interno dell'LHC. I
potenti tool di monitoraggio e controllo dell'LHC sono costruiti su database
Oracle basati su un'infrastruttura dati NetApp.
• Database di controllo (ACCCON). Questo database contiene le
impostazioni e i controlli dell'acceleratore. Gli operatori del CERN eseguono
il monitoraggio a ciclo continuo dell'acceleratore, apportando le modifiche
richieste alla configurazione del database usando gli schermi della stanza di
controllo. Se il database diventasse non disponibile anche per pochi minuti,
gli operatori non potrebbero più controllare l'acceleratore. Per proteggere
l'LHC, una struttura di costo pari a diversi miliardi di dollari, dovrebbero
quindi scaricare il raggio, ovvero estrarlo verso enormi blocchi di grafite al
fine di dissiparne l'energia. Ad esempio, temperature fuori scala potrebbero
danneggiare magneti dal costo unitario di circa un miliardo di dollari, mentre
eventuali riparazioni potrebbero arrestare il funzionamento della struttura per
settimane o persino mesi.
• Database di registrazione (ACCLOG). Questo database registra le
informazioni inviate dalle migliaia di sensori dell'LHC, gestendo la
manutenzione a lungo termine dei registri di stato di migliaia di magneti e di
tutte le parti in movimento della struttura, fra cui i collimatori, che
proteggono i raggi attraverso l'eliminazione delle particelle fuori percorso.
Questo database Oracle, che contiene circa 4,1 trilioni di righe di dati (126
TB), è il più ampio e in rapida crescita del CERN. Contenendo i dati di
calibrazione, diventa un elemento fondamentale per mantenere online l'LHC.
Cercare un ago in 20 milioni di pagliai
Un altro importante problema legato all'accesso agli enormi archivi di dati
sperimentali del CERN consiste nell'offerta di performance sufficienti per
l'accesso agli indici dei database Oracle. I database Oracle su NetApp
consentono di gestire i metadati utilizzati per monitorare e accedere ai dati non
organizzati di ricerca, memorizzati in file semplici nel sistema di gestione dello
storage gerarchico CASTOR (CERN Advanced STORage) del CERN. A oggi, le
farm di unità disco e i silos di nastri di CASTOR offrono una capacità di 40 PB.
In un anno di funzionamento dell'LHC, i 4 enormi rilevatori che intercettano
triliardi di collisioni fra particelle elementari producono oltre 10 milioni di
gigabyte di dati, equivalenti al contenuto di 20 milioni di CD-ROM. Alle attuali
velocità di registrazione, gli esperimenti fisici del CERN produrranno oltre 20
PB di nuovi dati ogni anno, che sarà necessario gestire usando i database
Oracle. Gli attuali sviluppi del CERN nel campo delle analisi di grandi volumi di
dati consentiranno ai ricercatori di ottenere un alto valore in maniera molto
rapida a partire da questi enormi insiemi di dati, riuscendo a trovare
l'applicazione di queste ricerche anche nel settore produttivo per migliorare i
risultati aziendali attraverso analisi predittive.
5
Restare al passo
Il reparto IT del CERN deve anche fare in modo che i sistemi storage e i
database possano restare al passo con l'enorme crescita dei dati. Nell'intero
CERN, NetApp mette oggi a disposizione 901 TB di capacità per i database
Oracle, requisiti che, secondo il personale assegnato ai database del CERN,
cresceranno molto in fretta. Secondo le previsioni, i database degli acceleratori
cresceranno di 50 TB all'anno. Una crescita così rapida richiede una scalabilità
e un'efficienza senza precedenti nello stack tecnologico storage e dei
database del CERN.
Principali tecnologie per equilibrare gli ambienti Oracle
Secondo Grancher, attraverso l'implementazione dei database Oracle su
NetApp, il team dei servizi di database è riuscito a bilanciare i requisiti di
efficienza con la stabilità, le performance e la scalabilità necessarie per il
sistema. Le funzionalità più importanti in tal senso sono:
• 10 GbE, per un percorso collaudato di crescita e una maggiore larghezza di
banda, con l'aggiunta della convenienza di una tecnologia ad alta diffusione
e di pubblico dominio. Grazie alla 10 GbE, il CERN può utilizzare gli stessi
switch e sistemi di rete adoperati nel resto del laboratorio. In altre parole, l'IT
del CERN è in grado di ridurre i costi trasferendo l'amministrazione di questi
elementi al team dedicato alle reti, già dotato di personale sufficiente per
fornire supporto e garantire una gestione a ciclo continuo.
• Oracle Direct NFS (dNFS) consente di utilizzare percorsi multipli verso lo
storage. Si tratta di una tecnologia che, escludendo il sistema operativo dei
server, favorisce la scalabilità e consente in genere di raddoppiare le
performance del NFS tradizionale. Un elemento altrettanto importante offerto
da dNFS è la possibilità di semplificare ulteriormente Oracle su NFS: il
personale IT del CERN non deve preoccuparsi della configurazione di NFS,
in quanto Oracle può generare richieste NFS direttamente dal database.
• SATA insieme al software NetApp Flash Cache consente di ottenere
performance comparabili alle unità disco FC, ma con prezzi molto più ridotti.
Una soluzione FC sarebbe stata proibitiva in termini di costi per i requisiti di
performance e il tasso di crescita del CERN.
• NetApp FlexClone® è un software che consente di creare copie
temporanee e scrivibili in maniera efficiente. Il CERN aveva bisogno di
Snapshot™ efficienti in termini di spazio e di copie scrivibili di database molto
estesi, ma anche della garanzia dell'assenza di impatti negativi sulle
performance da parte dei processi di replica. La gara d'appalto del CERN
specificava l'impatto massimo che la creazione di un determinato numero di
Snapshot avrebbe avuto su determinati carichi di lavoro.
6
• NetApp Data ONTAP 8 in Cluster-Mode ha consentito di preservare le
performance applicative di picco e l'efficienza dello storage attraverso
l'aggiunta di storage e lo spostamento dei dati senza interrompere le
operazioni in corso. Nell'ambiente del CERN è impossibile arrestare
un'applicazione, per cui l'infrastruttura deve offrire una disponibilità continua
e consentire operazioni amministrative e aggiornamenti senza interruzioni.
Secondo Grancher, l'unione di Cluster-Mode e Oracle su NFS offre in
maniera brillante l'agilità richiesta dal CERN.
Modalità di partecipazione di NetApp nello sviluppo della missione di
ricerca del CERN
Secondo Hemmer, le implementazioni tecnologiche di maggior successo
possono aver luogo solo grazie a un'efficace partnership. "Scegliamo fornitori
innovativi, proattivi e in grado di aiutarci a migliorare l'efficacia economica e
l'utilizzo delle risorse del nostro centro".
Grancher fornisce un esempio: "Con la rapida crescita del database di
registrazione dell'LHC, che aumenta di 50 TB all'anno, avevamo bisogno di
un'alternativa alla nostra costosa soluzione FC. Passando a SATA avremmo
risolto i problemi di costi e capacità, ma non quelli di performance. NetApp ci
ha consigliato di porre Flash Cache davanti a tali unità in modo da ottenere
performance di pari livello".
Database
Oracle RAC
Interconnessione
dello storage
Sistemi storage
FAS NetApp
Shelf di dischi
Figura 2) Infrastruttura storage basata su NAS del CERN
Migliorare i database Oracle 11g
Grancher è membro dal 2005 della rete Oak Table di scienziati Oracle e
pertanto conosce e sottolinea l'importanza dell'implementazione di una base
storage in grado di migliorare gli ambienti database. NetApp offre un'unica
piattaforma integrata per lo sviluppo dell'Agile Data Infrastructure:
• Intelligente. La semplicità di gestione aiuta il team IT del CERN a offrire più
rapidamente un'infrastruttura in grado di agevolare la ricerca. Ad esempio, il
CERN utilizza i volumi virtuali di NetApp FlexVol® per semplificare il
provisioning e ottenere efficienza con i volumi dotati di thin provisioning. Il
software di gestione NetApp OnCommand® consente di utilizzare
l'automazione per ridurre gli errori umani. Spiega Grancher: "Lo storage
Oracle su NFS con NetApp ha semplificato le nostre modalità di accesso e
gestione dei dati. Con il tempo risparmiato dal nostro team dedicato ai
database siamo in grado di offrire ulteriori servizi a un maggior numero di
utenti. NetApp offre tool intelligenti che utilizziamo in maniera molto
efficace".
7
Secondo Grancher, la virtualizzazione dei server Oracle VM su NFS è
"semplice, espandibile e stabile". Collaborando con Oracle, NetApp ha
sviluppato il plug-in Storage Connect per Oracle VM 3.0. Il plug-in consente
di semplificare e centralizzare la gestione dei database Oracle e degli
ambienti applicativi attraverso l'integrazione di funzionalità storage avanzate
NetApp (come la deduplica e il thin provisioning) con Oracle VM 3.0.
"Il CERN non ha mai subito
downtime dovuti alle unità
SATA. Nel passare dalle SAN
FC alle NAS SATA, abbiamo
conservato il medesimo livello
di affidabilità".
Eric Grancher
Database Services Architect
CERN
Inoltre, la tecnologia NetApp aumenta l'efficienza della protezione e della
recuperabilità dei dati. Nello specifico, NetApp consente al CERN di
proteggere i dati evitandone la duplicazione, di sfruttare diverse modalità per
la fornitura di insiemi di dati utilizzabili (senza eseguire copie) e di eliminare i
dati duplicati. "Senza la tecnologia NetApp SnapRestore®", spiega Grancher,
"avremmo impiegato settimane per recuperare un singolo database Oracle
di diversi terabyte. Inoltre, con NetApp, le dimensioni dei database sono
irrilevanti: è possibile copiare un database da 1 o 10 TB in pochi secondi e
ripristinarlo in pochi minuti o ore. Occorrevano 28 giorni per ripristinare un
database Oracle da 100 TB, operazione che adesso richiede solo 15 minuti.
Se utilizzata insieme a Oracle Real Application Testing, la tecnologia
SnapRestore consente di ripetere rapidamente un carico di lavoro per le
attività di test".
• Immortale. La stabilità dello storage è molto importante per la stabilità dei
carichi di lavoro dei database sovrastanti del CERN. La tecnologia di
NetApp RAID-DP®, i componenti ridondanti, le configurazioni di controller
con coppia ad alta disponibilità e l'ultima versione di Data ONTAP ClusterMode consentono al CERN di costruire una base storage priva di downtime
e perdite di dati.
Grancher sottolinea che la tecnologia NetApp ha consentito al CERN di
sviluppare le soluzioni per database Oracle in uso senza alcun downtime: "Il
CERN non ha mai subito un downtime dovuto alle unità disco SATA. Nel
passare dalle SAN FC alle NAS SATA, abbiamo conservato il medesimo
livello di affidabilità. Sin dalla prima implementazione dello storage NetApp,
che risale al 2007, il CERN non ha mai perduto un singolo blocco di dati.
Non stiamo enfatizzando eccessivamente l'importanza di questo aspetto: in
caso di indisponibilità dei database del CERN, l'acceleratore non potrebbe
funzionare e così anche la ricerca fisica".
• Infinita. NetApp ha consentito all'IT del CERN di ottenere performance a
prezzi convenienti. Quando i requisiti di capacità dei database Oracle su
larga scala hanno reso economicamente impossibile l'utilizzo dello storage
basato su FC, il CERN è riuscito a unire le economiche unità disco SATA con
NetApp Flash Cache in modo da ottenere la capacità necessaria senza
alcun sacrificio in termini di performance. Grancher aggiunge: "Utilizzando
Flash Cache con le unità disco SATA siamo riusciti a ottenere 35.000 IOPS
via Ethernet, l'equivalente di 250 unità disco in termini di performance.
Quando è possibile inserire in cache gran parte di un carico di lavoro, i tempi
di risposta possono ridursi fino a pochi millisecondi, invece dei 10-15 ms
richiesti dalle normali unità SATA. Possiamo specificare anche gli elementi
da inserire in cache, ad esempio escludere i registri di redo, consentendo
alla cache di adattarsi automaticamente ai carichi di lavoro. In questo modo
possiamo risparmiare tempo e ridurre al minimo gli errori".
Con la velocità e l'ambito della crescita dei dati del CERN, è fondamentale
disporre di scalabilità in termini di performance e capacità storage. Secondo
Grancher, "Il CERN non è diverso da qualsiasi altra organizzazione alle prese
con la gestione di un ambiente OLTP o con grandi quantità di dati. La nostra
infrastruttura IT deve essere adattabile, affidabile, scalabile ed efficiente,
mentre il nostro personale deve essere proattivo nell'integrazione delle
tecnologie e nell'utilizzo efficace delle limitate risorse a nostra disposizione,
anche in presenza di un'enorme crescita dei dati. A partire da un ridotto
costo iniziale fino all'espansione dello storage just-in-time, con NetApp
abbiamo potuto espandere la nostra infrastruttura storage in maniera
progressiva, secondo i nostri requisiti in continua espansione in termini di
dati e di ricerca".
8
Le tecnologie di efficienza dello storage consentono al CERN di sviluppare la
strategia desiderata per la "conservazione infinita" dei dati. Spiega Hemmer:
"Una volta inseriti nel nostro centro informatico, i dati devono essere
memorizzati in eterno. I ricercatori possono dover accedere ai dati anche
diversi anni dopo la raccolta, pertanto non ne eliminiamo mai nemmeno una
minima parte".
Una base affidabile ed espandibile per la ricerca
Per quanto riguarda il maggiore impatto dell'infrastruttura Oracle su NetApp,
Grancher aggiunge: "L'aspetto più soddisfacente per il nostro team dei servizi
di database è la possibilità di costruire una struttura stabile, un'architettura
soddisfacente in termini di risultati e non una soluzione specifica, piuttosto una
base flessibile per la crescita. I nostri clienti, vale a dire la community globale
di fisici, gli studenti e il personale del CERN, possono sfruttare questa
infrastruttura per l'accesso ai dati affidabile, per favorire una collaborazione
trasparente e garantire servizi reattivi".
Utilizzo dello storage:
75%
Personale: 15% di
database in più senza
aumentare il personale.
Footprint IT: dimezzamento
di spazio, energia,
raffreddamento
(SATA rispetto a SAS)
Hemmer aggiunge: "Gli scienziati si sono congratulati spontaneamente con noi
per il modo in cui la nostra infrastruttura di calcolo ha contribuito al
conseguimento dei risultati di fisica. Attraverso l'offerta dei tool e dell'accesso
ai dati richiesti dalla ricerca, stiamo aiutando i fisici nella ricerca di prove
rivoluzionarie e nel conseguimento di importanti scoperte in grado di avere un
impatto ben superiore ai limiti della nostra organizzazione".
9
Informazioni sul CERN
Il CERN, l'Organizzazione europea per la ricerca nucleare, è uno dei centri per
la ricerca scientifica più grandi e rispettati al mondo. L'attività del CERN
consiste nell'analisi della fisica di base per scoprire la struttura e il
funzionamento dell'universo. Al CERN vengono utilizzati i tool scientifici più
estesi e complessi al mondo per studiare gli elementi costitutivi della materia,
vale a dire le particelle fondamentali. Attraverso lo studio delle collisioni fra
questo tipo di particelle, i fisici cercano di scoprire i segreti delle leggi della
natura.
Fondato nel 1954, il laboratorio del CERN si estende lungo il confine francosvizzero nei pressi di Ginevra, in Svizzera. Si tratta una delle prime jointventure europee che vanta ormai il contributo di 20 Stati membri. www.cern.ch
Informazioni su NetApp
NetApp crea innovative soluzioni di storage e di gestione dei dati, che
favoriscono il progresso delle aziende, garantendo risparmi eccezionali sui
costi. Vieni a scoprire sul nostro sito www.netapp.com/it la nostra passione nel
sostenere aziende, sparse in tutto il mondo, che vogliono andare più lontano,
più velocemente.
Go further, faster®
Prodotti e tecnologie principali
NetApp
• Sistemi storage FAS
• Shelf di dischi DS4243
• SATA da 3 TB e 2 TB
• Flash Cache da 512 GB
• Data ONTAP 8
• FlexVol
• FlexClone
• Tecnologia Snapshot
• SnapRestore
• Software OnCommand
• Thin provisioning
• Aggregati estesi
• NVRAM
• NFS/CIFS
Oracle
• Oracle Database 11g Enterprise
Edition con tecnologia Real
Application Clusters e opzioni di
partizionamento
• Oracle Direct NFS
• Oracle Streams
• Oracle VM
Altro
• Switch Ethernet HP ProCurve
10 Gb/s
• Sistema a nastro IBM Tivoli TSM
e archivio TDPO
• Server di più vendor, tutti dotati
di Ethernet 10 Gb
© 2012 NetApp. Tutti i diritti riservati. Nessuna porzione del presente documento può essere riprodotta senza esplicito consenso scritto
da parte di NetApp, Inc. Le specifiche sono soggette a modifica senza preavviso. NetApp, il logo NetApp, Go further, faster, Data ONTAP,
FlexClone, FlexVol, OnCommand, RAID-DP, SnapRestore e Snapshot sono marchi o marchi registrati di NetApp, Inc. negli Stati Uniti e/o in
altri paesi. Tutti gli altri marchi e prodotti sono marchi commerciali o marchi registrati dei rispettivi proprietari e devono essere trattati come
tali. NA-143-0812-A4-itIT
www.netapp.com/it