L’ESPERIENZA DI CASPUR NELLA GESTIONE DEL DATACENTER Maurizio Goretti [email protected] Workshop CCR e INFN-GRID Palau 11 Maggio 2009 CASPUR E’ un consorzio tra Università - senza fini di lucro fondato nel 1992 80 Dipendenti – 15 Mln Fatturato 2008 Le sue principali finalità sono legate al Calcolo Scientifico (HPC) 460 posizione Top 500 (13,6 [17]Tflops) Servizi per le Università, Enti di Ricerca, Industria [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 2 Neutralità È una delle caratteristiche peculiari del Consorzio Origine Universitaria Senza fini di lucro Competenze Super-Partes [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 3 CASPUR La sua nascita coincide con lo sviluppo di Internet Attività di consulenza e realizzazione delle nuove reti Università, Pubbliche Amministrazioni Centrali e Locali [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 4 Crocevia Internet NaMeX punto di interscambio tra ISP Principale snodo internet del Centro-Sud Italia Presenti i principali operatori internet nazionali ed internazionali (oltre 30) TelecomItalia Wind Fastweb Interoute Cogent TataCommunications Seeweb GARR Sede Sistema Pubblico di Connettività (SPCQXN) Crocevia dei collegamenti tra Pubbliche amministrazioni centrali [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 5 Gestione DataCenter CASPUR gestisce un Data Center “importante” Consumi elevati HPC Criticita apparecchiature installate NaMeX SPC Presidenza Consiglio, Camera, etc… Affidabilità e continuità di servizio Ottimizzazione dei consumi [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 6 Il nostro CED Ubicazione : piano -2 Dispositivi anti allagamento Media Tensione 8600 V ACEA Interruttore MT DK5600 Doppio trasformatore in parallelo (640KVA) Doppio avvolgimento (8600/20.000) Gruppo elettrogeno (400 KVA, 12 ore autonomia) Scambio rete gruppo Doppio UPS (200 KVA, due linee separate, 15 min) Doppia linea rack Differenziali Raffredamento ridondato [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 7 Esigenza e Natura La grande importanza della efficienza del Datacenter ha imposto a CASPUR un investimento economico ed umano Obbligo di competenze interne per raggiungimento elevati standar di affidabilità La stesse esigenza nel mondo della ricerca ed ICT Difficoltà nel reperimento di informazioni “neutrali” CASPUR interessato a creare una comunità Italia di esperti ed addetti ai lavori [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 8 Esigenza e Natura Necessità di individuare dei riferimenti neutrali ed affidabili per gli utenti finali Comunità di studio e ricerca delle best practice e delle nuove tecnologie Sfruttando la posizione di neutralità Collaborazioni: Dipartimento Ingegneria Elettrica Sapienza Ruggero Ricci: Criteri progettazione impianti elettrici CED Tier2 Aziende del settore Internet Service Provider [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 9 Affidabilità e Costi Capire per migliorare Condividere per capire Youtube DataCenter Channel Errori come risorsa Non è facile “confessarli” … oltre il Commerciale verso il Progettista … Ritorno per le aziende e per gli utenti Confessione dei nostri peccati … [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 10 Incidenti Incidenti di media gravità (interruzione 1 linea) Apertura differenziali scambio rete/gruppo Servono i differenziali di sala? Trasformatore di disaccoppiamento UPS+calo tensione ACEA Errati valori di riferimento Bypass con micro interruzione [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 11 Incidenti Incidenti di elevata gravità (interruzione entrambe le linee) 23/05/2007 : 1H 02M Apertura interrutore MT Esplosione batteria avviamento GE 07/03/2008 : 0H 04 M Rottura capicorda neutro GE Durante manutenzione [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 12 Contromisure 23/05/2007 : 1H 02M Apertura interrutore MT Censimento interruttori e loro valore di apertura Esplosione batteria avviamento GE Cattiva manutenzione Nuova ditta manutenzione 07/03/2008 : 0H 04M Rottura capicorda neutro GE ? Errata logica di commutazione. Manutenzione Cattiva procedura di manutenzione Formazione del personale Nuove procedure Convocazione manutentori GE, UPS, Impianto elettrico. 5 persone interne coinvolte [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 13 Datacenter a sezioni Caratteristiche del Sito Impianto elettrico Media tensione Trasformatori Bassa tensione UPS Gruppo elettrogeno Distribuzione di Sala Raffreddamento Monitoring Standard Controllo accessi Procedure Manutenzione [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 14 Scambio rete Gruppo Quali dispositivi per la commutazione? Scheda Gruppo Interruttori Dispositivo dedicato (ABB ATS010) Quale logica di commutazione? Consenso gruppo per scambio [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 15 DK5600 ed il problema delle alimentazioni ausiliarie Gatto che si morde la coda? Il relè della DK5600, cosi come altri dispositivi “vitali” per l’alimentazione elettrica, ha bisogno di una alimentazione ausiliaria protetta (UPS) Scambio rete gruppo. UPS dedicato o uso degli UPS di sala? Static Switch [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 16 Monitoring Fondamentale per la prevenzione guasti/ottimizzazione consumi Noi del networking abbiamo uno “standard”: SNMP A volte in contrasto con gli usi e costumi degli “Elettrici” Bus e protocolli proprietari Ridondanza Costosi Sistema di monitoring personalizzati e centralizzati [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 17 Manutenzione e procedure Quale programma di manutenzione? Prova black-out? Quale procedura? La storia del Test batterie UPS e del Gruppo Elettrogeno Formazione del personale Riduzione tempi intervento guasti [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 18 Un esempio concreto Raffreddamento, CASPUR Problema di inefficienza Consumi elevati Esaurimento risorse Spazi Potenza elettrica Commerciale non troppo sensibile e superimpegnato Concorrenti che bussano alle porte con soluzioni radicali stile “cambia tutto”... … e se mi facessi un giro in fabbrica? [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 19 (In)Efficienza Sale CED 1 e 2 Sala 1, 200 mq Sala 2, 72 mq Disposizione non ottimale rack Raffreddamento a sottopavimento (30 cm) [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 20 (In)Efficienza Sale CED 1 e 2 6 Refrigeratori ad acqua 7 Refrigeratori ad espansione diretta Consumo medio singolo Refr. 10(15)KW Consumo sistema raffr. 130(195) KW Consumo elettrico sala 210 KW (170 sala1 + 40 sala 2) Efficienza raffreddamento 210/130(195)=1.62(1.08) [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 21 Efficienza Sala CED 3 54 mq 3 Refrigeratori ad acqua Consumo sistema raffreddamento 30(45) Kw Consumo elettrico di sala 100 Kw Efficienza raffreddamento 100/30(45)=3.3(2.22) [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 22 Efficienza Sala CED 3 [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 23 Efficienza Sala CED 3 [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 24 Efficienza e risparmi Se in sala 1 e 2 avessimo la stessa efficienza della sala 3 avremo bisogno di soli 210/3.3(2.22)=64(95) 130(195) Kw Kw per raffreddare invece di Si avrebbe un risparmio di 66(100) Kw In un anno si risparmierebbero 66(100)x24x365=578160(876000) Kwh Il costo del Kwh è circa 0,15 Euro Risparmio di 578160(876000)x0,15=86700(131400) [email protected] - Workshop CCR INFN-GRID - Euro/anno 11 Maggio 2009 25 Efficienza Sala CED 3 Raffreddando le sale 1 e 2 con la stessa efficienza della sala 3 avremmo un risparmio economico almeno il 40% Si potrebbe ampliare l’impianto elettrico e di raffreddamento 1 Refr.=35Kw Almeno 4 Refr.=140 Kw Raffreddando 15 Kw a rack potremo installare 10 rack [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 26 Differenze e risultati Sottopavimento 60cm invece di 30cm Corridoi “caldi” e “freddi” Chiusura corridoio freddo Uso active floor Disposizione ordinata macchine in rack Risultato: risparmio economico; risparmio energetico (maggiori risorse); maggiori spazi Top 500 e Top Green 500 Abbiamo condivisto il nostro risultato all’interno della nostra comunità [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 27 CASPUR Il nostro Consorzio promuove o patrocina iniziative e studi finalizzati alla conoscenza dei problemi legati a DataCenter ad alta criticità. Siamo alla ricerca di nuovi aziende od utenti interessati a partecipare o condividere tali iniziativa. L’adesione all’iniziativa non ha costi ma richiede impegno. Opportunità legate alla presenza di un vasto numero di potenziali utenti (e aziende). [email protected] - Workshop CCR INFN-GRID - 11 Maggio 2009 28 Grazie della attenzione. Maurizio Goretti E-mail: [email protected] Skype:Maurizio.Goretti Sip:[email protected] Workshop CCR e INFN-GRID Palau 11 Maggio 2009