Status dei siti COMETA Consorzio COMETA Dott. Emilio Mastriani [email protected] 03/11/2011 Status dei siti in data attuale Status dei siti COMETA INAF INFN_LNS UNICT UNIME UNIPA Riepilogo sui problemi aperti COMETA-INAF-CT N.5 Blade Chassis serie H N.70 Lame Ibm LS21 di cui: N.28 Accese e operative N.42 Spente per risparmio energetico (ma disponibili su richiesta) N.1 Switch CISCO SFS7012 a cui son collegati tutti i nodi. N.2 System X3655 server storage accesi ed operativi N.24 HD 500Gb Funzionanti Problemi Aperti Il management module di 2 Blade center segnala Critical Events Power module 2 is off. DC fault. Power module 3 is off. DC fault. COMETA-INFN-CT N. 5 Blade Chassis - serie H N. 70 Lame IBM LS21 N. 4 Blade Spenti (per ragioni di risparmio energetico) N. 2 gLite Worker Nodes disponibili Tutti i Blade Chassis sono connessi con IB su CISCO SFS 7012 N. 2 System X3655 server storage N. 2 Controller DS4200 N. 9 EXP420 N. 60 HD 500Gb ---> Funzionanti N. 112 HD 750Gb ---> Funzionanti Problemi Aperti N. 1 Cooling Modules guasto N. 4 HD 500Gb ---> Guasti N. 1 Power Module (EXP420) ---> Guasto COMETA-INFN-LNS N. 2 Blade Chassis - serie H N. 28 Lame IBM LS21 N. 26 gLite Worker Nodes disponibili Problemi Aperti N. 1 LamaLS21 HD guasto COMETA-UNICT-DIIT N. 2 Blade Chassis - serie H N. 50 Lame IBM LS21 N. 48 Lame disponibili N. 2 System X3655 server storage N. 2 Controller DS4200 N. 32 HD 750Gb Problemi Aperti N. 2 Lame LS21 N.1 Armadio Rittal piegato dal lato sx N.1 ventola rumorosa COMETA-UNICT-DMI N. 2 Blade Chassis - serie H N. 42 Lame IBM LS21 N. 14 Lame disponibili N. 28 Lame LS21 spente per risparmio energetico N. 2 System X3655 server storage N. 2 Controller DS4200 N. 40 HD 750Gb Problemi Aperti N. 1 Condizionatore con motore bruciato COMETA-UNIPA N.5 Blade Chassis - 28 Lame IBM LS21 per ogni chassis N.3 chassis accesi e operativi; N.2 chassis spenti per risparmio energetico; N. 2 System X3655 server storage accesi e operativi; N. 1 Controller DS4200; N. 2 EXP420 operativi 44 HD funzionanti; N.1 Switch Infiniband QLogic Silverstorm 9240 acceso e operativo; N.1 Switch Cisco acceso e operativo; Problemi Aperti N.8 lame con memoria RAM guasta; Problemi ai sensori ambientali, rilevazione temperatura in ingresso alta nei due InRowRC; Problemi sorgenti di alimentazione, il sistema dà warning che poi rientrano; Problemi ad una ventola, il sistema da dei warning che poi rientrano; COMETA-UNIPA Nota importante Il Centro di Calcolo di Palermo vuole la regolamentazione del Nodo Cometa. Tale regolamentazione consiste nell'attivazione di un sistema di monitoraggio del traffico in uscita, per evitare incidenti dovuti a job malconfigurati o maliziosi. Inoltre sarebbe opportuno attivare un firewall perimetrale in modo che i site admin del sito Cometa di Palermo possano regolare autonomamente porte aperte e servizi dell'infrastruttura. A tal proposito si richiedono informazioni riguardo alle impostazioni di sicurezza degli altri siti Cometa e eventuali incidenti di sicurezza avuti in passato. COMETA-ING-UNIME N. 5 Blade Chassis - serie H N. 68 Lame IBM LS21 N. 7 gLite Worker Nodes attivi N. 5 Lame attive destinate a servizi (UI/CE/WMS/LB/topBDII) N. 56 Lame funzionanti e mantenute spente, per inattività del Chiller N. 12 Lame accese ed operative N. 2 System X3655 server storage N. 1 Controller DS4200 N. 1 EXP420 N. 14 HD 500Gb funzionanti N. 16 HD 750Gb funzionanti Problemi Aperti N. 1 Modulo RAM LS21 guasto N. 1 APC InfraStruXure Management module --> sensori ambientali (da regolare) -->sorgenti di alimentazione (warning intermittenti) N. 1 circuito di pompa del Chiller: sportello quadro circuiti del Chiller (non si chiude) RIEPILOGO SITO Amministratore Azione COMETA-INAF-CT [email protected] COMETA-INFN-CT [email protected] N. 1 Cooling Modules N. 4 HD 500Gb N. 1 Power Module (EXP420) COMETA-INFN-LNS [email protected] N. 1 Lama LS21 COMETA-UNICT-DMI [email protected] N. 1 Motore del Condizionatore COMETA-UNICT-DIIT [email protected] N. 2 Lame LS21 N.1 Armadio Rittal piegato a sx N.1 ventola rumorosa COMETA-UNIPA [email protected] N.8 lame con memoria RAM guasta; Problemi ai sensori ambientali, rilevazione temperatura in ingresso alta nei due InRowRC; Problemi sorgenti di alimentazione, il sistema dà warning che poi rientrano; Problemi ad una ventola, il sistema da dei warning che poi rientrano; COMETA-UNIME [email protected] N. 1 Modulo RAM LS21 guasto Power module 2 is off. DC fault. Power module 3 is off. DC fault. N. 1 APC InfraStruXure Management module --> sensori ambientali (da regolare) --> sorgenti di alimentazione (warning intermittenti) N. 1 circuito di pompa del Chiller: sportello quadro circuiti del Chiller (non si chiude)