Status dei siti COMETA
Consorzio COMETA
Dott. Emilio Mastriani
[email protected]
03/11/2011
Status dei siti in data attuale


Status dei siti COMETA

INAF

INFN_LNS

UNICT

UNIME

UNIPA
Riepilogo sui problemi aperti
COMETA-INAF-CT
N.5 Blade Chassis serie H
N.70 Lame Ibm LS21 di cui:
N.28 Accese e operative
N.42 Spente per risparmio energetico (ma disponibili su richiesta)
N.1 Switch CISCO SFS7012 a cui son collegati tutti i nodi.
N.2 System X3655 server storage accesi ed operativi
N.24 HD 500Gb Funzionanti
Problemi Aperti
Il management module di 2 Blade center segnala
Critical Events
Power module 2 is off. DC fault.
Power module 3 is off. DC fault.
COMETA-INFN-CT
N. 5 Blade Chassis - serie H
N. 70 Lame IBM LS21
N. 4 Blade Spenti (per ragioni di risparmio energetico)
N. 2 gLite Worker Nodes disponibili
Tutti i Blade Chassis sono connessi con IB su CISCO SFS 7012
N. 2 System X3655 server storage
N. 2 Controller DS4200
N. 9 EXP420
N. 60 HD 500Gb ---> Funzionanti
N. 112 HD 750Gb ---> Funzionanti
Problemi Aperti
N. 1 Cooling Modules guasto
N. 4 HD 500Gb ---> Guasti
N. 1 Power Module (EXP420) ---> Guasto
COMETA-INFN-LNS
N. 2 Blade Chassis - serie H
N. 28 Lame IBM LS21
N. 26 gLite Worker Nodes disponibili
Problemi Aperti
N. 1 LamaLS21 HD guasto
COMETA-UNICT-DIIT
N. 2 Blade Chassis - serie H
N. 50 Lame IBM LS21
N. 48 Lame disponibili
N. 2 System X3655 server storage
N. 2 Controller DS4200
N. 32 HD 750Gb
Problemi Aperti
N. 2 Lame LS21
N.1 Armadio Rittal piegato dal lato sx
N.1 ventola rumorosa
COMETA-UNICT-DMI
N. 2 Blade Chassis - serie H
N. 42 Lame IBM LS21
N. 14 Lame disponibili
N. 28 Lame LS21 spente per risparmio energetico
N. 2 System X3655 server storage
N. 2 Controller DS4200
N. 40 HD 750Gb
Problemi Aperti
N. 1 Condizionatore con motore bruciato
COMETA-UNIPA
N.5 Blade Chassis - 28 Lame IBM LS21 per ogni chassis
N.3 chassis accesi e operativi;
N.2 chassis spenti per risparmio energetico;
N. 2 System X3655 server storage accesi e operativi;
N. 1 Controller DS4200;
N. 2 EXP420 operativi
44 HD funzionanti;
N.1 Switch Infiniband QLogic Silverstorm 9240 acceso e operativo;
N.1 Switch Cisco acceso e operativo;
Problemi Aperti
N.8 lame con memoria RAM guasta;
Problemi ai sensori ambientali, rilevazione temperatura in ingresso alta nei due
InRowRC;
Problemi sorgenti di alimentazione, il sistema dà warning che poi rientrano;
Problemi ad una ventola, il sistema da dei warning che poi rientrano;
COMETA-UNIPA
Nota importante
Il Centro di Calcolo di Palermo vuole la regolamentazione
del Nodo Cometa. Tale regolamentazione consiste
nell'attivazione di un sistema di monitoraggio del traffico
in uscita, per evitare incidenti dovuti a job malconfigurati
o maliziosi. Inoltre sarebbe opportuno attivare un firewall
perimetrale in modo che i site admin del sito Cometa di
Palermo possano regolare autonomamente porte aperte
e servizi dell'infrastruttura.
A tal proposito si richiedono informazioni riguardo alle
impostazioni di sicurezza degli altri siti Cometa e
eventuali incidenti di sicurezza avuti in passato.
COMETA-ING-UNIME
N. 5 Blade Chassis - serie H
N. 68 Lame IBM LS21
N. 7 gLite Worker Nodes attivi
N. 5 Lame attive destinate a servizi (UI/CE/WMS/LB/topBDII)
N. 56 Lame funzionanti e mantenute spente, per inattività del Chiller
N. 12 Lame accese ed operative
N. 2 System X3655 server storage
N. 1 Controller DS4200
N. 1 EXP420
N. 14 HD 500Gb funzionanti
N. 16 HD 750Gb funzionanti
Problemi Aperti
N. 1 Modulo RAM LS21 guasto
N. 1 APC InfraStruXure Management
module
--> sensori ambientali (da regolare)
-->sorgenti di alimentazione (warning
intermittenti)
N. 1 circuito di pompa del Chiller: sportello
quadro circuiti del Chiller (non si chiude)
RIEPILOGO
SITO
Amministratore
Azione
COMETA-INAF-CT
[email protected]
COMETA-INFN-CT
[email protected]
N. 1 Cooling Modules
N. 4 HD 500Gb
N. 1 Power Module (EXP420)
COMETA-INFN-LNS
[email protected]
N. 1 Lama LS21
COMETA-UNICT-DMI
[email protected]
N. 1 Motore del Condizionatore
COMETA-UNICT-DIIT
[email protected]
N. 2 Lame LS21
N.1 Armadio Rittal piegato a sx
N.1 ventola rumorosa
COMETA-UNIPA
[email protected]
N.8 lame con memoria RAM guasta;
Problemi ai sensori ambientali, rilevazione temperatura in
ingresso alta nei due InRowRC;
Problemi sorgenti di alimentazione, il sistema dà warning che poi
rientrano;
Problemi ad una ventola, il sistema da dei warning che poi
rientrano;
COMETA-UNIME
[email protected]
N. 1 Modulo RAM LS21 guasto
Power module 2 is off. DC fault.
Power module 3 is off. DC fault.
N. 1 APC InfraStruXure Management module
--> sensori ambientali (da regolare)
--> sorgenti di alimentazione (warning intermittenti)
N. 1 circuito di pompa del Chiller: sportello quadro circuiti del
Chiller (non si chiude)