Riunione PRIN STOA-LHC Bologna, 18 Giugno 2014 Attività per ALICE: sommario e prospettive Domenico Elia Domenico Elia Riunione PRIN STOA-LHC / Bologna 18.6.2014 1 Sommario attività ALICE Attività in corso: deployment prototipi VAF: adesso anche a TS, BA e LNL (e prossima a CA) interesse anche da CT (già nel loop) ottimi progressi dopo hands-on di Marzo al CERN (ancora 3 e 4 Luglio) supporto da parte di TO e “CERN” (D. Berzano) sviluppi Virtual Storage Element accounting/monitoring esperienza con tenant non-PROOF Piani: test di performance di VAF e accesso locale ai dati test e misure di accesso remoto federazione di VAF e/o storage Domenico Elia Riunione PRIN STOA-LHC / Bologna 18.6.2014 2 Obiettivi comuni ALICE Ottimizzazione dell'ambiente di analisi in interattivo: • Studio di infrastrutture di analisi interattive espandibili con tecniche di virtualizzazione integrate in soluzioni di tipo cloud computing – Installazione e messa in opera di infrastrutture di analisi espandibili • • • • OpenNebula (TO) OpenStack (BA, LNL, TS) Wnodes (CA) Sviluppo di sensori e politiche per abilitare la condivisione e la cessione automatica delle risorse virtuali, minimizzando l'intervento dell'amministratore di sistema Studio e ottimizzazione dell'accesso ai dati nell'analisi interattiva: • • Studio di una cache dinamica locale integrata nei file system parallelli esistenti o negli SE Sviluppo di un modello per l’accesso ai dati delle infrastrutture di analisi interattive espandibili (VSE) evitando duplicazioni di dati e risorse dedicate per analisi interattive (uso dello SE) Studio di una federazione nazionale: • • Sviluppo di un modello dati federativo nazionale e verifica della velocità e dell'affidabilità di un sistema xrootd a namespace unico nazionale Sviluppo in cooperazione con altri centri di calcolo delle specifiche di un cluster interattivo federato a livello nazionale: – “multi-master” – “PROOF on Demand” – “interoperabilità’ tra cloud” Domenico Elia Riunione PRIN STOA-LHC / Bologna 18.6.2014 3 Backup Domenico Elia Riunione PRIN STOA-LHC / Bologna 18.6.2014 4 Torino Milestones: 1. Nel primo si metterà in opera un'infrastruttura espandibile da subito utilizzabile dalla comunità scientifica 2. Nel secondo anno si svilupperanno soluzioni che rendano il più possibile automatico il bilanciamento delle risorse virtuali 3. Nel terzo anno il centro di calcolo verrà inserito in una realtà federativa nazionale per l'analisi interattiva nei grandi esperimenti Nel dettaglio, la scansione temporale che si intende seguire, con i relativi obiettivi proposti, è: 1. Installazione dello storage di primo livello condiviso GlusterFS con interfaccia xrootd. Test di velocità per l'accesso ai dati sia attraverso GlusterFS che attraverso xrootd, sia locale che da siti remoti 2. Conversione graduale delle risorse fisiche esistenti in hypervisor. Gli hypervisor saranno gestiti da OpenNebula e i loro dischi saranno già pensati come parte del cache storage di secondo livello 3. Preparazione delle macchine virtuali Grid e PROOF: al termine di questa fase l'infrastruttura sarà già operativa e fruibile dagli utenti, mentre gli amministratori di sistema potranno già decidere facilmente la “dimensione” dei cluster virtuali Grid e PROOF 4. Sviluppo di sensori e politiche per abilitare la condivisione e la cessione automatica delle risorse virtuali, minimizzando l'intervento dell'amministratore di sistema 5. Sviluppo in cooperazione con altri centri di calcolo delle specifiche di un cluster interattivo federato a livello nazionale tramite un approccio “multi-master” e /o un approccio “PROOF on Demand” 6. Sviluppo di un modello dati federativo nazionale: verifica della velocità e dell'affidabilità di un sistema xrootd a namespace unico nazionale, con un catalogo dei file completamente distribuito, eventualmente attraverso la tecnologia del “Global Redirector” Domenico Elia Riunione PRIN STOA-LHC / Bologna 18.6.2014 5 Trieste Milestones: Primo anno 1) Installazione di una infrastruttura di analisi interattiva di tipo statico 2) Test delle richieste di risorse da parte dei vari use case per l'analisi interattiva 3) Test della possibilita' di utilizzo dell'accesso remoto ai dati Secondo anno 1) Ottimizzazione delle risorse di calcolo con tecniche di virtualizzazione integrate in soluzioni di tipo cloud computing (replica nell'unita' di ricerca di Trieste il prototipo sviluppato a Torino, integrandolo nel cluster di calcolo gia' presente a Trieste). 2) Studio della scalabilita' degli strumenti che permettono un accesso contemporaneo da piu' nodi ai dati contenuti nei dischi del cluster locale ad elevata performance collegati ad interfacce standard, come XROOTD Terzo anno 1) Studio della possibilita' di federare i centri di analisi coinvolti nel progetto (Bari, Bologna, Cagliari INFN, Pisa, Roma, Torino) in modo da poter accedere i dati presenti in uno qualsiasi dei siti che ne facciano parte, evitando la duplicazione dei dati 2) Studio dell'accesso ai dati federati nell'analisi interattiva come la ripetitivita' e la breve durata di ciascun processo di analisi, il tempo necessario per accedere ai dati e la loro effettiva disponibilita' 3) Studio di una cache dinamica locale integrata nel file system parallelo esistente nel centro di calcolo dell'unita' di ricerca 4) Verifica della velocita' e dell'affidabilita' di un sistema a namespace unico nazionale 5) Sviluppo in cooperazione con altri centri di calcolo delle specifiche di un cluster interattivo federato a livello nazionale tramite un approccio "multi-master" e/o di un approccio "PROOF on Demand" Domenico Elia Riunione PRIN STOA-LHC / Bologna 18.6.2014 6 Cagliari Obiettivi principali: 1) realizzare un cluster wnodes compatibile per la fruibilità delle risorse per l'analisi interattiva in modo on demand per la anilisi dati in campo HEP. 2) realizzare un server di storage luste/zfs da utilizzare sia per ospitare i dati necessari alle analisi, sia come repository delle immagini della macchine virtuali. Ed infine federare le risorse destinate ad ospitare i cluster virtuali per l'analisi dati con altre unità operativo di questo progetto Milestones: Primo anno 1) Realizzare un cluster wnodes compatibile 2) Calibrare le politiche di accesso sul batch system locale per una efficace analisi dati 3) Realizzare un server storage zfs/lustre 4) Test di velocità di accesso sia in modalità locale sia con xrootd Secondo anno 1) Preparazione delle macchine virtuali da destinare all'analisi interattiva 2) Test di utilizzo dei cluster su wnodes per da parte di uno/due utenti ALICE dell'unita' di ricerca Terzo anno 1) Federare le risorse destinate ad ospitare i cluster virtuali per l'analisi dati con altre unità operativo di questo progetto Domenico Elia Riunione PRIN STOA-LHC / Bologna 18.6.2014 7 INFN-LNL Obiettivi principali: 1) Accesso da remoto ai dati dell'esperimento 2) Ottimizzazione dell'ambiente di analisi in interattivo: – Per l'esperimento ALICE, la sub unita' di Legnaro adottera' una facility di analisi basata su PROOF con una condivisione delle risorse dinamica dei nodi di calcolo in GRID e con l'accesso remoto ai dati memorizzati negli altri Tier2 di ALICE italiani. 3) Ottimizzazione della distribuzione del software di esperimento nei siti 4) Gestione dei dati a livello nazionale Domenico Elia Riunione PRIN STOA-LHC / Bologna 18.6.2014 8