Review Calcolo CSN2 D. Martello Dip. di Fisica & INFN - Univ. Del Salento CSN2 Napoli 30-11-2009 Sommario • Un po' di storia … • La struttura di Calcolo INFN (LHC) • I modelli di Calcolo di CSN2 e l’utilizzo delle risorse Un po' di Storia … Tradizionalmente il calcolo degli esperimenti di CSN2 era considerato trascurabile rispetto ai costi dell’esperimento e non richiedeva impegni significativi in termini organizzativi. La problematica principale riguardava (e riguarda in molti casi tuttora) le simulazioni. Gia’ ai tempi dei primi esperimenti presso i LNGS (MACRO) il grosso dello sforzo era concentrato sulle simulazioni. L’avvento di esperimenti come VIRGO e ARGO ha aumentato la rilevanza del calcolo in CSN2. Molti esperimenti hanno iniziato a considerare il calcolo come una parte dell’esperimento stesso (CSN1) La nascita di LHC ha spinto INFN a riorganizzare le sue strutture di calcolo e a far nascere realta’ come il CNAF e i Tier2 Un po' di Storia … L’INFN ha spinto tutti gli esperimenti a calcolare al CNAF per quanto possibile fornendo le risorse CNAF gratuitamente alle CSN. Cio’ era possibile grazie a al fondo speciale di ~ 21.5 M€ che l’INFN aveva stanziato per il CNAF. Molti esperimenti di CSN2 vengono “motivati” a calcolare al CNAF. Nel 2007 ci si rende conto che il fondo non e’ sufficiente per soddisfare tutte le esigenze di LHC e dal 2008 le risorse aggiuntive da allocare al CNAF nonLHC devono essere a carico delle commissioni. Con il bilancio 2009 il fondo si esaurisce. Dal 2010 anche le risorse aggiuntive LHC vanno a carico delle commissioni (CSN1-CSN3) Dati i tempi tipici di una gara CNAF il collegio dei referee suggerisce all’INFN di istituire un fondo tampone (2 M€) per permettere al CNAF di gestire le gare in temi utili per LHC. L’INFN assegna per il 2010 2M€ “extra” per CNAF-LHC (+ BFactory?) Questo NON e’ il fondo tampone richiesto dai referee, ma il meccanismo parte ugualmente. La struttura a Tier Inizialmente presenti e logicamente motivati i Tier3 scompaiono in Italia Tier3 La struttura a Tier Oltre ad un centro di calcolo regionale (Tier1) il modello di calcolo LHC prevede la creazione di alcuni centri di calcolo “minori” destinati all’analisi dati degli esperimenti. Questi centri (Tier2) sono associati allo specifico esperimento (per cui avremmo Tier2 di Atlas o di CMS anche fisicamente nella stessa sede). Nel modello di calcolo LHC tali centri sono dotati di potenza di calcolo e di disco, ma non di unita per l’archiviazione di massa (tape). INFN e le relative CSN coinvolte hanno deciso che la logistica per la realizzazione di questi centri non doveva gravare sulle commissioni. I centri sono stati realizzati con fondi di sezione, fondi universitari, progetti vari e contributi ordinari da dotazioni. I Modelli di Calcolo di CSN2 Inquadrare i modelli di Calcolo degli esperimenti di CSN2 all’interno dell’infrastruttura messa a punto dall’INFN non e’ cosa banale. CSN2 ha esperimenti estremamente eterogenei con problematiche molto diverse situati in regioni geografiche lontane. Non tutti gli esperimenti sono riusciti a inserirsi proficuamente nel modello a Tier proposto da LHC. L’idea del calcolo distribuito, però, e’ stata utile in molte situazioni. In particolar modo si presta bene ad affrontare il problema delle simulazioni in molte tipologie di esperimenti: software di simulazione comune, installazione semplice, esperienza gia’ accumulata (una scuola?). Per molti esperimenti c’e’ tutt’ora la “volontà” di allocarsi le risorse in sede anche se non chiaramente necessarie ed a fornire con riluttanza dettagli che le giustifichino. Status del CNAF Status del CNAF Il Piano per il CNAF Chi Utilizza il CNAF AMS2 Schema di Calcolo Attualmente l’esperimento non prevede l’utilizzo di GRID Struttura a Tier JFK CERN Ricostruzione e backup (Tier0) CASTOR CNAF CASTOR Sez. Sez. Analisi finali (Tier3) Sez. Master Copy e Simulazioni MonteCarlo (Tier1) Sez. Sez. AMS2 Finanziamento (k€) CNAF Altro 2008 1 <5 2009 5 <5 Risorse al CNAF nel 2009 Previsto Assegnato CPU (kSi2k) 25 Disco (TB) 9 8+9 Nastro (TB) 30 39.2 2010 52 <5 Usato 23 7 33.5 Picco (solo CPU) 1613 ARGO-YBJ Schema di Calcolo Uso di GRID per le simulazioni Tibet Pechino Ricostruzione, backup e Simulazione (Tier0) CNAF CASTOR Analisi ad alta statistica e Simulazioni (Tier2) Sez. Analisi finali (tier3) Sez. Napoli Roma3 Sez. Sez. Sez. ARGO-YBJ Finanziamento (k€) CNAF NA-RM3 Altro 2008 47 30 <10 2009 30 30 <10 Risorse al CNAF nel 2009 Previsto Assegnato CPU (kSi2k) 150 Disco (TB) 120 125 Nastro (TB) 380 320 2010 34 15 <10 Usato 309 107 286 Picco (solo CPU) 2007 MAGIC Schema di Calcolo L’esperimento usa saltuariamente GRID per le simulazioni Canarie Barcellona Ricostruzione e backup dei dati (tier0) CNAF Sez. Analisi finali (Tier3) Sez. Sez. MonteCarlo (Tier2) Sez. MAGIC Finanziamento (k€) CNAF Altro 2008 4 <5 2009 19 <5 Risorse al CNAF nel 2009 Previsto Assegnato CPU (kSi2k) 80 Disco (TB) 20 42 Nastro (TB) 30 47 2010 0 <5 Usato 69 39 22 Picco (solo CPU) 5768 FERMI Schema di Calcolo L’esperimento usa GRID per le simulazioni e la distribuzione dei dati SLAC Ricostruzione e backup dei dati (Tier0) CNAF Sez. Sez. Analisi finali (Tier3) Simulazioni MonteCarlo e analisi (Tier1) Sez. Sez. Sez. FERMI Finanziamento (k€) CNAF Altro 2008 6 63 2009 56 32 Risorse al CNAF nel 2009 Previsto Assegnato CPU (kSi2k) 150 Disco (TB) 60 10 Nastro (TB) 40 0 2010 14 67 Usato 24 Picco (solo CPU) 452 PAMELA Schema di Calcolo Pamela utilizza la GRID per simulazioni e analisi I dati dalla russia arrivano al CNAF dove avviene il backup Russia Ricostruzione e backup (Tier0) Sez. CASTOR CNAF Sez. Sez. Sez. Le analisi e le simulazioni vengono eseguite in sezione anche attraverso GRID (Tier2) PAMELA Finanziamento (k€) CNAF Altro 2008 6 5 2009 37 43 Risorse al CNAF nel 2009 Previsto Assegnato CPU (kSi2k) 70 Disco (TB) 48 41 Nastro (TB) 48 44 2010 3 55.5 Usato 56 23.5 40 Picco (solo CPU) 1075 VIRGO Schema di Calcolo Utilizzo di GRID per alcune analisi ad alto utilizzo di CPU Primo backup dei Dati a Cascina (Tier0) Lione Sez. Cascina backup CASTOR Processamento e Analisi (Tier1) Sez. CNAF Sez. Nelle sezioni solo analisi finali (Tier3) RM1 Sez. Sez. GRID VIRGO Finanziamento (k€) CNAF RM1 Altro 2008 98 50 33 2009 206 10 32 Risorse al CNAF nel 2009 Previsto Assegnato CPU (kSi2k) 1000 Disco (TB) 300 314 Nastro (TB) 300 163 2010 218 0 14 Usato 303 187.5 155 Picco (solo CPU) 2297 AUGER Finanziamento (k€) CNAF LNGS Altro Argentina 2008 0 6 0 2009 0 0 <5 L’esperimento usa GRID per le simulazioni Ricostruzione e backup (tier0) Analisi finali (tier3) Sez. backup Lione Simulazioni Monte Carlo e analisi intense (Tier1) Sez. 2010 57 0 <5 CNAF Sez. Sez. OPERA Finanziamento (k€) Altro 2008 31 2009 40 2010 48 Utilizzo di GRID molto difficile Sez. Master Copy del DB delle emulsioni (tier0??) Sez. Sez. Giappone Scanning delle emulsioni e analisi finale (tier3??) CNAF Lione ICARUS Finanziamento (k€) Altro 2008 18 2009 0 2010 <5 Approccio tradizionale. Un centro di calcolo presso la sede dell’esperimento piu’ risorse in sede per analisi finale. Non si prevede utilizzo di GRID LNGS Sez. Sez. Sez. Sez. WARP Finanziamento (k€) LNGS Altro 2008 0 13.5 2009 0 0 2010 50 <5 Approccio tradizionale. Un centro di calcolo presso la sede dell’esperimento piu’ risorse in sede per analisi finale. Non si prevede utilizzo di GRID LNGS Sez. Sez. Sez. Sez. Indagine 2007 LNGS Experiment AUGER BOREX GERDA ICARUS OPERA WARP TOTALE CPU KSI2K 64 80 5 80 7 27 263 2008 2009 2010 DISK TAPE CPU DISK TAPE CPU DISK TAPE TB-N TB KSI2K TB-N TB KSI2K TB-N TB 13 12 120 22 18 180 29 24 5 5 120 11 10 200 14 15 1 0 7 10 10 12 20 20 20 100 90 20 200 90 20 300 10 30 7 30 90 7 50 150 14 45 27 24 90 27 34 135 63 192 371 117 418 516 167 644 Molti esperimenti richiedono di collocare le loro risorse di calcolo presso i Laboratori Nazionali del Gran Sasso. Questa tendenza può essere giustificata per gli esperimenti che sono al Gran Sasso. Si ritiene ragionevole che il Gran Sasso possa svolgere un ruolo importante per il calcolo per gli esperimenti di gruppo 2. Affinché cio’ sia realizzabile occorre che siano verificate alcune condizioni fondamentali: Disponibilità del Laboratorio a svolgere questo ruolo Disponibilità del personale Disponibilità delle infrastrutture (spazi, potenza elettrica, impianti di condizionamento, etc.) Disponibilità economica CSN2 L’investimenti in Calcolo k€ CNAF CSN2 CNAF +Virgo 2008 64 162 2009 147 353 2010 160 378 Altre sedi 295 233 300 Totale CSN2 Totale +Virgo 359 (82%) 457 (65%) 380 (61%) 586 (40%) 460 (65%) 678(44%) “Costringere” gli esperimenti a presentare modelli di calcolo e a confrontarsi con altri anche nell’organizzazione del calcolo permette di ottenere significative economie ma anche di dare la giusta rilevanza all’analisi e gestione e dei dati e simulazioni introducendo dei protocolli e degli schemi che standardizzano molti processi di analisi. In passato alcuni progetti non hanno mai completato alcune analisi in quanto il lavoro era affidato alla buona volontà di qualche PhD che per la sua tesi iniziava e portava a termine un filone di analisi. In molti casi il lavoro terminava con la “scomparsa” del PhD. Spesso era difficile se non impossibile continuarlo anche se un nuovo studente era disponibile in un’altra sede. La sistematicità degli studi non era sempre soddisfacente.