Computing di BaBar Fabrizio Bianchi Universita’ di Torino e INFN Sez. di Torino Roma, 20 novembre 2007 1 Sommario Overview del computing di BaBar Contributo INFN Attivita’ 2008 Previsioni per il 2009-2011 2 Overview del Computing di BaBar Attivita’ : Produzione: Prompt Reconstruction, Simulation Production, Skimming Analisi Distribuito su diversi centri: SLAC, IN2P3, Gridka, RAL-Manchester, Padova, CNAF SP utilizza anche GRID e farm di calcolo universitarie 3 PR: typical single run processing Run taking 0 2 PC Importing conditions at Padova 24 ER Exporting ROOT to SLAC 44 48 Hours after the end of run recording Prompt Calibration a SLAC, Event Reconstruction a Padova 4 Simulation Production Sforzo distribuito su ~20 siti. Eventi generati vengono trasferiti a SLAC e qui skimmati e distribuiti ai centri di analisi Si sono prodotti fino a 260 Milioni di eventi / settimana 5 SP: contributo INFN ~10% del totale Farm di Roma (G. Cavoto, R. Faccini) INFN-GRID: E. Luppi, D. Andreotti (Ferrara), A. Fella (CNAF) Siti coinvolti: CNAF, Ferrara, Napoli, Padova, Catania, Bari, Perugia, Pisa. Server Xrootd per CDB e BKG installati a: CNAF, Ferrara, Padova, Pisa. ProdTools installati sulla UI (User Interface) del CNAF e integrati con l'ambiente GRID. 6 Skimming Gli eventi vengono selezionati in ~200 stream. Un evento puo’ essere selezionato in piu’ stream Fattore di espansione dei dati: 4-5 Deep Copy o Pointer Skim per ottimizzare dimensione dati e velocita’ di accesso Skimming a SLAC (~90%), Gridka, RAL-Manchester (su GRID), Padova (in background rispetto ad ER) 7 Farm di Padova Attivita’: ER e skimming Manpower: R. Stroili, P. Solagna, G. Castelli, A. Crescente + ER shifters Hardware: 330 nodi di calcolo: fino a 2 fb-1/ giorno (ER) 22 data servers: 31TB spazio disco Due librerie L700, capacita` 1400 cassette, fino a 560TB di dati Nuovo Hardware in arrivo: 30 macchine biprocessori quad core Una libreria da 500 slot Per le altre librerie: quattro drive LTO4 8 CNAF Netto miglioramento dei servizi. Attivita’: Analisi ed SP su GRID Downtime nel 2007 comparabili con altri centri Qualche preoccupazion per i lavori strutturali 2008 D-mixing osservato al CNAF Manpower: A. Fella, L. Ligioi + altro personale CNAF 9 CNAF SP accede ai working nodes via GRID, job analisi via LSF (N.B.: non ci sono wn riservati a BaBar) Hardware dedicato: 17 servers: databases, aree utenti, scratch, data import, software di esperimento 6 nuovi servers in arrivo per rimpiazzare macchine obsolete ~250 TB di spazio disco per i dati 150 TB aggiuntivi finanziati nel 2008 10 CNAF: uso della farm 11 Altri Contributi INFN Skim production: T. Cartaro (Trieste) Skim software: G. Marchiori (Pisa) Analysis software: A. Lazzaro (Milano) Data Quality Manager: S. Tosi (Genova) Run Quality: M. Pelliccioni (Torino) Operation Manager: FB 12 Decisioni e nuovi sviluppi Ci sara’ il reprocessing e la risimulazione dei dati di run1-6 Aprile-dicembre 2008 SP usera’ Geant4v8 + improvement ai generatori Phaseout di Objectivity quasi completo Risparmio sulle licenze 13 Objectivity Phaseout Status Fully migrated, and Objectivity no longer used in R22: ROOT read-only conditions database (CDB) is default for all applications at all sites, except: Online “ambient” database (history of detector control values) Configuration database (running on mySQL in IR-2, read-only ROOT copies elsewhere) “Spatial” and “temporal” databases used in rolling calibrations SLAC uses Objectivity for CDB in online, PC, and skimming Some scaling issues remain with the ROOT CDB for skimming To do: Understand scaling of ROOT CDB for skimming Deploy writable mySQL CDB in online, PC 14 Attivita’ fino a dicembre 2008 10 fb-1 test di release 24: entro fine novembre 60 fb-1 test di release 24: entro 15 gennaio Ricostruzione e simulazione dei dati di run7 (previsti 270 fb-1): in parallelo con la presa dati Bootstrap reprocessing dei primi ~10 fb-1 di run7: entro aprile Skimming run7: in parallelo con la presa dati Reprocessing e risimulazione di run1-6: aprile-dicembre 2008 Skimming run1-6: in parallelo con reprocessing Obbiettivo: dataset finale in tempo per le conferenze invernali 2009 15 2009-2010 Alta’ intensita’ di Analisi Migrazione di FTE da attivita’ di servizio ad analisi Dataset finale disponibile Compensa diminuzione membri della collaborazione Produzione prevista: Skimming sostanziale nel 2009 e piu’ limitato nel 2010 (nuove analisi) Limitata SP 16 2011-? Attivita’ decrescente di analisi Le collaborazioni LEP stanno ancora pubblicando Dopo il 2011 si prevede che le attivita’ di analisi saranno supportate solo a SLAC 17 Computing Professional Accordo (stabilito < 1999): 6.5 OCF, 8 DOE, 8 non-DOE Meno corrispondente alla realta’ con il passare degli anni: Task effetivamente necessari differenti dalla lista originaria Contributo addizionale di SLAC (fino ad 11 FTE) Personale nei Tier Crescenti difficolta’ a riempire le posizioni necessarie a runnare il computing di BaBar (sia CP che Fisici) Revisione del meccanismo dei CP (G. Dubois-Felsmann, M. Morandin, R. Mount) presentato all’IFC di luglio 2007, approvato per il 2008 18 Computing Professional: 2007 Identificati i task necessari Alcuni nella lista tradizionale Altri nuovi Personale TierA ed altri ~10 FTE non inclusi 19 Computing Professional: 2008 ed oltre Proposta: 25% SLAC, 25% OCF, 50% head count Non ci sono costi aggiuntivi per l’INFN 20 Necessita’ hardware post 2008 Le attivita’ di produzione cessano nel 2008, salvo coda nel 2009-2010. Si prevede una attivita’ di analisi ai livelli 2008 nel 2009-2010, a decrescere negli anni seguenti Sara’ sufficiente sostituire una frazione dell’hardware divenuto obsoleto All’IFC di febbraio verra’ presentato un modello per calcolare questi costi Ordine di grandezza 700 (2009), 450(2010), 300(2011) KUSD Per confronto, nel 2008 il costo e’ ~2700 KUSD 21 Contributo INFN 2009-2011 Padova cessera’ il supporto di BaBar con la fine dello skimming CNAF continuera’ ad essere un centro di analisi CPU sono condivise Le necessita’ di spazio disco si ridurranno a 150-200 TB dal 2010 (saranno 400 TB nel 2008) Stima (rozza) contributo INFN per il computing (in aggiunta al mantenimento del CNAF): 70 (2009), 50 (2010), 40 (2011) KUSD N. B.: A questi numeri vanno aggiunte le altre voci del CF 22 Conclusioni Ci stiamo preparando per ottenere il massimo dal run7 e produrre il campione finale di dati in tempo per le conferenze invernali del 2009 Prevediamo un intenso periodo di analisi nel 2009-2010 ed una attivita’ decrescente a partire dal 2011 All’IFC di febbraio verra’ presentato un modello dettagliato per il calcolo dei costi 23