Computing di BaBar
Fabrizio Bianchi
Universita’ di Torino e INFN Sez. di Torino
Roma, 20 novembre 2007
1
Sommario

Overview del computing di BaBar

Contributo INFN

Attivita’ 2008

Previsioni per il 2009-2011
2
Overview del Computing di BaBar

Attivita’ :



Produzione: Prompt Reconstruction, Simulation Production,
Skimming
Analisi
Distribuito su diversi centri: SLAC, IN2P3, Gridka,
RAL-Manchester, Padova, CNAF

SP utilizza anche GRID e farm di calcolo universitarie
3
PR: typical single run processing
Run
taking
0
2
PC
Importing
conditions at
Padova
24
ER
Exporting
ROOT to
SLAC
44
48
Hours after the end of run recording
Prompt Calibration a SLAC, Event Reconstruction a Padova
4
Simulation Production

Sforzo distribuito su ~20 siti.

Eventi generati vengono trasferiti a SLAC e qui skimmati
e distribuiti ai centri di analisi

Si sono prodotti fino a 260 Milioni di eventi / settimana
5
SP: contributo INFN

~10% del totale

Farm di Roma (G. Cavoto, R. Faccini)

INFN-GRID: E. Luppi, D. Andreotti (Ferrara), A. Fella
(CNAF)



Siti coinvolti: CNAF, Ferrara, Napoli, Padova, Catania, Bari,
Perugia, Pisa.
Server Xrootd per CDB e BKG installati a: CNAF, Ferrara,
Padova, Pisa.
ProdTools installati sulla UI (User Interface) del CNAF e
integrati con l'ambiente GRID.
6
Skimming

Gli eventi vengono selezionati in ~200 stream.


Un evento puo’ essere selezionato in piu’ stream
Fattore di espansione dei dati: 4-5

Deep Copy o Pointer Skim per ottimizzare dimensione
dati e velocita’ di accesso

Skimming a SLAC (~90%), Gridka, RAL-Manchester
(su GRID), Padova (in background rispetto ad ER)
7
Farm di Padova

Attivita’: ER e skimming

Manpower: R. Stroili, P. Solagna, G. Castelli, A. Crescente + ER
shifters

Hardware:




330 nodi di calcolo: fino a 2 fb-1/ giorno (ER)
22 data servers: 31TB spazio disco
Due librerie L700, capacita` 1400 cassette, fino a 560TB di dati
Nuovo Hardware in arrivo:



30 macchine biprocessori quad core
Una libreria da 500 slot
Per le altre librerie: quattro drive LTO4
8
CNAF

Netto miglioramento dei servizi.



Attivita’: Analisi ed SP su GRID


Downtime nel 2007 comparabili con altri centri
Qualche preoccupazion per i lavori strutturali 2008
D-mixing osservato al CNAF
Manpower: A. Fella, L. Ligioi + altro personale CNAF
9
CNAF

SP accede ai working nodes via GRID, job analisi via
LSF (N.B.: non ci sono wn riservati a BaBar)

Hardware dedicato:



17 servers: databases, aree utenti, scratch, data import,
software di esperimento
6 nuovi servers in arrivo per rimpiazzare macchine obsolete
~250 TB di spazio disco per i dati

150 TB aggiuntivi finanziati nel 2008
10
CNAF: uso della farm
11
Altri Contributi INFN

Skim production: T. Cartaro (Trieste)

Skim software: G. Marchiori (Pisa)

Analysis software: A. Lazzaro (Milano)

Data Quality Manager: S. Tosi (Genova)

Run Quality: M. Pelliccioni (Torino)

Operation Manager: FB
12
Decisioni e nuovi sviluppi

Ci sara’ il reprocessing e la risimulazione dei dati di
run1-6

Aprile-dicembre 2008

SP usera’ Geant4v8 + improvement ai generatori

Phaseout di Objectivity quasi completo

Risparmio sulle licenze
13
Objectivity Phaseout Status

Fully migrated, and Objectivity no longer used in R22:




ROOT read-only conditions database (CDB) is default
for all applications at all sites, except:



Online “ambient” database (history of detector control values)
Configuration database (running on mySQL in IR-2, read-only
ROOT copies elsewhere)
“Spatial” and “temporal” databases used in rolling
calibrations
SLAC uses Objectivity for CDB in online, PC, and skimming
Some scaling issues remain with the ROOT CDB for skimming
To do:


Understand scaling of ROOT CDB for skimming
Deploy writable mySQL CDB in online, PC
14
Attivita’ fino a dicembre 2008








10 fb-1 test di release 24: entro fine novembre
60 fb-1 test di release 24: entro 15 gennaio
Ricostruzione e simulazione dei dati di run7 (previsti 270 fb-1): in
parallelo con la presa dati
Bootstrap reprocessing dei primi ~10 fb-1 di run7: entro aprile
Skimming run7: in parallelo con la presa dati
Reprocessing e risimulazione di run1-6: aprile-dicembre 2008
Skimming run1-6: in parallelo con reprocessing
Obbiettivo: dataset finale in tempo per le conferenze invernali
2009
15
2009-2010

Alta’ intensita’ di Analisi


Migrazione di FTE da attivita’ di servizio ad analisi


Dataset finale disponibile
Compensa diminuzione membri della collaborazione
Produzione prevista:


Skimming sostanziale nel 2009 e piu’ limitato nel 2010 (nuove
analisi)
Limitata SP
16
2011-?

Attivita’ decrescente di analisi


Le collaborazioni LEP stanno ancora pubblicando
Dopo il 2011 si prevede che le attivita’ di analisi
saranno supportate solo a SLAC
17
Computing Professional

Accordo (stabilito < 1999): 6.5 OCF, 8 DOE, 8 non-DOE

Meno corrispondente alla realta’ con il passare degli anni:





Task effetivamente necessari differenti dalla lista originaria
Contributo addizionale di SLAC (fino ad 11 FTE)
Personale nei Tier
Crescenti difficolta’ a riempire le posizioni necessarie a runnare il
computing di BaBar (sia CP che Fisici)
Revisione del meccanismo dei CP (G. Dubois-Felsmann, M.
Morandin, R. Mount) presentato all’IFC di luglio 2007, approvato
per il 2008
18
Computing Professional: 2007

Identificati i task
necessari



Alcuni nella lista
tradizionale
Altri nuovi
Personale TierA ed altri
~10 FTE non inclusi
19
Computing Professional: 2008 ed oltre

Proposta: 25% SLAC, 25% OCF, 50% head count

Non ci sono costi aggiuntivi per l’INFN
20
Necessita’ hardware post 2008




Le attivita’ di produzione cessano nel 2008, salvo coda
nel 2009-2010.
Si prevede una attivita’ di analisi ai livelli 2008 nel
2009-2010, a decrescere negli anni seguenti
Sara’ sufficiente sostituire una frazione dell’hardware
divenuto obsoleto
All’IFC di febbraio verra’ presentato un modello per
calcolare questi costi


Ordine di grandezza 700 (2009), 450(2010), 300(2011) KUSD
Per confronto, nel 2008 il costo e’ ~2700 KUSD
21
Contributo INFN 2009-2011


Padova cessera’ il supporto di BaBar con la fine dello
skimming
CNAF continuera’ ad essere un centro di analisi



CPU sono condivise
Le necessita’ di spazio disco si ridurranno a 150-200 TB dal
2010 (saranno 400 TB nel 2008)
Stima (rozza) contributo INFN per il computing (in
aggiunta al mantenimento del CNAF): 70 (2009), 50
(2010), 40 (2011) KUSD

N. B.: A questi numeri vanno aggiunte le altre voci del CF
22
Conclusioni

Ci stiamo preparando per ottenere il massimo dal run7
e produrre il campione finale di dati in tempo per le
conferenze invernali del 2009

Prevediamo un intenso periodo di analisi nel 2009-2010
ed una attivita’ decrescente a partire dal 2011

All’IFC di febbraio verra’ presentato un modello
dettagliato per il calcolo dei costi
23