WS CCR, Genova, 30 maggio 2013
MODELLI DI
CALCOLO IN CSN3
Rosario Turrisi
ESPERIMENTI IN CSN3
4
2
Nuclear astrophysics and
1
Phase transitions of nuclear
interdisciplinary researches
3
and hadronic matter
Quarks and
Nuclear structure and
hadron dynamics
reaction dynamics
ALICE
Studio della produzione del QGP in
collisioni tra ioni pesanti ultrarelativistici
EXOCHIM
Collisioni tra Ioni pesanti stabili ed esotici
alle energie del tandem ed intermedie
636 ric/tec (+tecnici), 477.7 FTE (0.75 FTE/pers)
FAM-RD
ROSARIO TURRISI
Struttura iperfine dell’idrogeno muonico e
raggio e.m. del protone
30/5/2013
2
ALCUNE OSSERVAZIONI
 Gruppi di varie dimensioni: dai 2.3 FTE di ULYSSES ai 142 di ALICE
 …inseriti in collaborazioni di varie dimensioni (da alcune unità alle 1330 di ALICE)!
 La dimensione della collaborazione non è un indice della strategia di calcolo
 Spesso I piccoli gruppi collaborano mettendo a comune idee, risorse umane, hardware
 Quadro frammentato, diversi linguaggi, paradigmi, filosofie di storage…
…ma funziona tutto molto bene!
125
 FTE: 478/211 TOT/GRID
198
142
220 1300
410
<FTE>=21±29…
 Finanziamento 2013 (k€):
ALICE: 330, altri: ~108, tra cui
PANDA
AGATA/GAMMA
31
25.5
ROSARIO TURRISI
JLAB12
21
EXOCHIM
14
30/5/2013
3
PANDA: COME E PERCHÉ
 Più di 410 membri da 54 istituti distribuiti in 17 paesi.
ROSARIO TURRISI
30/5/2013
4
PANDA: LA SFIDA DEL RATE…
ROSARIO TURRISI
H.Xu, Introduction to PANDA Trigger and Data Acquisition System,TIPP11, Chicago
30/5/2013
5
‘’PANDAROOT’’
ROSARIO TURRISI
30/5/2013
6
ROSARIO TURRISI
30/5/2013
7
ROSARIO TURRISI
30/5/2013
8
ROSARIO TURRISI
30/5/2013
9
ROSARIO TURRISI
30/5/2013
10
ROSARIO TURRISI
30/5/2013
11
ROSARIO TURRISI
30/5/2013
12
ROSARIO TURRISI
30/5/2013
13
ROSARIO TURRISI
30/5/2013
14
ROSARIO TURRISI
30/5/2013
15
ROSARIO TURRISI
30/5/2013
16
ROSARIO TURRISI
30/5/2013
17
ROSARIO TURRISI
30/5/2013
18
AGATA
ADVANCED GAMMA TRACKING ARRAY
Stesso gruppo italiano di GAMMA/GALILEO, esperimenti in fase di presa dati e/o upgrade
180 hexagonal crystals 3 shapes
60 triple-clusters
all equal
Inner radius (Ge)
23.5 cm
Amount of germanium
362 kg
Solid angle coverage
82 %
36-fold segmentation 6480 segments
Singles rate
~50 kHz
Efficiency: 43% (Mg=1) 28% (Mg=30)
Peak/Total: 58% (Mg=1) 49% (Mg=30)
6660 high-resolution digital electronics channels
Detectors operated in position-sensitive mode 
Digital EDAQ + Pulse Shape Analysis + g-ray Tracking
Coupling to ancillary detectors for added selectivity
ROSARIO TURRISI
30/5/2013
19
AGATA DEMONSTRATOR + PRISMA
LNL 2009-2011 (~8% OF THE FULL ARRAY)
AGATA
PRISMA
Beam line
Reaction
chamber
ROSARIO TURRISI
30/5/2013
20
DATA PROCESSING, PSA AND TRACKING
Highly segmented
HPGe detectors
Identified
interaction points




g
(x,y,z,E,t)i
Reconstruction of
interaction tracks
(tracking algorithms
on interaction points)
Pulse Shape Analysis
of the recorded waves
DAQ - FARM
Synchronized digital
electronics to digitize
(14 bit, 100 MS/s) and
process the 38 signals
of each crystals
Store Raw Data
(10 kB/evt/crystal)
~100 MB/s total
ROSARIO TURRISI
On-line analysis of
reconstructed
g-rays21
30/5/2013
STRUCTURE OF COMPUTING SYSTEM
Det#1
Det#2
Det#3
············
FEE Readout
············
············
Preprocessing
Ancillary Detector(s)
FEE Readout
············
*
Det#N
FE Electronics
Preprocessing
Data Readout
PSA
~ 95 % of CPU time
spent in the PSA
*
Local Level (detectors don’t know of each other)
Global Level
Event Builder
Disk Write Rates
* Raw ~100 MB/s (total)
* PSA ~5 MB/s (total)
* Tracked ~10 MB/s
Merge
Tracking
*
Physical Analysis
ROSARIO TURRISI
PSA
Each box represents one task
managed by the ADA distributed
computing system NARVAL
(or by off-line C++ emulators)
Data processing implemented in C++
and loaded as shared libraries in the
NARVAL environment
Data formatting and flow managed by
the adf C++ library
22
30/5/2013
ROSARIO TURRISI
30/5/2013
23
ROSARIO TURRISI
30/5/2013
24
AGATA: SOMMARIO
 Le esigenze di calcolo di AGATA sono legate all'analisi della forma dei segnali
prodotti dai rivelatori al germanio (Pulse Shape Analysis, PSA)
 un'analisi abbastanza pesante in termine di CPU
 effettuata in tempo reale dalla farm di acquisizione (a Legnaro/GSI/GANIL), composta da ~30
macchine per un totale di 250 (LNL) o 500 (GSI) cores
 Se la PSA in tempo reale è stata effettuata correttamente, le necessità di calcolo
successive sono abbastanza modeste
 Esperimento in fase iniziale, algoritmi PSA non del tutto maturi -> raw su disco per
analisi off-line
 anche con le farm di acquisizione quando non utilizzate
 Maggior impegno attuale: gestione dei 150 TB/y (dati raw)
 Soluzione attuale: storage su GRID
 Gli utenti creano copie locali (VO AGATA): 350 TB @ Lione, 150 TB @ CNAF
 Gruppo di lavoro in AGATA per l’uso di GRID per il ‘’replay’’ dei dati in piena attività
(porting del codice, scrittura procedure di automatizzazione)
 Intanto si usano farm di acquisizione o locali per l’elaborazione dei dati
 Mi/Pd/LNL hanno piccole farm con 50-100 TB su disco, essenziali per l’analisi
ROSARIO TURRISI
30/5/2013
25
JLAB12: GLI ESPERIMENTI
 Upgrade in corso per permettere a CEBAF di raggiungere 12 GeV (2x)
 3 sale sperimentali con rivelatori dedicati + una quarta in costruzione
 Hall A polarimetro + spettrometri, in programma estensione range cinematico, alta luminosità
 Hall B target polarizzato + spettrometro a grande accettanza CLAS  CLAS12 per 1035 cm-2s-1
 Hall C misure in coincidenza ad alta risoluzione con 2 spettrometri, HMS+nuovo ad angolo variabile
 Hall D misure di brehmsstralung: γ, PID , coincidenza con particelle cariche (nuova sala)
ROSARIO TURRISI
30/5/2013
26
JLAB COMPUTING MODEL
 Una analisi: ~400 GB su disco ( + ~ 50% per simulazione)
 La simulazione è distribuita al 50% tra JLAB e farm locali
 ‘’T0’’ + ‘’T1’’ ad es. a Norfolk
 I dati (latency da alcuni anni ad alcuni mesi, JLAB12->15y) sono elaborati a
JLAB -> produzione dei ‘’dst’’
 3 mesi presa dati -> ~3 mesi ricostruzione
 comnservata la possibiltà di upstream
(~10% dei dati da riprocessare)
 dst= 4-impulsi + banche dei singoli rivelatori
 Copia locale dei dst (occupano ~ 1/10 dei raw)
 Localmente: ‘’filtratura’’ dei 4-impulsi per l’analisi finale
ROSARIO TURRISI
30/5/2013
27
ROSARIO TURRISI
30/5/2013
28
JLAB12 – IN SINTESI
JLAB
 Non c’è un modello unico e molti protocolli sono guidati dall’esperienza
 Utilizzo di software sviluppato localmente dai gruppi
 Non è stata sentita l’esigenza della transizione a GRID ‘’causa dimensioni’’
JLAB12
 Upgrade della macchina e degli esperimenti
 Upgrade anche del calcolo:
 GRID ?
 CLOUD ?
 Attualmente si discute se fare il salto direttamente alla Cloud
 Saltare la transizione a Root e ai protocolli GRID o GRID-like
 CLOUD, JAVA-based future?
ROSARIO TURRISI
30/5/2013
29
JLAB12: SVILUPPI
 CLARA, CLAS12 Reconstruction and Analysis Framework
 Graphical interface for software design
 Data-flow driven
 Contributi da esperti (ma non di software)
 Dall’oggetto (nel senso del C++) al servizio (da OOA a SOA):
 CLARA si occupa di collegare in maniera opportuna, ‘’at runtime’’ i servizi necessari
a ottenere il flusso di dati desiderato
 CLARA mira a distinguere nettamente tra il service programmer (ex
‘’core offline team’’) e l’application developer (il fisico che scrive il flusso
per l’analisi) che invece si occupa della ‘’orchestration’’…
ROSARIO TURRISI
30/5/2013
30
CLARA – UN’APPLICAZIONE
ROSARIO TURRISI
30/5/2013
31
n_TOF: UN ESEMPIO PARTICOLARE
 Analisi dei prodotti di fissione ed emissione γ
 Parametri dei rivelatori già studiati e fissati
 Ricostruzione automatizzata
 Cronjob: controllo esistenza nuovi file dati raw e successiva elaborazione
 AFS+LXBATCH+CASTOR (supporto da CERN-IT)
 librerie dedicate, software sviluppato localmente
 500 TB/y: parte più ‘’critica’’, gestita interamente al CERN
 In fase di sviluppo sistema di librerie a ‘’plugin’’ (codice per facilitare
l’aggiunta di un’analisi ad es. da un newcomer…)
ROSARIO TURRISI
30/5/2013
32
L’INDAGINE PIÙ EFFICACE (IN TEMPO REALE)
 RT: ‘’Ciao XX, devo fare un talk alla CCR, mi puoi dare qualche info sul vostro computing model?’’
 XX: ‘’In che senso?’’
 RT:’’…voglio dire…cioè…insomma da quando il rivelatore produce i raw data al plot sull’articolo, che
strategia avete adottato”
 XX:’’Mah, sai, oguno fa sul suo pc…’’
 RT:’’Ma quanti dati fate per anno?”
 XX:’’Diciamo due tera’’
 RT:’’…ah…ok, grazie. Ciao.
 XX:’’Ciao’’
ROSARIO TURRISI
30/5/2013
33
ALCUNE CONCLUSIONI…
o CLOUD o ‘’next thing’’…
ROSARIO TURRISI
30/5/2013
34
Grazie (anche) a:
Marco Battaglieri, Dino Bazzacco, Marco Calviani, Roberto Menegazzo, Stefano Spataro
GRAZIE DELL’ATTENZIONE
ROSARIO TURRISI
30/5/2013
35