Piano di calcolo dell`esperimento HERA-B

Bologna, 27 aprile 2000
Piano di calcolo dell’esperimento HERA-B
Introduzione
Questo piano di calcolo si propone di individuare le risorse di cui il gruppo italiano si deve dotare
per l’elaborazione dei dati acquisiti dall’esperimento.
Ai sistemi di calcolo off-line, nell’esperimento HERA-B, sono demandati i seguenti compiti:
• produzione degli eventi simulati Monte Carlo;
• analisi dei dati.
Il compito di ricostruire gli eventi reali è invece lasciato alla farm del trigger di quarto livello,
facente parte del sistema on-line.
La farm on-line del DESY è il centro di produzione dei dati reali, che vengono salvati sia in
formato DST, sia in formato mini-DST, mentre i sistemi off-line sono i centri di produzione dei
dati Monte Carlo, anch’essi salvati in formato DST e mini-DST.
L’analisi dei dati utilizza i mini-DST e talvolta i DST. Il trasporto dei dati dal DESY ai centri
periferici (dati reali) o viceversa (dati Monte Carlo) avviene prevalentemente mediante cassette
DLT 7000.
Lo sviluppo e la verifica del software off-line, così come le prime produzioni di eventi Monte
Carlo — dedicate prima all’ottimizzazione dei rivelatori e del sistema di trigger e poi alla
simulazione di canali fisici di reazione — si sono basate finora prevalentemente su alcune
macchine acquistate dal DESY e sui computer che i gruppi hanno ereditato da precedenti
esperimenti. I sistemi di calcolo nuovi in possesso dei gruppi sono essenzialmente prototipi di
piccola dimensione.
I computer utilizzati finora sono tuttavia inadeguati all’analisi di massa degli eventi: o perché
possiedono dimensioni prototipali, o perché possiedono un’età non trascurabile (se paragonata
al tempo di invecchiamento dei computer) e provengono da esperimenti con requisiti di potenza
di calcolo assai inferiori.
L’acquisto di nuovi strumenti per il calcolo, che è stata fino ad ora rinviata — nel quadro della
just in time purchase strategy che si avvantaggia del decadimento dei prezzi — si impone ora
come esigenza improcrastinabile per procedere nell’elaborazione dei dati che l’esperimento
produce.
Requisiti per la simulazione
Il numero di eventi simulati che deve essere prodotto dipende dal numero di eventi reali e di fondo
acquisiti durante la presa dati.
Fissiamo il numero di eventi di segnale che debbono essere simulati in un ammontare pari a 10
volte il numero di eventi di segnale reali.
Il numero di eventi reali di segnale di interesse può essere stimato in 2×104, come risulta dalla
tabella 1.
Tab. 1. Numero di eventi atteso in un anno ()totbb = 12 nb, 40 MHz).
Canale
eventi/anno
B0 J/4 K0s
1500
B0 J/4 K*0
B+ J/4 K+
B+ J/4 K*+
B0s J/4 0
J/4 B D 5 B D %
B D % % %
B % %
B % a.
B ' K
b
0
(*)
s
s
0
s
0
1500
1500
500
900
+
200
+
+
200
0
+
0
±
1
+
7000
(*)
s
(*)
s
s
+
5500
0
Totale
+
800
300
500
20400
Noi richiediamo perciò di produrre 2×105 eventi Monte Carlo di segnale. La produzione di
eventi Monte Carlo richiede i seguenti passaggi:
• generazione degli eventi fisici (p. es. mediante PHYTIA); vengono quindi effettuati i tagli di
accettanza per selezionare soltanto quegli eventi che il rivelatore può vedere;
• tracciamento (usando GEANT) attraverso il rivelatore per produrre le informazioni sui
rivelatori colpiti; questo è il compito più gravoso, in quanto in un evento tipico di HERA-B,
con 4 interazioni, vi sono circa 60 tracce primarie e 200 tracce prima del calorimetro;
• digitalizzazione, per simulare la risposta dei rivelatori
• triggering, per selezionare quegli eventi che avrebbero fatto scattare il trigger
dell’esperimento.
• ricostruzione totale del campione di eventi sopravvissuti al trigger
• applicazione dei tagli di analisi al campione di eventi ricostruiti.
Il tempo di CPU richiesto per produrre 2×105 eventi simulati è mostrato in tabella 21.
Tab. 2. Tempo di CPU (normalizzato allo SPECint95) richiesto per produrre 2×105 eventi
Monte Carlo.
eventi
#
tempo di CPU/evento
tempo totale di CPU
[SI95 # s/evt]
[CPU99 # s/evt]
[SI95 # s]
[CPU99 # s]
Generazione
1.8×107
200
10
3.6×109
1.8×108
Tracciamento
1.3×107
1000
50
1.3×1010
6.5×108
Digitalizzazione
1.3×107
100
5
1.3×109
6.5×107
Trigger
1.3×107
100
5
1.3×109
6.5×107
Ricostruzione
1.3×106
250
13
3.25×108
1.7×107
2×105
20
1
4×106
2×105
1670
84
2×1010
109
Tagli finali
Totale
Considerando un duty-cycle del 70%, il tempo di CPU richiesto per produrre 2×105 eventi di
segnale è pari a 3×1010 SI95 # s.
A questo tempo occorre aggiungere il tempo di CPU necessario per produrre gli eventi di
fondo (si ricordi che in HERA-B il rapporto segnale su fondo è )bb /)inel=106). Supponendo di
effettuare i tagli sul fondo il più presto possibile nella sequenza di simulazione e di riutilizzare i
dati di generazione del fondo per successive simulazioni (anche se a spese della memoria di
massa), possiamo fissare il tempo di calcolo richiesto per la produzione del fondo a un fattore
dieci rispetto al segnale, cioè 3×1011 SI95 # s. Il tempo totale di CPU per la produzione Monte
Carlo sale così a 3.3×1011 SI95 # s.
Se richiediamo che la produzione possa essere effettuata in un anno (3×107 s), la potenza di
CPU richiesta diviene 1.1×104 SI95, pari a 550 CPU99.
La quota spettante alla parte italiana della collaborazione, pari al 5% del totale, sarà perciò di
550 SI95, equivalenti a 28 CPU99.
Come broker per la gestione dei job pensiamo di utilizzare Condor, che consentirebbe anche
di utilizzare altre macchine della Condor-farm INFN e soprattutto di ottimizzare lo sfruttamento
delle risorse di calcolo in ambito INFN. Riteniamo tuttavia che non sia da sovrastimare l’apporto
che le macchine esterne possono dare al nostro piano di calcolo, in quanto, sotto Linux, sono
disponibili attualmente 30000 MIPS corrispondenti a circa 750 SI95 (considerando uno SI95
equivalente a 40 MIPS), peraltro utilizzati anche da altri esperimenti, come CMS.
Requisiti per l’analisi di produzione
L’analisi di produzione opera sui dati ricostruiti in formato mini-DST, seleziona eventi
corrispondenti a canali di reazioni omogenee e li salva — separatamente per canale di reazione
— in formato più sintetico sui -DST (n-ple). Inoltre scrive file di TAG che consentono di
1
Dove si indica con SI95 lo SPECint95 e si definisce 1 CPU99 = 20 SPECint95
rintracciare gli eventi sui mini-DST e sui DST.
L’analisi di produzione può essere eseguita 3-4 volte l’anno sullo stesso campione, in seguito
alla messa a punto degli algoritmi di selezione, e ragionevolmente deve poter essere completata
in alcuni giorni.
Il tempo di CPU richiesto per l’analisi di produzione è 1.2 SI95 # s/evt, che, moltiplicato per
il numero di eventi reali prodotto in un anno, 2.4×108, dà un tempo totale di CPU pari a 2.9×108
SI95 # s. Se richiediamo di svolgere l’analisi in 7 giorni, la potenza di calcolo richiesta è pari a
circa 500 SI95, ovvero 25 CPU99.
A differenza della produzione Monte Carlo, che non ha particolari richieste di I/O, l’analisi di
produzione accede ai DST prodotti in un anno, per un totale di 1.2 TB di mini-DST, e talvolta
può pure richiedere l’accesso a una parte dei DST (stimata in 200 GB), che debbono essere
residenti su disco e di rapido accesso in lettura.
La richiesta di svolgere l’analisi in 7 giorni comporta poi una velocità di trasferimento dati in
lettura di 16 Mbps.
Requisiti per l’analisi utente
L’analisi utente viene eseguita dal singolo fisico in maniera semi-interattiva, cioè con un tempo
di risposta di alcune ore, sui file di n-ple (-DST).
L’analisi utente viene eseguita tipicamente su di un campione di eventi più grande di un’ordine
di grandezza del numero atteso di eventi di segnale, vale a dire, per una tipica analisi di 1000
eventi, su di un campione di 104 eventi.
Il tempo di CPU richiesto è di circa 20 SI95 # s/evt, ovvero, in totale, 2×105 SI95 # s. La
richiesta di terminare l’analisi entro 4 ore può essere soddisfatta da una potenza di calcolo pari
a 14 SI95.
Se si prevede, come è ragionevole, di svolgere 4 analisi simultanee, la potenza di calcolo
complessiva richiesta è pari a 60 SI95, ovvero 3 CPU99.
Requisiti di memoria di massa
L’ammontare di spazio du disco richiesto è pari a circa 1.7 TB, dei quali, 1.2 TB per contenere
la produzione completa annuale di mini-DST, 200 GB per contenere una parte dei DST, infine
300 GB di spazio di lavoro.
Architettura
L’architettura proposta è così costituita:
• uno switch ethernet 100Base-TX cui sono connessi:
• un server multiprocessore basato su CPU Intel Pentium III Xeon, usato come file-server
(NFS) e per compiti di analisi con alto throughput;
• una farm costituita da PC biprocessore basati su CPU Pentium III standard.
Il server dovrebbe contenere 1.4 TB di disco a rapido accesso, specialmente in lettura. La
soluzione più appropriata ci sembra quella di utilizzare almeno 2 interfacce SCSI LVD
indipendenti e due disk-array in architettura RAID 5. L’architettura RAID 0 (striping), che
consente un più rapido accesso in scrittura e uno sfruttamento del 100% della memoria dei dischi
(contro il 94% del RAID 5 con 16 dischi), è caratterizzata da una fault-tolerance che ci sembra
troppo bassa per la mole di dati.
Sul server è istallato il sistema operativo Linux e tutti gli strumento di sviluppo, editing e
analisi. L’istallazione dei PC della farm è invece minimale, limitata al sistema operativo alle shared
library e a tutto ciò che è indispensabile a runtime, al fine di ridurre il manpower richiesto per la
gestione e l’aggiornamento del sistema.
Costi
La valutazione dei prezzi per il 2001 è stata fatta supponendo che non si renda disponibile nel
frattempo, sul mercato, hardware particolarmente innovativo (come processori IA64) e
considerando un tempo di dimezzamento dei prezzi pari a 1.5a (CPU), 1.4a (dischi) e 2.1a
(registratori su nastro). I prezzi non sono comprensivi di IVA.
anno 2000
• Switch Ethernet 24 porte 100Base-TX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 MA
• Server Intel
4×Pentium III Xeon 533 MHz, 2 MB cache (23.6 SI95),
1.5 GB RAM,
18 GB SCSI LVD HDD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 MA
• Disk Array
5 canali RAID
128 MB cache
16 × 50 GB HDD (0.8 TB in RAID 0, 0.75 TB in RAID 5) . . . . . . . . . . . . . . . 65 MA
• 5×PC biprocessore
2×Pentium III 533 Mhz (22.3 SI95),
20 GB EIDE HDD,
256 MB RAM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5×5 MA
Totale 317 SI95, 075 TB HDD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 MA
anno 2001
• 4×Processore aggiuntivo per Server Intel
Pentium III Xeon 533 MHz, 2 MB cache (23.6 SI95) . . . . . . . . . . . . . . . . . . . 4×8 MA
• 9×PC biprocessore
2×Pentium III 800 Mhz (38.4 SI95),
20 GB EIDE HDD,
256 MB RAM (38.4 SI95) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9×5 MA
• Disk Array
5 canali RAID
128 MB cache
16 × 50 GB HDD (0.8 TB in RAID 0, 0.75 TB in RAID 5) . . . . . . . . . . . . . . . 40 MA
• DLT tape library
70 cassette
3 driver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 MA
Totale 786 SI95, 0.75 TB HDD, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 MA