Talk - Istituto Nazionale di Fisica Nucleare

Babar: uso della rete
Emanuele Leonardi
-
INFN Roma
INFNet Workshop
Bologna - 18-19 Gennaio 1999
L’esperimento Babar
 Babar studierà i risultati degli eventi prodotti alla
risonzanza (4s) dall’acceleratore PEP II di SLAC.
 Scopo dell’esperimento è la misura diretta degli effetti di
violazione di CP attraverso lo studio dei decadimenti dei
mesoni B.
 La collaborazione è composta da circa 800 persone di 87
istituti di ricerca sparsi su 3 continenti (America, Asia,
Europa).
 La presa dati inizierà a maggio del 1999 e durera’
almeno 5 anni.
E.Leonardi - 19/01/99
Babar: uso della rete
2
Dati sperimentali
 La rate di eventi adronici prevista è di circa 10 Hz, per
un totale di circa 10 8 eventi l’anno.
 I dati raccolti saranno elaborati da un sistema software
sviluppato interamente in C++ e inseriti in un database
object oriented (Objectivity).
 Ogni evento sara’ accessibile dal DB con diversi livelli di
dettaglio, ricalcando in parte il modello gia’ usato in
precedenti esperimenti (DST, mini-DST, micro-DST).
 L’organizzazione del DB sarà tale da permettere di
gestire indipendentemente i vari livelli, facilitando la
distribuzione dei dati.
E.Leonardi - 19/01/99
Babar: uso della rete
3
Distribuzione dei dati
 Data la distribuzione geografica della collaborazione e
delle risorse di calcolo, è stato previsto uno schema di
analisi dei dati basato sulla creazione di un certo numero
di Centri Regionali (CR).
 In Europa sono prevsti 3 CR principali: Lione, RAL e
Roma.
 A Lione sarà presente una copia completa dei dati
prodotti a SLAC mentre Roma e RAL si limiteranno ad
importare i formati di dati ridotti (mini- e micro-DST).
E.Leonardi - 19/01/99
Babar: uso della rete
4
Distribuzione dei Dati
AOD, ESD ~ 5TB/anno
AOD, ESD, REC, RAW
200-300 TB/anno
Accesso remoto
E.Leonardi - 19/01/99
Babar: uso della rete
5
Il Centro Regionale
italiano
 L’INFN ha finanziato la creazione di un CR basato al
CASPUR (Roma) dove concentrare la maggior parte delle
attività di analisi dei gruppi italiani, per un totale di circa
70 fisici distribuiti su 12 sedi.
 Nel CR saranno copiati i formati di dati ridotti (mini- e
micro-DST) prodotti a SLAC per un totale di circa 5 TB
l’anno.
E.Leonardi - 19/01/99
Babar: uso della rete
6
La Farm del Centro
Regionale
~ 500 GB RAID
~300 SpecInt95
CPU Servers
Disk Server
Batch Machines (MC)
~ 20 TB
WAN
via INFN Roma1
Central Switch
Software Repository (AFS)
Interactive Machines
E.Leonardi - 19/01/99
Babar: uso della rete
~ 500 GB
Tape and Stage Server
Lock Server
7
Lo storage su nastro
 AMS, il data server di Objectivity, vede unicamente file
attraverso il file system Unix standard.
 A.Hanushewsky (SLAC) ha sviluppato una versione
modificata di AMS che è in grado di interagire con un
sistema di stage su nastro o con un file system
gerarchico stile HPSS o, in generale, con un sistema di
storage ad alta latenza.
 Una versione adattata al sistema di stage del CASPUR è
ora in funzione sulla farm (Dicembre 1998).
E.Leonardi - 19/01/99
Babar: uso della rete
8
Network
 Il CR è connesso alla infrastruttura GARR-B attraverso la
connessione della Sezione di Roma dell’INFN (8 Mbps).
FastEthernet
Rame
Fibra
ATM 8Mbps
E.Leonardi - 19/01/99
Router
INFN Roma1
Babar: uso della rete
Farm
Tape Robot
Stage & Backup
9
Uso della rete a Babar









Mirroring e ridistribuzione del software di esperimento
Trasferimento di campioni ridotti di dati da SLAC
Login interattivo sulla farm
Trasferimento dei risultati in sede
AFS
Database distribuito
Connessione a Lione per accesso a dati
Distribuzione dell’informazione
Interazione personale
E.Leonardi - 19/01/99
Babar: uso della rete
10
Mirroring del software
 A Babar sono attualmente supportate 3 architetture
(Sun, Digital, HP). Alla fine del 1999 HP sarà sostituita
con Intel/Linux.
 Nel CR è presente (Gennaio 99) un server AFS su cui
verranno importate le varie release di software.
 1 release (1.5 GB) x 3 architetture = 4.5 GB
 Link con ESNet: 1.5 Mbps  minimo 7 h (> 20 ore reali)
 Tra Dic 98 e Gen 99 ci sono state 10 release (!)
 Un aumento della banda con gli USA (ESNet!) è
altamente auspicabile.
E.Leonardi - 19/01/99
Babar: uso della rete
11
Trasferimento dei Dati
 Il grosso del trasferimento dei dati, O(5 TB/anno) ,
avverrà via nastro.
 Per campioni di dati ridotti e “urgenti” ( O(10 GB) )
sarebbe utile avere la possibilità di trasferirli via rete.
 Conclusione: vedi slide precedente.
E.Leonardi - 19/01/99
Babar: uso della rete
12
Login Interattivo al CR
 Il CR offre una facility di login interattiva per:
 compilazione del software (non tutte le sezioni hanno macchine
dell’architettura adatta)
 creazione e sottomissione dei job (LSF)
 È sufficiente un link che abbia bassa latenza e banda
anche limitata.
 GARR-B risponde bene a queste esigenze
(p.es. Roma-Padova RTT = 15-20 ms).
E.Leonardi - 19/01/99
Babar: uso della rete
13
Trasferimento dei Risultati
 I risultati dei job di analisi girati sulla farm vengono
scritti su aree di disco temporanee per poi essere
trasferiti sulle macchine personali o di sezione.
 Tipici output:
 istogrammi
 n-tuple
 file di database (?)
 Il pattern di comportamento del ricercatore dipende
dalla banda disponibile.
GARR-B va bene ma se la banda cresce la uso.
M. de Lapalisse
E.Leonardi - 19/01/99
Babar: uso della rete
14
Database Distribuito
 Objectivity permette la creazione di database federati
distribuiti su scala geografica.
 Diventa quindi possibile la creazione di un DB dsitribuito
sulle sezioni italiane che consentirebbe un accesso
trasparente ai dati.
 I risultati di RD45 mostrano problemi di latenza nei
tempi di risposta (cfr. E.Arderiu Ribeira, CHEP’98).
 Il possibile carico sulla rete è per ora poco prevedibile e
dipenderà dalle modalità di utilizzo del sistema.
E.Leonardi - 19/01/99
Babar: uso della rete
15
AFS
 AFS è in Babar lo strumento principe per accesso al
software e condivisione dei dati.
 AFS sarà quindi sicuramente usato sia per accedere al
repository di software sia per il trasferimento di dati e
programmi da e per la farm.
 L’infrastruttura AFS della cella infn.it si è dimostrata
adeguata allo scopo.
 È stato creato un sito AFS (bb) dedicato al CR e
direttamente gestibile dal responsabile della farm.
E.Leonardi - 19/01/99
Babar: uso della rete
16
Connessione a Lione
 Lione ha il mirror completo dei dati sperimentali.
 La banda di accesso è molto migliore di quella verso
SLAC (limitato dagli 8 Mbps di Roma).
 Possibile accesso ai dati non presenti nel CR.
 Progetto per utilizzare siti remoti come “sistemi di
storage ad alta latenza” direttamente visibili da
Objectivity (A.Hanushewsky).
 La banda disponibile verso Lione (Roma-CERN-IN2P3) è
per ora poco utilizzata ma potrebbe crescere MOLTO nei
prossimi mesi/anni.
E.Leonardi - 19/01/99
Babar: uso della rete
17
Accesso all’informazione
 Il sistema di scambio e archiviazione delle informazioni è
sostanzialmente basato sul web.
 A SLAC è attivo un sistema di hypernews/newsgroup
della collaborazione che è la principale forma di scambio
di informazioni e notizie.
 Praticamente tutte le sezioni italiane hanno attivato siti o
pagine web dedicati a Babar per scambio di informazioni
su scala locale.
E.Leonardi - 19/01/99
Babar: uso della rete
18
Interazione Personale
 Babar utilizza in maniera estensiva i phone meeting su
linea telefonica normale per le riunioni dei gruppi di
lavoro (AT&T phone conference service).
 Per interazioni personali è molto usato CU-SeeMe
(Windows, Mac, Linux), disponibile anche dal PC di casa.
 Possibile l’utilizzo delle Virtual Room del CERN (mbone
tools: vic, vat). Per ora non molto usato.
 Aumenti di banda verso ESNet migliorano la situazione
per CU-SeeMe ma non per le CERN VR.
E.Leonardi - 19/01/99
Babar: uso della rete
19
Conclusioni
 Babar dipende in maniera sostanziale dalla presenza,
dalla banda passante e dalla qualità del link verso
ESNet.
 La banda offerta da GARR-B è per ora poco utilizzata.
Tuttavia ci sarà un rapido aumento del suo uso con
l’inizio della presa dati (maggio 99). Il Centro Regionale
a Roma sarà la zona italiana più calda.
 La linea con Lione potrebbe diventare un canale di
accesso ai dati complementare al trasferimento via
nastro.
E.Leonardi - 19/01/99
Babar: uso della rete
20