Babar: uso della rete Emanuele Leonardi - INFN Roma INFNet Workshop Bologna - 18-19 Gennaio 1999 L’esperimento Babar Babar studierà i risultati degli eventi prodotti alla risonzanza (4s) dall’acceleratore PEP II di SLAC. Scopo dell’esperimento è la misura diretta degli effetti di violazione di CP attraverso lo studio dei decadimenti dei mesoni B. La collaborazione è composta da circa 800 persone di 87 istituti di ricerca sparsi su 3 continenti (America, Asia, Europa). La presa dati inizierà a maggio del 1999 e durera’ almeno 5 anni. E.Leonardi - 19/01/99 Babar: uso della rete 2 Dati sperimentali La rate di eventi adronici prevista è di circa 10 Hz, per un totale di circa 10 8 eventi l’anno. I dati raccolti saranno elaborati da un sistema software sviluppato interamente in C++ e inseriti in un database object oriented (Objectivity). Ogni evento sara’ accessibile dal DB con diversi livelli di dettaglio, ricalcando in parte il modello gia’ usato in precedenti esperimenti (DST, mini-DST, micro-DST). L’organizzazione del DB sarà tale da permettere di gestire indipendentemente i vari livelli, facilitando la distribuzione dei dati. E.Leonardi - 19/01/99 Babar: uso della rete 3 Distribuzione dei dati Data la distribuzione geografica della collaborazione e delle risorse di calcolo, è stato previsto uno schema di analisi dei dati basato sulla creazione di un certo numero di Centri Regionali (CR). In Europa sono prevsti 3 CR principali: Lione, RAL e Roma. A Lione sarà presente una copia completa dei dati prodotti a SLAC mentre Roma e RAL si limiteranno ad importare i formati di dati ridotti (mini- e micro-DST). E.Leonardi - 19/01/99 Babar: uso della rete 4 Distribuzione dei Dati AOD, ESD ~ 5TB/anno AOD, ESD, REC, RAW 200-300 TB/anno Accesso remoto E.Leonardi - 19/01/99 Babar: uso della rete 5 Il Centro Regionale italiano L’INFN ha finanziato la creazione di un CR basato al CASPUR (Roma) dove concentrare la maggior parte delle attività di analisi dei gruppi italiani, per un totale di circa 70 fisici distribuiti su 12 sedi. Nel CR saranno copiati i formati di dati ridotti (mini- e micro-DST) prodotti a SLAC per un totale di circa 5 TB l’anno. E.Leonardi - 19/01/99 Babar: uso della rete 6 La Farm del Centro Regionale ~ 500 GB RAID ~300 SpecInt95 CPU Servers Disk Server Batch Machines (MC) ~ 20 TB WAN via INFN Roma1 Central Switch Software Repository (AFS) Interactive Machines E.Leonardi - 19/01/99 Babar: uso della rete ~ 500 GB Tape and Stage Server Lock Server 7 Lo storage su nastro AMS, il data server di Objectivity, vede unicamente file attraverso il file system Unix standard. A.Hanushewsky (SLAC) ha sviluppato una versione modificata di AMS che è in grado di interagire con un sistema di stage su nastro o con un file system gerarchico stile HPSS o, in generale, con un sistema di storage ad alta latenza. Una versione adattata al sistema di stage del CASPUR è ora in funzione sulla farm (Dicembre 1998). E.Leonardi - 19/01/99 Babar: uso della rete 8 Network Il CR è connesso alla infrastruttura GARR-B attraverso la connessione della Sezione di Roma dell’INFN (8 Mbps). FastEthernet Rame Fibra ATM 8Mbps E.Leonardi - 19/01/99 Router INFN Roma1 Babar: uso della rete Farm Tape Robot Stage & Backup 9 Uso della rete a Babar Mirroring e ridistribuzione del software di esperimento Trasferimento di campioni ridotti di dati da SLAC Login interattivo sulla farm Trasferimento dei risultati in sede AFS Database distribuito Connessione a Lione per accesso a dati Distribuzione dell’informazione Interazione personale E.Leonardi - 19/01/99 Babar: uso della rete 10 Mirroring del software A Babar sono attualmente supportate 3 architetture (Sun, Digital, HP). Alla fine del 1999 HP sarà sostituita con Intel/Linux. Nel CR è presente (Gennaio 99) un server AFS su cui verranno importate le varie release di software. 1 release (1.5 GB) x 3 architetture = 4.5 GB Link con ESNet: 1.5 Mbps minimo 7 h (> 20 ore reali) Tra Dic 98 e Gen 99 ci sono state 10 release (!) Un aumento della banda con gli USA (ESNet!) è altamente auspicabile. E.Leonardi - 19/01/99 Babar: uso della rete 11 Trasferimento dei Dati Il grosso del trasferimento dei dati, O(5 TB/anno) , avverrà via nastro. Per campioni di dati ridotti e “urgenti” ( O(10 GB) ) sarebbe utile avere la possibilità di trasferirli via rete. Conclusione: vedi slide precedente. E.Leonardi - 19/01/99 Babar: uso della rete 12 Login Interattivo al CR Il CR offre una facility di login interattiva per: compilazione del software (non tutte le sezioni hanno macchine dell’architettura adatta) creazione e sottomissione dei job (LSF) È sufficiente un link che abbia bassa latenza e banda anche limitata. GARR-B risponde bene a queste esigenze (p.es. Roma-Padova RTT = 15-20 ms). E.Leonardi - 19/01/99 Babar: uso della rete 13 Trasferimento dei Risultati I risultati dei job di analisi girati sulla farm vengono scritti su aree di disco temporanee per poi essere trasferiti sulle macchine personali o di sezione. Tipici output: istogrammi n-tuple file di database (?) Il pattern di comportamento del ricercatore dipende dalla banda disponibile. GARR-B va bene ma se la banda cresce la uso. M. de Lapalisse E.Leonardi - 19/01/99 Babar: uso della rete 14 Database Distribuito Objectivity permette la creazione di database federati distribuiti su scala geografica. Diventa quindi possibile la creazione di un DB dsitribuito sulle sezioni italiane che consentirebbe un accesso trasparente ai dati. I risultati di RD45 mostrano problemi di latenza nei tempi di risposta (cfr. E.Arderiu Ribeira, CHEP’98). Il possibile carico sulla rete è per ora poco prevedibile e dipenderà dalle modalità di utilizzo del sistema. E.Leonardi - 19/01/99 Babar: uso della rete 15 AFS AFS è in Babar lo strumento principe per accesso al software e condivisione dei dati. AFS sarà quindi sicuramente usato sia per accedere al repository di software sia per il trasferimento di dati e programmi da e per la farm. L’infrastruttura AFS della cella infn.it si è dimostrata adeguata allo scopo. È stato creato un sito AFS (bb) dedicato al CR e direttamente gestibile dal responsabile della farm. E.Leonardi - 19/01/99 Babar: uso della rete 16 Connessione a Lione Lione ha il mirror completo dei dati sperimentali. La banda di accesso è molto migliore di quella verso SLAC (limitato dagli 8 Mbps di Roma). Possibile accesso ai dati non presenti nel CR. Progetto per utilizzare siti remoti come “sistemi di storage ad alta latenza” direttamente visibili da Objectivity (A.Hanushewsky). La banda disponibile verso Lione (Roma-CERN-IN2P3) è per ora poco utilizzata ma potrebbe crescere MOLTO nei prossimi mesi/anni. E.Leonardi - 19/01/99 Babar: uso della rete 17 Accesso all’informazione Il sistema di scambio e archiviazione delle informazioni è sostanzialmente basato sul web. A SLAC è attivo un sistema di hypernews/newsgroup della collaborazione che è la principale forma di scambio di informazioni e notizie. Praticamente tutte le sezioni italiane hanno attivato siti o pagine web dedicati a Babar per scambio di informazioni su scala locale. E.Leonardi - 19/01/99 Babar: uso della rete 18 Interazione Personale Babar utilizza in maniera estensiva i phone meeting su linea telefonica normale per le riunioni dei gruppi di lavoro (AT&T phone conference service). Per interazioni personali è molto usato CU-SeeMe (Windows, Mac, Linux), disponibile anche dal PC di casa. Possibile l’utilizzo delle Virtual Room del CERN (mbone tools: vic, vat). Per ora non molto usato. Aumenti di banda verso ESNet migliorano la situazione per CU-SeeMe ma non per le CERN VR. E.Leonardi - 19/01/99 Babar: uso della rete 19 Conclusioni Babar dipende in maniera sostanziale dalla presenza, dalla banda passante e dalla qualità del link verso ESNet. La banda offerta da GARR-B è per ora poco utilizzata. Tuttavia ci sarà un rapido aumento del suo uso con l’inizio della presa dati (maggio 99). Il Centro Regionale a Roma sarà la zona italiana più calda. La linea con Lione potrebbe diventare un canale di accesso ai dati complementare al trasferimento via nastro. E.Leonardi - 19/01/99 Babar: uso della rete 20