Trinacria Grid Virtual Laboratory
gLite Information System
Riccardo Bruno
INFN - Catania
gLite 3.0 Trigrid Tutorial
Catania, 23.10.2006
FESR
www.trigrid.it
Information System
• Cosa è
– Il sistema che si occupa di raccogliere informazioni riguardo allo
stato delle risorse di griglia
• Perché
– Per scoprire l’esistenza delle risorse di griglia e la loro natura
– Per ottenere importanti informazioni utili sulle quali basare le
proprie scelte
– Per verificare lo stato di salute delle risorse
• Come
– Monitorando lo stato delle risorse localmente e pubblicando le
opportune informazioni
– Adottando un modello dati riconosciuto da tutti i componenti
della griglia
Catania, Trigrid tutorial, 23.10.2006
2
Progetto di un sistema informativo
• Misurare
– Le misure devono essere compatibili con lo scopo che l’utente desidera
raggiungere.
– Le misure devono essere abbastanza accurate da essere considerate
valide.
– Le misure devono essere aggiornate in maniera adeguata all’uso.
• Ottenere l’informazione
– Come e quando le informazioni ottenute devono essere pubblicate?
– Dove devono essere pubblicate queste informazioni?
– Per quanto tempo l’informazione deve essere mantenuta?
• Interrogare l’Information System
– Dove devono essere mandate le interrogazioni per avere una risposta?
– Quale sintassi e protocollo bisogna utilizzare per fare interrogazioni?
– Quale modello di dati deve essere adottato per descrivere le
risorse?What is the adopted data model to describe resources?
• Sicurezza
– Chi ha l’autorizzazione per eseguire delle interrogazioni? E quel tipo di
interrogazioni l’utente puo’ fare?
– Gestione dei permessi e delle credenziali degli utenti
Catania, Trigrid tutorial, 23.10.2006
3
BDII e R-GMA
• BDII (Berkley Database Information Index)
– E’ stato adottato all’interno del middleware LCG e LCG-2
– E’ un evoluzione del Globus Meta Directory Service (MDS)
– Si basa su un sistema di server Light Direct Access Protocol
(LDAP)
• Relational Grid Monitoring Architecture (R-GMA)
– E’ un’implementazione di Grid Monitoring Architecture (GMA)
standardizzata dal Global Grid Forum (GGF) come modello di
riferimento
– E’ una implementazione a tabelle (relational)
– Orientato ai Web Services
– Verrà adottato dalle prossime versioni di gLite; Attualmente non
disponibile su Trigrid.
Catania, Trigrid tutorial, 23.10.2006
4
LCG Information System
• LCG adotta una combinazione di soluzioni
– Globus MDS




Al più basso livello del sistema informativo
Per scoprire e monitorare risorse e pubblicare le informazioni
Grid Information Security (GSI) per gestire le credenziali
Meccanismo di Caching dell’informazione
– BDII





Al più alto livello del sistema informativo
Perché MDS ha dimostrato alcuni problemi in termini di scalabilità
E’ utilizzato dal Resource Broker per il processo di ‘matchmaking’
Può essere configurrato a livello di singola VO
Ottiene periodicamente informazione (2 minuti) dei sistemi sottostanti.
• Sistema Gerarchico system
– L’informazione e’ mantenuta nelle foglie di un’albero e viaggia fino alla
sua radice
– I ‘clients’ possono interrogare l’albero ad ogni livello
– Piu’ altro e’ il livello cui si fa l’interrogazione e meno recente sarà
l’informazione ottenuta.
Catania, Trigrid tutorial, 23.10.2006
5
Gestione dell’informatione
• Si ottiene l’informazione a diversi livelli
– Basso livello: Grid Resource Information Server (GRIS)
 Gestisce l’informazione sullo stato di una data risorsa
 Un GRIS per ogni risorsa
 Un insieme di script e sensori che provano a estrarre dati utili sulla
risorsa
– Livello medio: Grid Index Information Server (GIIS)
 Gestisce l’informazione a livello di ‘sito’
 Un GIIS per ogni sito
– Alto livello: BDII
 Ottiene informazioni sulle risorse di una data VO.
 Un BDII per ogni VO (soluzioni suggerite)
• Modalità per ottenere informazioni
– ‘Pull model’ (server di alto livello interrogano periodicamente
server di piu’ basso livello)
– Modello dati LDAP
Catania, Trigrid tutorial, 23.10.2006
6
BDII - L’architettura
•
The Berkeley Database Information
Index (BDII)
– Sistema di raccolta gerarchica basato
su LDAP
– Le foglie dell’albero sono GRIS
– I nodi intermedi sono GIIS
– L’utente può interrogare l’albero a
qualunque livello
– Più l’informazione è vicina alla radice
e più è vecchia
– Uno per ogni VO
– E’ centralizzato
•
•
Grid Resource Information
Service (GRIS)
– Uno per ogni risorsa (CE, SE)
– Colleziona informazioni
statiche e dinamiche su quella
risorsa
BDII (gilda)
Other GIIS
(gilda)
GIIS
INFN sez. CT
GIIS
Merida (gilda)
Globus
MDS
Grid Index Information Service (GIIS)
– Uno per ogni sito
– Colleziona e mette in cache
informazioni dai GRIS sottostanti
– Interroga i sistemi GIIS e GRIS
sottostanti periodicamente
GRISes
GRISes
GRISes
Catania, Trigrid tutorial, 23.10.2006
7
Interrogare l’Information System
• Esistono due tool di alto livello per interrogare gli
elementi dell’IS:
lcg-infosites
lcg-info
• Questi tool possono essere utilizzati per nascondere la
complessità delle query LDAP e sono abbastanza
flessibili da soddisfare la maggior parte delle esigenze
degli utenti.
Catania, Trigrid tutorial, 23.10.2006
8
GLUE Schema
• Grid Laboratory Uniform Environment (GLUE) Schema
– E’ un modello di dati che descrive nel modo migliore le risorse grid
(sia statiche che dinamiche)
– E’ il risultato di una collaborazione tra EU-DataTAG e iVDGL
– EGEE, NorduGrid, LCG and Grid3/OSG hanno anch’essi
contribuito alla definizione dello schema
• XML Schema
– Attualmente il GLUE Schema e’ stato mappato su una
rappresentazione XML
– Per maggiori informazioni:
http://infnforge.cnaf.infn.it/glueinfomodel/Spec/V12/R1
Catania, Trigrid tutorial, 23.10.2006
9
Il protocollo LDAP
► LDAP struttura dati ad albero
o = grid (root of
the DIT)
► I valori di ciascun elemento sono
nominati univocamente
c= US
c=Switzerland
c=Spain
► Seguento il cammino dal nodo fino
alla radice del DIT
st = Geneva
is built (the DN):
or = CERN
“id=pml,ou=IT,or=CERN,st=Geneva, \
c=Switzerland,o=grid”
ou = IT
objectClass:person
cn: Patricia M. L.
phone: 5555666
office: 28-r019
id = pml
ou = EP
id=gv
Catania, Trigrid tutorial, 23.10.2006
id=fd
10
Trinacria Grid Virtual Laboratory
Cenni su RGMA (Relational Grid Monitoring Architecture)
FESR
www.trigrid.it
Database Virtuale
• Il Relational Grid Monitoring
Architecture (R-GMA)
– E’ una implementazione del Grid
Monitoring Architecture (GMA) definito
dal Global Grid Forum (GGF)
– Adotta un modello a database con
tabelle e relazioni
– Le tabelle sono distribuite (virtual)
– L’accesso avviene tramite stringhe
Standard Query Language (SQL)
– Implementa diversi tipi di query
• L’informazione
– Pubblicata e acceduta localmente al
sito di produzione
– Sempre aggiornata
– Alcuni servizi possono fare da centri di
raccolta per le informazioni
Virtual
Database
R-GMA
front end
R-GMA
front end
R-GMA
front end
R-GMA
client
R-GMA
client
R-GMA
client
Catania, Trigrid tutorial, 23.10.2006
12
Servizi R-GMA
• Tre tipi di servizi Produttori
Producer
data
– Primary Producer: Produce e salva i record
di tabella localmente
– Secondary Producer: Colleziona record di
tabella prodotti da diversi Produttori e li
concentra in un unico punto
– On Demand Producer: Produce record di
tabella su richiesta in tempo reale
interfacciandosi con un sistema esterno
store location
Virtual
Database
Consumer
lookup location
Registry
• Un tipo di servizio Consumatore
Table name, URL, predicate
– Consumer: Interroga il database virtuale per
ottenere record di tabella
Table name, URL, predicate
• Il Database Virtuale
– Registry: Contiene informazioni per
associare le interrogazioni dei Consumer
con i Producer capaci di rispondere
– Schema: Contiene gli schema che
descrivono le tabelle virtuali
– Mediator: Associa le richieste fatte dai
Consumer con i giusti Producer
Mediator
Virtual
Database
Schema
Table name, columns defs
Table name, columns defs
Catania, Trigrid tutorial, 23.10.2006
13
Referenze
• gLite 3.0 User Guide
– https://edms.cern.ch/file/722398/1.1/gLite-3-UserGuide.pdf
• R-GMA home page
– http://www.r-gma.org/
• GLUE Schema
– http://infnforge.cnaf.infn.it/glueinfomodel/
Catania, Trigrid tutorial, 23.10.2006
14