NUOVA SERVER FARM – PROGETTO Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 2 di 35 Riccardo Detti Cristina Mugnai Indice 1. Introduzione 5 2. Obiettivi del progetto 5 2.1. Razionalizzazione 5 2.2. Disegno di una nuova architettura del sistema informativo 6 2.3. Sicurezza 6 2.4. Ottimizzazione e potenziamento dei servizi interni 6 2.5. Obiettivi a lungo termine 7 3. Ricognizione dello stato attuale 7 3.1. Infrastruttura e topologia di rete 7 3.2. Server 8 3.3. Servizi 9 3.3.1. Servizi esterni 9 3.3.1.1. DNS 9 3.3.1.2. WWW 9 3.3.1.3. Posta elettronica 10 3.3.1.4. FTP 10 3.3.1.5. Video Streaming 10 3.3.2. Servizi interni 10 3.3.2.1. Contabilità di ateneo 11 3.3.2.2. Segreterie Studenti 11 3.3.2.3. Sistema di Gestione delle Biblioteche – SBN 11 3.4. Criticità emerse dalla ricognizione 12 4. Progetto 13 4.1. Filosofia del progetto 13 4.2. Open Source, GNU, Linux 14 4.3. Architettura 16 5. Rete 19 5.1. Topologia 19 5.2. Tecnologia 19 5.3. Sicurezza e firewall 19 6. Sezione di front-end 20 7. Sezione applicativa 20 7.1. Tecnologia 20 7.2. Servizi 21 7.2.1. DNS 21 7.2.2. WWW 21 7.2.3. Proxy 22 7.2.4. Email 22 7.2.5. FTP 23 7.2.6. LDAP 24 7.2.7. Streaming 24 7.2.8. Segreterie Studenti 24 7.3. Servizi interni 24 7.3.1. File service 24 7.3.2. Print service 25 Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 3 di 35 Riccardo Detti Cristina Mugnai 8. Sezione di back-end – Database e servizi ausiliari 25 8.1. Database 25 8.2. Storage Area Network 26 8.3. Sistema di Backup 27 8.4. Monitoraggio 28 9. Dimensionamento dei sistemi 28 9.1. Parte stabile 29 9.2. Server ad alto carico – Prima ipotesi 30 9.3. Server ad alto carico – Seconda ipotesi 30 Appendice A – Descrizione dei sistemi attuali 31 Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 4 di 35 Riccardo Detti Cristina Mugnai Indice delle figure Fig. 1 – Stato attuale: topologia di rete e sistemi 8 Fig. 2 – Architettura generale della Server Farm 17 Fig. 3 – Architettura generale della Server Farm — Deployment iniziale 18 Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 5 di 35 Riccardo Detti Cristina Mugnai 1. Introduzione Questo documento presenta in modo sintetico i vari aspetti che concernono la ristrutturazione della server farm del CSIAF. I primi capitoli oltre ad illustrare gli obiettivi del progetto, offrono una descrizione dettagliata degli attuali servizi in carico alla farm e indicano in modo critico le carenze derivanti dalla attuale architettura. I capitoli successivi descrivono l’approccio al problema e la filosofia del progetto; il progetto, in seguito, viene illustrato più in dettaglio focalizzando le varie componenti della nuova server farm. L’ultimo capitolo, “Dimensionamento dei sistemi”, fornisce indicazioni di massima, utili ad una discussione sulle strategie da seguire al fine di rendere esecutivo il progetto, descrivendo i possibili fabbisogni delle varie componenti. L’intero progetto si basa sui servizi. I servizi che la farm e, più in generale il Centro stesso, erogano al momento, insieme a quelli che e’ possibile prevedere nei prossimi tre anni, costituiscono “l’input” del progetto. I servizi progettati e realizzati all’interno del Centro (o comunque dell’Università) sono analizzati in modo critico e per alcuni di essi si prospetta una evoluzione volta sia al miglioramento del servizio stesso, sia ad una migliore integrazione con il nuovo contesto operativo. Ciò dovrebbe portare, nell’arco di vita previsto per il progetto (circa tre anni), verso la realizzazione di un sistema informativo “integrato” di ateneo, ove tutte le componenti siano in grado di interagire reciprocamente. Alcuni servizi (di grande importanza) sono invece forniti da terzi e sono solo ospitati dal Centro. Non potendo l’Univerità incidere né sulla loro architettura né sulle loro possibili evoluzioni, il progetto li colloca nel nuovo contesto nel modo migliore possibile. Essi in qualche modo viziano sia l’architettura generale, sia, soprattutto, la possibilità di evoluzione appena accennata e quindi la qualità complessiva dell’intero processo. D’altronde in questa sede non si ritiene appropriata, n é di competenza, la discussione a posteriori della validità, sia architetturale sia operativa, delle scelte fatte; di conseguenza, come appena detto, il progetto include questi servizi valutandoli allo stato attuale dell’arte e accettandone le imposizioni. Si ritiene comunque indispensabile, per il futuro, che la scelta di nuovi servizi venga preventivamente discussa sul piano architetturale e tecnologico, in modo che questi si integrino nel contesto senza degradare la qualità dell’intero sistema. A tal fine sarebbe necessaria la preparazione di una “carta tecnica dei servizi”, che indichi, sia agli interni sia agli esterni, gli standard architetturali e di qualita’ che devono essere soddisfatti da qualunque nuovo servizio prima di essere attivato. 2. Obiettivi del progetto Il progetto di ristrutturazione della Server Farm del CSIAF, centrale per quasi tutte le attività informatiche dell’ateneo, è sicuramente un progetto di elevata complessità tecnica. Predisporre, infatti, il cambiamento in una unica soluzione dell’intero basamento su cui poggia l’attuale sistema informativo dell’Università, pone tutto l’insieme delle problematiche classiche, aprendo al contempo un insieme di possibilità tecnologiche e architetturali, che di norma si affrontano gradualmente durante l’evoluzione di un sistema esistente. Comunque, come descritto nel paragrafo 3.4, le carenze dell’attuale struttura impongono un’azione radicale, tale da poter rispondere in tempi brevi alle necessità già emerse da tempo e a quelle previste nei piani di sviluppo del CSIAF. Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 6 di 35 Riccardo Detti Cristina Mugnai 2.1. Razionalizzazione Dalla ricognizione dell’insieme dei server installati presso il CSIAF (vedi capitolo 3), risulta una miscellanea di macchine, spesso dedicate ad un singolo servizio. Uno degli obiettivi principali del progetto sarà l’omogeneizzazione dei server al fine di ottenere: Economia di gestione. Utilizzando server per quanto possibile omogenei si ha un miglioramento dei tempi e dei costi di intervento per la gestione e l’aggiornamento dei sistemi. Si rende agevole il monitoraggio attraverso l’utilizzo uniforme di software di system management. Economia nell’acquisto e nei canoni di manutenzione. Rivolgendosi ad uno o ad un pool ristretto di fornitori si ottengono sicuramente vantaggi economici di scala. Svecchiamento dei server in produzione. Si possono dismettere i server pi ù vecchi che hanno un basso rapporto tra potenza e costi di gestione e manutenzione a favore di server di nuova tecnologia più potenti ed economici. 2.2. Disegno di una nuova architettura del sistema informativo L’attuale disegno architetturale del sistema informativo presenta gravi carenze. Le criticit à che ne derivano sono descritte nel paragrafo 3.4; in particolare il nuovo disegno architetturale dovr à garantire: Scalabilità. A fronte dell’aumento della richiesta di risorse, fisiologica o eccezionale, da parte di uno o più servizi l’architettura dovrà permettere l’aumento delle capacità di elaborazione senza dover modificare l’architettura stessa. Fault-tolerance. L’architettura dovrà permettere ad ogni servizio di continuare a funzionare anche in caso di guasto di un qualsiasi componente. Tecnologia. Il progetto dovrà impiegare lo stato dell’arte in campo tecnologico e valutare possibilmente il trend dei prossimi anni. Evoluzione. L’architettura dovrà permettere la naturale evoluzione dei sistemi e dei servizi coinvolti. Sarà, per quanto possibile, neutra rispetto alla tecnologia dei sistemi che la compongono. 2.3. Sicurezza La sicurezza dei sistemi informatici riveste sicuramente un aspetto che, ormai da qualche anno, non è più trascurabile, anzi lo si deve considerare un fattore di base nella progettazione di tutti i livelli di un sistema informativo, dall’infrastruttura di rete fino ai servizi resi all’utenza. Il progetto dovrà quindi valutare l’intero disegno anche da questo punto di vista, cercando, per quanto possibile, di utilizzare gli standard più diffusi per ottenere un sufficiente livello di sicurezza senza complicare l’utilizzo delle risorse e la fruizione dei servizi. 2.4. Ottimizzazione e potenziamento dei servizi interni La priorità dei servizi resi all’esterno del CSIAF ha reso di importanza secondaria le necessità interne alla Server Farm e più in generale quelle del personale interno al Centro. Obiettivo del progetto sarà un aggiornamento e un ampliamento dei servizi interni tra cui: Sistema centralizzato di backup per il salvataggio dei dati dei server e delle stazioni di lavoro del personale. Sistema per il monitoraggio dei server, dei servizi e dell’infrastruttura di rete interna alla Server Farm. Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 7 di 35 Riccardo Detti Cristina Mugnai File server centralizzato per i sistemi interni alla Farm e per il lavoro di gruppo del personale del Centro. Servizi di stampa e stampanti di formato e qualità adeguati alle necessità del Centro. 2.5. Obiettivi a lungo termine Il presente progetto è testimonianza dell’attenzione e della priorità dedicata alla qualità dei servizi forniti dal CSIAF. Con gli stessi criteri del presente progetto (stato dell’arte della tecnologia, adesione agli standard ecc.) vengono progettati i servizi sviluppati all’interno del Centro. È doveroso però notare che, per motivi che non possono essere discussi qui, i servizi informatici chiave dell’Università (contabilità, segreterie, protocollo, gestione del personale, ecc.) sono stati progettati e sviluppati da terzi. Prescindendo dalla qualità di ogni singolo servizio è inconfutabile il fatto che ognuno di essi rappresenta una realtà (un mondo) a se stante, fatto di architetture, tecnologie e dati diversi tra loro. In altre parole questi mondi non sono in grado di comunicare nè tantomeno di cooperare gli uni con gli altri. Se questa situazione poteva essere accettabile in passato, già oggi induce grosse difficoltà allo sviluppo di servizi trasversali, cioè che interessano contemporaneamente più mondi, imponendo attività notturne di trasferimento, trasformazione e, soprattutto, duplicazione dei dati. In futuro questa incapacità di ogni servizio di comunicare con gli altri rappresenterà il problema maggiore nel costituire un Sistema Informativo dell’Università di Firenze. Pertanto sarà indispensabile, a fronte della acquisizione di nuovi servizi/prodotti dall’esterno, la possibilità di valutare: L’architettura, in modo che il nuovo sistema possa essere agevolmente integrato e gestito nell’infrastruttura della Server Farm. La tecnologia, affinché il servizio possa eventualmente essere ospitato da server già presenti nella Server Farm. La capacità di offrire servizi verso altre applicazioni in modo che il nuovo sistema possa interagire con gli altri già presenti. 3. Ricognizione dello stato attuale 3.1. Infrastruttura e topologia di rete La Figura 1 schematizza le parti della rete di ateneo interessate dal progetto. Le sottoreti .1 e .3 costituiscono, rispettivamente, la rete dei servizi di front-end e quella dei servizi applicativi. Esse sono all’interno della sede di Via delle Gore , mentre le sottoreti .22 e .85 (in basso nella figura) sono all’interno della sede del rettorato. I rettangoli presenti in figura rappresentano i sistemi; in appendice Asono descritti in dettaglio i server e le loro configurazioni hardware e software. Gli apparati di rete sono viceversa elencati qui di seguito: C7200 – Router CISCO 7200, e’ il router di frontiera, collegato al POP GARR con un canale ATM a 34Mb/s, esposto verso l’esterno via protocollo BGP. Storicamente è stato il centro delle comunicazioni dell’ex CeSIT, sia verso l’esterno sia verso l’interno; sta avendo un ruolo sempre più marginale dopo l’implementazione della rete interna a 1Gb/s. Implementa verso l’interno il protocollo di routing OSPF. ENALP – Extreme Networks Alpine XXX, è lo switch layer 3 che WIND ha installato presso tutte le sedi che si collegano all’anello in fibra ottica a 1Gb/s. Sono fisicamente i “centro stella” Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Pag. 8 di 35 Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Riccardo Detti Cristina Mugnai sia della sede di Via delle Gore sia di quella del Rettorato. In Via delle Gore questo switch collega direttamente i server più importanti (MAIL, WWW, WWW2, OLS), mentre gli altri vi arrivano attraverso switch secondari (non presenti in figura). Si nota l’assenza di firewall; tutti i server presso la sede di Via delle Gore sono infatti esposti direttamente in rete pubblica, ponendo gravi, e noti, problemi di sicurezza e di interoperabilit à. L’unico firewall presente (un CISCO PIX XXX) è installato presso il Rettorato a protezione dei sistemi di contabilità e delle segreterie studenti. L’argomento sarà discusso in dettaglio nel paragrafo 5.3. Gli apparati e l’infrastruttura non sono ridondati. Internet DNS MAIL WWW WWW2 STRM EPRES MSTUD PROXY WWWS 150.217. C7200 Sede CSIAF .1 ENALP OLS DEVEL .3 Collegamento alle sedi principali dell’Ateneo 1 Gb Eth Rettorato ENALP .22 DNS2 .85 F W GISSas GISSdb GISSdb CONT Fig. 1– Stato attuale: topologia di rete e sistemi 3.2. Server In appendice A sono elencati i server principali attualmente installati presso le sedi del CSIAF, ne viene descritta sinteticamente la configurazione hardware, la dotazione di software di base, i principali servizi offerti. L’elenco non è completo, non sono descritti i server ritenuti marginali ai fini del progetto: per la scarsa importanza del servizio offerto, ad esempio file sever per un singolo ufficio; per la duplicazione del servizio, ad esempio un sito FTP simile a quello principale; per la non integrabilità dovuta alla specificità del servizio o dell’hardware; ad esempio il mainframe BULL che ospita il sistema gestionale delle biblioteche. Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 9 di 35 Riccardo Detti Cristina Mugnai 3.3. Servizi Sono di seguito elencati i servizi attualmente offerti dal CSIAF, divisi tra esterni, quelli cioè esposti in Internet, e interni, dedicati all’utenza di ateneo. Si noti che il termine esterno va inteso come “accedibile dall’esterno” e cioe’ da qualsiasi postazione Internet nel mondo e non come rivolto ad una utenza rigorosamente esterna all’Università. Viceversa per servizi interni si assumono quelli strettamente dedicati alle strutture, al personale tecnico-amministrativo, agli studenti e ai docenti dell’Università di Firenze. Ad esempio sono esterni il servizio web di ateneo ed il “cerca-chi”, utilizzati massivamente anche all’interno dell’ateneo, mentre contabilità e segreterie studenti sono servizi interni. 3.3.1. Servizi esterni 3.3.1.1. DNS Il Domain Name System è un servizio di base, obbligatorio per ogni ente che esponga il proprio dominio in Internet. Il sistema, organizzato come un database gerarchico distribuito a livello mondiale, garantisce la corrispondenza biunivoca tra la nomenclatura gerarchica a domini di Internet dei sistemi di una organizzazione con l’indirizzo IP di ogni sistema. Il DNS dell’Universit à di Firenze “mappa” il dominio unifi.it e i suoi sottomini con gli indirizzi IP della rete di classe B (150.217.) dedicata all’ateneo. Il servizio DNS e’ ospitato su più server, per garantire ridondanza in caso di guasto e per migliorare l’efficienza. Poiché ogni singola stazione interroga ripetutamente il DNS, da sempre si è provveduto ad installare il DNS primario presso la sede di Via delle Gore, vicino alla frontiera, in modo che le richieste provenienti dall’esterno trovino subito il servizio, senza percorrere l’infrastruttura di rete interna all’ateneo. Per lo stesso criterio, tutti i sistemi interni, topologicamente vicini alla sede di Via delle Gore, riferiscono direttamente al DNS primario. Il DNS secondario, installato presso la sede del Rettorato, fa da riferimento per i sistemi del Rettorato stesso e per quelli che insistono sulle reti del centro storico. Il sistema DNS presso la sede del Rettorato non è ridondato, mentre presso la sede di Via delle Gore è attivo un altro server, normalmente visto come secondario, che può sostituire temporaneamente il primario in caso di guasto. 3.3.1.2. WWW É il più importante, insieme alservizio di posta elettronica, dei servizi esterni. Da sempre sviluppato e gestito all’interno dell’ateneo viene considerato a livello nazionale tra i migliori siti universitari. Attualmente sono molteplici i server che ospitano parti del sito web di ateneo; i pi ù importanti (vedi appendice A per le caratteristiche) sono: WWW É il server che storicamente ha esposto la parte informativa del web di ateneo. Recentemente è stato scaricato della sezione “studenti”. Ospita sezioni “periferiche”, alimentate direttamente da unità amministrative dell’ateneo. Implementa alcuni servizi dinamici, tra i quali spicca il “cerca-chi”. Le parti dinamiche utilizzano i linguaggi PHP e PERL che sono installati come moduli del server Apache. Le procedure in PHP utilizzano il database mySQL. WWW2 E’ il server, recentemente introdotto, che ospita la sezione “studenti”, sviluppata utilizzando il prodotto di content management WebMate di Navita. Ospita le sezioni periferiche che utilizzano la tecnologia Active Server Pages (.asp) di Microsoft. OLS É un server orientato completamente all’erogazione dei servizi via WWW. Ospita il catalogo online delle biblioteche, tutti i servizi destinati agli studenti e recentemente alcuni servizi Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 10 di 35 Riccardo Detti Cristina Mugnai dedicati ai docenti. Il sistema ospita due web server: Apache e iPlanet. Il server Apache è dedicato all’OPAC/WWW, il quale consiste in un pacchetto di procedure in linguaggio Sibylla. Sibylla è un estensione del linguaggio di script TCL al quale sono state aggiunte primitive e funzioni per l’accesso al motore di information retrieval Basis+ e per l’interfaccia HTTP/HTML. Il server iPlanet invece viene utilizzato principalmente per le sue funzionalità di “servlet container” e di pubblicazione con la tecnologia “java server pages”. Tutti i servizi online per gli studenti e per i docenti sono sviluppati come servlet java e stanno convergendo verso lo standard 2.2 WWWS Ospita i siti web gestiti dalle organizzazioni studentesche. Non ospita contenuti dinamici. DEVEL É un server dedicato soprattutto allo sviluppo di nuovi servizi WWW , il pi ù importante dei quali e’ il progetto dell’anagrafe della ricerca. I prototipi sono scritti in linguaggio PHP. L’interprete PHP è installato come modulo del server Apache e incorpora i driver per l’accesso al database Oracle. 3.3.1.3. Posta elettronica Il servizio di posta elettronica è ormai considerato indispensabile al funzionamento di qualsiasi ente; nel caso dell’Università di Firenze è divenuto strumento infrastrutturale, e abituale, soprattutto nella comunicazione interna oltreché verso l’esterno. L’importanza con cui è stato visto questo servizio ha inciso notevolmente sul numero di risorse umane dedicate alla gestione e sulla tecnologia, hardware e software, sui cui è basato. Al momento tre persone si occupano praticamente a tempo pieno del sistema, che ospita circa 5.000 caselle di posta e circa 280 mailing lists. Il sistema è costituito da un cluster a 2 nodi basato sul sistema operativo Open/VMS (vedi MAIL in appendice A); i sistemi di comunicazione, di email e di gestione delle mailing list sono della InnoSoft. La scelta di questi sistemi, avvenuta alcuni anni fa, ha prediletto la leggendaria sicurezza e stabilità dei sistemi basati sul VMS ritenendo secondarie le problematiche e i costi di gestione. 3.3.1.4. FTP Il File Transfer Protocol, una volta l’unico sistema di trasferimento dei file tra sistemi remoti, ha perso nel tempo la sua cardinalità, essendo affiancato da numerosi altri modi per lo scambio di informazioni. Appare, da una breve indagine,che l’“utente medio” non utilizzi questo sistema (molti non lo conoscono nemmeno), preferendo sistemi più immediati come il download via protocollo HTTP, lo share di directory e, purtroppo, gli attach della posta elettronica. Viene, viceversa, utilizzato molto nelle comunità open source, e in generale nei siti da cui si scaricano grosse moli di dati, dove è ritenuta importante l’efficienza del trasferimento. L’offerta FTP presso il CSIAF è limitata allo scaricamento di alcuni pacchetti software, ad esempio Panda Antivirus, e al caricamento delle pagine web da parte degli amministratori dei contenuti delle sezioni periferiche del web di ateneo. È da notare che il software di client per la contabilità di ateneo utilizza internamente il protocollo FTP per l’installazione dei propri aggiornamenti. 3.3.1.5. Video Streaming Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 11 di 35 Riccardo Detti Cristina Mugnai 3.3.2. Servizi interni Nei paragrafi successivi vengono descritti i servizi dedicati ad una utenza rigorosamente interna, a supporto delle attività critiche di funzionamento dell’ateneo. La ricognizione non ha preso in considerazione quei servizi come ad esempio il l’E-learning o la gestione delle carriere del personale che, pur essendo importanti, non impattano direttamente sul progetto, essendo gestiti completamente da aziende esterne. Il sistema di gestione delle biblioteche viene citato in questi paragrafi per la sua storia particolare e per la centralità che occupa nel CSIAF; non sarà valutato ai fini del progetto in quanto, pur essendo in corso uno studio di migrazione e downsizing, le soluzioni architetturali e le esigenze dell’hardware, subordinate alle caratteristiche funzionali del nuovo sistema di gestione non sono note al momento. Saranno comunque fornite (nel paragrafo 3.3.2.3) alcune indicazioni di massima che, se rispettate, porteranno ad una buona integrazione del nuovo sistema nel contesto della Server Farm. 3.3.2.1. Contabilita`di ateneo La Contabilità Integrata di Ateneo (CIA) è il pacchetto applicativo che l’Università ha acquisito nel 2000 dal CINECA per la propria gestione contabile a amministrativa. Gli utenti registrati sono poco meno di 500. Dal punto di vista architetturale e tecnologico il programma implementa la logica client-server a due livelli. I client, cioè la parte di programma installata presso la postazione di lavoro di ogni utente, contengono l’interfaccia grafica, la logica di funzionamento dell’applicazione e le funzionalità di colloquio, via rete, con il server. Il programma client è stato sviluppato con Visual Age di IBM. Il server, unico per tutti i client, riceve ed esegue i comandi spediti dai client; con CIA il database Oracle viene esposto direttamente ai client, che ne sfruttano le capacit à di multiutenza e di motore transazionale. È previsto a breve termine l’istallazione e la sperimentazione del nuovo servizio di contabilit à per i Poli (CIA-Poli). Dal punto di vista architturale il sistema dovrebbe consistere in un server applicativo (IBM Web Sphere) che colloquia con i client via protocollo HTTP e, in back end, con uno schema dati all’interno dell’istanza Oracle della contabilità (CIA). L’hardware, per il test del prototipo, sarà fornito dal CINECA. 3.3.2.2. Segreterie Studenti Il sistema Gestione Integrata delle Segreterie Studenti (GISS) è stato acquisito dall’Università nel 2001 dalla Società Sistemi Informativi. Dopo una “laboriosa” attivit‘a di migrazione dei dati dal precedente sistema di gestione, GISS è entrato in produzione nel periodo di immatricolazione e iscrizione dello stesso anno. L’architettura del sistema, che serve circa XXX postazioni utente, segue la logica client-server a tre livelli, anche se in pratica si discosta dal modello classico a tre livelli. Infatti i client ospitano solo la presentazione della interfaccia utente (via browser WWW) e colloquiano con il server di livello intermedio, seguendo l’impostazione canonica 3-tier. Il livello intermedio, solitamente descritto come application server, cioè il server ove risiede la logica applicativa, in questo caso cura soltanto la logica di presentazione e la comunicazione con i client. Il database sever, il terzo livello, ospita, oltre ai dati anche le procedure applicative scritte in linguaggio PL/SQL, il linguaggio “interno” di Oracle. 3.3.2.3. Sistema di Gestione delle Biblioteche – SBN Il sistema gestionale delle biblioteche supporta il lavoro di acquisizione, catalogazione, collocazione e circolazione del materiale librario delle 5 biblioteche di area (oltre 70 fondi librari). Il sistema operante presso l’ateneo fiorentino è considerato una delle pietre miliari del Sistema Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 12 di 35 Riccardo Detti Cristina Mugnai Bibliotecario Nazionale (SBN) ed è stato progettato e sviluppato dal personale dell’Università di Firenze in collaborazione con altri enti coinvolti nel progetto finanziato direttamente dal Ministero dei Beni Culturali. Evoluto, e ri-ingegnerizzato più volte nel corso degli anni, questo sistema e’ in uso presso le più importanti biblioteche (le biblioteche nazionali centrali di Firenze e Roma) e istituti (Treccani), nonché la Regione Veneto e l’Università dell’Aquila. Il sistema consiste in un insieme di transazioni scritte in linguaggio COBOL, gestite da un motore transazionale classico (TDS), in ambiente mainframe BULL GCOS7. Il database su cui insiste il sistema è IDS II a struttura reticolare. Come già accennato è in corso una valutazione (congiunta CSIAF e Sistema Bibliotecario di Ateneo) per evolvere l’intero sistema di gestione verso una piattaforma più moderna. Non essendo note al momento le caratteristiche del sistema che sarà scelto si possono però elencare alcuni fattori che possono facilitarne l’inserimento e la gestione nella Server Farm: Architettura a tre livelli, in modo da separare il carico conversazionale e la logica applicativa dalle attività sulle basi dati. Eventualmente avere server separati per sfruttare le caratteristiche di sicurezza dell’infrastruttura di rete. Data base Oracle, in modo da sfruttare le conoscenze e unificare le attività di gestione e manutenzione. Eventualmente ospitare le basi dati su un server esistente. Sistema operativo Unix, per gli stessi motivi del punto precedente. 3.4. Criticita`emerse dalla ricognizione I paragrafi precedenti elencano lo stato attuale dei server e dei servizi offerti in modo il pi ù possibile neutro e oggettivo. In questo paragrafo sono invece elencate una serie di valutazioni critiche in relazione ad alcuni aspetti emersi durante la ricognizione. Dalla ricognizione effettuata appare evidente la differenza di approccio, e di esigenze, che le strutture confluite nel CSIAF hanno utilizzato nell’acquisizione e nella configurazione dei vari sistemi. Senza entrare nel merito della validità delle strategie adottate si possono estrapolare i seguenti punti che possono aiutare nella valutazione complessiva del “parco macchine” esistente e indicare direzioni possibili di evoluzione e di cambiamento per il progetto: Vetustà. La maggior parte dei server è in funzione da più di tre anni, con punte di cinque e sei anni. Questo fattore è indice delle difficoltà di reperimento dei fondi per l’aggiornamento dei sistemi, della mancanza di strategie e di protocolli a lungo termine con le ditte fornitrici, e della complessità degli iter burocratici sia di acquisto sia, soprattutto, di dismissione del materiale obsoleto. Proliferazione. L’Università di Firenze è “in rete” dal 1991; all’inizio, come è ovvio, con pochi sistemi sperimentali. In questi dieci anni di attività si è avuta una evoluzione e una espansione dei servizi, sia verso l’esterno, sia interni, che ha portato ad una moltitudine di server di varie dimensioni e potenza, nella logica che ogni nuovo servizio abbisognasse di un server. La situazione di “un servizio un server” è stata generata per vari motivi: la mancanza di un piano strategico unitario a lungo termine; l’evoluzione, a volte tumultuosa, dell’informatica che propone soluzioni e architetture non prevedibili con anni, se non mesi, di anticipo; i servizi esistenti, spesso di terze parti, ancorati ad architetture specifiche e/o antiquate che migrano con difficoltà, o addirittura non possono migrare, alle nuove architetture hardware e software; sistemi acquisiti che non possono scalare per ospitare nuovi servizi. Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 13 di 35 Riccardo Detti Cristina Mugnai Omogeneità. La crescita dei servizi offerti e, come abbiamo visto, dei server coinvolti, ha gravato, per contro, su un pool ristretto di persone che ha gestito i servizi in pratica fino dal loro esordio. Ciò ha portato, per una evidente ed implicita economicità di gestione, ad acquisire server aventi lo stesso sistema operativo e software di base. In pratica la maggioranza dei server rilevati sono prodotti da SUN Microsystems e “girano” lo stesso (nelle varie evoluzioni) sistema operativo: SUN Solaris. L’uniformare a livello di sistema operativo i vari server ha portato i seguenti vantaggi: la conoscenza approfondita del sistema ha permesso al personale di essere autonomo e risolvere situazioni critiche rapidamente; economia nella gestione del software di base che viene installato e manutenuto con le stesse modalità su i vari server; possibiltà di interscambio tra le persone che si occupano dei sistemi. Sono da notare alcune eccezioni: il sistema di posta elettronica insiste su sistema operativo Digital Open/VMS, il sistema di gestione delle segreterie studenti su IBM AIX, la sezione “Studenti” del sito web di ateneo in ambiente Windows 2000. Logica client-server a due livelli: è stata utilizzata moltissimo nel periodo di migrazione degli applicativi gestionali dai mainframe, ad architettura centrica, ai sistemi (tipicamente UNIX) in rete. Essa è utilizzata da alcuni sistemi in ateneo tra i quali il più importante è CIA. Il client-server a due livelli è considerato oramai obsoleto avendo dimostrato qualche limite; è essenziale la corretta valutazione delle problematiche indotte da questa architettura ai fini della collocazione di CIA nel modello proposto dal progetto. Sono qui elencati alcuni aspetti che verranno poi ripresi nel paragrafo 5.3: I client, possedendo in pratica tutta la logica applicativa, tendono ad essere molto complessi, abbisognano di hardware potente ed essendo numerosi impongono un costo di gestione e manutenzione oneroso. I client, colloquiando direttamente con il database centrale, generano un notevole traffico di rete, che spesso ha portato insoddisfazione all’utenza per i lunghi tempi di risposta dell’applicativo e costi per il potenziamento dell’infrastruttura di rete. I due aspetti appena citati si possono sintetizzare nella scarsa propensione della logica a due livelli a scalare verso un elevato numero di postazioni di lavoro. Il database, essendo acceduto direttamente dai client (che all’Università sono addiritura in rete pubblica), è esposto in rete e quindi pone gravi problemi di sicurezza. 4. Progetto Dopo aver elencato nei capitoli precedenti gli obiettivi del progetto, lo stato attuale dell’infrastruttura, dei server e dei servizi, questo capitolo introdurrà il contensto in cui opera il progetto, i suoi limiti e i punti di vista strategico, architetturale e di sicurezza del problema. 4.1. Filosofia del progetto La Server Farm, per definizione, costituisce le fondamenta su cui si basano i servizi informatici offerti dal CSIAF all’ateneo e le attività del personale del Centro. Ciò implica il contatto con praticamente tutte le unità organizzative del CSIAF, sia quelle direttamente coinvolte con l’erogazione dei servizi, sia quelle in back-end. Ai fini di una corretta iterpretazione del progetto è necessario “ritagliare” il dominio di responsabilit‘a della Server Farm. In particolare: È responsabilità del progetto della Server Farm del CSIAF lo studio, la scelta delle Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 14 di 35 Riccardo Detti Cristina Mugnai offerte sul mercato, l’implementazione e la messa in servizio: Dell’architettura informatica di insieme della Server Farm. Dell’infrastruttura di rete dedicata alla Server Farm, in collaborazione con l’area operativa “Servizi di Rete” per gli aspetti legati agli apparati di rete necessari e all’interazione della rete della Server Farm con la rete di ateneo. Dell’architettura e la tecnologia dei server della Server Farm, analizzate le proposte tecnologiche dei maggiori fornitori sul mercato. Dei sistemi operativi da installare sui vari server. Dei database, in collaborazione con l’area operativa “Sistemi Informativi”. Degli ambienti di sviluppo, intesi sia come server dedicati allo sviluppo di nuovi sistemi, sia come strumenti software (compilatori, interpreti, tools, ecc.), in collaborazione principalmente con l’area operativa “Sistemi Informativi” e con altre che possono abbisognare di tali strumenti. Del software per l’erogazione dei servizi di base. Dei sistemi di file server e di print server per la Farm e per il personale del Centro. Del sistema centralizzato di backup della Server Farm. Del sistema di monitoraggio. Vista la complessità del progetto si è deciso di sentire il “Settore Gestione Sistemi” del CINECA, che ha terminato da poco la ristrutturazione della proria Farm. CINECA è in grado di apportare un notevole contributo al progetto avendo in carico, anche se in scala pi ù grande, gli stessi servizi della Server Farm, essendo fornitore dell’Università di Firenze di alcuni servizi (CIA, Email per gli studenti) e, soprattutto, avendo conoscenza ed esperienza sulle tecnologie che si intende adottare nel progetto. Un aspetto interessante della collaborazione, emerso fino dai primi incontri, è l’esperienza del Settore Gestione Sistemi nel campo dei sistemi in cluster e, soprattutto, nell’aver sperimentato con successo e adottato tecniche di alta affidabilità e divisione di carico con server Linux. L’adozione di tali sistemi, prevista per alcune componenti nelle fasi preliminari del progetto, ma che induceva alcuni dubbi soprattutto sulla complessità architetturale e sull’affidabilità, trova adesso un conforto prezioso che si basa su una solida esperienza. 4.2. Open Source, GNU, Linux Fino a poco tempo fa la valutazione di un qualsiasi sistema software da classificare come “in produzione”, non avrebbe mai preso in considerazione software open source, ma sarebbe stato sicuramente orientato alla valutazione di prodotti industriali. Oggi, sarebbe insensato non considerare attentamente i prodotti disponibili dalle comunità open source, in quanto hanno dimostrato nel tempo caratteristiche di stabilità, performance, e adesione agli standard in assoluto non inferiori ai prodotti industriali. Anzi ultimamente assistiamo alla tendenza, sempre pi ù diffusa, dell’integrazione dei prodotti open source all’interno delle suite software vendute dalle software house industriali: un esempio per tutti è il web server Apache, considerato unanimemente un prodotto di altissima qualità e integrato in molti prodotti (ad esempio Oracle). La scelta di optare per il software open source, è una scelta di campo, filosofica, ma che può essere resa praticabile con un approccio pragmatico di valutazione, prodotto per prodotto, dei benefici e delle criticità rispetto allo stato dell’arte dei prodotti offerti dall’industria. Anche se, come appena detto, è indispensabile una valutazione puntuale, possiamo estrapolare un insieme Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 15 di 35 Riccardo Detti Cristina Mugnai di punti che aiutano ad inquadrare il problema: sono di eseguito elencati i vantaggi, i problemi e alcuni criteri generali di valutazione del software open source. 1) Vantaggi Economia. Il software con licenza GPL (o simili) è gratuito. Evoluzione. I software open source evolvono continuamente, sia per la correzione di errori e per deficienze sulla sicurezza, sia per l’implementazione di nuove funzionalit à. È un fattore estremamente positivo, ma può diventare un problema di gestione (vedi sotto). Adesione agli standard. L’etereogenità dei partecipanti allo sviluppo del software open source garantisce, come effetto intrinseco al processo di sviluppo,l’adesione agli standard. Inversamente, nei casi ove non ci siano specifiche formali, spesso i prodotti open source divengono essi stessi standard di fatto (vedi ad esempio il linguaggio PHP). Efficienza.È dimostrata continuamente l’altissima efficienza del software open source, dovuta probabilmente al processo “non economico” di sviluppo e alle conoscenze (alla genialità) delle persone che vi partecipano. 2) Problemi Evoluzione. La continua evoluzione dei prodotti open source pu ò imporre una elevata attività di gestione dovuta all’installazione di nuove versioni, patch, ecc. Contatto. L’aggiornamento, lo stato dell’arte, le linee di sviluppo, i problemi emersi, sono pubblicati nei siti web che ospitano lo sviluppo dei prodotti open source. Deve essere cura di chi li utilizza il verificarne periodicamente lo stato di evoluzione. Anche se questa è diventata una tendenza generale, adoottata anche dai sistemi industriali, deve essere prevista una periodica attività di monitoraggio dello stato dell’arte di ogni prodotto adottato. Garanzia. Nessuna garanzia. È completa responsabilità dell’utente la scelta del prodotto, la corretta installazione e configurazione, la manutenzione. 3) Criteri generali di valutazione Maturità del prodotto. Prodotti che hanno ancora in sviluppo parti essenziali, o siano molto innovativi come architettura, o che abbiano team di sviluppo di poche unit à, possono indurre cambiamenti radicali del prodotto o nella configurazione adottata; possono addirittura cessare l’attività di sviluppo e fondersi con altri gruppi che sviluppano prodotti simili. La maturità dei prodotti è un fattore essenziale nella scelta e nell’adozione di qualsiasi componente. Interesse. Prodotti che hanno una utenza vasta sono sviluppati da team di grosse dimensioni e possono contare su un feedback ampio e proveniente dalle pi ù diverse realtà di installazione. I prodotti di vasto interesse sono normalmente affidabili ed efficienti; in questa categoria si contano i prodotti che offrono i servizi “standard”: web server, MTA, ecc. Adozione da parte di utenti con requisiti simili alle proprie. Il confronto con entità che hanno già operato una scelta e messo in servizio prodotti di interesse e che abbiano requisiti confrontabili con i propri, può essere fonte di informazioni e indicazioni utili sia a livello di indagine, sia a livello di implementazione e configurazione dei prodotti. Il prendere in considerazione il software open source, con i criteri e le limitazioni appena viste, Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 16 di 35 Riccardo Detti Cristina Mugnai porta necessariamente a valutare il sistema operativo che e’ stato sviluppato dalla comunit à open source: Linux. Considerato all’inizio un esperimento, poi un sistema instabile da laboratorio e, infine, come un sistema operativo stabile ed efficientissimo, tanto da essere preso in cosiderazione, e addirittura offerto, dalle grandi case informatiche: IBM, SUN, HP. Soprattutto IBM ha fatto di Linux un cavallo di battaglia nella propria offerta di sistemi di piccola/media taglia e, ultimamente, lo offre anche come sottosistema operativo dei propri mainframe. Linux è da considerarsi una scelta obbligata se si intende utilizzare prodotti software open source. Anche se esistono porting e sviluppi paralleli su altre piattaforme dei principali prodotti, Linux è il sistema su cui vengono sviluppati, e rilasciati già in forma eseguibile, tutti i prodotti open source. L’unica seria limitazione di questo ambiente è la piattaforma hardware su cui gira in modo “nativo”: Intel o compatibile (AMD). Anche se si registra una crescita impressionante delle capacità di questi processori, dei chip di “glue”e degli standard di interconnessione delle periferiche, i sistemi che utilizzano queste tecnologie si collocano nella fascia più bassa, come caratteristiche di potenza, dei server. Come conseguenza, ove servisse una potenza di calcolo o di I/O superiore a quella fornibile da un server di questa classe è indispensabile ricorrere a sistemi proprietari di potenza medio/alta che implementano sistemi operativi UNIX (di solito sviluppati dalle stesse case che forniscono l’hardware). Uno o più sistemi di fascia media (spesso con hardware ridondante) con sistemi operativi proprietari e software applicativo industriale è stato fino ad oggi l’approccio standard per qualsiasi servizio di una certa importanza. La rapidissima evoluzione del software di base per le comunicazioni in Linux, ha introdotto di recente varie tecniche che permettono, in una certa misura, di aggirare le limitazioni di potenza dei server Intel. Il bilanciamento del carico applicativo su più server e il bilanciamento del traffico di rete su più interfacce, si candidano come tecnologie di base per raggiungere gli obiettivi architetturali previsti: ridondanza e scalabilità. In conclusione, nei casi in cui il software applicativo open source offra le caratteristiche necessarie al progetto, si ritiene percorribile la via di insiemi di server Linux, equipaggiati delle tecnologie appena accennate, per l’offerta di alcuni servizi. Al costo, forse, di una attivit à più onerosa di installazione, avremo sicuramente un notevolissimo risparmio economico, considerando la differenza di costo dell’hardware e delle licenze di acquisto e manutenzione degli applicativi. Affrontando il problema dal punto di vista opposto è possibile enunciare che se il costo economico di installazioni “standard”, magari prese in considerazione in una prima istanza, portassero i progetto fuori dal budget disponibile, è possibile riesaminarlo in un contesto open source più economico. 4.3. Architettura Questo paragrafo illustrerà il disegno generale della Server Farm, il contesto (framework) che racchiude tutti i sistemi coinvolti nel progetto. La Figura 2 illustra schematicamente l’architettura generale della Server Farm evidenziandone soprattutto gli aspetti della topologia delle varie reti locali che la compongono, della sicurezza, dell’organizzazione dei server e del posizionamento dei componenti di rilievo. I sistemi, sia nella sezione di front-end sia nella sezione applicativa, sono organizzati in cluster. Per cluster si intende in qusto caso la capacità di più di un server di offrire lo stesso servizio in modo di aumentare le capacità di carico durante il normale funzionamento e garantire la continuità dei servizi in caso di guasto di un server. La “collaborazione” dei server che offrono lo Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Pag. 17 di 35 Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Riccardo Detti Cristina Mugnai Internet 150.217. F W Cluster di Front−End DR Sezione di Front−End C7200 .1 ENALP RS RS RS ... RS .3 Sezione applicativa F W FS DR Cluster Server Applicativi SAN AS F W AS DB ... DB Database Cluster LAN di Management MGT ... BCK Sezione di Back−End 1 Gb Eth ENALP .22 F W DNS2 Fig. 2– Architettura generale della Server Farm stesso servizio non avviene (come nei veri cluster) mediante meccanismi interni ai server stessi, ma mediante l’azione di elemento esterno (DR in figura) che provvede a dirigere le richieste provenienti dall’esterno, sulla base del servizio richiesto, ai vari server. Ogni server lavora autonomamente, senza avere cognizione che altri possono offrire lo stesso servizio. La Figura 2 riporta, per quanto riguarda l’infrastruttura di rete, tre reti locali separate da firewall e una LAN dedicata al management. L’organizzazione a bastioni multipli dovrebbe garantire alla sezione di back-end, la più interna (che custodisce i database), un livello adeguato di sicurezza disaccoppiando i client che richiedono i servizi dai server applicativi mediante i proxy della sezione di front-end e controllando i flussi di informazione tra le varie LAN mediante i firewall. La rete di management permette l’accesso per la configurazione e il controllo dei vari sistemi solo dal sistema di management (MGT in figura); offre inoltre la possibilità di usufruire del sistema centralizzato di backup (BCK in figura) senza appesantire il traffico sulle altre LAN. Non sono rappresentati, per Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Pag. 18 di 35 Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Riccardo Detti Cristina Mugnai mantenere leggibile lo schema, gli apparati di rete e le modalità di collegamento dei vari server, che saranno descritti nel capitolo 5. Sulla destra della Figura 2 è rappresentata la Storage Area Network (SAN), sebbene sia un elemento che interessa più il tema tecnologico che architetturale. Lo schema riporta, comunque, quali sistemi la SAN dovrebbe assistere, garantendo (come illustrato nel paragrafo 8.2) performance e flessibilità di gestione. Il disegno architetturale proposto in Figura 2 risponde pienamente ai requisiti e agli obiettivi di progetto, ma introduce una complessità, soprattutto come numero di sistemi necessari ad attuarlo, troppo alta per essere messo in produzione nei termini previsti dal progetto. Si ritiene quindi opportuno implementare in un primo momento solo una parte del disegno appena illustrato, in modo da verificare “sul campo” le scelte operate (ed eventualmente aggiustarle), per poi completare il disegno in una fase successiva. Le parti da implementare secondariamente sono sostanzialmente due: la sezione di front-end e la LAN di management. Sezione applicativa Internet F W FS DR Cluster Server Applicativi 150.217. SAN C7200 AS .1 ENALP ... AS .3 F W DB ... DB Database Cluster MGT 1 Gb Eth BCK Sezione di Back−End Sede del Rettorato F W DNS2 Fig. 3– Architettura generale della Server Farm — Deployment iniziale ENALP .22 La parte di front-end, prevista dal progetto come interfaccia verso l’esterno attraverso l’uso di sistemi di proxy, imporrebbe un firewall e un bilanciatore di carico in alta affidabilità e un insieme di server per ospitare i sistemi proxy. La posticipazione di questa sezione riduce senz’altro il livello di sicurezza dell’intero sistema, ma permette di concentrare, senza rinunciare a nessun servizio previsto, le attività di implementazione e di tuning sulla parte più critica: la sezione applicativa. La LAN di management può essere rimandata o addirittura tolta dal progetto senza che esso ne risenta notevolmente. Concentrando le attività di backup dei sistemi durante le ore notturne, quando cioè il traffico è più basso, non dovrebbero presentarsi problemi di saturazione degli apparati di rete. Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 19 di 35 Riccardo Detti Cristina Mugnai Per il monitoraggio e la configurazione dei sistemi è proponibile,se i sistemi sono in numero limitato, il collegamento in seriale facendo funzionare come concentratore il sistema di management. Tale soluzione avrebbe come vantaggi minori problemi di sicurezza e di configurazione. Anche da un punto di vista economico il posticipare le reti di front-end e di management permette un margine di manovra più ampio nelle parti del progetto più critiche o più onerose, ad esempio i server per i database e la SAN. La Figura 3 sintetizza gli aspetti appena discussi, mostrando l’architettura generale al primo stadio di implementazione. In conclusione l’architettura generale, anche se implementata all’inizio solo parzialmente rispetto al disegno completo, soddisfa i prerequisiti imposti dagli obiettivi del progetto e le necessit à discusse nei capitoli precedenti; viene proposta di seguito una lista che riassume gli aspetti salienti dell’architettura proposta: Organizzazione modulare dell’infrastruttura di rete e di sicurezza. I server collaboranti mediante un divisore di carico possono scalare in base alle esigenze, aggiungendo semplicemente altri server all’insieme. Avendo ogni servizio ripartito su più server si ha continuità di servizio anche a fronte della rottura di un server (fault-tolerance). L’architettura è indipendente dalla tecnologia dei server utilizzati: si possono usare pochi server di fascia media o più server di fascia bassa in tecnologia Intel (Linux) a seconda delle esigenze delle piattaforme applicative. I server sono assistiti da tre componenti di servizio: il sistema centralizzato di backup; il file server; il sistema di management. 5. Rete L’infrastruttura di rete della Server Farm costituisce, di fatto, il contesto entro il quale operano tutti gli altri sistemi. I paragrafi seguenti illustrano gli aspetti topologici, tecnologici e di sicurezza della rete interna alla Server Farm. 5.1. Topologia La topologia delle reti locali (LAN) interne alla Server Farm, come si desume dalla Figura 3, è costituita da due reti: una LAN su cui insistono i server applicativi, è collegata alla rete di ateneo attraverso un firewall e, mediante un secondo firewall, verso la LAN pi ù interna che ospita i database e i sistemi di controllo e di gestione. La scelta di due firewall in cascata, rispetto ad un firewall a tre vie, è giustificata essenzialmente da due fattori: il troughput e la semplificazione della configurazione, come descritto più in dettaglio nel paragrafo 5.3. 5.2. Tecnologia Le due LAN saranno implementate utilizzando lo standard Ethernet. Per garantire il troughput previsto gli switch saranno collegati tra loro e con i firewall con interfacce a 1Gb/s, mentre i sistemi saranno collegati alla rete con interfacce a 100Mb/s o ad 1Gb/s in funzione del loro carico di lavoro. Tutti gli apparati di rete (switch) dovranno essere configurabili e monitorabili da remoto e sar à valutata la possibilità di installarne in ridondanza in modo da pemettere il funzionamento della rete anche in caso del guasto di un componente. Poiché è prevedibile che i server saranno installati in rack, i collegamenti tra i server e gli switch saranno in rame, mentre i link tra i rack e verso la rete di ateneo saranno in fibra ottica. Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 20 di 35 Riccardo Detti Cristina Mugnai 5.3. Sicurezza e firewall La sicurezza dell’intero sistema è affidata principalmente ai firewall i quali saranno preposti principalmente al filtraggio delle connessioni provenienti dall’esterno, permettendo l’accesso soltanto ai servizi previsti. I firewall, inoltre, si occuperanno di trasformare gli indirizzi privati dei server in indirizzi pubblici (NAT). L’utilizzo di spazi di indirizzamento privato nelle LAN interne, insieme alle attività di filtraggio e di NAT dei firewall garantisce un accettabile livello di sicurezza dei sistemi verso l’esterno, mantenendo alto il livello di interoperatività e di servizio tra i server all’interno delle LAN. I firewall saranno costituiti da coppie di sistemi Linux in alta affidabilità sfruttando le caratteristiche di filtraggio del kernel e del software iptables. La soluzione pi ù economica sarebbe di installare un solo firewall con tre interfacce: la prima vesro la rete esterna, la seconda verso la LAN applicativa e la terza verso la LAN di back-end. Poiché le interfacce del firewall saranno a 1Gb/s, esiste la possibilità che si saturino le capacità interne, ad esempio il bus PCI, del firewall creando un collo di bottiglia. Viceversa, installando due firewall in cascata, a fronte di un maggior costo economico, si ha la sicurezza che i firewall possano mantenere i traffico teorico della rete Ethernet a 1Gb/s; come effetto secondario si semplificano notevolmente gli schemi di filtraggio e di routing, facilitando le operazioni di mantenimento. Lo schema architetturale a doppio bastione, che pone i sistemi pi ù critici nella LAN più interna, è pensato principalmente per la protezione delle basi di dati e dei sistemi che le ospitano. Il firewall centrale dovrebbe permettere l’accesso ai database server solo dai server applicativi in modo tale da isolare ulteriormente la sezione di back-end dall’esterno. Purtroppo l’architettura a due livelli utilizzata da CIA impone che ogni postazione di lavoro dell’utenza si debba collegare direttamente con il databse server; i firewall, pertanto, dovranno essere configurati in modo tale che le postazioni su cui è installato CIA possano aprire connessioni verso il database server. Tutto ci ò riduce notevolmente l’efficacia dell’intero disegno. Si possono, per ora, ipotizzare due soluzioni, ma è necessario discutere con CINECA il problema della sicurezza della Server Farm in relazione all’uso di CIA. Le due ipotesi sono: 1) Collegare con una terza interfaccia il firewall più interno verso la rete di ateneo. In questo modo si snellirebbe la configurazione del primo firewall, ma si otterrebbe un livello di sicurezza paragonabile a quello odierno. 2) Porre un server di VPN (Virtual Private Network) nella LAN applicativa (o quella di back-end) e installando i relativi client su ogni postazione utente. 6. Sezione di front-end La sezione di front-end, composta essenzialmente da sistemi di proxy, garantisce il disaccoppiamento delle connessioni dei client dai server applicativi. Come accennato nel paragrafo 4.3 questa sezione verrà implementata in un secondo momento. 7. Sezione applicativa 7.1. Tecnologia La sezione applicativa della Server Farm sartà popolata di server predisposti all’offerta, principalmente, dei servizi “standard” di Internet. In questo campo il software open source è considerato eccellente; si prevede, pertanto, l’utilizzo di server Linux che ospitano i principali servizi. Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 21 di 35 Riccardo Detti Cristina Mugnai I server applicativi saranno coadiuvati da un sistema (Linux) in alta affidabilità che opererà come bilanciatore di carico mediante il software LVS (Linux Virtual Server). Per massimizzare la capacità di carico dell’intero sistema si è optato (tra le varie configurazioni possibili) per la configurazione DR (Direct Routing) dell’LVS. 7.2. Servizi 7.2.1. DNS Il DNS, implementato utilizzando il software standard di Berkeley BIND, non si presta come servizio a valle del bilanciatore di carico poiché il carico generato dai client verso il DNS è basso e la duplicazione su più server del servizio aumenterebbe soltanto il traffico di rete verso i server esterni di livello gerarchico più alto, duplicando inutilmente le cache dei server locali. Tenendo conto dello scarso utilizzo delle risorse dei server da parte del software LVS (specialmente in modalità DR), il sistema in alta affidabilità del bilanciatore di carico è ottimale per ospitare il servizio DNS. 7.2.2. WWW Ritenendo strategici la progettazione e lo sviluppo in un unico contesto della parte statica, informativa, del sito web di ateneo e della parte dinamica orientata ai servizi, la piattaforma software per i servizi WWW dovrà soddisfare entrambe le necessità. Inoltre l’evoluzione della parte informativa statica verso un sistema dinamico di content management è altrettanto importante e porta a valutare soluzioni software verticali. L’offerta Oracle della propria piattaforma Application Server e Portal, illustrata recentemente dai tecnici Oracle in una serie di seminari tenuti presso il CSIAF, potrebbe soddisfare le necessit à appena esposte oltre ad un insieme di possibiltà, come valore aggiunto, che innalzerebbero sicuramente il livello qualitativo e di servizio del sito web di ateneo. Sono elencate di seguito, in estrema sintesi, alcune delle caratteristiche salienti del prodotto Oracle: Il motore HTTP è Apache standard con alcuni moduli (in aggiunta a quelli standard tipo PHP o PERL) per l’interfaccia verso i database Oracle (PL/SQL) e verso l’ambiente Java. L’Application Server (AS) è un motore Java in grado di agire come Servlet container e come container per gli Enterprise Java Beans. Questi sono rispettivamente lo standard attuale presso il CSIAF per la produzione dei servizi via WWW e la piattaforma, più complessa, verso la quale potrebbero convergere i servizi in futuro. Il software di portale, che permette funzionalità di alto livello,sia per il processo di management dei contenuti sia per la naturale integrazione della parte informativa e di servizio. L’ambiente di portale è integrato in AS. Il sistema di management permette, mediante l’uso di un database di repository, la configurazione e la gestione di tutti gli aspetti dell’AS ed eventualmente anche dei database associati. L’AS può essere configurato su più server a valle di un bilanciatore di carico. Il software di management è in grado di replicare la configurazione su più server mediante l’uso del repository. L’AS, o meglio tutti gli applicativi e i servizi via WWW, possono usufruire dell’infrastruttura di Single Sign On che permette all’utente di autenticarsi una sola volta per qualsiasi servizio voglia utilizzare. Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 22 di 35 Riccardo Detti Cristina Mugnai L’AS incorpora anche un server LDAP v3 che oltre alle funzionalità previste dallo standard offre una capacità di interfaccia diretta verso i database Oracle. Questa caratteristica permetterebbe il caricamento e la gestione dei contenuti del directory server con modalità molto più lineari e rapide rispetto a quelle degli altri prodotti. L’AS permette la produzione di report, sia a stampa che pubblicabili via WWW, con strumenti interattivi che si interfacciano direttamente con il portale, i database ed eventualmente con i cubi di data warehouse. Il pacchetto di gestione delle segreterie studenti (GISS) adotta questa piattaforma per la presentazione via WWW verso i client; GISS sarebbe perfettamente integrabile con indubbi vantaggi di gestione e di economia. Nell’eventualità che i prodotti Oracle non siano economicamente sostenibili la scelta alternativa, che ricadrebbe su prodotti open source, potrebbe essere la seguente: Apache come motore HTTP con i moduli per PHP, PERL e Java. Jakarta/Tomcat come servlet container. Envolution per il portale ed il content management. OpenLDAP per il directory service. Sarebbero da valutare sistemi per la produzione di report. Il Single Sign On sarebbe da integrare. Nel caso si opti per i prodotti Oracle per la piattaforma applicativa la scelta dell’hardware può essere vincolata dal tipo di accordo tecnico/economico che si stipulerà con il fornitore. Poiché normalmente Oracle quota i propri prodotti in base al numero di processori che saranno utilizzati dal cliente, nel caso venga applicata questa politica, può essere economicamente vantaggioso scegliere hardware che offra la maggiore potenza possibile per CPU, tipicamente sistemi di fascia media con processori RISC a 64 bit. Nel caso invece venga stipulato un agreement complessivo, che ci svincolasse dal numero di CPU che utilizzeremo, potrebbero essere impiegati anche per questa parte server Linux a basso costo. Mentre si dà per scontato che servizi on-line via WWW insistano su database relazionali (Oracle), il catalogo on-line per le biblioteche (OPAC/WWW) utilizza un sistema di information retrieval dedicato (vedi paragrafo 3.3.1.2). Per l’OPAC si ipotizza di integrare la parte procedurale (procedure CGI in TCL/Sibylla) nei server applicativi, in modo da sfruttare il bilanciamento di carico, mentre la base di dati sarà ospitata da un server dedicato. 7.2.3. Proxy Per il servizio di proxy WWW verrà utilizzato il software open source Squid. Per il proxy, la cui attività principale è di mantenere una cache locale dei documenti web consultati in Internet, potrebbero valere i concetti che ne limitano l’uso a valle di un bilanciatore di carico visti per il DNS nel paragrafo 7.2.1. Sembra comunque sia possibile, con una particolare configurazione di LVS e di Squid, fare cooperare più cache di pari livello; tale possibilità sarà valutata in dettaglio durante la fase di deployment del servizio. Successivamente, stabilizzato il servizio, pu ò essere affrontata la valutazione di evolvere il sistema verso il “transparent proxy”, ovvero di rendere automatico il funzionamento del sistema senza dover configurare ogni client per l’utilizzo del proxy. 7.2.4. Email Il servizio di Email è ormai consolidato da anni ed è il servizio che coinvolge il più alto numero di utenti, circa 5000. Si ritiene comunque necessario valutare i software disponibili, sia Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 23 di 35 Riccardo Detti Cristina Mugnai open source che industriali, soprattutto al fine di integrare questo servizio con gli altri e di unificare la piattaforma operativa. I pacchetti dovranno essere valutati, come gli altri, in funzione delle loro potenzialità e della loro rispondenza ai requisiti che si ritengono necessari, ma soprattutto dovranno essere esaminate le problematiche di passaggio dal sistema attualmente in uso verso quello giudicato idoneo, in modo da rendere il più indolore possibile all’utenza l’utilizzo del nuovo sistema. L’adozione di un nuovo sistema di Email dovrebbe migliorare sia gli aspetti di gestione che la qualità e la potenzialità del servizio; in particolare: I server che ospiteranno il servizio saranno Linux o Unix, la loro gestione e manutenzione sarà omogenea con gli altri server; ad esempio l’aggiornamento del sistema operativo, l’uso del sistema centrale di backup e il monitoraggio saranno gli stessi degli altri server. La parte di front-end, cioè la ricezione dei messaggi via SMTP/ESMTP ed il controllo dei virus, può essere implementata su più server, mediante il controllo del bilanciatore di carico; si otterranno così i vantaggi visti per gli altri servizi. Il sistema di Web Mail, cioè l’interfaccia via WWW per l’uso della posta elettronica, ad oggi un po’ rudimentale, potrà essere integrata con gli altri servizi e utilizzare software allo stato dell’arte. Ciò potrebbe portare ad utilizzare normalmente questo sistema al posto dei client (OutLook, Eudora, ecc.) attualmente in uso ed minimizzare le problematiche di installazione e di funzionamento presso l’utenza. L’interfacciamento verso il directory server (LDAP) e verso il sistema di Single Sign On porterà questo servizio a integrarsi completamente con gli altri, facilitandone l’uso all’utente e al tempo stesso riducendo di molto la complessità di gestione al personale della Server Farm, soprattutto riguardo alla gestione delle mailing-lists. I pacchetti software che saranno comparati al fine di trovare il migliore rapporto tra funzionali à, gestione, migrazione e costi saranno: PMDF su sistema operativo UNIX, di InnoSoft. Questo è il pacchetto che attualmente è in funzione sul sistema OpenVMS. Sarà il punto di riferimento per la valutazione degli altri sistemi. Postfix. È un prodotto originariamente sviluppato da IBM e da qualche tempo reso pubblico. Progettato per superare le difficoltà di configurazione e le scarsa sicurezza di sendmail, si pone oggi come una delle MTA di riferimento nell’ambiente open source. È il software scelto da CINECA per il servizio di posta elettronica per gli studenti. Qmail. È il più sicuro dei software di Email in circolazione. La sua sicurezza risiede anche sulla semplicità con cui sono implementati i vari servizi. Conta un numero elevatissimo di utenti soprattutto in realtà molto grandi e sono disponibili molti pacchetti per aumentarne le capacità: imap, autenticazione sicura, LDAP, ecc. Courier. Software completamente sviluppato dalla comunità open source (il sito web è ospitato su Source Forge) ricalca la filosofia di Qmail, ma è molto più aderente agli standard. La caratteristica saliente è il motore di filtraggio dei messaggi, che risiede all’interno del nucleo del programma, e che permette l’eliminazione e la corretta gestione del traffico di spam. È dotato di tutti i servizi, compreso web mail. 7.2.5. FTP Il servizio di FTP è ad oggi scarsamente utilizzato. Potrebbe essere, al contrario, un servizio molto utile che il CSIAF potrebbe dare all’ateneo. Installando un server affidabile e sicuro Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 24 di 35 Riccardo Detti Cristina Mugnai (es. ProFTPD) per chi utilizza direttamente il protocollo FTP e potenziando il servizio mediante l’accesso ai files via WWW per gli utenti che non lo conoscono, potrebbero essere resi disponibili: le principali distribuzioni di Linux, gli aggiornamenti e le patch di Windows e i principali pacchetti software. Tutto ciò permetterebbe all’utenza di avere un luogo “vicino” di facile e di rapido accesso e al contempo un sicuro risparmio di traffico verso, e soprattutto da, l’esterno per il download del software. La Server Farm si doterà comunque di server per l’accesso FTP, essendo necessario, ad esempio, per l’upload dei documenti web e per altri servizi (vedi paragrafo 3.3.1.4), così come sarà disponibile il file sharing via WWW per facilitarne l’uso. La quantità, il tipo di informazioni e la politica con cui saranno disponibili all’utenza esula però dallo scopo del progetto. 7.2.6. LDAP Il servizio di directory, presente da anni in rete, solo ultimamente ha conosciuto un vero e proprio sviluppo, tanto da divenire un servizio essenziale. Poiché adesso anche i servizi più diffusi (ad esempio Email) basano le fasi di autenticazione e autorizzazione sul protocollo LDAP, la costituzione di un directory server centrale che contenga le informazioni del personale e degli studenti è da considerarsi obbligatoria. È attualmente allo studio, con un gruppo di lavoro presso il CSIAF, sia il contesto pi ù prettamente tecnologico rivolto principalmente alle tecniche di autenticazione e al mantenimento dei dati, sia la valutazione, logica e strutturale, delle informazioni che saranno disponibile nel directory tree. Il gruppo sta inoltre valutando le caratteristiche tecniche dei vari server disponibili sul mercato e le loro capacità di interfacciamento verso i database di produzione; in altre parole il gruppo di lavoro sta cercando il prodotto che permetta il modo più agevole di alimentazione dell’LDAP con i contenuti dei database del personale e degli studenti. 7.2.7. Streaming 7.2.8. Segreterie Studenti L’applicativo GISS, fornito da Sistemi Informativi, si basa completamente sulla piattaforma Oracle: il modulo FORMS dell’Application Server per la presentazione via WWW ai client e il database per i dati e le procedure in PL/SQL. Nel caso, auspicato, in cui si decida di adottare la stessa piattaforma per il sito web di ateneo e per i servizi online, la parte di presentazione di GISS sarebbe integrata agli altri servizi condividendone i server e le caratteristiche, come descritto nel paragrafo 7.2.2. 7.3. Servizi interni 7.3.1. File service Il file server riveste un ruolo centrale nell’architettura della Server Farm; poiché molti servizi saranno installati su più di un server, il file server funzionerà da repository per le configurazioni di ogni servizio. Le informazioni saranno sincronizzate sui server applicativi (ad esempio via rsync) o accedute dai server come filesystem remoti (NFS). Il file server esporterà, mediante i protocolli NFS e SMB, spazi disco propri per le attività del personale della Server Farm e altri spazi a comune per favorire e semplificare il lavoro di gruppo e Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 25 di 35 Riccardo Detti Cristina Mugnai lo scambio di informazioni tra il personale del Centro. Gli spazi disco messi a disposizione saranno accedibili sia da stazioni Windows (via SMB) che Unix/Linux (via NFS). Il file server sarà costituito da una coppia di sistemi Linux in alta affidabilità; il sistema esporterà i filesystem sia attraverso la modalità nativa Networked File System, sia attraverso il server Samba per interfacciare le stazioni Windows. I due server condivideranno i dischi o, meglio, useranno gli stessi volumi messi a disposizione dalla SAN. 7.3.2. Print service I servizi di stampa saranno resi disponibili dallo stesso sistema di file server. Con modalità simili allo share dei filesystem il sistema permetterà l’uso delle stampanti della Server Farm sia alle stazioni Windows, mediante Samba, sia alle stazioni Linux/Unix mediante i servizi nativi di remote print. La Server Farm si doterà di stampanti adeguate alle necessità del centro; si prevede di utilizzare una stampante HP in bianco/nero formato A3 con fronte/retro da 32 ppm già presente al CSIAF e di acquisirne una nuova a colori con caratteristiche simili. 8. Sezione di back-end – Database e servizi ausiliari 8.1. Database Le basi di dati rivestono l’aspetto più importante della sezione di back-end; il doppio bastione di firewall è posto proprio per dare una maggiore sicurezza ai database ospitati da questa sezione. Poichè i principali sistemi gestionali utilizzano i database Oracle e anche i servizi online, fino dal 1998, accedono via JDBC allo stesso motore di database, non c’è ragione di valutare un RDBMS alternativo. Viceversa l’organizzazione e la gestione dei database a tutt’oggi è assai poco efficace; in pratica ogni applicativo ha uno (o più) database server dedicato, imponendo una duplicazione delle attività di aggiornamento del software di sistema e del RDBMS. Anche l’hardware necessario risulta in eccesso rispetto ai risultati ottenuti, e impone l’uso di sistemi costosi. Recentemente Oracle ha introdotto la tecnologia di cluster per il proprio motore di database, denominata RAC (Real Application Cluster), che permette a più server (a uno o più processori) di coordinarsi e di lavorare “in gruppo” sulle stesse basi di dati. Utilizzando tale tecnologia si avrebbero una serie di vantaggi: Fault-tolerance e scalabilità. Valgono gli stessi criteri espressi nel paragrafo 4.3. Come per i server applicativi il cluster di database avrebbe gli stessi vantaggi. Snellimento delle procedure di gestione. Avendo server uguali ed una sola versione del RDBMS la manutenzione e l’aggiornamento dei sistemi è meno onerosa. In aggiunta è possibile mettere in manutenzione un nodo (server) del cluster alla volta mantenendo attivi i servizi. Hardware. L’impiego di più server apre la possibilità di installare server di fascia bassa, ottenendo un risparmio economico. L’adozione del RAC come motore centrale di database impone per ò alcune limitazioni che devono essere attentamente valutate: la più importante risiede nel numero di istanze di database. Il RAC è concepito per coordinare il lavoro di più server sulla stessa istanza di database; su ogni Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 26 di 35 Riccardo Detti Cristina Mugnai server risiede il software e tutto l’ambiente operativo di una istanza. Nel caso si abbiano N istanze su M server si dovranno gestire N * M configurazioni; risulta dunque essenziale cercare di ridurre al minimo il numero di istanze necessarie. Ad una prima analisi sembrerebbe possibile unificare l’istanza del database di GISS con i servizi online, i quali utilizzano in gran parte gli stessi dati, ottenendo anche una maggiore efficienza ed eliminando quasi totalmente le attività notturne di trasferimento di dati tra server diversi. Appare invece più problematica la situazione che riguarda CIA, che impone attualmente quattro istanze (tre di produzione e una di test). Sarà necessario un studio più approfondito del problema coivolgendo i tecnici che si occupano di CIA al CINECA. La seconda limitazione imposta dal RAC è di tipo tecnologico/economico; i server devono montare un sistema di clustering e, soprattutto, devono accedere contemporaneamente allo stesso spazio disco imponendo, di fatto, l’utilizzo di una SAN. Dovranno quindi essere valutati in dettaglio i rapporti costo/beneficio dei vari componenti del sistema (Numero e potenza dei server, software di clustering, software del RAC, SAN) per operare una scelta ottimale. Si ipotizzano alcuni scenari possibili: 1) Server separati, nessun cluster. Si tratta della semplice evoluzione che porta i server attuali all’interno della nuova struttura della Server Farm. I server potrebbero essere gli stessi (o di nuova acquisizione), della stessa classe e con caratteristiche simili a quelli esistenti. I costi, la gestione e le caratteristiche di servizio sarebbero simili a quelle odierne. Il miglioramento delle prestazioni si ottiene acquistando server più potenti. 2) Cluster di server di fascia media (RAC). Un cluster a due o massimo tre nodi costituito da server di media potenza da 4 o 8 processori; sistema operativo Unix; necessità del software di clustering; Connessione ridondata alla SAN. È, rispetto alla precedente, una soluzione con migliori caratteristiche di servizio, che unisce la potenza dei server di fascia media con le caratteristiche dei cluster; i costi dei componenti sono alti. 3) Cluster di server Linux (RAC). Un cluster da quattro a otto nodi costituito da server Intel da 2 o 4 processori; sistema operativo Linux; il software di cluster è incluso nel RAC; connessione alla SAN. È lo scenario più aggressivo dal punto di vista tecnologico; i punti critici possono essere: la gestione, a causa dell’elevato numero di nodi del cluster; l’innovazione, in un’area in cui la stabilità è essenziale. 4) Coppie di server in Cluster HA (Unix o Linux). Due coppie di server a 4 processori; sistema Linux o Unix (nel caso di Unix il software di clustering va acquistato); connessione ridondata alla SAN. Ogni server ospita una o più istanze di database (distribuite in base alla stima del carico). In caso di guasto il server in coppia offre, in modo degradato, anche i servizi del primo. Questa scenario, più conservativo rispetto al RAC, risponde però alle esigenze di flessibilità sul numero delle istanze di database, che è destinato a crescere in futuro; garantirebbe inoltre l’isolamento tra le applicazioni, che può essere un vincolo imposto dalle aziende fornitrici dei pacchetti applicativi. Il numero di configurazioni è N * 2. 8.2. Storage Area Network La Storage Area Network (SAN) è un elemento infrastrutturale sul quale si basano molte scelte architetturali del presente progetto. Dal punto di vista fisico si tratta di uno o più controller dischi ad alte prestazioni in configurazione ridondata che gestiscono uno o più array di dischi. I controller espongono verso i sistemi Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 27 di 35 Riccardo Detti Cristina Mugnai interfacce in fibra ottica a 2Gb/s di tipo Fibre Channel Arbitrated Loop (FC-AL). I dischi contenuti negli array sono acceduti mediante un doppio canale FC-AL in rame. La connessione dei server viene effettuata mediante switch ottici (solitamente a 16 o 32 porte) che collegano gli adattatori in fibra ottica installati sui server ai sistemi a dischi. Dal punto di vista logico e funzionale si nota innanzitutto che lo storage, normalmente interno ai server e gestito in modo autonomo, è invece un sistema centralizzato a se stante, con proprie funzionalità di gestione e di amministrazione, che offre come “servizio” lo spazio disco di cui i vari server abbisognano. La centralizzazione dello storage offre, come conseguenza diretta, una unica interfaccia per il management di questa risorsa per tutti i sistemi e una estrema flessibilità nella pianificazione e nella assegnazione di spazio disco ai vari server. Altra importante caratteristica introdotta dalla SAN è la possibilità di implementare i server come cluster in alta affidabilità (HA). Infatti in caso di guasto di un server o di un suo componente o servizio, l’altro server della coppia, che monitorando i servizi dell’altro si accorge del guasto, “eredita” l’accesso alla SAN del primo server e offre oltre ai propri anche i servizi del server guasto. Anche se esistono in commercio altre soluzioni per lo share di dischi per i cluster HA, ad esempio controller SCSI intelligenti che permettono la presenza sul bus SCSI di due server contemporanei, o degli array di dischi esterni con doppio accesso, la soluzione SAN offre sicuramente le caratteristiche migliori come sicurezza, gestione e flessibilità di utilizzo. Quest’ultima caratteristica è estremamente importante in una realtà come quella del CSIAF in cui si ha una continua e rapida espansione e diversificazione dei servizi offerti. L’implementazione di una SAN nella Server Farm alza però il costo dell’operazione. Infatti l’alta tecnologia dei componenti l’infrastruttura (controller, adattatori, switch e dischi), ma soprattutto la classe di mercato in cui questi componenti si collocano, pongono la SAN come elemento che economicamente non è trascurabile anche se riferito all’intero progetto. 8.3. Sistema di Backup Il sistema centralizzato di backup è uno degli obiettivi del progetto; attualmente i server provvedono al salvataggio dei dati e degli ambienti software mediante dispositivi (normalmente streamer DDS a 4mm) interni ai server stessi o sfruttando via rete i drive di altri server nei momenti in cui essi non sono utilizzati. La gestione dei salvataggi risulta piuttosto intricata e prona all’errore; le procedure di salvataggio, che indirizzano direttamente o remotamente i drive a nastro, presenti sui sistemi devono essere sincronizzate e devono tenere in conto i volumi di dati da salvare e la durata di ogni operazione. I sistemi periferici (le stazioni di lavoro e i server di workgroup) non hanno possibilità di backup o, al massimo, utilizzano spazi disco temporaneamente disponibili dei server. Il progetto prevede un sistema (Linux) per gestire in modo centralizzato i backup; il server si interfaccerà ad un dispositivo a natri con tecnologia LTO da 100 GB a due drive e libreria automatica (autochanger) da almeno 15 nastri, mediante bus SCSI. Al fine di disaccoppiare le attività di salvataggio dei server (e delle stazioni di lavoro) dalla scrittura fisica sui nastri, il server di backup sarà dotato di dischi, da utilizzare come buffer, con capacità almeno doppia dei nastri utilizzati (circa 400 GB). Sono inoltre disponibili software open source per la gestione centralizzata dei backup (ad esempio AMANDA) che permettono la schedulazione dei backup, completi e incrementali, dei server e l’utilizzo efficiente delle librerie di nastri. Questi software sono in grado di interfacciare Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 28 di 35 Riccardo Detti Cristina Mugnai i sistemi Windows, in modo da poter ricevere i backup anche dalle stazioni di lavoro di tutto il personale ed eventualmente da server con questo sistema operativo. Dovranno invece essere valutate in dettaglio tecniche che permetteranno il salvataggio in modo fisico delle partizioni di sistema, sia dei server sia delle stazioni di lavoro, al fine di permettere un ripristino rapido delle funzionalità in caso di guasto ai dischi di sistema, evitando la reinstallazione dei sistemi operativi e dei software di base. 8.4. Monitoraggio Lo sforzo progettuale teso alla massima unificazione dei server e dei sistemi operativi all’interno della Server Farm, trova nel sistema di monitoraggio la sua migliore giustificazione. Si ritiene infatti indispensabile, dato il numero di server, del numero e della complessità dei servizi, un sistema che permetta in tempo reale l’individuazione e la localizzazione dei guasti degli apparati di rete e dei server, controlli il corretto funzionamento dei servizi e misuri costantemente il traffico di rete e il carico di lavoro dei server. L’omogeneità dei sistemi coinvolti semplifica di molto il delicato processo di messa a punto del sistema di monitoraggio, massimizzando l’efficacia di tale sistema. È doveroso citare che mediante l’uso dell’attuale stazione di network management (che utilizza SUN Network/Domain Manager), orientata più al monitoraggio della rete che dei sistemi, si sono avuti riscontri molto positivi riguardo alla tempestività delle diagnosi (spesso si sono attivati interventi prima della segnalazione del guasto da parte dell’utenza) e della gestione della rete di ateneo. Mentre fino a poco tempo fa era necessario ricorrere a prodotti software delle grandi case (SUN Network Manager, HP Open View, IBM Tivoli) per ottenere le necessarie caratteristiche di monitoraggio, si stanno ultimamente affermando prodotti open source che offrono capacit à comparabili e che dovrebbero integrarsi perfettamente con le strutture previste. In particolare saranno valutati in dettaglio e verificati mediante test sul campo due prodotti open source: OpenNMS e Nagios. OpenNMS, accreditato come uno dei migliori in circolazione, è basato sull’architettura Java/Servlet, utilizza un database relazionale (PostGres) e files di configurazione XML. Ha capacità di controllo dei sistemi e della rete a basso livello, ma, soprattutto, offre moduli per il monitoraggio dei servizi (database, email, web, ecc). L’architettura Java semplificherebbe, se fosse necessario, attivitità di messa a punto e estensione degli agent in base alle conoscenze acquisite in passato in questo ambiente. Nagios offre un’ampia gamma di possibilità di controllo sia della rete sia dei sistemi, richiedendo al contempo una infrastruttura di sistema per il funzionamento molto pi ù semplice rispettoa OpenNMS. È il sistema di monitoraggio più diffuso ed è utilizzato da CINECA per il monitoraggio del proprio data center. Dal punto di vista fisico il server che ospita il sistema di monitoraggio sarà connesso alla rete di back-end, per motivi di sicurezza, e alla SAN in modo da concentrare su una stazione il controllo di tutta la Server Farm. 9. Dimensionamento dei sistemi Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 29 di 35 Riccardo Detti Cristina Mugnai Con scopo puramente introduttivo, al fine di fornire indicazioni per guidare il progetto verso la fase esecutiva vengono fornite alcuni “scenari” in cui si ipotizzano scelte sugli ambienti applicativi, i sistemi operativi, il numero e le caratteristiche (essenziali) dei server. Il prossimo paragrafo illustra la parte “stabile”, cioè l’insieme di server e di servizi di cui, sin da ora, si possono descrivere le caratteristiche tecniche e di architettura; i paragrafi successivi descriveranno invece soluzioni tra loro alternative che si differenziano soprattutto sulla tecnologia di alcuni server e, di conseguenza, sull’architettura complessiva. 9.1. Parte stabile Si assume innanzitutto di utilizzare software open source per i seguenti “componenti”: Firewall DNS Load balancer LDAP server Proxy Mail server File e print server FTP server Backup server Management Come conseguenza (vedi il paragrafo 4.2) questi componenti saranno ospitati da sistemi con Linux su server in tecnologia X86. I due firewall previsti dal progetto saranno realizzati come coppie di server Linux in cluster HA con la seconda unità in stand-by. Ogni sistema sarà dotato di due processori X86 con 1GB di memoria e 2 NIC ethernet a 1Gb/s. Un cluster HA ospiterà il DNS e il software di distribuzione del carico (LVS) sul primo server e il server LDAP di front-end sul secondo. I sistemi saranno dotati di due processori X86, 2GB di memoria, Ethernet a 1Gb/s e interfaccia FC-AL verso la SAN. Un cluster HA offrirà i servizi di file e print sharing (SAMBA) e FTP sul primo server, mentre il secondo esporterà in NFS il filesystem contenente le mailbox ai server smtp ed offrirà i servizi POP3/IMAP. I sistemi saranno dotati di due processori X86, 2GB di memoria, Ethernet a 1Gb/s e interfaccia FC-AL verso la SAN. Due server per il servizio di email, coordinati dal bilanciatore di carico. I server riceveranno via SMTP i messaggi di posta, filtrandoli attraverso il software di antivirus, e alimenteranno, via NFS, le mailbox utente. I sistemi saranno dotati di due processori X86, 2GB di memoria, Ethernet a 1Gb/s. Due server per il servizio di proxy, coordinati dal bilanciatore di carico. I sistemi utilizzeranno il software Squid e saranno configurati in modo da cooperare; offriranno il proxy per i protocolli HTTP e FTP. La dimensione delle cache è da definire (da 100 a 200 GB ognuna); sarà inoltre da valutare se implementare le cache su dischi locali o invece farle insistere sulla SAN. I sistemi saranno dotati di due processori X86, 2GB di memoria, Ethernet a 1Gb/s e, eventualmente, interfaccia FCAL verso la SAN. Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 30 di 35 Riccardo Detti Cristina Mugnai Un server per il sistema di backup. Il sistema sarà dotato di due processori X86, 1GB di memoria, Ethernet a 1Gb/s; il sottosistema a nastri, i dischi e il software di gestione sono descritti nel paragrafo 8.3. Una stazione di management, con un processore X86, 1GB di memoria, Ethernet a 1Gb/s, interfaccia FC-AL verso la SAN; il software di monitoraggio è descritto nel paragrafo 8.4. Al fine di rendere più efficiente le attività di sviluppo e test degli ambienti operativi e soprattutto delle procedure dei servizi online e dei contenuti (statici e dinamici) dei siti web si ritiene utile un server, posto sulla lan di front-end, dedicato appunto allo sviluppo. Tale sistema sar à dotato di due processori X86, 2GB di memoria, Ethernet a 1Gb/s e interfaccia FC-AL verso la SAN. Sono da prevedere altri server per ospitare il video streaming (servizio ancora da valutare in dettaglio), il nuovo programma per il protocollo (Titulus), l’application server per CIA-WEB e l’application server per GISS. A parte quest’ultimo, di caratteristiche note, questi servizi sono ancora in fase sperimentale o addirittura ancora da implementare; il numero e il dimensionamento dei server che li ospiteranno sarà possibile quando saranno note le caratteristiche di funzionamento e di carico previsto per questi servizi. 9.2. Server ad alto carico – Prima ipotesi Dalla sezione descritta nel paragrafo precedente mancano i server che subiranno il carico di lavoro più gravoso: i database server e i server applicativi. Questa prima ipotesi segue l’approccio, tradizionale, che prevede un unico server (posto nella lan di back-end) che ospita tutte le istanze di database previste e di un server applicativo in front-end. Il database server potrebbe consistere in un server di fascia media, configurato con 8 processori RISC a 64 bit, 8 GB di memoria, Ethernet a 1Gb/s e interfaccia (a 2Gb/s) FC-AL verso la SAN. Il server, essendo unico, dovrà avere hardware ridondato e di tipo hot-swap e la capacità di essere partizionato (cioè di funzionare come due o più server) in modo da permettere l’ottimizzazione delle risorse, la manutenzione del software di sistema e applicativo e l’esecuzione di interventi harware senza interrompere i servizi. Caratteristiche simili (o leggermente inferiori) sono necessarie per il server applicativo che ospiterà i server HTTP, gli application server, le procedure per i servizi online e i software di portale (e/o di content management). I fattori positivi di questa ipotesi sarebbero: utilizzo ottimale delle risorse hardware, affidabilit à di questa classe di server, economia e snellimento delle fasi di implementazione e di manutenzione del sistema. I fattori che impattano negativamente sarebbero: elevato costo di acquisto e di mantenimento, fermo di tutti i servizi a causa di un guasto grave. 9.3. Server ad alto carico – Seconda ipotesi Questa ipotesi, alternativa alla precedente, prevede di utilizzare per i database 4 server (a due a due in HA) che ospitano le varie istanze suddivise in base ad una analisi preventiva dei carichi di lavoro e di fabbisogno di risorse. I server saranno dotati di 4 processori X86, 4GB di memoria, Ethernet a 1Gb/s e interfaccia FC-AL verso la SAN. Per i server applicativi sarebbero necessari due server, con configurazioni simili a quelle definite per i db server, coordinati dal bilanciatore di carico. Gli elementi positivi di questa ipotesi sono: economia di acquisto e di gestione, completa ridondanza dei sistemi, uniformità delle problematiche di gestione e manutenzione con gli altri server della Farm. Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 31 di 35 Riccardo Detti Cristina Mugnai Incide negativamente, per i db server, una maggiore complessità iniziale di implementazione e messa a punto delle tecniche di alta affidabilità che devono garantire la continuità dei servizi a fronte di qualsiasi problema. Appendice A – Descrizione dei sistemi attuali MAIL mail1.unifi.it, mail2.unifi.it, smtp.unifi.it, Compaq DS20E 6/500 + DS20E 6/833 in cluster 1 Alpha EV68 500MHz + 1 Alpha EV68 833MHz 1GB + 1GB 9GB internal + 18GB internal, mirrored External SCSI array: 90GB mirrored, 18Gb spare 2 10/100 Mbps Ethernet adapters Digital OpenVMS 7.3 Multinet 4.3 Innosoft PMDF 6.0 WASD 7.1.1 yahMAIL Servizi: Mail Server di Ateneo Sigla in Figura 1: Hostname: Hardware: CPU: RAM: Disks: Disks: Network: Sistema operativo: Software di base: DNS dns.unifi.it SUN Ultra 10 1 UltraSparc II 440 MHz 512 MB 9.1GB internal 1 10/100 Mbps Ethernet adapters Solaris 8 Bind 9.2 Tacacs Servizi: DNS Primario di Ateneo Servizi: Autenticazione connessioni remote Sigla in Figura 1: Hostname: Hardware: CPU: RAM: Disks: Network: Sistema operativo: Software di base: Sigla in Figura 1: Hostname: Hardware: CPU: RAM: Disks: Network: Sistema operativo: Software di base: Database: Database: Servizi: WWW www.unifi.it SUN Blade 1000 1 UltraSparc III 750 MHz 512 MB 36GB internal 1 10/100 Mbps Ethernet adapters Solaris 8 Apache 1.3.9 mySQL 2.0.11 miniSQL 2.3.22 Web Server di Ateneo Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Sigla in Figura 1: Hostname: Hardware: CPU: RAM: Disks: Network: Sistema operativo: Software di base: Software di base: Database: Servizi: Note: Pag. 32 di 35 Riccardo Detti Cristina Mugnai WWW2 www2.unifi.it Compaq ProLiant 370 1 Intel P4 1.0GHz 1 GB 20GB internal 1 10/100 Mbps Ethernet adapters MS Windows 2000 Server MS IIS 5 Navita WebMate MS SQL Server 2000 Web Server di Ateneo Ospita la sezione “Studenti” del Web di Ateneo STRM sb1.unifi.it SUN Blade 1000 2 UltraSparc III 600 MHz 1 GB 18.2 internal 1 10/100 Mbps Ethernet adapters Solaris 8 Apache 1.3.9 RealServer 8.01 Servizi: Video streaming (Real Video) Note: Proprietà di CINECA Sigla in Figura 1: Hostname: Hardware: CPU: RAM: Disks: Network: Sistema operativo: Software di base: Sigla in Figura 1: Hostname: Hardware: CPU: RAM: Disks: Network: Sistema operativo: Software di base: Software di base: Database: Servizi: Sigla in Figura 1: Hostname: Hardware: CPU: RAM: Disks: Network: EPRES epress.unifi.it SUN SS 20 1 Sparc II 50 MHz 32 MB 6 GB 1 10 Mbps Ethernet adapter Solaris 8 Apache 1.3.9 Perl 5.005 36 mySQL 3.23.36 Server Web University Press MSTUD mail.student.unifi.it SUN Enterprise 250 1 UltraSparc II 440 MHz 512 MB 20GB internal, mirrored 1 10/100 Mbps Ethernet adapter Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 33 di 35 Riccardo Detti Cristina Mugnai Sistema operativo: Solaris 7 Software di base: Apache 1.3.4 Innosoft PMDF 5.2 Endymion MailMan Standard edition Servizi: Mail server per gli studenti Sigla in Figura 1: Hostname: Hardware: CPU: RAM: Disks: Network: Sistema operativo: Software di base: Servizi: PROXY proxy.unifi.it PC assemblato Intel P4 2.0GHz 512MB 108GB EIDE, internal 1 10/100 Mbps Ethernet adapter Linux RedHat 7.2 (Kernel 2.4.9-31) Squid 2.4 Stable 4 Proxy server di ateneo WWWS ?.unifi.it PC assemblato Intel P3 600GHz 128 8.5 EIDE, internal 1 10/100 Mbps Ethernet adapter Linux RedHat 6.2 (Kernel 2.2.19-6.2.16) Proxy server di ateneo Apache 1.3.9 BIND 8.2.3 Servizi: Web server per gli studenti DNS secondario di ateneo Sigla in Figura 1: Hostname: Hardware: CPU: RAM: Disks: Network: Sistema operativo: Servizi: Software di base: Sigla in Figura 1: Hostname: Hardware: CPU: RAM: Disks: Disks: I/O: Network: Sistema operativo: Software di base: OLS alicudi.unifi.it SUN Enterprise 3500 2 UltraSparc II 336 MHz 2.5 GB 36GB internal, mirrored External FibreChannel array: 200 GB RAID5, 36 GB spare 2 I/O subsystems 2 10/100 Mbps Ethernet adapters Solaris 2.6 Apache 1.3.9 iPlanet Web Server 6.0 + java 1.3.1 java SDK 1.3.1 SUN C compiler Perl 5 TCL 7.3 Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 34 di 35 Riccardo Detti Cristina Mugnai Database: Oracle 8.1.6 Basis+ 8.3 Servizi: Servizi online per gli studenti Catalogo online delle biblioteche (OPAC) DEVEL salina.unifi.it SUN Blade 1000 2 UltraSparc III 750 MHz 1 GB 36GB internal, mirrored 1 10/100 Mbps Ethernet adapters Solaris 8 Apache 1.3.9 php Database: Oracle 9i 9.0.1 Servizi: Prototipo anagrafe della ricerca Base dati PEOPLE Progetto Data Warehouse Note: Il database PEOPLE è acceduto direttamente dai client Sigla in Figura 1: Hostname: Hardware: CPU: RAM: Disks: Network: Sistema operativo: Software di base: DNS2 dns.unifi.it SUN Ultra 10 2 UltraSparc II 440 MHz 256 MB 18.2GB internal 1 10/100 Mbps Ethernet adapters Solaris 8 BIND 9.2 ProFTPD Qmail Servizi: DNS Secondario di Ateneo Server di posta per il rettorato – dismesso FTP server per l’aggiornamento dei client CIA Sigla in Figura 1: Hostname: Hardware: CPU: RAM: Disks: Network: Sistema operativo: Software di base: Sigla in Figura 1: Hostname: Hardware: CPU: RAM: Disks: Disks: I/O: Network: Sistema operativo: Database: CONT contab.adm.unifi.it SUN Enterprise 3500 2 UltraSparc II 336 MHz 1.75 GB 9.1GB internal, mirrored External SCSI array: 50 GB mirrored, 18 GB spare 2 I/O subsystems 2 10/100 Mbps Ethernet adapters Solaris 2.6 Oracle 8.1.7 Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione. Tipo di documento: Relazione Tecnica Tilolo del documento: Nuova Server Farm – Progetto Data: File: sf.tex Preparato da: Prot: Allegati: Approvato da: Revisione: 1.0 Pag. 35 di 35 Riccardo Detti Cristina Mugnai Servizi: Contabilità Integrata di Ateneo (CIA) Protocollo Note: Istanze Oracle (5) accedute direttamente dai client Sigla in Figura 1: Hostname: Hardware: CPU: RAM: Disks: Network: Sistema operativo: Software di base: Servizi: STUDas studenti.adm.unifi.it IBM e-server PSeries 640(B80) 2 Power II 375 MHz 4 GB 18.2GB internal, mirrored 1 10/100 Mbps Ethernet adapters AIX 4.3 Oracle Application Server Gestione Integrata Segreterie Studenti (GISS) Sigla in Figura 1: Hardware: CPU: RAM: Disks: Disks: Network: Sistema operativo: Database: Servizi: Note: STUDdb IBM e-server PSeries 640(B80) 2 Power II 375 MHz 2 GB 18.2GB internal, mirrored External SCSI array 6X18.2GB, RAID 5 1 10/100 Mbps Ethernet adapters AIX 4.3 Oracle 8.1.6 Gestione Integrata Segreterie Studenti (GISS) 2 server identici in cluster HA/CMP 3 istanze Oracle (produzione, test, migrazione) Il materiale tecnico e le informazioni contenute nel presente documento sono di natura strettamente confidenziale e di esclusiva proprietà del CSIAF. Non è consentita la divulgazione e la riproduzione totale o parziale senza esplicita autorizzazione.