CONTINUOUS AVAILABILITY DELLE APPLICAZIONI CON EMC VPLEX Un numero crescente di organizzazioni utilizza EMC VPLEX e altre tecnologie pronte all'uso per estendere l'elaborazione delle applicazioni e l'accesso ai dati a distanza, ottenendo così una continuous availability delle applicazioni pratica, conveniente e automatica. ABSTRACT Le aziende stanno consolidando le proprie tecnologie e pratiche di HA e DR per ottenere la continuous availability (CA), soluzione che fornisce agli utenti l'accesso ininterrotto a dati e applicazioni durante interruzioni pianificate o non pianificate. Certificate da VMware e comprovate per l'utilizzo con Oracle, Microsoft e altre tecnologie cluster pronte all'uso, le soluzioni di continuous availability delle applicazioni di EMC, ottimizzate da EMC VPLEX, garantiscono, attraverso una CA active-active, la coerenza dei dati a distanza per l'accesso simultaneo agli stessi dati da più sedi, il tutto senza modifiche al codice delle applicazioni né integrazione personalizzata. In questo documento viene illustrato come si utilizzano i modelli di implementazione per le applicazioni di EMC, come si possono ridistribuire gli asset nei set di applicazioni esistenti per implementare servizi di CA di tipo pure e near-line e come si può accelerare l'applicazione della CA al fine di proteggere WHITE PAPER EMC dati e applicazioni mission-critical per ottenere un vantaggio aziendale. IT TRUST Alle organizzazioni non basta più solo la capacità di eseguire il ripristino o ridurre al minimo il tempo di inattività, ma devono poter contare sul fatto che i dati e le applicazioni da cui dipendono gli utenti e il business continueranno a essere disponibili e a funzionare sia in caso di interruzioni pianificate che non pianificate. Quando il business viene gestito in digitale e al livello globale, le operazioni aziendali devono essere per definizione disponibili 24x7x365. Al di là dei tradizionali rischi per entrate e reputazione, in un mondo sempre connesso, anche una minima interruzione dell'attività può potenzialmente diventare di pubblico dominio e arrecare danni molto rapidamente. Da uno studio recente della Forrester Consulting1 è emerso che ‘la sempre maggiore dipendenza dalla tecnologia’ rappresenta il fattore numero uno di rischio per il business. Una survey globale del 2013 2 a cui hanno partecipato decision maker IT e responsabili delle decisioni aziendali ha concluso che l'IT trust rappresenta tanto un'opportunità quando un rischio. FINE DEL TEMPO DI INATTIVITÀ DELLE APPLICAZIONI Come chiunque collabori con owner di applicazioni aziendali per la pianificazione delle interruzioni dell'attività potrà attestare, ottenere l'approvazione per eseguire attività tipo aggiornamenti, upgrade e migrazioni è sempre più difficile. Gli utenti, tra cui dipendenti, partner, clienti e consumatori, si aspettano in misura crescente un accesso senza interruzione a dati e servizi IT. Quando la posta in gioco e le aspettative aumentano, le soluzioni di High Availability (HA) e disaster recovery (DR) non bastano. Sempre più, le organizzazioni riconoscono la necessità di avere tempi di inattività pari a zero: continuità operativa sia in caso di interruzioni delle attività pianificate che non pianificate. Figura 1. Rapporto tra origini pianificate e non pianificate dei tempi di inattività. Gli eventi pianificati rappresentano all'incirca l'85 percento del tempo di inattività delle applicazioni. 1 2 How Organizations Are Improving Business Resiliency With Continuous IT Availability, 2013. Forrester Research, Inc. IT Trust Curve—2013 Global Survey, 2013. EMC Corporation e Vanson Bourne. VPLEX: SOLUZIONE CERTIFICATA E COMPROVATA MANCANZA DI FIDUCIA NEL DR Le aziende fanno notevoli investimenti in DR poiché il potenziale impatto di un'interruzione dell'attività estesa sarebbe devastante. Tuttavia, nella pratica, le organizzazioni ottengono un ritorno sull'investimento poco significativo o pari a zero. CA OGGI PER ORACLE, L'esperienza dimostra che le aziende non sfruttano le rispettive soluzioni di DR VMWARE, MICROSOFT, per le interruzioni pianificate, che rappresentano la causa della non disponibilità SAP E ALTRI ANCORA delle applicazioni nell'85 percento dei casi. Meno ovvio è invece il fatto che, Le soluzioni di CA, progettate e nella realtà dei fatti, il sito o la soluzione di DR non venga utilizzato neanche per implementate da EMC Global Services la maggior parte delle interruzioni non pianificate. Eccetto che per perdite totali sfruttando l'integrazione di EMC e che riguardano l'intero sito del data center, causa di meno dell'1% del tempo VPLEX con le comuni tecnologie di inattività, la soluzione di DR viene raramente utilizzata. La decisione è invece pronte all'uso dei solution provider solitamente quella di non avvalersi del failover in caso di DR, anche quando leader del settore, garantiscono oggi il restore con una soluzione alternativa può richiedere ore o persino giorni. la continuous availability tra i data center. Le soluzioni di CA integrate basate su VPLEX sono state comprovate in configurazioni quali, tra le altre, quelle riportate di seguito: I clienti di Oracle Real Application Clusters (RAC) ritengono che la combinazione di di availability dei dati e delle applicazioni, il 46 percento degli intervistati in occasione della più recente survey di IOUG (Independent Oracle Users Group)3 ha dichiarato di non essere soddisfatto. Il DR non è progettato come evento flessibile. Failover, riavvio e restore sono attività manuali che presuppongono la decisione di agire. Molte organizzazioni non eseguono i test o gli aggiornamenti del proprio piano di DR necessari per stare Metro sia una soluzione facile al passo con i cambiamenti del proprio ambiente produttivo. Quando si verifica da implementare per passare un'interruzione non prevista dell'attività, dubitano che il failover/failback verrà da una CA a sito singolo a una eseguito correttamente. La paura è che con l'intervento del DR, le cose CA a doppio sito. non miglioreranno, anzi l'interruzione dell'attività potrebbe protrarsi. VMware ha certificato la Oltre all'investimento in una funzionalità inutilizzata, la maggior parte delle perfetta integrazione di EMC soluzioni di DR attuali poggia su un'infrastruttura ridondante e inattiva di un sito VPLEX Metro con VMware di ripristino, generando così costi (ingombro, alimentazione e manutenzione) vSphere Metro Storage Cluster operativi e di capitale onerosi. VPLEX estende i cluster vSphere tra i data center active/active per ottenere la CA e una data mobility trasparente e senza interruzioni in un ambiente di cloud computing Microsoft Failover Clustering e VPLEX forniscono la CA su di ripristino mediante la soluzione di DR. Alla domanda sulle rispettive strategie Extended Oracle RAC e VPLEX (vMSC) in più sedi geografiche. Perché? La maggior parte delle organizzazioni non si fida della propria capacità CONTINUOUS AVAILABILITY: UN NUOVO APPROCCIO Per tutte queste ragioni, le organizzazioni stanno abbandonando le tradizionali soluzioni di HA e DR a favore della "continuous availability". La Continuous Availability (CA) offre agli utenti accesso ininterrotto a dati e applicazioni, per un'operatività continua senza interruzione o riduzione delle prestazioni durante interruzioni pianificate o non pianificate. doppio sito per le implementa- Pur essendo di gran lunga la soluzione ideale, fino a poco tempo fa la CA era zioni di Microsoft Hyper-V proibitiva in termini di costi e complessità in particolare per le applicazioni Server e Microsoft SQL Server più sofisticate. Ad esempio, sebbene Tandem e Stratus fornissero sistemi Le applicazioni SAP ERP vengono eseguite oggi in configurazioni di CA a doppio sito grazie alle tecnologie dei cluster VPLEX Metro e Oracle RAC Per ulteriori informazioni, visitare il sito http://italy.emc.com/microsites/ittrust/protecting-information-systemsprocesses.htm con fault tolerance, ottenere una CA su più siti, che consentisse di sopravvivere alla perdita di un sito senza interruzioni, richiedeva in genere applicazioni personalizzate, logica commit in più fasi e integrazione di sistemi, con conseguenti costi elevati di sviluppo, utilizzo e manutenzione. ESTENSIONE DEI CLUSTER A DISTANZA CON EMC VPLEX Ora, tuttavia, le organizzazioni possono ottenere la continuous availability delle applicazioni tra ambienti eterogenei utilizzando le tecnologie pronte all'uso offerte da più vendor. Questo perché il virtual storage di EMC VPLEX garantisce coerenza dei dati e prestazioni a distanza, consentendo alle organizzazioni di "estendere" 3 Gestione dei data center Always-On: survey 2013 sull'availability delle applicazioni e dei dati di IOUG, 7 ottobre 2013. Oracle Corporation e Unisphere Research, una divisione di Information Today, Inc. 3 i propri cluster esistenti tra due siti per una CA active/active più semplice e conveniente. In molti casi, CA con VPLEX ha un costo inferiore alle soluzioni di HA e DR tradizionali a cui molte organizzazioni si affidano oggi. Inoltre, VPLEX Metro fornisce la CA per tutti i block data di un'organizzazione, indipendentemente dalla piattaforma. PASSAGGIO DA HA/DR N+1 ACTIVE-PASSIVE A UNA SOLUZIONE DI CA 2N ACTIVE-ACTIVE Da un punto di vista tecnico, l'architettura di implementazione delle applicazioni CA di EMC rappresenta una soluzione 2N active/active. Ovvero, tutte le risorse di cui necessita (N) l'applicazione o il servizio per l'availability vengono fornite attivamente, in parallelo, da due provider. ESTENSIONE DEI CLUSTER A DISTANZA FONDAMENTA DEL CLUSTER Oggigiorno, la maggior parte delle applicazioni moderne viene implementata in due o tre tier. In genere, esiste un livello di presentazione, un livello di applicazione e un livello di dati o database. Per fornire High Availability e Continuous Availability, vengono implementate diverse forme di clustering. CLUSTER DEL LIVELLO DI DATI In generale, i cluster del livello di dati vengono utilizzati per fornire High Availability e Continuous Availability per i database server o i server che gestiscono dati dinamici. Esistono tre tipi base di cluster ampiamente disponibili in commercio e a ognuno si applica il proprio use case. Al contrario, le tradizionali HA e DR sono soluzioni N+1, in cui N rappresenta il numero di risorse necessarie per la produzione e il più (+) una serie di risorse di backup ridondanti, generalmente passive, richieste per il restore del servizio. In genere, le soluzioni di HA +1 nel sito di produzione sono progettate per il failover automatico, mentre le soluzioni di DR +1 nel sito di DR sono configurate per essere richiamate manualmente. Per le applicazioni critiche che utilizzano soluzioni di HA e DR tradizionali, le organizzazioni dispongono in effetti di tre service provider: risorse necessarie per la produzione (N) e due soluzioni passive +1: una per HA e una per DR, con un conseguente numero considerevole di asset inattivi. Serie 1: Cluster OS: i cluster basati su sistemi operativi (OS) sono stati tra i primi ad avere un ampio utilizzo a livello commerciale. Costituiscono in genere una tecnologia active/passive (N+1), con due nodi: un nodo attivo che rappresenta le risorse necessarie (N) e uno passivo che rappresenta quelle aggiuntive o di backup (+1). Il nodo di backup resta in genere inattivo in modalità standby. Entrambi i nodi sono collegati alle risorse del cluster ed entrambi sono configurati per la scrittura sulle risorse del disco. Per controllare a quale nodo appartengono le risorse del cluster, viene utilizzato un meccanismo di blocco basato sulla proprietà di un quorum. Per convenzione, il nodo proprietario del quorum gestisce le risorse del cluster e può scrivere sui dischi del cluster. In caso di errore del nodo attivo, il nodo di standby subentra automaticamente e attiva i servizi necessari ad assumere il ruolo di nodo attivo. I cluster basati su OS vengono in genere utilizzati per i server fisici, benché possano anche essere utilizzati in ambienti virtuali, ad esempio per la tecnologia IBM AIX LPAR o all'interno di un cluster di hypervisor. Serie 2: Cluster di hypervisor: i cluster di hypervisor sono più sofisticati La differenza principale tra le architetture CA 2N e HA/DR N+1 sta nel fatto che con la CA 2N l'applicazione viene servita attivamente da due set di risorse in due siti di produzione (active/active); se una si blocca, l'altra continua a fornire servizi per 1N (rapporto 1:1 di risorse necessarie). dei cluster OS poiché l'hypervisor è proprietario e gestisce il blocco di CA 2N utilizza in modo attivo tutti gli asset a un costo potenzialmente inferiore poiché elimina le risorse HA inattive nel sito di produzione e non richiede ripristini o restore. VMFS è un file system clusterizzato che sfrutta lo storage condiviso per numerose virtual machine in esecuzione su numerosi server fisici; inoltre alcuni hypervisor sovrintendono all'orchestration di failover e riavvii. L'hypervisor controlla il blocco delle risorse del disco logico gestite dalle virtual machine. Il VMware vSphere Hypervisor (basato su ESXi), ad esempio, utilizza numerosi meccanismi di blocco. Uno di essi è il meccanismo di blocco del disco incorporato in VMFS (VMware Virtual Machine File System). consentire a più host fisici di leggere e scrivere contemporaneamente sullo stesso storage. VMFS fornisce la funzionalità di blocco su disco per garantire che la stessa virtual machine non venga alimentata da più server allo stesso tempo. Se si verifica un guasto nell'host fisico, il blocco su disco di ciascuna virtual machine viene rilasciato; in questo modo le virtual machine possono essere riavviate su altri host fisici. Rispetto a un cluster OS, VMFS controlla le operazioni di scrittura sui volumi logici eseguite da numerosi server virtuali distribuiti casualmente su una o più LUN. I cluster OS, invece, gestiscono in genere LUN o volumi interi. 4 VMware vSphere High Availability (HA) fornisce un'architettura di tipo N+1 (active-passive) per le virtual machine, mentre VMware vSphere Fault Tolerance (FT) fornisce un'architettura CA 2N (con funzionalità active-active). Serie 3: Cluster di database: i cluster di database si basano su un'architettura scale-out in cui numerosi server lavorano sullo stesso database. I meccanismi di blocco gestiti dal database consentono a più server di scrivere contemporaneamente sullo stesso database. I cluster di database rappresentano un'architettura active/active xN plus, dove la x indica un numero maggiore di uno. In genere, vengono implementati su un'architettura che oscilla tra 1,2N (120% delle risorse necessarie) e 2N (due volte le risorse necessarie). Alcuni esempi di cluster di database sono Oracle RAC, IBM DB2 PureScale e Sybase. È bene notare che un cluster di database può anche risiedere all'interno di un cluster di hypervisor e fornire opzioni di implementazione per server fisici e virtuali. CLUSTER DI SERVER STATELESS Cluster di server stateless: i server stateless sono diversi dai data server poiché conservano i dati delle transazioni solo per la durata di una transazione. Vengono spesso implementati in application tier e in tier di presentazione. In genere, vengono implementati più server in una farm e vengono utilizzate tecnologie di bilanciamento del carico locale per fornire l'HA attraverso una distribuzione delle transazioni basata su policy o sul carico. Se un server non risponde, le transazioni vengono dirette a un altro server della farm. In un cluster di rete con carico bilanciato, per fornire le risorse necessarie vengono di solito associati più server e per l'availability vengono aggiunti alla farm uno o due spare server. Di conseguenza, questa architettura di implementazione fornisce l'availability a un costo relativamente minore. I cluster di rete con carico bilanciato sono costituiti, per natura, da un'architettura di continuous availability xN active/active, dove la x indica un numero maggiore di uno. Inoltre, la x è in genere un numero compreso tra 1,2N e 2N ovvero tra il 120% e il 200% delle risorse necessarie. I cluster di rete con carico bilanciato possono essere utilizzati per i server fisici oppure in combinazione con un cluster basato su hypervisor per ambienti virtuali. UNIONE DI TUTTI QUESTI FATTORI Il modello di progettazione e implementazione di EMC Global Services per la CA su VPLEX utilizza tecnologie pronte all'uso per consentire alle applicazioni di CA di estendersi su due siti. L'architettura di implementazione corretta dipende dagli asset di elaborazione esistenti, dagli obiettivi di availability, dalle applicazioni e da altri fattori. Attraverso le fondamenta riportate di seguito, i professionisti EMC Services hanno aiutato le aziende a progettare centinaia di soluzioni. Essi aiutano a identificare i fattori decisionali fondamentali per scegliere le architetture di implementazione adatte a ogni applicazione e un servizio di middleware economico e resiliente. Alla base dello stack si trova uno dei principali disk array di tipo block, uno in ogni sito. Il livello superiore successivo è il livello di virtualizzazione dello storage VPLEX. VPLEX è il componente che mantiene sincronizzati gli array di ciascun sito. VPLEX presenta il livello di elaborazione con un disk volume virtualizzato esteso nei due siti. Si pensi al disk volume virtuale come a un mirror RAID 1 in cui il mirror A si trova in un sito e il mirror B nell'altro. Il mirroring di un'operazione 5 di scrittura su disco del mirror A viene eseguita sul mirror B e viceversa. Poiché entrambi i lati del mirror sono identici, è possibile eseguire un'operazione di lettura in ogni sito. Per il modo di pensare tradizionale, questa capacità può essere considerata sia straordinaria che rischiosa: straordinaria poiché gli stack di applicazioni possono essere implementati con una serie completa di risorse in due siti e preoccupante perché sorge spontanea la domanda: cosa impedisce che l'aggiornamento dello stesso settore del disco venga eseguito simultaneamente in ognuno degli stack? La risposta e l'aspetto interessante di questo modello di implementazione è che, per evitare questo problema, esso sfrutta il blocco di scrittura integrato nei meccanismi di clustering. Al livello dei dati, se si utilizza uno dei summenzionati modelli di clustering, il cluster di database viene esteso tra i siti. Continuando fino allo stack di elaborazione, il modello estende il cluster di rete con carico bilanciato e le farm di applicazioni tra i siti. Al di sopra del livello di elaborazione, ovvero all'altezza del livello di distribuzione, in cui il traffico in ingresso viene instradato su uno dei siti di elaborazione, il modello implementa un distributore di carico globale. Le soluzioni di distribuzione del carico globale sono offerte da Cisco, Citrix, F5 e altri. Altri requisiti includono: l'interconnessione del data center o la DCI, name space comune e LAN virtuale (VLAN) che attraversa entrambi i siti. La DCI è una connessione ad alta velocità con doppio percorso che collega i siti; in genere, utilizza due connessioni Ethernet a 10 Gb (o più rapide). La DCI viene utilizzata per il disk mirroring VPLEX, la comunicazione tra cluster e applicazioni, nonché il comando e il controllo. Solitamente, la DCI non è attraversata dalle transazioni utente. Il name space comune richiede servizi DNS in entrambi i siti. La maggior parte delle soluzioni DNS integra un meccanismo di replica che mantiene sincronizzati tutti i server DNS. Unitamente alle proprie soluzioni Single-SignOn (SSO), in entrambi i siti è altresì necessaria l'Active Directory. Nella maggior parte delle implementazioni di stretched clustering è richiesta l'estensione della VLAN. Per tradizione, l'estensione della VLAN ha sempre avuto una brutta reputazione; agli architetti di rete è stato infatti insegnato a evitarla poiché storicamente le chat di rete avrebbero invaso la DCI e non ci sarebbe stato modo di evitarlo. Oggi, tuttavia, le moderne tecnologie VLAN estese quali OTV di Cisco, VPLS di Brocade e altri vendor hanno risolto questi problemi associati alle VLAN estese. Attraverso le tecnologie summenzionate, è possibile implementare uno stack di applicazioni astratto su due siti. Se si verifica un guasto in un componente, entreranno subito in funzione la ridondanza dei cluster di elaborazione e altre tecnologie per offrire il servizio necessario. Inoltre, se si verifica un guasto che riguarda l'intero sito, subentra automaticamente l'altro sito e le transazioni vengono automaticamente istradate attraverso la tecnologia di bilanciamento del carico globale al sito integro. 6 Figura 2. Con VPLEX, le organizzazioni sono in grado di estendere a distanza il blocco dei dati fornito dai cluster di database per una funzionalità CA active-active a doppio sito. CONTINUOUS AVAILABILITY DELLE APPLICAZIONI Attraverso le fondamenta illustrate sopra, le organizzazioni sono in grado di realizzare una CA reale per le proprie applicazioni. Tuttavia, se la tecnologia di clustering di database esistente utilizzata supporta solo una tecnologia activepassive, quali sono le opzioni? Prima di tutto le architetture CA sono a tutti gli effetti architetture di implementazione; l'architettura delle applicazioni sottostante non ha subito modifiche. In un'implementazione CA, gli asset di elaborazione e dell'infrastruttura vengono implementati in due siti diversi e l'applicazione non è dipendente da un singolo sito. Di conseguenza, il numero di componenti di due siti attivi è superiore a quello di un solo sito attivo; tuttavia, attraverso le tecnologie di HA e un sito DR di backup, questo numero può diventare inferiore. Secondo poi, in una modalità di 2N o CA, la tecnologia VPLEX presenta dischi dati virtuali in entrambi i siti. I cluster di rete con carico bilanciato rappresentano una soluzione di CA, indipendentemente dall'implementazione in uno o due siti. Infine, in fatto di tecnologie di clustering per database server, i cluster di database e VMware FT rappresentano tecnologie CA 2N active-active. Sebbene I cluster di hypervisor estesi e gli stretched cluster basati su OS rappresentino tecnologie N+1 HA active-passive, è possibile creare modelli di implementazione con CA in tutto lo stack oppure creare un modello di CA near-line, con un minimo di dati forniti da VPLEX per la CA e varie combinazioni di modelli di cluster. È certo che, i modelli correnti di CA parziale non realizzano gli stessi vantaggi di un'implementazione di CA di tipo pure, ma rappresentano una base di partenza poiché più applicazioni diventano abilitate per la funzionalità active-active. Un'altra considerazione da fare è che i miglioramenti apportati ad alcuni modelli di clustering basato su OS possono mascherare il momento del failover, in modo che l'utente abbia la parvenza che l'applicazione sia sempre disponibile (always-on). Microsoft Always-On SQL e l'architettura di implementazione EMC per applicazioni SAP sono esempi di soluzioni sempre disponibili. 7 DOMANDE E DUBBI COMUNI VPLEX introduce un approccio completamente nuovo alla continuous availability di database e applicazioni grazie al quale un gran numero di organizzazioni può garantire la continuità operativa e l'accesso ai dati e alle applicazioni durante le interruzioni pianificate e non pianificate. Di seguito sono riportati alcuni dei dubbi più comuni e alcune delle domande più frequenti su questo nuovo approccio. IN CHE MODO VPLEX INFLUISCE SULLE PRESTAZIONI DI DATABASE E APPLICAZIONI? L'impatto dipende dalla configurazione del data center, dalla distanza e dall'applicazione. Per la maggior parte delle implementazioni VPLEX, è consigliato un RTT (Round Trip Time) di un massimo di cinque millisecondi (5 ms). In linea di massima, un RTT di 5 ms si traduce in una distanza round trip di circa 60 miglia/100 km tramite collegamento di cavi in fibra ottica o connessione Ethernet a 10 Gb. Il comando ping può fornire indicazioni più precise sull'RTT.4 VMware ha certificato il failover automatico di VPLEX in combinazione con vSphere HA a un RTT di massimo 5 ms e consente il failover automatico con Storage vMotion a un RTT di massimo 10 ms. Microsoft ha pubblicato un documento di 34 pagine sull'implementazione di EMC VPLEX, Microsoft Hyper-V e SQL Server con supporto per failover clustering ottimizzato su distanze sincrone.5 Altri fattori da considerare: Il mirroring tra i siti deve essere eseguito solo per i dati di scrittura. La latenza e il relativo impatto sul tempo di risposta delle applicazioni è un problema che riguarda esclusivamente la scrittura. La maggior parte delle applicazioni ha un rapporto lettura/scrittura di 80 su 20 (in genere rientra tra 70/30 e 90/10). La nostra esperienza ritiene che le organizzazioni che implementano VPLEX vedranno un miglioramento dei tempi di risposta in lettura, poiché le richieste di lettura vengono servite direttamente al di fuori della cache VPLEX. Se si considera inoltre che la maggior parte delle applicazioni legge prima diversi record e poi scrive, il throughput complessivo tende a compensarsi o viene intaccato a un livello molto marginale. Miglioramenti dei tempi di risposta della scrittura su disco. Fino a qualche anno fa, i tempi di risposta dei dischi SCSI locali erano compresi mediamente tra 15 e 18 ms. Oggi, il tempo di risposta delle unità FC è compreso tra 3 e 5 ms e quello delle unità Flash tra 1 e 2 ms. Riduzione delle prestazioni delle applicazioni SAN. È stato inoltre osservato che le SAN, implementate inizialmente con tempi di risposta medi compresi tra 3 e 5 ms, subiscono una riduzione delle prestazioni dovuta alle aggiunte e alle modifiche apportate nel tempo. In alcuni casi, i tempi di risposta sono aumentati a 15 ms per una scrittura media.6 Attraverso il tuning appropriato delle SAN FCoE (Fibre Channel over Ethernet) o FC (Fibre Channel), VPLEX aumenta da 1 a 5 ms i tempi di ogni scrittura su disco, a seconda della distanza. Svantaggi. Per molte applicazioni, l'aumento della CA, l'eliminazione dell'RTO, nonché dell'incertezza e della complessità legate alle soluzioni di HA/DR, giustificano l'aumento dei tempi di scrittura. 4 EMC offre un servizio con strumenti in grado di misurare con precisione l'RTT e controllare la pulizia delle interconnessioni del data center. 5 http://download.microsoft.com/download/06/02/06/26660F7D-301E-48DE-82008CFF64C7BCEA/h7116_vplex_hyper_v_sql_wp.pdf 6 EMC offre un servizio di health check in grado di calcolare i colli di bottiglia e i tempi di risposta delle SAN. 8 Se le prestazioni sono ancora inaccettabili, è possibile migliorare i tempi di risposta in altri modi per compensare l'eventuale latenza causata per realizzare la CA con VPLEX. Tali metodi includono: l'aggiunta di cache FAST o di storage Flash e/o, come indicato in precedenza, l'esecuzione del tuning delle SAN in base alle specifiche. In alcuni ambienti Oracle RAC, aggiungendo ulteriori server, è possibile aumentare il parallelismo e il throughput complessivo. Gli Application Architect e gli Storage Architect di EMC possono collaborare con le organizzazioni per aiutarle a scoprire le opzioni e a determinare come integrare al meglio VPLEX in due siti con un impatto sulla latenza poco significativo o pari a zero. COS'È IL MIDDLEWARE? Le applicazioni devono prendere i dati da altre fonti e passarli ad altre applicazioni. Se un'applicazione upstream si trova in un sito e il downstream in un altro, è necessario eseguire il mirroring delle code di dati del middleware su VPLEX per proteggerle. Middleware quali TIBCO, Oracle Enterprise Service Bus e IBM MQ Series possono essere implementati su VPLEX con CA attraverso un cluster di database active-active esteso tra i siti. COSA SONO I DATI NAS? VPLEX supporta attualmente soltanto i block data. Se utilizzati a un livello medio-basso, le share e i mount NAS possono essere serviti da un server Linux o Windows che archivia i dati sulle SAN di tipo block virtualizzate su VPLEX. Il server può essere protetto sia da un cluster di serie 1 che da uno di serie 2. Per le implementazioni NAS di larga scala su piattaforme quali EMC Isilon o EMC VNX in combinazione con EMC Celerra, è possibile eseguire il mirroring di un nodo attivo in un sito e di un nodo passivo nel secondo sito utilizzando il software di replica basato su array nativo. La combinazione di una soluzione di Global File Virtualization, quale EMC Rainfinity, e un failover ad attivazione manuale consente di spostare il servizio NAS tra le sedi, in caso di perdite presso il sito. In ogni caso, per le applicazioni che appesantiscono le share/i mount NAS in un sito e in cui il problema della larghezza di banda non sussiste, è possibile ospitare i servizi NAS su un sito per tutti gli utenti e il traffico NAS più leggero può passare nella DCI. ORACLE DISPONE DI UN'OPZIONE DI IMPLEMENTAZIONE EXTENDED ORACLE RAC. È POSSIBILE UTILIZZARLA? Parecchi anni fa, Oracle ha introdotto una soluzione a doppio sito active-active denominata Extended Oracle RAC che utilizzava Real Application Clusters (RAC) con il mirroring Automatic Storage Management (ASM). Tuttavia, la complessità e l'affidabilità dell'overhead di mirroring ASM basato su host non ha consentito alla maggior parte delle organizzazioni e delle applicazioni l'estensione su due siti. La soluzione era inoltre limitata esclusivamente ai dati e alle applicazioni basate su Oracle. Poiché il mirroring ASM esegue esclusivamente il mirroring dei dati Oracle, in una configurazione a doppio sito, è necessaria un'altra tecnologia per la sincronizzazione degli altri tipi di dati. In nessun modo è possibile garantire la coerenza della replica tra applicazioni di livello superiore o più database dipendenti senza una soluzione di terze parti. La soluzione di CA di EMC in combinazione con Extended Oracle RAC su VPLEX estende i server RAC tra i due siti e il ruolo di mirroring di ASM viene assunto da VPLEX. 9 COSA SUCCEDE SE VPLEX SI BLOCCA? Lo stesso VPLEX è basato su una tecnologia di clustering con cache di memoria condivisa. Viene implementato un cluster VPLEX in ogni sito. Se si verifica un errore nello storage o in un componente del cluster VPLEX, gli altri engine del cluster subentrano automaticamente per supportare il carico. Per ulteriori informazioni, consultare: TechBook: EMC VPLEX Metro Witness Technology and High Availability RIEPILOGO Il virtual storage di EMC VPLEX, in combinazione con le tecnologie di bilanciamento del carico globali e di clustering pronte all'uso, consente ai data center di produzione active-active, distanti tra loro, di garantire la continuous availability, generalmente a un costo inferiore rispetto alle soluzioni di HA e DR odierne. CA in combinazione con VPLEX prevede un approccio differente da quello delle soluzioni di HA/DR. Le soluzioni tradizionali di HA/DR richiedono: Interventi e soluzioni di HA e DR separati Infrastruttura di standby passiva e ridondante Ripristino attraverso i dati replicati provenienti da backup, replica dei dati e/o snapshot; in questo modo è facile avere sempre ritardi e rischi nell'esecuzione del failback e del ripristino di dati e applicazioni all'ultimo punto integro noto Al contrario, CA in combinazione con VPLEX: Combina HA e DR in un'unica soluzione, fornendo la continuità operativa simultanea in due data center di produzione active/active, distanti tra loro Nel caso di un'interruzione pianificata o non pianificata in un data center, CA in combinazione con VPLEX sposta automaticamente i carichi di lavoro sull'altro sito garantendo la continuità operativa e l'accesso ininterrotto degli utenti ad applicazioni e dati I vantaggi di una CA active-active con tecnologia VPLEX includono: Tempo di inattività pari a zero: durante le interruzioni dell'attività causate da guasti tecnici, errori umani, perdite presso il sito e durante le interruzioni pianificate dovute a test delle applicazioni, migrazioni, upgrade esterni ai dati e così via, le applicazioni e i dati continuano a essere disponibili ed elaborati. Soluzioni pronte all'uso: la CA viene implementata con tecnologie pronte all'uso offerte da più vendor, senza la necessità di scrittura del codice delle applicazioni, personalizzazioni o integrazioni. Maggiore utilizzo degli asset: è possibile utilizzare attivamente un'infrastruttura di ripristino ridondante passiva e le risorse possono essere organizzate in pool tra i siti per condividere il carico di lavoro. Non solo le risorse inattive vengono utilizzate, ma grazie alla capacità di distribuzione del carico, le organizzazioni sono generalmente in grado di ridurre il numero totale di server del 30-40 percento. Gestione semplificata: le organizzazioni non devono più gestire soluzioni di HA e DR separate, mantenere e aggiornare i run book di DR o eseguire test dei piani di ripristino; il bilanciamento dinamico del carico all'interno e tra i data center ottimizza automaticamente le prestazioni; i carichi di lavoro possono essere trasferiti con facilità da sito a sito in modo tale che le migrazioni, gli interventi di manutenzione e i refresh tecnologici si verifichino senza interrompere l'accesso degli utenti o l'elaborazione di dati e applicazioni. 10 Maggiore sicurezza: failover automatizzato e operazioni active-active eliminano i rischi associati al coordinamento di attività di ripristino manuali e soggette a errori. Riduzione del CAPEX e dell'OPEX: migliore utilizzo, infrastruttura snellita (licenze, manutenzione, ecc.) e gestione semplificata liberano il budget e le risorse che vengono spostati su iniziative strategiche di IT transformation e innovazione delle applicazioni. In un business case sviluppato dalla Forrester Research per un'organizzazione composita che ha raccolto interviste con i clienti di EMC che già utilizzano la CA con tecnologia EMC VPLEX, gli analisti hanno evidenziato un ROI di oltre il 250 percento in tre anni, ottenuto attraverso i seguenti fattori: riduzione del tempo di inattività, migliore utilizzo degli asset e bilanciamento del carico, nonché maggiore efficienza nella manutenzione dell'hardware e nella migrazione dei dati.7 REVISIONE IMMEDIATA DELLA PROPRIA STRATEGIA DI AVAILABILITY Le implementazioni CA active-active abilitate per VPLEX sono oggi operative nei data center aziendali, supportando le applicazioni più critiche delle organizzazioni, incluse quelle SAP su Extended Oracle RAC e su VMware HA e vMSC. In una recente survey della Forrester Research, il 44 percento degli intervistati ha affermato di eseguire alcuni carichi di produzione in modalità active-active; di questi, il 12 percento ha dichiarato di utilizzare stretched cluster.8 Le organizzazioni devono agire ora per superare i rischi di availability e ottenere la continuous availability e la mobility di dati e applicazioni richiesta dal business odierno, nonché dai mercati digitale e cloud. 7 Total Economic Impact della continuous availability di EMC: A Case Study Focused On Continuous Availability With EMC VPLEX, novembre 2013. Studio Total Economic Impact™ della Forrester commissionato da EMC. Project Director: Reggie Lau, Forrester Research, Inc. 8 How Organizations Are Improving Business Resiliency With Continuous IT Availability, 2013. Forrester Research, Inc. 11 ACCELERAZIONE DEL PASSAGGIO ALLA CA CON EMC GLOBAL SERVICES Il successo della CA si basa non solo sulla tecnologia, ma anche sulla capacità di delle parti interessate in materia di IT, database, applicazioni e business di modificare il proprio punto di vista sull'availability. Ciò può non essere così semplice quando concetti quali Recovery Time Objective (RTO) e Recovery Point Objective (RPO), che per tanti anni sono stati al centro del dibattito, perdono mordente e l'obiettivo aziendale è diventato quello di azzerare il tempo di inattività. Un aspetto correlato alle operazioni di produzione quotidiane è che la CA cambia anche il modo in cui owner delle applicazioni, Application Architect, DBA e operazioni IT lavorano insieme. Le organizzazioni possono accelerare la transizione alla CA affidandosi all'esperienza EMC acquisita aiutando centinaia di aziende ad apportare i cambiamenti al livello tecnico, dei processi e delle competenze necessari per implementare soluzioni di data center active-active. Gli esperti di EMC Continuous Availability Advisory Service possono aiutare le organizzazioni a valutare rapidamente la loro idoneità alla CA e a determinare il miglior approccio possibile. I nostri professionisti qualificati hanno progettato centinaia di soluzioni utilizzando le fondamenta sopradescritte. Possono aiutare a scegliere tra le diverse varianti delle architetture di implementazione delle applicazioni e a identificare i fattori decisionali fondamentali che consentono di scegliere le architetture di implementazione adatte a ogni applicazione, oltre a un servizio di middleware che sia economico e resiliente. I servizi includono: Analisi dei costi e dei vantaggi della CA e business case Soluzioni di implementazione della CA per applicazioni e middleware Soluzioni per l'infrastruttura active-active Roadmap e tempistica della CA step-by-step Implementazione di CA CA on-site, tutoring ed Education Services per l'arricchimento, la guida e la formazione del personale interno Ulteriori informazioni su EMC Continuous Availability Advisory Services. CONTATTI Per ulteriori informazioni sulle possibilità offerte da prodotti, servizi e soluzioni EMC per far fronte alle sfide del business e dell'IT, contattare il rappresentante locale o un rivenditore autorizzato oppure visitare il sito all'indirizzo italy.emc.com. EMC ritiene che le informazioni contenute nel presente documento siano esatte alla data di pubblicazione. Le informazioni sono soggette a modifica senza preavviso. Le informazioni contenute nella presente documentazione sono fornite "come sono". EMC Corporation non riconosce alcuna garanzia di nessun genere inerente le informazioni riportate nella presente pubblicazione, tra cui garanzie implicite di commerciabilità o idoneità a un determinato scopo. L'utilizzo, la copia e la distribuzione dei prodotti software di EMC descritti in questo documento richiedono una licenza d'uso valida per ciascun software. Per un elenco aggiornato dei nomi dei prodotti EMC, vedere i marchi di EMC Corporation sul sito web di EMC. EMC2, EMC, Avamar, Celerra, Networker, PowerPath, SRDF, Vblock e il logo EMC logo sono marchi o marchi registrati di EMC Corporation negli Stati Uniti e in altri paesi. VMware, vMotion e vSphere sono marchi registrati di VMware, Inc. negli Stati Uniti e/o in altre giurisdizioni. Tutti gli altri marchi citati nel presente documento appartengono ai rispettivi proprietari. © Copyright 2014 EMC Corporation. Tutti i diritti riservati. 1/14 White Paper H12693.1 italy.emc.com