Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione Abstract VMware offre vantaggi straordinari, ma può implicare un aumento dei requisiti in termini di storage, risorse di backup e problematiche amministrative. I sistemi di storage con funzionalità di deduplicazione EMC® Data Domain® affrontano questa sfida riducendo i dati ridondanti nei backup di dati VMware, operando alla velocità dei dischi e fornendo una replica efficiente ed economica per il disaster recovery rapido. Questa white paper illustra le best practice per la progettazione di un approccio di backup, ripristino e disaster recovery per VMware utilizzando i sistemi Data Domain, indipendentemente dal software o dagli script di backup coinvolti. Giugno 2010 Copyright © 2010 EMC Corporation. Tutti i diritti riservati. Le informazioni contenute nella presente documentazione sono accurate alla data di pubblicazione. Informazioni soggette a modifica senza preavviso. LE INFORMAZIONI CONTENUTE NELLA PRESENTE DOCUMENTAZIONE VENGONO FORNITE “COME SONO”. EMC CORPORATION NON RICONOSCE GARANZIE DI ALCUN GENERE INERENTI LE INFORMAZIONI RIPORTATE NELLA PRESENTE PUBBLICAZIONE ED ESCLUDE SPECIFICAMENTE, TRA LE ALTRE, GARANZIE IMPLICITE DI COMMERCIABILITÀ O IDONEITÀ AD UN DETERMINATO SCOPO. L’utilizzo, la copia e la distribuzione dei prodotti software EMC descritti in questo documento richiedono una licenza software valida. Per l’elenco aggiornato dei nomi di prodotto EMC, vedere i marchi di EMC Corporation all’indirizzo www.italy.emc.com Tutti gli altri marchi citati nel presente documento appartengono ai rispettivi proprietari. Codice documento: h7300.1 Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 2 Sommario Executive summary ............................................................................................ 4 Introduzione ........................................................................................................ 4 Destinatari .................................................................................................................................... 5 VMware Infrastructure 3 ..................................................................................... 6 Alternative di backup per VMware Infrastructure: indicatori di successo ..... 7 Guida introduttiva ......................................................................................................................... 9 Metodo 1: backup dei file del sistema operativo della macchina virtuale guest .................... 10 Metodo 2: backup di ESX e dei file VMDK ............................................................................. 11 Metodo 3: utilizzo di VMware Consolidated Backup .............................................................. 12 Metodo 4: backup consolidato con sistemi Data Domain ...................................................... 13 Best practice avanzate............................................................................................................... 13 VADP di vSphere con software di backup commerciale ............................... 15 Esempio di implementazione ........................................................................... 16 Conclusioni ....................................................................................................... 17 Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 3 Executive summary VMware è il metodo più utilizzato nel settore open system per la creazione di più macchine virtuali in un sistema di elaborazione fisico. Separando i sistemi virtuali dai limiti fisici, è possibile renderli più semplici da gestire, incrementarne l’utilizzo e ridurne l’ingombro. Il consolidamento aiuta a sfruttare meglio le potenti risorse dei server, contribuendo al supporto di iniziative per la tutela dell’ambiente. I siti VMware tuttavia, possono anche richiedere una maggiore capacità di storage per la gestione e la protezione dei propri complementi fisici. Semplificando la moltiplicazione dei server, l’ingombro dello storage tende a crescere. Le conseguenze diventano dolorosamente evidenti in fase di backup e ripristino. Ad esempio: • Più ambienti VM simili, moltiplicati per più versioni delle immagini dello storage per la protezione e il DR, rendono le dimensioni dello storage di gran lunga superiori rispetto a quando i server erano più difficili da clonare. Nel backup degli ambienti VMware, le esigenze di ripristino possono includere sia immagini complete in formato VMDK (Virtual Machine Disk), sia il ripristino di singoli file sul sistema operativo guest. L’esecuzione del backup sia delle immagini VMDK che dei file del sistema operativo guest può offrire una protezione ottimale, ma i dati sono estremamente ridondanti. Con lo storage della destinazione di backup su nastro o su semplice disco, verrebbero consumati molti più nastri o una maggiore capacità di storage su disco. Fortunatamente, con i sistemi EMC® Data Domain® come destinazione di backup per gli ambienti VMware, i file simili vengono deduplicati ad alta velocità prima dell’archiviazione, riducendo al minimo i requisiti in termini di capacità di storage e larghezza di banda per la protezione on-site e la replica su un sito di disaster recovery (DR). Mentre la maggior parte dei backup dei file system su un sistema Data Domain presentano una riduzione dei dati di 10-30 volte, i backup che includono le immagini VMDK offrono in genere una riduzione da 40 a 60 volte. Per ulteriori informazioni sui pluripremiati sistemi di storage con funzionalità di deduplicazione Data Domain negli ambienti VMware, visitare la pagina www.datadomain.com/solutions/vmware.html. • Quando si utilizzano i sistemi Data Domain applicando correttamente le best practice per la creazione di backup e snapshot in VMware, una distribuzione può semplificare la gestione di immagini coerenti. Dopo l’archiviazione, le immagini sono pronte per il ripristino in locale, o con replica deduplicata ottimizzata presso un sito di DR remoto. In questo documento vengono illustrate le best practice per la gestione congiunta del backup e della replica VMware. Riferimenti a fornitori ed esempi di script sono inclusi solo a titolo esemplificativo e non devono essere considerati definitivi o garantiti da EMC. Introduzione Questa white paper contiene informazioni generali per l’utilizzo dei sistemi di storage con funzionalità di deduplicazione EMC Data Domain per il back up di macchine virtuali mediante VMware Consolidated Backup (VCB) con VMware Infrastructure 3 (VI3). Gli argomenti includono una panoramica dei componenti di VI3 e vari metodi per il backup dei dati in immagini disco (VMDK) e file del sistema operativo guest per il ripristino discreto, sia in locale che in remoto in un sito di DR. L’argomento principale è la selezione dell’approccio di backup più idoneo a soddisfare le proprie specifiche esigenze e, per estensione, il modo in cui è possibile utilizzare i sistemi Data Domain per semplificare il ripristino e la replica online su un sito di DR. Il documento non affronta in dettaglio l’utilizzo dei sistemi di storage con funzionalità di deduplicazione Data Domain nei nuovi ambienti VADP (vStorage API for Data Protection) di vSphere 4.0. La differenza rispetto a VI3 è che VADP è stato introdotto in vSphere 4.0 e sostituisce VCB. In base all’applicazione di backup in uso, VADP può essere utilizzato con o senza un server proxy (il server proxy può essere completamente integrato nel software di backup commerciale). Nella Tabella 1 vengono messe a confronto le differenze tra VADP e VCB. Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 4 Tabella 1. Confronto tra VADP e VCB 1 VADP VCB Ulteriore download e installazione No, completamente integrato con l’applicazione di backup Sì Backup completo di immagini VM Sì Sì, copia in due fasi; Origine > proxy VCB > destinazione Backup incrementale di immagini VM Sì No Backup a livello di file Sì, Windows e Linux Sì, solo Windows Ripristino completo di immagini VM Sì Sì, con VMware Converter Ripristino incrementale di immagini VM Sì No Ripristino a livello di file Sì, con agenti di ripristino Sì, con agenti di ripristino Se è in uso un software di backup commerciale che supporta VADP, il server Data Domain rappresenta semplicemente la destinazione di backup. Per le best practice sull’utilizzo dello storage Data Domain come destinazione di backup standard in ambienti diversi, vedere www.datadomain.com/solutions. NOTA: questo documento ha come tema centrale le best practice per VCB, in quanto i componenti di VI3 non sono integrati e richiedono un’ulteriore pianificazione, nonché un server proxy separato per la configurazione dei backup. Destinatari La white paper è destinata ad amministratori di backup, sistemisti e partner EMC e vuole essere di ausilio nella progettazione di una soluzione di backup VMware ottimizzata per il proprio ambiente. Descrive come utilizzare i sistemi di storage con funzionalità di deduplicazione Data Domain per semplificare e ridurre i costi del backup e del ripristino di macchine virtuali e file di sistemi operativi guest. Si presumono una conoscenza di base della virtualizzazione ed una certa esperienza con i concetti e i software di backup e ripristino. 1 Blog sullo storage VMware all’indirizzo http://blogs.vmware.com/storage/2010/02/introduction-tovstorage-apis-for-data-protection---vstorage-apis-for-data-protection-were-introduced-in-vsphere-40-tofacil.html Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 5 VMware Infrastructure 3 Per un’introduzione ai componenti, alla terminologia e all’utilizzo di VMware, fare riferimento alla pagina www.vmware.com. VMware Infrastructure 3 (VI3) è un pacchetto di prodotti che comprende quattro componenti: Virtual Infrastructure Client (VI Client), License Server, Virtual Center Management Server (VC Server) ed ESX Server Console. Un host ESX, che contiene un kernel hypervisor (vmkernel), esegue macchine virtuali. La console di servizio è anch’essa una macchina virtuale, alla quale sono concessi privilegi speciali di accesso alla configurazione dell’host ESX. La Figura 1 mostra un esempio di distribuzione tipica di VI3 con due macchine virtuali. Ogni macchina virtuale dispone di uno o più file di immagine (VMDK) di sé stessa. La raccolta di file VMDK è gestita dal file system VMFS e dalla ESX Service Console, una macchina virtuale con privilegi di gestione speciali. VI3 include inoltre VMware Consolidated Backup (VCB). VCB consente un approccio centralizzato al backup esterno all’host ESX, utilizzando uno speciale server proxy Windows che accede ai dati ESX in modo indipendente. Se distribuito in modo appropriato, VCB offre molti vantaggi in termini di scalabilità per il backup di macchine virtuali e file VMDK. Figura 1. Distribuzione tipica di VI3 con due macchine virtuali Un server proxy di backup specializzato ha accesso ai file VMDK condivisi e ai file system dei relativi sistemi operativi guest. Utilizzando questo sistema di proxy, il software di backup è in grado di acquisire i backup delle immagini VMDK e dei file dei sistemi operativi guest con un impatto ridotto sulle VM delle applicazioni e con un impatto contenuto sul server ESX. Questo sistema richiede un server proxy. Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 6 Alternative di backup per VMware Infrastructure: indicatori di successo Esiste un’ampia varietà di possibili metodi per il backup di dati VMware. Per determinare quali siano le best practice per il proprio sito, considerare le caratteristiche illustrate di seguito. Sarà necessario individuare la soluzione che offre il giusto equilibrio tra semplicità, velocità, costo e ripristinabilità. • Ripristinabilità dei file VMDK: il metodo scelto dovrebbe consentire di ripristinare componenti VMDK completi e coerenti. Poiché il VMDK è un’unità di storage portatile, di tipo “bare metal”, che contiene tutte le impostazioni del sistema operativo guest, costituisce l’unità di ripristino più semplice dello stato di una macchina virtuale. Sebbene siano normalmente visti come un formato di dati di grandi dimensioni, che scoraggia alcuni amministratori dall’esecuzione di backup regolari, i file VMDK producono risultati eccezionali in termini di deduplicazione se archiviati su un sistema Data Domain, rendendo accettabile l’esecuzione di backup frequenti. • Ripristinabilità dei file del sistema operativo guest: secondo Gartner, circa l’80% dei ripristini eseguiti sono ripristini di file. Man mano che l’impiego di VMware si sposterà dai laboratori di test al supporto di attività generali di server e desktop, i ripristini di singoli file per un determinato sistema operativo guest diventeranno l’attività predominante. In base all’approccio, i file da ripristinare possono essere individuati tramite il catalogo/indice di un software di backup tradizionale, oppure per mezzo di un metodo di ricerca che consenta di individuare un file in uno spazio dei nomi familiare, come si farebbe nelle snapshot convenzionali di file system NAS. • Impatto del backup sulle VM delle applicazioni: ad eccezione delle implementazioni di dimensioni ridotte, è importante ridurre al minimo l’impatto del backup sulle VM di produzione. Anche se la maggior parte dei software di backup tenta di limitare l’impatto sui server utilizzando meno del 5% delle risorse di sistema, la presenza di 10 VM su un unico host ESX che eseguono il backup di se stesse contemporaneamente con le stesse strategie potrebbe immobilizzare una percentuale significativa di risorse dell’host fisico. • Impatto del backup sul server ESX che esegue le VM delle applicazioni: se il server ESX host rallenta, le applicazioni rallentano, anche se ciò non è dovuto al sistema operativo guest presente in una particolare macchina virtuale. Le best practice di backup in generale consigliano di evitare interruzioni delle attività nell’ecosistema delle applicazioni. • Prestazioni di backup: le finestre di backup hanno la stessa importanza sia nel mondo fisico che nel mondo virtualizzato. Più veloce è meglio. Scalabilità dei backup: assicurarsi che l’approccio scelto sia scalabile in base alle esigenze, man mano che si aggiungono macchine virtuali e server ESX. La scelta del metodo di backup VMware giusto può sembrare complessa, per la grande quantità di potenziali alternative. È possibile eseguire il backup in vari modi: • • All’interno delle macchine virtuali • All’interno del server ESX che esegue le macchine virtuali • Da un altro server ESX (utilizzando una fabric di storage condivisa oppure attraverso una LUN virtuale su Ethernet in un server ESX correlato) con il proxy VMware Consolidated Backup di VI3 • La SAN o il sistema NAS sottostante eseguono l’archiviazione direttamente mediante lo scripting delle copie dei file e/o snapshot • Utilizzando software di backup commerciale Sebbene le possibilità siano numerose, per la maggior parte delle implementazioni esistono solo alcune alternative accettabili, riassunte nella Tabella 2. È importante sottolineare che i metodi seguenti non verranno presi in considerazione, a causa delle limitazioni che li escludono dalle best practice. Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 7 • Backup o replica del solo datastore di back-end. La maggior parte delle implementazioni VMware è supportata da un sistema di storage a blocchi “well-provisioned”, spesso una SAN. È possibile eseguire il backup e il ripristino dei soli volumi a blocchi di quel determinato storage. Questa non è una best practice, in quanto rappresenta una procedura complessa ed è improbabile che vengano effettuati tutti i passaggi necessari per creare la snapshot di un’immagine coerente prima di eseguirne il backup. È preferibile eseguire il backup all’interno dell’immagine logica di ESX, del sistema operativo guest e/o di VCB. Tabella 2. Opzioni di backup Ripristino VMDK Ripristino file del sistema operativo guest Metodo di ripristino file Impatto sulle VM delle applicazioni Impatto sul server ESX che esegue le VM delle applicazioni Prestazioni di backup Scalabilità Sistemi operativi guest supportati Client di backup sia nelle VM che nella console di servizio VCB: VMDK più file del sistema operativo guest Sì (da backup della console di servizio) Snapshot/copia dei VMDK su sistema Data Domain da proxy Sì Sì Sì, se nella VM Sì Sì Catalogo del software di backup commerciale Catalogo del software di backup commerciale Ricerca basata sul nome Elevato Ridotto Ridotto Elevato Medio Ridotto Lento Medio Veloce Solo piccole implementazioni Buona scalabilità con proxy Buona scalabilità con proxy Qualsiasi Solo Windows Qualsiasi Numerosi pacchetti di software di backup contengono ulteriori informazioni sulle best practice per l’utilizzo in un ambiente VMware. Sebbene tali informazioni possano evolversi nel tempo, sono segnalate come documentazione corrente per il follow-up 2. VMware: • Per informazioni sull’infrastruttura precedente a VI3, leggere la white paper Using VMware ESX Server System and VMware Virtual Infrastructure for Backup, Restoration, and Disaster Recovery all’indirizzo www.vmware.com/pdf/esx_backup_wp.pdf. • Per informazioni sull’infrastruttura VI3, leggere la guida VMware Consolidated Backup: Improvements in Version 3.5 all’indirizzo www.vmware.com/files/pdf/vcb_35_new.pdf. • Leggere la guida VMware Virtual Machine Backup Guide all’indirizzo http://www.vmware.com/pdf/vsphere4/r40/vsp_vcb_15_u1_admin_guide.pdf. 2 I documenti sono elencati solo per comodità dei lettori ed EMC non ne garantisce in alcun modo la qualità o l’accuratezza. Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 8 Esempi di fornitori di software di backup di classe enterprise: • Per informazioni su EMC NetWorker®, leggere il data sheet all’indirizzo http://www.italy.emc.com/collateral/software/data-sheet/h2257-networker-ds.pdf. • Per informazioni su EMC Avamar®, leggere la white paper Optimizing Backup and Recovery for VMware Infrastructure with EMC Avamar all’indirizzo http://info.emc.com/mk/get/AMA00007001_LAND_STD. • Per informazioni su Symantec NetBackup, leggere la white paper Veritas NetBackup 6.5 for VMware 3.x Best Practices all’indirizzo http://eval.symantec.com/mktginfo/enterprise/white_papers/entwhitepaper_veritas_netBackup_6.5_vmware_nov2007.pdf. • Per informazioni sulle best practice per IBM Tivoli Storage Manager, visitare la pagina http://www.ibm.com/developerworks/wikis/display/tivolistoragemanager/Best+Practices. • Leggere Using IBM Tivoli Storage Manager V5.4 and V5.5 for backup and restore operations on the VMware service console all’indirizzo http://www.ibm.com/developerworks/wikis/display/tivolistoragemanager/Using+IBM+Tivoli+Storage +Manager+V5.4+and+V5.5+for+backup+and+restore+operations+on+the+VMware+service+console. • Per informazioni su CommVault Galaxy, leggere il Partner Solution Brief all’indirizzo www.commvault.com/pdf/CV_SolutionBrief_VMWare.pdf. Fornitori di soluzioni di backup speciali per VMware: • Per informazioni su Vizioncore vRanger Pro, leggere il data sheet tecnico all’indirizzo http://vizioncore.com/products/vRangerPro/documents/vRangerProDatasheet.pdf. • Per informazioni su Veeam, visitare la pagina http://www.veeam.com/tips_to_a_successful_veeam_backup_and_vcb_integration_rev2_wpp.pdf. Guida introduttiva Backup dei file del sistema operativo della macchina virtuale guest e dei file VMDK con un client di backup standard senza VCB Questo metodo è intuitivo per gli operatori di backup ed è sufficiente per le piccole implementazioni. Si tratta di un metodo molto diretto, che utilizza lo stesso software di backup utilizzato dal resto del data center, ma il livello di scalabilità è piuttosto limitato. È composto da due fasi ben definite, ognuna adatta ad un percorso di ripristino diverso. Innanzitutto, trattando ogni VM come macchina fisica, utilizzare un client di backup convenzionale in ogni VM per il backup dei file del sistema operativo guest, al fine di garantire un ripristino semplice dei file. Successivamente, utilizzare un client di backup standard nella VM Linux speciale che esegue la console di servizio per effettuare il backup dei dati di configurazione ESX e dei file VMDK, da utilizzare come punti di ripristino completi del sistema. La Figura 2 illustra la soluzione, che consiste nell’eseguire il backup sia delle macchine virtuali che del server ESX con un agente di backup commerciale. Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 9 Figura 2. Backup di VM ed ESX con un agente di backup commerciale Metodo 1: backup dei file del sistema operativo della macchina virtuale guest Questa è la tecnica più nota e rappresenta probabilmente il metodo più diretto per il backup di un sistema operativo eseguito in VMware. Si installa un client di backup standard su una macchina virtuale. Si pianifica quindi il backup del sistema operativo guest sulla VM e successivamente di eseguono backup a livello di file come in una macchina fisica. Il ripristino dei file viene eseguito come per qualsiasi client standard. L’infrastruttura di backup può essere condivisa, come qualsiasi altro componente di un’implementazione di backup standard, e non necessita di hardware aggiuntivo. L’utilizzo di questo approccio basato sulla macchina virtuale guest offre inoltre una soluzione semplice per le VM che eseguono un’applicazione, ad esempio SQL Server o Oracle. L’applicazione di backup in uso disporrà probabilmente di un agente speciale per queste situazioni, che può essere utilizzato per garantire un backup point-in-time coerente dell’applicazione. Vantaggi I backup a livello di file vengono in genere eseguiti mediante le stesse tecniche utilizzate con gli altri client di backup nell’ambiente. Backup e ripristini avvengono come se il sistema operativo guest fosse ospitato su una macchina fisica, e non virtuale. Il sistema operativo può essere sottoposto a backup in sicurezza, a condizione che il sistema operativo guest sia supportato dal software di backup e da VMware. I ripristini a livello di file sono supportati. I sistemi Data Domain sono ideali per questo metodo, poiché offrono una riduzione eccellente della quantità di dati e una replica ottimizzata per la WAN ai fini del disaster recovery (DR). La tecnica è semplice da implementare e consente il backup non solo della macchina virtuale, ma anche dei dati delle applicazioni che risiedono su partizioni di storage diverse, non controllate dalla macchina virtuale (ad esempio disco raw o NAS). Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 10 Considerazioni Innanzitutto, con questo metodo può essere difficile gestire il numero effettivo delle macchine virtuali, che tendono a proliferare rapidamente. In secondo luogo, se viene eseguito contemporaneamente il backup di un determinato numero di client, i backup possono causare rapidamente l’overrun della CPU, della memoria e di altre risorse dell’host ESX. Per evitare un possibile sovraccarico delle risorse, è necessario che i responsabili IT siano molto selettivi rispetto a quanti e quali sistemi virtuali sottoporre a backup a livello di file utilizzando questo approccio. La tecnica “del sistema operativo guest” non è sufficientemente scalabile, né offre una soluzione di gestione realizzabile per le installazioni VMware di medie e grandi dimensioni. Utilizzando questa sola procedura, non è possibile eseguire il backup di un host ESX che contiene la ESX Service Console o le immagini VMDK. A questo scopo, è necessario utilizzare il metodo 2. Metodo 2: backup di ESX e dei file VMDK Ogni sistema operativo guest VMware dispone di almeno un file del disco e altri file di configurazione associati, archiviati nella directory [DataStoreName]/ NomeVM, nella cartella /vmfs/volumes, all’interno dell’host ESX. VMware posiziona i file sul VMFS e aggiunge ad ogni file l’estensione “vmdk”. I file possono essere sottoposti a backup e ripristinati come file standard. Questa operazione è analoga ad un backup dell’intera immagine di una macchina virtuale che può essere utilizzato per il DR (ripristino interamente automatizzato). Per questa configurazione è necessario installare un agente di backup Linux sulla console di servizio VMware. Il ripristino di una macchina virtuale richiede il ripristino della singola cartella della VM che contiene i file VMDK, ossia il ripristino di un’immagine della VM dal point-in-time in cui è stata spenta. I sistemi Data Domain possono sfruttare questo metodo con risultati eccellenti in termini di riduzione del volume dei dati per lo storage locale, oltre che per la replica sulla WAN a scopi di DR. Si noti che il backup della console di servizio consente solo il backup e il ripristino dei dati che risiedono nella stessa area di storage (ad esempio “disco”) della VM. I dati delle applicazioni possono risiedere su un file system separato. Vantaggi Questo metodo funziona con tutto il software di backup in commercio che supporta i client basati su Linux (ESX). È più semplice da gestire rispetto all’approccio precedente, in quanto esiste un solo client Linux per ogni host ESX. Se necessario, consente di eseguire facilmente il backup dell’intero host ESX. Comporta un carico moderato sul server ESX, ma poiché è possibile trasmettere file di grandi dimensioni a velocità molto superiori rispetto a quelli di piccole dimensioni, può produrre un impatto minore rispetto al backup dei file di un sistema operativo guest. Questo metodo può agevolare la gestione del carico su qualsiasi server ESX, in quanto in circostanze normali i backup dei file VDMK verranno eseguiti in sequenza e non contemporaneamente. Considerazioni Questo metodo rappresenta essenzialmente il backup di un’immagine disco, che presenta dei limiti per la granularità del ripristino. Non è possibile effettuare il ripristino a livello di file del sistema operativo guest dal catalogo del software di backup. Un’altra considerazione importante è la necessità di creare una snapshot del sistema VM di cui si sta eseguendo il backup della cartella e del file VMDK; ciò richiede comandi o script appropriati a garanzia della coerenza dell’immagine. Alcune applicazioni di backup inoltre potrebbero non supportare Linux. Infine, con l’aumento delle macchine virtuali, il processo di pianificazione degli arresti, l’arresto delle macchine virtuali e la pianificazione dei backup possono complicare la gestione. Script specifici tuttavia, o la capacità di arrestare tutte le macchine virtuali su un server ESX allo stesso tempo, possono ridurre il carico di gestione. Se si aggiunge VMotion alla configurazione, la posizione del sistema operativo guest nel sistema non è fissa e questa opzione diventa ancora più difficile da gestire, in particolare se si desidera eseguire il backup solo di specifiche macchine virtuali. Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 11 Metodo 3: utilizzo di VMware Consolidated Backup Utilizzo di VCB con software di backup commerciale che non supporta VADP Se non si dispone di un software di backup commerciale che supporti l’API vStorage esiste un metodo alternativo, che prevede l’impiego di un host Windows 2003 o superiore come proxy di backup che funga da origine per i backup. Lo storage da sottoporre a backup viene condiviso con l’host proxy di backup. Può utilizzare uno storage array già condiviso dai server ESX e dal proxy oppure, come nella LUN virtuale di ESX 3.5, il proxy può utilizzare una connessione LAN ad un altro server ESX per accedere allo storage. Se lo si desidera, nei sistemi Windows, il server proxy VCB può inoltre eseguire il mount dello storage condiviso per l’accesso ai fini di backup a livello di file system. Sono supportati solo i sistemi operativi guest Windows. La Figura 3 illustra la configurazione di VMware VCB. Figura 3. VMware Consolidated Backup con un sistema Data Domain L’agente di backup consolidato, installato come pacchetto separato sull’host proxy Windows 2003, crea una snapshot di una singola macchina virtuale VMware (o, se è presente uno script apposito, di più macchine virtuali) e copia i dati in una cartella temporanea. I dati vengono quindi utilizzati come origine per i backup. Prima della creazione della snapshot viene eseguito lo script /usr/sbin/pre-freeze-script o C:\Windows\prefreeze-script.bat. Al termine del backup viene eseguito lo script /usr/ sbin/post-thaw-script o C:\Windows\post-thaw-script.bat. La creazione di una snapshot richiede solo pochi minuti, dunque, ad esempio, è possibile utilizzare gli script per interrompere le attività del database o arrestarlo. Per automatizzare il processo è necessario comprendere l’intero processo di creazione della snapshot e copia. Le variabili includono le dimensioni del file del disco e la quantità di risorse del server ESX in uso. La “snapshot” di un VMDK comporta la creazione di file VMDK speciali con l’estensione .redo, che diventano il file del disco scrivibile, mentre il file .vmdk principale viene precluso alla scrittura (e bloccato dal VMFS) e dunque può essere sottoposto a backup dalla console di servizio. Anche se non è mostrato, è possibile utilizzare il sistema Data Domain come libreria a nastro virtuale. Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 12 Vantaggi Il vantaggio principale di VCB è che una volta interrotte le attività dei sistemi e creata la snapshot della macchina virtuale, le macchine virtuali possono rimanere in funzione durante il backup con un impatto minimo sulle prestazioni. Le immagini VMDK e le immagini del file del sistema operativo guest possono essere copiate in una posizione sicura mediante script o software di backup. È possibile eseguire contemporaneamente il backup di più macchine virtuali con un impatto contenuto sulle VM o su un server ESX. Questo approccio è molto più semplice e scalabile, pertanto è il preferito nelle implementazioni VMware di grandi dimensioni che eseguono VI3. I sistemi Data Domain possono sfruttare questo metodo con risultati eccellenti in termini di deduplicazione dello storage locale, oltre che per la replica ottimizzata sulla WAN a scopi di DR. Considerazioni I compromessi nell’utilizzo di VMware Consolidated Backup sono elencati di seguito. • Per i backup consolidati sono necessarie la configurazione e l’implementazione manuale di alcune righe di comando. Il processo può essere automatizzato utilizzando gli script in dotazione con VMware. Nota: la nuova API vStorage (VADP) elimina la necessità dello scripting manuale. • Se si utilizza lo storage condiviso collegato a SAN, è necessario che le LUN abbiano lo stesso numero di LUN sia nel proxy e che nell’host ESX. Inoltre, il proxy e l’host ESX devono trovarsi sulla stessa SAN. Il framework VMware VI3 Consolidated Backup richiede un host Windows 2003 come proxy; non sono supportati altri sistemi operativi. Metodo 4: backup consolidato con sistemi Data Domain In questo esempio viene illustrato come impostare un proxy di backup consolidato e integrarlo ad un sistema Data Domain. L’esempio presume che il software di backup sia installato su un host separato configurato per i backup dei file system e che il sistema Data Domain sia correttamente installato. Per la connettività si presume lo schema illustrato nella Figura 3. Installazione del proxy I requisiti prevedono la presenza di un server Windows 2003 con il framework VMware Consolidated Backup installato, collegato direttamente ad una SAN insieme ad uno o più server ESX. Entrambi devono vedere direttamente tutte le immagini delle macchine virtuali che risiedono nelle LUN VMFS. L’host Windows viene denominato proxy di backup, o semplicemente proxy. La prima volta che si esegue un backup consolidato tramite l’host proxy, le macchine virtuali devono essere accese. Dopo la configurazione, il proxy comunica con il/i server ESX, crea una snapshot e quindi ne crea una copia su un disco collegato in locale. Il processo è manuale e si presta allo scripting. VMware non fornisce script che consentano il collegamento a prodotti di backup commerciali, quali EMC NetWorker o Symantec NetBackup. Best practice avanzate Creazione di snapshot/copia di immagini VMDK su sistemi Data Domain da ESX o VCB e ripristino delle copie dei file del sistema operativo guest tramite ricerca Nei metodi precedenti è stato utilizzato un software di backup commerciale per identificare, spostare, catalogare e ripristinare i file del sistema operativo guest e il sistema ESX stesso. I metodi offrono protezione completa con livelli diversi di scalabilità. È disponibile un altro importante approccio, che viene normalmente utilizzato solo con lo scripting. Alcuni fornitori di software di backup hanno iniziato ad offrirlo come pacchetto software, che si collega in modo ottimale all’infrastruttura VMware e ai sistemi Data Domain per ripristini locali o remoti/DR. Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 13 Con questo metodo, solo i file VMDK vengono effettivamente copiati a scopo di protezione nel sistema Data Domain. La copia può essere eseguita da una console di servizio o da un proxy VCB. Se i file VMDK copiati vengono denominati con caratteristiche che ne consentano l’individuazione immediata (ad esempio con una combinazione di nome della VM, nome del server ESX, ora e data), è possibile archiviarli in una condivisione di rete su un sistema Data Domain, ad esempio utilizzando NFS. Ciò consente un ripristino semplice dei file VMDK, in locale o in remoto. Dopo la copia sulla condivisione di rete, i dati sono completamente protetti. Il ripristino di un dato file VMDK sullo storage ESX corrisponde semplicemente ad un’altra richiesta di copia file. Questo metodo consente inoltre il ripristino dei file, senza dover eseguire il backup dei file del sistema operativo guest. Utilizzando le proprietà di accesso random del sistema Data Domain, è possibile avviare una nuova macchina virtuale dal file VMDK salvato sul sistema Data Domain. Quando questa è in funzione, gli utenti possono effettuare una ricerca nel file system del sistema operativo guest, individuare il file in questione e copiarlo semplicemente sul sistema operativo guest di una VM di produzione. Utilizzando Storage VMotion è possibile eseguire la migrazione dell’intera immagine dei dati della macchina virtuale su uno storage primario, se è richiesto un tasso di interazione (IOPS) elevato. Questa configurazione è illustrata nella Figura 4. Vantaggi Questo è l’approccio con il minore impatto sulle macchine virtuali in esecuzione e sull’infrastruttura ESX. Consente di eseguire backup più veloci rispetto a tutti gli altri metodi, in quanto per il ripristino di singoli file non è necessario il backup dei file del sistema operativo guest. È più semplice da amministrare nel tempo, per la minore quantità di file da gestire. Dal punto di vista dell’help desk, i file più importanti di cui tenere traccia sono solo i VMDK di dimensioni maggiori. A differenza di VCB, questo approccio supporta qualsiasi sistema operativo guest, compresi Linux, Solaris e NetWare. Considerazioni I software di backup commerciale archiviano le immagini di backup su disco nel proprio formato proprietario, ad esempio tar. Sebbene alcuni di questi formati siano facilmente riconoscibili, possono impedire la visualizzazione dei dati interni senza l’utilizzo del catalogo o di un’applicazione di backup per il ripristino. Di conseguenza, la maggior parte dei pacchetti di backup, che non ha mai davvero semplificato i requisiti di scripting di VCB, non è adatta ai backup del metodo 3. Per garantire backup coerenti è necessaria la creazione di script, utilizzando le convenzioni consigliate da VMware, per la creazione di snapshot e il riavvio delle macchine virtuali. A pagina 8 è disponibile un collegamento a documenti che illustrano la questione dal punto di vista di VMware. Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 14 Figura 4.Creazione di snapshot/copia di immagini VMDK su storage con funzionalità di deduplicazione Data Domain da ESX o VCB. Ripristino delle copie dei file del sistema operativo guest tramite ricerca I sei passaggi nella Figura 4 illustrano quanto segue: 1. Creazione della snapshot di un’immagine VMDK 2. Copia del file VMDK nel sistema Data Domain 3. Archiviazione / Replica Quanto segue avviene in locale o nel sito di DR. 4. Ripristino del file VMDK dal sistema Data Domain 5. Ripristino del file nel sistema operativo guest presso il sito di DR 6. Utilizzo di VMotion nello storage primario VADP di vSphere con software di backup commerciale Come accennato nell’introduzione, uno dei metodi più semplici per il backup e il ripristino degli ambienti virtualizzati prevede l’utilizzo di un software di backup che supporti l’API vStorage di vSphere. I pacchetti software che supportano l’API vStorage offrono la gestione centralizzata di backup e ripristini completi, differenziali e incrementali di macchine virtuali senza bisogno di gestire le attività da ogni VM o server ESX. Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 15 Vantaggi Il vantaggio principale offerto dall’utilizzo di software di backup con supporto dell’API vStorage è che gli utenti non devono disporre di un processo o di agenti software separati su ogni macchina virtuale. Gli utenti utilizzano semplicemente una macchina virtuale o un sistema fisico in cui è installato un software di backup per eseguire il backup e il ripristino di tutte le VM individuate in un determinato server ESX. Oltre a semplificare i backup, l’utilizzo di un software di backup standard per la gestione del processo riduce le finestre di backup, eliminando la necessità di affidare ai server ESX il carico di gestione associato ai backup delle macchine virtuali. Considerazioni Non tutti i pacchetti software di backup supportano l’API vStorage. Sebbene l’offerta di supporto sia in crescita, al momento questa opzione può non essere disponibile per tutti gli utenti. È necessario stabilire se la semplificazione delle attività di backup giustifica il passaggio ad un’altra applicazione software di backup, o se è preferibile applicare un metodo di backup alternativo per le proprie macchine virtuali. Esempio di implementazione Un’azienda di servizi finanziari inclusa nella classifica Fortune 500 con ricavi superiori ai 5,5 miliardi di dollari (2009) ha implementato Data Domain con VMware e una soluzione di storage EMC. Il progetto prevedeva la riprogettazione completa del piano di business continuity per la sede aziendale principale, che ospita oltre 1.000 dipendenti. L’approccio frammentato al backup e al ripristino esistente è stato sostituito con una protezione coerente e consolidata delle risorse infrastrutturali sia fisiche che virtuali. Attualmente l’azienda esegue il backup e la replica sul sito di disaster recovery di oltre 60 TB di dati. La soluzione ha consentito l’eliminazione di tre archivi su nastro; i backup sono stabili e le operazioni vengono eseguite in modo ottimale. La Figura 5 illustra uno schema della soluzione Data Domain così come implementata. Figura 5. Esempio di implementazione di un’azienda di servizi finanziari I file VMDK vengono spostati nel formato nativo (template, archive, mount, boot). VMware Storage VMotion viene utilizzato per la migrazione in tempo reale dei file VMDK. I test di disaster recovery nel nuovo ambiente risultano molto semplificati. Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 16 Conclusioni In questo documento sono stati presentati gli approcci più diffusi per il collegamento dei sistemi di storage con funzionalità di deduplicazione Data Domain all’ambiente VMware, per la massima semplicità, velocità e sicurezza della conservazione dei backup, del ripristino e della replica. Per sfruttare i vantaggi offerti da VMware, spesso è necessario aumentare lo storage (in particolare lo storage di backup). Un utilizzo efficiente dei sistemi di storage con funzionalità di deduplicazione Data Domain consente di gestire in modo ottimale i tempi di backup e di riportare sotto controllo lo storage di backup e la larghezza di banda per la replica a scopi di DR. Con backup dei file system e periodi di conservazione normali, Data Domain può offrire una riduzione dei dati da 10 a 30 volte; la riduzione dei dati in un ambiente VMware può raggiungere le 40-60 volte. Stabilire in modo chiaro i propri obiettivi e scegliere una delle opzioni seguenti: • Per iniziare, considerare l’utilizzo di un client di backup tradizionale in ogni sistema operativo guest, anche se questo approccio è poco scalabile. • Per una implementazione IT professionale che sarà supportata nel tempo dalla maggior parte dei software di backup, con virtualizzazione Windows considerare VI3 VCB. • Per la massima scalabilità ed efficienza, anche se nella maggior parte dei casi sarà necessaria la creazione di script, considerare la copia di VMDK coerenti su un sistema Data Domain. Per il ripristino delle macchine virtuali, copiare i file VMDK direttamente o mediante Storage VMotion. Per il ripristino dei file, avviare la macchina virtuale dal VMDK sul sistema Data Domain e quindi copiare il file nello storage primario, oppure utilizzare Storage VMotion mentre la macchina virtuale è in esecuzione. Per la massima scalabilità senza requisiti di scripting, considerare l’utilizzo di un software di backup con supporto dell’API vStorage. Con l’utilizzo dell’API vStorage inoltre, non è necessaria l’installazione di agenti di backup su tutte le VM esistenti. È infatti sufficiente installare l’agente di backup su una singola VM o server fisico, che gestirà tutti i backup e i ripristini per l’intero ambiente VM. Le possibili scelte sono molte, ma solo alcune possono essere definite best practice. Per ulteriori informazioni, visitare la pagina www.datadomain.com/solutions/vmware.html. • Backup e ripristino per VMware con i sistemi di storage con funzionalità di deduplicazione EMC Data Domain Considerazioni tecniche per la scelta della soluzione 17