Continuità Operativa & Disaster Recovery per la Pubblica Amministrazione Francesco Scarano Sales Consultant Software Giulio Lambardi Sales Consultant Hardware Le Linee di Principio • Articolo 97 della Costituzione – I pubblici uffici sono organizzati secondo disposizioni di legge, in modo che siano assicurati il buon andamento e la imparzialità dell'amministrazione. (...) • Nuovo Codice di Amministrazione Digitale • Le linee guida per Disaster Recovery delle Pubbliche Amministrazioni • Il dato visto come patrimonio informativo e di conoscenza dell’amministrazione pubblica • La salvaguardia dei dati è un aspetto principale da considerare nei piani di Disaster Recovery I livelli di complessità e criticità • • • • • • • 6 Livelli / Tier Criticità del patrimonio informativo Criticità del Livello di Servizio Tempi di Ripristino Necessità Infrastrutturali Risorse Finanziarie Complessità Organizzativa I livelli di complessità e criticità I 6 Livelli di Complessità Tier 1 – Tier 3 • Tier 1 (Manual Vaulting) • • • • • Backup/Recovery (supporti con copie di backup conservati e trasferiti al bisogno) Cold Site Costi d’investimento iniziali molto bassi Tempi di ripristino lunghi e costi imprevedibili Necessità di simulazione della procedura di ripristino • Tier 2 (Manual Vaulting with D/R Site) • • • • • Backup/Recovery (supporti con copie di backup trasferiti periodicamente) Warm Site Costi d’investimento iniziali bassi Tempi di ripristino moderati e costi prevedibili Procedura di ripristino sperimentata • Tier 3 (Electronic Vaulting with D/R Site) • • • • Backup/Recovery (copie backup trasferiti telematicamente) Warm Site Costi d’investimento per infrastruttura e connettività Tempi di ripristino abbastanza veloci I 6 Livelli di Complessità (cont.) Tier 4 – Tier 5 • Tier 4 (Business Continuity Asincrona) • • • • • • Doppio Sito Siti distanti geograficamente ed entrambi attivi Connettività efficiente Sistemi preferibilmente equipotenti ed allineati frequentemente Costi d’investimento alti Tempi di ripristino corti • Tier 5 (Business Continuity Sincrona) • • • • • • Doppio Sito Siti distanti geograficamente ed entrambi attivi Dati allineati all’ultima transazione andata buon fine Connettività ad alte prestazioni, specialmente in termini di latenza Costi d’investimento alti Tempi di ripristino immediati I 6 Livelli di Complessità (cont.) Tier 6 • Tier 6 (Business Continuity based on Maximum Availabilty Architecture) • • • • • • Doppio Sito, distanti geograficamente, entrambi attivi e cooperanti Banca Dati condivisa e replicata Connettività ad alte prestazioni Architettura Complessa Costi d’investimento molto alti Continuità operativa assoluta – nessun fermo sistema Le Soluzioni Oracle • Architetture rispondenti a ciascuno dei 6 Livelli definiti da DigitPA • Graduali, Flessibili, Complete • Garanzia di rispetto del Livello di Servizio richiesto • Tempi di Ripristino fino a pochissimi secondi • Infrastrutture di diversa complessità scalabili ed aggiornabili • Funzionalità di Sicurezza aggiuntive • Protezione dei Dati da qualsiasi minaccia e rischio • Maximum Available Architecture (MAA) Oracle Prima parte… ¾ Tier 1 Æ Manual Vaulting ¾ Tier 2 Æ Manual Vaulting with D/R Site ¾ Tier 3 Æ Electronic Vaulting ¾ Tier 4 Æ Business Continuity Asincrona ¾ Tier 5 Æ Business Continuity Sincrona ¾ Tier 6 Æ Business Continuity based on MAA Una Premessa… Tier 4-6 Online Backup Sito Primario B/C Tier 1-3 D/R Sito Secondario Dunque… Aver predisposto correttamente le procedure di dei dati è un requisito abilitante alla predisposizione del Disaster Recovery Backup Infrastructure (Architecture) Protected Servers Large Production Server Small Production Server -- FC Backup Client -- -- Network Backup Client -- LAN Backup Disk Media Server Backup Server -- Tape Read/Write-- -- Backup Catalog -- SAN LAN Backup Tape Library LAN-Free Backup 12 Backup Infrastructure (Building Blocks) Tape Tape Libraries Libraries & & Tape Tape Drives Drives Backup Backup Disk Disk SL3000 SL8500 SL500 SL24/48 ZFS Backup Appliance T9840 T10K LTO Backup Backup Server Server & & Media Media Server Server •Solaris •Solaris •Linux •Linux •Windows •Windows SPARC T-Series X64 X-Series Backup Backup Software Software RMAN 13 Tier 1 – Manual Vaulting Architettura Tape Library 1 A Retention: 1 Month, then: Recycle PROD 2 B Vaulting after 1 Day Retention: 1 Year, then: Recycle Legenda PROD SITE 1: OSB MF «A» to Storage Location «PROD» 2: OSB MF «B» to Storage Location «D/R» 3 3: Physical Move to D/R Site B D/R SITE 14 Tier 1 – Manual Vaulting Caratteristiche • Hardware 9 Tape 9 Tape Drive 9 Tape Library (Slot + CAP) • Software 9 9 9 9 9 9 Media Family Duplication Policy Storage Locations Rotation Policy Vaulting Schedule Media Reporting Tier 1 – Manual Vaulting Oracle Hardware Entry Distributed Midrange Enterprise SL24/SL48 24 48 SL500 30 SL500 SL3000 SL8500 575 200 SL3000 1500 Cartridge Slots 5000+ SL8500 70,000 Tier 1 – Manual Vaulting Oracle Software – Oracle Secure Backup Define tape pools, storage locations, policies and schedules: 1 3 Media Family(s) Policies: Vaulting, Duplication 5 Schedules: Vaulting, duplication 2 4 Storage Location(s) Association: Map policy(s) to media family 17 Tier 2 – Manual Vaulting with D/R Architettura Tape Library Retention: 1 Month, then: Recycle 1 A PROD Vaulting after 1 Day Retention: 1 Year, then: Recycle 2 B Legenda PROD SITE 1: OSB MF «A» to Storage Location «PROD» 3 2: OSB MF «B» to Storage Location «D/R» Tape Library 3: Physical Move to D/R Site 4 D/R 4: Restore to D/R Site B D/R SITE 18 Tier 3 – Electronic Vaulting Business Justifications Recovery Point and Recovery Time Wks Days Hrs Mins Secs Secs Mins Hrs Days Data Loss Downtime (RPO - Recovery Point Objective) (RTO - Recovery Time Objective) Wks Value Valueof ofData Data The Business The Businessvalue valueof ofdata dataisis rarely rarelyunderstood understood Recovery RecoveryTime TimeObjective Objective The Theshorter shorterthe theRecovery RecoveryTime Time Objective Objective(RTO) (RTO)the thequicker quickeryou you get getback backto tobusiness business Recovery RecoveryPoint PointObjective Objective Tolerance for Tolerance fordata dataloss loss(sec’s, (sec’s, hours, hours,days); days);determines determines frequency of backups frequency of backups Backup BackupWindow Window Static, Static,but butneeding needingto to accommodate accommodatean anever everincreasing increasing amount amountof ofdata data Tier 3 – Electronic Vaulting Architecture PROD FULL_BK_1 1 2 Bandwidth Latenza Persistenza Legenda PROD 1: Backup Process 2: Electronic Vaulting D/R 3: Restore Process FULL_BK_1 3 D/R Tier 3 – Electronic Vaulting Oracle Solution Oracle ZFS Backup Appliance 1 StorageTek Tape Storage 4 PROD Legenda PROD 1: Backup Process 2 2: Electronic Vaulting 3: Restore Process StorageTek Tape Storage 4 D/R 3 4: Tape Long Term Backup Archive Oracle ZFS Backup Appliance Tier 3 – Electronic Vaulting Oracle ZFS Backup Appliance Connectivity 9 GB Eth, 10 GB Eth 9 Fibre Channel 9 InfiniBand Snapshot/Cloning of Backup 9 Fast and efficient Test, Dev and D/R 9 Integrated with Oracle CloneDB Feature Block-level Remote Replication 9 Optimized for WAN 9 Integrated with Oracle Merged Incremental Backup D/R Tier 3 – Electronic Vaulting Deep integration b/w Oracle HW & SW CLN_BK_1 CLN_BK_2 CLN_BK_3 FULL_BK_2 FULL_BK_3 2 PROD FULL_BK_1 3 INCR_BK_2 1 Legenda INCR_BK_3 5 5 PROD 1: RMAN 2: ZFSBA Clone 3: Merged Incr.BK 5: ZFSBA Repl. (Full) FULL_BK_1 FULL_BK_2 6 FULL_BK_3 6 5: ZFSBA Repl. (Delta Blocks) 6: DNFS CloneDB CLN_DB_1 CLN_DB_1 CLN_DB_1 D/R Seconda parte… ¾ Tier 1 Æ Manual Vaulting ¾ Tier 2 Æ Manual Vaulting with D/R Site ¾ Tier 3 Æ Electronic Vaulting ¾ Tier 4 Æ Business Continuity Asincrona ¾ Tier 5 Æ Business Continuity Sincrona ¾ Tier 6 Æ Business Continuity based on MAA Tier 4 – Business Continuity Asincrona Caratteristiche • • • • • • • • Molteplici soluzioni : 1 Base e varie di tipo Enterprise Sfruttamento della rete di connessione tra i due siti Sfruttamento delle risorse elaborative del sito secondario Soluzioni di diverso impegno economico-finanziario Ottimo Livello di Sicurezza ed Affidabilità Operatività del Sito di Recovery in tempi brevissimi Utilizzabili anche in ambienti complessi e distribuiti Basate su Oracle Secure Backup, Oracle Advanced Security Option, Oracle Advanced Compression, Oracle Data Guard, Oracle Active Data Guard Tier 4 – Business Continuity Asincrona Architettura Tier 5 – Business Continuity Sincrona Caratteristiche • Molteplici soluzioni : 1 Base e varie di tipo Enterprise • Sfruttamento di connettività e di risorse elaborative • Sito secondario replicato sincronamente e continuamente allineato al primario • Soluzioni di diverso impegno economico-finanziario • Ottimo Livello di Sicurezza ed Affidabilità • Operatività del Sito di Recovery in tempi brevissimi • Utilizzabili anche in ambienti complessi e distribuiti • Multipiattaforma • Basate su Secure Backup, Advanced Security Option, Active Data Guard, Advanced Compression, GoldenGate Tier 5 – Business Continuity Sincrona Architettura Tier 5 – Business Continuity Sincrona Architettura Tier 6 Caratteristiche • • • • • • • • • Molteplici soluzioni : 1 Base e varie di tipo Enterprise Tutti i vantaggi delle soluzioni precedenti Clusterizzazione di nodi attivi e concorrenti Bilanciamento del carico operativo ed ottimizzazione delle prestazioni Continuità operativa massima Gestione efficiente di fermi programmati e non Siti perfettamente allineati, sincronizzati, mutuamente ed automaticamente interscambiabili Soluzioni di diverso impegno economico-finanziario Basate su OSB, Real Application Clusters, ASO, ADG, Advanced Compression, GoldenGate Tier 6 Architettura Oracle Secure Backup Backup & Recovery Integrato basato su Nastro Oracle Databases File System Data UNIX Windows Linux NAS Oracle Secure Backup Gestione Centralizzata dei Nastri di Backup • Protegge l’intero ambiente – Files di database Oracle – Files Applicativi • Integrazione Built-in con Oracle • Il backup più veloce per Oracle – 25-40% più veloce della competition • Costo più basso Oracle Recovery Manager Garantisce validi backup e restore di database • Conoscenza intrinseca dei formati dei file di database di Oracle database e dele procedure di recovery – – – – Validazione dei blocchi Recovery Online a livello di blocco Compressione dei blocchi non utilizzati Backup Online e multi-flusso • Completamente integrato con : – Oracle Secure Backup – Stumenti di backup di terze parti Transparent Data Encryption Oracle Advanced Security Disk Backups Exports Application • Protegge da accessi non-autorizzati a livello di Sistema Operativo e di rete • Cifratura efficiente di tutti i dati applicativi • Gestione built-in del ciclo di vita della chiave di cifratura • Nessun cambio richiesto all’applicazione Off-Site Facilities Advanced Compression Riduce Significativamente l’Utilizzazione di Storage • Comprime grandi tabelle applicative – Transaction processing, data warehousing • Comprime tutti i tipi di dati – Tipi di dati strutturati e non-strutturati • Migliora le prestazioni delle interrogazioni – Risparmi a cascata su tutto il data center Fino a 4X di Compressione Advanced Compression © 2011 Oracle Corporation 36 Oracle Data Guard Protezione da qualsiasi guasto del Sito Automatic Storage Management Data Guard Real Application Clusters Fino a 500 Km. • • • • • La migliore protezione dalla corruzione per il Database Oracle Failover Automatico verso il database di standby Siti abbastanza lontani per evitare disastri regionali Abbastanza vicini per nessuna perdita di dati Utilizza la rete per un ordine di grandezza minore rispetto alle soluzioni basate sul mirroring del disco Oracle Data Guard La miglior Protezione possibile per il Database Oracle • I cambiamenti sul Primario trasmessi direttamente dalla memoria – Isola il sito di standby dalle corruzioni dell’I/O • Il code path del Software sul Secondario diverso da quello sul Primario – Isola lo standby da errori di firmware e software • Molteplici controlli per l’individuazione di corruzione di Oracle – I Dati applicati allo standby sono consistenti logicamente e fisicamente • Lo Standby individua corruzioni silenti che avvengono sul Primario – Causati da errori hardware e da guasti che avvengono dopo che Oracle riceve la conferma dell’avvenuta scrittura • Il database di standby è in uno “stato conosciuto” – Oracle è aperto, pronto al failover se necessario Active Data Guard Per eliminare la ridondanza dei data center inoperosi Automatic Storage Management Recovery Manager Data Guard Real Application Clusters Active Data Guard • Il database di Standby è simultaneamente in read e recovery mode • Scarico delle queries a sola lettura su uno standby fisico aggiornato • Utilizzazione dei backups incrementali sullo standby fisico Oracle GoldenGate La Soluzione Oracle per l’Integrazione delIe Informazioni Applicazione Applicazione Cattura Source & Target Consegna Region A Consegna Cattura Source & Target Region B • Utilizza una molteplicità di sistemi per le transazioni • Permette la disponibilità continua durante le interruzioni pianificate e non pianificate • Sincronizza dati tra data centers sparsi geograficamente Oracle GoldenGate Ideale per le Manutenzioni Programmate Reconnect Applicazione Dati cambiati in Real-time Consegna Cattura Trail Files Oracle Consegna Database 8i/9i/10g Trail Files Failback Data Flow Confronta & Verifica Cattura Oracle Database 11g Release 2 • Effettuazione di aggiornamenti/migrazioni con nessun fermo del database • Verifica della consistenza dei dati • Minimizzazione dei rischi grazie al recupero di guasti, utilizzando una replicazione master-master Oracle Maximum Availability Architecture HA Best Practices Blueprint Secure Backups to Cloud and Tape Recovery Manager Undo Human Error Table & Index Redefinition Add/Remove Storage Rolling Upgrades Data Guard Add/Remove Nodes Rolling Patches & PSUs Automated Upgrade Testing Active Data Guard