Perché il RAID non è un backup: ricordiamolo

Backup Vs. RAID: proteggere in maniera efficace i dati

Un argomento spinoso ed estremamente dibattuto ma ancora da scoprire per molti.

Gli obiettivi da perseguire:

Una delle principali sfide dell’informatica è mantenere i dati disponibili e al sicuro. Il backup è uno dei nostri principali alleati. Se non hai mai riflettuto sulle minacce che possono mettere a rischio i tuoi dati ecco qualche esempio:

  1. Guasti hardware: la rottura di un hard disk, l’impossibilità di riattivare un server per un guasto alle sue componenti
  2. Furto o atti vandalici: un’eventualità spesso non considerata ma possibile e spesso disastrosa
  3. Virus, malware e ransomware: ben noto ai più specialmente a causa dell’inflazione di questi ultimi in periodi recenti
  4. Errore o dolo umano: spesso dovuto a una cattiva configurazione dei permessi di cartelle condivise

Risulta chiaro che le possibili minacce da cui bisogna proteggersi sono molteplici e di varia natura. Gli obiettivi da perseguire risultano essere quindi:

  1. Rendere i dati sempre disponibili e indipendenti dall’hardware
  2. Concedere, in modo sicuro, l’accesso ai dati condivisi a più utenti spesso dislocati in più aree geografiche
  3. Permettere, in caso di necessità, il recupero dei dati cancellati per errore o per dolo

Quali mezzi tecnologici abbiamo a disposizione?

La forte evoluzione tecnologica, unita a un forte abbattimento dei costi di immagazzinamento dei dati, permette oggi a chiunque di proteggere in maniera efficace e relativamente economica i propri dati. Bisogna però che i responsabili IT e i dirigenti aziendali conoscano bene le tecnologie, il loro scopo e le differenze tra esse. RAID, Backup, replica, decuplica, cloud storage sono termini noti ai più ma spesso confusi tra loro.

Il classico errore: “Non faccio i backup, tanto ho il RAID”

Ho sentito tante volte quest’affermazione, davvero tante. Ogni volta la mia risposta è stata: “Il RAID non è il Backup, non ha lo stesso scopo né la stessa valenza“.  Qualcuno, spesso deviato da letture frettolose su Internet o da consulenti impreparati, mi ha guardato confuso. Altri hanno voluto approfondire l’argomento, rendendosi conto dei gravi rischi corsi fino a quel giorno.

Analisi delle tecnologie di protezione e disponibilità dei dati

RAID: tipologie, differenze e implementazioni

Il RAID è una particolare configurazione in cui gli hard disk vengono gestiti da un controller (hardware o software) che si occupa di gestire la distribuzione dei dati tra più supporti. Il controller può solitamente gestire più tipologie di configurazioni: ognuna di esse ha particolare vantaggi, svantaggi e applicazioni d’uso.

Nella tabella che segue mostriamo le differenze tra le tipologie RAID, per praticità ci riferiremo all’utilizzo di dischi da 500Gb.

Q.tà min. HD Capacità totale Q.tà Max HD difettosi Schema
RAID 0 o “striping” 2 1000Gb 0  
RAID 1 o “mirroring” 2 500Gb 1  
RAID 5 3 1Tb (con 3 dischi da 500Gb) 1  
RAID 1+0 4 1Tb (con 4 dischi da 500Gb) 1 x ogni RAID 1  
RAID 0+1 4 1Tb (con 4 dischi da 500Gb) 2 (solo nello stesso RAID 0)  

 

La confusione tra backup e RAID nasce sempre in merito a una particolare configurazione di questa tecnologia il “RAID 1 o mirroring“. In questa modalità, infatti, i dischi sono copie speculari (da cui il termine “mirroring”) e cioè induce spesso a pensare che tale “copia” abbia la stessa valenza di un backup.

Perchè un RAID 1 non sostituisce il Backup?

Perchè il RAID non crea una copia del file. Il backup (come suggerito dalla parola stessa) serve a “tornare indietro”: risulta ovvio che un RAID non può svolgere questo lavoro. Tale tecnologia ci permette solo di proseguire il lavoro (prendendo le giuste precauzioni) in caso di guasto hardware. Se cancelliamo un file per errore o veniamo infettati da un ransomware il RAID non ci aiuterà mai e poi mai. Tutto ciò che non è leggibile sul primo supporto non lo sarà nemmeno sul secondo o sull’n-esimo.

Backup: tipologie e metodi per una corretta implementazione

Iniziamo con il ripetere alcuni punti fondamentali dei una corretta strategia di backup:

  1. Effettuare backup su supporti diversi ed affidabili: non utilizzare penne usb o hard disk portatili
  2. Impostare le copie con una frequenza adeguata alla velocità di modifica dei dati presenti
  3. Utilizzare soluzioni automatiche : non affidarsi alla propria memoria o peggio alla buona volontà dei collaboratori
  4. Analizzare bene i dati da custodire: non pensiamo solo ai file sul desktop ma anche alla posta elettronica, ai database, ai dati in cloud etc…
  5. Avere più copie di backup: per molte attività è addirittura un obbligo di legge. La singola copia (spesso effettuata su apparati che sono fisicamente vicini) non ci protegge da furti, atti vandalici, incidenti.
  6. Definire regole di conservazione ben precise e chiare: questo permette di sapere in ogni momento dove sono le copie che ci servono
  7. Simulare il ripristino dei dati: anche se progettato e implementato con cura, un sistema di backup è veramente efficace e sicuro se ci permette il “restore”. Sembra una banalità ma spesso, anche la semplice confusione fra incrementale e differenziale può riservarci brutte sorprese.

Diamo uno sguardo alle varie tipologie disponibili nella maggior parte dei software nati per questo scopo:

Backup Completo

Come lascia intuire il nome stesso è la copia di un intero sistema funzionante in uno o più momenti temporali. Un backup di questo tipo ci permette di ripristinare ogni singolo file presente sul nostro disco ma richiede più spazio e tempo per essere eseguito dato che per ogni copia è necessario un supporto con capacità pari, o leggermente inferiore, a quello di origine.

Backup Incrementale

Il backup incrementale permette di effettuare la copia dei soli file modificati dall’ultimo backup. In questo modo, ovviamente, le risorse hardware richieste sono decisamente inferiori ma per attenzione alla fase di ripristino. Per effettuare un ripristino completo dei dati sarà necessario, infatti, avere a disposizione un backup completo e tutti i backup incrementali fino alla data a cui si vuol riportare il sistema.

Backup Differenziale

Altra tipologia di backup che riduce, in modo minore, capacità di storage e tempo necessari all’esecuzione del processo di memorizzazione. Con questo tipo di backup vengono copiati solo i file modificati dall’ultimo backup completo. Un costo maggiore si traduce però in minori rischi di ripristino poiché saranno necessarie solo l’ultima copia completa e l’ultima differenziale per ripristinare interamente un sistema.

Non ho capito la differenza tra backup incrementale e differenziale

La differenza sostanziale sta nell’insieme di file che vengono considerati “modificati”. Nel primo caso a essere copiati sono solo i file modificati dall’ultimo backup (incrementale o completo) nel secondo tutti quelli modificati dall’ultima copia completa. Questa tabella compara i risultati di backup in un arco temporale di 5 giorni.

CompletoIncrementaleDifferenziale

Giorno 1 Tutti i file
Giorno 2 Tutti i file Tutti i file modificati dal giorno 1 Tutti i file modificati dal giorno 1
Giorno 3 Tutti i file Tutti i file modificati dal giorno 2 Tutti i file modificati dal giorno 1
Giorno 4 Tutti i file Tutti i file modificati dal giorno 3 Tutti i file modificati dal giorno 1
Giorno 5 Tutti i file Tutti i file modificati dal giorno 4 Tutti i file modificati dal giorno 1

Risulta evidente che il backup differenziale occuperà sempre più spazio e sarà sempre più lento rispetto all’incrementale ma, nel caso di ripristino saranno necessari solo le copie del giorno 5 e del giorno 1 per ripristinare interamente l’archivio.

Al contrario, il backup incrementale sarà più veloce ma saranno necessari tutti i backup per effettuare un ripristino completo.

Che tipologia di backup conviene scegliere?

Non esiste una soluzione unica e ogni azienda dovrebbe dedicare tempo a stabilire policy per effettuare in modo corretto e sicuro le copie di sicurezza. Non ci stancheremo mai di ripeterlo: il backup è la nostra unica vera protezione contro ransomware, guasti hardware ed errori, il RAID è un “passo successivo” per migliorare la disponibilità dei server e delle workstation ma non è un’efficace protezione per i nostri dati.

PCego offre servizi di consulenza per la pianificazione e il controllo dei backup. Le nostre soluzioni basate su hardware dedicato e di alta fascia permettono ai nostri Clienti di concentrarsi sul loro lavoro e di non avere brutte sorprese in caso di necessità.

Richiedi ora una consulenza