| 1- Sauvegarde sur disque, pour la flexibilité, la performance et la simplicité En dépit d’un coût au gigaoctet, d’une consommation électrique et d’une dissipation thermique plus élevées, la sauvegarde sur disque – aussi nommée D2D2 ou D2D2T3 – est désormais utilisée dans toutes les mises en œuvre de protection des données. La maturité de la technologie de disques SATA, disponible dans tous les système de stockage RAID, la progression continue de leur capacité – un téraoctet étant la plus forte capacité actuellement disponible – font du disque un support de sauvegarde fiable et abordable.
Parmi d’autres bénéfices, la sauvegarde sur disque améliore le taux de succès des sauvegardes en évitant les pannes liées aux bandes magnétiques et apporte une meilleure sécurité des données stockées, grâce à la protection RAID. En termes de performance, les disques sont plus flexibles et ajustables, même avec des productions journalières variables et des patrimoines d’information à protéger en perpétuelle évolution. Les disques offrent une fenêtre de sauvegarde plus déterministe. Autres avantages déterminants : les flux de sauvegarde concurrents, les sauvegardes et restaurations simultanées et l’accès direct à chaque bloc de données. La sauvegarde sur disque facilite la consolidation des équipements, tel que le partage d’un système disque entre plusieurs logiciels de sauvegarde ou la réutilisation d’un système de stockage existant pour stocker des données sauvegardées sur des disques économiques SATA. La virtualisation des librairies de bande magnétiques ouvre des opportunités supplémentaires de simplifications.
Deux options sont possibles pour mettre en oeuvre la sauvegarde :
- De classiques systèmes de stockages, en connexion DAS, SAN ou NAS. Tout logiciel de sauvegarde supporte désormais un stockage disque ; les différences majeures restant leur capacité à déplacer simplement les données entre disques et bandes.
- Librairies de bandes virtuelles. Ces systèmes disques émulant des librairies de bandes permettent une intégration totalement transparente, via un simple remplacement des librairies existantes. Optimisées pour les flux de données séquentiels, elles intègrent des technologies d’optimisation de la capacité, telles que la compression et la déduplication et peuvent décharger les serveurs des opérations de transfert de disque à bande ou de site primaire à site secondaire.
Les fonctions avancées des librairies de bande les rendent de plus en plus intéressantes. De leur côté, les systèmes disques classiques préservent les investissements en termes d’équipements et de compétences. Mais quelle que soit l’option choisie, il est désormais préconisé de garder sur disques de plusieurs jours à plusieurs semaines de sauvegarde et d’utiliser les bandes pour la sauvegarde de longue durée et l’externalisation.
Bull StoreWay propose tous les composants d’une solution de sauvegarde sur disques. StoreWay Optima 1200 – idéalement adaptés aux sauvegardes de type D2D – EMC CX, DMX et NetApp FAS sont tous disponibles avec des disques SATA 750 Go ou 1 To. StoreWay Virtuo est une VTL4 avec une connexion optionnelle à des librairies physiques, pour fournir de très hautes capacités à faible coût avec une remarquable efficacité énergétique. StoreWay Virtuo automatise totalement des tâches telles que le déplacement des jeux de sauvegarde de disque à bande, la duplication de médias et la réplication vers un site de secours. La suite StoreWay Calypso offre des solutions avancées de sauvegarde sur disque, avec des VTLs et des systèmes de stockage classiques et avec une gestion flexible et puissante de migration des jeux de sauvegarde de disque à bande, basée sur des règles de gestion du cycle de vie des données.
2- ‘Snapshots’, le nouveau niveau de récupération
Les ‘snapshots’ sont une technologie largement répandue pour créer des images quasi instantanées d’un jeu de données, sans provisionner la totalité de la capacité. Les ‘snapshots’ aident à résoudre les problèmes de fenêtre de sauvegarde, permettant une parallélisation de la production et des opérations de sauvegarde.
Depuis peu, les ‘snapshots’ sont utilisés directement comme un jeu de données permettant la restauration. Ce n’est pas une protection contre les pannes matérielles, mais c’est une réponse adaptée aux corruptions et aux suppressions de données : les causes les plus fréquentes de demande de restauration. La fréquence des sauvegardes peut devenir horaire, améliorant significativement le RPO5. Le RTO6 peut aussi être amélioré, les données étant disponibles en ligne.
Des améliorations récentes des meilleurs logiciels de protection des données, comme la suite logicielle StoreWay Calypso, fournissent une intégration parfaite des ‘snapshots’ dans les processus et le catalogue de sauvegarde, simplifiant et automatisant totalement l’usage des ‘snapshots’. Ce type de fonctions avancées permet de fournir des niveaux de service avec des RPO inférieurs à l’heure et des RTO en minutes, quasiment sans aucun surcoût d’administration.
3- Déduplication des données : la promesse de diviser le coût de la sauvegarde sur disque par un facteur de 20 à 50 !
La déduplication des données offre des ratios d’économie d’espaces impressionnants, comparée aux algorithmes de compression. L’efficacité de la déduplication repose sur la détection des informations redondantes. Par exemple, un fichier envoyé à plusieurs destinataires ou de multiples versions d’un document avec peu de modifications. Un autre scénario typique est la protection des données. Les sauvegardes journalières contiennent souvent des fichiers identiques ou très similaires à ceux du jour précédent. La déduplication détecte des suites de bits identiques, les stocke une fois, et utilise des pointeurs pour les occurrences suivantes. L’efficacité est donc clairement dépendante des données stockées. Et de ce point de vue, les sauvegardes offrent un très fort potentiel de déduplication.
Cette efficacité de stockage apporte de nombreux bénéfices :
- La sauvegarde sur disque devient plus économique, car il faut moins de capacité disque.
- La réplication des données vers des sites distants, principalement pour la reprise après sinistre, est plus efficace que jamais. Les séquences de bits dupliquées ne sont transmises qu’une seule fois sur le câble, permettant d’utiliser des liens de plus faible débit, sur des distances plus longues, avec bien sûr des réductions de coûts.
- Les processus de protection des données peuvent être simplifiés. Au lieu de tenter d’optimiser en mixant sauvegardes totales, partielles, incrémentales, les administrateurs de stockage peuvent réaliser des sauvegardes totales quotidiennes et déléguer au système de déduplication l’optimisation du stockage des données sauvegardées.
La déduplication est clairement positionnée comme une technologie permettant de garder de grands volumes de données sur disque, plus longtemps, avec un coût beaucoup plus faible que les solutions traditionnelles. D’un point de vue performance, c’est un compromis entre des solutions de sauvegarde sur disque de haute performance basées sur des systèmes de stockage classiques ou des VTLs sans déduplication et les sauvegardes traditionnelles sur bandes magnétiques ; la déduplication restant une opération nécessitant des traitements intensifs.
La déduplication des données est disponible dans plusieurs produits StoreWay, tels que la suite Calypso, le Centera d’EMC et le FAS de NetApp. Cette technologie étant très prometteuse, d’autres solutions de déduplication sont en cours d’évaluation.
4- Réplication des données, pour la reprise après sinistre de quelques minutes à quelques heures
Depuis des années, les systèmes disques peuvent répliquer des informations en temps réel, vers un site distant, permettant de reprendre une production dans des délais très brefs, tout en limitant les pertes de données à quelques transactions. La réplication fournit des jeux de données ‘crash-consistent7’ , permettant de redémarrer des applications sur un site de reprise comme si elles étaient redémarrées localement, après un arrêt non planifié d’un serveur.
Ce qui est nouveau et doit être pris en compte, c’est le niveau d’universalité atteint par cette technologie :
- La réplication est disponible du haut au bas de gammes des systèmes de stockage, pour des SAN, NAS, DAS et des disques internes.
- La réplication des données peut être mise en œuvre en dehors des équipements de stockage, soit au niveau des serveurs ou dans le réseau de stockage.
- La réplication synchrone peut être déployée au-delà des limites d’un campus, grâce au développement des technologies xWDM et des réseaux optiques métropolitains (MANs).
- La convergence entre le stockage et les protocoles IP simplifie l’interopérabilité. L’accroissement de la tolérance à la latence et aux pannes de liens permet de répliquer sur les réseaux longue distance de l’entreprise (WAN) ou d’utiliser les services IP d’un opérateur ou encore de répliquer sur de plus longues distances.
La réplication est appliquée à la fois aux données de production et aux jeux de données secondaires, comme la sauvegarde sur disque, via des systèmes de stockage classiques ou des VTLs.
Sans conteste, la réplication des données doit être revisitée et réévaluée en tant que remplacement des méthodes traditionnelles d’externalisation des bandes. Ce n’est plus une option pour fournir un service 24h/24h. Et même si le niveau de service est moins élevé, la réplication des données simplifie et sécurise considérablement les procédures de reprise. L’intégration avec des technologies de virtualisation serveur, telles que VMware offre une flexibilité sans précédent.
Bull a déjà déployé des solutions de réplication de données jusqu’à plusieurs centaines de kilomètres. Le portefeuille produits Bull StoreWay est riche en solutions de réplications : la suite Calypso, les systèmes disques FDA, Optima 5000, CX et DMX d’EMC, FAS de NetApp, l’’appliance’ de virtualisation SVC d’IBM (Vivo), la VTL Virtuo sont autant d’options de réplication disponibles.
5- Protection Continue de Données (CDP) : nouveau paradigme pour la protection des données
La CDP8 capture les changements en temps réel, sans interruption applicative et les sauvegarde sur un autre système de stockage. La CDP supprime les fenêtres de sauvegarde et fournit un RPO nul, sans perte de données. Les changements sont journalisés, permettant une reprise à n’importe quel moment dans le temps.
La prise en compte des applications par la CDP permet d’éviter l’inconvénient de redémarrer à partir d’un point de reprise ‘crash-consistent’ et non ‘application-consistent’9 . La coopération avec une application permet de mettre périodiquement les données dans un état consistant, ce point étant marqué dans le flux de réplication. Reprendre une application à partir de ces points identifiés est un compromis sur le RPO, lié à la fréquence de synchronisation applicative, mais améliore grandement le RTO.
En utilisant StoreWay Calypso, les administrateurs de stockage peuvent soit geler des points de reprise à la demande, soit opter pour un mode intégrant les applications, avec création automatique de point de reprises consistants pour l’application.
Elargir la vision StoreWay préconise une stratégie globale pour atteindre ou dépasser les engagements de niveaux de service, tout en minimisant les coûts. Elle est basée sur la classification des données et combine deux approches, préventive – « comment éviter de perdre des données » – et corrective – « j’ai perdu des données, comment les récupérer ? ».

Dans le volet préventif, Bull identifie deux domaines majeurs :
- Protection contre les pannes matérielles isolées, telles que les disques, les contrôleurs, les switches réseaux, les ports, les cartes HBA, etc.
- Archivage. Peut-être surprenant, mais Bull considère que l’archivage fait partie d’une stratégie préventive de protection des données. Préserver des données pendant une longue période est un véritable défi : identifier les information qui nécessitent d’être archivées, définir la durée de rétention, les niveaux de sécurité et d’authentification requis, classifier et indexer l’information de sorte qu’elle puisse être recherchée et retrouvée.
Dans le domaine correctif, on trouve :
- La récupération des données. Répondant aux pertes de données, la récupération des données restaure les données perdues à partir d’une copie. Les causes les plus fréquentes sont la suppression accidentelle, mais aussi les virus, les pannes logicielles et les pannes matérielles majeures.
- La reprise après sinistre. Elle est la déclinaison informatique d’un plan d’entreprise de continuité d’activité. Pour les systèmes informatiques, c’est typiquement le moyen de répondre à la perte d’un ‘Data Center’ complet, provoqué par des évènements tels qu’un incendie, une inondation, une panne électrique, un acte de terrorisme, des troubles sociaux, des épidémies, etc.
Un défi majeur pour les directions informatiques est de considérer ces quatre domaines comme les pièces d’un unique puzzle, celui de la stratégie de protection des données et de continuité d’activité et de ne pas les traiter comme des sujets indépendants. Les bénéfices sont mesurables. Par exemple, archiver des informations réduit le volume des données à sauvegarder chaque jour. Une mise en œuvre efficace de la protection contre les pannes permet une reprise fiable à partir de ‘snapshots’. N’hésitez pas à réévaluer votre stratégie avec les consultants Bull StoreWay.
Conclusion Les DSI devraient régulièrement réévaluer la mise en œuvre de la protection de leur patrimoine d’information et vérifier si elle est alignée avec les objectifs, souvent évolutifs, de gestion des risques de leur entreprise.
Les consultants stockage de Bull, les services professionnels et l’offre Bull StoreWay fournissent tous les ingrédients pour réaliser des solutions à l’état de l’art, parfaitement personnalisées et alignées avec les objectifs business de chaque projet.
1SNIA : Storage Networking Industry Association
2D2D : Disk to Disk. De disque à disque
3D2D2T : Disk to Disk to Tape. De disque à disque à bande
4VTL : Virtual Tape Library
5RPO : Recovery Point Objective. Métrique indiquant la perte de données acceptée.
6RTO : Recovery Time Objective. Délai de reprise.
7Crash-consistent. Etat des données correspondant à un crash système. L’ordre des écritures est identique à la visibilité qu’en a l’application.
8CDP : Continuous Data Protection
9Application-consistent. Etat de données consistant du point de vue applicatif
|