En trame de fond, une sauvegarde défaillante ….
Le contexte de notre client concernait 30 à 50 sites de type « ROBO » équipés de serveurs hors maintenance et obsolètes, avec différentes versions hors support d’ArcServe pour la sauvegarde, utilisant des media disparates (ex : NAS type home Office, Lecteur LTO, Robotique LTO,…), eux aussi sans support, et une externalisation des sauvegardes peu maitrisée.
Le client rencontrait un fort taux d’échec sur ses sauvegardes dont le seul indicateur était une « backlog » importante de tickets concernant les pannes récurrentes de ces systèmes de sauvegarde.
Le CTO ayant donné pour directive l’utilisation exclusive des solutions Office 365 (Groups et One Drive), la refonte de l’infrastructure en place n’a pas été identifiée comme nécessaire.
… avec des contraintes fortes
Cependant, le manque d’adhésion des utilisateurs aux solutions de stockage Office 365 – les raisons les plus souvent évoquées étant la bande passante limitée du réseau, les contraintes de la réglementation RGPD, la défiance vis-à-vis des solutions cloud et les contraintes de conservation des fichiers après la suppression des comptes utilisateurs – a finalement amené la DSI à reconsidérer le remplacement de ces solutions de sauvegarde sur les sites distants.
De plus, l’usage intensif de solution NAS de type Home Office (QNAP, Synology, Iomega, …) et la multiplication des serveurs physiques hors maintenance nous a conduits à proposer une refonte du modèle d’architecture des sites « ROBO ».
Le client nous a donné son accord de principe tout en insistant sur les contraintes fortes suivantes :
- Un CAPEX/OPEX de l’ordre de 5K€ sur trois ans par site. (Hypothèse retenue : 20 sites à distance au démarrage, avec un site en central)
- Une solution adaptable aux contraintes physiques des sites (présence ou non de locaux techniques),
- Une solution compatible avec les usages RGPD.
C’est dans ce contexte que nous avons proposé au client une architecture sur site faiblement redondante (du fait de la contrainte budgétaire) mais avec une potentialité de reprise d’activité simple et rapide pour palier à la redondance limitée.
C’est la solution Cohesity que nous avons retenue comme pierre angulaire de cette architecture. Le positionnement de cette solution comme acteur du stockage secondaire (intégrant sauvegarde et NAS pour des données de type bureautiques) nous a paru pertinent dans ce contexte.
Cohesity, késaco ?
La solution Cohesity permet de répondre à quatre besoins essentiels :
- Fournir un service de fichiers aux utilisateurs locaux,
- Assurer la sauvegarde des services de fichiers et des machines physiques / virtuelles,
- Assurer l’automatisation de l’externalisation de la sauvegarde vers le site central ou le Cloud (S3) via le WAN,
- Permettre une reprise d’activité rapide sur un site central en cas de sinistre, pour les fonctionnalités de NAS et les VMs.
L’objectif étant de virtualiser toutes les fonctions et services présents sur chaque site, nous avons proposé une architecture basée sur l’usage d’un hyperviseur standalone permettant l’exécution de trois à cinq VMs, dont la VM Cohesity.
Dans ce cas de figure, Cohesity est la brique d’architecture répondant aux besoins Sauvegarde (avec externalisation), NAS et PRA.
La fonctionnalité de Cohesity permettant la sauvegarde d’un système de fichiers NAS et la possibilité de prendre en charge sa reprise après sinistre a été un élément capital dans la cinématique de migration des infrastructures NAS hétérogènes.
Avec Cohesity , les données NAS à la source sont sauvegardées sans agent et cette sauvegarde est transformée en partages NAS (nommés « Views ») en quelques clics seulement.
Déploiement de la solution
Un POC a été réalisé sur un site en Italie avec une volumétrie significative (1,8 To), en utilisant la méthodologie suivante :
1. Mise en place d’une sauvegarde avec une granularité horaire de la source.
- Cohesity fonctionne en mode incrémental perpétuel et une mise en place de point de sauvegarde réguler est donc préférable. De ce point de vue Cohesity change l’approche de la sauvegarde classique sur base calendaire
2. Synchronisation des données sauvegardées vers le cluster sur le site central
- La synchronisation a été réalisée en moins de trois jours sur un lien WAN à 10 Mb/s (QoS basse pour le flux de synchro).
3. Conversion du dernier point de sauvegarde en partage NAS
4. Modification des GPOs concernant le mappage des disque partagés
5. Arrêt des partages à la source
Cette cinématique de migration s’est révélée simple et rapide à mettre en œuvre.
En regard de la facilité de mise en œuvre, le POC a été élargi à la sauvegarde des clusters Simplivity locaux (principalement pour la sauvegarde à rétention longue et le PRA). Une nouvelle fois, le support natif des API VMware a permis une mise en œuvre simple de la sauvegarde des environnements virtuels, avec une externalisation aisée et rapide des VMs hébergées sur les clusters Simplivity de cinq sites français (bande passante de 20 à 30 Mb/s par site).
Le coût d’un cluster Simplivity étant considéré comme prohibitif uniquement pour la fonction de sauvegarde, l’usage de Cohesity a été adopté à la suite de ce test.
En parallèle, la mise en place de la supervision de la solution Cohesity via Centreon s’est avérée très facile grâce à l’usage de l’API REST native.
Quels résultats ?
Voici le bilan après plus d’un mois d’exploitation:
- La simplicité de mise en œuvre de la solution et de son exploitation est évidente, la solution permet le pilotage,
- Cohesity permet un changement d’approche de la sauvegarde en se libérant d’usages traditionnels peu adaptés,
- Même si le reculreste limité à ce jour (3 mois), Cohesity se présente réellement comme une solution de type « Plug and Forget » du point de vue de sa fiabilité.
Cohesity, une solution d’avenir pour la sauvegarde ?
Cohesity est une solution innovante et performante dans le domaine du stockage secondaire. Elle peut être à la fois concurrente et complémentaire des solutions NAS classiques et des solutions de PRA.
Elle est aussi une alternative aux solutions de sauvegarde « historiques » en offrant une plus grande souplesse et efficacité d’usage, dans une enveloppe budgétaire réduite.
Cohesity doit certainement trouver sa place dans de nombreuses infrastructures de SI, pour un ou plusieurs usages.
A noter que l’utilisation d’algorithme de MAP/Reduce pour l’indexation et la déduplication des données a deux effets bénéfiques sur les sauvegardes et le stockage des données de type NAS :
- Un taux de déduplication très élevé (1:6 vs 1:2 sur NetApp avec un jeu de données similaire)
- La création de requête REST sur les données, typiquement dans le cadre d’une recherche de conformité RGPD. L’outil permet en effet la recherche sur des chaînes de caractères indexées dans les fichiers (ex : numéro de sécurité sociale, de carte bleue) et permet par exemple d’identifier les données éligibles à la suppression ou à l’anonymisation.
Les points faibles de la solution Cohesity sont la lisibilité de la gamme matérielle, notamment liée aux partenariats HPE et Cisco, le manque de diversité des appliances en fonction des besoins (ex : entrée de gamme, performances élevées, …), le faible nombre d’applications disponibles en mode Market (le produit est encore jeune) et le rythme soutenu de développement de fonctionnalités et de mises à jour qui sera un plus pour les adeptes du DevOps mais inquiètera les plus « conservateurs ».