Données secondaires : où en êtes-vous ?

Oct 26, 2021 | Data Intelligence | 0 commentaires

Près de 80 % de la capacité de stockage d’une entreprise typique sont consommés par des données dites secondaires. Comment les gérer ?

D’un côté, les données actives, utilisées dans les logiciels, par exemple les données comptables de l’exercice en cours. D’un autre, les données stockées, dont on estime qu’elles représentent 80 % du total. Celles-ci sont réparties entre les sauvegardes, les archives, les partages de fichiers, les bibliothèques d’objets ou, encore, les données d’analyse. On les nomme données secondaires. Ou froides.

Ce type de stockage offre un accès moins rapide aux données, mais bien moins cher et plus efficace. Cohesity est un des spécialistes du domaine. Récemment, Gartner l’a distingué, le positionnant comme «leader» de son fameux Magic Quadrant ! Labgroup représente Cohesity au Luxembourg. Et travaille aujourd’hui sur des chantiers importants, notamment auprès d’un des Big Four.

La problématique de la donnée dans son ensemble

Dans la plupart des organisations, les données sont stockées dans une logique de silo. Chaque métier, mais souvent aussi chaque acteur, crée son propre système de conservation des données qui lui est utile.

Cette prolifération continue et incontrôlée des données constitue ce mal nouveau qu’on nomme fragmentation massive des données, explique Cohesity. Or, cette fragmentation massive pose cinq problèmes aux organisations :

– la duplication des données et donc le coût, financier et environnemental des espaces nécessaires;

– la dispersion des données qui, ne se parlant pas, font très certainement manquer à l’entreprise des opportunités d’innovation, de résolution de problème ou d’identification d’opportunités;

– la sécurité des données (qui dit multiplication des bases de données dit multiplication des failles potentielles);

– la gestion des versions des documents en circulation, voire le contrôle des versions autorisées et des versions non autorisées des documents de référence;

– la multiplication des protocoles de recueil, d’archivage, d’autorisation, de sauvegarde, de gestion des versions…

« De là l’importance à prendre en charge la problématique de la donnée dans son ensemble, observe Labgroup. Qu’importe où qu’elle se trouve. Qu’importe, aussi, la fonction qui en est à l’origine… Il est donc d’opérer la réconciliation des données ! »

Oser appuyer sur le bouton «supprimer»

Cohesity apporte deux avantages fondamentaux :

l’unification des données, et donc la déduplication des données et la mise en place d’un protocole unique pour les recueillir, les archiver, les rechercher, les échanger ou les protéger;

la réduction du poids des données, notamment grâce à une gestion avancée des versions.

« Si le rythme actuel de croissance des données perdure, tôt ou tard, vous serez confrontés à la nécessité d’effacer les archives devenues superflues. Si vous arrivez à dépasser le premier verrou psychologique, celui d’appuyer enfin sur le bouton supprimer, encore faudra-t-il être sûr de le faire pour les bons ensembles de données », explique-t-on chez Labgroup. 

De la même manière que l’objectif ultime de la sauvegarde est la restauration, l’objectif de l’archivage est la consultation. C’est cette finalité qu’il faut avoir à l’esprit. En clair, la condition pour faire les bons choix lors de l’évaluation d’une solution de conservation des données. Mobilité des données, ouverture des formats et des supports, traçabilité sont les maitres mots de la réussite dans ce domaine. 

« Idéalement, avant d’en arriver là, vous aurez mis en place une solution permettant un recensement exhaustif de vos données à travers l’intégralité de vos et une traçabilité impeccable de la date de péremption de vos données. Une bonne solution d’archivage des données doit vous permettre d’avoir un contrôle sur le volume total qu’elle occupe. Et donc une visibilité et une lisibilité de son contenu. Même si vous n’êtes pas limités par la technologie, il est vraisemblable que votre budget, lui, soit fixe, voir diminue avec le temps. Être en capacité de purger vos données vous permettra de réduire la facture, quels que soient les choix que vous aurez faits sur les aspects précédents. »

Cohesity… ou comment accéder au DMaaS

Avec Amazon Web Services, Cohesity a lancé récemment la première solution de DMaaS (Data Management-as-a-Service). Unique, elle offre aux clients un moyen radicalement simple de sauvegarder, sécuriser, gouverner et analyser leurs données, le tout géré directement par Cohesity et hébergé sur le premier cloud public.

Avec le DMaaS, l’équipe IT n’a plus à se préoccuper des questions d’infrastructure. Le provisionnement se fait en quelques minutes. Quant au coût, il est proportionnel aux ressources de stockage consommées.

Autre scénario, une gestion par Cohesity, qui sélectionne avec son client le de sa . Cohesity prend alors en charge les couches de l’infrastructure et leur intégration pour produire un service SaaS. Dernière option, la collaboration avec les partenaires et fournisseurs de service de Cohesity, qui fournissent alors une offre de services managés. Là, il s’agit d’un package clés en main. Notons que l’ensemble de ces scénarios peut être mixé.

Réconcilier les données des évolutions successives

Pour réduire le poids des données, Cohesity développe une approche innovante de l’archivage. En effet, quand par exemple un document évolue de version en version, la méthode classique d’archivage documentaire consiste à conserver chaque version dans son intégralité.

Cohesity ne fonctionne pas selon ce principe. Ainsi, seules les modifications sont sauvegardées en plus de la version initiale. Ce qui fait que le poids est minimalisé.

Si l’on souhaite par exemple consulter la version 7 d’un document, la plateforme va réconcilier les données des évolutions successives en substituant dans la version originale uniquement les parties modifiées.

Toujours selon Labgroup, « un autre avantage de la plateforme Cohesity est de gérer, au choix de l’entreprise, les données sensibles, comme les données non conformes du point de vue du GDPR, celles dont la conservation pose un problème de sécurité, voire celles dont la conservation pourrait poser un problème de réputation à l’entreprise. »

Concrètement, Cohesity détecte les conservations qui paraissent devoir être arbitrées et informe l’administrateur. Ce qui est unique sur le marché.