Document sans nom
NL
Solutions-magazine

Rechercher




Et maintenant dédupliquez!

Rédigé par La rédaction le Mardi 24 Juin 2008
Lu 510 fois

La capacité de réduire un flux de données de 20 à 30 fois va être très utile pour réduire le coût de stockage.



Et maintenant dédupliquez!
Le Virtualisation Engine TS7530, la nouvelle bibliothèque de bandes virtuelles d’IBM, commercialisée officiellement depuis le 8 juin, ne propose pas les avantages de la déduplication. Trop tôt, estime «Big Blue». Malgré des avantages évidents, la technologie ne serait pas encore suffisamment stable, ni même assez performante. Pour réduire le poids des données stockées, IBM a préféré la compression matérielle avec un ratio de l’ordre de 2:1 contre les 20:1 généralement obtenus avec la dé¬duplication. L’Histoire dira si «Big Blue» a eu raison d’être aussi prudent…

A l’opposé, NetApp a été le premier constructeur à intégrer directement la déduplication dans un équipement de stockage et non sur un serveur dédié. C’est aussi la première fois que la technologie est exploitée sur une baie de stockage primaire et non dans un processus de sauvegarde.

Déduplication? Sous ce terme se cache une technologie plutôt simple à comprendre dans son principe puisqu’elle consiste à factoriser des séquences de données identiques afin d’économiser drastiquement l’espace de stockage sur les baies de disque. D’une certaine façon, la déduplication est une nouvelle extension des technologies de compression bien connues dans le monde informatique (comme les zip, bzip2, gzip), avec la capacité à fonctionner de façon beaucoup plus dynamique que les logiciels d’archive traditionnels.

Que l’on associe la déduplication aux VTL (Virtual Tape Library) ou que l’on y vienne après une première expérience de sauvegarde sur disques, peu importe. Les motivations sont souvent les mêmes: faire face à une augmentation du volume de données à protéger, souvent de 30% par an. Ainsi, pour un même besoin, l’espace disque nécessaire sera moindre. Les avantages de l’opération sont doubles. Au niveau des coûts: réduction des frais d’acquisition ou mises à niveau plus espacées des capacités de stockage. Au niveau de la gestion: stockage d’un plus grand nombre de données par unité, ou rétention des données en ligne sur de plus longues durées.

De là, d’autres sources d’économie: une consommation d’électricité réduite, une utilisation de mètres carrés diminuée et une mise en place d’infrastructures de refroidissement plus légère. Au final, les organisations bénéficient de coûts d’administration de stockage faibles et d’une réduction du coût de possession global.

L’essor sera rapide, garantissent les analystes. Pour preuve, la consolidation du secteur. A quelques mois d’intervalle, EMC a racheté Avamar, Hitachi Data Systems a repris Archivas, Adic -racheté ensuite par Quantum- s’est emparé de Rocksoft, Symantec a hérité des technologies de Datacenter Technologies acquises par Veritas et IBM, enfin, a mis la main sur Diligent. De son côté, FalconStor a développé sa propre technologie SIR. Et NetApp la sienne, ASIS, désormais embarquée dans tous ses équipements de stockage.

Pour NetApp, en particulier, le succès a été immédiat: plus de 3.500 systèmes installés et un espace de stockage total de plus de 100 PB (pétabytes), Aujourd’hui, NetApp est le seul fournisseur de solutions de stockage à permettre la déduplication dans plusieurs environnements -sauvegarde, archivage, stockage légal, données primaires.


Pourtant, si cette technologie est source d’économies, elle a aussi sa part d’ombre: alors qu’on connaît avec précision la capacité d’un disque dur, il en va différemment pour le taux de réduction. En effet, celui-ci est tributaire de la nature des données et de la politique de sauvegarde. Pour des documents bureautiques, le taux de réduction initial sera important; il le sera moins avec une base de données dont le niveau de redondance est inférieur. Ensuite, la progression dans le temps dépend du niveau de modification des données au quotidien.

Bref, constate NetApp, tout dépend du jeu de données et de la quantité de doublons qu’il contient. C’est un peu flou. N’empêche: les économies sont réelles. L’éditeur d’ASIS cite l’exemple d’un groupe international dans le secteur du gaz et du pétrole qui a réalisé une économie d’espace de 35% pour le stockage de ses répertoires personnels. Autre exemple, ce fabricant d’appareils de tests et de mesures qui a réalisé une économie d’espace de 98% sur ses sauvegardes quotidiennes de bases de données…

La déduplication est une technologie en devenir. Aujourd’hui, on l’exploite pour la sauvegarde -autrement dit pour optimiser leur espace disque. Mais, comme le démontre FalconStor, la technologie peut fort bien s’inscrire dans les plans de secours sans manipulation de supports physiques. De fait, pour éloigner les sauvegardes du site principal sans manipuler de bandes, des données de taille réduite transitent plus facilement d’un point à un autre, par des liens réseaux.