Extraire la valeur du chaos!Jeudi 7 Juillet 2011
Des ordres de grandeur qui dépassent l’entendement. Si l’on atteindra 1,8 zettaoctet au terme de cette année, il s’agit de penser prioritairement à la valeur que ces données peuvent générer. A une démarche opérationnelle, jusqu’ici centrée sur le coût du stockage, il est temps de privilégier une approche stratégique, conseille Geert Van Peteghem, General Manager, EMC Belgium-Luxembourg.
Cette année, 1,8 zettaoctet de données seront produites et répliquées. Ca ne vous dit rien? 1,8 Zo équivaut à 1,8 millier de milliards de Go. Ou le stockage de 113 milliards d’iPad de 16 Go réunis. Ou encore 200 milliards de films HD de deux heures...
Et rien n’indique que notre production gargantuesque de données va s’arrêter. Au contraire. IDC prévoit que le nombre de fichiers numériques grossira de 75% durant la décennie à venir. D’ici la prochaine décennie, la quantité de données gérées par les entreprises pourrait être multipliée par 50 et la taille des fichiers par 75. Ces résultats ont un impact technologique, social et économique décisif. «D’un côté, on pourrait se dire que la technologie répond à la demande, analyse Geert Van Peteghem. Aujourd’hui, en effet, les nouvelles technologies destinées à ‘apprivoiser l’information’ -création, capture, gestion et stockage de l'information- sont six fois moins onéreuses qu’en 2005. En même temps, les investissements consentis par les entreprises dans l’’univers numérique’ aussi bien technique qu’humain augmentent de 50% par an. Il y a donc un problème...» Un problème humain et non pas matériel. IDC est formel: les compétences, l’expérience et les ressources affectées à la gestion du déferlement des données et des ressources ne vont pas suffire à faire face à tous les secteurs de croissance. D'ici à 2020, les départements informatiques du monde entier connaîtront: une déferlante de serveurs (virtuels et physiques), qui seront 10 fois plus nombreux; un accroissement du volume d'information à gérer, qui sera 50 fois supérieur; une avalanche de fichiers ou de conteneurs, 75 fois plus nombreux qu’à l’heure actuelle. Les fichiers et conteneurs enregistreront ainsi une croissance plus rapide encore que celle de l'information elle-même, en raison de la démultiplication des systèmes intégrés, tels que les capteurs dans les vêtements ou le matériel médical, pour ne citer que ces exemples. «En revanche, l’effectif de professionnels informatiques dédiés à la gestion ne progressera pas plus de 150%, enchaîne Geert Van Peteghem. Aussi, il s’agit de repenser sérieusement notre façon de créer, gérer et exploiter l’information...»
La démarche dépasse les technologies. Même si des progrès considérables ont été réalisés. «Aujourd’hui, par exemple, il existe des technologies de gestion automatique des classes de services. Les données peuvent être migrées par la baie entre des noeuds à haute performance et des noeud plus lents, mais à haute capacité selon les politiques définies par l’administrateur. Avec Isilon, nous proposons des noeuds rapides à base de disques SSD, des noeuds équipés de disques SAS et des noeuds plus capacitifs à base de disques SATA. La question du cycle de vie des informations est donc réglée. A condition de le vouloir. Je veux dire par là qu’il faut, au départ, s’investir. Dans les faits, on observe que 80% des données de nos entreprises restent inactives; elles demeurent dans les systèmes de production venant paralyser les performances.»
Quand se défaire de ses données? La question de la fin de vie des données -moult fois posée- est aussi importante que la façon de les générer et de les exploiter. Or, nous avons la manie des greniers, comme le note avec humour Geert Van Peteghem. «On conserve tout. Pis! dans l’environnement numérique, on a tendance à multiplier les copies. Songez à toutes ces copies de présentations en PowerPoint qui ne servent strictement à rien... Dans une institution financière, où nous effectuions un audit, nous avons comptabilisé 24 copies d’une même chanson de Britney Spear sur un SAN! Anecdotique, direz-vous? Si l’exemple prête à sourire, on peut s’interroger: dans un environnement ICT que l’on veut durable, n’est-ce pas l’illustration d’une véritable gabegie?»
De toute évidence, le stockage est appelé à évoluer. Nous entrons dans l’ère du «Big Data». Dans un environnement foisonnant d'une masse sans cesse plus dense d'informations brutes, il s’agit de collecter, stocker, puis interroger en quasi temps réel un puits de données directement exploitables et orientées «usage». La technologie le permet: Cloud Computing, bases de données de nouvelle génération, architecture de type MapReduce, etc. Et Geert Van Peteghem de commenter: «A la différence des solutions décisionnelles traditionnelles, le Big Data apporte une donnée 'chaude', certes moins structurée, mais avec un niveau de détail tel qu'il permet d'isoler et d'analyser, au cas par cas, chaque transaction et événement... C’est une révolution qui s’annonce. Pour en profiter, il est urgent de préparer le terrain!»
Avec le Big Data, les informations changent de statut. Elles deviennent une ressource. Les entreprises doivent planifier de manière efficace et savoir allier stratégie, logiciel et matériel informatique pour éviter le «tsunami de données». Outre les nouvelles données qui sont générées tous les jours, les politiques internes strictes et les réglementations de rétention de données alimentent cette multiplication des données. Le cloud est-il une solution? Oui. Mais c’est aussi un risque: celui d’exploiter inutilement de la capacité tout simplement parce qu’elle est disponible, prévient Geert Van Peteghem. On l’a vu avec la virtualisation des serveurs. On les crée tellement facilement qu’on a tendance à les multiplier... «Chez EMC, nous avons décidé d’intégrer Salesforce.com en interne. En le faisant, on s’est rendu que ce service était déjà utilisé par certains de nos salariés, qui avaient pris l’initiative de l’introduire sans en avertir le département IT. C’est symptomatique. Imaginez que certains départements exploitent Amazon, d’autres Office 365, d’autres encore Salesforce.com. Tous, je l’imagine, ont de bonnes raisons pour le faire. Mais, in fine, où sont les données? Qui les contrôle, les valide? Quel est leur niveau d’intégrité, de fiabilité? Certes, le cloud ne manque pas d’avantages. Mais il réclame une stratégie.» IDC estime que, d’ici 2015, près de 20% des informations seront, d’une manière ou d’une autre, «traitées» par des fournisseurs de services de Cloud Computing. Par là, il faut entendre qu’entre la création et la destruction d’un octet, ce dernier sera, à un moment ou à un autre, stocké ou traité dans un cloud. Il se peut même que jusqu’à 10% de ces informations soient stockées dans un cloud. «Il faut extraire la valeur du chaos, conseille Geert Van Peteghem. Ne plus considérer le stockage sous l’angle opérationnel, mais le considérer de façon stratégique... Le stockage sort de la sphère du CIO. C’est le CEO qui doit décider de la criticité de ses données, de leur valeur. Et donc de l’importance à leur donner. La puissance de l’entreprise, aujourd’hui, vient de sa capacité à pouvoir extraire de la valeur de ses données, d’où qu’elles viennent.» Comment extraire la valeur du chaos
• Mettre en œuvre les nouveaux outils de capture, de recherche, de découverte et d’analyse permettant de mieux appréhender les données non-structurées, ces informations qui représentent désormais plus de 90% de l’univers numérique. Ces outils sont capables de créer automatiquement des données sur les données, de la même façon que la fonction de reconnaissance faciale permet de marquer ses photos sur Facebook. Les «métadonnées» se multiplient deux fois plus rapidement que l’ensemble de l'univers numérique.
• Exploiter les outils d’intelligence pour le traitement de données en temps réel puisqu’ils proposent de multiples applications possibles: déterminer la prime d’assurance automobile due en fonction de la zone où circulent les conducteurs, acheminer l'énergie au sein d’un réseau intelligent ou encore modifier «à la volée» les messages publicitaires en fonction des réactions des internautes sur les réseaux sociaux. • Adopter les nouveaux outils de gestion du stockage. Ils permettent de réduire les coûts de la sphère de l’univers numérique dans laquelle nous stockons les données par déduplication, auto-hiérarchisation ou virtualisation. Ces outils proposent également des fonctionnalités décisionnelles afin de choisir les données à stocker, à l’instar des solutions de gestion de contenu. • Privilégier les nouvelles pratiques et les outils innovants de sécurité pour identifier les informations à protéger et déterminer le niveau de sécurité requis et ce quel que soit le moyen utilisé: systèmes et logiciels de protection élaborés pour contrer des menaces spécifiques, services de protection de la réputation ou encore systèmes de gestion des fraudes. Dans la même rubrique :
|
|
|
|
|






Le nouveau visage du cybercrime




