Little Data, Big Impact. Provocation ou bon sens?

Tout est devenu «big» -y compris l’ICT Spring dont l’édition 2014 a connu un succès plus important encore. Reste à savoir si l’adjectif «big» se justifie. On évoque le plus souvent le Big Data dans le contexte des grands groupes qui génèrent des montagnes de données, alors que cette tendance à la croissance des données vaut pour les entreprises de toute taille. Et même si les volumes passent de 5 To à 10 To, au bout du compte, ça ne fait toujours qu’un doublement de données à gérer. La question ne porte pas sur l’importance du volume des données, estime David Rich, Senior Vice President Information Services, Mastercard Advisors.

De fait, nous n’avons pas à analyser toutes les données en même temps -ce qui veut dire, encore, que le volume total dans le système d’information n’est pas le critère principal. Souvent, d’ailleurs, c’est en analysant de petites quantités de données ou en les combinant avec des données externes que l’on obtient le résultat voulu. Et David Rich de parler, lui, de «Little Data» au «big impact»!

Etrange dichotomie! Mais ,à y réfléchir, raisonnement exact, logique même. De fait, ce dont nous avons besoin en Big Data, ce n’est pas de volume, mais de pouvoir extraire de la montagne les pépites qui nous intéressent. Comme le font remarquer les experts, les données ne sont pas des diamants, elles sont la mine!

Vu sous cet angle, le Big Data consiste à stocker des données en ayant la capacité d’extraire les informations utiles pour les transformer en actions visibles sur le terrain. «Ce qui revient à séparer les signaux du bruit», explique David Rich.

Dans son ouvrage «The Signal and the Noise», l’écrivain et statisticien Nate Silver insistait déjà sur ce constat: l’analyse de données révèle souvent beaucoup plus de bruit que de signal.

«Nous cherchons en permanence du signal dans le monde qui nous entoure: des relations de cause à effet, des clés pour réussir, bref, des patterns. Et souvent, nous prenons pour du signal ce qui n’est que du bruit. Dans l’illusion de compétence, nous prenons pour de la compétence ce qui relève de la chance.»

David Rich en est convaincu: nous nageons dans les données, sans jamais étancher sa soif. Pourtant, chaque problème n’exige pas nécessairement une quantité indénombrable de données. Dans certains cas, tel lot de données est plus utile que tel autre. Il est donc au moins aussi important de connaître la nature du problème à résoudre et le résultat que l’on souhaite atteindre à l’aide des données disponibles.

La clé? Déstructurer les gros volumes jusqu’à obtenir de plus petits ensembles de données. Les octets pertinents ainsi isolés forment le «little data». Ensuite, distinguer les données qui sont nécessaires de celles qui ne le sont pas. Il est en effet évident que nous n’avons pas besoin de tous les types de données de la planète. Il nous est ensuite aisé de les rendre plus digestes en recourant aux technologies modernes et en collaborant avec des experts. Est-il nécessaire, par exemple, de conserver tout ce qui se dit dans les médias sociaux à propos de votre entreprise? N’est-il pas plus utile de faire procéder à une analyse pour savoir dans quelle mesure elle est appréciée?

Et David Rich de conclure par ces trois conseils: bien comprendre le problème que nous voulons solutionner, savoir exactement ce que nous cherchons et, enfin, disposer des bonnes technologies et des meilleurs outils d’analyse.