A mesure qu’elle recouvre de nouveaux domaines au sein des entreprises, l’informatique décisionnelle met en évidence le rôle fondamental de la qualité des données dans les processus qui sont mis en œuvre. Quel que soit le secteur d’activité, marchand ou non marchand, voire public, il est primordial de pouvoir mesurer cette qualité, l’améliorer et, bien entendu, la piloter.
La qualité des données est un facteur critique de succès de tout projet décisionnel. Imaginez que pour un même client le système d’information contient deux ou plusieurs noms et adresses différents, les conséquences sur les processus ne peuvent être sous-estimées. Une campagne de marketing, par exemple, s’avèrera inefficace si une seule offre est envoyée plusieurs fois à la même personne. Par conséquent le «return on investment» ne sera pas correct.
Les dommages de la non-qualité des données ne sont évidemment pas limités à une action, ils peuvent perdurer. On le constatera lors de la migration ou de la mise en place d’un nouveau référentiel. Le système d’information risque tout simplement d’agréger des erreurs et d’amener l’entreprise à perdre confiance dans les informations qu’elle produit. C’est d’autant plus pénalisant que cette défiance ne concerne pas uniquement les chiffres, mais les indicateurs de tendances. Concrètement, des données de mauvaise qualité peuvent amener l’entreprise à prendre des décisions contraires à ses intérêts.
Multiples raisons, lourdes conséquences
La mauvaise qualité d’une donnée peut avoir diverses origines. Elle peut être obsolète -le client a déménagé; incomplète -un champ n’est pas renseigné;
aberrante -la valeur de l’âge est fausse; double -le même client est enregistré avec trois identifiants différents…
D’autres causes peuvent être trouvées dans les processus et systèmes de gestion de l’entreprise: données externes de mauvaise qualité, manque de contrôle en amont sur les données saisies dans les systèmes de gestion, incident de transfert d’une partie des données dans le processus de collecte des informations, retard dans la mise à jour des informations, hétérogénéité des systèmes de codification, multiplicité des règles de calcul dans les systèmes de gestion, saisies multiples dans plusieurs systèmes de la même entité…
Restent les conséquences. La mauvaise qualité des données peut remettre en cause la production des indicateurs de performance, décrédibiliser le système d’information et même générer des pertes financières (dans le cas des campagnes marketing), sans parler de l’image de marque de l’entreprise qui risque d’être ternie.
Pour améliorer la qualité des données, un projet de correction s’organise en phases sous forme d’un cycle itératif:
- profilage et analyse de la qualité des données variable par variable,
- procédures de correction en amont sur les système opérationnels,
- correction de la qualité des données injectées dans le système décisionnel,
- contrôle continu de la qualité des données.
Qualité des données, l’affaire de tous
La donnée doit être profilée afin de valider son adéquation par rapport aux règles et aux attentes de l’entreprise. De même, il est impératif de la standardiser pour réaliser des consolidations avec des référentiels internes et externes. Enfin, il s’agit d’effectuer une veille permanente prenant en compte le caractère volatil de la donnée.
L'expérience montre que cette qualité ne peut être garantie que si tous ceux qui produisent des informations en sont convaincus, depuis la direction générale jusqu'à l'ensemble des intervenants dits «opérationnels».
Par définition, l'enjeu va au-delà des attributions traditionnelles des gestionnaires de systèmes d'information: les projets liés à la qualité des données doivent impérativement être portés et soutenus par l'ensemble des responsables de l'entreprise.
Pour faire en sorte que l’IT et le business travaillent ensemble pour améliorer la qualité des données, il faut une solution qui réponde à deux exigences:
- la convivialité afin que les décideurs puissent implémenter leurs propres règles de qualité;
- la possibilité pour l’IT d’intégrer la qualité des données dans tous les systèmes informatiques de l’entreprise.
Précurseur de l’analyse (profilage), de la correction et de la gestion de la qualité des données, SAS propose deux produits reconnus qui répondent à ces exigences:
°
SAS Data Integration Server pour détecter les différentes sources de mauvaise qualité à travers des alertes automatiques intégrées dans le traitement ETL.
°
SAS Data Quality pour analyser la qualité des données, mais aussi standardiser des codifications hétérogènes sans aucune programmation, dédoublonner des enregistrements à partir de champs de type texte (comme le nom ou la raison sociale), éliminer les doublons et choisir les données correctes. SAS Data Quality est livré avec un Quality Knowledge Base (QKB), un repository qui contient des règles adaptées à une certaine langue et un certain pays et dans lequel l’utilisateur peut ajouter de nouvelles règles personnalisées.
La qualité, source de compétitivité
Aux Pays-Bas, DSM, entreprise internationale spécialisée dans les sciences de la vie et la chimie des matériaux, s’appuie sur SAS Data Quality pour cataloguer automatiquement ses achats en utilisant la classification eCl@ss et améliorer ainsi le suivi et l’analyse des coûts. En Belgique, dans la phase de migration de ses systèmes «legacy» vers SAP, le groupe SNCB a mis en œuvre SAS Data Quality pour identifier les sources d’erreurs, mais aussi standardiser les codifications et analyser la qualité globale de ses données.
Comme ces entreprises, faites confiance à SAS. Soyez conscient que la question de la qualité des données se pose avec d'autant plus d'acuité que les volumes à traiter augmentent et que les applications tendent à se diversifier. De même, la question de la qualité des données sera d’autant plus sensible à l’avenir que les pressions réglementaires et les exigences de contrôle interne vont croître.
Véritable enjeu, la qualité des données s'étend à tous les types de données recueillies: celles relatives aux fournisseurs, aux produits, et plus généralement, à tout le spectre des applications décisionnelles. Elle est désormais source de compétitivité. Ainsi, la qualité des données va au delà de la simple répercussion financière, elle influe en particulier sur la perception que vos clients ont de votre organisation.
SAS, «leader» dans le Magic Quadrant for Data Quality Tools du Gartner Group
«Les entreprises de tous les secteurs, quelle que soit leur taille, reconnaissent aujourd’hui l’importance d’une haute qualité des données et le rôle crucial que joue leur nécessaire qualification au sein des grandes initiatives de gouvernance de données s’appliquant à l’ensemble de l’organisation. Elles sont donc de plus en plus attentives aux propositions associées aux outils et technologies d’amélioration de la qualité des données.»
Ted Friedman et Andreas Bitterer, Gartner Group
Pour plus d’informations sur SAS Data Quality, visitez:
www.sas.com/belux, cliquez sur «Data Integration», puis sur «Data Quality»
SAS Institute nv/sa
Kasteel de Robiano
Hertenbergstraat 6
B-3080 Tervuren
+32 2 766 07 00
www.sas.com/belux
SAS Institute sàrl
204, Route d'Arlon
L-8010 Strassen
+352 26 11 84
www.sas.com/belux