problèmes de qualité des données

Si vous lisez ceci, c’est probablement parce que vous rencontrez des problèmes de qualité des données en ce moment même. Nous pouvons être assez confiants quant à cette présomption car, en vérité, de nombreuses organisations ont des problèmes avec leurs données qui les empêchent d’atteindre leurs objectifs.

Il suffit de regarder quelques-uns des chiffres ci-dessous de ZoomInfo qui montrent à quel point le problème des « données sales » est répandu:

  • 33% des entreprises ont plus de 100 000 enregistrements dans leur base de données
  • 62% des organisations se fient à des données de prospects qui sont jusqu’à 40% inexactes
  • 34% des entreprises changent de nom chaque année
  • 15% des prospects contenaient des données dupliquées
  • 7% des prospects contenaient des adresses e-mail / physiques invalides
  • 40% des objectifs commerciaux échec dû à des données inexactes
  • 50% des budgets informatiques sont consacrés à la réhabilitation des données
  • Les mauvaises données coûtent aux entreprises américaines plus de 611 milliards de dollars chaque année

( Source: https://blog.zoominfo.com/the-effect-of-dirty-data-on-roi/)

Donc au moins tu n’es pas seul. La question est que pouvez-vous faire à ce sujet? Quelles mesures pouvez-vous prendre pour améliorer la qualité de vos données et également corriger vos processus de gestion de la qualité des données afin que vous ne souffriez pas des mêmes problèmes plus loin ?

Les 6 problèmes de qualité des données les plus courants qui entravent votre organisation

Voici les problèmes de qualité des données les plus courants rencontrés par la plupart des organisations, ceux qui vous empêcheront de tirer le meilleur parti de vos informations :

1) Incomplétude: lorsque des informations cruciales sont manquantes

2) Inexactitude: toutes les informations peuvent être « présentes » (ou les champs de données remplis), mais elles peuvent être saisies dans le mauvais champ, mal orthographiées, ou le champ contient une valeur indésirable

3) Incohérence: les données qui doivent être présentées avec la même valeur / format sont incohérentes (par exemple, en utilisant différentes devises au lieu de la même partout)

4) Invalidité: les champs sont complets, mais avec des données qui ne peuvent pas être correctes dans ce contexte (par ex. « unités disponibles » affichant une valeur négative)

5) Redondance: où les mêmes données sont saisies plusieurs fois mais exprimées de manière légèrement différente (par exemple, entrer la même entreprise mais avec des noms différents, entrer le nom d’une personne de différentes manières, etc.)

6) Données non standard: les informations saisies en utilisant des formats non standard (ou des formats qui ne peuvent pas être traités par le système, par exemple en pourcentage plutôt qu’en %)

Bien que ces problèmes de qualité des données soient loin d’être idéaux, constituent-ils un obstacle suffisant pour justifier l’effort d’apporter des modifications globales à la façon dont votre organisation gère ses données? Si l’entreprise peut fonctionner de manière « adéquate » sans apporter de tels changements, devriez-vous simplement continuer comme avant et faire de votre mieux avec ce que vous avez?

En d’autres termes, quand les processus de qualité des données doivent-ils être mis en œuvre (le cas échéant)?

Quand faut-il mettre en œuvre des mesures de la qualité des données?

D’une manière générale, des contrôles et des mesures de qualité des données doivent être mis en place lorsqu’il y a un besoin commercial et lorsque vous devez résoudre un problème spécifique. Et comme nous le savons tous, il y a toujours un besoin commercial sous une forme ou une autre, et il y a toujours quelque chose à viser. Sinon, que faisons-nous tous ici?

Voici quelques raisons pour lesquelles vous êtes susceptible d’être intéressé à améliorer la qualité de vos données (ou devrait l’être!):

1) Vos données sont un atout stratégique majeur qui vous procurera un avantage concurrentiel si elles sont précises et utilisables

2) Vous souhaitez puiser des données de sources disparates dans un entrepôt de données ou un référentiel central, ce qui sera extrêmement difficile (voire impossible) à faire si les informations ne sont pas standardisées

3) Vous souhaitez gérer plus efficacement vos données de base

4) Vous envisagez de implémentez un nouveau système ou effectuez une migration de système, par exemple d’un système hérité ou d’un ERP vers un système basé sur le cloud

Une fois que vous avez identifié le analyse de rentabilisation pour mettre en place des mesures de qualité des données – ou convaincre les autres membres de votre organisation de la nécessité de le faire –, le processus de gestion de la qualité des données lui-même devra alors être défini. Mais qui en est responsable ?

Qui participe au processus de gestion de la qualité des données?

Deux types de rôles en particulier sont essentiels au succès du processus de qualité des données, à savoir:

Responsables des données – ils sont impliqués dans le profilage des données et la création de règles pour la normalisation et le nettoyage des données

Développeurs – ils collaborent avec les responsables des données et jouent un rôle important dans la conception des règles de qualité des données et le processus de développement

Ces deux rôles devront travailler en étroite collaboration tout au long du processus de mise en œuvre, après quoi les responsables des données seront responsables du suivi de la qualité des informations.

Qu’est-ce qui constitue un processus d’assurance/de gestion de la qualité des données?

Le processus lui–même comprend certaines étapes que les analystes de la qualité des données et les responsables de la gestion des données en particulier devront compléter, notamment:

Profilage des données – à ce stade, ils devront explorer les données afin d’acquérir une compréhension approfondie et d’identifier les problèmes qu’elles contiennent, tels que ceux décrits précédemment (incomplétude, inexactitude, etc.) avant de résumer les problèmes.

Définition des métriques – pour avoir une idée de l’ampleur des problèmes de données, tout en établissant des repères de qualité des données, ils devront enregistrer des métriques telles que la quantité de données actuellement complète (% terminée), la quantité cohérente (% cohérente), valide (% valide), etc.

Correction des données – à ce stade, après que les problèmes ont été profilés et comparés, le processus de nettoyage des informations et de résolution des problèmes peut commencer.

Cependant, apporter des modifications directement aux données présente évidemment un risque si les modifications suggérées elles-mêmes sont incorrectes. Cela conduirait à une situation très désordonnée et confuse qui est encore plus difficile à résoudre! Il est donc préférable de ne pas apporter de modifications directement à la base de données.

Au lieu de cela, les modifications proposées devraient être énumérées et détaillées avant d’être transmises à un responsable des données pour examen, après quoi elles seront approuvées ou rejetées.

Évolution des besoins et des questions en matière de qualité des données à prendre en compte

L’un des aspects incontournables du travail avec l’information – en particulier en ce qui concerne la gestion de la qualité des données, la gérance et la gouvernance – est qu’il ne s’agira jamais d’une situation  » un et fait « .

Au lieu de cela, les besoins de votre organisation en matière de qualité des données vont changer au fil du temps et, par conséquent, vos règles définies seront également réajustées au fil du temps, en particulier à mesure que les responsables des données acquerront une meilleure compréhension des données, des problèmes récurrents courants et de la façon de les atténuer.

De plus, les données elles-mêmes ne s’arrêtent pas. Les statistiques au début de ce blog montrent à quelle fréquence des informations telles que les noms d’entreprises, les adresses et les adresses e-mail changent et sont mises à jour, tandis que de nouvelles sources de données seront également ajoutées au fil du temps, ce qui signifie que le besoin de gérance et de gouvernance se poursuivra.

En raison de l’évolution des besoins de l’organisation et de la nature changeante des données elles-mêmes, vous devrez également vous poser périodiquement des questions pour vous assurer que la complaisance ne s’infiltre pas et que vous êtes proactif, plutôt que réactif.

Par exemple, ceux-ci peuvent inclure les éléments suivants:

  • La qualité de vos données s’améliore-t-elle réellement avec le temps et, par conséquent, le processus de gestion des données fonctionne-t-il comme prévu ?
  • Si la qualité ne s’améliore pas, les règles doivent-elles être mises à jour ? Répondent-ils aux besoins actuels de votre organisation ?
  • Si de nouvelles sources de données sont ajoutées, les règles de qualité des données existantes s’appliquent-elles toujours ou devront-elles être adaptées en conséquence?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

lg