Nous avons beaucoup parlé de la qualité des données dans le passé, y compris du coût des mauvaises données. Mais malgré une compréhension de base de la qualité des données, beaucoup de gens ne comprennent toujours pas exactement ce que l’on entend par « qualité ».

Par exemple, existe-t-il un moyen de mesurer cette qualité, et si oui, comment le faites-vous? Dans cet article, nous chercherons à répondre à ces questions et bien plus encore. Mais d’abord

Dissiper les mythes sur la qualité des données

decision-makers
La base pour assurer la qualité des données commence lorsque les exigences de base sont créées

L’un des plus grands mythes sur la qualité des données est qu’elles doivent être complètement exemptes d’erreurs. Avec des sites Web et d’autres campagnes collectant autant de données, il est presque impossible d’obtenir zéro erreur. Au lieu de cela, les données doivent uniquement être conformes aux normes qui ont été définies pour elles. Afin de déterminer ce qu’est la « qualité », nous devons d’abord savoir trois choses:

  1. Qui crée les exigences
  2. Comment les exigences sont-elles créées et
  3. Quel degré de latitude avons-nous pour répondre à ces exigences

De nombreuses entreprises ont un « délégué aux données » unique qui comprend et définit ces exigences, ainsi que la personne qui détermine les niveaux de tolérance pour les erreurs. S’il n’y a pas de responsable des données, IL joue souvent le rôle de s’assurer que les responsables des données comprennent les lacunes qui peuvent les affecter.

Vous pouvez L’Avoir Bon, Rapide ou Bon Marché – Choisissez deux

mcdonalds-junk-food

Tout, de la collecte des données à leur adaptation aux besoins de l’entreprise, les ouvre à des erreurs potentielles. Disposer de données complètes à 100% et précises à 100% coûte non seulement un coût prohibitif, mais prend également du temps et peine à pousser l’aiguille ROI.

Avec autant de données qui arrivent, les décisions doivent être prises et rapidement. C’est pourquoi la qualité des données est un jeu d’équilibre délicat : jongler et juger de l’exactitude et de l’exhaustivité. Si cela semble être une tâche difficile à remplir, vous serez heureux de savoir qu’il existe une méthode pour la folie, et la première étape est le profilage des données.

Qu’est-ce que le profilage des données ?

data-quality

Le profilage des données consiste à examiner toutes les informations de votre base de données pour déterminer si elles sont exactes et / ou complètes, et ce qu’il faut faire avec les entrées qui ne le sont pas. Il est assez simple, par exemple, d’importer une base de données de produits fabriqués par votre entreprise et de vous assurer que toutes les informations sont exactes, mais c’est une autre histoire lorsque vous importez des détails sur les produits de vos concurrents ou d’autres détails connexes.

Avec le profilage des données, vous vérifiez également la précision des données. Si vous avez lancé le 7/1/16, le système enregistre-t-il cela comme 1916 ou 2016? Il est possible que vous découvriez même des doublons et d’autres problèmes en parcourant les informations que vous avez obtenues. Le profilage des données de cette manière nous donne un point de départ – un tremplin pour nous assurer que les informations que nous utilisons sont de la meilleure qualité possible.

Détermination de la qualité des données

Maintenant que nous avons un point de départ pour déterminer si nos informations sont complètes et exactes, la question suivante devient: que faisons–nous lorsque nous trouvons des erreurs ou des problèmes? En règle générale, vous pouvez faire l’une des quatre choses suivantes:

  • Accepter l’erreur – Si elle est conforme à une norme acceptable (p. ex. Rue principale au lieu de rue principale), vous pouvez décider de l’accepter et de passer à l’entrée suivante.
  • Rejeter l’erreur – Parfois, en particulier avec les importations de données, les informations sont si gravement endommagées ou incorrectes qu’il serait préférable de simplement supprimer complètement l’entrée plutôt que d’essayer de la corriger.
  • Corriger l’erreur – Les fautes d’orthographe des noms de clients sont une erreur courante qui peut facilement être corrigée. S’il y a des variations sur un nom, vous pouvez en définir un comme « Maître » et conserver les données consolidées et correctes dans toutes les bases de données.
  • Créez une valeur par défaut – Si vous ne connaissez pas la valeur, il peut être préférable d’avoir quelque chose là (inconnu ou n / a) que rien du tout.

Intégration des données

Lorsque vous disposez des mêmes données dans différentes bases de données, l’opportunité est mûre pour les erreurs et les doublons. La première étape vers une intégration réussie consiste à voir où se trouvent les données, puis à les combiner de manière cohérente. Ici, il peut être extrêmement intéressant d’investir dans des outils éprouvés de qualité et de précision des données pour aider à coordonner et à synchroniser les informations entre les bases de données.

Liste de contrôle de la qualité des données

clean-data

Enfin, étant donné que vous traitez beaucoup de données dans de nombreux domaines différents, il est utile d’avoir une liste de contrôle pour déterminer que vous travaillez avec la plus haute qualité de données possible. DAMA UK a créé un excellent guide sur les « dimensions des données » qui peut être utilisé pour mieux comprendre comment la qualité des données est décidée.

Leurs dimensions de qualité des données comprennent :

Exhaustivité – un pourcentage de données qui comprend une ou plusieurs valeurs. Il est important que les données critiques (telles que les noms des clients, les numéros de téléphone, les adresses e-mail, etc.) être complété en premier, car l’exhaustivité n’a pas beaucoup d’impact sur les données non critiques.

Unicité – Lorsqu’elle est mesurée par rapport à d’autres ensembles de données, il n’y a qu’une seule entrée de ce type.

Actualité – Quelle incidence la date et l’heure ont-elles sur les données? Il peut s’agir de ventes antérieures, de lancements de produits ou de toute information sur laquelle on se fonde sur une période de temps pour être exacte.

Validité – Les données sont-elles conformes aux normes respectives définies pour elles?

Précision – Dans quelle mesure les données reflètent-elles la personne ou la chose du monde réel qu’elles identifient?

Cohérence – Dans quelle mesure les données s’alignent-elles sur un modèle préconçu? Les dates de naissance partagent un problème de cohérence commun, car aux États-Unis, la norme est MM / JJ / AAAA, alors qu’en Europe et dans d’autres régions, l’utilisation de JJ / MM / AAAA est standard.

Vue d’ensemble sur la qualité des données

Comme vous pouvez le constater, il n’existe pas d’approche  » taille unique  » pour maintenir l’exactitude et l’exhaustivité de tous les types de données pour chaque entreprise. Et avec l’appétit croissant du big Data pour l’information chaque jour, il devient plus important que jamais de s’attaquer de front aux problèmes de qualité des données. Bien que cela puisse sembler écrasant, il vaut la peine de faire appel à des outils d’hygiène des données pour permettre aux ordinateurs de faire ce qu’ils font le mieux: réduire les chiffres.

L’étape la plus importante que vous pouvez franchir est simplement de commencer. Les données vont toujours croître à mesure que de plus en plus de prospects arrivent et que de nouveaux marchés sont découverts, il n’y aura donc jamais de « meilleur moment » pour s’attaquer aux problèmes de qualité des données. Prendre le temps maintenant de déterminer ce que la qualité des données signifie pour votre entreprise ou votre organisation peut créer un effet d’entraînement d’un service client amélioré, d’une meilleure expérience client, d’un taux de conversion plus élevé et d’une rétention des clients plus longue – et ce sont les types de retours sur investissement que toute entreprise adoptera de tout cœur!

À propos de l’auteur: Sherice Jacob aide les propriétaires d’entreprises à améliorer la conception de sites Web et à augmenter les taux de conversion grâce à une rédaction convaincante, une conception conviviale et une analyse analytique intelligente. En savoir plus sur iElectrify.avec et téléchargez votre checklist de mise au point et de conversion de copie Web gratuite dès aujourd’hui!

Augmentez votre trafic

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

lg