Wir haben in der Vergangenheit viel über Datenqualität gesprochen – einschließlich der Kosten für schlechte Daten. Aber trotz eines grundlegenden Verständnisses von Datenqualität verstehen viele Menschen immer noch nicht ganz, was genau unter „Qualität“ zu verstehen ist.

Gibt es zum Beispiel eine Möglichkeit, diese Qualität zu messen, und wenn ja, wie machen Sie das? In diesem Artikel werden wir versuchen, diese Fragen und vieles mehr zu beantworten. Aber zuerst …

Datenqualitätsmythen zerstreuen

decision-makers
Die Grundlage für die Sicherstellung der Datenqualität beginnt, wenn grundlegende Anforderungen erstellt werden

Einer der größten Mythen über Datenqualität ist, dass sie vollständig fehlerfrei sein muss. Da Websites und andere Kampagnen so viele Daten sammeln, ist es nahezu unmöglich, null Fehler zu erhalten. Stattdessen müssen die Daten nur den Standards entsprechen, die dafür festgelegt wurden. Um festzustellen, was „Qualität“ ist, müssen wir zuerst drei Dinge wissen:

  1. Wer erstellt die Anforderungen
  2. Wie entstehen die Anforderungen und
  3. Welchen Spielraum haben wir, um diese Anforderungen zu erfüllen

Viele Unternehmen haben einen einzigartigen „Data Steward“, der diese Anforderungen versteht und festlegt sowie die Toleranzwerte für Fehler festlegt. Wenn es keinen Datenverwalter gibt, spielt er oft die Rolle, um sicherzustellen, dass die für die Daten Verantwortlichen alle Mängel verstehen, die sich auf sie auswirken können.

Sie können es gut, schnell oder billig haben – Wählen Sie zwei

mcdonalds-junk-food

Alles, von der Erfassung der Daten bis hin zur Anpassung an die Bedürfnisse des Unternehmens, öffnet es für potenzielle Fehler. Daten zu haben, die zu 100% vollständig und zu 100% genau sind, ist nicht nur unerschwinglich teuer, sondern auch zeitaufwändig und stößt die ROI-Nadel kaum an.

Bei so vielen Daten müssen Entscheidungen schnell getroffen werden. Aus diesem Grund ist die Datenqualität ein heikler Balanceakt – das Jonglieren und Beurteilen von Genauigkeit und Vollständigkeit. Wenn es sich nach einer großen Aufgabe anhört, werden Sie froh sein zu wissen, dass es eine Methode für den Wahnsinn gibt, und der erste Schritt ist die Datenprofilierung.

Was ist Data Profiling?

data-quality

Bei der Datenprofilierung werden alle Informationen in Ihrer Datenbank überprüft, um festzustellen, ob sie korrekt und / oder vollständig sind und was mit Einträgen zu tun ist, die dies nicht sind. Es ist ziemlich einfach, zum Beispiel eine Datenbank von Produkten zu importieren, die Ihr Unternehmen herstellt, und sicherzustellen, dass alle Informationen genau sind, aber es ist eine andere Geschichte, wenn Sie Details über Produkte von Mitbewerbern oder andere verwandte Details importieren.

Mit Data Profiling sehen Sie auch, wie genau die Daten sind. Wenn Sie am 1.7.16 gestartet haben, zeichnet das System dies als 1916 oder 2016 auf? Es ist möglich, dass Sie sogar Duplikate und andere Probleme beim Durchsuchen der erhaltenen Informationen aufdecken. Die Profilierung der Daten auf diese Weise gibt uns einen Ausgangspunkt – ein Sprungbrett, um sicherzustellen, dass die von uns verwendeten Informationen von bestmöglicher Qualität sind.

Bestimmung der Datenqualität

Nun, da wir einen Ausgangspunkt haben, um festzustellen, ob unsere Informationen vollständig und korrekt sind, lautet die nächste Frage: Was tun wir, wenn wir Fehler oder Probleme finden? In der Regel können Sie eines von vier Dingen tun:

  • Akzeptieren Sie den Fehler – Wenn er innerhalb eines akzeptablen Standards liegt (z. Main Street statt Main St) können Sie entscheiden, es zu akzeptieren und zum nächsten Eintrag überzugehen.
  • Ablehnen des Fehlers – Manchmal, insbesondere bei Datenimporten, sind die Informationen so stark beschädigt oder falsch, dass es besser ist, den Eintrag einfach ganz zu löschen, als zu versuchen, ihn zu korrigieren.
  • Korrigieren Sie den Fehler – Rechtschreibfehler von Kundennamen sind ein häufiger Fehler, der leicht korrigiert werden kann. Wenn es Variationen eines Namens gibt, können Sie einen als „Master“ festlegen und die Daten in allen Datenbanken konsolidieren und korrigieren.
  • Erstellen Sie einen Standardwert – Wenn Sie den Wert nicht kennen, kann es besser sein, etwas dort zu haben (unbekannt oder n / a) als gar nichts.

Integration der Daten

Wenn Sie dieselben Daten in verschiedenen Datenbanken haben, ist die Gelegenheit für Fehler und Duplikate reif. Der erste Schritt zu einer erfolgreichen Integration besteht darin, zu sehen, wo sich die Daten befinden, und diese Daten dann konsistent zu kombinieren. Hier kann es sich äußerst lohnen, in bewährte Tools für Datenqualität und -genauigkeit zu investieren, um Informationen datenbankübergreifend zu koordinieren und zu synchronisieren.

Ihre Datenqualitäts-Checkliste

clean-data

Schließlich, weil Sie mit so vielen Daten in so vielen verschiedenen Bereichen zu tun haben, ist es hilfreich, eine Checkliste zu haben, um festzustellen, dass Sie mit der höchstmöglichen Datenqualität arbeiten. DAMA UK hat einen ausgezeichneten Leitfaden zu „Datendimensionen“ erstellt, der verwendet werden kann, um ein besseres Bild davon zu erhalten, wie die Datenqualität entschieden wird.

Ihre Datenqualitätsdimensionen umfassen:

Vollständigkeit – ein Prozentsatz der Daten, der einen oder mehrere Werte enthält. Es ist wichtig, dass kritische Daten (wie Kundennamen, Telefonnummern, E-Mail-Adressen usw.) müssen zuerst ausgefüllt werden, da sich die Vollständigkeit nicht so stark auf unkritische Daten auswirkt.

Eindeutigkeit – Gemessen an anderen Datensätzen gibt es nur einen Eintrag dieser Art.

Aktualität – Welchen Einfluss haben Datum und Uhrzeit auf die Daten? Dies können frühere Verkäufe, Produkteinführungen oder Informationen sein, auf die man sich über einen bestimmten Zeitraum verlässt, um genau zu sein.

Gültigkeit – Entsprechen die Daten den dafür festgelegten Standards?

Genauigkeit – Wie gut spiegeln die Daten die reale Person oder Sache wider, die dadurch identifiziert wird?

Konsistenz – Wie gut stimmen die Daten mit einem vorgefassten Muster überein? Geburtsdaten haben ein gemeinsames Konsistenzproblem, da in den USA der Standard MM / TT / JJJJ ist, während in Europa und anderen Gebieten die Verwendung von TT / MM / JJJJ Standard ist.

Das große Ganze zur Datenqualität

Wie Sie sehen, gibt es keinen „One Size fits all“ -Ansatz, um die Genauigkeit und Vollständigkeit jeder Art von Daten für jedes Unternehmen aufrechtzuerhalten. Und da der Appetit von Big Data auf Informationen von Tag zu Tag größer wird, wird es wichtiger denn je, Probleme mit der Datenqualität direkt anzugehen. Obwohl es überwältigend erscheinen kann, lohnt es sich, Datenhygiene–Tools zu verwenden, damit Computer das tun können, was sie am besten können – Zahlen knacken.

Der wichtigste Schritt, den Sie unternehmen können, ist einfach der Einstieg. Die Daten werden immer wachsen, wenn mehr Interessenten an Bord kommen und neue Märkte entdeckt werden, so dass es nie eine „beste Zeit“ geben wird, um Datenqualitätsprobleme anzugehen. Wenn Sie sich jetzt die Zeit nehmen, herauszufinden, was Datenqualität für Ihr Unternehmen oder Ihre Organisation bedeutet, kann dies zu einem verbesserten Kundenservice, einem besseren Kundenerlebnis, einer höheren Conversion-Rate und einer längeren Kundenbindung führen – und das sind die Arten von Renditen auf Investitionen, die jedes Unternehmen von ganzem Herzen annehmen wird!

Über den Autor: Sherice Jacob hilft Geschäftsinhabern, das Website-Design zu verbessern und die Conversion-Raten durch überzeugendes Copywriting, benutzerfreundliches Design und intelligente Analyseanalysen zu erhöhen. Erfahren Sie mehr unter iElectrify.com und laden Sie noch heute Ihre kostenlose Checkliste für die Optimierung und Konvertierung von Webkopien herunter!

Steigern Sie Ihren Traffic

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

lg