we hebben in het verleden veel gesproken over de kwaliteit van gegevens – inclusief de kosten van slechte gegevens. Maar ondanks een basiskennis van de kwaliteit van de gegevens, veel mensen nog steeds niet helemaal begrijpen wat precies wordt bedoeld met”kwaliteit”.

bijvoorbeeld, is er een manier om die kwaliteit te meten, en zo ja, hoe doe je dat? In dit artikel, we zullen op zoek zijn om deze vragen en nog veel meer te beantwoorden. Maar eerst…

het verdrijven van mythes over gegevenskwaliteit

decision-makers
de basis voor het waarborgen van gegevenskwaliteit begint wanneer basisvereisten worden gecreëerd

een van de grootste mythes over gegevenskwaliteit is dat deze volledig foutloos moet zijn. Met websites en andere campagnes het verzamelen van zoveel gegevens, het krijgen van nul fouten is bijna onmogelijk. In plaats daarvan hoeven de gegevens alleen te voldoen aan de normen die daarvoor zijn vastgesteld. Om te bepalen wat “kwaliteit” is, moeten we eerst drie dingen weten:

  1. Who creates the requirements
  2. Hoe worden de requirements gecreëerd, en
  3. welke mate van speelruimte hebben we in termen van het voldoen aan deze requirements

veel bedrijven hebben een enkele “data steward” die deze requirements begrijpt en stelt, evenals de persoon die de tolerantieniveaus voor fouten bepaalt. Als er geen gegevens steward is, speelt het vaak de rol in ervoor te zorgen dat degenen die verantwoordelijk zijn voor de gegevens om het even welke tekortkomingen begrijpen die het kunnen beà nvloeden.

u kunt het goed, snel of goedkoop hebben-kies er twee

mcdonalds-junk-food

alles van het verzamelen van de gegevens tot het maken van het aansluiten op de behoeften van het bedrijf open het tot potentiële fouten. Het hebben van gegevens die 100% volledig en 100% nauwkeurig is niet alleen onbetaalbaar duur, maar tijdrovend en nauwelijks duwend de ROI naald.

met zoveel gegevens die binnenkomen, moeten beslissingen worden genomen en snel. Dat is de reden waarom de kwaliteit van de gegevens is zeer veel een delicate evenwichtsoefening-jongleren en beoordelen nauwkeurigheid en volledigheid. Als het klinkt als een grote order te vullen, zult u blij zijn om te weten dat er een methode om de waanzin, en de eerste stap is data profiling.

Wat is Dataprofilering?

data-quality

Data profiling omvat het bekijken van alle informatie in uw database om te bepalen of deze accuraat en/of volledig is, en wat te doen met vermeldingen die dat niet zijn. Het is vrij eenvoudig om, bijvoorbeeld, importeren van een database van producten die uw bedrijf produceert en zorg ervoor dat alle informatie is exact, maar het is een ander verhaal als je het importeren van gegevens over producten concurrent of andere gerelateerde details.

met dataprofilering kijkt u ook hoe nauwkeurig de gegevens zijn. Als je gelanceerd hebt op 7/1/16, registreert het systeem dat dan als 1916 of 2016? Het is mogelijk dat u zelfs duplicaten en andere problemen kunt ontdekken bij het kammen door de informatie die u hebt verkregen. Het profileren van de gegevens op deze manier geeft ons een startpunt – een springplank om van te springen om ervoor te zorgen dat de informatie die we gebruiken van de best mogelijke kwaliteit is.

gegevenskwaliteit bepalen

dus nu we een startpunt hebben om te bepalen of onze informatie volledig en accuraat is, wordt de volgende vraag: wat doen we als we fouten of problemen vinden? Meestal kun je een van de vier dingen doen:

  • accepteer de fout-als deze binnen een aanvaardbare standaard valt (d.w.z. Main Street in plaats van Main St) kunt u besluiten om het te accepteren en ga naar de volgende ingang.
  • wijs de fout af – soms, met name bij invoer van gegevens, is de informatie zo ernstig beschadigd of onjuist dat het beter is om de vermelding gewoon helemaal te verwijderen dan te proberen deze te corrigeren.
  • corrigeer de fout-spelfouten van klantennamen zijn een veel voorkomende fout die gemakkelijk kan worden gecorrigeerd. Als er variaties op een naam zijn, kunt u er een Instellen als de “Master” en de gegevens geconsolideerd en correct houden in alle databases.
  • Creëer een standaardwaarde-Als u de waarde niet kent, kan het beter zijn om iets (onbekend of nvt) te hebben dan helemaal niets.

integratie van de gegevens

wanneer u dezelfde gegevens in verschillende databases hebt, is de kans rijp voor fouten en duplicaten. De eerste stap naar succesvolle integratie is zien waar de gegevens zijn en vervolgens combineren die gegevens op een manier die consistent is. Hier kan het zeer de moeite waard zijn om te investeren in bewezen data kwaliteit en nauwkeurigheid tools om te helpen coördineren en synchroniseren van informatie tussen databases.

uw controlelijst voor gegevenskwaliteit

clean-data

tot slot, omdat je te maken hebt met zoveel gegevens over zoveel verschillende gebieden, is het handig om een checklist om te bepalen dat je werkt met de hoogst mogelijke kwaliteit van de gegevens. DAMA UK heeft een uitstekende gids over “data dimensions” gemaakt die kan worden gebruikt om beter het volledige beeld te krijgen over hoe de kwaliteit van de gegevens wordt bepaald.

hun dimensies van gegevenskwaliteit omvatten:

volledigheid-een percentage van de gegevens dat een of meer waarden omvat. Het is belangrijk dat kritische gegevens (zoals namen van klanten, telefoonnummers, e-mailadressen, enz.) eerst worden voltooid, omdat volledigheid niet zoveel invloed heeft op niet-kritische gegevens.

uniciteit – wanneer gemeten ten opzichte van andere gegevensverzamelingen, is er slechts één ingang in zijn soort.

tijdigheid – hoeveel invloed hebben datum en tijd op de gegevens? Dit kan eerdere verkopen, productlanceringen of informatie die wordt gebruikt over een periode van tijd om nauwkeurig te zijn.

geldigheid-voldoen de gegevens aan de respectieve normen die daarvoor zijn vastgesteld?

nauwkeurigheid – hoe goed weerspiegelen de gegevens de persoon of het ding in de echte wereld die ermee wordt geïdentificeerd?

consistentie – hoe goed komen de gegevens overeen met een vooropgezet patroon? Geboortedata delen een gemeenschappelijke consistentie probleem, omdat in de VS, de standaard is MM / DD/YYYY, terwijl in Europa en andere gebieden, het gebruik van DD/MM / YYYY is standaard.

the Big Picture on Data Quality

zoals u kunt zien, is er geen “one size fits all” – benadering voor het handhaven van nauwkeurigheid en volledigheid op elk type gegevens voor elk bedrijf. En met big data ‘ s honger naar informatie groeit elke dag meer en meer, is het steeds belangrijker dan ooit om problemen met de kwaliteit van de gegevens frontaal aan te pakken. Hoewel het kan lijken overweldigend, het is de moeite waard het inschakelen van data hygiëne tools om computers te laten doen wat ze het beste doen – crunch nummers.

de belangrijkste stap die u kunt zetten is gewoon beginnen. De gegevens zullen altijd groeien naarmate er meer vooruitzichten aan boord komen en nieuwe markten worden ontdekt, dus er zal nooit een “beste tijd” zijn om problemen met de gegevenskwaliteit aan te pakken. Het nemen van de tijd nu om in kaart te brengen wat de kwaliteit van de gegevens betekent voor uw bedrijf of organisatie kan een rimpel-effect van verbeterde klantenservice, een betere klantervaring, een hogere conversiesnelheid en langere klantenbinding te creëren – en dat zijn de soorten rendement op de investering die elk bedrijf van harte zal omarmen!

over de auteur: Sherice Jacob helpt ondernemers websiteontwerp te verbeteren en conversiepercentages te verhogen door middel van boeiende copywriting, gebruiksvriendelijk ontwerp en slimme analytics-analyse. Meer informatie op iElectrify.com en download uw gratis web copy tune-up en conversie checklist vandaag!

vergroot uw verkeer

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.

lg