datakvalitetsproblem

om du läser detta beror det förmodligen på att du upplever datakvalitetsproblem just nu. Vi kan vara ganska säkra på denna presumtion eftersom sanningen är att många organisationer har problem med sina data som hindrar dem från att nå sina mål.

titta bara på några av siffrorna nedan från ZoomInfo som visar hur utbredd problemet med smutsiga data är:

  • 33% av företagen har över 100 000 poster i sin databas
  • 62% av organisationerna förlitar sig på prospektdata som är upp till 40% felaktiga
  • 34% av företagen byter namn årligen
  • 15% av leads innehöll duplicerade data
  • 7% av leads innehöll ogiltiga e-post/fysiska adresser
  • 40% av affärsmålen misslyckas på grund av felaktiga data
  • 50% av IT-budgetarna spenderas på datarehabilitering
  • dåliga data kostar amerikanska företag mer än $611 miljarder varje år

(källa: https://blog.zoominfo.com/the-effect-of-dirty-data-on-roi/)

så du är åtminstone inte ensam. Frågan är vad du kan göra åt det? Vilka steg kan du vidta för att förbättra din datakvalitet och även fixa dina datakvalitetshanteringsprocesser så att du inte lider av samma problem längre ner?

de 6 vanligaste datakvalitetsproblemen som hindrar din organisation

nedan är de vanligaste datakvalitetsproblemen som de flesta organisationer upplever, de som hindrar dig från att få ut det mesta av din information:

1) ofullständighet: där viktiga informationsbitar saknas

2) felaktighet: all information kan vara ’närvarande’ (eller datafälten ifyllda), men den kan skrivas in i fel fält, stavas felaktigt eller fältet innehåller ett skräpvärde

3) inkonsekvens: data som ska presenteras med samma värde / format är inkonsekvent (t. ex. med olika valutor istället för samma i hela)

4) invaliditet: fälten som ska visas med är fullständiga, men med data som inte kan vara korrekta i det sammanhanget (t. ex. ”tillgängliga enheter” som visar ett minusvärde)

5) redundans: där samma data matas in flera gånger men uttrycks på något olika sätt (t. ex. att ange samma företag men med olika namn, Ange en persons namn på olika sätt, etc)

6) icke-standarddata: information som matas in med hjälp av icke-standardformat (eller format som inte kan behandlas av systemet, till exempel procent snarare än %)

även om dessa datakvalitetsproblem är långt ifrån idealiska, är de tillräckligt av ett hinder för att motivera att försöka göra grossiständringar i hur din organisation hanterar sina data? Om verksamheten kan fungera ’adekvat’ utan att göra sådana förändringar, ska du bara fortsätta som tidigare och göra det bästa med vad du har?

med andra ord, när ska datakvalitetsprocesser implementeras (om alls)?

När ska du genomföra datakvalitetsåtgärder?

generellt sett bör datakvalitetskontroller och åtgärder införas när det finns ett affärsbehov och när du behöver lösa ett specifikt problem. Och som vi alla vet finns det alltid ett företagsbehov i en eller annan form, och det finns alltid något att sträva efter. Annars, vad gör vi alla här?

här är några anledningar till varför du sannolikt är intresserad av att förbättra kvaliteten på dina data (eller borde vara!):

1) dina data är en viktig strategisk tillgång som ger dig en konkurrensfördel om den är korrekt och användbar

2) du vill rita data från olika källor till ett centralt datalager eller arkiv, vilket kommer att vara extremt svårt (om inte omöjligt) att göra om informationen inte är standardiserad

3) du vill hantera dina huvuddata mer effektivt

4) du planerar att implementera ett nytt system eller genomföra en systemmigrering, till exempel från ett äldre system eller ERP till ett molnbaserat system

när du har identifierat Business case för att sätta datakvalitetsåtgärder på plats – eller övertygade andra i din organisation om behovet av att-då måste datakvalitetshanteringsprocessen själv definieras. Men vem är ansvarig för det?

Vem är involverad i datakvalitetshanteringsprocessen?

två typer av roll i synnerhet är avgörande för framgången med datakvalitetsprocessen, nämligen:

dataförvaltare – de är involverade i att profilera data och skapa regler för data standardisering och rengöring

Utvecklare – de samarbetar med dataförvaltare och spelar en viktig roll i utformningen av datakvalitetsregler och utvecklingsprocessen

båda dessa roller kommer att behöva arbeta nära under hela implementeringsprocessen, varefter dataförvaltarna kommer att ansvara för att övervaka kvaliteten på informationen.

vad utgör en kvalitetssäkring / hanteringsprocess för data?

processen i sig innehåller vissa steg som datakvalitetsanalytiker och dataförvaltare i synnerhet kommer att behöva slutföra, inklusive:

dataprofilering – vid denna tidpunkt kommer de att behöva utforska data för att få en fördjupad förståelse och identifiera problem inom den, till exempel de som skisserats tidigare (ofullständighet, felaktig etc.) innan de sammanfattar problemen.

definiera mätvärden-för att få en uppfattning om hur utbredd dataproblemen är, samtidigt som de fastställer datakvalitetsriktmärken, måste de registrera mätvärden som hur mycket av data som för närvarande är komplett (% komplett), hur mycket är konsekvent (% konsekvent), giltig (% giltig) och så vidare.

fastställande av data-vid denna punkt, efter frågor har profilerats och benchmarked, processen att rensa informationen och åtgärda problemen kan börja.

att göra ändringar direkt i uppgifterna utgör emellertid uppenbarligen en risk om de föreslagna ändringarna själva är felaktiga. Detta skulle leda till en mycket rörig och förvirrande situation som är ännu svårare att fixa! Därför är det bäst att inte göra några ändringar direkt i databasen direkt.

istället bör föreslagna ändringar listas och specificeras innan de skickas till en dataförvaltare för granskning, varefter de antingen kommer att godkännas eller avvisas.

utvecklande datakvalitetsbehov och frågor att överväga

en av de oundvikliga aspekterna av att arbeta med information – särskilt när det gäller datakvalitetshantering, förvaltning och styrning – är att det aldrig kommer att bli en ’en och klar’ situation.

istället kommer din organisations datakvalitetsbehov att förändras över tiden, och som ett resultat av detta kommer dina definierade regler också att justeras över tiden, särskilt eftersom dataförvaltarna får en större förståelse för data, vanliga återkommande problem och hur man mildrar dem.

dessutom står data inte stilla. Statistiken i början av denna blogg visar hur ofta information som företagsnamn, adresser och e-postadresser ändras och uppdateras, medan nya datakällor också kommer att läggas till med tiden, vilket innebär att behovet av förvaltning och styrning kommer att fortsätta.

tack vare organisationens förändrade behov och dataens förändrade natur måste du också regelbundet ställa dig själv frågor för att se till att självbelåtenhet inte kryper in och att du är proaktiv, i motsats till reaktiv.

till exempel kan dessa inkludera följande:

  • förbättras kvaliteten på dina data faktiskt över tiden, och därför fungerar datahanteringsprocessen som avsedd?
  • om kvaliteten inte förbättras, behöver reglerna uppdateras? Uppfyller de din organisations nuvarande behov?
  • om och när nya datakällor läggs till, gäller de befintliga datakvalitetsreglerna fortfarande, eller måste de anpassas i enlighet därmed?

Lämna ett svar

Din e-postadress kommer inte publiceras.

lg