problemer med datakvalitet

hvis du læser dette, er det sandsynligvis fordi du oplever problemer med datakvalitet lige nu. Vi kan være ret sikre på denne formodning, fordi sandheden er, at mange organisationer har problemer med deres data, der forhindrer dem i at nå deres mål.

bare se på nogle af nedenstående tal fra , der viser, hvor udbredt problemet med ‘beskidte data’ er:

  • 33% 100.000 poster i deres database
  • 62% af organisationerne er afhængige af prospektdata, der er op til 40% unøjagtige
  • 34% af virksomhederne ændrer deres navne årligt
  • 15% af kundeemnerne indeholdt duplikerede data
  • 7% af kundeemnerne indeholdt ugyldige e-mail/fysiske adresser
  • 40% af forretningsmålene mislykkes på grund af unøjagtige data
  • 50% af it-budgetterne bruges på datarehabilitering
  • dårlige data koster amerikanske virksomheder mere end $611 mia. hvert år

(kilde: https://blog.zoominfo.com/the-effect-of-dirty-data-on-roi/)

så i det mindste er du ikke alene. Spørgsmålet er, hvad kan du gøre ved det? Hvilke skridt kan du tage for at forbedre din datakvalitet og også rette dine datakvalitetsstyringsprocesser, så du ikke lider af de samme problemer længere nede på linjen?

de 6 mest almindelige datakvalitetsproblemer, der hæmmer din organisation

nedenfor er de mest almindelige datakvalitetsproblemer, som de fleste organisationer oplever, dem, der forhindrer dig i at få mest muligt ud af dine oplysninger:

1) ufuldstændighed: hvor vigtige oplysninger mangler

2) unøjagtighed: alle oplysningerne kan være ’til stede’ (eller de udfyldte datafelter), men de kan indtastes i det forkerte felt, staves forkert, eller feltet indeholder en uønsket værdi

3) inkonsekvens: data, der skal præsenteres med den samme værdi / format, er inkonsekvente (f. eks. ved hjælp af forskellige valutaer i stedet for den samme overalt)

4) ugyldighed: felterne er ikke komplet, men med data, der umuligt kan være korrekte i den sammenhæng (f. eks. “tilgængelige enheder”, der viser en minusværdi)

5) redundans: hvor de samme data indtastes flere gange, men udtrykkes på lidt forskellige måder (f. eks. indtastning af det samme firma, men med forskellige navne, indtastning af en persons navn på forskellige måder osv.)

6) ikke-standarddata: oplysninger, der er input ved hjælp af ikke-standardformater (eller formater, der ikke kan behandles af systemet, for eksempel procent snarere end %)

selvom disse datakvalitetsproblemer langt fra er ideelle, er de nok af en hindring for at retfærdiggøre at gøre en indsats for at foretage engrosændringer i den måde, din organisation administrerer sine data på? Hvis virksomheden kan fungere ’tilstrækkeligt’ uden at foretage sådanne ændringer, skal du bare fortsætte som før og gøre det bedste med det, du har?

med andre ord, hvornår skal datakvalitetsprocesser implementeres (hvis overhovedet)?

Hvornår skal du gennemføre datakvalitetsforanstaltninger?

generelt skal datakvalitetskontrol og-foranstaltninger indføres, når der er et forretningsbehov, og når du har brug for at løse et specifikt problem. Og som vi alle ved, er der altid et forretningsbehov i en eller anden form, og der er altid noget at sigte efter. Ellers, hvad laver vi alle her?

her er et par grunde til, at du sandsynligvis vil være interesseret i at forbedre kvaliteten af dine data (eller burde være!):

1) Dine data er et vigtigt strategisk aktiv, der giver dig en konkurrencemæssig fordel, hvis den er nøjagtig og brugbar

2) du vil trække data fra forskellige kilder til et centralt datalager eller-lager, hvilket vil være ekstremt vanskeligt (hvis ikke umuligt) at gøre, hvis oplysningerne ikke er standardiseret

3) Du vil administrere dine stamdata mere effektivt

4) du planlægger at implementere et nyt system eller udføre en systemmigrering, for eksempel fra et ældre system eller ERP til et skybaseret system

når du har identificeret business case for at sætte datakvalitetsforanstaltninger på plads – eller overbevise andre i din organisation om behovet for-så skal datakvalitetsstyringsprocessen selv defineres. Men hvem er ansvarlig for det?

Hvem er involveret i datakvalitetsstyringsprocessen?

især to typer roller er kritiske for succesen med datakvalitetsprocessen, nemlig:

Dataforvaltere – de er involveret i profilering af dataene og oprettelse af regler for datastandardisering og rensning

Udviklere – de samarbejder med dataforvaltere og spiller en vigtig rolle i udformningen af datakvalitetsregler og udviklingsprocessen

begge disse roller bliver nødt til at arbejde tæt sammen gennem hele implementeringsprocessen, hvorefter dataforvalterne er ansvarlige for at overvåge kvaliteten af informationen.

hvad udgør en datakvalitetssikrings – / ledelsesproces?

selve processen omfatter visse faser, som især datakvalitetsanalytikere og datastyrere skal gennemføre, herunder:

Dataprofilering – på dette tidspunkt skal de undersøge dataene for at få en dybdegående forståelse og identificere problemer inden for den, som dem, der er skitseret tidligere (ufuldstændighed, unøjagtige osv.), før de opsummerer problemerne.

definition af metrics – for at få en ide om, hvor udbredt dataproblemerne er, samtidig med at de etablerer datakvalitetsbenchmarks, skal de registrere metrics som hvor meget af dataene der i øjeblikket er komplette (% komplet), hvor meget er konsistent (% konsistent), gyldig (% gyldig) og så videre.

fastsættelse af data – på dette tidspunkt, efter at problemer er blevet profileret og benchmarket, kan processen med at rense informationen og løse problemerne begynde.

men at foretage ændringer direkte i dataene udgør naturligvis en risiko, hvis de foreslåede ændringer i sig selv er forkerte. Dette ville føre til en meget rodet og forvirrende situation, der er endnu sværere at løse! Derfor er det bedst ikke at foretage ændringer direkte i databasen med det samme.

i stedet skal foreslåede ændringer opføres og detaljeres, inden de sendes til en dataforvalter til gennemgang, hvorefter de enten vil blive godkendt eller afvist.

udvikling af datakvalitetsbehov og spørgsmål at overveje

et af de uundgåelige aspekter ved at arbejde med information – især når det kommer til datakvalitetsstyring, forvaltning og styring – er, at det aldrig vil være en ‘en og færdig’ situation.

i stedet vil din organisations datakvalitetsbehov ændre sig over tid, og som et resultat heraf vil dine definerede regler også blive justeret over tid, især da dataforvalterne får en større forståelse af dataene, almindelige tilbagevendende problemer og hvordan man kan afbøde dem.

hvad mere er, data i sig selv står ikke stille. Statistikken i starten af denne blog viser, hvor ofte oplysninger som firmanavne, adresser og e-mail-adresser ændres og opdateres, mens nye datakilder også tilføjes, når tiden går, hvilket betyder, at behovet for forvaltning og styring fortsætter.

takket være organisationens skiftende behov og den ændrede karakter af selve dataene skal du også regelmæssigt stille dig selv spørgsmål for at sikre, at selvtilfredshed ikke kryber ind, og at du er proaktiv i modsætning til reaktiv.

for eksempel kan disse omfatte følgende:

  • forbedres kvaliteten af dine data faktisk over tid, og fungerer datastyringsprocessen derfor efter hensigten?
  • hvis kvaliteten ikke forbedres, skal reglerne opdateres? Opfylder de din organisations nuværende behov?
  • hvis og når nye datakilder tilføjes, gælder de eksisterende datakvalitetsregler stadig, eller skal de tilpasses i overensstemmelse hermed?

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.

lg