Vi har snakket mye om datakvalitet tidligere – inkludert kostnaden for dårlige data. Men til tross for en grunnleggende forståelse av datakvalitet, forstår mange fortsatt ikke helt hva som menes med «kvalitet».

er Det For eksempel en måte å måle den kvaliteten på, og i så fall hvordan gjør du det? I denne artikkelen vil vi være ute etter å svare på disse spørsmålene og mye mer. Men først …

Dispelling Datakvalitet Myter

decision-makers
grunnlaget for å sikre datakvalitet starter når grunnleggende krav opprettes

en av de største mytene om datakvalitet er at den må være helt feilfri. Med nettsteder og andre kampanjer som samler så mye data, er det nesten umulig å få null feil. I stedet må dataene bare være i samsvar med standardene som er satt for det. For å avgjøre hva «kvalitet» er, må vi først vite tre ting:

  1. hvem skaper kravene
  2. hvordan opprettes kravene, og
  3. hvilken breddegrad har vi når det gjelder å oppfylle disse kravene

Mange bedrifter har en enestående «data steward» som forstår og setter disse kravene, samt å være den personen som bestemmer toleransenivåene for feil. Hvis det ikke er noen dataforvalter, spiller det ofte rollen for å sikre at de som har ansvaret for dataene, forstår eventuelle mangler som kan påvirke det.

Du Kan Få Det Bra, Raskt eller Billig-Velg To

mcdonalds-junk-food

Alt fra å samle inn data til å gjøre det passer selskapets behov åpne den opp for potensielle feil. Å ha data som er 100% komplett og 100% nøyaktig er ikke bare uoverkommelig dyrt, men tidkrevende og knapt nudging ROI nålen.

med så mye data som kommer inn, må beslutninger gjøres og raskt. Derfor er datakvalitet i stor grad en delikat balansegang – sjonglering og bedømmelse av nøyaktighet og fullstendighet. Hvis det høres ut som en høy for å fylle, vil du være glad for å vite at det er en metode til galskapen, og det første trinnet er dataprofilering.

Hva Er Dataprofilering?

data-quality

dataprofilering innebærer å se på all informasjon i databasen din for å avgjøre om den er nøyaktig og / eller fullstendig, og hva du skal gjøre med oppføringer som ikke er. Det er ganske enkelt å for eksempel importere en database med produkter som firmaet produserer og sørge for at all informasjon er nøyaktig, men det er en annen historie når du importerer detaljer om konkurrentens produkter eller andre relaterte detaljer.

med dataprofilering ser du også på hvor nøyaktig dataene er. Hvis du har lansert på 7/1/16, registrerer systemet det som 1916 eller 2016? Det er mulig at du kan selv avdekke duplikater og andre problemer i å gre gjennom informasjonen du har fått. Profilering av dataene på denne måten gir oss et utgangspunkt – et springbrett å hoppe fra for å sikre at informasjonen vi bruker er av best mulig kvalitet.

Bestemme Datakvalitet

så nå som vi har et utgangspunkt for å avgjøre om informasjonen vår er fullstendig og nøyaktig, blir neste spørsmål – hva gjør vi når vi finner feil eller problemer? Vanligvis kan du gjøre en av fire ting:

  • Godta Feilen – hvis Den faller innenfor en akseptabel standard (dvs. Main Street i Stedet For Main St) kan du bestemme deg for å godta det og gå videre til neste oppføring.
  • Avvis Feilen-noen ganger, spesielt med dataimport, er informasjonen så alvorlig skadet eller feil at det ville være bedre å bare slette oppføringen helt enn å prøve å rette den.
  • Korriger Feilen-Feilstavinger av kundenavn er en vanlig feil som lett kan korrigeres. Hvis det er variasjoner på et navn, kan du angi en som «Master» og beholde dataene konsolidert og riktig på tvers av alle databasene.
  • Opprett En Standardverdi – hvis du ikke vet verdien, kan det være bedre å ha noe der (ukjent eller n / a) enn ingenting i det hele tatt.

Integrering Av Dataene

når du har de samme dataene på tvers av ulike databaser, er muligheten moden for feil og duplikater. Det første skrittet mot vellykket integrasjon er å se hvor dataene er og deretter kombinere dataene på en måte som er konsistent. Her kan det være svært verdifullt å investere i velprøvde verktøy for datakvalitet og nøyaktighet for å koordinere og synkronisere informasjon på tvers av databaser.

Sjekkliste For Datakvalitet

clean-data

Til Slutt, fordi du arbeider med så mye data på tvers av så mange forskjellige områder, er det nyttig å ha en sjekkliste for å fastslå at du arbeider med den høyeste kvaliteten på data mulig. DAMA UK har laget en utmerket guide på «data dimensjoner» som kan brukes til å bedre få hele bildet på hvordan datakvalitet er avgjort.

datakvalitetsdimensjonene omfatter:

Fullstendighet-en prosentandel av data som inneholder en eller flere verdier. Det er viktig at kritiske data(for eksempel kundenavn, telefonnumre, e-postadresser, etc.) fullføres først siden fullstendighet ikke påvirker ikke-kritiske data så mye.

Unikhet-når målt mot andre datasett, er det bare en oppføring av sitt slag.

Aktualitet – hvor stor innvirkning har dato og klokkeslett på dataene? Dette kan være tidligere salg, produktlanseringer eller informasjon som er avhengig av over en periode for å være nøyaktig.

Gyldighet-samsvarer dataene med de respektive standardene som er satt for det?

Nøyaktighet-hvor godt reflekterer dataene den virkelige personen eller tingen som er identifisert av den?

Konsistens – hvor godt samsvarer dataene med et forutbestemt mønster? Fødselsdatoer deler et felles konsistensproblem, siden i USA er standarden MM / DD / ÅÅÅÅ, mens I Europa og andre områder er bruken AV DD / MM / ÅÅÅÅ standard.

Det Store Bildet på Datakvalitet

Som du kan se, er det ingen «one size fits all» tilnærming til å opprettholde nøyaktighet og fullstendighet på alle typer data for hver bedrift. Og med big datas appetitt for informasjon vokser mer og mer hver dag, blir det viktigere enn noensinne å takle datakvalitetsproblemer head-on. Selv om det kan virke overveldende, er det verdt å anskaffe data hygiene verktøy for å la datamaskiner gjøre det de gjør best-knase tall.

det viktigste trinnet du kan ta er bare å komme i gang. Dataene vil alltid vokse etter hvert som flere prospekter kommer om bord og nye markeder blir oppdaget, så det kommer aldri til å være en «beste tid» for å takle datakvalitetsproblemer. Tar tid nå å kartlegge hva datakvalitet betyr for din bedrift eller organisasjon kan skape en ringvirkninger av forbedret kundeservice, en bedre kundeopplevelse, en høyere konverteringsfrekvens og lengre kundelojalitet – og det er den slags avkastning på investeringen som enhver bedrift vil helhjertet omfavne!

Om Forfatteren: Sherice Jacob hjelper bedriftseiere forbedre webdesign og øke konverteringsfrekvenser gjennom overbevisende copywriting, brukervennlig design og smart analytics analyse. Lær mer på iElectrify.com og laste ned gratis web kopi tune-up og konvertering sjekkliste i dag!

Øk trafikken

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.

lg