am vorbit mult despre calitatea datelor în trecut – inclusiv costul datelor proaste. Dar, în ciuda unei înțelegeri de bază a calității datelor, mulți oameni încă nu înțeleg exact ce se înțelege prin „calitate”.

de exemplu, există o modalitate de a măsura această calitate și, dacă da, cum o faceți? În acest articol, vom căuta să răspundem la aceste întrebări și multe altele. Dar mai întâi …

risipirea miturilor calității datelor

decision-makers
Fundația pentru asigurarea calității datelor începe atunci când sunt create cerințe de bază

unul dintre cele mai mari mituri despre calitatea datelor este că trebuie să fie complet fără erori. Cu site-urile web și alte campanii care colectează atât de multe date, obținerea de erori zero este aproape imposibilă. În schimb, datele trebuie doar să se conformeze standardelor stabilite pentru acestea. Pentru a determina ce este „calitatea”, trebuie mai întâi să știm trei lucruri:

  1. cine creează cerințele
  2. cum sunt create cerințele și
  3. ce grad de latitudine avem în ceea ce privește îndeplinirea acestor cerințe

multe companii au un „administrator de date” singular care înțelege și stabilește aceste cerințe, precum și persoana care determină nivelurile de toleranță pentru erori. Dacă nu există un administrator de date, acesta joacă adesea rolul de a se asigura că cei responsabili de date înțeleg orice deficiențe care le pot afecta.

puteți avea bine, rapid sau ieftin-alege două

mcdonalds-junk-food

Totul, de la colectarea datelor până la adaptarea nevoilor companiei, deschide-le până la potențiale erori. A avea date 100% complete și 100% exacte nu este doar prohibitiv de scump, ci consumă mult timp și abia împinge acul ROI.

cu atât de multe date care vin, deciziile trebuie luate rapid. De aceea, calitatea datelor este foarte mult un act delicat de echilibrare – jonglarea și judecarea acurateței și completitudinii. Dacă sună ca o comandă înaltă de completat, veți fi bucuroși să știți că există o metodă pentru nebunie, iar primul pas este profilarea datelor.

ce este profilarea datelor?

data-quality

profilarea datelor implică analizarea tuturor informațiilor din baza dvs. de date pentru a determina dacă sunt corecte și/sau complete și ce să faceți cu intrările care nu sunt. Este destul de simplu, de exemplu, să importați o bază de date cu produse pe care compania dvs. le produce și să vă asigurați că toate informațiile sunt exacte, dar este o poveste diferită atunci când importați detalii despre produsele concurentului sau alte detalii conexe.

cu profilarea datelor, vă uitați și la cât de exacte sunt datele. Dacă ați lansat pe 7/1/16, sistemul Înregistrează acest lucru ca 1916 sau 2016? Este posibil ca s-ar putea descoperi chiar duplicate și alte probleme în pieptănare prin informațiile pe care le-ați obținut. Profilarea datelor în acest fel ne oferă un punct de plecare – o rampă de lansare pentru a ne asigura că informațiile pe care le folosim sunt de cea mai bună calitate posibilă.

determinarea calității datelor

deci, acum că avem un punct de plecare de la care să determinăm dacă informațiile noastre sunt complete și corecte, următoarea întrebare devine – ce facem când găsim erori sau probleme? De obicei, puteți face unul din cele patru lucruri:

  • acceptați eroarea – dacă se încadrează într-un standard acceptabil (adică. Main Street în loc de Main St) puteți decide să o acceptați și să treceți la următoarea intrare.
  • respingeți eroarea-uneori, în special în cazul importurilor de date, informațiile sunt atât de grav deteriorate sau incorecte încât ar fi mai bine să ștergeți pur și simplu intrarea decât să încercați să o corectați.
  • corectați eroarea – greșelile de ortografie ale numelor clienților sunt o eroare obișnuită care poate fi corectată cu ușurință. Dacă există variații pe un nume, puteți seta unul ca „Master” și să păstreze datele consolidate și corecte în toate bazele de date.
  • creați o valoare implicită – dacă nu cunoașteți valoarea, poate fi mai bine să aveți ceva acolo (necunoscut sau n/A) decât nimic.

integrarea datelor

când aveți aceleași date în diferite baze de date, oportunitatea este coaptă pentru erori și duplicate. Primul pas spre integrarea cu succes este să vedem unde sunt datele și apoi să combinăm aceste date într-un mod consecvent. Aici poate fi extrem de util să investiți în instrumente dovedite de calitate și precizie a datelor pentru a ajuta la coordonarea și sincronizarea informațiilor între bazele de date.

Lista de verificare a calității datelor

clean-data

în cele din urmă, deoarece aveți de-a face cu atât de multe date în atât de multe domenii diferite, este util să aveți o listă de verificare pentru a determina că lucrați cu cea mai înaltă calitate a datelor posibile. DAMA UK a creat un ghid excelent privind „dimensiunile datelor”, care poate fi folosit pentru a obține o imagine mai bună asupra modului în care se decide calitatea datelor.

dimensiunile lor de calitate a datelor includ:

completitudine – un procent de date care include una sau mai multe valori. Este important ca datele critice (cum ar fi numele clienților, numerele de telefon, adresele de e-mail etc.) să fie completat mai întâi, deoarece completitudinea nu afectează atât de mult datele non-critice.

unicitate – când este măsurată în raport cu alte seturi de date, există o singură intrare de acest gen.

actualitatea – cât de mult de un impact data și ora au asupra datelor? Acestea ar putea fi vânzări anterioare, lansări de produse sau orice informații pe care se bazează pe o perioadă de timp pentru a fi corecte.

validitate – datele sunt conforme cu standardele respective stabilite pentru aceasta?

acuratețe – cât de bine reflectă datele persoana sau lucrul din lumea reală care este identificat de acesta?

consecvență – cât de bine se aliniază datele cu un model preconceput? Datele de naștere au o problemă comună de consistență, deoarece în SUA, standardul este ll/zz/aaaa, în timp ce în Europa și în alte domenii, utilizarea ZZ/LL / AAAA este standard.

imaginea de ansamblu asupra calității datelor

după cum puteți vedea, nu există o abordare „unică pentru toți” pentru a menține acuratețea și completitudinea fiecărui tip de date pentru fiecare afacere. Și cu apetitul big data pentru informații crescând din ce în ce mai mult în fiecare zi, devine din ce în ce mai important ca niciodată să abordăm problemele de calitate a datelor. Deși poate părea copleșitor, merită să se înroleze instrumente de igienă a datelor pentru a permite computerelor să facă ceea ce fac cel mai bine – numerele de criză.

cel mai important pas pe care îl puteți face este pur și simplu să începeți. Datele vor crește întotdeauna pe măsură ce vor apărea mai multe perspective și vor fi descoperite noi piețe, astfel încât nu va exista niciodată un „cel mai bun moment” pentru a aborda problemele de calitate a datelor. Luând timp acum pentru a mapa ce înseamnă calitatea datelor pentru compania sau organizația dvs. poate crea un efect de undă de servicii îmbunătățite pentru clienți, o experiență mai bună a clienților, o rată de conversie mai mare și o retenție mai lungă a clienților – și acestea sunt tipurile de rentabilități ale investițiilor pe care orice afacere le va îmbrățișa din toată inima!

despre autor: Sherice Jacob îi ajută pe proprietarii de afaceri să îmbunătățească designul site-ului web și să crească ratele de conversie prin Copywriting convingător, design ușor de utilizat și analiză inteligentă. Aflați mai multe la iElectrify.com și descărca gratuit copie web tune – up și lista de verificare de conversie de azi!

creșteți traficul

Lasă un răspuns

Adresa ta de email nu va fi publicată.

lg