problémy s kvalitou údajů

Pokud čtete tento, je to pravděpodobně proto, že jste se setkali kvalita dat problémy v této chvíli v čase. Můžeme si být docela jisti touto domněnkou, protože pravdou je, že mnoho organizací má problémy se svými údaji, které jim brání v dosažení jejich cílů.

stačí se podívat na některé z níže uvedených čísel z ZoomInfo, které ukazují, jak rozšířený je problém “ špinavých dat:

  • 33% firmy si více než 100.000 záznamech v databázi
  • 62% organizací spoléhají na vyhlídku data, která je až o 40% nepřesné
  • 34% firem, změnit jejich jména, jednou ročně
  • 15% vede obsahoval duplicitní data
  • 7% vede obsažené neplatné e-mail/fyzické adresy
  • 40% obchodních cílů nezdaří z důvodu nepřesných údajů
  • 50% IT rozpočtů jsou vynakládány na data rehabilitace
  • Špatná data stojí AMERICKÉ firmy více než $611bn každý rok

(Zdroj: https://blog.zoominfo.com/the-effect-of-dirty-data-on-roi/)

takže aspoň nejsi sám. Otázkou je, co s tím můžete dělat? Jaké kroky můžete podniknout, aby zlepšit kvalitu dat, a také opravit vaše data procesů řízení kvality, takže nemusíte trpět stejné problémy dál?

6 nejčastější otázky kvality údajů, které brání vaší organizaci

Níže jsou nejčastější otázky kvality údajů, že většina organizací zkušenosti, ty, které vás zastavit od získání největší hodnotu z vaší informace:

1) Neúplnost: kde zásadní kusy informací, chybí

2) Nepřesnost: všechny informace, může být přítomen (nebo datová pole vyplněno), ale mohlo by to být zadán ve špatném terénu, napsáno nesprávně, nebo pole obsahuje nezdravé hodnota

3) Nekonzistence: data, která by měla být prezentována se stejnou hodnotou / formát je nekonzistentní (např. použití různých měn namísto stejný po)

4) Invalidita: pole jsou kompletní, ale s daty, která nemůže být správné v této souvislosti (např. „jednotky k dispozici“ zobrazuje mínus hodnota)

5) Nadbytečnost: kdy stejné údaje je zapsána vícekrát, ale vyjádřil v mírně odlišné způsoby (např. zadání stejné společnosti, ale s různými názvy, zadáním jméno osoby různými způsoby, atd.)

6) nestandardní údaje: informace, které je vstup pomocí non-standardních formátů (nebo formátů, které mohou být zpracovány v systému, například procento spíše než %)

Zatímco tyto údaje problémy s kvalitou jsou daleko od ideálu, jsou dost překážkou k ospravedlnění bude snaha dělat velkoobchodní změny na způsob, jakým vaše organizace spravuje svá data? Pokud podnik může fungovat „přiměřeně“ bez provedení takových změn, měli byste pokračovat jako dříve a dělat to nejlepší s tím, co máte?

jinými slovy, kdy by měly být implementovány procesy kvality dat(pokud vůbec)?

kdy byste měli implementovat opatření kvality dat?

obecně řečeno, kontroly kvality dat a opatření by měla být zavedena, když je potřeba podnikání a když potřebujete vyřešit konkrétní problém. A jak všichni víme, vždy existuje obchodní potřeba v té či oné podobě a vždy je na co se zaměřit. Jinak, co tady všichni děláme?

zde je několik důvodů, proč budete pravděpodobně mít zájem na zlepšení kvality vašich dat (nebo by měla být!):

1) Vaše data je významným strategickým aktivem, které vám poskytne konkurenční výhodu, pokud je to přesné a použitelné

2) chcete čerpat data z různých zdrojů do jednoho centrálního datového skladu nebo úložiště, které bude velmi obtížné (pokud ne nemožné), aby, pokud informace není standardizované

3), který chcete spravovat kmenová data efektivněji

4) Plánujete zavést nový systém, nebo provést migraci systému, například z dědictví nebo systému ERP pro cloud-based systém,

Jakmile jste identifikovali obchodní případ pro zavedení opatření pro kvalitu dat – nebo přesvědčit ostatní ve vaší organizaci o potřebě-pak bude třeba definovat samotný proces řízení kvality dat. Ale kdo je za to zodpovědný?

kdo je zapojen do procesu řízení kvality dat?

pro úspěch procesu kvality dat jsou rozhodující zejména dva typy rolí, a to:

Údajů správci – jsou zapojeny v profilování dat a vytvoření pravidel pro data, standardizace a čištění

Vývojáři – spolupracují s datovými stevardy a hrají důležitou roli při navrhování pravidel pro kvalitu údajů a proces vývoje

Obě tyto role bude muset úzce spolupracovat v průběhu celého procesu implementace, po kterém údajů správci bude zodpovědný za sledování kvality informací.

co představuje proces zabezpečení / řízení kvality dat?

samotný proces zahrnuje několik etap, které na kvalitu údajů analytiků a datových stewardů zejména bude třeba dokončit, včetně:

Data profilování – v tomto bodě, je třeba zkoumat data s cílem získat in-hluboké porozumění a identifikovat problémy v něm, jako ty, je uvedeno dříve (neúplnost, nepřesné, atd.), než shrnující otázky.

Definování metriky – chcete-li získat představu o tom, jak rozšířená data jsou problémy, zatímco také stanovení data měřítek kvality, budou muset zaznamenávat metriky, jako je, kolik dat je v současné době complete (dokončeno%), jak moc je konzistentní (% konzistentní), platné (% platné), a tak dále.

Oprava dat – v tomto okamžiku, poté, co byly problémy profilovány a porovnány, může začít proces čištění informací a opravy problémů.

provedení změn přímo v datech však zjevně představuje riziko, pokud jsou navrhované změny samy o sobě nesprávné. To by vedlo k velmi chaotické a matoucí situaci, která je ještě těžší opravit! Proto je nejlepší neprovádět žádné změny přímo v databázi.

Místo, navrhované změny by měly být uvedeny a podrobně předtím, než je předána data steward za recenzi, po které se bude buď schválen, nebo zamítnut.

Vyvíjející se kvality údajů, potřeby a otázky, aby zvážila

Jedním z nevyhnutelné aspekty práce s informacemi – zejména pokud jde o řízení kvality dat, správcovství, správa a řízení je, že to bude nikdy být ‚jednou a dost‘ situace.

Místo toho, vaše organizace je kvalita údajů potřeb se v průběhu času mění, a jako výsledek této své definovaných pravidel bude také být upravena v průběhu času, zejména pokud údajů správci získat větší pochopení dat, běžné, opakující se problémy a jak je zmírnit.

a co víc, data sama o sobě nestojí. Statistiky na začátku tohoto blogu ukazují, jak často se mění a aktualizují informace, jako jsou názvy společností, adresy a e-mailové adresy, zatímco postupem času budou také přidány nové zdroje dat, což znamená, že potřeba správy a správy bude pokračovat.

Díky měnícím se potřebám organizace, a měnící se povahu samotná data, budete také muset pravidelně zeptejte se sami sebe otázky, aby se ujistil, že sebeuspokojení není úchyl a že jsi proaktivní, nikoli reaktivní.

například tyto mohou zahrnovat následující:

  • Je kvalita dat skutečně zlepšit v průběhu času, a proto je správa dat proces pracuje, jak bylo zamýšleno?
  • pokud se kvalita nezlepšuje, je třeba pravidla aktualizovat? Splňují aktuální potřeby vaší organizace?
  • pokud jsou přidány nové zdroje dat, platí stále stávající pravidla kvality dat, nebo je třeba je odpovídajícím způsobem upravit?

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.

lg