v minulosti jsme hodně mluvili o kvalitě dat-včetně nákladů na špatná data. Ale i přes základní chápání kvality dat mnoho lidí stále nechápe, co přesně znamená „kvalita“.

existuje například způsob, jak měřit tuto kvalitu, a pokud ano, jak to děláte? V tomto článku se budeme snažit odpovědět na tyto otázky a mnohem více. Ale první…

Rozptýlení Kvality Dat Mýty

decision-makers
základem pro zajištění kvality dat začíná, když základní požadavky jsou vytvořeny

Jeden z největších mýtů o datové kvality je, že musí být zcela bez chyb. S webovými stránkami a dalšími kampaněmi, které shromažďují tolik dat, získání nulových chyb je téměř nemožné. Místo toho musí data odpovídat pouze standardům, které pro ně byly nastaveny. Abychom zjistili, co je „kvalita“, musíme nejprve vědět tři věci:

  1. Který vytváří požadavky
  2. Jak jsou požadavky vytvořeny, a
  3. Co se stupeň zeměpisné šířky máme, pokud jde o splnění těchto požadavků

Mnohé podniky mají singulární „data steward“, který chápe a určuje tyto požadavky, stejně jako osoba, která určuje toleranci pro chyby. Pokud neexistuje žádný správce dat, často hraje roli při zajišťování toho, aby osoby odpovědné za data pochopily jakékoli nedostatky, které by je mohly ovlivnit.

Můžete Mít To Dobré, Rychlé, nebo Levné – Vybrat Dva

mcdonalds-junk-food

Vše od sběru dat k tomu, aby se vešly do společnosti potřebuje otevřít, aby se potenciální chyby. Mít data, která jsou 100% kompletní a 100% přesná, je nejen neúměrně drahé, ale časově náročné a sotva pošťuchování jehly ROI.

s tolika daty přicházejícími, rozhodnutí musí být učiněna a rychle. To je důvod, proč je kvalita dat velmi delikátní vyvažovací akt-žonglování a posuzování přesnosti a úplnosti. Pokud to zní jako vysoký příkaz k vyplnění, budete rádi, když víte,že existuje metoda šílenství, a prvním krokem je profilování dat.

co je profilování údajů?

data-quality

profilování dat zahrnuje prohlížení všech informací ve vaší databázi, abyste zjistili, zda jsou přesné a / nebo úplné a co dělat se záznamy, které nejsou. Je to poměrně jednoduché, například, import databáze produktů, které vaše firma vyrábí, a ujistěte se, že všechny informace jsou přesné, ale to je jiný příběh, když importujete údaje o konkurenční produkty nebo jiné související detaily.

s profilováním dat se také díváte na to, jak přesná jsou data. Pokud jste spustili na 7/1/16, zaznamenává to systém jako 1916 nebo 2016? Je možné, že můžete dokonce odhalit duplikáty a další problémy při česání informací, které jste získali. Profilování data tímto způsobem nám dává výchozí bod – můstek ke skoku z ujistěte se, že informace používáme je v nejlepší možné kvalitě.

Určování Kvality Dat

Takže teď, že máme výchozí bod, ze kterého chcete určit, zda naše informace jsou úplné a přesné, další otázka – co budeme dělat, když jsme našli chyby nebo problémy? Obvykle můžete udělat jednu ze čtyř věcí:

  • přijměte chybu – pokud spadá do přijatelného standardu (tj. Hlavní ulice místo hlavního St) můžete se rozhodnout ji přijmout a přejít k dalšímu vstupu.
  • Odmítnout Chyba – Někdy, zejména s importy dat, informace, tak vážně poškozen, nebo nesprávné, že by bylo lepší, aby jednoduše odstranit položku úplně, než se snažit to napravit.
  • Opravte chybu – překlepy jmen zákazníků jsou běžnou chybou, kterou lze snadno opravit. Pokud existují rozdíly v názvu, můžete jej nastavit jako „Master“ a udržovat data konsolidovaná a správná ve všech databázích.
  • vytvořte výchozí hodnotu-pokud ji neznáte, může být lepší mít tam něco (neznámé nebo n / A) než vůbec nic.

integrace dat

pokud máte stejná data v různých databázích, příležitost je zralá na chyby a duplikáty. Prvním krokem k úspěšné integraci je zjistit, kde jsou data, a poté je kombinovat způsobem, který je konzistentní. Zde může být nesmírně užitečné investovat do osvědčených nástrojů kvality a přesnosti dat, které pomáhají koordinovat a synchronizovat informace v databázích.

Vaše Data Kontrolní seznam Kvality

clean-data

Konečně, protože máte co do činění s tolik dat napříč mnoha různých oblastech, to je užitečné mít kontrolní seznam k určení, že pracujete s nejvyšší kvalitou dat možné. Společnost DAMA UK vytvořila vynikajícího průvodce „rozměry dat“, který lze použít k lepšímu získání úplného obrazu o tom, jak se rozhoduje o kvalitě dat.

jejich rozměry kvality dat zahrnují:

úplnost-procento dat, které obsahuje jednu nebo více hodnot. Je důležité, aby kritická data (například jména zákazníků, telefonní čísla, e-mailové adresy atd.) být dokončen jako první, protože úplnost nemá vliv na nekritická data tolik.

jedinečnost-při měření proti jiným souborům dat existuje pouze jeden záznam svého druhu.

včasnost-jak velký dopad má datum a čas na data? Mohlo by to být předchozí prodej, uvedení produktu na trh nebo jakékoli informace, na které se po určitou dobu spoléhá, aby byly přesné.

platnost-odpovídají údaje příslušným standardům, které jsou pro ně stanoveny?

přesnost-jak dobře data odrážejí skutečnou osobu nebo věc, která je identifikována?

konzistence-jak dobře se data sladí s předpojatým vzorem? Data narození sdílejí společný problém s konzistencí, protože v USA je standard MM / DD / rrrr, zatímco v Evropě a dalších oblastech je použití DD / MM / RRRR standardní.

The Big Picture on Data Quality

jak můžete vidět, neexistuje žádný přístup „one size fits all“ k udržení přesnosti a úplnosti každého typu dat pro každou firmu. A vzhledem k tomu, že chuť big data k informacím roste každým dnem stále více,je stále důležitější než kdy jindy řešit problémy s kvalitou dat. I když se to může zdát ohromující, stojí za to získat nástroje pro hygienu dat, které umožňují počítačům dělat to, co umí nejlépe-čísla crunch.

nejdůležitějším krokem, který můžete udělat, je jednoduše začít. Data budou vždy růst, jak se objeví další vyhlídky a objeví se nové trhy,takže nikdy nebude „nejlepší čas“ na řešení problémů s kvalitou dat. Čas nyní zmapovat, co se kvality údajů znamená pro vaši společnost nebo organizaci, můžete vytvořit dominový efekt zlepšené služby zákazníkům, lepší zkušenosti zákazníků, vyšší míra konverze a delší udržení zákazníků – a ty jsou druhy návratnost investic, že podnikání bude bezvýhradně přijmout!

O Autorovi: Sherice Jacob pomáhá podnikatelů, zlepšení designu webových stránek a zvýšení míry konverze přes přesvědčivý copywriting, uživatelsky příjemný design a inteligentní analytics analýzy. Více se dozvíte na iElectrify.com a stáhněte si zdarma webové kopie tune-up a konverze kontrolní seznam ještě dnes!

Rozšiřte svůj provoz

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.

lg