wiele mówiliśmy o jakości danych w przeszłości – w tym o kosztach złych danych. Ale pomimo podstawowego zrozumienia jakości danych, Wiele osób nadal nie do końca rozumie, co dokładnie oznacza „jakość”.

na przykład, czy istnieje sposób na zmierzenie tej jakości, a jeśli tak, to jak to zrobić? W tym artykule będziemy szukać odpowiedzi na te pytania i wiele więcej. Ale najpierw …

Obalanie mitów dotyczących jakości danych

decision-makers
podstawa zapewnienia jakości danych zaczyna się w momencie tworzenia podstawowych wymagań

jednym z największych mitów na temat jakości danych jest to, że musi być całkowicie wolna od błędów. Ponieważ strony internetowe i inne kampanie gromadzą tak dużo danych, uzyskanie zerowych błędów jest prawie niemożliwe. Zamiast tego dane muszą być zgodne tylko ze standardami, które zostały dla nich ustalone. Aby określić ,czym jest „jakość”, musimy najpierw wiedzieć trzy rzeczy:

  1. kto tworzy wymagania
  2. jak są tworzone wymagania i
  3. jaki mamy stopień swobody, jeśli chodzi o spełnienie tych wymagań

wiele firm ma pojedynczego „administratora danych”, który rozumie i ustala te wymagania, a także jest osobą, która określa poziomy tolerancji na błędy. Jeśli nie ma stewarda danych, często odgrywa rolę w upewnianiu się, że osoby odpowiedzialne za dane rozumieją wszelkie niedociągnięcia, które mogą na nie wpływać.

możesz mieć to dobrze, szybko lub tanio-wybierz dwa

mcdonalds-junk-food

Wszystko, od zbierania danych po dopasowanie ich do potrzeb firmy, otwiera ją na potencjalne błędy. Posiadanie danych, które są w 100% kompletne i w 100% dokładne, jest nie tylko zbyt drogie, ale i czasochłonne i ledwo pchające igłę ROI.

przy tak dużej ilości danych trzeba szybko podejmować decyzje. Dlatego jakość danych jest bardzo delikatnym działaniem równoważącym-żonglowaniem i ocenianiem dokładności i kompletności. Jeśli brzmi to jak wysokie zamówienie do wypełnienia, z przyjemnością dowiesz się, że istnieje metoda szaleństwa, a pierwszym krokiem jest profilowanie danych.

co to jest profilowanie danych?

data-quality

profilowanie danych polega na przeglądaniu wszystkich informacji w bazie danych w celu ustalenia, czy są one dokładne i / lub kompletne oraz co zrobić z wpisami, które nie są. Na przykład zaimportowanie bazy danych produktów wytwarzanych przez Twoją firmę i upewnienie się, że wszystkie informacje są dokładne, jest dość proste, ale to inna historia, gdy importujesz szczegóły dotyczące produktów konkurencji lub inne powiązane szczegóły.

dzięki profilowaniu danych sprawdzasz również dokładność danych. Jeśli uruchomiłeś 7/1/16, czy system zapisuje to jako 1916 lub 2016? Możliwe, że możesz nawet odkryć duplikaty i inne problemy związane z przeczesywaniem uzyskanych informacji. Profilowanie danych w ten sposób daje nam punkt wyjścia – odskocznię, z której możemy skakać, upewniając się, że informacje, których używamy, są najlepszej możliwej jakości.

określanie jakości danych

teraz, gdy mamy punkt wyjścia do ustalenia, czy nasze informacje są kompletne i dokładne, pojawia się kolejne pytanie – co robimy, gdy znajdziemy błędy lub problemy? Zazwyczaj można zrobić jedną z czterech rzeczy:

  • zaakceptować błąd-jeśli mieści się w akceptowalnym standardzie (tj. Główna ulica zamiast głównej ulicy) możesz zdecydować się na jej zaakceptowanie i przejść do następnego wpisu.
  • Odrzuć błąd-czasami, szczególnie przy imporcie danych, informacje są tak poważnie uszkodzone lub nieprawidłowe, że lepiej byłoby po prostu całkowicie usunąć wpis niż spróbować go poprawić.
  • Popraw błąd-błędy w pisowni nazw klientów są częstym błędem, który można łatwo poprawić. Jeśli istnieją odmiany nazwy, możesz ustawić ją jako „Master” i zachować dane skonsolidowane i poprawne we wszystkich bazach danych.
  • Utwórz wartość domyślną-jeśli nie znasz tej wartości, może być lepiej mieć tam coś (nieznanego lub n / a) niż nic.

Integracja danych

gdy masz te same dane w różnych bazach danych, istnieje możliwość wystąpienia błędów i duplikatów. Pierwszym krokiem do pomyślnej integracji jest sprawdzenie, gdzie znajdują się dane, a następnie połączenie tych danych w sposób spójny. W tym przypadku warto zainwestować w sprawdzone narzędzia do zapewniania jakości i dokładności danych, które pomagają koordynować i synchronizować informacje w bazach danych.

Twoja lista kontrolna jakości danych

clean-data

wreszcie, ponieważ masz do czynienia z tak dużą ilością danych w wielu różnych obszarach, pomocne jest posiadanie listy kontrolnej, aby określić, że pracujesz z najwyższą możliwą jakością danych. DAMA UK stworzyła doskonały przewodnik na temat „wymiarów danych”, który można wykorzystać, aby lepiej uzyskać pełny obraz tego, jak decyduje się jakość danych.

ich wymiary jakości danych obejmują:

kompletność – procent danych, który zawiera jedną lub więcej wartości. Ważne jest, aby krytyczne dane (takie jak nazwy klientów, numery telefonów, adresy e-mail itp.) być uzupełniane jako pierwsze, ponieważ kompletność nie ma tak dużego wpływu na niekrytyczne dane.

unikalność-przy pomiarze w stosunku do innych zbiorów danych, istnieje tylko jeden wpis tego rodzaju.

aktualność-jak duży wpływ ma Data i godzina na dane? Może to być poprzednia sprzedaż, premiery produktów lub wszelkie informacje, na których opiera się w określonym czasie, aby były dokładne.

ważność-czy dane są zgodne z określonymi dla nich normami?

dokładność-jak dobrze dane odzwierciedlają rzeczywistą osobę lub rzecz, która jest przez nią identyfikowana?

spójność-jak dobrze dopasowują się dane do z góry przyjętego wzorca? Daty urodzenia mają wspólny problem ze spójnością, ponieważ w USA standardem jest MM / DD/RRRR, podczas gdy w Europie i innych obszarach standardem jest użycie DD/MM / RRRR.

duży obraz jakości danych

jak widać, nie ma jednego uniwersalnego podejścia do zachowania dokładności i kompletności każdego rodzaju danych dla każdej firmy. A ponieważ apetyt na informacje big data rośnie z dnia na dzień, coraz ważniejsze staje się rozwiązywanie problemów związanych z jakością danych. Chociaż może to wydawać się przytłaczające, warto wykorzystać narzędzia do higieny danych, aby komputery mogły robić to, co robią najlepiej – chrupać liczby.

najważniejszym krokiem, jaki możesz zrobić, jest po prostu rozpoczęcie pracy. Dane zawsze będą rosły, gdy pojawi się więcej perspektyw i pojawią się nowe rynki, więc nigdy nie będzie „najlepszego czasu” na rozwiązanie problemów z jakością danych. Poświęcenie czasu teraz na mapowanie, co jakość danych oznacza dla Twojej firmy lub organizacji, może stworzyć efekt tętnienia lepszej obsługi klienta, lepszego doświadczenia klienta, wyższego współczynnika konwersji i dłuższego zatrzymywania klientów-i są to rodzaje zwrotów z inwestycji, które każda firma z całego serca obejmie!

o autorze: Sherice Jacob pomaga właścicielom firm ulepszyć projektowanie stron internetowych i zwiększyć współczynniki konwersji dzięki atrakcyjnemu copywritingowi, przyjaznemu dla użytkownika projektowi i inteligentnej analizie analitycznej. Dowiedz się więcej na iElectrify.com i pobierz darmową listę kontrolną dostrojenia i konwersji już dziś!

Zwiększ swój ruch

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.

lg