probleme de calitate a datelor

dacă citiți acest lucru, este probabil pentru că întâmpinați probleme de calitate a datelor chiar în acest moment. Putem fi destul de încrezători în această prezumție, deoarece, adevărul este că multe organizații au probleme cu datele lor care le împiedică să își atingă obiectivele.

uitați-vă la câteva dintre cifrele de mai jos de la ZoomInfo care arată cât de răspândită este problema datelor murdare:

  • 33% de afaceri au peste 100.000 de înregistrări în baza lor de date
  • 62% Din organizații se bazează pe date prospect care este de până la 40% inexacte
  • 34% Din companii schimba numele lor anual
  • 15% din conduce conținea date duplicat
  • 7% din conduce conținea adrese de e-mail/fizice nevalide
  • 40% din obiectivele de afaceri fail din cauza datelor inexacte
  • 50% din bugetele IT sunt cheltuite pentru reabilitarea datelor
  • datele proaste costă companiile americane mai mult de 611 miliarde USD în fiecare an

(Sursa: https://blog.zoominfo.com/the-effect-of-dirty-data-on-roi/)

deci, cel puțin nu ești singur. Întrebarea este ce poți face în legătură cu asta? Ce măsuri puteți lua pentru a vă îmbunătăți calitatea datelor și, de asemenea, pentru a remedia procesele de gestionare a calității datelor, astfel încât să nu suferiți de aceleași probleme în continuare?

cele mai frecvente 6 Probleme de calitate a datelor care împiedică organizația dvs.

de mai jos sunt cele mai frecvente probleme de calitate a datelor cu care se confruntă majoritatea organizațiilor, cele care vă vor împiedica să obțineți cea mai mare valoare din informațiile dvs.:

1) incompletitudine: în cazul în care lipsesc informații cruciale

2) inexactitate: toate informațiile pot fi ‘prezente’ (sau câmpurile de date completate), dar ar putea fi introduse în câmpul greșit, scrise incorect sau câmpul conține o valoare nedorită

3) inconsecvență: datele care ar trebui prezentate cu aceeași valoare / format sunt inconsistente (de exemplu, folosind valute diferite în loc de aceeași)

4) invaliditate: câmpurile sunt complete, dar cu date care nu pot fi corecte în acest context (de ex. „unități disponibile” care afișează o valoare minus)

5) redundanță: unde aceleași date sunt introduse de mai multe ori, dar exprimate în moduri ușor diferite (de exemplu, introducerea aceleiași companii, dar cu nume diferite, introducerea numelui unei persoane în moduri diferite etc.)

6) date Non-standard: informații care sunt introduse folosind formate non-standard (sau formate care nu pot fi procesate de sistem, de exemplu procentaj, mai degrabă decât %)

în timp ce aceste probleme de calitate a datelor sunt departe de a fi ideale, sunt suficiente pentru a justifica efortul de a face modificări angro ale modului în care organizația dvs. își gestionează datele? Dacă afacerea poate funcționa’ în mod adecvat ‘ fără a face astfel de schimbări, ar trebui să continuați ca înainte și să faceți tot ce este mai bun cu ceea ce aveți?

cu alte cuvinte, când ar trebui implementate procesele de calitate a datelor (dacă este cazul)?

când trebuie să implementați măsuri de calitate a datelor?

în general, controalele și măsurile de calitate a datelor ar trebui puse în aplicare atunci când există o nevoie de afaceri și când trebuie să rezolvați o problemă specifică. Și, după cum știm cu toții, există întotdeauna o nevoie de afaceri într-o formă sau alta, și există întotdeauna ceva pentru a urmări. Altfel, ce facem cu toții aici?

iată câteva motive pentru care este posibil să fiți interesat de îmbunătățirea calității datelor dvs. (sau ar trebui să fie!):

1) datele dvs. reprezintă un atu strategic major care vă va oferi un avantaj competitiv dacă sunt exacte și utilizabile

2) doriți să atrageți date din surse disparate într-un singur depozit central de date sau depozit, ceea ce va fi extrem de dificil (dacă nu chiar imposibil) de făcut dacă informațiile nu sunt standardizate

3) doriți să vă gestionați datele principale mai eficient

4) intenționați să implementați un sistem nou sau efectuați o migrare a sistemului, de exemplu de la un sistem vechi sau ERP la un sistem bazat pe cloud

după ce ați identificat caz de afaceri pentru punerea în aplicare a măsurilor de calitate a datelor – sau a convins pe alții din organizația dvs. de necesitatea de a – atunci procesul de management al calității datelor în sine va trebui definit. Dar cine e responsabil pentru asta?

cine este implicat în procesul de management al calității datelor?

două tipuri de roluri, în special, sunt esențiale pentru succesul procesului de calitate a datelor, și anume:

data stewards – sunt implicați în profilarea datelor și crearea de reguli pentru standardizarea datelor și curățarea dezvoltatorilor

– colaborează cu data stewards și joacă un rol important în proiectarea regulilor de calitate a datelor și în procesul de dezvoltare

ambele roluri vor trebui să colaboreze îndeaproape pe tot parcursul procesului de implementare, după care data stewards va fi responsabil pentru monitorizarea calității informațiilor.

ce constituie un proces de asigurare / gestionare a calității datelor?

procesul în sine include anumite etape pe care analiștii de calitate a datelor și administratorii de date, în special, vor trebui să le finalizeze, inclusiv:

profilarea datelor – în acest moment, vor trebui să exploreze datele pentru a obține o înțelegere aprofundată și pentru a identifica problemele din cadrul acestuia, cum ar fi cele prezentate anterior (incompletitudine, inexacte etc.) înainte de a rezuma problemele.

definirea valorilor – pentru a vă face o idee despre cât de răspândite sunt problemele de date, stabilind în același timp repere de calitate a datelor, vor trebui să înregistreze valori precum cât de multe date sunt în prezent complete (% complete), cât de consistente (% consistente), valide (% valide) și așa mai departe.

fixarea datelor – în acest moment, după ce problemele au fost profilate și evaluate, procesul de curățare a informațiilor și remedierea problemelor poate începe.

cu toate acestea, modificarea directă a datelor prezintă în mod evident un risc dacă modificările sugerate sunt incorecte. Acest lucru ar duce la o situație foarte dezordonată și confuză, care este și mai greu de remediat! Prin urmare, este mai bine să nu faceți modificări direct în baza de date imediat.

în schimb, modificările propuse ar trebui să fie enumerate și detaliate înainte de a fi transmise unui administrator de date pentru revizuire, după care vor fi aprobate sau respinse.

evoluția nevoilor de calitate a datelor și a întrebărilor care trebuie luate în considerare

unul dintre aspectele inevitabile ale lucrului cu informațiile – în special atunci când vine vorba de gestionarea calității datelor, gestionarea și guvernanța – este că nu va fi niciodată o situație unică și făcută.

în schimb, nevoile de calitate a datelor organizației dvs. se vor schimba în timp și, ca urmare, regulile dvs. definite vor fi, de asemenea, reajustate în timp, mai ales că administratorii de date dobândesc o mai bună înțelegere a datelor, a problemelor comune recurente și a modului de atenuare a acestora.

mai mult, datele în sine nu stau nemișcate. Statisticile de la începutul acestui blog arată cât de des se schimbă și se actualizează informații precum numele companiilor, adresele și adresele de e-mail, în timp ce noi surse de date vor fi adăugate și pe măsură ce trece timpul, ceea ce înseamnă că nevoia de administrare și guvernare va continua.

datorită nevoilor în schimbare ale organizației și naturii schimbătoare a datelor în sine, va trebui, de asemenea, să vă puneți periodic întrebări pentru a vă asigura că satisfacția nu se strecoară și că sunteți proactiv, spre deosebire de reactiv.

de exemplu, acestea pot include următoarele:

  • calitatea datelor dvs. se îmbunătățește efectiv în timp și, prin urmare, procesul de gestionare a datelor funcționează conform destinației?
  • dacă calitatea nu se îmbunătățește, trebuie actualizate Regulile? Satisfac nevoile actuale ale organizației tale?
  • dacă și când se adaugă noi surse de date, se aplică în continuare normele existente privind calitatea datelor sau vor trebui adaptate în consecință?

Lasă un răspuns

Adresa ta de email nu va fi publicată.

lg