우리는 과거에 잘못된 데이터의 비용을 포함하여 데이터 품질에 대해 많이 이야기했습니다. 그러나 데이터 품질에 대한 기본적인 이해에도 불구하고 많은 사람들은 여전히”품질”이 정확히 무엇을 의미하는지 이해하지 못합니다.

예를 들어,그 품질을 측정 할 수있는 방법이 있습니까? 이 글에서,우리는 그 질문 및 훨씬 더 답변을 찾고 있습니다. 하지만 먼저…

decision-makers
데이터 품질을 보장하는 토대는 기본 요구 사항이 생성 될 때 시작됩니다

데이터 품질에 대한 가장 큰 신화 중 하나는 완전히 오류가 없어야한다는 것입니다. 너무 많은 데이터를 수집하는 웹 사이트 및 기타 캠페인으로,제로 오류를 얻는 것은 불가능 옆에 있습니다. 대신,데이터만 그것에 대 한 설정 된 표준을 준수 해야 합니다. “품질”이 무엇인지 결정하기 위해,우리는 먼저 세 가지를 알아야합니다:

  1. 요구 사항을 생성하는 사람
  2. 요구 사항은 어떻게 생성되며,
  3. 이러한 요구 사항을 충족하는 측면에서 우리는 어느 정도의 위도를 가지고 있습니까

많은 비즈니스에는 이러한 요구 사항을 이해하고 설정하는 유일한”데이터 청지기”가 있으며 오류에 대한 허용 수준을 결정하는 사람입니다. 데이터 관리자가없는 경우,종종 데이터를 담당하는 사람들이 영향을 미칠 수있는 단점을 이해하도록하는 역할을합니다.

당신은 좋은,빠른 또는 싼 가질 수 있습니다-두 가지를 선택

mcdonalds-junk-food

데이터를 수집하는 것부터 회사의 요구에 맞게 만드는 것까지 모든 것이 잠재적 인 오류까지 열어줍니다. 100%완전하고 100%정확한 데이터를 갖는 것은 엄청나게 비쌀 뿐만 아니라 시간이 많이 걸리고 투자 수익 바늘을 간신히 유도합니다.

너무 많은 데이터가 들어 오면 결정을 신속하게 내려야합니다. 데이터 품질이 매우 섬세한 균형 행위 이유-저글링 및 정확성과 완전성을 판단. 이 채우기 위해 키가 큰 순서처럼 들린다면,당신은 광기에 방법이 있다는 것을 알고 드리겠습니다,그리고 첫 번째 단계는 데이터 프로파일 링입니다.

데이터 프로파일링이란?

data-quality

데이터 프로파일링은 데이터베이스의 모든 정보를 검토하여 정확 및/또는 완전한지,그렇지 않은 항목에 대해 수행할 작업을 결정하는 것입니다. 예를 들어 회사가 제조하는 제품 데이터베이스를 가져 와서 모든 정보가 정확한지 확인하는 것은 매우 간단하지만 경쟁 업체의 제품 또는 기타 관련 세부 정보에 대한 세부 정보를 가져올 때는 다른 이야기입니다.

데이터 프로파일 링을 사용하면 데이터가 얼마나 정확한지 알 수 있습니다. 7/1/16 에 출시 한 경우 시스템에서 1916 또는 2016 으로 기록합니까? 너가 조차 너가 얻은 정보를 통해서 빗질하기안에 중복 그리고 다른 문제점을 폭로할지도 모른다 고 가능하다. 이러한 방식으로 데이터를 프로파일링하면 사용 중인 정보가 최상의 품질인지 확인할 수 있는 출발점이 됩니다.

데이터 품질 결정

이제 우리는 우리의 정보가 완전하고 정확한지 확인하는 출발점을 가지고,다음 질문이된다-우리가 오류 또는 문제를 발견 할 때 우리는 무엇을해야합니까? 일반적으로 다음 네 가지 중 하나를 수행 할 수 있습니다:

  • 허용 가능한 표준(예:)에 해당하는 경우 오류를 수락합니다 대신 메인 스트리트의 메인 스트리트)당신은 그것을 받아 다음 항목으로 이동 결정할 수 있습니다.
  • 오류 거부-특히 데이터 가져오기의 경우 정보가 너무 심하게 손상되거나 올바르지 않아 항목을 수정하는 것보다 항목을 완전히 삭제하는 것이 좋습니다.
  • 오류 수정-고객 이름의 철자 오류는 쉽게 수정할 수있는 일반적인 오류입니다. 이름에 변형이 있는 경우 이름을”마스터”로 설정하고 모든 데이터베이스에서 데이터를 통합하고 올바른 상태로 유지할 수 있습니다.
  • 기본값 만들기-값을 모르는 경우 아무것도 아닌 것보다 거기에 뭔가(알 수 없거나 해당 없음)있는 것이 더 좋을 수 있습니다.

데이터 통합

서로 다른 데이터베이스에 동일한 데이터가 있는 경우 오류 및 중복이 발생할 가능성이 높습니다. 성공적인 통합을 향한 첫 번째 단계는 데이터의 위치를 확인한 다음 일관된 방식으로 데이터를 결합하는 것입니다. 여기에서 검증 된 데이터 품질 및 정확성 도구에 투자하여 데이터베이스 간의 정보를 조정하고 동기화하는 것이 매우 가치가 있습니다.

데이터 품질 체크리스트

clean-data

마지막으로,너무 많은 다른 영역에 걸쳐 너무 많은 데이터를 다루고 있기 때문에,그것은 당신이 가능한 데이터의 최고 품질로 작업하고 있는지 확인하는 체크리스트를 가지고하는 것이 도움이. 다마 영국은 더 나은 데이터 품질이 결정되는 방법에 대한 전체 그림을 얻기 위해 사용할 수있는”데이터 차원”에 대한 훌륭한 가이드를 만들었습니다.

완전성–하나 이상의 값을 포함하는 데이터의 백분율입니다. 중요한 데이터(고객 이름,전화 번호,이메일 주소 등)가 중요합니다.)완전성이 중요하지 않은 데이터에 그다지 영향을 미치지 않기 때문에 먼저 완료해야합니다.

고유성-다른 데이터 세트에 대해 측정 할 때 그 종류의 항목은 하나뿐입니다.

적시성-날짜와 시간이 데이터에 미치는 영향은 어느 정도입니까? 이 이전 판매,제품 출시 또는 정확 하 게 시간의 기간 동안 의존 하는 모든 정보를 수 있습니다.

유효성-데이터가 설정된 각 표준을 준수합니까?

정확도-데이터가 식별되는 실제 사람이나 사물을 얼마나 잘 반영합니까?

일관성-데이터가 선입견 패턴과 얼마나 잘 일치합니까? 생년월일은 일반적인 일관성 문제를 공유,이후 미국에서,표준은 월/일/년,반면 유럽 및 기타 지역에서,일/월/년의 사용이 표준입니다.

데이터 품질에 대한 큰 그림

보시다시피 모든 비즈니스에 대한 모든 유형의 데이터에 대한 정확성과 완전성을 유지하기 위한”하나의 크기에 맞는”접근 방식은 없습니다. 그리고 정보에 대한 빅 데이터의 식욕이 매일 점점 더 증가함에 따라 데이터 품질 문제를 정면으로 해결하는 것이 그 어느 때보 다 중요 해지고 있습니다. 압도적 인 것처럼 보일 수 있지만 컴퓨터가 가장 잘하는 일을 할 수 있도록 데이터 위생 도구를 입대 할 가치가 있습니다.

당신이 취할 수있는 가장 중요한 단계는 단순히 시작하는 것입니다. 더 많은 잠재 고객이 등장하고 새로운 시장이 발견됨에 따라 데이터는 항상 증가 할 것이므로 데이터 품질 문제를 해결할 수있는”가장 좋은시기”는 없을 것입니다. 데이터 품질이 기업이나 조직에 어떤 의미인지 파악하기 위해 시간을 내어 개선된 고객 서비스,더 나은 고객 경험,더 높은 전환율 및 더 긴 고객 유지의 파급 효과를 창출할 수 있습니다.

저자에 관하여:셰 리 스 야곱 도움이 비즈니스 소유자 웹사이트 디자인을 개선 하 고 매력적인 카피 라이팅,사용자 친화적인 디자인 및 스마트 분석 분석을 통해 전환율을 증가. 더 자세히 알아보기오늘 무료 웹 복사 튠업 및 변환 체크리스트를 다운로드하고 다운로드하십시오!

트래픽 증가

답글 남기기

이메일 주소는 공개되지 않습니다.

lg