Hemos hablado mucho sobre la calidad de los datos en el pasado, incluido el costo de los datos incorrectos. Pero a pesar de una comprensión básica de la calidad de los datos, muchas personas todavía no entienden exactamente lo que se entiende por «calidad».

Por ejemplo, ¿hay alguna forma de medir esa calidad y, de ser así, cómo se hace? En este artículo, buscaremos responder a esas preguntas y mucho más. Pero primero

Disipar Mitos sobre la Calidad de los Datos

decision-makers
La base para garantizar la calidad de los datos comienza cuando se crean los requisitos básicos

Uno de los mayores mitos sobre la calidad de los datos es que debe estar completamente libre de errores. Con sitios web y otras campañas que recopilan tantos datos, obtener cero errores es casi imposible. En cambio, los datos sólo debe ajustarse a los estándares que se han establecido para ello. Para determinar qué es «calidad», primero necesitamos saber tres cosas:

  1. Quién crea los requisitos
  2. Cómo se crean los requisitos, y
  3. Qué grado de latitud tenemos en términos de cumplir con esos requisitos

Muchas empresas tienen un «administrador de datos» singular que entiende y establece estos requisitos, además de ser la persona que determina los niveles de tolerancia para errores. Si no hay un administrador de datos, a menudo desempeña el papel de asegurarse de que los responsables de los datos comprendan cualquier deficiencia que pueda afectarlos.

Puedes Tenerlo Bueno, Rápido o Barato-Elige Dos

mcdonalds-junk-food

Todo, desde recopilar los datos hasta adaptarlos a las necesidades de la empresa, los abre a posibles errores. Tener datos 100% completos y 100% precisos no solo es prohibitivamente costoso, sino que consume mucho tiempo y apenas empuja la aguja del ROI.

Con tantos datos que llegan, las decisiones deben tomarse rápidamente. Es por eso que la calidad de los datos es un delicado acto de equilibrio: hacer malabares y juzgar la precisión y la integridad. Si suena como una tarea difícil de cumplir, te alegrará saber que hay un método para la locura, y el primer paso es el perfil de datos.

¿Qué es el Perfil de datos?

data-quality

La elaboración de perfiles de datos implica examinar toda la información de su base de datos para determinar si es precisa y/o completa, y qué hacer con las entradas que no lo son. Es bastante sencillo, por ejemplo, importar una base de datos de productos que fabrica su empresa y asegurarse de que toda la información sea exacta, pero es una historia diferente cuando importa detalles sobre productos de la competencia u otros detalles relacionados.

Con la creación de perfiles de datos, también está observando cuán precisos son los datos. Si se lanzó el 7/1/16, ¿el sistema lo registra como 1916 o 2016? Es posible que incluso pueda descubrir duplicados y otros problemas al revisar la información que ha obtenido. Perfilar los datos de esta manera nos da un punto de partida, un trampolín desde el que saltar para asegurarnos de que la información que estamos utilizando sea de la mejor calidad posible.

Determinar la calidad de los datos

Así que ahora que tenemos un punto de partida desde el que determinar si nuestra información es completa y precisa, la siguiente pregunta es: ¿qué hacemos cuando encontramos errores o problemas? Por lo general, puedes hacer una de cuatro cosas:

  • Aceptar el Error-Si cae dentro de un estándar aceptable (p. ej. Calle Principal en lugar de Calle Principal) puede decidir aceptarla y pasar a la siguiente entrada.
  • Rechazar el error-A veces, particularmente con las importaciones de datos, la información está tan dañada o incorrecta que sería mejor simplemente eliminar la entrada por completo que tratar de corregirla.
  • Corregir el error: Los errores ortográficos de los nombres de los clientes son un error común que se puede corregir fácilmente. Si hay variaciones en un nombre, puede establecer uno como el «Maestro» y mantener los datos consolidados y correctos en todas las bases de datos.
  • Cree un valor predeterminado: Si no conoce el valor, puede ser mejor tener algo allí (desconocido o n / a) que nada en absoluto.

Integración de los datos

Cuando tiene los mismos datos en diferentes bases de datos, la oportunidad está madura para errores y duplicados. El primer paso hacia una integración exitosa es ver dónde están los datos y luego combinarlos de manera consistente. En este caso, puede valer la pena invertir en herramientas de calidad y precisión de datos comprobadas para ayudar a coordinar y sincronizar la información entre las bases de datos.

Su Lista de Control de Calidad de Datos

clean-data

Finalmente, debido a que está tratando con tantos datos en tantas áreas diferentes, es útil tener una lista de verificación para determinar que está trabajando con la más alta calidad de datos posible. DAMA UK ha creado una excelente guía sobre «dimensiones de datos» que se puede utilizar para obtener una mejor imagen completa de cómo se decide la calidad de los datos.

Sus dimensiones de calidad de datos incluyen:

Integridad: un porcentaje de datos que incluye uno o más valores. Es importante que los datos críticos (como nombres de clientes, números de teléfono, direcciones de correo electrónico, etc.) completarse primero, ya que la integridad no afecta mucho a los datos no críticos.

Unicidad-Cuando se compara con otros conjuntos de datos, solo hay una entrada de este tipo.

Puntualidad: ¿Cuánto impacto tienen la fecha y la hora en los datos? Esto podría ser ventas anteriores, lanzamientos de productos o cualquier información en la que se confíe durante un período de tiempo para ser precisa.

Validez: ¿Los datos se ajustan a los estándares respectivos establecidos para ellos?

Precisión: ¿Qué tan bien reflejan los datos la persona o cosa del mundo real que se identifica por ella?

Consistencia: ¿Qué tan bien se alinean los datos con un patrón preconcebido? Las fechas de nacimiento comparten un problema de consistencia común, ya que en los EE.UU., el estándar es MM/DD/AAAA, mientras que en Europa y otras áreas, el uso de DD/MM/AAAA es estándar.

El panorama general de la calidad de los datos

Como puede ver, no existe un enfoque de «talla única» para mantener la precisión y la integridad de cada tipo de datos para cada negocio. Y con el apetito de información de big data creciendo cada día más, cada vez es más importante que nunca abordar los problemas de calidad de los datos de frente. Aunque puede parecer abrumador, vale la pena contar con herramientas de higiene de datos para permitir que las computadoras hagan lo que mejor saben hacer: calcular números.

El paso más importante que puede dar es simplemente comenzar. Los datos siempre crecerán a medida que se incorporen más prospectos y se descubran nuevos mercados, por lo que nunca habrá un «mejor momento» para abordar los problemas de calidad de los datos. Tomarse el tiempo ahora para trazar lo que significa la calidad de los datos para su empresa u organización puede crear un efecto dominó de un mejor servicio al cliente, una mejor experiencia del cliente, una tasa de conversión más alta y una retención de clientes más prolongada, ¡y esos son los tipos de retorno de la inversión que cualquier empresa adoptará de todo corazón!

Sobre el autor: Sherice Jacob ayuda a los propietarios de negocios a mejorar el diseño de sitios web y aumentar las tasas de conversión a través de la redacción atractiva, el diseño fácil de usar y el análisis analítico inteligente. Obtenga más información en iElectrify.¡com y descargue su lista de verificación de conversión y ajuste de copia web gratuita hoy mismo!

Crecer su tráfico

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

lg