Los algoritmos de clasificación de animales y los agentes de Go-playing dominan el ciclo de publicidad de la IA, pero los algoritmos son solo una parte de todo el ecosistema de productos de datos. En la mayoría de los entornos empresariales, los modelos podrían representar la menor cantidad de impacto. Debe existir un gran ecosistema de soporte para que los datos fluyan por las venas de su organización:

  1. Los eventos y transacciones sin procesar deben recopilarse, almacenarse y servirse
  2. Los datos deben procesarse, descubrirse y compartirse con los equipos pertinentes.Los modelos
  3. deben construirse, desplegarse y supervisarse en producción.

Y todas estas empresas deben producir resultados comerciales concretos. ¿Cómo debe una organización priorizar entre miles de direcciones potenciales?

En Insight, donde hemos ayudado a miles de becarios a realizar la transición a diversos roles en la industria de los datos, vemos un aumento en la demanda de gerentes de producto de la industria que pueden abordar estos desafíos de priorización y coordinación entre los equipos de datos. Este artículo tiene como objetivo explicar cómo se ve la gestión de productos en el espacio de datos y por qué es importante.

¿Por qué la Gestión de Productos de Datos?

En equipos de datos pequeños sin PMs formal, es probable que las responsabilidades estándar de los productos, como la evaluación de oportunidades, el trazado de rutas y la gestión de partes interesadas, sean realizadas por gerentes técnicos y colaboradores individuales (IC). Esto no se escala bien por muchas razones, las cuatro principales son:

  1. El trabajo del producto termina contabilizando todo el tiempo del CI.
  2. No todos los circuitos integrados están bien equipados o dispuestos a manejar el trabajo del producto a escala.
  3. Se amplían las brechas entre las unidades de negocio y los equipos técnicos.
  4. Se amplían las brechas entre los equipos técnicos individuales.

En este punto de inflexión, hay dos respuestas potenciales. El primer enfoque es dividir el trabajo en proyectos que sean lo suficientemente autónomos como para que un solo CI o un pequeño equipo técnico manejen de extremo a extremo, reduciendo la necesidad de algún tipo de coordinadores centrales.

El segundo enfoque es crear una organización de gestión de productos formal que sea responsable de mantener hojas de ruta de fuentes de verdad y coordinar los diferentes equipos e IC para su ejecución. Esto es especialmente común para productos altamente multifuncionales, como el comercio electrónico y los servicios bajo demanda.

Si es posible que un solo CI realice ajustes en un producto, obtenga información objetiva de inmediato sobre su rendimiento y retroceda en el peor de los casos sin ramificaciones importantes, el primer enfoque es extremadamente potente. Si bien esto podría funcionar para un producto de red social gratuito, es potencialmente catastrófico para un producto de pago y operación pesada, como los servicios bajo demanda. La mayoría de las empresas a escala, en última instancia, optan por el segundo enfoque de tener una organización de productos.

El Estado de los roles de Gestión de Productos de Datos

En los primeros días de la revolución de los datos, las habilidades de datos ortogonales, como ingeniería de software, estadísticas y modelado, se agruparon bajo el mismo paraguas de la ciencia de datos. Estas habilidades se están formalizando rápidamente en roles separados, como ingenieros de datos, científicos de datos, científicos de investigación e ingenieros de aprendizaje automático.

Dentro de la gestión de productos, una tendencia similar está tomando forma. Al igual que sus contrapartes técnicas, vemos que el amplio conjunto de PMs de datos se divide aún más en subáreas: infraestructura, análisis, ML / AI aplicada, descubrimiento y estandarización, y plataforma. Estos no son necesariamente títulos formales de Data PM en este momento. Más bien, reflejan áreas relativamente distintas de trabajo de productos de datos.

Si bien cada caso de uso de datos requiere un tipo ligeramente diferente de comprensión técnica y de dominio, que abordamos a continuación, es importante enfatizar que las habilidades generalistas de gestión de productos siguen siendo los impulsores más importantes del éxito. el 90% de lo que hace un PM de datos en el día a día seguirá siendo la priorización, las comunicaciones, la gestión de las partes interesadas, el diseño y las especificaciones.

Infraestructura

A escala, los equipos de productos individuales tendrán diferentes casos de uso y requisitos de datos. La tendencia natural de estos equipos es construir sus propias infraestructuras de datos para comenzar rápidamente. Esta tendencia conduce a trabajo duplicado, silos de datos y, en última instancia, los equipos se encontrarán con problemas similares de escalabilidad de datos.

El entregable definitivo para un PM de infraestructura es una infraestructura de datos común que recopila, almacena y procesa datos relevantes de manera eficiente para permitir casos de uso inactivos. Esta infraestructura común ayuda a los equipos a centrarse en usar, en lugar de recopilar y almacenar datos sin procesar.

Los principales KPI de infraestructura de PMs son la disponibilidad de datos, la escalabilidad y la fiabilidad. Están bien versados en tecnologías de ingeniería de datos, como la ingestión de datos, el procesamiento por lotes y en tiempo real, el sistema de archivos y la entrega.

Analytics

Las decisiones en el lugar de trabajo moderno se basan cada vez más en datos. El análisis debe respaldar una amplia gama de decisiones, desde la estrategia hasta el producto y las operaciones, tanto fuera de línea como en tiempo real. Mientras que el PMs de infraestructura garantiza que las consultas se puedan ejecutar de manera eficiente en conjuntos de datos masivos (el cómo), el PMs de análisis se centra en cómo convertir dichos datos sin procesar en información procesable para los responsables de la toma de decisiones, como ejecutivos, PMs y equipos de operaciones. En otros casos, los PMS de analytics también participan activamente en la definición de indicadores clave de rendimiento y en la exploración de datos para ayudar a recomendar decisiones empresariales.

En el contexto de la creación de productos, un PM de analytics es responsable de crear una mezcla de análisis de autoservicio, paneles personalizados y herramientas de informes para ayudar a mostrar y compartir información en toda la organización. Sus partes interesadas son diversas, desde expertos científicos de datos hasta consumidores de solo lectura como ejecutivos.

Los KPI que están viendo son el número probable de consultas ejecutadas, informes generados, etc. que indican la facilidad con que los usuarios de datos extraen la información que necesitan de los datos sin procesar.

ML / AI aplicado

Ciertos productos y características como búsqueda, recomendación,detección de fraude, etc. se prestan naturalmente a las soluciones de ML / AI. Piense en cómo se pueden aprovechar los datos para mejorar un producto existente (por ejemplo, analizar los registros de chat para automatizar el enrutamiento del servicio al cliente) o cómo diseñar una experiencia completamente nueva con inteligencia artificial avanzada (por ejemplo, filtros para aplicaciones para compartir fotos). En última instancia, todos trabajan para mejorar directamente las métricas clave para una función orientada al usuario.

Los PMs que trabajan en estas características, aunque no siempre se denominan Data PM, generalmente tienen una sólida comprensión del flujo de trabajo de ciencia de datos y los modelos de aprendizaje automático subyacentes. Tienen una fuerte intuición sobre cómo aprovechar el poder del aprendizaje automático mientras diseñan alrededor de sus limitaciones para ofrecer una experiencia de usuario superior en comparación con los enfoques basados en reglas.

Plataformas

A medida que una empresa crece en tamaño, la necesidad de marcos estandarizados se hace más evidente, particularmente en la experimentación y el aprendizaje automático. Los casos de uso en estos dos flujos de trabajo a menudo están muy estrechamente integrados con la naturaleza del producto en sí, por lo que pocas soluciones de código abierto pueden satisfacer realmente las necesidades de todos.

Por esta razón, los equipos de datos individuales en grandes empresas comenzaron con sus propios sistemas únicos, lo que llevó a la duplicación de trabajo y a un tiempo de comercialización más lento. Así, Google, Facebook y Uber se han embarcado en plataformas: marcos comunes para ayudar a reducir los esfuerzos invertidos en tareas comunes como herramientas, implementación y monitoreo.

Estas plataformas tienen como objetivo abstraer la necesidad de administrar datos, implementar y monitorear resultados, liberando a los equipos de datos para que se centren en iterar alrededor de los modelos y las experimentaciones en sí. También promueven la reutilización al hacer que los datos y las funciones comunes sean accesibles para todos los usuarios de la plataforma.

Plataforma PMs comience demostrando cómo la plataforma podría ser útil y convencer a los primeros usuarios para que la prueben. Una vez que la plataforma ha alcanzado el punto de inflexión, el rol cambia a identificar denominadores comunes de alto retorno de la inversión para construir en la plataforma. Miran KPI como modelos o experimentaciones que se ejecutan en la plataforma, el tiempo promedio de comercialización, etc.

Estandarización y descubrimiento

La estandarización y descubrimiento es otro problema con el crecimiento de los equipos de datos. A medida que una empresa crece, la cantidad de datos creados por equipos individuales y personas también crece exponencialmente. Esta rápida generación de datos crea un problema en el que no hay un lugar central para ver todos los datos que existen en una organización.

Sin una estructura para documentar, centralizar y mostrar metadatos, el conocimiento institucional de las fuentes de datos se limita a los propietarios de los datos. No está claro qué significan realmente los datos, de dónde provienen, qué tan confiables son, etc. Además, cualquier conocimiento de estos aspectos de las fuentes de datos desaparece cuando los empleados más familiarizados con esos datos abandonan el equipo. Otro problema común es que los equipos que usan los mismos datos a menudo definen métricas que suenan similares de manera diferente. Por ejemplo, un equipo puede definir los últimos 7 días como los últimos 7 días completos, mientras que otro equipo puede definirlos como las últimas 168 horas.

Un módulo de estandarización y descubrimiento de datos es responsable de garantizar que toda la organización conozca los datos que existen y los use de una manera definida de manera consistente. Una manifestación común de producto de este esfuerzo es un catálogo de datos o un portal de datos que facilita el descubrimiento y la definición de datos / paneles / métricas, así como identifica a los propietarios de datos con los que se puede contactar para conversaciones posteriores. Una versión más avanzada de un puerto de datos también hace que las métricas calculadas sean fácilmente accesibles e incorporadas en diferentes casos de uso (modelado, análisis).

Palabras finales

El panorama de la gestión de productos de datos sigue evolucionando y esto no es en absoluto una descripción exhaustiva de los roles de productos de datos disponibles en la industria. Dependiendo de la etapa y la estructura organizativa de una empresa, el rol de Data PM podría ser una mezcla de estas diferentes responsabilidades. El análisis puede ser parte de la Infraestructura, y la estandarización y el descubrimiento pueden ser parte de la Plataforma. Como PM de ML aplicado, es posible que se vea privado de recursos para crear la infraestructura y los entornos de implementación necesarios para producir su modelo.

En última instancia, estos roles se reducen a crear una valiosa experiencia de usuario basada en datos y eliminar todos los obstáculos que impiden que un equipo entregue ese valor.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

lg