Tierklassifizierungsalgorithmen und Go-Playing_agents dominieren den KI-Hype-Zyklus, aber Algorithmen sind nur ein Teil des gesamten Datenprodukt-Ökosystems. In den meisten Geschäftsumgebungen können die Modelle tatsächlich die geringste Auswirkung haben. Ein großes unterstützendes Ökosystem muss vorhanden sein, damit Daten durch die Adern Ihres Unternehmens fließen können:

  1. Rohe Ereignisse und Transaktionen müssen gesammelt, gespeichert und bereitgestellt werden
  2. Daten müssen verarbeitet, entdeckt und mit relevanten Teams geteilt werden.
  3. Modelle müssen in der Produktion erstellt, bereitgestellt und überwacht werden.

Und alle diese Unternehmen müssen konkrete Geschäftsergebnisse liefern. Wie sollte eine Organisation unter Tausenden von potenziellen Richtungen priorisieren?

Bei Insight, wo wir Tausenden von Fellows beim Übergang in verschiedene Rollen in der Datenindustrie geholfen haben, sehen wir einen Anstieg der Nachfrage der Industrie nach Produktmanagern, die diese Priorisierungs- und Koordinationsherausforderungen zwischen Datenteams bewältigen können. Dieser Artikel soll erklären, wie Produktmanagement im Datenraum aussieht und warum es wichtig ist.

Warum Datenproduktmanagement?

In kleinen Datenteams ohne formales PMs werden Standardproduktverantwortlichkeiten wie Opportunity Assessment, Road-Mapping und Stakeholder Management wahrscheinlich von technischen Managern und individuellen Mitwirkenden (IKs) übernommen. Dies skaliert aus vielen Gründen nicht gut, die vier wichtigsten sind:

  1. Die Produktarbeit macht letztendlich die gesamte Zeit des Kunden aus.
  2. Nicht alle ICs sind gut ausgestattet oder bereit, Produktarbeiten in großem Maßstab durchzuführen.
  3. Die Lücken zwischen Geschäftseinheiten und technischen Teams vergrößern sich.
  4. Die Lücken zwischen den einzelnen technischen Teams vergrößern sich.

An diesem Wendepunkt gibt es zwei mögliche Antworten. Der erste Ansatz besteht darin, die Arbeit in Projekte aufzuteilen, die für ein einzelnes IC oder ein kleines technisches Team eigenständig genug sind, um sie durchgängig abzuwickeln, wodurch der Bedarf an zentralen Koordinatoren verringert wird.

Der zweite Ansatz besteht darin, eine formale Produktmanagement-Organisation zu erstellen, die für die Pflege von Source-of-Truth-Roadmaps und die Koordination verschiedener Teams und ICs verantwortlich ist. Dies gilt insbesondere für hochgradig funktionsübergreifende Produkte wie E-Commerce und On-Demand-Dienste.

Wenn es einem einzelnen IC möglich ist, Anpassungen an einem Produkt vorzunehmen, sofort objektives Feedback zur Leistung zu erhalten und im schlimmsten Fall ohne größere Auswirkungen einen Rollback durchzuführen, ist der erste Ansatz äußerst leistungsfähig. Während dies für ein kostenloses soziales Netzwerkprodukt funktionieren könnte, ist es für ein kostenpflichtiges und betriebslastiges Produkt wie On-Demand-Dienste möglicherweise katastrophal. Die meisten Unternehmen in großem Maßstab entscheiden sich letztendlich für den zweiten Ansatz einer Produktorganisation.

Der Stand der Rollen im Datenproduktmanagement

In den frühen Tagen der Datenrevolution wurden orthogonale Datenkompetenzen wie Software Engineering, Statistik und Modellierung unter dem gleichen Dach der Datenwissenschaft zusammengefasst. Diese Fähigkeiten werden schnell in separate Rollen wie Data Engineers, Data Scientists, Research Scientists und ML Engineers formalisiert.

Im Produktmanagement zeichnet sich ein ähnlicher Trend ab. Wie ihre technischen Gegenstücke, Wir sehen, dass das breite Spektrum der Daten-PMs weiter in Teilbereiche unterteilt wird: infrastruktur, Analytik, angewandte ML / AI, Entdeckung und Standardisierung sowie Plattform. Dies sind im Moment nicht unbedingt formale Daten-PM-Titel. Vielmehr spiegeln sie relativ unterschiedliche Bereiche der Datenproduktarbeit wider.

Während jeder Datenanwendungsfall ein etwas anderes technisches und Domänenverständnis erfordert, auf das wir im Folgenden eingehen, ist es wichtig zu betonen, dass generalistische Produktmanagementfähigkeiten immer noch die wichtigsten Erfolgsfaktoren sind. 90% dessen, was ein Daten-PM täglich tut, sind weiterhin Priorisierung, Kommunikation, Stakeholder-Management, Design und Spezifikationen.

Infrastruktur

Im Maßstab haben einzelne Produktteams unterschiedliche Anwendungsfälle und Datenanforderungen. Die natürliche Tendenz dieser Teams besteht darin, eigene Dateninfrastrukturen aufzubauen, um schnell loszulegen. Diese Tendenz führt zu Doppelarbeit, Datensilos und letztendlich zu ähnlichen Problemen bei der Skalierbarkeit von Daten.

Das ultimative Ergebnis für ein Infrastruktur-PM ist eine gemeinsame Dateninfrastruktur, die relevante Daten auf performante Weise sammelt, speichert und verarbeitet, um neue Anwendungsfälle zu ermöglichen. Diese gemeinsame Infrastruktur hilft Teams, sich auf die Verwendung zu konzentrieren, anstatt Rohdaten zu sammeln und zu speichern.

Die wichtigsten KPIs von Infrastructure PMs sind Datenverfügbarkeit, Skalierbarkeit und Zuverlässigkeit. Sie sind versiert in Data Engineering-Technologien wie Datenaufnahme, Verarbeitung in Batch und Echtzeit, Dateisystem und Lieferung.

Analytics

Entscheidungen am modernen Arbeitsplatz werden zunehmend durch Daten beeinflusst. Analysen müssen eine Vielzahl von Entscheidungen unterstützen, von der Strategie über das Produkt bis hin zum Betrieb, sowohl offline als auch in Echtzeit. Während Infrastruktur-PMs sicherstellen, dass Abfragen effizient auf riesigen Datensätzen ausgeführt werden können (wie), konzentrieren sich Analytics-PMs darauf, wie solche Rohdaten in umsetzbare Erkenntnisse für Entscheidungsträger wie Führungskräfte, PMs und Ops-Teams umgewandelt werden können. In anderen Fällen sind Analytics-PMs auch aktiv an der Definition von Leistungskennzahlen und der Durchführung von Datenexplorationen beteiligt, um Geschäftsentscheidungen zu empfehlen.

Im Rahmen der Produktentwicklung ist ein Analytics-PM für die Erstellung einer Mischung aus Self-Service-Analysen, benutzerdefinierten Dashboards und Berichtstools verantwortlich, um Einblicke in ein Unternehmen zu gewinnen und auszutauschen. Ihre Stakeholder sind vielfältig, von versierten Datenwissenschaftlern bis hin zu schreibgeschützten Verbrauchern wie Führungskräften.

Die KPIs, die sie betrachten, sind die Anzahl der ausgeführten Abfragen, die generierten Berichte usw. dies zeigt, wie einfach Datennutzer die benötigten Erkenntnisse aus Rohdaten extrahieren können.

Angewandte ML / AI

Bestimmte Produkte und Funktionen wie Suche, Empfehlung, Betrugserkennung usw. eignen sich natürlich für ML / AI-Lösungen. Applied ML PMs Überlegen Sie, wie Daten genutzt werden können, um ein bestehendes Produkt zu verbessern (z. B. Chat-Protokolle analysieren, um das Kundenservice-Routing zu automatisieren) oder wie Sie mithilfe fortschrittlicher KI ein völlig neues Erlebnis gestalten können (z. B. Filter für Foto-Sharing-Apps). Letztendlich arbeiten sie alle daran, wichtige Metriken für eine benutzerorientierte Funktion direkt zu verbessern.

PMs, die an diesen Funktionen arbeiten, obwohl sie nicht immer als Daten-PM bezeichnet werden, verfügen im Allgemeinen über ein fundiertes Verständnis des Data-Science-Workflows und der zugrunde liegenden Machine-Learning-Modelle. Sie haben ein starkes Gespür dafür, die Leistungsfähigkeit von ML zu nutzen und gleichzeitig seine Grenzen zu umgehen, um eine überlegene Benutzererfahrung im Vergleich zu regelbasierten Ansätzen zu bieten.

Plattformen

Je größer ein Unternehmen wird, desto deutlicher wird der Bedarf an standardisierten Frameworks, insbesondere bei Experimenten und maschinellem Lernen. Die Anwendungsfälle in diesen beiden Workflows sind oft sehr eng mit der Natur des Produkts selbst verbunden, so dass nur wenige Open-Source-Lösungen wirklich die Bedürfnisse aller erfüllen können.

Aus diesem Grund begannen einzelne Datenteams in großen Unternehmen mit eigenen Einzelsystemen, was zu Doppelarbeit und langsamerer Markteinführungszeit führte. Google, Facebook und Uber haben daher mit dem Platforming begonnen: gemeinsame Frameworks zur Reduzierung des Aufwands für allgemeine Aufgaben wie Werkzeuge, Bereitstellung und Überwachung.

Diese Plattformen zielen darauf ab, die Notwendigkeit, Daten zu verwalten, bereitzustellen und Ergebnisse zu überwachen, zu abstrahieren, sodass sich die Datenteams stattdessen auf die Iteration der Modelle und der Experimente selbst konzentrieren können. Sie fördern auch die Wiederverwendbarkeit, indem sie gemeinsame Daten und Funktionen für alle Benutzer der Plattform zugänglich machen.

Plattform-PMs Testen Sie zunächst, wie nützlich die Plattform sein kann, und überzeugen Sie Early Adopters, sie auszuprobieren. Sobald die Plattform den Wendepunkt erreicht hat, verlagert sich die Rolle auf die Identifizierung gemeinsamer Nenner mit hohem ROI, die in die Plattform integriert werden sollen. Sie betrachten KPIs wie Modelle oder Experimente, die auf der Plattform ausgeführt werden, durchschnittliche Time-to-Market usw.

Standardisierung und Discovery

Standardisierung und Discovery ist ein weiteres Problem bei wachsenden Datenteams. Mit dem Wachstum eines Unternehmens wächst auch die Datenmenge, die von einzelnen Teams und Personen erstellt wird, exponentiell. Diese schnelle Ausgabe von Daten führt zu einem Problem, bei dem es keinen zentralen Ort gibt, an dem alle in einer Organisation vorhandenen Daten angezeigt werden können.

Ohne eine Struktur zum Dokumentieren, Zentralisieren und Anzeigen von Metadaten ist das institutionelle Wissen über Datenquellen auf die Dateneigentümer beschränkt. Es wird unklar, was die Daten eigentlich bedeuten, woher sie kommen, wie zuverlässig sie sind usw. Darüber hinaus verschwindet jegliches Wissen über diese Aspekte der Datenquellen, wenn die mit diesen Daten am besten vertrauten Mitarbeiter das Team verlassen. Ein weiteres häufiges Problem ist, dass Teams, die dieselben Daten verwenden, häufig ähnlich klingende Metriken unterschiedlich definieren. Zum Beispiel könnte ein Team last-7-day als letzte 7 volle Tage definieren, während ein anderes Team es als letzte 168 Stunden definieren könnte.

Ein Data Standardization and Discovery PM ist dafür verantwortlich, dass die gesamte Organisation Kenntnis von den vorhandenen Daten erhält und diese einheitlich definiert verwendet. Eine häufige Produktmanifestation dieser Bemühungen ist ein Datenkatalog oder ein Datenportal, das die Erkennung und Definition von Daten / Dashboards / Metriken erleichtert und Dateneigentümer identifiziert, die für weitere Gespräche kontaktiert werden können. Eine erweiterte Version eines Datenportals macht auch berechnete Metriken leicht zugänglich und über verschiedene Anwendungsfälle hinweg (Modellierung, Analyse) integriert.

Abschließende Worte

Die Datenproduktmanagementlandschaft befindet sich noch in der Entwicklung und dies ist keineswegs ein erschöpfender Überblick über die in der Industrie verfügbaren Datenproduktrollen. Je nach Stadium und Organisationsstruktur eines Unternehmens kann die Rolle des Datenmanagers eine Mischung aus diesen verschiedenen Verantwortlichkeiten sein. Analytik könnte ein Teil der Infrastruktur sein, und Standardisierung und Entdeckung könnte ein Teil der Plattform sein. Als Applied ML PM können Sie Ressourcen für den Aufbau der Infrastruktur und der Bereitstellungsumgebungen veräußern, die für die Produktivierung Ihres Modells erforderlich sind.

Letztendlich laufen diese Rollen darauf hinaus, eine wertvolle datenbasierte Benutzererfahrung zu schaffen und alle Hindernisse zu beseitigen, die ein Team daran hindern, diesen Wert zu liefern.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

lg