algoritmen voor Dierclassificatie en Go-playing_agents domineren de AI-hype-cyclus, maar algoritmen zijn slechts een deel van het hele ecosysteem van gegevensproducten. In de meeste zakelijke instellingen, de modellen kunnen eigenlijk goed voor de minste hoeveelheid impact. Er moet een groot ondersteunend ecosysteem zijn om data door de aderen van uw organisatie te laten stromen:

  1. ruwe gebeurtenissen en transacties moeten worden verzameld, opgeslagen en geserveerd
  2. gegevens moeten worden verwerkt, ontdekt en gedeeld met relevante teams.
  3. er moeten modellen worden gebouwd, geïmplementeerd en gemonitord in de productie.

en al deze ondernemingen moeten concrete bedrijfsresultaten opleveren. Hoe moet een organisatie prioriteit geven aan duizenden potentiële richtingen?

bij Insight, waar we duizenden Fellows hebben geholpen bij de overgang naar verschillende rollen in de data-industrie, zien we een toename in de vraag van de industrie naar productmanagers die deze prioritering en coördinatieproblemen tussen datateams kunnen aanpakken. Dit artikel is bedoeld om uit te leggen hoe product management eruit ziet in de dataruimte en waarom het belangrijk is.

Waarom Dataproductbeheer?

in kleine datateams zonder formele PMs worden standaardproductverantwoordelijkheden zoals opportuniteitsbeoordeling, routekaarten en stakeholderbeheer waarschijnlijk uitgevoerd door technische managers en individuele contribuanten (ICs). Dit schaalt niet goed om vele redenen, de vier belangrijkste zijn:

  1. Product werk eindigt goed voor alle van de IC ‘ s tijd.
  2. niet alle ICs zijn goed uitgerust of bereid om productwerk op grote schaal te verwerken.
  3. de kloof tussen business units en technische teams wordt groter.
  4. de verschillen tussen de afzonderlijke technische teams worden groter.

op dit buigpunt zijn er twee mogelijke reacties. De eerste aanpak is om het werk op te splitsen in projecten die op zichzelf voldoende zijn om één enkel IC of een klein technisch team voor end-to-end af te handelen, waardoor de behoefte aan een soort centrale coördinatoren afneemt.

de tweede aanpak is het creëren van een formele organisatie voor productbeheer die verantwoordelijk is voor het onderhouden van routekaarten voor bron-of-waarheid en het coördineren van de verschillende teams en ICs die moeten worden uitgevoerd. Dit is vooral gebruikelijk voor zeer cross-functionele producten zoals e-commerce en on-demand diensten.

als het mogelijk is voor één IC om aanpassingen aan een product aan te brengen, onmiddellijk objectieve feedback te krijgen over hoe het presteert, en terug te draaien in worst-case scenario ‘ s zonder grote vertakkingen, dan is de eerste benadering uiterst krachtig. Hoewel dit zou kunnen werken voor een gratis sociaal netwerk product, het is potentieel catastrofaal voor een betaalde en operatie-zware product zoals on-demand diensten. De meeste bedrijven op schaal uiteindelijk gaan met de tweede aanpak van het hebben van een productorganisatie.

The State of Data Product Management rollen

in de begindagen van de data revolutie werden orthogonale data vaardigheden zoals software engineering, statistiek en modellering gerold onder dezelfde paraplu van data science. Deze vaardigheden worden snel geformaliseerd in afzonderlijke rollen, zoals data engineers, data scientists, research scientists en ML engineers.

binnen productmanagement krijgt een soortgelijke trend vorm. Net als hun technische tegenhangers, zien we de brede paraplu van data PMs steeds verder verdeeld in sub-gebieden: infrastructuur, analytics, toegepaste ML / AI, ontdekking en standaardisatie, en platform. Dit zijn niet noodzakelijk formele data PM titels op het moment. Integendeel, ze weerspiegelen relatief verschillende gebieden van data product werk.

hoewel elke Data use case Een iets ander soort technische en domeinkennis vereist, die we hieronder bespreken, is het belangrijk om te benadrukken dat generalistische Product management vaardigheden nog steeds de belangrijkste aanjagers van succes zijn. 90% van wat een data PM doet op een dagelijkse basis zal nog steeds prioritering, communicatie, stakeholder management, ontwerp en specs.

Infrastructuur

op schaal zullen individuele productteams verschillende use cases en gegevensvereisten hebben. De natuurlijke neiging van deze teams is om hun eigen data-infrastructuren uit te bouwen om snel aan de slag te gaan. Deze tendens leidt tot dubbel werk, datasilo ‘ s, en uiteindelijk zullen teams in soortgelijke problemen met de schaalbaarheid van gegevens lopen.

de uiteindelijke levering voor een PM-infrastructuur is een gemeenschappelijke gegevensinfrastructuur die relevante gegevens op performante wijze verzamelt, opslaat en verwerkt om down use cases mogelijk te maken. Deze gemeenschappelijke infrastructuur helpt teams zich te concentreren op het gebruik in plaats van het verzamelen en opslaan van ruwe gegevens.De belangrijkste KPI’ s van Infrastructuur PMs zijn de beschikbaarheid, schaalbaarheid en betrouwbaarheid van gegevens. Ze zijn goed thuis in Data engineering technologieën zoals data inname, verwerking in batch en real-time, bestandssysteem en levering.

Analytics

beslissingen op de moderne werkplek worden steeds meer gebaseerd op gegevens. Analytics moet een breed scala aan beslissingen ondersteunen, van strategie tot product en ops, zowel offline als in real-time. Terwijl infrastructuur PMs ervoor zorgen dat query ‘ s efficiënt kunnen worden uitgevoerd op massale datasets (the how), richten analytics PMs zich op het omzetten van dergelijke ruwe gegevens in bruikbare inzichten voor besluitvormers zoals execs, PMs en ops team. In andere gevallen zijn Analytics PM ‘ s ook actief betrokken bij het definiëren van key performance indicators en het uitvoeren van data exploration om zakelijke beslissingen aan te bevelen.

in het kader van product building is een analytics PM verantwoordelijk voor het creëren van een mix van Self-service analytics, aangepaste dashboards en rapportagetools om inzicht te verzamelen en te delen in een organisatie. Hun stakeholders zijn divers, van slimme datawetenschappers tot alleen-lezen consumenten zoals execs.

de KPI ‘ s waar ze naar kijken zijn waarschijnlijk het aantal uitgevoerde queries, gegenereerde rapporten, enz. die aangeven hoe gemakkelijk data gebruikers de inzichten die ze nodig hebben uit ruwe data kunnen halen.

toegepast ML / AI

bepaalde producten en kenmerken zoals zoeken, aanbeveling, fraudedetectie, enz. leent zich natuurlijk voor ML / AI-oplossingen. Applied ML PMs denk na over hoe gegevens kunnen worden gebruikt om een bestaand product te verbeteren (Bijvoorbeeld chatlogs analyseren om routing van de klantenservice te automatiseren) of hoe u een geheel nieuwe ervaring kunt ontwerpen met behulp van geavanceerde AI (bijvoorbeeld filters voor apps voor het delen van foto ‘ s). Uiteindelijk, ze werken allemaal aan het direct verbeteren van de belangrijkste statistieken voor een gebruiker gerichte functie.

PMs die aan deze functies werken, hoewel niet altijd de naam Data PM draagt, hebben over het algemeen een goed begrip van de data science workflow en de onderliggende machine learning modellen. Ze hebben een sterke intuïtie over het benutten van de kracht van ML tijdens het ontwerpen rond de beperkingen om een superieure gebruikerservaring te bieden in vergelijking met op regels gebaseerde benaderingen.

Platforms

naarmate een bedrijf groter wordt, wordt de behoefte aan gestandaardiseerde kaders duidelijker, met name in experimenten en machine learning. De use cases in deze twee workflows zijn vaak zeer nauw geïntegreerd met de aard van het product zelf, dus weinig open-source oplossingen kunnen echt voldoen aan de behoeften van iedereen.

daarom begonnen individuele datateams in grote bedrijven met hun eigen eenmalige systemen, wat leidde tot dubbel werk en een tragere time-to-market. De wil van Google, Facebook en Uber dus zijn begonnen met platforming: gemeenschappelijke kaders om de inspanningen te helpen verminderen die worden besteed aan gemeenschappelijke taken zoals tooling, implementatie en monitoring.

deze platforms hebben tot doel de noodzaak om gegevens te beheren, te implementeren en de resultaten te monitoren weg te nemen, zodat datateams zich kunnen concentreren op itereren rond de modellen en de experimenten zelf. Ze bevorderen ook de herbruikbaarheid door gemeenschappelijke gegevens en functies toegankelijk te maken voor alle gebruikers van het platform.

Platform PMs begin met te bewijzen hoe het platform nuttig en overtuigend early adopters zou kunnen zijn om het eens te proberen. Zodra het platform het buigpunt heeft bereikt, verschuift de rol naar het identificeren van high-ROI gemeenschappelijke noemers om in het platform te bouwen. Ze kijken naar KPI ‘ s zoals modellen of experimenten die op het platform worden uitgevoerd, gemiddelde time-to-market, enz.

normalisatie en ontdekking

normalisatie en ontdekking is een ander probleem met groeiende datateams. Naarmate een bedrijf groeit, groeit ook de hoeveelheid data die door individuele teams en mensen wordt gecreëerd exponentieel. Deze snelle output van gegevens creëert een probleem waar er geen centrale plaats is om alle gegevens die in een organisatie bestaan te zien.

zonder een structuur voor het documenteren, centraliseren en weergeven van metagegevens is de institutionele kennis van gegevensbronnen beperkt tot de gegevenseigenaren. Het wordt onduidelijk wat de gegevens eigenlijk betekenen, waar ze vandaan komen, hoe betrouwbaar ze zijn, enz. Verder, elke kennis van deze aspecten van de gegevensbronnen verdwijnt wanneer de medewerkers het meest vertrouwd met die gegevens het team verlaten. Een ander veel voorkomend probleem is dat teams die dezelfde gegevens gebruiken vaak verschillend vergelijkbare klinkende metrics definiëren. Een team kan bijvoorbeeld last-7-day definiëren als de laatste 7 volle dagen, terwijl een ander team het kan definiëren als de laatste 168 uur.

een data standardization and discovery PM moet ervoor zorgen dat de gehele organisatie zich bewust wordt van de bestaande gegevens en deze op een consistent gedefinieerde manier gebruikt. Een veel voorkomende product manifestatie van deze inspanning is een data catalogus of een data portal dat de ontdekking en definitie van gegevens / dashboards / metrics vergemakkelijkt, evenals identificeert gegevens eigenaren die kunnen worden gecontacteerd voor verdere gesprekken. Een meer geavanceerde versie van een dataportal maakt ook computed metrics gemakkelijk toegankelijk en opgenomen in verschillende use cases (modellering, analytics).

Laatste Woorden

het landschap van gegevensproductbeheer is nog in ontwikkeling en dit is geenszins een uitputtend overzicht van gegevensproductrollen die in de industrie beschikbaar zijn. Afhankelijk van het stadium en de organisatiestructuur van een bedrijf, kan de Data PM rol een mix van deze verschillende verantwoordelijkheden zijn. Analytics kan een deel van de infrastructuur, en standaardisatie en ontdekking kan een deel van het Platform. Als een toegepaste ML PM, kunt u merken dat u het afstoten van middelen voor het opbouwen van de infrastructuur en deployment omgevingen die nodig zijn om uw model te produceren.

uiteindelijk komen deze rollen neer op het creëren van een waardevolle gebruikerservaring op basis van gegevens en het verwijderen van alle obstakels die een team verhinderen die waarde te leveren.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.

lg