Animal classification algoritmer og Go-playing_agents dominerer AI hype cyklus, men algoritmer er blot en del af hele data produkt økosystem. I de fleste forretningsindstillinger kan modellerne faktisk tegne sig for den mindste effekt. Et stort understøttende økosystem skal være på plads for at data kan strømme gennem venerne i din organisation:

  1. rå begivenheder og transaktioner skal indsamles, opbevares og serveres
  2. Data skal behandles, opdages og deles med relevante teams.
  3. modeller skal bygges, implementeres og overvåges i produktionen.

og alle disse virksomheder skal producere konkrete forretningsresultater. Hvordan skal en organisation prioritere blandt tusindvis af potentielle retninger?

hos Insight, hvor vi har hjulpet tusindvis af stipendiater med at overgå til forskellige roller i dataindustrien, ser vi en stigning i branchens efterspørgsel efter produktledere, der kan tackle disse prioriterings-og koordineringsudfordringer blandt datateams. Denne artikel har til formål at forklare, hvordan produktstyring ser ud i datarummet, og hvorfor det er vigtigt.

Hvorfor Data Produktstyring?

i små datateams uden formel PMs udføres standardproduktansvar såsom mulighedsvurdering, vejkortlægning og interessentstyring sandsynligvis af tekniske ledere og individuelle bidragydere (ICS). Dette skaleres ikke godt af mange grunde, de fire vigtigste er:

  1. produktarbejde ender med at regne med hele IC ‘ s tid.
  2. ikke alle IC ‘ er er veludstyrede eller villige til at håndtere produktarbejde i skala.
  3. huller mellem forretningsenheder og tekniske teams udvides.
  4. huller mellem individuelle tekniske teams udvides.

på dette bøjningspunkt er der to potentielle svar. Den første tilgang er at opdele arbejdet i projekter, der er selvstændige nok til, at en enkelt IC eller et lille teknisk team kan håndtere ende-til-ende, hvilket reducerer behovet for en eller anden form for centrale koordinatorer.

den anden tilgang er at oprette en formel product management org, der er ansvarlig for at opretholde source-of-truth køreplaner og koordinere forskellige teams og ICs til at udføre. Dette er især almindeligt for meget tværfunktionelle produkter såsom e-handel og on-demand-tjenester.

hvis det er muligt for en enkelt IC at foretage justeringer af et produkt, skal du straks få objektiv feedback om, hvordan det fungerer, og rulle tilbage i værste tilfælde scenarier uden større forgreninger, så er den første tilgang ekstremt kraftfuld. Selvom dette muligvis fungerer for et gratis socialt netværksprodukt, er det potentielt katastrofalt for et betalt og operationstungt produkt som on-demand-tjenester. De fleste virksomheder i skala går i sidste ende med den anden tilgang til at have en produktorganisation.

status for Dataproduktstyringsroller

i de tidlige dage af datarevolutionen blev ortogonale datafærdigheder som programmelteknik, statistik og modellering rullet under den samme paraply af datalogi. Disse færdigheder formaliseres hurtigt i separate roller, såsom dataingeniører, dataforskere, forskere og ML-ingeniører.

inden for produktstyring tager en lignende tendens form. Ligesom deres tekniske kolleger, vi ser den brede paraply af data PMs bliver yderligere opdelt i underområder: infrastruktur, analyse, anvendt ML / AI, opdagelse og standardisering og platform. Disse er ikke nødvendigvis formelle data PM titler i øjeblikket. De afspejler snarere relativt forskellige områder af dataproduktarbejde.

mens hver databrugssag kræver en lidt anden type teknisk og domæneforståelse, som vi berører nedenfor, er det vigtigt at understrege, at generalistiske produktstyringsevner stadig er de vigtigste drivkræfter for succes. 90% af, hvad en data PM gør på daglig basis, vil stadig være prioritering, kommunikation, stakeholder management, design og specs.

infrastruktur

i skala vil individuelle produktteams have forskellige brugssager og datakrav. Disse teams naturlige tendens er at opbygge deres egne datainfrastrukturer for hurtigt at komme i gang. Denne tendens fører til duplikeret arbejde, datasiloer, og i sidste ende vil teams løbe ind i lignende dataskalerbarhedsproblemer.

den ultimative levering til en infrastruktur PM er en fælles datainfrastruktur, der indsamler, lagrer og behandler relevante data på performant måde for at muliggøre nedbrugssager. Denne fælles infrastruktur hjælper teams med at fokusere på at bruge i stedet for at indsamle og lagre rådata.

infrastruktur PMs ‘vigtigste KPI’ er er datatilgængelighed, skalerbarhed og pålidelighed. De er velbevandret i data engineering teknologier såsom data indtagelse, behandling i batch og realtid, filsystem og levering.

Analytics

beslutninger på den moderne arbejdsplads informeres i stigende grad af data. Analytics skal understøtte en bred vifte af beslutninger, fra strategi til produkt og ops, både offline og i realtid. Mens infrastruktur PMs sikrer, at forespørgsler kan køres effektivt på massive datasæt (hvordan), analytics PMs fokuserer på, hvordan man omdanner sådanne rådata til handlingsbar indsigt for beslutningstagere som f.eks. I andre tilfælde er analytics PMs også aktivt involveret i at definere nøglepræstationsindikatorer og udføre dataudforskning for at hjælpe med at anbefale forretningsbeslutninger.

inden for rammerne af produktopbygning er en Analytics PM ansvarlig for at skabe en blanding af selvbetjeningsanalyser, tilpassede dashboards og rapporteringsværktøjer, der hjælper med at overflade og dele indsigt på tværs af en organisation. Deres interessenter er forskellige, fra kyndige dataforskere til skrivebeskyttede forbrugere som f.eks.

de KPI ‘ er, de ser på, er sandsynligvis antallet af forespørgsler, der køres, Rapporter genereret osv. hvilket indikerer, at det er let for databrugere at udtrække den indsigt, de har brug for, fra rådata.

anvendt ML / AI

visse produkter og funktioner såsom søgning, anbefaling, afsløring af svig osv. egner sig naturligt til ML / AI-løsninger. Applied ML PMs tænk over, hvordan data kan udnyttes til at forbedre et eksisterende produkt (f.eks. analysere chatlogfiler for at automatisere routing af kundeservice), eller hvordan man designer en helt ny oplevelse helt ved hjælp af avanceret AI (f. eks. filtre til apps til deling af fotos). I sidste ende arbejder de alle på direkte at forbedre nøglemetrics for en brugervendt funktion.

PMs arbejder på disse funktioner, men ikke altid titlen data PM, generelt har en stærk forståelse af data videnskab arbejdsgang og underliggende machine learning modeller. De har en stærk intuition om at udnytte ML ‘ s kraft, mens de designer omkring sine begrænsninger for at levere en overlegen brugeroplevelse sammenlignet med regelbaserede tilgange.

platforme

efterhånden som en virksomhed vokser i størrelse, bliver behovet for standardiserede rammer mere tydeligt, især inden for eksperimentering og maskinindlæring. Brugssagerne i disse to arbejdsgange er ofte meget tæt integreret med selve produktets art, så få open source-løsninger kan virkelig imødekomme alles behov.

af denne grund startede individuelle datateams i store virksomheder med deres egne engangssystemer, hvilket førte til duplikeret arbejde og langsommere time-to-market. Folk som Google, Facebook og Uber har således påbegyndt platformspil: fælles rammer for at hjælpe med at reducere indsatsen brugt på fælles opgaver som værktøj, implementering og overvågning.

disse platforme sigter mod at abstrahere behovet for at styre data, implementere og overvåge resultater og frigøre datateams til i stedet at fokusere på iterering omkring modellerne og eksperimenterne selv. De fremmer også genanvendelighed ved at gøre fælles data og funktioner tilgængelige for alle brugere af platformen.

Platform PMs start med at bevise, hvordan platformen kan være nyttig og overbevise tidlige adoptører om at prøve det. Når platformen har nået bøjningspunktet, skifter rollen til at identificere fællesnævnere med høj ROI for at bygge ind i platformen. De ser på KPI ‘ er som modeller eller eksperimenter, der kører på platformen, gennemsnitlig time-to-market osv.

standardisering og opdagelse

standardisering og opdagelse er endnu et problem med voksende datateams. Efterhånden som en virksomhed vokser, vokser mængden af data, der oprettes af individuelle teams og mennesker, også eksponentielt. Denne hurtige output af data skaber et problem, hvor der ikke er noget centralt sted at se alle de data, der findes i en organisation.

uden en struktur til at dokumentere, centralisere og vise metadata er den institutionelle viden om datakilder begrænset til dataejerne. Det bliver uklart, hvad dataene faktisk betyder, hvor de kommer fra, hvor pålidelige de er osv. Yderligere forsvinder enhver viden om disse aspekter af datakilderne, når de medarbejdere, der er mest fortrolige med disse data, forlader teamet. Et andet almindeligt problem er, at hold, der bruger de samme data, ofte definerer lignende lydende målinger forskelligt. For eksempel kan et hold definere sidste-7-dag som sidste 7 hele dage, mens et andet hold kan definere det som sidste 168 timer.

en DATASTANDARDISERING og discovery PM er ansvarlig for at sikre, at hele organisationen bliver opmærksom på de data, der findes, og bruger dem på en konsekvent defineret måde. En fælles produkt manifestation af denne indsats er et datakatalog eller en dataportal, der letter opdagelsen og definitionen af data / dashboards / metrics samt identificerer dataejere, der kan kontaktes for yderligere samtaler. En mere avanceret version af en dataportal gør også beregnede målinger let tilgængelige og inkorporeret på tværs af forskellige brugssager (modellering, analyse).

afsluttende ord

dataproduktstyringslandskabet udvikler sig stadig, og dette er på ingen måde en udtømmende oversigt over dataproduktroller, der er tilgængelige i industrien. Afhængigt af en virksomheds scene og organisationsstruktur kan data PM-rollen være en blanding af disse forskellige ansvarsområder. Analytics kan være en del af infrastrukturen, og standardisering og opdagelse kan være en del af platformen. Som en anvendt ML PM kan du finde dig selv at afhænde ressourcer til at opbygge de infrastruktur-og implementeringsmiljøer, der er nødvendige for at producere din model.

i sidste ende koger disse roller ned til at skabe en værdifuld datadrevet brugeroplevelse og fjerne alle forhindringer, der forhindrer et team i at levere denne værdi.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.

lg