Dyreklassifiseringsalgoritmer og Go-playing_agents dominerer ai hype-syklusen, men algoritmer er bare en del av hele dataproduktøkosystemet. I de fleste forretningsinnstillinger kan modellene faktisk utgjøre minst mulig innvirkning. Et stort støttende økosystem må være på plass for at data skal strømme gjennom venene i organisasjonen:

  1. Råhendelser og transaksjoner må samles inn, lagres og leveres
  2. Data må behandles, oppdages og deles med relevante team.
  3. Modeller må bygges, distribueres og overvåkes i produksjon.

og alle disse foretakene må produsere konkrete forretningsresultater. Hvordan skal en organisasjon prioritere blant tusenvis av potensielle retninger?

På Insight, hvor vi har hjulpet tusenvis Av Fellows overgang til ulike roller i databransjen, ser vi en økning i bransjens etterspørsel etter produktledere som kan takle disse prioriterings-og koordineringsutfordringene blant datateam. Denne artikkelen tar sikte på å forklare hvordan produktstyring ser ut i datarommet og hvorfor det er viktig.

Hvorfor Data Produktstyring?

i små datateam uten formelle PMs, er standard produktansvar som mulighetsvurdering, veikartlegging og interessentstyring sannsynligvis utført av tekniske ledere og individuelle bidragsytere (ICs). Dette skalerer ikke godt av mange grunner, de fire viktigste er:

  1. Vare arbeid ender opp med a regne for HELE ICS tid.
  2. Ikke Alle ICs er velutstyrte eller villige til å håndtere produktarbeid i stor skala.
  3. Gap mellom forretningsenheter og tekniske team øker.
  4. Gapene mellom individuelle tekniske team utvides.

På dette bøyningspunktet er det to potensielle svar. Den første tilnærmingen er å bryte ned arbeid i prosjekter som er selvstendige nok for en ENKELT IC eller lite teknisk team til å håndtere ende-til-ende, noe som reduserer behovet for noen type sentrale koordinatorer.

den andre tilnærmingen er å skape en formell produktstyringsorganisasjon som er ansvarlig for å opprettholde sannhetskart og koordinere ulike team og ICs for å utføre. Dette er spesielt vanlig for svært tverrfunksjonelle produkter som e-handel og on-demand-tjenester.

hvis det er mulig for en ENKELT IC å foreta justeringer av et produkt, umiddelbart få objektiv tilbakemelding på hvordan det fungerer, og rulle tilbake i verste fall scenarier uten store konsekvenser, så er den første tilnærmingen ekstremt kraftig. Selv om dette kan fungere for et gratis sosialt nettverksprodukt, er det potensielt katastrofalt for et betalt og operasjonelt produkt som on-demand-tjenester. De fleste bedrifter i skala går til slutt med den andre tilnærmingen til å ha en produktorganisasjon.

Status For Data Product Management Roller

i de tidlige dagene av datarevolusjonen ble ortogonale dataferdigheter som software engineering, statistikk og modellering rullet under samme paraply av datavitenskap. Disse ferdighetene blir raskt formalisert i separate roller, for eksempel dataingeniører, datavitenskapere, forskere og ML-ingeniører.

innen produktstyring tar en lignende trend form. Som deres tekniske kolleger ser vi den brede paraplyen Av Data PMs blir videre delt inn i delområder: infrastruktur, analyse, ANVENDT ML / AI, oppdagelse og standardisering og plattform. Dette er ikke nødvendigvis formelle DATA PM titler i øyeblikket. Snarere reflekterer de relativt forskjellige områder av dataproduktarbeid.

mens hver databrukstilfelle krever en litt annen type teknisk og domeneforståelse, som vi berører nedenfor, er det viktig å understreke at generalist produktledelse ferdigheter fortsatt er de viktigste driverne for suksess. 90% av Hva En DATA PM gjør på daglig basis vil fortsatt være prioritering, kommunikasjon, interessentstyring, design og spesifikasjoner.

Infrastruktur

i stor skala vil individuelle produktteam ha forskjellige bruksområder og datakrav. Den naturlige tendensen til disse lagene er å bygge ut sine egne datainfrastrukturer for å komme i gang raskt. Denne tendensen fører til duplisert arbeid, datasiloer, og til slutt vil lagene støte på lignende data skalerbarhet problemer.

den ultimate leveransen for En Infrastruktur PM er en felles datainfrastruktur som samler, lagrer og behandler relevante data på en effektiv måte for å muliggjøre nedbruk. Denne felles infrastrukturen hjelper team med å fokusere på å bruke i stedet for å samle inn og lagre rådata.

Pms’ Hovedindikatorer for Infrastruktur er datatilgjengelighet, skalerbarhet og pålitelighet. De er godt bevandret i data engineering teknologier som datainntak, behandling i batch og sanntid, filsystem og levering.

Analytics

Beslutninger på den moderne arbeidsplassen blir i økende grad informert av data. Analytics må støtte et bredt spekter av beslutninger, fra strategi til produkt og ops, både offline og i sanntid. Mens Infrastrukturpms sikrer at spørringer kan kjøres effektivt på massive datasett (how), fokuserer Analytics-PMs på hvordan man gjør slike rådata til handlingsinnsikt for beslutningstakere som execs, PMs og ops team. I andre tilfeller er Analytics-PMs også aktivt involvert i å definere nøkkelindikatorer og utføre datautforskning for å hjelpe til med å anbefale forretningsbeslutninger.

i forbindelse med produktbygging er EN analytics PM ansvarlig for å lage en blanding av selvbetjeningsanalyse, tilpassede dashbord og rapporteringsverktøy for å hjelpe overflaten og dele innsikt på tvers av en organisasjon. Deres interessenter er forskjellige, fra kunnskapsrike datavitenskapere til skrivebeskyttede forbrukere som execs.

Kpiene de ser på, er sannsynligvis antall spørringer, rapporter generert, etc. som indikerer at det er enkelt for databrukere å trekke ut innsikten de trenger fra rådata.

Applied ML / AI

Visse produkter og funksjoner som søk, anbefaling, svindel deteksjon, etc. egner seg naturlig TIL ML / AI-løsninger. Tenk på hvordan data kan utnyttes for å forbedre et eksisterende produkt (f.eks. analysere chatlogger for å automatisere kundeserviceruting) eller hvordan du utformer en helt ny opplevelse helt ved hjelp av avansert AI (f. eks. filtre for bildedelingsapper). Til slutt jobber de alle med å forbedre viktige beregninger for en brukervendt funksjon direkte.

PMs som arbeider med disse funksjonene, Men ikke alltid Kalt Data PM, har generelt en sterk forståelse av datavitenskaps arbeidsflyt og underliggende maskinlæringsmodeller. De har sterk intuisjon om å utnytte KRAFTEN TIL ML mens de designer rundt sine begrensninger for å levere en overlegen brukeropplevelse sammenlignet med regelbaserte tilnærminger.

Plattformer

etter hvert som et selskap vokser i størrelse, blir behovet for standardiserte rammer tydeligere, spesielt innen eksperimentering og maskinlæring. Bruksområdene i disse to arbeidsflytene er ofte svært tett integrert med selve produktet, så få åpen kildekode-løsninger kan virkelig møte behovene til alle.

av denne grunn startet individuelle datateam i store selskaper med egne engangssystemer, noe som førte til duplisert arbeid og langsommere time-to-market. Slike Som Google, Facebook Og Uber har dermed startet plattform: felles rammeverk for å bidra til å redusere innsatsen brukt på vanlige oppgaver som verktøy, distribusjon og overvåking.

disse plattformene tar sikte på å abstrahere behovet for å administrere data, distribuere og overvåke resultater, og frigjøre datateam for å fokusere i stedet på å iterere rundt modellene og eksperimentene selv. De fremmer også gjenbruk ved å gjøre felles data og funksjoner tilgjengelige for alle brukere av plattformen.

Plattform PMs start med å bevise hvordan plattformen kan være nyttig og overbevisende tidlige adoptere for å prøve. Når plattformen har nådd bøyningspunktet, skifter rollen til å identifisere høy ROI fellesnevnere for å bygge inn i plattformen. De ser På Kpier som modeller eller eksperimenter som kjøres på plattformen, gjennomsnittlig time-to-market, etc.

Standardisering Og Oppdagelse

Standardisering og oppdagelse er enda et problem med voksende datateam. Etter hvert som et selskap vokser, vokser også mengden data som opprettes av individuelle lag og mennesker eksponentielt. Denne raske produksjonen av data skaper et problem der det ikke er noe sentralt sted å se alle dataene som finnes i en organisasjon.

uten en struktur for å dokumentere, sentralisere og vise metadata, er den institusjonelle kunnskapen om datakilder begrenset til dataeierne. Det blir uklart hva dataene egentlig betyr, hvor de kommer fra, hvor pålitelige de er, etc. Videre forsvinner all kunnskap om disse aspektene av datakildene når de ansatte som er mest kjent med dataene, forlater teamet. Et annet vanlig problem er at lag som bruker de samme dataene, ofte definerer lignende lydmålinger annerledes. For eksempel kan et lag definere siste 7-dag som siste 7 hele dager, mens et annet lag kan definere det som siste 168 timer.

en data standardisering OG oppdagelse PM er ansvarlig for at hele organisasjonen blir klar over dataene som finnes og bruke dem på en konsekvent definert måte. En vanlig produkt manifestasjon av denne innsatsen er en datakatalog eller en dataportal som letter oppdagelsen og definisjonen av data / dashboards / beregninger, samt identifiserer dataeiere som kan kontaktes for videre samtaler. En mer avansert versjon av en dataportal gjør også beregnede beregninger lett tilgjengelige og innlemmet på tvers av ulike brukstilfeller (modellering, analyse).

Endelige Ord

data produkt management landskapet er fortsatt i utvikling, og dette er på ingen måte en uttømmende oversikt over data produkt roller tilgjengelig i industrien. Avhengig av scenen og organisasjonsstrukturen i et selskap, Kan Data PM-rollen være en blanding av disse forskjellige ansvarsområdene. Analyse kan være En Del Av Infrastrukturen, Og Standardisering og Oppdagelse kan være En Del Av Plattformen. SOM EN ANVENDT ML PM kan du finne deg selv å avhende ressurser for å bygge ut infrastrukturen og distribusjonsmiljøene som er nødvendige for å produsere modellen din.

Til slutt koker disse rollene ned til å lage en verdifull data-drevet brukeropplevelse og fjerne alle hindringene som hindrer et lag i å levere den verdien.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.

lg