djurklassificeringsalgoritmer och Go-playing_agents dominerar AI-hype-cykeln, men algoritmer är bara en del av hela dataproduktekosystemet. I de flesta affärsinställningar kan modellerna faktiskt stå för minst påverkan. Ett stort stödjande ekosystem måste vara på plats för att data ska kunna strömma genom venerna i din organisation:

  1. Råhändelser och transaktioner måste samlas in, lagras och serveras
  2. Data måste behandlas, upptäckas och delas med relevanta Team.
  3. modeller måste byggas, distribueras och övervakas i produktionen.

och alla dessa företag måste producera konkreta affärsresultat. Hur ska en organisation prioritera bland tusentals potentiella riktningar?

på Insight, där vi har hjälpt tusentals medarbetare att övergå till olika roller inom databranschen, ser vi en ökad efterfrågan på produktchefer som kan hantera dessa prioriterings-och samordningsutmaningar bland datateam. Denna artikel syftar till att förklara hur produkthantering ser ut i datautrymmet och varför det är viktigt.

Varför Data Produkthantering?

i små datateam utan formell PMs utförs standardproduktansvar som möjlighetsbedömning, vägkartläggning och intressenthantering sannolikt av tekniska chefer och enskilda bidragsgivare (ICS). Detta skala inte bra av många skäl, de fyra viktigaste är:

  1. Produktarbete slutar redogöra för hela IC: s tid.
  2. inte alla IC är välutrustade eller villiga att hantera produktarbete i stor skala.
  3. klyftorna mellan affärsenheter och tekniska team ökar.
  4. luckor mellan enskilda tekniska team breddas.

vid denna böjningspunkt finns det två potentiella svar. Det första tillvägagångssättet är att dela upp arbetet i projekt som är fristående nog för att en enda IC eller ett litet tekniskt team ska kunna hantera end-to-end, vilket minskar behovet av någon typ av centrala samordnare.

det andra tillvägagångssättet är att skapa en formell produkthanteringsorganisation som ansvarar för att upprätthålla sanningskällor och samordna olika team och ICs för att utföra. Detta är särskilt vanligt för mycket tvärfunktionella produkter som e-handel och on-demand-tjänster.

om det är möjligt för en enda IC att göra justeringar av en produkt, omedelbart få objektiv feedback om hur den presterar och rulla tillbaka i värsta fall utan större konsekvenser, då är den första metoden extremt kraftfull. Även om detta kan fungera för en gratis social nätverksprodukt, är det potentiellt katastrofalt för en betald och operativ tung produkt som on-demand-tjänster. De flesta företag i stor skala går slutligen med den andra metoden att ha en produktorganisation.

tillståndet för Dataprodukthanteringsroller

i början av datarevolutionen rullades ortogonala datafärdigheter som programvaruteknik, statistik och modellering under samma paraply av datavetenskap. Dessa färdigheter formaliseras snabbt i separata roller, såsom dataingenjörer, datavetenskapare, forskare och ML-ingenjörer.

inom produkthantering tar en liknande trend form. Liksom deras tekniska motsvarigheter ser vi att det breda paraplyet av data-PMs blir ytterligare uppdelat i delområden: Infrastruktur, analys, tillämpad ML / AI, upptäckt och standardisering och plattform. Dessa är inte nödvändigtvis formella data PM titlar just nu. Snarare återspeglar de relativt distinkta områden av dataproduktarbete.

medan varje dataanvändningsfall kräver en något annorlunda typ av teknisk och domänförståelse, som vi berör nedan, är det viktigt att betona att generalistiska produkthanteringsfärdigheter fortfarande är de viktigaste drivkrafterna för framgång. 90% av vad en data PM gör dagligen kommer fortfarande att prioriteras, kommunikation, intressenthantering, design och specifikationer.

Infrastruktur

i skala kommer enskilda produktgrupper att ha olika användningsfall och datakrav. Den naturliga tendensen hos dessa team är att bygga ut sina egna datainfrastrukturer för att komma igång snabbt. Denna tendens leder till duplicerat arbete, datasilos, och i slutändan kommer team att stöta på liknande dataskalbarhetsproblem.

den ultimata leveransen för en Infrastruktur PM är en vanlig datainfrastruktur som samlar in, lagrar och bearbetar relevanta data på ett effektivt sätt för att möjliggöra nedåtvända fall. Denna gemensamma Infrastruktur hjälper team att fokusera på att använda istället för att samla in och lagra rådata.

Infrastructure PMs: s viktigaste nyckeltal är datatillgänglighet, skalbarhet och tillförlitlighet. De är väl insatt i datateknik tekniker såsom data intag, bearbetning i batch och realtid, filsystem och leverans.

Analytics

beslut på den moderna arbetsplatsen informeras alltmer av data. Analytics måste stödja ett brett spektrum av beslut, från strategi till produkt och ops, både offline och i realtid. Medan Infrastruktur-PMs säkerställer att frågor kan köras effektivt på massiva datamängder (how), fokuserar analytics-PMs på hur man förvandlar sådana rådata till handlingsbara insikter för beslutsfattare som execs, PMs och ops-team. I andra fall är analytics PMs också aktivt involverade i att definiera viktiga resultatindikatorer och utföra datautforskning för att rekommendera affärsbeslut.

inom ramen för produktbyggnad är en analytics PM ansvarig för att skapa en blandning av självbetjäningsanalys, anpassade instrumentpaneler och rapporteringsverktyg för att hjälpa ytan och dela insikter i en organisation. Deras intressenter är olika, från kunniga Dataforskare till skrivskyddade konsumenter som execs.

KPI: erna de tittar på är sannolikt antal frågor som körs, rapporter genererade etc. vilket indikerar hur lätt det är för dataanvändare att extrahera de insikter de behöver från rådata.

Applied ML / AI

vissa produkter och funktioner som sökning, rekommendation, upptäckt av bedrägerier etc. lånar sig naturligt till ML / AI-lösningar. Applied ML PMs tänker på hur data kan utnyttjas för att förbättra en befintlig produkt (t.ex. analysera chattloggar för att automatisera kundservicedirigering) eller hur man utformar en helt ny upplevelse helt och hållet med avancerad AI (t. ex. filter för fotodelningsappar). I slutändan arbetar de alla med att direkt förbättra nyckeltal för en användarvänd funktion.

PMs som arbetar med dessa funktioner, men inte alltid med titeln data PM, har i allmänhet en stark förståelse för datavetenskapens arbetsflöde och underliggande maskininlärningsmodeller. De har en stark intuition om att utnyttja kraften i ML medan de utformar sina begränsningar för att leverera en överlägsen användarupplevelse jämfört med regelbaserade tillvägagångssätt.

plattformar

när ett företag växer i storlek blir behovet av standardiserade ramar tydligare, särskilt inom experiment och maskininlärning. Användningsfallen i dessa två arbetsflöden är ofta mycket tätt integrerade med själva produktens natur, så få lösningar med öppen källkod kan verkligen tillgodose alla behov.

av denna anledning startade enskilda datateam i stora företag med sina egna engångssystem, vilket ledde till duplicerat arbete och långsammare time-to-market. Lik av Google, Facebook och Uber har således börjat plattformsspel: gemensamma ramar för att minska ansträngningarna för vanliga uppgifter som verktyg, distribution och övervakning.

dessa plattformar syftar till att abstrahera bort behovet av att hantera data, distribuera och övervaka resultat, vilket frigör datateam att istället fokusera på att iterera kring modellerna och experimenten själva. De främjar också återanvändbarhet genom att göra gemensamma data och funktioner tillgängliga för alla användare av plattformen.

Platform PMs börjar med att bevisa hur plattformen kan vara användbar och övertyga tidiga adoptörer för att prova. När plattformen har nått böjningspunkten skiftar rollen till att identifiera högavkastande gemensamma nämnare för att bygga in i plattformen. De tittar på KPI: er som modeller eller experiment som körs på plattformen, genomsnittlig tid till marknaden etc.

standardisering och upptäckt

standardisering och upptäckt är ännu ett problem med växande datateam. När ett företag växer växer också mängden data som skapas av enskilda team och människor exponentiellt. Denna snabba datautmatning skapar ett problem där det inte finns någon central plats att se all data som finns i en organisation.

utan en struktur för att dokumentera, centralisera och visa metadata är den institutionella kunskapen om datakällor begränsad till dataägarna. Det blir oklart vad uppgifterna faktiskt betyder, var de kommer ifrån, hur pålitliga de är etc. Vidare försvinner all kunskap om dessa aspekter av datakällorna när de anställda som är mest bekanta med den informationen lämnar teamet. Ett annat vanligt problem är att lag som använder samma data ofta definierar liknande ljudande mätvärden annorlunda. Till exempel kan ett lag definiera sista-7-dagen som de senaste 7 hela dagarna medan ett annat lag kan definiera det som de senaste 168 timmarna.

en datastandardisering och discovery PM ansvarar för att hela organisationen blir medveten om de data som finns och använder dem på ett konsekvent definierat sätt. En vanlig produkt manifestation av detta arbete är en datakatalog eller en dataportal som underlättar upptäckten och definitionen av data / instrumentpaneler / mätvärden samt identifierar dataägare som kan kontaktas för ytterligare samtal. En mer avancerad version av en dataportal gör också beräknade mätvärden lättillgängliga och införlivade i olika användningsfall (modellering, analys).

Slutord

dataprodukthanteringslandskapet utvecklas fortfarande och detta är inte på något sätt en uttömmande översikt över dataproduktroller som finns tillgängliga inom industrin. Beroende på scenen och organisationsstrukturen i ett företag kan data PM-rollen vara en blandning av dessa olika ansvarsområden. Analytics kan vara en del av infrastrukturen, och standardisering och upptäckt kan vara en del av plattformen. Som en tillämpad ML PM Kan du hitta dig själv avyttra resurser för att bygga ut de infrastruktur-och distributionsmiljöer som krävs för att producera din modell.

i slutändan handlar dessa roller om att skapa en värdefull datadriven användarupplevelse och ta bort alla hinder som hindrar ett team från att leverera det värdet.

Lämna ett svar

Din e-postadress kommer inte publiceras.

lg