Zvířecí klasifikace algoritmů a Go-playing_agents ovládnout AI humbuk cyklu, ale algoritmy jsou jen jedna část celého datového produktu ekosystému. Ve většině obchodních nastavení mohou modely ve skutečnosti představovat nejmenší dopad. Aby data mohla proudit žilami vaší organizace, musí být zaveden velký podpůrný ekosystém:

  1. Raw události a transakce musí být shromažďovány, skladovány a sloužil
  2. Údaje musí být zpracovány, zjištěny a sdíleny s příslušnými týmy.
  3. modely musí být postaveny, nasazeny a monitorovány ve výrobě.

a všechny tyto podniky musí přinést konkrétní obchodní výsledky. Jak by měla organizace upřednostňovat tisíce potenciálních směrů?

Na Pohled, kde jsme pomohli tisíce Kolegů, přechod do různých rolí v datové průmyslu, vidíme nárůst poptávky průmyslu pro produktové manažery, kteří mohou řešení těchto priorit a koordinaci výzev mezi údaje týmy. Cílem tohoto článku je vysvětlit, jak vypadá Správa produktů v datovém prostoru a proč je důležitá.

Proč Data Product Management?

V malé datové týmy bez formální PMs, standardní produktu povinnosti, jako je možnost hodnocení, silnice-mapování a řízení zúčastněných stran je pravděpodobné, provádí technické manažeři a jednotliví přispěvatelé (ICs). To není měřítko dobře z mnoha důvodů, hlavní jsou čtyři:

  1. Produkt práce skončí účetnictví pro všechny IC.
  2. ne všechny integrované obvody jsou dobře vybavené nebo ochotné zvládnout práci s produktem v měřítku.
  3. mezery mezi obchodními jednotkami a technickými týmy se rozšiřují.
  4. mezery mezi jednotlivými technickými týmy se rozšiřují.

v tomto inflexním bodě existují dvě potenciální odpovědi. První přístup je rozdělit práci do projektů, které jsou soběstačné dost pro jeden IC nebo malý technický tým ovladatelná end-to-end, což snižuje potřebu pro některé typy centrálních koordinátorů.

druhým přístupem je vytvoření formálního produktu management org, který je zodpovědný za udržování plánů zdroje pravdy a koordinaci různých týmů a ICs k provedení. To je běžné zejména u vysoce funkčních produktů, jako je elektronický obchod a služby na vyžádání.

Pokud je to možné pro jeden IC provést úpravy, aby výrobek, okamžitě získat objektivní zpětnou vazbu o tom, jak je provádět, a roll-back v nejhorším případě scénáře bez větších následků, pak první přístup je velmi silný. I když to může fungovat pro bezplatný produkt sociální sítě, je to potenciálně katastrofální pro placený a provozně náročný produkt, jako jsou služby na vyžádání. Většina společností v měřítku nakonec jde s druhým přístupem k organizaci produktů.

Stav Dat Produktového Managementu Role

V prvních dnech datové revoluce, ortogonální údaje dovednosti, jako je softwarové inženýrství, statistiky a modelování byla vrácena pod stejný deštník dat vědy. Tyto dovednosti jsou rychle formalizován do jednotlivých rolí, jako jsou údaje inženýři, datové vědci, vědců a ML inženýrů.

v rámci produktového managementu se podobný trend formuje. Stejně jako jejich technické protějšky, vidíme, že široký deštník datových PMs se dále dělí na podoblasti: infrastruktura, analytika, aplikovaná ML / AI, zjišťování a standardizace a platforma. V tuto chvíli to nejsou nutně formální údaje. Spíše odrážejí relativně odlišné oblasti práce s datovými produkty.

Při každé použití údajů případě vyžaduje mírně odlišný typ technické a domény porozumění, které jsme dotknout níže, je důležité zdůraznit, že všeobecný produktový management dovednosti jsou stále nejdůležitější ovladače úspěchu. 90% toho, co datový PM dělá každý den, bude stále prioritizace, Komunikace, Správa zúčastněných stran, design a specifikace.

infrastruktura

v měřítku budou mít jednotlivé týmy produktů různé případy použití a požadavky na data. Přirozenou tendencí těchto týmů je budovat vlastní datové infrastruktury, aby mohli rychle začít. Tato tendence vede k duplikované práci, datovým silám a nakonec týmy narazí na podobné problémy se škálovatelností dat.

konečný výstup pro Infrastrukturu PM je společná datová infrastruktura, která shromažďuje, uchovává a zpracovává příslušné údaje v výkonný způsobem, který umožní se stanoví případy použití. Tato společná infrastruktura pomáhá týmům soustředit se na používání namísto shromažďování a ukládání nezpracovaných dat.

hlavními KPI infrastruktury PMS jsou dostupnost dat, škálovatelnost a spolehlivost. Jsou dobře obeznámeni s technologiemi datového inženýrství, jako je požití dat, zpracování v dávkovém a reálném čase, souborový systém a doručení.

analytika

rozhodnutí na moderním pracovišti jsou stále více informována daty. Analytics musí podporovat širokou škálu rozhodnutí, od strategie po produkt a ops, offline i v reálném čase. Zatímco PMs infrastruktury zajišťují, že dotazy lze efektivně spouštět na masivních datových sadách (the how), analytické PMs se zaměřují na to, jak proměnit taková surová data v praktické poznatky pro osoby s rozhodovací pravomocí, jako jsou execs, PMs a ops team. V ostatních případech, analytické PMs se také aktivně podílejí na definování klíčových ukazatelů výkonnosti a provádění průzkumu dat, aby pomohly doporučit obchodní rozhodnutí.

v Rámci produktu budovy, analytický PM je zodpovědný za vytvoření směsi self-service analytics, vlastní řídicí panely a nástroje pro podávání zpráv, aby pomohl povrch a sdílet poznatky v celé organizaci. Jejich subjekty jsou různorodé, od důvtipný dat vědci číst-pouze spotřebitelů, jako execs.

KPI, na které se dívají, jsou pravděpodobně počet spuštěných dotazů, generovaných zpráv atd. což naznačuje, že uživatelé dat mohou snadno získat informace, které potřebují, ze surových dat.

aplikované ML / AI

určité produkty a funkce, jako je vyhledávání, doporučení, detekce podvodů atd. přirozeně se hodí k řešením ML / AI. Applied ML PMs přemýšlejte o tom, jak lze data využít ke zlepšení stávajícího produktu (např. analyzovat protokoly chatu za účelem automatizace směrování zákaznických služeb) nebo jak navrhnout zcela nový zážitek pomocí pokročilé AI (např. filtry pro aplikace pro sdílení fotografií). Nakonec všichni pracují na přímém zlepšení klíčových metrik pro funkci orientovanou na uživatele.

PMs pracuje na těchto funkcí, i když ne vždy s názvem Data PM, obecně mají silné pochopení vědeckých dat workflow a základní strojového učení modely. Mají silnou intuici o tom, využít sílu ML při navrhování kolem jeho omezení poskytovat vynikající uživatelské zkušenosti ve srovnání s rule-based přístupy.

platformy

jak se společnost rozrůstá, potřeba standardizovaných rámců se stává zjevnější, zejména v experimentování a strojovém učení. Případy použití v těchto dvou pracovních postupech jsou často velmi úzce integrovány s povahou samotného produktu, takže jen málo open-source řešení může skutečně uspokojit potřeby každého.

z tohoto důvodu začaly jednotlivé datové týmy ve velkých společnostech s vlastními jednorázovými systémy, což vedlo k duplikované práci a pomalejšímu uvedení na trh. Lidé jako Google, Facebook a Uber se tak pustili do platformy: společné rámce, které pomáhají snížit úsilí vynaložené na běžné úkoly, jako je Nástroje, nasazení a monitorování.

Tyto platformy cílem je abstraktní pryč, že je třeba spravovat data, nasazení a monitorování výsledků, uvolnění údaje týmy zaměřit se místo toho na iterace kolem modelů a experimenty sami. Podporují také opětovnou použitelnost tím, že zpřístupňují společná data a funkce všem uživatelům platformy.

Platforma PMs začít tím, že prokáže, jak tato platforma by mohla být užitečná a přesvědčivá inovátoři to zkusit. Jakmile platforma dosáhne inflexního bodu, role se posouvá k identifikaci společných jmenovatelů s vysokou ROI, kteří se do platformy zabudují. Dívají se na KPI, jako jsou modely nebo experimenty běžící na platformě, průměrná doba uvedení na trh, atd.

standardizace a objev

standardizace a objev je dalším problémem rostoucích datových týmů. Jak společnost roste, exponenciálně roste také množství dat vytvořených jednotlivými týmy a lidmi. Tento rychlý výstup dat vytváří problém, kde není centrální místo pro zobrazení všech dat, která existují v Organizaci.

bez struktury pro dokumentaci, centralizaci a zobrazení metadat je institucionální znalost zdrojů dat omezena na vlastníky dat. Není jasné, co data ve skutečnosti znamenají, odkud pocházejí, jak spolehlivé jsou atd. Dále veškeré znalosti o těchto aspektech zdrojů dat zmizí, když zaměstnanci, kteří jsou s těmito údaji nejvíce obeznámeni, opustí tým. Dalším běžným problémem je, že týmy, které používají stejná data, často definují podobně znějící metriky odlišně. Například tým může definovat Poslední-7-den jako posledních 7 celých dnů, zatímco jiný tým může definovat jako poslední 168 hodin.

dat standardizace a objevů PM je zodpovědný za zajištění toho, že celá organizace se stává vědomi údaje, které existují, a jejich použití v trvale vymezených způsobem. Společným produktem tohoto úsilí je katalog dat nebo datový portál, který usnadňuje vyhledávání a definici dat / dashboardů / metrik a identifikuje vlastníky dat, kteří mohou být kontaktováni pro další konverzace. Pokročilejší verze dataportal také umožňuje vypočtené metriky snadno přístupné a začleněny v různých případech použití (modelování, analytika).

závěrečná slova

prostředí správy datových produktů se stále vyvíjí a v žádném případě to není vyčerpávající přehled rolí datových produktů dostupných v průmyslu. V závislosti na fázi a organizační struktuře společnosti by role PM dat mohla být kombinací těchto různých odpovědností. Analytika může být součástí infrastruktury a standardizace a zjišťování mohou být součástí platformy. Jako aplikovaný ML PM, můžete se ocitnout v odprodeji zdrojů na budování infrastruktury a prostředí nasazení nezbytných pro výrobu Vašeho modelu.

Nakonec, tyto role se redukuje na tvorbě cenná data-poháněl uživatelské zkušenosti a odstraní všechny překážky bránící tým z poskytování této hodnoty.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.

lg