algoritmi de clasificare a animalelor și GO-playing_agents domină ciclul ai hype, dar algoritmii sunt doar o parte a întregului ecosistem de produse de date. În majoritatea setărilor de afaceri, modelele ar putea reprezenta de fapt cel mai mic impact. Trebuie să existe un ecosistem de sprijin mare pentru ca datele să curgă prin venele organizației dvs:

  1. evenimentele brute și tranzacțiile trebuie colectate, stocate și servite
  2. datele trebuie procesate, descoperite și partajate cu echipele relevante.
  3. modelele trebuie construite, implementate și monitorizate în producție.

și toate aceste întreprinderi trebuie să producă rezultate concrete de afaceri. Cum ar trebui o organizație să prioritizeze printre mii de direcții potențiale?

la Insight, unde am ajutat mii de colegi să treacă în diferite roluri în industria datelor, vedem o creștere a cererii din industrie pentru managerii de produse care pot aborda aceste provocări de prioritizare și coordonare între echipele de date. Acest articol își propune să explice cum arată managementul produselor în spațiul de date și de ce este important.

De Ce Gestionarea Produselor De Date?

în echipele mici de date fără PMs formal, responsabilitățile standard ale produselor, cum ar fi evaluarea oportunităților, cartografierea drumurilor și gestionarea părților interesate, sunt probabil efectuate de manageri Tehnici și contribuitori individuali (IC). Acest lucru nu se scalează bine din mai multe motive, cele patru principale fiind:

  1. munca produsului ajunge să contabilizeze tot timpul IC.
  2. nu toate IC-urile sunt bine echipate sau dispuse să se ocupe de munca produsului la scară.
  3. decalajele dintre unitățile de afaceri și echipele tehnice se extind.
  4. decalajele dintre echipele tehnice individuale se extind.

în acest punct de inflexiune, există două răspunsuri potențiale. Prima abordare este de a descompune munca în proiecte care sunt suficient de autonome pentru ca o singură IC sau o echipă tehnică mică să se ocupe de la un capăt la altul, reducând necesitatea unui anumit tip de coordonatori centrali.

a doua abordare este de a crea o organizație formală de gestionare a produselor care este responsabilă pentru menținerea foilor de parcurs ale sursei adevărului și coordonarea diferitelor echipe și IC-uri pentru a le executa. Acest lucru este obișnuit în special pentru produsele extrem de funcționale, cum ar fi comerțul electronic și Serviciile la cerere.

dacă este posibil ca un singur IC să facă ajustări la un produs, să obțină imediat feedback obiectiv cu privire la performanța acestuia și să revină în cel mai rău caz, fără ramificații majore, atunci prima abordare este extrem de puternică. Deși acest lucru ar putea funcționa pentru un produs gratuit de rețea socială, este potențial catastrofal pentru un produs plătit și greu de operat, cum ar fi Serviciile la cerere. Cele mai multe companii la scară în cele din urmă merge cu a doua abordare de a avea o organizație de produs.

starea rolurilor de gestionare a produselor de date

în primele zile ale revoluției datelor, abilitățile ortogonale de date precum ingineria software, Statisticile și modelarea au fost rulate sub aceeași umbrelă a științei datelor. Aceste abilități sunt formalizate rapid în roluri separate, cum ar fi inginerii de date, oamenii de știință de date, oamenii de știință de cercetare și inginerii ML.

în cadrul managementului de produs, se conturează o tendință similară. La fel ca omologii lor tehnici, vedem că umbrela largă a datelor PMs devine împărțită în continuare în subzone: infrastructură, analiză, ml / AI aplicat, descoperire și standardizare și platformă. Acestea nu sunt neapărat titluri PM de date formale chiar în acest moment. Mai degrabă, ele reflectă domenii relativ distincte ale activității produselor de date.

în timp ce fiecare caz de utilizare a datelor necesită un tip ușor diferit de înțelegere tehnică și de domeniu, pe care îl atingem mai jos, este important să subliniem că abilitățile generaliste de gestionare a produselor sunt în continuare cei mai importanți factori ai succesului. 90% din ceea ce face un PM de date în fiecare zi va fi în continuare prioritizare, comunicații, gestionarea părților interesate, proiectare și specificații.

infrastructură

la scară, echipele individuale de produse vor avea diferite cazuri de utilizare și cerințe de date. Tendința naturală a acestor Echipe este de a-și construi propriile infrastructuri de date pentru a începe rapid. Această tendință duce la muncă duplicată, silozuri de date și, în cele din urmă, echipele se vor confrunta cu probleme similare de scalabilitate a datelor.

livrabilul final pentru o infrastructură PM este o infrastructură comună de date care colectează, stochează și procesează date relevante în mod performant pentru a permite cazuri de utilizare în jos. Această infrastructură comună ajută echipele să se concentreze pe utilizarea în loc să colecteze și să stocheze date brute.

principalii KPI ai PMs pentru infrastructură sunt disponibilitatea datelor, scalabilitatea și fiabilitatea. Ele sunt bine versat în tehnologii de inginerie de date, cum ar fi ingestia de date, Prelucrarea în lot și în timp real, sistem de fișiere și de livrare.

Analytics

deciziile la locul de muncă modern sunt din ce în ce mai informate de date. Analiza trebuie să sprijine o gamă largă de decizii, de la strategie la produs și ops, atât offline, cât și în timp real. În timp ce PMs de infrastructură se asigură că interogările pot fi rulate eficient pe seturi de date masive (cum), PMS de analiză se concentrează pe modul de a transforma astfel de date brute în informații acționabile pentru factorii de decizie precum execs, PMs și echipa ops. În alte cazuri, PMS analytics sunt, de asemenea, implicați activ în definirea indicatorilor cheie de performanță și efectuarea explorării datelor pentru a ajuta la recomandarea deciziilor de afaceri.

în contextul construirii de produse, un PM analytics este responsabil pentru crearea unui amestec de analize cu autoservire, tablouri de bord personalizate și instrumente de raportare pentru a ajuta la afișarea și partajarea informațiilor în cadrul unei organizații. Părțile interesate sunt diverse, de la savvy data scientists la consumatori numai în citire, cum ar fi execs.

KPI-urile la care se uită sunt numărul probabil de interogări rulate, rapoarte generate etc. ceea ce indică ușurința utilizatorilor de date de a extrage informațiile de care au nevoie din datele brute.

Applied ML / AI

anumite produse și caracteristici, cum ar fi căutarea, recomandarea, detectarea fraudelor etc. se pretează în mod natural la soluții ML / AI. Ml PMS aplicat gândiți-vă la modul în care datele pot fi valorificate pentru a îmbunătăți un produs existent (de exemplu, analizați jurnalele de chat pentru a automatiza rutarea serviciului pentru clienți) sau cum să proiectați o experiență complet nouă folosind ia avansată (de exemplu, filtre pentru aplicații de partajare a fotografiilor). În cele din urmă, toți lucrează la îmbunătățirea directă a valorilor cheie pentru o caracteristică orientată către utilizator.

PMs care lucrează la aceste caracteristici, deși nu sunt întotdeauna intitulate data PM, au, în general, o înțelegere puternică a fluxului de lucru al științei datelor și a modelelor de învățare automată care stau la baza acestora. Ei au o intuiție puternică cu privire la puterea ML în timp ce proiectează în jurul limitărilor sale pentru a oferi o experiență de utilizare superioară în comparație cu abordările bazate pe reguli.

platforme

pe măsură ce o companie crește în dimensiune, nevoia de cadre standardizate devine mai evidentă, în special în experimentare și învățare automată. Cazurile de utilizare în aceste două fluxuri de lucru sunt adesea foarte strâns integrate cu natura produsului în sine, astfel încât puține soluții open-source pot satisface cu adevărat nevoile tuturor.

din acest motiv, echipele individuale de date din companiile mari au început cu propriile sisteme unice, ducând la o muncă duplicată și la un timp mai lent de introducere pe piață. Cei de la Google, Facebook și Uber s-au angajat astfel pe platformă: cadre comune pentru a ajuta la reducerea eforturilor depuse pentru sarcini comune, cum ar fi scule, implementare și monitorizare.

aceste platforme își propun să elimine necesitatea de a gestiona datele, de a implementa și de a monitoriza rezultatele, eliberând echipele de date să se concentreze în schimb pe iterarea modelelor și a experimentelor în sine. De asemenea, promovează reutilizarea, făcând datele și caracteristicile comune accesibile tuturor utilizatorilor platformei.

platforma PMs începe prin a dovedi modul în care platforma ar putea fi utilă și convingătoare early adopters pentru a da un try. Odată ce platforma a atins punctul de inflexiune, rolul se mută la identificarea numitorilor comuni cu ROI ridicat pentru a se construi în platformă. Se uită la KPI-uri, cum ar fi modele sau experimentări rulate pe platformă, timp mediu de lansare pe piață etc.

standardizare și descoperire

standardizare și descoperire este încă o altă problemă cu echipele de date în creștere. Pe măsură ce o companie crește, cantitatea de date create de echipe individuale și de oameni crește, de asemenea, exponențial. Această ieșire rapidă a datelor creează o problemă în care nu există un loc central pentru a vedea toate datele care există într-o organizație.

fără o structură de documentare, centralizare și afișare a metadatelor, cunoașterea instituțională a surselor de date se limitează la proprietarii de date. Devine neclar ce înseamnă de fapt datele, de unde provin, cât de fiabile sunt etc. Mai mult, orice cunoaștere a acestor aspecte ale surselor de date dispare atunci când angajații cei mai familiarizați cu aceste date părăsesc echipa. O altă problemă comună este că echipele care utilizează aceleași date definesc adesea valori similare în mod diferit. De exemplu, o echipă ar putea defini ultimele 7 zile ca ultimele 7 zile complete, în timp ce o altă echipă ar putea defini ultimele 168 de ore.

un PM de standardizare și descoperire a datelor este responsabil pentru asigurarea faptului că întreaga organizație devine conștientă de datele care există și le utilizează într-o manieră definită în mod constant. O manifestare comună a acestui efort este un catalog de date sau un portal de date care facilitează descoperirea și definirea datelor / tablourilor de bord / valorilor, precum și identifică proprietarii de date care pot fi contactați pentru conversații ulterioare. O versiune mai avansată a unui port de date face, de asemenea, valorile calculate ușor accesibile și încorporate în diferite cazuri de utilizare (modelare, analiză).

cuvinte finale

peisajul de gestionare a produselor de date este încă în evoluție și acest lucru nu este în niciun caz o imagine de ansamblu exhaustivă a rolurilor de produse de date disponibile în industrie. În funcție de stadiul și structura organizatorică a unei companii, rolul PM de date ar putea fi un amestec al acestor responsabilități diferite. Analiza ar putea face parte din infrastructură, iar standardizarea și descoperirea ar putea face parte din platformă. Ca ml pm aplicat, s-ar putea să vă dezinvestiți resursele pentru a construi infrastructura și mediile de implementare necesare pentru a vă produce modelul.

în cele din urmă, aceste roluri se rezumă la crearea unei experiențe valoroase de utilizator bazate pe date și eliminarea tuturor obstacolelor care împiedică o echipă să ofere această valoare.

Lasă un răspuns

Adresa ta de email nu va fi publicată.

lg