Gli algoritmi di classificazione degli animali e Go-playing_agents dominano il ciclo di hype AI, ma gli algoritmi sono solo una parte dell’intero ecosistema dei prodotti dati. Nella maggior parte delle impostazioni aziendali, i modelli potrebbero effettivamente rappresentare il minor impatto. Un grande ecosistema di supporto deve essere a posto in modo che i dati di fluire attraverso le vene della vostra organizzazione:

  1. Gli eventi e le transazioni grezzi devono essere raccolti, archiviati e serviti
  2. I dati devono essere elaborati, scoperti e condivisi con i team competenti.
  3. I modelli devono essere costruiti, distribuiti e monitorati in produzione.

E tutte queste imprese devono produrre risultati commerciali concreti. Come dovrebbe un’organizzazione dare la priorità tra migliaia di potenziali direzioni?

In Insight, dove abbiamo aiutato migliaia di borsisti a passare a vari ruoli nel settore dei dati, vediamo un aumento della domanda del settore per i product manager che possono affrontare queste sfide di definizione delle priorità e coordinamento tra i team di dati. Questo articolo ha lo scopo di spiegare come appare la gestione del prodotto nello spazio dati e perché è importante.

Perché Data Product Management?

Nei piccoli team di dati senza PMS formale, le responsabilità di prodotto standard come la valutazione delle opportunità, la mappatura delle strade e la gestione degli stakeholder sono probabilmente eseguite dai responsabili tecnici e dai singoli contributori (IC). Questo non scala bene per molte ragioni, i quattro principali sono:

  1. Il lavoro del prodotto finisce per tenere conto di tutto il tempo dell’IC.
  2. Non tutti i circuiti integrati sono ben equipaggiati o disposti a gestire il lavoro del prodotto su larga scala.
  3. I divari tra business unit e team tecnici si allargano.
  4. I divari tra i singoli team tecnici si allargano.

A questo punto di flesso, ci sono due potenziali risposte. Il primo approccio consiste nel suddividere il lavoro in progetti che siano abbastanza autonomi da consentire a un singolo IC o a un piccolo team tecnico di gestire end-to-end, riducendo la necessità di un certo tipo di coordinatori centrali.

Il secondo approccio consiste nel creare un’organizzazione formale di gestione del prodotto responsabile del mantenimento delle roadmap di origine della verità e del coordinamento di diversi team e circuiti integrati da eseguire. Ciò è particolarmente comune per prodotti altamente interfunzionali come l’e-commerce e i servizi on-demand.

Se è possibile per un singolo IC apportare modifiche a un prodotto, ottenere immediatamente un feedback obiettivo su come sta eseguendo, e roll-back in scenari peggiori senza grandi ramificazioni, allora il primo approccio è estremamente potente. Anche se questo potrebbe funzionare per un prodotto di social network gratuito, è potenzialmente catastrofico per un prodotto a pagamento e pesante come i servizi on-demand. La maggior parte delle aziende su larga scala in ultima analisi, andare con il secondo approccio di avere un’organizzazione di prodotto.

The State of Data Product Management Roles

Nei primi giorni della rivoluzione dei dati, le competenze ortogonali dei dati come l’ingegneria del software, le statistiche e la modellazione sono state implementate sotto lo stesso ombrello della scienza dei dati. Queste competenze vengono rapidamente formalizzate in ruoli separati, come data engineers, data scientist, research scientist e ML engineers.

All’interno della gestione del prodotto, una tendenza simile sta prendendo forma. Come le loro controparti tecniche, vediamo l’ampio ombrello di PMS di dati che si divide ulteriormente in sotto-aree: infrastruttura, analisi, ML / AI applicata, discovery e standardizzazione e piattaforma. Questi non sono necessariamente titoli PM dati formali al momento. Piuttosto, riflettono aree relativamente distinte del lavoro sui prodotti di dati.

Mentre ogni caso d’uso dei dati richiede un tipo leggermente diverso di comprensione tecnica e di dominio, che tocchiamo di seguito, è importante sottolineare che le capacità di gestione del prodotto generalista sono ancora i driver più importanti del successo. il 90% di ciò che un PM di dati fa giorno per giorno sarà ancora prioritizzazione, comunicazione, gestione degli stakeholder, progettazione e specifiche.

Infrastruttura

Su vasta scala, i singoli team di prodotto avranno diversi casi d’uso e requisiti di dati. La tendenza naturale di questi team è quella di costruire le proprie infrastrutture di dati per iniziare rapidamente. Questa tendenza porta a lavori duplicati, silos di dati e, infine, i team si imbatteranno in problemi di scalabilità dei dati simili.

L’ultimo deliverable per un’infrastruttura PM è un’infrastruttura di dati comune che raccoglie, memorizza ed elabora i dati rilevanti in modo efficiente per abilitare i casi d’uso. Questa infrastruttura comune aiuta i team a concentrarsi sull’utilizzo invece di raccogliere e archiviare dati grezzi.

I principali KPI di Infrastructure PMs sono la disponibilità dei dati, la scalabilità e l’affidabilità. Sono esperti in tecnologie di ingegneria dei dati come l’ingestione dei dati, l’elaborazione in batch e in tempo reale, il filesystem e la consegna.

Analytics

Le decisioni nei luoghi di lavoro moderni sono sempre più informate dai dati. Analytics deve supportare una vasta gamma di decisioni, dalla strategia al prodotto e ops, sia offline che in tempo reale. Mentre i PMS dell’infrastruttura assicurano che le query possano essere eseguite in modo efficiente su enormi set di dati (how), i PMS di analisi si concentrano su come trasformare tali dati grezzi in informazioni utili per i decisori come dirigenti, PMS e team ops. In altri casi, i PMS di analytics sono anche attivamente coinvolti nella definizione di indicatori di performance chiave e nell’esplorazione dei dati per aiutare a raccomandare decisioni aziendali.

Nel contesto della creazione del prodotto, un PM di analytics è responsabile della creazione di una combinazione di analisi self-service, dashboard personalizzati e strumenti di reporting per aiutare a far emergere e condividere le informazioni in un’organizzazione. I loro stakeholder sono diversi, dai data scientist esperti ai consumatori di sola lettura come i dirigenti.

I KPI che stanno guardando sono probabilmente il numero di query eseguite, i report generati, ecc. che indicano la facilità per gli utenti di dati di estrarre le informazioni di cui hanno bisogno dai dati grezzi.

Applied ML / AI

Alcuni prodotti e funzionalità come ricerca, raccomandazione, rilevamento delle frodi, ecc. si prestano naturalmente alle soluzioni ML / AI. Applied ML PMs pensa a come i dati possono essere sfruttati per migliorare un prodotto esistente (ad esempio analizzare i log delle chat per automatizzare il routing del servizio clienti) o come progettare un’esperienza completamente nuova utilizzando l’IA avanzata (ad esempio filtri per le app di condivisione di foto). In definitiva, tutti lavorano per migliorare direttamente le metriche chiave per una funzionalità rivolta all’utente.

I PMS che lavorano su queste funzionalità, anche se non sempre intitolati Data PM, generalmente hanno una forte comprensione del flusso di lavoro della scienza dei dati e dei modelli di apprendimento automatico sottostanti. Hanno una forte intuizione di sfruttare la potenza di ML durante la progettazione intorno ai suoi limiti per offrire un’esperienza utente superiore rispetto agli approcci basati su regole.

Piattaforme

Man mano che un’azienda cresce di dimensioni, la necessità di framework standardizzati diventa più evidente, in particolare nella sperimentazione e nell’apprendimento automatico. I casi d’uso in questi due flussi di lavoro sono spesso strettamente integrati con la natura del prodotto stesso, quindi poche soluzioni open source possono davvero soddisfare le esigenze di tutti.

Per questo motivo, i singoli team di dati nelle grandi aziende hanno iniziato con i propri sistemi una tantum, portando a un lavoro duplicato e a un time-to-market più lento. Artisti del calibro di Google, Facebook e Uber hanno quindi intrapreso la piattaforma: framework comuni per contribuire a ridurre gli sforzi spesi per attività comuni come tooling, deployment e monitoraggio.

Queste piattaforme mirano ad astrarre la necessità di gestire i dati, distribuire e monitorare i risultati, liberando i team di dati di concentrarsi invece sull’iterazione intorno ai modelli e alle sperimentazioni stesse. Promuovono inoltre la riusabilità rendendo accessibili dati e funzionalità comuni a tutti gli utenti della piattaforma.

Platform PMs inizia dimostrando come la piattaforma potrebbe essere utile e convincere i primi utenti a provarlo. Una volta che la piattaforma ha raggiunto il punto di flesso, il ruolo si sposta sull’identificazione di denominatori comuni ad alto ROI da costruire nella piattaforma. Guardano KPI come modelli o sperimentazioni eseguite sulla piattaforma,time-to-market medio, ecc.

Standardizzazione e scoperta

La standardizzazione e la scoperta sono ancora un altro problema con i team di dati in crescita. Con la crescita di un’azienda, anche la quantità di dati creati da singoli team e persone cresce in modo esponenziale. Questo output rapido di dati crea un problema in cui non esiste un posto centrale per vedere tutti i dati esistenti in un’organizzazione.

Senza una struttura per documentare, centralizzare e visualizzare i metadati, la conoscenza istituzionale delle origini dati è limitata ai proprietari dei dati. Non è chiaro cosa significhino effettivamente i dati, da dove provengono, quanto siano affidabili, ecc. Inoltre, qualsiasi conoscenza di questi aspetti delle origini dati scompare quando i dipendenti più familiari con tali dati lasciano il team. Un altro problema comune è che i team che utilizzano gli stessi dati spesso definiscono metriche dal suono simile in modo diverso. Ad esempio, un team potrebbe definire last-7-day come last 7 full days mentre un altro team potrebbe definirlo last 168 hours.

A data standardization and discovery PM è responsabile di garantire che l’intera organizzazione venga a conoscenza dei dati esistenti e li utilizzi in modo coerente. Una manifestazione comune del prodotto di questo sforzo è un catalogo di dati o un portale di dati che facilita la scoperta e la definizione di dati / dashboard / metriche, nonché identifica i proprietari di dati che possono essere contattati per ulteriori conversazioni. Una versione più avanzata di un dataportal rende anche le metriche calcolate facilmente accessibili e incorporate in diversi casi d’uso (modellazione, analisi).

Final Words

Il panorama della gestione dei prodotti dati è ancora in evoluzione e questo non è affatto una panoramica esaustiva dei ruoli dei prodotti dati disponibili nel settore. A seconda della fase e della struttura organizzativa di un’azienda, il ruolo dei dati PM potrebbe essere un mix di queste diverse responsabilità. L’analisi potrebbe essere parte dell’infrastruttura e la standardizzazione e la scoperta potrebbero essere parte della piattaforma. Come PM ML applicato, potresti ritrovarti a cedere risorse per creare l’infrastruttura e gli ambienti di distribuzione necessari per produrre il tuo modello.

In definitiva, questi ruoli si riducono alla creazione di una preziosa esperienza utente basata sui dati e alla rimozione di tutti gli ostacoli che impediscono a un team di fornire quel valore.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.

lg