algorytmy klasyfikacji zwierząt i go-playing_agents dominują w cyklu hype AI, ale algorytmy są tylko częścią całego ekosystemu produktów danych. W większości ustawień biznesowych modele mogą mieć najmniejszy wpływ. Aby dane płynęły w żyłach Twojej organizacji, musi istnieć duży ekosystem wspierający:

  1. należy gromadzić, przechowywać i obsługiwać nieprzetworzone zdarzenia i transakcje
  2. dane muszą być przetwarzane, odkrywane i udostępniane odpowiednim zespołom.
  3. modele muszą być budowane, wdrażane i monitorowane w produkcji.

i wszystkie te przedsiębiorstwa muszą przynosić konkretne wyniki biznesowe. W jaki sposób organizacja powinna nadawać priorytety tysiącom potencjalnych kierunków?

w firmie Insight, w której pomogliśmy tysiącom pracowników przejść na różne stanowiska w branży danych, obserwujemy wzrost zapotrzebowania branży na menedżerów produktów, którzy mogą sprostać tym wyzwaniom związanym z ustalaniem priorytetów i koordynacją między zespołami ds. danych. Ten artykuł ma na celu wyjaśnienie, jak wygląda zarządzanie produktem w przestrzeni danych i dlaczego jest ważne.

Dlaczego Zarządzanie Danymi?

w małych zespołach danych bez formalnych PMs, standardowe obowiązki dotyczące produktów, takie jak ocena możliwości, mapowanie dróg i zarządzanie interesariuszami, są prawdopodobnie wykonywane przez menedżerów technicznych i indywidualnych współpracowników (ICs). To nie skaluje się dobrze z wielu powodów, cztery główne z nich to:

  1. praca nad produktem kończy się rozliczaniem całego czasu IC.
  2. nie wszystkie układy scalone są dobrze wyposażone lub chętne do obsługi pracy z produktem na dużą skalę.
  3. luki między jednostkami biznesowymi a zespołami technicznymi poszerzają się.
  4. luki między poszczególnymi zespołami technicznymi poszerzają się.

w tym punkcie przegięcia są dwie potencjalne odpowiedzi. Pierwszym podejściem jest rozbicie pracy na projekty, które są na tyle niezależne, że pojedynczy zespół informatyczny lub mały zespół techniczny może obsługiwać kompleksowo, co zmniejsza zapotrzebowanie na pewnego rodzaju koordynatorów centralnych.

drugim podejściem jest stworzenie formalnej organizacji zarządzania produktem, która jest odpowiedzialna za utrzymywanie map drogowych źródła prawdy i koordynację różnych zespołów i układów scalonych do wykonania. Jest to szczególnie powszechne w przypadku wysoce wielofunkcyjnych produktów, takich jak handel elektroniczny i usługi na żądanie.

jeśli pojedynczy układ scalony może wprowadzić zmiany w produkcie, natychmiast uzyskać obiektywną informację zwrotną na temat jego wydajności i wycofać się w najgorszych scenariuszach bez poważnych konsekwencji, pierwsze podejście jest niezwykle skuteczne. Chociaż może to działać w przypadku bezpłatnego produktu sieci społecznościowej, jest to potencjalnie katastrofalne w przypadku płatnego i ciężkiego produktu, takiego jak usługi na żądanie. Większość firm na skalę ostatecznie iść z drugim podejściem o organizację produktu.

Stan ról w zarządzaniu produktami danych

we wczesnych dniach rewolucji danych, ortogonalne umiejętności w zakresie danych, takie jak inżynieria oprogramowania, statystyka i modelowanie, były powiązane z nauką o danych. Umiejętności te są szybko formalizowane w osobne role, takie jak inżynierowie danych, analitycy danych, naukowcy badawczy i inżynierowie ML.

w obszarze zarządzania produktem kształtuje się podobny trend. Podobnie jak ich odpowiedniki techniczne, widzimy szeroki parasol danych PMs coraz dalej podzielone na podobszary: Infrastruktura, analityka, applied ML / AI, wykrywanie i standaryzacja oraz platforma. W tej chwili nie są to koniecznie formalne tytuły danych. Odzwierciedlają one raczej stosunkowo odrębne obszary pracy z produktami danych.

podczas gdy każdy przypadek użycia danych wymaga nieco innego rodzaju zrozumienia technicznego i domenowego, o czym wspominamy poniżej, ważne jest, aby podkreślić, że ogólne umiejętności zarządzania produktem są nadal najważniejszymi czynnikami sukcesu. 90% tego, co PM robi na co dzień, nadal będzie dotyczyć priorytetyzacji, komunikacji, zarządzania interesariuszami, projektowania i specyfikacji.

Infrastruktura

w skali poszczególne zespoły produktowe będą miały różne przypadki użycia i wymagania dotyczące danych. Naturalną tendencją tych zespołów jest budowanie własnej infrastruktury danych, aby szybko rozpocząć pracę. Ta tendencja prowadzi do powielania pracy, silosów danych, a ostatecznie zespoły napotkają podobne problemy ze skalowalnością danych.

ostatecznym rozwiązaniem dla PM infrastruktury jest wspólna infrastruktura danych, która zbiera, przechowuje i przetwarza istotne dane w wydajny sposób, aby umożliwić przypadki użycia w dół. Ta wspólna infrastruktura pomaga zespołom skupić się na używaniu zamiast na gromadzeniu i przechowywaniu surowych danych.

główne KPI infrastruktury PMS to dostępność danych, skalowalność i niezawodność. Są dobrze zorientowani w technologiach inżynierii danych, takich jak pobieranie danych, Przetwarzanie wsadowe i w czasie rzeczywistym, system plików i dostarczanie.

analityka

decyzje w nowoczesnym miejscu pracy są coraz częściej informowane o danych. Analityka musi wspierać szeroki zakres decyzji, od strategii po produkt i operacje, zarówno offline, jak i w czasie rzeczywistym. Podczas gdy PMS infrastruktury zapewnia, że zapytania mogą być wydajnie uruchamiane na ogromnych zestawach danych (w jaki sposób), PMS analytics koncentruje się na tym, jak przekształcić takie surowe dane w Przydatne informacje dla decydentów, takich jak execs, PMS i zespół ops. W innych przypadkach analitycy PMs są również aktywnie zaangażowani w definiowanie kluczowych wskaźników wydajności i przeprowadzanie eksploracji danych w celu rekomendowania decyzji biznesowych.

w kontekście budowania produktu kierownik ds. analityki jest odpowiedzialny za stworzenie mieszanki samoobsługowych analiz, dostosowanych pulpitów nawigacyjnych i narzędzi do raportowania, aby pomóc ujawnić i udostępnić informacje w całej organizacji. Ich interesariusze są zróżnicowani, od doświadczonych naukowców danych po konsumentów tylko do odczytu, takich jak execs.

KPI, na które patrzą, to prawdopodobnie liczba uruchomionych zapytań, wygenerowanych raportów itp. które wskazują, że użytkownicy danych mogą łatwo wyodrębnić potrzebne informacje z surowych danych.

zastosował ML / AI

niektóre produkty i funkcje, takie jak wyszukiwanie, rekomendacja, wykrywanie oszustw itp. naturalnie nadają się do rozwiązań ML / AI. Zastosowany ML PMs zastanów się, w jaki sposób można wykorzystać dane do ulepszenia istniejącego produktu (np. analizuj logi czatu, aby zautomatyzować routing obsługi klienta) lub jak zaprojektować zupełnie nowe doświadczenie przy użyciu zaawansowanej sztucznej inteligencji (np. filtry do aplikacji do udostępniania zdjęć). Ostatecznie wszyscy pracują nad bezpośrednią poprawą kluczowych wskaźników dla funkcji skierowanej do użytkownika.

PMs pracujący nad tymi funkcjami, choć nie zawsze zatytułowanymi Data PM, na ogół dobrze rozumieją przepływ pracy w zakresie nauki danych i podstawowe modele uczenia maszynowego. Mają silną intuicję na temat wykorzystania mocy ML podczas projektowania wokół jego ograniczeń, aby zapewnić lepsze wrażenia użytkownika w porównaniu do podejść opartych na regułach.

Platformy

wraz ze wzrostem wielkości firmy potrzeba znormalizowanych RAM staje się bardziej widoczna, szczególnie w przypadku eksperymentów i uczenia maszynowego. Przypadki użycia w tych dwóch obiegach pracy są często bardzo ściśle zintegrowane z naturą samego produktu,więc niewiele rozwiązań open-source może naprawdę zaspokoić potrzeby każdego.

z tego powodu poszczególne zespoły danych w dużych firmach zaczęły korzystać z własnych jednorazowych systemów, co prowadziło do powielania pracy i spowolnienia czasu wprowadzania na rynek. Pokroju Google, Facebook i Uber w ten sposób rozpoczęły platformowanie: wspólne ramy mające na celu zmniejszenie nakładów na wspólne zadania, takie jak oprzyrządowanie, wdrażanie i monitorowanie.

platformy te mają na celu wyeliminowanie potrzeby zarządzania danymi, wdrażania i monitorowania wyników, dzięki czemu zespoły ds. danych mogą skupić się na iteracjach wokół modeli i samych eksperymentów. Promują one również możliwość ponownego wykorzystania poprzez udostępnienie wspólnych danych i funkcji wszystkim użytkownikom platformy.

Platforma PMs zaczyna się od udowodnienia, w jaki sposób platforma może być przydatna i przekonać wczesnych użytkowników, aby spróbowali. Gdy platforma osiągnie punkt przegięcia, rola przesuwa się do identyfikacji wspólnych mianowników o wysokim ROI, które zostaną wbudowane w platformę. Przyglądają się wskaźnikom KPI, takim jak modele lub eksperymenty prowadzone na platformie, średni czas wprowadzenia na rynek itp.

standaryzacja i odkrywanie

standaryzacja i odkrywanie to kolejny problem z rosnącymi zespołami danych. Wraz z rozwojem firmy ilość danych tworzonych przez poszczególne zespoły i ludzi rośnie wykładniczo. To szybkie przesyłanie danych stwarza problem, w którym nie ma centralnego miejsca, aby zobaczyć wszystkie dane istniejące w organizacji.

bez struktury do dokumentowania, centralizacji i wyświetlania metadanych, instytucjonalna wiedza o źródłach danych jest ograniczona do właścicieli danych. Staje się jasne, co faktycznie oznaczają dane, skąd pochodzą, jak wiarygodne są itp. Ponadto wszelka wiedza na temat tych aspektów źródeł danych znika, gdy pracownicy najbardziej zaznajomieni z tymi danymi opuszczają zespół. Innym częstym problemem jest to, że zespoły, które używają tych samych danych, często definiują podobnie brzmiące metryki w inny sposób. Na przykład, zespół może zdefiniować last-7-day jako ostatnie 7 pełnych dni, podczas gdy inny zespół może zdefiniować go jako ostatnie 168 godzin.

ekspert ds. standaryzacji i wykrywania danych jest odpowiedzialny za zapewnienie, że cała organizacja uświadamia sobie istniejące dane i wykorzystuje je w spójny sposób. Powszechnym przejawem tego wysiłku jest katalog danych lub portal danych, który ułatwia wykrywanie i definiowanie danych / pulpitów nawigacyjnych / wskaźników, a także identyfikuje właścicieli danych, z którymi można się skontaktować w celu dalszych rozmów. Bardziej zaawansowana wersja dataportalu sprawia również, że obliczone metryki są łatwo dostępne i uwzględniane w różnych przypadkach użycia (modelowanie, analiza).

Ostatnie słowa

krajobraz zarządzania produktami danych wciąż się rozwija i nie jest to w żadnym razie wyczerpujący przegląd ról produktów danych dostępnych w przemyśle. W zależności od etapu i struktury organizacyjnej firmy, Rola Data PM może być mieszanką tych różnych obowiązków. Analityka może być częścią infrastruktury, a standaryzacja i odkrywanie mogą być częścią platformy. Jako zastosowany ML PM możesz wyprzedawać zasoby na budowę infrastruktury i środowisk wdrożeniowych niezbędnych do produkcji modelu.

ostatecznie role te sprowadzają się do stworzenia cennego doświadczenia użytkownika opartego na danych i usunięcia wszystkich przeszkód uniemożliwiających zespołowi dostarczanie tej wartości.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.

lg