動物分類アルゴリズムとGo-playing_agentsはAIの誇大広告サイクルを支配していますが、アルゴリズムはデータ製品エコシステム全体の一部にすぎません。 ほとんどのビジネス設定では、モデルは実際には影響の最小量を占める可能性があります。 データが組織の静脈を流れるためには、大規模なサポートエコシステムが整備されている必要があります:

  1. 生のイベントとトランザクションを収集、保存、提供する必要があります
  2. データを処理、発見、関連するチームと共有する必要があります。
  3. モデルは本番環境で構築、展開、監視する必要があります。

そして、これらすべての事業は具体的な業績を生み出す必要があります。 組織は何千もの潜在的な方向性の中でどのように優先順位を付けるべきですか?

Insightでは、何千人ものフェローがデータ業界でさまざまな役割に移行するのを支援してきましたが、データチーム間のこれらの優先順位付けと調整の課題に取 この記事では、製品管理がデータ空間でどのように見えるか、そしてそれが重要である理由を説明することを目的としています。

なぜデータ製品管理?

正式なPMsのない小規模なデータチームでは、機会評価、ロードマッピング、利害関係者管理などの標準的な製品責任は、技術管理者および個々の貢献者(ICs)によっ これは多くの理由でうまく拡張されません。:

  1. 製品の作業は、ICのすべての時間を占めてしまいます。
  2. すべてのIcが十分に装備されているわけではなく、製品の作業を大規模に処理する意思があるわけではありません。
  3. ビジネスユニットと技術チームの間のギャップが広がっています。
  4. 個々の技術チーム間のギャップが広がる。

この変曲点では、2つの潜在的な応答があります。 最初のアプローチは、単一のICまたは小規模な技術チームがエンドツーエンドを処理するのに十分な自己完結型のプロジェクトに作業を分割し、ある種の中央コーディネータの必要性を減らすことです。

第二のアプローチは、source-of-truthロードマップを維持し、実行するためのさまざまなチームとIcを調整する責任を持つ正式な製品管理組織を作成することです。 これは、電子商取引やオンデマンドサービスなどの機能横断性の高い製品に特に一般的です。

単一のICで製品を調整し、その性能について客観的なフィードバックをすぐに得て、最悪のシナリオで大きな影響を与えずにロールバックすることが これは無料のソーシャルネットワーク製品のために働くかもしれないが、それはオンデマンドサービスのような有料と操作重い製品のために潜在的に破 大規模なほとんどの企業は、最終的には製品組織を持つという第二のアプローチを採用しています。

データ製品管理の役割の状態

データ革命の初期には、ソフトウェア工学、統計、モデリングなどの直交データスキルは、データサイエンスの同じ傘の下 これらのスキルは、データエンジニア、データサイエンティスト、研究科学者、MLエンジニアなど、別々の役割に急速に形式化されています。

製品管理の中でも同様の傾向が現れています。 彼らの技術的な対応と同様に、我々はデータPMsの広範な傘がさらにサブエリアに分割されているのを見ています: インフラストラクチャ、分析、応用ML/AI、発見と標準化、およびプラットフォーム。 これらは、現時点では必ずしも正式なデータPMタイトルではありません。 むしろ、それらはデータ製品の作業の比較的明確な領域を反映しています。

それぞれのデータユースケースでは、技術的理解とドメイン理解のわずかに異なるタイプが必要ですが、以下に触れますが、ジェネラリストの製品管理スキ Data PMが日常的に行うことの90%は、依然として優先順位付け、通信、利害関係者の管理、設計、仕様です。

インフラストラクチャ

スケールでは、個々の製品チームは異なるユースケースとデータ要件を持っています。 これらのチームの自然な傾向は、迅速に開始するために、独自のデータインフラストラクチャを構築することです。 この傾向は、重複した作業、データのサイロにつながり、最終的にはチームは同様のデータスケーラビリティの問題に遭遇します。

インフラストラクチャPMの究極の成果物は、ダウンユースケースを可能にするために、関連するデータを効率的に収集、保存、処理する共通のデータインフラ この共通インフラストラクチャは、チームが生データを収集して保存するのではなく、使用に集中するのに役立ちます。

インフラストラクチャPMsの主なKpiは、データの可用性、スケーラビリティ、信頼性です。 彼らは、データの取り込み、バッチおよびリアルタイムでの処理、ファイルシステムおよび配信などのデータ工学技術に精通しています。

分析

現代の職場における意思決定は、ますますデータによって知らされています。 分析では、戦略から製品、運用まで、オフラインとリアルタイムの両方で幅広い意思決定をサポートする必要があります。 Infrastructure PMsでは、大量のデータセット(how)でクエリを効率的に実行できるようにしますが、analytics PMsでは、このような生データを実行者、PMs、opsチームなどの意思決定者にとっ その他のケースでは、analytics PMsは、主要業績評価指標の定義や、ビジネス上の意思決定を推奨するためのデータ探索の実行にも積極的に関与しています。

分析PMは、製品構築のコンテキスト内で、セルフサービス分析、カスタマイズされたダッシュボード、レポートツールの混合物を作成し、組織全体で洞察を表出して共有するのに役立ちます。 彼らの利害関係者は、精通したデータ科学者から幹部のような読み取り専用の消費者まで、多様です。

彼らが見ているKpiは、実行されたクエリの数、生成されたレポートなどです。 これは、データユーザーが生データから必要な洞察を抽出するのが容易であることを示しています。

Applied ML/AI

検索、レコメンデーション、不正検出などの特定の製品や機能。 ML/AIソリューションに自然に自分自身を貸します。 Applied ML PMsは、既存の製品を改善するためにデータを活用する方法(例えば、チャットログを分析して顧客サービスルーティングを自動化する方法)や、高度なAIを使用して全く新しいエクスペリエンスを設計する方法(例えば、写真共有アプリのフィルタ)について考えています。 最終的には、それらはすべて、ユーザー向け機能の主要な指標を直接改善することに取り組んでいます。

これらの機能に取り組んでいるPMsは、必ずしもData PMと題されているわけではありませんが、一般的にデータサイエンスのワークフローと基礎となる機械学習モデルを強く理解しています。 彼らは、ルールベースのアプローチと比較して優れたユーザーエクスペリエンスを提供するために、その限界を中心に設計しながら、MLの力を活用す

プラットフォーム

企業の規模が拡大するにつれて、特に実験や機械学習において、標準化されたフレームワークの必要性がより明らかになります。 これら二つのワークフローのユースケースは、多くの場合、製品自体の性質と非常に緊密に統合されているため、すべての人のニーズを真に満たすことができる

このため、大企業の個々のデータチームは独自の一回限りのシステムを開始し、作業の重複と市場投入までの時間の短縮につながりました。 このように、Google、Facebook、Uberなどが配給に着手しています。: ツール、展開、監視などの一般的なタスクに費やされる労力を削減するのに役立つ共通のフレームワーク。

これらのプラットフォームは、データの管理、展開、結果の監視の必要性を抽象化し、データチームがモデルと実験自体を反復することに集中できるように また、プラットフォームのすべてのユーザーが共通のデータと機能にアクセスできるようにすることで、再利用性を促進します。

プラットフォームPMsは、プラットフォームがどのように有用であるかを証明し、早期導入者に試してみるよう説得することから始めます。 プラットフォームが変曲点に到達すると、役割はプラットフォームに構築するための高ROI共通分母を特定することに移ります。 彼らは、プラットフォーム上で実行されるモデルや実験、市場投入までの平均時間などのKpiを見ています。

標準化と発見

標準化と発見は、データチームの成長にとってさらに別の問題です。 企業が成長するにつれて、個々のチームや人々によって作成されるデータの量も指数関数的に増加します。 このようなデータの迅速な出力は、組織内に存在するすべてのデータを見るための中心的な場所がないという問題を引き起こします。

メタデータを文書化し、一元化し、表示する構造がなければ、データソースに関する制度上の知識はデータ所有者に限定されます。 データが実際に何を意味するのか、それらがどこから来たのか、それらがどれほど信頼できるのかなどが不明になります。 さらに、データソースのこれらの側面に関する知識は、そのデータに最も精通している従業員がチームを離れると消えます。 別の一般的な問題は、同じデータを使用するチームは、多くの場合、同様の響きの指標を異なる定義していることです。 たとえば、あるチームはlast-7-dayをlast7full daysと定義し、別のチームはlast168hoursと定義することができます。

データの標準化と発見PMは、組織全体が存在するデータを認識し、一貫して定義された方法でそれらを使用するようにする責任があります。 この取り組みの一般的な製品の現れは、データ/ダッシュボード/メトリックの検出と定義を容易にするだけでなく、さらなる会話のために連絡することができ、データ所有者を識別するデータカタログまたはデータポータルです。 また、dataportalのより高度なバージョンでは、計算されたメトリックに簡単にアクセスでき、さまざまなユースケース(モデリング、分析)に組み込

最終的な言葉

データ製品管理の状況はまだ進化しており、これは決して業界で利用可能なデータ製品の役割の網羅的な概要ではありません。 企業のステージと組織構造に応じて、データPMの役割は、これらの異なる責任の組み合わせである可能性があります。 分析はインフラストラクチャの一部であり、標準化と検出はプラットフォームの一部である可能性があります。 適用されたML PMとして、モデルを生産するために必要なインフラストラクチャと展開環境を構築するためにリソースを売却することがあります。

最終的には、これらの役割は、貴重なデータを活用したユーザーエクスペリエンスを構築し、チームがその価値を提供するのを妨げるすべての障害を取り除く

コメントを残す

メールアドレスが公開されることはありません。

lg