동물 분류 알고리즘과 바둑 놀이 _대행사는 인공지능 과대 광고 사이클을 지배하지만 알고리즘은 전체 데이터 제품 생태계의 한 부분일 뿐이다. 대부분의 비즈니스 설정에서 모델은 실제로 영향을 가장 적게 차지할 수 있습니다. 데이터가 조직의 혈관을 통해 흐르려면 대규모 지원 에코시스템이 마련되어야 합니다:

  1. 원시 이벤트 및 트랜잭션을 수집,저장 및 제공해야합니다
  2. 데이터를 처리,발견 및 관련 팀과 공유해야합니다.
  3. 프로덕션 환경에서 모델을 구축,배포 및 모니터링해야 합니다.

이러한 모든 사업은 구체적인 사업 결과를 산출해야합니다. 조직은 수천 가지 잠재적 인 방향 중에서 어떻게 우선 순위를 매겨야합니까?

데이터 산업에서 수천 명의 동료들이 다양한 역할로 전환할 수 있도록 도와준 인사이트에서 데이터 팀 간의 이러한 우선 순위 지정 및 조정 문제를 해결할 수 있는 제품 관리자에 대한 업계 수요가 증가하고 있습니다. 이 문서에서는 데이터 공간에서 제품 관리가 어떻게 생겼는지,왜 중요한지 설명합니다.

왜 데이터 제품 관리인가?

공식 데이터 관리 시스템이 없는 소규모 데이터 팀에서는 기회 평가,도로 매핑,이해관계자 관리와 같은 표준 제품 책임이 기술 관리자 및 개별 기여자에 의해 수행될 가능성이 높습니다. 이것은 여러 가지 이유로 잘 확장되지 않습니다,네 가지 주요 것들 인:

  1. 제품 작업은 모든 시간을 차지하게 됩니다.
  2. 모든 정보통신망 이용촉진 및 정보보호 등에 관한 법률
  3. 사업 단위와 기술 팀 간의 격차가 확대됩니다.
  4. 개별 기술 팀 간의 격차가 확대됩니다.

이 변곡점에는 두 가지 잠재적 응답이 있습니다. 첫 번째 접근 방식은 작업을 단일 프로젝트 또는 소규모 기술 팀이 종단 간 처리 할 수있을만큼 독립적 인 프로젝트로 분해하여 일부 유형의 중앙 코디네이터의 필요성을 줄이는 것입니다.

두 번째 접근 방식은 소스-진실 로드맵을 유지하고 다른 팀과 정보 통신 시스템을 실행하도록 조정하는 공식적인 제품 관리 조직을 만드는 것입니다. 이는 전자 상거래 및 주문형 서비스와 같은 고도의 교차 기능 제품에 특히 일반적입니다.

한 가지 방법으로 제품을 조정하고,그 수행 방식에 대한 객관적인 피드백을 즉시 얻고,최악의 시나리오에서 큰 파급 효과 없이 롤백할 수 있다면,첫 번째 접근 방식은 매우 강력합니다. 이 무료 소셜 네트워크 제품에 대한 작동 할 수 있지만,그것은 주문형 서비스와 같은 유료 및 운영 무거운 제품에 대한 잠재적으로 재앙이다. 규모의 대부분의 기업은 궁극적으로 제품 조직을 갖는 두 번째 접근 방식으로 이동합니다.

데이터 제품 관리 역할의 현황

데이터 혁명 초기에는 소프트웨어 엔지니어링,통계 및 모델링과 같은 직교 데이터 기술이 데이터 과학의 동일한 우산 아래 적용되었습니다. 이러한 기술은 데이터 엔지니어,데이터 과학자,연구 과학자 및 기계 학습 엔지니어와 같은 별도의 역할로 빠르게 공식화되고 있습니다.

제품 관리 내에서 비슷한 추세가 형성되고 있습니다. 그들의 기술적 대응처럼,우리는 더 하위 영역으로 분할되고 데이터 생리 기간의 광범위한 우산을 참조하십시오: 인프라,분석,적용 ML/AI,디스커버리고 표준화하고,플랫폼입니다. 이 순간에 반드시 공식적인 데이터 오후 제목이 아니다. 오히려 데이터 제품 작업의 상대적으로 별개의 영역을 반영합니다.

각 데이터 사용 사례에는 약간 다른 유형의 기술 및 도메인 이해가 필요하지만 일반 제품 관리 기술은 여전히 성공의 가장 중요한 동인이라는 점을 강조하는 것이 중요합니다. 데이터 오후가 일상적으로하는 일의 90%는 여전히 우선 순위,커뮤니케이션,이해 관계자 관리,디자인 및 사양이 될 것입니다.

인프라

규모에 따라 개별 제품 팀은 사용 사례와 데이터 요구 사항이 다릅니다. 이러한 팀의 자연스러운 경향은 신속하게 시작하기 위해 자체 데이터 인프라를 구축하는 것입니다. 이러한 경향은 중복 된 작업,데이터 사일로로 이어지며 궁극적으로 팀은 유사한 데이터 확장 성 문제에 직면하게됩니다.

인프라스트럭처의 최종 결과물은 사용 사례를 축소할 수 있도록 관련 데이터를 수집,저장 및 처리하는 공통 데이터 인프라스트럭처입니다. 이 공통 인프라는 팀이 원시 데이터를 수집하고 저장하는 대신 사용하는 데 집중할 수 있도록 도와줍니다.

인프라스트럭처의 주요 기반시설은 데이터 가용성,확장성 및 안정성입니다. 데이터 수집,일괄 처리 및 실시간 처리,파일 시스템 및 전달과 같은 데이터 엔지니어링 기술에 정통합니다.

분석

현대 직장에서의 결정은 점점 더 데이터에 의해 알려지고 있습니다. 애널리틱스는 전략에서 제품 및 운영에 이르기까지 오프라인 및 실시간으로 다양한 의사 결정을 지원해야 합니다. 이러한 데이터를 실행 가능한 통찰력으로 전환하는 방법에 중점을 둡니다. 또한 비즈니스 의사결정을 권장하기 위해 핵심 성과 지표를 정의하고 데이터 탐색을 수행하는 데에도 적극적으로 참여하고 있습니다.

제품 구축의 맥락에서 분석 담당자는 셀프 서비스 분석,사용자 지정된 대시보드 및 보고 도구를 혼합하여 조직 전체에서 인사이트를 표시하고 공유하는 데 도움을 주는 역할을 담당하고 있습니다. 이해 관계자는 정통한 데이터 과학자부터 경영진과 같은 읽기 전용 소비자에 이르기까지 다양합니다.

보고 있는 쿼리는 실행된 쿼리 수,생성된 보고서 등입니다. 이는 데이터 사용자가 원시 데이터에서 필요한 통찰력을 쉽게 추출 할 수 있음을 나타냅니다.

응용마케팅/인공지능

검색,추천,사기 탐지 등과 같은 특정 제품 및 기능 자연스럽 게 솔루션/인공지능에 자신을 빌려. 기존 제품을 개선하기 위해 데이터를 활용할 수 있는 방법(예:채팅 로그를 분석하여 고객 서비스 라우팅 자동화)또는 고급 인공지능을 사용하여 완전히 새로운 경험을 설계하는 방법(예:사진 공유 앱의 필터)에 대해 생각해 보십시오. 궁극적으로 이들은 모두 사용자 대면 기능에 대한 주요 메트릭을 직접 개선하는 작업을 수행합니다.

이러한 기능에 대한 작업은 항상 데이터 오후라는 제목은 아니지만 일반적으로 데이터 과학 워크 플로우와 기본 기계 학습 모델에 대한 강력한 이해를 가지고 있습니다. 그들은 규칙 기반 접근 방식에 비해 우수한 사용자 경험을 제공하기 위해 그 한계를 중심으로 설계하면서 기계의 힘을 활용에 대한 강한 직관을 가지고있다.

플랫폼

기업의 규모가 커짐에 따라 표준화 된 프레임 워크에 대한 필요성이 특히 실험과 기계 학습에서 더욱 분명해진다. 이 두 워크 플로우의 사용 사례는 종종 제품 자체의 특성과 매우 긴밀하게 통합되므로 모든 사람의 요구를 진정으로 충족시킬 수있는 오픈 소스 솔루션은 거의 없습니다.

이러한 이유로 대기업의 개별 데이터 팀은 자체 일회성 시스템으로 시작하여 중복 작업과 시장 출시 시간을 단축했습니다. 구글,페이스 북과 동네 짱의 좋아하는 따라서 플랫폼에 착수했다 The: 툴링,배포 및 모니터링과 같은 일반적인 작업에 소요되는 노력을 줄이는 데 도움이되는 공통 프레임 워크.

이러한 플랫폼은 데이터 관리,결과 배포 및 모니터링의 필요성을 추상화하여 데이터 팀이 모델과 실험 자체를 반복하는 데 집중할 수 있도록하는 것을 목표로합니다. 또한 플랫폼의 모든 사용자가 공통 데이터 및 기능에 액세스 할 수 있도록하여 재사용을 촉진합니다.

플랫폼이 어떻게 유용하고 설득력있는 얼리 어답터가 시도 할 수 있는지 입증하는 것으로 시작합니다. 플랫폼이 변곡점에 도달하면 역할은 플랫폼에 구축 할 높은 투자 수익 공통 분모를 식별하는 것으로 이동합니다. 그들은 플랫폼에서 실행되는 모델이나 실험,평균 출시 시간 등과 같은 케이피스를 봅니다.

표준화 및 발견

표준화 및 발견은 성장하는 데이터 팀의 또 다른 문제입니다. 회사가 성장함에 따라 개별 팀과 사람들이 생성 한 데이터의 양도 기하 급수적으로 증가합니다. 이러한 빠른 데이터 출력은 조직에 존재하는 모든 데이터를 볼 수 있는 중앙 위치가 없는 문제를 야기합니다.

메타데이터를 문서화하고 중앙 집중화하고 표시하는 구조가 없으면 데이터 소스에 대한 제도적 지식은 데이터 소유자에게만 국한됩니다. 데이터가 실제로 무엇을 의미하는지,어디서 왔는지,얼마나 신뢰할 수 있는지 등이 분명하지 않습니다. 또한 데이터 원본의 이러한 측면에 대한 지식은 해당 데이터에 가장 익숙한 직원이 팀을 떠날 때 사라집니다. 또 다른 일반적인 문제는 동일한 데이터를 사용하는 팀이 종종 비슷한 소리 메트릭을 다르게 정의한다는 것입니다. 예를 들어,팀은 지난 7 일을 지난 7 일로 정의하고 다른 팀은 지난 168 시간으로 정의 할 수 있습니다.

데이터 표준화 및 검색 오후 전체 조직 존재 하 고 일관 되 게 정의 된 방식으로 사용 하는 데이터의 인식 되 고 보장 하는 책임이 있습니다. 이러한 노력의 일반적인 제품 표현은 데이터 카탈로그 또는 데이터/대시 보드/메트릭의 검색 및 정의를 용이하게하고 추가 대화를 위해 연락 할 수있는 데이터 소유자를 식별하는 데이터 포털입니다. 또한 고급 버전의 데이터 포트를 사용하면 계산된 메트릭에 쉽게 액세스할 수 있고 다양한 사용 사례(모델링,분석)에 통합할 수 있습니다.

최종 단어

데이터 제품 관리 환경은 여전히 진화하고 있으며 이는 업계에서 사용 가능한 데이터 제품 역할에 대한 철저한 개요가 아닙니다. 회사의 단계 및 조직 구조에 따라 데이터 오후 역할은 이러한 서로 다른 책임의 혼합이 될 수 있습니다. 분석은 인프라의 일부일 수 있으며 표준화 및 검색은 플랫폼의 일부일 수 있습니다. 응용 기계 학습 오후로,당신은 당신의 모델을 생산하는 데 필요한 인프라 및 배포 환경을 구축하기 위해 자원을 매각 자신을 찾을 수 있습니다.

궁극적으로 이러한 역할은 귀중한 데이터 기반 사용자 경험을 만들고 팀이 그 가치를 제공하지 못하게하는 모든 장애물을 제거하는 것입니다.

답글 남기기

이메일 주소는 공개되지 않습니다.

lg