首页 > 人工智能 > 正文

想组建自己的数据科学团队?CEO们请先回答这几个问题

2016-04-14 14:35:25  来源:36大数据

摘要:随着时间的推移,你打造的数据科学团队的成员将有不同的技能组合、不同的背景和世界观,这时他们也将发挥越来越大的影响。
关键词: 大数据 CEO
  Jeremy Stanley是日用杂货当日送达初创企业Instacart主管数据科学的副总裁,Daniel Tunkelang是前LinkedIn的数据主管。作为在数据科学领域身经百战的老将,他们在这篇文章中为那些想打造一支属于自己的数据科学团队的公司CEO们提供了一些建议,主要涵盖了这几个问题:
 

 
  你想实现什么样的目的?
  你是否应该在数据科学上进行投入?
  何时应该开始组建数据科学团队?
  你应该将数据科学团队放在公司的什么位置上?
  如何打造一个尊重和重视数据科学的公司文化?
 
  你可能很难相信,“数据科学家”在2008年才开始成为一个真正意义上的职业头衔。当时,为了迎合市场对数据分析、工程学和产品这种跨学科技能人才日益增长的需求,Facebook的Jeff Hammerbacher和LinkedIn的DJ Patil率先提出了“数据科学家”这个概念。今天,市场上对数据科学家的需求极其旺盛,越来越多的公司都想更好地了解如何打造一支属于自己的数据科学家团队。
 
  作为在数据科学领域身经百战的过来人,Jeremy Stanley和Daniel Tunkelang已经见识了不同行业的不同公司在不同发展阶段在打造数据科学家团队方面的成功和失败案例。他们发现,这里面的挑战不仅在于如何招聘顶尖的数据科学家,还包括如何最大限度地发挥他们的价值,以及如何在日趋激烈的人才竞争中留住他们。
 
  在这篇文章中,我们为那些想打造一支属于自己的数据科学团队的公司创始人提供了一些建议。
 
  第一个问题:你想实现什么样的目的?
 
  数据科学主要有两个方面的功能:
 
  一是改善用户所使用的产品;
  二是为公司决策提供支持,改善决策质量。
 
  数据驱动型产品利用数据科学和工程学来持续改进产品性能,例如,提供更好的搜索结果、更个性化的推荐等等。
 
  数据决策科学利用数据来分析业务指标,例如增长数据、用户黏性数据、盈利点和用户反馈数据等,从而为制定公司战略和关键性的业务决策服务。
 
  两者的区别可能看起来非常显而易见,不过在打造和扩充自己的数据科学团队的过程中,记住这两者之间的区别非常重要。接下来我们就详细探讨这两点。
 
  1.1利用数据科学打造更好的产品
 
  数据产品可以利用数据科学去提升产品的性能表现。他们依靠的是这样一个良性循环:产品搜集用户使用数据,这些数据成为算法素材后再反过来为用户提供更好的产品使用体验。
 
  那么在搜集到数据之前是怎样的呢?你的产品的第一个版本必须解决数据科学称之为 “冷启动” 的问题,也就是说产品的初始版本必须提供足够好的体验才能够启动 “数据搜集—数据驱动产品提升” 这个良性循环。要想做到这一点,这就需要依靠产品经理和工程师制定足够好的解决方案。
 
  例如,当用户打开Instacart应用的时候,这款应用会在 “再次购买” 栏向自动给用户展示他们最近购买过的日用杂货品。这是一个用户很喜欢的功能,不过它几乎用不到数据科学或是需要足够多的数据来支撑。只有当我们为用户推荐一些他们之前没有购买过的商品的时候,这时数据科学才能发挥它真正的作用。例如,要向A用户推荐他之前从未购买过的商品,这就需要数据科学家对所有用户的购买行为进行分析,从而确定和A用户比较类似的B用户,然后再根据B用户过去的购买行为来为A用户推荐商品。这就是数据科学利用数据创造价值、从而使用户更容易地发现他们自己可能没发现的好产品的一个案例。
 
  为了改善产品,数据科学家必须和工程师进行持续而紧密地合作。此外,你还需要决定是产品科学家自己去落实产品改进方案还是与工程师一起去落实。这两种方法都可以,不过最好能对其进行规定,让它成为公司员工人人皆知的一个流程与规范。
 
  1.2使用数据科学为做出更好的决策提供支持
 
  数据决策科学利用数据分析与可视化来为公司业务和产品决策提供支持。公司里可能谁都有可能是决策者,例如产品经理对如何制定路线图的优先级进行决策,公司高管对公司层面的战略性问题进行决策。决策科学问题涉及的范围很广,不过它们有一些共同的特点。第一,它们是公司之前尚不需要解决的一些新问题;第二,它们通常是主观性的问题,需要数据科学家在有未知变量和缺少上下文的情况下处理的问题。第三,它们通常是非常复杂的问题,问题的不同部分之间缺少明确的因果关系。与此同时,决策科学问题又是可以衡量且影响非常重大的,做出决策后能对业务产生具体而重大的影响。
 
  上面说得听起来很像数据分析,事实上,数据分析和数据决策科学之间的差别并不是一直都非常清楚的。不管怎样,决策科学要做的事远不限于仅仅是制作报告和图表。数据科学家不应该做那些利用市场上现有的商业智能工具就能完成的工作。
 
  在LinkedIn,公司管理团队就曾利用数据决策科学做出一个非常关键的商业决策:有关在搜索结果中其他会员资料的可见性。在之前,只有付费用户才能查看自己三度人脉网络里成员的全部资料。这种可见性规则非常复杂,LinkedIn想对其进行简化,但同时又不想影响自己的营收。其中的风险还是很大的。
 
  最后提议的可见模型是对非付费用户每月的使用进行限制。LinkedIn的决策科学家利用用户历史行为来预测这个改变对营收和用户黏性可能会造成的影响。这个分析必须在一个模型上推断过去的行为从而在另一个完全不同的模型上预测用户未来的行为。结果证明,新的可见性规则不仅对公司业务产生了积极影响,同时也让数百万用户更加满意我们的产品,它还帮我们卸下了之前产品开发中规则过于复杂的沉重负担。有些用户抱怨新的可见性规则方面对查看资料上做出的限制,然而这部分人正是LinkedIn认为应该付费使用自己产品的用户。在数据决策科学的帮助下,这个项目非常成功。
 
  并不是所有的决策都需要依靠数据决策科学。有些决策太无关紧要,所以不值当在数据决策科学上进行大量投入。还有一些决策可能非常重要,但缺乏需要的数据对其进行有意义地分析。在这种情况下,就需要依靠直觉和实验。
 
  数据决策科学和数据产品需要的技能有的是类似的,很少数据科学家能在这两个方面都非常擅长。数据决策科学依靠的是业务和产品感觉、系统思维能力和优秀的沟通能力。数据产品需要的是机器学习知识和产品级别的工程技能。如果你的数据科学团队规模还很小,你可能需要找一个在这两方面都比较擅长的超级英雄。当团队规模慢慢变大后,你最好能招在这两个方面分别比较擅长的人才。
 
  
  第二个问题:你是否应该在数据科学上进行投入?
 
  数据科学并不适合所有公司。只有当它对公司成功与否至关重要时,你才需要在数据科学上进行投入。在你决定是否投入打造一支数据科学团队之前,建议先问自己下面这四个问题:
 
  2.1你决心利用数据科学来为制定战略决策服务或是打造数据驱动型的产品吗?
 
  如果你还不确定是否会利用数据科学为制定战略决策服务或是打造数据驱动型的产品的话,那么建议暂时不要招聘数据科学家。
 
  只有当你决心打造一个数据驱动型的决策文化时,数据科学才能更好地为制定战略决策服务。你可能并不是一开始就需要它,不过要招到合适的数据科学家是需要一定的时间的,让数据科学家了解你的数据和业务同样是需要一定的时间的。在你打算利用数据科学驱动决策之前,这些工作都需要提前做。
 
  数据驱动型产品可以通过利用数据持续改善和优化产品,从而创造更多的价值并取悦更多的用户。如果你这些在你的产品路线图上,那么你应该尽早招数据科学家进来。数据科学家可以在产品设计、数据搜集和系统架构等方面做出关键性决策,这对于打造一款真正优秀的产品非常重要。
 
  2.2你能够搜集到你需要的数据并且让数据驱动行动吗?
 
  公司的创始工程师可以依靠很少产品和设计指导的情况下就能开发一个最小可行性产品。数据科学则需要大量的数据。推荐系统依靠监测你的产品来追踪用户行为,优化业务决策则需要依靠对关键性的活动和输出进行精密测量。
 
  光搜集数据是远远不够的,只有数据能够真正驱动行动的时候,数据科学的价值才能显现。数据应该去推动产品的迭代完善,同时能够驱动公司的关键绩效指标(KPI)。
 
  为了真正落实这一理念,这就需要在全公司范围内明确每款产品需要搜集什么数据,同时制定清晰的搜集和维护数据的架构和流程。这需要数据科学家、工程师和产品经理的协同配合,而所有这些又都需要管理层的支持和承诺。同样的道理,数据驱动型决策也需要公司CEO自上而下的支持和决心,确保全公司都能决心依靠数据来做决策,而不是依靠依靠职位高的人的意见进行决策。
 
  2.3你搜集的数据里有足够多有用的信号来帮你获取有意义的见解吗?
 
  很多人将大量数据和数据科学等同起来,然而数量并不是一切。真正的数据科学是从噪音中的数据里提取有用的数据信号。
 
  有用的信号不光取决于数据量的大小,还取决与信号和噪音的比例。举个例子,一个广告产可能会从数十亿的广告曝光中搜集数据,然而只有少数用户与广告互动的情况下才是真正有用的数据信号。因此,通常情况下大量的数据只能产生少量有用的信号。
 
  2.4你是否需要让数据科学成为你的核心竞争力,或是否可以将数据科学工作外包出去?
 
  要打造一支数据科学团队是非常困难而且是需要大量资金支持的。如果通过外包就能完全满足你在数据科学方面的需求的话,那么不妨将这项工作外包出去。有人建议可以明智地利用外部的顾问来做这项工作,不过还有一个更好的建议,那就是通过利用市场上现有的产品和解决方案来获取数据、创建模型、实现自动化操作并给出关键的分析报告。它可能不是专门为你的需求量身定制的完美解决方案,不过为了能快速推进业务、同时能够让核心团队成员专注在能创造最多价值的工作上,在这方面做一点点妥协也是值得的。
 
  你什么时候需要将数据科学作为自己的核心竞争力呢?如果数据科学正在解决对你能否成功起着至关重要作用的问题的话,这时你就不能将这项工作外包出去了。市场上现有的解决方案很多时候也非常死板不灵活。如果你的公司正在尝试利用一种独特的方法解决一个新问题的话(例如搜集全新类型的数据或是以全新的方法使用数据),这时市场上现有的解决方案可能就无法满足你的需求了。
 
  
  (Jeremy Stanley 在位于旧金山的 Instacart 总部)
 

  
第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训

责编:pingxiaoli

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。