首页 > 大数据 > 正文

2017全球TOP10数据科学公司榜单出炉

2017-04-13 08:28:30  来源:爽朗的林夏

摘要:用数据分析驱动商业,或者解决社会问题,已在全球形成一股风潮。对数据的分析和利用,已经成功让一些公司或机构脱颖而出。
关键词: 数据科学
  2017全球TOP10数据科学公司榜单出炉

  用数据分析驱动商业,或者解决社会问题,已在全球形成一股风潮。对数据的分析和利用,已经成功让一些公司或机构脱颖而出。

  美国知名的商业杂志《快公司》前段时间就公布了一份“2017最创新公司Top10”榜单。榜单专门评出了全球前10的“数据科学类”公司和机构。喏,排名长下面这样:

\

  纵览上面这10家数据科学类创新公司,DT君总结发现,公司的入选理由大致有三类:

  在利用大数据推动商业决策上有创新之处(Netflix,Spotify,FourSquare等);

  通过数据整合或众筹,实现了一定社会价值(NASA,《卫报》等);

  在数据科学领域进行了投资,以期通过数据分析为未来商业决策提供依据(WeWork)。

  这10家公司或机构在数据分析和利用方面究竟都有何“能耐”?下面DT君带你一一了解。

  1  Netflix

  Netflix创立于1997年,是一家提供网络视频点播的公司,也经营邮寄DVD出租服务。2011年,Netflix开始发力原创内容,投资并拍摄了一系列原创剧集,其中包括在中国大热的纸牌屋(HouseofCards)。

  与传统的视频点播类公司不同的是,Netflix的运营目标不是吸引尽可能多的观众,而是希望能为每一个细分群体提供他们最想看的电影或节目。

  2016年12月,Netflix对其用户界面进行了一次重大升级,将原来的静态海报图片换成了根据用户喜好定制的预览视频,当用户滑到视频模块时,预览视频会自动播放。实现这一功能,需要产品创意和数据科学二者相结合。

\
  (图片来源:网络)

  2  Spotify

  Spotify是一家提供音乐、视频、播客等形式的流媒体内容的平台。

  2016年,Spotify请来投资人兼LadyGaga前经纪人TroyCarter作为全球创意服务的负责人。在Carter的带领下,Spotify推出了基于数据产生的个性化播放列表,如Discover Weekly,Fresh Finds和Release Radar。

  在不到一年的时间里,Discover Weekly为4000万人提供了50亿首歌的服务,用户人数超过AppleMusic和Tidal(DT君注:Tidal是一家音乐流媒体服务商)的总和。

  Spotify的成功很大程度上是因为成熟的数据采集方式。数据使得Spotify能持续地提供新产品,抓住并黏住用户。

\
  (图片来源:网络)

  3  WeWork

  联合办公空间WeWork的运作模式是:WeWork从房地产公司租来办公空间,对其进行装修并配以商业配套服务,之后再转租给其它公司和移动办公的人。

  WeWork在全球激进扩张,截止2016年,WeWork的会员数和营收运转率都翻了一番。

  WeWork近期在机器学习和数据分析上作了投资,希望能通过数据发现租客是如何使用WeWork空间的,以此来降低新建办公室的制造成本。

  4  Foursquare

  Foursquare是一款基于用户定位的社交网络APP。Foursquare刚推出的时候需要通过用户手动“一键签到”来获取用户的位置信息。

  近年来,Foursquare通过引入一项名为Pilgrim的技术,可以在用户授权的情况下,更容易地获取用户的地理位置信息——Pilgrim的推出使得用户不用把手机从口袋里掏出来,就能实现“签到”。这也让Foursquare更容易知道了用户们的日常足迹。

  Foursquare利用这些地理位置的信息,可以为商家提供精准营销和店内数字广告效果评估的服务。

  2016年春季,Foursquare在Chipotle(DT君注:一家美国知名快餐店)发布财报之前的几周,就准确预测了其销量下滑的事实,展现了其数据分析能力。

\
  (图片来源:网络)

  5  NASA

  《快公司》表示,NASA的入选的原因是,让人们看到了二氧化碳的流动轨迹。

  2016年12月,NASA公布了一项超级计算机项目。该项目根据NASA的二氧化碳卫星测量数据,与复杂的地球系统模型相结合,提供了关键温室气体如何穿越大气层的真实视图。

  这个三维可视化数据产品展示了2014年9月到2015年9月期间,二氧化碳在全球大气中增加、减少和流动的细节。此前,从未有二氧化碳的可视化产品展现过如此细致的信息。

  NASA哥达德中心的碳循环科学家莱斯利·奥特解释了这个可视化项目背后的数据集的重要性。

  目前,学界共识是,人类排放的二氧化碳有50%的排放量停留在大气中,25%被陆地上的植被吸收,大约25%被海洋吸收。但科学家们仍有很多疑问:哪个生态系统吸收了多大数量的二氧化碳?以及,随着排放量的不断上升,土地和海洋会继续保持这样的吸收率吗?还是会达到一个饱和点?

  奥特表示说,(为支持可视化产生的)新的数据集可以帮助回答这些问题。科学家们需要了解驱动“碳流动”的过程,即二氧化碳在大气、陆地和海洋之间交换的过程。

\
  (图片来源:腾讯视频)

  6  英国《卫报》

  《快公司》称,《卫报》入选的原因是通过可视化图表对“警察枪击平民”这类事件进行了持续跟踪。

  《卫报》2015年为报道“警察枪击平民”这类事件组建了专门的记者小组。小组成立至今已经向警察局、检察院以及其他地方管理部门递交了几千份索取记录申请,希望能获得这之前对公众公开的警察武力使用信息。

  《卫报》此前还设立了专门的信息收集网页,打算发动分散在美国各地的《卫报》用户一起收集数据。除了自家的网站,《卫报》还利用现在影响力越来越大的社交平台传播收集数据的需求。《卫报》设立了专门的Facebook社区和Twitter主页,用户可以在上面向《卫报》爆料信息,每一条被采纳的新信息都会得到报道小组的感谢和反馈。

\
  (图片说明:《卫报》反映警察执法致死的互动地图)

  虽然《卫报》的这一可视化项目在2015年12月就已经完成,但来自网络用户的爆料信息却一直延续到现在,《卫报》的数据库也因此一直能反映最新的动态。

  7  Esri

  Esri打造了一个名为ArcGIS的开放地理信息系统(GIS)平台。平台融合了地理空间信息和数据分析,挖掘出数据的更深层次价值。

  商业机构可以通过ArcGIS平台判断消费趋势,进行商业选址,或在自然灾害中管理企业的供应链;政府机构可以用ArcGIS平台管理土地信息数据,或通过众筹报告来追踪恐怖分子行踪。

  2016年,Esri与白宫合作,为“警察数据计划”(Police Data Initiative)搭建了一个数据管理软件。(DT君注:2015年5月,奥巴马宣布推出“警察数据计划”,以此来加大该部门对外的透明度。)此外,太平洋灾难中心(Pacific Disaster Center)也曾用Esri的智能地图追踪寨卡病毒蔓延情况,为救援人员提供信息支持。

  8  DNAFit

  DNAFit是一家基因测试初创公司,它会为用户提供基因测试,以帮助人们制定更加合理、更有针对性的饮食和锻炼计划。

  在2016年下半年,DNAFit发布了名为Elevate的在线训练平台。用户可以通过Elevate了解自己的基因画像,从而制定个性化的训练计划。

  9  University Interscholastic League

  University Interscholastic League(UIL)是美国德克萨斯州公立高中体育事业的主管机构。《快公司》称,其入选的原因是:开启了最大的脑震荡数据库共享计划。

  2016年12月,UIL称德州将启动全州高中运动员的信息注册,以此来追踪记录高中生运动员的脑损伤情况。

  这些数据会支持脑震荡相关研究,这会有助于专家判断比赛规则或设施的改变是否会改善运动的安全系数,从而能够更好地保护运动员。

  10  Reverb Nation

  《快公司》称,Reverb Nation入选的原因是发明了寻找流行巨星的算法。

  ReverbNation于2015年推出了数据驱动的人才孵化项目Connect。只有经ReverbNation的数据和人工筛选的艺人才能参与这个项目。该项目提供一对一的专家咨询,并且从商业角度提供更加细化的数据,分析艺人的优势和弱势。

  数据分析部分如图;

\

  其实准确的说,这个图里面的应该是分析工具、分析平台,另外也有一些企业提供针对行业的解决方案。其实很多数据应用企业,也是基于特定的场景使用数据分析的结论,比如划在应用、农业板块的ClimateCorporation。你说他的核心能力分析农业相关数据,也无不可。

  即使聚焦到分析工具这个领域,我们也可以发现,这个领域是跨度很大的领域,在这个领域中涉及多个细分领域,比如:各类分析平台,BI分析工具,非结构化数据处理,可视化工具,机器学习、人工智能,实时数据处理,日志分析等。

  由于跨度很大,而且我也对IT技术领域了解较少,在这里简单说几个我认为有意思的企业。

  1.Palantir Technology,目前大数据领域估值最高的非上市公司,在国防、金融等领域有成熟的产品和解决方案。国防安全最著名的案例是帮助美国政府猎杀本拉登。金融领域在反欺诈领域比较突出,通过将各类数据进行关联,分析,和可视化,为专业分析人员提供决策支持。在同一方块中的DigitalReasoning是这家公司紧密的合作伙伴,在分析技术上有合作。

  2.Tableau,第二个上市的大数据企业,专业的数据可视化工具公司,将数据运算与美观的图表完美地嫁接在一起。它的程序很容易上手,各公司可以用它将大量数据拖放到数字“画布”上,转眼间就能创建好各种图表。目前很多大型新闻媒体的图表都是用这个软件生成的。

  3.DOMO,商业智能软件公司,用户数量增长迅速,而且收入也很高,DOMO的强项在于将很多不同来源的数据以实时而且可视化的方式来进行展现,Domo的客户包括eBay、TheSageGroup、TelusCorp和《美国国家地理》等大牌企业。

  4.Ayasdi,专业的医疗数据分析公司,人工智能与机器学习技术进行数据分析,与美国各个顶级医院和药厂合作。医院和制药公司可以从公开的信息源获得很多数据,和他们自己的数据结合起来,进行一些新的研究。通过对一个累计采集15年,被成千科学家研究过的数据集的分析。Ayasdi的数据分析技术,帮助发现了乳腺癌的14个变种。Ayasdi的算法发现了某一个基因子组的病人乳腺癌的存活率比较高。如果病人的基因是在这样的子组里,可以免受化疗之苦。

  5.Splunk,第一个上市的大数据企业,其他答友描述了,我就不多说了。

  6.SPSS,老牌统计分析软件厂商,被IBM在2012年收购了。

  其实美国的大数据领域的创新创业,主要集中在技术、工具领域。公司业务的边界比较清晰。在中国向像2C业务领域复制美国成功的企业模式比较困难。因为中国客户更需要成熟的解决方案,最好是交钥匙工程。比如SPSS当年试图独立拓展中国一些领域的客户,但很多客户表示,买软件用处不大,所以还是需要企业结合客户业务进行二次开发,研究合适的模型和展现形式。客户才能把自身数据用好。

  由于这些数据分析企业,主要对象是企业客户,甚至只是大型企业客户,所以一般不太出名,除了Palantir,Tableau最近在国内知名度起来了以外,大多数企业公众甚至业内人士也了解甚少。

  发现社交媒体数据价值的技巧在于,分析服务应当识别需要忽视的数据。数据分析公司Quantifind联合创始人阿里·塔奇曼(Ari Tuchman)表示,超过一半的社交信息是垃圾信息、自动生成的推广信息、新闻头条、转发信息和其他无法决定消费意愿的无用信息。但是,其中大部分信息被卖给广告商,这就稀释了广告影响力。

  塔奇曼认为,广告商甚至应该忽视不断提及产品或公司的社交信息。实际上,真正的客户往往通过其他方式表达自己的意愿。例如,赞过预告片的用户很少选择观赏电影,而提到电影名或相关名称的用户更可能观看电影。

  Quantifind曾与一家洗发水公司合作,共同在社交媒体上推广新气味的产品,推广信息获得了“大量”好口碑,但洗发产品的销量并没有增加。究其原因,社交用户真正关注的是新气味,而不是洗发水本身,因此相关的社交信息显得毫无价值。

  塔奇曼表示,真正购买这款洗发水的用户反而不会谈论新气味,他们更愿意谈论产品如何修复受损头发。Quantifind可以综合分析客户的社交媒体信息和财务数据,以此识别能够提升产品销量的社交会话。

  在现实生活和社交媒体中,客户的抱怨也存在差别。在生活中,即使手机用户痛骂电信服务商的信号质量,他们也很少换用其他服务。但在社交媒体,如果用户抱怨话费过高,他们的确会换用服务。

  塔奇曼表示:“在大数据中,我们很容易发现自己试图寻找的东西,但很难挖掘出没有特意寻找的东西。无数的事例说明,更多的社交信息无法产生更高的产品销量。”

  如今,在证明社交媒体有很大的投资回报率(ROI)时,我们同样需要把成果展示出来。但令人难以置信的是仍有一些企业并不把社交媒体作为投资回报率的来源。同时当涉及到社交媒体数据时,很难不与数字联系起来。

  人们常常认为,分析社交媒体数据必须数据科学家、数据分析师。但事实上,使用正确的工具,你同样也可以评估和分析社交媒体数据。

  什么是社交媒体数据?

  社交媒体数据是指来自社交网络的信息,当中显示用户分享,评论的情况,以及与你的内容、个人资料的互动。通过分析这些数字,百分比和统计数据能够更好地制定社交媒体策略。

  原始的社交媒体数据包括:

  分享

  点赞

  提及

  展示

  标签

  网页点击

  关键字分析

  新增粉丝

  评论

  以上列表并不全面,但可以大大优化社交媒体策略。

  社交媒体数据如何运作?

  一旦收集到社交媒体数据,就可以对其进行评估或分析,从而辨别哪些策略是有效的。当挖掘和分析社交网络时,不妨把社交媒体数据视为原始数据。一旦有了数据,就可以搭建社交媒体分析系统,从而进步一处理原始数据。

  若把社交媒体数据类比为一顿饭的食材,那么如何分析这些数据就相当于菜谱。没有菜谱,在做菜时就会无从下手。当掌握大量的数据时,就能够做出更明智的决策。

  营销人员和广告商有时会提出大量的点子来运营其社交媒体,希望有些方法能奏效,但这显然不够科学。与此相比,有效的收集和评估数据则更够更精准的把握市场需求。

  那么应该如何有效挖掘社交媒体数据并估量其投资回报率呢?

  确定核心社交媒体的关键绩效指标

  关键绩效指标(KPIs)是指分析业务的特定方面的各种指标。社交媒体关键绩效指标会影响社交媒体投资回报率。

  因此需要明确哪些社交媒体的关键绩效指标是值得跟踪分析的。从而能够更好地审视目前社交媒体策略。同时还能够进一步把握受众群体的覆盖面,客户参与度和响应时间。

  跟踪每个平台的指标

  社交平台有很多,无论针对哪个平台,对每个平台有个深入的了解是必不可少的。社交网络平台也深知分析的重要性,因此一些热门的社交网络平台,如Facebook,Tweeter,LinkedIn,Google都相继提供了相应平台的数据分析工具,让用户更够更好的分析自己的数据。

  我们来看看最受欢迎的社交网络平台数据分析工具:

  Facebook Insights

\


  对于拥有Facebook商务页面的用户,你可以分析当中的一些关键绩效指标。最基本的Facebook指标包括:

  参与度:该指标可以显示过去七天内的用户发布内容所得到的点击,点赞,评论和分享的次数。此外,数据还将与前一周进行比较。

  展示:Facebook页面被展示次数,包括点击或没有点击观看内容或页面的次数。

  自然关注人数:通过非广告渠道获得的关注人数。

  页面点赞:此指标显示页面和新页面点赞总数,同时包括与上周数据的对比。

\

  付费关注人数:通过投放广告获得的关注人数。

  帖子覆盖率:此指标显示用户的总覆盖数量,即看到与你的网页相关的任何内容或广告的总人数。以及页面访问量,指的是页面帖子的留言总数。

  反应:此指标显示用户对你发布帖子的不同反应,包括(Like,Love,Haha,Wow,Sad和Angry)。

  不喜欢人数:不喜欢你的页面的人数。

\

  Twitter Analytics

\


  无论你将Twitter做为商业或个人使用,都可以用其进行分析。仪表板提供了用户28天的发布内容摘要和其他重要的Twitter数据。以下是一些Twitter指标:

  参与率:将Tweet上的链接点击次数,转发总数,收藏和回复总和除以总展示次数。

  粉丝:Twitter粉丝总数。

  链接的点击:网址和标签链接的总点击数。

  提及:其他人提及@你的次数。

\

  个人资料访问量:Twitter的个人资料访问量。

  回复:回复你Twitter的次数。

  转发:其他人转发的总次数。

  Tweet展示次数:你的Tweet已被查看(无论是否被点击)的总次数。

  推文:发布推文的总数。

\

  LinkedIn Analytics

  你可以通过公司页面访问LinkedIn Analytics。这将显示你LinkedIn页面的所有的社交媒体数据。以下是较为重要的LinkedIn指标:

  点击次数:公司发布内容、公司名称、Logo的总点击次数。

  参与度:总互动次数除以总展示次数。

  粉丝:粉丝总数。

  展示次数:更新内容对其他用户可见的总次数。

  互动:评论总数,点赞,评论和分享。

\

  Google Analytics

\


  如果说其他平台的数据为我们提供了有效的见解,那么通过Google Analytics可以优化你的数据策略。

  在这里,你可以了解产品销售,潜在客户,下载,持续时间等等。

  当谈到社交媒体数据时,以下几条Google Analytics的数值需要注意:

  平均访问时间:用户在你的网站上花费的平均时间。

  跳出率:仅浏览完你网站上的一页,就离开的用户比例。

  新用户:首次浏览你的网站的新用户总数。

\

  页面/会话:每次会话用户查看的平均页面数。

  浏览量:浏览器中加载或重新载入的页数。

  会话:用户在你的网站上处于活动状态的总时间。

\

  辨别哪些是重要的指标

  现在已经有了社交媒体数据,下一步需要区分哪些数据是最重要的。你可以使用不同的方式分析,但要需要明确最终目标。

  如果想掌握Facebook上粉丝的增长情况,可以重点把握参与率,新关注者,帖子覆盖率和自然关注人数。

  如果在社交媒体发布了广告,则需要跟踪突出显示投资回报率的数据。根据Mashable.com,认为社交媒体宣传活动的ROI周期可分三个阶段:

  推出

  管理

  优化

  按顺序推行这三个阶段,可以发现哪些指标将影响着不同周期。从而有效地衡量社交媒体投资回报率。

\

  不要停止跟踪数据

  继续跟踪社交媒体数据至关重要。如果仅仅持续几个月,那么将不会对营销或社交媒体策略有更深入了解。

  Convince&Convert发现41%的公司和机构没有意识到社交媒体数据所带来的财务影响。数据的整理不可能一劳永逸的,而是需要数月的跟踪来确保对于将来的商务决策是有价值的。

\

  在同一份报告中,受访者被要求从他们的社交媒体数据中选出他们所看到的三个积极影响。报告发现,84%的组织在收集数据后,对客户和社区的见解产生积极的影响。

  同时搭建一个成熟的社交媒体也需要时间。获得数据后,可以更快地解决和修复社交媒体当中的问题。

  利用社交媒体分析工具做出决策

  收集社交媒体数据的最大的收益在于能够有足够的信息来做出有依据的商业决策。正如上文所述,分析客户和社区对于商业目标至关重要。如果想优化社区策略,正确的数据是必不可少的。
责编:houlimin
分享到: