下面是36大数据根据百度指数、微博微指数、36大数据3年来沉淀的用户做得一个简单画像。
事实上,在关注大数据的人群中,有62%的人群为年龄30-49岁、本科以上学历的传统行业人员,他们来自房产、生活服务、建材家居、商务服务、金融财经、旅游酒店、餐饮美食、教育培训、医疗健康、大众消费、航天、政府公共服务等多个领域;
关注大数据的人群中,25%的用户为年龄20-29、大专以上学历、IT科技、互联网相关从业者 ;
9%的用户为垂直数据行业从业人员,这群人最大的标签是高文凭、高技术、高收入、宅、技术控、少社交、不爱传播 ,理性、理工男。
剩下还有4%是19岁以下,50岁以上这一部分人群。他们绝大部分是通过新闻宣传后,怀着对大数据的好奇心才来关注的。
所以,基于大数据关注人群的画像,可以更好的指导大数据未来的发展方向。我认为大数据未来要实现爆发式的增长,拥抱传统行业,渗透人们生活是必经之路。
三、大数据如何惠及大众?
我承认,大数据近年来是被炒得有些过头了,但不代表它是一个“炒作词”。大数据的背后,的确有着实实在在的数据,实实在在的技术和是实实在在的应用。大数据确实能够产生商业价值。
下面基于我个人对大数据的理解画出的一个示意图。
对于大数据企业来说,大数据涵盖了公司内部数据和外部数据两大方面。
公司内部数据包括:
1、公司使用BI(Business Intelligence)、CRM系统、ERP系统、邮件系统等产生的数据;
2、财务数据。其中包括公司的支出、采购、收入等多项与公司日常运作有关的数据;
3、注册用户数据。无论是网站、APP还是游戏,用户注册都会填写邮箱、电话、身份证号码等数据,这些数据其实非常有价值,此外还要加上用户使用公司产品留下的行为数据。
4、历史数据。公司沉淀下来的其他各种数据,这些数据一定要整合起来。
外部数据包括:
1、社交网站数据。包括微信、微博、人人网、Twitter、Facebook、LinkedIn等社交媒体上的数据。社交数据部分是可以爬取的,另外一部分是需要运营方授权的。
2、线下采集数据。这一块目前做的公司比较少,但同时也比较有价值,比如说Wifi热点数据、地图数据等;
3、政府开放数据。目前在中国,已有多个省市不同程度的开放了部分数据,如果你想要找的话,可到相关政府网站下载。
4、智能设备、传感器数据。最典型的案例就是智能手机了,我们使用手机留下的行为数据,传感器数据,都可以整合到外部数据中来。你知道吗?一部智能手机,至少拥有8个传感设备。
5、网络可爬回的数据。除了文字之外,视频和图片也是可以爬回来的。视频和图片其实也是数据,而且是非结构化数据。
6、交易数据。这一块就比较难的,比如说商家流水数据、支付宝交易数据、信用卡消费数据等等,目前这一部分数据是最难获取的。
7、数据接口API数据。这个就不做细说了,据我所知,微博开放了商业数据API,腾讯开放了腾讯云分析SDK上报的应用数据,高德地图开放了LBS数据等等。如果你想找更多的数据API,我推荐你去数据堂、聚合数据这两家网站上看一下,上面有大量的API接口。
8、其他。其他范围就更大了,天气数据、交通数据、人口流动数据、位置数据等等。我们可以整合的外部数据种类很多很多。
整合完公司内部外部数据进行大数据存储,然后通过清洗,标注、去重、去噪、关联等过程可以将数据进行结构化,也可以进行大数据挖掘和数据分析,再以数据可视化呈现结果,打通数据孤岛形成数据闭环,将数据转换成“石油”和“生产资料”,最后应用到我们日常的生活、学习和工作中去。
当然,大数据应用到日常生活、学习和工作中,往往不是以“大数据产品”自居的,普通人能够使用到的大数据,已经是大数据加上业务场景的产品化应用和服务了。比如,百度搜索引擎、高德地图其实就是基于大数据和业务场景产生的大数据产品化应用。
第四十一届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:pingxiaoli
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。