首页 > 推荐 > 正文

大数据产业中的协同创新——技术、应用与新业态的区域实践

2017-10-13 11:44:15  来源:CIO时代网

摘要:9月29日,厦门大学自动化系副教授洪文兴在CIO时代APP微讲座栏目作了题为《大数据产业中的协同创新——技术、应用与新业态的区域实践》的主题分享。
关键词: 大数据产业 技术
\

  9月29日,厦门大学自动化系副教授洪文兴在CIO时代APP微讲座栏目作了题为《大数据产业中的协同创新——技术、应用与新业态的区域实践》的主题分享。

\
 
  目前,厦门逐渐对新生技术感兴趣,于是产生了人们耳熟能详的一些企业。在特定化的一些上市企业中,如美亚柏科等企业都与大数据有关系。
 
  一、总体
 
  1.关于姓氏的大数据
 
  数据:一组脱敏后的公民个人数据,覆盖1000多万人,大概占全国人口的1%,信息包括姓氏、年龄、籍贯城市、现居城市等。(脱敏:把敏感数据或信息去掉)
 
  模型:定义一些数学模型来解释上述的数据,具体定义了以下四个指数(也是所谓的四个模型):
 
  普遍指数=姓氏人口数量;
 
  抱团指数=各姓氏在各省分布的基尼系数;
 
  奔波指数=姓氏人均迁徙距离。迁徙距离为户籍所在地所在地市级与现居住地所在地级市的距离。
 
  风雅指数=名字中不包括“取名用字频率TOP1000”的人数占该姓氏总人数的比例。
 
  专家知识:对规律(模型反应的结果)进行解读、完善模型(所谓的专家是对一个行业比较了解的人)
 
  因此,大数据研究至少需要数据、模型、专家知识三个方面的内容。
 
  2.大数据基本态势
 
  2013年的中国被称为“大数据元年”,经过五年的发展,大数据目前已进入第二个阶段,我们将其称之为“大数据2.0”。以下为对大数据五个方面的观察:
 
  1.大数据意识润物无声。大数据意识已经普遍得到认可,人们不会可以去讲大数据解决什么问题。
 
  2.大数据技术蓬勃发展。
 
  3.大数据应用随处可见。
 
  4.大数据产业布局加速。
 
  5.大数据科学呼之欲出。目前,已有35所高校开始有了数据科学与大数据技术专业。
 
  3.厦门市大数据
 
  厦门市大数据产业应用和发展规划,该规划被称为“5+5+13规划”,包括5大任务、5大工程、13个项目。事实上,各城市的规划都是结合自身的经济思维发展情况和产业发展情况。厦门市的五个任务分别为:推进政府大数据的开放和价值开发、推动大数据与产城融合的示范应用、加强技术创新抢占生态系统制高点、培育和引进大数据生态链产业集群、完善公共服务平台和产业发展环境。
 
  厦门市希望将政府的大数据进行开放和开发,因此提出了政府大数据融合共享工程,包括对外的数据门户,对内的政务信息共享协同平台。民生方面需要在厦门比较擅长的一些领域展开,比如交通、教育、医疗、气象等。另外,厦门市在产业转型升级、社会治理和公共服务方面均有相关的工程。
 
  厦门市促进大数据发展的工作实施方案包括夯实大数据发展承载基础,构建政务数据共享体系、运用大数据提升政府治理水平、运用大数据提升公共服务能力、运用大数据推动相关产业发展、强化大数据应用安全管理。
 
  厦门市大数据工作重点包括成立大数据专家咨询委员会、制定《厦门市政府大数据开放暂行管理办法》、建设医疗健康大数据中心、建成交通大数据分析应用平台、建设统一的城市公共安全管理平台。
 
  通过厦门市的例子是为了说明大数据在全国乃至全世界已经进入一个新的发展阶段。当然,数据是无国界、全球化的,但还是要注意区域生态的做法。
 
  二、技术
 
     大数据发展趋势预测
 
  从2013年“大数据元年”开始,关于数据科学与大数据的论述还是比较粗浅的,都是一些最初的结构化论述。2016年以后,很多问题越来越具体,越来越多样性,越来越接近大数据应用本身的特点。比如2016年提到了大数据的平民化、《促进大数据发展行动纲要》的推广。2017年则希望大数据在技术上有所突破,政策法规为整个数据科学与大数据产业保驾护航。例如2017年机器学习继续成为智能分析的核心技术,多学科融合与数据科学兴起。因此,整个学科体系、研究路线越来越清洗,国内关于大数据的学术研讨会也越来越多。
 
  一个普遍的观点认为,大数据技术应该在企业中再次得到突破,原因是大数据包括的数据、专家知识等在企业中比较明显。
 
  三、应用
 
  当问到大数据应用在哪一个领域最靠谱、最值得推广时,从2013年至今还未发生变化。据统计,大数据应用在互联网与电子商务、金融、健康医疗三个领域最为广泛。
 
  实例1:厦门人才网数据分析项目
 
  其目标是使找工作的人找到合适的职位,公司找到合适的求职者。一般的方法是到人才网搜索,这里的方法是为人才和职位进行建模。为人才进行建模的问题在大数据领域体现出来被称之为用户画像,用户画像可以形象化的画一个人的样子,将人的特征画在人的形象上。简单而言,便是将人的特征分门别类地表达出来,将一个虚拟的人与现实的人对照起来。通过用户画像,能总结单个人、一群人或一批人进行分析。这里涉及到对人的简历的处理,包括一些结构化的文本数据、音频视频数据,这些数据被称为异构数据,对异构数据的处理是大数据领域中一项很重要的技术。
 
  实例2:网站访问日志处理
 
  学生在访问新闻网站的同时会留下所谓的网站访问日志,这些日志每秒钟都会留存网页访问请求,会记录相应的IT来源、身份信息、访问内容、访问时间等等,这里需要对读者进行用户画像,新闻被称为内容,也可以进行内容画像,这样既有了内容特征,也有了用户特征,接着对新闻和用户之间的关联关系进行分析。例如今日头条的新闻推荐也是上述的机理。
 
  实例3:对专家进行讨论
 
  所谓的专家是指在某一方面、某一领域具有比较好的知识体系,如何刻画专家在相关领域的知识表达?最简便的方法是将该专家发表的论文、工作、专利、著作、演讲及相关新闻找出来,这里一共找了六方面的数据,将这些数据抽取出来,这样便可对专家进行画像,形成了一个虚拟专家,用这个专家来表达现实世界中具备的能力。另外一端是等待求解的问题,比如工厂中遇到的技术难题,需要将这个难题表达清楚,围绕专家的知识表达寻找。
 
  上述三个例子都是通过互联网在进行,这里涉及到两组人,一组是所谓的人,一组是所谓的物,分析人和物之间应该怎么做。
 
  我们认为,一个好的大数据应用应该包含以下三个要素:1)专家知识,对某个场景进行解释;2)数据,主要通过云计算进行保障,所谓的云计算是为数据提供存储、计算能力;3)数据科学技术,并对其进行统计学、数据建模等角度的分析。如果以上三个部分都满足,才可以称得上一个好的大数据应用。
 
  四、业态

\
 
  上图为2016年全球大数据产业全景图,中国各个城市都在画各自的产业地图,通过产业地图可以发现哪些企业在搞大数据,大数据包括哪些环节。
 
  五、实践
 
  2016年,国家开始做健康医疗大数据试点工程,厦门市成为第一批入选试点城市之一。面对的问题是如何将数据、科研、平台、产业、应用结合起来,形成一个闭环,形成一个区域小生态。对数据的分析交给科研单位,科研单位分析完后形成了一些共性的技术平台,这些平台可以帮助产业或企业做很多应用,这些应用又会产生很多数据,因此,一个基于大数据的完整的闭环便形成了。对高校而言,最大的产出主要是在科研(技术水平突破)和人才两个方面。
 
  关于厦门信息产业和信息化研究院
 
  当前主要的研究领域是大数据或以大数据为基础的人工智能及新的技术发展方向,最大特点在于研究院的研究与产业非常接近。通过产业与学校的互动能讲清楚大数据生态的形成。

第四十一届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:houlimin

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。