【第二届中国行业互联网大会暨CIO班十一周年年会】陈国良:大数据及应用

2016-08-18 14:43:03  来源:CIO时代网

摘要:2016年8月13日,由北大信息化与信息管理研究中心、中国新一代IT产业推进联盟主办,CIO时代网、阿拉善盟旅游局、阿拉善盟文旅投公司承办,北达软、网加时代网、转型家、《金融电子化》协办的“第二届中国行业互联网大会暨CIO班十一周年年会&首届阿拉善峰会”在苍天圣地阿拉善成功举办。
关键词: CIO 互联网大会
  2016年8月13日,由北大信息化与信息管理研究中心、中国新一代IT产业推进联盟主办,CIO时代网、阿拉善盟旅游局、阿拉善盟文旅投公司承办,北达软、网加时代网、转型家、《金融电子化》协办的“第二届中国行业互联网大会暨CIO班十一周年年会&首届阿拉善峰会”在苍天圣地阿拉善成功举办。会议得到了大华南IT高管共赢圈、安徽CIO联盟、中国时尚行业CIO协会、江苏省CIO联盟、西南CIO联盟、四川CIO俱乐部、苏州IT人俱乐部等单位的大力支持。此次活动的会议主题为:基于互联网技术的行业应用变革,吸引了众多业界领导、专家、行业高管、各届CIO班学员们300多人参加了本次活动。中国科学院院士、全国高校大数据教育联盟理事长陈国良在本次活动上发表了题为《大数据及应用》的主题演讲。以下为演讲实录:
 
\
中国科学院院士、全国高校大数据教育联盟理事长    陈国良  
 
  刚才听了杨部长的讲话,如果按照杨部长的思路去做那么我们可能做的比较顺利,取得成功的机率就比较大。我今天非常高兴,第一次来到这个地方,遇到老领导,再次聆听他的教诲,非常高兴!今天让我讲讲大数据,我一再说,讲大数据最有资格发言权的是拥有大数据的人和企业,是企业家或者是政府的官员、管理官员,他们手中拥有很多数据,他们来讲大数据才最有资格。今天时间紧张,我把大数据及其应用的后面砍掉,只讲大数据的基本概念、应用。
 
  大数据
 
  大数据这个词好像不太科学,我们形容物体用大小来形容,比如桌子的大小、房子的大小,这个数据是个抽象的。所以大数据这个词是2012年突然爆发的一个非常热的词。为什么?它是源于美国奥巴马2012年3月宣布的计划“大数据研发计划”,大数据就从这来了,然后大家就跟着跑,因为美国是一个技术发达的国家,德国、法国、意大利、日本都跟着做,所以一下子就把大数据的热潮掀起来了。其实大数据这个词是非常通俗,看起来不怎么文雅、在学术界早就有了,只不过不叫大数据,我们叫海量数据。或者我们形容一个数据量很大,用天文数字来形容。我们都用这些字描述,根本不用大小描述,大小听起来好像是儿童用语,但是学术界大家都在用了。在现今进入大数据时代,不管你愿不愿意、自觉或者不自觉、关心或者不关心,你都在分享和制造大数据,处于大数据的包围之中,大数据推动着科技和社会的发展,改变着人们的生活方式和思维方式,所以现在就有着大数据潮流、大数据时代这种说法。
 
  大数据怎么产生的呢?
 
  我们这样总结一下。第一,大数据是万物连接的世界涌现了大数据,就是现在网络连接的世界涌现的大数据。可以说是互联网和社交网产生了大数据、无线移动网产生了大数据、物联网采集和观察着大数据、社会发布着各种信息等等,这些都是互联网生成的大数据。第二,大科学工程产生的大数据。我念书的时候到南京紫金山天文台实习时,数据量大得不得了,当时那些数据都装在磁带里头,放在一个大楼里面。采集、收集到了,因为太大很难处理,都放在那。这里举个比较特殊的例子,最近谈的比较热是因为2013年诺贝尔奖获得者一个84岁的科学家,他说他很早以前就预言了,但是理论上的预言没有得到证实。时隔50年以后,用实验的办法证明了。所以说推动科学人类文明进步,实验是一种非常重要的手段之一,理论自然重要,但是实验也非常重要。计算机模拟是我们的三大手段,我搞计算机的当然要讲这一套。当时这个例子,在50年以前就预见了,但没有被完全证实。没有被证实的东西始终得不到认同,但是50年以后被我们一个28岁的小伙子,合肥人,他用实验的办法验证了精度99.9999%,所以才能拿诺贝尔奖。但是这个诺贝尔奖只授给个人不授给集体,所以我们这一帮子年轻的实验团队的人就成了无名英雄了。我们计算机科学工作者跟搞理论的工作者要有做无名英雄的思想准备,往往是给人家服务。你们搞了一个定理、公式,我给你验证,验证半天花了很大的劲,被认同了,功劳还是归原来的人,我们都做了无名英雄。
 
  接着讲新技术和新的应用催生了大数据。刚才讲了传感技术、信息通信技术、物联网技术等等,让人们感知的东西越来越多,这样得到的数据也是越来越多。讲大数据的来源,我们讲了三个,网络世界产生大数据、原来大科学和大工程、新兴技术和新应用。现在的情况是什么呢?大数据已经成为潮流,大数据的潮流浩浩荡荡。过去讲顺者昌逆者亡,大数据来了,你要不顺应时代潮流进步,那你是有点危险的,所以我说顺者昌逆者衰。“亡”有点太刻薄一点。在座的企业家也是这样,不能说你不顺应大数据企业马上倒闭,但是可能会受影响。现在是21世纪,正将大数据潮流成为世界热门话题,现在大家说什么话都要用数据来说话,就是你讲话信任的程度不是说我推理怎么样或者想象怎么样、感悟能力怎么样,那还不够,但是我用大量的数据事实说话,人家信服的更多。
 
  大数据研究计划
 
  美国首先都以政府行为,我觉得一个新兴技术要想得到很快的发展,政府一定要敏感,当然政府的敏感是来自于那些高级参谋智囊团给他写建议书。2012年3月份美国奥巴马政府宣布了“Big Data Research and Development Initiative”计划,创新这个词也来了。我们以前学创新叫creative,现在innovate也是创新,这个更结合于源头的,creative更强调创新生产的东西,这两个还是不太一样的。当时发布这个计划的时候,目的是很清楚的,通过抽取支持和洞察大而复杂的数据改进工作能力;通过创新加速科学和工程发现的迸发;增强国家安全和改变国民经济教育的现状。把我们高校也卷进来了。然后紧接着日本就来了,日本搞“新ICT战略研究”计划,是在日本大地震2011年以后启动的第一次。日本大地震对他的影响很大,很多大型研究计划都停止了。英国这个国家是一个自信很强的国家,我从英国访问刚回来,大不列颠认为英国很厉害,所以大数据尽管在美国做的很厉害,他不认帐,他说英国早已做好大数据的准备,而且有基础。英国人说话还是比较厉害的,因为以前英国绅士讲话都不会低三下四的,英国人有这种气质。那么我国搞大数据也不用说了,我们计算机协会最早就成立了大数据专业委员会!李国杰院士任主任。这个也是破格的。我是教育部教学指导委员会的主任,计算机专业的主任,任何新兴专业的成立都必须写申请认证以后才行,只有他没有写就批了。为什么?第一是李院士弄的,第二也确实非常需要,如果按照常规,报上来我们写好了再校,菜都凉了。我们国家对大数据反映也很快,我们开了很多会,经信委几次开双清论坛大数据我都参加了。总而言之,英国、美国然后我们国家对大数据都是非常重视的。
 
  这张图我不讲了,是讲一个技术发展的预测图,这是非常科学的图,有兴趣的同志可以下来看。预测新兴技术的出现成熟与衰落,它还是很准确的。

\
 
  大数据的推动力主要是什么?
 
  大数据发展的推动力不是科学界,大数据推动力是企业界,企业界主要是经济利益的驱动。在座的很多企业家,你们很厉害,是大数据发展的驱动者,真正的大数据消费者是网民,而我们只是提供技术支撑。搞科研的、搞教育的只是做技术支撑,真正的推动力是企业家们,真正得益者是网民,这样就符合发展的规律了。如果得益者不是广大的老百姓也不行。所以我觉得大数据的发展驱动力、享受者和技术支持者总结的确实不错。大数据究竟什么是大数据呢?原来最早有这么一句话,用现代现有的技术和软件工具不能在有限的时间里或者规定的时间里进行解决的那一类的数据都叫大数据。就是用我现在的软件技术,不能解决的,怎么办,就说明量很大,这样还是很模糊的概念。我们做科学概念的一定要定量化,所以提出四维概念,用四个量词描述它,每一个量词的第一个字母都是“V”,如果数据量大是指它的容量非常大,主要体现在数据的存储量和计算大。速度很快,主要是它的更新增长速度快,更主要的是多样性,就是杨部长讲的数据结构、非结构,那就有文本出现、视频全部都来了,当然它的价值很高,价值很高,但是得挖掘。数据很大,但真正有价值的东西挖掘起来很难的,大海捞针。所以大数据的社会定义就是大容量、快速度、多样化、高价值。
 
  大数据究竟有多大?
 
  大数据的价值是讲大数据的经济价值。大数据作为一种资源、资产、竞争的能力,大数据还有一个潜在的价值,它可以再利用、重组、可扩展、折旧、开发,大数据的商业价值。大数据可以掌控公司的发展、大数据可以决定企业的竞争力,所以你们在大数据面前要把握好时机。那么大数据也有问题,大数据也会带来一些技术的挑战,首先在技术上的挑战,大数据这么大,怎么存储、怎么处理、怎么显示、怎么分析、安全怎么保障,这都是大数据给技术上带来的挑战,大数据也有威胁,大数据带来的威胁无处不在的第三只眼,威胁公众的隐私、伤害人类的自由尊严。特别是过渡的解读大数据,刚才讲的用大数据讲话,要记住什么事情都不能走极端。一方面要强调量化,另一方面人的因素是主要的。毛主席讲人的因素是主要的,一定要加上人文因素,所以过渡的解读大数据,牵强的把一些毫无关系的解读出来,希望能找出他们的联系模式,这根本就是过分的解读,都不是科学的。所以我们要提醒联盟,要谨慎的使用大数据,避免过分解读大数据,痴迷于大数据。
 
  大数据有什么作用?人跟社会国家科技的发展。
 
  第一,大数据对国家的社会安全的作用。增强国家的安全,促进政府开放,提高政策预见性和响应性。大数据可以推动国民经济的发展。农业社会、工业社会、信息社会,刚才讲工业4.0信息技术都是指这些东西。还有大数据是科学发现的第四范式,以前我们讲科学范式只有三个,第一个就是讲的理论科学,过去用理论分析。第二个是实验科学,比如说牛顿定律和物理现象,第三是计算科学。第四范式是从密集的科学里面、密集的数据里面去分析,处理,从中找出来规律、找出来科学问题。大家要注意,在大数据的面前也不要太追究严密性、严格性,一定要建立模型,找出来严格的数学分析你才认同。因为大数据太复杂了,如果过分追求会使你束手无策,如果束手无策不做什么还不如试试看多做几步。这并不是伪科学。做科学不是要提倡严肃、严格、严密嘛,在大数据面前,严肃、严密、严格的新的体会是这样的。
 
  大数据的应用
 
  我这举了几个,智慧城市,向城市管理智能化、公共服务的便捷化、城市建设的社会化,像医疗的应用,临床的应用、医疗的信息化、公众健康等等,我都不讲了。奥巴马怎么当总统的?当时奥巴马在竞争的时候他曾经332票跟206票,这很危险的,他怎么办,他就建立一个大数据平台,搞了一个模型,然后就模拟网民的意向分析,什么时候有多少人投他的票对他最有利,奥巴马多么会利用近代的科学技术特别是大数据科学。大数据应用使生活的精确化,比如说安全出行、商场顾客怎么应用等等。我今天就讲这么多。谢谢!

第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:陈国良

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。