北京大学计算机学院教授、北京智源人工智能研究院院长黄铁军：大模型的过去、现在与未来的商业前景 | CIO班18周年年会精彩演讲 - 学院活动_CIO时代网

首页 > CIO班 > 学院活动 > 正文

北京大学计算机学院教授、北京智源人工智能研究院院长黄铁军：大模型的过去、现在与未来的商业前景 | CIO班18周年年会精彩演讲

2023-09-08 16:46:54 来源：抢沙发

2023-09-08 16:46:54 来源：

摘要：8月19日，由CIO时代主办、新基建创新研究院作为智库支持的“第九届中国行业互联网大会暨CIO班18周年年会”在北京隆重召开。大会以“大模型时代的数字化转型”为主题，讲述了新时代下各行各业的全新变革。
关键词：大模型

8月19日，由CIO时代主办、新基建创新研究院作为智库支持的“第九届中国行业互联网大会暨CIO班18周年年会”在北京隆重召开。大会以“大模型时代的数字化转型”为主题，讲述了新时代下各行各业的全新变革。

北京大学计算机学院教授、北京智源人工智能研究院院长黄铁军出席了第九届中国行业互联网大会暨CIO班18周年年会，并发表了题为《大模型：过去、现在与未来》的主题演讲。

以下为演讲内容摘录：

人工智能这个概念自1956年提出以后，经历了将近七十年的发展历程，也衍生出符号主义、连接主义和行为主义三大流派，最终走向类脑的目标。在这里带大家了解一下大模型的过去、现在与未来。

大模型的历史发展沿革

人工智能出现于1956年夏，约翰·麦卡锡（1927-2011）、马文·明斯基（1927-2016）、纳撒尼尔·罗彻斯特（1919-2001）和克劳德·香农（1916-2001）共同发起召开人工智能讨论会，史称“达特茅斯夏季讨论会”。约翰·麦卡锡提议用人工智能（Artificial Intelligence）作为这一交叉学科的名称。

此后，人工智能经历了上世纪四十年代的萌芽期、上世纪五十年代注重逻辑的推理期、上世纪七十年代的知识期、上世纪八十年代的神经网络，进入到现在的深度学期时期。这期间AI的发展总是一轮浪潮伴随着一轮低谷。

经过六、七十年的发展，人工智能发展出三条技术路线。

第一条是符号主义，也就是把智能形式化、符号化、算法化和软件化。这也是人工智能最早也是最主要的技术路线，虽然有一定效果，但并没有真正成功。

第二条路线是连接主义，或者叫神经网络学派，它的理念是人的智能不可能用一种形式化的方法表达出来，于是就构造了一个神经系统，并且训练它，这样智能就被做出来了。

第三条是行为主义。这个学派认为智能来源于主体与环境的互动，地球上本来没有智能，后来产生了有机物，有机物跟环境互动产生了细胞，才产生了后来的神经元，才有了智能。

人工智能的发展进入到上世纪八十年代之后，就进入了所谓的学习期，这个学习期包含了神经网络和现在流行的深度学习。其中比较重要的是1985年提出的BP神经网络模型，到了2006年，Geoffrey Hinton在《Science》发表了关于深度神经网络的论文，包含神经网络和机器学习的深度学习开始登场。

深度学习与数据和算力结合，开始产生信息模型。在2012年至2018年之间，模型成为了AI研究和产业的中心。这之后，随着被用于训练参数（数据）的提升，具备规模大、涌现性和通用性特点的大模型，正式出现了。

通向AGI

到了现在，业界普遍认同人工智能接下来的发展，将会从通用人工智能（GAI）走向人工通用智能（AGI），或者说超人智能、强人工智能。

真正引起业界关注的大模型是OpenAI的ChatGPT。OpenAI一直定位于以人工通用智能（AGI）为最终目标，并保持开放合作，并且提出了广泛造福社会、关注长远安全问题、引领技术研究、保持合作意愿等四大原则。在2015年至2018年之间，OpenAI通过布局视觉/多模态、语言、语音、强化学习、多智体技术、机械控制、安全与可解释性等领域，一直在探索可能的AGI路径。到了2019年，OpenAI开始聚焦大模型。

OpenAI的ChatGPT的基本原理，是依托海量训练数据，大规模算力，及强大基础语言模型。发展到GPT3.5时，形成领先优势。此时被用于训练的参数已经达到了1750亿，“涌现”出强大的智能表现，具备人类“无中生有”的原创能力。2022年11月，当GPT4正式发岸上时，生成式AI颠覆世界的时代正式开始，而此时，GPT-5也已在研发之中。

预见大模型时代的未来

继OpenAI在2020年5月发布GPT-3之后，谷歌推出了Switch Transformer，智源推出了悟道，华为推出了盘古，阿里达摩院推出了PLUG和M6，微软研究院&英伟达推出了Megatron Turing-NLG。进入2022年之后，谷歌还推出了PaLM、LaMDA 2，Meta推出了OPT，DeepMind推出了Gato，BigScience推出了BLOOM。大模型已成为全球竞争热点，一个大模型时代已经到来了。

1994年网景（NetscapeNavigator）浏览器的出现，使大众上网变成了可能，互联网时代才真正到来。到2007年苹果推出iPhone手机，大量智能手机应用程序出现，移动互联网时代才真正到来。而2022年11月30日， OpenAI面向公众开放ChatGPT服务，人工智能从技术圈走向全民讨论，迎来了人工智能的网景/iPhone时刻。

大模型具备三个特点：规模大，需达到百亿参数级别；涌现性，能够产生预料之外的新能力；通用性，不限于专门问题或者领域。由于这三个特点的存在，以ChatGPT为例，ChatGPT采用“人类反馈的强化学习（RLHF）”方法，这使得ChatGPT能够理解和遵循人类指令，输出符合人类偏好的内容，这种特点它适用于广大的应用领域。

GPT知识空间里，参数达到数百亿规模的复杂系统涌现现象“融会贯通”，虽然尚不可解释，但是确实存在。ChatGPT在多项考试中表现超过人类水平，具备能够根据纯文字说明，具备生成图像或草图的整合能力，也拥有高等数学/复杂数学问题求解的数学能力。GPT-4则大幅降低幻觉率，而据估算，当幻觉率达到5%以内，接近人类水平（保守），就可作为大模型规模商用落地的基准幻觉率。

人工智能生态包括基础软硬件、基础模型和创新应用三个层次。人工智能基础模型能够支撑赋智经济于社会各类应用，也将带动基础软硬件智算体系的发展。

从当前的产业现状来看，超大规模智能模型生态在全球屈指可数，其原因是受制于应用、数据量、算力、算法等因素。谷歌由于掌握核心专利、搜索引擎积累的海量数据、通过Android能够更好地服务移动用户等原因，而走在了前列。当成为大模型标志，接受了微软投资之后，OpenAI也脱颖而出。谁会是世界上大模型第三强呢？恐怕接下来比拼的就是生态，因此，人工智能之争最终是生态之争。

对于CIO们来说，2000年以前是信息（Information）时代，再往后2020年以前是网络（Internet）时代，而2020年以后就属于智能（Intelligence）时代了。因此，CIO们接下来需要关注两个人工智能的重大转变，首先是从信息智能到实体智能，其次是从“静态融通”到“动态涌现”，未来有望通过类脑智能实现实现真正的AGI。

今天，ChatGPT有强大的智能，影响深远。未来3年，除了语言，大模型正在迅速扩展视觉、听觉、具身、行动等通用智能，影响将更大。未来10年，智力革命已经打响，就像工业革命解放体力，就像电力革命解决能源流通，智力革命将是全新生态的构建，开源开放生态终将胜利。未来20年，ChatGPT是数据驱动的静态智能，未来是时空环境驱动的具身智能，智能载体不是今天的人工神经网络，而是类脑的脉冲神经网络。到2045年，还会出现结构仿脑、功能类脑、性能超脑的超人“电子大脑”。

第三十八届CIO班招生
国际CIO认证培训
首席数据官（CDO）认证培训

责编：zhanghy

免责声明：本网站（http://www.ciotimes.com/）内容主要来自原创、合作媒体供稿和第三方投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。
本网站刊载的所有内容（包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等）版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时，请及时通知本站，予以删除。