2023-12-18 14:00:02 来源:
戴尔科技集团全球首席技术官John Roese近日从最前沿的视角,分析了ICT技术在2024年的演进趋势,对于CIO提升预判力而言,恰好是一个绝佳的参考标尺。
戴尔科技集团全球首席技术官John Roese
生成式AI的演进
2023年,生成式AI异军突起。表面看来,AI的成功似乎是在一夜之间完成的,但事实上,AI此前经历了漫长而艰辛的演进过程。在经历了两次AI低谷之后,主张智能来自智能主体与环境的互动的行为主义才占了上风, 2006年深度学习出现,直至2016年在围棋领域AlpaGo战胜人类最强棋手之后,到2018年,模型才成为AI研究和产业的中心。
2023年年末,尽管谷歌发布了号称赶超GPT-4的Gemini大模型,但这阻挡不了一个新趋势:经历了2023年的大语言模型训练热潮之后,2024年将迎来大语言模型应用狂潮。因此,2024年将注定是大语言模型的应用元年。
John Roese表示:“2023年,包括OpenAI、谷歌、阿里在内的大公司都推出了自己的生成式AI技术,但却很少有用户把生成式AI投入到实际应用中,多数都还处于理论探讨阶段。走得比较靠前的企业,开始针对生成式AI做各种各样的实验,想弄清如何去应用它。但到了2024年,真正的转变就会到来。生成式AI会走入到生产系统中,实现从理论阶段到业务应用阶段的过渡。”
事实上,戴尔科技集团在2023年对生成式AI的应用进行了深入研究,并且找出了能够应用生成式AI的数百个项目。作为先行者,John Roese给出了更深刻的建议:“当CIO和企业领导者准备应用生成式AI时,他们会发现可能有成百上千个潜在用例,但每一个企业的资源都有限,只能做其中几个。所以对于CIO和企业领导者来说,遇到的第一个问题就是要做出选择,能划分轻重缓急,选出几个优先事项。”
当选定了生成式AI的应用项目之后,接下来企业就会遇到成本问题。一种观点认为,大语言模型在训练阶段需要海量的成本,但应用阶段却并不需要特别多的费用。John Roese否定了这种说法:“在企业用例方面,我们在公司内部建立了一个系统,它可以回答关于我们产品及技术的任何内容问题,这个系统非常有用。但我们最后发现,它的成本并不仅仅来自于建立这个模型的成本,当它需要面临大量的工作量时,也会产生巨额的运营成本。所以CIO们也需要衡量一个生成式AI应用的性价比,是不是成本非常高时,他们也愿意做这项工作。”
这些问题并不是生成式AI应用面临的全部问题,John Roese接着介绍说:“接下来还会面临一系列复杂问题。首先是你的生成式AI推理的基础架构是什么,如果你有非常成熟的模型但却只面临很少量的用户,那么可能一台服务器就够用了。但当你面临数以百万计的客户要用这个模型时,你可能需要几十万台服务器来组成基础架构。其次是你的推理进程要放在什么地方。推理要放在数据和用户所在的地方,这样推理大概率不会放在数据中心中,而有可能在边缘端。最后,即使你有了这样的基础架构,来保障足够的推理能力应用,你是否有能力确保理基础架构的安全?”
当生成式AI最终进入企业核心应用,成为核心业务的依赖时,John Roese的观点却又让我们回到了问题的原点。
生成式AI应用的支撑体系
从CIO的角度来感受,近些年新技术浪潮一波连着一波,如多个正弦曲线一般交织在一起。而从技术提供者的视角来看,多种技术往往是共同进步,构建起强大的底层基础架构,才让一项技术突出显现出来。
从这个层面来看,生成式AI要走向成功应用,应对安全、推理场所、算力等新问题,无疑需要零信任安全、边缘计算、高性能硬件和充足的算力支撑。因此,在John Roese看来,零信任安全、边缘计算、先进硬件与量子计算,将构成生成式AI应用的四根支柱。

与生成式AI没有大规模走入企业应用不同,黑客们却对它表现出了异乎寻常的热情。作为ChatGPT的变种,WormGPT让钓鱼邮件更有说服力,FraudGPT成功降低了黑客的技术门槛,深度伪造与勒索行为混合在一起,已经造成了更大危害,DeepLocker和BlackMamba让攻击变得更为隐蔽。正是由于生成式AI的进化,才让网络安全面临更严峻的挑战。因此,走向零信认安全已成必经之路。
John Roese解释说:“零信任不是一个新的概念,它意味着所有人、APP以及设备都需要进行验证。从控制的角度来看,要识别出好的、坏的和不知道的。2024年,用户必须要开始做零信任,同时政府也会鼓励零信任架构。零信任不仅是一个产品,更多是一个架构和哲学。整个生态系统正在让零信认变成可能。”
而针对边缘计算,John Roese认为:“在多云的环境之下,云服务提供商都是集中在数据中心内提供服务,可是实际工作中,用户的数据却并不都在数据中心,而可能是在工厂、医院中。这就意味着大型服务提供商以及服务堆栈上需要为每一个架构建立自己的边缘,但事实上云服务商并不需要针对每个工作负载建平台,而是只需要建立一个共同的平台。”
对许多人来说,量子计算还只是明天的科技。John Roese则表示:“我认为量子计算会在5年内变成现实。量子计算和常规计算是完全不同的,生成式AI可以在无数的回答选项基础上给用户一个正确的回答,而量子计算具备处理无限数据的能力。所以量子计算与生成式AI结合并进行优化之后,能够让生成式AI更加有效,运行得更好。”
2024,未来已来
从生成式AI应用的四根支柱的角度来看,戴尔科技推出的Dell APEX云平台,通过将云运营模式扩展到本地和边缘环境,提供一致的多云运营。此外,戴尔科技还推出了很多创新产品和解决方案。因此,戴尔科技在2023年所做的尝试,可能正是我们将要在2024年开始的探索。
那么,当戴尔科技用自己的努力让明天已来的情况下,又是如何解决生成式AI应用中遇到的新问题呢?为了满足我们的好奇心,John Roese给出了更多答案。
当大语言模型进入行业应用时,还需要与领域知识进行深度融合。而在这个过程中,会遇到新问题。John Roese介绍说:“大多数企业并不需要一万台服务器,日夜不停地跑着支持企业级生成式AI的应用,而是可以从基础模型起步,不断地调优模型,不断实现和现有数据集之间的连接。但另一方面,用户一定要对IT基础架构进行重新设计,让它能支撑生成式AI的推理应用。”
对于生成式AI来说,当它走入企业应用时,数据短缺的问题会不断困扰它的发展。甚至有人极端地预测,用于大模型训练的数据会在三年内耗尽。针对这一问题,John Roese表示:“这种理解完全正确,没有良好的硬件支撑,就不会有一个良好的生成式AI应用。同时,没有良好的数据,或者说数据中充满了偏见化或碎片化,那么你的应用注定是要失败的。我想给大家一些好消息,一些公司已经开发出了不错的工具。从戴尔科技的角度而言,我们现在和数据的生态系统有很好的合作,我们因此而能够进行高层次的数据编排。比如两年前,我们和Snowflake建立了合作伙伴关系,它提供了非常好的以云为基础的数据仓库和数据编排,这让我们建立了基本数据基础。所以,今年以来,所有公司都需要研究生成式AI需要什么样的数据,以保证模型的训练。戴尔科技和全世界最好的数据公司有很好的合作伙伴关系,我们在这方面的使命,就是将这些数据工具带到各个用户企业的具体应用中来实施。”
对广大CIO而言,因为生成式AI应用的落地,数据也有了另一层更深的意义。John Roese强调:“数据对于生成式AI至关重要,所以企业一定要关注自己的数据集,不仅关注这些数据在哪里,是什么格式的,更要关注这些数据中是否存在潜在的偏见。考虑到现在新架构中有新工具将混乱的数据进行清理,用户有时候甚至需要用一个大语言模型来检测另一个大语言模型,这样就可以在坏数据和好模型之间建立一个防火墙。”
从John Roese的介绍中,我们不难体会到,无论你是选择逃避,还是迎头而上,生成式AI都会走入我们的工作和生活中,也都会带给我们无尽的新问题。所以,选对合作伙伴,从现在就开始接受挑战吧。
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。
