红帽和NVIDIA AI工厂发布,助力加速可扩展生产级AI落地
红帽和NVIDIA AI工厂发布,助力加速可扩展生产级AI落地
2026-03-03 08:53:28 来源:CIO时代
抢沙发
2026-03-03 08:53:28 来源:CIO时代
摘要:全新联合研发的解决方案,融合红帽AI Enterprise与NVIDIA加速计算软件,为构建、部署和扩展AI应用提供统一底座
关键词:
红帽
3月2日,企业级开源解决方案提供商红帽近日宣布,推出红帽和NVIDIA AI工厂(Red Hat AI Factory with NVIDIA)。这款由双方联合研发的软件平台整合了红帽AI Enterprise与NVIDIA AI Enterprise,为需要大规模部署人工智能(AI)的企业提供优化的端到端AI解决方案。红帽和NVIDIA AI工厂是双方深度合作的最新里程碑,在助力将最新AI创新成果加速交付给企业客户的同时,还将对NVIDIA硬件架构实现Day 0支持。
预计到2029年,企业AI支出将突破1万亿美元[1],智能体AI应用将成为主要增长动力。企业机构正寻求将战略转向高密度的智能体工作流,并需要应对由此带来的AI推理与基础设施压力。对此,红帽和NVIDIA AI工厂可以赋能IT运维团队,同时简化传统基础设施和AI技术堆栈不断发展的需求的管理,帮助企业机构跟上AI发展的节奏。
红帽和NVIDIA AI工厂能够加快生产级AI的发展进程,为AI工厂提供软件平台。该平台基于加速计算基础设施运行,可助力提升模型性能,并通过NVIDIA GPU驱动推理堆栈。目前,思科、戴尔科技、联想及Supermicro等领先系统制造商的AI工厂基础设施均已支持该平台。这让IT管理员和运营团队能够以企业级工作负载的运营严谨性和可预测性,实现AI部署的弹性扩展与持续维护。
这一联合研发的软件平台,融合了红帽与NVIDIA在开源协作、技术研发与服务支持方面的专业能力,打造了一款值得信赖的企业级解决方案。红帽和NVIDIA AI工厂为跨任意环境的AI部署提供了高度可扩展的底座,覆盖本地、云端与边缘场景,具备高性能AI推理、模型调优、定制化以及智能体部署和管理等核心能力,并重点强调安全防护,帮助企业机构实现从数据中心到公有云的架构管控,提供:
加速价值实现:通过简化工作流程、即时访问预配置模型,推进生产级AI发展。模型包括免责的IBM Granite系列、NVIDIA Nemotron及NVIDIA Cosmos开放模型,并以NVIDIA NIM 微服务形式交付。此外,企业机构可借助NVIDIA NeMo进一步将模型与企业数据对齐,从而缩短调优时间并降低成本。
性能与成本优化:通过统一的高性能服务堆栈,最大化基础设施利用率并提升推理性能。红帽和NVIDIA AI工厂内置可观测性功能,并借助由vLLM、NVIDIA TensorRT-LLM及NVIDIA Dynamo驱动的红帽AI推理能力,满足严格的AI服务等级目标,通过优化模型与NVIDIA GPU之间的连接,助力企业机构降低AI的总拥有成本(TCO)。
智能GPU编排:通过智能编排和基础设施池化,实现GPU资源的按需访问,通过自动检查点机制,保护长时间运行的任务,并在动态环境中维持更可预测的计算成本。
强化企业安全态势:依托红帽企业Linux灵活稳定的底座,企业机构可从内置的高级安全与合规能力中获益,有效降低风险、节省时间,并减少停机时间。这为需要隔离和持续验证的关键任务型AI工作负载提供了安全加固的基础底座。NVIDIA DOCA微服务在此基础上构建,打造零信任架构,并实现跨基础设施的AI运行时安全防护。
可用情况
红帽和NVIDIA AI工厂现已可用。
第四十一届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:lijj
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。