红帽推出红帽AI Enterprise,打造从底层硬件到智能体的一体化AI平台
红帽推出红帽AI Enterprise,打造从底层硬件到智能体的一体化AI平台
2026-03-03 08:58:28 来源:CIO时代
抢沙发
2026-03-03 08:58:28 来源:CIO时代
摘要:红帽AI Enterprise以红帽企业Linux和红帽OpenShift的行业领先技术为底座,统一AI生命周期,打通从AI基础设施到生产级智能体的全链路
关键词:
红帽
3月2日,企业级开源解决方案提供商红帽近日宣布,推出红帽AI Enterprise(Red Hat AI Enterprise),这是一款可在混合云环境中部署和管理AI模型、智能体及应用的一体化AI平台。该产品将加入包含红帽AI Inference Server、红帽OpenShift AI和红帽企业Linux AI在内的红帽AI产品矩阵。同时,红帽还发布了红帽AI 3.3(Red Hat AI 3.3),为AI产品矩阵带来了重要更新和功能增强。上述解决方案共同构建起一套“从底层硬件到智能体”的全技术栈,将底层的Linux和Kubernetes基础设施与先进的推理和智能体能力相集成,助力企业从零散的AI实验阶段迈向可治理、自动化的运营阶段。
当前企业AI正从简单的聊天交互界面,快速向高密度、自动化的智能体工作流演进,这对全技术栈的深度集成提出了更高要求。然而,工具体系碎片化、基础设施不统一的问题,导致许多企业始终停滞在AI“试点阶段”。红帽AI Enterprise通过统一模型与应用的生命周期来应对这一行业挑战,赋能IT团队将AI作为标准化的企业级系统而非孤立的项目进行管理,使AI交付具备传统企业软件同等的可靠性与可复用性。
红帽AI Enterprise:AI生产的基石
红帽AI Enterprise具备高性能AI推理、模型调优与定制、智能体部署与管理等核心能力,同时拥有可在任意环境下兼容各类模型与硬件的高度灵活性。该平台以业界领先的、由Kubernetes驱动的混合云应用平台红帽OpenShift为核心,利用熟悉的工具和框架,在任意场景都能提供高度可扩展、更具一致性且安全性能更强的使用体验。对于NVIDIA AI基础设施,红帽和NVIDIA结合红帽AI Enterprise和NVIDIA AI Enterprise,联手打造了全新的红帽和NVIDIA AI工厂,助力企业加速生产级AI落地并实现规模化部署。
红帽AI Enterprise的主要优势包括:
更高效、经济且可扩展的AI推理能力:利用vLLM推理引擎和llm-d分布式推理框架,在混合硬件环境中优化生成式AI模型的部署。
集成可观测性与生命周期管理:依托经过测试且可互操作的企业级一体化AI技术栈,助力实现AI生命周期治理并降低风险。
跨混合云的灵活性:以可信赖的红帽平台为支撑,让企业在业务所需的任意环境,都能以更高的一致性部署和管理AI模型、智能体及应用。
通过红帽AI 3.3扩展战略灵活性与全栈效率
红帽的战略核心在于通过一个统一平台,弥合企业关键任务稳定性与前沿创新之间的鸿沟。本次发布的红帽AI 3.3扩展了模型选择范围,深化了对下一代芯片的全栈优化,并强化了前沿模型操作的一致性。
新特性和增强的功能包括:
扩展的模型生态系统:可通过OpenShift AI模型目录获取新增的模型,如Mistral-Large-3、Nemotron-Nano和Apertus-8B-Instruct,上述模型均为经过验证并可直接投入生产的压缩版本。此外,新版本支持部署采用稀疏注意力机制的前沿模型,如Ministral 3和DeepSeek-V3.2,同时实现了多模态能力升级,包括Whisper速度提升3倍、地理空间能力的支持、改进的EAGLE推测解码以及面向智能体工作流的工具调用能力增强。
AI模型的自助访问服务:提供模型即服务(MaaS)的技术预览。IT团队可以通过API网关为内部用户提供私有托管模型的自助访问服务。这种集中管理模式让企业内部用户可按需调用AI能力,打造即取即用的AI技术底座,推动企业私有化、可扩展的AI落地应用。
扩展的硬件支持:推出CPU端生成式AI支持的技术预览,先从英特尔CPU开始落地,实现更具成本效益的小语言模型(SLM)推理。此外,该平台已扩展其对NVIDIA Blackwell Ultra的硬件认证,并支持AMD MI325X加速器。
从数据到模型的一体化生命周期管理:由全新的红帽AI Python索引确保安全。这个可信的仓库提供经过加固的企业级关键工具,包括Docling、SDG Hub和Training Hub,助力团队从零散的实验阶段,迈向可复用、安全优先的生产流水线。
全面的AI可观测性与安全防护:提供模型健康度、运行性能与行为表现的深度可视化,为AI工作负载、llm-d部署、模型即服务(MaaS)集群及模型使用情况提供实时遥测能力;并配合集成NeMo Guardrails技术预览版,帮助开发者在各类AI交互场景中保障运营安全与能力对齐。
按需提供GPU资源访问:支持企业通过智能编排与硬件池化,使企业能够部署其内部的GPU即服务(GPU-as-a-Service),结合自动检查点功能保存长时训练任务状态,避免工作成果丢失,即便在高度动态或可抢占的环境中,也能让企业的计算成本更具可预测性。
第四十一届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:lijj
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。