首页 > 人工智能 > 正文

红帽AI 3.4发布:重大升级打通开发运维协作链路,赋能智能体未来

2026-05-13 16:29:23  来源:CIO时代

摘要:红帽AI从底层硬件到智能体的全新能力,为企业在混合云环境中扩展模型与自主智能体提供基础平台
关键词: 红帽
2026年5月13日,企业级开源解决方案提供商红帽宣布,对红帽AI产品组合进行重大升级,旨在帮助企业弥合AI实验与生产级运维控制之间的鸿沟。通过推出从底层硬件到智能体(metal-to-agent)的统一平台,红帽AI 3.4简化了智能体工作流(agentic workflows)的开发与部署,帮助企业从试点项目迈向可覆盖其整个基础设施的可扩展AI应用。
 
通过为开发者与运维人员提供统一框架,红帽为企业扩展自主系统提供了基础平台,并同时确保了现代企业所需的控制力、安全能力与硬件效率。
 
什么是红帽AI 3.4?
红帽AI 3.4是一个综合性平台,提供在混合云环境中扩展模型与智能体工作流必需的架构基础与运维工具。此次发布的核心能力是模型即服务(MaaS),可为开发者提供受治理的统一接口,支持其访问各个精选模型,同时也支持管理员跟踪模型使用情况并实施策略控制。该能力构建于高性能分布式推理基础平台之上,由vLLM与llm-d驱动,从而支持模型服务在广泛环境中的优化、高效运行。
 
随着AI智能体推动推理需求呈指数级增长,红帽AI为企业提供了与智能体框架无关的大规模部署与管理能力。新推出的AgentOps工具可覆盖从开发到生产的智能体全程管理,包括集成式追踪、可观测性、加密身份与生命周期管理等能力。
 
为实现企业数据与模型、智能体的深度融合,红帽AI 3.4还新增提示词(prompt)管理能力,将提示词作为一级数据资产(first-class data assets)管理,同时推出评估中心,用于评估模型与智能体的准确率、质量与安全性。上述能力由MLflow提供支持,可为生成式AI与预测式AI场景,提供集成式实验追踪以及产物(artifact)管理功能。此外,该平台还使用Chatterbox Labs和Garak项目的技术,通过面向模型与智能体的自动化安全测试与红队测试能力,助力用户验证其安全性,为从实验性试点到生产就绪的企业级应用,提供一条以安全为先的实施路径。
 
为什么重要?
从实验性聊天机器人向生产级自主系统转型,需要IT团队之间的协作方式进行根本性转变。如今,许多企业已经意识到,为了更好地控制成本和支持私有AI与主权AI场景,需要从单纯的Token消费者转变为Token提供者。然而,开发团队与基础设施管理团队之间的协作摩擦,依然是相关技术模式落地的主要障碍之一。如果缺乏一种能够协调这两个角色的统一方法,基础设施访问受限会拖慢创新速度,而影子AI的捷径则会带来不受管控的风险与不可预测的成本。
 
红帽AI 3.4面向可扩展推理与自主智能体部署,推出企业基础平台,帮助缓解这一矛盾,提供了满足严格风险与治理标准所需的透明度与控制力。由于智能体具备一定独立性,对其决策过程缺乏可见性可能带来重大安全风险。对此,红帽AI提供的基础设施可以追踪操作、推理步骤、工具调用,使企业能够审计智能体的决策路径。同时,平台通过加密身份管理,将操作行为与已验证身份相关联,帮助企业识别执行相关任务的实体。这些能力将共同助力企业超越孤立的试点阶段,将AI作为一种可扩展、可预测且最重要的是可追责的企业级工具。
 
红帽及其合作伙伴的观点
红帽AI业务部副总裁兼总经理Joe Fernandes表示:“智能体时代意味着,我们的平台正在演进,从运行传统应用转向驱动智能自主系统。我们正在定义企业运行AI的开放标准。通过为AI推理、模型即服务、AgentOps提供从底层硬件到智能体的强化型基础平台,红帽为企业提供了所需的运维保障,使其能够在保持严格控制的同时实现大规模创新。”
 
CoreWeave AI服务产品管理副总裁Urvashi Chowdhary表示:“CoreWeave与红帽的合作,根植于双方对开放理念的共同坚守,旨在打造高性能推理基础平台,助力企业扩展其最复杂的AI工作负载。双方共同推出了基于CoreWeave Kubernetes Service的红帽AI推理部署蓝图,支持在本地和云端运行相同的推理堆栈,并具备Kubernetes原生的控制与生产级性能。这让受监管行业的企业AI团队能够专注于构建和扩展AI的重要工作,而无需为每个新环境重新调整其堆栈。”
 
NVIDIA企业软件副总裁John Fanelli表示:“企业中自主化、长期运行的智能体,需要更高水平的基础设施控制与安全保障能力,以确保大规模场景下的可信运行。红帽和NVIDIA AI工厂提供了开源驱动的统一基础平台,为开发者与运维人员提供了迈向智能体未来必需的治理能力与可靠性。”
 
主要亮点
可扩展的高性能推理,与受治理模型访问相结合:高效模型推理仍是生产就绪型AI的核心。通过将vLLM推理服务器和llm-d分布式推理引擎与MaaS相结合,红帽AI 3.4为模型推理提供了可靠且高性能的基础平台,同时简化了用户和智能体对模型的受治理访问。
 
简化AgentOps,面向自主应用生命周期:红帽AI 3.4版本新增全面的AgentOps能力,助力规模化智能体运维。功能涵盖集成式追踪、可观测性和评估功能,同时提供智能体身份管理及生命周期管理,从而推动智能体从开发到生产的顺利过渡。
 
打通数据、模型与智能体链路:企业数据是驱动模型与智能体运行的核心要素。红帽AI 3.4 新增提示词管理功能,将提示词作为一级数据资产管理,同时推出评估中心,可从质量、准确性、安全性及风险维度统筹管理各类评估工作。上述能力由MLflow提供支持,可为生成式AI与预测式AI/ML场景,提供集成式实验追踪以及产物管理功能。
 
集成式模型与智能体安全防护:为助力保护整个AI堆栈,红帽AI构建了分层安全防护体系,防护范围从操作系统延伸至智能体逻辑。通过自动化安全测试与红队测试,企业可采用数据驱动的方式完成模型及安全护栏的选型与配置,更好地抵御不断演进的威胁,保障AI工作负载安全。
 
更多详情
高级推理与模型优化:红帽AI推理在其分布式推理能力中新增请求优先级排序功能,可实现交互流量与后台流量共用同一端点,高负载场景下优先处理时延敏感型请求。红帽AI推理还超越了红帽OpenShift,扩展至其他Kubernetes服务,包括CoreWeave和Azure,为企业提供跨环境一致的推理堆栈。现已全面推出的投机解码(speculative decoding)支持,可在几乎不影响质量的前提下,将响应速度提升2至3倍,同时降低单次交互成本。
 
受治理的模型即服务(MaaS):该功能支持平台工程师通过安全增强型API端点,基于兼容OpenAI的标准接口交付经过验证的精选模型,实现内部模型与外部API的统一治理,并集成基于身份提供商(IDP)的身份认证。
 
集成式提示词管理:该平台提供统一工具,将提示词作为一级数据资产进行构建和管理。将驱动模型和智能体的输入存储在中央注册表中,为开发者和管理员提供了单一数据源。
 
模型与智能体自动化评估:红帽AI 3.4推出评估中心,这是一套与框架无关的统一AI评估控制平面,可对大语言模型(LLM)、AI应用及智能体开展评估。该功能以统一的评估方式替代了碎片化测试方法,可以对质量、准确性与风险水平进行基准测试。
 
多层安全防护:自动化对抗性扫描现已直接集成至开发生命周期中。红帽AI平台依托Chatterbox Labs技术,采用Garak工具筛查模型与智能体系统存在的越狱攻击、提示词注入、偏见等风险,并搭配NVIDIA NeMo Guardrails实现运行时安全防护。
 
生产级可观测性:通过集成MLflow,实现对智能体执行过程的可视化监控,借助OpenTelemetry完成LLM调用、推理步骤、工具执行、模型响应及token使用情况的端到端追踪。为提示词、嵌入向量、RAG配置的全生命周期建立透明审计轨迹,便于调试与审计工作。同时,MLflow可为生成式AI与预测式AI场景提供集成式实验追踪以及产物管理功能。
 
基于身份的治理:通过加密身份管理(SPIFFE/SPIRE),红帽AI使企业能够用短期Token取代静态硬编码密钥。这支持整个堆栈中自主智能体的最小权限操作,并有助于确保智能体行为与经过验证的身份相关联。
 
自动化体验:AutoRAG和AutoML等工具可自动化处理复杂的AI任务,涵盖从为特定数据集选择最有效的检索策略,到构建和优化传统预测模型等各个方面。
 
硬件灵活性与托管云:红帽AI 3.4提供对NVIDIA Blackwell GPU和AMD MI325X架构的零日支持。通过将该统一平台架构扩展至在第三方托管云上原生运行——包括通过全新的Red Hat AI Inference on IBM Cloud——红帽提供了跨多种硬件和云服务提供商的运营一致性。
 
可用性
红帽AI 3.4 预计将于2026年5月晚些时候发布。

第四十二届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:lijj

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。