《智能助手类智能体安全分级规范与建设指南》发布——为智能体安全立“标尺”推动智能助手从“可用”到“可信”-新华网

新华网北京6月11日电（曹素妨向思敏）人工智能正加速从“对话交互”走向“任务执行”。随着智能助手类智能体在办公、政务、金融、医疗等领域的深度嵌入，提示注入、数据泄露、权限劫持、多智能体协同失控等新型安全风险日益凸显。如何为智能体“系上安全带”，成为人工智能产业的关键命题。

6月10日，新华网联合中国信息通信研究院等主编及参编单位，正式发布《智能助手类智能体安全分级规范与建设指南》（以下简称“指南”），旨在为技术提供者、服务提供者及行业用户构建“可控、可信、可追溯”的安全能力体系。

图为专家评审会现场

五级安全体系：为智能体划定“安全等级”

指南构建了L1到L5五级递进式智能体安全分级体系，层级清晰、梯度适配各类应用场景。L1为基础级，守住行业基本合规底线，具备基础安全防护能力；L2为进阶级，强化安全管控能力，具备基础安全防护与审计能力，可抵御常规安全风险；L3为自主级，具备全生命周期安全防护体系，可抵御中高级安全风险；L4为协同级，强化多智能体协同、跨设备协同场景的安全能力，具备跨系统、跨组织的安全协同保障能力；L5为自治级，是AI智能助手安全能力最高等级，实现安全能力深度落地，具备纵深防御能力与可追溯审计能力，可抵御高级持续性安全威胁。

“不同场景的智能助手，安全需求差异较大。”参与编制的专家表示，“这套分级体系就像智能体的‘能力资质标尺’，让企业、政府机构和终端用户可根据场景风险等级选择匹配的智能体产品，有效规避标准‘一刀切’、高风险智能体违规落地等问题。”

全链路安全闭环：从输入到协作，每一步都有“护栏”

不同于以往行业标准多聚焦模型输出安全的单一维度管控，指南立足智能体全生命周期运行逻辑，围绕“输入→感知→决策→记忆→工具→执行→协作”运行闭环，为每一个运行环节细化明确刚性安全要求。在输入环节，要求防御提示注入与多模态对抗样本；在记忆环节，强调会话隔离、加密存储与防篡改；在工具调用环节，建立工具网关与最小权限边界；在执行环节，落实沙箱隔离与高危操作人工复核；在协作环节，实现多智能体身份认证与群体行为监控。

这意味着，智能助手不再是“黑箱”操作，而是从数据入口到行动出口，每一步都可控、可溯、可审计。

重点场景强化：政务、金融、医疗有了“专属安全锁”

指南特别针对高风险领域设置了场景化增强要求。在政务场景，强调“数据不出域”、接入统一身份认证、意识形态安全审核与人工复核机制；在金融服务场景，明确资金类操作强制人工复核、交易操作全链路追溯；在医疗健康场景，规定诊疗建议不得替代执业医师、患者隐私数据严格隔离。

“这不是一份泛化的技术建议，而是一份可以落地执行的‘操作手册’。”评审专家指出，“尤其是在关乎公共利益、民生保障、群众生命财产安全的重点领域，指南为智能助手的市场准入、日常运行和合规监管全流程，提供了可落地、可核验、可督导的清晰标尺。”

内容安全：为智能体注入“可信知识基因”

值得关注的是，指南在内容安全与价值观对齐层面，特别强调了权威知识底座的重要性。从源头上遏制语料污染、知识偏差与内容幻觉，是确保智能体的回答有据可查、有源可溯、合规可靠的前提。

新华社具有全域权威新闻报道的纯净语料与可信信源，汇聚了经过严格审核的事实数据、政策文本、主流价值观语料与多领域专业知识，能提供可追溯、可核验、可对齐的“可信知识底座”。指南编制团队指出，将具有可信知识底座的权威智能体相关能力嵌入智能助手的记忆与知识库模块，能有效落实内容安全防控、实现价值观对齐。未来，更多机构可以依托此类权威知识底座，快速构建符合安全等级要求的行业智能体。

从规范到能力：安全，正在从“防火墙”变成“竞争力”

指南不仅提出技术要求，还同步给出了分级评估方法，涵盖文档审查、配置核查、渗透测试、业务安全测试等多种手段，确保安全能力可量化、可验证、可比较。指南明确提出，安全不再是智能助手的“成本项”，而是构建用户信任、形成差异化竞争力的核心资产。

新华网后续将联合相关机构，推动指南的行业落地与评价体系建设，并持续依托“新华语典”等权威基础设施，为智能体安全治理提供从能力到标准、从评价到优化的完整链条。从“可用”到“可信”，从“对话”到“行动”，指南旨在为人工智能产业健康有序发展筑牢安全根基。

【纠错】【责任编辑:吴诗萌徐曼曼】

深度观察

新华全媒头条丨各地“城超”探索文体旅商融合发展“长红”之路