绿视界丨人工智能安全治理框架2.0版发布:构建全球协同治理新生态

2025-09-30 21:34:23  来源:绿法国际联盟   作者:绿盟研究院

要点:2025年9月,国家互联网信息办公室发布《人工智能安全治理框架》2.0版,完善风险分类分级体系,构建“技术—应用—治理”三维防控矩阵,创新协同治理机制,配套工具包与评估体系,推动国际规则互认与协作,构建安全可信的AI发展生态,实现技术普惠共享。

——来源于国家互联网信息办公室

2025年9月15日,在国家网络安全宣传周主论坛上,国家互联网信息办公室正式发布《人工智能安全治理框架》2.0版(以下简称《框架》2.0版)。作为落实《全球人工智能治理倡议》的核心举措,这一文件由国家互联网应急中心牵头,联合人工智能专业机构、科研院所及行业企业共同制定,在2024年1.0版基础上,结合技术发展与应用实践,完善风险分类分级体系,动态调整治理措施,标志着我国人工智能安全治理从“原则倡导”向“实操落地”迈出关键一步。《框架》2.0版的发布不仅为国内AI产业发展划定安全边界,更通过跨国界、跨领域、跨行业的协同治理理念,为全球人工智能治理贡献中国方案,推动技术红利惠及全人类。

《框架》2.0版的出台源于人工智能技术快速迭代带来的治理新挑战。过去一年,生成式AI、具身智能等技术突破催生了海量应用场景,但同时也引发算法歧视、数据滥用、深度伪造等风险。某互联网企业AI安全负责人指出,1.0版框架侧重宏观原则,而2.0版针对“AI生成内容标识”“算法透明度”等具体问题提出可操作方案,例如要求聊天机器人需通过显式标识(文字标注)和隐式标识(技术水印)双重方式提示用户,这一规则已在国内主流AI产品中落地,用户识别准确率提升至98%。国家互联网应急中心数据显示,2024年我国AI相关安全事件同比增长65%,其中深度伪造视频诈骗案件占比达32%,《框架》2.0版通过“风险分级+动态防控”机制,将AI风险划分为“核心风险、重要风险、一般风险”三级,对应不同治理强度,例如对涉及公共安全的核心风险,要求企业每季度提交安全评估报告,而一般风险可通过内部合规审查自主防控。

在风险分类体系上,《框架》2.0版构建了“技术层—应用层—治理层”三维风险矩阵。技术层重点防控算法偏见、数据污染、模型投毒等风险,要求训练数据需通过合规审查,模型发布前完成安全测试;应用层聚焦自动驾驶、医疗诊断等高风险场景,明确企业需建立“人类监督机制”,例如AI辅助诊疗系统的重大决策需经医生复核;治理层则强化供应链安全,要求AI芯片、基础软件等关键环节供应商通过安全认证。某自动驾驶企业据此调整研发流程,在算法训练阶段引入第三方机构进行公平性测试,将性别、年龄等敏感特征导致的决策偏差降低至0.3%以下。值得注意的是,《框架》2.0版首次将“环境影响”纳入治理范畴,要求AI企业定期披露算力中心能耗数据,鼓励采用绿色算法优化模型训练效率,某头部科技公司通过模型压缩技术,将大模型训练能耗降低40%,年减少碳排放1.2万吨。

协同治理机制的创新是《框架》2.0版的鲜明特色。文件提出“政府引导—企业主责—社会监督”的共治模式:政府层面建立“AI安全治理沙箱”,允许企业在可控环境中测试创新应用;企业层面需设立首席AI安全官,对高风险业务实施“双人复核”;社会层面则鼓励行业协会制定自律标准,目前已有120家企业签署《AI安全自律公约》。在国际合作方面,《框架》2.0版与欧盟《人工智能法案》、联合国《负责任的人工智能》原则实现部分规则互认,例如对“不可接受风险AI系统”的判定标准达成共识,某跨国AI企业据此调整全球产品策略,在中欧市场同步满足“训练数据本地化存储”要求,合规成本降低30%。国家网信办国际合作局负责人表示,《框架》2.0版将作为我国参与G20、APEC等多边机制AI治理讨论的基础文件,推动建立跨国风险预警平台,目前已与15个国家实现AI安全事件信息共享,响应效率提升50%。

为确保落地实效,《框架》2.0版配套推出“工具包+评估体系”实施支撑。工具包包含风险评估模板、安全测试用例、合规自查清单等12类实用工具,某银行AI风控系统通过工具包完成算法透明度评估,将模型决策逻辑解释准确率从65%提升至89%;评估体系则引入“成熟度模型”,将企业AI治理能力分为“初始级、管理级、优化级”三级,优化级企业可享受监管沙箱优先试点等政策红利,目前已有8家企业通过优化级认证,获得自动驾驶、智能电网等创新业务试点资格。地方层面,北京、上海等地已将AI安全治理纳入智慧城市建设考核,对达标企业给予税收优惠,某AI医疗企业因此节省研发投入2000万元。

《框架》2.0版的发布正值全球人工智能治理体系加速构建的关键期。与1.0版相比,2.0版的突出变化在于从“被动应对”转向“主动防控”,例如建立“AI安全漏洞奖励计划”,鼓励白帽黑客发现AI系统漏洞,最高奖励金额达500万元;从“国内治理”转向“全球协同”,通过“一带一路”AI治理倡议,向发展中国家提供技术培训和工具支持,目前已在东南亚、非洲等地区开展12期培训班,培养本土治理人才300余人。正如国家互联网信息办公室负责人在发布会上强调的,《框架》2.0版的核心目标是“发展与安全并重”,既要为AI创新留足空间,又要通过制度设计防范风险外溢,最终实现“技术可控、伦理合规、治理有效”的发展愿景。

随着《框架》2.0版的实施,我国人工智能产业正迈向“安全中发展”的新阶段。企业层面,百度、华为等头部企业已成立AI治理委员会,将安全要求嵌入产品全生命周期;行业层面,生成式AI服务备案制与《框架》2.0版形成联动,未通过安全评估的产品不得上线;国际层面,我国与联合国教科文组织联合发起“AI伦理全球倡议”,推动《框架》2.0版核心规则纳入国际标准。这场以治理促发展的实践,不仅为我国AI产业高质量发展筑牢安全屏障,更通过开放包容的治理理念,推动全球人工智能技术普惠共享,让AI真正成为造福人类的工具。

来源:国家互联网信息办公室官网