云智算深度融合重塑数字经济的底层逻辑,随着人工智能技术突破,用户需要随时、随地、随需接入算力资源。算力互联网通过网络化手段实现跨地域、跨主体的算力资源统一调度与接入,推动“东数西算”等国家工程落地实施,支撑人工智能、低空经济、自动驾驶等新兴业务发展。截至2024年底,我国算力总规模达到280EFLOPS,近5年平均增速近30%。在全行业加速数字化转型、推进算力应用创新的关键阶段,安全问题不容忽视,算力互联安全的内涵正经历从“网络防御”到“全域可信”的根本性拓展。
一、政策底座逐步完善,关键领域精准布局
我国算力产业迈向高质量规模化发展新阶段,相关制度文件密集出台,逐步夯实政策底座。《算力基础设施高质量发展行动计划》提出构建算力互联互通体系,统一算力资源标识和身份认证,同时要求强化算力安全保障能力建设,确保网络安全、数据安全、产业链供应链安全和算力稳定运行。今年5月,工信部印发《算力互联互通行动计划》,明确了算力互联互通体系重点任务,要求进一步夯实算力互联网安全保障,打造“云、网、边、端”一体化协同的安全态势感知和防护能力。8月,国务院发布《关于深入实施“人工智能+”行动的意见》,聚焦智能算力统筹,加强智算互联互通和供需匹配,鼓励发展标准化、可扩展的算力云服务,推动智能算力供给普惠易用、经济高效、绿色安全。相关政策文件在算力基础设施、互联互通、智能应用等关键领域逐步形成全面精准布局,为算力互联网安全建设提供强有力的理论引领。
二、算力互联体系复杂,风险防御刻不容缓
算力互联网是面向计算密集型任务与动态调度需求的新型网络技术体系,通过构建统一的算力标识机制与标准化的协议接口,实现对跨域、异构计算资源的逻辑抽象与统一管控。同时,深度融合高性能计算、边缘计算、云计算等多类型算力节点,依托弹性可编程网络基础设施,提升端到端的资源协同与调度效率。总的来说,算力互联网形成了一个逻辑集中、物理分布、动态协同的全局算力资源池,具备实时感知、按需服务、自适应优化等核心能力,为构建泛在化、智能化的数字基础设施提供关键支撑。
算力逐渐成为金融、医疗、工业等关键领域数字化的重要支撑,用户对算力互联互通的信任问题愈发凸显,当前算力互联网仍处于发展初期,其安全体系尚不成熟,面临计算资源劫持、平台拒绝服务、网络信道攻击、模型应用投毒等多层次风险,亟需系统性防范与治理。
三、算力基础设施层:技术体系不兼容,安全机制不成熟
算力基础设施层安全风险主要源于技术异构性与互联机制的脆弱性。算力互联网基础设施由计算资源、网络资源与核心互联架构共同组成,快速迭代的算网融合技术导致各类资源要素安全性滞后,总体上存在技术路径不兼容、安全体系不成熟、风险可控难度高等安全风险。
一是计算资源架构复杂。异构芯片(如GPU、NPU、FPGA)在计算框架、软件驱动、芯片封装上的差异,导致兼容性复杂,适配接口易出现设计漏洞,为攻击者提供可乘之机。算力卡间互联多采用高速直连链路(如NVLink、Infinity Fabric),互联协议普遍重效率、轻安全,为追求极致性能,部分场景未对传输数据加密,导致卡间通信存在数据泄露风险。二是核心互联体系未打通。当前在研算力标识体系不统一,跨域标识互认和转换受阻,算力资源溯源困难,难以预防伪造、篡改风险。算间互联协议多样,RDMA主流协议开放性不同(如专用网IB、以太网RoCE),暴露面和风险代价有差异,安全措施易出现疏漏,且缺乏认证字段,存在未授权访问风险。三是网络传输抗风险能力弱,当前普遍使用基于以太网的接入侧弹性网和传输侧IXP互联,部分高性能场景难以安全稳定运行。在光网络层面,全光互联虽具备高带宽优势,但物理层易遭光纤搭线窃听,软件层依赖SDN控制器,一旦被攻破,攻击者可大规模重构光路,造成全局性威胁。
四、算力资源互联层:平台身份权限管控难,调度编排安全可信度不足
在算力资源互联层,安全挑战集中在身份管控与调度可信度不足。一方面,调度平台身份难鉴别、权限难管控。大型资源调度统一管理平台拥有海量的用户与算力供应主体,作为资源汇聚与调度中枢,身份管理工作十分复杂。平台权限缺乏对角色与动态资源实体的细粒度权限管控,无法依据实时状态风险动态调整授权策略,形成权限超配与行为越权,极易成为跨域攻击的跳板。
资源调度编排前需进行身份验证
另一方面,算力调度编排行为难溯源、基线不统一。跨网络域的主体共同参与算力调度与编排,多元参与主体间缺乏权威、可审计的跨域身份互信与动态授权机制,安全边界模糊,难以追溯恶意行为起点并有效隔离攻击,极大增加了调度链路上的数据泄露、非授权访问及系统间协同被劫持的风险。同时,异构算力资源的安全基线配置不一,低安全等级资源可能被调度执行高敏感任务,形成“木桶效应”,甚至可能严重威胁整个算力生态的可信运行。
算力资源劫持与攻击入侵路径
五、算力业务应用层:稳定性难保障,数据安全责任边界不清
确保算力应用服务的持续稳定和低延迟响应难度大。算力业务应用层为智算、通算、行业应用搭建运行平台,涵盖人工智能训练、科学仿真、实时渲染、大数据分析等高算力需求场景,高度依赖网络与硬件稳定性,但在算力需求激增或节点故障时,系统往往缺乏快速自愈与冗余切换能力,影响关键业务连续性。运维系统对全局状态的可观测性不足,故障定位与恢复流程缓慢,进一步加剧服务中断风险。
算力业务参与主体的安全责任划分边界尚不清晰。随着海量数据在算力节点间频繁流转,如模型参数、用户信息、企业工作流等均可能存在敏感数据,数据安全责任主体从单一转向多元,形成用户、算力服务商、监管机构等多方共担责任的新格局。但“谁控制、谁负责;谁处理、谁担责”的原则在实践中仍面临权责界定模糊、审计日志篡改、数据残留等挑战,隐私泄露与合规风险并存。
算力业务主体间数据安全责任边界划分框架
六、多措并举形成多层次、全链路安全可信体系
在政策引导与行业安全需求的双重驱动下,构建全域可信的算力互联网体系,不仅是应对非传统安全挑战的必然选择,更是释放算力潜能、推动数字经济高质量发展的关键支撑。
在算力基础设施层面,加快构建国产算力卡生态框架,开发算子库、编译协议适配器等措施,向下屏蔽底层硬件资源差异,有利于解决异构算力兼容产生的复杂问题。依据国家相关文件部署,逐步建立算力互联网统一标识,推进算间高性能互联协议统一和兼容,完善安全认证机制。网络互联方面,聚焦网络传输技术与协议优化升级,增强以太网和全光网承载能力,提升网络硬件质量和抗风险性能。
在算力资源互联层面,鼓励调度平台广泛实施基于多因素凭证与零信任的精细身份治理,构建实时细粒度权限熔断机制,实现动态风险自适应的最小化授权体系。建立基于可信执行环境与分布式身份的新型跨域互信框架,探索跨域互认的资源可信防篡改、抗伪造治理措施,实现全链条可验证、可溯源。