4 月 2 日,深度求索(DeepSeek)官方发布重磅公告:新一代旗舰大模型 DeepSeek V4 全程采用纯国产算力集群完成训练,彻底不依赖英伟达任何芯片,实现全链路自主可控。这一消息不仅震动国内 AI行业,更在全球科技圈引发强烈关注,标志着国产大模型正式摆脱对美国芯片的依赖,打破高端算力封锁,具备独立研发、独立迭代、全球竞争的完整能力。
DeepSeek V4 是一款万亿级参数的通用大模型,覆盖文本生成、代码理解、数学推理、多模态交互、复杂逻辑决策等全场景能力,综合性能处于国产模型第一梯队,接近 GPT-4.5 国际水平,计划在 2026 年第二季度面向企业与公众全面开放。但此次发布最受关注的并非模型性能本身,而是其彻底 “去美化” 的实现路径 —— 从训练芯片、加速卡、服务器硬件,到编译器、框架、调度系统,全部采用国产方案,实现了从头到尾的自主可控。
官方在说明中明确列出三大核心原因。第一,保障供应链绝对安全,彻底杜绝断供、限制、合规风险,保证模型训练与迭代不被外部因素干扰。第二,摆脱美国技术生态绑定,走独立技术路线,避免在框架、算子、优化层面受制于人。第三,以真实大模型训练场景倒逼国产芯片成熟,大规模实际使用将快速推动寒武纪、壁仞、海光、昇腾等国产 AI 芯片的生态完善与性能优化。
经过大规模实测验证,此次用于训练 DeepSeek V4 的国产算力集群,综合算力效率已经达到英伟达 H100 芯片的约 85%,在稳定性、散热、集群调度上完全满足超大规模模型训练需求,训练周期、收敛速度、模型效果与传统方案差距极小。同时,国产方案在成本上具备明显优势,整体投入更低,更适合大规模推广。
长期以来,“算力卡脖子” 是国产大模型发展的最大痛点。高端 AI 芯片被美国严格限制,国内企业难以获得足量先进算力,严重制约模型迭代速度。DeepSeek V4 的成功,证明国产芯片已经可以支撑顶级大模型训练,不再需要看他人脸色。
此举也标志着中国 AI 产业正式形成完整闭环:从数据、算法、模型,到算力芯片、框架、部署,全链条自主可控。未来,越来越多国产大模型将转向纯国产算力,形成规模化效应,进一步推动成本下降与性能提升。
当然,行业也保持着理性认知:国产芯片在算力密度、软件生态、生态兼容性上仍有提升空间,需要持续迭代优化。但从 0 到 1 的突破已经完成,从 1 到 100 的规模化阶段已经开启。
对整个国家而言,大模型自主可控不仅是科技竞争问题,更是数据安全、产业安全、国家安全的关键基石。DeepSeek V4 的突破,无疑具有里程碑式意义。