过去一周,中国人工智能公司深度求索(DeepSeek)成为全球科技界的风暴眼。其最新模型R1的发布不仅引发资本市场震荡,更掀起了一场关于技术路径、创新模式与全球AI竞争的大讨论。中国工程院院士李国杰与DeepSeek的“过招”,成为这场风暴中最具象征意义的注脚。
2025年1月20日,DeepSeek发布开源推理模型R1,以数学、代码等复杂任务性能比肩OpenAI顶级模型的表现,迅速点燃市场热情。数据显示,其应用上线仅21天,日活跃用户(DAU)突破2215万,月活用户超3370万,成为全球用户增速最快的AI产品。更令人瞩目的是,R1模型的训练成本仅为560万美元,不足美国同行同类模型的十分之一。
这一突破背后,是DeepSeek在算法效率上的颠覆性创新。通过强化学习与专家混合模型(MoE)架构的结合,R1在减少对高性能芯片依赖的同时,实现了推理速度的飞跃——英伟达实测显示,其速度高达每秒3872个token。中国工程院院士李国杰指出:“DeepSeek证明了AI发展不必盲目堆砌算力,而是可以通过基础理论创新压缩时空复杂度。”
2月26日,李国杰院士发表《DeepSeek引发的AI发展路径思考》,以“七问”形式剖析这一现象:
这场“院士之问”迅速引发连锁反应。3月1日,李国杰团队与DeepSeek进行实测对比:在文献综述任务中,人类团队耗时8小时完成的工作,DeepSeek仅用15分钟即生成更全面的分析报告,且支持实时溯源验证。这一结果直观展现了AI辅助科研的潜力,也印证了李国杰“人机协同将重塑知识生产”的预判。
DeepSeek的崛起正在重塑全球科技权力版图。其开源策略迫使西方企业调整战略——OpenAI紧急推出免费推理模型o3-mini,Meta成立专项组逆向解析R1架构。资本市场反应更为剧烈:英伟达因市场担忧算力需求下降,单日股价暴跌17%,而中国昇腾芯片厂商单周市值飙升234%。
地缘政治维度上,DeepSeek被视为“技术-资本-政治(TCP)范式”的典型案例。德国《经济周刊》评论称:“美国的技术遏制反而激励中国程序员用创造力突破芯片封锁。”这种转变在李国杰看来具有历史意义:“中国首次在核心领域以规则改写者而非追赶者身份参与竞争。”
伴随影响力的扩大,争议随之而来。意大利、澳大利亚等地以数据安全为由限制DeepSeek服务,OpenAI指控其“利用知识蒸馏复制西方成果”。对此,DeepSeek创始人梁文锋回应:“R1所有训练技术均已公开,创新成果属于全人类。”
李国杰则从更高维度提出思考:“开源生态将加速AI民主化,但需建立全球协同的治理框架。”他建议,中国应把握当前技术优势,主导制定AI伦理与安全标准。
这场院士与AI的对话,揭示了中国科技创新的深层逻辑:
正如《卫报》所言:“DeepSeek让世界看到,AI的未来未必由硅谷书写。”在这场变革中,中国正以独特的技术哲学,为全球AI发展提供新范式。而李国杰院士与DeepSeek的“过招”,将成为人机协同时代的经典序章。