作者 | 常棣
编辑 | 葛覃
在所有关于DeepSeek的信息洪流中,有海外的和国内的、竞争对手和中立第三方的、搞算法的和搞算力的,等等角度,但却独缺少了一个关键维度——DeepSeek自己的发言。
是的,DeepSeek彷佛进入了缄默状态。除了最新一则,澄清官方账号与虚假信息的公告。
无论外界有多喧嚣,DeepSeek就像一潭静水,自DeepSeek在全球范围内取得现象级热度之后,梁文锋或者其他DeepSeek发言人没有做过任何官方表态。
但DeepSeek很难完全脱离外力造就的环境。这家仅成立两年的初创企业,以“低成本、高性能”的标签颠覆了全球AI行业认知,却也不得不面对外界的过度神话、技术争议与政治裹挟。
DeepSeek的崛起早有迹象,比如率先打起的“大模型价格战”,比互联网巨头和大模型创业厂商还早,还有更早有人发现幻方量化(DeepSeek的母公司)是国内罕见的拥有上万张高端GPU卡的厂商之一。
只是大部分人只将DeepSeek视为一家普通公司,并不十分看好,这也与DeepSeek本身的低调策略有关,有心者在细数“大模型六小虎”时,智谱AI、MiniMax、月之暗面、百川智能、零一万物和阶跃星辰都放入其中,却没有统计上DeepSeek。
当DeepSeek开源模型DeepSeek-V3和推理模型R1正式发布,V3仅以557.6万美元的训练成本实现了接近Claude-3.5-Sonnet-1022的性能,在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。
而R1在数学、代码等任务上对齐OpenAI的o1模型,甚至探索了纯强化学习路径的可能性。
某种程度上,OpenAI的“傲慢”成就了DeepSeek,o1模型选择不开源的路线,收费较高,并且将深度思考的过程隐藏起来,这使得 o1 无法在全球范围内普及。
OpenAI的做法可以理解,前期免费获取用户,后期收费获得收入,只是大模型的投入确实太高昂,OpenAI还没有形成稳固的技术代差,就迫于压力加速商业化,不料被DeepSeek“偷了家”。
这一成就被硅谷视为“东方神秘力量”,Meta员工更在匿名社区直言其低成本训练模式“让超高预算团队难以自洽”,其实也正是海外对DeepSeek的关注,才让其火爆起来。
然而,光环总是不缺少争议。OpenAI创始人Altman一边称赞DeepSeek,一边启动对其数据蒸馏是否违反服务条款的调查。
Anthropic CEO则公开呼吁美国政府加强芯片管制,直指中国AI威胁。尽管微软迅速将R1接入Azure和GitHub,但技术合法性的质疑始终如影随形。
让技术的归于技术,让政治的归于政治,这可能是当下AI行业最难以实现的事。
DeepSeek的开源策略本意是推动技术普惠,却意外成为地缘政治博弈的焦点。德国《经济周刊》以“DeepSeek表明,太多金钱会导致懒惰、失去创新能力”为题刊发评论指出,中国如今的成就很大程度上来自美国的制裁。
该评论指出,这家初创企业的成就证明了一点,资源稀缺能激发创造力。小团队往往更加灵活高效,因为他们不得不专注于最重要的事项。技术资源有限迫使他们寻找务实的而非显而易见的方案。此外,资金有限意味着围绕金钱分配的斗争减少。
还有欧洲媒体称其“打破了美国AI垄断”,瑞士《新苏黎世报》更评价其开源模式为欧洲提供了“对抗美国闭源霸权”的机会。而美国《南德意志报》则警告,DeepSeek的崛起可能动摇美国在AI领域的超级大国地位。
这种“技术民族主义”叙事让DeepSeek背负了本不属于一家初创企业的重担。中国社交媒体上,“干翻美帝”的狂热呼声,将DeepSeek推至中美对抗的象征性高度。
创始人梁文峰曾明确表示,公司的目标仅是“成为技术贡献者,而非搭便车者”。
DeepSeek的开源模式本是其核心竞争力:免费使用、代码透明、支持本地化部署,既降低了企业试错风险,又为研究者提供了创新基础。
但这一策略也激化了与闭源巨头的矛盾。Meta首席科学家杨立昆虽肯定开源价值,却暗示DeepSeek的成功“依赖前人成果”,试图淡化其独创性。
更深层的冲突在于生态壁垒。尽管DeepSeek通过PTX汇编语言,相当于用CUDA更底层的语言重写代码,但并没有完全绕过CUDA生态依赖。DeepSeek对于国产AI生态也是不小的利好,较小的算力需求意味着国产芯片也可支持训练和推理,例如华为昇腾、海光DCU等。
美国对英伟达高端芯片的出口管制仍是悬顶之剑。技术自主的代价,是必须用“创造力弥补算力劣势”。
《黑神话:悟空》,中国当前唯一一款纯国产的3A游戏大作,打破了长期以来欧美国家3A游戏的“垄断”和“神话”,IGN中国直接给到了10分的满分评价。
其开发商游戏科学的创始人冯骥,直言DeepSeek可能是一个具有国运级别科技意义的成果。公众对DeepSeek的期待已远超技术范畴,甚至认为其可单挑美股万亿美元市值波动。
事实是——DeepSeek-V3虽为当前最佳开源模型,但与头部闭源模型仍有差距;OpenAI的o3模型仅用三个月便迭代超越o1,更凸显了竞争压力。DeepSeek至今未有表态,可能是最正确的做法。
结合行业来看,更现实的挑战在于商业化。DeepSeek的C端应用虽因“深度思考”功能爆红,但大模型如何形成正向的商业模式,而不是靠烧钱,还有待检验。DeepSeek如何平衡技术理想、用户体验以及商业收入,是其下一阶段的关键命题。
DeepSeek的故事,折射出中国科技创新的典型悖论,技术突破总被赋予民族叙事,企业却需在政治、商业与技术的夹缝中求生。DeepSeek的价值在于证明“高效组织与开源创新可挑战巨头”,但其无需被架上神坛。
若外界能减少盲目狂热,回归技术理性;若市场能提供更开放的创新环境,而非胡乱介入,DeepSeek或能真正轻装上阵,探索属于AI的下一站未来。
毕竟,当AI开始“教会人类思考”时,我们更应思考如何为AI创新者减负,而非加压。DeepSeek不需要一个神话,只需要砥砺前行。