“DeepSeek开源那天,我们小团队连夜下载了代码包。”90后创业人小林用DeepSeek批量处理短视频脚本,工作室每天产出了200条原创内容。而王燕(化名)则每天习惯性地打开DeepSeek对话框,输入自己和男友相处时的小问题,看到光标在输入栏规律闪烁,感觉“它真的懂我在说什么……”
2025年1月,DeepSeek在人工智能领域掀起一场风暴,给世界带来巨大的影响。这般一石激起千层浪的效应,是否被开发者梁文锋所预料,人们不得而知。和他低调隐身在喧嚣之外形成鲜明对比,这场技术爆炸带来的平民化“破圈”风暴余波未消,不断外延的涟漪涤荡着公众认知,也让圈内外共同审视风暴狂飙后的沉淀。
毋庸置疑,DeepSeek的故事已经成为AI进化史上不可忽视的重要注脚。
风起 · 从“算力焦虑”到“算法革命”
从科技博主到普通网友,从外滩的游客到虹桥枢纽的春运旅客,人们津津乐道的不仅是AI生成的“锐评段子”,还有背后那个“拒绝资本”“少年天才创业”的励志故事。这场始于技术圈、盛于春节档的“风暴”,不仅让DeepSeek成为国民级话题,更掀开了中国AI产业换道超车的一角帷幕。
“关键在于架构创新。”果壳产品研发总监陈岩评价道。DeepSeek的V3模型采用MOE(混合专家系统)架构,将600亿参数拆分为多个“专家模块”,每次推理仅激活少量模块,极大降低了算力消耗。而R1模型则通过强化学习技术,将大模型知识“蒸馏”至小模型,既保证了性能,又压缩了成本。
这种“算力不足,算法来补”的思路,被复旦大学复杂体系多尺度研究院院长、上海人工智能实验室领军科学家、国际著名计算生物学家马剑鹏教授称为“中国AI的换道超车”。“这意味着,未来构建先进的AI模型,不再需要耗费大量5纳米以下的芯片。AI发展创建了一个低成本的模式。”作为一名“AI+生物”的科学家,马剑鹏一直强调,在计算生物学AI前沿赛道上,中国不能输,重点在算法上要另辟蹊径。“这其实和DeepSeek研究团队思路不谋而合,他们创新了独特的算法,获得了成功。致力于发展复杂系统的人工智能计算方法,是中国人在AI世界赶超的重要手段,我们不能总是跟着别人的赛道走,不能弯道超车,而要换道超车。”
更具颠覆性的是,DeepSeek突破了英伟达CUDA生态的依赖。团队自研算法绕开传统GPU调度逻辑,甚至能在华为昇腾、AMD等非主流芯片上高效运行。一位工程师比喻:“就像用自行车链条驱动汽车,却跑出了赛车的速度。”这种“去英伟达化”尝试,直接导致美股芯片板块震荡,英伟达股价一度暴跌20%。
2024世界人工智能大会上,人形机器人吸引眼球 新民晚报记者 陶磊 摄
云涌 · 人工智能“卷”进市井烟火
2024年12月,V3模型因在GitHub开源社区表现亮眼,引发海外开发者热议;1月初,科技博主用其生成“锐评春晚”“吐槽春运”的段子,在小红书、微博疯狂传播;春节前夕,R1模型上线,“AI思考过程可视化”功能让普通用户直呼“像在和真人聊天”。自媒体津津乐道:DeepSeek是如何“突破技术封锁”,“只花了600万美金训练”。陈岩说,三次技术迭代与传播节点的精准卡位,或许也是DeepSeek完成了从极客圈到大众层的“三级跳”成功的关键。
除了传播学的丝滑外,更令人兴奋的,还是DeepSeek在行业内带来的震荡。上海人工智能研究院技术创新中心主任林圆圆介绍:“DeepSeek正在推动AI普惠化,通过技术创新、开源策略和低成本高效率模型,大大降低了AI使用门槛,促进中小企业参与行业多元化发展,加速AI应用普及。”林圆圆说,DeepSeek-R1上线后不久,就有客户联系她,想要探索用新模型来实现垂直领域的智能问答应用。“此外,DeepSeek的出圈,也正在引发全球AI技术生态变革,并带动硬件和端侧应用发展,未来在消费电子、工业、车载等领域的渗透将进一步深化,形成‘端-边-云’协同的AI体系。
教育领域的变革同样令人期待。一位中学语文教师试用DeepSeek后感叹:“它不再只是生成教案,而是能引导学生追问‘为什么鲁迅用枣树象征孤独’。”这种启发式互动,让AI从“工具”升级为“学伴”。而在医疗领域,DeepSeek支持的“个性化健康管家”已进入临床测试阶段,未来或能通过基因数据分析,为每个人定制营养方案。
“与以往AI大模型特别不同之处在于,DeepSeek模型算法更鼓励AI程序进行‘开放式思维’,也就是RL强化学习训练法。训练没有标准答案,让AI有了自己的‘思维链’,不断尝试给人答复。当你每次根据它的答复给出反馈,鼓励它做对了或告诉它做错了,慢慢地,它就会总结出一个规律。”长期从事计算机行业的汪先生说,DeepSeek爆火,有技术的胜利,还有人文的共鸣。“大家都说跟DeepSeek对话感觉它在说人话。‘人味’的优点来源或许是因为其研发团队的年轻化使得他们更重视模型训练过程中的人文要素,让模型的对话更加符合年轻群体的对话习惯。”
技术不再高冷,DeepSeek有了人情味,也有了烟火气。如今,连63岁的上海陈阿姨都学会了用DeepSeek解决“今天吃什么”的问题,还能用AI检查孙女的寒假作业,只需要简单地拍照上传即可。“这波浪潮让技术不再是圈内自赏,而是席卷了每个普通人的生活。”陈岩说。
雨骤 · 如何从“玩具”变成“工具”?
当大自然里的风暴进入最猛烈的阶段时,通常伴有狂风呼啸,暴雨倾盆,整个世界仿佛都被风暴的力量所掌控。而DeepSeek的出现“搅动”了世界,也经受着来自外部的巨大压力和挑战。
1月23日,DeepSeek的服务器集群遭受了每秒超2.3亿次的DDoS攻击。打个比方,这就相当于全中国4.5亿台智能手机同时按下刷新键,攻击流量是双十一峰值流量的217倍,总量甚至达到整个欧洲三天网络流量的总和。如此强大的攻击,瞬间给DeepSeek的服务器带来了巨大的压力。这样的攻击,随后还在不断升级,从最初容易被清洗的放大攻击,逐渐演变为HTTP代理攻击,最后甚至出现了以僵尸网络为主的复杂攻击。每一次攻击模式的变化,都像是敌人变换了更锋利的武器,让DeepSeek的防御团队面临着前所未有的挑战,考验着它的应对能力。
“开源是把双刃剑。”“技术被海外复制怎么办?”物理的“攻击”之外,更多是关于技术的冷思考。对DeepSeek“开源”,梁文锋的前同事、艾麒信息创始人和董事长周朝恩表示,一点也不意外。“梁文锋尽管看着不善言辞,但在技术交流中,往往观点清晰,逻辑思维强大。他对产品和技术有着极高的追求,是典型的技术男风格。也因此,他不仅在技术上追求卓越,还富有情怀。”创业后,梁文锋就曾开放了万卡免费提供给各大学用于科研,还曾向慈善机构捐赠1.38亿元用于支持教育等公益项目。
陈岩也分析说,DeepSeek开源,一方面是出于技术理想,希望推动技术更快发展,让更多人参与到技术发展中,集合众人的智慧和力量,加速技术的创新和进步;另一方面或许有其商业考量。面对忧虑,陈岩认为,不必过于焦虑:“Linux系统证明,开源生态反而能增强话语权。”
当下,DeepSeek仍有诸多不容忽视的挑战。目前,DeepSeek的多模态能力较弱,图像、视频处理尚依赖其他模型,而Meta的Llama、谷歌的Gemini也正加速生态布局,成为其强劲的对手。“它能写诗,但看不懂画。”在陈岩看来,DeepSeek的落地仍存在鸿沟。数据显示,约60%尝鲜用户仅将其用于娱乐,真正嵌入工作流的不足15%。有团队测试发现,DeepSeek对包含图文混排的电商详情页解析错误率达43%,而谷歌Gemini仅为12%。更棘手的是,DeepSeek视频处理目前依赖于第三方模型,导致医疗影像分析等场景成本翻倍。“就像造了辆跑车,轮胎却要问别家借。”
如何从“玩具”变“工具”,是DeepSeek必须跨越的门槛。
涟漪 · 激活青年创新的勇气和热情
与美国以OpenAI为首的“模型闭源+高算力”的巨头模式不同,中国AI公司正探索独特路径。DeepSeek母公司“幻方”背靠量化投资资金与技术积累,走“模型开源+低成本”路线;阿里、腾讯、百度等则通过云平台集成模型,降低中小企业使用门槛,赋能垂直应用。“我们不需要完全复制硅谷,而是要解决产业中的真问题。”林圆圆说。
DeepSeek或许正成为草根创业者、普通用户“技术平权”的突破点。“创新者首先要有勇气和热情,相信自己能够赢。其次,创新过程中,要有不怕输的精神,同时不计功利得失。DeepSeek团队的年轻人们经历了一次次尝试,而每一次尝试探索之前他们并没有考虑会有多少得失、回报。这才是真正的科学态度。最后,任何一项科学实验都要有那么一点运气,但运气也是实力的一部分。偶然中蕴含着必然,这是事物发展的客观规律。最终,DeepSeek找到了算法。”马剑鹏说,其实,今年诺贝尔奖的两位谷歌公司得主,当年也是走了同样一条道路,创造出AlphaFold,使人工智能发展走上快车道。
不少人担忧,AI的进步,正给人类的生存带来危机。马剑鹏给公众的忠告意味深长:“别只顾找‘锤子’,先看清‘钉子’在哪里。”当AI能自动整理知识库、分析健康数据时,人类的核心竞争力正转向“提出正确问题的能力”。这场变革中,最大的赢家或许是那些既懂技术逻辑,又深谙人性需求的“跨界者”。陈岩同样认为,与其惧怕,不如拥抱。“AI时代,建立个人知识库变得尤为重要。以我自身经历为例,过去,我只是简单地将好的内容资料收藏在微信收藏夹里,利用率很低。而现在,知识工作者可以借助AI强大的检索和归纳能力管理这些信息,十倍百倍千倍地扩大自己的记忆和知识储备。”
DeepSeek风暴引发的涟漪远未消散。它证明中国团队能用算法突破算力桎梏,但也显露了应用落地与生态建设的短板。“成本大幅降低是AI发展的重大利好。”马剑鹏预测,DeepSeek的成功,是站在前人的基础上,也许很快,美国硅谷的创新者们在此基础上,又创造出更优化的大模型,而后,中国或其他国家再开发出进一步完善的AI结构。“后浪推前浪,是人类科技不断向前的趋势。依靠90后、00后的活力,民营企业的灵活机制,中国AI前景未来值得期待。”
新民晚报原创稿件
记者:马丹 张炯强 马亚宁
编辑:施雨
编审:魏丽英