这个春节,DeepSeek(深度求索)火了。
火到什么程度?大街小巷,从科技爱好者到普通民众,都在谈论DeepSeek。社交媒体上,网友纷纷晒出与DeepSeek的互动对话,从点评学校到锐评手机厂商的优缺点,万物皆可“DeepSeek”。超60%的用户用它制定旅行攻略、翻译外语、学习方言,约40%的用户用它学习麻将规则,为春节增添了不少乐趣……在资本市场,券商们也在为DeepSeek“加班加点”,举办超60场路演,甚至除夕夜也未停歇。凭借高性价比和开源创新,DeepSeek部分指标超越ChatGPT等国际巨头,被海外称为“来自东方的神秘力量”。
十年寒窗无人问,一举成名天下闻。亦如DeepSeek的成名之路,它的创始人梁文峰也在这个春节成为“最火的咖”“最靓的仔”——获总理邀请参加座谈会,登上《新闻联播》;家乡父老拉横幅、立拱门欢迎他回乡……热闹喧嚣背后,让我们走进梁文峰的成长史。
2019年,梁文锋在金牛奖颁奖仪式上
1985年,梁文峰出生于广东湛江吴川的一个普通农村家庭。他的父母都是小学教师,家境并不富裕。然而,梁文峰从小就展现出对数学和科技的浓厚兴趣,在奥数竞赛中屡获佳绩,成为众人眼中的“天才少年”。2002年,他以吴川市第一中学高考状元的身份,考入浙江大学电子信息工程专业人工智能方向。大学期间,他不仅对计算机科学和数学保持着浓厚兴趣,常常泡在实验室研究机器视觉,还自费购买零件组装设备,不断提升自己的实践能力。本科毕业后,梁文峰选择继续深造,于2007年在浙江大学攻读信息与通信工程硕士学位,他的毕业论文聚焦于低成本摄像机的算法优化。此时的他已经坚信人工智能将是未来的发展方向,在学术研究的道路上不断深耕。
2008年,全球金融危机爆发,金融市场动荡不安,但梁文峰却独具慧眼,敏锐地捕捉到了机器学习技术在量化交易中的巨大潜力。他和团队开始积累市场行情数据、金融市场相关数据及宏观经济数据,探索使用机器学习技术进行全自动量化交易。这段经历不仅为他日后的职业生涯奠定了坚实的基础,也让他对金融市场和人工智能技术的结合有了更深刻的理解。
2013年,硕士毕业后的梁文峰即开启了创业之旅。他与同学先是创立了杭州雅克比投资管理有限公司,正式投身量化投资领域。2015年,他们又创办了幻方量化(后更名为浙江九章资产管理有限公司),并开始在量化投资领域崭露头角。
幻方量化凭借数字和人工智能技术,迅速在量化投资领域取得了显著成绩。2016年,公司推出第一个AI模型,实现了所有量化策略的AI化转型。通过分析海量数据,幻方量化在动荡的市场中逆势扩张,管理资金规模逐步扩大。到2018年,幻方量化正式确立了AI为核心的发展战略,进一步深化AI技术在量化投资中的应用。到2019年,幻方量化管理的资金规模突破百亿元,成为中国最大的量化基金之一。
当多数人尚未意识到算力的重要性时,梁文峰便展现出了他的前瞻性眼光。他斥资2亿元创办幻方AI公司,研发“萤火一号”训练平台,搭载1100块GPU显卡,于2020年投入使用,显著提升算力水平。2021年,他又投入10亿元建设“萤火二号”,配备万张英伟达A100显卡,进一步巩固领先地位。凭借强大技术实力与创新精神,幻方迅速成长为国内领先的量化私募基金,管理规模突破千亿,跻身亚洲最大量化基金之一,成为国内量化私募“四大天王”之一。
然而,梁文峰的雄心远不止于此。在量化投资领域取得巨大成功后,他将目光投向了更具挑战性的通用人工智能(AGI)领域。2023年5月,梁文峰宣布进军AGI,同年7月创办了杭州深度求索人工智能基础技术研究有限公司(DeepSeek),正式开启了他在AI大模型研发领域的新篇章。
与其他致力于快速商业化的中国AI公司不同,DeepSeek专注于“不走寻常路”。他们的目标不是复刻ChatGPT,而是研究和揭秘AGI的更多未知信息。DeepSeek的故事也就开始于这一刻。
DeepSeek成立后,梁文峰带领团队攻坚克难,不断取得技术突破。2024年5月,DeepSeek发布混合专家语言模型DeepSeek-V2,以高性价比和创新架构引发行业关注。同年末,DeepSeek-V3问世,该模型采用创新的MLA架构(多头潜在注意力机制)与MoE稀疏结构,仅用2000块H800芯片、557万美元成本完成训练,性能却比肩GPT-4o,其长文本处理能力扩展至128k上下文,推理速度提升至每秒60个token。2025年年初,DeepSeek发布的R1模型,更是在数学、代码、推理等方面比肩OpenAI的顶尖模型,且开源权重,降低了AI技术的门槛,其免费聊天机器人应用在美国和其他国家的iOS应用商店下载量飙升,甚至超越ChatGPT,登上免费应用榜单第一位。
一个80后程序员在搅动中国量化市场完成资金积累后,似乎带领他的团队又回到了原本钟情的AI起点,但产生的能量正在全球掀起骇浪。深究原因,除了创新第一性原则、革命性架构、致力于开源等明晰的路线之外,独特的公司文化和人才战略也为其提供了独特的沃土——DeepSeek始终保持着一个完全自下而上的组织结构,优先看创造热情而不是证书。他们的突破性创新来自年轻的本土人才——中国本土的应届毕业生和年轻技术人才,而非海外招聘。
值得一提的是,梁文峰创立的公司一直热衷于公益事业,官网披露公司员工“一只平凡的小猪”个人捐助1.38亿元,在全国范围内帮助弱势群体。这位神秘的“小猪”,有爆料称正是梁文峰本人。