如何看待林俊旸和他所带领开发的 Qwen 系列模型对行业的贡献?
创始人
2026-03-06 07:41:15
0

早上好,我是平凡。

这几天闹的最沸沸扬扬的就是阿里Qwen之前掌舵人林俊旸的突然离职,我这里不讨论这件事。

而是跟大家说下为什么大家会对这件事的反应这么大。

这么说吧,中国是现在为数不多还在涌现开源模型的国家之一,开源模型数量多且质量高。阿里的Qwen系列,DeepSeek,Kimi,智谱的GLM,MiniMax,Stepfun,甚至可以毫无疑问的说中国就是现在开源世界的大半边江山。

大家各有特色,且都在国际上有一票铁杆粉丝。

01

Qwen系列的核心特点:广泛适配的基础模型

Qwen系列最大的特点,就是它是很多模型的基础模型。比如我们在Huggingface上设置两个条件:

  1. 模型大小在(0,12]B之间

  2. 排序按照Trending(趋势)

前面的几个全都是Qwen系列,当然了,这些都是所谓“小”模型,属于不需要非常大的算力也可以跑的模型,跟动不动需要几十上百块GPU的集群需求模型区别很大。

然后我们再看trending里面的其他模型,比如这个LocoreMind,看名字没见过,大概率属于“名不见经传”的野模型,模型也比较小,才4B。

但你别小看这种小的模型,需要的计算资源虽然不需要特别多,但是数据资源这个一般人搞不来的,这玩意是真的体力活,需要大公司雇人来搞。你再看师承,base model:Qwen3-4B-Instruct-2507,Teacher Model: Qwen3-Coder-Next。一切很清楚了,这个模型是在Qwen3的4B模型的基础上,用了更大的Qwen3-Coder-Next蒸馏出来的模型做的fine-tune。

我非常的怀疑这个fine-tune模型大概率不如原来的模型。因为大公司有更多的资源反复的训练一款模型让它达到最优解,而小的公司甚至实验室基本没多少次试错机会。但是,就这么一搞,一个公司或者一个实验室就有自己的大模型,再说了Qwen也有Qwen3.5-397B-A17B这种千亿参数的大模型。

这种例子在Fine-tune的模型中数不胜数,非常之多。

可以说,从个人到小型团体到乃至于一个中小型国家,都可以在Qwen里面找到合适自己的基础模型。这个非常重要。

02

Qwen对行业的价值

因为你想想,如果没有这些开源模型默默贡献,这个世界上的人就只能用OpenAI,Anthropic,Google他们的模型。

倒也不是他们的模型不好,但是一旦一件事情被垄断以后,第一是创新速度下降(OpenAI不是被DeepSeek逼了一把,他们都不知道自己可以出模型出的这么快),第二个用户地位会降低,因为你没有被选项,那么唯一项就会作威作福。

以上,这就是Qwen乃至整个开源世界的贡献。

相关内容

热门资讯

课程开挂"常州茶苑辅... 课程开挂"常州茶苑辅助器下载"开挂(下载)辅助平台(有挂透视);无需打开直接搜索打开薇:136704...
教会开挂!hhpoker到底可... 教会开挂!hhpoker到底可以辅助码,火神大厅辅助器,开挂(透视)辅助平台(竟然有挂)>>您好:软...
阶段开挂"三哥玩摆头... 阶段开挂"三哥玩摆头挂"开挂(脚本)辅助脚本(有挂功能);无需打开直接搜索薇:136704302 咨...
第5分钟开挂"欢乐情... 第5分钟开挂"欢乐情怀怎么开挂"本然有透视开挂辅助器(有挂头条);无需打开直接搜索加薇1367043...
实测开挂!pokerworld... 实测开挂!pokerworld辅助器,多乐游戏小程序辅助器免费,开挂(透视)辅助脚本(有挂方式)【无...
妙招开挂"钱柜手游辅... 妙招开挂"钱柜手游辅助"开挂(透视)辅助安装(有挂秘笈)您好:钱柜手游辅助这款游戏可以开挂,确实是有...
3分钟辅助"福建天天... 3分钟辅助"福建天天开心辅助真实性"本然有开挂辅助透视下载(的确有挂)1、下载安装好福建天天开心辅助...
台积电卖出价值3500万美元“... 11月27日消息,台积电公告,子公司Emerging Fund, L.P.公告处分Astera La...
宣泰医药:股东栖和创业拟减持不... 11月27日消息,宣泰医药公告称,公司持股5%以上股东南京市栖和创业投资合伙企业(有限合伙)(简称“...
美国10月耐用品订单初值环比增... 11月27日消息,美国10月耐用品订单初值环比增长0.2%,预估为增长0.5%。