阿里巴巴集团正在中国开源AI领域取得领先地位,其Qwen模型在多个基准测试中已经超越了Meta的Llama模型。
从内部分歧到全面采用,市场影响力不断扩大
阿里巴巴的成功并非一蹴而就。
根据The Information的报道,最初,其内部业务部门对自家研发的Qwen模型并不完全信服,部分团队甚至在2024年仍继续使用Meta的Llama等其他公司的人工智能模型 。一些阿里巴巴的应用程序也曾选择使用DeepSeek的R1模型来支持其AI功能。
然而,情况在之后发生了显著变化。阿里巴巴不仅实现了内部业务部门对Qwen模型的全面转换 ,还在外部市场赢得了广泛认可,成为中国最大的开源人工智能模型提供商 。
一些企业用户表示他们甚至更青睐阿里巴巴,因为其提供了更广泛的模型阵容,包括运行成本更低的小型模型。
根据公司公布的数据,截至今年1月,已有超过29万客户在汽车、医疗、教育和农业等各个行业使用Qwen模型。一些AI应用初创公司在构建软件时,现在选择阿里巴巴开发的模型而非Llama。
与此同时,阿里云正在努力提升Qwen模型的全球影响力。在日本,东京的AI开发商Abeja已经使用Qwen开发了多个专门针对日语设计的大语言模型。
中国开源AI的崛起,阿里巴巴正在引领中国大模型发展
The Information分析认为,Qwen和DeepSeek的成功表明中国企业正在开源AI领域开始领先美国,这是国际AI竞赛的一个重要战线。
新加坡Aiquris公司联合创始人兼首席技术官Martin Saerbeck在接受采访时表示:"专注于开源AI模型可能使中国公司产生全球影响力。流行的开源模型可以利用全球开发者和研究人员的集体知识。"
英伟达CEO黄仁勋在最近的财报电话会议上也表示,DeepSeek和阿里巴巴的Qwen是"最好的开源AI模型之一"。值得注意的是,英伟达的人工智能研究团队在开发其用于机器人和自动驾驶汽车的Cosmos-Reason1模型时,甚至使用了一个阿里巴巴的开源模型作为基础 。
The Information深入分析了阿里巴巴如何在开源AI领域取得领先地位。报道指出,这对亚马逊、微软和谷歌等美国科技巨头来说是一个教训,因为这些公司的运营方式比阿里巴巴更加集中化。
阿里巴巴在开源AI领域的领先,部分得益于其独特的组织架构。公司允许不同业务部门自主运营的决策,虽然最初是为了应对公司分拆计划(该计划最终未能实现),但却意外地促使AI工程师更加努力地提升模型吸引力。工程师们意识到,如果无法说服内部业务部门使用Qwen模型,那么也无法赢得外部客户的信任 。
The Information报道称,DeepSeek的成功给Qwen团队带来了巨大压力。据两位知情人士透露,就连六年前就已卸任执行和董事职务的阿里巴巴创始人马云,也频繁向阿里云CTO周靖人询问Qwen3开发进展的最新情况。
在Qwen3发布前的最后一周,团队成员轮流在办公桌下的床垫上休息。
今年4月底,阿里巴巴终于发布了Qwen3,这是一套包含八个不同规模和规格模型的套件,且全部为开源模型。阿里巴巴CEO吴泳铭在财报电话会议上表示,公司坚定致力于开源AI。
Qwen3的多个版本在LiveBench和Artificial Analysis等AI模型排行榜上超越了Meta最新的Llama 4模型。虽然DeepSeek上周发布了R1的更新版本再次超越Qwen3,但阿里巴巴自己的AI产品已经从DeepSeek转向使用Qwen。
尽管阿里巴巴的业务部门继续独立运营,但Qwen日益增长的重要性正在帮助它们走得更近。来自各个业务部门的许多团队现在正在与阿里云讨论开发由Qwen3驱动的更强大AI Agent的计划。
阿里巴巴的经验表明,中国公司有潜力通过专注于开源AI模型来产生全球影响,并可能重塑全球AI软件生态系统。同时,中国本土的开源模型也将加速AI在中国的普及和应用。正如阿里巴巴首席执行官吴泳铭所言,公司坚信Qwen3的全面开源将推动开发者、初创企业和各类企业的创新与新应用开发。