阿里、百度、科大讯飞争相开打价格战,大模型跨入免费时代
创始人
2024-05-22 18:47:50
0

本报(chinatimes.net.cn)记者卢晓 北京报道

去年掀起的百模大战,如今才开始真刀真枪血拼。继字节后,又有大厂加入大模型价格战,而且出手更狠。

5月21日,阿里云宣布其9款商业化及开源系列模型降价。其中,通义千问主力模型Qwen-Long的API输入价格降至0.0005元/千tokens,降幅达97%。而百度当日则直接甩出了免费这张王炸。5月22日,讯飞星火也紧跟宣布其轻量级大模型Spark Lite的API永久免费开放。

如同过往的网约车、电商、O2O等行业,大模型行业的价格战,承载着厂商们对在B端市场快速获客、跑马圈地划分地盘的期待,但同时也伴随着高昂的资金成本和激烈的竞争。

价格战火热进行

自字节宣布大模型进入“厘时代”,一夜之间降价的风吹遍了大模型行业。后来者们的降价,看起来更凶猛。

记者从阿里云方面了解到,Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万tokens(token是大模型中可以理解和生成的最小意义单位)。在API输入价格下降至0.0005元/千tokens后,一元钱就可以买200万tokens。作为对比,按火山引擎公布的价格计算,一元钱可以买到豆包主力模型的125万tokens,大约是200万个汉字。

此外,阿里云不久前发布的通义千问旗舰款大模型Qwen-Max,API输入价格也降至0.04元/千tokens,降幅达67%。据阿里云方面介绍,这款大模型性能追平GPT-4-Turbo。

但价格战中,还有免费这个大招。

5月21日,百度宣布其文心大模型中ERNIE Speed和ERNIE Lite两个主力模型输入输出全面免费,立即生效。据记者了解,这两款大模型发布于今年 3 月,均支持8K 和128k 上下文长度。百度相关人士对记者确认,这两款模型也都面向企业市场。讯飞星火方面,除了宣布上述轻量级大模型免费外,记者了解到,其主力模型Spark Pro和Max 版本的API价格也降至0.21元/万tokens。

在大模型厂商纷纷降价背后,多位业内人士在跟记者交流时认为,推理成本过高一直是制约AI大模型应用落地的重要因素。

字节旗下火山引擎总裁谭待此前就在采访中表示,大模型toB服务主要是推理,分布式推理还有混合调度等技术可以解决推理算力的问题。阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在5月21日的发言中还认为,无论是开源模型还是商业化模型,公共云+API将成为企业使用大模型的主流方式,其中公共云的技术红利和规模效应能带来巨大的成本和性能优势。

刘伟光当天提及,即便是同样的开源模型,在公共云上的调用价格也远低于私有化部署。以使用Qwen-72B开源模型、每月1亿tokens用量为例,在阿里云百炼上直接调用API每月仅需600元,私有化部署的成本平均每月超1万元。

抢夺B端市场

价格战意在快速抢夺新市场。因此晚到的字节走出另一条“不谈参数谈价格”的路线并不令人奇怪。就在5月15日在宣布低价的同时,字节的豆包大模型才正式对外发布,并正式对外提供服务。

早已入场的大模型厂商,也并不甘于坐看新进入者分走市场。

刘伟光在5月21日的发言中就表示:“作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。”

腾讯对大模型的价格战态度淡然。腾讯云副总裁吴运声5月17日在接受《华夏时报》等媒体记者采访时表示,“我们会把各种精力放在产品、技术能力发展之上。”但从其公布的价格来看,它也比字节豆包大模型的价格更低。

《华夏时报》记者在腾讯云官网看到,混元大模型可以为首次使用者提供10万tokens的文本生成模型免费体验额度,有效期为1年。而其窗口尺寸为32K的hunyuan-standard模型输入价格也为0.0069元/千tokens。作为对比,同为32K的豆包通用模型pro在企业市场的定价为0.0008元/千tokens。

互联网分析师丁道师认为,大模型厂商开打价格战理所应当。他对《华夏时报》记者表示,整个云服务产业都在打价格战,抢夺用户、抢夺市场,如果各方大模型厂商技术实力没有代差的前提下,价格就成为选择它的重要因素。而按照摩尔定律的思路来看,随着科技行业发展,所有的高精技术都会越来越便宜,应用规模会越来越广泛。

深度科技研究院院长张孝荣也对《华夏时报》记者表示,目前大模型行业技术成熟度有限,厂商打价格战的目的更多的是为了扩大份额,提升知名度。除了技术成熟度外,他认为市场需求以及厂商的成本控制等因素也将影响价格战走向。

需要提及的是,这场大模型价格战并不仅限于大厂,创业公司也被卷入其中。记者了解到,同在今年5月,智谱AI就将入门级产品GLM-3 Turbo模型的调用价格从5元/百万tokens降至1元/百万tokens,即0.001元/千tokens。降幅高达80%。

对于血条充足的大厂,价格战尚可拼一个“熬”字,但对依靠融资的创业公司来说,却并不算是一个好消息。

相关内容

热门资讯

2025年大模型时代:类脑智能... 该报告围绕类脑智能在电力领域的应用展开,介绍了类脑计算的背景、发展、与大模型的融合,以及在电力行业的...
重大通报(好友德州)外挂透明挂... 重大通报(好友德州)外挂透明挂辅助ai机器人(透视挂)透视脚本(2021已更新)(哔哩哔哩);一、好...
八分钟了解!天天监利麻将原来真... 八分钟了解!天天监利麻将原来真的有挂(透视辅助)外挂透视辅助下载教程(有挂开挂)-哔哩哔哩是一款可以...
玩家必备科技(微扑克辅助)外挂... 玩家必备科技(微扑克辅助)外挂透明挂辅助工具(辅助器)透视技巧(2025已更新)(哔哩哔哩);亲真的...
一分钟了解!小鸟历险记原来是真... 一分钟了解!小鸟历险记原来是真的有挂的(辅助透视)外挂透视辅助安装攻略(有挂到底有挂)-哔哩哔哩;最...
推荐十款!鱼扑克app ai软... 推荐十款!鱼扑克app ai软件透明挂细节(辅助挂)微扑克安卓版本辅助透视作弊(有挂机制)-哔哩哔哩...
技术分享(Wepoke实测)其... 技术分享(Wepoke实测)其实是真的有挂的(辅助挂)外挂透明挂辅助下载规律(有挂脚本)是一款可以让...
实测分享!aa扑克辅助软件透明... 实测分享!aa扑克辅助软件透明挂教程(辅助挂)德州wpk辅助透视挂(有挂计算器)-哔哩哔哩;wpk辅...
热点推荐!wepoke代打外挂... 热点推荐!wepoke代打外挂透明挂辅助插件,太厉害了原来真的有挂的(有挂中牌率);1、不需要AI权...