智谱AI CEO张鹏
出品|搜狐科技
作者|郑松毅
大模型价格战已经打响,科技厂商抢占市场份额的脚步越发急促起来。
6月5日,在智谱AI开放日活动上,GLM系列开源模型GLM-4-9B问世,具备更强大的推理性能、更长的上下文处理能力、及更强大的多模态能力。
同时,其通用能力提升达40%,超越Llama 3。Function Call函数调用能力提升40%,比肩GPT-4。
智谱AI CEO张鹏表示,“2024是AGI元年,大模型技术增长没有放缓的趋势,Scaling Law(尺度定律)并未失效,通过技术的不断迭代,已实现应用成本的降低。”
活动当日,智谱AI宣布新一轮降价,并制定企业权益服务体系享更高价格折扣,最高V3等级可享6折价格优惠。
优惠后,多模态模型GLM-4V价格由100元/百万Tokens降至30元/百万Tokens,GLM-3-Turbo价格由5元/百万Tokens降至0.6元/百万Tokens,GLM-4-Flash最高降价至0.06元/百万Tokens。
这意味着,最低仅用1毛钱可买近200万tokens,相当于两本《红楼梦》的文字量。GLM-4-Flash 将支持超过128K(千字符)的文本输入,并支持超过1M(百万字符)的文本输出,
在两周前的阿里云智领者峰会上,阿里云宣布,通义千问GPT-4级主力模型Qwen-Long,API输入价格从20元/百万Tokens降至0.5元/百万Tokens,直降97%。
相比之下,国内外厂商,如OpenAI的GPT-4、谷歌的Gemini1.5 Pro、Anthropic的Claude 3 Sonnet,以及百度文心4.0每百万tokens输入价格分别为220元、25元、22元及120元,均远高于GLM-4-Flash服务价格。
由此看来,虽然GLM-4-Flash在性能表现上与上述各家“看家”大模型有所差距,但从其使用价格和长文本处理能力来看,在收费大模型服务中,可以说它是目前最具性价比的存在。
张鹏表示,智谱AI切实是通过技术迭代和效率的提升,实现成本的持续降低,同时为客户带来升级的使用体验,并不是简单的价格战。
他强调,价格战不应以牺牲用户使用体验为代价,对于很多用户而言,关心的不只是使用大模型的价格,更重要的还是模型性能表现。
“不同版本的大模型服务持续推出是为了方便用户根据使用需求,选到计算效能和使用成本都能符合心理预期的模型。从当前服务矩阵来看,大模型服务的使用门槛在持续降低,也希望大模型服务能普惠更多用户。”
张鹏说,对AI而言,把对未来的想象力化为现实的生产力,才具有真正的革命意义。如何把强大的大模型能力真正用于帮助人们工作学习和生活,这其中还有很多工作要做。