智谱AI再卷价格战：最低1毛线可买近200万tokens，相当于两本《红楼梦》文字量_科技资讯

创始人

2024-06-05 17:25:10

0次

智谱AI CEO张鹏

出品｜搜狐科技

作者｜郑松毅

大模型价格战已经打响，科技厂商抢占市场份额的脚步越发急促起来。

6月5日，在智谱AI开放日活动上，GLM系列开源模型GLM-4-9B问世，具备更强大的推理性能、更长的上下文处理能力、及更强大的多模态能力。

同时，其通用能力提升达40%，超越Llama 3。Function Call函数调用能力提升40%，比肩GPT-4。

智谱AI CEO张鹏表示，“2024是AGI元年，大模型技术增长没有放缓的趋势，Scaling Law（尺度定律）并未失效，通过技术的不断迭代，已实现应用成本的降低。”

活动当日，智谱AI宣布新一轮降价，并制定企业权益服务体系享更高价格折扣，最高V3等级可享6折价格优惠。

优惠后，多模态模型GLM-4V价格由100元/百万Tokens降至30元/百万Tokens，GLM-3-Turbo价格由5元/百万Tokens降至0.6元/百万Tokens，GLM-4-Flash最高降价至0.06元/百万Tokens。

这意味着，最低仅用1毛钱可买近200万tokens，相当于两本《红楼梦》的文字量。GLM-4-Flash 将支持超过128K（千字符）的文本输入，并支持超过1M（百万字符）的文本输出，

在两周前的阿里云智领者峰会上，阿里云宣布，通义千问GPT-4级主力模型Qwen-Long，API输入价格从20元/百万Tokens降至0.5元/百万Tokens，直降97%。

相比之下，国内外厂商，如OpenAI的GPT-4、谷歌的Gemini1.5 Pro、Anthropic的Claude 3 Sonnet，以及百度文心4.0每百万tokens输入价格分别为220元、25元、22元及120元，均远高于GLM-4-Flash服务价格。

由此看来，虽然GLM-4-Flash在性能表现上与上述各家“看家”大模型有所差距，但从其使用价格和长文本处理能力来看，在收费大模型服务中，可以说它是目前最具性价比的存在。

张鹏表示，智谱AI切实是通过技术迭代和效率的提升，实现成本的持续降低，同时为客户带来升级的使用体验，并不是简单的价格战。

他强调，价格战不应以牺牲用户使用体验为代价，对于很多用户而言，关心的不只是使用大模型的价格，更重要的还是模型性能表现。

“不同版本的大模型服务持续推出是为了方便用户根据使用需求，选到计算效能和使用成本都能符合心理预期的模型。从当前服务矩阵来看，大模型服务的使用门槛在持续降低，也希望大模型服务能普惠更多用户。”

张鹏说，对AI而言，把对未来的想象力化为现实的生产力，才具有真正的革命意义。如何把强大的大模型能力真正用于帮助人们工作学习和生活，这其中还有很多工作要做。