消息称DeepSeek R2下月发:成本较GPT降97%
创始人
2025-04-30 00:01:31
0

4月29日消息,据国内媒体报道称,深度求索可能会在下个月有所行动,推出下一代AI大模型DeepSeek-R2。

报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。

此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控

据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。

DeepSeek-R2是一款基于华为昇腾910B(Ascend 910B)芯片集群训练的模型,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%。

据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。

相关内容

热门资讯

马斯克旗下公司起诉苹果和Ope... 美国企业家马斯克旗下的人工智能初创公司xAI和社交媒体平台X于25日起诉苹果公司和开放人工智能研究中...
【我为民企办实事】盘活低效用地... 齐鲁网·闪电新闻8月25日讯临沭县科翰硅源新材料项目,在驻企服务员帮助下,通过盘活低效用地,仅用8个...
【2025数博会看点前瞻】20... 8月26日,2025年中国国际大数据产业博览会媒体吹风会举行,记者从发布会上获悉,本届数博会精心策划...
小米汽车公布全景图像生成方法专... 【CNMO科技消息】8月26日,天眼查App信息显示,小米汽车科技有限公司联合小米科技(武汉)有限公...
蜀道不难了?看科技如何赋能蜀道... 封面新闻记者 张峥 实习生 陈丹 千年之前,李白慨叹“蜀道之难,难于上青天”,千年之后,蜀道奏响筑路...
中国科技馆举办科学之夜暨“全国... 8月23日,“天宫领航 筑梦星球”科学之夜活动在中国科技馆举办。作为2025年“全国科普月”预热活动...
深入薪资管理场景 浦发银行数智... 本报记者 金婉霞 当数字化浪潮席卷各行各业,企业经营管理正经历着从“线下人工”向“线上智能”的深刻变...
“乘大船、去深海、做大事”——... 一望无际的深黑色海面上,翻滚着墨绿色浪花。半空中,一团巨大的乌云正以肉眼可见的速度,气势汹汹压顶而来...
国务院印发《关于深入实施“人工... 国务院日前印发《关于深入实施“人工智能+”行动的意见》(以下简称《意见》)。 《意见》充分发挥我国数...
华为星河 AI 高算效数据中心... IT之家 8 月 25 日消息,在 2025 中国算力大会期间,智能计算创新发展论坛举办。华为数据通...