英伟达推出OpenReasoning-Nemotron推理模型
创始人
2025-07-20 21:00:56
0

IT之家 7 月 20 日消息,英伟达今日推出了全新推理模型套件 OpenReasoning-Nemotron。该套件包含四个基于 Qwen-2.5 微调的模型,参数规模分别为 1.5B、7B、14B 和 32B,全部源自 6710 亿参数的 DeepSeek R1 0528 大模型。通过“蒸馏”这一过程,英伟达成功将这一超大规模模型压缩成更轻量的推理模型,降低了部署门槛,使得即使在标准游戏电脑上也能进行高级推理实验,避免了高昂的 GPU 与云计算成本。

据IT之家了解,英伟达此次模型的核心优势并非在于训练手段的复杂创新,而是依托强大的数据支撑。公司利用 NeMo Skills 生成了 500 万个涵盖数学、科学与编程的解答数据集,并通过纯监督学习方式对模型进行微调。经测试,32B 模型在 AIME24 数学竞赛中获得 89.2 分,在 HMMT 2 月赛中达到 73.8 分,甚至最小的 1.5B 模型也分别拿下 55.5 和 31.5 分,展现出良好的推理与解题能力。

英伟达将 OpenReasoning-Nemotron 定位为科研探索的有力工具,四个模型的完整检查点将在 Hugging Face 开放下载,便于研究人员基于此进行强化学习等进一步实验,或针对特定任务定制优化。同时,模型支持“GenSelect 模式”,即每个问题可生成多种解答版本,通过筛选最优解来提升准确率。在该模式下,32B 模型在多项数学与编程基准测试中已达到甚至超越 OpenAI o3-high 的表现。

值得一提的是,英伟达此次模型训练全程未引入强化学习,仅采用监督微调,为社区提供了干净且处于技术前沿的起点,便于未来开展强化学习相关研究。对于拥有高性能游戏 GPU 的玩家及个人开发者而言,这套模型让本地运行接近业界最先进水平的推理模型成为现实。

相关内容

热门资讯

格力取得消音装置及空调器专利,... 金融界2025年7月19日消息,国家知识产权局信息显示,珠海格力电器股份有限公司取得一项名为“一种消...
微扑克游戏辅助器!微扑克有保险... 微扑克游戏辅助器!微扑克有保险吗(辅助)原来真的有挂(有挂安装)是一款可以让一直输的玩家,快速成为一...
wpk透视辅助工具!wpk a... wpk透视辅助工具!wpk ai辅助(透视)原来真的有挂(有挂规律)1、每一步都需要思考,不同水平的...
wpk ai辅助!云扑克有没有... wpk ai辅助!云扑克有没有辅助挂(辅助)其实真的有挂(有挂助手)1、wpk ai辅助系统规律教程...
wepokeai机器人!pok... wepokeai机器人!pokerworld下载外挂(透明挂)原来真的有挂(有挂攻略);揭秘教程安装...
德扑之星作弊!德扑之星实战(透... 德扑之星作弊!德扑之星实战(透视)原来真的有挂(有挂方法);一、德扑之星作弊有挂的是的,亲,真的有的...
aapoker有挂!gg扑克有... aapoker有挂!gg扑克有假吗(辅助)其实真的有挂(有挂教程)1、aapoker有挂系统规律教程...
wpk俱乐部!wpk真的太假了... wpk俱乐部!wpk真的太假了(透视)其实真的有挂(有挂总结)1、起透看视 wpk俱乐部透明视辅助2...
wpk有辅助挂!wpk长期盈利... wpk有辅助挂!wpk长期盈利打法教学(辅助)原来真的有挂(有挂助手);科技详细教程小薇《48730...
1800架无人机爆炸,连炸基辅... 乌克兰不愿意与俄罗斯和谈,拒绝停止对俄罗斯打击,只会引发俄罗斯的猛烈报复。根据乌克兰媒体《基辅独立报...