英伟达推出 OpenReasoning-Nemotron 推理模型，普通游戏电脑也能玩转高级推理

2025-07-21 09:17:03雷霆软件园

本站 7 月 20 日消息，英伟达今日推出了全新推理模型套件 OpenReasoning-Nemotron。该套件包含四个基于 Qwen-2.5 微调的模型，参数规模分别为 1.5B、7B、14B 和 32B，全部源自 6710 亿参数的 DeepSeek R1 0528 大模型。通过“蒸馏”这一过程，英伟达成功将这一超大规模模型压缩成更轻量的推理模型，降低了部署门槛，使得即使在标准游戏电脑上也能进行高级推理实验，避免了高昂的 GPU 与云计算成本。

据本站了解，英伟达此次模型的核心优势并非在于训练手段的复杂创新，而是依托强大的数据支撑。公司利用 NeMo Skills 生成了 500 万个涵盖数学、科学与编程的解答数据集，并通过纯监督学习方式对模型进行微调。经测试，32B 模型在 AIME24 数学竞赛中获得 89.2 分，在 HMMT 2 月赛中达到 73.8 分，甚至最小的 1.5B 模型也分别拿下 55.5 和 31.5 分，展现出良好的推理与解题能力。

英伟达将 OpenReasoning-Nemotron 定位为科研探索的有力工具，四个模型的完整检查点将在 Hugging Face 开放下载，便于研究人员基于此进行强化学习等进一步实验，或针对特定任务定制优化。同时，模型支持“GenSelect 模式”，即每个问题可生成多种解答版本，通过筛选最优解来提升准确率。在该模式下，32B 模型在多项数学与编程基准测试中已达到甚至超越 OpenAI o3-high 的表现。

值得一提的是，英伟达此次模型训练全程未引入强化学习，仅采用监督微调，为社区提供了干净且处于技术前沿的起点，便于未来开展强化学习相关研究。对于拥有高性能游戏 GPU 的玩家及个人开发者而言，这套模型让本地运行接近业界最先进水平的推理模型成为现实。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表本站立场。文章及其配图仅供学习分享之

7501

570

上一篇：美团 600 元神券省钱年卡 9.9 元发车：天猫官方再补货，堂食外卖剪发泡澡都能用下一篇：最后一页

同类推荐更多

《一女多夫共妻苏苏慕千澈免费阅读》：不同读者的情感体验与复杂情节深度解析

最火的雷霆攻略

2025-04-28

《一女多夫共妻苏苏慕千澈免费阅读》这本小说吸引了很多读者的关注，尤其是喜欢现代言情、复杂情感故事的朋友。故事围绕着主人公苏苏与慕千澈之间的爱情纠葛展开，独特的情节和人物设定，使得这本书成为近年来广受欢迎的小说之一。这种设定虽然在传统的小说中并不常见，但它通过深刻的情感描写和复杂的人物关系，让读者感受到了一种不同寻常的阅读体验。故事背景与设定这部小说的故事背景设定在现代社会中，讲述了苏苏与慕千

新品榜/热门榜

资讯推荐更多