苹果发布 DiffuCode-7B-cpGRPO 编程 AI 模型：基于 Qwen2.5-7B，可不按顺序生成代码

2025-07-05 13:57:02雷霆软件园

本站 7 月 5 日消息，苹果公司悄然在 Hugging Face 上发布了一款名为 DiffuCode-7B-cpGRPO 的开源 AI 模型，该模型在生成代码方面具有创新特性，能够不按顺序生成代码，且性能媲美顶级开源编码模型。

本站注：传统大语言模型（LLM）生成代码的方式，如同大多数人类阅读文本的方式，采用从左到右、从上到下顺序。

这主要是因为这些 LLM 采用自回归（Autoregression）方式工作，意味着当用户向它们提问后，它们会处理整个问题，预测答案的第一个 token，然后带着这个 token 重新处理整个问题，预测第二个token，以此类推。

LLM 还有一个名为“温度”（Temperature）的设置，用于控制输出的随机性。在预测下一个 token 后，模型会为所有可能的选项分配概率。较低的温度意味着更有可能选择最可能的 token，而较高的温度则给予模型更多的自由，选择不太可能的 token。

而另一种选择就是扩散（Diffusion）模型，这种模型通常用于图像模型。简而言之，模型从一个模糊、噪声的图像开始，迭代去除噪声，同时考虑到用户的需求，逐渐将其引导至更接近用户请求的图像。

苹果公司发布的模型名为 DiffuCode-7B-cpGRPO，它基于上月发表、名为《DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation》的论文。

论文描述了一个采用扩散优先策略的代码生成模型，但有一个特别之处：当采样温度从默认的 0.2 增加到 1.2 后，DiffuCoder 在生成 token 的顺序上变得更加灵活，从而摆脱了严格的从左到右的约束。

更为有趣的是，苹果的这款模型建立在阿里的开源 Qwen2.5-7B 模型上，将这个模型按照 DiffuCoder 论文中的描述，改造成了一个基于扩散的 decoder，然后调整它以更好地遵循指示。完成这些后，他们又用超过 20000 个精心挑选的编码示例训练了它的另一个版本。

在主流编程跑分中，DiffuCode-7B-cpGRPO 保持了在生成代码时不严格依赖从左到右的生成方式情况下，相比较主流基于扩散的编程模型，测试得分提高了 4.4%。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表本站立场。文章及其配图仅供学习分享之

6011

333

上一篇：小米：车载磁吸纸巾盒进行专门的开发设计，磁吸物理按键支持上百种功能的一键操作下一篇：最后一页

同类推荐更多

《一女多夫共妻苏苏慕千澈免费阅读》：不同读者的情感体验与复杂情节深度解析

最火的雷霆攻略

2025-04-28

《一女多夫共妻苏苏慕千澈免费阅读》这本小说吸引了很多读者的关注，尤其是喜欢现代言情、复杂情感故事的朋友。故事围绕着主人公苏苏与慕千澈之间的爱情纠葛展开，独特的情节和人物设定，使得这本书成为近年来广受欢迎的小说之一。这种设定虽然在传统的小说中并不常见，但它通过深刻的情感描写和复杂的人物关系，让读者感受到了一种不同寻常的阅读体验。故事背景与设定这部小说的故事背景设定在现代社会中，讲述了苏苏与慕千

新品榜/热门榜

资讯推荐更多