华为宣布 MindSpeed 支持 DeepSeek V3 预训练与微调,昇腾适配 Open R1 项目

MindSpeed 支持 DeepSeek V3

2 月 11 日消息,华为技术有限公司今日宣布,MindSpeed 现已支持 DeepSeek V3 模型的预训练与微调。DeepSeek 团队通过知识蒸馏,实现了较小的模型也能具备较强的推理能力。华为表示,基于昇腾完成的蒸馏流程验证,使得经过蒸馏后的 Qwen 模型在对应领域上的评分显著提升,开发者可以参考这一流程,完成自定义蒸馏模型训练。

昇腾适配 Open R1 项目

华为昇腾还适配完成了 Open R1 项目的重要步骤,打通了 Open R1-Zero 的 GRPO 流程,并支持通过 vLLM 等生态库实现训练过程中的数据生成。Open R1 项目是 Hugging Face 官方开源的对 DeepSeek-R1 模型流程进行完全开放式复现的项目,已经获得 18K+ star 数,目标是构建 DeepSeek-R1 训练流程的缺失部分。

结论

华为通过 MindSpeed 和昇腾的技术支持,进一步推动了 DeepSeek V3 和 DeepSeek-R1 模型的应用和发展。MindSpeed 对 DeepSeek V3 的预训练与微调支持,使开发者能够更高效地进行模型训练和优化。而昇腾对 Open R1 项目的适配,打通了关键流程,为开发者提供了更加完善的复现和训练环境。这些进展不仅提升了模型的性能和应用效果,也为 AI 技术的推广和普及提供了强有力的支持。华为在 AI 领域的不断创新和努力,将继续引领技术发展的潮流,为各行业带来更多智能化解决方案。