华为宣布 MindSpeed 支持 DeepSeek V3 预训练与微调，昇腾适配 Open R1 项目

MindSpeed 支持 DeepSeek V3

2 月 11 日消息，华为技术有限公司今日宣布，MindSpeed 现已支持 DeepSeek V3 模型的预训练与微调。DeepSeek 团队通过知识蒸馏，实现了较小的模型也能具备较强的推理能力。华为表示，基于昇腾完成的蒸馏流程验证，使得经过蒸馏后的 Qwen 模型在对应领域上的评分显著提升，开发者可以参考这一流程，完成自定义蒸馏模型训练。

昇腾适配 Open R1 项目

华为昇腾还适配完成了 Open R1 项目的重要步骤，打通了 Open R1-Zero 的 GRPO 流程，并支持通过 vLLM 等生态库实现训练过程中的数据生成。Open R1 项目是 Hugging Face 官方开源的对 DeepSeek-R1 模型流程进行完全开放式复现的项目，已经获得 18K+ star 数，目标是构建 DeepSeek-R1 训练流程的缺失部分。

结论

华为通过 MindSpeed 和昇腾的技术支持，进一步推动了 DeepSeek V3 和 DeepSeek-R1 模型的应用和发展。MindSpeed 对 DeepSeek V3 的预训练与微调支持，使开发者能够更高效地进行模型训练和优化。而昇腾对 Open R1 项目的适配，打通了关键流程，为开发者提供了更加完善的复现和训练环境。这些进展不仅提升了模型的性能和应用效果，也为 AI 技术的推广和普及提供了强有力的支持。华为在 AI 领域的不断创新和努力，将继续引领技术发展的潮流，为各行业带来更多智能化解决方案。