DeepSeek-R1-0528更新了什么?官方公布细节了
【CNMO科技消息】近日,DeepSeek R1模型迎来重要升级,最新版本DeepSeek-R1-0528正式发布。此次更新通过强化后训练过程,显著提升了模型的思维深度与推理能力,在多个领域展现出更优异的性能。
在深度思考能力方面,DeepSeek-R1-0528以2024年12月发布的DeepSeek V3 Base模型为基座,投入更多算力进行优化。这使得新模型在数学、编程和通用逻辑等多个基准测评中表现卓越,成绩位居国内模型前列,并接近国际顶尖水平,如o3与Gemini-2.5-Pro。特别是在AIME 2025测试中,新版模型的准确率从旧版的70%提升至87.5%,显示出在复杂推理任务中的显著进步。这一提升得益于模型在解题过程中进行了更为详尽和深入的思考,平均每题使用的tokens从12K增加到23K。
除了深度思考能力的提升,DeepSeek-R1-0528还在其他方面进行了优化。针对“幻觉”问题,新模型在改写润色、总结摘要、阅读理解等场景中的幻觉率降低了45%~50%,提供了更为准确、可靠的结果。在创意写作方面,新模型针对议论文、小说、散文等文体进行了优化,能够输出篇幅更长、结构更完整的长篇作品,且风格更贴近人类偏好。
此外,DeepSeek-R1-0528还支持工具调用功能,尽管不支持在thinking中进行工具调用,但在Tau-Bench测评中表现良好,与OpenAI o1-high相当。同时,新模型在前端代码生成、角色扮演等领域的能力也有所提升。
API方面,DeepSeek-R1-0528已同步更新,接口与调用方式保持不变,但增加了Function Calling和JsonOutput的支持。官方还调整了max_tokens参数的含义,用于限制模型单次输出的总长度,包括思考过程。