DeepSeek-R1更新,官方说明来了!多项表现已接近其他国际顶尖模型
创始人
2025-05-29 23:18:05

每经编辑:黄胜

5月29日晚间,深度求索微信公众号公布了 DeepSeek-R1-0528 更新的详细升级内容,DeepSeek-R1-0528 仍然使用 2024年12月所发布的 DeepSeek V3 Base 模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。更新后的 R1 模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。

图片来源:视觉中国

其他能力更新比如:

1.幻觉改善:新版 DeepSeek R1 针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45~50% 左右,能够有效地提供更为准确、可靠的结果。

2.创意写作:在旧版 R1 的基础上,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

3.工具调用:DeepSeek-R1-0528 支持工具调用(不支持在 thinking 中进行工具调用)。当前模型 Tau-Bench 测评成绩为 airline 53.5% / retail 63.9%,与 OpenAI o1-high 相当,但与 o3-High 以及 Claude 4 Sonnet 仍有差距。

5月29日凌晨,DeepSeek-R1-0528正式在Hugging Face平台开源。此前一日(5月28日),DeepSeek官方宣布DeepSeek-R1模型已完成小版本试升级,用户可通过官方网页、App、小程序进行测试(打开深度思考),API接口和使用方式保持不变。

每日经济新闻综合公开消息

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

每日经济新闻

相关内容

热门资讯

原创 黑... 标题:黑椒鸡腿卷的家常做法,搭配合理,营养丰富,超级喜欢这种口味。 在忙碌的生活中,我们总是渴望一...
原创 麦... 在快餐文化中,麦当劳无疑是一个标志性的存在。它不仅代表着一种快捷的餐饮体验,更承载着无数人童年的记忆...
原创 4... 标题:40年湘菜师傅:做剁椒鱼头时,牢记这3点技巧,鱼头鲜香,无腥味。 在湖南的餐桌上,剁椒鱼头是...
梁晓声:一碗阳春面,承载着温情... 在繁忙的都市生活中,我们是否曾停下脚步,思考过那些我们每天所依赖的美食背后,隐藏着怎样的人生哲学?今...
原创 4... 在烹饪的世界里,每一道佳肴背后都蕴含着厨师的匠心独运。今天,我将与大家分享一道经典家常菜——炸酥肉,...