DeepSeek-R1更新,官方说明来了!多项表现已接近其他国际顶尖模型
创始人
2025-05-29 23:18:05

每经编辑:黄胜

5月29日晚间,深度求索微信公众号公布了 DeepSeek-R1-0528 更新的详细升级内容,DeepSeek-R1-0528 仍然使用 2024年12月所发布的 DeepSeek V3 Base 模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。更新后的 R1 模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。

图片来源:视觉中国

其他能力更新比如:

1.幻觉改善:新版 DeepSeek R1 针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45~50% 左右,能够有效地提供更为准确、可靠的结果。

2.创意写作:在旧版 R1 的基础上,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

3.工具调用:DeepSeek-R1-0528 支持工具调用(不支持在 thinking 中进行工具调用)。当前模型 Tau-Bench 测评成绩为 airline 53.5% / retail 63.9%,与 OpenAI o1-high 相当,但与 o3-High 以及 Claude 4 Sonnet 仍有差距。

5月29日凌晨,DeepSeek-R1-0528正式在Hugging Face平台开源。此前一日(5月28日),DeepSeek官方宣布DeepSeek-R1模型已完成小版本试升级,用户可通过官方网页、App、小程序进行测试(打开深度思考),API接口和使用方式保持不变。

每日经济新闻综合公开消息

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

每日经济新闻

相关内容

热门资讯

告别旧战役! 看休闲零食如何打... 文|财华社 今年三季度休闲食品市场的压力依旧没有减弱,多数企业出现营收净利润双降、增收不增利的困境...
家常菜里挖出的家族美食故事,藏... 佳肴并非仅仅局限于烹饪以及品尝,它所肩负着的是记忆、情感还有个人既往经历,每一款菜品的背后都极有可能...
从家常菜里听故事,红烧肉、腌咸... 于美食天地之中,每一道菜肴背后皆匿着一段往事,其或许关乎一处地方的风俗人情,一个家族的沿袭传承,又或...
外婆的红烧肉秘方:一道菜里的温... 进行美食分享,从本质上来说嘛,是在去分享一段经过浓缩的时光以及情感哟。它并非是被限定在食材的昂贵程度...
昆明夏夜的清凉:调糕藕粉的绵密... 当夏日的热浪笼罩春城昆明,一种清凉甜蜜的小吃便成为夜晚街头的宠儿——调糕藕粉。这道将米糕与藕粉结合的...