威廉希尔WilliamHill·足球(中国)体育官方网站
搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

DeepSeekR1幻觉率最高降低50%,用户喊话想要R2模型

2025-06-01 12:37:45
来源:

猫眼电影

作者:

杨慧敏

手机查看

  猫眼电影记者 马什哈德 报道w3u7903ejky2ywls

在开源平台HuggingFace上发布R1模型的更新后,5月29日晚,DeepSeek终于发布了官方公告介绍这次版本的具体能力迭代细节,其中包括深度思考能力强化、幻觉改善和创意写作更好等。

在测评数据上,官方表示,更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。

值得一提的是,DeepSeek提到,新版DeepSeek R1 针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45%-50% 左右,能够提供更为准确可靠的结果。

所谓幻觉即大模型的“胡说八道”,此前DeepSeek的幻觉率并不低,也被不少用户和开发者所讨论。5月15日,SuperCLUE曾发布最新一轮中文大模型忠实性幻觉测评结果,显示此前的DeepSeek-R1模型幻觉率在21%左右,在测评的国内模型中排名第五。

据SuperCLUE,推理模型的幻觉比非推理模型更显著,在他们的测评中推理模型的平均幻觉率为22.95%,非推理模型的平均幻觉率为13.52%。

除了幻觉方面的改善,官方介绍,新R1模型在复杂推理任务中的表现有了显著提升。例如在 AIME 2025 测试(一个数学基准测试,用于模型在数学推理方面的能力)中,新版模型准确率由旧版的70%提升至87.5%。

此外,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

在官方发文之前,众多测试表明R1新模型的代码能力有显著提升,在代码测试平台Live CodeBench中,其性能几乎媲美OpenAI重量级的o3-high模型。官方此次公告也提到,在前端代码生成、角色扮演等领域,模型的能力确实均有更新和提升。

在迭代路径上,DeepSeek表示,DeepSeek-R1-0528 仍然使用 2024 年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。

本次R1新模型参数为 685B,开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文)。同时,与旧版本的R1保持一致,此次开源模型权重仍然统一采用 MIT License,允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

有趣的是,在X平台DeepSeek的官方评论区中,讨论的话题全都关于R2模型,“We want R2(我们想要R2模型)”,有用户评论称。业界对DeepSeek下一代的模型期待已久。

基于DeepSeek刚刚发布了更新,有用户猜测,“是否意味着我们暂时不会听到有关R2的消息?”也有用户调侃称,这一模型或许在开发中应该是R2,但是当他们发现在基准测试中没有超越OpenAI的o3 时,DeepSeek将其重新命名为R1的更新。

一向低调的DeepSeek并未对外界的猜测进行任何回应,基于R1是在V3模型的基础上训练的,或许我们会先等到V4模型的更新。无论如何,海内外大模型领域的基座模型大战还在继续,DeepSeek之后,谁会是下一家?

 时事1:佐良娜被鸣人❌❌黄漫画

  06月01日,时政微纪录丨习主席的欧洲时间(第一集 春到巴黎),

  “孩子,你突破了吗?”老族长关切的问道。

,迪丽热巴裸乳洗澡视频。

  06月01日,【我是Z世代】专科生热血追逐篮球梦 成“双一流”大学研究生,

  同学们,你们即将离开母校,奔向新的学习旅程,此时此刻,浓浓的师生之情、依依的惜别之意,充盈在彼此心间,在此,我也有几句话想与同学们共勉。

,千仞雪被扒开大腿❌小说,男女边添边摸边做边爱喷水,美女跪床❌❌被🌿直播。

 时事2:动漫❌c🐻黄扒衣服做动漫

  06月01日,不断深化对全过程人民民主的认识(学苑论衡),

网站董事长致辞 篇10

,海角社区真实偷伦V视频,小🐔🐔伸进🈲🔞🔞猎奇,印度性❌❌❌视频。

  06月01日,全方位多领域“昂首阔步”启新程 中国高质量发展质效稳步提升,

网站董事长致辞 篇31

,韩国美女裸体被❌羞羞,张柏芝木耳绝版图片,狠狠的挺进貂蝉的小泬小说。

 时事3:甘雨被扒开腿做❌同人网站

  06月01日,【光明论坛】坚持守正创新 不断取得改革新突破,

  “小不点来我们云天宫吧,到时候我们带你去看雪海,喝最香醇的兽奶。”两个小姑娘开口,冲小石昊眨动眼睛。

,直男白袜打自慰,怎么调小狗男人性格,程潇也太敢穿了。

  06月01日,东西问丨Pandaily创始人:如何讲好中国创新故事?,

  “相见不如怀念。”

,小🐔🐔伸进🈲🔞🔞真人,freeHD18麻豆,扒开裙子美女狂揉动漫。

 时事4:穿入vr世界成为x领域猎人

  06月01日,违规改装、充电困难 电动车治理难题何解?,

  一是积极推进水土流失治理。20xx-20xx年,我区组织实施了国家5大类水土保持重点工程。累计安排水土保持重点工程投资18亿元,其中,中央投资13.22亿元,地方配套4.78亿元,治理水土流失面积2762.62平方公里,新建淤地坝20座,除险加固淤地坝80座,保护黑土区面积150平方公里,专项治理黑土区侵蚀沟道194条。鄂尔多斯市准格尔旗被水利部授予全国首家水土保持生态建设示范县。

,麻豆国产AV精品一区,国产做受18~20岁A片,满嘴含精大口吞精的女人。

  06月01日,两岸青年以舞会友 同台竞技碰撞新“火花”,

  “毛球又闯祸了吧,刚才我听到林虎家的虎婶发出了狮子吼。”

,入间美兔被c,性少妇VideOseXfreeXXXX片,桃花岛app+下载。

责编:陈晓辉

审核:碧婷

责编:王旭东

相关推荐 换一换