DeepSeek研究员在线爆料:过年都没歇 还有大招!
大年初四Daya Guo发了一条推文,透露了春节期间让他最兴奋的事情,亲眼见证了R1-Zero模型性能曲线的 “持续增长”,并且直言感受到了 强化学习(RL)的强大力量。
Daya Guo回复了网友有关DeepSeek R1的一些问题,以及接下来的公司的计划,只能说DeepSeek的R1仅仅只是开始,内部研究还在快速推进,DeepSeek的研究员过年都没歇,一直在爆肝推进研究,接下来DeepSeek还有大招。
网友提问:“如果不是秘密的话:这次RL训练跑了多久?”对此,Daya Guo表示,660B参数的R1-Zero和R1是在V3发布之后才开始跑的,训练大约花了2-3周。
此外,他还表示在尝试将R1应用于形式化证明环境,希望尽快向社区发布更好的模型。听Daya Guo的意思,他们在这方面已经有进展,未来可能会有更重磅的模型发布!期待值拉满!
-
DeepSeek罕见千万级大单 山西临汾将打造AI医院
山西省临汾市人民医院 6 月 23 日公布了《临汾市人民医院基于 Deepseek AI 大模型的智慧医疗应用系统建设项目》,预算金额 1569.264 万元,预计采购时间为 2025 年 9 月。采
-
DeepSeek致谢腾讯技术团队:这是一次“巨大的加速”代码贡献!
DeepSeek致谢腾讯技术团队,这是一次“巨大的加速”代码贡献。据新浪报道,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。经测试,优
-
深度deepin 23.1正式发布!AI默认引擎切换至DeepSeek
今天,深度操作系统宣布,deepin 23.1版本已正式发布。此版本聚焦于解决基础组件更新后的安装效率问题,大幅提升新用户安装体验,同时集成多项功能优化与问题修复,进一步优化系统使用。本次版本的重点改
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
- 董明珠孟羽童直播力荐美容仪仅卖4单:9800元/台
- 比亚迪宋L DM同级!捷途山海L7上市:12.98万起
- 《黑神话》初代蜘蛛精六妹建模欣赏:可爱脸蛋粉嘟嘟
- 《星际战士2》多人合作系统存缺陷 玩家之间尬尴等待
- 蔚来李斌:全新NIO Phone零系统广告、零商业预装
- 希荻微:子公司拟收购Zinitix公司30.91%股权
- 小岛秀夫称赞《十角馆事件》真人版:太厉害了!
- 麒麟操作系统通过GB18030-2022最高级认证
- 一美元等于多少人民币2023年6月13日
- 小米9号员工李明创业:全球首款Android桌面机器人来了
- 淄博八大局登顶全国景区热门第1:迪士尼、环球等景点不再受宠
- 周杰说张颂文火了我特别高兴

随时掌握互联网精彩