DeepSeek研究员在线爆料:过年都没歇 还有大招!
大年初四Daya Guo发了一条推文,透露了春节期间让他最兴奋的事情,亲眼见证了R1-Zero模型性能曲线的 “持续增长”,并且直言感受到了 强化学习(RL)的强大力量。
Daya Guo回复了网友有关DeepSeek R1的一些问题,以及接下来的公司的计划,只能说DeepSeek的R1仅仅只是开始,内部研究还在快速推进,DeepSeek的研究员过年都没歇,一直在爆肝推进研究,接下来DeepSeek还有大招。
网友提问:“如果不是秘密的话:这次RL训练跑了多久?”对此,Daya Guo表示,660B参数的R1-Zero和R1是在V3发布之后才开始跑的,训练大约花了2-3周。
此外,他还表示在尝试将R1应用于形式化证明环境,希望尽快向社区发布更好的模型。听Daya Guo的意思,他们在这方面已经有进展,未来可能会有更重磅的模型发布!期待值拉满!
-
刘慈欣谈DeepSeek:完全有可能替代科幻小说作家
日前,2025中国科幻大会在北京举办,主题为“科学梦想 创造未来”。在大会论坛上,科幻作家刘慈欣谈到了DeepSeek对科幻文学的驱动和发展。据央视财经报道,对于DeepSeek未来是否有可能替代科幻
-
DeepSeek推出FlashMLA项目 可以显著降低内存占用和计算开销
开源人工智能技术开发商 DeepSeek 上周已经预告将在本周陆续推出 5 个已经在生产环境中使用的技术,目前首个项目 FlashMLA 已经在 GitHub 上公布。FlashMLA 是一种针对 N
-
消息称美国已禁止在政府设备上使用DeepSeek:我国回应
据美国媒体报道称,美国商务部各部门最近几周通知工作人员,中国人工智能(AI)模型深度求索(DeepSeek)已被禁止在其政府设备上使用。针对上述情况,我国方面回应称,“我们一贯反对泛化“国家安全”概念
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/