消息称DeepSeek R2下月发:成本较GPT降97%、华为芯片性能不输英伟达
据国内媒体报道称,深度求索可能会在下个月有所行动,推出下一代AI大模型DeepSeek-R2。

报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。
有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。
此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。
据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。
DeepSeek-R2是一款基于华为昇腾910B(Ascend 910B)芯片集群训练的模型,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%。
据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。
-
车主花35.88万买车 4S店承诺返现11万元!结果被坑了
据博主“汽车265热线”爆料,红旗HQ9车主吴先生向其反馈称,自己买车时选择了付35.88万元车款,后续可以返现11万元的方式,结果现在返现还没完全到账。吴先生介绍,今年4月份他在北京一家红旗4S店,
-
1000万粉丝网红女装店突然关停:经营16年 年销量超40万
近日,经营16年的网红大店“黑牛奶heiniunai”发布闭店公告。店铺公告显示:“微薄的利润无法支撑团队运转,持续的亏损,迫使我们不得不停下脚步。做出这个决定,心中充满了不舍与无奈。”资料显示,这家
-
华为李小龙飞机上实测无网通信:天上照样发消息、打电话
今日,华为终端BG CTO李小龙微博发文称,国内运营商地面信号覆盖太好,他此前一直没什么机会用无网通信。李小龙表示,今天在飞机上与同事试了无网通信,太好用了,即使在天上也能自由发送消息和拨打电话。据了
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
关注网络尖刀微信公众号随时掌握互联网精彩



![林霸天 容我准备一下 下次更新就是大片![开学季] ](https://imgs.knowsafe.com:8087/img/aideep/2023/4/11/1ff7b6894449d39bec36e77e288514f2.jpg?w=250)



