消息称DeepSeek R2下月发:成本较GPT降97%、华为芯片性能不输英伟达
据国内媒体报道称,深度求索可能会在下个月有所行动,推出下一代AI大模型DeepSeek-R2。
报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。
有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。
此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。
据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。
DeepSeek-R2是一款基于华为昇腾910B(Ascend 910B)芯片集群训练的模型,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%。
据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。
-
华为Mate 80将搭载侧边超声波指纹 大概率12月上市
近日,有数码博主爆料称,华为Mate 80系列有望搭载自研侧边超声波指纹技术。若属实,将是华为在生物识别领域的重要突破。据博主透露,华为侧边超声波指纹技术正在推进,预计下半年进入试产阶段。此前,华为因
-
《寻秦记》宣布2025贺岁档上映 古天乐等原班人马回归
据“中国电影报道”官微,今日,电影版《寻秦记》亮相第27届全国影片推介会,将于2025年贺岁档上映。该片延续剧版《寻秦记》的剧情,讲述承接剧版结局19年后的故事,影片集结了2001年剧版原班人马,包括
-
玄戒O1被严重低估了 雷军:不少人觉得做芯片很容易 其实这个过程非常艰难
今天下午,小米创办人雷军发文表示,我们这次发布大芯片,不少人觉得很突然,甚至觉得做大芯片好像很“容易”。我们一直没有对外讲过,大家不了解,我们默默干了四年多,花了135亿,等到O1量产后才披露,其实这
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

随时掌握互联网精彩