消息称DeepSeek R2下月发:成本较GPT降97%、华为芯片性能不输英伟达
据国内媒体报道称,深度求索可能会在下个月有所行动,推出下一代AI大模型DeepSeek-R2。
报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。
有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。
此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。
据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。
DeepSeek-R2是一款基于华为昇腾910B(Ascend 910B)芯片集群训练的模型,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%。
据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。
-
vivo X200 Ultra正式开售:能打电话的V单
vivo X200 Ultra今天正式开售,共三个版本,12GB+256GB售价6499元;16GB+512GB售价6999元;16GB+1TB售价7999元(支持卫星通信)。此外还有摄影师套装,内置
-
腾讯免费硬核军事模拟端游 《暗区突围:无限》端游国服今日上线:GTX 960就能玩
《暗区突围:无限》端游国服将于今天上午10:00正式开服,这是腾讯魔方工作室自研IP“暗区突围”手游的全新端游续作,是一款免费硬核军事模拟撤离式射击端游。玩家可自由选择武器和配装,无论是顶配下场,还是
-
阿里巴巴正式开源千问3 仅需4张H20即可部署满血版
今天凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量为DeepSeek-R1的1/3,成本大幅下降。千问3是“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/