阿里巴巴正式开源千问3 仅需4张H20即可部署满血版
今天凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量为DeepSeek-R1的1/3,成本大幅下降。
千问3是“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,节省算力消耗。
作为Qwen系列全新一代的混合推理模型,Qwen3 在 GPQA、AIME24/25、LiveCodeBench 等多个权威评测中表现出极具竞争力的结果。
在相同计算资源下,Qwen3 模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了“小而强大”。
千问3总参数量235B,刷新了开源模型的智能水平新高,阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。
千问3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。
-
高德地图发布代言人剪影图 网友看拿筷方式猜测是王鹤棣 并喊“复婚成功”
据媒体报道,此前有网友爆料,阿里全球总部此前未启用的C4楼,被用于一个高级别的全新项目。新项目组单独进驻,完全封闭办公模式,设置额外门禁权限,甚至配了独立安保。项目组已入驻两个多月,却鲜有人知晓具体情
-
曝阿里明日发布两个重磅业务:重启“口碑网” 高德上线自营团购
据“新浪科技”报道,阿里巴巴明日将官宣重大业务调整。报道称,知情人士透露,此次业务调整涉及本地生活服务领域的重大布局,包括重启口碑网以及高德地图开展自营团购业务,旨在重新构建本地生活消费决策体系,对标
-
腾讯混元翻译模型Hunyuan-MT-7B登顶开源热榜
日前,腾讯混元宣布,混元翻译模型Hunyuan-MT-7B登顶 Hugging Face模型趋势榜第一位。官方表示,该模型和混元世界模型家族最新成员HunyunWorld-Voyager一起,拿下前三
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

随时掌握互联网精彩