百川智能王小川:美国OpenAI要把1000万个GPU连接起来做大模型 这种想法像登月一样
在今天上午举办的2023云栖大会上,百川智能创始人兼CEO王小川发表演讲称,今年年底之前,国内会有几家公司能够做到GPT3.5的水平,明年国内会有若干款超级应用。
王小川表示,百川智能做大模型的理念是“理想上慢一步,落地上快三步”。4月下场之后,百川在两个月时间就完成了第一个70亿参数的模型的发布,行业一般需要半年,比预期时间节省了三倍。
他直言,在大模型领域,确实得承认跟美国存在差距。他预计今年年底之前国内会有几家公司能达到GPT 3.5的水平,到明年也有信心能够达到GPT4.0的水平,但是达到之后,可能很难去超越他们。
他在发言中还谈到在美国与OpenAI交流时了解到的情况。
“他们在正在设计一个把1000万颗GPU连在一起做模型的技术。咱们做GPT3.5的时候用了4000颗GPU,做GPT4的时候是25000颗,英伟达一年生产能力才100万颗,而OpenAI在设计把1000万个GPU连接起来,这样一种想法像登月一样。“
“我对他们充满了敬畏。我更自豪的地方是,我们在做应用方面可能比美国走得更快。”王小川表示。
王小川认为,在做应用方面,中国企业会走得很快。基于现在已有的技术,相信中国明年有若干款超级应用。
公开资料显示,百川智能成立于2023年4月10日,由前搜狗公司CEO王小川创立。其核心团队来自搜狗、Google、腾讯、百度、华为、微软、字节等知名科技公司,目前团队规模170余人,研发人员占比超80%。
成立半年,百川智能便接连发布baichuan-7B/13B,Baichuan2-7B/13B四款开源可免费商用大模型及Baichuan-53B、Baichuan2-53B两款闭源大模型,平均每28天就会发布一款新的大模型。
10月30日,百川智能发布Baichuan2-192K大模型,其上下文窗口长度达192K,是目前全球最长的上下文窗口,能够处理约35万个汉字,是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗口,实测约8万字)的 4.4倍,更是 GPT-4(支持32K上下文窗口,实测约 2.5万字)的14倍。
据悉,Baichuan2-192K现已正式开启内测,以API(应用程序接口)调用的方式开放给核心合作方,目前已经与财经类媒体及律师事务所等机构达成了合作,将全球领先的长上下文能力应用到了传媒、金融、法律等具体场景当中,不久后将全面开放。
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
- 一家三口被害 凶手被鉴定为精神分裂
- 小米汽车正为YU7大规模量产做准备:UWB钥匙、续航835km、多种轮胎选项
- 《冲·撞》首映 黄渤冯小刚称市场需要热血青春片
- 极越CEO夏一平名下两家公司被列入经营异常
- 荣耀MagicBook Pro 14官宣:首发HONOR Turbo X技术 引爆续航革命
- 刘作虎:所有想要用手机替代电脑的想法都是愚蠢的
- 贾跃亭:如果接受恒大收购 FF将不复存在
- 专家称国际油价2025年将暴跌 价格低到你不敢信
- 飞天茅台散瓶批发参考价降至2345元
- 阿根廷首都一校车发生交通事故 至少15人受伤
- 安乃近和布洛芬哪个好
- 美团、饿了么被杭州市监约谈要求落实食品安全管理责任 严禁恶意竞争

随时掌握互联网精彩