OpenAI最强推理模型o3发布:AGI能力暴涨 接近人类水平
OpenAI“连续12日圣诞发布”终于迎来激动人心的大结局,OpenAI推出重磅收官新品,其迄今最强前沿推理模型的升级版——o3。
OpenAI号称o3在一些条件下接近通用人工智能(AGI),共有o3和精简版o3-mini两个版本。
评估显示,o3在软件工程测试中准确率比o1高近47%,竞赛数学测评的准确率比o1高15%,人类博士专家级生化物测试中准确率比o1高近13%。
AGI相关测试中,o3最佳成绩87.5,超过人类水平门槛85,显示迈向类人智能取得突破。
对比之下,GPT-3的评测结果为0%,GPT-4o为5%,而o3一举将成绩提升到87.5%。
OpenAI计划明年初发布o3系列模型,CEO Altman暗示可能一段时间内都不会面向大众上线这类模型,称希望正式发布前,先有一个联邦政府的测试框架,指导监控并减少这类模型的风险。
从本周五开始,OpenAI允许安全研究人员可以注册访问o3 和 o3-mini的预览。
OpenAI12天技术直播要点汇总:
1、推出“满血版”推理模型o1和ChatGPT Pro(每月订阅费200美元)。
2、推出强化微调研究项目,能够使用数十到数千个高质量任务定制模型。
3、正式推出AI视频生成模型Sora Turbo,最高支持1080p 20s视频。
4、发布升级版Canvas创作助手,主打高效编程与写作,向全量用户开放。
5、与苹果合作发布iOS 18.2,Siri、写作工具和Visual Intelligence与ChatGPT深度集成
6、全量上线4o视频通话,能实时对话并理解用户的连续性动作,也有记忆。
7、推出Projects In ChatGPT,可整合ChatGPT的各种功能,便于创建及管理项目。
8、ChatGPT搜索功能全面升级,新增地图集成、实时搜索等功能,向所有用户开放。
9、OpenAI开放满血o1模型API,实时API直接支持WebRTC,且定价猛砍60%。
10、ChatGPT入驻手机,拨打免费号码连接聊天机器人,每月可免费通话15分钟。
11、支持原生应用程序自动化协作功能,与AI Agent玩法相似,能够主动理解用户需求。
12、o1下一代模型o3亮相,推出两个版本,正式版o3以及精简版o3-mini。
-
微软OpenAI即将推出的GPT-4.5和GPT-5模型积极准备服务器容量
有消息透露称,微软的工程师正在全力以赴,为 OpenAI 即将推出的 GPT-4.5和 GPT-5模型准备服务器容量。OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)近日确认,GPT-4
-
谷歌和OpenAI每年向Reddit支付6,000万/7,000万美元用于获取内容授权训练AI
Reddit 论坛此前虽然有众多活跃用户但在财务方面的表现默默无闻,没想到人工智能热潮让 Reddit 也能乘风起飞,因为该论坛拥有海量的真实用户发布的数据。这些可用于人工智能模型训练的数据是个宝库,
-
马斯克974亿收购计划落空!OpenAI董事会坚决说‘不’
据央视报道,当地时间2月14日,ChatGPT开发商美国开放人工智能研究中心(OpenAI)董事会一致拒绝了马斯克提出的以974亿美元收购该公司资产的提案。此前,本月10日,一个由马斯克领导的财团宣布
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

随时掌握互联网精彩