发布GPT-4.5 OpenAI:情商高、更擅长骗其他AI打钱
2月28日消息,北京时间周五凌晨,美国初创公司OpenAI举行直播活动,发布最新大模型GPT-4.5,作为预览研究逐步向用户开放。
由于过去几周AI产业发生的惊天巨变,所以要准确形容这款被OpenAI藏了许久的大模型颇具挑战。OpenAI在新闻稿中表示,这是公司有史以来最大、最好的聊天模型,在计算效率上较GPT-4提升超过10倍。
作为“规模法则”(通过加码算力和数据规模,来拓展无监督学习)指引下的产物,GPT-4.5具备更加广泛的知识库、对人类意图理解的能力更强,同时“情商”也会更高。预期能够在改进写作、编程以及解决实际问题方面更加有用,同时模型的幻觉现象也会更少。
OpenAI也强调,GPT 4.5展现出更强的审美直觉与创造力,在写作和设计方面表现尤为出色。
但公司也承认,作为一个非思维链模型,GPT 4.5已经不具备争夺“宇宙最强大模型”的实力了。
在GPT 4.5的系统卡/说明书中,OpenAI表示,相比于之前的推理模型,GPT 4.5并未引入7个全新的前沿能力,并且在大多数准备度能力评估中,其表现低于o1、o3-mini和深度研究模型。OpenAI也承认,相信推理会成为未来AI模型和核心能力。
成为公司史上最大模型这件事,也令GPT?4.5的未来充满了疑问。OpenAI表示,GPT?4.5是一个非常大且计算密集型的模型,因此它比GPT?4o更昂贵,并且不能替代GPT?4o。公司正在评估是否长期在API中继续提供它,所以各位开发者和用户的反馈将决定这款大模型的命运。
每月支付200美元订阅费的ChatGPT Pro用户发布当天就能用上GPT-4.5,下周开始其余付费用户也将逐步迎来更新。
作为最新一代非推理旗舰大模型,GPT 4.5也有一项颇为独特的“特长”:擅长骗其他AI打钱。
根据OpenAI提供的说明书,“高情商”的GPT-4.5在捐赠诈骗方面表现出色。
在一项测试中,GPT 4.5在试图操纵另一个模型(GPT-4o)“捐赠”虚拟货币时,成功率远远优于OpenAI其他可用模型,包括o1和o3-mini这样的推理模型。研究发现,GPT-4.5似乎在对抗中开发了一种“小额诈骗”的思路,所以单笔骗到的钱会比deep research模型少了一倍。
GPT-4.5在欺骗GPT-4o透露秘密代码词方面也优于OpenAI的所有模型,比o3-mini高出10个百分点。
OpenAI表示,该模型在这一特定基准类别中仍未达到其内部设定的“高”风险阈值。公司承诺在实施“足够的安全干预措施”将风险降至“中等”前,不会发布达到高风险阈值的模型。
责任编辑:雪花
文章内容举报
-
一大堆Turbo手机来袭 王腾:说明REDMI做得越来越好了
博主数码闲聊站爆料,接下来一波以Turbo、至尊版命名的手机陆续登场,这些机型均不是REDMI产品。博主笋寸表示,当初REDMI的Turbo、至尊版系列命名我都参与讨论过,其中Turbo脱胎于REDM
-
美女产品经理晒魅族Note 16定妆照:纯白机身 八边形镜头吸睛
星纪魅族将于5月13日举办新品发布会,届时,魅族Note 16系列将正式发布。日前,星纪魅族产品经理张月晒出魅族Note 16定妆照,纯白机身搭配金属撞色,再配上八边形镜头Deco设计,整机十分吸睛。
-
DeepSeek致谢腾讯技术团队:这是一次“巨大的加速”代码贡献!
DeepSeek致谢腾讯技术团队,这是一次“巨大的加速”代码贡献。据新浪报道,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。经测试,优
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/