财联社
财经通讯社
打开APP
GPT-5.6深夜亮相!性能反超竞品Mythos 但大多数用户暂无缘使用
①OpenAI周六凌晨发布GPT-5.6系列模型,包含旗舰Sol、均衡Terra和轻量Luna模型,性能对标甚至部分超过Anthropic旗舰竞品;
                ②不过受美国政府限制,GPT-5.6目前仅向少数“受信任合作伙伴”开放有限预览。

财联社6月27日讯(编辑 史正丞)北京时间周六凌晨,OpenAI官宣推出新一代旗舰大模型GPT‑5.6系列。但由于美国政府的阻挠,目前只有获得美国政府批准的一小撮“受信任合作伙伴”能够用上这款代表人类AI能力新巅峰的大模型。

据OpenAI介绍,GPT‑5.6系列一共有3款模型:旗舰模型Sol、适合日常工作的均衡型模型Terra,以及快速且经济的Luna模型

用更容易理解的角度来解释,这三个单词也有太阳、地球和月亮的含义。

(来源:OpenAI)

其中,GPT‑5.6 Sol能够引入更高等级的推理强度,让AI有更多时间进行深入推理;同时,OpenAI还推出利用子智能体加速复杂任务的GPT‑5.6 Sol Ultra模式。

OpenAI声称,在检验编程工作流的Terminal‑Bench 2.1测试中,GPT‑5.6 Sol的表现略好于主要竞争对手Anthropic的Mythos预览模型。同时Terra的表现与Mythos模型的首个公开发布版本Fable 5持平。主打轻量化的Luna模型,也能比竞品Anthropic目前仍能公开提供服务的旗舰模型Opus 4.8强上一些。

(来源:OpenAI)

而在名为ExploitBench的网络安全基准测试中,Sol与Mythos预览模型表现相当,但仅使用了三分之一的输出词元(显著省钱)

定价方面,旗舰模型Sol的输入/输出价格为每百万词元5美元/30美元;均衡模型Terra为2.5美元/15美元;轻量模型Luna为1美元/6美元。

对于资本市场而言,眼下更大的不确定性在于,GPT‑5.6和Mythos/Fable模型均在美国政府的要求下禁止对广泛公众开放

大约在两周前,Anthropic上线Fable 5仅3天便火速下线,原因是收到美国政府出口管制指令,禁止一切外国国民(含Anthropic外籍员工)访问Fable 5与Mythos模型

美国政府也对GPT-5.6采取了类似的措施。据报道,OpenAI掌门山姆·奥尔特曼在周四的内部员工备忘录中提及,美国政府将在此次GPT‑5.6预览期间“逐个批准客户访问申请”

OpenAI也在周五的公告中表示,他们不认为“这种政府访问审批流程应成为长期默认做法”,因为它“剥夺了需要这些最佳工具的用户、开发者、企业、网络防御者和全球合作伙伴的使用权”

公司同时表示,目前的“短期措施”,是在未来几周实现更广泛开放的最有力路径。OpenAI未来将与政府合作,制定网络安全行政令框架,以及可重复执行的模型发布流程。

作为“求生欲”的象征,OpenAI公告中半数以上篇幅都在谈论如何保障前沿大模型不被用于网络攻击等恶意行为。

公司表示,GPT-5.6被训练为会拒绝提供被禁止的网络安全协助。即便这一层防护被恶意行为者通过不断尝试提示词绕过,实时网络安全和生物学滥用分类器也会在模型生成输出的过程中进行评估,并对潜在恶意行为进行拦截。

OpenAI同时警告称,被标记的活动可能触发对相关对话和风险信号的账户级审查。

公司补充称,GPT‑5.6模型尚未触及OpenAI所界定的“关键网络安全风险”门槛,该门槛被定义为带来“前所未有的通向严重危害的新途径”。

环球市场情报
财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
商务合作
热门解锁
相关阅读
评论
发送
复制
取消
垃圾广告
政治激进内容
色情低俗内容
取消