一天内海外AI大模型接连上新还有“重大发布”蓄势待发

①谷歌、OpenAI、Anthropic三家公司在AI大模型上都有了新动作。
②OpenAI前不久刚刚宣布即将发布GPT-5,；而Anthropic也在今日宣布，计划在未来几周内发布“对模型的重大改进”——可以想见，届时AI大模型又将掀起一波迭代更新潮。

人工智能

关注

《科创板日报》8月6日讯 一天不到的时间内，谷歌、OpenAI、Anthropic三家公司在AI大模型上都有了新动作。

先是谷歌正式发布了Genie 3，这款通用世界模型能生成“前所未有的丰富交互环境”。

有多“前所未有”？Genie 3是首个支持实时交互的世界模型，单次交互时长从几十秒延长到数分钟，并首次加入“可提示的世界事件”和“视觉记忆”等关键特性，能以每秒20-24帧速度，实时生成720p画面，并能保持数分钟的画面一致性。

通俗点来说，用户可以在生成的动态世界中多视角自由探索，且即使用户多次往返之后，同一地点的同一物品细节仍能保持一致——这种“记忆力”对于模型来说可以说是一项重大技术突破。

“这就是游戏引擎2.0。”英伟达高级科学家Jim Fan如此断言，“未来某一天，UE5 那样复杂的系统，将被一个由数据驱动的注意力权重块取代。这个系统只需要接收来自手柄的操作指令，就能直接渲染一段动态的时空画面。”

当然，作为一个通用模型来说，游戏并非Genie 3的唯一应用场景。除了游戏外，Genie 3还能为机器人或自动驾驶系统提供多元化训练场景，可以为AI智能体研究提供更长、更稳定的交互回合。

Anthropic则在发布Claude Opus 4不到3个月之后，推出Claude Opus 4.1。公司表示，新版本是Claude Opus 4在“Agent任务、真实世界编码和推理能力上的全面提升”。

在SWE-bench Verified基准测试中，Opus 4.1较Opus 4提升了2个百分点，达到74.5%，而相比Sonnet 3.7则提升幅度更大，后者仅为62.3%。另外，Opus 4.1在智能体工具调用、多语言问答能力和智能体编程上超越OpenAI o3，但在视觉推理和数学能力上与OpenAI o3和Gemini 2.5 Pro还有一定差距。

OpenAI则发布了两款“开放权重”大模型，GPT-oss-120b和GPT-oss-20b。公司CEO Sam Altman表示，“GPT-oss是一个重大突破，这是最先进的开放权重推理模型，具备与o4-mini相当的强大现实世界性能，可在电脑上本地运行。”

值得注意的是，OpenAI前不久刚刚宣布，即将发布GPT-5,；而Anthropic也在今日宣布，计划在未来几周内发布“对模型的重大改进”——可以想见，届时AI大模型又将掀起一波迭代更新潮。

国内方面，多家公司也在近日发布大模型迭代。例如Kimi发布Kimi K2，具备更强代码能力、更擅长通用Agent任务；智谱发布GLM-4.5，专为Agent应用打造，增强推理、Agent能力，在工具调用可靠性和任务完成度上表现突出；Qwen3发布升级版235B和30B模型、以及30B推理模型，显著提升推理、Agent能力等。

太平洋证券指出，目前模型后训练阶段仍具备工程红利，基于此国内外大模型持续拓展智能边界，且国内模型在开源领域表现突出，在Hugging Face开源前10榜单中占据8位，而海外OpenAI、xAI等仍在闭源发力。同时，各基础大模型均实现通用Agent能力提升，模型即Agent的范式或正在形成。

特别声明：文章内容仅供参考，不构成投资建议。投资者据此操作风险自担。