①谷歌、OpenAI、Anthropic三家公司在AI大模型上都有了新动作。 ②OpenAI前不久刚刚宣布即将发布GPT-5,;而Anthropic也在今日宣布,计划在未来几周内发布“对模型的重大改进”——可以想见,届时AI大模型又将掀起一波迭代更新潮。
《科创板日报》8月6日讯 一天不到的时间内,谷歌、OpenAI、Anthropic三家公司在AI大模型上都有了新动作。
先是谷歌正式发布了Genie 3,这款通用世界模型能生成“前所未有的丰富交互环境”。
有多“前所未有”?Genie 3是首个支持实时交互的世界模型,单次交互时长从几十秒延长到数分钟,并首次加入“可提示的世界事件”和“视觉记忆”等关键特性,能以每秒20-24帧速度,实时生成720p画面,并能保持数分钟的画面一致性。
通俗点来说,用户可以在生成的动态世界中多视角自由探索,且即使用户多次往返之后,同一地点的同一物品细节仍能保持一致——这种“记忆力”对于模型来说可以说是一项重大技术突破。
“这就是游戏引擎2.0。”英伟达高级科学家Jim Fan如此断言,“未来某一天,UE5 那样复杂的系统,将被一个由数据驱动的注意力权重块取代。这个系统只需要接收来自手柄的操作指令,就能直接渲染一段动态的时空画面。”
当然,作为一个通用模型来说,游戏并非Genie 3的唯一应用场景。除了游戏外,Genie 3还能为机器人或自动驾驶系统提供多元化训练场景,可以为AI智能体研究提供更长、更稳定的交互回合。
Anthropic则在发布Claude Opus 4不到3个月之后,推出Claude Opus 4.1。公司表示,新版本是Claude Opus 4在“Agent任务、真实世界编码和推理能力上的全面提升”。
在SWE-bench Verified基准测试中,Opus 4.1较Opus 4提升了2个百分点,达到74.5%,而相比Sonnet 3.7则提升幅度更大,后者仅为62.3%。另外,Opus 4.1在智能体工具调用、多语言问答能力和智能体编程上超越OpenAI o3,但在视觉推理和数学能力上与OpenAI o3和Gemini 2.5 Pro还有一定差距。
OpenAI则发布了两款“开放权重”大模型,GPT-oss-120b和GPT-oss-20b。公司CEO Sam Altman表示,“GPT-oss是一个重大突破,这是最先进的开放权重推理模型,具备与o4-mini相当的强大现实世界性能,可在电脑上本地运行。”
值得注意的是,OpenAI前不久刚刚宣布,即将发布GPT-5,;而Anthropic也在今日宣布,计划在未来几周内发布“对模型的重大改进”——可以想见,届时AI大模型又将掀起一波迭代更新潮。
国内方面,多家公司也在近日发布大模型迭代。例如Kimi发布Kimi K2,具备更强代码能力、更擅长通用Agent任务;智谱发布GLM-4.5,专为Agent应用打造,增强推理、Agent能力,在工具调用可靠性和任务完成度上表现突出;Qwen3发布升级版235B和30B模型、以及30B推理模型,显著提升推理、Agent能力等。
太平洋证券指出,目前模型后训练阶段仍具备工程红利,基于此国内外大模型持续拓展智能边界,且国内模型在开源领域表现突出,在Hugging Face开源前10榜单中占据8位,而海外OpenAI、xAI等仍在闭源发力。同时,各基础大模型均实现通用Agent能力提升,模型即Agent的范式或正在形成。