财联社
财经通讯社
打开APP
谷歌推出Gemini 3.5系列模型 Omni视频生成迎来关键突破
Play
语音播报
00:00
/
00:00
00:00
语音播报由AI生成
①谷歌宣布推出Gemini 3.5系列模型,包括Gemini 3.5 Flash和Gemini 3.5 Pro,以及一款新型AI模型Gemini Omni;
                ②谷歌还推出了Gemini Spark,一款新型通用AI智能体,能够对关联应用中的信息进行跨平台推理。

财联社5月20日讯(编辑 牛占林)在全球人工智能(AI)竞争加剧的背景下,谷歌宣布推出Gemini 3.5系列模型,以及一款用于模拟物理世界的新型AI模型,旨在在模型开发方面保持领先,同时为其庞大的用户群提供更多AI智能体服务。

谷歌在周二举行的年度开发者大会(Google I/O)上发布了上述消息,当前市场正高度关注OpenAI与Anthropic两家公司飙升的估值,这两家公司均计划最早于今年进行IPO。

谷歌AI战略的核心依然是Gemini系列及相关工具。周二公司重点展示了Gemini 3.5 Flash,这是该系列的一款轻量级产品。

谷歌首席执行官桑达尔·皮查伊表示,Gemini 3.5 Flash在提供尖端能力的同时,其成本仅为同类顶尖模型的一半,甚至有时不到三分之一,同时保持了高智能水平。

皮查伊称Gemini 3.5 Flash“速度极快”。谷歌同时宣布,该型号将成为全球Gemini应用和搜索AI模式的默认模型。

谷歌在博客中指出:“用户无需再在质量与响应速度之间做取舍。”公司还强化了Gemini 3.5 Flash的网络安全防护,使其“生成有害内容的可能性更低,也不易在安全问题上拒绝回答。”

至于重量级版本Gemini 3.5 Pro,目前仅在内部使用,预计下月才会向更广泛的用户开放。

在AI智能体方面,谷歌推出了Gemini Spark,这是Gemini应用中一款新型通用AI智能体,能够对关联应用中的信息进行跨平台推理。谷歌表示,该工具能够管理用户的数字生活,并代表用户执行操作。Gemini Spark目前处于测试阶段,下周将首先向受信任的测试用户及Google AI Ultra订阅用户开放。

皮查伊表示:“我们已经将智能体带给开发者和企业一段时间了。现在,我们专注于将这种前沿能力安全可靠地带给消费者,让每个人都能受益。”

随着越来越多的互联网用户使用聊天机器人,谷歌正在努力说服传统搜索用户信任其完成最少输入即可执行的任务。在公司资本支出大幅上升的情况下,华尔街关注谷歌是否能实现产品深度整合,而智能代理功能可能成为重要突破口。

AI公司的市场预期持续上升,尤其是在Anthropic近期发布的Mythos模型背景下。据称,该模型强大到能够发现全球软件基础设施中的数千个未知漏洞。

谷歌的AI产品组合还包括Gemini Omni,这是一款用于模拟物理环境的世界模型,可以根据用户的操作预测接下来会发生的情况。世界模型通常用于机器人和游戏领域,多年来一直是DeepMind重点研究方向。而Omni在物理模拟方面更准确,例如重力、流体动力学和动能等。

谷歌DeepMind首席AI架构师兼技术总监Koray Kavukcuoglu介绍称:“Omni可以生成非常高质量的视频,并允许用户在生成后与视频进行互动。可以想象,这为学习和探索提供了类似教程的能力。”

Omni可在Gemini Flash、Gemini应用、Google Flow及YouTube Shorts中运行,支持图像和音频功能。谷歌在另一篇博客中指出,用户可利用Omni编辑视频并生成更逼真的图像效果。

"拍摄一段视频,可以让Omni改变其中正在发生的内容。"谷歌表示,这款AI模型能够"编辑动作、添加新角色或物体"。

高质量视频的生成一直是AI工具的难点,而且对计算资源要求极高。OpenAI在今年早些时候就放弃了其视频生成工具Sora,部分原因就是为了将算力资源用于其他项目。

环球市场情报 人工智能
财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
商务合作
热门解锁
相关阅读
评论
发送
复制
取消
垃圾广告
政治激进内容
色情低俗内容
取消