①ChatGPT开启高级语音模式:实时视频通话、屏幕共享和图像上传; ②高级语音模式支持超过50种语言,9种逼真输出语音选项,且每种语音都有自己独特的语气和特征。 ③不仅让ChatGPT作为AI陪伴工具的体验感大幅提升,也为更高效强大的AI教育工具作出了示范。
①Gemini 2.0将是支撑谷歌智能体开发的最新一代模型; ②第一时间上线的是比Gemini 1.5 Pro更强的Gemini 2.0 Flash实验版。
①不需要预先的地图,结合实时的视觉图像和激光雷达信息,机器人可实时感知环境; ②NaVILA还进一步将导航技术从轮式扩展到了足式机器人,研究人员对宇树Go2机器狗和G1人形机器人进行了实测; ③NVILA模型具有强大的多模态推理能力。