①2024年对于生成式AI行业而言,是充满变革与突破的一年。 ②面向2025年,生成式AI行业又会发生哪些新变化?行业将有哪些看点?我们让几个AI大模型回答了这个问题。
《科创板日报》2月26日讯(编辑 郑远方)据知名苹果爆料记者马克•古尔曼消息,苹果正在探索开发带摄像头的AirPods。
在苹果一个代号为B798的项目中,该公司正在测试在耳机上安装低分辨率摄像头,该耳机大小与目前的AirPods差不多。
古尔曼称,去年苹果工程师已开始探索这一方向。若这一产品成功发布,则可以提供人工智能功能,AI可以使用摄像头拍摄的画面,并通过多模态语音、图像人工智能系统,帮助用户跟踪自己的日常活动,协助人们的日常工作,优化日常作息。
“AI+耳机”,同样也是三星与谷歌的布局方向。不过以目前信息来看,与苹果“长眼”的AirPods不同,三星与谷歌似乎暂时仅限于语音互动。
其中,有媒体在谷歌测试版APP发现,谷歌正计划将智能助理Gemini搭载在Pixel Buds Pro等无线耳机上,通过生成式AI技术,用户可以下达比以往Google助理更复杂的指令。
除了基本的音量/媒体控制,Gemini还可以回答诸如“附近有咖啡店吗”“今天通勤路况如何”“导航到这个地方”等多种问题。目前该功能尚未推出。
三星则准备将旗下的Galaxy AI功能安装在Galaxy Buds2 Pro、Galaxy Buds2及Galaxy Buds FE 等无线耳机上,无需网络便能实时进行翻译。三星总裁卢泰文也透露,下一步计划将AI 应用延伸至智能手机以外,并且特别点名Galaxy穿戴装置,将通过AI强化数字健康的体验。
值得注意的是,耳机同样也被比尔•盖茨视为AI Agent交互的下一个突破口。
他指出,AI Agent“将彻底改变计算机使用方式,并颠覆软件行业。”目前,有多种互动途径都在探索中,包括应用程序、眼镜、吊坠、别针、全息图。
盖茨认为,交互的第一个重大突破将是耳机。当航班延误时,它将在耳机里与你对话,或出现在你的手机屏幕上:“您的航班延误,您想等一等,还是需要我帮忙重新订票?”不仅如此,AI Agent可以检测传入你耳中的声音,还能屏蔽背景噪音、放大听不清的语音或让口音重的人更容易听懂。