①用户和AutoGLM的沟通为语音或文字形式,并实时显示字幕; ②智谱同步发布“人味儿”更重的GLM-4-Voice端到端情感语音模型; ③当下的AI助理依然存在很大的进步空间。
《科创板日报》10月28日讯(编辑 宋子乔) 临近苹果AI功能(Apple Intelligence)发布日,中国独角兽企业智谱AI(以下简称智谱)抢先上线了AI助理工具。
10月25日,智谱用三分钟的视频展示了AutoGLM带来的便利:无需手动操作,用户对着手机说话(发出指令),便可让其自动打开手机上的各类App,进行网购、点外卖、订高铁票,甚至发微信、抢红包、评论朋友圈、整理笔记并生成攻略、总结论文。从宣传视频中已经有的功能看,智谱已展示淘宝、美团、微信等App,这三个公司也是智谱的投资方。
用户和AutoGLM的沟通为语音或文字形式,并实时显示字幕。
手机成为AI助理,只需接收文字/语音指令,就可以模拟人类操作手机,帮你解决日常琐事,这一幕是不是很像电影中的贾维斯来到现实?
同日(10月25日),智谱发布GLM-4-Voice端到端情感语音模型。
该模型的最大亮点在于,“人味儿”更重、交互体验更强。据介绍,GLM-4-Voice能够根据用户指令灵活调整语音的情感、语调、语速及方言等特征,且具有更低的延时,支持实时打断、多语言、多方言。作为端到端的语音模型,GLM-4-Voice避免了传统的“语音转文字再转语音”级联方案过程中带来的信息损失和误差积累,也拥有理论上更高的建模上限,即将上线视频通话功能,旨在打造“能看又能说”的AI助理。
智谱表示,“GLM-4-Voice的出现是智谱在迈向AGI的道路上迈出的最新一步。”
目前,用户可以通过安装“智谱清言”插件体验AutoGLM,AutoGLM也在安卓系统上开放了内测申请,并与荣耀等手机厂商开展了深度合作。
资料显示,智谱在2024年9月与荣耀共同成立AI大模型技术联合实验室,与荣耀进行深度合作。2024年10月23日荣耀Magic9.0发布会展示具备自动驾驶功能的AI Agent YOYO。
开源证券称,智谱AutoGLM大幅提高AI Agent的实用性,或推动AI Agent用户渗透率及商业化空间打开。
国泰君安表示,AutoGLM精准理解用户指令,自动完成App操作,解放用户双手,有望加速手机厂商AI助理落地,具备自动驾驶功能的AI助理可帮助用户摆脱繁琐的App操作,仅需语音指令即可满足用户需求,真正实现AI个人助理,有望驱动AI手机换机潮,带动上游产业链需求上行。
不过AutoGLM依然存在很大的进步空间。国泰君安便表示,手机端的“自动驾驶”仍需明确指令,根据数字生命卡兹克发布的实测视频,AutoGLM自动驾驶需要用户下达明确的指令信息,如预订酒店,需要用户给出时间、地点、预算及相应房型。
另外,执行如“帮我订回家的机票”等更个性化指令,仍需与手机厂商进行合作,获取用户个人信息使用权限方可实现。目前AutoGLM已可自动执行微信、淘宝、美团、小红书等App中用户常用操作,更多个性化操作尚未实现,并且未适配滴滴、京东、微信读书等App,未来需要更多第三方厂商以及更全面的UI训练数据集支持。
AI助理(AI Agent)是一种能够感知环境、进行决策和执行动作的智能实体,具备通过独立思考、调用工具去逐步完成给定目标的能力,可拆解为大模型+规划+记忆+工具使用四个组成部分。
应用场景方面,AI助理适用于销售、供应链、客户服务、财务、人力资源等。
对于AI产业而言,AI助理能够为C端提供个性化应用、为B端提供降本增效方案;对于用户而言,AI助理最核心的功能是AI自主操作手机,辅助完成复杂推理任务。
业界正积极布局和探索AI助理,如阿里的MobileAgent、腾讯的App Agent、荣耀的MagicOS 9.0操作系统、苹果的Apple Intelligence等,微软、谷歌近期也相继推出AI助理应用。
10月22日凌晨,微软宣布在Dynamics365中集成10个自主AI助理,可帮助企业自动执行客服、销售、财务、仓储等业务,这些AI助理支持OpenAI最新模型o1并具备自主学习能力,可以自动执行跨平台的超复杂任务;
10月24日,科大讯飞推出面向教育、医疗、司法、政府服务等领域的AI助手;
彩讯股份于10月11-13日的2024中国移动全球合作伙伴大会上,正式推出一站式AI应用开发平台RichAIBox,可实现多个基座大模型统一接入、企业私域知识库无缝衔接以及多场景智能体可视编排,助力企业快速构建AI应用。在应用层面,公司也推出了3D数字人生成、图生音乐彩灵、AI智舞、AI来电秘书等AIGC产品,覆盖“5G新通话”各场景……
浙商证券表示,近期,国产多模态AI应用的使用情况呈现爆发态势——8月底Minimax推出文生视频模型abab-video-1并应用于海螺AI以来,使用生态呈现加速增长,据“AI产品榜”统计,9月海螺AI网页版访问量环比增长860%;而similarweb数据显示,7月快手“可灵”视频生成大模型上线以来,9月单月web端访问量超1600万次。
该机构认为,AI助理应用的爆发反映出国产多模态AI大模型能力的显著提升,国产多模态AI应用使用情况爆发式增长,为AI助理应用奠定良好基础。
华泰证券表示,AI助理是通往AGI的核心基础,AI助理落地带来多个层次的产业机遇,其中,Agent+终端有望推动人机交互变革,除了在终端销售量价方面的变化外,可能对终端应用的商业模式产生更加深远的影响。
德邦证券认为,由于建立在大模型底层平台上,AI助理在应用场景实现规模化推广以及高频响应后将催生巨大的推理算力需求,推理侧或成为未来算力需求长期蓝海。