财联社
财经通讯社
打开APP
大模型公司盯上硬件入口?智谱发布首个手机Agent
①《科创板日报》记者在内测中发现,AutoGLM 2.0能够真实帮助人们“干活”,且不是直接接管手机,而是在软件内部中的云手机中完成操作;
                ②智谱AutoGLM负责人刘潇介绍,AI不仅能“自动驾驶手机”,还可“异步代理办公”。让手机变成具备自主执行、跨端协作能力的智能体手机。

《科创板日报》8月20日讯(记者 李明明)智谱又有新动作。

今日,智谱发布AutoGLM 2.0,由国产模型 GLM-4.5 与 GLM-4.5V 驱动,具备推理、代码和多模态处理能力,能够在多种设备和场景中运行,面向普通用户开放。与常见的移动端 AI 助手不同,其定位是能够在设备上执行具体操作的智能体。智谱方面介绍称,这是全球首个手机 Agent。

《科创板日报》记者在内测中发现,AutoGLM 2.0能够真实帮助人们“干活”,且不是直接接管手机,而是在软件内部中的云手机中完成操作,在此期间用户可以使用其它APP。

AutoGLM 2.0的发布也意味着,智谱想先拿下那枚最稀缺的资源:手机屏幕上的“入口级流量”。

记者内测AutoGLM 2.0

先来简单介绍一下AutoGLM 2.0的操作方式。进入APP之后,页面有“生活助手”和“办公助手”两类的任务栏目。

随后,《科创板日报》记者内测了AutoGLM 2.0,分别选取了生活助手和办公场景。

首先记者下了一个任务,让贝壳找房搜一下北京朝阳区附近的租房,按照最新发布的时间查看。

实测过程中,记者只是在手机上输入一句话,它便能立即启动并执行任务,接管操作流程,无需在各类APP间频繁切换。过了几分钟后,AutoGLM 2.0就给记者找到了满意的房子,基本符合设定的价格和位置要求。

接着,《科创板日报》记者又升级了任务,同一句话多个指令:在小红书上搜索骑行到四海镇的攻略,然后打开汽水音乐随机播一首歌,最后用高德选骑车导航过去。

三分钟左右,AutoGLM 2.0快速的在APP间各种查找后,给出了满意的结果。

紧接着,《科创板日报》记者又测试了办公助手的“智能体电脑”,下达了指令:请结合新能源汽车金融行业近半年市场规模、主要企业财务表现跟政策影响,预测其2025年第四季度的业绩表现,包括营收、净利润和关键业务板块的变化预估,并输出为结构清晰的分析可视化网页。

很快,AutoGLM 2.0生成了详细的报告。

重构人机交互:从“手机自动驾驶”到跨设备智能延伸

步入AI发展的下半场,如何推动AI从“能言”向“善为”跨越,已成为产业界聚焦的核心命题,而智能体正被视作实现这一突破的关键载体,承载着行业的高度期待。

过去的 AI 多停留在“对话”层面,只能回答问题;一般的 Agent 助手也多局限于信息查询和总结。

谈及AutoGLM 2.0的升维作用,智谱AutoGLM负责人刘潇对《科创板日报》记者表示,事实上,在 AutoGLM 1.0 中,智谱已探索过让 AI 代替用户完成部分手机操作,但只在有限场景下生效。如今,随着 AutoGLM 2.0 的发布,它已经成长为一名执行型助手,能够在云端自主完成多样化的任务。“AutoGLM 2.0实现了质的飞跃——它不再只是‘说’,而是真正能够‘做’。 而且重要的一点是,它几乎不占用本地资源。”

在内测中《科创板日报》记者也注意到,AutoGLM 2.0支持一句话实现云端操作+自动执行。简言之,它为每个用户部署了一台云手机与云电脑。只需发布指令,AutoGLM 就能直接在云设备上帮助完成各种任务:打开 App、浏览网页、点外卖、订酒店、制作PPT和网页、生成视频,甚至在多个 App 间协同操作。用户无需安装、无需连接,所有任务都在云端执行,不占用自己的手机或电脑资源,也不打断正在进行的操作。

刘潇介绍,这也意味着AI不仅能“自动驾驶手机”,还可“异步代理办公”。让手机变成具备自主执行、跨端协作能力的智能体手机。

借助AutoGLM的云端执行能力,人与设备的交互方式正在被重新定义。“我们已将AutoGLM的操作执行能力封装为API,开发者只需简单接入,即可将这一能力无缝融入各类硬件设备,从AI眼镜等可穿戴设备到传统家电。AutoGLM首次让硬件具备完整的手机级操作能力,无需在端侧堆叠复杂系统或大容量电池。例如,可以通过智能眼镜点一杯咖啡。” 刘潇说。

掌握手机端口流量

关于本次智谱发布手机Agent,业内认为这不仅是一次简单的产品发布,可能影响未来的产业布局。

北京计算机学会AI专委会秘书长、北大人工智能博士张有鱼告诉《科创板日报》记者,此次发布最根本的目标,是试图改变过去十余年由智能手机所定义的、以应用(APP)为基本操作单元的人机交互范式。

而手机Agent所要构建的,是一个“意图驱动”的新范式。在这个范式下,交互的核心不再是APP,而是用户的自然语言意图。用户只需提出“半小时后送我去机场,选一条不堵的路”,Agent作为中枢系统,会负责理解这个意图,并将其拆解为一系列子任务,并将结果反馈给用户。其目标是最大化地降低用户实现最终目的所需的操作步骤和认知成本。

《科创板日报》记者注意到,AI行业竞争焦点正在转移:从“模型能力”到“场景闭环”,过去,大模型行业的竞争主要集中在基础模型的能力层面, 而发布手机Agent,标志着竞争的焦点正式进入下半场:场景落地与商业闭环。而手机,无疑是实现这一目标的最关键载体。

AutoGLM 2.0的发布也意味着,智谱想先拿下那枚最稀缺的资源:手机屏幕上的“入口级流量”。手机是当今社会最高密度的个人数据终端,,并覆盖了用户工作、生活、娱乐的绝大多数场景,为Agent提供了足够多的、有价值的任务去完成,从而验证和迭代其任务规划(Task Planning)与工具调用(Tool Calling)的能力。

张有鱼认为,AutoGLM 2.0的众多便利功能,让其有望吸引大量用户。一旦用户基数扩大,其手机端口的流量价值将不可估量,这无疑会吸引众多app主动寻求合作,接入AutoGLM 2.0的生态。通过与各类app的深度融合,AutoGLM 2.0能够为用户提供更全面、便捷的服务,进一步增强用户粘性,形成良性循环。

对于手机厂商而言,AutoGLM 2.0同样极具吸引力。它可以集成到手机系统中,成为手机的特色功能,提升手机的智能化水平和用户体验,在激烈的市场竞争中脱颖而出。目前,智谱已经推出移动端API申请通道及开发者生态共建计划,这为手机厂商与智谱的合作搭建了桥梁。

“因此,通过手机Agent,大模型公司不再仅仅是提供API的技术供应商,而是试图成为掌控服务分发和用户入口的平台运营商,其商业想象空间远超当前。发布手机Agent可以说是一个‘牵一发而动全身’的战略举措。它不仅预示着交互方式的代际变革,更启动了对整个移动互联网产业价值链的重构进程。尽管当前技术尚处早期,但它所指向的方向,值得行业内所有参与者高度关注。” 张有鱼判断。

科创板最新动态 人工智能
财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
商务合作
热门解锁
相关阅读
评论
发送