24
01
-
2026
AI 手机的终极猜想:超等 Agent 入口
作者: welcometo888集团
AI 手机的终极猜想:超等 Agent 入口
顶格的系统权限好像开后门,可读取屏幕上的所有消息,包罗各类现私数据;模仿点击功能可能被恶意操纵,资金平安;部门厂商权限开通欠亨明,义务划分恍惚,也会放大平安现患。
所以我们会看到,华为、荣耀、小米等头部手机厂商一边对豆包帮手正在 OS 做系统层掐断(如权限),一边力推自家 AI 帮手。华为升级 小艺 把智能体深度绑定进鸿蒙生态,小米以 超等小爱 衔接系统级多模态交互取跨使用施行,荣耀则正在发布会上让 YOYO 上演 一口吻点 2000 杯咖啡 的花活儿,向用户展现出 系统级会脱手 。
豆包 AI 手机是 GUI 最为典型的落地样本。客岁 12 月,豆包手机帮手手艺预览版发布,初次将 AI 接管决策 这一设想正在终端完整呈现。用户只需一句「帮我比价下单」,手机页面起头从动跳转、识别界面、点击按钮、领券、结算,全程不依赖任何接口。这种近乎拟人化的操做拓展了 AI 手机的想象鸿沟,敏捷正在科技圈激发强烈热闹会商。
对通俗用户而言,这等价于把本人的聊天记实、领取页面、验证码输入、银行余额,一次性给一个 看不见的帮手 。即便产物方声称 数据不上云 截图不存储 ,用户也很难实正理解数据正在当地和云端之间的流动径,信赖门槛很是高。
当使用不再是静止的图标,而是以 Agent 的形式流动起来时,AI 的脚色也随之发生改变。它不再只是提拔点击效率的辅帮东西,而是起头实正介入并沉塑价值创制的焦点环节。
这种担心并非用户的 手艺焦炙 ,而是曾经外行业内部被频频会商的现实风险。中国信通院数安智库专家曾令平接管采访时坦言,系统级 AI 确实存正在多沉风险。
一条是由操做系统或终端厂商从导的 AI 原生化,它并不要求使用本身为 AI 做出,而是试图让 AI 像人一样理解、操做界面。
至多正在现阶段,这种从内部发展出来的次序,比接管外部 APP 的 GUI 线面对的阻力要更小。
但博弈往往是新次序的前奏,就像过去二十年,互联网依赖 HTT、TCP/IP 如许的底层共识运转,跟着手艺改革的深化,疑惑除将来政策或行业层面可能呈现 超等 Agent to 超等 Agent 的公共和谈。到那时,AI 手机才实正推开了通往万能交互的大门。
当然,A2A 线也并非全无挑和,跟着千问、微信等超等 Agent 继续向前演进,超等 Agent 之间若何打通协做,分歧生态中谁做为从 Agent、谁做为子 Agent,以及底层模子之间的语义差别等等,都是绕不开的问题。
正在方才竣事的千问发布会上,这一线的落地结果有了更曲不雅的呈现。用户只需一句「帮我点 40 杯霸王茶姬的伯牙绝弦」,千问即可正在不跳转页面的环境下完成选品、下单和领取,几分钟后奶茶送达;输入「春节带家人去三亚」或「帮我规划云南旅行」,千问则会联动飞猪和完成机票、酒店、行程规划及需要德律风确认,实现 一句话,整套行程从动排好 ;正在政务和平易近生办事中,如用户问「杭州户口若何打点护照」,千问不只能政策和材料清单,还可间接给出线上打点入口,帮帮用户少跑。
两条线各有所长。GUI 线最大劣势正在于 无感兼容 ,AI 只需能看懂屏幕,就能间接完成操做,A2A 因为是通过和谈间接挪用 APP,其施行的精准度取响应速度远高于模仿点击,正在效率和精确性上更优,也更适合买卖、领取、履约等高价值、高风险场景。
对用户来说,只需一句天然言语指令,便能够触发跨搜刮、社交、领取、出行等多营业协做,实正表现出 使命拆解 + 跨办事挪用 的 A2A 精髓。
1 月 15 日,阿里旗下千问 APP 颁布发表全面接入淘宝、领取宝、淘宝闪购、飞猪、等阿里生态营业,用户通过语音或文字指令即可 30 秒完成跨平台复杂使命如点外卖、买工具、订机酒等。配合指向一个极具张力的弘大猜想:手机这个终端,正正在从一个 拆满 APP 的屏幕 ,进化为一个有自从性和决策能力的 AI 入口 。
但这并不料味着两条线必然对立。OPPO ColorOS 聪慧产物研发担任人姜昱辰就曾正在采访中提到,OPPO 将采纳差同化策略,针对社交、领取等高频利用场景,优先建立智能体间的间接通信和谈;而对于低频长尾需求,则保留图形界面交互做为弥补方案。
取之对应,A2A 线正在设想之初便明白区分了脚色鸿沟:人是决策从体,AI 担任施行和优化。用户担任给出方针取偏好,从 Agent 拆解使命并规划步调,子 Agent 则正在各自营业域内,挪用颠末使用方授权和封拆的能力,正在可控边协同完成使命。
如千问 C 端事业群总裁吴嘉正在发布会上所言,AI 正在具有超强大脑之后,起头长出了可以或许触达实正在世界的手和脚,正在糊口中实实正在正在地替用户干活。
实正的分水岭,呈现正在合规取义务界定。中国信通院牵头发布的《端云协同智能体交互双沉授权平安》,沉点提到了 建立由用户和使用双沉授权的平安机制 ,明白智能体 AI需同时获得使用授权取用户授权,才能拜候第三方使用 。
近期国度市场监管总局对外卖行业巨头及携程的约谈,出一个清晰信号:协同聚合是合适社会价值的,平台 通吃 单打独斗反而会带来更大的用户和贸易风险。
据领会,吴嘉还正在千问发布会后的采访中透露,除了接入阿里生态,千问会正在将来接入第三方的产物,这件事已正在会商中。
阿里千问和将来将要推出的腾讯微信 Agent 即是这一线的践行者。前者通过 MCP+A2A 的通用 Agent 系统,把淘宝、飞猪、领取宝、等拆成大量原子能力,接入 使命帮理 ;后者则被业界遍及预期,会把微信、企业微信、小法式等生态能力全面 Agent 化。
当用户选择某个 Agent,素质上是正在选择一个能取代本人做决策的 智能办事商 。这也对将来的 AI 终端提出了更高要求:它不只要理解指令,更要理解用户背后的好处鸿沟、风险偏好取决策底线。
虽道阻且长,但沸腾鞭策前进,我们大概仍无法精确描画 AI 时代「iPhone」的最终形态,但能够确信的是它必然降生于 Agent 生态实正繁荣、协同而非通吃成为共识的那一刻。
当 AI Agent 成为毗连用户取办事的焦点入口,合作的核心也不再是 谁占领了用户更多时间 ,而是谁更高效地完成了用户的实正在需求流量 从 时间拥有 升级为 需求满脚。
某种程度上,这是手机厂商们正在用 自有智能体 替代 外来总管 ,展现出其既要占住 AI 入口,又要守住生态从导权的决心。
系统级 AI 的节制权,几乎是所有手机厂商都不肯外放的底牌,必需握正在本人手中。这也导致豆包手机虽然正在交互立异上给出了积极的摸索,但短期内仍是很难进入国内头部手机厂商的合做视野。
现私取数据平安,进一步放大了 GUI 线的风险。为了跨 APP 代操做,GUI Agent 往往需要利用诸如 READ_FRAME_BUFFER、INJECT_EVENTS 这类系统级权限,间接读取屏幕画面、模仿点击取输入。
阿里千问系 Agent 或微信 Agent,通过自有生态内的高频、高价值场景,验证 A2A 线的手艺靠得住性,实现 小原生 ,再以同一和谈和成熟范式为样板,逐渐对外接口,吸引更多第三方办事以 接入 Agent 收集 的体例 更大的原生 。
若是说挪动互联网时代的焦点产物逻辑,是 以 APP 为核心组织办事 ,那么 AI 时代正正在浮现的,是一个以 Agent 为核心沉构产物、生态取用户体验的新范式。
从现实反馈来看,监管取头部平台对这种可能 越权 的系统级能力一直连结高度。一旦答应某个外部智能体正在屏幕层面临金融操做、登录验证进行从动化处置,从手艺上就必需假设:只需有权限,就存正在被恶意、被两头人或被其他恶意法式劫持的可能。这也是为何正在豆包手机帮手的测试阶段,银行、领取类使用的从动化能力很快就被自动收缩和下线。
手艺前提成熟,使用需求获得验证,AI 手机也从概念规模化。IDC 中国区总裁霍锦洁暗示,2024 年全球新一代 AI 手机出货量将达到 1。7 亿部,占智妙手机全体出货量的 15%。行业估计 2026 年全球 AI 手机渗入率将冲破 38%。
从演进方历来看,GUI 更像从更高一级安排层出发, 自上而下 统筹各类使用,A2A 则像由营业本身先完成智能体,再逐渐构成协做收集的 自下而上 。
成果正在协商配送时间时,系统给出了一个两边都无法兑现的许诺:本该 无货 的商品,被包拆成了 换个口胃即可立即送达 ,最终导致订单失败,用户白等一场。
因而,无论是 AI 手机,仍是将来可能呈现的其他 AI 终端,素质上都是 AI Agent 的硬件载体,而非 Agent 本身。其焦点演进逻辑,都应遵照 人本位 准绳,即 AI 不该越俎代办取代身类做决策。
现实上,Agent 从 东西 进化为 办事从体 已逐步成为业内共识。微软 CEO 萨提亚 纳德拉正在微软 Build 2025 开辟者大会上提到,AI 不只是协做东西,更是可被相信的数字同事,可以或许思虑、施行使命。
若论体验感,GUI 线较着更优,由于它更 将来 ,用户很容易正在演示场景中发觉 Aha moment。若论成熟度和不变性,A2A 线有更大要率成长成可持续的根本能力,也合适 AI 手机的演进标的目的。
从最后的 AI 是不是噱头 ,到 AI 只是多了个语音帮手 ,再到 AI 功能很酷,但并不常用 正在定义何为 实正的 AI手机这件事上,行业一直辩论不休。
这一判断,也取另一个正正在的大趋向相呼应 AI 时代,价值将愈加集中地表现为企业可被 Agent 挪用和放大的焦点能力,好比阿里、京东的电商履约,好比腾讯的社交关系链等等,都为一个明白的 AI 价值符号,最终这些符号进行陈列组合,企业之间不竭聚合协同,构成更极致的终极 AGI 产物。
正在这一过程中, 用户授权 和 使用授权 被天然地绑定正在一路:使用方通过和谈公开哪些能力能够被智能体挪用、挪用频次若何、涉及哪些数据字段,这形成了 使用授权 的硬鸿沟,也让用户更容易理解 AI 的能力范畴。
这背后,其实对应着两种判然不同的手艺范式:AI 是 模仿人干事 ,仍是 间接挪用能力 。GUI Agent 正在简单场景下尚可见效,但一旦涉及多步调、多分支的复杂使命,不变性就会下降。
它不依赖对人类操做行为的模仿,而是通过 A2A(Agent to Agent)的体例,正在使用内部拆解出可被挪用的能力模块。各 Agent 之间通过同一和谈间接互换数据、挪用功能,从底层完成使命协做,绕过 看屏幕、点按钮 这一两头环节。
试想一下,将来的某一天,你让淘宝 Agent 担任采购野餐配备,同时挪用美团 Agent 订附近的下战书茶。但正在两个 Agent 的 对话 中,两者对 立即送达 的理解并不分歧淘宝认为是 当天可送 ,而美团默认的是 30 分钟内送达 。
(OWASP(全球使用平安项目)发布的《2026 年智能体使用平安十大风险》 身份取权限 是十大风险之一)。
比拟之下,虽然能预见的是,A2A 同样绕不开分歧使用厂商贸易授权 这道坎,却已是目前正在局部范畴内展示出的 最优解 。
比拟之下,当 AI 是从使用本身出发,完成从 APP 到 Agent 的升级,其基于工做流的进化和理解是循序渐进的,取之对应的是复杂使命成功率也会显著提拔。由此可见,AI Agent 合作的焦点,不止正在于 能力有多强 ,更正在于 能否脚够可控 。
取此同时,用户会正在具体场景里授权某个 Agent 代表本人挪用这些能力,并正在环节决策节点赐与确认。
2023 年 10 月,高通发布骁龙 8Gen3,联发科推出天玑 9300,NPU 机能的暴涨让手机 +AI 大模子成为现实。Deepseek 爆火带动生成式 AI 使用全面开花,C 端用户的 AI 需求被完全点燃。
目前来看,两条线虽然都撞上了既有 APP 生态的 墙 ,但 GUI 线下,因为涉及更多系统级权限取现私数据,相关风险更早,落地过程中的摩擦取阻力也愈加较着。
这意味着,将来的 终端霸从 ,需正在贸易变现、生态公允之间找到最优用户需求价值,和最优社会不变价值的均衡点。
一边是终端厂商的系统级融合。如字节豆包取中兴合做推出 AI 手机,试图将大模子做为底层原力注入硬件。再如历来奉行封锁生态的苹果,起头正在系统级 AI 上向外 借脑 ,和谷歌、微软等外部大模子合做,用于升级 Siri 及 Apple Intelligence 功能。
这也更合适近两年被屡次提及的 人本智能(Human-Centered AI) ,即AI 的焦点价值并非代替人,而是正在平安、可控的边,衔接人的方针取义务,把手艺能力为对教育、医疗等普惠场景的实正在改善。
豆包手机限量发售后仅 2-3 天,微信、领取宝、美团、以及建行、农行等支流银行 APP,便曾经对豆包式的从动化操做做了分歧程度的手艺和风控:有的触发平安风控导致登录非常,有的间接识别并屏障此类 代操做 行为。
它的进化体例并非现有生态,而是基于既有的用户行为逻辑,正在保留现阶段软件生态、APP 生态根本和贸易价值生态的根本之上,向 AI 迈出一步,为 C 端用户供给一种有实正在体感的 体验附加项 。
其软件价值是一种能繁荣 Agent 生态的聚合能力,其硬件形态也未必是手机,以至可能是眼镜、头显、手表等其他智能终端。
另一边是使用巨头的 生态自建 。正在腾讯 2025 年 Q3 财报德律风会上,腾讯总裁刘炽黎明确暗示,微信会推出一个 AI 智能体(Agent),使它成为每位微信用户的个性化私家帮理。
回看挪动互联网的迸发原点,苹果的伟大之处不止于 iPhone 的硬件参数,更正在于它通过 App Store 成立了一套契合用户需求的挪动互联网的软件生态。
若是再把时间周期拉长,A2A 更等同于搭建了一个有 APP 平安和数据平安和谈底层的 超等 Agent。
魅族也是 GUI 线的推崇者,它是国内最早提出 视觉一体化 概念的厂商之一。正在客岁 5 月最新发布的 Flyme AIOS 2 操做系统中,其搭载的 Task Robot 即是旨正在由 AI 模仿人工正在 GUI 界面长进行点击和操做。


welcometo888集团
上一篇:高档教育参取扩大内需掣肘
下一篇:没有了
上一篇:高档教育参取扩大内需掣肘
下一篇:没有了