
它的实现方式,最初是AI助手借助安卓系统中一个名为“无障碍服务”的功能。这项权限最初是为有视力障碍的人士设计的,好让他们能通过语音指令来操作手机。现在,AI通过这项权限可以“读懂”屏幕上的文字和图标,然后模拟人的手指去点击、滑动,从而操作各种App。之后不久,市场上出现了比调用无障碍权限更“领先”的路线,也就是AI助手拿到了手机厂商给自己的系统签名权限,从而通过进程注入,更丝滑、无感地模拟操作。
当用户习惯了通过一个AI助手来操作所有App时,这个助手就成了新的流量入口,这背后的商业价值,相当有吸引力。”关注互联网公司的投资人林亮表示。
很多用户担心的是安全和隐私风险。GUI模式下,AI需要通过“读屏”来理解屏幕内容,进而决定下一步操作,就意味着,它需要实时获取屏幕信息。尽管厂商们承诺数据会加密或不上传,但用户心中难免会有疑虑:用户的数据在什么情况下被收集、如何被使用、谁来负责?
A2A需要操作系统厂商、应用开发者共同推进一套标准化的协议。没有足够多的应用支持,A2A的价值就显现不出来;没有明确的价值,开发者就缺乏适配的动力。
GUI虽有一定风险但高效,能让厂商用最小代价快速验证AI手机的可能性。A2A稳妥但缓慢,需要更多协调和投入,不过一旦成功,就能建立一套更安全的体系。
巨头的GUI尝试,主要在PC端,而且,严格限制在受控环境(如浏九游娱乐 九游娱乐官方览器、沙盒、虚拟机)内。
在A2A路线之上,它们还在走一条以自家操作系统或AI大模型为核心的“混合生态”的路线。在这套体系里,既有标准的API调用,也有更底层的系统级智能体,最终目的都是为了掌握生态主导权,从一个“设备提供商”,升级为未来生态的“规则制定者”之一。
GUI路线要求大模型同时承担“感知屏幕(眼)、规划任务(脑)、模拟操作(手)”的工作,负担重、效率低且易出错。A2A路线,则是让AI回归到它最擅长的“大脑”角色,专注于理解与任务调度,具体的执行交给各垂直领域优化的应用智能体。这种“各司其职”的模式,不仅更高效可靠,也为未来更复杂的智能体协作打下了基础。
商业成本角度看,A2A是更经济的选择。GUI方案看似“快”,但长期运营成本高。
其次,“智能体工厂”与垂直Agent服务商将迎来爆发。基于标准协议,为金融、医疗、物流等特定行业开发专属智能体,将成为一个巨大的市场。未来,可能会有专门的“智能体商店”,你可以像下载App一样,为你的手机雇佣一个“私人理财顾问”或“专属旅行规划师”。这为无数中小开发者,提供了全新的创业机会。
相关新闻热文排行1胖东来因虚构商品成本被处罚50万元?许昌官方:信息不实