中国青年网

科技

首页 >> AI+ >> 正文

豆包“破局” AI智能体未来什么样

发稿时间:2025-12-23 10:44:00 来源: 中国青年报

  “字节跳动在AI手机方面的尝试,在整个互联网生态上撕出来一道口子。”

  ---------------

  试想一个场景:对手机说一声“帮我在附近点一杯咖啡”,手机就能按照指令自主打开App(应用程序)、点单、下单,而你只需确认订单并支付,根据提示到咖啡店领取咖啡就可以了——这听起来很科幻,但已经变成了现实。

  不久前,字节跳动发布“豆包手机助手”技术预览版,并与中兴合作发售了工程样机nubia M153(以下简称“豆包AI手机”)。这个手机助手在豆包App的基础上,与手机厂商在操作系统层面进行了合作。根据官方演示,豆包AI手机已实现跨应用操作,能直接帮用户点外卖、订机票、比价购物等,俨然一个“系统级管家”。

  然而,豆包手机助手上线次日,部分用户在工程机上让其操作微信,却收到“登录环境异常”的提示,账号被强制下线或短期冻结。同时,淘宝弹出验证码、多家银行App以“风险环境”为由中止登录和支付……限制使用情况接连出现。没用几天,其就变成了各大App的“重点风控对象”。

  一边是系统级AI Agent(智能体),一边是微信、淘宝及各类金融App,一场移动互联网生态“地震”正悄然发生。在业内专家看来,豆包手机助手引发的系列反应,既有安全性考量,也掀开了关于流量入口主权、数据安全边界等变革的序幕。

  安全防控与“流量入口”博弈

  开售第一天,豆包AI手机就宣告售罄,北京双湃智安科技有限公司首席科学家陶耀东特意向朋友借了一部豆包AI手机来体验。在日前举行的中国计算机学会青年计算机科技论坛特别论坛现场,陶耀东向中青报·中青网记者展示了豆包手机助手如何完成任务。

  以预订机票为例,陶耀东打开手机,语音发出“给我订一张今天下午6点以后飞南京最低票价的机票,只要直飞”的指令,豆包手机助手后台执行了1分多钟后回复了具体机票信息,显示“票价504元”,此时只需手动确认支付,订票任务就完成了,其间无需其他点击或操作。

  “确实能省点时间,但完成任务的过程还不是很丝滑。”在陶耀东看来,豆包手机助手本质上就是一个AI Agent,核心价值就在于解放双手、提升效率。此前用户想在网上买到低价机票,往往需要在多个App间来回切换、搜索、比价。而豆包手机助手可以根据指令,自动打开App搜索产品并比价,“解放了用户的双手”。

  实际上,AI手机助手并非豆包首创。此前,荣耀和京东联合推出一款AI手机,可一键唤醒AI,用语音打开乘车码、导航等;OPPO则在新版操作系统中增加了“AI一键闪记”功能,能自动总结屏幕内容。为何豆包手机助手这次遭到一众互联网平台的“限制”?一个很重要的因素是:安全性。

  据了解,当前AI手机助手有两种实现路径:一是手机操作系统与App之间达成协议,让AI助手借助App开放接口执行任务,这种效率高,但双方需要合作;二是大模型获取操作系统授权,结合屏幕识别等信息,理解界面结构并模拟人类手势进行操作,豆包手机助手就是典型代表。

  正是后面这一路径,引发了外界对豆包手机助手安全性的质疑。作为10多年前“3Q大战”(腾讯与360之争)的亲历者,中国计算机学会常务理事、知名网络安全专家谭晓生犀利地指出,豆包手机助手在通过底层技术读取屏幕、执行任务过程中,没有交待清楚如何解决用户隐私保护等问题。“这给了平台方一个合理的‘限制’理由。”谭晓生说。

  不过,豆包手机助手团队表示,手机助手执行任务需用户授权,在执行过程中有明确展示,用户可以中断。其发布的“隐私安全白皮书”也强调,豆包手机助手借助硬件级的隔离与加密保护机制,实现对用户数据的全方位守护,不会使用用户敏感数据训练模型,数据在传输和存储过程中均为加密状态。

  但在北京交通大学计算机与信息技术学院教授桑基韬看来,豆包手机助手实现跨应用操作的方式,与外挂程序等看起来差不多,在现有安全体系下较难区分,引起了相关App的安全防御。他也强调,相关安全防御举措其实一直都有,并非专门针对豆包手机助手而设。典型的例子就是:B站也不允许AI助手自动总结站内视频内容。

  更深层次看,这其实是一场有关商业利益与“流量入口”的博弈。工业和信息化部的数据显示,截至今年10月末,我国移动互联网用户数已达16.17亿户。智能手机时代,淘宝、美团等应用正是依靠大量用户的高频使用,构建起广告、佣金、会员等多元收入体系。

  “豆包手机助手这次是‘动了别人的蛋糕’,甚至想把蛋糕‘连盘端走’。”桑基韬分析说,目前淘宝、微信等超级App拥有流量分发权,用户访问App,App将流量分给不同商户。“如果在操作系统层有一个AI Agent掌握分发权,将替代超级App成为新的流量入口,这对有数据壁垒的App来说,是无法接受的。”

  陶耀东说,互联网平台现在主要靠用户停留和广告来赚钱,豆包手机助手等系统级AI Agent要做的事就是把用户停留在App上的阶段越过去,提升效率,“这将直接影响到广告收入,可能是千亿元级”。但他也表示,对那些排名不算靠前的App来说,这可能是个机会。“比如效率提升、技术赋能的机遇,新变现场景等,未来可能还有很多新机会出现。”

  交互方式的革命性变革

  豆包AI手机面世后,绿盟科技集团首席创新官刘文懋想到了一个问题:“从过去15年甚至更长的时间线来看,人机交互的方式从最早的鼠标、键盘交互,变成了App点击交互。未来会不会变成人与智能体对话交互?”换句话说:未来,AI Agent是否会终结超级App时代?

  对此,北京大学人工智能研究院研究员杨耀东给出的答案是:两者并非二元对立,AI Agent带来的将是交互方式的根本性变革。他解释道,超级App本质上是功能的聚合,即把社交、支付等具有网络效应的功能结合在一起;而AI Agent的核心目标是将任务自主进行拆分和理解,它其实是一个跨系统执行任务的个体。

  杨耀东说,AI Agent通过自然语言交互,压缩了人参与任务执行的中间步骤,降低了用户的认知负担。比如在制定假期日程时,用户原本需要跨越携程、日历、便签本等多个App,而通过豆包手机助手,一句语音指令就能搞定,这种“去中间化”的能力是AI Agent的核心优势。他强调,未来AI Agent虽然在形式上可能改变App的现有形态,但在功能上,它更多是改变交互方式,提升人的效能。

  北京交通大学计算机与信息技术学院教授金一的态度则相对积极。在她看来,未来人机交互的对象甚至将不再局限于手机,而是延伸至机器人及物理世界的万物。她说,如果未来能健全例如数据安全和隐私等相关协议、标准,AI Agent也许将从根本上改变互联网生态和商业模式,“人们将不再依赖于点击一个个独立图标,而是生活在一个万物互联的智能代理环境中”。

  人机交互方式会发生改变是确定的,关于超级App的未来,业内也达成了一个共识:短期内不会彻底消失。陶耀东举例说,用户使用快手、B站、小红书等App的主要目的是浏览视频、社交互动等,这些沉浸式体验光靠语音交互是无法替代的。因此AI Agent并非超级App的“终结者”,还有很多细分场景需要这些App来满足。

  在业内,有人将AI Agent看成是一个操作系统,App则是其中的应用软件。“未来App不一定是交互入口,但操作系统一定需要调用应用软件来完成任务。”桑基韬以微信为例说,即便未来微信不是一个交互入口,但里面的社交关系是肯定会用到的。“从这个角度看,操作系统将从幕后走到台前。”

  值得注意的是,聚焦以AI Agent为基础的互联网生态的建设,多家公司已经有所行动。在2025年三季度财报会上,腾讯总裁刘炽平透露,微信最终会推出一个AI Agent,让用户可以利用AI完成多项任务。阿里巴巴则于近日成立了千问C端事业群,首要目标是将千问打造成AI时代用户的第一入口。

  日前,金沙江创投主管合伙人朱啸虎表达了一个观点:ChatGPT(OpenAI旗下的一款大模型)聚焦日活,就是想成为超级入口。这让杨耀东深受启发,他说:“我们一直以为OpenAI是想干谷歌搜索,其实他最近想干的是Meta,GPT-5.2非常强调社交属性。”在杨耀东看来,AI Agent作为交互入口是一定会发生的事,至于是什么样的形态、由谁来提供服务,还是未知数。

  AI Agent的未来在哪

  未来,如何推动AI Agent更好地发展和演进?

  白金才在联想研究院主要从事智能体交互研发,他认为,与其让AI Agent野蛮生长,不如先建立标准。比如可以先推动形成行业通用的智能体协议,让AI Agent合规调用App,这是解决AI Agent与App互联互通难题的技术基础。“标准先行,这样一开始的付出会少一点;野蛮生长会付出很多,虽然结果可能是好的,但也产生了很多浪费。”白金才分析说。

  聚焦商业模式的改变,不少专家提到了“利益再分配”。对外经济贸易大学数字经济与法律创新研究中心主任许可表示,互联网时代讲求流量分配,流量只是结果,其背后包含算法、数据、内容生态等。“互联网广告依托数据分析,是基于个人画像的精准广告。未来假设访问所有App的都是AI,个人画像还从何谈起。”在他看来,当AI Agent成了流量入口,未来的商业模式可能从传统的广告展示,转向基于高价值转化的分销佣金模式。

  在商业利益和技术标准之外,数据安全与监管机制的建立更为重要,其中关键是数据产权界定。在许可看来,AI Agent打破了App之间形成的“数据孤岛”,但平台对数据享有持有权,这就意味着即使用户授权AI Agent获取平台上数据,仍需得到平台的同意和授权。“这可能会带来在数据流通上很高的壁垒。”许可建议,可以对AI设置一些例外的安全港措施,比如针对AI搜索、AI数据训练等特定场景设置数据合理使用制度。

  目前,我国正发力建设高质量数据集,其中一个重要的应用场景就是AI。“现在社会对于高质量数据集的安全共享有迫切的需求。也许不同的‘数据孤岛’会找到渠道构建底层基础设施,推动数据共享,进而推动AI Agent彼此互联。”中国人民大学信息学院副教授黄科满强调说。

  北京工业大学计算机学院院长助理李童建议采取“分级分类”的监管思路。具体来说,可以根据用户对AI Agent的依赖程度和权限赋予(如是否涉及支付、隐私)进行需求分类,然后分级规划制定不同层次的监管机制,在保障安全的前提下允许技术创新。

  AI Agent想要落地,硬件也不可或缺。字节跳动表示:没有自研手机计划,目前主要在和多家手机厂商洽谈豆包手机助手的合作。“字节跳动在AI手机方面的尝试,在整个互联网生态上撕出来一道口子,接下来会有人跟进、模仿和更进一步。”中国计算机学会青年计算机科技论坛主席贺瑞君说。

  市场已经有了新动向。12月9日,北京智谱华章科技股份有限公司宣布,开源其核心AI Agent模型AutoGLM,该模型被业界视为全球首个具备“PhoneUse”(手机操作)能力的AI Agent,此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个AI助手。而据媒体报道,字节跳动正与联想集团方面开展AI手机相关合作,为其设备预装AIGC(人工智能生成内容)插件,从而获得用户入口。

  “AI Agent未来的路径是每个人用脚投票投出来的,不管是技术、产品还是标准。”北京邮电大学计算机学院副教授张宇超认为,技术本身不是瓶颈也不是矛盾,既能帮用户减轻负担、又能保证信息安全的产品,将最终赢得用户的选择。

  中青报·中青网记者 贾骥业来源:中国青年报

  2025年12月23日 06版

责任编辑:贾骥业