12月9日早间,国内头部大模子厂商智谱AI正式颁布发表开源其焦点AI Agent模子——AutoGLM。这是一个历经32个月研发、具备“Phone Use”(手机操做)能力的智能体框架。
智谱此时选择开源,被业界解读为一种手艺上的“掀桌”行为——它意味着“人人都能够打制豆包手机”的愿景正在手艺上已成为可能。对于行业来说,这大概是手机财产的“智驾时辰”。中信证券点评称,正如从动驾驶之于汽车。此次开源意味着硬件厂商、手机厂商和开辟者均可基于AutoGLM,正在本人的设备或系统中复现一个能“看懂”屏幕、并模仿实人进行点击、输入、滑动的AI帮手。目前,AutoGLM已支撑微信、淘宝、等跨越50个高频中文使用的焦点场景,其从动化操做能力取此前激发热议的“豆包手机”演示类似。而这一动做发生正在一个极其微妙且剑拔弩张之际。就正在此前的一周内,字节跳动结合努比亚发布的“豆包手机”搅动了整个科技圈,激发了互联网巨头们的集体“应激反映”。12月1日,字节跳动结合中兴通信旗下努比亚推出了搭载“豆包手机帮手”的nubia M153,售价3499元。这款手机凭仗系统级权限,可以或许模仿人类操做,逾越APP孤岛施行点外卖、发微信、比价购物等复杂使命。这一立异敏捷市场,首批备货霎时售罄,正在闲鱼平台上,该手机的未拆封报价以至一度被炒至7999~9999元。然而,这种“之手”般的跨使用能力敏捷触碰了互联网行业的逆鳞。尔后,微信、淘宝及多家银行APP随即启动了防御机制。用户反馈,当豆包帮手测验考试接管微信或淘宝时,会呈现非常退出、风险提醒以至封号的环境。大厂们给出的来由是“平安取现私”,但行业遍及认为,素质上这是对流量入口和数据节制权的殊死和。据智谱通稿显示,AutoGLM项目正式正在GitHub上线,开源了包罗锻炼好的焦点模子、Phone Use能力框架取东西链,以及笼盖50+高频中文App的可跑通Demo。智谱方面明白暗示:“这件事只正在一家公司做,是不敷的。AutoGLM 开源的第一层初志,是把这一层能力变成整个行业能够配合具有、配合打磨的公共底座。”市场阐发人士指出,这一行动的杀伤力正在于,变成了所有开辟者唾手可得的东西。当手艺门槛被夷平,巨头们大概能够围剿一款“豆包手机”,却难以围剿千千千万个基于开源框架自建的个性化Agent。
按照智谱发布的手艺细节及行业内部的深度拆解,AutoGLM的手艺实现具有以下性特征:据智谱透露,AutoGLM的研发始于2023年4月。晚期系统经常“丢失”正在手机操做中,但颠末32个月的打磨,团队成立了一整套Phone Use能力框架,将点击、滑动、输入、界面理解笼统化。2024年11月,AutoGLM发出了人类汗青上第一个由AI完成的手机红包——不是通过API,而是AI实正“看懂”了界面并完成了操做。
分歧于保守脚本依赖易被封禁的无妨碍办事(Accessibility),AutoGLM正在底层挪用了ADB(Android Debug Bridge)指令,并连系视觉大模子(AutoGLM-Phone-9B)。其运转逻辑是“看屏幕截图 - 大模子阐发 - 模仿手指导击”。这种基于视觉的“类人操做”,让APP厂商通过简单的代码检测进行防御变得极其坚苦。只需人眼能看懂界面,AI就能操做。![]()
针对大厂“围剿”的来由——现私平安,智谱正在开源通知布告中给出了明白回应:“手艺向整个生态,数据取现私,永久留正在利用方这一侧。” AutoGLM支撑私有化摆设,通过MobileRL等强化进修算法正在云端虚拟手机中锻炼,而现实运转时,企业和开辟者能够正在本人的合规中掌控数据。AutoGLM支撑当地摆设模式,模子运转和数据处置均正在用户设备端完成,数据不出手机。这种架构设想间接了互联网大厂以“现私泄露”为由进行围剿的性根本。
坐正在投资者和行业成长的角度审视,智谱AutoGLM的开源具有里程碑式的意义,其不只关乎手艺,更关乎贸易模式的沉构。中信证券正在12月5日的研报中指出,AI Agent之于手机,正如从动驾驶之于汽车。此前,手机厂商苦于缺乏可以或许打通所有APP的超等入口,而AutoGLM的开源为荣耀、小米、OPPO等厂商,以至中小硬件开辟者供给了现成的手艺底座。参考汽车行业“华为+赛力斯”的智选模式,将来“大模子厂商+手机厂商”的深度绑定将成为常态,AI手机无望送来雷同新能源汽车的迸发式增加。
对于腾讯、阿里等互联网巨头而言,护城河反面临严峻挑和。当用户能够通过AI Agent绕过APP的首页保举、告白位,间接触达焦点办事(如间接订票、比价购物),超等APP的流量分发逻辑将失效。智谱的开源将这种能力泛化后,巨头们面对的选择只剩下两个:要么继续建筑高墙,冒着用户体验下降的风险死守;要么自动坐上构和桌,API,取AI Agent共建重生态。正如Linux开源鞭策了操做系统的普及,Stable Diffusion开源了AI绘画,AutoGLM的开源标记动手机Agent进入了“可编程”时代。将来,基于该框架,可能会降生出特地办事于视障人士的公益Agent、专注于特定工做流的效率Agent,以至是完全个性化的私家帮理。2025年12月,从豆包手机的“冲锋”到智谱AutoGLM的“开源”,短短十天内,中国互联网履历了一场关于入口、流量取节制权的猛烈震动。AutoGLM的开源,现实上是把选择权交还给了用户和开辟者。它宣布了仅仅依托封锁生态和流量垄断的时代正正在过去。虽然当下的体验大概还存正在延迟或不不变性,但智能体时代的到来无法。对于市场而言,这不只仅是一个手艺旧事,更是一个明白的信号:智能终端的交互逻辑正正在发生底子性逆转,一个新的万亿级赛道——端侧智能体经济,曾经轰然。
建湖bjl平台官方网站科技有限公司
2025-12-12 20:57
0515-68783888
免费服务热线
扫码进入手机站 |
网站地图 | | XML | © 2022 Copyright 江苏bjl平台官方网站机械有限公司 All rights reserved. 