12月9日深夜,智譜開源了其核心AI Agent模型AutoGLM,引發(fā)AI圈關(guān)注。
距離AutoGLM第一次出現(xiàn)在公眾視野里,已經(jīng)過去了111天。AutoGLM是智譜AI開發(fā)的跨端通用智能體,通過自然語言指令自主完成手機(jī)、電腦等設(shè)備的復(fù)雜操作,實(shí)現(xiàn)“一句話搞定任務(wù)”的人機(jī)交互體驗(yàn)。
作為全球一個具備“Phone Use”能力的AI Agent,AutoGLM核心功能圍繞“自主執(zhí)行”展開。它能模擬真人點(diǎn)擊、滑動、輸入等動作,穩(wěn)定處理外賣點(diǎn)單、機(jī)票預(yù)訂、朋友圈互動等數(shù)十步流程,覆蓋50多個高頻中文應(yīng)用的核心場景,同時支持跨端協(xié)同(手機(jī)+電腦),例如,手機(jī)發(fā)指令讓電腦自動生成PPT、整理數(shù)據(jù),任務(wù)在云端運(yùn)行,不占用本地設(shè)備資源。
2025年8月,AutoGLM 2.0面向公眾開放,強(qiáng)調(diào)“執(zhí)行型助手”定位,不再局限于對話或信息查詢,而是“動手”完成任務(wù),比如,辦公場景中從檢索資料到生成視頻、PPT的全流程執(zhí)行,生活場景中跨應(yīng)用預(yù)訂服務(wù)等。
但是,由于三方功能的實(shí)際體驗(yàn)不夠順暢,在實(shí)際體驗(yàn)過程中,授權(quán)動作繁瑣,語義理解易錯等方面問題,讓AutoGLM的首次亮相并未在C端引發(fā)現(xiàn)象級傳播。
但其構(gòu)建的新技術(shù)范式仍引發(fā)了行業(yè)震動。
智譜官方表示,這一次AutoGLM選擇開源,主要基于三方面原因:
一是避免AI手機(jī)能力被少數(shù)廠商壟斷,通過開放技術(shù)底座推動行業(yè)共建;
二是保護(hù)用戶隱私,讓數(shù)據(jù)與控制權(quán)完全歸屬使用方,支持私有化部署;
三是共享32個月的技術(shù)積累,降低Agent開發(fā)門檻。本次開源內(nèi)容包含訓(xùn)練好的核心模型、Phone Use能力框架、50+高頻App的Demo及文檔,均以MIT和Apache-2.0許可證開放。
據(jù)智譜官方,AutoGLM開源的首要意義是對抗技術(shù)壟斷,將“AI使用手機(jī)”這一核心能力基礎(chǔ)設(shè)施化和民主化。
文檔指出,如果“會用手機(jī)的AI能力”只掌握在極少數(shù)廠商手中,用戶的手機(jī)將越來越像“別人家的入口”,開發(fā)者的創(chuàng)新也會受制于人。通過開源,AutoGLM將這項(xiàng)能力變?yōu)樾袠I(yè)可以共同擁有和打磨的公共底座。
開源使得任何開發(fā)者或團(tuán)隊(duì)都能像使用“積木”一樣,將AutoGLM集成到自己的系統(tǒng)中,或進(jìn)行拆解、重寫和改造。這降低了Agent開發(fā)的門檻,可以催生出多樣化的AI原生應(yīng)用、硬件和解決方案,加速Agent生態(tài)的繁榮。
同時,基于Phone Use能力涉及的支付、社交、企業(yè)系統(tǒng)等敏感領(lǐng)域的問題,AutoGLM團(tuán)隊(duì)強(qiáng)調(diào),將控制權(quán)交還給用戶,以此解決信任核心問題。團(tuán)隊(duì)明確表示,“不希望也不應(yīng)該把這些東西握在自己手里”。
有行業(yè)人士對作者表示:“AutoGLM開源的意義遠(yuǎn)超一個普通的代碼開放項(xiàng)目。它是一次戰(zhàn)略性的生態(tài)卡位和規(guī)則定義,其目標(biāo)是成為未來AI Agent,尤其是終端通用Agent的基礎(chǔ),就像Android之于移動應(yīng)用生態(tài)。”
結(jié)合最近“豆包AI手機(jī)”的熱潮來看,智譜AutoGLM這次開源,也意味著各家公司在智能手機(jī)終端的通用Agent之爭,正走上完全不同的道路。
而這兩條路徑,正好與多年之前的安卓與蘋果之爭十分類似。
從策略目標(biāo)層面來看,AutoGLM的策略,是成為AI時代的基礎(chǔ)設(shè)施和公共底座,是一套類似于安卓的軟件開發(fā)環(huán)境。而豆包手機(jī)助手的策略,是直接搶占硬件入口,通過“AI附體手機(jī)”的方式,搶占用戶與數(shù)字世界交互的終端。
從AI能力部署層面來看,AutoGLM采用“云端智能體”范式,為AI配備專屬的云手機(jī)、云電腦,任務(wù)在云端虛擬設(shè)備中執(zhí)行,不占用、不干擾用戶本地設(shè)備;豆包手機(jī)直接采用“終端具身智能”范式,讓AI直接在用戶真實(shí)的物理手機(jī)上進(jìn)行“模擬點(diǎn)擊”操作,并將AI能力深度集成到手機(jī)硬件和系統(tǒng)層,實(shí)現(xiàn)多任務(wù)并行。
智譜AutoGLM的開放模式將訓(xùn)練模型、能力框架等開源,將操作執(zhí)行能力封裝為API,供開發(fā)者融入各類硬件;而豆包與手機(jī)廠商(中興努比亞)合作,推出專屬硬件,搶占用戶終端,其“模擬點(diǎn)擊、調(diào)度一切”的模式,直接挑戰(zhàn)了微信、淘寶等超級應(yīng)用的生態(tài)壁壘和用戶入口,因此,引發(fā)了平臺的“封禁”。
智譜AutoGLM與豆包手機(jī)助手的路線分歧,某種程度上像是傳統(tǒng)意義上軟件與硬件誰來定義誰的問題,后續(xù)必定還有更多的玩家進(jìn)入這場角力,而智譜AutoGLM這次開源,更像是通用AI Agent話語權(quán)之爭的大幕拉開的一個重要信號。