①用戶和AutoGLM的溝通爲語音或文字形式,並實時顯示字幕;②智譜同步發佈「人味兒」更重的GLM-4-Voice端到端情感語音模型;③當下的AI助理依然存在很大的進步空間。
《科創板日報》10月28日訊(編輯 宋子喬) 臨近蘋果AI功能(Apple Intelligence)發佈日,中國獨角獸企業智譜AI(以下簡稱智譜)搶先上線了AI助理工具。
10月25日,智譜用三分鐘的視頻展示了AutoGLM帶來的便利:無需手動操作,用戶對着手機說話(發出指令),便可讓其自動打開手機上的各類App,進行網購、點外賣、訂高鐵票,甚至發微信、搶紅包、評論朋友圈、整理筆記並生成攻略、總結論文。從宣傳視頻中已經有的功能看,智譜已獲得淘寶、美團、微信等App的授權,這三個公司也是智譜的投資方。
用戶和AutoGLM的溝通爲語音或文字形式,並實時顯示字幕。
手機成爲AI助理,只需接收文字/語音指令,就可以模擬人類操作手機,幫你解決日常瑣事,這一幕是不是很像電影中的賈維斯來到現實?
同日(10月25日),智譜發佈GLM-4-Voice端到端情感語音模型。
該模型的最大亮點在於,「人味兒」更重、交互體驗更強。據介紹,GLM-4-Voice能夠根據用戶指令靈活調整語音的情感、語調、語速及方言等特徵,且具有更低的延時,支持實時打斷、多語言、多方言。作爲端到端的語音模型,GLM-4-Voice避免了傳統的「語音轉文字再轉語音」級聯方案過程中帶來的信息損失和誤差積累,也擁有理論上更高的建模上限,即將上線視頻通話功能,旨在打造「能看又能說」的AI助理。
智譜表示,「GLM-4-Voice的出現是智譜在邁向AGI的道路上邁出的最新一步。」
目前,用戶可以通過安裝「智譜清言」插件體驗AutoGLM,AutoGLM也在安卓系統上開放了內測申請,並與榮耀等手機廠商開展了深度合作。
資料顯示,智譜在2024年9月與榮耀共同成立AI大模型技術聯合實驗室,與榮耀進行深度合作。2024年10月23日榮耀Magic9.0發佈會展示具備自動駕駛功能的AI Agent YOYO。
開源證券稱,智譜AutoGLM大幅提高AI Agent的實用性,或推動AI Agent用戶滲透率及商業化空間打開。
國泰君安表示,AutoGLM精準理解用戶指令,自動完成App操作,解放用戶雙手,有望加速手機廠商AI助理落地,具備自動駕駛功能的AI助理可幫助用戶擺脫繁瑣的App操作,僅需語音指令即可滿足用戶需求,真正實現AI個人助理,有望驅動AI手機換機潮,帶動上游產業鏈需求上行。
不過AutoGLM依然存在很大的進步空間。國泰君安便表示,手機端的「自動駕駛」仍需明確指令,根據數字生命卡茲克發佈的實測視頻,AutoGLM自動駕駛需要用戶下達明確的指令信息,如預訂酒店,需要用戶給出時間、地點、預算及相應房型。
另外,執行如「幫我訂回家的機票」等更個性化指令,仍需與手機廠商進行合作,獲取用戶個人信息使用權限方可實現。目前AutoGLM已可自動執行微信、淘寶、美團、小紅書等App中用戶常用操作,更多個性化操作尚未實現,並且未適配滴滴、京東、微信讀書等App,未來需要更多第三方廠商以及更全面的UI訓練數據集支持。
終端有望迎AI助理時代 或帶來多層次產業機遇
AI助理(AI Agent)是一種能夠感知環境、進行決策和執行動作的智能實體,具備通過獨立思考、調用工具去逐步完成給定目標的能力,可拆解爲大模型+規劃+記憶+工具使用四個組成部分。
應用場景方面,AI助理適用於銷售、供應鏈、客戶服務、財務、人力資源等。
對於AI產業而言,AI助理能夠爲C端提供個性化應用、爲B端提供降本增效方案;對於用戶而言,AI助理最核心的功能是AI自主操作手機,輔助完成複雜推理任務。
業界正積極佈局和探索AI助理,如阿里的MobileAgent、騰訊的App Agent、榮耀的MagicOS 9.0操作系統、蘋果的Apple Intelligence等,微軟、谷歌近期也相繼推出AI助理應用。
10月22日凌晨,微軟宣佈在Dynamics365中集成10個自主AI助理,可幫助企業自動執行客服、銷售、財務、倉儲等業務,這些AI助理支持OpenAI最新模型o1並具備自主學習能力,可以自動執行跨平台的超複雜任務;
10月24日,科大訊飛推出面向教育、醫療、司法、政府服務等領域的AI助手;
彩訊股份於10月11-13日的2024中國移動全球合作伙伴大會上,正式推出一站式AI應用開發平台RichAIBox,可實現多個基座大模型統一接入、企業私域知識庫無縫銜接以及多場景智能體可視編排,助力企業快速構建AI應用。在應用層面,公司也推出了3D數字人生成、圖生音樂彩靈、AI智舞、AI來電秘書等AIGC產品,覆蓋「5G新通話」各場景……
浙商證券表示,近期,國產多模態AI應用的使用情況呈現爆發態勢——8月底Minimax推出文生視頻模型abab-video-1並應用於海螺AI以來,使用生態呈現加速增長,據「AI產品榜」統計,9月海螺AI網頁版訪問量環比增長860%;而similarweb數據顯示,7月快手「可靈」視頻生成大模型上線以來,9月單月web端訪問量超1600萬次。
該機構認爲,AI助理應用的爆發反映出國產多模態AI大模型能力的顯著提升,國產多模態AI應用使用情況爆發式增長,爲AI助理應用奠定良好基礎。
華泰證券表示,AI助理是通往AGI的核心基礎,AI助理落地帶來多個層次的產業機遇,其中,Agent+終端有望推動人機交互變革,除了在終端銷售量價方面的變化外,可能對終端應用的商業模式產生更加深遠的影響。
德邦證券認爲,由於建立在大模型底層平台上,AI助理在應用場景實現規模化推廣以及高頻響應後將催生巨大的推理算力需求,推理側或成爲未來算力需求長期藍海。