來源:晚點LatePost 作者:賀乾明
8 月 30 日晚上,百度公關團隊加班加點準備宣傳材料,目標是在時鐘跨過 0 點後,第一時間對外發布大模型應用文心一言全面開放的消息,最終在 0:02 發佈成功。
同一時刻,百度也提前部署了大量算力支持文心一言等大模型應用,以應對這次全面放開後可能激增的用量。
緊接着,31 日凌晨 1 點 44 分,大模型創業公司智譜 AI 宣佈大模型應用 “智譜清言” 正式上線;3 點 09 分,百川智能稱通過 “生成式人工智能備案”,開放公衆服務。
更多消息在今天清晨傳播開來:字節跳動、商湯、MiniMax、中科院、上海人工智能實驗室等公司和機構也宣佈其大模型已通過備案,將開始正式對外提供服務。
《晚點 LatePost》了解到,科大訊飛、華爲、騰訊和阿里巴巴開發的大模型也在首批通過備案之列。阿里的通義千問也即將對外開放服務。
“對我們來說,今天這個節點比 3 月 16 日發佈大模型還重要。” 一位百度人士說。他和不少同事都記得百度發佈大模型到現在已過去 167 天。
隨着第一批大模型應用通過備案上線,中國人工智能大模型市場進入全新競爭階段,科技公司和機構基於大模型研發的產品,可以向所有用戶提供服務,而之前只能開展人數受限的測試。
“大模型的進化高度依賴用戶反饋,更多人使用後,會有更多數據反饋用於改進大模型。” 百度科技與社會研究中心主任餘歡說,百度正在嘗試提高大模型的迭代速度。“原本計劃年底發佈新版本模型,現在我們正在加速,儘可能提前發佈。”
百川智能創始人王小川告訴《晚點 LatePost》,百川智能將在今年第四季度發佈千億參數模型,在明年一季度推出 “超級應用”。據了解,半個月前發佈新版大模型的科大訊飛,也會在通過備案後,加快大模型應用的推廣速度。
新環境使大模型競爭變成了一場綜合能力試煉:致勝因素將不再只是一家公司訓練大模型的技術實力,還有它洞察市場需求、開發與之匹配的應用和做好運營的能力。
圍繞新用戶和客戶的拉新、增長與產品的更激進投入即將開啓。當 “限速” 被放開,是時候看看誰快誰慢了。
政策落地,一批大模型將公開上線
《生成式人工智能服務管理暫行辦法》正式實施的 8 月 15 日,是中國大模型公司通過備案的關鍵節點。一名大模型從業者說,這之後,有關部門開始召集一些大模型公司開會,進行備案培訓並下發備案材料模板。
據了解,備案過程中,監管部門關注數據安全、數據來源問題,比如數據是否侵犯知識產權或侵犯隱私;監管部門同時建議,各公司大模型在完成聊天任務時,“拒答率不能過高”。
在大模型備案工作開始前後,本輪通過備案的大型科技公司,都或多或少釋放了大模型進展:
7 月底,騰訊開始在多個業務線測試混元大模型,預計將在下月宣佈新進展。兩個月前,騰訊 CEO 馬化騰說,不急於早早把半成品拿出來。
8 月初,字節跳動公開測試大模型應用 “豆包”,底層模型就是本次通過備案的 “雲雀” 模型。
8 月 4 日,華爲宣佈將盤古大模型集成到鴻蒙系統中,將通過手機中的語音助手提供生成郵件、自動操控手機軟件等功能。
8 月 15 日,科大訊飛發佈訊飛星火大模型 2.0 版本,增加生成、理解圖像和代碼的能力,並與華爲聯合推出星火一體機,爲政企客戶本地部署大模型提供解決方案。
幾天前,百度羣發短信,提醒文心一言內測用戶獲得 “百度搜索 AI 夥伴” 內測資格,可以通過百度 App 和百度搜索引擎使用類似 New Bing 的功能。
首批通過大模型備案的創業公司中,智譜 AI、百川智能和 MiniMax 近期也在快速迭代自己的大模型。6 月,智譜 AI 升級推出 ChatGLM2 系列,新增 3 個不同參數規格的模型,最多可以處理 3.2 萬個 token(token 與文字處理量成正比)。
今年 4 月成立的百川智能在過去 4 個月裏快速推出 3 個模型,兩個開源、一個閉源,最高參數達到 530 億。創立於 2021 年底的 MiniMax 7 月完成自有模型 ABAB 的一次大版本升級,並以周爲單位提升性能。
創業公司背後亦有大公司身影。美團於今年參與智譜 AI 的 B-2 輪融資。騰訊也已於今年 6 月投資了 MiniMax。智譜 AI 和 MiniMax 都已成爲估值超 10 億美元的獨角獸。
目前通過備案的大模型公司,多數已經宣佈面向社會公衆開放。不過通過備案本身可能不會成爲一種大模型競爭的長期優勢。
參與了備案的多位行業人士的觀點是,接下來陸續會有更多的大模型公司通過備案,“不會只有第一批,也會有第二批、第三批”。
推廣不再受限,大模型商業化加速
大模型應用 “通過生成式人工智能備案” 後,最直接變化是,產品可直接面向社會公衆提供服務。
這之前,大部分公司推廣大模型應用時相對剋制,它們面向個人用戶的產品皆是內測、邀測形態,一般用戶無法直接註冊、使用,各公司也不會主動投放廣告推廣大模型產品,這抑制了產品擴散。
政策落地則會推動公司投入資源推廣大模型,最終加速大模型的商業化。目前大模型行業主要有四種變現模式:
開發大模型對話應用,按月 / 年向用戶收費。比如 OpenAI 的 ChatGPT Plus 服務等。
出售大模型 API 接口,向公司或開發者按照調用次數收費,比如 MiniMax 與金山辦公 WPS 的合作。
直接賣大模型開發服務,向傳統企業輸出大模型行業解決方案掙錢,比如百度、騰訊、訊飛、華爲大力推廣的行業大模型方案。
擁有大模型的公司,還可以用大模型改造現有業務,提高產品的競爭力獲得更多商業回報。如 Google、百度等公司正在用大模型優化搜索產品;釘釘把大模型融入到產品功能中;阿里曾表示要用大模型改造電商業務等。
大模型陸續通過備案後,最明顯的市場變化之一是,直接面向個人消費者的產品會變得更多、更活躍。
據悉,MiniMax 接下來會推出面向公衆的產品,但暫未披露細節。
王小川稱,明年一季度,百川計劃推出第一款面向個人的 “超級應用”。他在 8 月上旬的媒體溝通會上說,百川智能 “未來不只有一款超級應用,(更多產品)正在研發的路上”。
大規模的產品推廣,同時能爲面向企業客戶的業務引流。一位百度人士說,百度暫時不會在面向公衆的文心一言產品上收費,但這是一個展示技術能力的好方法,“有助於吸引企業用戶”。
企業級市場是本次大模型獲得備案前,整個行業已在着力推進的方向。騰訊、科大訊飛、華爲此前在不同場合提到,它們已面向十多個行業發佈了數十個、甚至上百個大模型解決方案。MiniMax 也宣佈,其面向企業客戶的開放平台已接入超百家付費客戶。
大模型本身的技術競賽還在繼續。一位百度人士稱,公司正全力加速研發新版本的大模型,希望能提前發佈。百川智能方面稱,將按之前的研發計劃,陸續發佈 Baichuan2 的 70 億參數和 130 億參數版本,年底計劃推出千億參數大模型。科大訊飛計劃在 10 月 24 日推出中文超過、英文能力與 ChatGPT 相當的大模型,在明年上半年對標 GPT-4。
大模型發展進入新階段
截至現在,中國已有上百個參數超過 10 億的大模型。政策落地、大模型商業化加速的另一面是,參與者們將面臨更激烈、綜合的競爭。當 “限速” 被放開,才能試出領先者的極限,而跑得慢的人,則可能面臨淘汰。
從大模型發展更快、監管後置的海外市場看,大模型的競爭力主要體現在三個方面:
計算基礎設施。當大模型應用獲得大量用戶後,會消耗大量算力。OpenAI 一度暫停了付費用戶註冊,並嚴格限制用戶調用 GPT-4 的次數,核心原因就是算力跟不上用戶增長速度。
專有數據。市場上多數的預訓練大模型,都是用一樣的架構、公開數據集和類似的方法訓練的。大模型擁有差異化能力的關鍵在於用什麼樣的數據去微調它。這些數據的數量多少和質量差別,將直接決定一個大模型的能力。
商業應用。基於大模型做應用不難,但想要基於百億甚至千億參數模型做應用,需要大量 GPU 做推理計算。一位行業人士判斷,參數上千億的大模型,訓練與推理成本大概是 1:9。這意味着必須找到商業價值足夠大、足夠賺錢的場景,才能讓大模型應用變得划算。在更龐大的應用場景中,大模型供應商也能得到更多用戶的反饋,不斷改進模型。
大模型的競爭會在某些層面會有利於資金雄厚、本身就已聚集海量用戶的大公司,比如百度、騰訊、華爲、阿里巴巴、科大訊飛和字節跳動等。
不過一位基於其它公司大模型,開發生成式寫作應用的創業者告訴《晚點 LatePost》,他並不是很擔心備案後,大公司在應用層加大投入,擠壓中小公司。“熱潮之前已退去不少,很多應用都進入深了度集成 AI 的過程,也就是 AI 本身不是賣點,關鍵還是看對用戶需求與場景的把握。” 在這一競爭點上,他認爲大小公司都有機會,代表性的產品包括 Notion 和釘釘等。
還有許多創業公司也正在與用戶體量較大的公司建立合作關係,提升實力。比如 MiniMax、智譜 AI 都接入了金山辦公的 WPS。
據了解,美團投資智譜 AI 前,已花費上千萬元購買了其大模型授權,計劃在此基礎上探索相關應用。
所有大模型公司接下來面臨的重大考驗是:怎麼找到真正賺錢、可持續的大模型商業模式。
“我們不能只是推動人工智能,卻沒有支撐它的商業模式。” 雲數據庫公司 Snowflake CEO 弗蘭克·斯魯特曼(Frank Slootman)在八月的財務電話會議上說。他說,“許多公司高管將他們進入大模型的嘗試描述爲實驗性的、探索性的,他們還在試圖弄清楚這是多大的挑戰。”
到目前爲止,從大模型浪潮中賺到錢的幾乎都是 “買鏟子” 的公司。比如英偉達。剛過去的第二財務季度,英偉達 GPU 相關業務營收同比增長 171% 到 103 億美元,公司淨利潤同比增長八倍到 62 億美元。
這輪政策落地,也可能會讓互聯網廣告平台先賺一筆錢。一名北京大模型從業者說,他們正在等待備案完成,之後將在短視頻、搜索平台重新啓動產品投放。在此前一段時間各產品主要以測試形態存在時,這家公司認爲大規模投入經濟上不划算。這之前,它們一度每月的產品廣告投流費用達百萬元級別。
“現在還沒有到出現超級應用的程度。” 一位大模型從業者認爲可能還需要兩到三年時間,目前只是有了一些跡象,“等到技術能力更強,應用效果夠好,成本足夠低,真正的超級應用才可能出現。”
編輯/lambor
評論(0)
請選擇舉報原因