DeepSeek消息動態追蹤

專題 1201條資訊 24935人訂閱

首批大模型通過備案，更激進的投入開始了

晚點LatePost · 2023/08/31 14:03

来源：晚点LatePost 作者：贺乾明

8 月 30 日晚上，百度公关团队加班加点准备宣传材料，目标是在时钟跨过 0 点后，第一时间对外发布大模型应用文心一言全面开放的消息，最终在 0:02 发布成功。

同一时刻，百度也提前部署了大量算力支持文心一言等大模型应用，以应对这次全面放开后可能激增的用量。

紧接着，31 日凌晨 1 点 44 分，大模型创业公司智谱 AI 宣布大模型应用 “智谱清言” 正式上线；3 点 09 分，百川智能称通过 “生成式人工智能备案”，开放公众服务。

更多消息在今天清晨传播开来：字节跳动、商汤、MiniMax、中科院、上海人工智能实验室等公司和机构也宣布其大模型已通过备案，将开始正式对外提供服务。

《晚点 LatePost》了解到，科大讯飞、华为、腾讯和阿里巴巴开发的大模型也在首批通过备案之列。阿里的通义千问也即将对外开放服务。

“对我们来说，今天这个节点比 3 月 16 日发布大模型还重要。” 一位百度人士说。他和不少同事都记得百度发布大模型到现在已过去 167 天。

随着第一批大模型应用通过备案上线，中国人工智能大模型市场进入全新竞争阶段，科技公司和机构基于大模型研发的产品，可以向所有用户提供服务，而之前只能开展人数受限的测试。

“大模型的进化高度依赖用户反馈，更多人使用后，会有更多数据反馈用于改进大模型。” 百度科技与社会研究中心主任余欢说，百度正在尝试提高大模型的迭代速度。“原本计划年底发布新版本模型，现在我们正在加速，尽可能提前发布。”

百川智能创始人王小川告诉《晚点 LatePost》，百川智能将在今年第四季度发布千亿参数模型，在明年一季度推出 “超级应用”。据了解，半个月前发布新版大模型的科大讯飞，也会在通过备案后，加快大模型应用的推广速度。

新环境使大模型竞争变成了一场综合能力试炼：致胜因素将不再只是一家公司训练大模型的技术实力，还有它洞察市场需求、开发与之匹配的应用和做好运营的能力。

围绕新用户和客户的拉新、增长与产品的更激进投入即将开启。当 “限速” 被放开，是时候看看谁快谁慢了。

政策落地，一批大模型将公开上线

《生成式人工智能服务管理暂行办法》正式实施的 8 月 15 日，是中国大模型公司通过备案的关键节点。一名大模型从业者说，这之后，有关部门开始召集一些大模型公司开会，进行备案培训并下发备案材料模板。

据了解，备案过程中，监管部门关注数据安全、数据来源问题，比如数据是否侵犯知识产权或侵犯隐私；监管部门同时建议，各公司大模型在完成聊天任务时，“拒答率不能过高”。

在大模型备案工作开始前后，本轮通过备案的大型科技公司，都或多或少释放了大模型进展：

7 月底，腾讯开始在多个业务线测试混元大模型，预计将在下月宣布新进展。两个月前，腾讯 CEO 马化腾说，不急于早早把半成品拿出来。
8 月初，字节跳动公开测试大模型应用 “豆包”，底层模型就是本次通过备案的 “云雀” 模型。
8 月 4 日，华为宣布将盘古大模型集成到鸿蒙系统中，将通过手机中的语音助手提供生成邮件、自动操控手机软件等功能。
8 月 15 日，科大讯飞发布讯飞星火大模型 2.0 版本，增加生成、理解图像和代码的能力，并与华为联合推出星火一体机，为政企客户本地部署大模型提供解决方案。
几天前，百度群发短信，提醒文心一言内测用户获得 “百度搜索 AI 伙伴” 内测资格，可以通过百度 App 和百度搜索引擎使用类似 New Bing 的功能。

首批通过大模型备案的创业公司中，智谱 AI、百川智能和 MiniMax 近期也在快速迭代自己的大模型。6 月，智谱 AI 升级推出 ChatGLM2 系列，新增 3 个不同参数规格的模型，最多可以处理 3.2 万个 token（token 与文字处理量成正比）。

今年 4 月成立的百川智能在过去 4 个月里快速推出 3 个模型，两个开源、一个闭源，最高参数达到 530 亿。创立于 2021 年底的 MiniMax 7 月完成自有模型 ABAB 的一次大版本升级，并以周为单位提升性能。

创业公司背后亦有大公司身影。美团于今年参与智谱 AI 的 B-2 轮融资。腾讯也已于今年 6 月投资了 MiniMax。智谱 AI 和 MiniMax 都已成为估值超 10 亿美元的独角兽。

目前通过备案的大模型公司，多数已经宣布面向社会公众开放。不过通过备案本身可能不会成为一种大模型竞争的长期优势。

参与了备案的多位行业人士的观点是，接下来陆续会有更多的大模型公司通过备案，“不会只有第一批，也会有第二批、第三批”。

推广不再受限，大模型商业化加速

大模型应用 “通过生成式人工智能备案” 后，最直接变化是，产品可直接面向社会公众提供服务。

这之前，大部分公司推广大模型应用时相对克制，它们面向个人用户的产品皆是内测、邀测形态，一般用户无法直接注册、使用，各公司也不会主动投放广告推广大模型产品，这抑制了产品扩散。

政策落地则会推动公司投入资源推广大模型，最终加速大模型的商业化。目前大模型行业主要有四种变现模式：

开发大模型对话应用，按月 / 年向用户收费。比如 OpenAI 的 ChatGPT Plus 服务等。
出售大模型 API 接口，向公司或开发者按照调用次数收费，比如 MiniMax 与金山办公 WPS 的合作。
直接卖大模型开发服务，向传统企业输出大模型行业解决方案挣钱，比如百度、腾讯、讯飞、华为大力推广的行业大模型方案。
拥有大模型的公司，还可以用大模型改造现有业务，提高产品的竞争力获得更多商业回报。如 Google、百度等公司正在用大模型优化搜索产品；钉钉把大模型融入到产品功能中；阿里曾表示要用大模型改造电商业务等。

大模型陆续通过备案后，最明显的市场变化之一是，直接面向个人消费者的产品会变得更多、更活跃。

据悉，MiniMax 接下来会推出面向公众的产品，但暂未披露细节。

王小川称，明年一季度，百川计划推出第一款面向个人的 “超级应用”。他在 8 月上旬的媒体沟通会上说，百川智能 “未来不只有一款超级应用，（更多产品）正在研发的路上”。

大规模的产品推广，同时能为面向企业客户的业务引流。一位百度人士说，百度暂时不会在面向公众的文心一言产品上收费，但这是一个展示技术能力的好方法，“有助于吸引企业用户”。

企业级市场是本次大模型获得备案前，整个行业已在着力推进的方向。腾讯、科大讯飞、华为此前在不同场合提到，它们已面向十多个行业发布了数十个、甚至上百个大模型解决方案。MiniMax 也宣布，其面向企业客户的开放平台已接入超百家付费客户。

大模型本身的技术竞赛还在继续。一位百度人士称，公司正全力加速研发新版本的大模型，希望能提前发布。百川智能方面称，将按之前的研发计划，陆续发布 Baichuan2 的 70 亿参数和 130 亿参数版本，年底计划推出千亿参数大模型。科大讯飞计划在 10 月 24 日推出中文超过、英文能力与 ChatGPT 相当的大模型，在明年上半年对标 GPT-4。

大模型发展进入新阶段

截至现在，中国已有上百个参数超过 10 亿的大模型。政策落地、大模型商业化加速的另一面是，参与者们将面临更激烈、综合的竞争。当 “限速” 被放开，才能试出领先者的极限，而跑得慢的人，则可能面临淘汰。

从大模型发展更快、监管后置的海外市场看，大模型的竞争力主要体现在三个方面：

计算基础设施。当大模型应用获得大量用户后，会消耗大量算力。OpenAI 一度暂停了付费用户注册，并严格限制用户调用 GPT-4 的次数，核心原因就是算力跟不上用户增长速度。
专有数据。市场上多数的预训练大模型，都是用一样的架构、公开数据集和类似的方法训练的。大模型拥有差异化能力的关键在于用什么样的数据去微调它。这些数据的数量多少和质量差别，将直接决定一个大模型的能力。
商业应用。基于大模型做应用不难，但想要基于百亿甚至千亿参数模型做应用，需要大量 GPU 做推理计算。一位行业人士判断，参数上千亿的大模型，训练与推理成本大概是 1:9。这意味着必须找到商业价值足够大、足够赚钱的场景，才能让大模型应用变得划算。在更庞大的应用场景中，大模型供应商也能得到更多用户的反馈，不断改进模型。

大模型的竞争会在某些层面会有利于资金雄厚、本身就已聚集海量用户的大公司，比如百度、腾讯、华为、阿里巴巴、科大讯飞和字节跳动等。

不过一位基于其它公司大模型，开发生成式写作应用的创业者告诉《晚点 LatePost》，他并不是很担心备案后，大公司在应用层加大投入，挤压中小公司。“热潮之前已退去不少，很多应用都进入深了度集成 AI 的过程，也就是 AI 本身不是卖点，关键还是看对用户需求与场景的把握。” 在这一竞争点上，他认为大小公司都有机会，代表性的产品包括 Notion 和钉钉等。

还有许多创业公司也正在与用户体量较大的公司建立合作关系，提升实力。比如 MiniMax、智谱 AI 都接入了金山办公的 WPS。

据了解，美团投资智谱 AI 前，已花费上千万元购买了其大模型授权，计划在此基础上探索相关应用。

所有大模型公司接下来面临的重大考验是：怎么找到真正赚钱、可持续的大模型商业模式。

“我们不能只是推动人工智能，却没有支撑它的商业模式。” 云数据库公司 Snowflake CEO 弗兰克·斯鲁特曼（Frank Slootman）在八月的财务电话会议上说。他说，“许多公司高管将他们进入大模型的尝试描述为实验性的、探索性的，他们还在试图弄清楚这是多大的挑战。”

到目前为止，从大模型浪潮中赚到钱的几乎都是 “买铲子” 的公司。比如英伟达。刚过去的第二财务季度，英伟达 GPU 相关业务营收同比增长 171% 到 103 亿美元，公司净利润同比增长八倍到 62 亿美元。

这轮政策落地，也可能会让互联网广告平台先赚一笔钱。一名北京大模型从业者说，他们正在等待备案完成，之后将在短视频、搜索平台重新启动产品投放。在此前一段时间各产品主要以测试形态存在时，这家公司认为大规模投入经济上不划算。这之前，它们一度每月的产品广告投流费用达百万元级别。

“现在还没有到出现超级应用的程度。” 一位大模型从业者认为可能还需要两到三年时间，目前只是有了一些迹象，“等到技术能力更强，应用效果够好，成本足够低，真正的超级应用才可能出现。”

编辑/lambor

來源：晚點LatePost 作者：賀乾明

8 月 30 日晚上，百度公關團隊加班加點準備宣傳材料，目標是在時鐘跨過 0 點後，第一時間對外發布大模型應用文心一言全面開放的消息，最終在 0:02 發佈成功。

同一時刻，百度也提前部署了大量算力支持文心一言等大模型應用，以應對這次全面放開後可能激增的用量。

緊接着，31 日凌晨 1 點 44 分，大模型創業公司智譜 AI 宣佈大模型應用 “智譜清言” 正式上線；3 點 09 分，百川智能稱通過 “生成式人工智能備案”，開放公衆服務。

更多消息在今天清晨傳播開來：字節跳動、商湯、MiniMax、中科院、上海人工智能實驗室等公司和機構也宣佈其大模型已通過備案，將開始正式對外提供服務。

《晚點 LatePost》了解到，科大訊飛、華爲、騰訊和阿里巴巴開發的大模型也在首批通過備案之列。阿里的通義千問也即將對外開放服務。

“對我們來說，今天這個節點比 3 月 16 日發佈大模型還重要。” 一位百度人士說。他和不少同事都記得百度發佈大模型到現在已過去 167 天。

隨着第一批大模型應用通過備案上線，中國人工智能大模型市場進入全新競爭階段，科技公司和機構基於大模型研發的產品，可以向所有用戶提供服務，而之前只能開展人數受限的測試。

“大模型的進化高度依賴用戶反饋，更多人使用後，會有更多數據反饋用於改進大模型。” 百度科技與社會研究中心主任餘歡說，百度正在嘗試提高大模型的迭代速度。“原本計劃年底發佈新版本模型，現在我們正在加速，儘可能提前發佈。”

百川智能創始人王小川告訴《晚點 LatePost》，百川智能將在今年第四季度發佈千億參數模型，在明年一季度推出 “超級應用”。據了解，半個月前發佈新版大模型的科大訊飛，也會在通過備案後，加快大模型應用的推廣速度。

新環境使大模型競爭變成了一場綜合能力試煉：致勝因素將不再只是一家公司訓練大模型的技術實力，還有它洞察市場需求、開發與之匹配的應用和做好運營的能力。

圍繞新用戶和客戶的拉新、增長與產品的更激進投入即將開啓。當 “限速” 被放開，是時候看看誰快誰慢了。

政策落地，一批大模型將公開上線

《生成式人工智能服務管理暫行辦法》正式實施的 8 月 15 日，是中國大模型公司通過備案的關鍵節點。一名大模型從業者說，這之後，有關部門開始召集一些大模型公司開會，進行備案培訓並下發備案材料模板。

據了解，備案過程中，監管部門關注數據安全、數據來源問題，比如數據是否侵犯知識產權或侵犯隱私；監管部門同時建議，各公司大模型在完成聊天任務時，“拒答率不能過高”。

在大模型備案工作開始前後，本輪通過備案的大型科技公司，都或多或少釋放了大模型進展：

7 月底，騰訊開始在多個業務線測試混元大模型，預計將在下月宣佈新進展。兩個月前，騰訊 CEO 馬化騰說，不急於早早把半成品拿出來。
8 月初，字節跳動公開測試大模型應用 “豆包”，底層模型就是本次通過備案的 “雲雀” 模型。
8 月 4 日，華爲宣佈將盤古大模型集成到鴻蒙系統中，將通過手機中的語音助手提供生成郵件、自動操控手機軟件等功能。
8 月 15 日，科大訊飛發佈訊飛星火大模型 2.0 版本，增加生成、理解圖像和代碼的能力，並與華爲聯合推出星火一體機，爲政企客戶本地部署大模型提供解決方案。
幾天前，百度羣發短信，提醒文心一言內測用戶獲得 “百度搜索 AI 夥伴” 內測資格，可以通過百度 App 和百度搜索引擎使用類似 New Bing 的功能。

首批通過大模型備案的創業公司中，智譜 AI、百川智能和 MiniMax 近期也在快速迭代自己的大模型。6 月，智譜 AI 升級推出 ChatGLM2 系列，新增 3 個不同參數規格的模型，最多可以處理 3.2 萬個 token（token 與文字處理量成正比）。

今年 4 月成立的百川智能在過去 4 個月裏快速推出 3 個模型，兩個開源、一個閉源，最高參數達到 530 億。創立於 2021 年底的 MiniMax 7 月完成自有模型 ABAB 的一次大版本升級，並以周爲單位提升性能。

創業公司背後亦有大公司身影。美團於今年參與智譜 AI 的 B-2 輪融資。騰訊也已於今年 6 月投資了 MiniMax。智譜 AI 和 MiniMax 都已成爲估值超 10 億美元的獨角獸。

目前通過備案的大模型公司，多數已經宣佈面向社會公衆開放。不過通過備案本身可能不會成爲一種大模型競爭的長期優勢。

參與了備案的多位行業人士的觀點是，接下來陸續會有更多的大模型公司通過備案，“不會只有第一批，也會有第二批、第三批”。

推廣不再受限，大模型商業化加速

大模型應用 “通過生成式人工智能備案” 後，最直接變化是，產品可直接面向社會公衆提供服務。

這之前，大部分公司推廣大模型應用時相對剋制，它們面向個人用戶的產品皆是內測、邀測形態，一般用戶無法直接註冊、使用，各公司也不會主動投放廣告推廣大模型產品，這抑制了產品擴散。

政策落地則會推動公司投入資源推廣大模型，最終加速大模型的商業化。目前大模型行業主要有四種變現模式：

開發大模型對話應用，按月 / 年向用戶收費。比如 OpenAI 的 ChatGPT Plus 服務等。
出售大模型 API 接口，向公司或開發者按照調用次數收費，比如 MiniMax 與金山辦公 WPS 的合作。
直接賣大模型開發服務，向傳統企業輸出大模型行業解決方案掙錢，比如百度、騰訊、訊飛、華爲大力推廣的行業大模型方案。
擁有大模型的公司，還可以用大模型改造現有業務，提高產品的競爭力獲得更多商業回報。如 Google、百度等公司正在用大模型優化搜索產品；釘釘把大模型融入到產品功能中；阿里曾表示要用大模型改造電商業務等。

大模型陸續通過備案後，最明顯的市場變化之一是，直接面向個人消費者的產品會變得更多、更活躍。

據悉，MiniMax 接下來會推出面向公衆的產品，但暫未披露細節。

王小川稱，明年一季度，百川計劃推出第一款面向個人的 “超級應用”。他在 8 月上旬的媒體溝通會上說，百川智能 “未來不只有一款超級應用，（更多產品）正在研發的路上”。

大規模的產品推廣，同時能爲面向企業客戶的業務引流。一位百度人士說，百度暫時不會在面向公衆的文心一言產品上收費，但這是一個展示技術能力的好方法，“有助於吸引企業用戶”。

企業級市場是本次大模型獲得備案前，整個行業已在着力推進的方向。騰訊、科大訊飛、華爲此前在不同場合提到，它們已面向十多個行業發佈了數十個、甚至上百個大模型解決方案。MiniMax 也宣佈，其面向企業客戶的開放平台已接入超百家付費客戶。

大模型本身的技術競賽還在繼續。一位百度人士稱，公司正全力加速研發新版本的大模型，希望能提前發佈。百川智能方面稱，將按之前的研發計劃，陸續發佈 Baichuan2 的 70 億參數和 130 億參數版本，年底計劃推出千億參數大模型。科大訊飛計劃在 10 月 24 日推出中文超過、英文能力與 ChatGPT 相當的大模型，在明年上半年對標 GPT-4。

大模型發展進入新階段

截至現在，中國已有上百個參數超過 10 億的大模型。政策落地、大模型商業化加速的另一面是，參與者們將面臨更激烈、綜合的競爭。當 “限速” 被放開，才能試出領先者的極限，而跑得慢的人，則可能面臨淘汰。

從大模型發展更快、監管後置的海外市場看，大模型的競爭力主要體現在三個方面：

計算基礎設施。當大模型應用獲得大量用戶後，會消耗大量算力。OpenAI 一度暫停了付費用戶註冊，並嚴格限制用戶調用 GPT-4 的次數，核心原因就是算力跟不上用戶增長速度。
專有數據。市場上多數的預訓練大模型，都是用一樣的架構、公開數據集和類似的方法訓練的。大模型擁有差異化能力的關鍵在於用什麼樣的數據去微調它。這些數據的數量多少和質量差別，將直接決定一個大模型的能力。
商業應用。基於大模型做應用不難，但想要基於百億甚至千億參數模型做應用，需要大量 GPU 做推理計算。一位行業人士判斷，參數上千億的大模型，訓練與推理成本大概是 1:9。這意味着必須找到商業價值足夠大、足夠賺錢的場景，才能讓大模型應用變得划算。在更龐大的應用場景中，大模型供應商也能得到更多用戶的反饋，不斷改進模型。

大模型的競爭會在某些層面會有利於資金雄厚、本身就已聚集海量用戶的大公司，比如百度、騰訊、華爲、阿里巴巴、科大訊飛和字節跳動等。

不過一位基於其它公司大模型，開發生成式寫作應用的創業者告訴《晚點 LatePost》，他並不是很擔心備案後，大公司在應用層加大投入，擠壓中小公司。“熱潮之前已退去不少，很多應用都進入深了度集成 AI 的過程，也就是 AI 本身不是賣點，關鍵還是看對用戶需求與場景的把握。” 在這一競爭點上，他認爲大小公司都有機會，代表性的產品包括 Notion 和釘釘等。

還有許多創業公司也正在與用戶體量較大的公司建立合作關係，提升實力。比如 MiniMax、智譜 AI 都接入了金山辦公的 WPS。

據了解，美團投資智譜 AI 前，已花費上千萬元購買了其大模型授權，計劃在此基礎上探索相關應用。

所有大模型公司接下來面臨的重大考驗是：怎麼找到真正賺錢、可持續的大模型商業模式。

“我們不能只是推動人工智能，卻沒有支撐它的商業模式。” 雲數據庫公司 Snowflake CEO 弗蘭克·斯魯特曼（Frank Slootman）在八月的財務電話會議上說。他說，“許多公司高管將他們進入大模型的嘗試描述爲實驗性的、探索性的，他們還在試圖弄清楚這是多大的挑戰。”

到目前爲止，從大模型浪潮中賺到錢的幾乎都是 “買鏟子” 的公司。比如英偉達。剛過去的第二財務季度，英偉達 GPU 相關業務營收同比增長 171% 到 103 億美元，公司淨利潤同比增長八倍到 62 億美元。

這輪政策落地，也可能會讓互聯網廣告平台先賺一筆錢。一名北京大模型從業者說，他們正在等待備案完成，之後將在短視頻、搜索平台重新啓動產品投放。在此前一段時間各產品主要以測試形態存在時，這家公司認爲大規模投入經濟上不划算。這之前，它們一度每月的產品廣告投流費用達百萬元級別。

“現在還沒有到出現超級應用的程度。” 一位大模型從業者認爲可能還需要兩到三年時間，目前只是有了一些跡象，“等到技術能力更強，應用效果夠好，成本足夠低，真正的超級應用才可能出現。”

編輯/lambor

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。