追蹤AI最新趨勢

這個訪談回應了所有AI焦點問題！他是AI最重要論文的聯合作者

Aidan Gomez认为，LLM发展已进入平台期，简单扩大模型规模带来的边际效益正在递减，而推理能力将成为未来突破口，并将带来新的商业模式和市场机遇——从"买更大的算力"变成了"多给AI一点思考时间"。

AI狂飙突进的时代，真的要结束了吗？

随着scaling law撞墙新闻爆出，全球科技圈、资本市场关于大模型发展触及天花板的讨论愈演愈烈。那么，AI发展是否放缓？后续又将如何发展？商业模式如何突破？

针对一系列焦点问题，人工智能领域最具影响力的论文《Attention Is All You Need》的联合作者，Cohere联合创始人兼CEO Aidan Gomez在访谈中分享了自己对AI发展的深度见解。

他认为，LLM发展已进入平台期，而推理能力将成为未来突破口，并将带来新的商业模式和市场机遇。同时，他也提醒投资者警惕模型价格倾销，关注 AGI 发展趋势。

对于scaling law放缓的问题，Gomez认为，简单扩大模型规模带来的边际效益正在递减。以绘画为例，Gomez指出 LLM 的发展初期如同用大笔触快速完成基础构图，但随着模型需要处理更精细的任务，如同绘画需要越来越细的笔触来完善细节，模型改进需要的数据也越来越精细，这导致获取高质量数据的成本越来越高，最终模型的规模化发展将受限于人类知识的边界和专家数据的获取难度。

推理能力方面，Gomez表示，推理能力可以让 LLM 不仅简单地记忆输入输出对，还可以像人类一样进行多步骤的思考和推理，解决更复杂的问题。而这，这带来了一个革命性的变化——企业不必再为提升AI能力投入巨额固定成本，而是可以通过增加推理时间来实现。用通俗的话说，就是从"买更大的算力"变成了"多给AI一点思考时间"。

Gomez还认为，推理时间计算量的增加还将对芯片层和数据中心建设产生影响，未来需要开发更适合处理推理任务的芯片，以及建设更适合分布式计算的数据中心。

以下是访谈内容精编：

LLM发展进入平台期，推理能力将成未来突破口

问：LLM 发展是否已经进入平台期？未来的突破口在哪里？

Gomez：

LLM 性能提升已进入平台期，边际效益递减。 [2， 6] 简单地扩大模型规模带来的性能提升有限，就像油画创作从大笔触的构图阶段进入到需要用越来越细的笔触来完善细节的阶段。
模型改进需要越来越精细的数据。 LLM 在处理简单、常见的任务时可以快速提升，但在处理更专业、敏感的领域（如科学、数学）时，性能提升的难度越来越大，因为需要更精细、专业的数据来训练模型。
推理能力将成为 LLM 未来发展的新突破口。 [3， 5] 推理能力可以让 LLM 不仅简单地记忆输入输出对，还可以像人类一样进行多步骤的思考和推理，解决更复杂的问题，例如多项式求解。

问：影响模型规模化发展的因素有哪些？

Gomez：

合成数据可以帮助模型在某些领域（如代码、数学）提升性能。因为这些领域的答案易于验证，可以通过合成大量数据来训练模型。
但在其他需要真实世界知识的领域（如生物学、化学），数据的获取难度更大，需要依赖专家知识。
最终，模型的规模化发展将受限于人类知识的边界和专家数据的获取难度。

2. 推理能力将带来新的商业模式和市场机遇

问：推理能力将如何改变行业格局？

答：

推理能力的出现将带来新的商业模式。
客户可以通过增加推理时间计算量来获得更智能的模型，而无需等待数月进行新的模型训练。这意味着客户可以根据需求灵活地调整模型性能，获得更好的产品体验。
这种从资本支出（CAPEX）模式到消费模式的转变将吸引更多客户投资于解决问题，而无需承担高昂的训练成本和时间成本。
推理时间计算量的增加还将对芯片层和数据中心建设产生影响，未来需要开发更适合处理推理任务的芯片，以及建设更适合分布式计算的数据中心。

问：如何理解推理能力？

答：

目前的 LLM 缺乏像人类一样的“内心独白”，无法进行多步骤的推理思考。它们只能根据输入直接给出输出，而不能像人类一样在解决问题时进行思考、尝试、纠错，最终找到解决方案。
推理能力的加入将使 LLM 可以像人类一样进行多步骤的思考和推理。这种能力将通过使用人类数据和合成数据，明确地收集人们的内心想法并进行训练来实现。

问：什么类型的问题更适合使用推理能力解决？

答：

任何需要多步骤解决的问题都更适合使用推理能力来解决。例如，多项式求解，人类在解决这类问题时，需要将其分解成多个步骤，逐步解决，最终得到答案。而目前的 LLM 只能通过记忆的方式来解决这类问题。

问：市场普遍低估了推理时间计算的哪些方面？

答：

推理时间计算在提供智能方面的作用尚未被市场充分认识。
推理能力的加入为客户提供了一种新的选择：客户可以通过增加推理时间计算量来获得更智能的模型。

3. Cohere: 自主研发模型，打造差异化竞争优势

问：Cohere 为什么选择自主研发模型？

答：

虽然开源模型提供了基础模型，但微调效果不如自主研发。
自主研发能够控制数据和训练过程，为客户提供更多定制化选项。

问：LLM 是否适用于所有领域？

答：

虽然 Transformer 模型可以处理很多问题，但在某些领域可能效率较低，例如图结构数据。
在这些领域，可能需要更专业的模型才能实现更高的效率。

4. 警惕模型价格倾销，关注 AGI 发展趋势

问：市场上 LLM 价格下降是否意味着模型商品化？

答：

市场上出现的模型价格下降并非商品化的标志，而是价格倾销的结果。
模型构建需要高度的技术能力，只有少数公司掌握核心技术。
未来市场将受到增长压力和投资回报率的影响，目前以亏损或免费提供昂贵技术的做法是不可持续的。

问：如何看待 AGI 的发展？

答：

AGI 并非一个非黑即白的概念，而是一个持续发展的过程，我们已经在构建通用智能机器的道路上取得了很大进展。
超级智能的快速发展和自我提升并不会导致像电影“终结者”中那样的人类灭绝。
人类将利用人工智能技术创造富足，而不是依赖于一个“上帝”般的超级智能来实现。

编辑/ping

Aidan Gomez認爲，LLM發展已進入平台期，簡單擴大模型規模帶來的邊際效益正在遞減，而推理能力將成爲未來突破口，並將帶來新的商業模式和市場機遇——從"買更大的算力"變成了"多給AI一點思考時間"。

AI狂飆突進的時代，真的要結束了嗎？

隨着scaling law撞牆新聞爆出，全球科技圈、資本市場關於大模型發展觸及天花板的討論愈演愈烈。那麼，AI發展是否放緩？後續又將如何發展？商業模式如何突破？

針對一系列焦點問題，人工智能領域最具影響力的論文《Attention Is All You Need》的聯合作者，Cohere聯合創始人兼CEO Aidan Gomez在訪談中分享了自己對AI發展的深度見解。

他認爲，LLM發展已進入平台期，而推理能力將成爲未來突破口，並將帶來新的商業模式和市場機遇。同時，他也提醒投資者警惕模型價格傾銷，關注 AGI 發展趨勢。

對於scaling law放緩的問題，Gomez認爲，簡單擴大模型規模帶來的邊際效益正在遞減。以繪畫爲例，Gomez指出 LLM 的發展初期如同用大筆觸快速完成基礎構圖，但隨着模型需要處理更精細的任務，如同繪畫需要越來越細的筆觸來完善細節，模型改進需要的數據也越來越精細，這導致獲取高質量數據的成本越來越高，最終模型的規模化發展將受限於人類知識的邊界和專家數據的獲取難度。

推理能力方面，Gomez表示，推理能力可以讓 LLM 不僅簡單地記憶輸入輸出對，還可以像人類一樣進行多步驟的思考和推理，解決更復雜的問題。而這，這帶來了一個革命性的變化——企業不必再爲提升AI能力投入巨額固定成本，而是可以通過增加推理時間來實現。用通俗的話說，就是從"買更大的算力"變成了"多給AI一點思考時間"。

Gomez還認爲，推理時間計算量的增加還將對芯片層和數據中心建設產生影響，未來需要開發更適合處理推理任務的芯片，以及建設更適合分佈式計算的數據中心。

以下是訪談內容精編：

LLM發展進入平台期，推理能力將成未來突破口

問：LLM 發展是否已經進入平台期？未來的突破口在哪裏？

Gomez：

LLM 性能提升已進入平台期，邊際效益遞減。 [2， 6] 簡單地擴大模型規模帶來的性能提升有限，就像油畫創作從大筆觸的構圖階段進入到需要用越來越細的筆觸來完善細節的階段。
模型改進需要越來越精細的數據。 LLM 在處理簡單、常見的任務時可以快速提升，但在處理更專業、敏感的領域（如科學、數學）時，性能提升的難度越來越大，因爲需要更精細、專業的數據來訓練模型。
推理能力將成爲 LLM 未來發展的新突破口。 [3， 5] 推理能力可以讓 LLM 不僅簡單地記憶輸入輸出對，還可以像人類一樣進行多步驟的思考和推理，解決更復雜的問題，例如多項式求解。

問：影響模型規模化發展的因素有哪些？

Gomez：

合成數據可以幫助模型在某些領域（如代碼、數學）提升性能。因爲這些領域的答案易於驗證，可以通過合成大量數據來訓練模型。
但在其他需要真實世界知識的領域（如生物學、化學），數據的獲取難度更大，需要依賴專家知識。
最終，模型的規模化發展將受限於人類知識的邊界和專家數據的獲取難度。

2. 推理能力將帶來新的商業模式和市場機遇

問：推理能力將如何改變行業格局？

答：

推理能力的出現將帶來新的商業模式。
客戶可以通過增加推理時間計算量來獲得更智能的模型，而無需等待數月進行新的模型訓練。這意味着客戶可以根據需求靈活地調整模型性能，獲得更好的產品體驗。
這種從資本支出（CAPEX）模式到消費模式的轉變將吸引更多客戶投資於解決問題，而無需承擔高昂的訓練成本和時間成本。
推理時間計算量的增加還將對芯片層和數據中心建設產生影響，未來需要開發更適合處理推理任務的芯片，以及建設更適合分佈式計算的數據中心。

問：如何理解推理能力？

答：

目前的 LLM 缺乏像人類一樣的「內心獨白」，無法進行多步驟的推理思考。它們只能根據輸入直接給出輸出，而不能像人類一樣在解決問題時進行思考、嘗試、糾錯，最終找到解決方案。
推理能力的加入將使 LLM 可以像人類一樣進行多步驟的思考和推理。這種能力將通過使用人類數據和合成數據，明確地收集人們的內心想法並進行訓練來實現。

問：什麼類型的問題更適合使用推理能力解決？

答：

任何需要多步驟解決的問題都更適合使用推理能力來解決。例如，多項式求解，人類在解決這類問題時，需要將其分解成多個步驟，逐步解決，最終得到答案。而目前的 LLM 只能通過記憶的方式來解決這類問題。

問：市場普遍低估了推理時間計算的哪些方面？

答：

推理時間計算在提供智能方面的作用尚未被市場充分認識。
推理能力的加入爲客戶提供了一種新的選擇：客戶可以通過增加推理時間計算量來獲得更智能的模型。

3. Cohere: 自主研發模型，打造差異化競爭優勢

問：Cohere 爲什麼選擇自主研發模型？

答：

雖然開源模型提供了基礎模型，但微調效果不如自主研發。
自主研發能夠控制數據和訓練過程，爲客戶提供更多定製化選項。

問：LLM 是否適用於所有領域？

答：

雖然 Transformer 模型可以處理很多問題，但在某些領域可能效率較低，例如圖結構數據。
在這些領域，可能需要更專業的模型才能實現更高的效率。

4. 警惕模型價格傾銷，關注 AGI 發展趨勢

問：市場上 LLM 價格下降是否意味着模型商品化？

答：

市場上出現的模型價格下降並非商品化的標誌，而是價格傾銷的結果。
模型構建需要高度的技術能力，只有少數公司掌握核心技術。
未來市場將受到增長壓力和投資回報率的影響，目前以虧損或免費提供昂貴技術的做法是不可持續的。

問：如何看待 AGI 的發展？

答：

AGI 並非一個非黑即白的概念，而是一個持續發展的過程，我們已經在構建通用智能機器的道路上取得了很大進展。
超級智能的快速發展和自我提升並不會導致像電影「終結者」中那樣的人類滅絕。
人類將利用人工智能技術創造富足，而不是依賴於一個「上帝」般的超級智能來實現。

編輯/ping

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

追蹤AI最新趨勢

这个访谈回应了所有AI焦点问题！他是AI最重要论文的联合作者

這個訪談回應了所有AI焦點問題！他是AI最重要論文的聯合作者

LLM发展进入平台期，推理能力将成未来突破口

2. 推理能力将带来新的商业模式和市场机遇

3. Cohere: 自主研发模型，打造差异化竞争优势

4. 警惕模型价格倾销，关注 AGI 发展趋势

LLM發展進入平台期，推理能力將成未來突破口

2. 推理能力將帶來新的商業模式和市場機遇

3. Cohere: 自主研發模型，打造差異化競爭優勢

4. 警惕模型價格傾銷，關注 AGI 發展趨勢

風險及免責聲明

聲明