share_log

观点 | GPT-4发布,持续逼近通用人工智能AGI

觀點 | GPT-4發佈,持續逼近通用人工智能AGI

中信證券研究 ·  2023/03/16 10:43

來源:中信證券研究

近日openAI採用閉源模式發佈多模態大語言模型GPT-4 ,該模型採用和GPT-3.5/ChatGPT相同的技術路線,但帶來了更好的創造性、協作性、推理能力、安全性等,同時訓練過程中採用定製超級計算機進行算力承載,並完善了大語言模型scaling law基礎理論,實現訓練資源可控。

我們判斷,GPT-4的良好效果,有望推動全球AI領域技術棧持續向LLM(大語言模型)模型收斂,並通過暴力美學+工程技巧的結合不斷加速AI產業發展,帶來更多應用場景落地的同時,亦幫助人類不斷逼近通用人工智能AGI。

我們持續看好openAI及全球AI領域的產業投資機會,並建議持續聚焦芯片、算力設施、模型架構&工程實踐、應用場景等核心環節。

報告緣起:OpenAI正式發佈GPT-4

北京時間2023年3月14日晚,OpenAI發佈了正式版本的GPT-4,取代了此前ChatGPT使用的GPT-3.5版本,並開始爲付費的Plus用戶提供服務。OpenAI在官網表示,GPT-4雖然在大多數現實場景中的能力不如人類,但在一些專業問題和學術基準上表現已經和人類持平。本篇報告將基於對GPT-4底層技術邏輯、實現功能詳細分析的基礎上,探討GPT-4對全球AI產業帶來的可能技術路徑影響,以及產業層面的變化和機遇。

GPT-4:完全閉源模式發佈,耗時6個月迭代調整完成的多模態大語言模型

本次OpenAI推出GPT-4的形式與以往模型的發佈都有所不同,OpenAI既沒有公開發布GPT-4的相關論文,也沒有提供詳細的框架說明,僅僅提供了一份98頁的技術文檔(主要描述模型能力以及相關評測的得分,幾乎沒有任何技術細節)。通過這一方式,OpenAI阻斷了所有借鑑者參考的直接途徑(模型大小、數據集構建、訓練方法等),將閉源的路線堅持到底,這也符合我們之前對行業未來發展的判斷:領先的頭部公司(OpenAI、Google)將堅持閉源路線,避免其他公司復現其模型;落後一到兩個身位的公司(Meta、Amazon、NVIDIA等)可能會選擇開源路線,寄希望通過社區的力量加速迭代。

根據OpenAI發佈的這份技術報告,GPT-4的訓練以及迭代的耗時長達6個月以上,是之前發佈的ChatGPT的兩倍以上,在技術路徑上沿用了自回歸的Transformer模型加上人類反饋強化學習。模型能力方面最大的提升在於引入了多模態的處理能力,除了此前ChatGPT就支持的文字外,GPT-4還可以接受圖片輸入,不過暫時還沒有開放給用戶使用。此外,模型在面對複雜任務的可靠性與輸出的安全性上均有顯著的提升。

模型訓練關鍵點:採用定製化超級計算機,完善了大語言模型scaling law基礎理論

儘管OpenAI沒有公佈模型的及具體訓練細節,但從其在技術文檔中的表述出發,我們找到了兩點可能會影響整體產業的關鍵點:

1)OpenAI在去年開始就與微軟合作重新構建一臺用於大語言模型訓練的超級計算機,而本次GPT-4的訓練以及迭代環節應該是完全通過這臺計算機所完成的。根據Bloomberg的相關報道,OpenAI與微軟所搭建的這臺計算機總共耗資數億美元,使用了近萬張英偉達A100顯卡,這也與我們之前報告中對訓練大語言模型所需要的顯卡體量計算相一致。從OpenAI在技術文檔中描述的結果看(訓練+迭代總共耗時6個月),GPT-4的訓練過程遠短於此前的預期(從之前的論文出發,如此體量的模型迭代部分的對其就要耗費數月時間),這也表明了構建專用超級計算機的必要性。我們認爲,在未來數月時間我們將會看到更多AI大廠效仿OpenAI的做法,將定製化的超級計算機提上日程。

2)Scaling Law是OpenAI團隊在2020年發表的論文,主要對模型能力與模型大小、訓練時長間的關係做了推算,也成爲了大語言模型研究的重要理論。而在本次OpenAI的技術報告中,我們看到對scaling law有了進一步的完善。OpenAI表示在開發GPT-4的過程中進一步完善了Scaling Law,對此前無法解釋的湧現能力(當模型體積大小突破到某一階段時會突然出現某種新能力)可以更好的預測。Scaling Law的完善也意味着在模型訓練資源的投入將會更加可控,AI廠商將不再需要爲了湧現能力一味擴大參數,這將進一步降低AI訓練階段的成本。

應用場景:多模態能力加速多領域創新

GPT-4相較於ChatGPT最直觀的改變在於加入了支持圖片輸入的多模態的能力。儘管OpenAI表示目前多模態能力的重點還在於圖片轉文字,對於音頻、視頻、圖片編輯等還不支持,但這也給了市場足夠的想象空間。

1) 搜索領域:結合圖片輸入的多模態將更好的爲目前傳統搜索引擎+大語言模型輔助的模式進行服務。

2)智能客服:圖片與文字結合輸入的模式更加貼合目前ToC智能客服所遇到的一些痛點。

3)中小模型公司微調模型應用到具體細分領域:GPT-4被描述爲一個通用的大語言模型,從OpenAI的文檔看他們也沒有興趣對具體細分領域進行微調以求更好效果,那麼這個在未來就自然會交到中小人工智能廠商手中:在GPT-4的基礎上針對細分行業進行微調來獲得更好效果。

風險因素:

AI核心技術發展不及預期風險;科技領域政策監管持續收緊風險;全球宏觀經濟復甦不及預期風險;宏觀經濟波動導致歐美企業IT支出不及預期風險;全球雲計算市場發展不及預期風險;企業數據泄露、信息安全風險;行業競爭持續加劇風險等。

投資策略:

GPT-4 採用與 GPT-3.5/ChatGPT 相同的技術路線,但帶來了更好的創造性、協作性、推理能力,以及多模態能力等。GPT-4的良好效果,有望推動AI領域技術棧持續向LLM模型收斂,並通過暴力美學+工程技巧的結合不斷加速AI產業發展,幫助人類不斷逼近通用人工智能AGI。我們持續看好openAI及AI領域的產業投資機會,並建議持續聚焦芯片、算力設施、模型架構&工程實踐、應用場景等核心環節。

編輯/Somer

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論