追蹤AI最新趨勢

觀點 | GPT-4發佈，持續逼近通用人工智能AGI

中信證券研究 · 2023/03/16 10:43

来源：中信证券研究

近日openAI采用闭源模式发布多模态大语言模型GPT-4 ，该模型采用和GPT-3.5/ChatGPT相同的技术路线，但带来了更好的创造性、协作性、推理能力、安全性等，同时训练过程中采用定制超级计算机进行算力承载，并完善了大语言模型scaling law基础理论，实现训练资源可控。

我们判断，GPT-4的良好效果，有望推动全球AI领域技术栈持续向LLM（大语言模型）模型收敛，并通过暴力美学+工程技巧的结合不断加速AI产业发展，带来更多应用场景落地的同时，亦帮助人类不断逼近通用人工智能AGI。

我们持续看好openAI及全球AI领域的产业投资机会，并建议持续聚焦芯片、算力设施、模型架构&工程实践、应用场景等核心环节。

报告缘起：OpenAI正式发布GPT-4

北京时间2023年3月14日晚，OpenAI发布了正式版本的GPT-4，取代了此前ChatGPT使用的GPT-3.5版本，并开始为付费的Plus用户提供服务。OpenAI在官网表示，GPT-4虽然在大多数现实场景中的能力不如人类，但在一些专业问题和学术基准上表现已经和人类持平。本篇报告将基于对GPT-4底层技术逻辑、实现功能详细分析的基础上，探讨GPT-4对全球AI产业带来的可能技术路径影响，以及产业层面的变化和机遇。

GPT-4：完全闭源模式发布，耗时6个月迭代调整完成的多模态大语言模型

本次OpenAI推出GPT-4的形式与以往模型的发布都有所不同，OpenAI既没有公开发布GPT-4的相关论文，也没有提供详细的框架说明，仅仅提供了一份98页的技术文档（主要描述模型能力以及相关评测的得分，几乎没有任何技术细节）。通过这一方式，OpenAI阻断了所有借鉴者参考的直接途径（模型大小、数据集构建、训练方法等），将闭源的路线坚持到底，这也符合我们之前对行业未来发展的判断：领先的头部公司（OpenAI、Google）将坚持闭源路线，避免其他公司复现其模型；落后一到两个身位的公司（Meta、Amazon、NVIDIA等）可能会选择开源路线，寄希望通过社区的力量加速迭代。

根据OpenAI发布的这份技术报告，GPT-4的训练以及迭代的耗时长达6个月以上，是之前发布的ChatGPT的两倍以上，在技术路径上沿用了自回归的Transformer模型加上人类反馈强化学习。模型能力方面最大的提升在于引入了多模态的处理能力，除了此前ChatGPT就支持的文字外，GPT-4还可以接受图片输入，不过暂时还没有开放给用户使用。此外，模型在面对复杂任务的可靠性与输出的安全性上均有显著的提升。

模型训练关键点：采用定制化超级计算机，完善了大语言模型scaling law基础理论

尽管OpenAI没有公布模型的及具体训练细节，但从其在技术文档中的表述出发，我们找到了两点可能会影响整体产业的关键点：

1）OpenAI在去年开始就与微软合作重新构建一台用于大语言模型训练的超级计算机，而本次GPT-4的训练以及迭代环节应该是完全通过这台计算机所完成的。根据Bloomberg的相关报道，OpenAI与微软所搭建的这台计算机总共耗资数亿美元，使用了近万张英伟达A100显卡，这也与我们之前报告中对训练大语言模型所需要的显卡体量计算相一致。从OpenAI在技术文档中描述的结果看（训练+迭代总共耗时6个月），GPT-4的训练过程远短于此前的预期（从之前的论文出发，如此体量的模型迭代部分的对其就要耗费数月时间），这也表明了构建专用超级计算机的必要性。我们认为，在未来数月时间我们将会看到更多AI大厂效仿OpenAI的做法，将定制化的超级计算机提上日程。

2）Scaling Law是OpenAI团队在2020年发表的论文，主要对模型能力与模型大小、训练时长间的关系做了推算，也成为了大语言模型研究的重要理论。而在本次OpenAI的技术报告中，我们看到对scaling law有了进一步的完善。OpenAI表示在开发GPT-4的过程中进一步完善了Scaling Law，对此前无法解释的涌现能力（当模型体积大小突破到某一阶段时会突然出现某种新能力）可以更好的预测。Scaling Law的完善也意味着在模型训练资源的投入将会更加可控，AI厂商将不再需要为了涌现能力一味扩大参数，这将进一步降低AI训练阶段的成本。

应用场景：多模态能力加速多领域创新

GPT-4相较于ChatGPT最直观的改变在于加入了支持图片输入的多模态的能力。尽管OpenAI表示目前多模态能力的重点还在于图片转文字，对于音频、视频、图片编辑等还不支持，但这也给了市场足够的想象空间。

1) 搜索领域：结合图片输入的多模态将更好的为目前传统搜索引擎+大语言模型辅助的模式进行服务。

2）智能客服：图片与文字结合输入的模式更加贴合目前ToC智能客服所遇到的一些痛点。

3）中小模型公司微调模型应用到具体细分领域：GPT-4被描述为一个通用的大语言模型，从OpenAI的文档看他们也没有兴趣对具体细分领域进行微调以求更好效果，那么这个在未来就自然会交到中小人工智能厂商手中：在GPT-4的基础上针对细分行业进行微调来获得更好效果。

风险因素：

AI核心技术发展不及预期风险；科技领域政策监管持续收紧风险；全球宏观经济复苏不及预期风险；宏观经济波动导致欧美企业IT支出不及预期风险；全球云计算市场发展不及预期风险；企业数据泄露、信息安全风险；行业竞争持续加剧风险等。

投资策略：

GPT-4 采用与 GPT-3.5/ChatGPT 相同的技术路线，但带来了更好的创造性、协作性、推理能力，以及多模态能力等。GPT-4的良好效果，有望推动AI领域技术栈持续向LLM模型收敛，并通过暴力美学+工程技巧的结合不断加速AI产业发展，帮助人类不断逼近通用人工智能AGI。我们持续看好openAI及AI领域的产业投资机会，并建议持续聚焦芯片、算力设施、模型架构&工程实践、应用场景等核心环节。

编辑/Somer

來源：中信證券研究

近日openAI採用閉源模式發佈多模態大語言模型GPT-4 ，該模型採用和GPT-3.5/ChatGPT相同的技術路線，但帶來了更好的創造性、協作性、推理能力、安全性等，同時訓練過程中採用定製超級計算機進行算力承載，並完善了大語言模型scaling law基礎理論，實現訓練資源可控。

我們判斷，GPT-4的良好效果，有望推動全球AI領域技術棧持續向LLM（大語言模型）模型收斂，並通過暴力美學+工程技巧的結合不斷加速AI產業發展，帶來更多應用場景落地的同時，亦幫助人類不斷逼近通用人工智能AGI。

我們持續看好openAI及全球AI領域的產業投資機會，並建議持續聚焦芯片、算力設施、模型架構&工程實踐、應用場景等核心環節。

報告緣起：OpenAI正式發佈GPT-4

北京時間2023年3月14日晚，OpenAI發佈了正式版本的GPT-4，取代了此前ChatGPT使用的GPT-3.5版本，並開始爲付費的Plus用戶提供服務。OpenAI在官網表示，GPT-4雖然在大多數現實場景中的能力不如人類，但在一些專業問題和學術基準上表現已經和人類持平。本篇報告將基於對GPT-4底層技術邏輯、實現功能詳細分析的基礎上，探討GPT-4對全球AI產業帶來的可能技術路徑影響，以及產業層面的變化和機遇。

GPT-4：完全閉源模式發佈，耗時6個月迭代調整完成的多模態大語言模型

本次OpenAI推出GPT-4的形式與以往模型的發佈都有所不同，OpenAI既沒有公開發布GPT-4的相關論文，也沒有提供詳細的框架說明，僅僅提供了一份98頁的技術文檔（主要描述模型能力以及相關評測的得分，幾乎沒有任何技術細節）。通過這一方式，OpenAI阻斷了所有借鑑者參考的直接途徑（模型大小、數據集構建、訓練方法等），將閉源的路線堅持到底，這也符合我們之前對行業未來發展的判斷：領先的頭部公司（OpenAI、Google）將堅持閉源路線，避免其他公司復現其模型；落後一到兩個身位的公司（Meta、Amazon、NVIDIA等）可能會選擇開源路線，寄希望通過社區的力量加速迭代。

根據OpenAI發佈的這份技術報告，GPT-4的訓練以及迭代的耗時長達6個月以上，是之前發佈的ChatGPT的兩倍以上，在技術路徑上沿用了自回歸的Transformer模型加上人類反饋強化學習。模型能力方面最大的提升在於引入了多模態的處理能力，除了此前ChatGPT就支持的文字外，GPT-4還可以接受圖片輸入，不過暫時還沒有開放給用戶使用。此外，模型在面對複雜任務的可靠性與輸出的安全性上均有顯著的提升。

模型訓練關鍵點：採用定製化超級計算機，完善了大語言模型scaling law基礎理論

儘管OpenAI沒有公佈模型的及具體訓練細節，但從其在技術文檔中的表述出發，我們找到了兩點可能會影響整體產業的關鍵點：

1）OpenAI在去年開始就與微軟合作重新構建一臺用於大語言模型訓練的超級計算機，而本次GPT-4的訓練以及迭代環節應該是完全通過這臺計算機所完成的。根據Bloomberg的相關報道，OpenAI與微軟所搭建的這臺計算機總共耗資數億美元，使用了近萬張英偉達A100顯卡，這也與我們之前報告中對訓練大語言模型所需要的顯卡體量計算相一致。從OpenAI在技術文檔中描述的結果看（訓練+迭代總共耗時6個月），GPT-4的訓練過程遠短於此前的預期（從之前的論文出發，如此體量的模型迭代部分的對其就要耗費數月時間），這也表明了構建專用超級計算機的必要性。我們認爲，在未來數月時間我們將會看到更多AI大廠效仿OpenAI的做法，將定製化的超級計算機提上日程。

2）Scaling Law是OpenAI團隊在2020年發表的論文，主要對模型能力與模型大小、訓練時長間的關係做了推算，也成爲了大語言模型研究的重要理論。而在本次OpenAI的技術報告中，我們看到對scaling law有了進一步的完善。OpenAI表示在開發GPT-4的過程中進一步完善了Scaling Law，對此前無法解釋的湧現能力（當模型體積大小突破到某一階段時會突然出現某種新能力）可以更好的預測。Scaling Law的完善也意味着在模型訓練資源的投入將會更加可控，AI廠商將不再需要爲了湧現能力一味擴大參數，這將進一步降低AI訓練階段的成本。

應用場景：多模態能力加速多領域創新

GPT-4相較於ChatGPT最直觀的改變在於加入了支持圖片輸入的多模態的能力。儘管OpenAI表示目前多模態能力的重點還在於圖片轉文字，對於音頻、視頻、圖片編輯等還不支持，但這也給了市場足夠的想象空間。

1) 搜索領域：結合圖片輸入的多模態將更好的爲目前傳統搜索引擎+大語言模型輔助的模式進行服務。

2）智能客服：圖片與文字結合輸入的模式更加貼合目前ToC智能客服所遇到的一些痛點。

3）中小模型公司微調模型應用到具體細分領域：GPT-4被描述爲一個通用的大語言模型，從OpenAI的文檔看他們也沒有興趣對具體細分領域進行微調以求更好效果，那麼這個在未來就自然會交到中小人工智能廠商手中：在GPT-4的基礎上針對細分行業進行微調來獲得更好效果。

風險因素：

AI核心技術發展不及預期風險；科技領域政策監管持續收緊風險；全球宏觀經濟復甦不及預期風險；宏觀經濟波動導致歐美企業IT支出不及預期風險；全球雲計算市場發展不及預期風險；企業數據泄露、信息安全風險；行業競爭持續加劇風險等。

投資策略：

GPT-4 採用與 GPT-3.5/ChatGPT 相同的技術路線，但帶來了更好的創造性、協作性、推理能力，以及多模態能力等。GPT-4的良好效果，有望推動AI領域技術棧持續向LLM模型收斂，並通過暴力美學+工程技巧的結合不斷加速AI產業發展，幫助人類不斷逼近通用人工智能AGI。我們持續看好openAI及AI領域的產業投資機會，並建議持續聚焦芯片、算力設施、模型架構&工程實踐、應用場景等核心環節。

編輯/Somer

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。