share_log

银河证券:Sora对算力需求影响几何?

銀河證券:Sora對算力需求影響幾何?

智通財經 ·  04/01 14:59

Sora 算力需求將呈指數級增長,帶動算力基礎設施需求。

智通財經APP獲悉,銀河證券發佈研究報告稱,基於大語言模型推導算力需求方法,對Sora單次訓練算力需求進行推演,據相關研究推測,Sora參數規模估算在30B(待確認),如果按此參數測算,該行推演出Sora訓練單次算力需求或可達到2.6×10^24Flops,相當於GPT-3 175B的8.2倍。目前Sora還在初級階段,仍然存在如能以準確模擬物理運動規律及場景、混淆左右方向、混淆空間細節等,但伴隨Sora不斷迭代調優,訓練數據集規模增大,未來算力需求將呈現指數級爆發式增長,持續看好上游算力基礎設施投資機會。

銀河證券觀點如下:

Sora 算力需求將呈指數級增長,帶動算力基礎設施需求。

北京時間 2 月 16 日凌晨,OpenAI 發佈了首個文生視頻模型 Sora,可以用文字指令生成長達 60秒的高清流暢視頻,在生成視頻長度、連貫性、多鏡頭切換方面具備顯著優勢。本文基於大語言模型推導算力需求方法,對Sora單次訓練算力需求進行推演,據相關研究推測,Sora參數規模估算在30B(待確認),如果按此參數測算,該行推演出Sora訓練單次算力需求或可達到2.6×10^24Flops,相當於GPT-3 175B的8.2倍。該行認爲,目前Sora還在初級階段,仍然存在如能以準確模擬物理運動規律及場景、混淆左右方向、混淆空間細節等,但伴隨Sora不斷迭代調優,訓練數據集規模增大,未來算力需求將呈現指數級爆發式增長,持續看好上游算力基礎設施投資機會。

Sora基於DiT架構,採用Transformer替換U-Net。

Sora實際上是一種基於DiT(Diffusion Transformer,擴散變換器)的模型搭建,同時採用了Diffusion與Transformer,是一種用於擴散模型的新架構。Sora受到大語言模型的啓發,用Transformer替換擴散模型中的U-Net,通過將Transformer與Diffusion結合成爲一種基於擴散變換的模型DiT,趨於標準Transformer架構,同時保留其可擴展性。與大語言模型將文本轉換爲可被理解的token類似,Sora將視頻轉換成一系列Patch(視覺編碼塊)並將其進行降維,用Patch作爲視覺圖像統一表現形式,將噪聲通過去噪來預測原始圖像信息,進而生成視頻。

Sora實現跨越式提升,文生視頻大模型開啓新紀元。

Sora可以將Prompt轉換成長達60秒視頻,相對於此前文生視頻大模型Runway、Pika、Stable Video等提升幾個級別。同時在視頻分辨率以及質量方面,Sora可以生成1080P清晰度視頻,並且能夠相對完整實現對世界及物體運動規律理解及模擬,在鏡頭切換方面保持穩定性。此外,Sora還支持圖片格式輸入、視頻擴展、視頻拼接等,是文生視頻領域突破性技術變革。

投資建議:Sora是人工智能發展進程中的“里程碑”,推動AGI時代加速到來,算力需求將持續爆發,持續看好產業鏈投資機會。建議重點關注國內上市公司:1)國內多模態大模型:科大訊飛(002230.SZ)、海康威視(002415.SZ)、大華股份(002236.SZ);2)算力基礎設施:工業富聯(601138.SH)、中科曙光(603019.SH)、軟通動力(301236.SZ)等;3)AI應用端:萬興科技(300624.SZ)、金山辦公(688111.SH)、超圖軟件(300036.SZ)等。

風險提示:技術研發進度不及預期風險;供應鏈風險;政策推進不及預期風險;消費需求不及預期風險;行業競爭加劇風險等。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論