share_log

招商证券:文生视频模型SORA表现效果超预期 带动算力网络建设需求

招商證券:文生視頻模型SORA表現效果超預期 帶動算力網絡建設需求

智通財經 ·  02/20 13:57

智通財經APP獲悉,招商證券發佈研究報告稱,Sora打開AIGC在視覺領域的應用空間,算力網絡供給持續短缺拉動硬件基礎設施建設需求。該行測算訓練Sora模型需要約7.09萬張H100一個月的訓練量。在推理側,根據相關研究測算生成一張圖的算力消耗約爲256個詞的消耗。由此推算生成一個1分鐘時長短視頻的算力消耗約是生成一次文字對話的千倍以上。該行認爲中短期算力將持續處於短缺不能充分滿足推理側需求。

事件:2月16日OpenAI推出文生視頻模型Sora,可以根據文本指令創建現實且富有想象力的場景,能夠生成具有多個角色、特定類型的運動,以及主體和背景的準確細節的複雜場景的高清視頻,並且時長可以達到一分鐘。Sora的超預期表明Transformer模型在視覺領域的有效,爲視覺模型的加速迭代奠定基礎。

招商證券觀點如下:

Sora模型展示效果驚豔,創立視覺模型里程碑。

與之前的視覺模型不同,OpenAI的Sora是視覺數據的通用模型,通過一次爲模型提供多幀的預測,解決了一個具有挑戰性的問題,即確保主題即使暫時離開視野也保持不變。它可以生成不同時長、長寬比和分辨率的視頻和圖像,而且最多可以輸出長達一分鐘的高清視頻。Sora的核心優勢:一致性、靈活性、穩定性。Sora能夠靈活的生成各種像素各種畫幅的圖像,同時能夠根據圖像生成視頻或者將視頻內容擴充出新的視頻。與其他模型相比Sora生成的時長達到1分鐘的情況下還能保持前後主題的一致性是之前視覺模型所不具備的。同時Sora還湧現出對物理規律的理解能力,在沒有人爲約束的情況下生成的畫面中滿足物理學規則使得畫面更加逼真。

視覺模型的GPT3時刻,模型迭代進入加速期。

Sora之前,雖然大語言模型隨着GPT的成功逐漸成爲主要研究方向,不過擴散模型仍在大語言模型佔據主導地位。DALL·E、StableDiffusion等廣泛使用的視覺模型都採用擴散模型。2023年穀歌提出大語言模型之所以在視頻領域表現不佳的主要原因不在於模型本身而在於沒有好的表達形式來轉化視頻,也證明了大語言模型在文生視頻領域的可行性。Sora的突破之處在於基於DiT結構,結合了大語言模型和擴散模型的共同優點。使得Diffusion模型也能夠規模化,證明GTP4式的大力出奇跡也能在視覺領域出現同樣的“湧現”效果。Sora標誌了擴散+語言大模型融合路線的成功,未來具有很大的迭代潛力,類似於GPT3的里程碑意義,沿着這條道路持續迭代未來1-2年內有望出現能生成效果更加逼真的視覺模型。

Sora大幅拉動算力需求,拉動硬件建設投資。

根據DiT模型創立者謝賽寧博士粗略測算,Sora模型的參數規模大約爲30億。根據對可訓練數據量的研究成果,海外大型視頻網站每分鐘大約上傳500小時視頻內容。由此該行測算訓練Sora模型需要約7.09萬張H100一個月的訓練量。在推理側,根據相關研究測算生成一張圖的算力消耗約爲256個詞的消耗。由此推算生成一個1分鐘時長短視頻的算力消耗約是生成一次文字對話的千倍以上。中短期算力將持續處於短缺不能充分滿足推理側需求。

投資建議:Sora打開AIGC在視覺領域的應用空間,算力網絡供給持續短缺拉動硬件基礎設施建設需求。

光模塊環節該行重點推薦北美光模塊核心供應商:中際旭創(300308.SZ)、新易盛(300502.SZ),及其上游核心供應商天孚通信(300394.SZ),及國產光芯片龍頭源傑科技(688498.SH);

交換機環節該行建議關注交換機國產替代龍頭紫光股份(000938.SZ)、銳捷網絡(301165.SZ),同時建議關注國產交換機芯片龍頭盛科通信(688702.SH),同時推薦國內ICT巨頭中興通訊(000063.SZ);

視頻編解碼環節該行建議關注視頻編解碼優質公司當虹科技(688039.SH)、維海德(301318.SZ)。

風險提示:核心計算參數假設不準確,Sora模型落地進度不及預期,行業競爭格局惡化

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論