①谷歌表示,Veo 2在技術層面上的進步主要體現在物理引擎、攝影技術和人物表現力;②在性能評估中,Veo 2超過了Sora Turbo、可靈、MiniMaX等模型;③券商觀點,隨着AI視頻生成工具持續迭代,未來其向多種應用場景的滲透有望加速。
《科創板日報》12月17日訊 Sora正式發佈僅8天后,「谷歌版Sora」的2.0版本——Veo 2便正式發佈。
據谷歌官網顯示,Veo 2可製作具有逼真動作和高質量輸出的視頻。其最高分辨率可達4K,時長可達2分鐘以上。谷歌方面表示,Veo代表着高質量視頻生成領域的重大進步。
除視頻清晰度有所長進外,Veo 2對物理世界和鏡頭控制的理解也是驚人的:
![](https://newsfile.futunn.com/public/NN-PersistNewsContentImage/7781/20241217/51303220-0-26e5d4d49984d128b134a2f42976e73e.gif/big)
這段畫面的部分提示詞是:低角度跟蹤拍攝,18mm鏡頭。汽車漂移,留下光跡和輪胎煙霧。相機低速跟蹤,捕捉到光滑的橄欖綠色肌肉車接近拐角時的畫面。
![](https://newsfile.futunn.com/public/NN-PersistNewsContentImage/7781/20241217/51303220-1-7e2abcfbebc0cd4d3b7945756d7a5300.gif/big)
該畫面部分提示詞爲:特寫鏡頭聚焦於一位女DJ的臉部,她美麗、濃密的黑色捲髮勾勒出她的五官。她閉上雙眼,沉浸在節奏中,嘴角掛着一絲微笑。當她隨着節拍點頭和搖擺時,相機捕捉到了她頭部的細微動作。
從上述案例可見,Veo 2在真實世界還原以及Prompt指令遵循方面都有不錯的表現。而在谷歌官網發佈的性能評估中,Veo 2同樣打敗了Sora Turbo、可靈、MiniMaX等一衆海內外AI文生視頻大模型。
![](https://newsfile.futunn.com/public/NN-PersistNewsContentImage/7781/20241217/51303220-2-6c6864042aefa7a0a66f341fce95f826.png/big)
對此,谷歌總結稱,Veo 2在技術層面上的進步主要體現在三個方面。一是物理引擎的優化,這決定了AI視頻模型對於現實世界物理規律的深入理解。二是攝影技術的集成,能夠輸出更爲豐富的視覺效果。最後是人物表現力的提升,使人物動作和表情更具實感。
目前,Veo 2已被引入谷歌旗下視頻創作工具VedioFX。就在上週,OpenAI正式推出Sora Turbo,向美國及其他市場的ChatGPT付費用戶開放。新版工具Sora Turbo可以生成最長達20秒的視頻,並且可以提供這些視頻的多種變體。
與此同時,國內文生視頻進展不斷。今年以來,國內企業開始加速研發並迭代AI視頻生成產品,產品能力不斷提升:
今年6月,快手AI團隊發佈可靈AI視頻生成大模型,可生成長達2分鐘、分辨率達1080p的視頻;
7月,智譜AI上線視頻生成產品智譜清影,並在11月進行升級,支持生成時長爲10秒的4K超高清視頻;
8月,字節推出即夢AI一站式創作平台,隨後在11月宣佈即夢AI視頻模型S2.0Pro和P2.0Pro上線。
山西證券12月12日研報指出,隨着AI視頻生成工具持續迭代,未來其向多種應用場景的滲透有望加速。一方面,應用層建議重點關注創意、設計、教育等多模態特別是視頻生成強相關的領域;另一方面,視頻生成模型對算力需求較文本顯著提升,重點關注AI算力相關標的。