谷歌AI視頻模型深夜炸場：4K分辨率+2分鐘時長又給OpenAI「來了一槍」

財聯社 · 12/17 12:56

①谷歌表示，Veo 2在技术层面上的进步主要体现在物理引擎、摄影技术和人物表现力；②在性能评估中，Veo 2超过了Sora Turbo、可灵、MiniMaX等模型；③券商观点，随着AI视频生成工具持续迭代，未来其向多种应用场景的渗透有望加速。

《科创板日报》12月17日讯 Sora正式发布仅8天后，“谷歌版Sora”的2.0版本——Veo 2便正式发布。

据谷歌官网显示，Veo 2可制作具有逼真动作和高质量输出的视频。其最高分辨率可达4K，时长可达2分钟以上。谷歌方面表示，Veo代表着高质量视频生成领域的重大进步。

除视频清晰度有所长进外，Veo 2对物理世界和镜头控制的理解也是惊人的：

这段画面的部分提示词是：低角度跟踪拍摄，18mm镜头。汽车漂移，留下光迹和轮胎烟雾。相机低速跟踪，捕捉到光滑的橄榄绿色肌肉车接近拐角时的画面。

该画面部分提示词为：特写镜头聚焦于一位女DJ的脸部，她美丽、浓密的黑色卷发勾勒出她的五官。她闭上双眼，沉浸在节奏中，嘴角挂着一丝微笑。当她随着节拍点头和摇摆时，相机捕捉到了她头部的细微动作。

从上述案例可见，Veo 2在真实世界还原以及Prompt指令遵循方面都有不错的表现。而在谷歌官网发布的性能评估中，Veo 2同样打败了Sora Turbo、可灵、MiniMaX等一众海内外AI文生视频大模型。

对此，谷歌总结称，Veo 2在技术层面上的进步主要体现在三个方面。一是物理引擎的优化，这决定了AI视频模型对于现实世界物理规律的深入理解。二是摄影技术的集成，能够输出更为丰富的视觉效果。最后是人物表现力的提升，使人物动作和表情更具实感。

目前，Veo 2已被引入谷歌旗下视频创作工具VedioFX。就在上周，OpenAI正式推出Sora Turbo，向美国及其他市场的ChatGPT付费用户开放。新版工具Sora Turbo可以生成最长达20秒的视频，并且可以提供这些视频的多种变体。

与此同时，国内文生视频进展不断。今年以来，国内企业开始加速研发并迭代AI视频生成产品，产品能力不断提升：

今年6月，快手AI团队发布可灵AI视频生成大模型，可生成长达2分钟、分辨率达1080p的视频；

7月，智谱AI上线视频生成产品智谱清影，并在11月进行升级，支持生成时长为10秒的4K超高清视频；

8月，字节推出即梦AI一站式创作平台，随后在11月宣布即梦AI视频模型S2.0Pro和P2.0Pro上线。

山西证券12月12日研报指出，随着AI视频生成工具持续迭代，未来其向多种应用场景的渗透有望加速。一方面，应用层建议重点关注创意、设计、教育等多模态特别是视频生成强相关的领域；另一方面，视频生成模型对算力需求较文本显著提升，重点关注AI算力相关标的。

①谷歌表示，Veo 2在技術層面上的進步主要體現在物理引擎、攝影技術和人物表現力；②在性能評估中，Veo 2超過了Sora Turbo、可靈、MiniMaX等模型；③券商觀點，隨着AI視頻生成工具持續迭代，未來其向多種應用場景的滲透有望加速。

《科創板日報》12月17日訊 Sora正式發佈僅8天后，「谷歌版Sora」的2.0版本——Veo 2便正式發佈。

據谷歌官網顯示，Veo 2可製作具有逼真動作和高質量輸出的視頻。其最高分辨率可達4K，時長可達2分鐘以上。谷歌方面表示，Veo代表着高質量視頻生成領域的重大進步。

除視頻清晰度有所長進外，Veo 2對物理世界和鏡頭控制的理解也是驚人的：

這段畫面的部分提示詞是：低角度跟蹤拍攝，18mm鏡頭。汽車漂移，留下光跡和輪胎煙霧。相機低速跟蹤，捕捉到光滑的橄欖綠色肌肉車接近拐角時的畫面。

該畫面部分提示詞爲：特寫鏡頭聚焦於一位女DJ的臉部，她美麗、濃密的黑色捲髮勾勒出她的五官。她閉上雙眼，沉浸在節奏中，嘴角掛着一絲微笑。當她隨着節拍點頭和搖擺時，相機捕捉到了她頭部的細微動作。

從上述案例可見，Veo 2在真實世界還原以及Prompt指令遵循方面都有不錯的表現。而在谷歌官網發佈的性能評估中，Veo 2同樣打敗了Sora Turbo、可靈、MiniMaX等一衆海內外AI文生視頻大模型。

對此，谷歌總結稱，Veo 2在技術層面上的進步主要體現在三個方面。一是物理引擎的優化，這決定了AI視頻模型對於現實世界物理規律的深入理解。二是攝影技術的集成，能夠輸出更爲豐富的視覺效果。最後是人物表現力的提升，使人物動作和表情更具實感。

目前，Veo 2已被引入谷歌旗下視頻創作工具VedioFX。就在上週，OpenAI正式推出Sora Turbo，向美國及其他市場的ChatGPT付費用戶開放。新版工具Sora Turbo可以生成最長達20秒的視頻，並且可以提供這些視頻的多種變體。

與此同時，國內文生視頻進展不斷。今年以來，國內企業開始加速研發並迭代AI視頻生成產品，產品能力不斷提升：

今年6月，快手AI團隊發佈可靈AI視頻生成大模型，可生成長達2分鐘、分辨率達1080p的視頻；

7月，智譜AI上線視頻生成產品智譜清影，並在11月進行升級，支持生成時長爲10秒的4K超高清視頻；

8月，字節推出即夢AI一站式創作平台，隨後在11月宣佈即夢AI視頻模型S2.0Pro和P2.0Pro上線。

山西證券12月12日研報指出，隨着AI視頻生成工具持續迭代，未來其向多種應用場景的滲透有望加速。一方面，應用層建議重點關注創意、設計、教育等多模態特別是視頻生成強相關的領域；另一方面，視頻生成模型對算力需求較文本顯著提升，重點關注AI算力相關標的。

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

谷歌AI视频模型深夜炸场：4K分辨率+2分钟时长 又给OpenAI“来了一枪”