share_log

谷歌发布“基础世界模型”Genie 多模态AI浪潮有望加速到来

谷歌發佈“基礎世界模型”Genie 多模態AI浪潮有望加速到來

財聯社 ·  02/28 07:46

①據媒體報道,谷歌定義了生成式AI的全新範式——Genie,這是一個110億參數的基礎世界模型,可以通過單張圖像提示生成可玩的交互式環境。 ②浙商證券發佈研報表示,隨着海外廠商持續加速多模態AI領域佈局,多模態AI新一輪浪潮有望加速到來。

據媒體報道,谷歌定義了生成式AI的全新範式——生成式交互環境(Genie,Generative Interactive Environments)。Genie是一個110億參數的基礎世界模型,可以通過單張圖像提示生成可玩的交互式環境。GenieAI是一個利用互聯網視頻訓練的基礎世界模型,可以從合成圖像、照片甚至素描中生成無限多的可玩(可控制動作的)世界。它的使用範圍廣泛,可以用於從圖像或文本生成整個互動世界,是訓練未來通用AI代理的有利工具。

浙商證券發佈研報表示,近日英偉達宣佈成立GEAR實驗室,佈局多模態AI以及具身智能領域,另外Stability.ai發佈了具備更強文生圖能力的Stable Diffusion 3模型,並宣佈文生視頻應用Stable Video開放公測。隨着海外廠商持續加速多模態AI領域佈局,多模態AI新一輪浪潮有望加速到來。

據財聯社主題庫顯示,相關上市公司中:

因賽集團的InsightGPT具備文生文、視頻智能剪輯、圖生視頻等功能,目前正在開發文生視頻功能。在現有圖生視頻等技術框架下,InsightGPT目前可生成20秒以上的視頻。

萬興科技的天幕大模型具備多媒體、垂直解決方案、算力數據及應用本土化等特色,以更智能、更沉浸的功能效果和產品體驗賦能全球內容創作者的創意表達。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論