share_log

发布即开源:智谱AI最新视频模型支持10秒60帧4K画质,还自带音效

發佈即開源:智譜AI最新視頻模型支持10秒60幀4K畫質,還自帶音效

快訊 ·  11/08 17:52

智譜AI清影迎來升級,發佈最新版視頻模型CogVideoX v1.5。升級後的清影在複雜提示詞理解等方面的能力得到提升,能夠生成10秒、4k、60幀超高清畫質,同時支持任意比例圖像生成視頻,可以一次性生成4個視頻。智譜也同步發佈了音效模型CogSound和音樂模型CogMusic,可以生成與畫面匹配的音效,音效功能將在本月上線公測。新模型發佈後,智譜也宣佈將CogVideoX v1.5進行開源,相比於原有模型,CogVideoX v1.5包含5/10秒、768P、16幀視頻生成能力,I2V模型支持任意尺寸比例,大幅提升圖生視頻質量及複雜語義理解。 智譜AI表示,真正的智能一定是多模態的,因此希望智譜多模態大模型家族能進一步提高大模型的應用和工具能力,未來還將與視覺中國等合作,基於更豐富的視覺內容產出更好的AI生成視頻工具。(澎湃)

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論