美媒：中國新型“文生視頻”人工智能模型令人興奮

環球網 · 06/21 06:54

美国《麻省理工科技评论》6月19日文章，原题：我测试了一个令人兴奋的中国新型“文生视频”人工智能模型人们可能还不熟悉“快手”，但这家中国企业刚达到一个重要里程碑：它发布首款可供公众免费测试的“文生视频”生成式人工智能（AI）模型。6月6日，这个拥有6亿多活跃用户的短视频平台宣布推出这款自主研发的新工具。它的名字叫“可灵”。

但与公众在OpenAI试用4个月后仍无法访问的Sora不同，可灵很快就开始让人们亲自试用该模型。笔者就是其中之一。还记得Sora发布的令人印象深刻的演示视频和形象，包括东京街头景象、猫迅速穿过花园以及宇航员骑马等场景吗？我让可灵也生成有关视频。

生成的结果有几个值得称赞之处。这些视频都没偏离提示文字，且无论是摄像机的平移、树叶的颤动，还是马和宇航员的转动方式，相关视频画面的物理特性似乎都是正确的。其中每段视频大约需要3分钟生成。这不是最快的，但完全可以接受。

这些视频也有明显缺点。它们看起来模糊，有时会忽略提示中的请求，且目前生成的视频长度上限为5秒，这导致视频画面的动态或复杂性大幅降低。不过，将这些结果与Sora的演示视频进行对比并不公平，后者是OpenAI精心挑选后才向公众发布的，可能代表着超过其平均水平的文生视频。相比之下，这些可灵视频来自我首次尝试给出的提示，我也很少键入像“照片级真实感”这样的关键词来微调结果。

可灵的工作方式与Sora类似。但与Sora相比，可灵具有一个关键优势：快手是抖音在中国的最主要短视频竞争对手，拥有庞大的视频平台和数亿用户，这些用户共同上传可以用来训练可灵的海量视频数据。可灵最大的局限性可能是它（目前）只能生成5秒的视频。AI专家说，视频越长，就越有可能产生‘幻觉’或不一致的结果。

AI或将颠覆短视频的内容创作场景，将在短期内使创作者受益。从长远来看，快手、抖音等平台有可能接管视频制作，直接生成为用户定制的内容，从而减少平台对明星创作者的依赖。相关技术可能还需要相当长时间才能发展到这个水平，但如今文生视频工具领域越来越引人注目。据报道，快手的竞争对手字节跳动也在准备发布生成式视频工具。行业观察人士说，到今年年底，将会有很多选择。（作者Zeyi Yang，丁玎译）

美國《麻省理工科技評論》6月19日文章，原題：我測試了一個令人興奮的中國新型“文生視頻”人工智能模型人們可能還不熟悉“快手”，但這家中國企業剛達到一個重要里程碑：它發佈首款可供公衆免費測試的“文生視頻”生成式人工智能（AI）模型。6月6日，這個擁有6億多活躍用戶的短視頻平台宣佈推出這款自主研發的新工具。它的名字叫“可靈”。

但與公衆在OpenAI試用4個月後仍無法訪問的Sora不同，可靈很快就開始讓人們親自試用該模型。筆者就是其中之一。還記得Sora發佈的令人印象深刻的演示視頻和形象，包括東京街頭景象、貓迅速穿過花園以及宇航員騎馬等場景嗎？我讓可靈也生成有關視頻。

生成的結果有幾個值得稱讚之處。這些視頻都沒偏離提示文字，且無論是攝像機的平移、樹葉的顫動，還是馬和宇航員的轉動方式，相關視頻畫面的物理特性似乎都是正確的。其中每段視頻大約需要3分鐘生成。這不是最快的，但完全可以接受。

這些視頻也有明顯缺點。它們看起來模糊，有時會忽略提示中的請求，且目前生成的視頻長度上限爲5秒，這導致視頻畫面的動態或複雜性大幅降低。不過，將這些結果與Sora的演示視頻進行對比並不公平，後者是OpenAI精心挑選後才向公衆發佈的，可能代表着超過其平均水平的文生視頻。相比之下，這些可靈視頻來自我首次嘗試給出的提示，我也很少鍵入像“照片級真實感”這樣的關鍵詞來微調結果。

可靈的工作方式與Sora類似。但與Sora相比，可靈具有一個關鍵優勢：快手是抖音在中國的最主要短視頻競爭對手，擁有龐大的視頻平台和數億用戶，這些用戶共同上傳可以用來訓練可靈的海量視頻數據。可靈最大的侷限性可能是它（目前）只能生成5秒的視頻。AI專家說，視頻越長，就越有可能產生‘幻覺’或不一致的結果。

AI或將顛覆短視頻的內容創作場景，將在短期內使創作者受益。從長遠來看，快手、抖音等平台有可能接管視頻製作，直接生成爲用戶定製的內容，從而減少平台對明星創作者的依賴。相關技術可能還需要相當長時間才能發展到這個水平，但如今文生視頻工具領域越來越引人注目。據報道，快手的競爭對手字節跳動也在準備發佈生成式視頻工具。行業觀察人士說，到今年年底，將會有很多選擇。（作者Zeyi Yang，丁玎譯）

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

美媒：中国新型“文生视频”人工智能模型令人兴奋

美媒：中國新型“文生視頻”人工智能模型令人興奮

風險及免責聲明

聲明