share_log

美媒:中国新型“文生视频”人工智能模型令人兴奋

huanqiu.com ·  Jun 21 06:54

美国《麻省理工科技评论》6月19日文章,原题:我测试了一个令人兴奋的中国新型“文生视频”人工智能模型人们可能还不熟悉“快手”,但这家中国企业刚达到一个重要里程碑:它发布首款可供公众免费测试的“文生视频”生成式人工智能(AI)模型。6月6日,这个拥有6亿多活跃用户的短视频平台宣布推出这款自主研发的新工具。它的名字叫“可灵”。

但与公众在OpenAI试用4个月后仍无法访问的Sora不同,可灵很快就开始让人们亲自试用该模型。笔者就是其中之一。还记得Sora发布的令人印象深刻的演示视频和形象,包括东京街头景象、猫迅速穿过花园以及宇航员骑马等场景吗?我让可灵也生成有关视频。

生成的结果有几个值得称赞之处。这些视频都没偏离提示文字,且无论是摄像机的平移、树叶的颤动,还是马和宇航员的转动方式,相关视频画面的物理特性似乎都是正确的。其中每段视频大约需要3分钟生成。这不是最快的,但完全可以接受。

这些视频也有明显缺点。它们看起来模糊,有时会忽略提示中的请求,且目前生成的视频长度上限为5秒,这导致视频画面的动态或复杂性大幅降低。不过,将这些结果与Sora的演示视频进行对比并不公平,后者是OpenAI精心挑选后才向公众发布的,可能代表着超过其平均水平的文生视频。相比之下,这些可灵视频来自我首次尝试给出的提示,我也很少键入像“照片级真实感”这样的关键词来微调结果。

可灵的工作方式与Sora类似。但与Sora相比,可灵具有一个关键优势:快手是抖音在中国的最主要短视频竞争对手,拥有庞大的视频平台和数亿用户,这些用户共同上传可以用来训练可灵的海量视频数据。可灵最大的局限性可能是它(目前)只能生成5秒的视频。AI专家说,视频越长,就越有可能产生‘幻觉’或不一致的结果。

AI或将颠覆短视频的内容创作场景,将在短期内使创作者受益。从长远来看,快手、抖音等平台有可能接管视频制作,直接生成为用户定制的内容,从而减少平台对明星创作者的依赖。相关技术可能还需要相当长时间才能发展到这个水平,但如今文生视频工具领域越来越引人注目。据报道,快手的竞争对手字节跳动也在准备发布生成式视频工具。行业观察人士说,到今年年底,将会有很多选择。(作者Zeyi Yang,丁玎译)

The above content is for informational or educational purposes only and does not constitute any investment advice related to Futu. Although we strive to ensure the truthfulness, accuracy, and originality of all such content, we cannot guarantee it.
    Write a comment