快科技11月26日消息,據報道,英偉達展示了一種用於生成音樂和音頻的新型人工智能模型Fugatto,它可以修改聲音並生成新的聲音。
Fugatto的獨特魅力在於其超越傳統的人工智能界限,不僅能夠接收並分析現有音頻素材,還能對其進行靈活修改。
舉例來說,它能將鋼琴伴奏的旋律無縫轉化爲動人的人聲演唱,或是調整口語錄音中的口音特徵與情感色彩,展現出前所未有的音頻轉換能力。
儘管英偉達目前尚未規劃將此技術面向公衆開放,但Fugatto在合成音頻領域的潛在應用及其可能帶來的變革,已引起了業界的廣泛矚目與熱烈討論。
然而,隨着生成式人工智能模型的快速發展,其創建者也面臨着如何有效防止技術濫用的挑戰。特別是如何阻止用戶利用此類技術製造誤導性信息,或是通過生成受版權保護的角色與內容來侵犯他人權益,成爲亟待解決的問題。
此外,行業內的其他巨頭如OpenAI與Meta,對於何時會推出能夠生成音頻或視頻的先進模型,同樣保持着神祕的態度,尚未透露具體的時間表。