share_log

AI大模型训练数据版权问题凸显 优质训练数据库价值有望重估

AI大模型訓練數據版權問題凸顯 優質訓練數據庫價值有望重估

財聯社 ·  02/23 07:49

①知情人士稱,美國社交媒體平台Reddit已同谷歌達成協議,將其內容用於訓練後者的人工智能模型。 ②人工智能在使用媒體品牌內容進行大模型訓練時將需要向媒體品牌付費,這意味着AI大模型向數據提供方的知識產權付費或將成爲行業趨勢。

知情人士稱,美國社交媒體平台Reddit已同谷歌達成協議,將其內容用於訓練後者的人工智能模型。據悉,協議價值約爲每年6000萬美元。Reddit已公開提交美國IPO文件,摩根士丹利、高盛、摩根大通及美國銀行爲牽頭行。

近期,新聞出版巨頭施普林格出版集團(Axel Springer)與ChatGPT開發機構OpenAI簽署協議,成爲全球第一家與OpenAI合作將新聞業與人工智能技術進行更深入整合的出版機構。銀河證券指出,Open AI與Axel Springer簽訂的協議表明,人工智能在使用媒體品牌內容進行大模型訓練時將需要向媒體品牌付費,這意味着AI大模型向數據提供方的知識產權付費或將成爲行業趨勢。當前AI政策密集出臺,高質量數據集和訓練數據版權問題得到重視,未來優質訓練數據庫的價值將得到凸顯。出版行業公司大多擁有豐富的電子化的圖文資源,這可以作爲國內外大模型訓練的重要數據集。出版行業公司在版權和IP上的資源優勢有望助力其作爲海內外AI大模型研發的重點助力。

據財聯社主題庫顯示,相關上市公司中:

中信出版已嘗試與作者和大模型公司合作語言訓練,開發智能閱讀應用產品。例如,公司旗下的知識服務平台與百度聯合發佈了“中信書院AI閱讀助手”插件。

掌閱科技在文學和閱讀領域的版權儲備業內領先,這些中文語料可以用於網文行業垂類模型訓練。公司與字節目前主要在數字閱讀的版權、內容生產、廣告商業化等多方面開展了深度合作。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論