什麼是開源AI？官方定義終於來了 Meta Llama模型沒過關

華爾街見聞 · 01:42

长期致力于定义和“管理”所有开源事务的开放源代码倡议（OSI），周一发布了其开源AI定义（OSAID）1.0版。根据OSAID，AI模型若要被视为开源，必须提供足够的信息，使任何人都可以“实质性地”重建该模型。模型还必须披露与其训练数据相关的任何重要细节，包括数据的来源、处理方式以及获取或许可的方式。然而，Meta并不认可这一定义，认为不存在单一的开源AI定义。

开源AI终于有了“官方”定义。

OSAID还列出了开发者使用开源AI时应享有的使用权，例如可以为任何目的使用和修改模型，而无需获得他人许可。

OSI执行副总裁Stefano Maffulli表示，制定开源AI官方定义主要目的是，让政策制定者和AI开发者达成一致。

“监管机构已经在关注这一领域。我们明确向各方利益相关者和社区进行了推广，甚至还试图联系那些经常与监管机构交流的组织，来获取早期反馈。”
“开源AI是一种允许你完全理解其构建方式的AI模型，这意味着你可以访问所有组件，比如用于训练和数据过滤的完整代码。最重要的是，你应该能够在其基础上构建。”

OSI并不强制施压开发者遵守OSAID定义，但打算对那些不符合该定义却被描述为“开源”的模型进行标记。“我们希望当有人试图滥用这个术语时，AI社区会说，‘我们不承认这是开源’，并加以纠正。”Maffulli说道。

Meta：我反对

目前，许多初创企业和大型科技公司，尤其是Meta，称其AI模型发布策略为“开源”，但很少符合OSAID的标准。研究人员发现，许多“开源”模型实际上只是名义上开源，但实际训练模型所需的数据是保密的，而且运行这些模型所需要的计算能力超出了许多开发者的能力范围。

例如，Meta要求月活跃用户超过7亿的平台获得特殊许可才能使用其Llama模型。Maffulli公开批评Meta将其模型称为“开源”的做法。而谷歌和微软在与OSI讨论后，已经同意不再将不完全开放的模型称为“开源”，但Meta并未这么做。

此外，长期宣传其模型为“开源”的Stability AI要求年收入超过100万美元的企业获得企业许可，而法国AI新创公司Mistral的许可证则禁止将某些模型和输出用于商业用途。

Meta自然不认同这一评估。尽管该公司参与了定义的起草过程，但对OSAID的措辞表示异议。Meta发言人称，Llama的许可条款和随附的可接受使用政策对有害应用提供了防护。Meta还表示，在加州AI相关法规正在演变之际，该公司对共享模型细节的做法是“谨慎的”。

“我们在许多方面与OSI的伙伴立场一致，但我们以及业内其他公司都不同意他们的新定义，我们认为没有单一的开源AI定义，因为过去的开源定义无法涵盖当今迅速发展的AI模型的复杂性。我们让Llama免费公开使用，并通过许可和使用政策来确保安全。无论技术定义如何，我们将继续与OSI和其他行业团体合作，增加免费AI使用的便利程度。”

分析认为，Meta不愿公开训练数据，很可能与其自身及大多数AI模型的开发方式有关。

AI公司从社交媒体和网站上收集大量图像、音频和视频等数据，并以这些“公开可用数据”训练模型。在如今竞争激烈的市场中，数据集的收集和优化方法被视为竞争优势，公司常以此为由拒绝披露。

但训练数据的细节也可能让开发者面临法律风险。作者和出版商声称，Meta使用了受版权保护的书籍进行训练。艺术家们也对Stability AI提起诉讼，指控其使用其作品而未给予认可，将其行为比作盗窃。

因此，OSAID的开源AI定义，可能会给那些试图顺利解决诉讼的公司带来问题，特别是如果原告和法官认为该定义足够合理而在法庭上引用。

長期致力於定義和「管理」所有開源事務的開放源代碼倡議（OSI），週一發佈了其開源AI定義（OSAID）1.0版。根據OSAID，AI模型若要被視爲開源，必須提供足夠的信息，使任何人都可以「實質性地」重建該模型。模型還必須披露與其訓練數據相關的任何重要細節，包括數據的來源、處理方式以及獲取或許可的方式。然而，Meta並不認可這一定義，認爲不存在單一的開源AI定義。

開源AI終於有了「官方」定義。

OSAID還列出了開發者使用開源AI時應享有的使用權，例如可以爲任何目的使用和修改模型，而無需獲得他人許可。

OSI執行副總裁Stefano Maffulli表示，制定開源AI官方定義主要目的是，讓政策制定者和AI開發者達成一致。

「監管機構已經在關注這一領域。我們明確向各方利益相關者和社區進行了推廣，甚至還試圖聯繫那些經常與監管機構交流的組織，來獲取早期反饋。」
「開源AI是一種允許你完全理解其構建方式的AI模型，這意味着你可以訪問所有組件，比如用於訓練和數據過濾的完整代碼。最重要的是，你應該能夠在其基礎上構建。」

OSI並不強制施壓開發者遵守OSAID定義，但打算對那些不符合該定義卻被描述爲「開源」的模型進行標記。「我們希望當有人試圖濫用這個術語時，AI社區會說，『我們不承認這是開源』，並加以糾正。」Maffulli說道。

Meta：我反對

目前，許多初創企業和大型科技公司，尤其是Meta，稱其AI模型發佈策略爲「開源」，但很少符合OSAID的標準。研究人員發現，許多「開源」模型實際上只是名義上開源，但實際訓練模型所需的數據是保密的，而且運行這些模型所需要的計算能力超出了許多開發者的能力範圍。

例如，Meta要求月活躍用戶超過7億的平台獲得特殊許可才能使用其Llama模型。Maffulli公開批評Meta將其模型稱爲「開源」的做法。而谷歌和微軟在與OSI討論後，已經同意不再將不完全開放的模型稱爲「開源」，但Meta並未這麼做。

此外，長期宣傳其模型爲「開源」的Stability AI要求年收入超過100萬美元的企業獲得企業許可，而法國AI新創公司Mistral的許可證則禁止將某些模型和輸出用於商業用途。

Meta自然不認同這一評估。儘管該公司參與了定義的起草過程，但對OSAID的措辭表示異議。Meta發言人稱，Llama的許可條款和隨附的可接受使用政策對有害應用提供了防護。Meta還表示，在加州AI相關法規正在演變之際，該公司對共享模型細節的做法是「謹慎的」。

「我們在許多方面與OSI的夥伴立場一致，但我們以及業內其他公司都不同意他們的新定義，我們認爲沒有單一的開源AI定義，因爲過去的開源定義無法涵蓋當今迅速發展的AI模型的複雜性。我們讓Llama免費公開使用，並通過許可和使用政策來確保安全。無論技術定義如何，我們將繼續與OSI和其他行業團體合作，增加免費AI使用的便利程度。」

分析認爲，Meta不願公開訓練數據，很可能與其自身及大多數AI模型的開發方式有關。

AI公司從社交媒體和網站上收集大量圖像、音頻和視頻等數據，並以這些「公開可用數據」訓練模型。在如今競爭激烈的市場中，數據集的收集和優化方法被視爲競爭優勢，公司常以此爲由拒絕披露。

但訓練數據的細節也可能讓開發者面臨法律風險。作者和出版商聲稱，Meta使用了受版權保護的書籍進行訓練。藝術家們也對Stability AI提起訴訟，指控其使用其作品而未給予認可，將其行爲比作盜竊。

因此，OSAID的開源AI定義，可能會給那些試圖順利解決訴訟的公司帶來問題，特別是如果原告和法官認爲該定義足夠合理而在法庭上引用。

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

什么是开源AI？官方定义终于来了 Meta Llama模型没过关

什麼是開源AI？官方定義終於來了 Meta Llama模型沒過關

Meta：我反对

Meta：我反對

風險及免責聲明

聲明