share_log

“最好的开源大模型”!报道称Meta下周将推出2个小版本Llama 3 为暑期推出正式版铺路

“最好的開源大模型”!報道稱Meta下週將推出2個小版本Llama 3 爲暑期推出正式版鋪路

華爾街見聞 ·  04/09 16:24

來源:華爾街見聞

報道稱,正式版Llama 3將支持多模態處理,先行推出的兩個小版本則不具備這一能力。

當地時間週一,科技媒體The Information援引一位$Meta Platforms (META.US)$員工消息報道稱,該公司計劃在下週推出兩個小型的Llama 3大語言模型(LLM),作爲夏季推出正式版Llama 3的先行版本。

這兩個小模型的發佈,預計將爲Llama 3的正式亮相進行鋪墊。Meta在去年7月份發佈了Llama 2,此後,包括谷歌、馬斯克旗下的xAI與Mistral等在內的數家公司發佈了開源的大語言模型,競爭十分激烈。

Llama 3直接對標OpenAI的GPT-4,後者已經成爲一個強大的多模態模型,不僅能夠處理更長的文本,還支持圖像輸入。

報道稱,正式版Llama 3也將支持多模態處理,即同時理解和生成文本及圖片;而先行推出的兩個小版本則不具備這一能力。

一般而言,較小的模型成本更低,運行更快,尤其在運行大型模型成本高昂的當下,其價值尤爲凸顯。小型模型還便於開發者在移動設備上開發人工智能軟件。

Meta此前已推出三個版本的Llama 2,其中最大的一個擁有700億個參數,另外兩個版本分別擁有130億和70億個參數。

據硬AI此前文章,Llama 3的最大版本可能會擁有超過1400億個參數。

Meta還將在Llama 3中改進Llama 2在響應爭議性話題時過於保守的問題,研究人員計劃放鬆大模型在這一方面的限制,以便它更多地與用戶互動,提供背景信息,而不僅僅是拒絕回答。

編輯/tolk

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論