share_log

Meta发布最强开源大模型Llama 3 多模态版本随后将上线

Meta發佈最強開源大模型Llama 3 多模態版本隨後將上線

財聯社 ·  04/19 02:12

①Llama 3有8B和70B兩個版本,大版本的Llama 3將有超過4000億參數; ②更高級的推理能力,比如制定更長的多步驟計劃的能力,將在隨後的版本中出現。

財聯社4月19日訊(編輯 牛佔林)當地時間週四,美國科技巨頭Meta推出了其最強大的開源人工智能(AI)模型Llama 3,以追趕行業領導者OpenAI。美股盤中,Meta股價上漲逾2%,今年迄今漲近43%。

Meta首席執行官扎克伯格聲稱,Llama 3有8B和70B兩個版本,大版本的Llama 3將有超過4000億參數。由於預訓練和指令微調,Llama 3相比Llama 2有了極大的改進。

image

Llama 3在多種行業基準測試上展現了最先進的性能,並提供了包括改進的推理能力在內的新功能。Meta認爲Llama 3是市場上最好的開源大模型。開源意味着這些模型的代碼和數據對公衆開放,任何人都可以查看、修改和使用。

開發人員抱怨之前的Llama 2模型無法理解基本的上下文,在處理查詢時經常出現混淆。谷歌的Gemini AI圖像生成工具也遇到了類似問題,它在生成歷史人物的圖像時產生了不準確的描述,這引起了廣泛批評。

現在,Meta在訓練Llama 3時使用了更高質量的數據,這些數據幫助AI模型更好地識別語言中的細微差別,從而提高其對上下文的理解能力。

Meta提到,他們爲Llama 3模型輸入的數據量是Llama 2的七倍,這可能有助於提高模型的性能和準確性。還利用了由AI生成的“合成”數據來加強模型在編碼和推理等特定領域的能力。

據Meta介紹,Llama 3將被整合到其虛擬助手Meta AI中,這是免費使用的同類產品中最先進的AI應用程序。Meta AI助手已經在Facebook、Instagram、WhatsApp和Messenger等應用中上線,隨後也將迎來更新。

Meta首席產品官Chris Cox在接受採訪時說,這家社交媒體巨頭爲Llama 3配備了新的計算機編碼能力,這次除了可以輸入文本外,還可以輸入了圖像,不過目前該模型只能輸出文本內容。因此,Llama 3目前還不是多模態大模型。

但他補充說,更高級的推理能力,比如制定更長的多步驟計劃的能力,將在隨後的版本中出現。並計劃在未來幾個月發佈多模態版本,這意味着它們可以同時生成文本和圖像。

Cox表示,最終的目標是幫助用戶從繁雜的工作中解脫出來,讓生活更輕鬆快樂,無論是與企業互動,還是寫作,或者是計劃旅行。

此外,Llama 3很快將在亞馬遜AWS、Databricks、谷歌雲、Hugging Face、Kaggle、IBM的雲平台WatsonX、微軟雲Azure、英偉達的NIM和Snowflake上推出,並得到AMD、AWS、戴爾、英特爾、英偉達提供的硬件平台支持。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論