Meta發佈最強開源大模型Llama 3 多模態版本隨後將上線

財聯社 · 04/19 02:12

①Llama 3有8B和70B两个版本，大版本的Llama 3将有超过4000亿参数； ②更高级的推理能力，比如制定更长的多步骤计划的能力，将在随后的版本中出现。

财联社4月19日讯（编辑牛占林）当地时间周四，美国科技巨头Meta推出了其最强大的开源人工智能(AI)模型Llama 3，以追赶行业领导者OpenAI。美股盘中，Meta股价上涨逾2%，今年迄今涨近43%。

Meta首席执行官扎克伯格声称，Llama 3有8B和70B两个版本，大版本的Llama 3将有超过4000亿参数。由于预训练和指令微调，Llama 3相比Llama 2有了极大的改进。

Llama 3在多种行业基准测试上展现了最先进的性能，并提供了包括改进的推理能力在内的新功能。Meta认为Llama 3是市场上最好的开源大模型。开源意味着这些模型的代码和数据对公众开放，任何人都可以查看、修改和使用。

开发人员抱怨之前的Llama 2模型无法理解基本的上下文，在处理查询时经常出现混淆。谷歌的Gemini AI图像生成工具也遇到了类似问题，它在生成历史人物的图像时产生了不准确的描述，这引起了广泛批评。

现在，Meta在训练Llama 3时使用了更高质量的数据，这些数据帮助AI模型更好地识别语言中的细微差别，从而提高其对上下文的理解能力。

Meta提到，他们为Llama 3模型输入的数据量是Llama 2的七倍，这可能有助于提高模型的性能和准确性。还利用了由AI生成的“合成”数据来加强模型在编码和推理等特定领域的能力。

据Meta介绍，Llama 3将被整合到其虚拟助手Meta AI中，这是免费使用的同类产品中最先进的AI应用程序。Meta AI助手已经在Facebook、Instagram、WhatsApp和Messenger等应用中上线，随后也将迎来更新。

Meta首席产品官Chris Cox在接受采访时说，这家社交媒体巨头为Llama 3配备了新的计算机编码能力，这次除了可以输入文本外，还可以输入了图像，不过目前该模型只能输出文本内容。因此，Llama 3目前还不是多模态大模型。

但他补充说，更高级的推理能力，比如制定更长的多步骤计划的能力，将在随后的版本中出现。并计划在未来几个月发布多模态版本，这意味着它们可以同时生成文本和图像。

Cox表示，最终的目标是帮助用户从繁杂的工作中解脱出来，让生活更轻松快乐，无论是与企业互动，还是写作，或者是计划旅行。

此外，Llama 3很快将在亚马逊AWS、Databricks、谷歌云、Hugging Face、Kaggle、IBM的云平台WatsonX、微软云Azure、英伟达的NIM和Snowflake上推出，并得到AMD、AWS、戴尔、英特尔、英伟达提供的硬件平台支持。

①Llama 3有8B和70B兩個版本，大版本的Llama 3將有超過4000億參數； ②更高級的推理能力，比如制定更長的多步驟計劃的能力，將在隨後的版本中出現。

財聯社4月19日訊（編輯牛佔林）當地時間週四，美國科技巨頭Meta推出了其最強大的開源人工智能(AI)模型Llama 3，以追趕行業領導者OpenAI。美股盤中，Meta股價上漲逾2%，今年迄今漲近43%。

Meta首席執行官扎克伯格聲稱，Llama 3有8B和70B兩個版本，大版本的Llama 3將有超過4000億參數。由於預訓練和指令微調，Llama 3相比Llama 2有了極大的改進。

Llama 3在多種行業基準測試上展現了最先進的性能，並提供了包括改進的推理能力在內的新功能。Meta認爲Llama 3是市場上最好的開源大模型。開源意味着這些模型的代碼和數據對公衆開放，任何人都可以查看、修改和使用。

開發人員抱怨之前的Llama 2模型無法理解基本的上下文，在處理查詢時經常出現混淆。谷歌的Gemini AI圖像生成工具也遇到了類似問題，它在生成歷史人物的圖像時產生了不準確的描述，這引起了廣泛批評。

現在，Meta在訓練Llama 3時使用了更高質量的數據，這些數據幫助AI模型更好地識別語言中的細微差別，從而提高其對上下文的理解能力。

Meta提到，他們爲Llama 3模型輸入的數據量是Llama 2的七倍，這可能有助於提高模型的性能和準確性。還利用了由AI生成的“合成”數據來加強模型在編碼和推理等特定領域的能力。

據Meta介紹，Llama 3將被整合到其虛擬助手Meta AI中，這是免費使用的同類產品中最先進的AI應用程序。Meta AI助手已經在Facebook、Instagram、WhatsApp和Messenger等應用中上線，隨後也將迎來更新。

Meta首席產品官Chris Cox在接受採訪時說，這家社交媒體巨頭爲Llama 3配備了新的計算機編碼能力，這次除了可以輸入文本外，還可以輸入了圖像，不過目前該模型只能輸出文本內容。因此，Llama 3目前還不是多模態大模型。

但他補充說，更高級的推理能力，比如制定更長的多步驟計劃的能力，將在隨後的版本中出現。並計劃在未來幾個月發佈多模態版本，這意味着它們可以同時生成文本和圖像。

Cox表示，最終的目標是幫助用戶從繁雜的工作中解脫出來，讓生活更輕鬆快樂，無論是與企業互動，還是寫作，或者是計劃旅行。

此外，Llama 3很快將在亞馬遜AWS、Databricks、谷歌雲、Hugging Face、Kaggle、IBM的雲平台WatsonX、微軟雲Azure、英偉達的NIM和Snowflake上推出，並得到AMD、AWS、戴爾、英特爾、英偉達提供的硬件平台支持。

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

Meta发布最强开源大模型Llama 3 多模态版本随后将上线