追蹤AI最新趨勢

挑戰GPT！Meta推出最強開源模型Llama 3，社交媒體全線配“最智能”免費AI助手

硬AI · 04/19 08:42

来源：硬AI

Llama 3最大参数规模超4000亿，训练token超15万亿，对比GPT-3.5多种人类评估测评胜率超六成；亚马逊、微软、谷歌云将推出Llama 3，英伟达、英特尔、AMD硬件平台将支持Llama 3。英伟达称，Meta用搭载超2.4万块H100芯片的计算机集群训练Llama 3。Meta AI助手将在美国以外十三国推出英语版，手机和电脑均可用，用它查询无需切换App，文生图功能Image可根据提示词实时更新图片、可生成GIF动图。

OpenAI的GPT迎来强劲对手，$Meta Platforms (META.US)$正在发起最新一轮挑战。

美东时间4月18日周四，Meta宣布，推出旗下第三代大语言模型（LLM）Llama 3，称它为“迄今为止能力最强的开源LLM”，并且基于Llama 3，升级了人工智能（AI）助手Meta AI，称它“现在是你可以免费使用的最智能AI助手”。

Meta公布，Llama 3将在亚马逊、微软、谷歌云等云平台得到启用，并得到英伟达等芯片巨头和戴尔的硬件支持。英伟达透露，Meta在合计搭载超过2.4万块H100芯片的计算机集群上训练Llama 3，英伟达产品和服务加持的Llama 3用于云、边缘计算、机器人、PC等领域。

Llama 3最大参数规模超4000亿训练token超15万亿

去年7月Meta发布的Llama 2有三个版本，最大版本70B的参数规模为700亿。本周四Meta介绍，Llama 3有8B和70B两个版本。Meta CEO扎克伯格称，大版本的Llama 3将有超过4000亿参数。Meta并未透露会不会将4000亿参数规模的Llama 3开源，目前它还接受训练。

对比前代，Llama 3有了质的飞跃。Llama 2使用2万亿个 token进行训练，而训练Llama 3大版本的token超过15 万亿。

Meta称，由于预训练和训练后的改进，其预训练和指令调优的模型是目前8B和70B两个参数规模的最佳模型。在训练后程序得到改进后，模型的错误拒绝率（FRR）大幅下降，一致性提高，模型响应的多样性增加。在推理、代码生成和指令跟踪等功能方面，Llama 3相比Llama 2有极大改进，使Llama 3更易于操控。

下图可见，8B和70B版本的Llama 3指令调优模型在大规模多任务语言理解数据集（MMLU）、研究生水平专家推理（GPQA）、数学评测集（GSM8K）、编程多语言测试（HumanEval）等方面的测评得分都高于Mistral、谷歌的Gemma和Gemini和Anthropic的Claude 3。

8B和70B版本的预训练Llama 3多种性能测评优于Mistral、Gemma、Gemini和Mixtral。

Meta称，开发了一套新的高质量人类评估集，包括涵盖12 个关键用例的1800个提示词，这些用例分别是寻求建议、头脑风暴、分类、闭卷问答、开卷问答、编码、创意写作、提取、塑造角色/人物形象、推理、改写和总结。下图可见，在人类评估集测评中，70B版本指令调优Llama 3优于Claude Sonnet、Mistral Medium、GPT-3.5和Llama 2的胜率分别为52.9%、59.3%、63.2%、63.7%。

为了未来适用于多语言用例，超过5%的 Llama 3 预训练数据集属于涵盖30 多种语言的高质量非英语数据。但Meta预计，对非英语语种的性能不会和英语的一致。

Meta预计。未来几个月，将推出Llama 3 的新功能，上下文窗口会更长，性能会更强，还会有该模型新的尺寸版本，Meta还将分享 Llama 3的研究论文。

亚马逊等云平台将推出Llama 3 超2.4万英伟达H100芯片训练Llama 3

Meta介绍，Llama 3 模型很快将在亚马逊云AWS、Databricks、谷歌云、Hugging Face、Kaggle、IBM的云平台WatsonX、微软云Azure、英伟达的NIM和 Snowflake 上推出，得到 AMD、AWS、戴尔、英特尔、英伟达提供的硬件平台支持。

英伟达同日披露，Meta的工程师在包含2.4576万块英伟达H100 Tensor Core GPU、连接英伟达Quantum-2 InfiniBand网络的计算机集群上训练 Llama 3。在英伟达的支持下，Meta 为其LLM调整了网络、软件和模型架构。而且，为了进一步推进生成式AI的先进水平，Meta最近公布了计划，要在其基础设施用应用35万块H100 芯片。

英伟达称，由英伟达芯片助力的Llama 3现已推出，可用于云、数据中心、边缘计算和个人电脑（PC）。开发人员可以通过英伟达的网站ai.nvidia.com试用Llama 3，企业用户可以通过英伟达的端到端云原生框架NeMo，利用自身数据对 Llama 3进行调优。

Llama 3 还可在英伟达用于机器人开发的模组Jetson Orin 上运行，用于机器人和边缘计算设备，创建像Jetson AI 实验室中的交互式代理。此外，适用于工作站和 PC 的 NVIDIA RTX 和 GeForce RTX GPU可加快 Llama 3的推理速度。

美国以外十三国推出英语版Meta AI 手机和电脑均可用文生图功能Image可实时更新图、生成GIF

Meta介绍，用户可以在旗下社交媒体Facebook、Instagram、WhatsApp 和 Messenger上使用 Meta AI完成工作、学习、创作和连接自己看重的事物。

Meta称，将在美国以外的十三个国家推出英语版 Meta AI，包括加拿大、澳大利亚、新西兰、新加坡、南非、尼日利亚、巴基斯坦、加纳、牙买加、马拉维、乌干达、赞比亚和津巴布韦。

Meta AI能做什么？Meta举了一些例子，比如策划和朋友晚上怎么玩，推荐一家可欣赏日落美景并提供素食选择的餐厅，查找周末晚上哪里有音乐会，提供野餐地点的建议，解释遗传特征如何发挥作用这种课业问题。

Meta还提到一个新功能——名叫Image的AI图像生成功能，用户可以根据WhatsApp 和 Meta AI 网站中的文本生成图像。用这种功能，Meta AI 可以根据用户想要的审美要求“想象”生成图片，给用户的实际购物提供灵感。

扎克伯格表示，Image服务将在用户输入更详细的提示词时实时更新图像，并可以创建自定义动画GIF。

Meta称，当用户开始打字输入提示词时，会看到一个图像出现，并且每输入几个字母，这个图就会发生变化。

Meta介绍，如果用户找到喜欢的图片，可以让 Meta AI 为其制作动画，或者转换为GIF图片与朋友分享。

除了手机用户，Meta还兼顾电脑用户，上线了网站meta.ai，让用户在电脑上完成工作时也可以使用 Meta AI，让它帮忙解数学题，让工作电邮的内容更专业。用户还可以登录网站保存与Meta AI 的对话内容，供将来参考。

Meta AI 还可以在 Facebook、Instagram、WhatsApp 和 Messenger上进行网页实时搜索。用户可以通过网络访问实时信息，无需在这些社交媒体的应用程序App之间切换。假用户正在 Messenger 群聊时计划怎么安排滑雪旅行。使用Messenger 中的搜索，可以要求 Meta AI 查找从纽约飞往科罗拉多州的航班，找出出行人数相对最少的周末，所有这些查找工作都无需离开 Messenger的App进行。

滚动浏览Facebook Feed 时，用户也可以访问Meta AI。如果发现感兴趣的帖子，用户可以在打开帖子后直接问Meta AI获取更多相关信息。比如看到冰岛北极光的照片，可以询问 Meta AI 一年中的什么时间最适合观看北极光。

编辑/tolk

來源：硬AI

Llama 3最大參數規模超4000億，訓練token超15萬億，對比GPT-3.5多種人類評估測評勝率超六成；亞馬遜、微軟、谷歌雲將推出Llama 3，英偉達、英特爾、AMD硬件平台將支持Llama 3。英偉達稱，Meta用搭載超2.4萬塊H100芯片的計算機集群訓練Llama 3。Meta AI助手將在美國以外十三國推出英語版，手機和電腦均可用，用它查詢無需切換App，文生圖功能Image可根據提示詞實時更新圖片、可生成GIF動圖。

OpenAI的GPT迎來強勁對手，$Meta Platforms (META.US)$正在發起最新一輪挑戰。

美東時間4月18日週四，Meta宣佈，推出旗下第三代大語言模型（LLM）Llama 3，稱它爲“迄今爲止能力最強的開源LLM”，並且基於Llama 3，升級了人工智能（AI）助手Meta AI，稱它“現在是你可以免費使用的最智能AI助手”。

Meta公佈，Llama 3將在亞馬遜、微軟、谷歌雲等雲平台得到啓用，並得到英偉達等芯片巨頭和戴爾的硬件支持。英偉達透露，Meta在合計搭載超過2.4萬塊H100芯片的計算機集群上訓練Llama 3，英偉達產品和服務加持的Llama 3用於雲、邊緣計算、機器人、PC等領域。

Llama 3最大參數規模超4000億訓練token超15萬億

去年7月Meta發佈的Llama 2有三個版本，最大版本70B的參數規模爲700億。本週四Meta介紹，Llama 3有8B和70B兩個版本。Meta CEO扎克伯格稱，大版本的Llama 3將有超過4000億參數。Meta並未透露會不會將4000億參數規模的Llama 3開源，目前它還接受訓練。

對比前代，Llama 3有了質的飛躍。Llama 2使用2萬億個 token進行訓練，而訓練Llama 3大版本的token超過15 萬億。

Meta稱，由於預訓練和訓練後的改進，其預訓練和指令調優的模型是目前8B和70B兩個參數規模的最佳模型。在訓練後程序得到改進後，模型的錯誤拒絕率（FRR）大幅下降，一致性提高，模型響應的多樣性增加。在推理、代碼生成和指令跟蹤等功能方面，Llama 3相比Llama 2有極大改進，使Llama 3更易於操控。

下圖可見，8B和70B版本的Llama 3指令調優模型在大規模多任務語言理解數據集（MMLU）、研究生水平專家推理（GPQA）、數學評測集（GSM8K）、編程多語言測試（HumanEval）等方面的測評得分都高於Mistral、谷歌的Gemma和Gemini和Anthropic的Claude 3。

8B和70B版本的預訓練Llama 3多種性能測評優於Mistral、Gemma、Gemini和Mixtral。

Meta稱，開發了一套新的高質量人類評估集，包括涵蓋12 個關鍵用例的1800個提示詞，這些用例分別是尋求建議、頭腦風暴、分類、閉卷問答、開卷問答、編碼、創意寫作、提取、塑造角色/人物形象、推理、改寫和總結。下圖可見，在人類評估集測評中，70B版本指令調優Llama 3優於Claude Sonnet、Mistral Medium、GPT-3.5和Llama 2的勝率分別爲52.9%、59.3%、63.2%、63.7%。

爲了未來適用於多語言用例，超過5%的 Llama 3 預訓練數據集屬於涵蓋30 多種語言的高質量非英語數據。但Meta預計，對非英語語種的性能不會和英語的一致。

Meta預計。未來幾個月，將推出Llama 3 的新功能，上下文窗口會更長，性能會更強，還會有該模型新的尺寸版本，Meta還將分享 Llama 3的研究論文。

亞馬遜等雲平台將推出Llama 3 超2.4萬英偉達H100芯片訓練Llama 3

Meta介紹，Llama 3 模型很快將在亞馬遜雲AWS、Databricks、谷歌雲、Hugging Face、Kaggle、IBM的雲平台WatsonX、微軟雲Azure、英偉達的NIM和 Snowflake 上推出，得到 AMD、AWS、戴爾、英特爾、英偉達提供的硬件平台支持。

英偉達同日披露，Meta的工程師在包含2.4576萬塊英偉達H100 Tensor Core GPU、連接英偉達Quantum-2 InfiniBand網絡的計算機集群上訓練 Llama 3。在英偉達的支持下，Meta 爲其LLM調整了網絡、軟件和模型架構。而且，爲了進一步推進生成式AI的先進水平，Meta最近公佈了計劃，要在其基礎設施用應用35萬塊H100 芯片。

英偉達稱，由英偉達芯片助力的Llama 3現已推出，可用於雲、數據中心、邊緣計算和個人電腦（PC）。開發人員可以通過英偉達的網站ai.nvidia.com試用Llama 3，企業用戶可以通過英偉達的端到端雲原生框架NeMo，利用自身數據對 Llama 3進行調優。

Llama 3 還可在英偉達用於機器人開發的模組Jetson Orin 上運行，用於機器人和邊緣計算設備，創建像Jetson AI 實驗室中的交互式代理。此外，適用於工作站和 PC 的 NVIDIA RTX 和 GeForce RTX GPU可加快 Llama 3的推理速度。

美國以外十三國推出英語版Meta AI 手機和電腦均可用文生圖功能Image可實時更新圖、生成GIF

Meta介紹，用戶可以在旗下社交媒體Facebook、Instagram、WhatsApp 和 Messenger上使用 Meta AI完成工作、學習、創作和連接自己看重的事物。

Meta稱，將在美國以外的十三個國家推出英語版 Meta AI，包括加拿大、澳大利亞、新西蘭、新加坡、南非、尼日利亞、巴基斯坦、加納、牙買加、馬拉維、烏干達、贊比亞和津巴布韋。

Meta AI能做什麼？Meta舉了一些例子，比如策劃和朋友晚上怎麼玩，推薦一家可欣賞日落美景並提供素食選擇的餐廳，查找週末晚上哪裏有音樂會，提供野餐地點的建議，解釋遺傳特徵如何發揮作用這種課業問題。

Meta還提到一個新功能——名叫Image的AI圖像生成功能，用戶可以根據WhatsApp 和 Meta AI 網站中的文本生成圖像。用這種功能，Meta AI 可以根據用戶想要的審美要求“想象”生成圖片，給用戶的實際購物提供靈感。

扎克伯格表示，Image服務將在用戶輸入更詳細的提示詞時實時更新圖像，並可以創建自定義動畫GIF。

Meta稱，當用戶開始打字輸入提示詞時，會看到一個圖像出現，並且每輸入幾個字母，這個圖就會發生變化。

Meta介紹，如果用戶找到喜歡的圖片，可以讓 Meta AI 爲其製作動畫，或者轉換爲GIF圖片與朋友分享。

除了手機用戶，Meta還兼顧電腦用戶，上線了網站meta.ai，讓用戶在電腦上完成工作時也可以使用 Meta AI，讓它幫忙解數學題，讓工作電郵的內容更專業。用戶還可以登錄網站保存與Meta AI 的對話內容，供將來參考。

Meta AI 還可以在 Facebook、Instagram、WhatsApp 和 Messenger上進行網頁實時搜索。用戶可以通過網絡訪問實時信息，無需在這些社交媒體的應用程序App之間切換。假用戶正在 Messenger 群聊時計劃怎麼安排滑雪旅行。使用Messenger 中的搜索，可以要求 Meta AI 查找從紐約飛往科羅拉多州的航班，找出出行人數相對最少的週末，所有這些查找工作都無需離開 Messenger的App進行。