蘋果官宣：支持Apple Intelligence的模型在谷歌定製芯片上訓練

苹果论文披露，在8192块谷歌TPUv4 芯片上训练一个大型服务器语言模型——服务器苹果基础模型（AFM），进行6.3万亿token训练；端侧AFM在2048块TPUv5p 芯片训练；AFM和AFM服务是在“云TPU 集群”上训练。

本文作者：李丹

来源：硬AI

公开文件显示，苹果开发自家的人工智能（AI）系统Apple Intelligence离不开谷歌定制芯片的支持。

美东时间7月29日周一，苹果官网公布了一篇技术论文，详细介绍为支持苹果个人智能化系统Apple Intelligence而开发了一些基础语言模型，包括一个用于在设备上高效运行的约30亿参数模型——端侧“苹果基础模型”（AFM），以及一个为苹果云端AI架构“私有云计算”（Private Cloud Compute）而设计的大型服务器语言模型——服务器AFM。

论文中，苹果介绍，端侧AFM和服务器AFM是苹果开发的生成式模型大家族成员，这些模型都用于支持用户和开发者。论文中，苹果披露，训练模型采用了谷歌研发的第四代AI ASIC芯片TPUv4和更新一代的芯片TPUv5。文章写道：

“我们在8192块TPUv4 芯片上从无到有训练服务器AFM，使用4096的序列长度和4096个序列的批量大小，进行6.3万亿token训练。”
“端侧AFM在2048块TPUv5p芯片上进行训练。”

在这篇长达47页的论文中，苹果没有提到谷歌或是英伟达的名字，但表示，其AFM和AFM 服务是在“云TPU 集群”上训练。这意味着，苹果向云服务商租用了服务器执行计算。

事实上，今年6月的全球开发者大会（WWDC）期间，媒体已经在苹果公布的技术文件细节中发现，谷歌成为苹果在AI领域发力的另一位赢家。苹果的工程师在构建基础模型时运用了公司自研的框架软件及多种硬件，包括仅在谷歌云上可用的张量处理单元（TPU）。只不过，苹果未透露，相比英伟达等其他AI硬件供应商，苹果有多依赖谷歌的芯片和软件。

因此，本周一在社交媒体X上有评论指出，6月就出过苹果用谷歌芯片的消息，现在我们有了更多关于训练堆栈的细节。

有评论称，苹果并不是讨厌英伟达，只不过TPU的速度更快。还有评论称，TPU速度更快，所以苹果用它是有道理的，当然也可能它比英伟达的芯片更便宜。

本周一媒体评论称，谷歌的TPU最初是为内部工作负载而创建，现在正得到更广泛的应用。苹果用谷歌芯片训练模型的决定表明，在AI训练方面，一些科技巨头可能正在寻找并且已找到英伟达AI芯片的替代品。

华尔街见闻曾提到，上周，Meta的CEO扎克伯格和Alphabet兼谷歌的CEO皮查伊都在讲话中暗示，他们的公司和其他科技业公司可能在AI基础设施方面投资过度，“可能过多投入AI”。但他们同时都承认，如果不这样做，商业风险太高。

扎克伯格说：

“落后的后果是，你在未来10到15年内，都会在最重要的技术上处于不利地位。”

皮查伊说：

AI成本高，但投资不足的风险更大。谷歌可能在AI基础设施上投资过多，主要包括购买英伟达的GPU。即使AI热潮放缓，公司购买的数据中心和计算机芯片也可以用于其他用途。对我们来说，投资不足的风险远远大于投资过度的风险。

蘋果論文披露，在8192塊谷歌TPUv4 芯片上訓練一個大型服務器語言模型——服務器蘋果基礎模型（AFM），進行6.3萬億token訓練；端側AFM在2048塊TPUv5p 芯片訓練；AFM和AFM服務是在“雲TPU 集群”上訓練。

本文作者：李丹

來源：硬AI

公開文件顯示，蘋果開發自家的人工智能（AI）系統Apple Intelligence離不開谷歌定製芯片的支持。

美東時間7月29日週一，蘋果官網公佈了一篇技術論文，詳細介紹爲支持蘋果個人智能化系統Apple Intelligence而開發了一些基礎語言模型，包括一個用於在設備上高效運行的約30億參數模型——端側“蘋果基礎模型”（AFM），以及一個爲蘋果雲端AI架構“私有云計算”（Private Cloud Compute）而設計的大型服務器語言模型——服務器AFM。

論文中，蘋果介紹，端側AFM和服務器AFM是蘋果開發的生成式模型大家族成員，這些模型都用於支持用戶和開發者。論文中，蘋果披露，訓練模型採用了谷歌研發的第四代AI ASIC芯片TPUv4和更新一代的芯片TPUv5。文章寫道：

“我們在8192塊TPUv4 芯片上從無到有訓練服務器AFM，使用4096的序列長度和4096個序列的批量大小，進行6.3萬億token訓練。”
“端側AFM在2048塊TPUv5p芯片上進行訓練。”

在這篇長達47頁的論文中，蘋果沒有提到谷歌或是英偉達的名字，但表示，其AFM和AFM 服務是在“雲TPU 集群”上訓練。這意味着，蘋果向雲服務商租用了服務器執行計算。

事實上，今年6月的全球開發者大會（WWDC）期間，媒體已經在蘋果公佈的技術文件細節中發現，谷歌成爲蘋果在AI領域發力的另一位贏家。蘋果的工程師在構建基礎模型時運用了公司自研的框架軟件及多種硬件，包括僅在谷歌雲上可用的張量處理單元（TPU）。只不過，蘋果未透露，相比英偉達等其他AI硬件供應商，蘋果有多依賴谷歌的芯片和軟件。

因此，本週一在社交媒體X上有評論指出，6月就出過蘋果用谷歌芯片的消息，現在我們有了更多關於訓練堆棧的細節。

有評論稱，蘋果並不是討厭英偉達，只不過TPU的速度更快。還有評論稱，TPU速度更快，所以蘋果用它是有道理的，當然也可能它比英偉達的芯片更便宜。

本週一媒體評論稱，谷歌的TPU最初是爲內部工作負載而創建，現在正得到更廣泛的應用。蘋果用谷歌芯片訓練模型的決定表明，在AI訓練方面，一些科技巨頭可能正在尋找並且已找到英偉達AI芯片的替代品。

華爾街見聞曾提到，上週，Meta的CEO扎克伯格和Alphabet兼谷歌的CEO皮查伊都在講話中暗示，他們的公司和其他科技業公司可能在AI基礎設施方面投資過度，“可能過多投入AI”。但他們同時都承認，如果不這樣做，商業風險太高。

扎克伯格說：

“落後的後果是，你在未來10到15年內，都會在最重要的技術上處於不利地位。”

皮查伊說：

AI成本高，但投資不足的風險更大。谷歌可能在AI基礎設施上投資過多，主要包括購買英偉達的GPU。即使AI熱潮放緩，公司購買的數據中心和計算機芯片也可以用於其他用途。對我們來說，投資不足的風險遠遠大於投資過度的風險。

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

苹果官宣：支持Apple Intelligence的模型在谷歌定制芯片上训练

蘋果官宣：支持Apple Intelligence的模型在谷歌定製芯片上訓練

風險及免責聲明

聲明