AMD發現將芯片效能提升100倍的辦法

如果您希望可以时常见面，欢迎标星收藏哦~

来源：内容由半导体行业观察（ID：icbank）编译自tomshardware，谢谢。

AMD 首席执行官 Lisa Su 出席了 imec 的 ITF World 2024 大会，接受了享有盛誉的imec 创新奖，以表彰其创新和行业领导力，与 Gordon Moore、Morris Chang 和 Bill Gates 等其他往届获奖者一起获得了该奖项。在接受奖项后，Su 开始了她的演讲，介绍了 AMD 为实现公司 30x25 目标所采取的步骤，该目标旨在到 2025 年将计算节点的能效提高 30 倍。Su 宣布，AMD 不仅有望实现这一目标，而且现在还看到了到 2026 年至 2027 年将能效提高 100 倍以上的途径。

由于 ChatGPT 等生成式 AI LLM 的激增，人们对 AI 功耗的担忧成为人们关注的焦点，但 AMD 早在 2021 年就预见到了 AI 巨大的功耗需求所带来的问题。当时，AMD 开始致力于其 30x25 目标，以提高数据中心计算节点的能效，特别指出 AI 和 HPC 的功耗是一个迫在眉睫的问题。（AMD 早在 2014 年就设定了其第一个雄心勃勃的能源目标，其首个 25x20 目标是到 2020 年将消费处理器的能效提高 25 倍，而 AMD 最终以 31.7 倍的提升超额完成了这一目标。）

这个问题现在已成为焦点。随着全球最大的公司争夺人工智能霸主地位，生成式人工智能正在推动数据中心的快速扩张，但公共电网尚未准备好应对耗电数据中心的突然激增，电力成为新的限制因素。由于电网容量、基础设施和环境问题限制了可用于新建和扩建数据中心的容量，因此数据中心可用的电量受到严格限制。事实上，许多新数据中心都建在发电厂旁边，以确保电力供应，而巨大的需求甚至重新点燃了使用核小型模块反应堆 (SMR) 为单个数据中心供电的热情。

随着训练模型所需的计算量增加，问题只会愈演愈烈。苏姿丰指出，第一批图像和语音识别人工智能模型的大小过去每两年翻一番，与过去十年计算能力的进步速度基本一致。

然而，生成式人工智能模型的规模现在以每年 20 倍的速度增长，超过了计算和内存进步的速度。苏姿丰表示，虽然当今最大的模型是在数万个 GPU 上训练的，消耗了数万兆瓦时的电力，但快速扩大的模型大小可能很快就需要数十万个 GPU 进行训练，可能需要几千兆瓦的电力来训练一个模型。这显然是站不住脚的。

AMD 为提高能效制定了多管齐下的策略，包括一种广泛的方法，从其硅架构和先进的封装策略扩展到 AI 特定的架构、系统和数据中心级调整以及软件和硬件共同设计计划。

当然，硅是基石。

苏姿丰指出，3nm 全栅极 (GAA) 晶体管是 AMD 在硅路线图上的下一步，旨在提高功率效率和性能，同时继续关注先进封装和互连，以实现更节能、更具成本效益的模块化设计。先进封装在扩展设计以在单芯片封装的限制内产生更多马力方面发挥着关键作用，AMD 采用 2.5D 和 3D 封装的混合技术，以最大限度地提高每平方毫米数据中心硅片的每瓦计算能力。

在服务器节点和服务器机架之间传输数据会因距离较长而消耗额外电力，因此优化数据局部性可以节省大量电力。AMD 的 MI300X 是一个很好的例子，它体现了制造越来越大的芯片封装所带来的效率——该芯片拥有 1530 亿个晶体管，分布在 12 个芯片上，搭配 24 个 HBM3 芯片，可提供 192GB 的内存容量，所有这些都可作为本地内存供 GPU 使用。再加上封装内单元之间经过功率和性能优化的 Infinity Fabric 互连，极高的计算和内存密度可将更多数据保持在靠近处理核心的位置，从而减少传输数据所需的能量。

参考链接

点这里加关注，锁定更多原创内容

如果您希望可以時常見面，歡迎標星收藏哦~

來源：內容由半導體行業觀察（ID：icbank）編譯自tomshardware，謝謝。

AMD 首席執行官 Lisa Su 出席了 imec 的 ITF World 2024 大會，接受了享有盛譽的imec 創新獎，以表彰其創新和行業領導力，與 Gordon Moore、Morris Chang 和 Bill Gates 等其他往屆獲獎者一起獲得了該獎項。在接受獎項後，Su 開始了她的演講，介紹了 AMD 爲實現公司 30x25 目標所採取的步驟，該目標旨在到 2025 年將計算節點的能效提高 30 倍。Su 宣佈，AMD 不僅有望實現這一目標，而且現在還看到了到 2026 年至 2027 年將能效提高 100 倍以上的途徑。

由於 ChatGPT 等生成式 AI LLM 的激增，人們對 AI 功耗的擔憂成爲人們關注的焦點，但 AMD 早在 2021 年就預見到了 AI 巨大的功耗需求所帶來的問題。當時，AMD 開始致力於其 30x25 目標，以提高數據中心計算節點的能效，特別指出 AI 和 HPC 的功耗是一個迫在眉睫的問題。（AMD 早在 2014 年就設定了其第一個雄心勃勃的能源目標，其首個 25x20 目標是到 2020 年將消費處理器的能效提高 25 倍，而 AMD 最終以 31.7 倍的提升超額完成了這一目標。）

這個問題現在已成爲焦點。隨着全球最大的公司爭奪人工智能霸主地位，生成式人工智能正在推動數據中心的快速擴張，但公共電網尚未準備好應對耗電數據中心的突然激增，電力成爲新的限制因素。由於電網容量、基礎設施和環境問題限制了可用於新建和擴建數據中心的容量，因此數據中心可用的電量受到嚴格限制。事實上，許多新數據中心都建在發電廠旁邊，以確保電力供應，而巨大的需求甚至重新點燃了使用核小型模塊反應堆 (SMR) 爲單個數據中心供電的熱情。

隨着訓練模型所需的計算量增加，問題只會愈演愈烈。蘇姿豐指出，第一批圖像和語音識別人工智能模型的大小過去每兩年翻一番，與過去十年計算能力的進步速度基本一致。

然而，生成式人工智能模型的規模現在以每年 20 倍的速度增長，超過了計算和內存進步的速度。蘇姿豐表示，雖然當今最大的模型是在數萬個 GPU 上訓練的，消耗了數萬兆瓦時的電力，但快速擴大的模型大小可能很快就需要數十萬個 GPU 進行訓練，可能需要幾千兆瓦的電力來訓練一個模型。這顯然是站不住腳的。

AMD 爲提高能效制定了多管齊下的策略，包括一種廣泛的方法，從其硅架構和先進的封裝策略擴展到 AI 特定的架構、系統和數據中心級調整以及軟件和硬件共同設計計劃。

當然，硅是基石。

蘇姿豐指出，3nm 全柵極 (GAA) 晶體管是 AMD 在硅路線圖上的下一步，旨在提高功率效率和性能，同時繼續關注先進封裝和互連，以實現更節能、更具成本效益的模塊化設計。先進封裝在擴展設計以在單芯片封裝的限制內產生更多馬力方面發揮着關鍵作用，AMD 採用 2.5D 和 3D 封裝的混合技術，以最大限度地提高每平方毫米數據中心硅片的每瓦計算能力。

在服務器節點和服務器機架之間傳輸數據會因距離較長而消耗額外電力，因此優化數據局部性可以節省大量電力。AMD 的 MI300X 是一個很好的例子，它體現了製造越來越大的芯片封裝所帶來的效率——該芯片擁有 1530 億個晶體管，分佈在 12 個芯片上，搭配 24 個 HBM3 芯片，可提供 192GB 的內存容量，所有這些都可作爲本地內存供 GPU 使用。再加上封裝內單元之間經過功率和性能優化的 Infinity Fabric 互連，極高的計算和內存密度可將更多數據保持在靠近處理核心的位置，從而減少傳輸數據所需的能量。

參考鏈接

點這裏加關注，鎖定更多原創內容

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

AMD发现将芯片效能提升100倍的办法

AMD發現將芯片效能提升100倍的辦法

風險及免責聲明

聲明