DeepSeek消息動態追蹤

來自英偉達的認可！DeepSeek上線英偉達NIM平台，私募巨頭預計人工智能將獲更廣泛應用

券商中國 · 01/31 05:28

来源：券商中国
作者：时谦

英伟达也认可了！

据 $英伟达 (NVDA.US)$ 官网最新消息，为了帮助开发人员安全地试验这些功能并构建自己的专用代理，6710亿参数的DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版在Build.nvidia.com上提供。DeepSeek-R1 NIM微服务可以在单个NVIDIA HGX H200系统上每秒提供多达3872个令牌。开发人员可以使用应用程序编程接口（API）进行测试和试验，该接口预计很快将作为可下载的NIM微服务提供，是NVIDIA AI Enterprise软件平台的一部分。

此外，英伟达还在官网中表示，DeepSeek-R1是一个具有最先进推理能力的开放模型。DeepSeek-R1等推理模型不会提供直接响应，而是对查询进行多次推理，采用思路链、共识和搜索方法来生成最佳答案。

来自英伟达的认可

英伟达称，DeepSeek-R1等推理模型不会提供直接响应，而是对查询进行多次推理，采用思路链、共识和搜索方法来生成最佳答案。执行这一系列推理过程（使用推理得出最佳答案）称为测试时间扩展。DeepSeek-R1是此扩展定律的完美示例，证明了加速计算对于代理AI推理的需求至关重要。

由于模型可以反复“思考”问题，因此它们会创建更多输出标记和更长的生成周期，因此模型质量会不断提高。大量的测试时计算对于实现实时推理和来自DeepSeek-R1等推理模型的更高质量响应至关重要，这需要更大规模的推理部署。R1在需要逻辑推理、推理、数学、编码和语言理解的任务中提供了领先的准确性，同时还提供了高推理效率。

为了帮助开发人员安全地试验这些功能并构建自己的专用代理，6710亿参数的DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版在Build.nvidia.com上提供。DeepSeek-R1 NIM微服务可以在单个NVIDIA HGX H200系统上每秒提供多达3872个令牌。开发人员可以使用应用程序编程接口（API）进行测试和试验，该接口预计很快将作为可下载的NIM微服务提供，是NVIDIA AI Enterprise软件平台的一部分。

DeepSeek-R1 NIM微服务通过支持行业标准API简化了部署。企业可以通过在其首选的加速计算基础设施上运行NIM微服务来最大限度地提高安全性和数据隐私。通过使用NVIDIA AI Foundry和NVIDIA NeMo软件，企业还可以为专门的AI代理创建定制的DeepSeek-R1 NIM微服务。

DeepSeek-R1是一个大型混合专家(MoE)模型。它包含了令人印象深刻的6710亿个参数——比许多其他流行的开源LLM多10倍——支持128000个Token的大输入上下文长度。该模型还在每个层中使用了极多的专家。R1的每一层都有256位专家，每个Token并行路由到八个不同的专家进行评估。

为R1提供实时答案需要许多具有高计算性能的GPU，并通过高带宽和低延迟通信进行连接，以将提示令牌路由到所有专家进行推理。结合NVIDIA NIM微服务中提供的软件优化，一台使用NVLink和NVLink Switch连接的带有八个H200 GPU的服务器可以以每秒高达3872个令牌的速度运行完整的6710亿参数DeepSeek-R1模型。这种吞吐量是通过在每一层使用 NVIDIA Hopper 架构的FP8 Transformer Engine实现的，并且使用900GB/s的NVLink带宽进行MoE专家通信。

充分利用GPU的每秒浮点运算(FLOPS)性能对于实时推理至关重要。下一代NVIDIA Blackwell架构将通过第五代Tensor Core大幅提升 DeepSeek-R1等推理模型的测试时间扩展，第五代Tensor Core可提供高达20 petaflops的峰值FP4计算性能，以及专门针对推理优化的72-GPU NVLink域。

从开源到复现

近日，加州大学伯克利分校的研究人员开发出了中国开发的 AI 语言模型DeepSeek R1-Zero的小规模语言模型复制品，成本约为30美元。语言模型TinyZero是由校园研究生Jiayi Pan和其他三名研究人员领导的项目，由校园教授Alane Suhr教授和伊利诺伊大学厄巴纳-香槟分校助理教授Hao Peng指导。

DeepSeek的R1模型权重和代码库采用公共MIT许可证，因此Pan和他的团队能够访问基础代码来训练一个明显小得多的模型。潘表示，TinyZero同样是开源的，这意味着代码可供公众使用。他说，TinyZero 的开源性质允许人们下载代码并尝试训练和修改模型。“小规模复制非常容易实现，而且成本非常低，即使人们将其作为实验的副项目，”潘说。“从项目一开始，我们的目标基本上就是揭开如何训练这些模型的神秘面纱，更好地理解它们背后的科学和设计决策。”

昨天，$微软 (MSFT.US)$官网显示，DeepSeek R1现已在Azure AI Foundry和 GitHub上的模型目录中提供，加入了1800多个模型的多样化产品组合，包括前沿、开源、行业特定和基于任务的AI模型。作为Azure AI Foundry的一部分，DeepSeek R1可在值得信赖、可扩展且企业级就绪的平台上访问，使企业能够无缝集成高级AI，同时满足SLA、安全性和负责任的AI承诺——所有这些都由Microsoft的可靠性和创新支持。

黑石最新态度

本周，硅谷、华盛顿、华尔街等地的领导人因中国人工智能公司DeepSeek的意外崛起而陷入混乱。许多分析师认为DeepSeek的成功动摇了推动美国人工智能行业发展的核心信念。

但人工智能科学家反驳说，许多担忧都是夸大其词。他们表示，尽管DeepSeek确实代表了人工智能效率的真正进步，但美国人工智能行业仍然具有关键优势。兰德公司人工智能研究员伦纳特·海姆表示：“这并不是人工智能前沿能力的飞跃。我认为市场只是搞错了。”

另外，截至目前，私募股权巨头、全球主要人工智能系统数据中心投资者黑石集团仍持乐观态度。“我们仍然认为，实体基础设施、数据中心和电力的需求十分迫切，”黑石总裁乔纳森·格雷(Jonathan Gray)周四在与投资者举行的第四季度财报电话会议上表示。“这些需求的使用方式可能会发生变化。”

格雷表示，与投资界和企业界的大多数人一样，黑石集团的高管在过去一周花了大量时间来权衡DeepSeek的影响。近年来，黑石集团积极购买和建设数据中心，这是科技公司运行人工智能系统所使用的物理基础设施。2021年，黑石集团以100亿美元收购了美国数据中心公司QTS，去年，黑石集团牵头以约160亿美元收购了在亚洲运营数据中心的AirTrunk。

格雷同时预计，随着人工智能计算能力成本的大幅下降，人工智能将得到更广泛的应用。换句话说，虽然人工智能模型回答特定问题所需的能力可能会减少，但人们会提出更多问题。格雷表示，黑石集团只为签订长期租约的科技公司建造数据中心。“我们不会投机性地建造它们。”他指出，客户使用这些数据中心的方式很可能会改变。

AI应用热潮来袭！善用「投资主题」功能，捕捉投资机会。

打开富途牛牛>美股>投资主题>AI应用软件股

编辑/Jeffy

來源：券商中國
作者：時謙

英偉達也認可了！

據 $英偉達 (NVDA.US)$ 官網最新消息，爲了幫助開發人員安全地試驗這些功能並構建自己的專用代理，6710億參數的DeepSeek-R1模型現已作爲NVIDIA NIM微服務預覽版在Build.nvidia.com上提供。DeepSeek-R1 NIM微服務可以在單個NVIDIA HGX H200系統上每秒提供多達3872個令牌。開發人員可以使用應用程序編程接口（API）進行測試和試驗，該接口預計很快將作爲可下載的NIM微服務提供，是NVIDIA AI Enterprise軟體平台的一部分。

此外，英偉達還在官網中表示，DeepSeek-R1是一個具有最先進推理能力的開放模型。DeepSeek-R1等推理模型不會提供直接響應，而是對查詢進行多次推理，採用思路鏈、共識和搜索方法來生成最佳答案。

來自英偉達的認可

英偉達稱，DeepSeek-R1等推理模型不會提供直接響應，而是對查詢進行多次推理，採用思路鏈、共識和搜索方法來生成最佳答案。執行這一系列推理過程（使用推理得出最佳答案）稱爲測試時間擴展。DeepSeek-R1是此擴展定律的完美示例，證明了加速計算對於代理AI推理的需求至關重要。

由於模型可以反覆「思考」問題，因此它們會創建更多輸出標記和更長的生成周期，因此模型質量會不斷提高。大量的測試時計算對於實現實時推理和來自DeepSeek-R1等推理模型的更高質量響應至關重要，這需要更大規模的推理部署。R1在需要邏輯推理、推理、數學、編碼和語言理解的任務中提供了領先的準確性，同時還提供了高推理效率。

爲了幫助開發人員安全地試驗這些功能並構建自己的專用代理，6710億參數的DeepSeek-R1模型現已作爲NVIDIA NIM微服務預覽版在Build.nvidia.com上提供。DeepSeek-R1 NIM微服務可以在單個NVIDIA HGX H200系統上每秒提供多達3872個令牌。開發人員可以使用應用程序編程接口（API）進行測試和試驗，該接口預計很快將作爲可下載的NIM微服務提供，是NVIDIA AI Enterprise軟體平台的一部分。

DeepSeek-R1 NIM微服務通過支持行業標準API簡化了部署。企業可以通過在其首選的加速計算基礎設施上運行NIM微服務來最大限度地提高安全性和數據隱私。通過使用NVIDIA AI Foundry和NVIDIA NeMo軟體，企業還可以爲專門的AI代理創建定製的DeepSeek-R1 NIM微服務。

DeepSeek-R1是一個大型混合專家(MoE)模型。它包含了令人印象深刻的6710億個參數——比許多其他流行的開源LLM多10倍——支持128000個Token的大輸入上下文長度。該模型還在每個層中使用了極多的專家。R1的每一層都有256位專家，每個Token並行路由到八個不同的專家進行評估。

爲R1提供實時答案需要許多具有高計算性能的GPU，並通過高帶寬和低延遲通信進行連接，以將提示令牌路由到所有專家進行推理。結合NVIDIA NIM微服務中提供的軟體優化，一臺使用NVLink和NVLink Switch連接的帶有八個H200 GPU的服務器可以以每秒高達3872個令牌的速度運行完整的6710億參數DeepSeek-R1模型。這種吞吐量是通過在每一層使用 NVIDIA Hopper 架構的FP8 Transformer Engine實現的，並且使用900GB/s的NVLink帶寬進行MoE專家通信。

充分利用GPU的每秒浮點運算(FLOPS)性能對於實時推理至關重要。下一代NVIDIA Blackwell架構將通過第五代Tensor Core大幅提升 DeepSeek-R1等推理模型的測試時間擴展，第五代Tensor Core可提供高達20 petaflops的峰值FP4計算性能，以及專門針對推理優化的72-GPU NVLink域。

從開源到復現

近日，加州大學伯克利分校的研究人員開發出了中國開發的 AI 語言模型DeepSeek R1-Zero的小規模語言模型複製品，成本約爲30美元。語言模型TinyZero是由校園研究生Jiayi Pan和其他三名研究人員領導的項目，由校園教授Alane Suhr教授和伊利諾伊大學厄巴納-香檳分校助理教授Hao Peng指導。

DeepSeek的R1模型權重和代碼庫採用公共MIT許可證，因此Pan和他的團隊能夠訪問基礎代碼來訓練一個明顯小得多的模型。潘表示，TinyZero同樣是開源的，這意味着代碼可供公衆使用。他說，TinyZero 的開源性質允許人們下載代碼並嘗試訓練和修改模型。「小規模複製非常容易實現，而且成本非常低，即使人們將其作爲實驗的副項目，」潘說。「從項目一開始，我們的目標基本上就是揭開如何訓練這些模型的神祕面紗，更好地理解它們背後的科學和設計決策。」

昨天，$微軟 (MSFT.US)$官網顯示，DeepSeek R1現已在Azure AI Foundry和 GitHub上的模型目錄中提供，加入了1800多個模型的多樣化產品組合，包括前沿、開源、行業特定和基於任務的AI模型。作爲Azure AI Foundry的一部分，DeepSeek R1可在值得信賴、可擴展且企業級就緒的平台上訪問，使企業能夠無縫集成高級AI，同時滿足SLA、安全性和負責任的AI承諾——所有這些都由Microsoft的可靠性和創新支持。

黑石最新態度

本週，硅谷、華盛頓、華爾街等地的領導人因中國人工智能公司DeepSeek的意外崛起而陷入混亂。許多分析師認爲DeepSeek的成功動搖了推動美國人工智能行業發展的核心信念。

但人工智能科學家反駁說，許多擔憂都是誇大其詞。他們表示，儘管DeepSeek確實代表了人工智能效率的真正進步，但美國人工智能行業仍然具有關鍵優勢。蘭德公司人工智能研究員倫納特·海姆表示：「這並不是人工智能前沿能力的飛躍。我認爲市場只是搞錯了。」

另外，截至目前，私募股權巨頭、全球主要人工智能系統數據中心投資者黑石集團仍持樂觀態度。「我們仍然認爲，實體基礎設施、數據中心和電力的需求十分迫切，」黑石總裁喬納森·格雷(Jonathan Gray)週四在與投資者舉行的第四季度業績電話會議上表示。「這些需求的使用方式可能會發生變化。」

格雷表示，與投資界和企業界的大多數人一樣，黑石集團的高管在過去一週花了大量時間來權衡DeepSeek的影響。近年來，黑石集團積極購買和建設數據中心，這是科技公司運行人工智能系統所使用的物理基礎設施。2021年，黑石集團以100億美元收購了美國數據中心公司QTS，去年，黑石集團牽頭以約160億美元收購了在亞洲運營數據中心的AirTrunk。

格雷同時預計，隨着人工智能計算能力成本的大幅下降，人工智能將得到更廣泛的應用。換句話說，雖然人工智能模型回答特定問題所需的能力可能會減少，但人們會提出更多問題。格雷表示，黑石集團只爲簽訂長期租約的科技公司建造數據中心。「我們不會投機性地建造它們。」他指出，客戶使用這些數據中心的方式很可能會改變。

AI應用熱潮來襲！善用「投資主題」功能，捕捉投資機會。

打開富途牛牛>美股>投資主題>AI應用軟件股

編輯/Jeffy

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。