亞馬遜雲科技陳曉建：2025年很多客戶將從生成式AI原型驗證轉爲生產應用

TechWeb · 12/27 14:33

【TechWeb】12月27日消息，亚马逊云科技2024 re:Invent全球大会于12月初在美国举办，期间推出一系列技术发布，聚集生成式AI、数据战略和云服务三大领域，覆盖基础设施、模型和应用的全栈联动创新，可谓为企业应用生成式AI铺平了道路。

近日，在亚马逊云科技2024 re:Invent中国行活动上，亚马逊云科技大中华区产品部总经理陈晓建就表示：“在非常受关注的生成式AI应用领域，2024年许多客户从思考阶段进入实践阶段，进行了大量场景试验。2025年肯定会发生一个变化，很多客户将从原型验证阶段转化为生产阶段。”

帮助客户将生成式AI技术从小范围试验探索到落地至真正投入生产应用，亚马逊云科技到底是如何进行全栈联动来达成这一能力的呢？我们从其最新的技术发布中可以窥见一斑。

整体来看，2024 re:Invent全球大会上，亚马逊云科技在生成式AI领域，推出Amazon Nova系列基础模型并强化Amazon SageMaker、Amazon Bedrock和Amazon Q等核心服务，通过更低的训练和推理成本、更多的模型选择、更深入场景的应用全面加速企业应用生成式AI创新；在数据战略方面，发布新一代Amazon SageMaker为数据、分析和AI提供统一平台；Amazon S3新增Tables存储类型和元数据功能，以及无服务器分布式SQL数据库Amazon Aurora DSQL将进一步提升用户的数据管理能力；在云服务方面，推出搭载Trainium2芯片的新型计算实例和为万亿参数模型提供实时推理性能的超级服务器。

陈晓建强调：“这些新发布展现出亚马逊云科技不仅在云的核心服务层面持续创新，更在从芯片到模型，再到应用的每一个技术堆栈取得突破，让不同层级的创新相互赋能、协同进化。只有这样全栈联动的大规模创新才能真正满足当今客户的发展需求，助力各行各业重塑未来。”

生成式AI从原型验证到生产应用，有效改善大模型幻觉是基础

将生成式AI应用于企业实际的业务时，很多企业的第一个顾虑就是“幻觉”问题——大模型一本正经的胡说八道。想象一下，如果企业想将生成式AI用来做一个非常重要的业务应用场景，比如法律咨询、金融交易或者健康咨询等，这里如果出现幻觉的话，结果是无法接受的。

“亚马逊云科技团队一直在思考如何解决幻觉的问题，也探索了多种不同的技术方案。最后我们发现自动推理技术（Automatic Reasoning）能够很有效的解决幻觉问题。”陈晓建称。

陈晓建介绍，自动推理技术（Automatic Reasoning）是一项特殊的 AI 技术，它能够从数学层面证明这个推理的结果是不是正确的。它通常用于验证这个系统是不是按照设计的规范来正常的运行。自动推理在很多领域下都已经有了实践的应用，比如金融交易、健康咨询、法律咨询等领域。亚马逊云科技拥有自动推理方面的多位世界级专家。例如，可以通过自动推理来证明在Amazon IAM（Identity and Access Management）之中设计的权限和策略是不是按照企业所预想的方式来进行，这种方式的证明叫做“可证明的安全性”。这些技术同样能够帮助提升模型的准确性、降低模型的幻觉。

本次2024 re:Invent上，亚马逊云科技推出了Amazon Bedrock 自动化推理检查的功能，它能够有效的预防由于模型幻觉带来的事实性错误。

生成式AI三层架构同频更新：更强训练推理、更多模型、更优应用

在解决大模型幻觉问题后，陈晓建表示，2025年，很多客户将从生成式AI原型验证阶段转化为生产阶段，届时客户需求将更加复杂，不仅是选择模型，还需要各种技术支持。因此，在生成式AI领域，亚马逊云科技全面强化基础设施、模型和应用三层技术栈能力。

更强训练推理方面，此次2024 re:Invent上，亚马逊云科技推出新⼀代Amazon SageMaker，为客户提供一个单一的数据和AI开发环境，用户可以在其中查找和访问其组织中的所有数据，为各种常见的数据用例选择最佳工具，并将数据和AI项目扩展至团队内不同分工角色以实现协作。此外，Amazon SageMaker AI的四项创新包括Amazon SageMaker HyperPod的新训练配方功能、灵活训练计划和任务治理功能，以及在Amazon SageMaker中使用亚马逊云科技合作伙伴的热门AI应用。这些功能将帮助客户更快开始训练流行模型，通过灵活训练计划节省数周时间，并将成本降低高达40%。

陈晓建表示，新的Amazon SageMaker涵盖了分析、数据处理、搜索、数据准备、AI模型开发和训练、⽣成式AI等所有必需功能。

更多模型方面，亚马逊云科技一方面新推出了自研的Amazon Nova六款基础模型，包括Nova Micro、Nova Lite、Nova Pro和Nova Premier基础模型，以及用于生成高质量图像的Nova Canvas和生成高质量视频的Nova Reel，这些模型成本更低速度更快。另一方面，Amazon Bedrock通过推出的Amazon Bedrock Marketplace新功能新接入Luma AI和poolside等100多款热门、新兴及专业模型。这些给企业客户提供了丰富的模型选择。

同时，Amazon Bedrock推出了低延迟优化推理、模型蒸馏、提示词缓存等功能，大幅提升推理效率；支持GraphRAG等知识库功能增强数据利用能力；通过自动推理检查功能和多智能体协作等创新，进一步增强AI安全性并推动智能体发展。

陈晓建总结道：“更新能力后的Amazon Bedrock 提供的功能不只是提供多种多样的功能和模型，还能帮客户在不同的场景下选择最适合的场景功能，它同时提供了大模型真正用于生产的时候所需要的各种各样的工具。”

更优应用方面，Amazon Q更加深入软件开发和商业应用场景。Amazon Q Developer增加三款新的智能体，能自动执行单元测试、文档编制和代码审查流程，并通过与GitLab深度集成，扩展应用场景；推出转型功能以加速Windows.NET、VMware和大型机工作负载的迁移和现代化，缩短转型时间并降低成本。强化了Amazon Q Business和Amazon Q in QuickSight洞察能力，并简化了复杂工作流程的自动化实现方式。

至此，对生成式AI应用于生产时所需的各类模型、技术、工具等都已具备。

夯实底层，升级计算、网络、存储和数据库等云服务

事实上，生成式AI应用是天然的“云原生”应用。如何让企业客户在使用生成式AI应用时更快、更省、更稳，还有很多云基础服务方面的工作可以优化和提升。

2024 re:Invent上，亚马逊云科技在计算、网络、存储和数据库等云计算服务核心领域也进行了创新，为包括生成式AI应用在内的各类工作负载提供更强大的底层支持。

在自研芯片领域，基于Amazon Trainium2的EC2 Trn2实例正式可用，较当前GPU实例性价比提升30-40%；推出配备64个Trainium2芯片的EC2 Trn2 UltraServers服务器，提供高达83.2 Petaflops浮点算力，计算能力是单一实例的四倍。采用3纳米工艺的下一代Trainium3芯片预计将在2025年末上线，预计将使集群性能提升4倍，并在性能、能效和密度上树立新标杆。

在网络基础设施领域，推出第二代UltraCluster网络架构，支持超过20,000个GPU协同工作，带宽达10Pb/s，延迟低于10ms，这一突破性升级将模型训练时间缩短至少15%。

在存储服务领域，Amazon S3新增Metadata元数据功能实现自动获取和实时更新；推出专为Iceberg表优化的S3 Tables存储类型，将查询性能提升3倍，事务处理能力提升10倍。

在数据库服务领域，推出Amazon Aurora DSQL全新的无服务器分布式SQL数据库，采用active-active架构并具备自动故障恢复功能，支持应用程序在任意端点进行读写，能实现近乎无限的可扩展性。Amazon DynamoDB global tables增加了多区域强一致性支持，进一步增强了其分布式数据库服务能力。

陈晓建表示，亚马逊云科技是全球云计算的开创者和引领者，更是企业构建和应用生成式AI的首选，今年re:Invent全球大会的这一系列重磅发布再次印证了这一点。

沙利文大中华区总监李庆表示：”本届re:Invent大会上的新发布更加侧重于产品的实际应用和工具优化。本次更新有两个方面让人印象深刻：一是随着全球企业对生成式AI的深入应用，数据不仅实现跨区域的传输与协同，更实现跨地域、跨区域的深度连接；二是亚马逊云科技进一步优化生成式AI的应用，从数据存储、治理到管理的全流程提升，旨在简化AI对数据的使用，同时强化模型功能、增加AI agent管理和应对模型幻觉的功能。此外，新发布的Amazon Nova大模型家族备受期待，这一系列的模型和亚马逊云科技的开放选择理念将为用户带来更多创新机会，进一步推动AI的发展。”（果青）

【TechWeb】12月27日消息，亞馬遜雲科技2024 re:Invent全球大會於12月初在美國舉辦，期間推出一系列技術發佈，聚集生成式AI、數據戰略和雲服務三大領域，覆蓋基礎設施、模型和應用的全棧聯動創新，可謂爲企業應用生成式AI鋪平了道路。

近日，在亞馬遜雲科技2024 re:Invent中國行活動上，亞馬遜雲科技大中華區產品部總經理陳曉建就表示：「在非常受關注的生成式AI應用領域，2024年許多客戶從思考階段進入實踐階段，進行了大量場景試驗。2025年肯定會發生一個變化，很多客戶將從原型驗證階段轉化爲生產階段。」

幫助客戶將生成式AI技術從小範圍試驗探索到落地至真正投入生產應用，亞馬遜雲科技到底是如何進行全棧聯動來達成這一能力的呢？我們從其最新的技術發佈中可以窺見一斑。

整體來看，2024 re:Invent全球大會上，亞馬遜雲科技在生成式AI領域，推出Amazon Nova系列基礎模型並強化Amazon SageMaker、Amazon Bedrock和Amazon Q等核心服務，通過更低的訓練和推理成本、更多的模型選擇、更深入場景的應用全面加速企業應用生成式AI創新；在數據戰略方面，發佈新一代Amazon SageMaker爲數據、分析和AI提供統一平台；Amazon S3新增Tables存儲類型和元數據功能，以及無服務器分佈式SQL數據庫Amazon Aurora DSQL將進一步提升用戶的數據管理能力；在雲服務方面，推出搭載Trainium2芯片的新型計算實例和爲萬億參數模型提供實時推理性能的超級服務器。

陳曉建強調：「這些新發佈展現出亞馬遜雲科技不僅在雲的核心服務層面持續創新，更在從芯片到模型，再到應用的每一個技術堆棧取得突破，讓不同層級的創新相互賦能、協同進化。只有這樣全棧聯動的大規模創新才能真正滿足當今客戶的發展需求，助力各行各業重塑未來。」

生成式AI從原型驗證到生產應用，有效改善大模型幻覺是基礎

將生成式AI應用於企業實際的業務時，很多企業的第一個顧慮就是「幻覺」問題——大模型一本正經的胡說八道。想象一下，如果企業想將生成式AI用來做一個非常重要的業務應用場景，比如法律諮詢、金融交易或者健康諮詢等，這裏如果出現幻覺的話，結果是無法接受的。

「亞馬遜雲科技團隊一直在思考如何解決幻覺的問題，也探索了多種不同的技術方案。最後我們發現自動推理技術（Automatic Reasoning）能夠很有效的解決幻覺問題。」陳曉建稱。

陳曉建介紹，自動推理技術（Automatic Reasoning）是一項特殊的 AI 技術，它能夠從數學層面證明這個推理的結果是不是正確的。它通常用於驗證這個系統是不是按照設計的規範來正常的運行。自動推理在很多領域下都已經有了實踐的應用，比如金融交易、健康諮詢、法律諮詢等領域。亞馬遜雲科技擁有自動推理方面的多位世界級專家。例如，可以通過自動推理來證明在Amazon IAM（Identity and Access Management）之中設計的權限和策略是不是按照企業所預想的方式來進行，這種方式的證明叫做「可證明的安全性」。這些技術同樣能夠幫助提升模型的準確性、降低模型的幻覺。

本次2024 re:Invent上，亞馬遜雲科技推出了Amazon Bedrock 自動化推理檢查的功能，它能夠有效的預防由於模型幻覺帶來的事實性錯誤。

生成式AI三層架構同頻更新：更強訓練推理、更多模型、更優應用

在解決大模型幻覺問題後，陳曉建表示，2025年，很多客戶將從生成式AI原型驗證階段轉化爲生產階段，屆時客戶需求將更加複雜，不僅是選擇模型，還需要各種技術支持。因此，在生成式AI領域，亞馬遜雲科技全面強化基礎設施、模型和應用三層技術棧能力。

更強訓練推理方面，此次2024 re:Invent上，亞馬遜雲科技推出新⼀代Amazon SageMaker，爲客戶提供一個單一的數據和AI開發環境，用戶可以在其中查找和訪問其組織中的所有數據，爲各種常見的數據用例選擇最佳工具，並將數據和AI項目擴展至團隊內不同分工角色以實現協作。此外，Amazon SageMaker AI的四項創新包括Amazon SageMaker HyperPod的新訓練配方功能、靈活訓練計劃和任務治理功能，以及在Amazon SageMaker中使用亞馬遜雲科技合作伙伴的熱門AI應用。這些功能將幫助客戶更快開始訓練流行模型，通過靈活訓練計劃節省數週時間，並將成本降低高達40%。

陳曉建表示，新的Amazon SageMaker涵蓋了分析、數據處理、搜索、數據準備、AI模型開發和訓練、⽣成式AI等所有必需功能。

更多模型方面，亞馬遜雲科技一方面新推出了自研的Amazon Nova六款基礎模型，包括Nova Micro、Nova Lite、Nova Pro和Nova Premier基礎模型，以及用於生成高質量圖像的Nova Canvas和生成高質量視頻的Nova Reel，這些模型成本更低速度更快。另一方面，Amazon Bedrock通過推出的Amazon Bedrock Marketplace新功能新接入Luma AI和poolside等100多款熱門、新興及專業模型。這些給企業客戶提供了豐富的模型選擇。

同時，Amazon Bedrock推出了低延遲優化推理、模型蒸餾、提示詞緩存等功能，大幅提升推理效率；支持GraphRAG等知識庫功能增強數據利用能力；通過自動推理檢查功能和多智能體協作等創新，進一步增強AI安全性並推動智能體發展。

陳曉建總結道：「更新能力後的Amazon Bedrock 提供的功能不只是提供多種多樣的功能和模型，還能幫客戶在不同的場景下選擇最適合的場景功能，它同時提供了大模型真正用於生產的時候所需要的各種各樣的工具。」

更優應用方面，Amazon Q更加深入軟件開發和商業應用場景。Amazon Q Developer增加三款新的智能體，能自動執行單元測試、文檔編制和代碼審查流程，並通過與GitLab深度集成，擴展應用場景；推出轉型功能以加速Windows.NET、VMware和大型機工作負載的遷移和現代化，縮短轉型時間並降低成本。強化了Amazon Q Business和Amazon Q in QuickSight洞察能力，並簡化了複雜工作流程的自動化實現方式。

至此，對生成式AI應用於生產時所需的各類模型、技術、工具等都已具備。

夯實底層，升級計算、網絡、存儲和數據庫等雲服務

事實上，生成式AI應用是天然的「雲原生」應用。如何讓企業客戶在使用生成式AI應用時更快、更省、更穩，還有很多雲基礎服務方面的工作可以優化和提升。

2024 re:Invent上，亞馬遜雲科技在計算、網絡、存儲和數據庫等雲計算服務核心領域也進行了創新，爲包括生成式AI應用在內的各類工作負載提供更強大的底層支持。

在自研芯片領域，基於Amazon Trainium2的EC2 Trn2實例正式可用，較當前GPU實例性價比提升30-40%；推出配備64個Trainium2芯片的EC2 Trn2 UltraServers服務器，提供高達83.2 Petaflops浮點算力，計算能力是單一實例的四倍。採用3納米工藝的下一代Trainium3芯片預計將在2025年末上線，預計將使集群性能提升4倍，並在性能、能效和密度上樹立新標杆。

在網絡基礎設施領域，推出第二代UltraCluster網絡架構，支持超過20,000個GPU協同工作，帶寬達10Pb/s，延遲低於10ms，這一突破性升級將模型訓練時間縮短至少15%。

在存儲服務領域，Amazon S3新增Metadata元數據功能實現自動獲取和實時更新；推出專爲Iceberg表優化的S3 Tables存儲類型，將查詢性能提升3倍，事務處理能力提升10倍。

在數據庫服務領域，推出Amazon Aurora DSQL全新的無服務器分佈式SQL數據庫，採用active-active架構並具備自動故障恢復功能，支持應用程序在任意端點進行讀寫，能實現近乎無限的可擴展性。Amazon DynamoDB global tables增加了多區域強一致性支持，進一步增強了其分佈式數據庫服務能力。

陳曉建表示，亞馬遜雲科技是全球雲計算的開創者和引領者，更是企業構建和應用生成式AI的首選，今年re:Invent全球大會的這一系列重磅發佈再次印證了這一點。

沙利文大中華區總監李慶表示：”本屆re:Invent大會上的新發佈更加側重於產品的實際應用和工具優化。本次更新有兩個方面讓人印象深刻：一是隨着全球企業對生成式AI的深入應用，數據不僅實現跨區域的傳輸與協同，更實現跨地域、跨區域的深度連接；二是亞馬遜雲科技進一步優化生成式AI的應用，從數據存儲、治理到管理的全流程提升，旨在簡化AI對數據的使用，同時強化模型功能、增加AI agent管理和應對模型幻覺的功能。此外，新發佈的Amazon Nova大模型家族備受期待，這一系列的模型和亞馬遜雲科技的開放選擇理念將爲用戶帶來更多創新機會，進一步推動AI的發展。”（果青）

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

亚马逊云科技陈晓建：2025年很多客户将从生成式AI原型验证转为生产应用

亞馬遜雲科技陳曉建：2025年很多客戶將從生成式AI原型驗證轉爲生產應用

風險及免責聲明

聲明