【TechWeb】12月27日消息,亞馬遜雲科技2024 re:Invent全球大會於12月初在美國舉辦,期間推出一系列技術發佈,聚集生成式AI、數據戰略和雲服務三大領域,覆蓋基礎設施、模型和應用的全棧聯動創新,可謂爲企業應用生成式AI鋪平了道路。
近日,在亞馬遜雲科技2024 re:Invent中國行活動上,亞馬遜雲科技大中華區產品部總經理陳曉建就表示:「在非常受關注的生成式AI應用領域,2024年許多客戶從思考階段進入實踐階段,進行了大量場景試驗。2025年肯定會發生一個變化,很多客戶將從原型驗證階段轉化爲生產階段。」
幫助客戶將生成式AI技術從小範圍試驗探索到落地至真正投入生產應用,亞馬遜雲科技到底是如何進行全棧聯動來達成這一能力的呢?我們從其最新的技術發佈中可以窺見一斑。
整體來看,2024 re:Invent全球大會上,亞馬遜雲科技在生成式AI領域,推出Amazon Nova系列基礎模型並強化Amazon SageMaker、Amazon Bedrock和Amazon Q等核心服務,通過更低的訓練和推理成本、更多的模型選擇、更深入場景的應用全面加速企業應用生成式AI創新;在數據戰略方面,發佈新一代Amazon SageMaker爲數據、分析和AI提供統一平台;Amazon S3新增Tables存儲類型和元數據功能,以及無服務器分佈式SQL數據庫Amazon Aurora DSQL將進一步提升用戶的數據管理能力;在雲服務方面,推出搭載Trainium2芯片的新型計算實例和爲萬億參數模型提供實時推理性能的超級服務器。
陳曉建強調:「這些新發佈展現出亞馬遜雲科技不僅在雲的核心服務層面持續創新,更在從芯片到模型,再到應用的每一個技術堆棧取得突破,讓不同層級的創新相互賦能、協同進化。只有這樣全棧聯動的大規模創新才能真正滿足當今客戶的發展需求,助力各行各業重塑未來。」
生成式AI從原型驗證到生產應用,有效改善大模型幻覺是基礎
將生成式AI應用於企業實際的業務時,很多企業的第一個顧慮就是「幻覺」問題——大模型一本正經的胡說八道。想象一下,如果企業想將生成式AI用來做一個非常重要的業務應用場景,比如法律諮詢、金融交易或者健康諮詢等,這裏如果出現幻覺的話,結果是無法接受的。
「亞馬遜雲科技團隊一直在思考如何解決幻覺的問題,也探索了多種不同的技術方案。最後我們發現自動推理技術(Automatic Reasoning)能夠很有效的解決幻覺問題。」陳曉建稱。
陳曉建介紹,自動推理技術(Automatic Reasoning)是一項特殊的 AI 技術,它能夠從數學層面證明這個推理的結果是不是正確的。它通常用於驗證這個系統是不是按照設計的規範來正常的運行。自動推理在很多領域下都已經有了實踐的應用,比如金融交易、健康諮詢、法律諮詢等領域。亞馬遜雲科技擁有自動推理方面的多位世界級專家。例如,可以通過自動推理來證明在Amazon IAM(Identity and Access Management)之中設計的權限和策略是不是按照企業所預想的方式來進行,這種方式的證明叫做「可證明的安全性」。這些技術同樣能夠幫助提升模型的準確性、降低模型的幻覺。
本次2024 re:Invent上,亞馬遜雲科技推出了Amazon Bedrock 自動化推理檢查的功能,它能夠有效的預防由於模型幻覺帶來的事實性錯誤。
生成式AI三層架構同頻更新:更強訓練推理、更多模型、更優應用
在解決大模型幻覺問題後,陳曉建表示,2025年,很多客戶將從生成式AI原型驗證階段轉化爲生產階段,屆時客戶需求將更加複雜,不僅是選擇模型,還需要各種技術支持。因此,在生成式AI領域,亞馬遜雲科技全面強化基礎設施、模型和應用三層技術棧能力。
更強訓練推理方面,此次2024 re:Invent上,亞馬遜雲科技推出新⼀代Amazon SageMaker,爲客戶提供一個單一的數據和AI開發環境,用戶可以在其中查找和訪問其組織中的所有數據,爲各種常見的數據用例選擇最佳工具,並將數據和AI項目擴展至團隊內不同分工角色以實現協作。此外,Amazon SageMaker AI的四項創新包括Amazon SageMaker HyperPod的新訓練配方功能、靈活訓練計劃和任務治理功能,以及在Amazon SageMaker中使用亞馬遜雲科技合作伙伴的熱門AI應用。這些功能將幫助客戶更快開始訓練流行模型,通過靈活訓練計劃節省數週時間,並將成本降低高達40%。
陳曉建表示,新的Amazon SageMaker涵蓋了分析、數據處理、搜索、數據準備、AI模型開發和訓練、⽣成式AI等所有必需功能。
更多模型方面,亞馬遜雲科技一方面新推出了自研的Amazon Nova六款基礎模型,包括Nova Micro、Nova Lite、Nova Pro和Nova Premier基礎模型,以及用於生成高質量圖像的Nova Canvas和生成高質量視頻的Nova Reel,這些模型成本更低速度更快。另一方面,Amazon Bedrock通過推出的Amazon Bedrock Marketplace新功能新接入Luma AI和poolside等100多款熱門、新興及專業模型。這些給企業客戶提供了豐富的模型選擇。
同時,Amazon Bedrock推出了低延遲優化推理、模型蒸餾、提示詞緩存等功能,大幅提升推理效率;支持GraphRAG等知識庫功能增強數據利用能力;通過自動推理檢查功能和多智能體協作等創新,進一步增強AI安全性並推動智能體發展。
陳曉建總結道:「更新能力後的Amazon Bedrock 提供的功能不只是提供多種多樣的功能和模型,還能幫客戶在不同的場景下選擇最適合的場景功能,它同時提供了大模型真正用於生產的時候所需要的各種各樣的工具。」
更優應用方面,Amazon Q更加深入軟件開發和商業應用場景。Amazon Q Developer增加三款新的智能體,能自動執行單元測試、文檔編制和代碼審查流程,並通過與GitLab深度集成,擴展應用場景;推出轉型功能以加速Windows.NET、VMware和大型機工作負載的遷移和現代化,縮短轉型時間並降低成本。強化了Amazon Q Business和Amazon Q in QuickSight洞察能力,並簡化了複雜工作流程的自動化實現方式。
至此,對生成式AI應用於生產時所需的各類模型、技術、工具等都已具備。
夯實底層,升級計算、網絡、存儲和數據庫等雲服務
事實上,生成式AI應用是天然的「雲原生」應用。如何讓企業客戶在使用生成式AI應用時更快、更省、更穩,還有很多雲基礎服務方面的工作可以優化和提升。
2024 re:Invent上,亞馬遜雲科技在計算、網絡、存儲和數據庫等雲計算服務核心領域也進行了創新,爲包括生成式AI應用在內的各類工作負載提供更強大的底層支持。
在自研芯片領域,基於Amazon Trainium2的EC2 Trn2實例正式可用,較當前GPU實例性價比提升30-40%;推出配備64個Trainium2芯片的EC2 Trn2 UltraServers服務器,提供高達83.2 Petaflops浮點算力,計算能力是單一實例的四倍。採用3納米工藝的下一代Trainium3芯片預計將在2025年末上線,預計將使集群性能提升4倍,並在性能、能效和密度上樹立新標杆。
在網絡基礎設施領域,推出第二代UltraCluster網絡架構,支持超過20,000個GPU協同工作,帶寬達10Pb/s,延遲低於10ms,這一突破性升級將模型訓練時間縮短至少15%。
在存儲服務領域,Amazon S3新增Metadata元數據功能實現自動獲取和實時更新;推出專爲Iceberg表優化的S3 Tables存儲類型,將查詢性能提升3倍,事務處理能力提升10倍。
在數據庫服務領域,推出Amazon Aurora DSQL全新的無服務器分佈式SQL數據庫,採用active-active架構並具備自動故障恢復功能,支持應用程序在任意端點進行讀寫,能實現近乎無限的可擴展性。Amazon DynamoDB global tables增加了多區域強一致性支持,進一步增強了其分佈式數據庫服務能力。
陳曉建表示,亞馬遜雲科技是全球雲計算的開創者和引領者,更是企業構建和應用生成式AI的首選,今年re:Invent全球大會的這一系列重磅發佈再次印證了這一點。
沙利文大中華區總監李慶表示:”本屆re:Invent大會上的新發佈更加側重於產品的實際應用和工具優化。本次更新有兩個方面讓人印象深刻:一是隨着全球企業對生成式AI的深入應用,數據不僅實現跨區域的傳輸與協同,更實現跨地域、跨區域的深度連接;二是亞馬遜雲科技進一步優化生成式AI的應用,從數據存儲、治理到管理的全流程提升,旨在簡化AI對數據的使用,同時強化模型功能、增加AI agent管理和應對模型幻覺的功能。此外,新發佈的Amazon Nova大模型家族備受期待,這一系列的模型和亞馬遜雲科技的開放選擇理念將爲用戶帶來更多創新機會,進一步推動AI的發展。”(果青)