CAD巨頭Autodesk也在落地生成式AI了。
截至發稿,Autodesk(US:ADSK)股票2024年年內漲超20%,報293.32美元/股,總市值630.64億美元。
"我們正在開發與任何模型都不同的生成式AI基礎模型。"Autodesk 執行副總裁兼首席技術官 Raji Arasu 近日在出席一場公開活動時表示。Raji Arasu所說的基礎模型,即2024年5月被曝出的名爲「 Bernini 」的生成式AI項目,該項目可將文本、手繪草圖等轉換成3D文件。
就當前的大模型市場來說,圖生3D功能的實現似乎已經不是什麼新鮮事。谷歌DeepMind剛剛發佈的Genie 2、國內的騰訊混元以及生數科技的VoxCraft等等,都可以實現類似的功能。但是作爲一家全球CAD巨頭,Bernini之於Autodesk的實際業務具有很大的現實意義。
揭秘Bernini
Bernini 以 17 世紀意大利著名雕塑家和建築師 Gian Lorenzo Bernini 命名。在訓練數據的選擇上,該模型由 Autodesk AI 實驗室與香港中文大學合作,基於 1000 萬種公開可用3D形狀進行訓練。
之所以說Bernini與其他基礎大模型不同,是因爲Bernini在生成3D圖像上有三大特性:
1. 生成3D圖像結構爲功能性 3D 結構。例如生成的水壺是中空的,真正具備裝水的功能,而不僅僅是生成外觀相似的模型;
2. 分離形狀和紋理。能夠分別生成形狀和紋理,讓使用者可以自由地調整變量,將它們融合在一起或進行其他設計,避免了將 3D 物體的紋理和輪廓混淆的問題;
3. 提供多種變體。特別針對專業幾何工作流進行了優化,能夠從單一輸入生成多個功能性的 3D 形狀變體,爲設計師提供選擇並加速其創意工作流程。
Autodesk使用界面截圖
這其中,基礎模型要實現上述特性需要克服設計、製造過程的天然障礙,即AI需要完全貼合設計工作輸入輸出的複雜邏輯。「接受多模態輸入,如文本、草圖、體素、點雲,這些複製了創作者的設計過程。」Raji Arasu介紹。
此外,由於生成3D CAD 這樣的幾何圖形需要基於物理定律的空間和結構來進行推理,對精度和準確性也提出了較高要求。
所以從時間上看,Bernini的推出似乎算不上迅速。自2024年5月被曝出Bernini進展到現在,已經過去大半年。彼時,Bernini只是放出了一部分概念視頻。而在10月份Autodesk在聖地亞哥舉行的用戶大會上,CEO Andrew Anagnost 才放出Bernini預覽版。
但Andrew Anagnost 表示,Bernini用公開數據進行訓練,目前還不能用於商業用途,已向AI社區開放。但是他也披露了Bernini可能的商業計劃:「訓練Bernini的方法是不依賴於數據的,所以客戶在需要的情況下,可以使用自己的數據來優化Bernini,不斷改進這個模型。」
Bernini是如何「煉」成的
Bernini的訓練過程也同樣使用了英偉達GPU,但在GPU之外,Raji Arasu認爲訓練模型更爲重要的是對「數據」的處理和使用。演講中,Raji Arasu進一步披露了這一過程。她將構建過程分爲數據處理、數據準備、兼顧成本與效率的模型訓練和模型推理的複雜性管理。
「需要處理數十億個不同大小、形狀和工作負載的對象和 PB 級數據。」Raji Arasu表示。
Autodesk需要基於其海量的大型設計文件,來構建雲端的數據底座,爲此選擇了Amazon DynamoDB 作爲主要數據庫並創建了一個規範數據模型,從而能夠跨數百個分區進行寫入,並具備高吞吐量和近乎於零的延遲。
在解決數據性能的基礎上,Autodesk又通過結合Amazon EMR、Amazon EKS、Amazon Glue 和Amazon SageMaker等雲服務輕鬆完成基礎模型訓練的數據準備流程,將大量複雜的歷史數據進行了特徵化、標記化和分詞等操作。
在模型訓練階段,Autodesk也面臨GPU選型等諸多問題,它最終使用了Amazon SageMaker 來統一解決實例測試、基礎設施管理等,團隊的更多精力放在了數據準備、模型開發以及面向客戶的AI功能開發等方面。
在大規模模型推理管理時,需要妥善處理延遲、成本和性能表現。「Amazon SageMaker的自動縮放和多模型端點,無縫支持實時和批量推理,實現了高吞吐量、最小延遲和最大成本效率。」Raji Arasu表示。
可以看到,Autodesk構建Bernini的過程大量使用了Amazon SageMaker,這是亞馬遜雲科技最廣爲人知的人工智能和機器學習服務,包括Autodesk在內的很多知名企業正在利用其中的Amazon SageMaker HyperPod進行模型訓練。Amazon SageMaker HyperPod在近期正式推出了幾項重磅更新,如靈活訓練計劃可以創建更自動化的訓練作業,通過高效利用各種更高性價比的計算資源來優化成本;以及任務治理功能,可以爲不同的訓練任務進行優先級排序,從而在模型訓練、微調和推理過程中最大化資源利用率。
基於這些創新,Autodesk最終將基礎模型部署時間縮短了一半。在保持運營成本穩定的同時,將AI生產力提高了30%。Raji Arasu也透露,Autodesk 已經開始向客戶推出基於這些基礎模型構建的AI功能。
「作爲客戶的設計夥伴,幫助他們平衡參數,如材料強度、成本,以便他們能夠確定最佳設計。所有這些都是爲了最大限度地減少繁瑣任務,最大限度地提高創造力。」Raji Arasu說。
數據正確,訓練大模型的前提
ChatGPT之後,英偉達GPU成爲各大AI公司追逐的熱門標的,某大型公司一年訂購多少張英偉達GPU甚至能夠成爲媒體的頭版頭條。不過,總結Bernini的誕生過程,GPU固然重要,但數據決定了大模型訓練的質量。
而訓練一個能夠真正在業務中起作用的大模型,是一個涉及多方面的全棧系統問題。
“大模型只是生成式AI應用創新的一部分。生成式AI應用創新要做好的話,還需要其他能力的增強。首先需要確保生成式AI能用企業自己的數據來增強生成式AI應用的大模型能力。”亞馬遜全球副總裁、亞馬遜雲科技大中華區總裁儲瑞松也在一次演講中表達了類似的觀點。
就拿大模型現在備受關注的幻覺問題來說,也可以從「元數據」的角度來着手解決,即在訓練大模型之前確保知識庫中的數據質量。「數據庫中的元數據即被審查和批准的高質量數據,有助於減少延遲,提升大模型的響應。」亞馬遜雲科技技術副總裁 Mai-Lan Tomsen Bukovec表示,他提醒有正在進行大模型訓練的企業,要注意分清哪些由人創建、哪些數據由人工智能生成。
正是由於數據的重要,大模型加速了企業數據資產的變現方式。2個月前,一家來自中國的3D空間設計平台酷家樂母公司群核科技也公佈了新的商業計劃,其面向具身智能等推出數據訓練平台,開放全球最大室內場景認知深度學習數據集。這家公司披露,平台已經擁有超過3.2億的3D模型,平均每月活躍訪問者達7780萬。該公司將面向AIGC、具身智能、AR/VR 等企業開放物理正確的3D空間數據資產、空間認知解決方案以及空間智能訓練相關服務。
數據顯示,約有77%的公司將在3年內增加或大力增加對人工智能和新興技術的投資,人工智能將最先發生效率的3個方面分別是:Automation、Analysis、Augmentation(自動化、數據分析、輔助增強)。
「AI正在重塑所有行業」已經不再是一句口號。「越來越多的行業在生成式AI領域變得越來越積極。」 亞馬遜雲科技全球服務副總裁Uwem Ukpon表示,在生成式AI的行業應用領域,已從最開始的金融行業逐漸擴展各行各業,包括公共部門、傳統行業、政府機構,以及生命科學和醫療等行業。與此同時,生成式AI也給各個企業提供了新的商業機會,Autodesk所押注的正是基於大規模數據的生成式CAD這個潛力巨大的未來市場。