share_log

AI闯进设计圈 腾讯混元大模型最新技术进展披露

AI闖進設計圈 騰訊混元大模型最新技術進展披露

TechWeb ·  05/11 17:15

5月11日消息,數字時代,人工智能技術的快速發展正在爲各行各業帶來翻天覆地的變革。在設計領域,AI的應用日益廣泛,不僅賦予了專業人士更多創造力,更爲普通人提供了表達創意的機會。

5月10日,騰訊混元產品負責人陳妍披露了混元大模型在設計領域的一些應用,以及在騰訊業務場景下的最新技術進展。

據陳妍介紹,在AI設計領域,除了文生文這一最基礎的能力,騰訊還在進行文生圖、文生視頻、文生3D的多模態探索。

文生圖方面,騰訊混元大模型和國外不一樣的地方在於本土化,特別是在很多應用場景上面,用SDI、MDI等。歐美對中國很深度的歷史文化的元素理解上是欠缺的,不管是廣告還是遊戲,讓他們做一個古代元素是沒有辦法很好表現的,相較之下,混元大模型有比較突出的能力。

去年10月,騰訊混元大模型全新升級,正式對外開放 “文生圖” 功能。官方公告稱,升級後的騰訊混元中文效果整體超過 GPT-3.5,代碼能力大幅提升 20%,達到業界領先水平。

陳妍指出,目前文生圖已經深度應用在B端和C端,比如創意廣告、人像風格化等。陳妍透露,下週騰訊將在北京舉辦發佈會,宣佈文生圖能力開源。

文生視頻方面,2月Sora的發佈,給了業內很大震撼。陳妍表示,根據算法路徑重新看我們文生視頻的能力,時空擴散和解碼不一樣,可以把視頻拉的很長,之前能夠做到4秒,這個月我們可以做多16秒,整個過程非常不容易。

除了文生視頻,騰訊混元大模型現在還可以做圖生視頻、視頻生視頻,具體落地上,可以把實拍圖片變成卡通、臉土風或者其他風格,可以局部做替換,還有骨骼驅動視頻等。

文生3D方面,現在還沒有很廣泛的應用,但騰訊已經提前做了一些研究。陳妍認爲,文生3D跟生視頻、生圖比較不一樣的點是它生成出來的模型可以再編輯,就是導到3D的編輯工具裏面重新做調整。“現在我們也想嘗試3D人物的應用,手伴這些東西還是蠻火的。”

最新數據顯示,騰訊混元大模型目前已擴展至萬億級參數規模,自上線起即突出其實用性標籤,騰訊內部已經有超過400個業務和場景接入混元大模型進行測試,部分已經發布。

陳妍向TechWeb等表示,“目前,大模型國內能力評測中,混元在第一梯隊。中文領域能夠趕上GPT的水平了,希望對中國的大模型技術越來越有信心。”

據悉,爲了激發公衆對科技和設計的興趣,藉助AI工具探索人工智能與人類創造力結合的新可能性,騰訊研究院聯合清華大學建築學院、中央廣播電視總檯央廣網聯合發起了騰訊未來城市AI創意設計大賽。5月10日,大賽徵集活動已經正式啓動。

此次大賽徵集活動以騰訊深圳前海總部園區科創街區爲主題,大賽面向對建築設計、城市規劃、藝術創作、科幻、人工智能感興趣的公衆,徵集具有豐富想象力與創新性的城市建成環境場景設計、裝置與小品設計、平面視覺設計。

“這應該算是一個實驗。”騰訊集團副總裁、騰訊研究院總顧問楊健說到,我們選擇在一個特定場景裏面,把人工智能的一些新的技術,新的工具拿來,把城市規劃、城市設計的專業人士以及對人工智能有興趣的愛好者召集起來,讓大家去了解怎麼用這些技術提高規劃設計的效率,也希望在這個過程中,能夠進一步把騰訊混元大模型具備的能力和理念更好的落地。

作爲新一輪科技革命和產業變革的重要驅動力量,人工智能技術發展正在按下“快進鍵”,給人們帶來了無限想象的空間。國際建築師協會副主席、清華大學建築學院院長、教授張利表示,AI帶給所有的學科和行業的挑戰是衆所周知的,在我國高質量城市更新的今天,數據與計算技術以及潛在的規劃新範式湧現,建築行業正站在新的歷史起點上。雖然我們還遠不能肯定AI帶來怎樣的具體改變,但我們擁抱AI帶來的全新可能性,更期待這次競賽,通過AI能夠連接不同的人群,共同爲高質量的城市更新貢獻智慧。(周小白)

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論