AI闖進設計圈騰訊混元大模型最新技術進展披露

TechWeb · 05/11 17:15

5月11日消息，数字时代，人工智能技术的快速发展正在为各行各业带来翻天覆地的变革。在设计领域，AI的应用日益广泛，不仅赋予了专业人士更多创造力，更为普通人提供了表达创意的机会。

5月10日，腾讯混元产品负责人陈妍披露了混元大模型在设计领域的一些应用，以及在腾讯业务场景下的最新技术进展。

据陈妍介绍，在AI设计领域，除了文生文这一最基础的能力，腾讯还在进行文生图、文生视频、文生3D的多模态探索。

文生图方面，腾讯混元大模型和国外不一样的地方在于本土化，特别是在很多应用场景上面，用SDI、MDI等。欧美对中国很深度的历史文化的元素理解上是欠缺的，不管是广告还是游戏，让他们做一个古代元素是没有办法很好表现的，相较之下，混元大模型有比较突出的能力。

去年10月，腾讯混元大模型全新升级，正式对外开放 “文生图” 功能。官方公告称，升级后的腾讯混元中文效果整体超过 GPT-3.5，代码能力大幅提升 20%，达到业界领先水平。

陈妍指出，目前文生图已经深度应用在B端和C端，比如创意广告、人像风格化等。陈妍透露，下周腾讯将在北京举办发布会，宣布文生图能力开源。

文生视频方面，2月Sora的发布，给了业内很大震撼。陈妍表示，根据算法路径重新看我们文生视频的能力，时空扩散和解码不一样，可以把视频拉的很长，之前能够做到4秒，这个月我们可以做多16秒，整个过程非常不容易。

除了文生视频，腾讯混元大模型现在还可以做图生视频、视频生视频，具体落地上，可以把实拍图片变成卡通、脸土风或者其他风格，可以局部做替换，还有骨骼驱动视频等。

文生3D方面，现在还没有很广泛的应用，但腾讯已经提前做了一些研究。陈妍认为，文生3D跟生视频、生图比较不一样的点是它生成出来的模型可以再编辑，就是导到3D的编辑工具里面重新做调整。“现在我们也想尝试3D人物的应用，手伴这些东西还是蛮火的。”

最新数据显示，腾讯混元大模型目前已扩展至万亿级参数规模，自上线起即突出其实用性标签，腾讯内部已经有超过400个业务和场景接入混元大模型进行测试，部分已经发布。

陈妍向TechWeb等表示，“目前，大模型国内能力评测中，混元在第一梯队。中文领域能够赶上GPT的水平了，希望对中国的大模型技术越来越有信心。”

据悉，为了激发公众对科技和设计的兴趣，借助AI工具探索人工智能与人类创造力结合的新可能性，腾讯研究院联合清华大学建筑学院、中央广播电视总台央广网联合发起了腾讯未来城市AI创意设计大赛。5月10日，大赛征集活动已经正式启动。

此次大赛征集活动以腾讯深圳前海总部园区科创街区为主题，大赛面向对建筑设计、城市规划、艺术创作、科幻、人工智能感兴趣的公众，征集具有丰富想象力与创新性的城市建成环境场景设计、装置与小品设计、平面视觉设计。

“这应该算是一个实验。”腾讯集团副总裁、腾讯研究院总顾问杨健说到，我们选择在一个特定场景里面，把人工智能的一些新的技术，新的工具拿来，把城市规划、城市设计的专业人士以及对人工智能有兴趣的爱好者召集起来，让大家去了解怎么用这些技术提高规划设计的效率，也希望在这个过程中，能够进一步把腾讯混元大模型具备的能力和理念更好的落地。

作为新一轮科技革命和产业变革的重要驱动力量，人工智能技术发展正在按下“快进键”，给人们带来了无限想象的空间。国际建筑师协会副主席、清华大学建筑学院院长、教授张利表示，AI带给所有的学科和行业的挑战是众所周知的，在我国高质量城市更新的今天，数据与计算技术以及潜在的规划新范式涌现，建筑行业正站在新的历史起点上。虽然我们还远不能肯定AI带来怎样的具体改变，但我们拥抱AI带来的全新可能性，更期待这次竞赛，通过AI能够连接不同的人群，共同为高质量的城市更新贡献智慧。（周小白）

5月11日消息，數字時代，人工智能技術的快速發展正在爲各行各業帶來翻天覆地的變革。在設計領域，AI的應用日益廣泛，不僅賦予了專業人士更多創造力，更爲普通人提供了表達創意的機會。

5月10日，騰訊混元產品負責人陳妍披露了混元大模型在設計領域的一些應用，以及在騰訊業務場景下的最新技術進展。

據陳妍介紹，在AI設計領域，除了文生文這一最基礎的能力，騰訊還在進行文生圖、文生視頻、文生3D的多模態探索。

文生圖方面，騰訊混元大模型和國外不一樣的地方在於本土化，特別是在很多應用場景上面，用SDI、MDI等。歐美對中國很深度的歷史文化的元素理解上是欠缺的，不管是廣告還是遊戲，讓他們做一個古代元素是沒有辦法很好表現的，相較之下，混元大模型有比較突出的能力。

去年10月，騰訊混元大模型全新升級，正式對外開放 “文生圖” 功能。官方公告稱，升級後的騰訊混元中文效果整體超過 GPT-3.5，代碼能力大幅提升 20%，達到業界領先水平。

陳妍指出，目前文生圖已經深度應用在B端和C端，比如創意廣告、人像風格化等。陳妍透露，下週騰訊將在北京舉辦發佈會，宣佈文生圖能力開源。

文生視頻方面，2月Sora的發佈，給了業內很大震撼。陳妍表示，根據算法路徑重新看我們文生視頻的能力，時空擴散和解碼不一樣，可以把視頻拉的很長，之前能夠做到4秒，這個月我們可以做多16秒，整個過程非常不容易。

除了文生視頻，騰訊混元大模型現在還可以做圖生視頻、視頻生視頻，具體落地上，可以把實拍圖片變成卡通、臉土風或者其他風格，可以局部做替換，還有骨骼驅動視頻等。

文生3D方面，現在還沒有很廣泛的應用，但騰訊已經提前做了一些研究。陳妍認爲，文生3D跟生視頻、生圖比較不一樣的點是它生成出來的模型可以再編輯，就是導到3D的編輯工具裏面重新做調整。“現在我們也想嘗試3D人物的應用，手伴這些東西還是蠻火的。”

最新數據顯示，騰訊混元大模型目前已擴展至萬億級參數規模，自上線起即突出其實用性標籤，騰訊內部已經有超過400個業務和場景接入混元大模型進行測試，部分已經發布。

陳妍向TechWeb等表示，“目前，大模型國內能力評測中，混元在第一梯隊。中文領域能夠趕上GPT的水平了，希望對中國的大模型技術越來越有信心。”

據悉，爲了激發公衆對科技和設計的興趣，藉助AI工具探索人工智能與人類創造力結合的新可能性，騰訊研究院聯合清華大學建築學院、中央廣播電視總檯央廣網聯合發起了騰訊未來城市AI創意設計大賽。5月10日，大賽徵集活動已經正式啓動。

此次大賽徵集活動以騰訊深圳前海總部園區科創街區爲主題，大賽面向對建築設計、城市規劃、藝術創作、科幻、人工智能感興趣的公衆，徵集具有豐富想象力與創新性的城市建成環境場景設計、裝置與小品設計、平面視覺設計。

“這應該算是一個實驗。”騰訊集團副總裁、騰訊研究院總顧問楊健說到，我們選擇在一個特定場景裏面，把人工智能的一些新的技術，新的工具拿來，把城市規劃、城市設計的專業人士以及對人工智能有興趣的愛好者召集起來，讓大家去了解怎麼用這些技術提高規劃設計的效率，也希望在這個過程中，能夠進一步把騰訊混元大模型具備的能力和理念更好的落地。

作爲新一輪科技革命和產業變革的重要驅動力量，人工智能技術發展正在按下“快進鍵”，給人們帶來了無限想象的空間。國際建築師協會副主席、清華大學建築學院院長、教授張利表示，AI帶給所有的學科和行業的挑戰是衆所周知的，在我國高質量城市更新的今天，數據與計算技術以及潛在的規劃新範式湧現，建築行業正站在新的歷史起點上。雖然我們還遠不能肯定AI帶來怎樣的具體改變，但我們擁抱AI帶來的全新可能性，更期待這次競賽，通過AI能夠連接不同的人群，共同爲高質量的城市更新貢獻智慧。（周小白）

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

AI闯进设计圈 腾讯混元大模型最新技术进展披露

AI闖進設計圈 騰訊混元大模型最新技術進展披露

風險及免責聲明

聲明

AI闯进设计圈腾讯混元大模型最新技术进展披露

AI闖進設計圈騰訊混元大模型最新技術進展披露