昇騰AI平台訓練推理！中國聯通元景文生圖大模型開源：真正懂中文

快科技 · 2024/12/26 18:30

中国联通宣布，联通数据智能公司打造、首个完全在国产昇腾AI软硬件平台上实现训练和推理的中文原生文生图模型“联通元景文生图模型”，正式开源。

该模型实现了多项自主创新突破：

首先是在架构上，通过在SDXL架构中融合复合语言编码模块，实现了对中文长文本、多属性对应和中文特色词汇的精确语义理解，对应图像的生成效果得到了极大提升。

其次是在昇腾AI大规模算力集群上，实现了中文原生文生图模型的训练和推理，并将模型和代码对业界开源，以推动文生图领域的国产化进程。

据悉，原始SDXL的语言编码器仅使用英文CLIP模型，智能支持英文文本输入，输入长度也不能超过77个token。

对此，联通元景文生图模型一方面将英文CLIP模型替换成中文CLIP，并引入复合语言编码架构，使用基于encoder-decoder架构的语言模型，突破文本长度限制。

通过引入复合语言编码模块，元景文生图模型实现了原生中文语义理解，避免了利用翻译插件等作为中介调用英文文生图模型造成的中文信息损失。

同时，通过引入海量中文图文对数据进行预训练，模型对中文专属名词，如鼠标-老鼠、仙鹤-吊车等英文模型易混淆的对象，以及中文菜谱等英文模型无法理解的名词，都能够准确理解并生成对应的高质量图片。

（在英文中均翻译成crane，易混淆）

（中文特色词汇）

中国联通在国产昇腾AI基础软硬件平台上实现了元景文生图模型从微调训练到推理的一体化适配。

在微调训练方面，用户可使用自定义数据集，实现从其它平台至昇腾的平滑切换；

在模型推理方面，接口与Diffusers对齐，简单易用，支持单卡和多卡，单卡推理支持UNet Cache加速。

该模型已在联通的多个内外部项目中服务于文创、服装、工业设计等诸多领域，支撑了中华器灵、服装大模型等数十个案例。

联通元景文生图模型赋能服装设计

联通元景文生图模型赋能文物活化

目前，元景文生图模型已在GitHub、Hugging Face、魔搭、始智等社区全面开源，地址如下：

GitHub：

HuggingFace：

魔搭：

始智：

联通元景文生图模型在全球数字经济大会上获奖

中國聯通宣佈，聯通數據智能公司打造、首個完全在國產昇騰AI軟硬件平台上實現訓練和推理的中文原生文生圖模型「聯通元景文生圖模型」，正式開源。

該模型實現了多項自主創新突破：

首先是在架構上，通過在SDXL架構中融合複合語言編碼模塊，實現了對中文長文本、多屬性對應和中文特色詞彙的精確語義理解，對應圖像的生成效果得到了極大提升。

其次是在昇騰AI大規模算力集群上，實現了中文原生文生圖模型的訓練和推理，並將模型和代碼對業界開源，以推動文生圖領域的國產化進程。

據悉，原始SDXL的語言編碼器僅使用英文CLIP模型，智能支持英文文本輸入，輸入長度也不能超過77個token。

對此，聯通元景文生圖模型一方面將英文CLIP模型替換成中文CLIP，並引入複合語言編碼架構，使用基於encoder-decoder架構的語言模型，突破文本長度限制。

通過引入複合語言編碼模塊，元景文生圖模型實現了原生中文語義理解，避免了利用翻譯插件等作爲中介調用英文文生圖模型造成的中文信息損失。

同時，通過引入海量中文圖文對數據進行預訓練，模型對中文專屬名詞，如鼠標-老鼠、仙鶴-吊車等英文模型易混淆的對象，以及中文菜譜等英文模型無法理解的名詞，都能夠準確理解並生成對應的高質量圖片。

（在英文中均翻譯成crane，易混淆）

（中文特色詞彙）

中國聯通在國產昇騰AI基礎軟硬件平台上實現了元景文生圖模型從微調訓練到推理的一體化適配。

在微調訓練方面，用戶可使用自定義數據集，實現從其它平台至昇騰的平滑切換；

在模型推理方面，接口與Diffusers對齊，簡單易用，支持單卡和多卡，單卡推理支持UNet Cache加速。

該模型已在聯通的多個內外部項目中服務於文創、服裝、工業設計等諸多領域，支撐了中華器靈、服裝大模型等數十個案例。

聯通元景文生圖模型賦能服裝設計

聯通元景文生圖模型賦能文物活化

目前，元景文生圖模型已在GitHub、Hugging Face、魔搭、始智等社區全面開源，地址如下：

GitHub：

HuggingFace：

魔搭：

始智：

聯通元景文生圖模型在全球數字經濟大會上獲獎

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

昇腾AI平台训练推理！中国联通元景文生图大模型开源：真正懂中文

昇騰AI平台訓練推理！中國聯通元景文生圖大模型開源：真正懂中文

風險及免責聲明

聲明