share_log

揭秘中国联通鸿湖图文大模型:同赛道暂无竞品 可实现跨模态内容理解

揭秘中國聯通鴻湖圖文大模型:同賽道暫無競品 可實現跨模態內容理解

證券時報 ·  2023/07/19 19:30

近期,三大運營商陸續發佈了大模型產品,正式進軍大模型賽道。不過,三家運營商產品定位有所差異,中國聯通的鴻湖圖文AI大模型 1.0可實現以文生圖、視頻剪輯、以圖生圖等功能;中國電信大語言模型TeleChat推出了大模型賦能數據中臺、智能客服和智慧政務三個方向的產品;中國移動的九天人工智能大模型聚焦於政務及客服行業應用。

針對運營商佈局大模型業務的機遇及挑戰,證券時報·e公司記者採訪了中國聯通研究院智能技術研究部吳浩然。

在吳浩然看來,大模型是人工智能新一輪爆發的轉折點,也是AGI(通用人工智能)時代的原點,它的泛化能力將AI從過去一場景一適配的方式解放,類似工業革命從小作坊生產發展爲工廠批量化生產,也意味着AI由能用到好用或者泛用的轉變。與此同時,隨着大模型語言能力的發展以及目前的混合專家系統模式,以自然語言交互大模型做“管家”的模式很可能會成爲下一個時代的主流,也就是業界常說的大模型成爲流量入口。

基於以上認知,吳浩然向記者表示,從商業價值角度講,中國聯通佈局大模型領域是必要的。“運營商在移動互聯網時代未能利用好流量成爲了管道運營商,在智能互聯時代將積極嘗試轉變,成爲新時代的綜合數字服務運營商。”

吳浩然還提到,隨着大模型技術進一步發展,它極有可能成爲新時代的操作系統,爲防止重蹈過去很多工業軟件被“卡脖子”的覆轍,中國聯通或者運營商作爲央企中在AI方向較強的企業,佈局大模型也是符合國家政府期許的,是積極承擔央企責任的體現。

“中國聯通發佈的模型不同於政務、客服等純語言模型,最開始我們做的就是圖文雙模態的模型。”談及鴻湖圖文大模型 1.0,吳浩然表示,中國聯通在圖文領域主打的是國風水墨畫生成和對古詩詞理解,而這個賽道還沒看到類似競品。

據悉,中國聯通佈局大模型相對較早,在2021年即開始了相關技術研究,目前的鴻湖大模型是在2022年啓動研發的,當時ChatGPT尚未出現,Midjourney、Stable Diffusion等文生圖模型也還在醞釀。“我們最開始是從公衆線的增值業務場景出發,因爲5G新通信不再像傳統通信只有文字,所以最開始我們瞄準的就是圖文領域。”

吳浩然介紹說,在上述背景下,中國聯通大模型最重要的工作或者優勢是特徵融合,將不同模態內容對齊到文本,來實現跨模態的內容理解。“由於當時ChatGPT尚未出現,我們採用的是當時更常用的Encoder-Decoder模式,使用這種模式使我們的特徵提取和特徵融合可以解耦,意味着我們只需要把注意力放在特徵融合對齊上,而提取部分只需要選擇合適的提取器即可,因此我們的模型擴展性極強。”

吳浩然表示,鴻湖圖文大模型 1.0目前是針對圖文,也可以將提取部分改爲圖聲或其他模態提取器,同樣進行特徵融合和跨模態對比學習後,可以很容易擴展至其他跨模態,最終實現不同模態在文本語義上統一的目標。“模型的松耦合和擴展性強也構成了我們競爭力的一環,只要做好模態融合部分,特徵提取就可以時刻選取市面最好的模型來替換,保持我們模型的活力。”

當前,AI持續火熱,市場上也出現了“百模大戰”,運營商系的大模型產品也面臨不少挑戰。

吳浩然認爲,對於中國聯通而言,目前最大的挑戰來自於人員。“前期聯通在人工智能方向投入的相對較少,人才積累方面存在着不足。本次鴻湖大模型也是同高校聯合研發實現的,具備大模型訓練及工程化經驗的人員還較少,但也在緊急招募中。相信在中國聯通決心進軍大模型產業的背景下,我們能很快補足這點。”

其次就是相關賽道的產品化經驗不足,當然這並不僅是聯通自身面臨的挑戰,也是整個大模型產業需要面臨的挑戰。吳浩然表示,目前有成熟商業模式的只有GPT融合進搜索引擎,Midjourney進行原畫創作等C端或2B2C緊密結合的模式,其他的行業落地尤其是純B端的行業落地仍處於探索階段。

“大模型仍處於Gartner技術成熟度曲線頂峯的左側,今年的大模型熱過去後,未來兩到三年會有一個沉降期,然後5-10年逐步回升,能夠在多少個行業找到商業模式,將決定其回升的速度和高度。”

談及大模型產業的未來趨勢,吳浩然認爲,首先,模態融合一定是最大的趨勢,單模態的仍稱不上AGI,融合所有模態再進一步發展後才能迎來AGI;其次,混合專家系統類思路是目前大模型落地比較優質的路徑,過去十幾年人工智能尤其是深度學習技術的發展積累了很多優質的模型,將大模型與這些模型結合,乃至將大模型與各類數字化系統結合,與機器部件結合,將是未來大模型由純數字經濟向數字經濟賦能實體經濟轉變的重要途徑。

此外,大模型稀疏化也是未來大模型落地的重要路徑之一,當前大模型參數量仍呈快速增長態勢,稠密大模型的計算推理勢必將佔用極大的算力資源,阻礙大模型的快速落地和泛在服務,而大模型稀疏化將極大降低大模型的部署成本,提高推理速度,使大模型真正“飛入尋常百姓家”。

根據吳浩然的判斷,短期內,大模型仍會以C端場景爲主落地,B端由於存在大量判別式場景,仍需模型能力進一步增強,但長期看能否解決判別式場景的高精度同時保持高度泛化能力,是未來大模型能否在B端廣泛應用的決定性因素。“可以說,C端決定未來大模型下限,B端則決定了其上限。”

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論