share_log

国金证券:AI大模型催生高要求和新需求 利好海天瑞声(688787.SH)等专业数据解决方案提供商

國金證券:AI大模型催生高要求和新需求 利好海天瑞聲(688787.SH)等專業數據解決方案提供商

智通財經 ·  2023/03/13 10:25

智通財經APP獲悉,國金證券發佈研究報告稱,AI已在金融、醫療、交通、安防等多個垂直場景深度落地,且應用場景拓展勢能強勁,伴生數據海量增長。據信通院,自OpenAI於2020年推出GPT-3以來,超大預訓練模型參數數量、訓練數據規模按照300倍/年的趨勢增長,客觀推動高質量數據需求指數級擴張。AI大模型催生高要求和新需求,專業化數據集及AI訓練師需求利好海天瑞聲(688787.SH)等優質專業數據解決方案提供商。

▍國金證券主要觀點如下:

AI基礎數據服務商脫胎於專業數據採標分工需求。

國內AI基礎數據服務產業主要包括上游-數據產生及產能資源、中游-訓練數據生產、下游-AI算法研發三大產業環節。數據工程是AI工程基礎環節,目前正處於市場格局漸趨清晰,新老技術迭代、下游需求加速釋放的關鍵節點。

AI快速落地疊加數據量指數級躍升,2025年國內百億規模可期。

場景側,AI已在金融、醫療、交通、安防等多個垂直場景深度落地,且應用場景拓展勢能強勁,伴生數據海量增長;

產品側,據信通院,自OpenAI於2020年推出GPT-3以來,超大預訓練模型參數數量、訓練數據規模按照300倍/年的趨勢增長,客觀推動高質量數據需求指數級擴張。

據艾瑞諮詢,2025年我國AI基礎數據服務市場或達101億元,相較2022年翻倍。

AI大模型催生高要求和新需求,專業化數據集及AI訓練師需求利好海天瑞聲等優質專業數據解決方案提供商。

AI大模型時代無監督/半監督訓練重回主流,“基礎模型+微調”成爲AI開發新範式,RLHF微調技術催生兩大新興需求。

一是預訓練階段催生AI廠商對標註完善、清洗完備的各類專業化場景數據集的需求;二是交互獎勵階段催生AI廠商對於具備專業事實判斷與規範價值判斷的人工智能訓練師的需求。

目前兩類新興需求尚未得到充分有效的市場供給。伴隨超大規模預訓練模型推動訓練數據指數級躍升,市場藍海亟待填補。

自動駕駛訓練數據需求方興未艾,海天瑞聲發力佈局。

自動駕駛約佔我國AI基礎數據服務市場規模的35%,系第一大下游場景,2025年市場規模或達25億元。自動駕駛領域的業務類型可分爲車載攝像頭採集的2D圖像數據標註與激光雷達採集的3D點雲數據標註。目前業內客戶對於全棧式閉環數據解決方案需求較高。

國內市場集中度趨勢性收斂,海天瑞聲具備領先優勢。

伴隨需求側AI垂直場景及專業化需求凸顯,數據需求量提升但數據採標業務門檻提高;供給端國內數據安全標準及相關資質要求提升,相關解決能力向頭部廠商聚集。

以海天瑞聲、Appen爲代表的品牌數據服務商未來將替代中小型供應商成爲市場主要供應力量。據IDC,2021年海天瑞聲在國內AI基礎數據服務行業市佔率高達12.9%,位居第一。Appen在覆蓋區域、語種/方言覆蓋能力等方面更具優勢。

海外對標:Appen,全球AI基礎數據服務龍頭。

公司近五年營收CAGR達27.2%,主營業務包括數據採集、數據預處理與模型評價三大類,業務類型齊全。主要客戶包括Google、Amazon、Microsoft等知名IT巨頭,客戶質量較高。全球範圍看,Appen位居全球AI基礎數據服務行業收入體量首位,員工量能及標註技術均領先同業。

他山之石可以攻玉,對於國內廠商而言,積極卡位全球AI頭部客戶將有助獲得大模型預訓練的業務紅利;持續拓寬業務矩陣,開闢模型評價模塊主動挖掘客戶數據需求將有助於縱向做深客戶價值;夯實數據採標技術,緊跟行業趨勢發展包括機器標註在內的先進數據採標技術將有助於築牢自身業務護城河。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論