share_log

在视频数据沃土上,大华股份是怎么打造未来数据要素×范本?

在視頻數據沃土上,大華股份是怎麼打造未來數據要素×範本?

智東西 ·  08/14 00:00

智東西(公衆號:zhidxcom)

作者 | 三北

編輯 | 漠影

2024年,狂飆大半年的百模大戰,打到了視頻領域。瘋狂進化的模型、暴力堆砌的算力,展現出變革的巨大能量。但同時,海量難以開發利用的視頻數據,成爲新的「瓶頸」。

「數據時代,大模型是核心工具,場景化應用是價值變現的關鍵。」大華股份研發中心副總裁周文凱告訴智東西,「當下數據要素很火,但視頻類數據生產、流通、交易仍有很多亟待解決的問題,這與視頻數據的隱私性、敏感性、安全性有很大的關係。」

作爲AIoT領域龍頭企業,大華股份在視頻領域有長達十幾年的深耕,周文凱認爲基於場景化的業務理解來提取視頻數據的結構化信息,並與業務應用進行深度的融合才能發揮更大價值。

作爲以視頻爲核心的數據產業代表企業,大華股份是如何打造未來範本的?通過對話周文凱,本文試圖從大華股份在千行百業的場景實戰經驗中,尋找這些問題的答案。一、數據爲王,以視頻爲核心的數據產業尤爲重要

據知名行研機構IDC預測,到2025年,全球數據總量將超過180ZB,其中中國數據總量將躍居全球首位。伴隨這一趨勢,數據交易市場的規模預計將達到2200億元以上,若進一步考慮其驅動的計算、存儲、AI技術及軟件等基礎設施的全面發展,整體市場規模更是有望突破2萬億元大關。

這將展現出什麼樣的廣闊發展前景呢?周文凱向智東西透露,目前產生的所有數據類型中,‌以視圖爲核心的非結構化數據佔據數據總量的90%以上,圍繞着視頻的數據採集、流轉、分析、計算和應用等每個環節都隱藏着巨大的價值。但打開視頻數據產業鏈,我們看到還面臨着很多挑戰:如何在複雜的感知場景和泛雜的物聯協議中,實現數據的精準採集和海量設備的跨網互聯,在視頻數據分析和加工服務中,當前對於視頻等非結構化數據的挖掘程度還很低,視頻類數據需要依賴行業智能算法和應用的進一步挖掘,當前中國人工智能滲透率還不足10%,只有通過將視頻內容結構化後與業務結合才能發揮更大價值,而場景化應用是數據產業價值變現的核心關鍵。

「我國視頻數據要素市場已構建起清晰的三級架構:上游聚焦於數據採集與治理的一級市場,中游專注於數據加工與分析的二級市場,以及下游面向數據應用評估的三級市場。這一專業化分工體系不僅促進了視頻數據產業鏈的精細化發展,還顯著加速了視頻數據向產業化邁進的步伐。」周文凱說

總的來看,海量數據資源和三級視頻數據要素市場,都是數據產業的肥沃土壤。二、發揮視頻要素「乘數效應」,要邁過四道坎

今年1月4日,國家數據局等17部門近日聯合印發《「數據要素×」三年行動計劃(2024—2026年)》(簡稱:行動計劃),提出選取工業製造、現代農業、商貿流通、交通運輸、金融服務等12個行業和領域,推動發揮數據要素乘數效應,釋放數據要素價值。

周文凱告訴智東西,行動方案提及的12個行業所涉及的數據,90%以上是視圖爲核心的非結構化數據。而發揮這些視頻要素「乘數效應」,至少要邁過四道坎。

具體來說,這些視頻數據包括用戶生成數據、專業製作數據、公共資源產生數據、社交媒體分享數據等多種類型。相比於結構化的文本數據來說,這些視頻數據在存儲、處理、理解和計算四大方面都更加複雜。

1、存儲量大。視圖數據有別於結構化的文本數據,大量的視圖數據要做大量的存儲。這就對有效的存儲空間利用提出更高要求,包括需要較強的編解碼技術,以及有效的存儲能力。

2、數據處理複雜。視頻數據種類豐富,編碼方式繁多,需要支持不同的分辨率、幀率、編碼方式、格式的數據的處理,這就要求數據處理方積累這些不同數據的處理能力。

3、視頻理解難度大。視頻數據內容複雜多樣,要去理解場景化的內容,最好是將小模型和大模型結合起來,去做數據的解析,從而挖掘出視頻數據中有價值的信息。這裏補充說下,除了訓練模型所需的原始數據,視頻數據真正產生的交易價值,還是在於視頻結構化後挖掘產生的數據價值,因此視頻理解好不好,很大程度上決定了視頻價值的大小。

4、計算量大。視頻數據的計算量非常大,大模型加劇了這一情況。這就需要廠商在準確率和效率之間找一個平衡。視頻解析模型的參數量要適度,無法像文本大模型動輒有千億參數,不然計算量就太大了。

上述特徵,也決定了視頻數據定價、交易和流通難度更大。

周文凱表示,視頻數據不像結構化的文本數據一樣流通便利,而是規模巨大,且大多數機器不可讀。如果要交易的話,巨量視頻數據怎麼上傳和下載,對網絡帶寬、安全保護、結構化成本的要求都較高;基於成本和價值定價標準如何定,都是要解決的問題。

對此,周文凱認爲,視頻數據要素價值的開發,可以參考地產行業採取所有權、使用權、經營權「三權分立」。視頻數據使用者向數據所有者付費,視頻數據運營者推動視頻價值得到最大限度的安全挖掘,從而能夠盤活視頻數據要素市場。

而從技術角度來說,讓視頻數據可交易使用,還有賴於AI對數據的理解。比如大華股份在視頻編解碼、大數據平台、數據治理、視覺大模型、安全合規等多方面都有深入積澱,比如如何實現視頻數據與文本數據的異構數據融合計算等,以此降低視頻數據開發利用的難度和成本。三、數據價值變現,場景化應用落地是關鍵

在數字化時代,‌數據被視爲新型生產要素,數據的價值不僅僅在於其本身,‌更在於如何有效地利用這些數據,場景化應用落地是實現數據價值變現的關鍵。大華股份自2017年起就開始構建大的物聯數智平台,2019年形成完整的平台體系架構,2021年發佈Dahua Think #戰略,推出「一體系、兩平台」,即「物聯數智中臺體系」和「城市平台2.0、企業平台3.0」,助力各行各業挖掘視頻數據價值。

2023年,大華股份全新升級Dahua Think #2.0戰略,並全新升級的物聯數智平台2.0,該平台全面融合物聯感知、算網融合、視覺大模型、數據智能等技術,完善軟件工程化能力,賦能千行百業客戶的應用。

在城市方面,大華圍繞城市高效治理、運行自治、安全體系升級、生態協同治理拓展了各領域,覆蓋了超過200個城市場景。比如在交通治理場景,周文凱談道,過去的小模型往往只能識別一些局部場景,如某個關口排隊要多久等;在應用了大模型之後,某地整個城市交通態勢變得可被全面掌控,交通調配決策變得更科學。

在企業方面,大華則以助力企業構建大安全體系、數智生產力、提升經營決斷力,爲企業提供數字化管理工具,幫助企業解決業務痛點。比如能源領域,周文凱稱一些客戶的需求比較強烈,他們亟需通過視頻去做安全生產和降本提效;另外智能駕駛領域的客戶需求也非常強烈,他們需要基於視頻和雷達聯合起來去做智能駕駛。

當然這些應用的升級離不開大模型能力的加載,很多大模型並不適合直接拿來用,而是需要結合場景去發揮價值。「無論是生成式模型還是解析式模型,這些大模型都是基礎模型(Foundation Model),本質上是比小模型加強了理解和認知能力。當認知產生的時候,人們在上面構建出面向各個場景的能力,這才是大模型價值的本質。」

周文凱談道,大華做的大模型,是以視覺爲核心,融合了多模態的能力,具備準確性和泛化性躍升、圖文提示定義新功能、突破視覺認知能力、全場景自主解析、大小模型與算力協同五大方面特徵,目前已落地多個行業領域。

除了大模型外,這背後也離不開大華股份圍繞視圖在編解碼、治理、分析、網絡、存儲等方面所做的一系列優化。

比如在數據分析方面,大華自建了超千台服務器規模的數據中心,專門模擬大數據各種場景需求,支持大華在數據存儲、數據治理、數據分析等多方面去做全流程試驗,從而保證技術領先性和穩定性。

數據安全方面,大華積累了衆多安全相關技術,在其一站式的數據智能引擎上提供了面向數據傳輸流轉的很多安全管控措施,如實現項目隔離、數據隔離,權限隔離、訪問隔離、安全審計等。結語:視頻數據沃土,場景化數據要素價值凸顯

當下正值數據要素加速落地千行百業,深挖場景化數據價值變得尤爲重要。

從大華股份的實踐中,我們了解到國產玩家正在克服視頻數據在存儲、處理、理解、計算、定價、流通等環節面臨的挑戰,將視頻數據處理能與多樣化場景應用深度融合。這其中既包含了企業十幾年的行業經驗和數據處理能力積澱,更凝聚了跨越多個業務週期的寶貴行業知識與專業洞察(know-how)。

數據爲王時代,在堆算力、煉模型的同時,如何讓海量的視頻數據要素髮揮乘數效應,成爲我國數字產業實現領跑世界的一大關鍵。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論