深挖非結構化數據富礦，嘉銀科技(JFIN.US)推出自研“識瀾”、“明經”雙算法

智通財經 · 04/12 09:49

自创立以来，嘉银科技始终将技术创新视为企业发展的重要引擎，不断探索大数据和人工智能技术在不同业务场景中的应用，力求给客户和合作伙伴带来更优质的产品和服务。为进一步赋能决策科学和智慧运营，近日嘉银科技推出自研“识澜”音频数据挖掘算法和“明经”文本数据挖掘算法，全面释放非结构化数据价值，标志着公司科研能力和大数据实力再上新台阶。

自创立以来，嘉银科技(JFIN.US)始终将技术创新视为企业发展的重要引擎，不断探索大数据和人工智能技术在不同业务场景中的应用，力求给客户和合作伙伴带来更优质的产品和服务。为进一步赋能决策科学和智慧运营，近日嘉银科技推出自研“识澜”音频数据挖掘算法和“明经”文本数据挖掘算法，全面释放非结构化数据价值，标志着公司科研能力和大数据实力再上新台阶。

基于多年的业务运营和数据积累，嘉银科技沉淀了丰富的数据“矿藏”。由于非结构化的特性，如何能从中提取有价值的信息转化为结构化数据，以进一步提高决策质量、提升客户体验，并最终推动业务增长，成为企业思考的重要课题。

经过探索和实践，嘉银成功自研了针对音频数据的“识澜”算法和针对文本数据的“明经”算法，根据不同业务场景，高效地从音频和文本数据中提取有价值的结构化数据，为下游的数据分析和建模提供更多决策支持。这两项最新成果展示了嘉银科技在科技领域的积极布局和对未来技术发展的深刻洞察，标志着数据驱动下，音频和文本数据深度理解和利用迎来新篇章。

音频数据挖掘算法命名为“识澜”，灵感源于声音犹如水纹波动，该算法能够从声音的波纹中识别出说话人情绪上的细微变化。嘉银决策科学中心通过利用数字信号处理(DSP)工具将音频文件转化为信号序列，再利用傅里叶变化分别从时域和频域的视角来提取说话人的声学特征，比如频谱质心、过零率、均方根能量等，这些特征旨在挖掘语音、语调、语速中蕴含的信息。由于人在不同的情绪状态下说话的方式会存在很大的差别，比如情绪激动的时候会语速加快、音调尖锐、提高音量等等，通过分析这些信息可以更完整地了解说话人在音频发生时的状态属性。

“明经”是古代科举考试的一种，旨在考察学生对儒学典籍的理解和运用能力。嘉银以此来命名文本数据挖掘算法，是希望它能够“学以致用”，从海量的文本里找到对业务有帮助的信息。目前，嘉银决策科学中心团队对传统的机器学习文本挖掘思路进行升级，让模型可以根据不同的业务场景自动化搜索有价值的关键词，并从近义词和同现词的角度对关键词库进行扩充，起到多路召回的作用。除此以外，公司还运用大语言模型(LLM)对命中文本的语义信息做进一步理解，来提升识别的准确性。这种传统机器学习和大语言模型相结合的方式，不仅让语义标签召回率和准确率实现同步提升，也助力公司业务降本增效。

目前，这两种数据挖掘算法已经成功运用于数据建模等场景，嘉银科技模型开发专家夏春秋表示，“结构化数据与非结构化数据起到很好互补作用，目前在多个场景下，声学和语义信息的融入都能给模型带来预测性能和稳定性能的提升。这充分证明了我们对非结构化数据的挖掘探索是有业务价值的。”

最新的信贷服务类模型报告显示，这两种非结构化数据挖掘算法开发出的变量占总入模变量的比例高达27%，对模型的预测起到强有力的支持作用。使用文本和音频变量的新模型预测效果相对于老模型也有大幅度的提升，在尾部20%的分位数阈值下，新模型能够提升60%以上的捕获率，减少40%风险事件的发生。新模型的运用不仅降低了运营成本，更重要的是显著提升客户满意度。

未来，嘉银科技将继续秉持“科技赋能服务革新”这一信念，不断突破技术边界，优化服务流程，与客户共同携手，构建高质量服务品质之路。在这条道路上，嘉银也将始终坚持以客户需求为导向，以技术创新为动力，不断提升服务的专业化、个性化水平。

自創立以來，嘉銀科技始終將技術創新視爲企業發展的重要引擎，不斷探索大數據和人工智能技術在不同業務場景中的應用，力求給客戶和合作夥伴帶來更優質的產品和服務。爲進一步賦能決策科學和智慧運營，近日嘉銀科技推出自研“識瀾”音頻數據挖掘算法和“明經”文本數據挖掘算法，全面釋放非結構化數據價值，標誌着公司科研能力和大數據實力再上新臺階。

自創立以來，嘉銀科技(JFIN.US)始終將技術創新視爲企業發展的重要引擎，不斷探索大數據和人工智能技術在不同業務場景中的應用，力求給客戶和合作夥伴帶來更優質的產品和服務。爲進一步賦能決策科學和智慧運營，近日嘉銀科技推出自研“識瀾”音頻數據挖掘算法和“明經”文本數據挖掘算法，全面釋放非結構化數據價值，標誌着公司科研能力和大數據實力再上新臺階。

基於多年的業務運營和數據積累，嘉銀科技沉澱了豐富的數據“礦藏”。由於非結構化的特性，如何能從中提取有價值的信息轉化爲結構化數據，以進一步提高決策質量、提升客戶體驗，並最終推動業務增長，成爲企業思考的重要課題。

經過探索和實踐，嘉銀成功自研了針對音頻數據的“識瀾”算法和針對文本數據的“明經”算法，根據不同業務場景，高效地從音頻和文本數據中提取有價值的結構化數據，爲下游的數據分析和建模提供更多決策支持。這兩項最新成果展示了嘉銀科技在科技領域的積極佈局和對未來技術發展的深刻洞察，標誌着數據驅動下，音頻和文本數據深度理解和利用迎來新篇章。

音頻數據挖掘算法命名爲“識瀾”，靈感源於聲音猶如水紋波動，該算法能夠從聲音的波紋中識別出說話人情緒上的細微變化。嘉銀決策科學中心通過利用數字信號處理(DSP)工具將音頻文件轉化爲信號序列，再利用傅里葉變化分別從時域和頻域的視角來提取說話人的聲學特徵，比如頻譜質心、過零率、均方根能量等，這些特徵旨在挖掘語音、語調、語速中蘊含的信息。由於人在不同的情緒狀態下說話的方式會存在很大的差別，比如情緒激動的時候會語速加快、音調尖銳、提高音量等等，通過分析這些信息可以更完整地了解說話人在音頻發生時的狀態屬性。

“明經”是古代科舉考試的一種，旨在考察學生對儒學典籍的理解和運用能力。嘉銀以此來命名文本數據挖掘算法，是希望它能夠“學以致用”，從海量的文本里找到對業務有幫助的信息。目前，嘉銀決策科學中心團隊對傳統的機器學習文本挖掘思路進行升級，讓模型可以根據不同的業務場景自動化搜索有價值的關鍵詞，並從近義詞和同現詞的角度對關鍵詞庫進行擴充，起到多路召回的作用。除此以外，公司還運用大語言模型(LLM)對命中文本的語義信息做進一步理解，來提升識別的準確性。這種傳統機器學習和大語言模型相結合的方式，不僅讓語義標籤召回率和準確率實現同步提升，也助力公司業務降本增效。

目前，這兩種數據挖掘算法已經成功運用於數據建模等場景，嘉銀科技模型開發專家夏春秋表示，“結構化數據與非結構化數據起到很好互補作用，目前在多個場景下，聲學和語義信息的融入都能給模型帶來預測性能和穩定性能的提升。這充分證明了我們對非結構化數據的挖掘探索是有業務價值的。”

最新的信貸服務類模型報告顯示，這兩種非結構化數據挖掘算法開發出的變量佔總入模變量的比例高達27%，對模型的預測起到強有力的支持作用。使用文本和音頻變量的新模型預測效果相對於老模型也有大幅度的提升，在尾部20%的分位數閾值下，新模型能夠提升60%以上的捕獲率，減少40%風險事件的發生。新模型的運用不僅降低了運營成本，更重要的是顯著提升客戶滿意度。

未來，嘉銀科技將繼續秉持“科技賦能服務革新”這一信念，不斷突破技術邊界，優化服務流程，與客戶共同攜手，構建高質量服務品質之路。在這條道路上，嘉銀也將始終堅持以客戶需求爲導向，以技術創新爲動力，不斷提升服務的專業化、個性化水平。

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

深挖非结构化数据富矿，嘉银科技(JFIN.US)推出自研“识澜”、“明经”双算法

深挖非結構化數據富礦，嘉銀科技(JFIN.US)推出自研“識瀾”、“明經”雙算法

風險及免責聲明

聲明