【TechWeb】1月15日,科大訊飛發佈了當前全國產算力平台上唯一的深度推理大模型——訊飛星火X1。該模型中文數學能力國內第一,並率先應用於教育、醫療等剛需場景。
同時,訊飛星火4.0 Turbo底座能力再次迎來全新升級,圖文、數學和長文本能力顯著提升,並首發混域知識搜索技術,進一步解決行業、企業痛點。
此外,作爲國內智能翻譯領域的佼佼者,科大訊飛還推出了業界首個具備端到端語音到語音同傳能力的大模型——星火語音同傳大模型,最快語音同傳時延小於5秒。
01
訊飛星火X1中文數學能力國內第一,
率先落地真實場景
一直以來,訊飛星火堅持走全國產化路線。儘管在全國產算力平台上訓練深度推理模型遭遇了諸多挑戰,但科大訊飛攜手華爲,成功攻克了訓練推理強交互、高吞吐推理優化以及國產算子優化等一系列難題,最終成功訓練出我國首個基於全國產算力訓練的具備深度思考和推理能力的大模型——訊飛星火X1。
發佈會上,科大訊飛研究院的研究員們依次展示了訊飛星火X1解答高考題、AIME競賽題以及高中奧賽題的表現。訊飛星火X1不僅準確給出了這些題目的答案,還對解題思路和步驟進行了詳細拆解。與通用大模型相比,其解題過程更接近人類的「慢思考」方式。
過程中,訊飛星火X1充分展現深度推理模型的三大典型特徵:化繁爲簡,將複雜問題分步拆解簡化;進行自我探索和反思驗證;基於答案正確與否的優質反饋信息進行強化訓練。
值得一提的是,訊飛星火X1在近期參加的小初高(含競賽)、大學(含競賽)、AIME、MATH 500等多項「考試」中成績十分亮眼,用更少的算力,實現了業界一流的效果,多項指標國內第一。
「大模型發展,應用才是硬道理」是科大訊飛一直秉持的觀點。
目前,訊飛星火X1率先在教育等真實場景中實現了應用落地。去年1024,科大訊飛聯合中國教育科學研究院發佈了基於「問題鏈」的高中數學智能教師助手。同時也正面向全國百個試點區域、聯合千名優秀教研員和老師打造上萬個優秀案例。目前,星火X1已經部署上述試點區域,並廣獲好評,體驗過的老師們紛紛表示,X1在一題多解、教學知識關聯、拓展學生高階思維等方面表現出色。訊飛星火X1也將成爲學生和家長的幫手,隨着相關技術的深度融入,科大訊飛AI學習機學習推薦和診斷將變得更加精準,解題思路和知識鏈條將更加清晰,後續也將持續升級。
醫療領域,訊飛星火X1的模型策略已取得初步驗證成效,可使得專科輔助診斷和複雜病歷內涵質控的準確率均達90%。發佈會上,科大訊飛還宣佈將在今年上半年正式發佈基於訊飛星火X1的醫療大模型升級版,確保其深層次診斷推理效果和質控能力業界領先。
02
訊飛星火4.0 Turbo底座能力再升級,
成爲更懂行業的大模型
此次發佈會,訊飛星火4.0 Turbo底座能力實現了全新升級,七大核心能力全面提升,全面對標OpenAI 最新版的GPT-4o。此次升級最重要的特點,是針對行業、企業的痛點問題,在數學能力、行業知識、圖文識別、長文本能力等能力上實現提升。
數學能力一直是訊飛星火的強項,此次基於訊飛星火X1的高質量合成數據,訊飛星火4.0 Turbo的數學能力變得更強,可以在數學教學、金融分析和科研推演等工作中更好的幫助用戶。
圖文識別能力直接關乎着企業能否高效的採編和利用行業、私域數據,是大模型「學習」的基礎。在各行各業的實際工作中,經常面臨圖文識別的「疑難雜症」:如醫療的體檢報告、法院的文書、學術論文、企業合同等,還有複雜長表格、雜亂板式、手寫公式、印章手寫合同、傾斜少線等情況,訊飛星火4.0 Turbo圖文識別能力升級,使得通用文檔版面分析、文字識別的準確率相對提升了40%,複雜表格結構、潦草手寫文字等方面的準確率相對提升了60%,可以解決上述難題、大幅提升高價值數據的獲取能力。對比測試表明,訊飛星火4.0 Turbo的圖文識別能力顯著領先國內外頂尖競品。
此次升級還針對性地提升了文檔要素檢測能力,在知識切分和構建的粒度上更加精細、準確,能有效防止大模型幻覺,同時發佈了掃描文檔解析的極速版本,文檔理解速度提升了10倍以上。對於一份500頁的項目文件,從掃描、識別到解析的全過程,僅需2分鐘即可全部完成。
大模型的長文本能力一直是用戶關注的重點,特別是在企業知識問答這類嚴謹的應用場景中,用戶對大模型幻覺的容忍度幾乎爲零。因此,訊飛星火推出了基於智能體的全新長文本框架,並行業首發了句子級溯源功能。這一新框架優化了超長注意力機制,同時利用大規模網頁和書籍數據進行知識關聯式合成,使得知識回覆的錯誤率降低了40%,句子級溯源效果更是超越了GPT-4o,顯著緩解了問答搜索服務中因大模型幻覺而需要反覆溯源確認的應用落地難題。
考慮到不少用戶在寫報告、做調研這類工作時,往往需要花費大量時間蒐集信息、整理資料,基於圖文、長文本能力的提升和行業應用能力的積累,訊飛星火行業首發了混域知識搜索技術。該技術能夠實現對個人知識、企業知識、業務系統數據、精品行業數據以及Internet Plus-related信息的綜合搜索,用戶只需一次提問,即可獲得綜合搜索後的結果,大大提升信息搜索效率。
根據第三方數據,2024年,訊飛星火在大模型中標數量和中標金額上取得「雙第一」,尤其是在能源、金融、汽車、運營商等行業,與客戶共同打磨了近百個智能體應用。
基於「技術+應用」的不斷正向循環,訊飛星火4.0 Turbo的行業能力全面提升,金融、油氣、能源、電力、鋼鐵、 航司等領域綜合能力的絕對提升全部超過10%,可以說是「最懂行業的大模型」。
03
首發星火語音同傳大模型,
助力全系產品翻譯能力提升
作爲國內智能翻譯領域的領軍者,科大訊飛不僅擁有在業內率先通過全國翻譯專業資格考試的機器翻譯系統,且在最近連續3屆IWSLT國際口語機器翻譯比賽都獲得了冠軍。發佈會上,科大訊飛帶來了在智能翻譯領域又一突破:針對日常對話、商務交流、行業翻譯等國際交流場景中的高難度同傳翻譯需求,發佈了國內首個具備端到端語音同傳能力的大模型——星火語音同傳大模型。
衆所周知,語音同傳的技術難度較高,「現在大模型能力的發展,結合訊飛在智能語音技術上的獨特算法積累,可以做端到端的語音同傳。」據了解,該模型通過模仿人類同傳譯員的思維鏈路進行訓練,具備實時意群理解和切分、上下文語境精準選詞以及碎片化信息重組的能力,這一特性使得星火語音同傳大模型在處理複雜句式和語境時表現出色,能夠迅速準確地傳達原意。
技術測試結果顯示,即便將訊飛的語音同傳技術和國外最優競品的交傳技術對比,訊飛語音同傳在內容完整度、信息準確度以及語言質量上都處於領先水平,同時星火語音同傳大模型還可以最快實現僅5秒的同傳時延,達到人類專家譯員的水平。
集成了最新的同傳技術的產品用起來怎麼樣?訊飛翻譯機的產品經理也進行了演示。無論是海外旅遊場景中的景點介紹,還是國際展會上的專業產品介紹,翻譯機能在短時間內完成高質量的英到中和中到英的雙向同傳任務。
除了端到端的語音同傳能力,星火語音同傳大模型還促進了語音到文字翻譯效果的提升,使得科大訊飛全系產品的翻譯能力都得到顯著提升,在日常對話、單人演講、影視節目,包括場景更復雜、翻譯難度更高的多人會議等場景以及醫療等專業領域,爲各種國際交流場景提供高質量翻譯服務。
發佈會最後,科大訊飛透露,針對語音到語音的同傳場景,訊飛翻譯機將會配置耳機、音箱、麥克風,在2025年推出商務套裝,滿足用戶在不同的商務洽談場景的使用需求。(Suky)
評論(0)
請選擇舉報原因