業界唯一！科大訊飛發佈首個基於全國產算力的深度推理大模型X1

TechWeb · 01/15 09:48

【TechWeb】1月15日，科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一，并率先应用于教育、医疗等刚需场景。

同时，讯飞星火4.0 Turbo底座能力再次迎来全新升级，图文、数学和长文本能力显著提升，并首发混域知识搜索技术，进一步解决行业、企业痛点。

此外，作为国内智能翻译领域的佼佼者，科大讯飞还推出了业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型，最快语音同传时延小于5秒。

讯飞星火X1中文数学能力国内第一，

率先落地真实场景

一直以来，讯飞星火坚持走全国产化路线。尽管在全国产算力平台上训练深度推理模型遭遇了诸多挑战，但科大讯飞携手华为，成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题，最终成功训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型——讯飞星火X1。

发布会上，科大讯飞研究院的研究员们依次展示了讯飞星火X1解答高考题、AIME竞赛题以及高中奥赛题的表现。讯飞星火X1不仅准确给出了这些题目的答案，还对解题思路和步骤进行了详细拆解。与通用大模型相比，其解题过程更接近人类的“慢思考”方式。

过程中，讯飞星火X1充分展现深度推理模型的三大典型特征：化繁为简，将复杂问题分步拆解简化；进行自我探索和反思验证；基于答案正确与否的优质反馈信息进行强化训练。

值得一提的是，讯飞星火X1在近期参加的小初高（含竞赛）、大学（含竞赛）、AIME、MATH 500等多项“考试”中成绩十分亮眼，用更少的算力，实现了业界一流的效果，多项指标国内第一。

“大模型发展，应用才是硬道理”是科大讯飞一直秉持的观点。

目前，讯飞星火X1率先在教育等真实场景中实现了应用落地。去年1024，科大讯飞联合中国教育科学研究院发布了基于“问题链”的高中数学智能教师助手。同时也正面向全国百个试点区域、联合千名优秀教研员和老师打造上万个优秀案例。目前，星火X1已经部署上述试点区域，并广获好评，体验过的老师们纷纷表示，X1在一题多解、教学知识关联、拓展学生高阶思维等方面表现出色。讯飞星火X1也将成为学生和家长的帮手，随着相关技术的深度融入，科大讯飞AI学习机学习推荐和诊断将变得更加精准，解题思路和知识链条将更加清晰，后续也将持续升级。

医疗领域，讯飞星火X1的模型策略已取得初步验证成效，可使得专科辅助诊断和复杂病历内涵质控的准确率均达90%。发布会上，科大讯飞还宣布将在今年上半年正式发布基于讯飞星火X1的医疗大模型升级版，确保其深层次诊断推理效果和质控能力业界领先。

讯飞星火4.0 Turbo底座能力再升级，

成为更懂行业的大模型

此次发布会，讯飞星火4.0 Turbo底座能力实现了全新升级，七大核心能力全面提升，全面对标OpenAI 最新版的GPT-4o。此次升级最重要的特点，是针对行业、企业的痛点问题，在数学能力、行业知识、图文识别、长文本能力等能力上实现提升。

数学能力一直是讯飞星火的强项，此次基于讯飞星火X1的高质量合成数据，讯飞星火4.0 Turbo的数学能力变得更强，可以在数学教学、金融分析和科研推演等工作中更好的帮助用户。

图文识别能力直接关乎着企业能否高效的采编和利用行业、私域数据，是大模型“学习”的基础。在各行各业的实际工作中，经常面临图文识别的“疑难杂症”：如医疗的体检报告、法院的文书、学术论文、企业合同等，还有复杂长表格、杂乱板式、手写公式、印章手写合同、倾斜少线等情况，讯飞星火4.0 Turbo图文识别能力升级，使得通用文档版面分析、文字识别的准确率相对提升了40%，复杂表格结构、潦草手写文字等方面的准确率相对提升了60%，可以解决上述难题、大幅提升高价值数据的获取能力。对比测试表明，讯飞星火4.0 Turbo的图文识别能力显著领先国内外顶尖竞品。

此次升级还针对性地提升了文档要素检测能力，在知识切分和构建的粒度上更加精细、准确，能有效防止大模型幻觉，同时发布了扫描文档解析的极速版本，文档理解速度提升了10倍以上。对于一份500页的项目文件，从扫描、识别到解析的全过程，仅需2分钟即可全部完成。

大模型的长文本能力一直是用户关注的重点，特别是在企业知识问答这类严谨的应用场景中，用户对大模型幻觉的容忍度几乎为零。因此，讯飞星火推出了基于智能体的全新长文本框架，并行业首发了句子级溯源功能。这一新框架优化了超长注意力机制，同时利用大规模网页和书籍数据进行知识关联式合成，使得知识回复的错误率降低了40%，句子级溯源效果更是超越了GPT-4o，显著缓解了问答搜索服务中因大模型幻觉而需要反复溯源确认的应用落地难题。

考虑到不少用户在写报告、做调研这类工作时，往往需要花费大量时间搜集信息、整理资料，基于图文、长文本能力的提升和行业应用能力的积累，讯飞星火行业首发了混域知识搜索技术。该技术能够实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索，用户只需一次提问，即可获得综合搜索后的结果，大大提升信息搜索效率。

根据第三方数据，2024年，讯飞星火在大模型中标数量和中标金额上取得“双第一”，尤其是在能源、金融、汽车、运营商等行业，与客户共同打磨了近百个智能体应用。

基于“技术+应用”的不断正向循环，讯飞星火4.0 Turbo的行业能力全面提升，金融、油气、能源、电力、钢铁、航司等领域综合能力的绝对提升全部超过10%，可以说是“最懂行业的大模型”。

首发星火语音同传大模型，

助力全系产品翻译能力提升

作为国内智能翻译领域的领军者，科大讯飞不仅拥有在业内率先通过全国翻译专业资格考试的机器翻译系统，且在最近连续3届IWSLT国际口语机器翻译比赛都获得了冠军。发布会上，科大讯飞带来了在智能翻译领域又一突破：针对日常对话、商务交流、行业翻译等国际交流场景中的高难度同传翻译需求，发布了国内首个具备端到端语音同传能力的大模型——星火语音同传大模型。

众所周知，语音同传的技术难度较高，“现在大模型能力的发展，结合讯飞在智能语音技术上的独特算法积累，可以做端到端的语音同传。”据了解，该模型通过模仿人类同传译员的思维链路进行训练，具备实时意群理解和切分、上下文语境精准选词以及碎片化信息重组的能力，这一特性使得星火语音同传大模型在处理复杂句式和语境时表现出色，能够迅速准确地传达原意。

技术测试结果显示，即便将讯飞的语音同传技术和国外最优竞品的交传技术对比，讯飞语音同传在内容完整度、信息准确度以及语言质量上都处于领先水平，同时星火语音同传大模型还可以最快实现仅5秒的同传时延，达到人类专家译员的水平。

集成了最新的同传技术的产品用起来怎么样？讯飞翻译机的产品经理也进行了演示。无论是海外旅游场景中的景点介绍，还是国际展会上的专业产品介绍，翻译机能在短时间内完成高质量的英到中和中到英的双向同传任务。

除了端到端的语音同传能力，星火语音同传大模型还促进了语音到文字翻译效果的提升，使得科大讯飞全系产品的翻译能力都得到显著提升，在日常对话、单人演讲、影视节目，包括场景更复杂、翻译难度更高的多人会议等场景以及医疗等专业领域，为各种国际交流场景提供高质量翻译服务。

发布会最后，科大讯飞透露，针对语音到语音的同传场景，讯飞翻译机将会配置耳机、音箱、麦克风，在2025年推出商务套装，满足用户在不同的商务洽谈场景的使用需求。(Suky)

【TechWeb】1月15日，科大訊飛發佈了當前全國產算力平台上唯一的深度推理大模型——訊飛星火X1。該模型中文數學能力國內第一，並率先應用於教育、醫療等剛需場景。

同時，訊飛星火4.0 Turbo底座能力再次迎來全新升級，圖文、數學和長文本能力顯著提升，並首發混域知識搜索技術，進一步解決行業、企業痛點。

此外，作爲國內智能翻譯領域的佼佼者，科大訊飛還推出了業界首個具備端到端語音到語音同傳能力的大模型——星火語音同傳大模型，最快語音同傳時延小於5秒。

訊飛星火X1中文數學能力國內第一，

率先落地真實場景

一直以來，訊飛星火堅持走全國產化路線。儘管在全國產算力平台上訓練深度推理模型遭遇了諸多挑戰，但科大訊飛攜手華爲，成功攻克了訓練推理強交互、高吞吐推理優化以及國產算子優化等一系列難題，最終成功訓練出我國首個基於全國產算力訓練的具備深度思考和推理能力的大模型——訊飛星火X1。

發佈會上，科大訊飛研究院的研究員們依次展示了訊飛星火X1解答高考題、AIME競賽題以及高中奧賽題的表現。訊飛星火X1不僅準確給出了這些題目的答案，還對解題思路和步驟進行了詳細拆解。與通用大模型相比，其解題過程更接近人類的「慢思考」方式。

過程中，訊飛星火X1充分展現深度推理模型的三大典型特徵：化繁爲簡，將複雜問題分步拆解簡化；進行自我探索和反思驗證；基於答案正確與否的優質反饋信息進行強化訓練。

值得一提的是，訊飛星火X1在近期參加的小初高（含競賽）、大學（含競賽）、AIME、MATH 500等多項「考試」中成績十分亮眼，用更少的算力，實現了業界一流的效果，多項指標國內第一。

「大模型發展，應用才是硬道理」是科大訊飛一直秉持的觀點。

目前，訊飛星火X1率先在教育等真實場景中實現了應用落地。去年1024，科大訊飛聯合中國教育科學研究院發佈了基於「問題鏈」的高中數學智能教師助手。同時也正面向全國百個試點區域、聯合千名優秀教研員和老師打造上萬個優秀案例。目前，星火X1已經部署上述試點區域，並廣獲好評，體驗過的老師們紛紛表示，X1在一題多解、教學知識關聯、拓展學生高階思維等方面表現出色。訊飛星火X1也將成爲學生和家長的幫手，隨着相關技術的深度融入，科大訊飛AI學習機學習推薦和診斷將變得更加精準，解題思路和知識鏈條將更加清晰，後續也將持續升級。

醫療領域，訊飛星火X1的模型策略已取得初步驗證成效，可使得專科輔助診斷和複雜病歷內涵質控的準確率均達90%。發佈會上，科大訊飛還宣佈將在今年上半年正式發佈基於訊飛星火X1的醫療大模型升級版，確保其深層次診斷推理效果和質控能力業界領先。

訊飛星火4.0 Turbo底座能力再升級，

成爲更懂行業的大模型

此次發佈會，訊飛星火4.0 Turbo底座能力實現了全新升級，七大核心能力全面提升，全面對標OpenAI 最新版的GPT-4o。此次升級最重要的特點，是針對行業、企業的痛點問題，在數學能力、行業知識、圖文識別、長文本能力等能力上實現提升。

數學能力一直是訊飛星火的強項，此次基於訊飛星火X1的高質量合成數據，訊飛星火4.0 Turbo的數學能力變得更強，可以在數學教學、金融分析和科研推演等工作中更好的幫助用戶。

圖文識別能力直接關乎着企業能否高效的採編和利用行業、私域數據，是大模型「學習」的基礎。在各行各業的實際工作中，經常面臨圖文識別的「疑難雜症」：如醫療的體檢報告、法院的文書、學術論文、企業合同等，還有複雜長表格、雜亂板式、手寫公式、印章手寫合同、傾斜少線等情況，訊飛星火4.0 Turbo圖文識別能力升級，使得通用文檔版面分析、文字識別的準確率相對提升了40%，複雜表格結構、潦草手寫文字等方面的準確率相對提升了60%，可以解決上述難題、大幅提升高價值數據的獲取能力。對比測試表明，訊飛星火4.0 Turbo的圖文識別能力顯著領先國內外頂尖競品。

此次升級還針對性地提升了文檔要素檢測能力，在知識切分和構建的粒度上更加精細、準確，能有效防止大模型幻覺，同時發佈了掃描文檔解析的極速版本，文檔理解速度提升了10倍以上。對於一份500頁的項目文件，從掃描、識別到解析的全過程，僅需2分鐘即可全部完成。

大模型的長文本能力一直是用戶關注的重點，特別是在企業知識問答這類嚴謹的應用場景中，用戶對大模型幻覺的容忍度幾乎爲零。因此，訊飛星火推出了基於智能體的全新長文本框架，並行業首發了句子級溯源功能。這一新框架優化了超長注意力機制，同時利用大規模網頁和書籍數據進行知識關聯式合成，使得知識回覆的錯誤率降低了40%，句子級溯源效果更是超越了GPT-4o，顯著緩解了問答搜索服務中因大模型幻覺而需要反覆溯源確認的應用落地難題。

考慮到不少用戶在寫報告、做調研這類工作時，往往需要花費大量時間蒐集信息、整理資料，基於圖文、長文本能力的提升和行業應用能力的積累，訊飛星火行業首發了混域知識搜索技術。該技術能夠實現對個人知識、企業知識、業務系統數據、精品行業數據以及Internet Plus-related信息的綜合搜索，用戶只需一次提問，即可獲得綜合搜索後的結果，大大提升信息搜索效率。

根據第三方數據，2024年，訊飛星火在大模型中標數量和中標金額上取得「雙第一」，尤其是在能源、金融、汽車、運營商等行業，與客戶共同打磨了近百個智能體應用。

基於「技術+應用」的不斷正向循環，訊飛星火4.0 Turbo的行業能力全面提升，金融、油氣、能源、電力、鋼鐵、航司等領域綜合能力的絕對提升全部超過10%，可以說是「最懂行業的大模型」。

首發星火語音同傳大模型，

助力全系產品翻譯能力提升

作爲國內智能翻譯領域的領軍者，科大訊飛不僅擁有在業內率先通過全國翻譯專業資格考試的機器翻譯系統，且在最近連續3屆IWSLT國際口語機器翻譯比賽都獲得了冠軍。發佈會上，科大訊飛帶來了在智能翻譯領域又一突破：針對日常對話、商務交流、行業翻譯等國際交流場景中的高難度同傳翻譯需求，發佈了國內首個具備端到端語音同傳能力的大模型——星火語音同傳大模型。

衆所周知，語音同傳的技術難度較高，「現在大模型能力的發展，結合訊飛在智能語音技術上的獨特算法積累，可以做端到端的語音同傳。」據了解，該模型通過模仿人類同傳譯員的思維鏈路進行訓練，具備實時意群理解和切分、上下文語境精準選詞以及碎片化信息重組的能力，這一特性使得星火語音同傳大模型在處理複雜句式和語境時表現出色，能夠迅速準確地傳達原意。

技術測試結果顯示，即便將訊飛的語音同傳技術和國外最優競品的交傳技術對比，訊飛語音同傳在內容完整度、信息準確度以及語言質量上都處於領先水平，同時星火語音同傳大模型還可以最快實現僅5秒的同傳時延，達到人類專家譯員的水平。

集成了最新的同傳技術的產品用起來怎麼樣？訊飛翻譯機的產品經理也進行了演示。無論是海外旅遊場景中的景點介紹，還是國際展會上的專業產品介紹，翻譯機能在短時間內完成高質量的英到中和中到英的雙向同傳任務。

除了端到端的語音同傳能力，星火語音同傳大模型還促進了語音到文字翻譯效果的提升，使得科大訊飛全系產品的翻譯能力都得到顯著提升，在日常對話、單人演講、影視節目，包括場景更復雜、翻譯難度更高的多人會議等場景以及醫療等專業領域，爲各種國際交流場景提供高質量翻譯服務。

發佈會最後，科大訊飛透露，針對語音到語音的同傳場景，訊飛翻譯機將會配置耳機、音箱、麥克風，在2025年推出商務套裝，滿足用戶在不同的商務洽談場景的使用需求。(Suky)

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

讚好

熱點推薦

搶先評論

业界唯一！科大讯飞发布首个基于全国产算力的深度推理大模型X1

業界唯一！科大訊飛發佈首個基於全國產算力的深度推理大模型X1

風險及免責聲明

聲明