share_log

打通大模型行业应用任督二脉!讯飞星火V4.0升级解读,七大能力飙升

打通大模型行業應用任督二脈!訊飛星火V4.0升級解讀,七大能力飆升

智東西 ·  06/28 00:00

智東西(公衆號:zhidxcom)

作者 | 程茜

編輯 | 漠影

智東西6月28日下午,昨日下午,科大訊飛的星火大模型迎來重磅升級,基於全國首個國產萬卡算力集群“飛星一號”的訊飛星火大模型V4.0性能表現已超越GPT-4 Turbo,並且相關應用已經在醫療、教育等領域落地。

星火大模型核心性能的升級以及與千行百業業務場景的深入結合,與當下大模型產業的兩大焦點問題密切相關。

一開場,科大訊飛董事長劉慶峯就談道,一方面,底座大模型的能力決定了我們可以在通用人工智能的浪潮中走多遠;另一方面,大模型未來不僅將改變信息獲取、內容生產模式,還會改變整個產業競爭格局、科研範式,因此對於企業而言,讓大模型真正科學合理地在剛需場景中落地才更有價值

星火大模型V4.0在國內外多個主流權威評測體系中,在多項能力中已經全面超越GPT-4 Turbo,成爲支撐大模型走向應用的核心底座,與此同時,科大訊飛推出星火企業智能體平台,通過交互的方式大幅降低智能體創建門檻,讓每個崗位都能擁有AI智能體。

可以看出,星火大模型V4.0以及基於其打造的自主可控、軟硬一體解決方案,就是科大訊飛爲當下大模型產業面對這兩大核心技術問題亮出的最優解之一。

一、全面對標GPT-4 Turbo,可執行復雜指令、空間推理等高階任務

國內大模型已經在全面趕超GPT-4 Turbo之路上突飛猛進,能力持續躍升必然是大模型產業當下的必答題。

去年,科大訊飛參與設計的國產通用認知智能大模型測評體系,形成覆蓋7個方面481個測試項的評估基準。在七大衡量大模型的關鍵指標中,星火大模型V4.0已經在其中的文本生成、語言理解、知識問答、邏輯推理、數學能力已經全面超越GPT-4 Turbo。

另外的代碼能力和多模態能力上,星火大模型V4.0略有差距。劉慶峯談道,代碼能力是未來的產業信息化和信息產業化的核心,星火大模型預計在今年8月達到當前GPT-4 Turbo 86分以上的水平。此外在多模態能力上,星火大模型圖文識別能力在科研、金融、醫療、司法、辦公等場景的應用效果已領先GPT-4o。

不僅如此,在國內外中英文12項主流測試集中,星火V4.0在其中8項測試集中全面超越了GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro。

在具體的業務場景中,訊飛星火V4.0的能力也在不斷進階。

實際情況中,大模型往往需要聽懂多元化的複雜指令,或者基於已有的空間信息進行推理、基於邏輯關係進行多模理解等。並且大模型生成內容更爲準確、能夠減少幻覺對於應用端來說都至關重要。

因此,星火大模型長文本能力在長文檔要素抽取、長文檔總結摘要、長文檔問答、長文檔文本生成能力全面升級的同時,還首發了內容溯源功能。也就是說,用戶在查閱大模型生成的文本內容時,可以點擊答案附近的超鏈接,就能準確找到這部分答案的出處。

中英文長文檔以及音視頻等的解讀、問答,星火大模型V4.0均可勝任,同時在溯源時能幫用戶快速定位到文字、視頻的相應位置。

同時,星火大模型的圖文生成能力還從單張圖進階到了多張圖片之間的邏輯理解、生成文本,可以根據多張圖片生成小故事並且進行語音朗讀。正如下圖所演示的,將小兔子和小鳥的互動情節進行了生動串聯。

大模型的能力正在從單一的生成、問答、理解能力進階,向着更高階的能力演進,同時也逐漸朝着大模型走向落地應用,解決企業或者個人真正需求的底座演進。

二、兩大路徑、三大優勢,科大訊飛爲企業大模型落地鋪路搭橋

從整個產業的發展格局來看,大模型的競爭焦點已經逐漸外延,從百模大戰、排名刷榜逐漸深入行業應用中。

今年上半年,已經有數十個大模型大單公佈中標結果。以訊飛星火大模型爲代表的越來越多大模型玩家已經奔赴大模型落地戰,伴隨着下半年的新一批大單湧現,AI落地應用競爭進入白熱化態勢。

這背後,如何讓企業對於大模型應用落地的感知度更強,讓大模型與企業業務場景的結合更便捷、高效,且真正融入其核心痛點中至關重要。

相比於C端,企業業務場景的需求更爲明確,且能深度集成至企業業務場景中進行定製化,能在幫助企業解決複雜問題、真正提質增效,對於大模型玩家而言,其產品價值的體現也更具針對性。

總體來看,大模型賦能企業的核心路徑有兩條,一是基於認知大模型的能力直接完成任務,二是認知大模型作爲大腦,調度內外部工具完成任務

對大模型落地應用的思考,正從訊飛星火大模型的全體系升級佈局中清晰呈現出來。劉慶峯將大模型的能力邊界在企業應用中進行了更爲細緻的拆解,一般難度指的是代碼生成、文案翻譯、文本摘要等大模型可以拿來即用,中等難度就是需要企業對基座大模型進行定製優化,例如檢索類的知識問答、多輪對話等應用化的服務。

而高難度任務就是更難的數學推理、多階推理類知識問答,這一能力需要開放域的通用智能體來完成,但短期內還沒有實現。

這對應到企業中就是一個核心問題,如何用更少的算力、更高的效率打造專屬模型和專屬應用。這就對大模型玩家本身產品是否易用、好用、可用提出了更高的要求,這也是企業爲大模型買單的關鍵。

因此,科大訊飛在錨定真正讓大模型落地應用這一核心目標之後,將自己的技術優勢、應用經驗、生態範式真正打通。

從去年發佈至今,訊飛星火大模型能力不斷躍升,且打造了面向企業的智能體開發平台,進一步降低企業業務與大模型能力相互影響、對齊的門檻。

與此同時,作爲AI國家隊的科大訊飛,在加速當下國內大模型商業化加速落地過程中具有天然的優勢,其技術實力在AI產業的發展中已經被充分驗證。以智能語音交互技術爲例,深耕十餘年且近日科大訊飛拿下過去十年人工智能領域首個國家科學技術進步獎一等獎——作爲第一完成單位的“多語種智能語音關鍵技術及產業化”項目斬獲國家科學技術進步獎一等獎。

技術創新與產業落地在科大訊飛的業務佈局中相輔相成。科大訊飛已經在教育、醫療、汽車等諸多賽道上有了大量的商業化積累。訊飛星火大模型已經應用於國家能源集團、中國石油、中國移動、中國人保、太平洋保險、交通銀行、奇瑞汽車、中國一汽、海爾集團、美的集團等各賽道頭部玩家的業務場景中。

在這些優勢的支撐之上,科大訊飛正在朝着構建面向未來的AI新生態突圍,以源頭技術生態、智能體生態、應用生態、行業生態真正在大模型的發展過程中流轉起來。

科大訊飛正爲大模型落地企業提供了無限的想象空間。

三、企業的專屬崗位AI助手,對話交互就能搞定智能體

伴隨着訊飛星火V4.0的重磅升級,科大訊飛爲大模型賦能企業亮出了另一大殺手鐧——星火企業智能體平台,爲每個崗位打造專屬的AI助手。

在解決企業大模型應用最後一公里上,劉慶峯談道,企業首先要科學地認識大模型能力的邊界,根據任務難度選擇合適方案,並且用更少的算力、更高的效率,打造企業專屬大模型。基於星火V4.0的強大能力,他認爲用智能體平台打造每個崗位的專屬助手的時間已經到了。

智能體在企業的業務場景中,可以通過拆解分析用戶的任務需求並進行任務執行的步驟規劃,然後匹配相應的任務工具,同時調用打通內外部知識信源,最後能夠準確執行用戶的任務需求。

現在科大訊飛將企業創建智能體的門檻降低,只需三個步驟:提出需求、構建智能體、功能驗證。用戶只需說出需求,就可以實現一句話創建。在對話框中,用戶只需要說出智能體的相應功能,該平台就會自動生成開場白、所需信源、技能規劃等。

如果企業內部的辦公平台已經與星火智能體平台連接,智能體還會自動同步到企業內部辦公平台上,用戶就可以進行功能驗證。

以下圖演示的彩頁智能分析專家爲例,用戶可以直接上傳彩頁圖片,該智能體就可以通過OCR識別並將其中的信息進行結構化呈現,並且迅速檢索給出企業的核心業務以及與其他公司的合作方向等供用戶參考,最後將這些內容進行總結梳理,以分析報告的形式發送到用戶郵箱中。

如見簡便高效的智能體生成流程,這背後依靠的是星火企業智能體平台的三大關鍵能力,AI原子能力、集成外部信源、打通內部IT系統

劉慶峯透露,目前AI原子能力集成已經超過400多家,涵蓋90多個重要外部信源,打通了超過100個的內部IT系統,包括公司的財務、法務等諸多部門。

在常見的生產、科創、辦公和管理領域,科大訊飛已經首批創建了32個企業智能體,企業可實現即插即用。

特別在AI編程領域,正如前文所所提到的,其在信息化產業與產業信息化的發展中至關重要,因此科大訊飛不斷迭代代碼智能體iFlyCode,可以滿足代碼生成、架構設計、代碼問答、測試、數據庫優化、代碼審核方面實現應用。在科大訊飛內部,代碼智能體的代碼採納率已經從30%提升到52%。

此外,還有企業中需要大量數據分析處理、信息檢索或者耗時耗力的商機線索、評標等方面,訊飛創建的企業智能體已經深入不同的企業業務流程中,幫助不同環節的員工實現了將本增效。

面向企業,科大訊飛還在人機交互領域,全面升級了支持37個語種、37種方言自由對話的星火語音大模型,重構用戶的交互體驗,已應用在星火汽車智能座艙等產品裏。在家電、機器人、運營商等行業場景下,科大訊飛的雲邊端和軟硬件一體化解決方案也爲這些玩家提供了更具靈活性的方案,去釋放大模型潛能。

當下,企業的數字化轉型需求,與大模型日益進階的性能提升相契合。科大訊飛已經形成了底座大模型支撐,外加通過智能體平台深入業務“細枝末節”,爲企業搭建起堅實的技術底座。

還有更爲重要的一點是,劉慶峯強調,新的AI生態體系建設的根基就是底座技術完全可控,總結起來就是“軟硬一體+自主可控”。這也正是訊飛星火大模型V4.0此次升級迭代的底層邏輯,既真正爲企業釋放大模型價值,又要讓軟硬件一體化的解決方案成長於中國自己的土壤之上。

結語:大模型商業化落地爆點降至,科大訊飛率先佈局

大模型在企業的各個業務環節中發揮作用、釋放價值已經成爲這一產業發展的重要趨勢,因此,大模型玩家與不同的企業需要對大模型本身的能力以及企業的核心痛點進行拆解與對齊,在此之上才能讓AI能力真正普惠,落地到千行百業之中。

點點“星火”,已成燎原之勢。訊飛星火正在以基座大模型爲核心,進一步助攻大模型技術在各行各業的規模化普及。對於國內的大模型玩家而言,既需要科學理性認識到中美科技的綜合差異,還需要在朝着通用人工智能加速前進的同時,以長期主義來打造真正自主可控的AI產業生態。

科大訊飛已經成爲先行者,並且讓大模型在企業剛需場景的更多應用價值逐漸被釋放出來,加速大模型應用生態的蓬勃發展。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論