share_log

遥遥领先!阿里Qwen-2成全球开源大模型排行榜第一

遙遙領先!阿里Qwen-2成全球開源大模型排行榜第一

快科技 ·  06/27 11:45

快科技6月27日消息,全球知名的開源平台Hugging Face的聯合創始人兼首席執行官Clem在社交平台激動宣佈,阿里巴巴最新開源的Qwen2-72B指令微調版本在開源模型排行榜上榮登榜首。

爲了打造一個更爲公正和準確的開源大模型排名,Clem及其團隊利用300塊H100高性能硬件,對全球100多個主流開源大模型,包括Qwen2、Llama-3、Mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等嚴格的基準測試集上進行了全面而深入的評估。

這次重新評估的初衷在於,許多開發者過於追求排行榜的名次,導致在模型訓練過程中過度依賴評估集數據,並且過去的評估標準對於模型而言顯得過於簡單。因此,本次評估提高了難度標準,以檢驗這些模型在更高挑戰下的真實性能。

令人矚目的是,阿里巴巴開源的Qwen-2 72B模型在激烈競爭中脫穎而出,不僅超越了科技巨頭Meta的Llama-3,還超越了法國知名大模型平台Mistralai的Mixtral,成爲了新的行業領軍者。這一成績充分展示了中國在全球開源大模型領域的領導地位。

針對這一排名結果,Stability AI的研究總監、早年在19歲便獲得博士學位的Tanishq表示,他早前就預測中國在開源大模型領域具有強大的競爭力。除了Qwen2,還有零一萬物、InternLM、Deepsseek等衆多優秀的中國開源模型,都在國際舞臺上嶄露頭角。

Tanishq進一步強調,任何關於中國在開源大模型領域落後的觀點都是站不住腳的。相反,中國在這一領域正逐漸展現出領導者的姿態,引領着全球開源模型的發展潮流。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論