share_log

阿里雲推開源Qwen2.5 上架逾100個模型

AASTOCKS ·  09/19 16:21

阿里雲智能首席技術官(CTO)周靖人於2024雲棲大會上發佈通義千問新一代開源模型Qwen2.5,全系列涵蓋多個尺寸的大語言模型、多模態模型、數學模型和代碼模型,每個尺寸都有基礎版本、指令跟隨版本、量化版本,總計上架100多個模型,其中旗艦模型Qwen2.5-72B性能超越Llama 405B。

與Qwen2相比,Qwen2.5全系列模型都在18T tokens數據上進行預訓練,整體性能提升逾18%,擁有更多的知識、更強的編程和數學能力。Qwen2.5-72B模型在MMLU-rudex基準(考察通用知識)、MBPP基準(考察代碼能力)和MATH基準(考察數學能力)的得分高達86.8、88.2、83.1。Qwen2.5可生成最多8,000字內容,支援中文、英文、法文、西班牙文、俄文、日文、越南文與阿拉伯文等29種以上語言。

在多模態模型方面,阿里雲宣布視覺語言模型Qwen2-VL-72B開源,Qwen2-VL能識別不同分辨率和長寬比的圖片,理解20分鐘以上長視頻,具備自主操作手機和機械人的視覺智能體能力。

以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論