阿里雲推開源Qwen2.5 上架逾100個模型

AASTOCKS · 09/19 16:21

阿里雲智能首席技術官(CTO)周靖人於2024雲棲大會上發佈通義千問新一代開源模型Qwen2.5，全系列涵蓋多個尺寸的大語言模型、多模態模型、數學模型和代碼模型，每個尺寸都有基礎版本、指令跟隨版本、量化版本，總計上架100多個模型，其中旗艦模型Qwen2.5-72B性能超越Llama 405B。

與Qwen2相比，Qwen2.5全系列模型都在18T tokens數據上進行預訓練，整體性能提升逾18%，擁有更多的知識、更強的編程和數學能力。Qwen2.5-72B模型在MMLU-rudex基準(考察通用知識)、MBPP基準(考察代碼能力)和MATH基準(考察數學能力)的得分高達86.8、88.2、83.1。Qwen2.5可生成最多8,000字內容，支援中文、英文、法文、西班牙文、俄文、日文、越南文與阿拉伯文等29種以上語言。

在多模態模型方面，阿里雲宣布視覺語言模型Qwen2-VL-72B開源，Qwen2-VL能識別不同分辨率和長寬比的圖片，理解20分鐘以上長視頻，具備自主操作手機和機械人的視覺智能體能力。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

阿里雲推開源Qwen2.5 上架逾100個模型

風險及免責聲明