阿里雲智能首席技術官(CTO)周靖人於2024雲棲大會上發佈通義千問新一代開源模型Qwen2.5,全系列涵蓋多個尺寸的大語言模型、多模態模型、數學模型和代碼模型,每個尺寸都有基礎版本、指令跟隨版本、量化版本,總計上架100多個模型,其中旗艦模型Qwen2.5-72B性能超越Llama 405B。
與Qwen2相比,Qwen2.5全系列模型都在18T tokens數據上進行預訓練,整體性能提升逾18%,擁有更多的知識、更強的編程和數學能力。Qwen2.5-72B模型在MMLU-rudex基準(考察通用知識)、MBPP基準(考察代碼能力)和MATH基準(考察數學能力)的得分高達86.8、88.2、83.1。Qwen2.5可生成最多8,000字內容,支援中文、英文、法文、西班牙文、俄文、日文、越南文與阿拉伯文等29種以上語言。
在多模態模型方面,阿里雲宣布視覺語言模型Qwen2-VL-72B開源,Qwen2-VL能識別不同分辨率和長寬比的圖片,理解20分鐘以上長視頻,具備自主操作手機和機械人的視覺智能體能力。