share_log

微软出招,新模型数学超GPT-4o编程胜Llama3.3,训练新范式引热议:midtraining

微軟出招,新模型數學超GPT-4o編程勝Llama3.3,訓練新範式引熱議:midtraining

快訊 ·  03:51

微軟推出最新小模型Phi-4。參數量僅14B,MMLU性能就和Llama 3.3/ Qwen2.5等70B級別大模型坐一桌。數學能力上,Phi-4在美國數學競賽AMC 10/12上超過了GPT-4o等一衆大模型,分數衝上90。編程能力也是開源模型一流,超過了70B的Llama 3.3和72B的Qwen 2.5。微軟在技術報告中還提出了一個新的訓練範式——midtraining。(量子位)

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論