share_log

DeepSeek-V3首个版本上线

DeepSeek-V3首個版本上線

快訊 ·  08:25

幻方量化全新系列模型DeepSeek-V3首個版本上線並同步開源,API服務已同步更新,接口配置無需改動。當前版本的DeepSeek-V3暫不支持多模態輸入輸出。據介紹,DeepSeek-V3爲自研MoE模型,671B參數,激活37B,在14.8Ttoken上進行了預訓練,其多項評測成績超越了Qwen2.5-72B和Llama-3.1-405B等其他開源模型,並在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論