share_log

商汤发布日日新5.0大模型

商湯發佈日日新5.0大模型

快訊 ·  04/23 14:53
商湯科技今日發佈日日新5.0大模型,採用MOE混合專家架構,基於超過10TB tokens訓練,推理上下文窗口200K,全面對標GPT-4 Turbo。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論