share_log

智源大模型权威评测:百度文心4.0登顶国内外“百模”榜,豆包、kimi等追随其后

智源大模型權威評測:百度文心4.0登頂國內外“百模”榜,豆包、kimi等追隨其後

快訊 ·  06/17 19:16
近日,由北京智源研究院打造的FlagEval天秤大模型評測平台實現了全面升級,並公佈202406期FlagEval模型評測排行榜單。最新一期榜單顯示,百度文心大模型4.0以89.72的綜合評分在閉源對話模型中排名第一,超過字節雲雀、豆包和阿里通義千問等一衆國產大模型,以及OpenAI的最新模型GPT-4o。在中文語境下,以文心大模型爲代表的國內頭部語言模型的綜合表現已超過國際一流水平的表現。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論