上海人工智能實驗室司南大模型評測產品負責人葛佳燁表示,大語言模型評測中面臨全面性、評測成本、數據污染、魯棒性等挑戰。她表示,評測數十萬道題需要大量算力資源,基於人工打分的主觀評測成本高昂。同時,海量語料不可避免帶來評測集污染,亟需可靠的數據污染檢測技術。此外,大模型對提示詞十分敏感,多次採樣情況下模型性能不穩定。
繁體中文
返回
- English
- 繁體中文
- 简体中文
- 深色
- 淺色
立即開戶
- 快訊
- 詳情
譯文內容由第三人軟體翻譯。
以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
風險及免責聲明
以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
我知道了
風險及免責聲明
以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
我知道了
搶先評論
0 0 0
讚好勁正笑哭社會社會Emm惨惨嬲嬲
輕觸選擇心情
- 分享到weixin
- 分享到qq
- 分享到facebook
- 分享到twitter
- 分享到微博
- 粘贴板
使用瀏覽器的分享功能,分享給你的好友吧
點擊這裡與好友分享
暫無評論,快來留言吧!
資訊熱榜
更新時間