share_log

英伟达开源3400亿参数模型Nemotron-4 340B

英偉達開源3400億參數模型Nemotron-4 340B

快訊 ·  06/15 15:11
當地時間6月14日,英偉達開源Nemotron-4 340B(3400億參數)系列模型。據英偉達介紹,開發人員可使用該系列模型生成合成數據,用於訓練大型語言模型(LLM),用於醫療保健、金融、製造、零售和其他行業的商業應用。Nemotron-4 340B包括基礎模型Base、指令模型Instruct和獎勵模型Reward。英偉達使用了9萬億個token(文本單位)進行訓練。Nemotron-4 340B-Base在常識推理任務,如ARC-c、MMLU和BBH基準測試中,可以和Llama-3 70B、Mixtral 8x22B和Qwen-2 72B模型媲美。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論