快科技10月17日消息,今天,NVIDIA悄然開源了名爲Nemotron-70B的AI模型。
這款模型一經發布便在多個基準測試中超越了包括OpenAI的GPT-4和Anthropic的Claude 3.5 Sonnet在內的140多個開閉源模型,僅次於OpenAI的最新模型o1。
對此AI社區驚呼,新的開源王者又來了?業內更是表示,用Llama 3.1訓出小模型吊打GPT-4o,簡直是神來之筆。
從命名上可以看出,Nemotron-70B基於Llama-3.1-70B開發,在沒有專門提示和額外推理token的情況下,Nemotron-70B也能答對複雜的推理問題,如「草莓有幾個r」的經典難題。
業內人士評價,NVIDIA在Llama 3.1基礎上訓練出的這個不太大模型,能夠超越GPT-4o和Claude 3.5 Sonnet,是一次技術上的飛躍。
目前,Llama-3.1-Nemotron-70B-Instruct已經可以在線體驗。
此外,英偉達還開源了Nemotron的訓練數據集 HelpSteer2,包括如下:
構建了21362個提示響應,使模型更符合人類偏好,也更有幫助、更符合事實、更連貫,並且可以根據複雜度和詳細度進行定製;
構建了20324個用於訓練的提示響應,1038個用於驗證。