share_log

Amazon推出新一代基礎模型Amazon Nova 擬明年首季推出語音到語音模型

AASTOCKS ·  12/04 15:34

Amazon在2024 re:Invent全球大會上,宣布推出新一代基礎模型Amazon Nova。Amazon Nova模型將透過Amazon Bedrock提供,當中包括超快速文本生成模型Amazon Nova Micro,以及能夠處理文本、圖像和影片並生成文本的多模態模型Amazon Nova Lite、Amazon Nova Pro 和Amazon Nova Premier。此外,Amazon推出了兩個全新的模型—用於生成專業級圖像的Amazon Nova Canvas和用於生成專業級影片的Amazon Nova Reel。

Amazon通用人工智能高級副總裁Rohit Prasad表示,在Amazon內部,公司正在開發約1,000個生成式AI應用程式,因此公司可以全面了解開發人員所面臨的挑戰。新一代的Amazon Nova模型旨在協助內外部開發人員應對這些挑戰,提供卓越的智能和內容生成功能,並在延遲性、成本效益、客製化、檢索增強生成(RAG)和代理智能(agentic)等方面取得顯著進展。

Amazon Nova包含四款先進的模型。Amazon Nova Micro是一款只針對處理文本的模型,能夠以極低的延遲和成本提供回應。Amazon Nova Lite是一款高性價比的多模態模型,能夠快速處理圖像、影片和文本輸入;Amazon Nova Pro是一款功能強大的多模態模型,能夠在準確性、速度和成本之間取得最佳平衡,適用於多種應用場景;Amazon Nova Premier作為Amazon的頂級多模態模型,專為複雜推理任務而設,並將其作為蒸餾客製化模型(distilling custom models)的最佳典範模型(teacher model)使用。目前,Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro已全部正式可用,Amazon Nova Premier預計將在明年第一季度推出。

另外,Amazon Nova Canvas是一款先進的圖像生成模型,能夠根據輸入的文本或圖像生成專業級的視覺內容。而Amazon Nova Reel是一款先進的影片生成模型,讓客戶能輕鬆從文本和圖像創建高品質影片,適用於廣告、行銷和培訓等內容創作。

Amazon計劃在明年第一季度推出Amazon Nova語音到語音模型。該模型旨在通過理解自然語言的流式語音輸入,傳譯語言和非語言訊號,提供流暢、接近真人的互動,徹底改變對話式AI應用,並確保低延遲的雙向交流。

此外,Amazon正在開發一種新模型,能接受文本、圖像、音訊和影片作為輸入,並以任意模態生成輸出。這款具備本地多模態到多模態-即「任意到任意」模態能力的Amazon Nova模型預計將在明年中旬推出。該模型將簡化應用程式開發過程,使同一模型能夠執行多種任務,如內容模態轉換、內容編輯,以及驅動能夠理解和生成所有模態的AI代理。

以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論