大模型賦能智能座艙！NVIDIA深度適配通義千問大模型

快科技 · 09/20 11:07

快科技9月20日消息，在杭州雲棲大會上，NVIDIA DRIVE Orin系統級芯片實現了與阿里雲通義千問多模態大模型Qwen2-VL的深度適配。

阿里雲、斑馬智行聯合NVIDIA英偉達推出艙駕融合大模型解決方案，基於通義大模型開發「能聽會看」的智能座艙助理，讓車內人員通過語音交流就能操作座艙內的各類應用，享受極致豐富的交互體驗。

據悉，通義大模型的智能座艙解決方案，能爲座艙配備一位具備感知、思考、決策能力的「智能助理」，它不僅能觀察理解用戶的語音、手勢，還能根據環境信息和常識判斷做出自主決策。乘客無需物理按鍵，只要動動嘴巴，就能讓智能助理完成各種任務。

這個解決方案以通義大模型爲「大腦」，集成了通義大語言模型Qwen2-7B和通義多模態模型Qwen2-VL。Qwen2-VL是阿里通義實驗室研發的新一代視覺語言模型，具備業界最強的圖片識別能力和視覺智能體能力，在多個國際權威測評中創下同等尺寸最優成績。

Qwen2-VL的2B和7B參數模型因其性能和尺寸的「極致性價比」，尤其適合汽車等端側場景。同時，通義實驗室最新發布的Mobile Agent V3首次落地汽車座艙場景，提供座艙屏幕感知、複雜任務規劃以及座艙應用 UI的操作決策能力，大大擴展座艙智能助理的能力邊界。

本次解決方案基於端雲一體架構，端側通義大模型經NVIDIA 英偉達自動駕駛和座艙芯片NVIDIA DRIVE Orin加速。NVIDIA英偉達提供了強大的芯片適配技術支持，通過優化GPU 架構和驅動軟件，確保充分發揮大模型的性能潛力。

此外，NVIDIA的模型加速技術有效降低了大模型在實時處理複雜任務時的計算成本和時間延遲，爲用戶創造了流暢無阻的智能體驗。

未來，通義大模型還將採用 NVIDIA DRIVE Thor新一代集中式車載計算平台。

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

大模型赋能智能座舱！NVIDIA深度适配通义千问大模型