share_log

商汤绝影许亮:AI大模型上车,将彻底颠覆原有的研发模式 | T-EDGE@CTIS

商湯絕影許亮:AI大模型上車,將徹底顛覆原有的研發模式 | T-EDGE@CTIS

鈦媒體 ·  06/14 15:36

商湯絕影智能汽車事業群智能座艙副總裁 許亮

隨着生成式AI大熱,人工智能已經成爲各個垂直行業必然要解鎖的「科技樹」。而如何讓前沿技術真正貼近生活?未來科技又有怎麼樣的可能?這是一個需要技術方、平台方、場景方、品牌方還有消費者,去共同想象和探索的開放命題。

而在AI的推動下,全球各大車企也紛紛開始探討如何將AI應用到汽車產業鏈條中,通過差異化體驗來建立獨有的優勢,從而在非常“卷”的汽車行業衝出重圍。

6月13日,在“AI驅動汽車新變革”這一議題下,鈦媒體攜手環球資源在“消費者科技及創新展覽會”(CTIS)期間,舉辦了2024T-EDGE未來科技大會@CTIS,並邀請到了商湯絕影智能汽車事業群智能座艙副總裁許亮,分享商湯在大模型時代對智能汽車的思考、研發投入及行業變革的見解。

在許亮看來,大模型的興起,尤其是GPT-4的發佈,已經深刻影響了我們的生活,帶來了多模態融合的新概念。

而對於AI在汽車領域的變革,許亮將其具體體現總結爲三個核心方面:首先,許亮認爲大模型將徹底顛覆原有的研發模式,顯著提升生產效率。過去,自動駕駛等技術研發依賴大量算法和代碼生成,耗費了大量的工程師資源。大模型的引入能夠顯著提高效率,特別是在新研發方向切換時,將帶來質的飛躍。

其次,在交互體驗方面,大模型帶來了全新的變革。從文本到文本+視頻,再到多模態的演化,技術進步使得人機交互更加接近於真人模擬環境。這種技術不僅應用於汽車,還將深深融入我們的生活,帶來顯著變化。最後,許亮還談到了萬物互聯的智能體。在他看來,智能家電和萬物互聯的概念早已存在,但主要通過遠程控制實現。未來,萬物互聯的智能體將大大改變我們對生活場景的控制方式,使其更加智能和便捷。

同時,許亮也談到了大模型技術的挑戰,尤其是在技術演進和研發投入方面。他提到,大模型的端到端設計對模型能力、數據及研發投入提出了高要求,但這些努力將帶來生活和汽車應用的巨大突破。

他預測,這個行業未來每幾個月就會有重大的技術突破,帶來新的驚喜和體驗。像現在這種大模型的上車已經陸陸續續出現了,商湯絕影在今年的北京車展上發佈了大模型的矩陣,並計劃在未來與多家車廠合作,推動技術的實際應用。

而在通用人工智能的發展中,許亮強調了“尺度定律”的重要性,追求模型的最佳性能和最優解,模型參數的增加和高質量數據的獲取是核心要素。他回顧了商湯在大模型上的投入,指出從2018年起,公司就開始佈局視覺、語言類及生成式的大模型。在2023年,商湯發佈了“日日新”大模型的矩陣,並在4月23日提升到5.0版本,與多家行業領軍企業探討合作價值。

許亮還特別提到了商湯與小米集團的合作,小米汽車發佈的多模態大模型背後正是商湯的技術支持。他強調,商湯的5.0版本大模型在知識、推理、代碼層面上已經全面對標GPT-4,未來公司將繼續加大研發投入,提取更高質量的數據,進一步提升模型性能,爲整個行業帶來更好的發展前景。

會上,許亮也詳細闡述了整個公司GPU的投入情況以及分享了AI技術在車輛領域的實際應用進展。他指出,自2018年起,商湯開始大規模投入GPU基礎算力設施建設,目前運營4.5萬塊GPU,年底峯值算力將達到18000 P 成爲行業內的重要力量。

許亮強調,在大模型時代,模型參數的提升必然會帶來對算力的需求,因此商湯也致力於融合國產芯片算力,支持了58款國產化芯片的計算能力,實現從硬件到軟件再到行業數據的綜合性生態融合。

在智能汽車應用方面,商湯絕影的使命是利用AI技術,特別是大模型時代帶來的紅利,推動智能汽車從1.0向超級智能體的轉變。許亮將商湯絕影的思考聚焦在三個方面:智能駕駛、智能座艙和AI智能體。他提到,商湯絕影提出了端到端自動駕駛解決方案,並推出多模態座艙大腦的概念,計劃未來推出AI智能體,致力於在視覺和汽車產業結合的過程中取得快速進展。

隨後,許亮詳細闡述了商湯在智能駕駛領域的成果和計劃。商湯在2022年底推出了UniAD,這是國內首個感知決策一體的端到端自動駕駛解決方案,通過一個大模型實現從輸入到最終規控的整個自動駕駛過程,顯著提高了性能,尤其在複雜路況下表現出色。目前,商湯已在多條道路上進行了公開測試,並計劃在明年與多家車廠開展實質性合作。

在智能座艙方面,許亮指出,AI特別是深度學習基於視覺技術的應用,極大提升了汽車的安全性和用戶體驗。傳統物理傳感器的應用存在侷限,而視覺技術相當於汽車的眼睛,能夠感知座艙內外的真實環境,提供超過60%的信息量。他提到,商湯絕影已經推出了包括DMS(駕駛員監控系統)和OMS(乘客監控系統)在內的20多個視覺模型,幫助行業向標準化方向發展。

同時,商湯在多模態大模型的應用上,也展示了其在複雜指令處理方面的突破。許亮舉例說明了複雜指令如“等會如果小紅書睡着了把空調和窗戶調整一下”的處理方式,這類指令包含模糊的語言和人物狀態描述,傳統的車控方案無法應對,而多模態大模型則能夠有效處理,實現更加智能化的交互體驗。

許亮還提到,商湯在座艙感知方面的應用,能夠處理駕駛員的無意識狀態,如身體突然趴在車上等危險場景,通過多模態大模型可以提供更好的檢查結果和感知信號。這在滿足2026年ENCAP法規的要求上具有重要意義,商湯提出了全新的解決方案,帶來真正智能化的座艙體驗,徹底顛覆現有車機架構。

除此之外,許亮還展示了商湯絕影在北京車展上發佈的多模態場景核心矩陣,並介紹了與多家車廠的合作進展,預計今年下半年這些技術將正式應用於實際車輛中。他強調,多模態模型在提升識別準確率和感知信號方面的重要性,並指出商湯絕影正與芯片公司合作,從雲端部署逐步遷移到端上部署,以保證模型的低延時和高性能。

最後,許亮總結了商湯絕影在智能座艙和智能汽車領域的使命,即通過AI技術提高用戶的交互體驗,降低溝通成本,增強交通和科技的便利性。他表示,商湯絕影將繼續推動智能座艙從1.0時代向全面智能體的轉變,希望在這一過程中不斷帶來新的產品和驚喜,爲行業注入新的活力。商湯絕影的口號“AGI通用人工智能引起智能座艙體驗的新時代”已成現實,期待未來帶來更多創新和變革。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論