share_log

商汤绝影许亮:AI大模型上车,将彻底颠覆原有的研发模式 | T-EDGE@CTIS

TMTPost News ·  Jun 14 15:36

商汤绝影智能汽车事业群智能座舱副总裁 许亮

随着生成式AI大热,人工智能已经成为各个垂直行业必然要解锁的「科技树」。而如何让前沿技术真正贴近生活?未来科技又有怎么样的可能?这是一个需要技术方、平台方、场景方、品牌方还有消费者,去共同想象和探索的开放命题。

而在AI的推动下,全球各大车企也纷纷开始探讨如何将AI应用到汽车产业链条中,通过差异化体验来建立独有的优势,从而在非常“卷”的汽车行业冲出重围。

6月13日,在“AI驱动汽车新变革”这一议题下,钛媒体携手环球资源在“消费者科技及创新展览会”(CTIS)期间,举办了2024T-EDGE未来科技大会@CTIS,并邀请到了商汤绝影智能汽车事业群智能座舱副总裁许亮,分享商汤在大模型时代对智能汽车的思考、研发投入及行业变革的见解。

在许亮看来,大模型的兴起,尤其是GPT-4的发布,已经深刻影响了我们的生活,带来了多模态融合的新概念。

而对于AI在汽车领域的变革,许亮将其具体体现总结为三个核心方面:首先,许亮认为大模型将彻底颠覆原有的研发模式,显著提升生产效率。过去,自动驾驶等技术研发依赖大量算法和代码生成,耗费了大量的工程师资源。大模型的引入能够显著提高效率,特别是在新研发方向切换时,将带来质的飞跃。

其次,在交互体验方面,大模型带来了全新的变革。从文本到文本+视频,再到多模态的演化,技术进步使得人机交互更加接近于真人模拟环境。这种技术不仅应用于汽车,还将深深融入我们的生活,带来显著变化。最后,许亮还谈到了万物互联的智能体。在他看来,智能家电和万物互联的概念早已存在,但主要通过远程控制实现。未来,万物互联的智能体将大大改变我们对生活场景的控制方式,使其更加智能和便捷。

同时,许亮也谈到了大模型技术的挑战,尤其是在技术演进和研发投入方面。他提到,大模型的端到端设计对模型能力、数据及研发投入提出了高要求,但这些努力将带来生活和汽车应用的巨大突破。

他预测,这个行业未来每几个月就会有重大的技术突破,带来新的惊喜和体验。像现在这种大模型的上车已经陆陆续续出现了,商汤绝影在今年的北京车展上发布了大模型的矩阵,并计划在未来与多家车厂合作,推动技术的实际应用。

而在通用人工智能的发展中,许亮强调了“尺度定律”的重要性,追求模型的最佳性能和最优解,模型参数的增加和高质量数据的获取是核心要素。他回顾了商汤在大模型上的投入,指出从2018年起,公司就开始布局视觉、语言类及生成式的大模型。在2023年,商汤发布了“日日新”大模型的矩阵,并在4月23日提升到5.0版本,与多家行业领军企业探讨合作价值。

许亮还特别提到了商汤与小米集团的合作,小米汽车发布的多模态大模型背后正是商汤的技术支持。他强调,商汤的5.0版本大模型在知识、推理、代码层面上已经全面对标GPT-4,未来公司将继续加大研发投入,提取更高质量的数据,进一步提升模型性能,为整个行业带来更好的发展前景。

会上,许亮也详细阐述了整个公司GPU的投入情况以及分享了AI技术在车辆领域的实际应用进展。他指出,自2018年起,商汤开始大规模投入GPU基础算力设施建设,目前运营4.5万块GPU,年底峰值算力将达到18000 P 成为行业内的重要力量。

许亮强调,在大模型时代,模型参数的提升必然会带来对算力的需求,因此商汤也致力于融合国产芯片算力,支持了58款国产化芯片的计算能力,实现从硬件到软件再到行业数据的综合性生态融合。

在智能汽车应用方面,商汤绝影的使命是利用AI技术,特别是大模型时代带来的红利,推动智能汽车从1.0向超级智能体的转变。许亮将商汤绝影的思考聚焦在三个方面:智能驾驶、智能座舱和AI智能体。他提到,商汤绝影提出了端到端自动驾驶解决方案,并推出多模态座舱大脑的概念,计划未来推出AI智能体,致力于在视觉和汽车产业结合的过程中取得快速进展。

随后,许亮详细阐述了商汤在智能驾驶领域的成果和计划。商汤在2022年底推出了UniAD,这是国内首个感知决策一体的端到端自动驾驶解决方案,通过一个大模型实现从输入到最终规控的整个自动驾驶过程,显著提高了性能,尤其在复杂路况下表现出色。目前,商汤已在多条道路上进行了公开测试,并计划在明年与多家车厂开展实质性合作。

在智能座舱方面,许亮指出,AI特别是深度学习基于视觉技术的应用,极大提升了汽车的安全性和用户体验。传统物理传感器的应用存在局限,而视觉技术相当于汽车的眼睛,能够感知座舱内外的真实环境,提供超过60%的信息量。他提到,商汤绝影已经推出了包括DMS(驾驶员监控系统)和OMS(乘客监控系统)在内的20多个视觉模型,帮助行业向标准化方向发展。

同时,商汤在多模态大模型的应用上,也展示了其在复杂指令处理方面的突破。许亮举例说明了复杂指令如“等会如果小红书睡着了把空调和窗户调整一下”的处理方式,这类指令包含模糊的语言和人物状态描述,传统的车控方案无法应对,而多模态大模型则能够有效处理,实现更加智能化的交互体验。

许亮还提到,商汤在座舱感知方面的应用,能够处理驾驶员的无意识状态,如身体突然趴在车上等危险场景,通过多模态大模型可以提供更好的检查结果和感知信号。这在满足2026年ENCAP法规的要求上具有重要意义,商汤提出了全新的解决方案,带来真正智能化的座舱体验,彻底颠覆现有车机架构。

除此之外,许亮还展示了商汤绝影在北京车展上发布的多模态场景核心矩阵,并介绍了与多家车厂的合作进展,预计今年下半年这些技术将正式应用于实际车辆中。他强调,多模态模型在提升识别准确率和感知信号方面的重要性,并指出商汤绝影正与芯片公司合作,从云端部署逐步迁移到端上部署,以保证模型的低延时和高性能。

最后,许亮总结了商汤绝影在智能座舱和智能汽车领域的使命,即通过AI技术提高用户的交互体验,降低沟通成本,增强交通和科技的便利性。他表示,商汤绝影将继续推动智能座舱从1.0时代向全面智能体的转变,希望在这一过程中不断带来新的产品和惊喜,为行业注入新的活力。商汤绝影的口号“AGI通用人工智能引起智能座舱体验的新时代”已成现实,期待未来带来更多创新和变革。

The above content is for informational or educational purposes only and does not constitute any investment advice related to Futu. Although we strive to ensure the truthfulness, accuracy, and originality of all such content, we cannot guarantee it.
    Write a comment