AI 前线导读:12 月 18 日,英伟达(NVDA.US) GTC China 2019 在苏州金鸡湖畔正式拉开序幕,英伟达创始人黄仁勋身披那件熟悉的黑色皮夹克,对这一年公司取得的各项成果进行汇报。
一年前,同样是在这个场地,GTC China 2018 开幕的前一天,英伟达股价「腰斩」,市值蒸发超 200 亿美元。此后的一年里,英伟达一改往日高调「嚣张」的态度,敛起锋芒,低调发展,以至于几乎一年多的时间里都没有听到英伟达的「豪言壮语」。
面对英伟达如此巨大的态度转变,人们不禁想问:英伟达这一年怎么了?
重磅技术发布回顾 新品带来「小惊喜」
「The more you buy,the more money you save!」
没错,当你看到这句话的时候,就应该知道:黄仁勋回来了,熟悉的皮夹克,熟悉的「塑料中文」。
今天,老黄在四个领域带来了几项重大发布和新品:
图形技术
图形技术方面,RTX 已经支持更多游戏的光影效果优化,微软的《我的世界》也在其中。另外,英伟达与腾讯 START 达成合作,为玩家提供云端游戏服务,即使终端性能不足,也无损游戏体验。
作为英伟达图形技术的王牌,RTX 已经被顶尖渲染平台采用,RTX Studio 更是包含 40 多个面向内容工作者打造的产品。此外,黄仁勋在现场发布了面向建筑行业的大型 3D 图形设计平台 OMNIVERSE,以前需要 485 个小时才能完成的渲染场景,现在只需要 40 小时。
HPC
黄仁勋称,加速计算需要完整的堆栈工具,而出色的芯片只是起点。每个应用程序领域都需要特殊的数学内核、算法库和应用程序软件优化。英伟达 CUDA 平台具有丰富的库、工具和应用程序。仅在去年,英伟达就发布了 500 多个 SDK 和库,其中既有全新内容,也有更新版本。在不断改进软件栈的基础上,用户已有 GPU 的性能也得到了提高,深度学习训练在 3 年内提高了 4 倍,深度学习推理在 1 年内提高 2 倍。
黄仁勋重点提到,英伟达为 CUDA 增加了两个新的主流应用:5G vRAN 和基因组处理。并且发布了一款基因组分析工具包 Parabricks。这是一个 CUDA 加速的基因组处理工具包,可与用于发现变异并能产生与行业标准 GATK 最近实践流程一致的结果。
注:基因组处理流程在行业标准中被称为 GATk。这一过程可根据参考绘制 DNA 短链,以重建基因组并找出变异,因此属于计算密集型任务。
PARABRICKS 的主要特征:
能实现 30~50 倍的加速;
能提供 DeepVariant 工具,利用深度学习技术进行基因变异检测。基于以上几种优势,目前已有基因技术公司采用了 PARABRICKS,借助若干 GUP 服务器,可以按照其测序仪生成数据的速率来处理基因组。
AI
在今天的发布会上,英伟达推出了 TensorRT 的最新版本 TensorRT 7。由于仅支持 CNN,去年发布的 TensorRT 5 饱受开发者诟病。相比之下,最新版 TensorRT 7 可支持各种类型的 RNN、transformer、CNN,能够融合水平与垂直方向的运算,为开发者设计大量 RNN 配置自动生成代码,逐点融合 LSTM 单元,甚至可以跨多个时间步长进行融合,并尽可能做到自动低精度处理。此外,TensorRT 7 可支持 1000 多种不同的计算变换和优化。黄仁勋举例说,有了 TensorRT 7 的支持,在 GPU 上编译会话模型只需要 0.3 秒。
最新发布的机器人平台芯片 Orin 能够处理更高精度的传感器与感知数据,且拥有更强大的安全和防范能力。
Orin 芯片
该芯片由 170 亿个晶体管组成,集成了 NVIDIA 新一代 GPU 架构和 Arm Hercules CPU 内核以及全新深度学习和计算机视觉加速器,每秒可运行 200 万亿次计算,几乎是 NVIDIA 上一代 Xavier 系统级芯片性能的 7 倍。
Orin 可处理在自动驾驶汽车和机器人中同时运行的大量应用和深度神经网络,并且达到了 ISO 26262 ASIL-D 等系统安全标准。
作为一个软件定义平台,DRIVE AGX Orin 能够赋力从 L2 级到 L5 级完全自动驾驶汽车开发的兼容架构平台,助力 OEM 开发大型复杂的软件产品系列。由于 Orin 和 Xavier 均可通过开放的 CUDA、TensorRT API 及各类库进行编程,因此开发者能够在一次性投资后使用跨多代的产品。
机器人
在智能机器人领域,英伟达发布发布 ISAAC SDK,提供模拟仿真和训练平台,包含多种预训练模型以及多种参考应用样例。
左:模拟场景;右:机器人学习后应用在真实场景里
通过仿真,开发人员可以在极端情况下(即困难或异常情况下)对机器人进行测试,以进一步加强对它的训练。将这些结果输入训练管道,使神经网络可以基于真实和模拟数据来提高准确性。
Isaac SDK 包括 Isaac Robotics Engine(提供应用程序框架),Isaac GEM(预先构建的深度神经网络模型、算法、库、驱动程序和 API),用于室内物流的参考应用程序以及 Isaac Sim 的第一个版本(提供导航功能)。
使用 Isaac Sim 训练机器人,并将所生成的软件部署到在现实世界中运行的真实机器人中。这有望大大加快机器人的开发速度,从而实现综合数据的训练。
在最后,一款 one more thing 的发布让人眼前一亮:
这个名叫 Leonardo 的机器人是 Isaac Sim 训练成果的最佳体现,可以通过模拟学习物体抓取,黄仁勋表示:这就是未来机器人的雏形。
看过了英伟达这一年的技术积累,下面要谈一谈这一年来英伟达的种种遭遇。
GPU 需求放缓,股价三次暴跌,英伟达曾陷入低谷
看到今天在台上依旧亢奋的黄老板,很难想象这是在一年内经历了三次低谷打击的人。
一年前,GTC China 2018 前一天,英伟达股价 暴跌约 18%,股价下滑至 164.43 美元 / 股,随后几天更一度跌到 145 美元。虽然当时的发布会上的黄仁勋尽力在炒热现场气氛,但是会后取消采访环节这一举动还是能够感受到一丝无奈。
彼时,黄仁勋曾表示:股价下跌与加密货币热潮退散有直接关系。2017-2018 年,加密货币陷入狂热,对算力的需求也暴增,英伟达 GPU 的价格也因此被炒高,这使得一些买家望而却步。随着热潮消退,游戏卡的价格回落至正常水平,英伟达自然希望那些被价格挡在门外的买家能再次回来,推动销量增长。
然而,一切并没有想象的那么顺利。很长一段时间里,英伟达芯片的库存都处于积压状态,英伟达 CFO Colette Kress 接受采访时表示:要完全解决 GPU 过剩问题,可能还需要 1~2 个季度。
出于谨慎的考虑,1 月 28 日,英伟达发布业绩预警,将第四季度营收预估下调 5 亿美元,直接导致股市开盘后英伟达股价一度 暴跌 17% 以上,最终收盘股价为 138.01 美元,下跌 13.82%,第二天则以 131.6 美元的价格收盘。
有分析师认为:市场对于芯片的需求放缓依旧是困扰英伟达发展的一大问题。或许正是出于这样的考虑,英伟达在 3 月以创纪录的 69 亿美元收购以色列芯片设计公司 Mellanox,成英伟达史上最大收购案。业内人士认为:英伟达此举是希望摆脱对加密货币以及游戏市场的依赖,从而专心将业务中心放在芯片技术上。
钱花出去了,但是见效仍然需要等待。今年 5 月,英伟达发布了第一季度的财报。财报显示:英伟达 2019 年一季度营收达到 22.2 亿美元,但相比去年同期的 30.07 亿美元,下降超过 30%;净利润则更是引发担忧:3.94 亿美元的净利润与去年同期的 12.44 亿美元相比,下降甚至达到 68%。
一波未平一波又起,当英伟达还没来得及为下一季度的营收担忧时,6 月 18 日,美国政府又将 5 家以开发芯片和超级计算机为主的中国企业和机构拉进「黑名单」,随之而来的是美国芯片企业的股价集体暴跌,其中英伟达以 151.76 美元 的价格收盘。
8 月,英伟达第二季度财报发布,财报显示:英伟达这一季度的营收为 25.79 亿美元,同比减少 30%,较上一财季的 22.2 亿美元环比增长了 16%;净利润为 5.52 亿美元,去年同期为 11.01 亿美元,同比下滑 50%。
连续两个季度的利润下滑,同时伴随着三次严重的股价下跌,英伟达的 2019 上半年收获了一份不太好看的成绩单。
低调发布新品 转身拥抱超算,能否绝处逢生?
经历了几番重挫,英伟达变得收敛且低调了,同时也调转船头,向着芯片、超算为主的业务发展。
英伟达在 3 月收购的 Mellanox 以其 InfiniBand 互连技术而闻名,该技术与高速以太网产品配合使用,可以快速地通过系统传输数据,简单来说,就是可以将许多小型计算机连接成大型计算机。黄仁勋曾表示:对 Mellanox 的收购旨在解决通过智能网络结构连接大量快速计算节点,以形成巨大的数据中心规模计算引擎的整体架构。
借助 Mellanox,英伟达能够为客户提供更高的性能,更高的利用率和更低的运营成本。不难看出,芯片业务发展滞缓的情况下,英伟达将目标瞄准了超算。
6 月,英伟达宣布与 Arm 合作开发超级计算机,更是坐实了这一猜测。英伟达加速计算部门副总裁伊恩·巴克表示:Arm 技术能够为超级计算提供一个开放的架构。
同样在 6 月,英伟达推出了全球排名第 22 的超级计算机:DGX SuperPOD。据英伟达官方介绍:它仅用三周时间就内置了 96 台 NVIDIA DGX-2H 超级计算机和 Mellanox 互连技术,具有 9.4 petaflops 的处理能力,可以训练安全自动驾驶车辆所需的大量深度神经网络。
11 月,SC19 超算大会上,英伟达正式宣布:Arm 处理器可以使用来自英伟达的 GPU 加速技术,比如 CUDA。此外,一款 GPU 新品也低调亮相——Tesla V100s,但是据参加活动的媒体报道:黄仁勋在当天的演讲中并没有提到这款产品。
低调的新品、拥抱超算的决心,英伟达在绝境中寻找生机。11 月 15 日,英伟达发布了第三季度的财报,报告显示,英伟达第三季度营收为 30.14 亿美元,与上年同期的 31.81 亿美元相比下降 5%;净利润为 8.99 亿美元,与上年同期的 12.30 亿美元相比下降 27%。
虽然各项数据与去年同期相比仍然较低,但是能明显看到差距在缩小——英伟达正在努力恢复元气。
结语
身穿黑色皮夹克的黄仁勋甩掉了一身的疲惫,站在舞台中央时又是精神抖擞,英伟达在 2019 年遭遇的种种也终会随着时间的流逝而过去。虽然如芯片业务等诸多问题仍然有待解决,但是一切都在向好的方向发展,或许就在不久之后,「核弹厂」又能爆发出新的威力。
编辑/Gary