投递人 itwriter 发布于 2019-03-19 17:07 [收藏] « »

  文/李根  乾明  郭一璞

  来源:量子位(ID:QbitAI)

  中国古语有言:否极泰来。

  AI 芯片巨头英伟达的 2018,再糟糕不过,所以 2019 年 GTC 大会,也比以往更受关注。

  而且颇有意思的是,教主黄仁勋把这次的主题演讲地点选在了圣何塞州立大学礼堂。

  这所公立大学在硅谷小有名气,且在计算机领域,最有名的校友莫过于原 Intel 董事长高登·摩尔——“摩尔定律”就是以他之名命名。

  而老黄就是那个全世界最热衷宣扬“摩尔定律已经失效”的人。

  但这一次,老黄一句“摩尔定律”都没提,默默扔出 99 美元 AI 开发套件 Jetson Nano。

  具体情况怎么样,我们完整回顾下今年 GTC 发布情况。

  CUDA-X:50 倍提速

  首先,直接看核心重头戏:CUDA-X。

  按照英伟达的说法,这是全球唯一的一个,端到端的数据科学加速库。帮助从事数据分析、机器学习、深度学习的数据科学家们,更快的完成工作。

  CUDA-X 由十几个专用加速库组成。整个系统中,包含几个部分:用 cuDF 加速数据分析,用 cuDNN 深度学习原语,用 cuML 进行机器学习算法,和 DALI 等数据处理。

  简单来说,所有英伟达的库,都被整合成一个库:CUDA-X。

  包括 TensorFlow、PyTorch 和 MXNet 在内的所有深度学习训练框架,随着 CUDA-X 的发布也会自动为英伟达 Tensor Core GPU 进行优化。

  英伟达表示,CUDA-X 解锁了 Tensor Core GPU 的灵活性,能够将机器学习和数据科学工作负载加速多达 50 倍。CUDA-X 可以加速典型 AI 工作流程的每一步,无论是用深度学习训练语音和图像识别系统,还是数据分析评估抵押贷款组合的风险。

  而且据说,“只需要点击几下”。

  微软的 Azure Machine Learning(AML)是第一个集成 RAPIDS 的云服务,RAPIDS 是 CUDA-X 的关键组件。通过访问 RAPIDS 开源库,数据科学家可以让 AML 上的英伟达 GPU 以“前所未有”的速度进行预测分析。

  英伟达官方披露的数据称,在 AML 上使用 RAPIDS,可以帮助企业把训练 AI 模型所需的时间,减少多达 20 倍,训练时间可以从数天减少到数小时,或者从数小时减少到几分钟。

  此外,CUDA-X 还会部署在几大主流的云平台,包括亚马逊 AWS、谷歌云等。目前 PayPal、沃尔玛等公司已经在使用相关服务。

  值得一提的是,在介绍 CUDA-X 的时候,老黄还皮了一下。他说:每次演讲,我都想让你们记住一个关键词,今天的关键词是:

  PRADA。

  还让现场跟着一起念。看来接下来要发布的东西,可能还挺贵。

  PRADA 其实是四个单词的强行缩写,它也带代表对 CUDA-X 介绍的几个方面:PRogrammable (可编程)、Acceleration (加速)、Domains (域)、Architecture (架构)。

  史上最便宜 AI 硬件

  在老黄两个多小时讲完后,最让网友们念念不忘的,是一款出场非常晚、时间非常短的硬件产品:

  Jetson Nano。

  它是体积小巧、性能并不弱的小电脑,老黄称之为“全新的机器人计算机”,共有两个版本。

  一是 99 美元(约合人民币 666 元)的开发者套件,面向个人用户,比如创客、学生、技术爱好者;另一个版本 129 美元,可以部署到生产环境,面向的是想要构建边缘系统的企业。

  历次发布会都让人深感贫穷的英伟达,终于也价格厚道了。在 PRADA 的衬托下,更是感动人心。

  不少外媒纷纷打 call,因为 Jetson Nano 的价格让业余爱好者、学生之类的大众群体,可以打造自己的自动化设备。

  当场,老黄也拿出了一个基于 Jetson Nano 的无人车 Kaya。

  价格厚道,性能如何呢?Jetson Nano 能提供 472 GFLOPS 的计算性能,而耗电量只有 5 瓦。

  不久前 Google 发布的千元 TPU 开发板,单精度和半精度浮点运算性能分别是 32 和 64 GFLOPs;英特尔神经计算棒的性能是 100 GFLOPs。

  Jetson Nano 搭载了 4 核的 ARM A57 CPU 和 128 核基于英伟达 Maxwell 架构的 GPU,4GB 内存,使用 MIPI CSI-2 DPHY 通道摄像头。

  它也支持今天发布的 CUDA-X,也就是说有支持很多常见的人工智能框架,装有面向 Tegra 的 Linux 操作系统,实现了开箱即用。

  英伟达会后还展示了 Jetson Nano 运行 ResNet、Inception、VOLO 等各种神经网络模型,在目标检测、姿势估计等各类任务上进行推断的实际性能:

  此外,它还支持高分辨率传感器,而且可以并行处理多个传感器,并在每个传感器流上都运行多个神经网络。

  英伟达称,Jetson Nano 能够运行所有 AI 模型,可以创建数百万个智能系统。

  GTC 刚结束的时候,就有人在 HackerNews 上表示,自己想要 DIY 了。

  很快就有“同道中人”回复他,你可以自己做无人驾驶小车、能跟踪猫的无人机、可以自动识别鸟的摄像机等等。

  自动驾驶

  最后,自动驾驶,老黄说这是最重要的自动化机器的落地场景。

  也是三方面。

  首先,推出全新 DRIVE Constellation 自动驾驶汽车仿真平台。

  基于该平台,在云端就能虚拟仿真各种自动驾驶场景——不用再路测数百万公里了。

  老黄说,从常规驾驶,到各种罕见的危机情况,都能在仿真中实现,要风得风,求雨得雨。会比现实世界中实现的效率高出不知多少倍,而且成本低、安全性高。

  数据中心方案则去年就有过官宣。包括两个并排服务器:

  第一台服务器——DRIVE Constellation Simulator,从虚拟汽车生成传感器输出。

  第二台服务器——DRIVE Constellation Vehicle,包含 DRIVE AGX Pegasus AI 车载电脑。

  DRIVE AGX Pegasus 接收传感器数据,做出决定,然后将车辆控制命令发送回模拟器。

  老黄还强调,该过程完全闭环,而且定位精准、定时精确,测试环境也能随心所欲——不用怨天求神。

  其次,该平台完全开放,提供编程接口,允许 DRIVE Sim 生态系统合作伙伴集成他们的环境模型、车辆模型、传感器模型和交通场景。

  同时也通过整合合作伙伴的场景,让平台可以生成全面,多样化和复杂的测试环境。

  换而言之,玩法有点像虚拟仿真领域的 Apollo。

  英伟达也在这个“开放生态”里,集合了产业链上下游玩家。

  第三,英伟达还宣布了基于仿真平台的最新合作。

  并且合作方来头不小,是全球第一大车厂——丰田。

  老黄的意思也再明确不过,像丰田这样的大厂都当了首个客户,开放平台 DRIVE Constellation 的品质肯定值得信赖。

  此外,还是在 GTC 大会上,老黄还宣布推出新自动驾驶软件套件,该软件的主要组成部分是 Safety Force Field(SFF),通过加强规划和控制,实现更安全、舒适的驾驶体验,而且其算法策略主打车辆保护、乘客和其他车辆安全。

  在高级辅助驾驶领域,这会最先发挥作用。

  老传统:视觉渲染新突破

  当然,英伟达的 GTC,不炫下最新渲染成绩怎么行?

  今年新亮相的图像渲染引擎,让图片的渲染更快、更真实。

  NVIDIA Omniverse,3D 创作渲染协同工具,即使团队成员身处不同的时区,也能一起为同一个 3D 场景的创作出力。

  另外,现场还展示了一段视频:

  是不是很有大片感?

  同时,英伟达宣布 Adobe、Autodesk、Epic、Unity 等 16 家厂商也将得到 RTX 技术支持,帮助他们在复杂的场景中完成光线跟踪照明,用更快的速度进行图像渲染,这一技术支持在今年内将会服务 900 万创作者。

  另外,对于游戏玩家,英伟达推出了 GeForce NOW 云游戏服务,游戏在云端的电脑上运行,而玩家只要打开任何一台 PC 或者 MAC,就能让云端的游戏显示在自己的电脑上,无需下载、安装、升级、更新、装补丁,也不用担心自己的电脑配置不够了。

  显然,老黄也最爱这部分的 Demo 展示。

  不断播放视频,不断收获掌声,他还不断告诉大家:鼓掌太早了,好戏还在后面。

  甚至到后来,教主直接扔核弹语录:

  我常说,买得越多,省得越多,现在我觉得我错了……RTX Sever 根本就是免费的!省下的电费就能买一台服务器了!

  老黄の诚意

  不过今年 GTC,新品确实便宜得不像英伟达。

  会后,大家最主要的评价都集中在 Jetson Nano 上。

  更直接说是 99 美元售价上。

  虽然 TheVerge 也报道称,这种低价的 AI 开发套件,英伟达并非独一家。

  比如英特尔的 Neural Compute Stick 只需要 79 美元,谷歌在 Coral 下最近也推出了两款设备,分别是 150 美元的开发者套件和 79 美元 USB 加速设备。

  但不可否认的是,英伟达正在进入一个有潜力的市场,AI 驱动的创新正在增长。

  而且,对于今年 GTC 主题演讲关键词是 PRADA 的英伟达来说。

  99 美元,折合人民币 666 元。老黄的诚意,看得见。

  你觉得呢?

 
来自: 量子位(ID:QbitAI)
码云企业版,专注于助力企业开发 收藏 新浪微博 分享至微信
标签: 英伟达 AI

24小时阅读排行

    最新新闻

      相关新闻