盘一盘NVIDIA Jetson家族的前浪和后浪!
NVIDIA Jetson系列截至目前已经推出了5代产品了,Xavier经过几年的发展已经在AI市场占据了绝对领导地位,而最近的NVIDIA GTC厨房发布会上,黄教主又推出了新一代GPU架构安培,高达2000Tops算力的GPU A100成为新的带头大哥,在Xavier还未退居二线之前,盘一下NVIDIA推出的Jetson平台产品,算是给自己一直以来所追的“星”做个Mark。毕竟也是曾经加班加点的研究,这也算是另一种追星发烧友不是。
什么是Jetson
NVIDIA定义Jetson为适用于新一代自主机器的嵌入式系统,号称是适用于一切自主机器(Autonomous Machines)的AI平台。
根据NVIDIA官网介绍,Jetson系统所提供的性能和能效可提高自主机器软件的运行速度,而且功耗更低。Jetson每个系统都是一个完备的模块化系统 (SOM),具备 CPU、GPU、PMIC、DRAM 和闪存,并且具备可扩展性。对于开发者和用户来说,只需选择适合应用场景功能需求的 SOM,即能够以此为基础构建系统。这就是NVIDIA提供的AI计算平台解决方案,对于Jetson系列而言,从TX2开始,这些解决方案全部使用相同的软件堆栈架构和 SDK,可在整个产品组合中实现一个代码基和无缝部署。
Jetson 模块可以支持需要各种性能级别和价格的大量应用需求,包括开发者、配套商,以及工程服务企业。比如我们熟悉的基于Xavier开发的域控制器产品用于无人驾驶系统。
Jetson平台从探索性的TK1,到AI硬件龙头Xavier,以及推出不久的小而美的Nano套件,一共推出了5款产品。
目前TK1已经是古董了,TX1也已停产,只有在某些淘宝店可以看到了,TX2还在发挥余热,但是算力不足已经让市场对它逐渐失去兴趣,Xavier正处于当打之年,扛把子的存在,已经实现了部分量产,Nano这个小巧的开发套件个人感觉不太适合做产品用,而是更适合高校教学和学生实践。
下面来逐一看看Jetson家族这些宝贝。
二、Jetson家族产品横向对比
Jetson系列产品支持需要各种性能级别和价格的大量应用场合,例如 AI 网络视频录像机 (NVR)、高精度制造领域中的自动光学检查 (AOI) 以及自主移动机器人 (AMR)等。因此,可在边缘设备的嵌入式系统中高效引入现代 AI、深度学习和推理。目前主流的Nano、TX2、Xavier产品性能对比如下。
、Jetson系列产品特性介绍
3.1 最新产品Nano
Jetson Nano是一款低成本的 AI 平台,具备较高的性能和能效,可以运行计算量不大的 AI 工作负载和多个神经网络,以及同时处理来自多个高清传感器的数据。这使其成为向嵌入式产品中添加高级 AI 的最理想选择。官方售价899RMB,相当超值。
Jetson Nano产就绪型模组系统 (SOM)
Jetson Nano 模组仅有 70 x 45 毫米,体积非常小巧。可以为多个行业(从智慧城市到机器人)的边缘设备部署 AI 时提供强大支持。
NVIDIA Jetson Nano推出开发者套件,作为一种功能强大的小型计算机,可以并行运行多个神经网络,从而实现图像分类、物体检测、分割和语音处理等应用。且运行功率仅为 5 瓦。
NVIDIA JETSON NANO 开发者套件
3.2当代扛把子Xavier
NVIDIA官网这样介绍:Jetson AGX Xavier 为边缘设备的计算密度、能效和 AI 推理能力树立了新的标杆。作为现在AI计算的扛把子,其尺寸仅为 100 x 87 mm,只是工作站的 1/10,但性能媲美大型工作站。Xavier具有高达 32 TOPS的峰值计算能力和 750 Gbps 的高速 I/O 性能。全负载功耗30W,性能和能效分别比前代产品 NVIDIA Jetson TX2 高出 20 倍。
Jetson AGX Xavier
Jetson AGX Xavier作为全球首款专为自主机器打造的计算机,具有六个计算机主板,用于处理传感器数据和运行自主机器软件,其超高性能,足以完成视觉测距、传感器融合、定位与地图绘制、障碍物探测,以及路线规划算法等计算任务。适合配送和物流机器人、工厂系统和大型工业 UAV 等自主机器。
基于Jetson AGX Xavier 可以打造出 AI 助力的自主机器,在边缘提供更高级别的计算密度、能效和 AI 推理能力。其运行功率低至 10W,得益于 NVIDIA丰富的 AI 工具和生态环境,开发者可以快速训练和部署神经网络。
Jetson AGX Xavier 8GB 是一款价格实惠的低功率 Jetson AGX Xavier,可与现有的 Jetson AGX Xavier 实现完整的软硬件兼容性。其整个模块最高消耗 20W 功率,同时提供高达 20 TOPS 的 AI 性能。该产品自 2019 年 8 月起发售。
用户可以使用价格实惠的低功率 Jetson AGX Xavier 8GB 模块,以 10W 或 20W 功率为其应用程序配置操作模式,或使用 Jetson AGX Xavier 模块并以 10W、15W 或 30W 功率进行此项配置。
NVIDIA Jetson AGX Xavier 开发者套件,它包含了助您轻松上手和快速开发产品的各种软硬件。
NVIDIA Jetson AGX Xavier 开发者套件
Jetson Xavier NX将 NVIDIA Xavier SoC 的强大性能封装到很小的模块中,外形尺寸只有 70 x 45 mm与Nano相当,但是具备丰富的IO(从高速 CSI 和 PCIe 到低速 I2C 和 GPIO)。Xavier NX可为边缘提供性能高达 21 Tops 的加速 AI 计算。它能并行运行多个现代神经网络,处理来自多个高分辨率传感器的数据,进而满足完整 AI 系统的需求。Jetson Xavier NX 是NVIDIA所谓的生产就绪产品,金手指插卡接口,方便产品设计扩展。
Jetson Xavier NX
Jetson Xavier NX具有云原生支持,使开发人员可以在嵌入式和边缘设备上构建和部署高质量的软件功能。NVIDIA NGC和NVIDIA Transfer Learning Toolkit提供的经过预先训练的AI模型提供了一条通往训练过并优化过的AI网络的更快的路径,而Jetson设备的容器化部署则可以实现灵活,无缝的更新。
Jetson Xavier NX的性能比其前身Jetson TX2高出10倍以上,适用于无人机、便携式医疗设备、小型商业机器人、智能摄像头、高分辨率传感器、自动光学检测、智能工厂和其他 IoT 嵌入式系统等高性能 AI 系统。
NVIDIA Jetson Xavier NX 开发者套件包括一个Jetson Xavier NX模组,开发者可以基于NVIDIA提供的软件架构开发更多AI应用程序,而功耗不超过10 W。
NVIDIA Jetson Xavier NX 开发者套件
3.3 三代产品JetsonTX2
Jetson TX2提供高性能边缘人工智能计算平台,适用于边缘设备 AI 应用,有三个版本:Jetson TX2 (8GB)、Jetson TX2i 和新推出且成本较低的 Jetson TX2 4GB。
NVIDIA Jetson TX2 为嵌入式 AI 计算设备提供卓越的速度和能效。采用256 核 NVIDIA Pascal GPU架构、高达 8 GB 内存、59.7 GB/s 内存带宽,提供丰富的标准硬件接口,完美适配各类产品和外形规格,计算更快,推理能力更强,实现真正意义上的 AI 计算终端。Jetson TX2模块尺寸50 毫米 x 87 毫米,功耗仅为 7.5W。
NVIDIA Jetson TX2
JETSON TX2 4GB
Jetson TX2 4GB以 Jetson TX1 两倍的计算性能和能效来运行神经网络——而且价格不变。得益于 NVIDIA 丰富的 AI 工具和工作流程,让开发人员快速训练和部署神经网络。
JETSON TX2
Jetson TX2 采用 NVIDIA Pascal 构架,外形小巧、节能高效,非常适合机器人、无人机、智能摄像机和便携医疗设备等智能边缘设备。支持 Jetson TX1 模块的所有功能,同时可以实现更大型、更复杂的深度神经网络。
JETSON TX2i
Jetson TX2i 模块拥有坚固的设计、小巧的外形和更低的能耗,堪为工业机器人、机器视觉相机和便携式医疗设备等高性能边缘计算设备的理想选择。
NVIDIA JETSON TX2 开发者套件
3.4 二代产品TX1
Jetson TX1是世界上第一个基于模块的超级计算机,能够提供最新视觉计算应用所需的性能和能效。 它基于具有256个CUDA内核的革命性NVIDIA Maxwell 架构构建,可提供超过1 TeraFLOP的性能。 64位CPU,4K视频编码和解码功能以及1400 MPix / s的摄像头接口使其成为嵌入式深度学习,计算机视觉,图形和GPU计算的最佳系统。
Jetson TX1开发者套件
3.5 初代探索产品TK1
TK1是NVIDIA在边缘计算领域的首次尝试,基于Tegra K1开发的一块低成本开发板,针对嵌入式系统应用释放 GPU 的潜能。它以革命性的 NVIDIA Tegra K1 SoC 为基础构建,并且使用相同的 NVIDIA Kepler 计算核心(该核心专为全世界的超级计算机而设计)。TK1提供了一款全功能 NVIDIA CUDA平台,其上面预装了Linux4Tegra OS(Ubuntu 14.04,配有预配置的驱动程序)。根据官网的介绍,NVIDIA可以提供整个BSP和软件包,包括CUDA、OpenGL4.4和由Tegra加速的OpenCV。可用于快速开发和部署面向计算机视觉、机器人技术、医疗和更多领域的计算密集型系统。
Jetson TK1板载一块Tegra K1 32-bit(Logan)芯片,开发板上还有一个HDMI输出,一个以太网口,一个USB 3.0,一个micro USB口,SATA,mini PCIe,SD卡插槽,调试口有串口DB9和JTAG,以及众多的IO接口引出。可以说是麻雀虽小,五脏俱全。
TK1开发者套件
四、NVIDIA统一的软件堆栈
Jetson Nano、Xavier、TX2等SOM解决方案均由NVIDIA同一软件堆栈Jetpack SDK提供支持,其优势在于完成一次开发,即可在前三者中任意平台进行部署。
Jetpack SDK 提供包括板级支持包 (BSP)、Linux 操作系统、NVIDIA CUDA(R)等,并且兼容第三方平台。
JetPack 可提供用于深度学习、计算机视觉、加速计算和多媒体的库,而且支持各类传感器的驱动程序。此外,NVIDIA 还针对深度估算、路线规划和物体检测等重要的自主机器任务开发了 GPU 加速 IP 。
根据开发Xavier以及Nano经验,NVIDIA为 Jetpack 提供了大量开发者工具,这些开发者工具非常实用,可以大大加快开发过程,并且提供了有关应用与系统功率和对应性能的详细信息,有助于开发者快速优化和调整代码。
举报/反馈

风语辰

158获赞 89粉丝
汽车智能控制研究,关注智能黑科技
关注
0
0
收藏
分享