（转）Jetson TX2助力终端人工智能

Jetson家族的新一代产品Jetson TX2正式发布，也标志着NVIDIA在终端人工智能领域的布局又往前迈进了一步。

本文转自雷锋网：在终端人工智能领域，NVIDIA的Jetson TX2为何如此受青睐？
"da"

NVIDIA中国区高级技术经理李铭

在人工智能大热的当下，拥有强大计算能力的NVIDIA走上了发展的快车道，公司Slogan也变成了“引领人工智能计算”。

凭借着在GPU领域的深耕，NVIDIA在深度学习和人工智能领域推出了诸多产品，各类超级计算平台和数据处理加速器赫然在列，而Jetson平台便是NVIDIA诸多此类产品中的一员。

具体来说，Jetson是NVIDIA推出的嵌入式人工智能超级计算平台，可以部署在诸多终端（可能是摄像头、无人机、机器人和无人小车等）之上，令其具备人工智能计算能力。而“嵌入式”则可以很好地解决这些终端要具备人工智能计算能力所要面临的带宽不足、延迟等问题。

被寄予厚望的TX2

今年3月8日，Jetson家族的新一代产品Jetson TX2正式发布，也标志着NVIDIA在终端人工智能领域的布局又往前迈进了一步。
"da"

Jetson TX2

据雷锋网了解，Jetson平台此前已有TK1和TX1两代产品，而且还积累了诸多客户以及应用案例，其中包括思科的电视电话会议系统（人脸识别、智能识别）、法拉赫的工厂自动化（零部件的分拣）、丰田的服务类机器人等。而在国内，也不乏Jetson平台的使用者，其中比较知名的有安防领域的企业海康威视，其摄像头产品中便采用了TX1，此外，京东的送货无人车也是TX1的客户。可见，终端人工智能已经深入到了人类日常生活的诸多方面。

事实上，在TX2发布前，NVIDIA中国区高级技术经理李铭便阐述了这款新产品的性能细节。当时，雷锋网(公众号：雷锋网)获知，相比前一代，TX2的GPU和CPU都进行了升级，内存增加、存储增加，支持Wifi和蓝牙，编解码支持H.265，体型同样小巧；套件方面有USB接口、SD卡接口、HDMI接口等，连上鼠标、键盘以及显示器，实际就是一台电脑，可以进行人工智能开发或日常使用。

"da"

Jetson TX1与Jetson TX2的性能对比

另据NVIDIA官方介绍，TX2所提供的性能是之前版本的2倍，也就是说能够以2倍以上的功效运行，且功率低于7.5瓦。这样的性能可让TX2在终端应用上运行更庞大、更深度的神经网络，让终端设备更加智能化，同时在执行图像分类、导航和语音识别等任务时在更短的时间内达到更高的精度。

此外，为了方便开发者基于TX2平台进行开发，NVIDIA还配套推出了JetPack 3.0的软件开发包，配备的开发工具非常齐全，大大降低了开发者的准入门槛。

正因为TX2的性能提升，目前Jetson的很多客户都在进行平台迁移。李铭告诉雷锋网，目前TX2在向上以及向下兼容两方面都做得比较好，所以以往使用TX1的用户转移到TX2上完全没有转移成本。

至此，关于TX2的各类优势已经非常明晰：无论是性能上的成倍增长、还是开发门槛的降低、亦或是无需平台转移成本。NVIDIA对这款产品的市场表现同样寄予厚望。

为了让这款产品更加具有说服力，NVIDIA官方在TX2发布一个多月后，再一次举办了一场产品解读活动，详解了一些Demo，还特地请来了TX2的代表性客户海康威视的相关负责人以及资深技术专家分享其与Jetson平台结缘的故事以及其在技术上的考量。

在展示Demo前，李铭提到了NVIDIA的“AI City”（人工智能城市）构想。在NVIDIA眼中，这个世界每时每刻都会产生大量的视频流，这些视频在2020年会出自全球超过10亿个摄像头。面对海量的数据，只有采用深度学习相关的技术才能加以理解和分析——把像素级的信息直接转化成一种语义，或者说是一种对场景的理解。这些场景包括但不限于智慧交通，未来还有更多的应用场景，最后将覆盖整个城市，形成所谓的“AI City”。

具体怎么做？李铭向雷锋网新智驾展示了两段视频Demo。

一段是在美国金门大桥上行车的视频，当4K的视频流传输进搭载Jetson TX2的工作站后，人工智能终端可以实时解读视频信息，识别车辆、行人、路牌等信息，甚至还能识别出车辆的颜色和品牌型号以及行人的性别、年龄以及手上是否提有物品等信息。

整个数据处理过程遵循：视频流输入－视频解码－使用人工智能的手段识别目标（如车牌、人脸等）并框选－编码、完成本地处理－存储到云端或者显示在监控屏幕上。

另一段则是美国警察在停车场巡逻的视频，搭载了TX2的摄像头终端可以监测记录车辆、人口的各类细节信息，如果在停车场发现可疑的车辆和人口，那么系统会自动与内部构建的嫌疑模型比对，警察很快就可以锁定有问题的对象。这样高效率处理视频信息的手段，是安防和公安领域的福音。

李铭表示，以上“AI City”相关Demo的源代码和Pipeline都会打包到Jetpack 3.0中供使用者参考。

为什么选择TX2？

此次，NVIDIA请来了海康威视研究院高性能计算部总监王鹏和以及资深技术专家蒋超为Jetson TX2站台。

海康威视是安防领域全球领先的解决方案提供商。他们在去年与NVIDIA共同发布了基于深度学习技术的从后端到前端的全系列安防产品。其双目智能人脸摄像机“深眸”（前端）与视频云结构化服务器“猎鹰”（后端）都采用了NVIDIA的技术解决方案。

"da"

海康威视研究院高性能计算部总监王鹏

王鹏表示，此前选择与NVIDIA合作的原因就是看中其在GPU以及深度学习方面能力，而且这些年NVIDIA在这方面的能力提升也非常迅猛。

王鹏告诉雷锋网，“我们这几年的安防发展目标从原来的‘看得见’转向了‘看得清’。而最近几年人工智能的火热，也让我们有了新方向，就是‘看得懂’”。“看得懂”其实与NVIDIA“AI City”的构想不谋而合，所以其中对于计算能力和海量视频信息处理能力的要求也拔高了，因此Jetson平台对于海康威视来说，是非常合适的终端智能化选择。

而在实际效果上，王鹏称，采用了NVIDIA的一套技术解决方案后，“我们引以为傲的产品——1U智能处理服务器“刀锋”的计算性能达到了16T，在1U的空间里它的功耗只有300瓦。而通用的服务器要达到14T左右的性能，它的功耗要达到8000瓦以上……”。所以无论从空间还是电力方面，采用这种高性能芯片，对海康威视整个后端部署的成本实施都有非常大的好处。

“NVIDIA的高性能深度学习引擎以及端到端的解决方案，使得我们能以最快的速度、在最短的时间内把研究成果在产品上落地”，王鹏总结道。

资深技术专家蒋超则将自家的室内机器人带到了现场。在他看来，当一个机器人进入家庭或者商用场合时，它必须解决的一个问题是“怎么样走路”。这个问题又衍生出三个核心子问题：机器人是否知道自身所处的空间位置？机器人是否知道路在哪里？机器人能否接收使用者的指令？

"da"

资深技术专家蒋超（来自猎户星空）

所以，蒋超认为，vSLAM（visual Simultaneous Localization and Mapping，基于视觉的即时定位与地图构建）其实是整个机器人技术最底层、最核心的部分。

最终，当机器人走起来之后，各类传感器会产生相关信息，还有控制指令不断发送给机器人，意味着将形成一个非常复杂的操控网络。在真实的商业场景中，机器人必须当下就能工作。

这里面就产生了矛盾——如果采用“云计算”技术或者把数据传回去计算再返回的话，以目前的网络状况来说，是无法达到实时性要求的。

因此这些复杂的计算必须在终端上完成，“我们必须在端上、离用户最近的地方解决问题，所以我们就需要非常强大的计算平台”，蒋超说。

NVIDIA的TX1则提供了很好的计算能力，但计算能力总是不够用的，当蒋超去做应用的时候，还是发现一些局限。“所以当我看到TX2的时候，我就非常兴奋，因为TX2整体的性能比TX1整整提高的一倍，所以就有余下一些空间，让我们做更多的事情。”而所谓的“更多的事情”则包括了“语义地图”这样的应用。

蒋超还向雷锋网提到，TX2能够支持其产品研发的不仅仅是硬件本身，还有非常好的软件——VisionWorks（包含在Jetpack 3.0当中），该软件其实是在OpenVX这个标准上实现了很多机器视觉的底层操作，还提供编程框架，“我们可以用这些东西去进行快速开发。”

此外，TX2还可以用在SLAM的后端优化上，因为在CPU上运行的一些优化工具，性能会有非常大的限制。