英伟达DPU计算吞吐量三年将跨越近1000倍

此次GTC开幕演讲中,黄仁勋也提到了英伟达与Arm的关系。

10月5日,英伟达召开一年一度的2020 GTC(GPU技术大会)。黄仁勋再次在自家厨房发表了开幕演讲,这次演讲主要分为4个部分:数据中心、边缘人工智能、协作工具和医疗保健。

核心亮点包括:

数据中心:推出英伟达Blue Field-2 DPU和英伟达Blue Field-2X DPU,具有英伟达Mellanox的所有功能;推出DOCA SDK。边缘人工智能:宣布推出英伟达EGX AI平台,使各种规模的组织能够快速有效地大规模部署人工智能;推出Jetson Nano 2GB开发套件,范围包括从入门级AI设备到高级平台。协作工具:支持百万设计师实时合作的开源测试版本Omniverse平台,流媒体视频AI平台英伟达Maxine。医疗保健:同全球医疗公司GSK及其AI集团合作,正建造供英国医疗人研究人员使用的超级计算机。

新一代DPU加速数据中心

黄仁勋说,当下的数据中心是由软件定义的,这使得数据中心更加灵活的同时也产生了巨大的负担,数据中心基础架构的运行能够消耗20%-30%的CPU核心,因此需要一种新的处理器,即DPU(Data Processing Unit)。

DPU究竟有什么作用?根据英伟达官方的解释,DPU是一种SOC,集三个关键要素于一身:

行业标准的、最高性能及软件可编程的多核CPU,通常基于广泛的Arm架构,与其SOC组件密切配合;高性能网络接口,能以线速或网络中的可用速度解析、处理数据,并高效地将数据传输到GPU和CPU。各种灵活和可编程的加速引擎,可以卸载AI、机器学习、安全、电信和存储等应用,并提升性能。DPU的这些功能对于实现安全的下一代云上大规模计算至关重要。

基于英伟达今年四月收购的Mellanox的最新研究成果,英伟达推出了两款DPU产品,英伟达BlueField-2 DPU与BlueField-2X DPU。

据英伟达介绍,BlueField-2 DPU具有英伟达Mellanox Connext-6 SmartNIC的所有特点,并与强大的Arm内核连接在一起,且是可完全编程的,能够提供每秒200千兆比特的数据传输速率,加速关键数据中心的安全、网络和存储任务。

BlueField-2X DPU则拥有包括BlueField-2 DPU的所有关键特性,其特性能够通过英伟达安培GPU的AI功能得以增强。

为了能够让开发人员在DPU加速的数据中心基础设施服务上构建应用程序,英伟达还推出类似于英伟达CUDA编程模型帮助开发人员构建GPU加速的应用程序——DOCA软件开发工具包。

值得一提的是,DOCA为开发人员提供了一个全面、开放的平台,完全集成在一个软件目录中,能够为第三方应用程序提供商提供一个方便的软件环境,利用DPU加速数据中心,并开发、认证和分发应用程序给客户。

黄仁勋宣布,将在英伟达下一代安培GPU添加新的BlueField-2,用于英伟达AI计算。

此外,黄仁勋还公布了英伟达DPU的发展路线图,预计在2023年推出400 TOPS、400Gbps的BlueField-4,这意味着在短短几年内,英伟达DPU的计算吞吐量将跨越近1000倍。

EGX AI平台部署人工智能,民主化的Jetson AI机器人

黄仁勋认为,总有一天数以万计的人工智能设备和机器人将遍布家庭、办公楼、商店等场所,充斥整个地球,“为了支持这一大规模的转变,英伟达创建了一个加速计算平台,帮助公司实现数据中心的现代化,并在任何地方部署人工智能。”

这里所说的加速计算平台即英伟达EGX人工智能平台,该平台的系统能够通过戴尔、联想、浪潮、超微等领先的服务器制造商获得。

英伟达还宣布,EGX平台正在扩大合并英伟达安培GPU和BlueField-2 DPU在单个PCIe卡上的功能,为企业提供了一个共同的平台来构建安全、加速的数据中心。

为了部署和管理EGX服务器,英伟达推出一项名为英伟达舰队司令部的新服务,将边缘计算的安全和实时处理能力与远程管理和软件服务的易用性结合起来,能够通过统一的控制平面,集中管理遍布广大地区的服务器,包括工厂、医院、零售店甚至城市街道。据悉,全球供应链解决方案的领导者KION集团正在使用英伟达EGX AI平台为其智能仓库系统开发AI应用程序,提高零售配送中心的吞吐量和效率。

去年,英伟达推出了售价为99美元的Jetson AI计算机,今年扩大Jetson AI在边缘平台上的入门级开发套件,售价仅为59美元。

据悉,作为Jetson系列的新成员,Jetson Nano 2GB开发人员套件是为教学和学习人工智能的人群而设计的,其范围从入门级AI设备到高级平台,用黄仁勋的话讲,Jetson AI机器人是民主化的机器人。为了支持人工智能教学,英伟达还宣布了Jetson免费在线的可用性,补充了许多开源项目,数千名开发人员都活跃在Jetson社区,培训和获得人工智能认证。

Booz Allen Hamilton分析和人工智能研究主任Drew Farris说:“在Booz Allen,我们寻求增强人们改变世界的能力。我们正在使用英伟达 Jetson来培训新的技术资源,因为人工智能对于企业和人员来说至关重要,利用人工智能来解决最困难的全球问题挑战。”

安培架构拓展至专业视觉产品线,Omniverse构建元宇宙

除了在数据中心和边缘人工智能方面取得的进展,英伟达还宣布推出协作工具Omniverse平台的开放测试版本和AI数据流平台Maxine,构建致力于AI医疗研究的超级计算机“剑桥1”。此外,英伟代还在GCT fall上宣布延展至专业视觉产品线的安培架构。

Omniverse是世界上第一个基于英伟达RTX的三维仿真和协作平台,它融合了物理和虚拟世界,实时模拟现实,并具有真实感的细节。“Omniverse允许设计师、艺术家、创作者甚至人工智能在不同的世界中使用不同的工具,在一个共同的世界中连接合作,共同创造一个世界。”黄仁勋说。

使用Maxine,开发人员可以减少视频带宽消耗,降低供应商成本名为终端用户提供能流畅的视频会议体验,改善视频会议的经验。

除了提高普通流媒体的用户体验,英伟达在GCT Fall上宣布,正在与AWS展开合作,发布英伟达CloudXR,并在Amazon EC2 P3和G4上可用。据悉,英伟达CloudXR平台包括 CloudXR软件开发工具包、Quadro虚拟工作站软件和AI SDK。借助云流式的体验,专业人员可以轻松设置、扩展和访问来自任何地方身临其境的体验,不再受到VR环境的限制。

在GTC Fall上,英伟达还宣布推出面向专业设计师的Quadro RTX A6000和英伟达A40 GPU,与上一代产品相比,新一代GPU具有新的RT核心、Tensor核心和CUDA核心,加快了图形渲染和AI的速度。

最后,值得注意的是,在此次演讲中,黄仁勋也提到了英伟达与Arm的关系,宣布了推进Arm平台重大举措:

首先,英伟达将用GPU、网络、存储和安全技术补充Arm的业务,创建完整的加速平台。第二,英伟达正在与Arm合作伙伴合作,为HPC、云、边缘和PC创建平台,这需要芯片、系统和系统软件。第三,英伟达正在将AI和RTX引擎移植到Arm。“今天,这些功能只能在x86上使用,有了这一举措,Arm平台也将在加速和AI计算方面的领先地位。”黄仁勋说。

ChinaIT.com 网站文章仅限于提供更多信息,不代表本网站立场观点。如需转载,请注明来源 。转载之文章来源于互联网,如有版权问题,请与我们联系:content@chinait.com。

下载 ChinaIT.com APP,随时掌握最新IT资讯