NVIDIA的HopperH100GPU首次登上MLPerfAIBenchmark榜单,打破了AmpereA100之前的所有记录。虽然HopperTensorCoreGPU为下一次AI大革命铺平了道路,但AmpereA100GPU继续在主流AI应用程序套件中展示领先性能,而JetsonAGXOrin在边缘计算方面处于领先地位。
NVIDIA的AI革命继续进行,HopperH100TensorCoreGPU打破了所有MLPerf基准,与上一代相比,性能提升高达4.5倍
新闻稿:在MLPerf行业标准AI基准测试中首次亮相时,NVIDIAH100TensorCoreGPU在所有工作负载的推理方面创造了世界纪录,提供的性能比上一代GPU高4.5倍。结果表明,Hopper是对高级AI模型要求最高性能的用户的首选。
数据中心和边缘的离线场景(单GPU)
NVIDIAH100
(推理/秒) NVIDIAA100
(推理/秒) NVIDIAJETSONAGXORIN
(最大推理/查询)
DLRM
(推荐人) 695,298 314,992 不适用*
BERT
(自然语言处理)** 7,921 1,757 558
ResNet-50v1.5
(图像分类) 81,292 41,893 6164
RetinaNet
(物体检测) 960 592 60
RNN-T
(语音识别) 22,885 13,341 1149
3DU-Net
(医学成像) 5 3 0.5
此外,用于人工智能驱动机器人的NVIDIAA100TensorCoreGPU和NVIDIAJetsonAGXOrin模块继续在所有MLPerf测试中提供整体领先的推理性能:图像和语音识别、自然语言处理和推荐系统。
H100,又名Hopper,在这一轮中提高了所有六个神经网络的每个加速器性能的标准。它在单独的服务器和离线场景中展示了吞吐量和速度方面的领先地位。NVIDIAHopper架构提供的性能比NVIDIAAmpere架构GPU高4.5倍,后者继续在MLPerf结果中保持整体领先地位。
部分归功于其TransformerEngine,Hopper在流行的自然语言处理BERT模型上表现出色。它是MLPerfAI模型中最大且最需要性能的模型之一。这些推理基准测试标志着H100GPU的首次公开演示,将于今年晚些时候推出。H100GPU将参与未来的MLPerf轮次进行训练。
NVIDIAA100GPU现已可从主要云服务提供商和系统制造商处获得,在最新测试中继续显示在主流人工智能推理性能方面的整体领先地位。A100GPU在数据中心和边缘计算类别和场景中赢得的测试比任何提交的都要多。6月,A100还在MLPerf训练基准测试中全面领先,展示了其在整个AI工作流程中的能力。
自2020年7月在MLPerf上首次亮相以来,得益于NVIDIAAI软件的不断改进,A100GPU的性能提升了6倍。NVIDIAAI是在数据中心和边缘计算中运行所有MLPerf推理工作负载和场景的唯一平台。
用户需要多功能性能
NVIDIAGPU在所有主要AI模型上提供领先性能的能力使用户成为真正的赢家。他们的实际应用通常使用许多不同类型的神经网络。
例如,人工智能应用程序可能需要了解用户的语音请求、对图像进行分类、提出建议,然后以人类声音的语音消息的形式提供响应。每个步骤都需要不同类型的AI模型。
MLPerf基准测试涵盖了这些和其他流行的AI工作负载和场景——计算机视觉、自然语言处理、推荐系统、语音识别等。这些测试确保用户将获得可靠且部署灵活的性能。
用户依靠MLPerf结果来做出明智的购买决定,因为测试是透明和客观的。基准测试得到了广泛的支持,包括亚马逊、Arm、百度、谷歌、哈佛、英特尔、Meta、微软、斯坦福和多伦多大学。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!