ZAO 2022年中关村在线年度观察推选领先解决方案Leading Solutions 30(以下简称LS30)为行业用户提供更好的选择,帮助行业提供高质量的解决方案和技术解决方案。
中关村在线认为,英特尔将于2022年推出Habana Gaudi 2处理器可参与本次终极评选。Habana Gaudi 2处理器采用7纳米工艺Habana以数据中心的计算机视觉和自然语言应用为基础,旨在为客户的模型培训和推理提供更高的性能。
●对数据中心的意义:帮助实现高效AI训练
如今,人工智能正从技术概念走向数千个行业,实现多场景的实际实施。可以看出,人工智能的繁荣正在推动AI芯片市场不断焕新。据Allied Market Research到2025年,全球机器学习芯片市场将达到约378亿美元。这不仅推动了传统芯片公司战略和技术的转型,也推动了大量新玩家进入游戏,在连续性或颠覆性创新方面经常出奇。
英特尔今年推出的高性能深度学习AI训练的Gaudi处理器可以让客户以更低的成本进行更多的培训。最新发布的Habana Gaudi2是基于Synapse 电脑 AI通过支持多样化的架构,终端用户可以充分利用处理器的高性能和高能效。
对于数据中心来说,由于数据集和人工智能业务规模和复杂性的不断增加,培训深度学习模型所需的时间和成本越来越高IDC根据数据,74%的机器学习从业者在2020年接受调查,对其模型进行了5-10次迭代训练,50%以上需要每周或更频繁地重建模型,26%的人每天甚至每小时重建模型。56%的受访者认为,培训成本是阻碍其组织利用人工智能解决问题、创新和增强终端客户体验的首要因素。英特尔推出Habana Gaudi 2处理器采用7纳米工艺Habana以数据中心的计算机视觉和自然语言应用为基础,旨在为客户的模型培训和推理提供更高的性能。
●技术分析:全面升级,有效提高训练性能
基于和第一代Gaudi相同的系统架构,Habana Gaudi 处理器大大提高了训练性能。客户在云中运行Amazon EC2 DL1例及本地运行Supermicro Gaudi培训服务器时,其性价比现有GPU解决方案提高了40%,这些都来自Gaudi2.结构进步:包括从16纳米到7纳米的工艺过程;矩阵乘法(MME)和Tensor引入处理器核心计算引擎FP新数据类型包括8;Tensor处理器的核心数量从8个增加到24个;芯片集成多媒体处理引擎,从主机子系统卸载;芯片包装的内存容量增加了3倍,从32GB提升到带宽2.45TB/秒的96GB HBM2E;两倍48MB的板载SRAM存储器和基础RDMA (RoCE2) 集成以太网从10个增加到24个,在标准网络上实现高效的纵向和横向扩展。
电脑从MLPerf也可以看出行业测试的表现,Habana Gaudi 视觉上处理器(ResNet-50)和语言(BERT)模型上相比NVIDIA A100训练时间有很大优势。
与第一代相比Gaudi处理器,Habana Gaudi 2处理器在ResNet-训练吞吐量增加了50模型的3倍,BERT训练模型的吞吐量增加了4.7倍。这是因为工艺从16纳米到7纳米,Tensor处理器内核数量增加了三倍GEMM高带宽存储容量的发动机计算能力和包装增加了三倍,SRAM带宽增加,容量增加一倍。这是因为工艺从16纳米到7纳米,Tensor处理器内核数量增加了三倍GEMM高带宽存储容量的发动机计算能力和包装增加了三倍,SRAM带宽增加,容量增加一倍。训练视觉处理模型,Gaudi2集成媒体处理引擎的处理器可以独立完成AI对压缩图像进行数据增强和预处理。
两代Gaudi在没有特殊软件操作的情况下,处理器的性能是通过的Habana实现客户开箱即用的商业软件栈。
在商用软件提供的开箱即用性能中Habana 8个GPU服务器与HLS-Gaudi2参考服务器上的测试比较。其中,训练吞吐量来自NGC和Habana公共库的TensorFlow docker,在混合精度训练模式下测量双方推荐的最佳性能参数。值得注意的是,吞吐量是影响最终训练时间收敛的关键因素。
电脑●行业影响力和用户需求:数据中心按需加速,使深度学习更加快
通过将Habana Gaudi 2部署到数据中心,可以提供更高效的计算机视觉和自然语言处理模型培训和推理,解决客户最关心的两个问题:降低服务器处理成本和培训模型所需的时间。Habana Gaudi2和Greco AI基于加速器Synapse AI通过支持多样化的架构,终端用户可以充分利用处理器的高性能和高能效。
同时,借助Habana Labs的Gaudi平台、数据中心团队可以专注于深度学习处理器技术,使数据科学家和机器学习工程师能够有效地进行模型培训,实现新模型构建或现有模型迁移,提高工作效率,降低运营成本。
●结语
英特尔发布的第二代基本计算能力领域主要为云计算和边缘计算提供计算能力。Gaudi处理器Habana Gaudi2.实现了深度学习的关键飞跃,用户可以通过支持多样化的架构,充分利用处理器的高性能和高能效,以更高的性价比培训数据中心负载。毫无疑问,服务器或服务器集群主要用于深度学习训练和推理计算,Habana Gaudi对于这些特殊场景,理想的加速器可以提供优异的深度学习性能,降低整体拥有成本。
(8086572)
电脑