地 址:诏安
电 话:0783-988262
网址:point.rjess.com
邮 箱:shaheshi1992@126.com
明敏 发自 凹非寺
量子位 | 公众号 QbitAI
11分钟内训练一遍GPT-3,英伟8秒训完BERT。杀疯
这就是分钟英伟达给AI圈的一点“小小震撼” 。
在最新MLPerf训练基准测试中,训完英伟达H100集群,英伟横扫八项测试 ,杀疯全部创下新纪录,分钟并且在大语言模型任务中体现尤为突出!训完
在大语言模型任务中,H100集群的杀疯加速性能逼近线性增长。
即随着集群处理器数量增加,分钟加速效果也几乎同比增加。训完
这意味着在集群内GPU之间的英伟通信效率非常高。
除此之外,H100还完成了推荐算法 、分钟CV、医学图像识别以及语音识别等任务,是唯一一个参加8项测试的集群 。
而在算力就是生产力的时代下,这波成绩意味着什么,懂得都懂 。
据悉,本次测试系统由英伟达和Inflection AI联合开发,在云厂商CoreWeave上托管。
这次MLPerf Training v3.0中增加了两项新任务 :
这意味着测试任务包含了更大的数据集和更先进的模型。
如上刷新各项记载的,是由3584块H100组成的超大集群 。
它的具体成绩如下 :
这是本轮测试中,英伟达拿出的最大集群。
实际上他们还提交了一个包含768块H100的集群进行测试,并分别在云上和本地部署 。
成果显示二者性能几乎完全相同。
更进一步还论证了随着集群中显卡数量的增加,其性能提升可以接近线性增长。
(NVIDIA Pre-Eos为本地部署,NVIDIA+CoreWeave为云上部署)
除此之外,这轮测试中英伟达还刷新了单节点加速记载。
和6个月前MLPef Training v2.1的数据比较 ,单个DGX H100系统(8块H100组成)在各项任务中平均提速17%。
和A100 Tensor Core GPU相比