走向伟大世界上最快的计算机进行大型语言建模
由能源部橡树岭国家实验室的研究人员领导的团队在世界上最快的超级计算机的帮助下探索了迄今为止最大的人工智能模型之一的训练策略。
这些发现可以帮助指导新一代人工智能模型的科学研究训练。
这项由ORNL的SajalDash、FeiyiWang和PrasannaBalaprakash领导的研究采用了世界上第一台百亿亿级超级计算机Frontier,在类似于OpenAI的ChatGPT的大型语言模型上运行初始阶段的训练。研究团队使用一组测试数据来预测具有220亿、1750亿和1万亿个参数或变量的模型如何在Frontier的9,400多个节点中的128个以及后来的384个节点上运行。该团队并未尝试训练完整的模型。
该作品发布在arXiv预印本服务器上。
“这项研究和我们的发现与其说是一本手册,不如说是为用户训练大型模型提供的一套潜在指南,”达什说。“他们可以借鉴我们的经验来决定如何使用Frontier的资源来训练他们的特定模型,并最有效地利用分配的计算时间。”
该团队将于5月在德国汉堡举行的2024年高性能国际超级计算会议上展示该研究。橡树岭国家实验室的科学家同事IsaacLyngaas、JunqiYin、XiaoWang、GuojingCong以及巴黎-萨克雷大学的RomaineEgele也参与了这项研究。
该研究的重点不是模型开发,而是确定利用图形处理单元(GPU)的最有效方法,GPU为Frontier和类似的超级计算机提供动力,并将其用于训练人工智能。Frontier的每个节点都依赖于四个AMDMI250XGPU,总共超过75,000个GPU。
训练对测试数据的约1亿个标记(单词和字符等文本的基本单位)运行了几个小时。这大约是完成训练万亿参数模型所需数据的万分之一,甚至是所需时间的更小部分。
研究团队使用这些运行的数据来计算,如果在Frontier上完成训练,万亿参数模型的表现如何。
“这项研究主要是为了表明我们可以在Frontier上以特定的规模和特定的效率水平训练特定大小的模型,”Wang说。“我们还没有接近完整大型语言模型的终点线。”
大型语言模型松散地模仿人类大脑学习和识别单词和数字模式的能力,并随着时间的推移通过额外的训练来提高学习能力。目标:设计一个模型,可以吸收和调整从训练数据中学到的经验教训,并将这些知识一致、准确地应用于新的、不熟悉的数据和任务。
此类培训所需的大量数据集和强大的处理器仍然大部分是学者无法接触到的,而由私营公司拥有,这些公司往往将这些资源视为专有资源,并设定严格的使用条件。这些条件通常会限制研究机会,并且不允许轻易验证结果。
但是像Frontier这样的领导级超级计算机,通过美国能源部的创新和新颖的计算对理论和实验的影响项目,为科学研究人员提供计算时间,如果科学家找到正确的方法,可以更快地训练新一代人工智能模型。
“传统上,这个过程依赖于专家知识或反复试验,”橡树岭国家实验室人工智能项目主任巴拉普拉卡什说。“我们在这项研究中的工作亮点之一是在大量选项中自动识别高性能策略。我们利用开源可扩展调整软件DeepHyper来自动确定最佳设置。
“我们计划扩展这种自动化方法,以极大程度地微调系统级性能并提高效率。此外,我们还使我们的方法和软件民主化,以造福科学界。这一策略确保我们的见解可以被广泛获取用于未来在科学中训练大型人工智能基础模型的研究。”
模型及其训练数据集越大,其性能越好,但对计算能力的要求也越高。即使以Frontier世界领先的速度,在没有优化的情况下,从初始阶段到完成训练一个万亿参数的大型语言模型也需要数月时间。
ORNL的研究检验了数据并行性的方法(Frontier等超级计算机使用的一种过程,用于将大问题分解为更小的问题,以便更快地找到解决方案)来训练人工智能,以及如何将训练移植到竞争供应商制造的GPU专有框架上。
“这是为了找到训练策略的最佳组合,同时获得最佳吞吐量,”达什说。“大多数深度学习框架都针对NVIDIA制造的GPU,而不是为Frontier提供支持的AMD制造的GPU。我们想看看现有模型是否可以在Frontier上运行,如何充分利用Frontier的计算能力以及如何实现这一点跨GPU平台可能达到的性能水平。
“例如,我们无法在单个GPU或单个节点上训练这种大小的模型,每次我们跨越节点之间的障碍时,都需要更多的通信,从而消耗更多的时间。我们如何跨GPU分割模型,以便我们可以拟合和训练模型,而不会损失太多节点之间通信的时间和精力?”
研究人员发现,针对计算平台定制的并行策略混合效果最佳,但表示他们的工作还远未完成。
“我们通过该模型在Frontier上实现的效率不错,但还不够好,”王说。“在极端规模下,我们实现了30%的效率,这意味着我们将Frontier约70%的计算能力留在了现场。我们需要更多的优化,以使机器在这种规模下更加高效。”
该团队的下一步包括使用跨更多节点的同行评审科学数据进一步训练模型。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
在众多紧凑型性能车中,大众高尔夫GTI始终以其独特的驾驶乐趣和经典形象占据着重要地位。对于预算有限但又追求...浏览全文>>
-
2022款的大众蔚揽以其优雅的设计和出色的性能在市场上占据了一席之地。对于预算在20-30万元之间的消费者来说,...浏览全文>>
-
池州长安启源E07作为一款备受关注的新能源SUV,在市场上拥有较高的关注度。这款车型凭借其时尚的设计和丰富的...浏览全文>>
-
近年来,随着汽车市场的竞争愈发激烈,各大品牌纷纷推出优惠政策以吸引消费者。作为国内知名汽车品牌之一,蚌...浏览全文>>
-
菱势汽车的菱势电卡是一款新能源物流车,如果您想预约试驾这款车型,以下是可能的流程及注意事项:预约试驾流...浏览全文>>
-
奥迪e-tron GT是一款融合了豪华与科技的电动跑车,如果您对这款车型感兴趣并希望进行试驾体验,可以通过以下...浏览全文>>
-
试驾五菱扬光是一次非常有趣的体验。以下是从咨询到试驾的完整体验过程:咨询阶段1 信息获取:首先通过官方...浏览全文>>
-
在试驾丰田bZ3C时,享受4S店专业服务的关键在于提前做好准备,并充分利用4S店提供的各项资源。以下是一些具体...浏览全文>>
-
近年来,新能源汽车市场蓬勃发展,各大品牌纷纷推出全新车型以满足消费者需求。作为大众汽车旗下备受关注的新...浏览全文>>
-
作为一款备受关注的新能源车型,2022款亳州迈腾GTE在市场上的表现一直引人注目。近期,其最低落地价已降至18 ...浏览全文>>
- 蚌埠揽巡最新价格2024款走势,市场优惠力度持续加大
- 亳州迈腾GTE多少钱 2022款落地价走势,近一个月最低售价18.79万起,性价比凸显
- 安庆探影多少钱?价格解读
- 天津滨海高尔夫GTI最新价格2025款,各车型售价大公开,性价比爆棚
- 试驾奕泽IZOA,感受豪华与科技的完美融合
- 五菱E5试驾预约操作指南
- ARCFOX极狐极狐 阿尔法S6试驾有哪些途径
- 奔腾T55预约试驾有哪些途径
- 东风风度帕拉丁试驾,开启完美驾驭之旅
- 试驾腾势N7,一键搞定,开启豪华驾驶之旅
- 开沃D10多少钱?经销商报价及市场优惠情况
- 飞度新款价格2025款多少钱?如何挑选性价比高的车
- 东莞途锐 2025新款价格全解买车必看
- 试驾东风小康EC36 II的流程及注意事项
- 北京BJ30预约试驾预约流程
- 奥迪A6(进口)试驾预约,从咨询到试驾的完整体验
- 东风本田M-NV试驾全攻略
- 欧拉芭蕾猫落地价全解,买车必看的省钱秘籍
- 龙耀8L新车报价2022款,各配置车型售价全解析
- 沃尔沃S60新能源多少钱 2024款落地价实惠,配置丰富,不容错过