智源|智源研究院发布大规模并行训练效率提升器 DeepSpeed|并行计算|TDS|提升器

近日，北京智源人工智能研究院（简称智源研究院）发布大规模并行训练效率提升器TDS 。作为超大规模智能模型系统“悟道”的阶段进展， TDS（Tsinghua/Temporary DeepSpeed）插件将进一步优化现今最流行的DeepSpeed 并行计算框架，从而“多快好省”地训练一个大模型。
据介绍，数据、算法、算力是当前人工智能技术崛起的重要驱动力。利用海量数据训练大规模机器学习模型，有助于人类充分学习数据中蕴含的知识，达到更好的训练效果。
然而，随着训练规模的扩大，单张GPU卡的显存与计算效率已经无法满足训练的需要，通过分布式训练框架实现多GPU并行训练成为了一种新的刚需。为了提升多GPU并行训练的效率，研发更高效的并行计算框架十分必要。
为应对大规模计算集群高效训练方法的需求，智源研究院发挥其在硬件设计、模型架构、编程框架研发等方面的优势，组织智源“悟道”团队科研人员研发了 TDS 插件，对当下主流的并行计算框架进行了优化。
【智源|智源研究院发布大规模并行训练效率提升器】据介绍， TDS 插件重新实现了DeepSpeed的流水线，通过适配器模式封装了DeepSpeed 的其它功能，该插件十分易于使用。如果已经完成了对 DeepSpeed 的安装，只需要将TDS的代码拷贝到工程中，然后加载 DeepSpeed 库即可。（郑金武）

智源|智源研究院发布大规模并行训练效率提升器

推荐阅读

盗汗吃什么好儿童盗汗吃什么好

观点用英语怎么说,英语中表示作者观点立场的单词

水培建兰的养殖方法

白条取现利息是多少

夜晚的照片真实马路晚上在马路上的照片

maya怎么设置关键帧

吃枫糖上火吗？枫糖的营养价值有哪些

宝宝19天体重增加多少正常

应届毕业生应如何找工作刚毕业怎么找工作

余额宝一万元一天收益多少

江南曲其二原文、作者

竹筒茶

鲫鱼鸡蛋牛奶汤的制作方法（鲫鱼鸡蛋牛奶汤怎么做）

私汤可以裸泡吗

啤酒零下多少度会冻

什么是蘑菇圈蘑菇圈是怎样形成的啥是蘑菇圈蘑菇圈是如何形成的

狂犬病的潜伏期是多久关于狂犬病的潜伏期介绍

乔丹身高多少米乔丹的身高是多少

哪些食物热量低适合减肥 5类减肥食物热量低都很常见

紫藤花一年开几次花花期月份与时间