大语言模型（LLM）分布式训练框架总结--相关文章

原文：大语言模型（LLM）分布式训练框架总结

流水线并行技术与飞桨优化实现详解

520jefferson 阅37

32卡176%训练加速，开源大模型训练框架Megatron-LLaMA来了

天承办公室阅27

源码解析目标检测的跨界之星DETR（二）、模型训练过程与数据处理

李xinle 阅579 转2

老师木讲架构：深度学习平台技术演进

万皇之皇阅91 转4

百度将高性能计算引入深度学习：可高效实现模型的大规模扩展

LZS2851 阅99 转2

大数据：使用sklearn优雅地进行数据挖掘

天道酬勤197102 阅644 转2

tensorflow 多GPU操作

雪柳花明阅856

动手学深度学习：如何使用多块 GPU 计算？多GPU计算的简洁实现？

新用户0175WbuX 阅1118 转2

深度神经网络DNN的多GPU数据并行框架及其在语音识别的应用

二月石桥阅102 转2

跨平台Caffe及I/O模型与并行方案（三）

谢兴l4nztpvbdk 阅96 转2

LLMs之InternLM：InternLM-20B的简介、安装、使用方法之详细攻略

处女座的程序猿阅91 转2

让机器学习“如何学习”！从零开始读懂MAML！

汉无为阅567 转8

不容错过的12个深度学习面试问题

taotao_2016 阅694 转4

完整 | 神经网络的工作原理介绍

西北望msm66g9f 阅1361 转3

AI科学家带你从零开始学习：循环神经网络！

爱因思念l5j0t8 阅74 转3

HALCON 20.11：深度学习笔记(5)

提着灯笼追月亮阅164 转3

在机器学习项目中该如何选择优化器

高性能算法的四大实战技巧 | 算法经验（12）

ZZvvh2vjnmrpl4 阅2

手把手教你如何用 TensorFlow 实现基于 DNN 的文本分类

机器学习 101：一文带你读懂梯度下降

LibraryPKU 阅46