原文:
大语言模型(LLM)分布式训练框架总结
流水线并行技术与飞桨优化实现详解
520jefferson 阅37
32卡176%训练加速,开源大模型训练框架Megatron-LLaMA来了
天承办公室 阅27
源码解析目标检测的跨界之星DETR(二)、模型训练过程与数据处理
李xinle 阅579 转2
老师木讲架构:深度学习平台技术演进
万皇之皇 阅91 转4
百度将高性能计算引入深度学习:可高效实现模型的大规模扩展
LZS2851 阅99 转2
大数据:使用sklearn优雅地进行数据挖掘
天道酬勤197102 阅644 转2
tensorflow 多GPU操作
雪柳花明 阅856
动手学深度学习:如何使用多块 GPU 计算?多GPU计算的简洁实现?
新用户0175WbuX 阅1118 转2
深度神经网络DNN的多GPU数据并行框架 及其在语音识别的应用
二月石桥 阅102 转2
跨平台Caffe及I/O模型与并行方案(三)
谢兴l4nztpvbdk 阅96 转2
LLMs之InternLM:InternLM-20B的简介、安装、使用方法之详细攻略
处女座的程序猿 阅91 转2
让机器学习“如何学习”!从零开始读懂MAML!
汉无为 阅567 转8
不容错过的12个深度学习面试问题
taotao_2016 阅694 转4
完整 | 神经网络的工作原理介绍
西北望msm66g9f 阅1361 转3
AI科学家带你从零开始学习:循环神经网络 !
爱因思念l5j0t8 阅74 转3
HALCON 20.11:深度学习笔记(5)
提着灯笼追月亮 阅164 转3
在机器学习项目中该如何选择优化器
x_box361 阅86
高性能算法的四大实战技巧 | 算法经验(12)
ZZvvh2vjnmrpl4 阅2
手把手教你如何用 TensorFlow 实现基于 DNN 的文本分类
田杰4 阅80
深入浅出
mscdj 阅173
机器学习 101:一文带你读懂梯度下降
LibraryPKU 阅46
首页
留言交流
联系我们
回顶部