PyTorch中DistributedDataParallel 使用笔记

张开发

• 2026/6/25 21:50:54 • 15 分钟阅读

分享文章

1. 为何使用DistributedDataParallel在PyTorch中的多GPU训练一般有2种DataParallel和DistributedDataParallelDataParallel是最简单的的单机多卡实现但是它使用多线程模型并不能够在多机多卡的环境下使用所以本文将介绍DistributedDataParallelDDP 基于使用多进程而不是使用多线程的DP并且存在GIL争用问题并且可以扩充到多机多卡的环境所以它是分布式多GPU训练的首选。2. 基本概念在使用DistributedDataParallel时有一些概率必须掌握多机多卡含义world_size代表有几台机器可以理解为几台服务器rank第几台机器即第几个服务器local_rank某台机器中的第几块GPU单机多卡含义world_size代表机器一共有几块GPUrank第几块GPUlocal_rank第几块GPU与rank相同3. 使用方法3.1. 修改主函数在运行的时候DistributedDataParallel会往你的程序中加入一个参数local_rank所以要现在你的代码中解析这个参数如parser.add_argument(--local_rank, typeint, default1, helpnumber of cpu threads to use during batch generation)3.2. 初始化torch.distributed.init_process_group(backendnccl) os.environ[CUDA_VISIBLE_DEVICES] 0, 1, 2 # 有几块GPU写多少3.3. 设定devicelocal_rank torch.distributed.get_rank() torch.cuda.set_device(local_rank) global device device torch.device(cuda, local_rank)我没用arg.local_rank新定义了一个local_rank变量是因为我更信任distributed.get_rank()这个函数这里用torch.device来写并且加了global是因为后面模型和数据都要用到这个device不会出错3.4. 模型加载到多gpumodel.to(device) # 这句不能少最好不要用model.cuda() model torch.nn.parallel.DistributedDataParallel(model, device_ids[local_rank], output_devicelocal_rank, find_unused_parametersTrue) # 这句加载到多GPU上3.5. 数据加载到gpu数据.to(device)3.6. 启动torchrun --nproc_per_node4 --rdzv_endpointlocalhost:12345 train_cylinder_asym.py参考文献Pytorch并行计算(二): DistributedDataParallel介绍_dist.barrier_harry_tea的博客-CSDN博客DistributedDataParallel多GPU分布式训练全过程总结跟着做90%成功_BRiAq的博客-CSDN博客百度安全验证

更多文章

前端开发 2026/6/14 22:38:18

ComfyUI-Manager 深度技术解析与高级部署实战指南

ComfyUI-Manager 深度技术解析与高级部署实战指南【免费下载链接】ComfyUI-Manager ComfyUI-Manager is an extension designed to enhance the usability of ComfyUI. It offers management functions to install, remove, disable, and enable various custom nodes of Comf…

张开发

前端开发 2026/6/12 3:43:07

告别Keil破解！用STM32CubeIDE + HAL库点亮你的第一颗LED（STM32F103C8T6保姆级教程）

从Keil到STM32CubeIDE：零成本玩转STM32F103C8T6的LED控制第一次接触STM32开发时，我和大多数初学者一样，被各种开发工具和复杂的配置流程搞得晕头转向。Keil的破解过程更是让人望而却步——不仅要面对道德困境，还要担心软件突然停…

张开发

前端开发 2026/6/25 21:50:21

如何用BatteryChargeLimit拯救你的手机电池：告别一夜充电的损害

如何用BatteryChargeLimit拯救你的手机电池：告别一夜充电的损害【免费下载链接】BatteryChargeLimit 项目地址: https://gitcode.com/gh_mirrors/ba/BatteryChargeLimit 你是否曾经在清晨醒来，发现手机已经充电一整夜，电池图标显示着…

张开发

前端开发 2026/6/19 16:17:15

如何快速掌握React-rnd：理解可拖拽调整大小组件的核心设计与实现

如何快速掌握React-rnd：理解可拖拽调整大小组件的核心设计与实现【免费下载链接】react-rnd 🖱 A resizable and draggable component for React. 项目地址: https://gitcode.com/gh_mirrors/re/react-rnd React-rnd 是一个强大的 React 组件库&…

张开发

前端开发 2026/6/9 7:12:30

用PyBullet+Python玩转机器人强化学习：从零搭建DQN训练环境完整指南

用PyBulletPython玩转机器人强化学习：从零搭建DQN训练环境完整指南深夜的实验室里，机械臂的关节发出轻微的嗡鸣声。屏幕上跳动的奖励曲线突然突破阈值——这个由PyBullet仿真环境训练的DQN模型，终于学会了精准抓取随机位置的物体。作为强化学…

张开发

前端开发 2026/5/25 7:10:11

终极Inspira UI性能优化指南：10个提升组件加载速度的实用技巧

终极Inspira UI性能优化指南：10个提升组件加载速度的实用技巧【免费下载链接】inspira-ui Build beautiful website using Vue & Nuxt. 项目地址: https://gitcode.com/gh_mirrors/in/inspira-ui Inspira UI是一个基于Vue和Nuxt构建精美网站的开源项目&…

张开发

前端开发 2026/5/27 22:24:00

【2026年最新600套毕设项目分享】基于微信小程序的会议发布与预约系统（30072）

有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码SQL脚本）配套文档（LWPPT开题报告/任务书）远程调试控屏包运行一键启动项目&…

张开发

前端开发 2026/6/5 18:16:14

如何快速集成Hanzi Writer：10分钟上手汉字动画教程

如何快速集成Hanzi Writer：10分钟上手汉字动画教程【免费下载链接】hanzi-writer Chinese character stroke order animations and practice quizzes 项目地址: https://gitcode.com/gh_mirrors/ha/hanzi-writer Hanzi Writer是一款专注于汉字笔画顺序动画和…

张开发

前端开发 2026/6/18 20:06:46

矿板EBAZ4205之SD卡启动全流程实战

1. 矿板EBAZ4205硬件改造指南这块售价仅30多元的矿板EBAZ4205，搭载Xilinx Zynq-7010芯片，性价比极高。但原设计主要用于挖矿，需要经过三项关键硬件改造才能实现SD卡启动功能。首先是供电改造。板载的J4接口需要短接D24电阻来实现5V供电&…

张开发

前端开发 2026/5/25 7:10:13

从硬件选型到软件调试：ADS1292R心电与呼吸监测系统实战

1. 为什么选择ADS1292R做心电与呼吸监测？ 在医疗电子和健康监测领域，ADS1292R算得上是明星级的生物电信号采集芯片。我第一次接触这颗芯片是在开发便携式心电监护设备时，当时对比了市面上多款ADC芯片，最终选择它主要有三个原因&am…

张开发

前端开发 2026/6/19 19:47:14

终极指南：LlamaParse如何彻底改变金融文档解析——从SEC文件到财报分析的完整解决方案

终极指南：LlamaParse如何彻底改变金融文档解析——从SEC文件到财报分析的完整解决方案【免费下载链接】llama_parse Knowledge Agents and Management in the Cloud 项目地址: https://gitcode.com/gh_mirrors/ll/llama_parse LlamaParse作为一款强大的文档…

张开发

前端开发 2026/5/25 7:10:14

GetQzonehistory：3步轻松备份QQ空间历史说说，守护你的数字记忆

GetQzonehistory：3步轻松备份QQ空间历史说说，守护你的数字记忆【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 在数字时代，我们的记忆越来越多地存储…

张开发

PyTorch中DistributedDataParallel 使用笔记

最新文章

Mac Mouse Fix终极指南：让你的普通鼠标秒变苹果触控板！[特殊字符]

mysql事务什么时候需要回滚_mysql异常处理解析

虚拟线程在Spring WebFlux中偷偷泄露数据库连接？深度剖析ThreadLocal跨虚拟线程失效的5类隐蔽漏洞，立即修复！

别再傻傻分不清了！一张图看懂NI USRP和Ettus USRP的区别与选型

从“鱼与熊掌”到帕累托最优：NSGA-II算法如何帮你做更聪明的决策？

2026年高并发AI应用架构指南：5款主流大模型API中转服务性能横评与接入实战

推荐文章

相关文章

分享文章

更多文章

ComfyUI-Manager 深度技术解析与高级部署实战指南

告别Keil破解！用STM32CubeIDE + HAL库点亮你的第一颗LED（STM32F103C8T6保姆级教程）

如何用BatteryChargeLimit拯救你的手机电池：告别一夜充电的损害

如何快速掌握React-rnd：理解可拖拽调整大小组件的核心设计与实现

用PyBullet+Python玩转机器人强化学习：从零搭建DQN训练环境完整指南

终极Inspira UI性能优化指南：10个提升组件加载速度的实用技巧

【2026年最新600套毕设项目分享】基于微信小程序的会议发布与预约系统（30072）

如何快速集成Hanzi Writer：10分钟上手汉字动画教程

矿板EBAZ4205之SD卡启动全流程实战

从硬件选型到软件调试：ADS1292R心电与呼吸监测系统实战

终极指南：LlamaParse如何彻底改变金融文档解析——从SEC文件到财报分析的完整解决方案

GetQzonehistory：3步轻松备份QQ空间历史说说，守护你的数字记忆