当前位置: 首页 > news >正文

torchrun常见参数

示例

torchrun --nproc_per_node=4 --nnodes=3 --node_rank=0 --master_addr=192.168.0.101 --master_port=29500 test_mpi.py

常见参数

1.指定每个节点(机器)上的进程数,这里是4个。意味着每个机器将启动4个进程来参与分布式训练。

--nproc_per_node=4

2.指定总共的节点数,这里是3个。意味着总共有3个机器参与分布式训练。

--nnodes=3

3.指定当前节点(机器)的排名,这里是0。排名从0开始,用于在分布式环境中区分不同的节点。

--node_rank=0 

4.指定主节点的IP地址,这里是192.168.0.101(更根据实际修改)。主节点用于协调分布式训练过程。

--master_addr=192.168.0.101

5.指定主节点的端口号,这里是29500。主节点使用指定的端口来与其他节点进行通信。

–master_port=29500

6.单机运行

--standalone

相关文章:

  • 【论文阅读】ACM MM 2023 PatchBackdoor:不修改模型的深度神经网络后门攻击
  • 颜色检测python项目
  • xlsx.js读取本地文件,按行转成数组数据
  • 手机App防沉迷系统C卷(JavaPythonC++Node.jsC语言)
  • UE5.1_TimeLine
  • yudao-cloud 学习笔记
  • web服务,C/S框架,单设备登陆实现方案
  • C++中实现String类
  • mysqld.exe运行时,提示缺少msvcr100.dll,msvcp100.dll文件,导致mysql安装失败或mysql服务无法启动
  • vue若依自定义权限控制
  • java面试题:为什么 SQL 语句不要过多的 join?
  • 【华为OD机试】智能成绩表【C卷|100分】
  • Liinux——(网络)socket编程
  • Vue3全家桶 - VueRouter - 【3】嵌套路由【children】
  • win10系统在低分辨率显示器显示模糊时
  • Google 是如何开发 Web 框架的
  • 4. 路由到控制器 - Laravel从零开始教程
  • Django 博客开发教程 16 - 统计文章阅读量
  • ES6语法详解(一)
  • Java应用性能调优
  • rabbitmq延迟消息示例
  • Vue官网教程学习过程中值得记录的一些事情
  • XForms - 更强大的Form
  • Xmanager 远程桌面 CentOS 7
  • 浮动相关
  • 极限编程 (Extreme Programming) - 发布计划 (Release Planning)
  • 技术胖1-4季视频复习— (看视频笔记)
  • 解析 Webpack中import、require、按需加载的执行过程
  • 入门级的git使用指北
  • 项目实战-Api的解决方案
  • 中国人寿如何基于容器搭建金融PaaS云平台
  • 移动端高清、多屏适配方案
  • 正则表达式-基础知识Review
  • # 透过事物看本质的能力怎么培养?
  • #NOIP 2014#Day.2 T3 解方程
  • $con= MySQL有关填空题_2015年计算机二级考试《MySQL》提高练习题(10)
  • (2009.11版)《网络管理员考试 考前冲刺预测卷及考点解析》复习重点
  • (LNMP) How To Install Linux, nginx, MySQL, PHP
  • (NO.00004)iOS实现打砖块游戏(十二):伸缩自如,我是如意金箍棒(上)!
  • (附源码)计算机毕业设计ssm高校《大学语文》课程作业在线管理系统
  • (剑指Offer)面试题41:和为s的连续正数序列
  • (论文阅读26/100)Weakly-supervised learning with convolutional neural networks
  • (状压dp)uva 10817 Headmaster's Headache
  • .class文件转换.java_从一个class文件深入理解Java字节码结构
  • .net core 依赖注入的基本用发
  • .NET Windows:删除文件夹后立即判断,有可能依然存在
  • .net 简单实现MD5
  • .net6使用Sejil可视化日志
  • .pub是什么文件_Rust 模块和文件 - 「译」
  • ?php echo ?,?php echo Hello world!;?
  • @test注解_Spring 自定义注解你了解过吗?
  • [\u4e00-\u9fa5] //匹配中文字符
  • []T 还是 []*T, 这是一个问题
  • [2016.7.test1] T2 偷天换日 [codevs 1163 访问艺术馆(类似)]
  • [20180129]bash显示path环境变量.txt