当前位置: 首页 > news >正文

pytorch FSDP分布式训练minist案例

参考:
https://pytorch.ac.cn/tutorials/intermediate/FSDP_tutorial.html

http://admin.guyuehome.com/39789/1000

FSDP(Fully Sharded Data Parallel)—类似实现zero系列

FSDP是PyTorch
1.11版本引入的一种新的数据并行策略。它的主要目标是解决在多GPU和多节点环境下训练大型模型的内存效率问题。FSDP通过将模型的参数、梯度和优化器状态分片到多个GPU上,从而允许在有限的内存资源下训练更大的模型。

主要特点:

参数分片:将模型的参数分片到多个GPU上,每个GPU只保存一部分参数。

梯度分片:梯度也会被分片,每个GPU只计算和存储与其参数分片对应的梯度。

优化器状态分片:优化器的状态也会被分片,每个GPU只维护与其参数分片对应的优化器状态。

通信优化:通过减少通信量和优化通信模式,提高训练效率。

运行版本:
torch 2.4.0

代码:
python DDP_mnist.py


<

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • java springboot 集成activeMQ(保姆级别教程)
  • C++学习笔记——交换值
  • Unity3D UGUI性能消耗和管理详解
  • Redis集群技术
  • CSS3页面布局-三栏-中栏流动布局
  • 基于无人机边沿相关 ------- IBUS、SBUS协议和PPM信号
  • 目标检测:Cascade R-CNN: Delving into High Quality Object Detection - 2017【方法解读】
  • 张宇36讲+1000题重点强化!保100冲120速刷攻略
  • <WPF> xaml代码如何使用c#编写
  • 《一种个性化逻辑定制与类置换方案》
  • Android原生JobSchedulerContext内存泄漏导致设备重启的现象
  • java中位运算在算法中的应用
  • Ubuntu2004编译VLC-QT(记录)(根据官方步骤来)
  • 【ES6新特性】介绍ES6新特性的内容,如var,Let,Const声明变量的区别,解构赋值的概念,字符串的扩展,数组的扩展,以及对象的扩展。
  • 大数据技术之 Flume概述、安装(1)
  • 【跃迁之路】【699天】程序员高效学习方法论探索系列(实验阶段456-2019.1.19)...
  • EventListener原理
  • github指令
  • HTML-表单
  • Java深入 - 深入理解Java集合
  • maya建模与骨骼动画快速实现人工鱼
  • 区块链将重新定义世界
  • 让你的分享飞起来——极光推出社会化分享组件
  • 携程小程序初体验
  • 远离DoS攻击 Windows Server 2016发布DNS政策
  • 如何用纯 CSS 创作一个货车 loader
  • ​【经验分享】微机原理、指令判断、判断指令是否正确判断指令是否正确​
  • ​DB-Engines 11月数据库排名:PostgreSQL坐稳同期涨幅榜冠军宝座
  • ​如何防止网络攻击?
  • $.type 怎么精确判断对象类型的 --(源码学习2)
  • %@ page import=%的用法
  • (4)(4.6) Triducer
  • (NO.00004)iOS实现打砖块游戏(九):游戏中小球与反弹棒的碰撞
  • (纯JS)图片裁剪
  • (几何:六边形面积)编写程序,提示用户输入六边形的边长,然后显示它的面积。
  • (六)激光线扫描-三维重建
  • (每日一问)基础知识:堆与栈的区别
  • (深度全面解析)ChatGPT的重大更新给创业者带来了哪些红利机会
  • (数据结构)顺序表的定义
  • (四)软件性能测试
  • (转)大型网站架构演变和知识体系
  • (轉貼) UML中文FAQ (OO) (UML)
  • .bashrc在哪里,alias妙用
  • .gitignore文件—git忽略文件
  • .NET : 在VS2008中计算代码度量值
  • .NET 8 中引入新的 IHostedLifecycleService 接口 实现定时任务
  • .Net Web项目创建比较不错的参考文章
  • [20150707]外部表与rowid.txt
  • [Angular] 笔记 16:模板驱动表单 - 选择框与选项
  • [Angularjs]asp.net mvc+angularjs+web api单页应用
  • [BUUCTF 2018]Online Tool(特详解)
  • [BZOJ 4598][Sdoi2016]模式字符串
  • [C++打怪升级]--学习总目录
  • [caffe(二)]Python加载训练caffe模型并进行测试1
  • [CSS]文字旁边的竖线以及布局知识