当前位置: 首页 > news >正文

服务器量化训练操作说明

Freespace服务器预训练主要步骤:

  1. 首先登录堡垒机,命令如下:

ssh xxx@relay.baidu-int.com  (xxx为个人邮箱前缀)

密码为个人邮箱密码

  1. 登录工作机,命令如下:

ssh l3@yq01-gpu-255-122-22-00.epc.baidu.com

密码为:l3

  1. 在工作机上找到freespace网络的训练源码及脚本(该版本为验证成功版本),原始路径为/home/l3/chenghongkuan/freespace/perception-tnt8.2, 在根目录下新建一个自己的目录,并将原始路径下的内容拷贝到个人目录下。
  2. 集群环境配置
    1. slurm客户端工具拷贝:工作机slurm客户端工具已安装,可以直接将该部分内容copy到自己的目录下:
    2. Token申请:在自己的客户端目录下,执行以下命令完成个人token的申请,会收到邮件,注意查收:
    3. Token配置:执行以下命令完成个人token的配置,其中ak以及sk可以在申请时收到的邮件中查到,配置成功会收到邮件,
  1. 训练任务提交:该部分暂时先按最简单的方式来操作,操作如下
    1. 在自己的训练路径下,找到submit.sh, 修改submit.sh中的HGclient的地址,改为自己目录:
    1. 在自己的训练路径下,找到train.sh,可以将job_name改为自己定义的名字;
    2. 在自己的训练路径下,找到freespace.yaml,检查DATASET:TRAINING:DATA_MODULE是否为apps.freespace.src.data.sfs_v3.SFSDataset,检查MODEL:BACKBONE:CONV_BODY是否为SfsVps;
    3. 在自己的训练路径下,找到train.sh,并执行sh train.sh,将训练任务提交到远程集群进行训练,如果训练任务提交成功则会有如下打印信息:

阡陌控制台也会查到当前提的任务,界面如下:

  1. 训练模型获取:在阡陌服务器页面中“我的作业”中找到本次训练的任务,然后点击“查看overview”

,进入Log Agent界面,点击“output”,选中模型,点击“download”进行模型下载,

相关文章:

  • 虾皮广告怎么做:如何在虾皮平台上进行广告投放
  • 【玩转TableAgent数据智能分析】借助全球高校数据多维度分析案例,体验TableAgent如何助力用户轻松洞察数据,赋能企业高效数智化转型
  • 【C语言】动态内存管理基础知识——动态通讯录,如何实现通讯录容量的动态化
  • 数据分析基础之《numpy(4)—ndarry运算》
  • 第四十一章 XML 映射参数摘要
  • opencv静态链接error LNK2019
  • Peter算法小课堂—贪心与二分
  • 22 3GPP在SHF频段基于中继的5G高速列车场景中的标准化
  • 数智金融技术峰会|数新网络受邀分享《金融信创湖仓一体数据平台架构实践》,敬请期待
  • OpenCV实现手势音量控制
  • 鸿蒙开发基本概念
  • 关于时区处理策略
  • Unity中Shader旋转矩阵(二维旋转矩阵)
  • c语言:指针作为参数传递
  • react v-18父组件调用子组件的方法和数据
  • ES学习笔记(10)--ES6中的函数和数组补漏
  • Java编程基础24——递归练习
  • Java到底能干嘛?
  • JAVA之继承和多态
  • js 实现textarea输入字数提示
  • Linux快速配置 VIM 实现语法高亮 补全 缩进等功能
  • React的组件模式
  • Redis 中的布隆过滤器
  • Vue 动态创建 component
  • vue.js框架原理浅析
  • 编写高质量JavaScript代码之并发
  • 前端相关框架总和
  • 什么软件可以剪辑音乐?
  • 用element的upload组件实现多图片上传和压缩
  • 怎么把视频里的音乐提取出来
  • 我们雇佣了一只大猴子...
  • ​DB-Engines 12月数据库排名: PostgreSQL有望获得「2020年度数据库」荣誉?
  • ​一些不规范的GTID使用场景
  • # Panda3d 碰撞检测系统介绍
  • #gStore-weekly | gStore最新版本1.0之三角形计数函数的使用
  • #微信小程序:微信小程序常见的配置传值
  • (done) NLP “bag-of-words“ 方法 (带有二元分类和多元分类两个例子)词袋模型、BoW
  • (黑客游戏)HackTheGame1.21 过关攻略
  • (免费分享)基于springboot,vue疗养中心管理系统
  • (实战)静默dbca安装创建数据库 --参数说明+举例
  • (一)基于IDEA的JAVA基础1
  • (原)Matlab的svmtrain和svmclassify
  • (转)Mysql的优化设置
  • (转载)在C#用WM_COPYDATA消息来实现两个进程之间传递数据
  • .NET Micro Framework初体验
  • .net 提取注释生成API文档 帮助文档
  • .net企业级架构实战之7——Spring.net整合Asp.net mvc
  • .net图片验证码生成、点击刷新及验证输入是否正确
  • .net下简单快捷的数值高低位切换
  • .Net中间语言BeforeFieldInit
  • .vollhavhelp-V-XXXXXXXX勒索病毒的最新威胁:如何恢复您的数据?
  • @Valid和@NotNull字段校验使用
  • @value 静态变量_Python彻底搞懂:变量、对象、赋值、引用、拷贝
  • @WebService和@WebMethod注解的用法
  • @软考考生,这份软考高分攻略你须知道