当前位置: 首页 > news >正文

深度学习-Pytorch如何保存和加载模型

深度学习-Pytorch如何保存和加载模型

用pytorch构建模型,并训练模型,得到一个优化的模型,那么如何保存模型?然后如何又加载模型呢?

pytorch 目前在深度学习具有重要的地位,比起早先的caffe,tensorflow,keras越来越受到欢迎,其他的深度学习框架越来越显得小众。

数据分析

数据分析-Pandas如何转换产生新列

数据分析-Pandas如何统计数据概况

数据分析-Pandas如何轻松处理时间序列数据

数据分析-Pandas如何选择数据子集

数据分析-Pandas如何重塑数据表-CSDN博客

经典算法

经典算法-遗传算法的python实现

经典算法-模拟退火算法的python实现

经典算法-粒子群算法的python实现-CSDN博客

LLM应用

大模型查询工具助手之股票免费查询接口

Python技巧-终端屏幕打印光标和文字控制

如何保存模型

用pytorch构建模型,并训练模型,得到一个优化的模型,那么如何保存模型?

通常模型的信息很多,有些对使用没有用处,只需要保存感兴趣的参数部分状态就行,第二个参数就是模型路径和名称。

torch.save(model.state_dict(), "model.pth")
print("Saved PyTorch Model State to model.pth")

如何加载模型

保存好模型后,如何加载模型,进行使用呢?

这里,需要加载模型的网络结构,当然也需要加载参数部分状态。

model = NeuralNetwork().to(device)
model.load_state_dict(torch.load("model.pth"))

加载模型后,如何使用呢?

这个模型是分类模型,把衣服分为10类,预测也是10类,如下,类似与前文的模型测试部分。

读者可以自行比较下:

[深度学习-Pytorch如何构建和训练模型-CSDN博客]

classes = ["T-shirt/top","Trouser","Pullover","Dress","Coat","Sandal","Shirt","Sneaker","Bag","Ankle boot",
]model.eval()
x, y = test_data[0][0], test_data[0][1]
with torch.no_grad():x = x.to(device)pred = model(x)predicted, actual = classes[pred[0].argmax(0)], classes[y]print(f'Predicted: "{predicted}", Actual: "{actual}"')

Predicted: “Ankle boot”, Actual: “Ankle boot”

以上代码只是一个简单示例,示例代码中的表达式可以根据实际问题进行修改。

觉得有用 收藏 收藏 收藏

点个赞 点个赞 点个赞

End


DeepLearning文章:

深度学习-Pytorch数据集构造和分批加载-CSDN博客

深度学习-Pytorch如何构建和训练模型-CSDN博客

GPT专栏文章:

GPT实战系列-ChatGLM3本地部署CUDA11+1080Ti+显卡24G实战方案

GPT实战系列-LangChain + ChatGLM3构建天气查询助手

大模型查询工具助手之股票免费查询接口

GPT实战系列-简单聊聊LangChain

GPT实战系列-大模型为我所用之借用ChatGLM3构建查询助手

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型,到底做了什么?(二)

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型,到底做了什么?(一)

GPT实战系列-ChatGLM2模型的微调训练参数解读

GPT实战系列-如何用自己数据微调ChatGLM2模型训练

GPT实战系列-ChatGLM2部署Ubuntu+Cuda11+显存24G实战方案

GPT实战系列-Baichuan2本地化部署实战方案

GPT实战系列-Baichuan2等大模型的计算精度与量化

GPT实战系列-GPT训练的Pretraining,SFT,Reward Modeling,RLHF

GPT实战系列-探究GPT等大模型的文本生成-CSDN博客

相关文章:

  • 2023年第十六届中国系统架构师大会(SACC2023):核心内容与学习收获(附大会核心PPT下载)
  • 【grafana】使用教程
  • 实体识别与分类方法综述
  • 你认识哪几种树结构
  • PBM模型学习(六)团聚模型及UDF
  • 计算机网络第三章习题(谢希仁)
  • 城市建筑白模数据
  • docker之部署青龙面板
  • tee漏洞学习-翻译-1:从任何上下文中获取 TrustZone 内核中的任意代码执行
  • 《游戏-03_3D-开发》之—新输入系统人物移动攻击连击
  • XMLHttpRequestUpload 对象
  • 侯捷《C++标准11-14》笔记
  • uniapp安卓android离线打包本地打包整理
  • Oracal学习
  • pytorch实战-6手写数字加法机-迁移学习
  • 【面试系列】之二:关于js原型
  • 2017 前端面试准备 - 收藏集 - 掘金
  • idea + plantuml 画流程图
  • JAVA SE 6 GC调优笔记
  • Java 实战开发之spring、logback配置及chrome开发神器(六)
  • JavaScript/HTML5图表开发工具JavaScript Charts v3.19.6发布【附下载】
  • mysql常用命令汇总
  • spring boot 整合mybatis 无法输出sql的问题
  • Spring声明式事务管理之一:五大属性分析
  • SpriteKit 技巧之添加背景图片
  • SwizzleMethod 黑魔法
  • vue 个人积累(使用工具,组件)
  • vue2.0开发聊天程序(四) 完整体验一次Vue开发(下)
  • 发布国内首个无服务器容器服务,运维效率从未如此高效
  • 机器人定位导航技术 激光SLAM与视觉SLAM谁更胜一筹?
  • 检测对象或数组
  • 快速构建spring-cloud+sleuth+rabbit+ zipkin+es+kibana+grafana日志跟踪平台
  • 删除表内多余的重复数据
  • 实现简单的正则表达式引擎
  • 使用 @font-face
  • 远离DoS攻击 Windows Server 2016发布DNS政策
  • 追踪解析 FutureTask 源码
  • k8s使用glusterfs实现动态持久化存储
  • #if 1...#endif
  • #我与Java虚拟机的故事#连载08:书读百遍其义自见
  • (+4)2.2UML建模图
  • (13)Hive调优——动态分区导致的小文件问题
  • (k8s中)docker netty OOM问题记录
  • (二)JAVA使用POI操作excel
  • (简单有案例)前端实现主题切换、动态换肤的两种简单方式
  • (数位dp) 算法竞赛入门到进阶 书本题集
  • (转)c++ std::pair 与 std::make
  • (转)使用VMware vSphere标准交换机设置网络连接
  • .net 程序发生了一个不可捕获的异常
  • .net 逐行读取大文本文件_如何使用 Java 灵活读取 Excel 内容 ?
  • .Net调用Java编写的WebServices返回值为Null的解决方法(SoapUI工具测试有返回值)
  • :如何用SQL脚本保存存储过程返回的结果集
  • @ComponentScan比较
  • @JsonFormat与@DateTimeFormat注解的使用
  • @transactional 方法执行完再commit_当@Transactional遇到@CacheEvict,你的代码是不是有bug!...