当前位置：首页 > news >正文

pytorch 加载模型参数后如何测试数据，应用模型预测数据，然后连续变量转换成 list 或者numpy.array padans并保存到csv文件中

news 来源：原创 2024/9/27 15:34:49

在PyTorch中，加载模型参数后测试数据通常涉及以下几个步骤：

1. **加载模型**：首先，你需要定义模型的结构，然后加载预训练的参数。

2. **加载数据**：准备你的测试数据集。确保数据集已经正确地预处理，以匹配训练时的格式。

3. **设置模型为评估模式**：在进行推理之前，将模型设置为评估模式，这会关闭Dropout和Batch Normalization层的训练行为。

4. **进行推理**：遍历测试数据集，使用模型进行预测。

5. **评估模型**：根据模型的输出和测试数据集的真实标签计算性能指标，如准确率、损失等。

下面是一个简化的代码示例，展示了这个过程：

```python
import torch
from torch import nn
from torch.utils.data import DataLoader
from torchvision import datasets, transforms

# 假设我们有一个预定义的模型结构
class MyModel(nn.Module):
def __init__(self):
super(MyModel, self).__init__()
# 定义模型层
# ...

def forward(self, x):
# 定义前向传播
# ...
return x

# 实例化模型
model = MyModel()

# 加载预训练的模型参数
model.load_state_dict(torch.load('model_parameters.pth'))

# 设置为评估模式
model.eval()

# 准备测试数据集
transform = transforms.Compose([
transforms.ToTensor(),
# 其他必要的转换
])
test_dataset = datasets.MNIST(root='./data', train=False, transform=transform)
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False)

# 测试模型
correct = 0
total = 0
with torch.no_grad(): # 不计算梯度，节省计算资源
for data in test_loader:
images, labels = data
outputs = model(images)
_, predicted = torch.max(outputs.data, 1)
total += labels.size(0)
correct += (predicted == labels).sum().item()

# 计算准确率
accuracy = 100 * correct / total
print(f'Accuracy of the model on the test images: {accuracy}%')
```

在这个例子中，我们首先定义了一个模型类`MyModel`，然后加载了模型参数。接着，我们设置了模型为评估模式，并准备了一个测试数据集。最后，我们遍历测试数据集，计算模型的准确率。

如何预测呢

在PyTorch中进行预测通常涉及以下步骤：

1. **加载模型**：确保你的模型已经加载了预训练的参数。

2. **设置模型为评估模式**：使用`model.eval()`将模型设置为评估模式，这样可以关闭Dropout和Batch Normalization等仅在训练时使用的层。

3. **准备输入数据**：确保你的输入数据是正确的格式，并且已经进行了适当的预处理，比如缩放、归一化等。

4. **进行预测**：将输入数据传递给模型，获取输出。

5. **处理输出**：根据模型的输出进行后处理，比如转换为概率、选择最可能的类别等。

下面是一个具体的代码示例，展示如何使用PyTorch进行预测：

```python
import torch
from torchvision import transforms
from PIL import Image

# 假设模型已经加载并设置为评估模式
model.eval()

# 定义图像的预处理
transform = transforms.Compose([
transforms.Resize((224, 224)), # 调整图像大小
transforms.ToTensor(), # 将图像转换为Tensor
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) # 归一化
])

# 加载图像
image = Image.open("path_to_your_image.jpg")
image = transform(image).unsqueeze(0) # 增加一个批次维度

# 进行预测
with torch.no_grad(): # 不计算梯度
outputs = model(image)

# 将输出转换为概率
probabilities = torch.nn.functional.softmax(outputs, dim=1)

# 获取最大概率的索引，即预测的类别
_, predicted = torch.max(probabilities, 1)

# 打印预测结果
print(f"Predicted class: {predicted.item()}")
```

### 详细步骤解释：

1. **加载模型**：
```python
model.eval()
```
使用`model.eval()`将模型设置为评估模式。

2. **定义图像预处理**：
```python
transform = transforms.Compose([
transforms.Resize((224, 224)), # 调整图像大小
transforms.ToTensor(), # 将图像转换为Tensor
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) # 归一化
])
```
使用`transforms.Compose`定义一系列预处理步骤，包括调整图像大小、转换为Tensor和归一化。

3. **加载图像**：
```python
image = Image.open("path_to_your_image.jpg")
image = transform(image).unsqueeze(0) # 增加一个批次维度
```
使用`PIL`库加载图像，并应用预处理。`unsqueeze(0)`用于增加一个批次维度，因为模型期望批次维度。

4. **进行预测**：
```python
with torch.no_grad(): # 不计算梯度
outputs = model(image)
```
使用`torch.no_grad()`禁用梯度计算，这样可以节省内存并加速预测。将处理后的图像传递给模型，获取输出。

5. **处理输出**：
```python
probabilities = torch.nn.functional.softmax(outputs, dim=1)
_, predicted = torch.max(probabilities, 1)
```
使用`softmax`函数将模型输出转换为概率分布，然后使用`torch.max`获取最大概率的索引，即预测的类别。

6. **打印预测结果**：
```python
print(f"Predicted class: {predicted.item()}")
```
打印预测的类别。

这个示例展示了如何使用PyTorch进行图像分类的预测。如果你有其他类型的数据或任务（如回归、生成任务等），预测步骤可能会有所不同，但基本流程是类似的。如果你有具体的模型或任务，我可以提供更详细的帮助。

with torch.no_grad():

test_result = model(X_test)、

在PyTorch中，使用`with torch.no_grad():`块来执行模型的推理是一种常见的做法，特别是在进行预测或评估模型时。这个上下文管理器的作用是告诉PyTorch在这个代码块内不需要计算梯度，这样可以节省内存和计算资源。

当你写：

```python
with torch.no_grad():
test_result = model(X_test)
```

这意味着你正在将输入数据`X_test`传递给模型，并获取模型的输出，存储在变量`test_result`中。由于你已经处于`torch.no_grad()`上下文中，PyTorch不会跟踪在这个块内进行的任何操作的梯度，这对于推理阶段是必要的，因为在推理阶段你不需要进行反向传播。

这里的`X_test`应该是你的测试数据，它需要是适当的PyTorch张量格式，并且已经经过了与训练时相同的预处理步骤。

以下是使用这段代码进行预测的完整示例：

```python
import torch
from torch.utils.data import DataLoader

# 假设 model 已经被定义并加载了预训练的参数
model.eval()

# 假设 X_test 是你的测试数据集，这里是一个简化的例子
# 你需要根据你的数据集实际情况来加载和预处理数据
# X_test = ...

# 测试数据加载器
test_loader = DataLoader(X_test, batch_size=64, shuffle=False)

# 存储预测结果
predictions = []

# 不计算梯度，进行预测
with torch.no_grad():
for data in test_loader:
outputs = model(data)
_, predicted = torch.max(outputs.data, 1)
predictions.extend(predicted.cpu().numpy())

# 现在 predictions 包含了所有测试数据的预测结果
```

在这个例子中，我们遍历了测试数据加载器`test_loader`中的所有数据，对每个批次的数据进行预测，并将预测结果存储在`predictions`列表中。注意，我们使用`.cpu().numpy()`将预测结果从PyTorch张量转换为NumPy数组，以便进一步处理或评估。

请确保你的`X_test`数据是正确预处理的，并且模型`model`已经设置为评估模式（`model.eval()`）。如果你需要进一步的帮助来准备数据或评估模型，请提供更多的信息。

转换成文本保存到csv中

要将模型的预测结果`test_result`转换成文本并保存到CSV文件中，你可以使用Python的`csv`模块或`pandas`库。以下是使用`pandas`库将结果保存到CSV文件的步骤：

首先，确保你已经安装了`pandas`库。如果没有安装，可以使用`pip`安装它：

```bash
pip install pandas
```

然后，你可以使用以下代码将预测结果保存到CSV文件中：

```python
import torch
import pandas as pd

# 假设 model 已经被定义并加载了预训练的参数
model.eval()

# 假设 X_test 是你的测试数据集
# 你需要根据你的数据集实际情况来加载和预处理数据
# X_test = ...

# 进行预测
with torch.no_grad():
test_result = model(X_test)

# 将预测结果转换成CPU上的numpy数组（如果它们不在CPU上）
# 并且转换成一维数组（如果它们是多维的）
# 这里假设test_result是多维的，我们取每个样本的预测类别
_, predicted = torch.max(test_result, 1)
predicted = predicted.cpu().numpy()

# 将预测结果转换成DataFrame
df = pd.DataFrame(predicted, columns=['Predicted_Class'])

# 保存到CSV文件
df.to_csv('predictions.csv', index=False)
```

在这段代码中，我们首先使用`torch.max`获取每个测试样本的预测类别，然后使用`.cpu().numpy()`将它们转换为NumPy数组。接着，我们创建了一个`pandas` DataFrame，并将这个DataFrame保存到名为`predictions.csv`的CSV文件中。`index=False`参数的作用是在保存时不包括行索引。

如果你的预测结果是概率或其他连续值，你可能需要根据你的需求调整代码来保存这些值。

如果你不想使用`pandas`，也可以使用Python的内置`csv`模块，如下所示：

```python
import torch
import csv

# 进行预测
with torch.no_grad():
test_result = model(X_test)

# 将预测结果转换成CPU上的numpy数组
test_result = test_result.cpu().numpy()

# 打开一个文件用于写入
with open('predictions.csv', 'w', newline='') as file:
writer = csv.writer(file)
# 写入标题（如果有的话）
writer.writerow(['Predicted_Class'])
# 写入预测结果
for row in test_result:
writer.writerow(row)
```

在这个例子中，我们使用`csv.writer`对象来写入CSV文件。我们首先写入标题行（如果你有多个预测值，可以在这里添加更多的标题），然后遍历`test_result`数组，将每一行写入文件。记得在打开文件时使用`newline=''`参数，以防止在写入时出现额外的空行。

y_test.view(batch_size, datalen//batch_size, 1) 如何变成一个维度的张量呢

在PyTorch中，如果你想要将一个多维张量（例如，一个形状为`(batch_size, datalen//batch_size, 1)`的张量）变成一个一维张量，你可以使用`view`方法或者`reshape`方法来改变张量的形状，但要保持总元素数量不变。对于你提到的张量，我们可以通过移除中间的维度来实现这一点。

这里有两种方法可以实现：

### 方法1: 使用`view`方法
`view`方法可以重新排列张量的形状，但要求新形状的元素总数与原形状相同。对于你的例子，如果你想将`(batch_size, datalen//batch_size, 1)`形状的张量变为一维，可以这样做：

```python
# 假设 y_test 是一个形状为 (batch_size, datalen//batch_size, 1) 的张量
y_test_flattened = y_test.view(-1) # '-1' 让 PyTorch 自动计算这个维度的大小
```

这里，`-1`告诉PyTorch自动计算这个维度的大小，以便保持总元素数量不变。这将使`y_test`变为一个一维张量。

### 方法2: 使用`reshape`方法
`reshape`方法与`view`类似，但`reshape`在某些情况下更灵活，因为它可以处理非连续张量。如果原始张量不是连续的，`reshape`会尝试返回一个视图，如果不可能，它会复制数据到一个新的连续张量。

```python
# 同样假设 y_test 是一个形状为 (batch_size, datalen//batch_size, 1) 的张量
y_test_flattened = y_test.reshape(-1)
```

### 检查结果
无论使用哪种方法，你都可以通过打印`y_test_flattened.shape`来验证结果，确保它现在是一维的。

### 注意
- 确保在调用`view`或`reshape`之前，张量是连续的。如果不是，你可能需要先调用`y_test.contiguous()`。
- 这两种方法都不会改变原始数据，它们只是改变了数据的视图。

这样，你就可以将任何形状的张量转换为一维张量，这对于某些操作（如保存到文件、进行某些类型的计算等）非常有用。

然后转换成 list 或者numpy.array 并保存到csv文件中

要将PyTorch张量转换成列表或NumPy数组，并保存到CSV文件中，你可以按照以下步骤操作：

### 1. 将张量转换为NumPy数组

首先，确保你的张量在CPU上（如果它在GPU上），然后使用`.numpy()`方法将其转换为NumPy数组。

```python
import torch

# 假设 y_test_flattened 是一个形状为 (batch_size * (datalen//batch_size),) 的一维张量
y_test_flattened = y_test.view(-1)

# 确保张量在CPU上
y_test_flattened = y_test_flattened.cpu()

# 转换为NumPy数组
y_test_numpy = y_test_flattened.numpy()
```

### 2. 将NumPy数组保存到CSV文件

使用NumPy的`savetxt`函数，你可以将数组保存到CSV文件中。

```python
import numpy as np

# 保存到CSV文件
np.savetxt('output.csv', y_test_numpy, delimiter=',', fmt='%d')
```

在这里，`fmt='%d'`指定了数组中的整数应该以整数格式保存。如果你的数据是浮点数，你可以使用`fmt='%.18e'`（或其他精度）来保存。

### 3. 使用Pandas保存到CSV

如果你更喜欢使用Pandas，这也是一个不错的选择，特别是当你需要更多的格式化选项时。

```python
import pandas as pd

# 将NumPy数组转换为DataFrame
df = pd.DataFrame(y_test_numpy, columns=['Label'])

# 保存到CSV文件
df.to_csv('output.csv', index=False)
```

这里，我们创建了一个单列的DataFrame，并将其保存到CSV文件中。`index=False`参数确保不将行索引写入文件。

### 完整示例

将以上步骤合并，得到一个完整的示例：

```python
import torch
import numpy as np
import pandas as pd

# 假设 y_test 是一个形状为 (batch_size, datalen//batch_size, 1) 的张量
y_test_flattened = y_test.view(-1).cpu()

# 转换为NumPy数组
y_test_numpy = y_test_flattened.numpy()

# 使用Pandas保存到CSV
df = pd.DataFrame(y_test_numpy, columns=['Label'])
df.to_csv('output.csv', index=False)
```

这个示例展示了如何将PyTorch张量转换为NumPy数组，然后使用Pandas将其保存到CSV文件中。这种方法适用于处理任何类型的数值数据，并可以轻松地调整以满足你的特定需求。

单链表的实现（C语言）

Android 去掉SIM卡插拔出现的重启弹窗提示

STM32 的 SDIO 接口(基于STM32F429HAL库)

【xhs截流软件】爬取小红书关键词笔记下的筛选评论

ComfyUI 节点、插件的基本指南

PHP程序如何实现限制一台电脑登录？

024.PL-SQL进阶—游标

吐血整理 ChatGPT 3.5/4.0 新手使用手册~ 【亲测好用】

ES6的简单介绍(第三部分)

基于Java语言的充电桩平台+充电桩系统+充电桩管理系统+充电桩系统源码+充电桩管理后台+充电桩小程序

Service和Endpoints

python学习记录3

ansible部署二进制mysql 8

文献阅读——基于拉格朗日乘子的电力系统安全域边界通用搜索方法

【RDMA】mlxconfig修改和查询网卡(固件)配置--驱动工具

[rust! #004] [译] Rust 的内置 Traits, 使用场景, 方式, 和原因

Apache Spark Streaming 使用实例

C# 免费离线人脸识别 2.0 Demo

centos安装java运行环境jdk+tomcat

Docker下部署自己的LNMP工作环境

Less 日常用法

MD5加密原理解析及OC版原理实现

nodejs实现webservice问题总结

node学习系列之简单文件上传

QQ浏览器x5内核的兼容性问题

VuePress 静态网站生成

程序员最讨厌的9句话，你可有补充？

技术：超级实用的电脑小技巧

理清楚Vue的结构

聊聊hikari连接池的leakDetectionThreshold

深度学习中的信息论知识详解

栈实现走出迷宫（C++）

这几个编码小技巧将令你 PHP 代码更加简洁

自定义函数

Spring Batch JSON 支持

# Redis 入门到精通（一）数据类型（4）

#nginx配置案例

#鸿蒙生态创新中心#揭幕仪式在深圳湾科技生态园举行

（0）Nginx 功能特性

(done) ROC曲线和 AUC值分别是什么？

（Matalb时序预测）WOA-BP鲸鱼算法优化BP神经网络的多维时序回归预测

（STM32笔记）九、RCC时钟树与时钟第一部分

（二）七种元启发算法（DBO、LO、SWO、COA、LSO、KOA、GRO）求解无人机路径规划MATLAB

（译）计算距离、方位和更多经纬度之间的点

(原創) 如何優化ThinkPad X61開機速度? (NB) (ThinkPad) (X61) (OS) (Windows)

(转)AS3正则：元子符,元序列,标志,数量表达符

（转）Unity3DUnity3D在android下调试

(转)视频码率,帧率和分辨率的联系与区别

(转载)hibernate缓存

***监测系统的构建（chkrootkit ）

.gitattributes 文件

.NET/C# 的字符串暂存池

.NET关于跳过SSL中遇到的问题

.Net转Java自学之路—基础巩固篇十三（集合）

.pyc文件是什么？

在PyTorch中，加载模型参数后测试数据通常涉及以下几个步骤：

如何预测呢

转换成文本 保存到csv中

y_test.view(batch_size, datalen//batch_size, 1) 如何变成一个维度的张量呢

然后转换成 list 或者numpy.array 并保存到csv文件中

相关文章：

转换成文本保存到csv中