当前位置：首页 > news >正文

北京交通大学《深度学习》专业课，实验3卷积、空洞卷积、残差神经网络实验

news 来源：原创 2024/9/20 20:21:01

一、实验要求

1. 二维卷积实验（平台课与专业课要求相同）

⚫ 手写二维卷积的实现，并在至少一个数据集上进行实验，从训练时间、预测精度、Loss变化等角度分析实验结果（最好使用图表展示）

⚫ 使用torch.nn实现二维卷积，并在至少一个数据集上进行实验，从训练时间、预测精度、Loss变化等角度分析实验结果（最好使用图表展示）

⚫ 不同超参数的对比分析（包括卷积层数、卷积核大小、batchsize、lr等）选其中至少1-2个进行分析

⚫ 使用PyTorch实现经典模型AlexNet并在至少一个数据集进行试验分析（平台课同学选做，专业课同学必做）（无GPU环境则至少实现模型）

⚫ 使用实验2中的前馈神经网络模型来进行实验，并将实验结果与卷积模型结果进行对比分析（选作）

2. 空洞卷积实验（专业课）

⚫ 使用torch.nn实现空洞卷积，要求dilation满足HDC条件（如1,2,5）且要堆叠多层并在至少一个数据集上进行实验，从训练时间、预测精度、Loss 变化等角度分析实验结果（最好使用图表展示）

⚫ 将空洞卷积模型的实验结果与卷积模型的结果进行分析比对，训练时间、预测精度、Loss变化等角度分析

⚫ 不同超参数的对比分析（包括卷积层数、卷积核大小、不同dilation的选择， batchsize、lr等）选其中至少1-2个进行分析（选做）

3. 残差网络实验（专业课）

⚫ 实现给定结构的残差网络，在至少一个数据集上进行实验，从训练时间、预测精度、Loss 变化等角度分析实验结果（最好使用图表展示）

⚫ 将残差网络与空洞卷积相结合，在至少一个数据集上进行实验，从训练时间、预测精度、Loss 变化等角度分析实验结果（最好使用图表展示）（选做）

二、源代码

见资源“北京交通大学《深度学习》专业课，实验3卷积神经网络、空洞卷积、残差神经网络实验”

三、实验问题

问题一：变形函数无法使用

教学视频中对图片进行变形时使用的代码——Image.ANTIALIAS报错

解决办法：更换新代码 ——Image.Resampling.LANCZOS

问题二：记录测试时间时函数无法使用

解决办法：在python3.8中，time模块下不支持clock，更换新代码——time.perf_counter()

问题三：显存爆炸

在不断调整参数时，突然出现报错：

RuntimeError: CUDA out of memory. Tried to allocate 20.00 MiB (GPU 0; 4.00 GiB total capacity; 2.44 GiB already allocated; 0 bytes free; 2.45 GiB reserved in total by PyTorch)

解决办法：在执行代码前输入释放显存：

if hasattr(torch.cuda, 'empty_cache'):torch.cuda.empty_cache()

补充：此方法不一定生效！

大概率是因为实验机器性能问题，也就是显卡不够用了。。。

此时更有效的办法是降低参数量，或者简单粗暴的换更好的显卡。

问题四：设置卷积核参数

训练输入的样本和分类对象是已定的。

训练的深度（隐藏层的层数）和卷积核（神经元）的数量、大小都是训练前根据经验设定的。

如果训练参数设置不合理会导致过拟合或者欠拟合！！

卷积网络也可以通过误差反向传播算法来进行参数学习，参数为卷积核中权重以及偏置

即在训练过程中，网络会自动调整卷积核的参数，使得输出特征最优化。

同时，卷积神经网络也可以使用预训练模型来初始化卷积核的参数，以加速网络的训练过程。预训练模型可以使用已经在大规模数据上训练好的模型参数，这些参数已经学习到了一些通用的特征，可以在新的任务中进行微调，以提高网络的性能。

北京网站建设多少钱？

辽宁网页制作哪家好_网站建设

高端品牌网站建设_汉中网站制作

基于trace_id实现SpringCloudGateway网关的链路追踪

比较 WordPress 、 Baklib 和 BetterDocs

Qt开发网络嗅探器02

webSocket模块组件

八股文之java基础

python大小写转换、驼峰大小写转换

NodeJS系列面试题

SwiftUI 5.0（iOS 17）滚动视图的滚动目标行为（Target Behavior）解惑和实战

Quectel EM05-CE 模块测试

VScode通过Graphviz插件和dot文件绘制层次图，导出svg

前端面试题整理

揭开黑箱：目标检测中可解释性的重要性与实现

kail-linux如何使用NAT连接修改静态IP

Java面试题系列 - 第17天

FreeRTOS的互斥锁（互斥信号量）使用

crontab执行失败的多种原因

egg(89)--egg之redis的发布和订阅

EOS是什么

input的行数自动增减

java多线程

Java知识点总结（JavaIO-打印流）

java中的hashCode

Js基础——数据类型之Null和Undefined

JS数组方法汇总

Python_OOP

unity如何实现一个固定宽度的orthagraphic相机

ViewService——一种保证客户端与服务端同步的方法

Vue.js源码（2）：初探List Rendering

从零开始的无人驾驶 1

利用阿里云 OSS 搭建私有 Docker 仓库

在Unity中实现一个简单的消息管理器

智能合约Solidity教程-事件和日志（一）

puppet连载22：define用法

#include＜初见C语言之指针（5）＞

#宝哥教你#查看jquery绑定的事件函数

（3）nginx 配置(nginx.conf)

（Redis使用系列） SpringBoot中Redis的RedisConfig 二

（solr系列:一）使用tomcat部署solr服务

（附源码）基于SSM多源异构数据关联技术构建智能校园-计算机毕设 64366

（介绍与使用）物联网NodeMCUESP8266（ESP-12F）连接新版onenet mqtt协议实现上传数据（温湿度）和下发指令（控制LED灯）

（十五）devops持续集成开发——jenkins流水线构建策略配置及触发器的使用

(收藏）Git和Repo扫盲——如何取得Android源代码

(一)基于IDEA的JAVA基础12

（终章）[图像识别]13.OpenCV案例自定义训练集分类器物体检测

(转)菜鸟学数据库（三）——存储过程

***详解账号泄露：全球约1亿用户已泄露

*++p：p先自＋，然后*p，最终为3 ++*p：先*p，即arr[0]=1，然后再++，最终为2 *p++：值为arr[0],即1，该语句执行完毕后，p指向arr[1]

.md即markdown文件的基本常用编写语法

.NET / MSBuild 扩展编译时什么时候用 BeforeTargets / AfterTargets 什么时候用 DependsOnTargets？

.NET C# 使用GDAL读取FileGDB要素类

.NET Framework .NET Core与 .NET 的区别

.NET/C# 编译期间能确定的相同字符串，在运行期间是相同的实例

.net8.0与halcon编程环境构建

？？如何把JavaScript脚本中的参数传到java代码段中

@RequestMapping 的作用是什么？

一、实验要求

1. 二维卷积实验（平台课与专业课要求相同）

2. 空洞卷积实验（专业课）

3. 残差网络实验（专业课）

二、源代码

三、实验问题

问题一： 变形函数无法使用

问题二： 记录测试时间时函数无法使用

问题三： 显存爆炸

问题四： 设置卷积核参数

相关文章：

问题一：变形函数无法使用

问题二：记录测试时间时函数无法使用

问题三：显存爆炸

问题四：设置卷积核参数