当前位置：首页 > news >正文

Pytorch 实战 LESSON 16 深度学习视觉入门上

news 来源：原创 2024/5/4 22:39:56

文章目录

深度视觉行业综述
卷积与卷积神经网络的基本元素
Pytorch复现LeNet5与AlexNet
构筑自己的卷积神经网络

在这里插入图片描述

深度视觉行业综述

在这里插入图片描述

卷积与卷积神经网络的基本元素

在这里插入图片描述

高度，宽度，通道数

通道数绝对色彩空间。

在这里插入图片描述

在这里插入图片描述
0-255.越接近0越暗。越接近255越接近颜色通道颜色本身。3个都是255，是纯白色。

在这里插入图片描述
因为颜色的明亮程度不同，也就构成了图像的纹理不同。所以通道本身决定了图片的颜色和纹理等所有构成。

在这里插入图片描述

在这里插入图片描述

孔雀的颜色变了。因为opencv在读取图像，是BGR，不是我们以为的RGB。

#OpenCV默认读取后的图像通道是BGR，因此我们需要将图像的通道顺序转换为RGB
img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)

在这里插入图片描述

uint8限制像素是0-255.

在这里插入图片描述
255+10->9这不符合常识，255不能再亮了之后，不是让它变黑。所以我们需要调整它。通过先将像素转成float，然后用np.clip限制。

在这里插入图片描述

img = img/255
#所有像素值都在0-255范围内，通过除以255，我们将图像归一化，并让像素的范围被压缩到[0,1]之间

在这里插入图片描述

乘法和加法对于图像来说，是不太一样的。乘法是控制对比度，加法控制敏感程度。

在这里插入图片描述

在这里插入图片描述

这和我一开始学的不一样。才知道为什么叫卷积。

在这里插入图片描述
这里特别关键，我们之前说过，对图像像素进行数学运算，并且不超出图像的像素范围，就可以生成新的图像。而卷积就是一种从2个矩阵中得出新数值的方式。这个操作正好就是图像变换。

在这里插入图片描述

在这里插入图片描述

为什么要找个矩阵才旋转呢，为什么不直接找一个矩阵呢。所以从今天的眼光来说，旋转对于卷积已经是不太有意义的操作了。但是从卷积的发源来看，是有一个180度旋转的（数学线性加权）。在今天的深度学习当中，我们都不需要旋转了。很多人不知道卷积的卷怎么来的，卷就是旋转，但是目前不用旋转了。直接去求扫描区域和卷积核来进行点积。

在这里插入图片描述

感受野就是卷积核能够看到的区域。卷积核和感受野轮流得到的新的矩阵，叫特征图feature map。
在这里插入图片描述

sobel和laplace已经不能很好的凸显原始图像了。我们需要用不同的卷积核，去提取图像的特征。假设计算机可以自己判断图像需要什么样的卷积核算子，知道自己需要把特征提取道什么程度就ok，我们希望让计算机自己做。这就是深度学习，神经网络自己学习kernal的weight。