一、卷积神经网络CNN
图像分类
常用于图像分类等任务。
一张图像是一个三维的张量,其中一维代表图像的宽,另外一维代表图像的高,还有一维代表图像的通道(channel)数目。
通道(channel):彩色图像的每个像素都可以描述为红色(red)、绿色(green)、蓝色(blue)的组合,这 3 种颜色就称为图像的 3 个色彩通道。这种颜色描述方式称为 RGB 色彩模型,常用于在屏幕上显示颜色。
输入图像
网络的输入往往是向量,因此,将代表图像的三维张量“丢”到网络里之前,需要先将它“拉直”(展平)。
模型的输出
模型的目标是分类,因此可将不同的分类结果表示成不同的独热向量 y ′ y' y