当前位置: 首页 > news >正文

看demo学算法之 卷积神经网络(CNN)

卷积神经网络(CNN)介绍:

卷积神经网络是一种深度学习算法,主要用于处理具有类似网格结构的数据,如图像。它通过层次化的特征提取和转换来识别图像中的模式。CNN的主要组成部分包括卷积层、池化层、激活层、全连接层和归一化层。

CNN的工作流程:

  1. 输入图像:首先,将图像作为输入数据传入网络。
  2. 特征提取:通过卷积层和激活层提取图像的局部特征。
  3. 特征选择:通过池化层减少特征维度,同时保留重要信息。
  4. 特征分类:通过全连接层将提取的特征转化为最终的分类结果。
  5. 输出结果:网络输出结果,如图像的类别标签。

好的,让我们通过一个简单的例子来更直观地理解卷积神经网络(CNN)的工作原理。

例子:手写数字识别

假设我们有一个简单的CNN模型,用于识别28x28像素的手写数字图像(例如MNIST数据集中的数字)。

网络结构:
  1. 输入层:28x28像素的灰度图像。
  2. 卷积层1:使用6个5x5的卷积核,步长为1,无填充(valid padding)。
  3. 激活层1:ReLU激活函数。
  4. 池化层1:2x2的最大池化。
  5. 卷积层2:使用16个5x5的卷积核,步长为1,无填充。
  6. 激活层2:ReLU激活函数。
  7. 池化层2:2x2的最大池化。
  8. 全连接层:有120个神经元。
  9. 激活层3:ReLU激活函数。
  10. 输出层:有10个神经元(对应0到9的数字),使用softmax激活函数。
工作流程:
  1. 输入图像:28x28像素的手写数字图像。
  2. 卷积层1:使用6个5x5的卷积核在输入图像上滑动,生成6个不同的特征图。
  3. 激活层1:应用ReLU激活函数,增强非线性特征。
  4. 池化层1:对每个特征图进行2x2的最大池化,减少数据维度。
  5. 卷积层2:使用16个5x5的卷积核在池化后的特征图上滑动,生成16个新的特征图。
  6. 激活层2:再次应用ReLU激活函数。
  7. 池化层2:进行2x2的最大池化。
  8. 全连接层:将池化后的特征图展平为一维向量,输入到全连接层。
  9. 激活层3:应用ReLU激活函数。
  10. 输出层:通过softmax函数输出每个数字类别的概率。
结果:

模型输出10个概率值,每个值对应一个数字类别(0到9)。最高的概率值对应的数字即为模型预测的数字。
这个例子展示了CNN如何通过层次化的特征提取和转换来识别图像中的模式。通过调整网络结构和参数,CNN可以适应更复杂的图像识别任务。

Python代码实例:

import tensorflow as tf
from tensorflow.keras import datasets, layers, models
import matplotlib.pyplot as plt
# 1. 加载和预处理数据
(train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data()
train_images = train_images.reshape((60000, 28, 28, 1)).astype('float32') / 255
test_images = test_images.reshape((10000, 28, 28, 1)).astype('float32') / 255
# 2. 构建CNN模型
model = models.Sequential()
model.add(layers.Conv2D(6, (5, 5), activation='relu', input_shape=(28, 28, 1)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(16, (5, 5), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Flatten())
model.add(layers.Dense(120, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))
# 3. 编译模型
model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics=['accuracy'])
# 4. 训练模型
history = model.fit(train_images, train_labels, epochs=5, validation_data=(test_images, test_labels))
# 5. 评估模型
test_loss, test_acc = model.evaluate(test_images, test_labels)
print(f'测试准确率: {test_acc:.4f}')
# 6. 模型预测
predictions = model.predict(test_images)
predicted_labels = tf.argmax(predictions, axis=1)
# 7. 绘制训练过程中的损失和准确率
plt.figure(figsize=(12, 4))
# 损失
plt.subplot(1, 2, 1)
plt.plot(history.history['loss'], label='训练损失')
plt.plot(history.history['val_loss'], label='验证损失')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()
# 准确率
plt.subplot(1, 2, 2)
plt.plot(history.history['accuracy'], label='训练准确率')
plt.plot(history.history['val_accuracy'], label='验证准确率')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.legend()
plt.show()

代码解释:

  • 加载和预处理数据:使用Keras的datasets.mnist.load_data()函数加载MNIST数据集,并将其归一化到0-1范围。
  • 构建CNN模型:按照之前描述的网络结构构建模型。
  • 编译模型:设置优化器为adam,损失函数为sparse_categorical_crossentropy,评估指标为accuracy
  • 训练模型:在训练数据上训练模型5个epochs,并记录训练过程中的损失和准确率。
  • 评估模型:在测试数据上评估模型的性能。
  • 模型预测:使用模型对测试数据进行预测,并输出前10个预测结果。
  • 绘制图表:使用Matplotlib绘制训练过程中的损失和准确率图表。

demo展示了如何使用Keras构建和训练一个简单的CNN模型,用于手写数字识别,并使用图表展示模型的训练过程和性能。你可以在本地环境中运行此代码,以观察模型的训练过程和性能。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 鸿蒙原生应用元服务开发-初识仓颉开发语言
  • Unity(2022.3.38LTS) - 输入
  • 企业电子招投标采购系统——功能模块功能描述+数字化采购管理 采购招投标
  • 【C++ 第十章】继承
  • php防止页面重复刷新或者重复提交
  • Excel表格使用IF条件判断
  • 介绍一下react中虚拟dom和diff算法
  • 第N5周:Pytorch文本分类入门
  • 如何在香港云服务器上优化网站性能?
  • 基于车联网大数据平台的用户驾驶习惯行为画像分析
  • AI学习记录 - 自注意力机制之权重矩阵和查询向量V矩阵的计算方式的补充
  • RCE绕过练习
  • 工厂模式和策略模式区别以及使用
  • STM32第十二节(中级篇):串口通信(第二节)——串口固件库函数以及串口发送和接收代码讲解
  • Nginx与Tomcat的区别
  • 【Leetcode】104. 二叉树的最大深度
  • 3.7、@ResponseBody 和 @RestController
  • Apache的基本使用
  • CSS 专业技巧
  • java 多线程基础, 我觉得还是有必要看看的
  • JAVA_NIO系列——Channel和Buffer详解
  • JavaScript 奇技淫巧
  • Java方法详解
  • Laravel Mix运行时关于es2015报错解决方案
  • Promise面试题2实现异步串行执行
  • PV统计优化设计
  • Rancher如何对接Ceph-RBD块存储
  • SSH 免密登录
  • 阿里云前端周刊 - 第 26 期
  • 不上全站https的网站你们就等着被恶心死吧
  • 大主子表关联的性能优化方法
  • 浏览器缓存机制分析
  • 前端之React实战:创建跨平台的项目架构
  • 前嗅ForeSpider中数据浏览界面介绍
  • 使用 @font-face
  • 事件委托的小应用
  • 问:在指定的JSON数据中(最外层是数组)根据指定条件拿到匹配到的结果
  • 用mpvue开发微信小程序
  • PostgreSQL之连接数修改
  • 阿里云服务器购买完整流程
  • 阿里云重庆大学大数据训练营落地分享
  • ​DB-Engines 12月数据库排名: PostgreSQL有望获得「2020年度数据库」荣誉?
  • #includecmath
  • #Linux(Source Insight安装及工程建立)
  • (02)Unity使用在线AI大模型(调用Python)
  • (3)医疗图像处理:MRI磁共振成像-快速采集--(杨正汉)
  • (30)数组元素和与数字和的绝对差
  • (4)事件处理——(6)给.ready()回调函数传递一个参数(Passing an argument to the .ready() callback)...
  • (BFS)hdoj2377-Bus Pass
  • (cos^2 X)的定积分,求积分 ∫sin^2(x) dx
  • (Java入门)学生管理系统
  • (zz)子曾经曰过:先有司,赦小过,举贤才
  • (分布式缓存)Redis持久化
  • (附源码)spring boot网络空间安全实验教学示范中心网站 毕业设计 111454
  • (紀錄)[ASP.NET MVC][jQuery]-2 純手工打造屬於自己的 jQuery GridView (含完整程式碼下載)...