当前位置: 首页 > news >正文

深度学习基础与实战:Python实现

深度学习基础与实战:Python实现

深度学习是机器学习的一个重要分支,通过多层神经网络实现对数据的自动特征提取和建模。本文将介绍深度学习的基础概念、常用框架以及一个完整的实战项目,帮助读者从基础入门到实际应用。

目录

  1. 深度学习概述
  2. 深度学习基础
    • 神经网络结构
    • 前向传播与反向传播
    • 激活函数
  3. Python中的深度学习框架
    • TensorFlow
    • Keras
    • PyTorch
  4. 深度学习模型
    • 简单神经网络
    • 卷积神经网络
    • 循环神经网络
  5. 实战项目:手写数字识别
  6. 总结

1. 深度学习概述

深度学习通过模拟人脑的神经网络结构来进行数据处理和模式识别,广泛应用于图像识别、自然语言处理和语音识别等领域。深度学习模型通过多层神经元的非线性变换,逐层提取数据的特征,实现复杂的模式识别和决策。

2. 深度学习基础

神经网络结构

神经网络由多个层(输入层、隐藏层和输出层)组成,每一层包含若干个神经元。神经元之间通过权重相连,权重的调整使得神经网络能够学习和预测。

import numpy as np# 定义一个简单的神经网络
class SimpleNN:def __init__(self, input_size, hidden_size, output_size):self.W1 = np.random.randn(input_size, hidden_size)self.W2 = np.random.randn(hidden_size, output_size)def forward(self, X):self.z1 = np.dot(X, self.W1)self.a1 = self.sigmoid(self.z1)self.z2 = np.dot(self.a1, self.W2)self.a2 = self.sigmoid(self.z2)return self.a2def sigmoid(self, s):return 1 / (1 + np.exp(-s))def sigmoid_derivative(self, s):return s * (1 - s)
前向传播与反向传播

前向传播是计算神经网络输出的过程,反向传播则是通过计算损失函数的梯度来更新权重。

class SimpleNN:# ... previous code ...def backward(self, X, y, output):self.output_error = y - outputself.output_delta = self.output_error * self.sigmoid_derivative(output)self.z1_error = self.output_delta.dot(self.W2.T)self.z1_delta = self.z1_error * self.sigmoid_derivative(self.a1)self.W1 += X.T.dot(self.z1_delta)self.W2 += self.a1.T.dot(self.output_delta)
激活函数

激活函数用于引入非线性特性,使得神经网络可以拟合复杂的函数。常用的激活函数包括Sigmoid、ReLU和Tanh。

import matplotlib.pyplot as pltx = np.linspace(-10, 10, 100)
sigmoid = 1 / (1 + np.exp(-x))
relu = np.maximum(0, x)
tanh = np.tanh(x)plt.figure(figsize=(10, 6))
plt.plot(x, sigmoid, label='Sigmoid')
plt.plot(x, relu, label='ReLU')
plt.plot(x, tanh, label='Tanh')
plt.legend()
plt.show()

3. Python中的深度学习框架

Python中有许多强大的深度学习框架,这些框架提供了丰富的工具和接口,方便我们进行深度学习模型的构建和训练。

TensorFlow

TensorFlow是由Google开发的开源深度学习框架,支持大规模分布式计算。

import tensorflow as tf# 定义一个简单的全连接层
model = tf.keras.Sequential([tf.keras.layers.Dense(64, activation='relu'),tf.keras.layers.Dense(10, activation='softmax')
])# 编译模型
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])# 训练模型
model.fit(X_train, y_train, epochs=10)
Keras

Keras是一个高级深度学习API,能够运行在TensorFlow、Theano和CNTK之上,具有简洁和易用的特点。

from keras.models import Sequential
from keras.layers import Dense# 定义一个简单的神经网络
model = Sequential([Dense(64, input_dim=20, activation='relu'),Dense(10, activation='softmax')
])# 编译模型
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])# 训练模型
model.fit(X_train, y_train, epochs=10, batch_size=32)
PyTorch

PyTorch是由Facebook开发的深度学习框架,支持动态图计算,灵活性高。

import torch
import torch.nn as nn
import torch.optim as optim# 定义一个简单的神经网络
class SimpleNN(nn.Module):def __init__(self):super(SimpleNN, self).__init__()self.fc1 = nn.Linear(20, 64)self.fc2 = nn.Linear(64, 10)def forward(self, x):x = torch.relu(self.fc1(x))x = torch.softmax(self.fc2(x), dim=1)return xmodel = SimpleNN()
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)# 训练模型
for epoch in range(10):outputs = model(X_train)loss = criterion(outputs, y_train)optimizer.zero_grad()loss.backward()optimizer.step()

4. 深度学习模型

简单神经网络

简单神经网络包含一个或多个隐藏层,每个隐藏层包含若干个神经元。

import tensorflow as tfmodel = tf.keras.Sequential([tf.keras.layers.Dense(64, activation='relu'),tf.keras.layers.Dense(32, activation='relu'),tf.keras.layers.Dense(10, activation='softmax')
])model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=10)
卷积神经网络

卷积神经网络(CNN)擅长处理图像数据,通过卷积层和池化层提取图像特征。

import tensorflow as tfmodel = tf.keras.Sequential([tf.keras.layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),tf.keras.layers.MaxPooling2D((2, 2)),tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),tf.keras.layers.MaxPooling2D((2, 2)),tf.keras.layers.Flatten(),tf.keras.layers.Dense(64, activation='relu'),tf.keras.layers.Dense(10, activation='softmax')
])model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=10)
循环神经网络

循环神经网络(RNN)擅长处理序列数据,通过循环结构捕捉数据的时间依赖性。

import tensorflow as tfmodel = tf.keras.Sequential([tf.keras.layers.Embedding(input_dim=10000, output_dim=64),tf.keras.layers.SimpleRNN(128),tf.keras.layers.Dense(10, activation='softmax')
])model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=10)

5. 实战项目:手写数字识别

我们将使用MNIST数据集进行手写数字识别任务,结合前述技术,进行完整的实现。

数据导入与预处理
import tensorflow as tf# 加载数据
mnist = tf.keras.datasets.mnist
(X_train, y_train), (X_test, y_test) = mnist.load_data()# 数据归一化
X_train, X_test = X_train / 255.0, X_test / 255.0# 增加通道维度
X_train = X_train[..., tf.newaxis]
X_test = X_test[..., tf.newaxis]
模型构建与训练
model = tf.keras.Sequential([tf.keras.layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),tf.keras.layers.MaxPooling2D((2, 2)),tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),tf.keras.layers.MaxPooling2D((2, 2)),tf.keras.layers.Flatten(),tf.keras.layers.Dense(64, activation='relu'),tf.keras.layers.Dense(10, activation='softmax')
])model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=5, validation_data=(X_test, y_test))
模型评估
# 模型评估
loss, accuracy = model.evaluate(X_test, y_test)
print(f'Accuracy: {accuracy}')# 可视化预测结果
import matplotlib.pyplot as plt
import numpy as np# 预测
predictions = model.predict(X_test)# 绘制前10个测试样本及其预测结果
for i in range(10):plt.subplot(2, 5, i+1)plt.imshow(X_test[i].reshape(28, 28), cmap='gray')plt.title(f'Pred: {np.argmax(predictions[i])}, True: {y_test[i]}')plt.axis('off')
plt.show()

6. 总结

本文详细介绍了深度学习的基础概念、常用框架、深度学习模型以及一个完整的实战项目。通过本文的学习,读者可以掌握深度学习的基础知识和技术,并能在实际项目中应用这些知识进行模型构建和训练。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • spark任务,使用 repartition 对数据进行了重新分区,但任务输入数据大小仍存在不均衡
  • mmtracking单目标跟踪数据集说明以及自定义数据集
  • 重载车辆驾驶舱地板的监测与故障诊断
  • Opencv图像处理(全)
  • 【建议收藏】一万字图文并茂,终于有人把GPT的玩法整理全了
  • centos单机配置多个内网IP地址
  • LLMs 入门实战系列
  • HTTP协议。(HTTP-概述和特点、HTTP-请求协议、HTTP-请求数据格式、浏览器访问服务器的几种方式)
  • 算法 —— 模拟
  • 【JavaEE】网络编程——UDP
  • 工程化-vue3+ts:代码检测工具 ESLint
  • C++入门到进阶(图文详解,持续更新中)
  • Qt学生管理系统(付源码)
  • 解析 unstructured pdfminer_utils.py rect_to_bbox 坐标转换函数
  • IOC、DI<4> Unity、AOP、MVCAOP、UnityAOP 区别
  • const let
  • Cookie 在前端中的实践
  • co模块的前端实现
  • Effective Java 笔记(一)
  • JAVA_NIO系列——Channel和Buffer详解
  • Java|序列化异常StreamCorruptedException的解决方法
  • JS题目及答案整理
  • js正则,这点儿就够用了
  • k个最大的数及变种小结
  • markdown编辑器简评
  • nodejs:开发并发布一个nodejs包
  • Protobuf3语言指南
  • python 学习笔记 - Queue Pipes,进程间通讯
  • SegmentFault 2015 Top Rank
  • 对象引论
  • 分享自己折腾多时的一套 vue 组件 --we-vue
  • 简析gRPC client 连接管理
  • 深度解析利用ES6进行Promise封装总结
  • 一个JAVA程序员成长之路分享
  • ​secrets --- 生成管理密码的安全随机数​
  • # 透过事物看本质的能力怎么培养?
  • #### go map 底层结构 ####
  • (Redis使用系列) Springboot 实现Redis消息的订阅与分布 四
  • (二)windows配置JDK环境
  • (分布式缓存)Redis持久化
  • (附源码)spring boot儿童教育管理系统 毕业设计 281442
  • (附源码)ssm跨平台教学系统 毕业设计 280843
  • (五)网络优化与超参数选择--九五小庞
  • (转)http-server应用
  • .net core + vue 搭建前后端分离的框架
  • .NET/C# 将一个命令行参数字符串转换为命令行参数数组 args
  • .net2005怎么读string形的xml,不是xml文件。
  • .NET业务框架的构建
  • .pub是什么文件_Rust 模块和文件 - 「译」
  • ?php echo ?,?php echo Hello world!;?
  • @31省区市高考时间表来了,祝考试成功
  • @angular/cli项目构建--http(2)
  • [ web基础篇 ] Burp Suite 爆破 Basic 认证密码
  • [ACM] hdu 1201 18岁生日
  • [android] 天气app布局练习