当前位置: 首页 > news >正文

《动手学深度学习》(PyTorch版)代码注释 - 35 【GRU_with_simple_way】

目录

  • 说明
  • 配置环境
  • 此节说明
  • 代码

说明

本博客代码来自开源项目:《动手学深度学习》(PyTorch版)
并且在博主学习的理解上对代码进行了大量注释,方便理解各个函数的原理和用途

配置环境

使用环境:python3.8
平台:Windows10
IDE:PyCharm

此节说明

此节对应书本上6.7节
此节功能为:门控循环单元(GRU)的简单实现
由于次节相对容易理解,代码注释量较少

代码

# 本书链接https://tangshusen.me/Dive-into-DL-PyTorch/#/chapter03_DL-basics/3.8_mlp
# 6.7 门控循环单元(GRU)
# 注释:黄文俊
# E-mail:hurri_cane@qq.com


import numpy as np
import torch
from torch import nn, optim
import torch.nn.functional as F

import sys
sys.path.append("..")
import d2lzh_pytorch as d2l
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

(corpus_indices, char_to_idx, idx_to_char, vocab_size) = d2l.load_data_jay_lyrics()



num_inputs, num_hiddens, num_outputs = vocab_size, 256, vocab_size
print('will use', device)


num_epochs, num_steps, batch_size, lr, clipping_theta = 160, 35, 32, 1e2, 1e-2
pred_period, pred_len, prefixes = 40, 50, ['分开', '不分开']



# 简洁实现
lr = 1e-2 # 注意调整学习率
gru_layer = nn.GRU(input_size=vocab_size, hidden_size=num_hiddens)
model = d2l.RNNModel(gru_layer, vocab_size).to(device)
d2l.train_and_predict_rnn_pytorch(model, num_hiddens, vocab_size, device,
                                corpus_indices, idx_to_char, char_to_idx,
                                num_epochs, num_steps, lr, clipping_theta,
                                batch_size, pred_period, pred_len, prefixes)




print("*"*50)

相关文章:

  • 祝贺CICI拿到VISA
  • 《动手学深度学习》(PyTorch版)代码注释 - 36 【LSTM_with_zero】
  • WPF/E去了,Silverlight来了
  • iPhone - 少一点自恋,多一点现实 !
  • 《动手学深度学习》(PyTorch版)代码注释 - 37 【LSTM_with_simple_way】
  • FerryMan Fractal的: 23312506
  • 《动手学深度学习》(PyTorch版)代码注释 - 38 【Gradient_descent_Learning】
  • 鲁迅先生
  • 《动手学深度学习》(PyTorch版)代码注释 - 39 【Small_batch_stochastic_gradient_descent】
  • 《动手学深度学习》(PyTorch版)代码注释 - 40 【Momentum_method】
  • 《动手学深度学习》(PyTorch版)代码注释 - 41 【AdaGrad_algorithm】
  • 《动手学深度学习》(PyTorch版)代码注释 - 42 【RMSProp_algorithm】
  • 《动手学深度学习》(PyTorch版)代码注释 - 43 【AdaDelta_algorithm】
  • OpenGL Fractal Hill
  • 《动手学深度学习》(PyTorch版)代码注释 - 44 【Adam_algorithm】
  • 【159天】尚学堂高琪Java300集视频精华笔记(128)
  • AzureCon上微软宣布了哪些容器相关的重磅消息
  • Babel配置的不完全指南
  • JavaScript创建对象的四种方式
  • js ES6 求数组的交集,并集,还有差集
  • JWT究竟是什么呢?
  • Magento 1.x 中文订单打印乱码
  • Netty 框架总结「ChannelHandler 及 EventLoop」
  • SpiderData 2019年2月16日 DApp数据排行榜
  • Transformer-XL: Unleashing the Potential of Attention Models
  • 彻底搞懂浏览器Event-loop
  • 对话:中国为什么有前途/ 写给中国的经济学
  • 记一次删除Git记录中的大文件的过程
  • 简单数学运算程序(不定期更新)
  • 聊一聊前端的监控
  • 你真的知道 == 和 equals 的区别吗?
  • 前端相关框架总和
  • 实习面试笔记
  • ​Z时代时尚SUV新宠:起亚赛图斯值不值得年轻人买?
  • !!【OpenCV学习】计算两幅图像的重叠区域
  • $.ajax中的eval及dataType
  • (1)安装hadoop之虚拟机准备(配置IP与主机名)
  • (2)MFC+openGL单文档框架glFrame
  • (pytorch进阶之路)CLIP模型 实现图像多模态检索任务
  • (附源码)springboot掌上博客系统 毕业设计063131
  • (附源码)ssm基于jsp高校选课系统 毕业设计 291627
  • (蓝桥杯每日一题)love
  • (求助)用傲游上csdn博客时标签栏和网址栏一直显示袁萌 的头像
  • (十)T检验-第一部分
  • (转载)CentOS查看系统信息|CentOS查看命令
  • ***利用Ms05002溢出找“肉鸡
  • .NET Core引入性能分析引导优化
  • .NET 常见的偏门问题
  • .NET 读取 JSON格式的数据
  • .NET 命令行参数包含应用程序路径吗?
  • .NET6使用MiniExcel根据数据源横向导出头部标题及数据
  • .net获取当前url各种属性(文件名、参数、域名 等)的方法
  • .set 数据导入matlab,设置变量导入选项 - MATLAB setvaropts - MathWorks 中国
  • @Autowired自动装配
  • @WebService和@WebMethod注解的用法