当前位置: 首页 > news >正文

循环神经网络 - RNN

循环神经网络(Rerrent Neural Network,RNN)是神经网络的一种,类似的还有深度神经网络(DNN)、卷积神经网路(CNN)、生成对抗网络(GAN)等。**RNN对具有时序特性的数据非常有成效,他能挖掘数据中的时序信息以及语义信息。**利用RNN的这种能力,使深度学习模型在解决语音识别、语言模型、机器翻译以及时序分析等NLP领域的问题时有所突破。

潜变量自回归模型

  • 使用潜变量 h t h_t ht总结过去信息 p ( h t ∣ h t − 1 , x t − 1 ) p(h_t|h_{t-1},x_{t-1}) p(htht1,xt1) p ( x t ∣ h t , x t − 1 ) p(x_t|h_t,x_{t-1}) p(xtht,xt1)

在这里插入图片描述

循环神经网络

在这里插入图片描述

更新隐藏状态: h t = ∅ ( W h h h t − 1 + W h x X t − 1 + b h ) h_t=\empty(W_{hh}h_{t-1}+W_{hx}X_{t-1}+b_h) ht=(Whhht1+WhxXt1+bh)

输出: o t = ∅ ( W h o h t + b o ) o_t=\empty(W_{ho}h_t+b_o) ot=(Whoht+bo)

困惑度(perplexity)

  • 衡量一个语言模型的好坏可以用评价你交叉熵

π = 1 n ∑ i = 1 n − l o g p ( x t ∣ x t − 1 , . . . ) \pi = \frac{1}{n}\sum\limits_{i=1}^n-logp(x_t|x_{t-1},...) π=n1i=1nlogp(xtxt1,...)

p p p是语言模型的概率预测, x t x_t xt是真实词

  • 历史原因NLP使用困惑的 e x p ( π ) exp(\pi) exp(π)来衡量,时平均每次可能选项
  • 1表示完美,无穷大是最差情况

梯度剪裁

  • 迭代中计算这 T T T个时间步上的梯度,在反向传播过程中产生长度为 O ( T ) O(T) O(T)的矩阵乘法链,导致数值不稳定

  • 梯度裁剪能有效预防梯度爆炸

    • 如果梯度长度超过 θ \theta θ,那么拖影回长度 θ \theta θ
      g ← m i n ( 1 , θ ∣ ∣ g ∣ ∣ ) g g\leftarrow min(1,\frac{\theta}{||g||})g gmin(1,∣∣g∣∣θ)g

更多的应用 RNNs

在这里插入图片描述

总结:

  • 循环神经网络的输出取决于当下输入和前一时间的隐变量
  • 应用到语言模型中时,循环神经网络根据当前词预测下一次时刻词
  • 通常使用困惑度来衡量语言模型的好坏

相关文章:

  • MySQL数据库入门到精通——运维篇(1)
  • 图像处理:图片二值化学习,以及代码中如何实现
  • 【实现多个接口的使用】
  • 软件测试面试,一定要准备的7个高频面试题(附答案,建议收藏)
  • QMS质量检验管理|攻克制造企业质量检验难题,助力企业提质增效
  • web - 会话技术
  • Android照搬,可删
  • 玻色量子签约移动云“五岳”量子云计算创新加速计划!
  • 使用 ElementUI 组件构建 Window 桌面应用探索与实践(WinForm)
  • 微服务parent工程和子工程pom文件配置注意
  • 线扫相机DALSA-相机平场矫正详细步骤
  • 一文深入了解 CPU 的型号、代际架构与微架构
  • MySQL8.0安装
  • Linux的开发环境安装配置与后端项目部署
  • 爬虫API中的滑块验证及解决方案
  • flask接收请求并推入栈
  • MaxCompute访问TableStore(OTS) 数据
  • node-glob通配符
  • pdf文件如何在线转换为jpg图片
  • Swoft 源码剖析 - 代码自动更新机制
  • 阿里云前端周刊 - 第 26 期
  • 番外篇1:在Windows环境下安装JDK
  • 浮动相关
  • 免费小说阅读小程序
  • 排序(1):冒泡排序
  • 腾讯视频格式如何转换成mp4 将下载的qlv文件转换成mp4的方法
  • 云大使推广中的常见热门问题
  • MPAndroidChart 教程:Y轴 YAxis
  • 京东物流联手山西图灵打造智能供应链,让阅读更有趣 ...
  • 直播平台建设千万不要忘记流媒体服务器的存在 ...
  • ​DB-Engines 12月数据库排名: PostgreSQL有望获得「2020年度数据库」荣誉?
  • ​LeetCode解法汇总2182. 构造限制重复的字符串
  • !$boo在php中什么意思,php前戏
  • #图像处理
  • (1)(1.8) MSP(MultiWii 串行协议)(4.1 版)
  • (13)Latex:基于ΤΕΧ的自动排版系统——写论文必备
  • (4) openssl rsa/pkey(查看私钥、从私钥中提取公钥、查看公钥)
  • (附源码)springboot优课在线教学系统 毕业设计 081251
  • (附源码)ssm基于jsp的在线点餐系统 毕业设计 111016
  • (官网安装) 基于CentOS 7安装MangoDB和MangoDB Shell
  • (机器学习的矩阵)(向量、矩阵与多元线性回归)
  • (亲测成功)在centos7.5上安装kvm,通过VNC远程连接并创建多台ubuntu虚拟机(ubuntu server版本)...
  • (三)终结任务
  • (算法)Travel Information Center
  • (一)基于IDEA的JAVA基础1
  • (转) RFS+AutoItLibrary测试web对话框
  • (转)ORM
  • ..回顾17,展望18
  • .NET C# 使用 SetWindowsHookEx 监听鼠标或键盘消息以及此方法的坑
  • .NET 跨平台图形库 SkiaSharp 基础应用
  • .NET 中各种混淆(Obfuscation)的含义、原理、实际效果和不同级别的差异(使用 SmartAssembly)
  • .NET精简框架的“无法找到资源程序集”异常释疑
  • /usr/bin/perl:bad interpreter:No such file or directory 的解决办法
  • @Transactional类内部访问失效原因详解
  • [ vulhub漏洞复现篇 ] ECShop 2.x / 3.x SQL注入/远程执行代码漏洞 xianzhi-2017-02-82239600