当前位置: 首页 > news >正文

【Pytorch】学习记录分享8——PyTorch自然语言处理基础-词向量模型Word2Vec

【Pytorch】学习记录分享7——PyTorch自然语言处理基础-词向量模型Word2Vec

      • 1. 词向量模型Word2Vec)
        • 1. 如何度量这个单词的?
        • 2.词向量是什么样子?
        • 3.词向量对应的热力图:
        • 4.词向量模型的输入与输出![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/5ab5dc810a724ae883574a8bc58aeff8.png)
      • 2.如何构建训练数据
        • 2.1 构建训练数据
        • 2.2 不同模型对比(传入中间词预测上下文,传入上下文,预测中间词汇)
      • 3.如何训练
        • 3.1 如何设计驯联网络
        • 3.2 改进方案:加入一些负样本(负采样模型)
        • 3.3 词向量训练过程

1. 词向量模型Word2Vec)

1. 如何度量这个单词的?

在这里插入图片描述

2.词向量是什么样子?

在这里插入图片描述

3.词向量对应的热力图:

在这里插入图片描述
在这里插入图片描述

4.词向量模型的输入与输出在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

2.如何构建训练数据

2.1 构建训练数据

类似wiki与合乎说话逻辑的文本均可以作为训练数据
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.2 不同模型对比(传入中间词预测上下文,传入上下文,预测中间词汇)

CBOW:

在这里插入图片描述
在这里插入图片描述
Skip-gram模型所需训练数据集 :
在这里插入图片描述
在这里插入图片描述

3.如何训练

3.1 如何设计驯联网络

如果一个语料库稍微大一些,可能的结果简直太多了,最后一层相当于softmax,计算起来十分耗时,有什么办法来解决嘛?
在这里插入图片描述
初始方案:输入两个单词,看他们是不是前后对应的输入和输出,也就相当于一个二分类任务,但是这样做之后

在这里插入图片描述
在这里插入图片描述
出发点非常好,但是此时训练集构建出来的标签全为1,无法进行较好的训练

3.2 改进方案:加入一些负样本(负采样模型)

在这里插入图片描述

3.3 词向量训练过程

1.初始化词向量矩阵
在这里插入图片描述
在这里插入图片描述
2.通过神经网络返向传播来计算更新,此时不光更新权重参数矩阵W,也会更新输入数据
在这里插入图片描述

相关文章:

  • 记录一下imx6ull linux 5.10.9多点电容触摸屏驱动报错问题解决方法
  • Python中matplotlib库的使用1
  • 《Spring Cloud学习笔记:微服务保护Sentinel + JMeter快速入门》
  • 【面试题】HTTP 协议中 URI 和 URL 的区别
  • linux基于用户身份对资源访问进行控制的解析及过程
  • RabbitMQ 和 Kafka 对比
  • FPGA - 231227 - 5CSEMA5F31C6 - 电子万年历
  • GoLang学习之路,对Elasticsearch的使用,一文足以(包括泛型使用思想)(二)
  • redis,memcached,nginx网络组件,网络编程——reactor的应用
  • 原生js浪费性能吗?
  • 虚函数的讲解
  • 华清远见嵌入式学习——ARM——作业4
  • 如何通过 useMemo 和 useCallback 提升你的 React 应用性能
  • Python和Java的优缺点
  • Properties
  • Docker 1.12实践:Docker Service、Stack与分布式应用捆绑包
  • JavaScript设计模式系列一:工厂模式
  • JS实现简单的MVC模式开发小游戏
  • Just for fun——迅速写完快速排序
  • leetcode-27. Remove Element
  • Nginx 通过 Lua + Redis 实现动态封禁 IP
  • October CMS - 快速入门 9 Images And Galleries
  • Python打包系统简单入门
  • Storybook 5.0正式发布:有史以来变化最大的版本\n
  • TiDB 源码阅读系列文章(十)Chunk 和执行框架简介
  • 构造函数(constructor)与原型链(prototype)关系
  • 官方解决所有 npm 全局安装权限问题
  • 批量截取pdf文件
  • 回归生活:清理微信公众号
  • 移动端高清、多屏适配方案
  • ​香农与信息论三大定律
  • ${factoryList }后面有空格不影响
  • (+4)2.2UML建模图
  • (17)Hive ——MR任务的map与reduce个数由什么决定?
  • (2015)JS ES6 必知的十个 特性
  • (6)STL算法之转换
  • (二)基于wpr_simulation 的Ros机器人运动控制,gazebo仿真
  • (附源码)计算机毕业设计ssm基于Internet快递柜管理系统
  • (汇总)os模块以及shutil模块对文件的操作
  • (学习日记)2024.03.25:UCOSIII第二十二节:系统启动流程详解
  • (轉貼) 蒼井そら挑戰筋肉擂台 (Misc)
  • .Net 6.0 处理跨域的方式
  • .net core Swagger 过滤部分Api
  • .net core webapi 部署iis_一键部署VS插件:让.NET开发者更幸福
  • .Net 代码性能 - (1)
  • .NET 中各种混淆(Obfuscation)的含义、原理、实际效果和不同级别的差异(使用 SmartAssembly)
  • .NET下ASPX编程的几个小问题
  • .Net下C#针对Excel开发控件汇总(ClosedXML,EPPlus,NPOI)
  • [ Linux ] git工具的基本使用(仓库的构建,提交)
  • [ SNOI 2013 ] Quare
  • [23] 4K4D: Real-Time 4D View Synthesis at 4K Resolution
  • [IE技巧] IE 中打开Office文件的设置
  • [Interview]Java 面试宝典系列之 Java 多线程
  • [iOS]如何删除工程里面用cocoapods导入的第三方库
  • [Java算法分析与设计]--线性结构与顺序表(List)的实现应用