当前位置: 首页 > news >正文

Trm理论 2(Word2Vec)

神经网络模型(NNLM)和Word2Vec

NNLM模型是上次说过的模型,其目的是为了预测下一个词。
softmax(w2tanh(w1x + b1)+b2)
会得到一个副产品词向量
而Word2Vue就是专门求词向量的模型
softmax(w2*(w1*x + b1)+b2)

Word2Vec

softmax(w2*(w1*x + b1)+b2),Word2vec比NNLM少了一个激活函数tanh,其原因是word2vec目的是求词向量,并不需要预测结果的准确性,只需要反向传播能正常进行即可。
Word2Vec分为两种
CBOW和skip-gram
在这里插入图片描述
左图是CBOM,右图是skip-gram
word2vue的目的是训练得到Q矩阵,并非预测词,因此重要的是训练过程
CBOM像是一个老师训练多个学生,skip-gram是一堆老师训练一个学生

CBOM

CBOM是用一个词的上下文预测出这个词,“这是一瓶很好喝的牢大冰红茶”,分词后,输入“这是一瓶很__牢大冰红茶”

skip-gram

skip-gram是用一个词,预测出他的上下文,输入“很好喝的”,输出“这是一瓶很__牢大冰红茶”

Word2Vec的缺点

Q矩阵的形成是由训练的数据决定的,因此当你使用训练好的Q矩阵应用于下游任务时,会出错。
举个例子,训练Q矩阵时,所有的苹果意思就是水果,而应用于下游任务的时候,我想表达苹果手机,预测就会出现相差很大的问题

word2vec的下游任务改造

word2vec得到的Q矩阵是预训练的一种
首先得到下游任务的独热编码,在使用word2vec的Q矩阵得到词向量,最后进行接下来的任务。

学习视频连接如下

该文章是学习b站up主水论文的程序员的笔记,链接如下可自行学习

https://www.bilibili.com/video/BV1mZ4y1q7J2/?spm_id_from=333.788&vd_source=2910693b31a0847b17a3d12d76d0e3f1

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 使用AI写WebSocket知识是一种怎么样的体验?
  • 【C++ Qt day5】
  • Docker 安装FileBeat、Elasticsearch及Kibana详细步骤
  • git查看代码提交记录
  • python使用selenium,实现简单爬虫功能
  • 9月4日星期三今日早报简报微语报早读
  • 太阳能光伏异常红外图像数据集
  • CentOS 7 docker 部署遇到内网通,外网不通 问题
  • pytorch pyro更高阶的优化器会使用更高阶的导数,比如二阶导数(Hessian矩阵)
  • HTTP、Session、Token及Cookie详解
  • 【Unity优化】优化Android平台拖动地图表现
  • 使用ElementUI + Vue框架实现学生管理系统前端页面设计
  • java中数据访问层userdao接口怎么写
  • IDEA项目启动在不同端口的方法,服务多端口启动
  • CSS3 文本效果(text-shadow,box-shadow,white-space等)文本溢出隐藏并且显示省略号
  • SegmentFault for Android 3.0 发布
  • golang中接口赋值与方法集
  • go语言学习初探(一)
  • javascript 哈希表
  • linux安装openssl、swoole等扩展的具体步骤
  • React的组件模式
  • 工作手记之html2canvas使用概述
  • 基于Javascript, Springboot的管理系统报表查询页面代码设计
  • 基于阿里云移动推送的移动应用推送模式最佳实践
  • 解析带emoji和链接的聊天系统消息
  • 聊聊sentinel的DegradeSlot
  • 学习Vue.js的五个小例子
  • Java总结 - String - 这篇请使劲喷我
  • puppet连载22:define用法
  • ​Z时代时尚SUV新宠:起亚赛图斯值不值得年轻人买?
  • # MySQL server 层和存储引擎层是怎么交互数据的?
  • $refs 、$nextTic、动态组件、name的使用
  • (+4)2.2UML建模图
  • (14)Hive调优——合并小文件
  • (7)svelte 教程: Props(属性)
  • (MonoGame从入门到放弃-1) MonoGame环境搭建
  • (ros//EnvironmentVariables)ros环境变量
  • (ZT)一个美国文科博士的YardLife
  • (编程语言界的丐帮 C#).NET MD5 HASH 哈希 加密 与JAVA 互通
  • (二)Eureka服务搭建,服务注册,服务发现
  • (二)JAVA使用POI操作excel
  • (分享)自己整理的一些简单awk实用语句
  • (紀錄)[ASP.NET MVC][jQuery]-2 純手工打造屬於自己的 jQuery GridView (含完整程式碼下載)...
  • (四)c52学习之旅-流水LED灯
  • (转)es进行聚合操作时提示Fielddata is disabled on text fields by default
  • (转)Sql Server 保留几位小数的两种做法
  • *算法训练(leetcode)第四十五天 | 101. 孤岛的总面积、102. 沉没孤岛、103. 水流问题、104. 建造最大岛屿
  • .java 指数平滑_转载:二次指数平滑法求预测值的Java代码
  • .NET 将混合了多个不同平台(Windows Mac Linux)的文件 目录的路径格式化成同一个平台下的路径
  • .ui文件相关
  • //TODO 注释的作用
  • @CacheInvalidate(name = “xxx“, key = “#results.![a+b]“,multi = true)是什么意思
  • @GlobalLock注解作用与原理解析
  • [ vulhub漏洞复现篇 ] Apache Flink目录遍历(CVE-2020-17519)
  • [ 英语 ] 马斯克抱水槽“入主”推特总部中那句 Let that sink in 到底是什么梗?