当前位置: 首页 > news >正文

【期末复习向】n元gram的应用

n =1 时, 即出现 i 的基 w i 立于 一元文法也 uni-gram monogram;
n =2 , 2-gram ( bi-gram ) 被称 1 可夫 链;
n =3 , 3-gram( tri-gram ) 被称为 2 阶马尔 次类推。
例如:
给定句子 John read a book
增加标记 <BOS> John read a book <EOS>
一元 <BOS>, John, read, a, book, <EOS
二元(<BOS>John), (John read), (read a),   (a book), (book <EOS>)
三元:(<BOS>John read), (John read a),   (read a book), (a book <EOS>
基于2元文法的概率是:
p(John read a book) =
p(John |<BOS>p(read|John)× p(a|read)×  p(book|a)× p( <EOS>|book)

 n元文法的应用:1.音字转换2.汉字分词等。

一个常考的应用:求句子的概率。会给定几个句子,对其进行分词后,重新给定一个句子求其出现的概率。

例如给定上面的句子,求一个新的句子“他是研究生物的”出现概率。那么解决这种问题的步骤:

1.分别统计几个句子分词后每个词出现的次数

2.把新的句子分词后求概率:

P(s) = P(他|<*BOS*>)P(是|他)P(研究|是)P(生物|研究)P(的|生物)P(<*EOS*>|的)

 3.根据2元文法模型,计算每个概率。计算方法是前一个词在后一个词出现的基础上出现的次数/后一个词出现的总次数。

P(s) = P(他|<*BOS*>)P(是|他)P(研究|是)P(生物|研究)P(的|生物)P(<*EOS*>|的)

= 3/6 * 1/4 * 2/3 * 3/4 * 3/5 * 3/4

相关文章:

  • CentOS 防火墙管理及使用的redis基本常用命令
  • EasyExcel-最简单的读写excel工具类
  • 【Vue】日常错误总结(持续更新)
  • acwing算法提高之动态规划--状态机模型
  • Python接口自动化 —— Json 数据处理实战(详解)
  • 2019年第八届数学建模国际赛小美赛C题预测通过拥堵路段所需的时间解题全过程文档及程序
  • JAVA的关键字、标识符和命名规范
  • 【计算机网络】UDP报文详解
  • WPF使用WebBrowser报脚本错误问题处理
  • Linux 常用命令----mktemp 命令
  • 使用Postman如何在接口测试前将请求的参数进行自定义处理
  • 企业IT安全:内部威胁检测和缓解
  • 租一台服务器多少钱决定服务器的价格因素有哪些
  • ubuntu下搜索文件的几种方法
  • Unity2023.3(Unity6)版本开始将可以发布WebGPU
  • [LeetCode] Wiggle Sort
  • 「译」Node.js Streams 基础
  • 002-读书笔记-JavaScript高级程序设计 在HTML中使用JavaScript
  • android 一些 utils
  • Java面向对象及其三大特征
  • MySQL QA
  • MySQL用户中的%到底包不包括localhost?
  • rabbitmq延迟消息示例
  • Sequelize 中文文档 v4 - Getting started - 入门
  • Storybook 5.0正式发布:有史以来变化最大的版本\n
  • ucore操作系统实验笔记 - 重新理解中断
  • 诡异!React stopPropagation失灵
  • 解决iview多表头动态更改列元素发生的错误
  • 开发了一款写作软件(OSX,Windows),附带Electron开发指南
  • 前端知识点整理(待续)
  • 入口文件开始,分析Vue源码实现
  • 什么软件可以剪辑音乐?
  • 详解移动APP与web APP的区别
  • ​2020 年大前端技术趋势解读
  • #NOIP 2014# day.1 T3 飞扬的小鸟 bird
  • #经典论文 异质山坡的物理模型 2 有效导水率
  • #我与Java虚拟机的故事#连载16:打开Java世界大门的钥匙
  • (01)ORB-SLAM2源码无死角解析-(56) 闭环线程→计算Sim3:理论推导(1)求解s,t
  • (1)STL算法之遍历容器
  • (2)MFC+openGL单文档框架glFrame
  • (2)STM32单片机上位机
  • (c语言)strcpy函数用法
  • (附源码)spring boot基于小程序酒店疫情系统 毕业设计 091931
  • (附源码)spring boot校园健康监测管理系统 毕业设计 151047
  • (附源码)springboot 智能停车场系统 毕业设计065415
  • (区间dp) (经典例题) 石子合并
  • (入门自用)--C++--抽象类--多态原理--虚表--1020
  • (一)C语言之入门:使用Visual Studio Community 2022运行hello world
  • (原創) 人會胖會瘦,都是自我要求的結果 (日記)
  • (转)【Hibernate总结系列】使用举例
  • (转)平衡树
  • .NET Core MongoDB数据仓储和工作单元模式封装
  • .Net Remoting(分离服务程序实现) - Part.3
  • .NET 的静态构造函数是否线程安全?答案是肯定的!
  • .net遍历html中全部的中文,ASP.NET中遍历页面的所有button控件