当前位置: 首页 > news >正文

ElasticSearch 相关性

  1、相关性

    ElasticSearch检索结果是按照相关性倒序排列的,相关性是什么,相关性又是如何计算的?每个文档都有相关性评分,用一个正浮点数字段 _score 来表示 。 _score 的评分越高,相关性越高。

    查询语句会为每个文档生成一个 _score 字段。评分的计算方式取决于查询类型 不同的查询语句用于不同的目的: 

    fuzzy 查询会计算与关键词的拼写相似程度

    terms 查询会计算 找到的内容与关键词组成部分匹配的百分比

    但是通常我们说的 relevance 是我们用来计算全文本字段的值相对于全文本检索词相似程度的算法。

    Elasticsearch 的相似度算法 被定义为检索词频率/反向文档频率, TF/IDF ,包括以下内容:

    检索词频率
   检索词在该字段出现的频率?出现频率越高,相关性也越高。 字段中出现过 5 次要比只出现过 1 次的相关性高。
    反向文档频       每个检索词在索引中出现的频率?频率越高,相关性越低。检索词出现在多数文档中会比出现在少数文档中的权重更低。     字段长度准则
   字段的长度是多少?长度越长,相关性越低。 检索词出现在一个短的 title 要比同样的词出现在一个长的 content 字段权重更大。

    单个查询可以联合使用 TF/IDF 和其他方式,比如短语查询中检索词的距离或模糊查询里的检索词相似度。

    相关性并不只是全文本检索的专利。也适用于 yes|no 的子句,匹配的子句越多,相关性评分越高。

    如果多条查询子句被合并为一条复合查询语句 ,比如 bool 查询,则每个查询子句计算得出的评分会被合并到总的相关性评分中。

相关文章:

  • 简介
  • XP系统下Chrome浏览器打开某些网站闪退的解决办法
  • MongoDB 搭建副本集
  • linux的cpu软中断问题引发的gc cr block lost高等待
  • 对IO流的操作(文件大小,拷贝,移动,删除)
  • 【NetApp】关于walfiron命令的一点资料
  • 电商总结(八)如何打造一个小而精的电商网站架构
  • java正则表式的使用
  • grub修复
  • (转)es进行聚合操作时提示Fielddata is disabled on text fields by default
  • LXD 2.0系列之二:LXD安装和配置
  • Java调用JavaFX的方法
  • ORA-04089: 无法对 SYS 拥有的对象创建触发器
  • Java获取URL中的顶级域名domain的工具类
  • CSS实现空心三角指示箭头
  • JS中 map, filter, some, every, forEach, for in, for of 用法总结
  • 自己简单写的 事件订阅机制
  • 【跃迁之路】【699天】程序员高效学习方法论探索系列(实验阶段456-2019.1.19)...
  • CentOS学习笔记 - 12. Nginx搭建Centos7.5远程repo
  • extract-text-webpack-plugin用法
  • Java应用性能调优
  • KMP算法及优化
  • MobX
  • MySQL的数据类型
  • RxJS 实现摩斯密码(Morse) 【内附脑图】
  • scala基础语法(二)
  • SwizzleMethod 黑魔法
  • Vue2.0 实现互斥
  • 好的网址,关于.net 4.0 ,vs 2010
  • 简单实现一个textarea自适应高度
  • 利用jquery编写加法运算验证码
  • 使用权重正则化较少模型过拟合
  • 数据可视化之 Sankey 桑基图的实现
  • 体验javascript之美-第五课 匿名函数自执行和闭包是一回事儿吗?
  • 赢得Docker挑战最佳实践
  • LIGO、Virgo第三轮探测告捷,同时探测到一对黑洞合并产生的引力波事件 ...
  • ​LeetCode解法汇总2583. 二叉树中的第 K 大层和
  • (01)ORB-SLAM2源码无死角解析-(56) 闭环线程→计算Sim3:理论推导(1)求解s,t
  • (10)工业界推荐系统-小红书推荐场景及内部实践【排序模型的特征】
  • (3)Dubbo启动时qos-server can not bind localhost22222错误解决
  • (a /b)*c的值
  • (每日持续更新)jdk api之FileReader基础、应用、实战
  • (五)网络优化与超参数选择--九五小庞
  • (原創) 是否该学PetShop将Model和BLL分开? (.NET) (N-Tier) (PetShop) (OO)
  • .net mvc actionresult 返回字符串_.NET架构师知识普及
  • .net 托管代码与非托管代码
  • .NetCore项目nginx发布
  • .NET大文件上传知识整理
  • @serverendpoint注解_SpringBoot 使用WebSocket打造在线聊天室(基于注解)
  • [ vulhub漏洞复现篇 ] Django SQL注入漏洞复现 CVE-2021-35042
  • [28期] lamp兄弟连28期学员手册,请大家务必看一下
  • [BZOJ 1032][JSOI2007]祖码Zuma(区间Dp)
  • [codeforces]Checkpoints
  • [Firefly-Linux] RK3568 pca9555芯片驱动详解
  • [IE编程] WebBrowser控件中设置页面的缩放