当前位置: 首页 > news >正文

ES核心概念、IK分词器

目录

ES核心概念

 倒排索引

IK分词器

什么是ik分词器?

安装ik分词器

使用Kibana测试

ik分词器增加自定义词汇


 

ES核心概念

 

 

 倒排索引

 

   当用户在主页上搜索关键词“华为手机”时,假设只存在正向索引(forward index),那么就需要扫描索引库中的所有文档,找出所有包含关键词“华为手机”的文档,再根据打分模型进行打分,排出名次后呈现给用户。因为互联网上收录在搜索引擎中的文档的数目是个天文数字,这样的索引结构根本无法满足实时返回排名结果的要求。

       正向索引   相当于通过key找value

所以,搜索引擎会将正向索引重新构建为倒排索引,即把文件ID对应到关键词的映射转换为关键词到文件ID的映射,每个关键词都对应着一系列的文件,这些文件中都出现这个关键词。

        倒排索引  相当于通过value去找key   即从词的关键字,去找文档。

IK分词器

什么是ik分词器?

 

安装ik分词器

 github下载网址:Releases · medcl/elasticsearch-analysis-ik · GitHub

版本也要对应

下载并解压到插件目录下:  

 

查看加载进来的插件:

使用Kibana测试

 ik_smart:

按顺序打断点分词,不会重复出现

ik_max_word : 最细粒度划分,穷尽词库的可能

 

自己需要的词,需要自己加到分词器的字典中

ik分词器增加自定义词汇

 

 新建一个自定义字典dic

 

 

 重启ES

 

未配置字典时:

配置字典后 :

 

相关文章:

  • 【JAVA】总结Java线程的几种状态
  • day009--mysql中的日期函数
  • sql语句 如果为空值显示为0
  • 【MySQL数据库】- 多表查询
  • C++文件服务器项目—数据库表设计 与 后端接口设计—6
  • 聊聊Redis的数据热点问题
  • 猿创征文|瑞吉外卖——管理端_员工管理
  • springcloud springboot nacos版本对应
  • Windows安装Visual Studio2019+OpenCV配置
  • 单片机——硬件系统
  • jenkins一键部署搭建
  • 【022】Vue+Springboot+mysql汽车销售系统课设(含源码、数据库、运行教程、实验报告)
  • 【Golang开发面经】字节跳动(三轮技术面)
  • SpringCloud Stream详解
  • 【苹果家庭推送iMessage位置推送】群发安装软件获取home目录路径的函数: NSString *homeDir = NSHomeDirectory()
  • Date型的使用
  • Java精华积累:初学者都应该搞懂的问题
  • Linux后台研发超实用命令总结
  • Python进阶细节
  • Sublime Text 2/3 绑定Eclipse快捷键
  • Transformer-XL: Unleashing the Potential of Attention Models
  • Travix是如何部署应用程序到Kubernetes上的
  • Zsh 开发指南(第十四篇 文件读写)
  • 从0实现一个tiny react(三)生命周期
  • 构建工具 - 收藏集 - 掘金
  • 技术:超级实用的电脑小技巧
  • 开源SQL-on-Hadoop系统一览
  • 如何进阶一名有竞争力的程序员?
  • 一个6年java程序员的工作感悟,写给还在迷茫的你
  • 1.Ext JS 建立web开发工程
  • 关于Kubernetes Dashboard漏洞CVE-2018-18264的修复公告
  • 京东物流联手山西图灵打造智能供应链,让阅读更有趣 ...
  • ​ 全球云科技基础设施:亚马逊云科技的海外服务器网络如何演进
  • # 安徽锐锋科技IDMS系统简介
  • ### Cause: com.mysql.jdbc.exceptions.jdbc4.MySQLTr
  • #pragam once 和 #ifndef 预编译头
  • $refs 、$nextTic、动态组件、name的使用
  • (10)ATF MMU转换表
  • (4) PIVOT 和 UPIVOT 的使用
  • (java版)排序算法----【冒泡,选择,插入,希尔,快速排序,归并排序,基数排序】超详细~~
  • (poj1.2.1)1970(筛选法模拟)
  • (pojstep1.1.1)poj 1298(直叙式模拟)
  • (Ruby)Ubuntu12.04安装Rails环境
  • (zt)最盛行的警世狂言(爆笑)
  • (保姆级教程)Mysql中索引、触发器、存储过程、存储函数的概念、作用,以及如何使用索引、存储过程,代码操作演示
  • (数据结构)顺序表的定义
  • (原創) 如何安裝Linux版本的Quartus II? (SOC) (Quartus II) (Linux) (RedHat) (VirtualBox)
  • (转)关于多人操作数据的处理策略
  • (最优化理论与方法)第二章最优化所需基础知识-第三节:重要凸集举例
  • .net php 通信,flash与asp/php/asp.net通信的方法
  • .NET 命令行参数包含应用程序路径吗?
  • .Net的C#语言取月份数值对应的MonthName值
  • .net连接oracle数据库
  • @RequestBody与@ResponseBody的使用
  • [.net]官方水晶报表的使用以演示下载