当前位置: 首页 > news >正文

Lucene 4.0 TieredMergePolicy

默认的merge policy。

findMerges:

先将全部段依照扣除删除文档之后的字节数(bytesize * (1.0 - delRatio))降序排,对当中size() > 2.5G(maxMergedSegmentSize / 2)的段排除在外,其它仅仅要不是正在归并的段,增加候选。

这个候选的列表假设大于allowedSegCount(allowedSegCount计算方法例如以下: 依照min(最小段size(),2M)做为10路归并在总字节数的限制下计算的段数),则须要从不同位置開始选归并段组合,这些段组合要

进行打分,打分最低的最为一次归并,这样重复挑选,直到全部的候选段都已经挑过。

详细打分公式例如以下: 

skew * totAfterMergeBytes ^ 0.05 * nunDelRatio^2.0

假设归并段接近5G(hitLarge=true),skew=1/10,否则为floorsize(candidate(0)) / totAfterMergeBytesFloored。

findForcedMerges提供segmentsToMerge,findForcedMerge对当中是original的段按size()降序排。依照30个一组,从最小的段一次一次加入merge,最后剩下(maxSegmentCount - 1)个段不归并(除非段数>不够)。 

findForcedDeletesMerges对于删除文档数超过20%且不是正在归并的段。依照size()排序,按30个一组,从最小的段做一次次归并。

转载于:https://www.cnblogs.com/liguangsunls/p/7219420.html

相关文章:

  • 关于表单修改
  • Ubuntu安装源配置文件/etc/apt/sources.list第X行有错误
  • 原型和原型链
  • Linux(ubuntu)下如何安装与卸载软件总结
  • 前端调试的一点新理解
  • Linux(ubuntu)下搭建Java开发环境 - 安装JDK
  • POJ 2585 Window Pains 拓扑排序
  • 【Android Dev Guide - 03】 - Content Providers
  • Coding Pages jekyll 404无法找到静态文件(css,js )
  • Linux(ubuntu)下安装搭建Eclipse开发环境
  • 定时清理两周前的分区上的数据
  • Linux(ubuntu)下搭建Android开发环境
  • C++井字棋游戏,DOS界面版
  • html5 02 随记
  • 复制粘贴惹的祸
  • [nginx文档翻译系列] 控制nginx
  • Apache Pulsar 2.1 重磅发布
  • CentOS学习笔记 - 12. Nginx搭建Centos7.5远程repo
  • create-react-app做的留言板
  • IndexedDB
  • javascript 哈希表
  • pdf文件如何在线转换为jpg图片
  • PHP 的 SAPI 是个什么东西
  • python 学习笔记 - Queue Pipes,进程间通讯
  • react 代码优化(一) ——事件处理
  • Redis 中的布隆过滤器
  • scala基础语法(二)
  • spring security oauth2 password授权模式
  • 对话:中国为什么有前途/ 写给中国的经济学
  • 基于Android乐音识别(2)
  • 简单实现一个textarea自适应高度
  • 前端相关框架总和
  • 如何设计一个微型分布式架构?
  • 使用 5W1H 写出高可读的 Git Commit Message
  • 使用agvtool更改app version/build
  • 使用Envoy 作Sidecar Proxy的微服务模式-4.Prometheus的指标收集
  • 微信支付JSAPI,实测!终极方案
  • 我这样减少了26.5M Java内存!
  • 智能合约Solidity教程-事件和日志(一)
  • !!java web学习笔记(一到五)
  • !$boo在php中什么意思,php前戏
  • (145)光线追踪距离场柔和阴影
  • (16)UiBot:智能化软件机器人(以头歌抓取课程数据为例)
  • (3)(3.5) 遥测无线电区域条例
  • (5)STL算法之复制
  • (ISPRS,2023)深度语义-视觉对齐用于zero-shot遥感图像场景分类
  • (pt可视化)利用torch的make_grid进行张量可视化
  • (ros//EnvironmentVariables)ros环境变量
  • (十三)Maven插件解析运行机制
  • (四)七种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (正则)提取页面里的img标签
  • (转载)hibernate缓存
  • *** 2003
  • .NET CORE Aws S3 使用
  • .net mvc actionresult 返回字符串_.NET架构师知识普及