当前位置: 首页 > news >正文

linux中的优先搜索树的实现--prio_tree【转】

转自:http://blog.csdn.net/bailyzheng/article/details/8041943

linux中的优先搜索树的实现--prio_tree

prio_tree在linux内核中被应用于反向内存映射,prio-tree是一棵查找树,它查找的是一个区间,为何将之组织成tree是一个数学问题,简单理解就是根节点包含了所有的区间,父节点代表的区间包含了子节点代表的区间,这里的包含不是现实意义的包含,而是heap/radix意义上的包含,只要满足heap的性质以及radix的性质即可,不过大多数情况下包含的意义就是现实意义的包含,Documentation中的prio_tree.txt中的图示可以看一下,[4,3,7]是[5,2,7]和[6,1,7]的父节点,父节点区间“现实包含”了两个子节点区间,而[5,2,7]是[4,2,6]和[5,1,6]的父节点, [5,2,7]就没有“现实包含”[4,2,6],但是仍然是后者的父节点,因为它们满足了heap的性质,[5,2,7]的heap-index是7,大于[4,2,6]的heap-index。由于prio-tree首先要是一个heap(插入过程中详细说明)--处理父子关系,其次要是一个radix树--处理兄弟关系,父子间满足了heap之后还要在兄弟间满足radix性质,总之,prio-tree节点间的关系有两个层次的两种,第一层,父子关系,必须符合heap性质,第二层,兄弟关系,必须符合radix性质。
     以上简要介绍了prio-tree的性质,是所有实现的共性,linux内核的实现实现了自己的个性,如果看代码的话就会发现,linux引入了一些变量或者约束,使得prio-tree在性能,资源消耗以及代码可读性之间做出了一个完美的平衡,最值得推崇的就是linux的prio-tree中维护了一个图表,该图表约束了prio-tree的高度,该图表以一个数组实现,数组的内容其实就是该索引下最大的heap,每一个树节点都有一个index_bits字段,它表示了用index_bits个比特就能表达最大的heap,而此index_bits减1正是“这么些”比特在数组中的下标,图表如下:
bit-used    array-index    max-heap
1        0        1
2        1        11
3        2        111
4        3        1111
由上面的图表1可以推导出下面的等式,下面的等式优化了树的性能,促使了数的平衡,并且巧妙的处理了兄弟之间的关系,使之符合prio-tree的原始约束:
bit-used+1=tree-height  (等式1)
根据上述等式,mask=1UL<< (root->index_bits - 1);,这个mask代表了“当前处理的层”的最高位,它决定了待插入节点是插入左孩子还是插入右孩子。插入过程中,每下将一层,mask要右移一位,由于prio-tree是一棵二叉树,因此二进制的0和1就能决定左和右,这个性质和二叉radix查找树是一样的,一个二进制的数是由0和1组成的串,如果欲将之插入一棵radix树,那么从待插节点最高位开始依次从树根处开始和树中节点的相应位进行"&"操作,根据结果来进行左右抉择,每下降一层,比较位就右移一位,直到成功插入,这样就保证了树的radix性质,上述等式1其实并不是必不可少的,它的作用更大的意义是优化,包括代码紧凑度的优化以及时间空间的优化,没有它的话,代码不可能写成现在的prio_tree.c中如此紧凑又容易理解的形式,同时一棵树还会因为频繁的插入和删除而变得很高,这样对查找来讲是很不利的,正如宏黑树用颜色来约束平衡,AVL树用高度来约束平衡一样,prio-tree用上述等式1来约束平衡。既然用radix性质实现了一棵radix树,我们还可以用heap性质来构造一个heap,本质上也是一棵二叉树,如果将二者合并的话,就是prio-tree了,而heap的性质主要体现在父子上面,对兄弟之间并没有多大的约束,因此在prio-tree的插入过程中,基本分为三大块,第一大块是实现heap的性质,在此基础上,第二大快对待左右抉择的时候利用radix的性质以及radix的插入逻辑实现插入,两大块保证了prio-tree的性质,但是不能保证平衡性,由此在此两块的基础上尽量保证树的平衡,于是等式1起作用,以上的三块联动已经近乎完美了,但是理想情况往往不能尽满足现实需求,很多的节点都拥有相同的radix,那么根据heap的性质,它们最终将成为一个近似链表的东西,因此如果为了处理这些链表二增加树的高度(增加max-heap),那么树看起来会很不平衡的,因此单独列出一个overflow-sub-tree来处理这种情况,加入这个性质之后,prio-tree实则成了一个集heap,radix树,链表于一身的集大成,最终的结果就是prio_tree.c中的prio_tree_insert函数的实现:
insert:
cur = root->prio_tree_node;
mask = 1UL << (root->index_bits - 1);
while (mask) {
    GET_INDEX(cur, r_index, h_index);
    if (r_index == radix_index && h_index == heap_index)
        return cur;
        if (h_index < heap_index || //破坏了父子约束,因此需要交换父子
        (h_index == heap_index && r_index > radix_index)) {
        struct prio_tree_node *tmp = node;
        node = prio_tree_replace(root, cur, node);
        cur = tmp;  //需要插入的node现在已经成了被替换的node
        index = r_index; //交换所有的索引,heap索引和radix索引
        ...
    }
    if (size_flag) 
        index = heap_index - radix_index;
    else
        index = radix_index;
    if (index & mask) { //此处的if-else用于确定兄弟约束,对应位为1则往右走
        ...//右孩子为空的话直接插入右孩子的位置,返回
    } else //否则返回右孩子
        cur = cur->right;
    } else {  //对应位为0则往左走
        ...//左孩子为空的话直接插入左孩子的位置,返回
    } else //否则返回左孩子
        cur = cur->left;
    }
    mask >>= 1;  //进入下一层的radix抉择
    if (!mask) {  //处理overflow树
        mask = 1UL << (root->index_bits - 1);
        size_flag = 1;
    }
}
由于heap和radix树的逻辑都是执行过程中体现的,并且都是确定的,只有那个图表1相关的代码是prio-tree独有的,因此在prio_tree_init中必然要进行相关的初始化,可以看出,prio_tree_init进行的仅仅是图表1相关的初始化,初始化完成以后,从图表1就可以推出等式1了,由此prio-tree的运行所需要的基础设施就全部到位了:
void __init prio_tree_init(void)
{
    unsigned int i;
    for (i = 0; i < ARRAY_SIZE(index_bits_to_maxindex) - 1; i++)
        index_bits_to_maxindex[i] = (1UL << (i + 1)) - 1;
    index_bits_to_maxindex[ARRAY_SIZE(index_bits_to_maxindex) - 1] = ~0UL;
}
很多树节点的remove操作都很复杂,甚至比insert还要复杂,但是对于prio-tree来讲却是很简单的,因为prio-tree节点的heap特性,并且整个prio-tree首先肯定是一个heap,所谓的radix只是在对兄弟无约束的heap加上了兄弟间的约束而已,因此remove操作完全实际上就是一个heap调整的过程,调整完heap之后无需再关心树的radix性质,因为它只要首先是一个heap即可,在remove的每一步操作中,只要能保证树的heap性质就可以了,只需要从待删除节点往下沿着大孩子走一直到叶节点,然后再回溯回来即可,回溯过程中需要依次的将当前节点和父节点进行对换,依次进行,最终就是待删除节点的大孩子替换了待删除节点,删除至此结束,至于忽略了radix性质是否会带来树的不平衡,答案是可能不会也可能会,但不甚会,如果在remove操作时加上树的平衡性维护,那么代码将变得复杂,同时也会影响到效率。

相关文章:

  • Linux内核驱动之GPIO子系统(一)GPIO的使用【转】
  • 数据库官方在线文档列表(mysql, postgreSQL)
  • Servlet 过滤器
  • Ubuntu的flash不能用(如百度文库看不了)解决办法
  • 网上收集的以及自己总结的iOS开发技巧
  • Groovy学习随笔之一
  • 归纳总结Android的点击事件
  • 关于从子窗口获取内容并填充到父窗口元素中的方法
  • msyql sql优化一列
  • 项目同步部署
  • Nessus的安装/激活/更新
  • tail
  • Nginx和Nginx+的比较(上)
  • JDBC+Servlet+JSP整合开发之25.JSP动作元素
  • mysql基础(3)-高级查询
  • 【Leetcode】101. 对称二叉树
  • 【干货分享】SpringCloud微服务架构分布式组件如何共享session对象
  • 30天自制操作系统-2
  • Angular 响应式表单之下拉框
  • FastReport在线报表设计器工作原理
  • git 常用命令
  • iOS仿今日头条、壁纸应用、筛选分类、三方微博、颜色填充等源码
  • JS+CSS实现数字滚动
  • Mocha测试初探
  • Node.js 新计划:使用 V8 snapshot 将启动速度提升 8 倍
  • Python实现BT种子转化为磁力链接【实战】
  • React Transition Group -- Transition 组件
  • Spring Cloud(3) - 服务治理: Spring Cloud Eureka
  • 搭建gitbook 和 访问权限认证
  • 开放才能进步!Angular和Wijmo一起走过的日子
  • 如何打造100亿SDK累计覆盖量的大数据系统
  • 如何合理的规划jvm性能调优
  • 以太坊客户端Geth命令参数详解
  • 用Node EJS写一个爬虫脚本每天定时给心爱的她发一封暖心邮件
  • mysql面试题分组并合并列
  • 基于django的视频点播网站开发-step3-注册登录功能 ...
  • ## 临床数据 两两比较 加显著性boxplot加显著性
  • #define 用法
  • (1)安装hadoop之虚拟机准备(配置IP与主机名)
  • (42)STM32——LCD显示屏实验笔记
  • (阿里云万网)-域名注册购买实名流程
  • (备忘)Java Map 遍历
  • (黑客游戏)HackTheGame1.21 过关攻略
  • (六) ES6 新特性 —— 迭代器(iterator)
  • (论文阅读40-45)图像描述1
  • (论文阅读笔记)Network planning with deep reinforcement learning
  • (五)关系数据库标准语言SQL
  • (心得)获取一个数二进制序列中所有的偶数位和奇数位, 分别输出二进制序列。
  • (一)ClickHouse 中的 `MaterializedMySQL` 数据库引擎的使用方法、设置、特性和限制。
  • (原創) 如何動態建立二維陣列(多維陣列)? (.NET) (C#)
  • (轉貼) 寄發紅帖基本原則(教育部禮儀司頒布) (雜項)
  • ***检测工具之RKHunter AIDE
  • .axf 转化 .bin文件 的方法
  • .net 4.0发布后不能正常显示图片问题
  • .NET Core使用NPOI导出复杂,美观的Excel详解