当前位置: 首页 > news >正文

Map集合、散列表、红黑树介绍

前言

声明,本文用得是jdk1.8

前面已经讲了Collection的总览和剖析List集合:

  • Collection总览
  • List集合就这么简单【源码剖析】

原本我是打算继续将Collection下的Set集合的,结果看了源码发现:Set集合实际上就是HashMap来构建的

所以,就先介绍Map集合、散列表和红黑树吧

看这篇文章之前最好是有点数据结构的基础:

  • Java实现单向链表
  • 栈和队列就是这么简单
  • 二叉树就这么简单

当然了,如果讲得有错的地方还请大家多多包涵并不吝在评论去指正~

一、Map介绍

1.1为什么需要Map

前面我们学习的Collection叫做集合,它可以快速查找现有的元素。

而Map在《Core Java》中称之为-->映射..

映射的模型图是这样的:

那为什么我们需要这种数据存储结构呢???举个例子

  • 作为学生来说,我们是根据学号来区分不同的学生。只要我们知道学号,就可以获取对应的学生信息。这就是Map映射的作用!

生活中还有很多这样的例子:只要你掏出身份证(key),那就可以证明是你自己(value)

1.2Map与Collection的区别

1.3Map的功能

下面我们来看看Map的源码:

简单常用的Map功能有这么一些:

下面用红色框框圈住的就是Map值得关注的子类:

二、散列表介绍

无论是Set还是Map,我们会发现都会有对应的-->HashSet,HashMap

首先我们也先得回顾一下数据和链表

  • 链表和数组都可以按照人们的意愿来排列元素的次序,他们可以说是有序的(存储的顺序和取出的顺序是一致的)
  • 但同时,这会带来缺点:想要获取某个元素,就要访问所有的元素,直到找到为止。
  • 这会让我们消耗很多的时间在里边,遍历访问元素~

而还有另外的一些存储结构:不在意元素的顺序,能够快速的查找元素的数据

  • 其中就有一种非常常见的:散列表

2.1散列表工作原理

散列表为每个对象计算出一个整数,称为散列码根据这些计算出来的整数(散列码)保存在对应的位置上

在Java中,散列表用的是链表数组实现的,每个列表称之为桶。【之前也写过桶排序就这么简单,可以回顾回顾】

一个桶上可能会遇到被占用的情况(hashCode散列码相同,就存储在同一个位置上),这种情况是无法避免的,这种现象称之为:散列冲突

  • 此时需要用该对象与桶上的对象进行比较,看看该对象是否存在桶子上了~如果存在,就不添加了,如果不存在则添加到桶子上
  • 当然了,如果hashcode函数设计得足够好,桶的数目也足够,这种比较是很少的~
  • JDK1.8中,桶满时会从链表变成平衡二叉树

如果散列表太满,是需要对散列表再散列,创建一个桶数更多的散列表,并将原有的元素插入到新表中,丢弃原来的表~

  • 装填因子(load factor)决定了何时对散列表再散列~
  • 装填因子默认为0.75,如果表中超过了75%的位置已经填入了元素,那么这个表就会用双倍的桶数自动进行再散列

当然了, 在后面阅读源码的时候会继续说明的,现在简单了解一下即可~

扩展阅读:

  • https://www.cnblogs.com/s-b-b/p/6208565.html
  • https://www.cnblogs.com/chinajava/p/5808416.html

三、红黑树介绍

上面散列表中已经提过了:如果桶数满的时候,JDK8是将链表转成红黑树的~。并且,我们的TreeSet、TreeMap底层都是红黑树来实现的。

所以,在这里学习一波红黑树到底是啥玩意。

之前涉及过二叉树的文章:

  • 二叉树就这么简单
  • 堆排序就这么简单

在未学习之前,我们可能是听过红黑树这么一个数据结构类型的,还有其他什么B/B+树等等,反正是比较复杂的数据结构了~~~

各种常见的树的用途:

来源:
https://www.zhihu.com/question/30527705/answer/52527887

3.1回顾二叉查找树

首先我们来回顾一下:利用二叉查找树的特性,我们一般来说可以很快地查找出对应的元素。

  • 二叉树就这么简单

可是二叉查找树也有个例(最坏)的情况(线性):

上面符合二叉树的特性,但是它是线性的,完全没树的用处~

树是要“均衡”才能将它的优点展示出来的~,比如下面这种:

因此,就有了平衡树这么一个概念~红黑树就是一种平衡树,它可以保证二叉树基本符合矮矮胖胖(均衡)的结构

3.2知新2-3树

讲到了平衡树就不得不说最基础的2-3树,2-3树长的是这个样子:

在二叉查找树上,我们插入节点的过程是这样的:小于节点值往右继续与左子节点比,大于则继续与右子节点比,直到某节点左或右子节点为空,把值插入进去。这样无法避免偏向问题

而2-3树不一样:它插入的时候可以保持树的平衡

在2-3树插入的时可以简单总结为两个操作:

  • 合并2-节点为3-节点,扩充将3-节点扩充为一个4-节点
  • 分解4-节点为3-节点,节点3-节点为2-节点
  • ........至使得树平衡~

合并分解的操作还是比较复杂的,要分好几种情况,代码量很大~这里我就不介绍了,因为要学起来是一大堆的,很麻烦~

3.3从2-3树到红黑树

由于2-3树为了保持平衡性,在维护的时候是需要大量的节点交换的!这些变换在实际代码中是很复杂的,大佬们在2-3树的理论基础上发明了红黑树(2-3-4树也是同样的道理,只是2-3树是最简单的一种情况,所以我就不说2-3-4树了)。

  • 红黑树是对2-3查找树的改进,它能用一种统一的方式完成所有变换

红黑树是一种平衡二叉树,因此它没有3-节点。那红黑树是怎么将3-节点来改进成全都是二叉树呢?

红黑树就字面上的意思,有红色的节点,有黑色的节点

我们可以将红色节点的左链接画平看看:

一颗典型的二叉树:

将红色节点的左链接画平之后:得到2-3平衡树:

3.4红黑树基础知识

前面已经说了,红黑树是在2-3的基础上实现的一种树,它能够用统一的方式完成所有变换。很好理解:红黑树也是平衡树的一种,在插入元素的时候它也得保持树的平衡,那红黑树是以什么的方式来保持树的平衡的呢?

红黑树用的是也是两种方式来替代2-3树不断的节点交换操作:

  • 旋转:顺时针旋转和逆时针旋转
  • 反色:交换红黑的颜色
  • 这个两个实现比2-3树交换的节点(合并,分解)要方便一些

红黑树为了保持平衡,还有制定一些约束,遵守这些约束的才能叫做红黑树:

  1. 红黑树是二叉搜索树。
  2. 根节点是黑色
  3. 每个叶子节点都是黑色的空节点(NIL节点)
  4. 每个红色节点的两个子节点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色节点)
  5. 从任一节点到其每个叶子的所有路径都包含相同数目的黑色节点(每一条树链上的黑色节点数量(称之为“黑高”)必须相等)

3.5红黑树总结

红黑树可以说是十分复杂的,我在学习的时候并没有去认真细看当中的处理细节,只是大概的过了一遍,知道了整体~

有了前辈很多优质的资料,相信要等到想要理解其中的细节,花点力气和时间还是可以掌握一二的。

红黑树参考资料:

  • https://blog.csdn.net/chen_zhang_yu/article/details/52415077
  • https://riteme.github.io/blog/2016-3-12/2-3-tree-and-red-black-tree.html#fn:red-is-left
  • http://www.sohu.com/a/201923614_466939
  • https://www.jianshu.com/p/37c845a5add6
  • https://www.cnblogs.com/nullzx/p/6111175.html
  • https://blog.csdn.net/fei33423/article/details/79132930

四、总结

这篇主要介绍了Map集合的基础知识,了解Map的常用子类~

简单介绍了散列表和红黑树,他俩作为Hashxxx和Treexxx的底层,了解其整体思想和相关基础在后续看源码也不至于那么懵~

后续会去看Map常用子类的源码,文章敬请期待~~~~

文章的目录导航:https://zhongfucheng.bitcron.com/post/shou-ji/gong-zhong-hao-wen-zhang-zheng-li

如果文章有错的地方欢迎指正,大家互相交流。习惯在微信看技术文章,想要获取更多的Java资源的同学,可以 关注微信公众号:Java3y。为了大家方便,刚新建了一下 qq群:742919422,大家也可以去交流交流。谢谢支持了!希望能多介绍给其他有需要的朋友

参考资料:

  • 《Core Java》

相关文章:

  • centos7.4系统的虚拟机网络配置教程
  • win10 php安装redis 扩展
  • 6、通过Appium Desktop 实现录制功能
  • 文件上传漏洞攻击
  • Micropython TPYBoard V10X拼插编程实践之定时器 代码不精通?...
  • 从抖音关闭评论,看服务治理的重要性
  • diango-团队介绍
  • ModeBusRtu概述
  • Project中最常用的注意点
  • 云时代,ERP选型莫走入低价、免费误区
  • 以太坊智能合约开发第六篇:truffle开发框架
  • CSS居中完全指南——构建CSS居中决策树
  • 悲观的并发策略——synchronized互斥锁
  • 一步一步构建自己的管理系统之 ------登入注册
  • 64位linux安装wine等软件
  • 2018天猫双11|这就是阿里云!不止有新技术,更有温暖的社会力量
  • Android交互
  • css属性的继承、初识值、计算值、当前值、应用值
  • Fabric架构演变之路
  • golang 发送GET和POST示例
  • JAVA SE 6 GC调优笔记
  • passportjs 源码分析
  • seaborn 安装成功 + ImportError: DLL load failed: 找不到指定的模块 问题解决
  • vue-router 实现分析
  • 海量大数据大屏分析展示一步到位:DataWorks数据服务+MaxCompute Lightning对接DataV最佳实践...
  • 函数式编程与面向对象编程[4]:Scala的类型关联Type Alias
  • 使用 Docker 部署 Spring Boot项目
  • 小程序开发之路(一)
  • 小而合理的前端理论:rscss和rsjs
  • 以太坊客户端Geth命令参数详解
  • 做一名精致的JavaScripter 01:JavaScript简介
  • 阿里云ACE认证学习知识点梳理
  • 数据库巡检项
  • 完善智慧办公建设,小熊U租获京东数千万元A+轮融资 ...
  • 移动端高清、多屏适配方案
  • ​io --- 处理流的核心工具​
  • ### Cause: com.mysql.jdbc.exceptions.jdbc4.MySQLTr
  • (12)Hive调优——count distinct去重优化
  • (20050108)又读《平凡的世界》
  • (33)STM32——485实验笔记
  • (AngularJS)Angular 控制器之间通信初探
  • (C++)栈的链式存储结构(出栈、入栈、判空、遍历、销毁)(数据结构与算法)
  • (js)循环条件满足时终止循环
  • (第8天)保姆级 PL/SQL Developer 安装与配置
  • (附源码)springboot 个人网页的网站 毕业设计031623
  • (机器学习的矩阵)(向量、矩阵与多元线性回归)
  • (十五)Flask覆写wsgi_app函数实现自定义中间件
  • **python多态
  • *上位机的定义
  • .360、.halo勒索病毒的最新威胁:如何恢复您的数据?
  • .NET 解决重复提交问题
  • .NET基础篇——反射的奥妙
  • .NET开源的一个小而快并且功能强大的 Windows 动态桌面软件 - DreamScene2
  • .net企业级架构实战之7——Spring.net整合Asp.net mvc
  • .NET企业级应用架构设计系列之应用服务器