当前位置: 首页 > news >正文

JAVA集合4-HashMap

介绍

HashMap 它实现了 Map 接口,提供了键值对的存储和检索功能。HashMap 的底层数据结构是基于哈希表实现的,JDK7 是数组+链表,JDK8 是数组+链表+红黑 树。其中有两个重要的参数:

  • 容量
  • 负载因子

容量的默认大小是 16,负载因子是 0.75,当 HashMapsize > 16*0.75 时就会发生扩容(容量和负载因子都可以自由调整)。

哈希表:HashMap 的核心是一个哈希表,它是一个数组,数组的每个元素称为桶(bucket),每个桶可以存储一个链表或红黑树结构。桶的数量通常是HashMap的容量(capacity),而每个桶中可以存放多个键值对。

哈希算法:HashMap 使用键的哈希码来确定键值对在哈希表中的存储位置。哈希码通过键的hashCode()方法生成,然后通过哈希函数(通常是对数组长度取模)将哈希码映射到具体的桶索引上。

解决哈希冲突:由于不同的键可能会生成相同的哈希码(哈希冲突),所以需要在同一个桶中存储多个键值对。HashMap 使用链表和红黑树来解决哈希冲突:

  • 当桶中的元素较少时,使用链表来存储键值对。
  • 当链表长度达到一定阈值(通常为8)时,将链表转换为红黑树,以提高检索效率。
  • 当红黑树的节点数量减少到较小阈值以下时,将红黑树转换为链表,以节省空间。

扩容与重新哈希:当 HashMap 中的元素数量达到负载因子(load factor)与容量的乘积时,会触发扩容操作。负载因子是一个介于0和1之间的值,用于表示哈希表的填充程度。扩容操作会创建一个新的数组,将所有键值对重新插入到新的哈希表中。扩容操作比较耗时,因为它需要重新计算所有键的哈希码,并重新分配存储位置。

迭代顺序:HashMap 中的键值对存储顺序是不确定的,它不保证键值对的顺序与插入顺序相同。这是因为HashMap的存储位置是由键的哈希码决定的,而不是插入顺序。

put 方法

首先会将传入的 Key 做 hash 运算计算出 hashcode,然后根据数组长度取模计算出在数组中的 index 下标。

由于在计算中位运算比取模运算效率高的多,所以 HashMap 规定数组的长度为 2^n 。这样用 2^n - 1 做位运算与取模效果一致,并且效率还要高出许多。

由于数组的长度有限,所以难免会出现不同的 Key 通过运算得到的 index 相同,这种情况可以利用链表来解决,HashMap 会在 table[index]处形成链表,采用头插法将数据插入到链表中。

get 方法

get 和 put 类似,也是将传入的 Key 计算出 index ,如果该位置上是一个链表就需要遍历整个链表,通过 key.equals(k) 来找到对应的元素。

遍历方式

 Iterator<Map.Entry<String, Integer>> entryIterator = map.entrySet().iterator();while (entryIterator.hasNext()) {Map.Entry<String, Integer> next = entryIterator.next();System.out.println("key=" + next.getKey() + " value=" + next.getValue());}
Iterator<String> iterator = map.keySet().iterator();while (iterator.hasNext()){String key = iterator.next();System.out.println("key=" + key + " value=" + map.get(key));}
map.forEach((key,value)->{System.out.println("key=" + key + " value=" + value);
});

强烈建议使用第一种 EntrySet 进行遍历。

第一种可以把 key value 同时取出,第二种还得需要通过 key 取一次 value,效率较低, 第三种需要 JDK1.8 以上,通过外层遍历 table,内层遍历链表或红黑树。

notice

在并发环境下使用 HashMap 容易出现死循环。

并发场景发生扩容,调用 resize() 方法里的 rehash() 时,容易出现环形链表。这样当获取一个不存在的 key 时,计算出的 index 正好是环形链表的下标时就会出现死循环。

所以 HashMap 只能在单线程中使用,并且尽量的预设容量,尽可能的减少扩容。

JDK1.8 中对 HashMap 进行了优化: 当 hash 碰撞之后写入链表的长度超过了阈值(默认为8)并且 table 的长度不小于64(否则扩容一次)时,链表将会转换为红黑树

假设 hash 冲突非常严重,一个数组后面接了很长的链表,此时重新的时间复杂度就是 O(n)

如果是红黑树,时间复杂度就是 O(logn)

大大提高了查询效率。

多线程场景下推荐使用 ConcurrentHashMap。

相关文章:

  • 【R语言简介】讲解
  • Python并发编程:协程-gevent模块
  • 本科毕业设计:计及并网依赖性的分布式能源系统优化研究。(C语言实现)(内包含NSGA II优化算法)(二)
  • ai聊天消息内容调用PHP写到excel中
  • docker通过dockerfile安装sftp教程
  • tomcat nginx 动静分离
  • NIO群聊系统的实现
  • 除了Gamma和tome,还有哪些值得推荐的ai写ppt工具?
  • [LeetBook]【学习日记】数组内乘积
  • 大宋咨询数据研究在汽车新品上市中的核心作用
  • H5小游戏,斗地主
  • 备赛蓝桥杯-算法-动态规划
  • ViewModel 原理
  • (3)(3.2) MAVLink2数据包签名(安全)
  • redis06 redis事务
  • 「前端」从UglifyJSPlugin强制开启css压缩探究webpack插件运行机制
  • 【个人向】《HTTP图解》阅后小结
  • Android单元测试 - 几个重要问题
  • Angular4 模板式表单用法以及验证
  • CentOS7简单部署NFS
  • Docker 笔记(2):Dockerfile
  • Fabric架构演变之路
  • JWT究竟是什么呢?
  • Kibana配置logstash,报表一体化
  • Lucene解析 - 基本概念
  • Magento 1.x 中文订单打印乱码
  • Perseus-BERT——业内性能极致优化的BERT训练方案
  • Protobuf3语言指南
  • ReactNativeweexDeviceOne对比
  • supervisor 永不挂掉的进程 安装以及使用
  • 基于web的全景—— Pannellum小试
  • 罗辑思维在全链路压测方面的实践和工作笔记
  • 前端临床手札——文件上传
  • 区块链共识机制优缺点对比都是什么
  • 突破自己的技术思维
  • 网页视频流m3u8/ts视频下载
  • 译有关态射的一切
  • - 转 Ext2.0 form使用实例
  • “十年磨一剑”--有赞的HBase平台实践和应用之路 ...
  • 2017年360最后一道编程题
  • linux 淘宝开源监控工具tsar
  • ​业务双活的数据切换思路设计(下)
  • # Swust 12th acm 邀请赛# [ K ] 三角形判定 [题解]
  • #宝哥教你#查看jquery绑定的事件函数
  • #常见电池型号介绍 常见电池尺寸是多少【详解】
  • #多叉树深度遍历_结合深度学习的视频编码方法--帧内预测
  • (2)STL算法之元素计数
  • (NSDate) 时间 (time )比较
  • (附源码)spring boot火车票售卖系统 毕业设计 211004
  • (十八)用JAVA编写MP3解码器——迷你播放器
  • (四)七种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (转)平衡树
  • (状压dp)uva 10817 Headmaster's Headache
  • * CIL library *(* CIL module *) : error LNK2005: _DllMain@12 already defined in mfcs120u.lib(dllmodu
  • **Java有哪些悲观锁的实现_乐观锁、悲观锁、Redis分布式锁和Zookeeper分布式锁的实现以及流程原理...