当前位置: 首页 > news >正文

Java [ 基础 ] HashMap详解 ✨

目录

✨探索Java基础   HashMap详解✨

总述

主体

1. HashMap的基本概念

2. HashMap的工作原理

3. HashMap的常用操作

4. HashMap的优缺点

总结

常见面试题

常见面试题解答

1. HashMap的底层实现原理是什么?

2. 如何解决HashMap中的哈希冲突?

3. HashMap和Hashtable的区别是什么?

4. 在什么情况下HashMap会发生扩容?

5. 为什么HashMap不是线程安全的?如何实现线程安全的HashMap?

HashMap源码

1 put方法流程

2 扩容

3 get方法


✨探索Java基础   HashMap详解✨

总述

在Java中,HashMap 是一个常用的数据结构,它实现了Map接口,允许我们通过键值对的形式存储和快速查找数据。HashMap的底层是基于哈希表(hash table)的实现,它的高效性和灵活性使其在各种编程场景中广受欢迎。本文将详细介绍HashMap的原理、使用方法、优缺点,并提供一些常见的面试题。

主体
1. HashMap的基本概念

HashMap是一个散列表,它存储键值对(key-value pairs),每个键对应一个唯一的值。HashMap不保证顺序,并且允许null值作为键或值。

import java.util.HashMap;public class Main {public static void main(String[] args) {HashMap<String, Integer> map = new HashMap<>();map.put("one", 1);map.put("two", 2);map.put("three", 3);System.out.println(map.get("one"));  // 输出: 1}
}
2. HashMap的工作原理

HashMap使用哈希表来存储数据。键的哈希值通过hash()方法计算,然后通过哈希函数将哈希值映射到数组的索引位置上。通过链地址法(chaining)来解决哈希冲突,即在每个数组索引处存储一个链表(Java 8及之后版本采用红黑树以提高性能)。

public int hash(Object key) {int h;return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

3. HashMap的常用操作
  • 添加元素: 使用put()方法。

  • map.put("four", 4);
  • 获取元素: 使用get()方法。

    int value = map.get("two");
  • 移除元素: 使用remove()方法。

    map.remove("three");
  • 遍历元素:

    for (Map.Entry<String, Integer> entry : map.entrySet()) {System.out.println(entry.getKey() + ": " + entry.getValue());
    }
    

4. HashMap的优缺点

优点:

  • 快速查找: 平均时间复杂度为O(1)。
  • 灵活: 可以存储不同类型的对象,允许null键和值。

缺点:

  • 非线程安全: 多线程情况下需要手动同步。
  • 不保证顺序: 插入顺序和遍历顺序可能不同。

总结

HashMap是Java中一个强大且高效的集合类,用于快速查找和存储键值对。理解其工作原理和常用操作对于提高编程效率和解决复杂问题非常有帮助。

常见面试题
  1. HashMap的底层实现原理是什么?
  2. 如何解决HashMap中的哈希冲突?
  3. HashMapHashtable的区别是什么?
  4. 在什么情况下HashMap会发生扩容?
  5. 为什么HashMap不是线程安全的?如何实现线程安全的HashMap

常见面试题解答

1. HashMap的底层实现原理是什么?

HashMap的底层是基于哈希表(hash table)实现的。它内部使用一个数组来存储元素,每个数组的元素被称为“桶”(bucket)。当我们向HashMap中插入一个键值对时,会先根据键的hashCode()方法计算出哈希值,然后通过哈希函数将哈希值映射到数组的索引位置上。HashMap通过链地址法(chaining)来解决哈希冲突,即每个桶中存储一个链表(Java 8及之后版本采用红黑树以提高性能)。

public int hash(Object key) {int h;return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
2. 如何解决HashMap中的哈希冲突?

HashMap采用链地址法(chaining)来解决哈希冲突。具体方法是,每个桶中存储一个链表(或者在Java 8及之后版本中,当链表长度超过一定阈值时,会转换成红黑树),所有映射到同一索引位置的键值对都会存储在这个链表或红黑树中。

当插入一个新的键值对时,如果该键值对的哈希值映射到的索引位置已经存在其它元素,则会将新的键值对添加到该位置的链表或红黑树中。

3. HashMap和Hashtable的区别是什么?
  • 线程安全性: Hashtable是线程安全的,所有方法都是同步的,而HashMap不是线程安全的,适用于单线程环境或通过外部同步来保证线程安全。
  • null键和值: HashMap允许一个null键和多个null值,而Hashtable不允许null键和值。
  • 性能: 由于Hashtable的方法是同步的,因此在单线程环境下性能比HashMap差。
  • 遗产: Hashtable是基于较老的Dictionary类实现的,而HashMap是从Java 1.2开始作为Map接口的实现类。
4. 在什么情况下HashMap会发生扩容?

HashMap会在容量达到阈值(默认是当前容量的0.75倍)时发生扩容。扩容时,HashMap的容量会变为原来的两倍,并重新哈希已有的键值对,重新分配到新的桶中。扩容可以避免哈希冲突,保持HashMap的高效性。

5. 为什么HashMap不是线程安全的?如何实现线程安全的HashMap?

HashMap不是线程安全的,因为它的所有方法都不是同步的。在多线程环境下,多个线程同时修改HashMap的结构可能导致数据不一致或出现死循环。

要实现线程安全的HashMap,可以通过以下方法:

  • 使用Collections.synchronizedMap(Map<K, V> m)方法: 这个方法返回一个线程安全的Map

    Map<String, Integer> synchronizedMap = Collections.synchronizedMap(new HashMap<>());
  • 使用ConcurrentHashMap 这是Java提供的线程安全的Map实现,适用于高并发环境。它通过分段锁机制(Segmented Locking)来提高并发性能。

    ConcurrentHashMap<String, Integer> concurrentMap = new ConcurrentHashMap<>();

HashMap源码

1 put方法流程

public V put(K key, V value) {return putVal(hash(key), key, value, false, true);
}final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {Node<K,V>[] tab; Node<K,V> p; int n, i;//判断数组是否未初始化if ((tab = table) == null || (n = tab.length) == 0)//如果未初始化,调用resize方法 进行初始化n = (tab = resize()).length;//通过 & 运算求出该数据(key)的数组下标并判断该下标位置是否有数据if ((p = tab[i = (n - 1) & hash]) == null)//如果没有,直接将数据放在该下标位置tab[i] = newNode(hash, key, value, null);//该数组下标有数据的情况else {Node<K,V> e; K k;//判断该位置数据的key和新来的数据是否一样if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))//如果一样,证明为修改操作,该节点的数据赋值给e,后边会用到e = p;//判断是不是红黑树else if (p instanceof TreeNode)//如果是红黑树的话,进行红黑树的操作e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);//新数据和当前数组既不相同,也不是红黑树节点,证明是链表else {//遍历链表for (int binCount = 0; ; ++binCount) {//判断next节点,如果为空的话,证明遍历到链表尾部了if ((e = p.next) == null) {//把新值放入链表尾部p.next = newNode(hash, key, value, null);//因为新插入了一条数据,所以判断链表长度是不是大于等于8if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st//如果是,进行转换红黑树操作treeifyBin(tab, hash);break;}//判断链表当中有数据相同的值,如果一样,证明为修改操作if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))break;//把下一个节点赋值为当前节点p = e;}}//判断e是否为空(e值为修改操作存放原数据的变量)if (e != null) { // existing mapping for key//不为空的话证明是修改操作,取出老值V oldValue = e.value;//一定会执行  onlyIfAbsent传进来的是falseif (!onlyIfAbsent || oldValue == null)//将新值赋值当前节点e.value = value;afterNodeAccess(e);//返回老值return oldValue;}}//计数器,计算当前节点的修改次数++modCount;//当前数组中的数据数量如果大于扩容阈值if (++size > threshold)//进行扩容操作resize();//空方法afterNodeInsertion(evict);//添加操作时 返回空值return null;
}

2 扩容

//扩容、初始化数组
final Node<K,V>[] resize() {Node<K,V>[] oldTab = table;//如果当前数组为null的时候,把oldCap老数组容量设置为0int oldCap = (oldTab == null) ? 0 : oldTab.length;//老的扩容阈值int oldThr = threshold;int newCap, newThr = 0;//判断数组容量是否大于0,大于0说明数组已经初始化if (oldCap > 0) {//判断当前数组长度是否大于最大数组长度if (oldCap >= MAXIMUM_CAPACITY) {//如果是,将扩容阈值直接设置为int类型的最大数值并直接返回threshold = Integer.MAX_VALUE;return oldTab;}//如果在最大长度范围内,则需要扩容  OldCap << 1等价于oldCap*2//运算过后判断是不是最大值并且oldCap需要大于16else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&oldCap >= DEFAULT_INITIAL_CAPACITY)newThr = oldThr << 1; // double threshold  等价于oldThr*2}//如果oldCap<0,但是已经初始化了,像把元素删除完之后的情况,那么它的临界值肯定还存在,       			如果是首次初始化,它的临界值则为0else if (oldThr > 0) // initial capacity was placed in thresholdnewCap = oldThr;//数组未初始化的情况,将阈值和扩容因子都设置为默认值else {               // zero initial threshold signifies using defaultsnewCap = DEFAULT_INITIAL_CAPACITY;newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);}//初始化容量小于16的时候,扩容阈值是没有赋值的if (newThr == 0) {//创建阈值float ft = (float)newCap * loadFactor;//判断新容量和新阈值是否大于最大容量newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?(int)ft : Integer.MAX_VALUE);}//计算出来的阈值赋值threshold = newThr;@SuppressWarnings({"rawtypes","unchecked"})//根据上边计算得出的容量 创建新的数组       Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];//赋值table = newTab;//扩容操作,判断不为空证明不是初始化数组if (oldTab != null) {//遍历数组for (int j = 0; j < oldCap; ++j) {Node<K,V> e;//判断当前下标为j的数组如果不为空的话赋值个e,进行下一步操作if ((e = oldTab[j]) != null) {//将数组位置置空oldTab[j] = null;//判断是否有下个节点if (e.next == null)//如果没有,就重新计算在新数组中的下标并放进去newTab[e.hash & (newCap - 1)] = e;//有下个节点的情况,并且判断是否已经树化else if (e instanceof TreeNode)//进行红黑树的操作((TreeNode<K,V>)e).split(this, newTab, j, oldCap);//有下个节点的情况,并且没有树化(链表形式)else {//比如老数组容量是16,那下标就为0-15//扩容操作*2,容量就变为32,下标为0-31//低位:0-15,高位16-31//定义了四个变量//        低位头          低位尾Node<K,V> loHead = null, loTail = null;//        高位头		   高位尾Node<K,V> hiHead = null, hiTail = null;//下个节点Node<K,V> next;//循环遍历do {//取出next节点next = e.next;//通过 与操作 计算得出结果为0if ((e.hash & oldCap) == 0) {//如果低位尾为null,证明当前数组位置为空,没有任何数据if (loTail == null)//将e值放入低位头loHead = e;//低位尾不为null,证明已经有数据了else//将数据放入next节点loTail.next = e;//记录低位尾数据loTail = e;}//通过 与操作 计算得出结果不为0else {//如果高位尾为null,证明当前数组位置为空,没有任何数据if (hiTail == null)//将e值放入高位头hiHead = e;//高位尾不为null,证明已经有数据了else//将数据放入next节点hiTail.next = e;//记录高位尾数据hiTail = e;}} //如果e不为空,证明没有到链表尾部,继续执行循环while ((e = next) != null);//低位尾如果记录的有数据,是链表if (loTail != null) {//将下一个元素置空loTail.next = null;//将低位头放入新数组的原下标位置newTab[j] = loHead;}//高位尾如果记录的有数据,是链表if (hiTail != null) {//将下一个元素置空hiTail.next = null;//将高位头放入新数组的(原下标+原数组容量)位置newTab[j + oldCap] = hiHead;}}}}}//返回新的数组对象return newTab;}

3 get方法

public V get(Object key) {Node<K,V> e;//hash(key),获取key的hash值//调用getNode方法,见下面方法return (e = getNode(hash(key), key)) == null ? null : e.value;
}final Node<K,V> getNode(int hash, Object key) {Node<K,V>[] tab; Node<K,V> first, e; int n; K k;//找到key对应的桶下标,赋值给first节点if ((tab = table) != null && (n = tab.length) > 0 &&(first = tab[(n - 1) & hash]) != null) {//判断hash值和key是否相等,如果是,则直接返回,桶中只有一个数据(大部分的情况)if (first.hash == hash && // always check first node((k = first.key) == key || (key != null && key.equals(k))))return first;if ((e = first.next) != null) {//该节点是红黑树,则需要通过红黑树查找数据if (first instanceof TreeNode)return ((TreeNode<K,V>)first).getTreeNode(hash, key);//链表的情况,则需要遍历链表查找数据do {if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))return e;} while ((e = e.next) != null);}}return null;
}

觉得有用的话可以点点赞 (*/ω\*),支持一下。

如果愿意的话关注一下。会对你有更多的帮助。

每天都会不定时更新哦  >人<  。

相关文章:

  • Python中的双向哈希表(双向字典)
  • Qt 使用 QZipReader 解压文件
  • Java中的并行计算与任务分发策略
  • 阿里云智能编程助手的安装使用
  • zoom 会议视频软件的使用
  • MySQL内存使用率高且不释放问题排查与总结
  • 黑马点评项目难点-动态代理,sychronized,@Transactional失效的情况
  • JAVA小知识31:多线程篇2
  • 1-Pandas是什么
  • Perl 语言开发(四):条件语句
  • python学习-基础1
  • JSON字符串中获取一个指定字段的值
  • 第1章 人工智能的基础概念与应用导论
  • C++ 定长队列的实现
  • 【博士每天一篇文献-综述】A survey on few-shot class-incremental learning
  • 9月CHINA-PUB-OPENDAY技术沙龙——IPHONE
  • [rust! #004] [译] Rust 的内置 Traits, 使用场景, 方式, 和原因
  • LintCode 31. partitionArray 数组划分
  • Python连接Oracle
  • RxJS: 简单入门
  • scrapy学习之路4(itemloder的使用)
  • session共享问题解决方案
  • vue-router的history模式发布配置
  • 读懂package.json -- 依赖管理
  • 工程优化暨babel升级小记
  • 工作手记之html2canvas使用概述
  • 构建二叉树进行数值数组的去重及优化
  • 关于 Linux 进程的 UID、EUID、GID 和 EGID
  • 关于List、List?、ListObject的区别
  • 后端_ThinkPHP5
  • 极限编程 (Extreme Programming) - 发布计划 (Release Planning)
  • 如何实现 font-size 的响应式
  • 无服务器化是企业 IT 架构的未来吗?
  • 线上 python http server profile 实践
  • 小程序上传图片到七牛云(支持多张上传,预览,删除)
  • 协程
  • 用jQuery怎么做到前后端分离
  • 再次简单明了总结flex布局,一看就懂...
  • Oracle Portal 11g Diagnostics using Remote Diagnostic Agent (RDA) [ID 1059805.
  • ​​​​​​​Installing ROS on the Raspberry Pi
  • ​批处理文件中的errorlevel用法
  • # MySQL server 层和存储引擎层是怎么交互数据的?
  • #vue3 实现前端下载excel文件模板功能
  • (10)工业界推荐系统-小红书推荐场景及内部实践【排序模型的特征】
  • (14)目标检测_SSD训练代码基于pytorch搭建代码
  • (cos^2 X)的定积分,求积分 ∫sin^2(x) dx
  • (c语言)strcpy函数用法
  • (zt)最盛行的警世狂言(爆笑)
  • (二)JAVA使用POI操作excel
  • (附源码)ssm码农论坛 毕业设计 231126
  • (六) ES6 新特性 —— 迭代器(iterator)
  • (译) 理解 Elixir 中的宏 Macro, 第四部分:深入化
  • (转)全文检索技术学习(三)——Lucene支持中文分词
  • .NET 中各种混淆(Obfuscation)的含义、原理、实际效果和不同级别的差异(使用 SmartAssembly)
  • .NET6 命令行启动及发布单个Exe文件