注:源码系列文章主要是对某付费专栏的总结记录。如有侵权,请联系删除。
Map 在面试中,占据了很大一部分的面试题,其中以 HashMap 为主,这些面试题目有的可以说清楚,有的很难说清楚,如果是面对面面试的话,建议画一画。
答:HashMap 底层是 数组 + 链表 + 红黑树
的数据结构,数组的作用主要是方便快速查找,时间复杂度是 O(1),默认大小是 16,数组的下标索引是通过 Key 的 hash 计算出来的(index = (tab.length - 1) & hash
),数组元素叫做 Node,当多个 key 的 hashcode 一致,但 key 值不同时,就叫做(hash 碰撞冲突),单个 Node 就会转化成链表,链表的查询复杂度是 O(n),当链表的长度大于等于 8 并且数组大小(tab.length)超过 64 时,链表就会转化成红黑树,红黑树的查询复杂度是 O(log(n)),简单来说,最坏的查询次数相当于红黑树的最大深度。
答:
相同点:
ConcurrentModificationException
错误。不同点:
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
// index = (tab.length - 1) & hash
以上代码是 HashMap 的 hash 算法。
这其实是个数学问题,源码中就是通过以上代码来计算 hash 的,首先计算出 key 的 hashcode,因为 key 是 Object,所以会根据 key 的不同类型进行 hashcode 的计算,接着计算 h ^ (h >>> 16)
,这么做的好处是使大多数场景下,算出来的 hash 值比较分散。
一般来说,hash 值算出来之后,要计算当前 key 在数组中的索引下标位置,可以采用取模的方式,就是:索引下标位置 = hash 值 % 数组大小
,这样做的好处,就是可以保证计算出来的索引下标值可以均匀的分布在数组的各个索引位置上,但取模操作对于处理器的计算是比较慢的,数学上有个公式,当 b 是 2 的幂次方时
, a & b = a & (b - 1)
,所以此处索引位置的计算公式我们可以更改为:(n - 1) & hash
。
此问题可以延伸出三个小问题:
答:如果 key 是数字,直接用 key % 数组大小是没有问题的,但我们的 key 还有可能是字符串,是复杂对象,这时候用 字符串或复杂对象 % 数组大小是不行的,所以需要先计算出 key 的 hash 值。
答:hash 算法是 h ^ (h >>> 16)
,为了使计算出的 hash 值更分散,所以选择先将 h 无符号右移 16 位,然后再与 h 异或,就能达到 h 的高 16 位和低 16 位都能参与计算,减少了碰撞的可能性。
答:key.hashCode() 算出来的 hash 值还不是数组的索引下标,为了随机的计算出索引的下标位置,我们还会用 hash 值和数组大小进行取模,这样子计算出来的索引下标比较均匀分布。
取模操处理器计算比较慢,处理器对 & 操作就比较擅长,换成了 & 操作,是有数学证明的支撑,提高了处理器处理的速度。
答:因为只有大小是 2 的幂次方时,才能使 hash 值 % n(tab.length) == (n - 1) & hash 公式成立。
答:
网上列举的一些其它方法,尽量不要说,因为这些方法资料很少,实战用过的人更少,如果你没有深入研究的话,面试官让你深入描述一下很难说清楚,反而留下了不好的印象,说说 HashMap 现有的措施就足够了。
答:
扩容的时机:
resize() 中的 newCap = oldCap << 1
。(ArrayList 扩容为 1.5 倍(newCapacity = oldCapacity + (oldCapacity >> 1)
))扩容的门阀值是 threshold
,每次扩容时 threshold
都会被重新计算,门阀值等于 数组大小 * 影响因子(0.75)
。
新数组初始化之后,需要将老数组的值拷贝到新数组上,链表和红黑树都有自己的拷贝方法。
答:hash 冲突指定是 key 值的 hashcode 计算相同,但 key 值不同的情况。
如果桶中的元素原本只有一个或已经是链表了,新增元素直接追加到链表尾部;
如果桶中元素已经是链表,并且链表个数大于等于 8 时,此时有两种情况:
这里不仅仅判断了链表元素个数大于等于 8,还判断了数组大小,数组容量小于 64 没有立即转化的原因,猜测主要是因为红黑树占用的空间比链表大很多,转化也比较耗时,所以数组容量小的情况下冲突严重,我们可以先尝试扩容,看看能否通过扩容来解决冲突的问题。
答:当链表元素个数太多时,遍历可能比较耗时,转化成红黑树,可以使遍历的时间复杂度降低。但转化成红黑树,有空间和转化耗时的成本,我们通过 泊松分布公式
计算,正常情况下,链表个数出现 8 的几率不到千万分之一,所以说正常情况下,链表都不会转化成红黑树,这样设计的目的是为了防止非正常情况下,比如 hash 算法出问题时,导致链表元素个数轻易大于等于 8 时,仍然能够快速遍历。
延伸问题:红黑树什么时候转化成链表?
答:当节点的个数小于等于 6 时,红黑树会自动转化为链表,主要还是考虑红黑树的空间成本问题,当节点个数小于等于 6 时,遍历链表也很快,所以红黑树会重新变成链表。
答:如果数组有了 key,但不想覆盖 value,可以选择 putIfAbsent
方法,这个方法有给内置变量 onlyIfAbsent,内置是 true,就不会覆盖,我们平时使用的 put 方法,内置 onlyIfAbsent 为 false,是允许覆盖的。
取值时,如果为空,想返回默认值,可以使用 getOrDefault
方法,方法第一参数为 key,第二参数为你想返回的默认值,如 map.get(“10”, “3”),当 map 中没有 key 为 10 的值时,会返回默认值 3,而不是为空。
HashMap<String,String > map = Maps.newHashMap();
map.put("1","1");
map.put("2","2");
map.forEach((s, s2) -> map.remove("1"));
答:不行,会报 ConcurrentModificationException,如下:
@Override
public void forEach(BiConsumer<? super K, ? super V> action) {
Node<K,V>[] tab;
if (action == null)
throw new NullPointerException();
if (size > 0 && (tab = table) != null) {
int mc = modCount;
for (int i = 0; i < tab.length; ++i) {
for (Node<K,V> e = tab[i]; e != null; e = e.next)
action.accept(e.key, e.value);
}
if (modCount != mc)
throw new ConcurrentModificationException();
}
}
发现 HashMap 重写了 Map 的 forEach 方法,会判断 modCount。建议使用迭代器的方式进行珊瑚,原理同 ArrayList 迭代器类似。
答:可以详细描述下源码的实现路径,说不清楚的话,可以画一画。
答:DTO 就是一个数据载体,可以看做拥有很多属性的 Java 类,我们可以对这些属性进行 get、set 操作。
看是什么类型的 Map。如果是 HashMap 的话,一定要覆写 equals 和 hashCode 方法,因为在 get、put 的时候,需要通过 equals 方法进行相等的判断;如果是 TreeMap 的话,DTO 需要实现 Comparable 接口,因为 TreeMap 会使用 Comparable 接口进行判断 key 的大小;如果是 LinkedHashMap 的话,和 HashMap 一样。
答:LRU,英文全称:Least recently used,中文叫做最近最少访问,在 LinkedHashMap 中,也叫做最少访问删除策略,我们可以通过 removeEldestEntry
方法设定一定的删除策略,使最少被访问的元素,在适当的时机被删除,原理是在 put 方法执行的最后,LinkedHashMap 会去检查这种策略,如果满足策略,就删除头节点。LinkedHashMap 覆写了 HashMap 的 afterNodeInsertion
方法。
保证头节点就是最少访问元素的原理是:LinkedHashMap 在 get 的时候,就会把当前访问的节点,移动到链表的尾部,慢慢的,就会使头部的节点成为最少被访问的元素。
答:因为 TreeMap 的底层就是通过排序来比较两个 key 的大小的,所以推荐 key 实现 Comparable 接口,是为了让 key 的排序往你希望的排序顺序上发展,而 String 本身已经实现了 Comparable 接口,所以使用 String 时,我们不需要额外的工作,不仅仅是 String,其它包装类型也都实现了 Comparable 接口,如 Long、Double、Float 等等。
Map 的面试题主要是 HashMap 为主,会问很多源码方面的问题,TreeMap 和 LinkedHashMap 主要以功能和场景为主,作为加分项。
Map 的面试题很多,但只要弄懂原理,题目再多变化,回答起来都会比较简单。
------------------------------------- END -------------------------------------
文章浏览阅读2.4k次,点赞3次,收藏3次。建了一个简单web项目,但是项目出了一个Description Resource Path Location TypeDescription Resource Path Location TypeThe superclass “javax.servlet.http.HttpServlet” was not found on the Java Build Path index.jsp /s..._"descriptionresourcepathlocationtype the superclass \"javax.servlet.http.h"
文章浏览阅读1.8k次。1. Download Sun Java JDK or JRE Download Sun Java JDK or JRE from here (current version is JDK 6 Update 20)http://java.sun.com/javase/downloads/index.jsp.Note: you can Skip login step.Download rpm.bin package (example jdk-6u20-linux-i586-rpm.bin).2. Change_fedora install jdk
文章浏览阅读108次。_andori拍照返回app 崩溃
文章浏览阅读1.1w次,点赞48次,收藏317次。在嵌入式操作系统中,BootLoader是在操作系统内核运行之前运行。可以初始化硬件设备、建立内存空间映射图,从而将系统的软硬件环境带到一个合适状态,以便为最终调用操作系统内核准备好正确的环境。在嵌入式系统中,通常并没有像BIOS那样的固件程序(注,有的嵌入式CPU也会内嵌一段短小的启动程序),因此整个系统的加载启动任务就完全由BootLoader来完成。_stm32 bootloader
文章浏览阅读91次。PIC单片机C语言编程实例三-第7章秒表.docPAGEPAGE 133第7章 秒 表7.2.2 程序清单该源程序已在实验板上调试通过,读者可直接引用,并可利用软件编程的灵活性,加以拓展,实现更为复杂的功能。#include#include //此程序实现计时秒表功能,时钟显示范围00.00~99.99秒,分辨度:0.01秒unsigned chars0,s1,s2,s3;//定义0.0..._pic跑表启动条件
文章浏览阅读2.1k次。概述 在Java和Groovy的结合中,经常会碰到需要从Java代码中调起一个写好的Groovy脚本,我们可以通过GroovyShell来实现。其中最重要的就是GroovyShell和Binding两个类,其中GroovyShell可以调起一个Groovy脚本,而Binding可以向脚本里面传递参数。简单示例//通过Binding向要执行的groovy脚本传递变量 Bindi..._groovy evaluate
文章浏览阅读168次。牛客小白月赛20D 3的倍数题目链接算法分析n最大为15,范围比较小,所以直接来采用爆搜就行算法实现#include<iostream>#include<cstdio>#include<string>#include<cstring>#include<math.h>using namespace std;int ch[20][30];//ch[i][j]记录第i个字符串中j的个数,j为字符转换后的数字int dp[30];/_3的倍数csdn
文章浏览阅读71次。本文来自于腾讯优测公众号(wxutest),未经作者同意,请勿转载,原文地址:https://mp.weixin.qq.com/s/806TiugiSJvFI7fH6eVA5w作者:腾讯TMQ专项测试团队导语最近小优听说,隔壁的腾讯TMQ团队出了一本新书——《移动App性能评测与优化》,便借阅了一本,读完感觉写得确实很赞。这本书体系化地介绍了移动应用性能评测与优化的方方面面,如内存,电量..._如何降低app的待机内存
文章浏览阅读1.6k次,点赞21次,收藏6次。Texlive2020+Texstudio2.12.22资源,附安装教程和刘海洋latex入门使用说明书百度云地址文件截图![\[\]](https://img-blog.csdnimg.cn/20201031105628261.png#pic_center)总结百度云地址链接:https://pan.baidu.com/s/1w4ZdEHvgMBF2uURQmnAxXw提取码:6jga复制这段内容后打开百度网盘手机App,操作更方便哦–来自百度网盘超级会员V1的分享文件截图总结如果链接..
文章浏览阅读5.2k次。题目大意:有一种汉堡,用B、S、C三种原料做成,现在告诉你当前有的B、S、C的个数,到商店买的B、S、C的单价(商店无限供应这三种原料),还有你拥有的钱。问最多能做多少个汉堡。刚开始我还以为是模拟,先把能用的用完,再去买。但是写了半天写不下去了,找了一下题解才发现是二分答案板子题。发现自己对二分还是不是很敏感。AC代码://https://blog.csdn.net/hesorche..._hamburger题解
文章浏览阅读1.9k次。提示:安装uhd+gnuradio实际上并不难,只是实际安装的时候,作为新手经常会因为缺乏相关知识而踩不少坑,以下是我踩坑安装的一些记录。gnuradio+uhd安装过程ubuntu下安装uhd+gnuradioExample: For UHD 3.9.5:Example: For UHD 3.14.0.0win10下安装ubuntu双系统使用usrpb210ubuntu18.04安装方法有两种,一种是使用已经编译好的二进制码,缺点是版本通常比较旧,但学习usrp也不需要太新的版本,另外,这种_无法定位软件包 libuhd003
文章浏览阅读3.1k次,点赞4次,收藏45次。awk文本和数据进行处理的编程语言awk 是一种编程语言,用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入(stdin)、一个或多个文件,或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能,是linux/unix下的一个强大编程工具。它在命令行中使用,但更多是作为脚本来使用。awk有很多内建的功能,比如数组、函数等,这是它和C语言的相同之处,灵活性是awk最大的优势。awk命令格式和选项语法形式awk [options] ‘script’ va_在linux系统中,awk允许进行多种测试。作为样式匹配,还提供了模式匹配表达式,以下