01 概述
HashMap是Java程序员使用频率最高的用于映射(键值对)处理的数据类型。随着JDK(Java Developmet Kit)版本的更新,JDK1.8对HashMap底层的实现进行了优化,例如引入红黑树的数据结构和扩容的优化等。本文主要分析一下HashMap中红黑树树化的过程。
02 红黑树(red black tree)
一个节点标记为红色或者黑色。 根是黑色的。 如果一个节点是红色的,那么它的子节点必须是黑色的(这就是为什么叫红黑树)。 一个节点到到一个null引用的每一条路径必须包含相同数目的黑色节点(所以红色节点不影响)。 其实RB Tree和著名的AVL Tree有很多相同的地方,困难的地方都在于将一个新项插入到树中。了解AVL Tree的朋友应该都知道为了维持树的高度必须在插入一个新的项后必须在树的结构上进行改变,这里主要是通过旋转,当然在RB Tree中原理也是如此。
03 两种旋转和一种典型的变换









- 单旋转变换。
- 双旋转变换(需要两次反方向的单旋转)。
- 当遇到两个子几点都为红色的话执行颜色变换,因为插入 是红色的会产生冲突。如果根节点两边的子节点都是红色,两个叶子节点变成黑色,根节点变成红色,然后再将根节点变成黑色。
上面的图中描述了红黑树中三种典型的变换,其实前两种变换这正是AVL Tree中的两种典型的变换。
04 几个问题
4.1 为什么要进行旋转?
4.2 新加入的节点总是红色的,这是为什么呢?
4.3 为什么要进行颜色变换?
第二种双变换中在树的内部怎么出现的红色的节点? 正是由于上面的颜色变换导致新颜色变换后的节点与他的父节点产生了颜色冲突。
与AVL树相比? 比AVL树相比优点是不用在节点类中保存一个节点高度这个变量,节省了内存。
05 好了有了这些基本的概念让我们去看一下HashMap中的代码的实现
- final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict)
- {
- Node<K, V>[] tab;
- Node<K, V> p;
- int n, i;
- if ((tab = table) == null || (n = tab.length) == 0)
- n = (tab = resize()).length;
- if ((p = tab[i = (n – 1) & hash]) == null)
- tab[i] = newNode(hash, key, value, null);
- else
- {
- Node<K, V> e;
- K k;
- if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
- e = p;
- else if (p instanceof TreeNode)
- // 如果当前的bucket里面已经是红黑树的话,执行红黑树的添加操作
- e = ((TreeNode<K, V>) p).putTreeVal(this, tab, hash, key, value);
- else
- {
- for (int binCount = 0;; ++binCount)
- {
- if ((e = p.next) == null)
- {
- p.next = newNode(hash, key, value, null);
- // TREEIFY_THRESHOLD = 8,判断如果当前bucket的位置链表长度大于8的话就将此链表变成红黑树。
- if (binCount >= TREEIFY_THRESHOLD – 1) // -1 for 1st
- treeifyBin(tab, hash);
- break;
- }
- if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
- break;
- p = e;
- }
- }
- if (e != null)
- { // existing mapping for key
- V oldValue = e.value;
- if (!onlyIfAbsent || oldValue == null)
- e.value = value;
- afterNodeAccess(e);
- return oldValue;
- }
- }
- ++modCount;
- if (++size > threshold)
- resize();
- afterNodeInsertion(evict);
- return null;
- }
- final void treeifyBin(Node<K, V>[] tab, int hash)
- {
- int n, index;
- Node<K, V> e;
- if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
- // resize()方法这里不过多介绍,感兴趣的可以去看上面的链接。
- resize();
- // 通过hash求出bucket的位置。
- else if ((e = tab[index = (n – 1) & hash]) != null)
- {
- TreeNode<K, V> hd = null, tl = null;
- do
- {
- // 将每个节点包装成TreeNode。
- TreeNode<K, V> p = replacementTreeNode(e, null);
- if (tl == null)
- hd = p;
- else
- {
- // 将所有TreeNode连接在一起此时只是链表结构。
- p.prev = tl;
- tl.next = p;
- }
- tl = p;
- } while ((e = e.next) != null);
- if ((tab[index] = hd) != null)
- // 对TreeNode链表进行树化。
- hd.treeify(tab);
- }
- }
- static final class TreeNode<K, V> extends LinkedHashMap.Entry<K, V>
- {
- TreeNode<K, V> parent; // red-black tree links
- TreeNode<K, V> left;
- TreeNode<K, V> right;
- TreeNode<K, V> prev; // needed to unlink next upon deletion
- boolean red;
- TreeNode(int hash, K key, V val, Node<K, V> next)
- {
- super(hash, key, val, next);
- }
- final void treeify(Node<K,V>[] tab)
- {
- // ……
- }
- static <K,V> TreeNode<K,V> balanceInsertion(TreeNode<K,V> root, TreeNode<K,V> x)
- {
- // ……
- }
- static <K,V> TreeNode<K,V> rotateLeft(TreeNode<K,V> root, TreeNode<K,V> p)
- {
- // ……
- }
- static <K,V> TreeNode<K,V> rotateRight(TreeNode<K,V> root, TreeNode<K,V> p)
- {
- // ……
- }
- // ……其余方法省略
- }
- final void treeify(Node<K, V>[] tab)
- {
- TreeNode<K, V> root = null;
- // 以for循环的方式遍历刚才我们创建的链表。
- for (TreeNode<K, V> x = this, next; x != null; x = next)
- {
- // next向前推进。
- next = (TreeNode<K, V>) x.next;
- x.left = x.right = null;
- // 为树根节点赋值。
- if (root == null)
- {
- x.parent = null;
- x.red = false;
- root = x;
- } else
- {
- // x即为当前访问链表中的项。
- K k = x.key;
- int h = x.hash;
- Class<?> kc = null;
- // 此时红黑树已经有了根节点,上面获取了当前加入红黑树的项的key和hash值进入核心循环。
- // 这里从root开始,是以一个自顶向下的方式遍历添加。
- // for循环没有控制条件,由代码内break跳出循环。
- for (TreeNode<K, V> p = root;;)
- {
- // dir:directory,比较添加项与当前树中访问节点的hash值判断加入项的路径,-1为左子树,+1为右子树。
- // ph:parent hash。
- int dir, ph;
- K pk = p.key;
- if ((ph = p.hash) > h)
- dir = -1;
- else if (ph < h)
- dir = 1;
- else if ((kc == null && (kc = comparableClassFor(k)) == null)
- || (dir = compareComparables(kc, k, pk)) == 0)
- dir = tieBreakOrder(k, pk);
- // xp:x parent。
- TreeNode<K, V> xp = p;
- // 找到符合x添加条件的节点。
- if ((p = (dir <= 0) ? p.left : p.right) == null)
- {
- x.parent = xp;
- // 如果xp的hash值大于x的hash值,将x添加在xp的左边。
- if (dir <= 0)
- xp.left = x;
- // 反之添加在xp的右边。
- else
- xp.right = x;
- // 维护添加后红黑树的红黑结构。
- root = balanceInsertion(root, x);
- // 跳出循环当前链表中的项成功的添加到了红黑树中。
- break;
- }
- }
- }
- }
- // Ensures that the given root is the first node of its bin,自己翻译一下。
- moveRootToFront(tab, root);
- }
- static <K, V> TreeNode<K, V> balanceInsertion(TreeNode<K, V> root, TreeNode<K, V> x)
- {
- // 正如开头所说,新加入树节点默认都是红色的,不会破坏树的结构。
- x.red = true;
- // 这些变量名不是作者随便定义的都是有意义的。
- // xp:x parent,代表x的父节点。
- // xpp:x parent parent,代表x的祖父节点
- // xppl:x parent parent left,代表x的祖父的左节点。
- // xppr:x parent parent right,代表x的祖父的右节点。
- for (TreeNode<K, V> xp, xpp, xppl, xppr;;)
- {
- // 如果x的父节点为null说明只有一个节点,该节点为根节点,根节点为黑色,red = false。
- if ((xp = x.parent) == null)
- {
- x.red = false;
- return x;
- }
- // 进入else说明不是根节点。
- // 如果父节点是黑色,那么大吉大利(今晚吃鸡),红色的x节点可以直接添加到黑色节点后面,返回根就行了不需要任何多余的操作。
- // 如果父节点是红色的,但祖父节点为空的话也可以直接返回根此时父节点就是根节点,因为根必须是黑色的,添加在后面没有任何问题。
- else if (!xp.red || (xpp = xp.parent) == null)
- return root;
- // 一旦我们进入到这里就说明了两件是情
- // 1.x的父节点xp是红色的,这样就遇到两个红色节点相连的问题,所以必须经过旋转变换。
- // 2.x的祖父节点xpp不为空。
- // 判断如果父节点是否是祖父节点的左节点
- if (xp == (xppl = xpp.left))
- {
- // 父节点xp是祖父的左节点xppr
- // 判断祖父节点的右节点不为空并且是否是红色的
- // 此时xpp的左右节点都是红的,所以直接进行上面所说的第三种变换,将两个子节点变成黑色,将xpp变成红色,然后将红色节点x顺利的添加到了xp的后面。
- // 这里大家有疑问为什么将x = xpp?
- // 这是由于将xpp变成红色以后可能与xpp的父节点发生两个相连红色节点的冲突,这就又构成了第二种旋转变换,所以必须从底向上的进行变换,直到根。
- // 所以令x = xpp,然后进行下下一层循环,接着往上走。
- if ((xppr = xpp.right) != null && xppr.red)
- {
- xppr.red = false;
- xp.red = false;
- xpp.red = true;
- x = xpp;
- }
- // 进入到这个else里面说明。
- // 父节点xp是祖父的左节点xppr。
- // 祖父节点xpp的右节点xppr是黑色节点或者为空,默认规定空节点也是黑色的。
- // 下面要判断x是xp的左节点还是右节点。
- else
- {
- // x是xp的右节点,此时的结构是:xpp左->xp右->x。这明显是第二中变换需要进行两次旋转,这里先进行一次旋转。
- // 下面是第一次旋转。
- if (x == xp.right)
- {
- root = rotateLeft(root, x = xp);
- xpp = (xp = x.parent) == null ? null : xp.parent;
- }
- // 针对本身就是xpp左->xp左->x的结构或者由于上面的旋转造成的这种结构进行一次旋转。
- if (xp != null)
- {
- xp.red = false;
- if (xpp != null)
- {
- xpp.red = true;
- root = rotateRight(root, xpp);
- }
- }
- }
- }
- // 这里的分析方式和前面的相对称只不过全部在右测不再重复分析。
- else
- {
- if (xppl != null && xppl.red)
- {
- xppl.red = false;
- xp.red = false;
- xpp.red = true;
- x = xpp;
- } else
- {
- if (x == xp.left)
- {
- root = rotateRight(root, x = xp);
- xpp = (xp = x.parent) == null ? null : xp.parent;
- }
- if (xp != null)
- {
- xp.red = false;
- if (xpp != null)
- {
- xpp.red = true;
- root = rotateLeft(root, xpp);
- }
- }
- }
- }
- }
- }
x本身为根节点返回x。 x的父节点为黑色或者x的父节点是根节点直接返回不需要变换。 如若上述两个条件不满足的话,就要进行变换了,允许我再贴一点代码……没有代码分析起来很困难。
06 颜色变换
- if (xp == (xppl = xpp.left))
- {
- if ((xppr = xpp.right) != null && xppr.red)
- {
- xppr.red = false;
- xp.red = false;
- xpp.red = true;
- x = xpp;
- }
- }


07 两个核心旋转(左旋转和右旋转)
- // 一旦我们进入到这里就说明了两件是情
- // 1.x的父节点xp是红色的,这样就遇到两个红色节点相连的问题,所以必须经过旋转变换。
- // 2.x的祖父节点xpp不为空。
- // 判断如果父节点是否是祖父节点的左节点
- if (xp == (xppl = xpp.left))
- {
- if ((xppr = xpp.right) != null && xppr.red)
- {// ……
- }
- // 进入到这个else里面说明。
- // 父节点xp是祖父的左节点xppr。
- // 祖父节点xpp的右节点xppr是黑色节点或者为空,默认规定空节点也是黑色的。
- // 下面要判断x是xp的左节点还是右节点。
- else
- {
- // x是xp的右节点,此时的结构是:xpp左->xp右->x。这明显是第二中变换需要进行两次旋转,这里先进行一次旋转。
- // 下面是第一次旋转。
- if (x == xp.right)
- {
- root = rotateLeft(root, x = xp);
- xpp = (xp = x.parent) == null ? null : xp.parent;
- }
- // 针对本身就是xpp左->xp左->x的结构或者由于上面的旋转造成的这种结构进行一次旋转。
- if (xp != null)
- {
- xp.red = false;
- if (xpp != null)
- {
- xpp.red = true;
- root = rotateRight(root, xpp);
- }
- }
- }
- }

7.1 左旋转
- 1 static <K, V> TreeNode<K, V> rotateLeft(TreeNode<K, V> root, TreeNode<K, V> p)
- 2 {
- 3 // r:right,右节点。
- 4 // pp:parent parent,父节点的父节点。
- 5 // rl:right left,右节点的左节点。
- 6 TreeNode<K, V> r, pp, rl;
- 7 if (p != null && (r = p.right) != null)
- 8 {
- 9 if ((rl = p.right = r.left) != null)
- 10 rl.parent = p;
- 11 if ((pp = r.parent = p.parent) == null)
- 12 (root = r).red = false;
- 13 else if (pp.left == p)
- 14 pp.left = r;
- 15 else
- 16 pp.right = r;
- 17 r.left = p;
- 18 p.parent = r;
- 19 }
- 20 return root;
- 21 }

- 9 if ((rl = p.right = r.left) != null)
- 10 rl.parent = p;

- 11 if ((pp = r.parent = p.parent) == null)
- 12 (root = r).red = false;


- 13 else if (pp.left == p)
- 14 pp.left = r;

- 15 else
- 16 pp.right = r;
- 17 r.left = p;
- 18 p.parent = r;

- if (x == xp.right)
- {
- root = rotateLeft(root, x = xp);
- xpp = (xp = x.parent) == null ? null : xp.parent;
- }
- xpp = (xp = x.parent) == null ? null : xp.parent;

- if (xp != null)
- {
- xp.red = false;
- if (xpp != null)
- {
- xpp.red = true;
- root = rotateLeft(root, xpp);
- }
- }


由于我们在rotateLeft(root, xpp),传进来的是XXP所以下面的的旋转中实际上就是对XP和XXP执行了一次与上面的方向相反其他完全相同的旋转。
- static <K, V> TreeNode<K, V> rotateRight(TreeNode<K, V> root, TreeNode<K, V> p)
- {
- // l:left,左节点。
- // pp:parent parent,父节点的父节点。
- // lr:left right,左节点的右节点。
- TreeNode<K, V> l, pp, lr;
- if (p != null && (l = p.left) != null)
- {
- if ((lr = p.left = l.right) != null)
- lr.parent = p;
- if ((pp = l.parent = p.parent) == null)
- (root = l).red = false;
- else if (pp.right == p)
- pp.right = l;
- else
- pp.left = l;
- l.right = p;
- p.parent = l;
- }
- return root;
- }

- 9 if ((lr = p.left = l.right) != null)
- 0 lr.parent = p;

- 11 if ((pp = l.parent = p.parent) == null)
- 12 (root = l).red = false;

- 15 else
- 16 pp.left = l;

- 17 l.right = p;
- 18 p.parent = l;

08 疑问?


- static <K, V> TreeNode<K, V> balanceInsertion(TreeNode<K, V> root, TreeNode<K, V> x)
- {
- x.red = true;
- for (TreeNode<K, V> xp, xpp, xppl, xppr;;)
- {
- if ((xp = x.parent) == null)
- {
- x.red = false;
- return x;
- }
- else if (!xp.red || (xpp = xp.parent) == null)
- return root;
- if (xp == (xppl = xpp.left))
- {
- // 插入位置父节点在祖父节点的左边。
- }
- else
- {
- // 插入位置父节点在祖父节点的右边。
- }
- }
- }