「源码学习」String 类

78 阅读1分钟

String的源码也看过N遍了,这个源码大家都能读得懂,本帖主要贴一下equals()和hashcode()方法。

public final class String

    implements java.io.Serializable, Comparable<String>, CharSequence {
   /** 用来保存字符串的字节数组 */
    private final char value[];

    /** 缓存字符串的hash值 */
    private int hash; // Default to 0

    /** use serialVersionUID from JDK 1.0.2 for interoperability */
    private static final long serialVersionUID = -6849794470754667710L;

    public boolean equals(Object anObject) {
        if (this == anObject) {
            return true;
        }
        if (anObject instanceof String) {
            String anotherString = (String)anObject;
            int n = value.length;
            if (n == anotherString.value.length) {
                char v1[] = value;
                char v2[] = anotherString.value;
                int i = 0;
                while (n-- != 0) {
                    if (v1[i] != v2[i])
                        return false;
                    i++;
                }
                return true;
            }
        }
        return false;
    }
   public int hashCode() {
        int h = hash;
        if (h == 0 && value.length > 0) {
            char val[] = value;

            for (int i = 0; i < value.length; i++) {
                h = 31 * h + val[i];
            }
            hash = h;
        }
        return h;
    }
}
  • Object的hashcode()是返回对象的内存地址编号,而equals()是比较内存地址是否相等。
  • 当重写equals()方法的时候,hashcode()也要被重写。
  • 按照一般情况来看,equals()相等的两个对象,hashcode()必须保持相等;equals()不相等的两个对象,hashcode()也可能相等。
  • 一个类作为HashMap的key,需要重写equals()和hashcode()方法。

为么计算hashcode选用31呢?

  1. 31 是一个奇质数,首先 hash 函数必须要选用质/素数,这个是被科学家论证过的 hash 函数减少冲突的一个理论。
  2. 如果设置为偶数的话会存在溢出的情况,导致信息丢失(因为使用偶数相当于使用了移位运算)。
  3. 可以兼顾到虚拟机的性能,虚拟机默认使用2<<5-1来得到很好的性能,且其是一个不大不小的质数,兼顾了性能和冲突率。