詳解equals()方法和hashCode()方法

2021-03-02 Java團長
前言

Java的基類Object提供了一些方法,其中equals()方法用於判斷兩個對象是否相等,hashCode()方法用於計算對象的哈希碼。equals()和hashCode()都不是final方法,都可以被重寫(overwrite)。

本文介紹了2種方法在使用和重寫時,一些需要注意的問題。

如果覺得文章對你有幫助,歡迎點讚或轉發。文章有疏漏之處,歡迎批評指正。

一、equal()方法

 Object類中equals()方法實現如下:

public boolean equals(Object obj) {    return (this == obj);}

通過該實現可以看出,Object類的實現採用了區分度最高的算法,即只要兩個對象不是同一個對象,那麼equals()一定返回false。

雖然我們在定義類時,可以重寫equals()方法,但是有一些注意事項;JDK中說明了實現equals()方法應該遵守的約定:

(1)自反性:x.equals(x)必須返回true。

(2)對稱性:x.equals(y)與y.equals(x)的返回值必須相等。

(3)傳遞性:x.equals(y)為true,y.equals(z)也為true,那麼x.equals(z)必須為true。

(4)一致性:如果對象x和y在equals()中使用的信息都沒有改變,那麼x.equals(y)值始終不變。

(5)非null:x不是null,y為null,則x.equals(y)必須為false。

二、hashCode()方法1、Object的hashCode()

Object類中hashCode()方法的聲明如下:

public native int hashCode();

可以看出,hashCode()是一個native方法,而且返回值類型是整形;實際上,該native方法將對象在內存中的地址作為哈希碼返回,可以保證不同對象的返回值不同。

與equals()方法類似,hashCode()方法可以被重寫。JDK中對hashCode()方法的作用,以及實現時的注意事項做了說明:

(1)hashCode()在哈希表中起作用,如java.util.HashMap。

(2)如果對象在equals()中使用的信息都沒有改變,那麼hashCode()值始終不變。

(3)如果兩個對象使用equals()方法判斷為相等,則hashCode()方法也應該相等。

(4)如果兩個對象使用equals()方法判斷為不相等,則不要求hashCode()也必須不相等;但是開發人員應該認識到,不相等的對象產生不相同的hashCode可以提高哈希表的性能。

2、hashCode()的作用

總的來說,hashCode()在哈希表中起作用,如HashSet、HashMap等。

當我們向哈希表(如HashSet、HashMap等)中添加對象object時,首先調用hashCode()方法計算object的哈希碼,通過哈希碼可以直接定位object在哈希表中的位置(一般是哈希碼對哈希表大小取餘)。如果該位置沒有對象,可以直接將object插入該位置;如果該位置有對象(可能有多個,通過鍊表實現),則調用equals()方法比較這些對象與object是否相等,如果相等,則不需要保存object;如果不相等,則將該對象加入到鍊表中。

這也就解釋了為什麼equals()相等,則hashCode()必須相等。如果兩個對象equals()相等,則它們在哈希表(如HashSet、HashMap等)中只應該出現一次;如果hashCode()不相等,那麼它們會被散列到哈希表的不同位置,哈希表中出現了不止一次。

實際上,在JVM中,加載的對象在內存中包括三部分:對象頭、實例數據、填充。其中,對象頭包括指向對象所屬類型的指針和MarkWord,而MarkWord中除了包含對象的GC分代年齡信息、加鎖狀態信息外,還包括了對象的hashcode;對象實例數據是對象真正存儲的有效信息;填充部分僅起到佔位符的作用, 原因是HotSpot要求對象起始地址必須是8位元組的整數倍。

三、String中equals()和hashCode()的實現

String類中相關實現代碼如下:

private final char value[];private int hash; public boolean equals(Object anObject) {    if (this == anObject) {        return true;    }    if (anObject instanceof String) {        String anotherString = (String)anObject;        int n = value.length;        if (n == anotherString.value.length) {            char v1[] = value;            char v2[] = anotherString.value;            int i = 0;            while (n-- != 0) {                if (v1[i] != v2[i])                    return false;                i++;            }            return true;        }    }    return false;}public int hashCode() {    int h = hash;    if (h == 0 && value.length > 0) {        char val[] = value;        for (int i = 0; i < value.length; i++) {            h = 31 * h + val[i];        }        hash = h;    }    return h;}

通過代碼可以看出以下幾點:

1、String的數據是final的,即一個String對象一旦創建,便不能修改;形如String s = "hello"; s = "world";的語句,當s = "world"執行時,並不是字符串對象的值變為了"world",而是新建了一個String對象,s引用指向了新對象。

2、String類將hashCode()的結果緩存為hash值,提高性能。

3、String對象equals()相等的條件是二者同為String對象,長度相同,且字符串值完全相同;不要求二者是同一個對象。

4、String的hashCode()計算公式為:s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]

關於hashCode()計算過程中,為什麼使用了數字31,主要有以下原因:

1、使用質數計算哈希碼,由於質數的特性,它與其他數字相乘之後,計算結果唯一的概率更大,哈希衝突的概率更小。

2、使用的質數越大,哈希衝突的概率越小,但是計算的速度也越慢;31是哈希衝突和性能的折中,實際上是實驗觀測的結果。

3、JVM會自動對31進行優化:31 * i == (i << 5) - i

 四、如何重寫hashCode()

本節先介紹重寫hashCode()方法應該遵守的原則,再介紹通用的hashCode()重寫方法。

1、重寫hashcode()的原則

通過前面的描述我們知道,重寫hashCode需要遵守以下原則:

(1)如果重寫了equals()方法,檢查條件「兩個對象使用equals()方法判斷為相等,則hashCode()方法也應該相等」是否成立,如果不成立,則重寫hashCode ()方法。

(2)hashCode()方法不能太過簡單,否則哈希衝突過多。

(3)hashCode()方法不能太過複雜,否則計算複雜度過高,影響性能。

2、hashCode()重寫方法

《Effective Java》中提出了一種簡單通用的hashCode算法
A、初始化一個整形變量,為此變量賦予一個非零的常數值,比如int result = 17;
B、選取equals方法中用於比較的所有域(之所以只選擇equals()中使用的域,是為了保證上述原則的第1條),然後針對每個域的屬性進行計算:
(1) 如果是boolean值,則計算f ? 1:0
(2) 如果是byte\char\short\int,則計算(int)f
(3) 如果是long值,則計算(int)(f ^ (f >>> 32))
(4) 如果是float值,則計算Float.floatToIntBits(f)
(5) 如果是double值,則計算Double.doubleToLongBits(f),然後返回的結果是long,再用規則(3)去處理long,得到int
(6) 如果是對象應用,如果equals方法中採取遞歸調用的比較方式,那麼hashCode中同樣採取遞歸調用hashCode的方式。否則需要為這個域計算一個範式,比如當這個域的值為null的時候,那麼hashCode 值為0
(7) 如果是數組,那麼需要為每個元素當做單獨的域來處理。java.util.Arrays.hashCode方法包含了8種基本類型數組和引用數組的hashCode計算,算法同上。 
C、最後,把每個域的散列碼合併到對象的哈希碼中。

下面通過一個例子進行說明。在該例中,Person類重寫了equals()方法和hashCode()方法。因為equals()方法中只使用了name域和age域,所以hashCode()方法中,也只計算name域和age域。

對於String類型的name域,直接使用了String的hashCode()方法;對於int類型的age域,直接用其值作為該域的hash。

public class Person {    private String name;    private int age;    private boolean gender;    public Person() {        super();    }    public String getName() {        return name;    }    public void setName(String name) {        this.name = name;    }    public int getAge() {        return age;    }    public void setAge(int age) {        this.age = age;    }    public boolean isGender() {        return gender;    }    public void setGender(boolean gender) {        this.gender = gender;    }    @Override    public boolean equals(Object another) {        if (this == another) {            return true;        }        if (another instanceof Person) {            Person anotherPerson = (Person) another;            if (this.getName().equals(anotherPerson.getName()) && this.getAge() == anotherPerson.getAge()) {                return true;            } else {                return false;            }        }        return false;    }    @Override    public int hashCode() {        int hash = 17;        hash = hash * 31 + getName().hashCode();        hash = hash * 31 + getAge();        return hash;    }}

Java團長

微信號:javatuanzhang

每日分享Java技術乾貨

長按識別二維碼

相關焦點

  • 乾貨 | 名企高頻考點-Java hashCode() 方法 和 equals() 方法
    在Java中存在兩個比較方法,分別是:hashCode() 方法 和 equals() 方法。為什麼我們有時候要重寫hashCode() 方法 和 equals() 方法?1. 你知道hashCode() 方法 和 equals() 方法嗎?當被面試官問到這個問題的時候,我們首先需要回答清楚兩個方法在沒有重寫之前,他們是如何工作的?
  • Java中重寫equals方法為什麼要重寫hashcode方法?
    所有對象都有equals方法,默認是Object類的equals,其結果與==一樣。如果希望比較對象的值相同,必須重寫equals方法。當equals方法被重寫時,通常有必要重寫hashCode方法,以維護hashCode方法的常規約定:值相同的對象必須有相同的hashCode。
  • 『Java系列文章』2、淺談equals()和hashcode()
    所有的對象,包括數組,都實現了Object類中的定義的方法equals()方法詳解equals() 方法是用來判斷其他的對象是否和該對象相等equals() 方法在object類中定義如下:public boolean equals(Object obj) { return (this == obj); }
  • 經典面試題:重寫equals方法時,為什麼必須重寫hashCode方法?
    取出數組中步驟1位置的元素,這個元素是一個鍊表結構,沿著鍊表一個個遍歷,遍歷的過程會判斷鍊表的當前節點的key是否和get方法傳入的key相等,判斷key是否相等是通過equals方法判斷的,若equals方法返回true了,表示元素找到了重新equals方法,未重寫hashCode方法會出現什麼結果?
  • 為什麼要重寫 hashcode 和 equals 方法?
    這裡講的理論知識並非無的放矢,大家能在後文裡清晰地了解到重寫hashCode方法的重要性。2. 為什麼要重寫equals和hashCode方法當我們用HashMap存入自定義的類時,如果不重寫這個自定義類的equals和hashCode方法,得到的結果會和我們預期的不一樣。我們來看WithoutHashCode.java這個例子。
  • 重寫equals()時為什麼要重寫hashcode
    重寫equals()方法時,為什麼要重寫hashcode方法?1.==和equals()的區別(1)== 是比較運算符,equals()是在Object中定義的一個方法。 map.get(手機1) ;   map.get(手機2) ; map.get()方法是先計算key的hashcode值,然後根據hashcode值在內存中匹配相應的value。而此時,我們並沒有重寫hashcode方法,因此此時手機1和手機2會繼承使用Object中定義的hashcode方法計算。
  • 面試官問我:hashcode 是什麼?和equals是兄弟嗎?
    秋招的時候還記得面試官問過我hashcode是什麼,對於int、long、string類型的hashcode有什麼區別,和equals一起是怎麼使用的,為什麼重寫hashcode的同時也要重寫equals。      八股文背多了,也只是會表面,有空的時候還是整理一下,順便寫了幾個例子加深下印象。hashcode 是什麼?
  • Java為什麼重寫equals一定要重寫hashCode?
    初步探索首先我們要了解equals方法是什麼,hashcode方法是什麼。equals方法equals 是java的obejct類的一個方法,equals的源碼如下:由此我們可以看到equals是用來比較兩個對象的內存地址是否相等。
  • 淺談Java中的hashcode方法
    此時hashCode方法的作用就體現出來了,當集合要添加新的對象時,先調用這個對象的hashCode方法,得到對應的hashcode值,實際上在HashMap的具體實現中會用一個table保存已經存進去的對象的hashcode值,如果table中沒有該hashcode值,它就可以直接存進去,不用再進行任何比較了;如果存在該hashcode值, 就調用它的equals方法與新元素進行比較,相同的話就不存了
  • Java面試題之為什麼要重寫hashcode( )和equals( )?
    好了,請看下題:為什麼要重寫hashcode( )和equals( )?打個比方,一個名叫張三的人去住酒店,在前臺登記完名字就去了99層100號房間,此時警察來前臺找叫張三的這個人住在哪間房,經過查詢,該酒店住宿的有50個叫張三的,需要遍歷查詢,查詢起來很不方便。
  • 淺談 Java 中的 hashcode 方法
    此時hashCode方法的作用就體現出來了,當集合要添加新的對象時,先調用這個對象的hashCode方法,得到對應的hashcode值,實際上在HashMap的具體實現中會用一個table保存已經存進去的對象的hashcode值,如果table中沒有該hashcode值,它就可以直接存進去,不用再進行任何比較了;如果存在該hashcode值, 就調用它的equals方法與新元素進行比較,相同的話就不存了
  • Object類中的equals和hashCode方法,你真的了解嗎?
    前言在Java中,equals和hashCode方法是Object中提供的兩個方法,這兩個方法對以後的學習有很大的幫助,本文就深度來去講解這兩個方法。多說一句,我們直接從JDK的文檔來去解釋。 這個方法返回true若且唯若x和y指向了同樣的對象(x==y),這句話也就是說明了在默認情況下,Object類中的equals方法默認比較的是對象的地址,因為只有是相同的地址才會相等(x == y),如果沒有重寫equals方法,那麼默認就是比較的是地址。
  • 「原創」不重寫equals和hashcode難道就不行嗎?
    本文轉載自【微信公眾號:java進階架構師,ID:java_jiagoushi】經微信公眾號授權轉載,如需轉載與原文作者聯繫究竟為什麼要重寫equals和hashcode???目錄1、equals()方法和hashCode()方法介紹1.1、equals()方法1.2、hashCode()方法
  • equals 和 hashCode 到底有什麼聯繫?一文告訴你!
    equals()和hashCode()都不是final方法,都可以被重寫(overwrite)。本文介紹了2種方法在使用和重寫時,一些需要注意的問題。通過該實現可以看出,Object類的實現採用了區分度最高的算法,即只要兩個對象不是同一個對象,那麼equals()一定返回false。
  • 不懂得hashcode的重要性,程序的性能會大打折扣
    第二種:自己重寫equals和hashcode,這就不一定了。這得看你自己怎麼寫hashcode了。既然提到自己重寫equals和hashcode,那我就需要遵守java的規則:equals必須滿足自反性、對稱性、傳遞性、一致性,對於任意不為null的引用值x,x.equals(null)返回false;如果兩個對象相同(equals方法返回true),那麼它們的hashCode值一定要相同,如果兩個對象的hashCode相同,它們並不一定相同。
  • Java hashCode() 方法深入理解
    Java.lang.Object 有一個hashCode()和一個equals()方法,這兩個方法在軟體設計中扮演著舉足輕重的角色。
  • hashCode和identityHashCode的區別你知道嗎?
    * The hash code for the null reference is zero.;identityHashCode和hashCode的區別是,identityHashCode會返回對象的hashCode,而不管對象是否重寫了hashCode方法。
  • java工程師必知必會的 hashcode 和 hash 算法!
    String 類型的 hashcode 方法為什麼大部分 hashcode 方法使用 31HashMap 的 hash 算法的實現原理(為什麼右移 16 位,為什麼要使用 ^ 位異或)HashMap 為什麼使用 & 與運算代替模運算?HashMap 的容量為什麼建議是 2 的冪次方?
  • 簡單的理解集合中的HashSet和HashTree幾個重寫方法
    Java中的set是無序的,但是是不可重複的HashSet底層是哈希表,通過調用hashcode和equals方法實現去重當我們HashSet裡面存的是字符串時,就能默認去重了,因為String已經重寫了hashcode和euqals方法public static void main(String[] args) {HashSet
  • String的hashCode方法不能濫用
    首先,需要理解一下hashCode方法的含義,以及知道不同String,調用hashCode方法返回的值可能是相同的,比如"Aa"和"BB"的hashCode方法返回的都是2112.這時如果用在這裡,就有問題了。我們再來看看String的hashCode方法源碼:1、為什麼有個常數31作為生成hashCode算法的一部分?