作者 | 代號[K]
責編 | Carol
來源 | CSDN 博客
Hash,一般翻譯做散列、雜湊,或音譯為哈希,是把任意長度的輸入(又叫做預映射pre-image)通過散列算法變換成固定長度的輸出,該輸出就是散列值。
今天我們就一起來探索一下,哈希最底層的奧秘。
哈希概念構造一種儲存結構,通過某種函數,使得其元素的儲存位置與他的關鍵碼之間能夠建立一一映射關係,那麼在查找時通過該函數很快找到相應元素。簡言之,就是設定某一固定函數(hashFunc),通過此函數來使插入元素的值與元素位置相對應,往後我們需要查找此元素時就可以通過此函數(hashFunc)找到該值。哈希函數散列函數(英語:Hash function)又稱散列算法、哈希函數,是一種從任何一種數據中創建小的數字「指紋」的方法。散列函數把消息或數據壓縮成摘要,使得數據量變小,將數據的格式固定下來。
該函數將數據打亂混合,重新創建一個叫做散列值(hash values,hash codes,hash sums,或hashes)的指紋。散列值通常用一個短的隨機字母和數字組成的字符串來代表。
哈希函數使得計算出來的地址均勻分布在整個空間。
插入及搜索元素根據待插入元素的關鍵碼,根據哈希函數計算出其存儲位置。例: 現有 1 ,3,4,5,6,9幾個數進行儲存,將n%10求模運算的結果作為哈希地址進行元素插入。若想查找某一元素時,則只需要對查找元素進行哈希函數運算,得到其存放地址,就能找到該元素。
哈希衝突當出現插入一個元素,其根據哈希函數計算出的地址,已經被其他元素佔用的情況稱為哈希衝突。
為了能更好的識別當前位置是否被佔用,我們需要對每個位置進行標記
enum state{EMPTY,FULL,DELETE};注意:如果我們要刪除某一元素時,不能將其直接刪除,如果直接刪除,會對當前結構產生影響,導致其他元素的搜索出錯,所以當我們要刪除一個元素時,需要將其標記為刪除,而非空。
開散列開散列又稱鏈地址法,首先對關鍵碼集合用哈希函數計算哈希地址,當具有相同地址的關鍵碼時,將所有同一地址的元素,通過單鍊表的形式連結起來,而各鍊表的頭結點存儲在哈希表中。
這下,你該了解哈希的思想和哈希表構造了吧?歡迎在評論區和我們分享你的想法!
《原力計劃【第二季】- 學習力挑戰》正式開始!
即日起至 3月21日,千萬流量支持原創作者,更有專屬【勳章】等你來挑戰