作者:wagslane
譯者:火火醬
出品:區塊鏈大本營
本文對哈希函數進行簡要的介紹,旨在幫助讀者理解為什麼要使用哈希函數,以及其基本工作原理。文中將省略具體證明和實現細節,而將重點放在高級原理上。
為什麼要使用哈希函數
哈希函數被廣泛應用於網際網路的各個方面,主要用於安全存儲密碼、查找備份記錄、快速存儲和檢索數據等等。例如,Qvault使用哈希散列將主密碼擴展為私人加密密鑰。
(Qvault:https://qvault.io/)
用途列表清單詳見: https://en.wikipedia.or/wiki/Hash_function#Uses
本文將重點介紹哈希函數的幾個重要特性,也可以說是其最重要的特性:
哈希函數確定性地加擾數據;無論輸入是什麼,哈希函數的輸出大小始終相同;無法從加擾的數據中檢索原始數據(單向函數);確定性地加擾數據
首先,想像一個魔方。
我們從恢復魔方開始。如果我們隨機轉動魔方,到最後,魔方將會呈現和開始時完全不同的狀態。同樣,如果我們重新開始,重複完全相同的動作,那麼我們會不斷得到完全相同的結果。儘管看起來結果可能是隨機產生的,但實質上並非如此。這就是「確定性」的意思。
「確定性」在安全存儲密碼方面起著至關重要的作用。例如,假設我的密碼是「iLoveBitcoin」。我可以使用哈希函數對其進行加擾:
iLoveBitcoin→ 「2f5sfsdfs5s1fsfsdf98ss4f84sfs6d5fs2d1fdf15」
現在,如果有人看到這個加擾後的版本,他們也不會知道我的原始密碼!這一點非常重要,因為這意味著,作為一名網站開發人員,我只需存儲用戶密碼的哈希散列(加擾數據),即可對其進行驗證。
當用戶進行註冊時,我對密碼進行哈希散列處理,並將其存儲在資料庫中。當用戶登錄時,我只需再次對輸入的內容進行哈希散列處理,並比較兩個哈希值。由於特定的輸入始終會輸出相同的哈希值,所以該方法每次都可以成功驗證密碼。
如果網站以純文本格式存儲密碼的話,則會出現巨大的安全漏洞。如果有人入侵該網站,那麼他將會能獲取所有的電子郵件和密碼,並可以嘗試在其他網站上使用這些信息進行登錄。
無論輸入是什麼,輸出大小始終相同
如果對單個單詞進行哈希,則輸出將是特定的大小(對於特定的哈希函數SHA-256來說,其大小是256 bits)。如果對一本書進行哈希,其輸出也將是相同的大小。
這是其另一個重要特性,因為這可以節省我們的計算時間。典型的例子是在數據映射(data map)中使用哈希散列作為鍵(key)。數據映射是計算機科學中用來存儲數據的簡單結構。
當程序在映射中存儲數據時,會向映射提供鍵(key)和值(value)。當程序想要訪問該值時,它可以向映射提供適當的鍵並接收相應的值。數據映射的優勢在於它們可以立即找到數據。該鍵被用作計算機能夠立即找到的地址,這樣一來,就不必花費數小時在數百萬條記錄中進行搜索了。
因為鍵就像地址一樣,不能太大。如果想將書籍存儲在數據映射中,則可以對書籍的內容進行哈希散列處理,並使用哈希值作為鍵。作為一名程式設計師,我可以輕而易舉地使用哈希散列來查找該書的內容,而不必按標題、作者等對數千條記錄進行排序。
其工作原理是怎樣的呢?
這部分是本文的難點,我會儘量將其簡化,省略實際的實現細節,重點介紹計算機在使用哈希散列處理數據時工作原理的基本概念。
下面讓我們來看一下我為此專門編寫的一個算法——LANEHASH:
我們從要進行哈希散列的數據開始
我把字母和數字轉換成1和0 (計算機中的所有數據都以1和0的形式進行存儲,不同的1和0的組合代表了不同的字母)
此時,我們通過各種預設的步驟對數據進行轉換。步驟內容可以是任意的,但重要的是,每次使用LANEHASH時,我們都需要遵循相同的步驟,以便我們的算法具有確定性。我們將前4位從左側移到右側:
每隔1 位(bit)進行間隔:
我們把這兩部分轉換為以十進位的數字。十進位是我們在學校中學過的「正常的」數字系統。(所有的二進位數據實際上都是數字,你可以在其他網站上在線查詢如何將二進位轉換為十進位數字)
我們將這兩個數字相乘:
然後對該數進行平方:
再將該數字轉換回二進位:
從右側切掉9 bits後正好得到16 bits:
然後將該二進位數據轉換回英語:
如上所示,如果輸入相同,那麼最後終將會得到相同的輸出結果。但是,如果改變任何一個字母,最終的結果也將發生巨大變化。免責聲明:
在我將英語轉換成二進位,並將二進位轉換成英語的步驟中,並沒有遵循任何模式。有許多不同的方法可以將二進位數據轉換成英語並轉換回去,我只是不想在本文中展開討論這個問題。感興趣的話,你可以通過以下連結進行了解:
https://en.wikipedia.org/wiki/ASCII
https://en.wikipedia.org/wiki/Unicode原文:https://hackernoon.com/a-very-basic-intro-to-hash-functions-sha-256-md-5-etc-21wp24jk