HASH 主要用于信息安全領域中加密算法,它把一些不同長度的信息轉化成雜亂的128 位的編碼, 這些編碼值叫做HASH 值. 也可以說,hash 就是找到一種數據內容和數據存放地址之間的映射關系
例如字符串 hello 的哈希算法
char* value = "hello"; int key = (((((((27* (int)'h'+27)* (int)'e') + 27) * (int)'l') + 27) * (int)'l' +27) * 27 ) + (int)'o' ;。
數組的特點是:尋址容易,插入和刪除困難;而鏈表的特點是:尋址困難,插入和刪除容易。那么我們能不能綜合兩者的特性,做出一種尋址容易,插入刪除也容易 的數據結構?答案是肯定的,這就是我們要提起的哈希表,哈希表有多種不同的實現方法,我接下來解釋的是最常用的一種方法—— 拉鏈法,我們可以理解為“ 鏈表 的數組” ,如圖:

HashMap其實也是一個線性的數組實現的,所以可以理解為其存儲數據的容器就是一個線性數組。這可能讓我們很不解,一個線性的數組怎么實現按鍵值對來存取數據呢?這里HashMap有做一些處理。
1.首先HashMap里面實現一個靜態內部類Entry 其重要的屬性有 key , value, next,從屬性key,value我們就能很明顯的看出來Entry就是HashMap鍵值對實現的一個基礎bean,我們上面說到HashMap的基 礎就是一個線性數組,這個數組就是Entry[],Map里面的內容都保存在Entry[]里面。
2.既然是線性數組,為什么能隨機存取?這里HashMap用了一個小算法,大致是這樣實現:
Java代碼

- 存儲時:
-
- int hash = key.hashCode();--> 這個hashCode方法這里不詳述,只要理解每個key的hash是一個固定的int值
-
- int index = hash % Entry[].length;
-
- Entry[index] = value;
-
- 取值時:
-
- int hash = key.hashCode();
-
- int index = hash % Entry[].length;
-
- return Entry[index]
到這里我們輕松的理解了HashMap通過鍵值對實現存取的基本原理
3.疑問:如果兩個key通過hash % Entry[].length得到的index相同,會不會有覆蓋的危險?
這里HashMap里面用到鏈式數據結構的一個概念.上面我們提到過Entry類里面有一個next屬性,作用是指向下一個Entry。打個比方, 第一個鍵值對A進來,通過計算其key的hash得到的index=0,記做:Entry[0] = A.一會后又進來一個鍵值對B,通過計算其index也等于0,現在怎么辦?HashMap會這樣做:B.next = A,Entry[0] = B,如果又進來C,index也等于0,那么C.next = B,Entry[0] = C;這樣我們發現index=0的地方其實存取了A,B,C三個鍵值對,他們通過next這個屬性鏈接在一起。所以疑問不用擔心。
到這里為止,HashMap的大致實現,我們應該已經清楚了。
當然HashMap里面也包含一些優化方面的實現,這里也啰嗦一下。
比如:Entry[]的長度一定后,隨著map里面數據的越來越長,這樣同一個index的鏈就會很長,會不會影響性能?
HashMap里面設置一個因素(也稱為因子),隨著map的size越來越大,Entry[]會以一定的規則加長長度。
解決hash沖突的辦法
1)開放定址法(線性探測再散列,二次探測再散列,偽隨機探測再散列)
2)再哈希法
3)鏈地址法
4)建立一 公共溢出區
java 中hashmap的解決辦法就是采用的鏈地址法
轉載文章