一. 緩存穿透 (請(qǐng)求數(shù)據(jù)緩存大量不命中): 緩存穿透是指查詢一個(gè)一定不存在的數(shù)據(jù),由于緩存不命中,并且出于容錯(cuò)考慮, 如果從存儲(chǔ)層查不到數(shù)據(jù)則不寫入緩存,這將導(dǎo)致這個(gè)不存在的數(shù)據(jù)每次請(qǐng)求都要到存儲(chǔ)層去查詢,失去了緩存的意義。
例如:下圖是一個(gè)比較典型的cache-storage架構(gòu),cache(例如memcache, redis等等) + storage(例如mysql, hbase等等)架構(gòu),查一個(gè)壓根就不存在的值, 如果不做兼容,永遠(yuǎn)會(huì)查詢storage。
二. 危害:
對(duì)底層數(shù)據(jù)源(mysql, hbase, http接口, rpc調(diào)用等等)壓力過大,有些底層數(shù)據(jù)源不具備高并發(fā)性。
例如mysql一般來說單臺(tái)能夠扛1000-QPS就已經(jīng)很不錯(cuò)了(別說你的查詢都是select * from table where id=xx 以及你的機(jī)器多么牛逼,那就有點(diǎn)矯情了)
例如他人提供的一個(gè)抗壓性很差的http接口,可能穿透會(huì)擊潰他的服務(wù)。
三. 如何發(fā)現(xiàn):
我們可以分別記錄cache命中數(shù), storage命中數(shù),以及總調(diào)用量,如果發(fā)現(xiàn)空命中(cache,storage都沒有命中)較多,可能就會(huì)在緩存穿透問題。
注意:緩存本身的命中率(例如redis中的info提供了類似數(shù)字,只代表緩存本身)不代表storage和業(yè)務(wù)的命中率。
四. 產(chǎn)生原因以及業(yè)務(wù)是否允許?
產(chǎn)生原因有很多:可能是代碼本身或者數(shù)據(jù)存在的問題造成的,也很有可能是一些惡意攻擊、爬蟲等等(因?yàn)閔ttp讀接口都是開放的)
業(yè)務(wù)是否允許:這個(gè)要看做的項(xiàng)目或者業(yè)務(wù)是否允許這種情況發(fā)生,比如做一些非實(shí)時(shí)的推薦系統(tǒng),假如新用戶來了,確實(shí)沒有他的推薦數(shù)據(jù)(推薦數(shù)據(jù)通常是根據(jù)歷史行為算出),這種業(yè)務(wù)是會(huì)發(fā)生穿透現(xiàn)象的,至于業(yè)務(wù)允不允許要具體問題具體分析了。
五. 解決方法:
解決思路大致有兩個(gè),如下表。下面將分別說明
解決緩存穿透 | 適用場(chǎng)景 | 維護(hù)成本 |
緩存空對(duì)象 | 1. 數(shù)據(jù)命中不高 2. 數(shù)據(jù)頻繁變化實(shí)時(shí)性高 | 1.代碼維護(hù)簡(jiǎn)單 2.需要過多的緩存空間 3. 數(shù)據(jù)不一致 |
bloomfilter或者壓縮filter提前攔截 | 1. 數(shù)據(jù)命中不高 2. 數(shù)據(jù)相對(duì)固定實(shí)時(shí)性低 | 1.代碼維護(hù)復(fù)雜 2.緩存空間占用少 |
1. 緩存空對(duì)象
(1). 定義:如上圖所示,當(dāng)?shù)?#9313;步MISS后,仍然將空對(duì)象保留到Cache中(可能是保留幾分鐘或者一段時(shí)間,具體問題具體分析),下次新的Request(同一個(gè)key)將會(huì)從Cache中獲取到數(shù)據(jù),保護(hù)了后端的Storage。
(2) 適用場(chǎng)景:數(shù)據(jù)命中不高,數(shù)據(jù)頻繁變化實(shí)時(shí)性高(一些亂轉(zhuǎn)業(yè)務(wù))
(3) 維護(hù)成本:代碼比較簡(jiǎn)單,但是有兩個(gè)問題:
第一是空值做了緩存,意味著緩存系統(tǒng)中存了更多的key-value,也就是需要更多空間(有人說空值沒多少,但是架不住多啊),解決方法是我們可以設(shè)置一個(gè)較短的過期時(shí)間。
第二是數(shù)據(jù)會(huì)有一段時(shí)間窗口的不一致,假如,Cache設(shè)置了5分鐘過期,此時(shí)Storage確實(shí)有了這個(gè)數(shù)據(jù)的值,那此段時(shí)間就會(huì)出現(xiàn)數(shù)據(jù)不一致,解決方法是我們可以利用消息或者其他方式,清除掉Cache中的數(shù)據(jù)。
(4) 偽代碼:
Java代碼

- package com.carlosfu.service;
-
- import org.apache.commons.lang.StringUtils;
-
- import com.carlosfu.cache.Cache;
- import com.carlosfu.storage.Storage;
-
- /**
- * 某服務(wù)
- *
- * @author carlosfu
- * @Date 2015-10-11
- * @Time 下午6:28:46
- */
- public class XXXService {
-
- /**
- * 緩存
- */
- private Cache cache = new Cache();
-
- /**
- * 存儲(chǔ)
- */
- private Storage storage = new Storage();
-
- /**
- * 模擬正常模式
- * @param key
- * @return
- */
- public String getNormal(String key) {
- // 從緩存中獲取數(shù)據(jù)
- String cacheValue = cache.get(key);
- // 緩存為空
- if (StringUtils.isBlank(cacheValue)) {
- // 從存儲(chǔ)中獲取
- String storageValue = storage.get(key);
- // 如果存儲(chǔ)數(shù)據(jù)不為空,將存儲(chǔ)的值設(shè)置到緩存
- if (StringUtils.isNotBlank(storageValue)) {
- cache.set(key, storageValue);
- }
- return storageValue;
- } else {
- // 緩存非空
- return cacheValue;
- }
- }
-
-
- /**
- * 模擬防穿透模式
- * @param key
- * @return
- */
- public String getPassThrough(String key) {
- // 從緩存中獲取數(shù)據(jù)
- String cacheValue = cache.get(key);
- // 緩存為空
- if (StringUtils.isBlank(cacheValue)) {
- // 從存儲(chǔ)中獲取
- String storageValue = storage.get(key);
- cache.set(key, storageValue);
- // 如果存儲(chǔ)數(shù)據(jù)為空,需要設(shè)置一個(gè)過期時(shí)間(300秒)
- if (StringUtils.isBlank(storageValue)) {
- cache.expire(key, 60 * 5);
- }
- return storageValue;
- } else {
- // 緩存非空
- return cacheValue;
- }
- }
-
- }
2. bloomfilter或者壓縮filter(bitmap等等)提前攔截
(1). 定義:如上圖所示,在訪問所有資源(cache, storage)之前,將存在的key用布隆過濾器提前保存起來,做第一層攔截, 例如: 我們的推薦服務(wù)有4億個(gè)用戶uid, 我們會(huì)根據(jù)用戶的歷史行為進(jìn)行推薦(非實(shí)時(shí)),所有的用戶推薦數(shù)據(jù)放到hbase中,但是每天有許多新用戶來到網(wǎng)站,這些用戶在當(dāng)天的訪問就會(huì)穿透到hbase。為此我們每天4點(diǎn)對(duì)所有uid做一份布隆過濾器。如果布隆過濾器認(rèn)為uid不存在,那么就不會(huì)訪問hbase,在一定程度保護(hù)了hbase(減少30%左右)。
注:有關(guān)布隆過濾器的相關(guān)知識(shí),請(qǐng)自行查閱,有關(guān)guava中如何使用布隆過濾器,之后會(huì)系列文章給大家介紹。
(2) 適用場(chǎng)景:數(shù)據(jù)命中不高,數(shù)據(jù)相對(duì)固定實(shí)時(shí)性低(通常是數(shù)據(jù)集較大)
(3) 維護(hù)成本:代碼維護(hù)復(fù)雜, 緩存空間占用少
第一是空值做了緩存,意味著緩存系統(tǒng)中存了更多的key-value,也就是需要更多空間(有人說空值沒多少,但是架不住多啊),解決方法是我們可以設(shè)置一個(gè)較短的過期時(shí)間。
第二是數(shù)據(jù)會(huì)有一段時(shí)間窗口的不一致,假如,Cache設(shè)置了5分鐘過期,此時(shí)Storage確實(shí)有了這個(gè)數(shù)據(jù)的值,那此段時(shí)間就會(huì)出現(xiàn)數(shù)據(jù)不一致,解決方法是我們可以利用消息或者其他方式,清除掉Cache中的數(shù)據(jù)。
六、參考資料:
附圖一張,單機(jī)負(fù)載,哈哈: