2269678

最近有點忙，一直沒更新博客，繼續(xù)堅持下去。

一、背景

1. 什么是緩存無底洞問題：

Facebook的工作人員反應(yīng)2010年已達(dá)到3000個memcached節(jié)點，儲存數(shù)千G的緩存。
他們發(fā)現(xiàn)一個問題--memcached的連接效率下降了，于是添加memcached節(jié)點，添加完之后，并沒有好轉(zhuǎn)。稱為“無底洞”現(xiàn)象

2. 緩存無底洞產(chǎn)生的原因：

鍵值數(shù)據(jù)庫或者緩存系統(tǒng)，由于通常采用hash函數(shù)將key映射到對應(yīng)的實例，造成key的分布與業(yè)務(wù)無關(guān)，但是由于數(shù)據(jù)量、訪問量的需求，需要使用分布式后（無論是客戶端一致性哈性、redis-cluster、codis），批量操作比如批量獲取多個key(例如redis的mget操作)，通常需要從不同實例獲取key值，相比于單機(jī)批量操作只涉及到一次網(wǎng)絡(luò)操作，分布式批量操作會涉及到多次網(wǎng)絡(luò)io。

3. 無底洞問題帶來的危害：

(1) 客戶端一次批量操作會涉及多次網(wǎng)絡(luò)操作，也就意味著批量操作會隨著實例的增多，耗時會不斷增大。

(2) 服務(wù)端網(wǎng)絡(luò)連接次數(shù)變多，對實例的性能也有一定影響。

4. 結(jié)論：

用一句通俗的話總結(jié)：更多的機(jī)器不代表更多的性能，所謂“無底洞”就是說投入越多不一定產(chǎn)出越多。

分布式又是不可以避免的，因為我們的網(wǎng)站訪問量和數(shù)據(jù)量越來越大，一個實例根本坑不住，所以如何高效的在分布式緩存和存儲批量獲取數(shù)據(jù)是一個難點。

二、哈希存儲與順序存儲

在分布式存儲產(chǎn)品中，哈希存儲與順序存儲是兩種重要的數(shù)據(jù)存儲和分布方式，這兩種方式不同也直接決定了批量獲取數(shù)據(jù)的不同，所以這里需要對這兩種數(shù)據(jù)的分布式方式進(jìn)行簡要說明：

1. hash分布：

hash分布應(yīng)用于大部分key-value系統(tǒng)中，例如memcache, redis-cluster, twemproxy，即使像mysql在分庫分表時候，也經(jīng)常會用user%100這樣的方式。

hash分布的主要作用是將key均勻的分布到各個機(jī)器，所以它的一個特點就是數(shù)據(jù)分散度較高，實現(xiàn)方式通常是hash(key)得到的整數(shù)再和分布式節(jié)點的某臺機(jī)器做映射，以redis-cluster為例子：

問題：和業(yè)務(wù)沒什么關(guān)系，不支持范圍查詢。

2. 順序分布

3. 兩種分布方式的比較：

分布方式

特點

典型產(chǎn)品

哈希分布

數(shù)據(jù)分散度高
鍵值分布與業(yè)務(wù)無關(guān)
無法順序訪問
支持批量操作

一致性哈希memcache
redisCluster
其他緩存產(chǎn)品

順序分布

數(shù)據(jù)分散度易傾斜
鍵值分布與業(yè)務(wù)相關(guān)
可以順序訪問
支持批量操作

BigTable
Hbase

三、分布式緩存/存儲四種Mget解決方案

1. IO的優(yōu)化思路：

(1) 命令本身的效率：例如sql優(yōu)化，命令優(yōu)化

(2) 網(wǎng)絡(luò)次數(shù)：減少通信次數(shù)

(3) 降低接入成本:長連/連接池,NIO等。

(4) IO訪問合并:O(n)到O(1)過程:批量接口(mget),

2. 如果只考慮減少網(wǎng)絡(luò)次數(shù)的話，mget會有如下模型：

3. 四種解決方案：

(1).串行mget

將Mget操作(n個key)拆分為逐次執(zhí)行N次get操作, 很明顯這種操作時間復(fù)雜度較高，它的操作時間=n次網(wǎng)絡(luò)時間+n次命令時間，網(wǎng)絡(luò)次數(shù)是n，很顯然這種方案不是最優(yōu)的，但是足夠簡單。

(2). 串行IO

將Mget操作(n個key)，利用已知的hash函數(shù)算出key對應(yīng)的節(jié)點，這樣就可以得到一個這樣的關(guān)系：Map<node, somekeys>，也就是每個節(jié)點對應(yīng)的一些keys

它的操作時間=node次網(wǎng)絡(luò)時間+n次命令時間，網(wǎng)絡(luò)次數(shù)是node的個數(shù)，很明顯這種方案比第一種要好很多，但是如果節(jié)點數(shù)足夠多，還是有一定的性能問題。

(3). 并行IO

此方案是將方案（2）中的最后一步，改為多線程執(zhí)行，網(wǎng)絡(luò)次數(shù)雖然還是nodes.size()，但網(wǎng)絡(luò)時間變?yōu)閛(1)，但是這種方案會增加編程的復(fù)雜度。

它的操作時間=1次網(wǎng)絡(luò)時間+n次命令時間

(4). hash-tag實現(xiàn)。

第二節(jié)提到過，由于hash函數(shù)會造成key隨機(jī)分配到各個節(jié)點，那么有沒有一種方法能夠強(qiáng)制一些key到指定節(jié)點到指定的節(jié)點呢?

redis提供了這樣的功能，叫做hash-tag。什么意思呢？假如我們現(xiàn)在使用的是redis-cluster（10個redis節(jié)點組成），我們現(xiàn)在有1000個k-v，那么按照hash函數(shù)(crc16)規(guī)則，這1000個key會被打散到10個節(jié)點上，那么時間復(fù)雜度還是上述(1)~(3)

那么我們能不能像使用單機(jī)redis一樣，一次IO將所有的key取出來呢？hash-tag提供了這樣的功能，如果將上述的key改為如下，也就是用大括號括起來相同的內(nèi)容，那么這些key就會到指定的一個節(jié)點上。

例如：

Java代碼  
user1,user2,user3......user1000  
{user}1,{user}2,{user}3.......{user}1000  

例如下圖：它的操作時間=1次網(wǎng)絡(luò)時間+n次命令時間

3. 四種批量操作解決方案對比：

方案	優(yōu)點	缺點	網(wǎng)絡(luò)IO
串行mget	1.編程簡單 2.少量keys，性能滿足要求	大量keys請求延遲嚴(yán)重	o(keys)
串行IO	1.編程簡單 2.少量節(jié)點，性能滿足要求	大量node延遲嚴(yán)重	o(nodes)
并行IO	1.利用并行特性 2.延遲取決于最慢的節(jié)點	1.編程復(fù)雜 2.超時定位較難	o(max_slow(node))
hash tags	性能最高	1.tag-key業(yè)務(wù)維護(hù)成本較高 2.tag分布容易出現(xiàn)數(shù)據(jù)傾斜	o(1)

四、總結(jié)和建議

無底洞問題對資源和性能有一定影響，但是其實大部分系統(tǒng)不需要考慮這個問題，因為

1. 99%公司的數(shù)據(jù)和流量無法和facebook相比。

2. redis/memcache的分布式集群通常來講是按照項目組做隔離的，以我們經(jīng)驗來看一般不會超過50對主從。

所以這里只是提供了一種優(yōu)化的思路，開闊一下視野。

五、參考文獻(xiàn)

Facebook's Memcached Multiget Hole: More machines != More Capacity
Multiget的無底洞問題
再說memcache的multiget hole（無底洞）

posted on 2016-12-20 17:19 jinfeng_wang 閱讀(225) 評論(0) 編輯收藏所屬分類: 2016-REDIS

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關(guān)文章: 緩存系列文章--7.無底洞問題(multiget hole) 緩存系列文章--6.緩存雪崩問題緩存系列文章--5.緩存穿透問題緩存系列文章--4.緩存的粒度控制緩存系列文章--2.是否真的需要緩存？緩存系列文章--3.緩存常用更新策略對比(一致性)。緩存系列文章--1.緩存的一些基本常識 JedisCluster 源碼分析 redis cluster使用經(jīng)驗深入淺出Redis（三）高級特性：管道

jinfeng_wang

公告

常用鏈接

留言簿(40)

隨筆分類(592)

隨筆檔案(400)

Domestic

Foreign

搜索

積分與排名

最新評論

閱讀排行榜

評論排行榜

轉(zhuǎn)載請注明出處哈:http://carlosfu.iteye.com/blog/2269678

最近有點忙，一直沒更新博客，繼續(xù)堅持下去。