<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    jinfeng_wang

    G-G-S,D-D-U!

    BlogJava 首頁 新隨筆 聯(lián)系 聚合 管理
      400 Posts :: 0 Stories :: 296 Comments :: 0 Trackbacks

     轉(zhuǎn)載請注明出處哈:http://carlosfu.iteye.com/blog/2269678


      最近有點忙,一直沒更新博客,繼續(xù)堅持下去。大笑

     

    一、背景 

      1. 什么是緩存無底洞問題:

    Facebook的工作人員反應(yīng)2010年已達(dá)到3000個memcached節(jié)點,儲存數(shù)千G的緩存。
    他們發(fā)現(xiàn)一個問題--memcached的連接效率下降了,于是添加memcached節(jié)點,添加完之后,并沒有好轉(zhuǎn)。稱為“無底洞”現(xiàn)象

          

     2. 緩存無底洞產(chǎn)生的原因:

       鍵值數(shù)據(jù)庫或者緩存系統(tǒng),由于通常采用hash函數(shù)將key映射到對應(yīng)的實例,造成key的分布與業(yè)務(wù)無關(guān),但是由于數(shù)據(jù)量、訪問量的需求,需要使用分布式后(無論是客戶端一致性哈性、redis-cluster、codis),批量操作比如批量獲取多個key(例如redis的mget操作),通常需要從不同實例獲取key值,相比于單機(jī)批量操作只涉及到一次網(wǎng)絡(luò)操作,分布式批量操作會涉及到多次網(wǎng)絡(luò)io。

        

        

        

     

    3. 無底洞問題帶來的危害:

      (1) 客戶端一次批量操作會涉及多次網(wǎng)絡(luò)操作,也就意味著批量操作會隨著實例的增多,耗時會不斷增大。

      (2) 服務(wù)端網(wǎng)絡(luò)連接次數(shù)變多,對實例的性能也有一定影響。

     
    4. 結(jié)論:

      用一句通俗的話總結(jié):更多的機(jī)器不代表更多的性能,所謂“無底洞”就是說投入越多不一定產(chǎn)出越多。

      分布式又是不可以避免的,因為我們的網(wǎng)站訪問量和數(shù)據(jù)量越來越大,一個實例根本坑不住,所以如何高效的在分布式緩存和存儲批量獲取數(shù)據(jù)是一個難點。

     

    二、哈希存儲與順序存儲

       在分布式存儲產(chǎn)品中,哈希存儲與順序存儲是兩種重要的數(shù)據(jù)存儲和分布方式,這兩種方式不同也直接決定了批量獲取數(shù)據(jù)的不同,所以這里需要對這兩種數(shù)據(jù)的分布式方式進(jìn)行簡要說明:

       1. hash分布:

       hash分布應(yīng)用于大部分key-value系統(tǒng)中,例如memcache, redis-cluster, twemproxy,即使像mysql在分庫分表時候,也經(jīng)常會用user%100這樣的方式。

       hash分布的主要作用是將key均勻的分布到各個機(jī)器,所以它的一個特點就是數(shù)據(jù)分散度較高,實現(xiàn)方式通常是hash(key)得到的整數(shù)再和分布式節(jié)點的某臺機(jī)器做映射,以redis-cluster為例子:

        

       問題:和業(yè)務(wù)沒什么關(guān)系,不支持范圍查詢。

      2. 順序分布

      

     

     3. 兩種分布方式的比較:

    分布方式特點典型產(chǎn)品
    哈希分布

    1. 數(shù)據(jù)分散度高

    2.鍵值分布與業(yè)務(wù)無關(guān)

    3.無法順序訪問

    4.支持批量操作

    一致性哈希memcache

    redisCluster

    其他緩存產(chǎn)品

    順序分布

    1.數(shù)據(jù)分散度易傾斜

    2.鍵值分布與業(yè)務(wù)相關(guān)

    3.可以順序訪問

    4.支持批量操作

    BigTable

    Hbase

     

     

     

    三、分布式緩存/存儲四種Mget解決方案

     

    1. IO的優(yōu)化思路:

      (1) 命令本身的效率:例如sql優(yōu)化,命令優(yōu)化

      (2) 網(wǎng)絡(luò)次數(shù):減少通信次數(shù)

      (3) 降低接入成本:長連/連接池,NIO等。

      (4) IO訪問合并:O(n)到O(1)過程:批量接口(mget),

     

    2.  如果只考慮減少網(wǎng)絡(luò)次數(shù)的話,mget會有如下模型

     

     

    3. 四種解決方案:

    (1).串行mget

    將Mget操作(n個key)拆分為逐次執(zhí)行N次get操作, 很明顯這種操作時間復(fù)雜度較高,它的操作時間=n次網(wǎng)絡(luò)時間+n次命令時間,網(wǎng)絡(luò)次數(shù)是n,很顯然這種方案不是最優(yōu)的,但是足夠簡單。

     

     

    (2). 串行IO

        將Mget操作(n個key),利用已知的hash函數(shù)算出key對應(yīng)的節(jié)點,這樣就可以得到一個這樣的關(guān)系:Map<node, somekeys>,也就是每個節(jié)點對應(yīng)的一些keys

        它的操作時間=node次網(wǎng)絡(luò)時間+n次命令時間,網(wǎng)絡(luò)次數(shù)是node的個數(shù),很明顯這種方案比第一種要好很多,但是如果節(jié)點數(shù)足夠多,還是有一定的性能問題。

     

     

    (3). 并行IO

       此方案是將方案(2)中的最后一步,改為多線程執(zhí)行,網(wǎng)絡(luò)次數(shù)雖然還是nodes.size(),但網(wǎng)絡(luò)時間變?yōu)閛(1),但是這種方案會增加編程的復(fù)雜度。

       它的操作時間=1次網(wǎng)絡(luò)時間+n次命令時間

     

     

    (4). hash-tag實現(xiàn)。

        第二節(jié)提到過,由于hash函數(shù)會造成key隨機(jī)分配到各個節(jié)點,那么有沒有一種方法能夠強(qiáng)制一些key到指定節(jié)點到指定的節(jié)點呢?

        redis提供了這樣的功能,叫做hash-tag。什么意思呢?假如我們現(xiàn)在使用的是redis-cluster(10個redis節(jié)點組成),我們現(xiàn)在有1000個k-v,那么按照hash函數(shù)(crc16)規(guī)則,這1000個key會被打散到10個節(jié)點上,那么時間復(fù)雜度還是上述(1)~(3)

          

        那么我們能不能像使用單機(jī)redis一樣,一次IO將所有的key取出來呢?hash-tag提供了這樣的功能,如果將上述的key改為如下,也就是用大括號括起來相同的內(nèi)容,那么這些key就會到指定的一個節(jié)點上。

       例如:

        

       

    Java代碼  收藏代碼
    1. user1,user2,user3......user1000  
    2. {user}1,{user}2,{user}3.......{user}1000  

     

     

     

    例如下圖:它的操作時間=1次網(wǎng)絡(luò)時間+n次命令時間

     

     

    3. 四種批量操作解決方案對比:

    方案優(yōu)點缺點網(wǎng)絡(luò)IO
    串行mget

    1.編程簡單

    2.少量keys,性能滿足要求

    大量keys請求延遲嚴(yán)重o(keys)
    串行IO

    1.編程簡單

    2.少量節(jié)點,性能滿足要求

    大量node延遲嚴(yán)重

    o(nodes)
    并行IO

    1.利用并行特性

    2.延遲取決于最慢的節(jié)點

    1.編程復(fù)雜

    2.超時定位較難

    o(max_slow(node))
    hash tags性能最高

    1.tag-key業(yè)務(wù)維護(hù)成本較高

    2.tag分布容易出現(xiàn)數(shù)據(jù)傾斜

    o(1)

     

     

     

     

    四、總結(jié)和建議

     

        無底洞問題對資源和性能有一定影響,但是其實大部分系統(tǒng)不需要考慮這個問題,因為

        1. 99%公司的數(shù)據(jù)和流量無法和facebook相比。

        2. redis/memcache的分布式集群通常來講是按照項目組做隔離的,以我們經(jīng)驗來看一般不會超過50對主從。   

        所以這里只是提供了一種優(yōu)化的思路,開闊一下視野。

        

     

    五、參考文獻(xiàn)

    1. Facebook's Memcached Multiget Hole: More machines != More Capacity  
    2. Multiget的無底洞問題
    3. 再說memcache的multiget hole(無底洞)
    posted on 2016-12-20 17:19 jinfeng_wang 閱讀(225) 評論(0)  編輯  收藏 所屬分類: 2016-REDIS
    主站蜘蛛池模板: 亚洲伊人久久综合中文成人网| 九九免费久久这里有精品23| 久久99国产亚洲高清观看首页| 最近中文字幕免费mv视频8| 玖玖在线免费视频| 污视频网站免费观看| 亚洲乱码一二三四区乱码| 亚洲AV日韩精品久久久久| 亚洲免费在线观看| 免费无码又爽又刺激高潮| 麻豆一区二区免费播放网站| 国产高清不卡免费视频| 免费看黄的成人APP| 国产高清对白在线观看免费91| 香蕉视频亚洲一级| 亚洲乱人伦中文字幕无码| 中文字幕 亚洲 有码 在线| 亚洲日韩国产精品无码av| 亚洲视频一区在线播放| 亚洲国产精品第一区二区| 久久久久久亚洲精品中文字幕| 337p日本欧洲亚洲大胆裸体艺术| 免费人成网站在线高清| 国产精品自在自线免费观看| 国产精品久久免费视频| 国产午夜鲁丝片AV无码免费| 日本一区免费电影| 国产jizzjizz视频免费看| 国产成人免费A在线视频| 国产精品成人无码免费| 国产精品美女自在线观看免费| 国产精品另类激情久久久免费| 免费无码又爽又刺激高潮| 在线日韩av永久免费观看| 日韩免费视频播放| 免费精品国产自产拍观看| 亚洲不卡AV影片在线播放| 亚洲区小说区图片区| 亚洲人成网亚洲欧洲无码久久| 亚洲综合精品香蕉久久网| 久久久影院亚洲精品|