亚洲成在人天堂在线,亚洲精品无码久久毛片波多野吉衣,精品久久久久久亚洲综合网

作者:charlee 來源:idv2.com 時間:2008-09-28 閱讀:48 次原文鏈接 [收藏]

發(fā)表日：2008/7/23
作者：長野雅廣(Masahiro Nagano)
原文鏈接：http://gihyo.jp/dev/feature/01/memcached/0004

我是Mixi的長野。第2次、第3次由前坂介紹了memcached的內(nèi)部情況。本次不再介紹memcached的內(nèi)部結構，開始介紹memcached的分布式。

memcached的分布式

正如第1次中介紹的那樣， memcached雖然稱為“分布式”緩存服務器，但服務器端并沒有“分布式”功能。服務器端僅包括第2次、第3次前坂介紹的內(nèi)存存儲功能，其實現(xiàn)非常簡單。至于memcached的分布式，則是完全由客戶端程序庫實現(xiàn)的。這種分布式是memcached的最大特點。

memcached的分布式是什么意思？

這里多次使用了“分布式”這個詞，但并未做詳細解釋。現(xiàn)在開始簡單地介紹一下其原理，各個客戶端的實現(xiàn)基本相同。

下面假設memcached服務器有node1～node3三臺，應用程序要保存鍵名為“tokyo”“kanagawa”“chiba”“saitama”“gunma” 的數(shù)據(jù)。

圖1 分布式簡介：準備

首先向memcached中添加“tokyo”。將“tokyo”傳給客戶端程序庫后，客戶端實現(xiàn)的算法就會根據(jù)“鍵”來決定保存數(shù)據(jù)的memcached服務器。服務器選定后，即命令它保存“tokyo”及其值。

圖2 分布式簡介：添加時

同樣，“kanagawa”“chiba”“saitama”“gunma”都是先選擇服務器再保存。

接下來獲取保存的數(shù)據(jù)。獲取時也要將要獲取的鍵“tokyo”傳遞給函數(shù)庫。函數(shù)庫通過與數(shù)據(jù)保存時相同的算法，根據(jù)“鍵”選擇服務器。使用的算法相同，就能選中與保存時相同的服務器，然后發(fā)送get命令。只要數(shù)據(jù)沒有因為某些原因被刪除，就能獲得保存的值。

圖3 分布式簡介：獲取時

這樣，將不同的鍵保存到不同的服務器上，就實現(xiàn)了memcached的分布式。 memcached服務器增多后，鍵就會分散，即使一臺memcached服務器發(fā)生故障無法連接，也不會影響其他的緩存，系統(tǒng)依然能繼續(xù)運行。

接下來介紹第1次中提到的Perl客戶端函數(shù)庫Cache::Memcached實現(xiàn)的分布式方法。

Cache::Memcached的分布式方法

Perl的memcached客戶端函數(shù)庫Cache::Memcached是 memcached的作者Brad Fitzpatrick的作品，可以說是原裝的函數(shù)庫了。

Cache::Memcached - search.cpan.org

該函數(shù)庫實現(xiàn)了分布式功能，是memcached標準的分布式方法。

根據(jù)余數(shù)計算分散

Cache::Memcached的分布式方法簡單來說，就是“根據(jù)服務器臺數(shù)的余數(shù)進行分散”。求得鍵的整數(shù)哈希值，再除以服務器臺數(shù)，根據(jù)其余數(shù)來選擇服務器。

下面將Cache::Memcached簡化成以下的Perl腳本來進行說明。

use strict;

use warnings;

use String::CRC32;



my @nodes = ('node1','node2','node3');

my @keys = ('tokyo', 'kanagawa', 'chiba', 'saitama', 'gunma');



foreach my $key (@keys) {

my $crc = crc32($key);             # CRC値

my $mod = $crc % ( $#nodes + 1 );

my $server = $nodes[ $mod ];       # 根據(jù)余數(shù)選擇服務器

printf "%s => %s\n", $key, $server;

}

Cache::Memcached在求哈希值時使用了CRC。

String::CRC32 - search.cpan.org

首先求得字符串的CRC值，根據(jù)該值除以服務器節(jié)點數(shù)目得到的余數(shù)決定服務器。上面的代碼執(zhí)行后輸入以下結果：

tokyo       => node2

kanagawa => node3

chiba       => node2

saitama   => node1

gunma     => node1

根據(jù)該結果，“tokyo”分散到node2，“kanagawa”分散到node3等。多說一句，當選擇的服務器無法連接時，Cache::Memcached會將連接次數(shù)添加到鍵之后，再次計算哈希值并嘗試連接。這個動作稱為rehash。不希望rehash時可以在生成Cache::Memcached對象時指定“rehash => 0”選項。

根據(jù)余數(shù)計算分散的缺點

余數(shù)計算的方法簡單，數(shù)據(jù)的分散性也相當優(yōu)秀，但也有其缺點。那就是當添加或移除服務器時，緩存重組的代價相當巨大。添加服務器后，余數(shù)就會產(chǎn)生巨變，這樣就無法獲取與保存時相同的服務器，從而影響緩存的命中率。用Perl寫段代碼來驗證其代價。

use strict;

use warnings;

use String::CRC32;



my @nodes = @ARGV;

my @keys = ('a'..'z');

my %nodes;



foreach my $key ( @keys ) {

my $hash = crc32($key);

my $mod = $hash % ( $#nodes + 1 );

my $server = $nodes[ $mod ];

push @{ $nodes{ $server } }, $key;

}



foreach my $node ( sort keys %nodes ) {

printf "%s: %s\n", $node,  join ",", @{ $nodes{$node} };

}

這段Perl腳本演示了將“a”到“z”的鍵保存到memcached并訪問的情況。將其保存為mod.pl并執(zhí)行。

首先，當服務器只有三臺時：

$ mod.pl node1 node2 nod3

node1: a,c,d,e,h,j,n,u,w,x

node2: g,i,k,l,p,r,s,y

node3: b,f,m,o,q,t,v,z

結果如上，node1保存a、c、d、e……，node2保存g、i、k……，每臺服務器都保存了8個到10個數(shù)據(jù)。

接下來增加一臺memcached服務器。

$ mod.pl node1 node2 node3 node4

node1: d,f,m,o,t,v

node2: b,i,k,p,r,y

node3: e,g,l,n,u,w

node4: a,c,h,j,q,s,x,z

添加了node4。可見，只有d、i、k、p、r、y命中了。像這樣，添加節(jié)點后鍵分散到的服務器會發(fā)生巨大變化。26個鍵中只有六個在訪問原來的服務器，其他的全都移到了其他服務器。命中率降低到23%。在Web應用程序中使用memcached時，在添加memcached服務器的瞬間緩存效率會大幅度下降，負載會集中到數(shù)據(jù)庫服務器上，有可能會發(fā)生無法提供正常服務的情況。

mixi的Web應用程序運用中也有這個問題，導致無法添加memcached服務器。但由于使用了新的分布式方法，現(xiàn)在可以輕而易舉地添加memcached服務器了。這種分布式方法稱為 Consistent Hashing。

Consistent Hashing

關于Consistent Hashing的思想，mixi株式會社的開發(fā)blog等許多地方都介紹過，這里只簡單地說明一下。

mixi Engineers' Blog - スマートな分散で快適キャッシュライフ
ConsistentHashing - コンシステントハッシュ法

Consistent Hashing的簡單說明

Consistent Hashing如下所示：首先求出memcached服務器（節(jié)點）的哈希值，并將其配置到0～2³²的圓（continuum）上。然后用同樣的方法求出存儲數(shù)據(jù)的鍵的哈希值，并映射到圓上。然后從數(shù)據(jù)映射到的位置開始順時針查找，將數(shù)據(jù)保存到找到的第一個服務器上。如果超過2³²仍然找不到服務器，就會保存到第一臺memcached服務器上。

圖4 Consistent Hashing：基本原理

從上圖的狀態(tài)中添加一臺memcached服務器。余數(shù)分布式算法由于保存鍵的服務器會發(fā)生巨大變化而影響緩存的命中率，但Consistent Hashing中，只有在continuum上增加服務器的地點逆時針方向的第一臺服務器上的鍵會受到影響。

圖5 Consistent Hashing：添加服務器

因此，Consistent Hashing最大限度地抑制了鍵的重新分布。而且，有的Consistent Hashing的實現(xiàn)方法還采用了虛擬節(jié)點的思想。使用一般的hash函數(shù)的話，服務器的映射地點的分布非常不均勻。因此，使用虛擬節(jié)點的思想，為每個物理節(jié)點（服務器）在continuum上分配100～200個點。這樣就能抑制分布不均勻，最大限度地減小服務器增減時的緩存重新分布。

通過下文中介紹的使用Consistent Hashing算法的memcached客戶端函數(shù)庫進行測試的結果是，由服務器臺數(shù)（n）和增加的服務器臺數(shù)（m）計算增加服務器后的命中率計算公式如下：

(1 - n/(n+m)) * 100

支持Consistent Hashing的函數(shù)庫

本連載中多次介紹的Cache::Memcached雖然不支持Consistent Hashing，但已有幾個客戶端函數(shù)庫支持了這種新的分布式算法。第一個支持Consistent Hashing和虛擬節(jié)點的memcached客戶端函數(shù)庫是名為libketama的PHP庫，由last.fm開發(fā)。

libketama - a consistent hashing algo for memcache clients – RJ ブログ - Users at Last.fm

至于Perl客戶端，連載的第1次中介紹過的Cache::Memcached::Fast和Cache::Memcached::libmemcached支持 Consistent Hashing。

Cache::Memcached::Fast - search.cpan.org
Cache::Memcached::libmemcached - search.cpan.org

兩者的接口都與Cache::Memcached幾乎相同，如果正在使用Cache::Memcached，那么就可以方便地替換過來。Cache::Memcached::Fast重新實現(xiàn)了libketama，使用Consistent Hashing創(chuàng)建對象時可以指定ketama_points選項。

my $memcached = Cache::Memcached::Fast->new({

servers => ["192.168.0.1:11211","192.168.0.2:11211"],

ketama_points => 150

});

另外，Cache::Memcached::libmemcached 是一個使用了Brain Aker開發(fā)的C函數(shù)庫libmemcached的Perl模塊。 libmemcached本身支持幾種分布式算法，也支持Consistent Hashing，其Perl綁定也支持Consistent Hashing。

Tangent Software: libmemcached

總結

本次介紹了memcached的分布式算法，主要有memcached的分布式是由客戶端函數(shù)庫實現(xiàn)，以及高效率地分散數(shù)據(jù)的Consistent Hashing算法。下次將介紹mixi在memcached應用方面的一些經(jīng)驗，和相關的兼容應用程序。

posted on 2008-10-15 11:37 Kevin.Zhong 閱讀(152) 評論(0) 編輯收藏所屬分類: memcache

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: memcache分析調(diào)試 memcache通信協(xié)議(轉自博客園) Cache Insight (轉自javaeye) memcached全面剖析–5. memcached的應用和兼容程序 memcached全面剖析–4. memcached的分布式算法 memcached全面剖析–3.memcached的刪除機制和發(fā)展方向 memcached全面剖析–2.理解memcached的內(nèi)存存儲 memcached完全剖析–1. memcached的基礎 Memcached深度分析

Kevin.Zhong

常用鏈接

留言簿(1)

隨筆分類

隨筆檔案

文章分類

文章檔案

搜索

最新評論

閱讀排行榜

評論排行榜

memcached全面剖析–4. memcached的分布式算法