亚洲宅男天堂在线观看无病毒,久久久久亚洲av无码专区蜜芽,亚洲va无码专区国产乱码

2009年12月9日

這篇文章是用英文寫的，由于某種原因，這篇文章可以很直接的說是Anti-MongoDB一個和諧的DB（一）。寫一的時候其實有很多問題，還是不很清楚的。所以有了以下的問題：

I has some questions about the nosql and the document database solutions because I just touch the nosql solutions these days,
I tried to understand and find the benefit of the NOSQL solutions (performance and scalability), but I cannot convince myself for the reasons, specially for the complex business related cases,
After read a lot of the articles and find the CAP, relational and Scalability are the three points for the NOSQL solutions,
CAP : only can pickup two of the three factors, and the NOSQL solutions pickup the AP, and use the eventually consistency to handle the consistency, now, let's check the RDBMS, if we have a lot of database servers, we also cannot have a good Consistency because of the performance issues, so we can choose the Master/Slave and asynchronize copy to handle the consistency (Similar with Eventually Consistency) which is similar with the NOSQL, so what is the benefit of the NOSQL (specify document database) from the CAP theory?
No-Relational object : the NOSQL is good at the no-relationship objects, for example, log. but log also can save to the RDBMS without relationship, so for the no-relationship objects, I think the mongo solution and the RDBMS solutions should be have the same performance and scalability. right?
Relational : in the mongodb.org there is a good example as following,

the address is embedded into the student which is reasonable and will make the performance better if we need load the address from the student in the UI, but the RDBMS also can do it for the 1-1 relationship, and the scores need ref to the another collection and which is also similar with the RDBMS and also need touch database two times when we load the course which also similar with RDBMS. so what is the benefit.
Partition and Sharding : RDBMS also provide the solutions (although need change some codes), and RDBMS also can handle them.

posted @ 2010-02-24 10:47 wz.xjtu 閱讀(244) | 評論 (0) | 編輯收藏

MongoDB之一NOSQL

NOSQL數(shù)據(jù)庫經(jīng)過了風風火火的一年，各個解決方案做的一個比一個有個性，并且大部分都有了商業(yè)應用，總體來說自己創(chuàng)造出來并且可以進行自行優(yōu)化的東東還是經(jīng)得起歷練的。

MongoDB在過去的一年中，變化非常之大，剛開始關注它的時候，它只是一個沒有1.0版本的東東，但是現(xiàn)在已經(jīng)加上太多太多的功能了，其中包括 MapReduce，Auto Sharding，等。

經(jīng)過了比較深入的研究（還會繼續(xù)研究），發(fā)現(xiàn)這個最像關系型數(shù)據(jù)庫的數(shù)據(jù)確實做的很強大。有很多東西還是非常值得探討的。我們先從以下方面進行研究關系型數(shù)據(jù)庫和非關系型數(shù)據(jù)庫的區(qū)別，以及為什么要在某種條件下擯棄關系型數(shù)據(jù)庫。

1. 關系型數(shù)據(jù)庫的產(chǎn)生就是為關系所生，如果一條條的都不是關系型的數(shù)據(jù)，需要進行關系型數(shù)據(jù)庫嗎？答案很簡單：不需要

經(jīng)典應用：Log的存儲（存儲到關系型數(shù)據(jù)庫的話，耽誤了我們可憐的不好擴張的數(shù)據(jù)庫呀，如果存儲在文件里面，那又不好進行管理，所以非關系型數(shù)據(jù)庫是一個很好的解決方案）

2. 關系型數(shù)據(jù)庫過多的強調(diào)了關系，關系型數(shù)據(jù)庫的目標是把我們的數(shù)據(jù)庫打造成一個第三范式遍布的數(shù)據(jù)結(jié)構（無傳遞函數(shù)依賴和部分函數(shù)依賴）。但是這種拆解變相的多了一次數(shù)據(jù)庫操作，也就是一次IO，性能也就會下降了。例子如下：當我們想打開一個帖子的時候，我們肯定還是想把下面的Comments都拿到的，如果我們直接能把Comments存在這個帖子之下就很容解決了吧。

3. 關系型數(shù)據(jù)庫過的關注consistency，其實我們很多的系統(tǒng)中并不需要這么好的consistency，起碼很多的Web2.0或者是普通的網(wǎng)站來說，只要把Support，維護，alert機制做好，不需要太多的consistency一樣可以做出很好的系統(tǒng)。當然我們也可以通過一些機制實現(xiàn) eventually consistency （沒有很深入的研究過）。太多的consistency的關注必然導致最后的available不會做到很好。進而關系型數(shù)據(jù)庫很難scaling out。為了scaling out read，我們只能去做partition，但是partition很難做呀，一半都會牽扯到很多代碼的改動。這些代碼的改動會嚴重影響項目的穩(wěn)定性而且風險性很大。而為了scaling out write 只能去做master-slave的解決方案（async和sync每種都有自己的問題）。很多NOSQL都解決了這個問題，無論是auto- sharding（因為是key做主的東西，可以很好的拆分）還是replication。（這一塊要進一步研究）

4. Schema問題。關系型數(shù)據(jù)的schema都是一定的，如果增加或減少一個column那可是一個大動呀。但是NOSQL卻是能很容易的解決這個問題，因為他們就是key-value而已。

NOSQL的提出是一個思想的進步，是一種編程理念的進步，數(shù)據(jù)庫只是一個存儲的庫而已，他不應該過多的關注于其他的business相關的東西。將來發(fā)展的前景是我們所有的business的邏輯都應該在Domain里面體現(xiàn)，我們不用關注下面到底存儲到那里。

posted @ 2010-02-24 10:46 wz.xjtu 閱讀(331) | 評論 (0) | 編輯收藏

LinkIn基于Dynamo設計的系統(tǒng) [ZZ]

Key-Value存儲

為了實現(xiàn)高性能和高可用性，我們只允許非常簡單的鍵值數(shù)據(jù)存取。key和value可以是list和map的復雜類型，但美中不足的是只有以下的查詢是有效的：

value = store.get(key)

store.put(key, value)

store.delete(key)

這可不是解決了所有的問題，其實做了許多的取舍：

缺點

沒有復雜的查詢過濾器

所有的聯(lián)合查詢必須在代碼實現(xiàn)

沒有外鍵的結(jié)構

沒有觸發(fā)器和視圖

優(yōu)點

只有高效的查詢可用，性能是可想像的

容易分布到集群

不管怎樣，面向服務常常不允許外鍵的結(jié)構，并且強制在代碼中實現(xiàn)聯(lián)合（因為和數(shù)據(jù)相關的key這個關系在另一個服務中維護著）

使用關系型數(shù)據(jù)庫你必須要有一個緩存層用來擴展讀操作，不過這個緩存層很典型地強制你使用了key-value的存儲系統(tǒng)

為了性能，最后不得不使用xml或者是其他不夠正規(guī)的一砣文本

使邏輯和存儲分離清晰（出于性能原因，SQL鼓勵將商業(yè)邏輯和存儲操作混在一起）

沒有對象-關系數(shù)據(jù)的丟失匹配問題

數(shù)據(jù)模型的詳細的討論將在下面給出。

系統(tǒng)架構

代碼中的每層實現(xiàn)了簡單的put get和delete操作的接口。每一層都會負責一個方法，諸如tcp/ip網(wǎng)絡通信、序列化、版本沖突解決、內(nèi)部結(jié)點路由等等。例如路由層負責發(fā)起一個操作，比方說是Put，并且分發(fā)給N個存儲并行執(zhí)行復制，同是要捕獲所有的失敗。

圖1

保持每一層獨立意味著可以混合和匹配使用以滿足運行中不同的需求。例如，我們可以增加一個壓縮層，將字節(jié)值的壓縮水平降低到序列化之下。同樣，在將數(shù)據(jù)路由到分區(qū)的時候我們可以做靈活的智能路由。硬件負載均衡的http客戶端（用ruby寫的）這項工作可以在客戶端做（smart的客戶端），也可以在服務端做成傻瓜式的使用。要把網(wǎng)絡層放在路由層的上面還是下面，我們需要做的是一件簡單的事情。

圖2

在上圖中“Load Bal.”是指負載均衡的硬件或者是輪循軟件負載均衡器，“Partition-aware routing”是存儲的內(nèi)部路由。從傳延遲角度來看，越少的跳是件好事（因為，嗯，這樣就跳得少了），從吞吐量的角度來說也是件好事（因為可預見的瓶頸更少了），但是需要把路由信息放到棧頂（例如，客戶端必須是java的而且還要使用我們的庫）。最后，最右的圖中，http-rpc發(fā)送到服務的請求被路由到了包含正確數(shù)據(jù)的機器（如果有的話），因此，在一個單獨的復制讀的簡單的情況下，機器必須能夠直接從本地bdb線程內(nèi)部獲取數(shù)據(jù)。

這一靈活性使得高性能的配置成為可能。在存儲中，磁盤的訪問是一個獨立的最大的性能沖擊，第二個是網(wǎng)絡的跳數(shù)。靠分區(qū)數(shù)據(jù)和盡可能緩存數(shù)據(jù)，可以避免磁盤訪問。網(wǎng)絡跳數(shù)需要架構的靈活性來消除。請注意在上圖中，我們可以用不同的配置文件來執(zhí)行3跳2跳和1跳的遠程服務。要獲得非常高的性能，就必須路由服務直接找到正確的服務器。

數(shù)據(jù)分區(qū)和復制

數(shù)據(jù)必須分區(qū)到一個集群的所有服務器上，使沒有任何一臺單一的服務器需要保存所有的數(shù)據(jù)集。即便數(shù)據(jù)可以在一個單獨的磁盤上存下，磁盤訪問小值數(shù)據(jù) 的時候是受尋找時候所控制，因此分區(qū)有改善緩存性能的作用，它依靠把熱的數(shù)據(jù)集分成更小的塊，能夠（希望能夠）整個地放到那個存有整個分區(qū)的服務器內(nèi)存里。這就意味著，在集群里的機器是不可以互換的，請求必須被路由到保存有所請求的數(shù)據(jù)的機器，而不只是隨便地到某一臺可用的機器上。

同樣，因為負載過重或者是維護原因的停機，服務器經(jīng)常會不可用。如果有S臺機器并且每臺機器一天有p的概率會獨自掛掉，因此一天里一臺機器丟失數(shù)據(jù)的概率為1 - (1 - p)^s，顯然，鑒于這一事實，我們不能將數(shù)據(jù)只保存在一臺機器上，或者說，數(shù)據(jù)丟失的概率與群集中的數(shù)量成反比。

最簡單的方式來完成這件事是，將數(shù)據(jù)分成S個分區(qū)（每個機器一個），并且在R臺機器上面保存鍵為K的值的拷貝。用K這個鍵來關聯(lián)R臺機器的一種方法是，設a=K%S，然后將這個值保存在機器a，a+1，a+2，…a+r。因此，對于任何的概率p，你都可以選擇一個合適的復制因子R，來達到一個可接受的夠低的數(shù)據(jù)丟失的概率。

這個系統(tǒng)有個非常漂亮的特性，那就是任何人只要知道數(shù)據(jù)的key就可以計算到數(shù)據(jù)所處的位置，系統(tǒng)允許我們以peer-to-peer的方式做數(shù)據(jù)尋找，而不需要聯(lián)系一個裝有所有的key到服務器的映射信息的中央元數(shù)據(jù)服務器。

當從集群中添加、刪除機器時（這樣說是因為我們購買新的硬件或服務器臨時關閉），上述方法會導致缺點。在這種情況下，d會被改變，數(shù)據(jù)會在機器之間遷移。假如d不變，那負載不會平均地從原來刪除的或者是壞了的機器分布到集群中剩余的部分。

一致性哈希是一種避免這種問題的技術，我們用它來計算每個key在集群中所處的位置。使用這種技術，伏地魔有了這樣的特性，當一臺機器掛了的時候，負載可以平均地分布到集群中剩余的機器。同樣，當增加一臺機器給一個有S臺機器的集群時，只有1/(S+1)的機器上的值需要遷移到新機器。

為了形象化一致性哈希方法，我們可以看到，用可能出現(xiàn)的整數(shù)哈希值，這樣，環(huán)就從0開始，順著環(huán)旋轉(zhuǎn)到2^31-1。這個環(huán)被平均分成Q個分區(qū)，Q>>S，這樣S個機器中的每個，都能分到Q/S個分區(qū)。一個key用任何一種哈希算法映射到環(huán)上，然后我們順時針看分區(qū)找到第一個唯一的R節(jié)點，計算出一個負責這個key的R個所有機器的列表。下面這個圖畫出了ABCD四個機器的一個哈希環(huán)。箭頭表示key映射到哈希環(huán)，結(jié)果給出當R為 3時對應的保存了那個key的值的所有機器的列表。

圖3

數(shù)據(jù)格式化和查詢

在關系數(shù)據(jù)庫中的數(shù)據(jù)被分成二維表。在這里它的等價物是“存儲”，如果數(shù)據(jù)不是必須成表，我們不使用字表結(jié)構（一個值可以包括列表，以及不需要考慮嚴格的關系型的映射）。每個key都有一個唯一的存儲，并且每個key都最多只能有一個值。

查詢

伏地魔系統(tǒng)支持哈希表的語義，因此一個單獨的值可以一次進行修改，同時可以按照主鍵查詢。因為可以通過主鍵來切分，這使得通過機器做分布式非常簡單。

請注意，雖然我們不支持一對多的關系，但我們支持把列表做為值，這樣也就完成了同樣的事情，因此存儲一個合理數(shù)量的有關聯(lián)的值成為可能。這相當于一個java.util.Map的值是一個java.util.List。在大多數(shù)情況下，這樣不規(guī)范來做是一個巨大的性能改善，因為只需要一個單獨的磁盤尋址過程。但對于非常大的一個一對多關系（例如，而一個key映射到數(shù)千萬的value），必須保存在機器上，再通過游標慢吞吞地過一遍，這樣子是不實際的。這（很少見），必須將他們分成子查詢或以其他方式在應用層處理。

查詢簡單可能是一種優(yōu)勢，因為每個查詢都有非?？深A測的性能，很容易將服務的性能拆分成存儲操作的數(shù)量份，它執(zhí)行并迅速估計負載。相反，SQL查詢往往不透明，而且執(zhí)行計劃是數(shù)據(jù)依賴的，因此很難估計一條給定的SQL在實際負載下的數(shù)據(jù)中還能很好地執(zhí)行（特別是對于一項新的功能，既沒有數(shù)據(jù)也沒有負載的情況下）。

此外，有三個操作接口，使得在整個存儲層之上的透明層成為可能，并且在單元測試中使用模擬存儲，它的實現(xiàn)不過是一個HashMap的模擬。這樣可使得單元測試在特殊的容器或者是環(huán)境之外，會更加實用。

數(shù)據(jù)模型和序列化

在伏地魔系統(tǒng)中，序列化是可插拔的，因此你可以使用一個弄好的序列化方法同時也可以簡單也寫自己的。在伏地魔系統(tǒng)的最底層，數(shù)據(jù)格式是只包括key 和value的字節(jié)數(shù)組。高層次的數(shù)據(jù)格式化是每個存儲都設置的配置選項，處理字節(jié)到對象的轉(zhuǎn)變時，依靠實現(xiàn)序列化類，所有格式的數(shù)據(jù)都可支持。這樣做要確?？蛻舳说淖止?jié)序列正確。

通過輸入在存儲上的配置文件，我們可以廣泛地支持以下各種類型:

json–二進制，類型的JSON數(shù)據(jù)模型，支持列表，地圖，日期，布爾值和各種精度數(shù)字。這是唯一的一種可以從字節(jié)<->對象和字符串<->對象映射的序列化的類型。這就意味著，它可以和SQL相互作用（例如通過命令行客戶端）。我們當前的產(chǎn)品設計中使用了一種有類型的、壓縮的、結(jié)構檢查的類Json格式；但這并沒有特殊的狀態(tài)，對于其他的應用軟件來說，其他的序列化機制可能會更好。

字符串–只保存原生的字條串類型。對xml數(shù)據(jù)塊比較有用。

java序列化–我們的老朋友java序列化。當你保存許多的java對象之前，請確認了解java序列化所提供的兼容性保證。

protobuf–Protocol buffers是來自google的代碼生成的序列化格式，這可能是條不錯的道，如果你不需要命令行訪問的話。

identity–這個類型有效地禁止了序列化，將返回給你確切的byte[]

字符串和identity的序列化都是相當?shù)牟谎宰悦鳌rotocol Buffers最好的說明應該是google來說。因此本節(jié)的剩余部分講述json背后的機制。

json序列化類型詳解

可能會有三種狀態(tài)的數(shù)據(jù)會駐留，我們希望能夠在它們之間進行轉(zhuǎn)換：

在內(nèi)存中的數(shù)據(jù)結(jié)構，例如一個User對象；

持久性和網(wǎng)絡傳輸?shù)淖止?jié)；

文本表示：DBA在檢查特定的值和在線升級時不需要寫新的代碼是非常重要的。

SQL基本上就通過文本查詢格式化來達到標準化，程序來處理這些字符串和程序所使用的內(nèi)部數(shù)據(jù)結(jié)構的映射關系。這是傳統(tǒng)的對象關系映射的問題。

對于存儲來說，json是一個優(yōu)秀的數(shù)據(jù)模型，因為它支持了所有編程語言中的數(shù)據(jù)類型（字符串，數(shù)字，列表/數(shù)組，以及對象/哈希表）。問題在于，它是本質(zhì)上是少結(jié)構的。對于任何存儲問題最常見的情況，是有使用完全相同的格式保存的N行數(shù)據(jù)（包括有相同的列），在這種情況下，用json是一種浪費，因為它每一行都帶有數(shù)據(jù)的格式。同樣，我們希望能夠數(shù)據(jù)的表單聲明，避免錯拼了列保存了臟數(shù)據(jù)。為了避免這種情況，我們要給每個存儲上的key和 value都分配一個結(jié)構，這個結(jié)構要能描述什么允許保存，以及怎么樣轉(zhuǎn)成字節(jié)和從字節(jié)轉(zhuǎn)成數(shù)據(jù)。使用如下的類型，json本身就可以指定結(jié)構：

int8, int16, int32, int64, float32, float64,string, date, object, bytes, boolean, object, array

例如，如果我希望一個存儲包含字符串，我指定那個表的類型為：

"string"

請注意，此類型的定義本身就是有效的JSON。

JAVA代碼取到數(shù)據(jù)的時候就是字符串類型的。

如果我期望存儲包含一個整數(shù)列表，例如，會員ID，我可以指定類型：

["int32"]

JAVA代碼將會返回List<Integer>。

如果我期望存儲包含一個簡單的用戶對象，可以定義的類型：

{"fname":"string", "lname":"string", "id":"int32", "emails":["string"]}

這里JAVA代碼將返回 Map<String,Object> ，包含了每個給出的key，以及對應的值。

下面是所有允許的類型：

type	storable substyles	bytes used	Java type	example JSON	example type definition
number	int8, int16, int32, int64, float32, float64, date	8, 16, 32, 64, 32, 64, 32	Byte, Short, Integer, Long Float, Double, Date	1	“int32″
string	string, bytes	2 + length of string or bytes	String, byte[]	“hello”	“string”
boolean	boolean	1	Boolean	true	“boolean”
object	object	1 + size of contents	Map<String,Object>	{”key1″: 1, “key2″:”2″, “key3″:false}	{”name”:”string”, “height”:”int16″}
array	array	size * sizeof(type)	List<?>	[1, 2, 3]	["int32"]

從這個意義上來說，類型定義是一套在標準json上的限制集，這樣能使序列化高效執(zhí)行（通過分段重復的字段，并且壓縮數(shù)字），并且允許基礎數(shù)據(jù)正確性檢測。

請注意，即使一個值可能有不同的字段，但只支持依賴存儲時定義的key來查詢。

為了幫助結(jié)構的發(fā)展，這JSON實現(xiàn)了版本，允許數(shù)據(jù)的逐步遷移的結(jié)構。數(shù)據(jù)總是以最新的結(jié)構來寫，但是，讀的時候要可以用任何一種寫的時候用的結(jié)構。這樣做可以在結(jié)構遷移的時候不需要停下服務來取數(shù)據(jù)。

一致性和版本化

當多個同步的寫到多個分布的機器（甚至是多個數(shù)據(jù)中心），數(shù)據(jù)的一致性成了一個難題。傳統(tǒng)的解決這個問題是分布式事務，但這些都是緩慢（由于很多跳）和脆弱的，因為他們要求所有服務器將可用于處理。如果應用程序運行在多個數(shù)據(jù)中心，而跨數(shù)據(jù)中心操作的延遲將會非常地高，特別地，任何一個算法要提及大于百分之五十的機器都能保證一致性將會非常困難。

其他的解決辦法是容忍不一致的可能性，并在讀取時解決不一致。這就是這里所探討的。

應用程序通常只讀、修改、更新序列時，修改數(shù)據(jù)。例如，一個用戶往他的賬號里增加一個email，我們必須先搞到用戶對象，增加email，然后把新的值寫回到db。數(shù)據(jù)庫的事務是這個問題的解決方案，但當事務跨越多個頁面的加載時（有可能加載完也可能沒完，并且可能在指定的時間片里完成），這并不是一個真正的選項。

當所有的update不存在時，給定的key的值是一致的，所有的讀操作都將會返回一個相同的值。在只讀世界中，數(shù)據(jù)被以一致性的方法創(chuàng)建并且永不改變。當我們增加了寫操作、復制，會遇到問題：現(xiàn)在我們需要更新在多個機器上的多份數(shù)據(jù)，并且要讓所有的東東都保持一致。在機器故障面前，這樣做很困難，在網(wǎng)絡分區(qū)的面前，這樣做被證明是不可能的（例如分區(qū)的情況，A和B可以互通，C和D可以互通，但是A、B與C、D并不能互通）。

下面有些方法，靠不同的保證和折衷性能來達到一致性：

兩步提交–這是一個鎖協(xié)議，包括在機器之間兩輪的協(xié)作。它是完全一致的，但不能兼容出錯，而且很慢。

Paxos式的共識–這是一個在一個值上達成共識的協(xié)議，能夠更多地兼容出錯。

讀修復–前兩種方法防止永久不一致。這種方法在寫的時候?qū)懭胨械牟灰恢掳姹?，在讀的時候檢測所有的沖突并且解決問題。這不涉及協(xié)調(diào)工作，是完全兼容出錯的，但可能需要額外的應用程序邏輯來解決沖突。

我們使用版本和讀修復。這有一個最好的可用性保證，和最高的性能（N次復制只需要W次的網(wǎng)絡往返寫，W可以配置成小于N的值）。兩步提交需要2N次的阻塞網(wǎng)絡往返。Paxos變化有很大不同，但相比兩步提交也差不多。

許多的細節(jié)，以下文件借自亞馬遜

這里有一些很好的寫關于這個問題的東東：

Consistency in Amazon’s Dynamo
Paxos Made Simple
Two-phase commit
The meaning’s of eventual consistency (by Amazon’s CTO Werner Vogels)

分布式系統(tǒng)中的版本

一個簡單的版本控制系統(tǒng)只是樂觀鎖定–我們保存一個唯一的計數(shù)器或者是時鐘值在每一片數(shù)據(jù)上，并且只允許更新數(shù)據(jù)的時候才能更新這個值。

在集中式的數(shù)據(jù)庫中這運行良好，但在一個機器時好時壞、復制需要時間的分布式系統(tǒng)中，它就掛了。對于這種用法，一個單一的值不能保存足夠的寫入歷史，以便我們丟棄老的版本?？紤]下面的一系列指令：

#兩個機器同時取一個相同的值

[client 1] get(1234) => {"name":"jay", "email":"jay.kreps@linkedin.com"}

[client 2] get(1234) => {"name":"jay", "email":"jay.kreps@linkedin.com"}



#1客戶端作了一次對name的修改并且put了一下

[client 1] put(1234, {"name":"jay kreps", "email":"jay.kreps@linkedin.com"})

#2客戶端作了一次對email的修改也put了一下

[client 2] put(1234, {"name":"jay", "email":"jay.kreps@yahoo.com"})



#現(xiàn)在我們有了以下的沖突版本

{"name":"jay", "email":"jay.kreps@linkedin.com"}

{"name":"jay kreps", "email":"jay.kreps@linkedin.com"}

{"name":"jay", "email":"jay.kreps@yahoo.com"}

在這個模型中，后面兩次的寫入使原值不再可用（因為是基于原值的修改）。盡管如此，我們沒有規(guī)則來告訴服務器是要拋棄對name的修改，還是對email的修改。因此我們需要一個版本系統(tǒng)來允許我們檢測重寫和拋棄老版本內(nèi)容，同時也要能檢測沖突并且讓客戶去解決。

解決這個問題的一個答案是靠傳說中的向量時鐘版本。一個向量時鐘在每次寫機器的時候都保持一個計數(shù)器，在兩個版本沖突和一個版本成功或者是比另一個新的時候，我們能計算它。

向量時鐘是一個服務器和版本對的列表：

 [1:45,2:3,5:55]

從這個版本能夠看出對那個寫的數(shù)字來說這是一臺主服務器。

對i來說v1繼承自v2，v1_i > v2_i。如果 v1 > v2和v1 < v2都不滿足，那么v1和v2同現(xiàn)，也就是沖突了。下面是兩個沖突的版本的例子：

	[1:2,2:1]

[1:1,2:2]

我們的版本結(jié)構定義了一個偏序，而簡單的樂觀鎖是一個全序。

路由參數(shù)

任何持久存儲的系統(tǒng)都需要回答的一個問題就是“我的東西存在哪里”。如果我們有一個集中的數(shù)據(jù)庫，這是一個簡單的問題，因為答案總是“它們在數(shù)據(jù)庫里的某個地方”。在一個鍵分離的系統(tǒng)中，可能在在多臺機器有所需要的數(shù)據(jù)。當我們執(zhí)行讀操作的時候，我們至少需要從一臺機器去取數(shù)據(jù)，當我們寫的時候，我們需要寫到N個復制去。

因此，有三個參數(shù)的問題：

N - 復制的次數(shù)
R - 讀數(shù)據(jù)的節(jié)點數(shù)
W -寫成功的分區(qū)數(shù)

請注意，如果R + W > N能夠保證我們“讀我們所寫”。如果w=0，那么寫操作是不阻塞的，寫成功是沒有保障的。取操作和刪除操作既不是立即一致的，也不是孤立的。這意思是說：如果一個put/delete操作要成功，需要W個節(jié) 點都進行了同樣的操作；然而，如果寫失敗了（這樣說是因為極少數(shù)的節(jié)點能夠馬上完成操作），那狀態(tài)就是不確定的了。如果一個put/delete操作成功了，那最后這個值都會變成最終的值，但如果沒有成功的這個值將會失效。如果客戶端要確保這個狀態(tài)，必須在一次寫操作失敗后再發(fā)起一次寫操作。

持久層

持久存儲我們默認使用JAVA版的BDB。MYSQL和內(nèi)存存儲也同樣支持。要添加一個新的持久化實現(xiàn)，你需要實現(xiàn)put\get\delete，并且要提供一個本地存儲的值的迭代程序。

批量計算數(shù)據(jù)支持

數(shù)據(jù)最密集的存儲需求之一是在我們的系統(tǒng)批量計算關于成員和內(nèi)容的數(shù)據(jù)。這份工作常常涉及到實體之間的關系（比如說有關系的用戶、相關的新聞文章等），那這樣N個實體就會增長出N²個關系來。在LinkIn的一個實例是用戶網(wǎng)絡，如果要為所有用戶準確保存會在12TB的范圍。批量數(shù)據(jù)處理通常比隨機訪問更有效率，也就意味著批量處理的數(shù)據(jù)可以被實際系統(tǒng)簡單地訪問。Hadoop極大地擴充了這一點。我們正在開源伏地魔的后端持久化的東東，它支持非常高效的只讀訪，還能解建立、發(fā)布以及管理大量的、只讀地指計算數(shù)據(jù)集等許多痛苦的事情。

處理批量計算的大多數(shù)痛苦來自于從數(shù)據(jù)倉庫或者是hadoop傳輸數(shù)據(jù)到線上系統(tǒng)的“推送”的過程。在傳統(tǒng)DB這意味著在線上機器重建新數(shù)據(jù)的索引。做數(shù)以百萬計的insert和update操作一般不會所有都很高效地執(zhí)行，通常在一個sql數(shù)據(jù)庫里數(shù)據(jù)需要被布到一個新的表中，當新表建立完畢，再交換回來替換當前數(shù)據(jù)。比數(shù)百萬計的單獨的update操作來說這樣做更好，但是，當同時服務于真實環(huán)境時，這仍然意味著線上系統(tǒng)現(xiàn)正為新的數(shù)據(jù)集（或者是performa）興建許多GB的索引。僅此一點可能需要數(shù)小時或數(shù)天，并可能會毀了實時查詢的性能。有人想搞定這個問題，通過將數(shù)據(jù)庫級別的 swap換出（比如說，有一個在線的DB和一個離線的DB，進行交換），但這要求做許多事并且意味著你將只有一半的硬件正在使用。伏地魔依靠盡可能的離線重建自身的索引（在hadoop之上或者其他），然后簡單地推送給線上機器并且透明地進行交換。

參考文獻

Dynamo: Amazon’s Highly Available Key-Value Store — This is the original!
Time, Clocks, and the Ordering of Events in a Distributed System — This is the template for the versioning system
Eventual Consistency Revisited Very interesting discussion on Werner Vogels’ blog on the developers interaction with the storage system and what the tradeoffs mean in practical terms.
Brewer’s conjecture and the feasibility of consistent, available, partition-tolerant web services — Consistency, Availability, Partition-tolerance choose two.
Berkeley DB performance — A somewhat biased overview of bdb performance.
Google’s Bigtable — For comparison, a very different approach.
One Size Fit’s All: An Idea Whose Time Has Come and Gone — Very interesting paper by the creator of Ingres, Postgres and Vertica
One Size Fits All? - Part 2, Benchmarking Results — Benchmarks to go with the above paper
Consistency in Amazon’s Dynamo — A good blog post on Dynamo
Paxos Made Simple
Two-phase commit — Wikipedia description.

posted @ 2010-01-18 22:45 wz.xjtu 閱讀(340) | 評論 (0) | 編輯收藏

Selenium – Acceptance Testing Tool

周末，由于項目需要，作為一個開發(fā)者，我決定研究一下自動化測試，因為最近，我們要統(tǒng)計User Story所帶來的Defect的個數(shù)，所以Dev要在開始的時候就要準備自己在自己的開放環(huán)境上多測試幾遍。

公司一直在用QTP測試，用VB去寫腳本，額的神呀，那語言我玩不轉(zhuǎn)，所以還是選擇了Selenium，因為它提供了Java的driver，還是不錯的。先裝了一個Firefox插件，錄制了一些腳本，拷貝到JUnit里面，竟然不可以運行。網(wǎng)上Google了很久沒有找到好的方法，一方面是由于我們的這個frame寫的不是怎么標準，另外一個方面估計是網(wǎng)絡太慢了。所以我加上了一個waitForPageLoad，竟然神奇的可以通過了。不知道為什么，但是這樣的腳本的東西，我也懶得去理解為什么。

一直想怎么把東西做到超級的自動化，自動化達到在一個地方輸入，另一個地方就可以驗證了，最后決定，把輸入數(shù)據(jù)寫到Excel里面，中間的數(shù)據(jù)存儲到數(shù)據(jù)庫中（必須的，其實還是可以在Excel里面存著，不過懶得這樣存，訪問Excel不是俺的強項）。最后去根據(jù)這些中間的結(jié)果去驗證最后的輸出是不是正確。

想法很好，開始做了，遇到了第一個問題，輸出是簡單的<tr><td>test</td></tr>, 怎么去驗證這個test是不是正確呢？去網(wǎng)上繼續(xù)搜索，發(fā)現(xiàn)用xpath能解決這個問題，最后用以下的path解決了這個東東，如下（xpath=//div[@id='reponseFormHeader']/div/table/tbody/tr[1]/td[1]）可以用一個firefox差價xpather去發(fā)現(xiàn)這個東東，并且寫上去，也解決了給這些沒有必要的text寫上一個Identifier的問題（QA一直強調(diào)要給這些Text都加上一個ID方便自動化測試）。

最后選擇把中間結(jié)果寫在MongoDB里面，原因很簡單，Schemaless和Map driven的DB，我僅僅需要把Map往里面一扔，后面的就不用管了。簡單粗暴，但是又是很實用。自動化測試不是很難，但是要用心去做，QA也不是很容易，很多東西，資料不多，寫起來也很奇怪。

最后說說敏捷軟件開發(fā)，什么時候?qū)懽詣踊瘻y試呢？看網(wǎng)上有人說，QA測試中80%的要手工測試，我比較不同意，我認為80%都可以進行自動化測試。自動化測試是QA可以在很早就可以開始的，Mockup出來后就可以開始了。只要我們把自動化測試當成一回事去做，可以省去很多很多的effort，不失為一種敏捷的快捷之路。

posted @ 2010-01-11 00:02 wz.xjtu 閱讀(283) | 評論 (0) | 編輯收藏

NoSQL & MongoDB

最近在準備一個小的討論會，題目可以自定，我感覺這個MongoDB還是蠻有意義的，值得討論一下。做了一些slides，節(jié)選如下，

What is NOSQL

NOSQL != NO SQL
NOSQL = Not Only SQL

What do we want?

Performance
Scalability
Flexibility

Two important theories

CAP (Every system only can match 2 of them, NoSQL supports to match A and P)

Consistency
Availability
Tolerance to network Partitions

ACID & BASE(Anti-ACID)

ACID – RDBMS use this theory
BASE – Anti-ACID and NoSQL use it.

Compare with current RDBMS with NoSQL solutions

RDBMS are working w/ relationship, and the relationship are not easy to extend (scalability)
RDBMS software are implemented as a big system with additional function which make the database slow
ACID can make the data perfect, but it does not care about the performance.
Most of NoSQL solutions are schemaless
Make the simple things simple (for example: log)

Upcoming solutions of the software.

NoSQL is nibbling up the SQL solutions.
NoSQL + SQL = Data solution

What is the issues we are meeting now?

Performance
Document generation (PDF/Email)
Image solutions

Compare with MySQL

Performance is better
Scalability is excellent

MongoDB vs CouchDB

Similar solutions.
Performance of MongoDB is better than CouchDB
MongoDB is better at web solutions.

Three words about the MongoDB

NOSQL –> RDBMS
BSON
GridFS

How to use it?

1 Click install
2 clicks helloworld using java client
types which mongo supports now
Collection oriented database.
index using with MongoDB
GridFS for the big file

Sharding with Mongodb

How to shard?
Scalability is excellent.

Upcoming solutions for Mongodb

ORM with MongoDB java client
Performance tuning with java client

What can Mongodb do? cannot do?

Document
Image store
Real-time Analysis
Caching

Upcoming simple desgin with Mongodb.

posted @ 2009-12-20 01:31 wz.xjtu 閱讀(2593) | 評論 (0) | 編輯收藏

Cache之我見

這兩日對Cache研究了一點，讀了一些源代碼，自己也寫了點code，借此假期也算是休閑加學習了。

什么時候用Cache？

在系統(tǒng)中，如果要考慮系統(tǒng)的性能，我們最好都使用Cache，在各個層次上都用上Cache，這樣的話可以盡最大程度的減少數(shù)據(jù)庫的壓力。估計現(xiàn)在的系統(tǒng)都在分層，vo，po，do（domain object）；我們可以把這些東西能緩存的都緩存起來，當然要根據(jù)具體系統(tǒng)具體分析（Cache多長時間，Cache多少東西）。
Tip：公司的系統(tǒng)中，由于用一臺數(shù)據(jù)庫，數(shù)據(jù)庫的壓力一直都是一個很大的問題，timeout，too many connection，等問題應接不暇。

怎么用Cache？

估計每個公司都有自己的Cache framework，簡單的就是幾個類，麻煩的可以做個小的framework去包裝已有的opensource的cache provider。很多opensource的cache provider（例如：oscahe，ehcache）都對性能進行了優(yōu)化，所以肯定性能比Map好很多，但是肯定不能拿過來就用，那樣的話每次調(diào)用的時候太過于麻煩，寫很多的類，很多的方法。所以說包裝是很重要的，建議包裝成一個Bus一樣的東西（CacheBus，叫做CacheManager比較好），這樣的話就可以在各個層次都向上面寫和讀了。

Tip： Cache就是key value，我們只要能寫好key-value怎么寫都可以的。這樣也讓系統(tǒng)變得簡單實用（更能體現(xiàn)OO）

Cache Provider

Oh，這方面太多東西了，oscache（貌似停止開發(fā)了），ehcache（被terracotta收購了，前途不錯），treecache（jbosstreecache大而全），memecached（很火了很久），nosql相關的東西（couchdb，mongodb）。Oh...不能忘記Map

其實用什么都可以，關鍵是用好，一般的解決方案很簡單，既然你要在系統(tǒng)中用Cache并且想風風火火的用一下，那就來個二級Cache，第一級用本地Cache（速度快，但是東西不能太多），第二級，用memcached （能存放大的東東，便宜）。第一級Cache上3分鐘（自己要調(diào)試確定時間），自動收割到第二級Cache中。

什么在第一級Cache中永遠存活？小的，永遠都要用的，例如用戶信息，Site信息，一些template等。

特別強調(diào)一下nosql 這方面mongodb和couchdb做的很好，在document相關的東西，可以緩存到這里面，例如：系統(tǒng)要在半天后發(fā)一封郵件，這封郵件所有的數(shù)據(jù)現(xiàn)在內(nèi)存中都有，比較大的東東。到時候再去太復雜，太浪費內(nèi)存了。怎么辦呢？放在一級緩存肯定不合適，放在二級緩存，要存活半天呀，太浪費時間了，存在數(shù)據(jù)庫里面，增加壓力，也不是很好，NOSQL的mongodb和couchdb就可以解決這個問題，這個schemaless的數(shù)據(jù)庫，可以讓你輕松的存任何的東西（性能不錯）。（自己要優(yōu)化一下代碼）

舉例：

Annotation

@Documented
@java.lang.annotation.Target(value={java.lang.annotation.ElementType.TYPE})
@java.lang.annotation.Retention(value=java.lang.annotation.RetentionPolicy.RUNTIME)
public @interface CacheIt {
    //Provide the cacheProvider which will be use to cache the object which is just used to replace the xml configuration.
    public String cacheProvider();
    //Used to define how long the cache need to be provide
    public long cacheDuration();
    //The level of the cache, define, level1, level2 (If there is level2 defination in the annotation, the cache will be kick to level2 after the timeout in the level1)
    public int cacheLevel();

}

一個VO的configuration

@CacheIt(cacheProvider="com.javaeye.wmwm.cache.impl.HashMapCacheProvider", cacheDuration=10000, cacheLevel=1)
public class TestVo {

    @Identifier
    public String key;

    public String test;

    public String getKey() {
        return key;
    }

    public void setKey(String key) {
        this.key = key;
    }

    public String getTest() {
        return test;
    }

之后寫一個CacheManager

public class CommonCacheManager implements CacheManager {
    /**
     * Cache the object into the cache.
     * <p> the provider is defined in the annotation in the related Vo/PO/DO
     * <p> the key is annotated by the <code>Identifier</code>.
     * @param object represents the input objects which needs to be cached.
     */
    public void cache(Object object) {
        Cache cache = CachePool.getInstance().loadCache(object.getClass());
        Object key = new CacheKeyFinder().find(object);
        cache.put(key, object);
    }

    public Object load(Class<?> clazz, Object key) {
        Cache cache = CachePool.getInstance().loadCache(clazz);
        return cache.get(key);
    }
}

posted @ 2009-12-09 11:44 wz.xjtu 閱讀(1934) | 評論 (6) | 編輯收藏

WZ_XJTU_JAVA_SPACE

Key-Value存儲

缺點

優(yōu)點

系統(tǒng)架構

數(shù)據(jù)分區(qū)和復制

數(shù)據(jù)格式化和查詢

查詢

數(shù)據(jù)模型和序列化

json序列化類型詳解

一致性和版本化

分布式系統(tǒng)中的版本

路由參數(shù)

持久層

批量計算數(shù)據(jù)支持

參考文獻

What is NOSQL

What do we want?

Performance

Scalability

Flexibility

Two important theories

CAP (Every system only can match 2 of them, NoSQL supports to match A and P)

ACID & BASE(Anti-ACID)

ACID – RDBMS use this theory

BASE – Anti-ACID and NoSQL use it.

Compare with current RDBMS with NoSQL solutions

RDBMS are working w/ relationship, and the relationship are not easy to extend (scalability)

RDBMS software are implemented as a big system with additional function which make the database slow

ACID can make the data perfect, but it does not care about the performance.

Most of NoSQL solutions are schemaless

Make the simple things simple (for example: log)

Upcoming solutions of the software.

NoSQL is nibbling up the SQL solutions.

NoSQL + SQL = Data solution

What is the issues we are meeting now?

Performance

Document generation (PDF/Email)

Image solutions

Compare with MySQL

Performance is better

Scalability is excellent

MongoDB vs CouchDB

Similar solutions.

Performance of MongoDB is better than CouchDB

MongoDB is better at web solutions.

Three words about the MongoDB

NOSQL –> RDBMS

BSON

GridFS

How to use it?

1 Click install

2 clicks helloworld using java client

types which mongo supports now

Collection oriented database.

index using with MongoDB

GridFS for the big file

Sharding with Mongodb

How to shard?

Scalability is excellent.

Upcoming solutions for Mongodb

ORM with MongoDB java client

Performance tuning with java client

What can Mongodb do? cannot do?

Document

Image store

Real-time Analysis

Caching

Upcoming simple desgin with Mongodb.

導航

統(tǒng)計

常用鏈接

留言簿

隨筆檔案

搜索

最新評論

閱讀排行榜

評論排行榜