Posted on 2010-02-24 12:06
啥都寫點 閱讀(165)
評論(0) 編輯 收藏 所屬分類:
others
Apache基金會副總裁Matthieu Riou近日在郵件列表中宣布,開源分布式數據存儲系統Cassandra日前正式成為Apache頂級項目。
Cassandra最初由Facebook開發,以Amazon專有的完全分布式的Dynamo為基礎,結合了Google BigTable基于列族(Column Family)的數據模型。很多方面都可以稱之為Dynamo 2.0。
2008年開
源,轉而由Amazon
Dynamite團隊成員維護。后成為Apache基金會旗下的一個重要孵化項目。雖然目前仍然在密集開發階段,但是已經有了許多產品級的應用,包括知名
云計算公司RackSpace,著名的新聞聚合網站Digg等等。當然還值得一提的是Twitter。
下面的介紹引用自JavaEye范凱的博客:
Cassandra的主要特點就是它不是一個數據庫,而是由一堆數據庫節點共同構成的一個分布式網絡服務,對Cassandra
的一個寫操作,會被復制到其他節點上去,對Cassandra的讀操作,也會被路由到某個節點上面去讀取。對于一個Cassandra群集來說,擴展性能
是比較簡單的事情,只管在群集里面添加節點就可以了。我看到有文章說Facebook的Cassandra群集有超過100臺服務器構成的數據庫群集。
Cassandra也支持比較豐富的數據結構和功能強大的查詢語言,和MongoDB比較類似,查詢功能比MongoDB稍弱一
些,twitter的平臺架構部門領導Evan
Weaver寫了一篇文章介紹Cassandra:http://blog.evanweaver.com/articles/2009/07/06
/up-and-running-with-cassandra/,有非常詳細的介紹。
Cassandra以單個節點來衡量,其節點的并發讀寫性能不是特別好,有文章說評測下來Cassandra每秒大約不到1萬次
讀寫請求,我也看到一些對這個問題進行質疑的評論,但是評價Cassandra單個節點的性能是沒有意義的,真實的分布式數據庫訪問系統必然是n多個節點
構成的系統,其并發性能取決于整個系統的節點數量,路由效率,而不僅僅是單節點的并發負載能力。
--
學海無涯