<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    一江春水向東流

    做一個有思想的人,期待與每一位熱愛思考的人交流,您的關注是對我最大的支持。

      BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
      44 隨筆 :: 139 文章 :: 81 評論 :: 0 Trackbacks
    2009年開始掀起的“NoSQL革命”在Web領域造成了極大的反響,Twitter也在2010年對其Tweets數據類型引進新生的NoSQL數據庫。近日,國外知名網站readwriteweb.com企業頻道作者Klint Finley撰寫了一篇有關“Twitter放棄MySQL轉而使用NoSQL緣由”的文章。 infoQ在今年早些時候發布了一個演講視頻,在該視頻中,Kevin Weil談到了公司應如何使用NoSQL。Weil指出Twitter嚴重依賴于MySQL。然而,當MYSQL在許多用途上表現的并不理想的時候 Twitter使用了NoSQL解決方案。據威爾介紹,在2009年里,Twitter用戶數從1月份的每天約 200萬人,激增至12月份的每天近5000萬人。每天登陸Twitter的用戶數量增長已經超過了20倍。目前Twitter每天產生的用戶數據在 12TB左右,而每年約產生4PB的數據。   Scribe   Twitter的系統日志在一段時間后停止進行壓縮,所以Facebook使用Scribe來替代它。日志的收集創建在Facebook開源框架上,Twitter已經發布了一些Scribe的補丁。Twitter使用Scribe來記錄Hadoop的日志。Scribe使Twitter記錄日志數據變得簡單。Scribe還可以比以前記錄更多的數據,現在數據日志已經分成了80個不同的類別。   Hadoop   Twitter每天都需要將更多的數據可靠的寫入到一個硬盤驅動器上,然后這是不現實的,所以像Twitter這樣每天都產生大量數據的機構需要把數據存儲在集群之中才能滿足其業務需求。Twitter使用了Cloudera的Hadoop為其分配集群。Weil指出能夠,MySQL不能滿足 Twitter在大規模做需求分析時所要求的效率,為了滿足需求,Twitter使用了Hadoop及自己擁有的開源項目,他們稱之為FlockDB。 Hadoop可以運行分析并找到在FlockBD中相似的社交圖數據集合。   Pig      這種Pig腳本可以幫您找到其網站年齡在18至25歲訪問者中訪問量排名前五位的網頁   Weil說Hadoop是通過Java語言實現的,但是Java是復雜的,這使得它很難快速的重復執行。相反,Twitter使用Pig腳本的語言,這個高級語言運行在Hadoop之上。   Yahoo創造了Pig腳本語言并使其快速發展,Weil表示,Pig非常易學并且容易理解。他說,你將受益于Pig的方便,并且它縮短了執行時間,但這是值得的。   HBase   HBase是建立在Hadoop的之上的,并且具有低延時和數據可變性的設計。 Twitter的使用它來增強人們的搜索。   FlockDB   FlockDB是一個實時的、分布式的數據庫。如上所述,它的建立和開源由來自Twitter。該公司使用它的社交圖分析。它仍然在MySQL的下面,但是它的速度非常快。   Weil用一個在FlockDB的應用程序舉例,顯示哪些用戶顯示@表示回復。舉個例子。如果Ashton Kutcher發送tweet到@foursquare。它不應該顯示在Kutcher的6156915粉絲之中,他應該僅在關注Kutcher的用戶和 Foursquare中顯示。   Cassandra   Twitter至今仍然在嘗試并使用Casandra,這個開源的數據庫由Facebook創建。Weil說,Twitter當前的原子計算實驗使用的就是Cassandra。但對Twitter而言,Cassandra也非萬能,首先在于Cassandra代碼或許還存在不少問題,Twitter如果投入大量的精力來改進Cassandra和比較優化MySQL 的投入來看有點得不償失。在QCon Beijing上@nk也提到Cassandra在Twitter的內部測試中曾經暴露出不少嚴重的問題。   Twitter拿所有的這些數據都用來做什么?   Twitter的使用它收集的所有數據有各種用途。有些只是簡單的計數問題,如計算出有多少請求它的服務,每天有多少搜索服務,每天來處理這些交易的平均時間,等等。   其他用途更為復雜。例如,不同類型用戶的運行比較。Twitter的分析數據,以確定是否移動用戶,用戶誰使用了第三方客戶短或“超級用戶”與普通用戶使用Twitter的不同。   韋伊最后指出,Twitter的其他問題包括:確定轉推的話題中哪些類型是人們最感興趣,最成功的網絡需要什么樣的社會效果圖結構,以及如何區分不同類型的人或機器人。
    posted on 2011-01-12 09:17 allic 閱讀(452) 評論(0)  編輯  收藏 所屬分類: 開源數據庫學習研究
    主站蜘蛛池模板: 亚洲欧美日韩国产成人| 亚洲一区二区三区免费在线观看| 亚洲欧美黑人猛交群| 日本一区二区三区免费高清| 亚洲国产精品日韩在线| 性短视频在线观看免费不卡流畅| 亚洲精彩视频在线观看| 五月亭亭免费高清在线| 亚洲国产av一区二区三区丶| 最近中文字幕mv免费高清视频8| 亚洲精选在线观看| 中文字幕在线免费观看| 亚洲va精品中文字幕| 成人黄18免费视频| 美女裸体无遮挡免费视频网站| 免费大黄网站在线看| 国产精品玖玖美女张开腿让男人桶爽免费看 | 午夜视频在线观看免费完整版 | 色多多免费视频观看区一区| www.亚洲色图.com| 最近免费中文字幕中文高清| 亚洲人成影院在线| 18禁无遮挡无码网站免费| 色网站在线免费观看| 亚洲AV天天做在线观看| 丁香花免费高清视频完整版| 亚洲av无码日韩av无码网站冲| 亚洲成a人片在线播放| 四虎影视成人永久免费观看视频| 亚洲国产精品线观看不卡| 国产精品免费电影| 国产成人免费AV在线播放 | 亚洲成人影院在线观看| 日韩免费在线视频| 亚洲精品无码成人| 在线精品亚洲一区二区小说| 1000部夫妻午夜免费| 噜噜综合亚洲AV中文无码| 国产亚洲福利精品一区| 久久久久久久久免费看无码| 久久精品免费网站网|