<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    paulwong

    STORM與HADOOP的比較

    對于一堆時(shí)刻在增長的數(shù)據(jù),如果要統(tǒng)計(jì),可以采取什么方法呢?
    1. 等數(shù)據(jù)增長到一定程度的時(shí)候,跑一個(gè)統(tǒng)計(jì)程序進(jìn)行統(tǒng)計(jì)。適用于實(shí)時(shí)性要求不高的場景。
      如將數(shù)據(jù)導(dǎo)到HDFS,再運(yùn)行一個(gè)MAP REDUCE JOB。
    2. 如果實(shí)時(shí)性要求高的,上面的方法就不行了。因此就帶來第二種方法。
      在數(shù)據(jù)每次增長一筆的時(shí)候,就進(jìn)行統(tǒng)計(jì)JOB,結(jié)果放到DB或搜索引擎的INDEX中。
      STORM就是完成這種工作的。

    HADOOP與STORM比較
    1. 數(shù)據(jù)來源:HADOOP是HDFS上某個(gè)文件夾下的可能是成TB的數(shù)據(jù),STORM是實(shí)時(shí)新增的某一筆數(shù)據(jù)
    2. 處理過程:HADOOP是分MAP階段到REDUCE階段,STORM是由用戶定義處理流程,
      流程中可以包含多個(gè)步驟,每個(gè)步驟可以是數(shù)據(jù)源(SPOUT)或處理邏輯(BOLT)
    3. 是否結(jié)束:HADOOP最后是要結(jié)束的,STORM是沒有結(jié)束狀態(tài),到最后一步時(shí),就停在那,直到有新
      數(shù)據(jù)進(jìn)入時(shí)再從頭開始
    4. 處理速度:HADOOP是以處理HDFS上大量數(shù)據(jù)為目的,速度慢,STORM是只要處理新增的某一筆數(shù)據(jù)即可
      可以做到很快。
    5. 適用場景:HADOOP是在要處理一批數(shù)據(jù)時(shí)用的,不講究時(shí)效性,要處理就提交一個(gè)JOB,STORM是要處理
      某一新增數(shù)據(jù)時(shí)用的,要講時(shí)效性
    6. 與MQ對比:HADOOP沒有對比性,STORM可以看作是有N個(gè)步驟,每個(gè)步驟處理完就向下一個(gè)MQ發(fā)送消息,
      監(jiān)聽這個(gè)MQ的消費(fèi)者繼續(xù)處理

    posted on 2013-09-08 19:49 paulwong 閱讀(4578) 評論(0)  編輯  收藏 所屬分類: LOG ANALYST BIG DATA SYSTEMSTORM

    主站蜘蛛池模板: 亚洲色WWW成人永久网址| 亚洲综合精品第一页| 久久久久久久91精品免费观看| 亚洲熟妇AV一区二区三区宅男| 亚洲AV日韩精品一区二区三区| baoyu122.永久免费视频| 亚洲五月综合缴情婷婷| 国产精品V亚洲精品V日韩精品 | 亚洲精品国产精品国自产网站 | 亚洲色大情网站www| 国产精品亚洲玖玖玖在线观看| 18成禁人视频免费网站| 四虎影视在线看免费观看| 亚洲视频免费在线播放| 亚洲第一区精品日韩在线播放| 222www免费视频| aa在线免费观看| 亚洲精品无码av中文字幕| 亚洲AV无码一区二区二三区软件 | 四虎成人免费观看在线网址| 中国国语毛片免费观看视频| 亚洲欧美综合精品成人导航| 亚洲AV无码一区二区二三区软件| 日韩免费a级在线观看| 午夜视频免费在线观看| 一个人晚上在线观看的免费视频| 亚洲中文字幕日本无线码| 久久精品国产精品亚洲蜜月| 国产免费看插插插视频| 中文字幕乱码免费视频| 黄色网站软件app在线观看免费| 风间由美在线亚洲一区| 亚洲一区免费视频| 亚洲色图视频在线观看| 国产亚洲人成网站观看| 亚洲国产香蕉人人爽成AV片久久| 成人男女网18免费视频| 桃子视频在线观看高清免费完整| 日本免费人成网ww555在线| 一级特黄色毛片免费看| 精品无码专区亚洲|