<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-153  評論-235  文章-19  trackbacks-0

     

    Required Software

    1. JavaTM 1.5.x
    2. ssh與sshd

    如果沒有安裝請自行安裝。我以CentOS 4.6為例。

    下載hadoop,http://apache.mirror.phpchina.com/hadoop/core/ 我下載的是0.17.1版本。

    解壓hadoop-0.17.1.tar.gz,然后conf/hadoop-env.sh 設置JAVA_HOME ,我是可JAVA_HOME 去注釋,值自己的路徑。如:

    export JAVA_HOME=/usr/java/jdk1.6.0_06

    如果不設置啟動后用不了。

    先從簡單開始。

    1、Local (Standalone) Mode ,叫單機模式。

    [chenlb@master hadoop-0.17.1]$ bin/hadoop jar hadoop-0.17.1-examples.jar grep conf output 'dfs[a-z.]+'

     

    [chenlb@master hadoop-0.17.1]$ cat output/*


    如果,正常可以看到內容。像這樣。

    3       dfs.
    3       dfs.class
    2       dfs.period
    2       dfs.replication
    ...    ...

    2、Pseudo-Distributed Mode,虛擬分布模式。
    vi conf/hadoop-site.xml
    <configuration>
    <property>
            
    <name>fs.default.name</name>
            
    <value>hdfs://master:9000/</value>
    </property>
    <property>
            
    <name>mapred.job.tracker</name>
            
    <value>hdfs://master:9001/</value>
    </property>
    <property>
            
    <name>dfs.replication</name>
            
    <value>1</value>
    </property>
    <property>
            
    <name>hadoop.tmp.dir</name>
            
    <value>/home/chenlb/hadoop-0.17.1/tmp/</value>
    </property>
    </configuration>

    在/etc/hosts里添加本機ip對應master,例如我的:172.16.249.210    master
    保證可以無密碼登錄。請看那一篇文章:http://www.tkk7.com/chenlb/archive/2008/07/03/212293.html

    用ssh localhost試一下是否免密碼登錄。

    格式化分布式文件系統:
    [chenlb@master hadoop-0.17.1]$ bin/hadoop namenode -format

    啟動Hadoop:
    [chenlb@master hadoop-0.17.1]$ bin/start-all.sh 

    默認可以在${HADOOP_HOME}/logs里看到日志。

    可以用web看瀏覽NameNode和JobTracker
  • NameNode - http://localhost:50070/
  • JobTracker - http://localhost:50030/


    把文件放到分布式文件系統里:

    [chenlb@master hadoop-0.17.1]$ bin/hadoop dfs -put conf input

    此時已經在分布文件系統里建立了input文件夾。而conf是本地的文件夾。

    執行示例:
    [chenlb@master hadoop-0.17.1]$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'

    這里input和output都是分布式文件系統的的文件夾,而且output在分布式文件系統里不存在,否則報錯(也可以先刪除它bin/badoop dfs -rmr output)。

    耐心等待。結束后可以查看。
    [chenlb@master hadoop-0.17.1]$ bin/hadoop dfs -get output output 
    [chenlb
    @master hadoop-0.17.1]$ cat output/* 

    也可以直接在分布式文件系統里查:
    [chenlb@master hadoop-0.17.1]$ bin/hadoop dfs -cat output/*

    成功運行后可以關閉它了:
    [chenlb@master hadoop-0.17.1]$ bin/stop-all.sh

    我在第2階段,出了些問題:output已經存在,要先刪除它(第二次運行前,可以不用output)。

    下一篇講:Fully-Distributed Mode http://www.tkk7.com/chenlb/archive/2008/08/11/221314.html
  • posted on 2008-08-11 15:28 流浪汗 閱讀(4951) 評論(2)  編輯  收藏 所屬分類: Lucene

    評論:
    # re: Hadoop 快速入門 2009-04-28 11:03 | 隔葉黃鶯
    想問一下,博主在使用 Hadoop 有實際的應用嗎?用在哪些方面的。  回復  更多評論
      
    # re: Hadoop 快速入門 2009-04-28 13:21 | 流浪汗
    @隔葉黃鶯
    沒有實際的經驗,那時公司打算要用,后來就不用了。想用在分布式索引。

    后來也就沒時間繼續學習它了。  回復  更多評論
      
    主站蜘蛛池模板: 久久精品国产免费观看| 国产福利视精品永久免费| 亚洲午夜福利在线视频| 91九色老熟女免费资源站| 婷婷精品国产亚洲AV麻豆不片 | 国产成人无码a区在线观看视频免费 | 亚洲小说图片视频| 中文字幕影片免费在线观看| 国内精品久久久久影院亚洲| 日本特黄特色aa大片免费| 国产亚洲精品欧洲在线观看| 人人狠狠综合久久亚洲高清| 国产高清视频免费在线观看| 亚洲国产精品国自产拍AV| 久久免费视频精品| 在线综合亚洲中文精品| 日韩毛片无码永久免费看| 无套内射无矿码免费看黄| 国产亚洲成归v人片在线观看| 你好老叔电影观看免费| 亚洲国产精品久久久久久| 无人影院手机版在线观看免费| 丰满亚洲大尺度无码无码专线| 亚洲无线一二三四区手机| 久久成人免费电影| 亚洲中文字幕乱码AV波多JI| 区三区激情福利综合中文字幕在线一区亚洲视频1 | 中文字幕亚洲色图| 午夜男人一级毛片免费| 免费看一级高潮毛片| 久久国产亚洲电影天堂| 我要看WWW免费看插插视频| 五月婷婷免费视频| 亚洲综合小说久久另类区| 国产又黄又爽又刺激的免费网址| 中文字幕永久免费| 亚洲综合色一区二区三区| 亚洲精品无码久久久久sm| 毛片免费视频播放| 99久久免费国产精精品| jiz zz在亚洲|