<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-153  評論-235  文章-19  trackbacks-0

     

    Required Software

    1. JavaTM 1.5.x
    2. ssh與sshd

    如果沒有安裝請自行安裝。我以CentOS 4.6為例。

    下載hadoop,http://apache.mirror.phpchina.com/hadoop/core/ 我下載的是0.17.1版本。

    解壓hadoop-0.17.1.tar.gz,然后conf/hadoop-env.sh 設置JAVA_HOME ,我是可JAVA_HOME 去注釋,值自己的路徑。如:

    export JAVA_HOME=/usr/java/jdk1.6.0_06

    如果不設置啟動后用不了。

    先從簡單開始。

    1、Local (Standalone) Mode ,叫單機模式。

    [chenlb@master hadoop-0.17.1]$ bin/hadoop jar hadoop-0.17.1-examples.jar grep conf output 'dfs[a-z.]+'

     

    [chenlb@master hadoop-0.17.1]$ cat output/*


    如果,正常可以看到內容。像這樣。

    3       dfs.
    3       dfs.class
    2       dfs.period
    2       dfs.replication
    ...    ...

    2、Pseudo-Distributed Mode,虛擬分布模式。
    vi conf/hadoop-site.xml
    <configuration>
    <property>
            
    <name>fs.default.name</name>
            
    <value>hdfs://master:9000/</value>
    </property>
    <property>
            
    <name>mapred.job.tracker</name>
            
    <value>hdfs://master:9001/</value>
    </property>
    <property>
            
    <name>dfs.replication</name>
            
    <value>1</value>
    </property>
    <property>
            
    <name>hadoop.tmp.dir</name>
            
    <value>/home/chenlb/hadoop-0.17.1/tmp/</value>
    </property>
    </configuration>

    在/etc/hosts里添加本機ip對應master,例如我的:172.16.249.210    master
    保證可以無密碼登錄。請看那一篇文章:http://www.tkk7.com/chenlb/archive/2008/07/03/212293.html

    用ssh localhost試一下是否免密碼登錄。

    格式化分布式文件系統:
    [chenlb@master hadoop-0.17.1]$ bin/hadoop namenode -format

    啟動Hadoop:
    [chenlb@master hadoop-0.17.1]$ bin/start-all.sh 

    默認可以在${HADOOP_HOME}/logs里看到日志。

    可以用web看瀏覽NameNode和JobTracker
  • NameNode - http://localhost:50070/
  • JobTracker - http://localhost:50030/


    把文件放到分布式文件系統里:

    [chenlb@master hadoop-0.17.1]$ bin/hadoop dfs -put conf input

    此時已經在分布文件系統里建立了input文件夾。而conf是本地的文件夾。

    執行示例:
    [chenlb@master hadoop-0.17.1]$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'

    這里input和output都是分布式文件系統的的文件夾,而且output在分布式文件系統里不存在,否則報錯(也可以先刪除它bin/badoop dfs -rmr output)。

    耐心等待。結束后可以查看。
    [chenlb@master hadoop-0.17.1]$ bin/hadoop dfs -get output output 
    [chenlb
    @master hadoop-0.17.1]$ cat output/* 

    也可以直接在分布式文件系統里查:
    [chenlb@master hadoop-0.17.1]$ bin/hadoop dfs -cat output/*

    成功運行后可以關閉它了:
    [chenlb@master hadoop-0.17.1]$ bin/stop-all.sh

    我在第2階段,出了些問題:output已經存在,要先刪除它(第二次運行前,可以不用output)。

    下一篇講:Fully-Distributed Mode http://www.tkk7.com/chenlb/archive/2008/08/11/221314.html
  • posted on 2008-08-11 15:28 流浪汗 閱讀(4951) 評論(2)  編輯  收藏 所屬分類: Lucene

    評論:
    # re: Hadoop 快速入門 2009-04-28 11:03 | 隔葉黃鶯
    想問一下,博主在使用 Hadoop 有實際的應用嗎?用在哪些方面的。  回復  更多評論
      
    # re: Hadoop 快速入門 2009-04-28 13:21 | 流浪汗
    @隔葉黃鶯
    沒有實際的經驗,那時公司打算要用,后來就不用了。想用在分布式索引。

    后來也就沒時間繼續學習它了。  回復  更多評論
      
    主站蜘蛛池模板: 久久久久亚洲AV成人网| 亚洲欧洲国产视频| 亚洲人色大成年网站在线观看| 亚洲精品视频免费| 成人无码精品1区2区3区免费看| 最近免费中文字幕高清大全| 亚洲 日韩 色 图网站| 曰批免费视频播放在线看片二| 小日子的在线观看免费| 乱爱性全过程免费视频| 国产曰批免费视频播放免费s| 免费毛片a线观看| 亚洲高清无码在线观看| 日韩亚洲人成在线| 久久国产免费福利永久| 狠狠亚洲婷婷综合色香五月排名| 国产精品亚洲专区在线观看| 最近中文字幕完整版免费高清| 免费在线观看a级毛片| 亚洲色少妇熟女11p| 成人黄软件网18免费下载成人黄18免费视频| 免费a在线观看播放| 亚洲欧洲自拍拍偷综合| 久久99热精品免费观看牛牛| 中文字幕亚洲天堂| 午夜不卡AV免费| 精品免费国产一区二区三区| 亚洲综合激情六月婷婷在线观看| 国产在线观看免费视频软件| 国产成人亚洲精品影院| 中文在线日本免费永久18近| 亚洲国产精品无码av| 99re这里有免费视频精品| 久久亚洲熟女cc98cm| 妻子5免费完整高清电视| 亚洲熟妇无码av另类vr影视| 亚洲国产精品一区二区三区久久| 和老外3p爽粗大免费视频| 久久亚洲AV无码精品色午夜麻豆 | 国产在线观看xxxx免费| 亚洲无av在线中文字幕|