<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    paulwong

    Hadoop管理員的十個最佳實踐(轉(zhuǎn))

    前言
    接觸Hadoop有兩年的時間了,期間遇到很多的問題,既有經(jīng)典的NameNode和JobTracker內(nèi)存溢出故障,也有HDFS存儲小文件問題,既有任務(wù)調(diào)度問題,也有MapReduce性能問題.遇到的這些問題有些是Hadoop自身的缺陷(短板),有些則是使用的不當(dāng)。


    在解決問題的過程中,有時需要翻源碼,有時會向同事、網(wǎng)友請教,遇到復(fù)雜問題則會通過mail list向全球各地Hadoop使用者,包括Hadoop Committer(Hadoop開發(fā)者)求助。在獲得很多人幫助后,自己將遇到問題和心得整理成文,希望本文可以對那些焦頭爛額的Hadoop新手們有所幫助,少走筆者的彎路。
    PS. 本文基于 Cloudera CDH 3u4(同Apache Hadoop 1.0)編寫。相關(guān)推薦配置為官方推薦值或者筆者經(jīng)驗數(shù)值,它不是絕對的,可能會因為不同的應(yīng)用場景和硬件環(huán)境有所出入。

    1. 選擇Cloudera CDH部署你的Cluster

    動機(jī)
    大多數(shù)管理員都是從Apache Hadoop開始學(xué)習(xí)。筆者最開始也使用Apache版本Hadoop進(jìn)行開發(fā)和部署工作,但接觸到Cloudera CDH后,我發(fā)現(xiàn)它可以使管理員的工作更簡單,不僅可以獲得最新的特性和Bug修復(fù),有時也會帶來令人驚喜的性能改善。
    CDH為什么更好?筆者羅列了以下幾點(diǎn):
    CDH基于穩(wěn)定版Apache Hadoop,并應(yīng)用了最新Bug修復(fù)或者Feature的Patch。Cloudera常年堅持季度發(fā)行Update版本,年度發(fā)行Release版本,更新速度比Apache官方快,而且在實際使用過程中CDH表現(xiàn)無比穩(wěn)定,并沒有引入新的問題。
    Cloudera官方網(wǎng)站上安裝、升級文檔詳細(xì),省去Google時間。
    CDH支持Yum/Apt包,Tar包,RPM包,Cloudera Manager四種方式安裝,總有一款適合您。官方網(wǎng)站推薦Yum/Apt方式安裝,筆者體會其好處如下:   聯(lián)網(wǎng)安裝、升級,非常方便。當(dāng)然你也可以下載rpm包到本地,使用Local Yum方式安裝。
    自動下載依賴軟件包,比如要安裝Hive,則會級聯(lián)下載、安裝Hadoop。
    Hadoop生態(tài)系統(tǒng)包自動匹配,不需要你尋找與當(dāng)前Hadoop匹配的Hbase,F(xiàn)lume,Hive等軟件,Yum/Apt會根據(jù)當(dāng)前安裝Hadoop版本自動尋找匹配版本的軟件包,并保證兼容性。
    自動創(chuàng)建相關(guān)目錄并軟鏈到合適的地方(如conf和logs等目錄);自動創(chuàng)建hdfs, mapred用戶,hdfs用戶是HDFS的最高權(quán)限用戶,mapred用戶則負(fù)責(zé)mapreduce執(zhí)行過程中相關(guān)目錄的權(quán)限。

    推薦指數(shù):★★★
    推薦理由:獲取最新特性和最新Bug修復(fù);安裝維護(hù)方便,節(jié)省運(yùn)維時間。

    2. Hadoop集群配置與管理
    安裝和維護(hù)Hadoop集群涉及大量的管理工作,包括軟件安裝,設(shè)備管理(crontab、iptables等)、配置分發(fā)等。
    對于小型集群軟件分發(fā)和節(jié)點(diǎn)管理可以使用PDSH這款軟件,它可以通過免密鑰的SSH將文件分發(fā)到目標(biāo)服務(wù)器,以及為一組目標(biāo)設(shè)備發(fā)送命令并獲得反饋。如果是大型集群或者硬件配置差別很大的集群,推薦使用puppet這樣的工具幫助你維護(hù)配置文件,或者通過Cloudera Manager以GUI的方式的管理集群(注意:Clodera Manager不是開源軟件,免費(fèi)版最多支持50個節(jié)點(diǎn))。
    推薦指數(shù):★★★
    推薦理由:提高運(yùn)維效率

    3. 開啟SecondaryNameNode
    SecondaryNameNode(下稱SNN)的主要功能是工作是幫助NameNode(下稱NN)合并編輯日志,然后將合并后的鏡像文件copy回NN,以減少NN重啟時合并編輯日志所需的時間。SNN不是NN的熱備,但是通過以下步驟可以實現(xiàn)將SNN切換為NN的目的。首先,SNN節(jié)點(diǎn)上導(dǎo)入從NN Copy過來的鏡像文件,然后修改SNN機(jī)器名和IP與NN一致,最后重啟集群。
    特別注意的是SNN的內(nèi)存配置要與NN一致,因為合并編輯日志的工作需要將metadata加載到內(nèi)存完成。另外,不僅僅是SNN,任何保存NN鏡像的節(jié)點(diǎn)都可以通過上面步驟變?yōu)镹N,只是SNN更適合罷了。
    推薦指數(shù):★★★
    推薦理由:減少NN重啟導(dǎo)致集群服務(wù)中斷時間;NN節(jié)點(diǎn)故障后,SNN充當(dāng)NN角色

    4. 使用Ganglia和Nagios監(jiān)控你的集群
    當(dāng)運(yùn)行一個大型mapreduce 作業(yè)時,我們通常非常關(guān)心該作業(yè)對TaskTracker(下稱TT)CPU、內(nèi)存、磁盤,以及整個網(wǎng)絡(luò)的帶寬情況,這時候就需要Ganglia這個工具為我們生成相關(guān)圖表來診斷、分析問題。
    Ganglia可以監(jiān)控集群狀態(tài),但當(dāng)你的服務(wù)器down機(jī)或者某個TT掛掉,它卻無法通知到你,這時我們可以使用Nagios這款告警軟件,它可以配置郵件告警和短息告警。通過編寫plugins,可以實現(xiàn)自己的監(jiān)控功能。我們的集群目前做了如下監(jiān)控:
    NameNode、JobTracker內(nèi)存
    DataNode和TaskTracker運(yùn)行狀態(tài)
    NFS服務(wù)狀態(tài)
    磁盤使用情況
    服務(wù)器負(fù)載狀態(tài)
    推薦指數(shù):★★★
    推薦理由:Ganglia可以幫你記錄集群狀態(tài),方便診斷問題;Nagios可以再遇到問題時第一時間通知你。

    5. 設(shè)置好內(nèi)存至關(guān)重要
    Hadoop集群安裝完畢后,第一件事就是修改bin/hadoop-evn.sh文件設(shè)置內(nèi)存。主流節(jié)點(diǎn)內(nèi)存配置為32GB,典型場景內(nèi)存設(shè)置如下
    NN: 15-25 GB JT:2-4GB DN:1-4 GB TT:1-2 GB,Child VM 1-2 GB 集群的使用場景不同相關(guān)設(shè)置也有不同,如果集群有大量小文件,則要求NN內(nèi)存至少要20GB,DN內(nèi)存至少2GB。
    推薦指數(shù):★★★★★
    推薦理由:幾個組件中NN對內(nèi)存最為敏感,它有單點(diǎn)問題,直接影響到集群的可用性;JT同樣是單點(diǎn),如果JT內(nèi)存溢出則所有MapReduce Job都無法正常執(zhí)行。

    6. 管理員玩轉(zhuǎn)MapReduce
    Hadoop原生MapReduce需要Java語言編寫,但是不會Java也沒問題,通過Hadoop streaming框架管理員可以使用Python,Shell,Perl等語言進(jìn)行MapReduce開發(fā),但更簡單的辦法是安裝和使用Hive或者Pig。
    推薦指數(shù):★★★
    推薦理由:減少運(yùn)維時間,快速響應(yīng)各種ad-hot需求和故障診斷。

    7. NameNode HA
    前面已經(jīng)說過,NN是整個集群可能出現(xiàn)的單點(diǎn)故障。
    Hadoop通過在hdfs.site.xml文件的dfs.name.dir屬性指定保持的metadata路徑,如果希望保持到多個路徑,可以使用逗號分割配置多個路徑。
    dfs.name.dir /data/cache1/dfs/nn,/data/cache2/dfs/nn Hadoop官方推薦配置為metadata配置多個path,其中包含一個NFS的路徑。但根據(jù)筆者一次集群嚴(yán)重故障經(jīng)驗,即使這樣,還是導(dǎo)致了所有鏡像文件損壞,包括SNN上的鏡像文件,所以定期備份一個可用的副本還是很有必要的。
    推薦指數(shù):★★★★★
    推薦理由:Cloudera3uX和Apache1.0的NN單點(diǎn)問題是大家最頭痛問題之一,多些準(zhǔn)備,少許痛苦。

    8. 使用firewall阻止壞人進(jìn)入
    Hadoop的安全控制非常簡單,只包含簡單的權(quán)限,即只根據(jù)客戶端用戶名,決定使用權(quán)限。它的設(shè)計原則是:“避免好人做錯事,但不阻止壞人做壞事”。
    如果你知道某臺NN的IP和端口,則可以很輕松獲取HDFS目錄結(jié)構(gòu),并通過修改本機(jī)機(jī)器用戶名偽裝成HDFS文件所屬owner,對該文件進(jìn)行刪除操作。
    通過配置kerberos,可以實現(xiàn)身份驗證。但很多管理員使用更簡單有效的辦法——通過防火墻對訪問IP進(jìn)行控制。
    推薦指數(shù):★★★★★
    推薦理由:安全無小事,防范于未然。

    9. 開啟垃圾箱(trash)功能

    動機(jī)
    我曾經(jīng)犯下一個錯誤,在我加班非常累,大腦稍有混亂的時候,不小心刪除執(zhí)行了一個命令“hadoop fs -rmr /xxx/xxx”,沒有刪除提示,幾TB的數(shù)據(jù),一下子就沒有了。簡直讓我崩潰,后悔莫及。這時你多希望有個時間機(jī)器可以讓HDFS恢復(fù)到刪除前的狀態(tài)。
    trash功能就是這個時間機(jī)器, 它默認(rèn)是關(guān)閉的,開啟后,被你刪除的數(shù)據(jù)將會mv到操作用戶目錄的".Trash"文件夾,可以配置超過多長時間,系統(tǒng)自動刪除過期數(shù)據(jù)。這樣一來,當(dāng)操作失誤的時候,可以把數(shù)據(jù)mv回來。開啟垃圾箱步驟如下:
    vi core-site.xml ,添加下面配置,value單位為分鐘。
    fs.trash.interval 1440 筆者 在CDH3u4下不用重啟Namenode就可以生效。開啟垃圾箱后,如果希望文件直接被刪除,可以在使用刪除命令時添加“–skipTrash” 參數(shù),如下:
    hadoop fs –rm –skipTrash /xxxx推薦指數(shù):★★★★★
    推薦理由:想要時間機(jī)器嗎?

    10. 去社區(qū)尋找?guī)椭?/span>
    Hadoop是一個非常優(yōu)秀的開源項目,但它仍存有很多尚未解決的問題,諸如,NN,JT單點(diǎn)問題,JT掛死問題,Block在小文件下匯報效率低下等問題。此時可以通過如下渠道找到可以幫助你的人,筆者幾次集群嚴(yán)重故障都是通過Cloudera公司的google user group直接獲得幾位 committer的幫助。通常前一天提問,第二天就會有反饋。下面是兩個能夠幫助的你的社區(qū),當(dāng)然你也可以幫助其他人:
    Apache hadoop的mail list :
    http://hadoop.apache.org/mailing_lists.html
    Cloudera CDH google group:
    https://groups.google.com/a/cloudera.org/forum/#!forum/cdh-user
    推薦指數(shù):★★★★★
    推薦理由:沒有人比軟件作者更熟悉Hadoop本身,去社區(qū)求助,幫你解決很多自己無法跨越的問題。

    Cloudera簡介:
    公司是一家Hadoop軟件服務(wù)公司,提供免費(fèi)軟件CDH和Cloudera Manager Free Edition,同時提供Hadoop相關(guān)資訊、培訓(xùn)、技術(shù)支持等服務(wù)。Hadoop創(chuàng)始人Dong Cutting在該公司任架構(gòu)師,同時該公司擁有多名Apache Committer。

    posted on 2012-09-18 22:10 paulwong 閱讀(346) 評論(0)  編輯  收藏 所屬分類: HADOOP云計算

    主站蜘蛛池模板: 国产午夜成人免费看片无遮挡 | 亚洲精品无码成人片在线观看| 黄色一级视频免费观看| 中文字幕不卡亚洲| 青草草色A免费观看在线| 老司机午夜免费视频| 亚洲精品福利视频| 又大又粗又爽a级毛片免费看| 国产精品美女久久久免费 | 免费精品无码AV片在线观看| 亚洲精品天堂成人片AV在线播放| 中文字幕亚洲一区二区va在线| aⅴ在线免费观看| 无码毛片一区二区三区视频免费播放| 久久国产精品亚洲一区二区| 日本人的色道www免费一区| 久久精品免费电影| 特级毛片全部免费播放a一级| 亚洲欧洲在线播放| 亚洲愉拍99热成人精品热久久 | 国产大片91精品免费看3| 国产精品免费福利久久| 香港特级三A毛片免费观看| 亚洲无删减国产精品一区| 亚洲国产一区明星换脸| 久久久www成人免费毛片| a级毛片免费播放| 污污污视频在线免费观看| 亚洲色大成WWW亚洲女子| 亚洲成人在线网站| 亚洲一区二区三区在线视频| 午夜老司机免费视频| 麻花传媒剧在线mv免费观看| 国产精品综合专区中文字幕免费播放| 2019亚洲午夜无码天堂| 亚洲邪恶天堂影院在线观看| 免费女人18毛片a级毛片视频| 和日本免费不卡在线v| 日韩精品内射视频免费观看| 成在线人免费无码高潮喷水| 小说专区亚洲春色校园|