經驗不在于年限，在于積累---專注互聯網軟件開發

把工作當事業做，把項目當作品做！

BlogJava :: 首頁 :: 聯系 :: 聚合

:: 管理

55 Posts :: 0 Stories :: 66 Comments :: 0 Trackbacks

利用Hadoop分析BHO上報日志時，發現很多日志文件會出現下面的錯誤：

即在map結束的時候拋出Java堆棧溢出異常！

（友情提示：本博文章歡迎轉載，但請注明出處：hankchen，http://www.tkk7.com/hankchen）

首先設置下面的參數：

發現還是解決不了問題。開始懷疑代碼問題，于是進行了一系列的優化：

主要的優化是，在map和reduce程序中，重用key和value對象。但是發現還是解決不了問題。并且mapred.child.java.opts設置3G也無濟于事。

沒有辦法，只好繼續找原因。最后發現一個規律：報這個異常出錯的日志不一定是最大的日志。

只好使用最后一招了，直接分析報錯時的Java堆內存情況！

再次出現異常的時候，把集群里面所有的機器的Hadoop進程的堆內存導出來分析！

主要是下面的幾類進程：

同時，關注每臺機器的top命令輸出，可以從內存的使用情況中發現主要是哪臺機器出問題！然后重點導出這臺機器的Java堆參數！

jmap -dump:live,format=b,file=heapt0923.bin pid

剩下來的就是把/data/bhopid_output/heapt0923.bin這個文件復制到本地，利用Eclipse Memory Analyzer Tool 進行分析！

下面是分析的結果：

發現有兩個內存泄漏的情況：

1、

2、

找到根本原因：說明日志文件有這樣很大的空記錄導致的！在代碼中把這些記錄忽略掉即可！

（友情提示：本博文章歡迎轉載，但請注明出處：hankchen，http://www.tkk7.com/hankchen）

posted on 2012-03-21 17:52 hankchen 閱讀(8800) 評論(0) 編輯收藏所屬分類: 工作感悟


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: 從經理的角度看技術債務【轉】游戲數據平臺規劃線上應用故障排查系列線上應用故障排查之二：高內存占用線上應用故障排查之一：高CPU占用 jstack -F 命令在Linux 64位機器報錯：get_thread_regs failed for a lwp 給開發維護大型項目開發者的建議 zz 利用Eclipse Memory Analyzer Tool（MAT）分析內存泄漏如何學好java---JavaIDC技術總監給新進技術人員的建議 zz 工作感悟---系統優化經歷