一本久久综合亚洲鲁鲁五月天,午夜亚洲国产理论片二级港台二级 ,亚洲一区二区三区在线观看精品中文

[Mac] MAC OSX快捷鍵大全

Cmd-C 復制文件

Cmd-V 粘貼文件
Option-拖動復制文件到新地址
Cmd-拖動移動并自動對齊
Cmd-Delete 刪除
Cmd-Option-拖動做替身(快捷方式)
Cmd-Shift-Delete 清空垃圾桶
Cmd-Shift-Option-Delete 強制清空垃圾桶
Tab 選定下一個項目
Shift-Tab 選定上一個項目
Return 執行默認動作
Escape 關閉對話框
Page Up 向上翻頁
向上箭頭選取上一個文件
Page Down 向下翻頁
向下箭頭選取下一個文件
Cmd-Shift-G 打開’前往文件夾’對話框
Cmd-句號 [.] 關閉對話框
Exposé 和系統的快捷
F8 切換Space
Shift-F8 慢速切換Space
F9（默認設置）使用 Exposé 顯示所有打開的窗口
F10（默認設置）使用 Exposé 在某個應用程序中顯示所有打開的窗口
F11（默認設置）使用 Exposé 隱藏所有打開的窗口并顯示桌面
Cmd-H 隱藏程序
Cmd-Option-H 隱藏其他程序
Cmd-Q 退出程序
Cmd-Shift-Q 退出所有程序并且注銷用戶
Cmd-Option-Shift-Q 強制注銷用戶
Cmd-Tab 切換到下一個應用程序
Cmd-Shift-Tab 切換到上一個應用程序
Cmd-拖動整理菜單欄
按下 Option 鍵并點按一個窗口切換窗口并隱藏當前窗口
按住 Option 并點按 Dock 圖標切換到另一個應用程序并隱藏當前應用程序
按下 Control 鍵并點按該項查看某個項的快捷（上下文）菜單
將光標移到該詞上面，然后按 Cmd-Control-D 使用 Dictionary 查看對字詞在應用程序中的定義

停止響應
Cmd-句號 [.] 停止進程
Cmd-Option-Escape 打開’強制退出’

電源鍵關機
Cmd-Option-Shift-電源鍵強制關機或重新啟動（在某些電腦上）
Cmd-Control-電源鍵強制重啟

Finder
Cmd-點擊標題查看當前窗口的路徑
Cmd-雙擊 (文件夾上) 新窗口中打開文件夾
Option-雙擊 (文件夾上) 新窗口中打開文件夾并關閉當前窗口
Cmd-1 用圖標瀏覽
Cmd-2 用列表瀏覽
Cmd-Option-向右箭頭列表模式下顯示包含的目錄
向左箭頭列表模式下關閉選定目錄
Cmd-向下箭頭在圖標或列表模式下打開選定目錄
Cmd-Option-向下箭頭在圖標或列表模式下在新窗口打開選定目錄并關閉當前窗口
Cmd-Shift-Option-向下箭頭 (慢速)在圖標或列表模式下在新窗口打開選定目錄并關閉當前窗口
Cmd-向上箭頭打開上一級目錄
Cmd-Option-向上箭頭打開上一級目錄并關閉當前目錄
Cmd-3 用分欄瀏覽
Cmd-4 用cover flow瀏覽
Cmd-Y 打開快速查看
Cmd-Option-Y 用幻燈片顯示
Cmd-Shift-H 打開用戶文件夾
Cmd-Option-Shift-向上箭頭聚焦桌面
Cmd-Shift-I 打開iDisk
Cmd-Shift-D 打開桌面
Cmd-Shift-C 打開’電腦’
Cmd-Shift-K 打開網絡
Cmd-Shift-A 打開應用程序
雙擊標題最小化窗口
Cmd-M 最小化窗口
Option-點擊按鈕應用到所有激活的窗口
按下并按住滾動條快速瀏覽長文稿
按住 Option 鍵并點按滾動條迅速在“滾動到當前位置”和“滾動到頁面”之間切換
Cmd-波浪符號 (~) 激活當前應用程序中的上一個或下一個窗口

Dock
拖動分割線自定義Dock大小
Option-拖動分割線調整Dock到合適大小
Control-點擊顯示Dock快捷菜單
Control-點擊圖標顯示項目的快捷菜單
Cmd-點擊打開圖標所在文件夾
Option-點擊切換并隱藏當前程序
Cmd-Option-點擊切換并隱藏所有程序
Cmd-Option-拖動強制程序打開文件
Cmd-Option-D 顯示/隱藏Dock

啟動
*快捷鍵只能在啟動時使用
當您看到進程指示器（看起來像旋轉的齒輪）時，請按住左邊的 Shift 鍵。防止自動登錄
聽到啟動音之后立即按住 Shift 鍵，然后當您看到進程指示器（看起來像旋轉的齒輪）時釋放該鍵。以安全模式啟動（只
有必要的 Mac OS X 項被啟動，一些功能和應用程序可能無法正常工作。）
在登錄屏幕上點按“登錄”按鈕之后，請按住 Shift 鍵。防止登錄時打開“登錄項”和 Finder 窗口
C 從光盤啟動
N 從默認的 NetBoot 磁盤映像啟動
T 以目標磁盤模式啟動
Option 選擇啟動磁盤（在某些電腦上）
Cmd-X 使用 Mac OS X 而不是 Mac OS 9 來進行啟動（如果兩者均位于同一宗卷上）
按住鼠標鍵推出可去掉的光盤
Cmd-Option-P-R 還原參數 RAM
Cmd-V 顯示詳細的狀態信息（詳細模式）
Cmd-S 以單一用戶模式啟動

Safari
Cmd-Option-F google搜索欄
Option-向上箭頭向上翻頁
Option-向下箭頭向下翻頁
Cmd-點擊鏈接在后臺用新標簽打開
Cmd-Shift-點擊鏈接打開并激活新標簽
Cmd-Option-點擊鏈接打開新窗口
Option-點擊 Close 按鈕關閉其他標簽
Cmd-Shift-] 選取下一個標簽
Cmd-Shift-[ 選取上一個標簽
Cmd-Shift-H 打開主頁
Cmd-Shift-K 切換’禁止彈出窗口’
Cmd-Option-E 清空緩存
Cmd-Option-R 不用緩存并刷新頁面
Cmd-F 查找
Cmd-M 最小化窗口
Shift-點擊按鈕慢動作動畫效果
Cmd-加號[+] 增大字體
Cmd-減號[-] 減小字體
Cmd-0 默認字體

Dashboard
使用這些快捷來處理 Dashboard 和 Dashboard widget。
F12（默認設置）顯示或隱藏 Dashboard
Cmd-R 重新載入當前 widget
Cmd-等號 (=) 顯示或隱藏 widget 欄
Cmd-向左箭頭鍵，Cmd-向右箭頭鍵滾動 widget 欄
注:要更改 Dashboard 的快捷，請選取“文件”>“系統偏好設置”，點按“Exposé & Spaces”，然后點按“Exposé”。

Front Row
您可以使用鍵盤來控制 Front Row 而無需使用 Apple Remote 遙控器。
Cmd-Esc (Escape) 打開 Front Row
Cmd-Esc 或 Esc 從打開的菜單中關閉 Front Row
向上箭頭鍵，向下箭頭鍵瀏覽菜單和列表
Cmd-Esc 或 Esc 返回上一級菜單
空格鍵或 Return 選擇菜單或列表中的項
空格鍵或 Return 播放和暫停音頻或視頻
向上箭頭鍵，向下箭頭鍵更改音量
向右箭頭鍵，向左箭頭鍵前往下一個或上一個歌曲或照片
向右箭頭鍵，向左箭頭鍵前往所播放 DVD 的下一章或上一章
右箭頭鍵，左箭頭鍵（按住按鈕）快進或倒回歌曲、視頻或 DVD
在某些 Apple 鍵盤和便攜式電腦上，您或許也可以使用特定按鍵來更改音量和控制回放。

鍵盤導航
Control-F1 打開/關閉全鍵盤控制
Control-F2 聚焦菜單欄
Control-F3 聚焦Dock
Control-F4 聚焦活躍窗口或下一個窗口
Control-F5 聚焦窗口工具欄
Control-F6 聚焦浮動窗口
Control-F7 在控制或文本框與列表之間移動
Control-F8 聚焦菜單欄中的狀態菜單
Cmd-Accent [`] 聚焦活躍應用程序的下一個窗口
Cmd-Shift-Accent [`] 聚焦活躍應用程序的上一個窗口
Cmd-Option-Accent [`] 聚焦窗口抽屜
Cmd-Option-T 顯示或隱藏字符調板

posted @ 2012-10-07 19:48 paulwong 閱讀(490) | 評論 (0) | 編輯收藏

Submitting a Hadoop MapReduce job to a remote JobTracker

Posted on August 31, 2012 by pcbje

While messing around with MapReduce code, I’ve found it to be a bit tedious having to generate the jarfile, copy it to the machine running the JobTracker, and then run the job every time the job has been altered. I should be able to run my jobs directly from my development environment, as illustrated in the figure below. This post explains how I’ve “solved” this problem. This may also help when integrating Hadoop with other applications. I do by no means claim that this is the proper way to do it, but it does the trick for me.

My Hadoop infrastructure

I assume that you have a (single-node) Hadoop 1.0.3 cluster properly installed on a dedicated or virtual machine. In this example, the JobTracker and HDFS resides on IP address 192.168.102.131.Let’s start out with a simple job that does nothing except to start up and terminate:

package com.pcbje.hadoopjobs;

import java.io.IOException;

import java.util.Date;

import java.util.Iterator;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapred.FileInputFormat;

import org.apache.hadoop.mapred.FileOutputFormat;

import org.apache.hadoop.mapred.JobClient;

import org.apache.hadoop.mapred.JobConf;

import org.apache.hadoop.mapred.MapReduceBase;

import org.apache.hadoop.mapred.Mapper;

import org.apache.hadoop.mapred.OutputCollector;

import org.apache.hadoop.mapred.Reporter;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapred.Reducer;

public class MyFirstJob {

public static void main(String[] args) throws Exception {

Configuration config = new Configuration();

JobConf job = new JobConf(config);

job.setJarByClass(MyFirstJob.class);

job.setJobName("My first job");

FileInputFormat.setInputPaths(job, new Path(args[0));

FileOutputFormat.setOutputPath(job, new Path(args[1]));

job.setMapperClass(MyFirstJob.MyFirstMapper.class);

job.setReducerClass(MyFirstJob.MyFirstReducer.class);

JobClient.runJob(job);

}

private static class MyFirstMapper extends MapReduceBase implements Mapper {

public void map(LongWritable key, Text value, OutputCollector output, Reporter reporter) throws IOException {

}

private static class MyFirstReducer extends MapReduceBase implements Reducer {

public void reduce(Text key, Iterator values, OutputCollector output, Reporter reporter) throws IOException {

}

Now, most of the examples you find online typically shows you a local mode setup where all the components of Hadoop (HDFS, JobTracker, etc) run on the same machine. A typical mapred-site.xml configuration might look like:

<name>mapred.job.tracker</name>

<value>localhost:9001</value>

</property>

</configuration>

As far as I can tell, such a configuration requires that jobs are submitted from the same node as the JobTracker. This is what I want to avoid. The first thing to do is to change the fs.default.name attribute to the IP address of my NameNode.

Configuration conf = new Configuration();

conf.set("fs.default.name", "192.168.102.131:9000");

And in core-site.xml:

<name>fs.default.name</name>

</property>

</configuration>

This tells the job to connect to the HDFS residing on a different machine. Running the job with this configuration will read from and write to the remote HDFS correctly, but the JobTracker at 192.168.102.131:9001 will not notice it. This means that the admin panel at 192.168.102.131:50030 wont list the job either. So the next thing to do is to tell the job configuration to submit the job to the appropriate JobTracker like this:

config.set("mapred.job.tracker", "192.168.102.131:9001");

You also need to change mapred-site.xml to allow external connections, this can be done by replacing “localhost” with the JobTracker’s IP address:

<name>mapred.job.tracker</name>

</property>

</configuration>

Restart hadoop.Upon trying to run your job, you may get an exception like this:

SEVERE: PriviledgedActionException as:[user] cause:org.apache.hadoop.security.AccessControlException:
org.apache.hadoop.security.AccessControlException: Permission denied: user=[user], access=WRITE, inode="mapred":root:supergroup:rwxr-xr-x

If you do, this may be solved by adding the following mapred-site.xml:

<name>mapreduce.jobtracker.staging.root.dir</name>

</property>

</configuration>

And then execute the following commands:

stop-mapred.sh
start-mapred.sh

When you now submit your job, it should be picked up by the admin page over at :50030. However, it will most probably fail and the log will be telling you something like:

java.lang.ClassNotFoundException: com.pcbje.hadoopjobs.MyFirstJob$MyFirstMapper

In order to fix this, you have to ensure that all dependencies of the submitted job are available to the JobTracker. This can be achieved by exporting the project in as a runnable jar, and then execute something like:

java -jar myfirstjob-jar-with-dependencies.jar /input/path /output/path

If your user has the appropriate permissions to the input and out directory on HDFS, the job should now run successfully. This can be verified in the console and on the administration panel.

Manually exporting runnable jars requires a lot of clicks in IDEs such as Eclipse. If you are using Maven, you can tell it to build the jar with its dependencies (See this answer for details). This would make the process a whole lot easier.Finally, to make it even easier, place a tiny bash-script in the same folder as pom.xml for building the maven project and executing the jar:

#!/bin/sh
mvn assembly:assembly
java -jar $1 $2 $3

After making the script executable, you can build and submit the job with the following command:

./build-and-run-job target/myfirstjob-jar-with-dependencies.jar /input/path

posted @ 2012-10-03 15:06 paulwong 閱讀(770) | 評論 (0) | 編輯收藏

HBASE的MAPREDUCE任務運行異常解決辦法，無需CYGWIN，純WINDOWS環境

如果是在WINDOWS的ECLIPSE中，運行HBASE的MAPREDUCE，會出現異常，這是由于默認運行MAPREDUCE任務是在本地運行，而由于會建立文件賦權限是按照UNIX的方式進行，因此會報錯：

java.lang.RuntimeException: Error while running command to get file permissions : java.io.IOException: Cannot run program "ls": CreateProcess error=2,

解決辦法是將任務發到運程主機，通常是LINUX上運行，在hbase-site.xml中加入：

<name>mapred.job.tracker</name>

<value>master:9001</value>

</property>

同時需把HDFS的權限機制關掉：

<name>dfs.permissions</name>

<value>false</value>

</property>

另外由于是在遠程上執行任務，自定義的類文件，如Maper/Reducer等需打包成jar文件上傳，具體見方案：
Hadoop作業提交分析（五）http://www.cnblogs.com/spork/archive/2010/04/21/1717592.html

研究了好幾天，終于搞清楚，CONFIGUARATION就是JOB的配置信息，遠程JOBTRACKER就是以此為參數構建JOB去執行，由于遠程主機并沒有自定義的MAPREDUCE類，需打成JAR包后，上傳到主機處，但無需每次都手動傳，可以代碼設置：

conf.set("tmpjars", "d:/aaa.jar");

另注意，如果在WINDOWS系統中，文件分隔號是“；”，生成的JAR包信息是以“；”間隔的，在遠程主機的LINUX上是無法辨別，需改為：

System.setProperty("path.separator", ":");

參考文章：
http://www.cnblogs.com/xia520pi/archive/2012/05/20/2510723.html

使用hadoop eclipse plugin提交Job并添加多個第三方jar（完美版）
http://heipark.iteye.com/blog/1171923

posted @ 2012-10-03 02:18 paulwong 閱讀(2416) | 評論 (0) | 編輯收藏

ZOOKEEPER資源

ZooKeeper實際上是一個小型的分布式文件系統，外加通知功能。

ZooKeeper典型應用場景一覽
http://www.coder4.com/archives/3856

!!!!!ZooKeeper偽分布式集群安裝及使用
http://blog.fens.me/hadoop-zookeeper-intro/

!!!ZOOPKEEPER之配置管理、分布式隊列、會話、緩存等管理
http://www.cnblogs.com/xguo/category/495322.html

ZooKeeper實現分布式隊列Queue
http://blog.fens.me/zookeeper-queue/

ZooKeeper實現分布式FIFO隊列
http://blog.fens.me/zookeeper-queue-fifo/

!基于ZooKeeper的分布式Session實現
http://blog.csdn.net/jacktan/article/details/6112806

ZOOPKEEPER和SPRING整合，作為PROPERTY數據的來源
https://github.com/james-wu-shanghai/spring-zookeeper
http://stackoverflow.com/questions/9940476/zookeeper-for-java-spring-config
https://github.com/ryantenney/zookeeper-spring

http://rdc.taobao.com/team/jm/archives/tag/zookeeper

分布式服務框架 Zookeeper -- 管理分布式環境中的數據

http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/

zookeeper

http://baike.baidu.com/view/3061646.htm

為什么要使用ZooKeeper

http://blog.csdn.net/franklysun/article/details/6424213

使用zookeeper管理多個hbase集群

http://koven2049.iteye.com/blog/1150484

Description of how HBase uses ZooKeeper

http://wiki.apache.org/hadoop/ZooKeeper/HBaseUseCases

hadoop+hbase+zookeeper集群安裝方法
http://linuxjcq.blog.51cto.com/3042600/760634

http://marysee.blog.51cto.com/1000292/629405

posted @ 2012-10-02 10:20 paulwong 閱讀(512) | 評論 (0) | 編輯收藏

HADOOP1.0.3+HBASE0.94.1偽單機環境配置實錄

1.在host中加入master 127.0.0.1

2.實現無需密碼登錄ssh

3.hadoop配置文件

core-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>



<configuration>

<property>
  <name>hadoop.tmp.dir</name>
  <value>/Users/paul/Documents/PAUL/DOWNLOAD/SOFTWARE/DEVELOP/HADOOP/hadoop-tmp-data</value>
  <description>A base for other temporary directories.</description>
</property>

<property>
  <name>fs.default.name</name>
  <value>hdfs://master:9000</value>
  <description>The name of the default file system.  A URI whose
  scheme and authority determine the FileSystem implementation.  The
  uri's scheme determines the config property (fs.SCHEME.impl) naming
  the FileSystem implementation class.  The uri's authority is used to
  determine the host, port, etc. for a filesystem.</description>
</property>

</configuration>

hdfs-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>



<configuration>

<property>
  <name>dfs.replication</name>
  <value>1</value>
  <description>Default block replication.
  The actual number of replications can be specified when the file is created.
  The default is used if replication is not specified in create time.
  </description>
</property>



</configuration>

mapred-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>



<configuration>

<property>
  <name>mapred.job.tracker</name>
  <value>master:9001</value>
  <description>The host and port that the MapReduce job tracker runs
  at. If "local", then jobs are run in-process as a single map
  and reduce task.
  </description>
</property>

<property>
<name>mapred.tasktracker.tasks.maximum</name>
<value>8</value>
<description>The maximum number of tasks that will be run simultaneously by a
a task tracker
</description>
</property>

</configuration>

masters/slaves

master

4. 格式化namenode

5. 啟動hadoop

6. hbase配置文件

hbase-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

  <property>
    <name>hbase.rootdir</name>
    <value>hdfs://master:9000/hbase</value>
  </property>

  <property>
    <name>hbase.cluster.distributed</name>
    <value>true</value>
  </property>

  <property>
    <name>hbase.zookeeper.quorum</name>
    <value>localhost</value>
  </property>

</configuration>

7. 啟動hbase

posted @ 2012-10-01 22:15 paulwong 閱讀(837) | 評論 (0) | 編輯收藏

hudson+maven+sonar+svn 快速搭建持續集成服務

http://www.tkk7.com/Nirvana/archive/2012/09/10/387404.html

http://www.tkk7.com/Nirvana/archive/2012/09/10/387408.html

posted @ 2012-09-26 23:15 paulwong 閱讀(696) | 評論 (0) | 編輯收藏

用ab命令來對 JVM進行內存分析的一個例子

1、JVM的啟動參數

我是這樣設置的：

java -Xmx1024m -Xms1024m -Xss128k -XX:NewRatio=4 -XX:SurvivorRatio=4 -XX:MaxPermSize=16m

啟動tomcat之后，使用 jmap -heap `pgrep -u root java`，得到如下信息：

Heap Configuration:

MinHeapFreeRatio = 40

MaxHeapFreeRatio = 70

MaxHeapSize = 1073741824 (1024.0MB)

NewSize = 1048576 (1.0MB)

MaxNewSize = 4294901760 (4095.9375MB)

OldSize = 4194304 (4.0MB)

NewRatio = 4

SurvivorRatio = 4

PermSize = 12582912 (12.0MB)

MaxPermSize = 16777216 (16.0MB)

Heap Usage:

New Generation (Eden + 1 Survivor Space):

capacity = 178913280 (170.625MB)

used = 51533904 (49.14656066894531MB)

free = 127379376 (121.47843933105469MB)

28.80384508070055% used

Eden Space:

capacity = 143130624 (136.5MB)

used = 51533904 (49.14656066894531MB)

free = 91596720 (87.35343933105469MB)

36.00480635087569% used

From Space:

capacity = 35782656 (34.125MB)

used = 0 (0.0MB)

free = 35782656 (34.125MB)

0.0% used

To Space:

capacity = 35782656 (34.125MB)

used = 0 (0.0MB)

free = 35782656 (34.125MB)

0.0% used

tenured generation:

capacity = 859045888 (819.25MB)

used = 1952984 (1.8625106811523438MB)

free = 857092904 (817.3874893188477MB)

0.22734338494383202% used

Perm Generation:

capacity = 12582912 (12.0MB)

used = 6656024 (6.347679138183594MB)

free = 5926888 (5.652320861816406MB)

52.897326151529946% used

------------------------------------------華麗的分割線---------------------------------------

按照這個參數來計算的話（可以參考這里：http://blog.sina.com.cn/s/blog_68158ebf0100wp83.html）

-Xmx1024m -Xms1024m -Xss128k -XX:NewRatio=4 -XX:SurvivorRatio=4 -XX:MaxPermSize=16m

-Xmx1024m 最大堆內存為 1024M

-Xms1024m 初始堆內存為 1024M

-XX:NewRatio=4

則年輕代:年老代=1:4 1024M/5=204.8M

故年輕代=204.8M 年老代=819.2M

-XX:SurvivorRatio=4

則年輕代中 2Survivor:1Eden=2:4 204.8M/6=34.13333333333333M

故 Eden=136.5333333333333M 1Suivivor=34.13333333333333M

用 jmap -heap <pid>

查看的結果與我們計算的結果一致

-----------------------------------華麗的分割線-------------------------------------------

3、編寫測試頁面

在網站根目錄里新建頁面perf.jsp，內容如下：

<%intsize = (int)(1024 * 1024 * m);byte[] buffer = new byte[size];Thread.sleep(s);%>

注：m值用來設置每次申請內存的大小，s 表示睡眠多少ms

4、使用jstat來監控內存變化

·jstat命令的用法和介紹，參考這里http://blog.sina.com.cn/s/blog_68158ebf0100woyh.html

這里使用 jstat -gcutil `pgrep -u root java` 1500 10

再解釋一下，這里有三個參數：

·pgrep -u root java --> 得到java的進程ID號

·1500 --> 表示每隔1500ms取一次數據

·10 --> 表示一共取10次數據

5、用ab來進行壓測

壓測的命令：[root@CentOS ~]# ab -c150 -n50000 "http://localhost/perf.jsp?m=1&s=10"

注：這里使用150個線程并發訪問，一共訪問50000次。

另外我做了apache與tomcat的整合，過程見：http://blog.sina.com.cn/s/blog_68158ebf0100wnvx.html

默認情況下你可以使用 http://localhost:8080/perf.jsp?m=1&s=10 來訪問。

--------------------------------------------華麗的分割線----------------------------------------

下面開始進行實驗：

·先啟動Java內存的監聽：

[root@CentOS ~]# jstat -gcutil 8570 1500 10

·在開啟一個終端，開始壓測：

[root@CentOS ~]# ab -c150 -n50000 "http://localhost/perf.jsp?m=1&s=10"

兩個命令結束之后的結果如下：

jstat：

[root@CentOS ~]# jstat -gcutil 8570 1500 10

S0 S1 E O P YGC YGCT FGC FGCT GCT

0.06 0.00 53.15 2.03 67.18 52 0.830 1 0.218 1.048

0.00 0.04 18.46 2.03 67.18 55 0.833 1 0.218 1.052

0.03 0.00 28.94 2.03 67.18 56 0.835 1 0.218 1.053

0.00 0.04 34.02 2.03 67.18 57 0.836 1 0.218 1.054

0.04 0.00 34.13 2.03 67.18 58 0.837 1 0.218 1.055

0.00 0.04 38.62 2.03 67.18 59 0.838 1 0.218 1.056

0.04 0.00 8.39 2.03 67.18 60 0.839 1 0.218 1.058

結果簡單解析：

可以看到JVM里S0和S1始終有一個是空的，Eden區達到一定比例之后就會產生Minor GC，由于我這里的Old Generation 區設置的比較大，所以沒有產生Full GC。

[root@CentOS ~]# ab -c150 -n50000 "http://localhost/perf.jsp?m=1&s=10"

This is ApacheBench, Version 2.0.40-dev <$Revision: 1.146 $> apache-2.0

Benchmarking localhost (be patient)

Completed 5000 requests

Completed 10000 requests

Completed 15000 requests

Completed 20000 requests

Completed 25000 requests

Completed 30000 requests

Completed 35000 requests

Completed 40000 requests

Completed 45000 requests

Finished 50000 requests

Server Software: Apache/2.2.3

Server Hostname: localhost

Server Port: 80

Document Path: /perf.jsp?m=1&s=10

Document Length: 979 bytes

Concurrency Level: 150

Time taken for tests: 13.467648 seconds

Complete requests: 50000

Failed requests: 0

Write errors: 0

Non-2xx responses: 50005

Total transferred: 57605760 bytes

HTML transferred: 48954895 bytes

Requests per second: 3712.60 [#/sec] (mean)

Time per request: 40.403 [ms] (mean) #平均請求時間

Time per request: 0.269 [ms] (mean, across all concurrent requests)

Transfer rate: 4177.05 [Kbytes/sec] received

Connection Times (ms)

min mean[+/-sd] median max

Connect: 0 1 46.5 0 3701

Processing: 10 38 70.3 36 6885

Waiting: 3 35 70.3 33 6883

Total: 10 39 84.4 37 6901

Percentage of the requests served within a certain time (ms)

50% 37

66% 38

75% 39

80% 39

90% 41

95% 43

98% 50

99% 58

100% 6901 (longest request)

詳細的分析見：http://blog.sina.com.cn/s/blog_68158ebf0100woyp.html

posted @ 2012-09-26 22:46 paulwong 閱讀(560) | 評論 (0) | 編輯收藏

hadoop優化

網絡帶寬
Hadoop集群的服務器在規劃時就在統一的交換機下，這是在官方文檔中建議的部署方式。

但是我們的這臺交換機和其他交換機的互聯帶寬有限，所以在客戶端遇到了HDFS訪問速度慢的問題。

把操作集群的客戶端也聯入DataNode的交換機內部，解決了這個問題。
系統參數
對ulimit -c的修改也是官方文檔建議的修改，在集群只有10臺服務器時，并沒有遇到問題。
隨著機器增加和任務增加，這個值需要改的更大。
配置文件管理
這個集群用的是Cloudera發行的版本，配置文件默認存在/etc/hadoop/conf位置。這是一個只有root才能修改的位置。

為了修改方便，我把配置文件統一保存在一臺機器上，修改后用腳本分發。保證所有服務器都是統一的配置。
mapred.tasktracker.map.tasks.maximum
這個參數控制每個TaskTracker同時運行的Map任務數。

以前的設置是和CPU核數相同的，偶爾遇到任務擠占DataNode資源的問題。

現在改成map+reduce+1==num_cpu_cores。
嚴格控制root權限
Cloudera的發行版會創建一個hadoop用戶，各種守護進程都應該以這個用戶運行。

曾經有誤操作（/usr/lib/hadoop/bin/hadoop datanode &）導致本地的數據目錄被root寫入新文件，于是正確啟動的hadoop用戶進程無法讀寫。

所以現在的集群服務器不提供日常的root權限訪問。
Java的GC模式
在mapred.child.java.opts和HADOOP_OPTS都增加了-XX:+UseConcMarkSweepGC。

JDK的文檔中推薦現代多核處理器系統，采用這種GC方式，可以充分利用CPU的并發能力。

這個改動對性能的積極影響很大。
選擇正確的JDK
這個集群有部分服務器的JDK用的是32位版本，不能創建-Xmx4g以上的進程。
統一為x64版本的JDK。
mapred.reduce.slowstart.completed.maps
這個參數控制slowstart特性的時機，默認是在5%的map任務完成后，就開始調度reduce進程啟動，開始copy過程。

但是我們的機器數量不多，有一次大量的任務堆積在JobTracker里，每個TaskTracker的map和reduce slots都跑滿了。

由于map沒有足夠資源迅速完成，reduce也就無法結束，造成集群的資源互相死鎖。
把這個參數改成了0.75，任務堆積的列表從平均10個，變成了3個。
mapred.fairscheduler.preemption
這個參數設為了true。以便fairscheduler在用戶最小資源不能滿足時，kill其他人的任務騰出足夠的資源。

集群運行著各種類型的任務，有些map任務需要運行數小時。這個參數會導致這類任務被頻繁kill，幾乎無法完成。曾經有個任務在7小時內被kill了137次。

可以通過調整fairscheduler的pool配置解決，給這種任務單獨配置一個minMap==maxMap的pool。
mapred.jobtracker.completeuserjobs.maximum
限制每個用戶在JobTracker的內存中保存任務的個數。
因為這個參數過大，我們的JobTracker啟動不到24小時就會陷入頻繁的FullGC當中。

目前改為5，JT平穩運行一天處理1500個任務，只占用800M內存。

這個參數在>0.21.0已經沒有必要設置了，因為0.21版本改造了completeuserjobs的用法，會盡快的寫入磁盤，不再內存中長期存在了。
mapred.jobtracker.update.faulty.tracker.interval和mapred.jobtracker.max.blacklist.percent
一個寫錯的任務，會導致一大批TaskTracker進入黑名單，而且要24小時才能恢復。這種狀況對中小規模的集群性能影響是非常大的。只能通過手工重啟TaskTracker來修復。所以我們就修改了部分JobTracker的代碼，暴露了兩個參數：

mapred.jobtracker.update.faulty.tracker.interval控制黑名單重置時間，默認是24小時不能改變，我們現在改成了1小時。

mapred.jobtracker.max.blacklist.percent控制進入黑名單TT的比例，我們改成了0.2。
我正在補充這兩個參數的TestCase，準備提交到trunk中。
多用hive少用streaming
由于streaming的方便快捷，我們做了很多基于它的開發。但是由于streaming的任務在運行時還要有一個java進程讀寫stdin/out，有一定的性能開銷。

類似的需求最好改用自定義的Deserializer+hive來完成。

posted @ 2012-09-24 23:28 paulwong 閱讀(820) | 評論 (0) | 編輯收藏

SPRING BATCH ADMIN安裝實錄

下載
從云端下載文件：http://s3.amazonaws.com/dist.springframework.org/release/BATCHADM/spring-batch-admin-1.2.1.RELEASE.zip
更改JOBREPOSITRY的數據庫
支持從啟動JVM時傳參數，即如果啟動JVM時傳了-DENVIRONMENT=mysql值，則讀取batch-mysql.properties文件，如未傳值，則默認讀batch-hsql.properties文件，如找不到此文件，才讀取batch-default.properties文件，因此將batch-mysql.properties等刪除，只保留default文件，里面放數據庫驅動程序等信息是開發環境時的首選做法。相關的properties文件可去http://www.springsource.org/download/community中下載。順便將JDK改成1.6，SPRING-BATCH的版本改成最新的2.1.8。
生成WAR包
先用MAVEN安裝PARENT包，再安裝ADMIN包。
部署
打開TOMCAT，將WAR包丟進去即可，如果要在ECLIPSE中調試，將此兩個PROJECT 導入到ECLIPSE中，安裝RUN-JETTY-RUN插件，即可在ECLIPSE中啟動JETTY，而MAVEN項目不用改成ECLIPSE的WEB項目，推薦！
訪問網址：http://localhost:8080/spring-batch-admin-sample。
部署JOB
將job的spring配置文件和相關class如itemreader等打成jar包，放到META-INF/spring/batch/jobs/下，則會自動顯示到UI中。

<點擊下載修改后的控制臺> <點擊下載例子>

posted @ 2012-09-23 19:36 paulwong 閱讀(3322) | 評論 (0) | 編輯收藏

SPRING資源下載

http://www.springsource.com/download/community

posted @ 2012-09-22 12:09 paulwong 閱讀(290) | 評論 (0) | 編輯收藏

僅列出標題

paulwong

My Links

Blog Stats

常用鏈接

留言簿(66)

隨筆分類(1387)

隨筆檔案(1145)

文章分類(7)

文章檔案(10)

相冊

收藏夾(2)

AI

Develop

E-BOOK

Other

養生

微服務

搜索

最新評論

閱讀排行榜

評論排行榜

60天內閱讀排行

[Mac] MAC OSX快捷鍵大全

Submitting a Hadoop MapReduce job to a remote JobTracker

HBASE的MAPREDUCE任務運行異常解決辦法，無需CYGWIN，純WINDOWS環境

ZOOKEEPER資源

HADOOP1.0.3+HBASE0.94.1偽單機環境配置實錄

hudson+maven+sonar+svn 快速搭建持續集成服務

用ab命令來對 JVM進行內存分析的一個例子

hadoop優化

SPRING BATCH ADMIN安裝實錄

SPRING資源下載