亚洲午夜精品一区二区,亚洲欧洲日韩在线电影,国产午夜亚洲不卡

��浩 — Fri, 08 Jul 2005 08:14:00 GMT

摘要: 1.字节和unicodejava内核是unicode的，��p��class文�g也是�Q�但是很多媒体，包括文�g/��的保存方式是��用字节流的。因此java要对�q�些字节��经行�{化。char是unicode的，而byte是字节。java中byte/char互�{的函数在sun.io的包中间有。其中ByteToCharConverter�c�L��中调度，可以用来告诉你，�?.. 阅读全文

��浩 2005-07-08 16:14 发表评论

ArrayList中的数据排序--java对象排序

��浩 — Wed, 06 Jul 2005 09:59:00 GMT

ArrayList中的数据排序--java对象排序

常常遇到数组排序的问�?比如我有一个Person�c?它的实例对象存储在ArrayList数组�?现在要把ArrayList数组中的Person对象按照�q�龄排序.
其实�q�种情况�l�常遇到.
下面�l�出源代�?

1:Person.java文�g:-------------------------------
public class Person{
String name;
int age;

public Person(String name,int age){
  this.name = name;
  this.age = age;

}

public int getAge() {
return age;
}

public void setAge(int age) {
this.age = age;
}

public String getName() {
return name;
}

public void setName(String name) {
this.name = name;
}

}

2:Mycomparator.java-------------------------------
//实现Comparator接口,也就是定义排序规�?你几乎可以定义�Q何规�?BR>package com.infoearth;
import java.util.*;
public class Mycomparator implements Comparator{

public int compare(Object o1,Object o2) {
  Person p1=(Person)o1;
  Person p2=(Person)o2;
  if(p1.age   return 1;
  else
   return 0;
}

}

3:ListSort.java------------------------------------

package com.infoearth;

import java.util.ArrayList;
import java.util.Collections;
import java.util.Comparator;

public class ListSort {
public static void main(String[] args){
  ArrayList list = new ArrayList();
  list.add(new Person("lcl",28));
  list.add(new Person("fx",23));
  list.add(new Person("wqx",29));
  Comparator comp = new Mycomparator();
  Collections.sort(list,comp);
  for(int i = 0;i   Person p = (Person)list.get(i);
   System.out.println(p.getName());
  }

}

}

��浩 2005-07-06 17:59 发表评论

Java语言的异常类使用讨论 (�?

��浩 — Wed, 06 Jul 2005 03:56:00 GMT

    Java异常的语法应该是很简单的�Q�一个try�Q�catch�Q�finally�Q�一个throws�Q�throw�Q�两分钟��可学完了。我�怿�许多人和我一��P��对于异常是这样处理的�Q?BR>1.写程序时��q��~�译器检查，一旦通不�q�就加try�Q�catch;
2.自己抛异常常常忘了在�Ҏ(gu��)��声明时加throws�Q�而且又不明白��Z��么有的异帔R��要throws�Q�而有的又不需�?
3.从来不写自己的异常类�Q?BR>4.catch到异�怸�知道怎么办，通通加一行printStackTrace拉倒；
如果属于以上�q�几�U�情�늚��Q�我觉得有必要和我一赯��Z��下Java的异�怋�用方法�?/FONT>

    查阅资料可以得知�Q�Java最主要的异常类包括4�U�：Throwable、Error、Exception和RuntimeException�Q�其中Throwable是所有异常类的父�c�，它��承Object�c�dƈ实现Serializable接口�Q�Error和Exception都是Throwable的子�c�；而RuntimeException是Exception的子�c�R��Exception的子�c�非常多�Q�但是RuntimeException是一个特�D�的子类�Q�需要单独讨论�?BR>    一般当�E�序员在某个�Ҏ(gu��)��中抛��Z��个Exception异常�Q�或者其子类�Q�时�Q�需在方法头部声明此�Ҏ(gu��)��抛出了一个异常，��是用throws关键字来声明�Q�但是如果在�Ҏ(gu��)��中抛��Z��个RuntimeException或者一个Error�Ӟ��则不需要声明此�Ҏ(gu��)��抛出了异常，�q�是��Z��么呢�Q?BR>    语法上的�U�束必然有其背后的道理；如果不去弄明白这些道理而是一味的依赖�~�辑器来帮忙�Q�则事倍功半。事实上�Q�Java语言的这�U�语法含义是�Q�Java�~�译器要求Java�E�序必须捕获或声明所有非�q�行时的异常�Q�也��是��_��Exception异常是需查异常，必须��q��序员对它严格的负责，如果在方法中抛出�Q�必��d��明，如果抛出的异常没有被catch�Q�则会出现语法错误，�~�译都不能通过。这是强制性的让程序员遵守Java的异常规则。这栯��定的原因是当Exception异常出现�Ӟ��q�行的程序还有补救的余地�Q�通过异常处理代码�Q�可以让�E�序恢复�q�行�Q�如果不捕捉�q�种异常�Q�则白白��费了补救程序的��Z��。而且�Q�这�U�异常应让程序员可见�Q�所以必��d��Ҏ(gu��)��头部声明此方法抛��Z��某种Exception异常�?BR>    那么�Q�Error和RuntimeException都是不需查异常，在方法中抛出�q�两�U�异帔R��不需要声明，在程序中不catch它们也不会造成语法错误。我的理解是�Q�当出现�q�样的异常时�Q�运行的�E�序已经没有补救的余��C��Q�于是直接抛出异常让�E�序�l�束是比较合理的安排。如果在�E�序�q�行时出��C��Error或者RuntimeException�Q�那么程序员也无能�ؓ力，所以它们可以对�E�序员透明�Q�也不需要特意声明让�E�序员来处理它们�?BR>    现在我们知道�Q�try和catch一般对Exception及其子类使用�Q�throws也是。而对于Error和RuntimeException则不需要throws�Q�不�q�还是可以catch的，但是catch到它们一般也��是释放资源�Q�退出程序而已�?BR>    对于catch到的异常的处理，最�l�常犯的错误��是丢失异常�Q�catch到旧的异常抛出新的异常，�{�到�E�序出错时就找不到旧异常的信息了。其实JDK1.4已经提供了这个问题的解决�Ҏ(gu��)��Q�就是用Exception的构造函数�Ş成异帔R��Q�用旧异�怽�为参数构造新异常�Q�这样就可以在出错时一步步跟踪到所有出现过的异�怺��Q�这两个构造函数就是：
    public Exception(String message, Throwable cause) {
    super(message, cause);
    }
    public Exception(Throwable cause) {
        super(cause);
    }
    ��想到这么多�Q�以后有了新体会再箋�?/FONT>

                                                                           2005-03-02 15:40 作�? wxb_nudt

��浩 2005-07-06 11:56 发表评论

最安全的加密算�?

��浩 — Wed, 06 Jul 2005 03:11:00 GMT

在密码学里，有一�U�理想的加密�Ҏ(gu��)��Q�叫做一�ơ一密�ؕ码本�Q�one-time pad�Q��?BR>
one-time pad的算法有以下要求�Q?BR>1、密钥必��随��Z��?BR>2、密钥不能重复��?BR>3、密钥和密文的长度是一��L��?BR>
one-time pad是最安全的加密算法，双方一旦安全交换了密钥�Q�之后交换信息的�q�程��是�l�对安全的啦。这�U�算法一直在一些要求高度机密的场合使用�Q�据说美国和前苏联之间的热线�?sh��)话、前苏联的间谍都是��用One-time pad的方式加密的。不��超�U�计��机工作多久�Q�也不管多少人，用什么方法和技术，��h��多大的计��能力，都不可能破解�?BR>
一�ơ一密的一�U�实现方式，如下�Q?BR>

public class OneTimePadUtil {
    public static byte[] xor(byte[] bytes, byte[] keyBytes) {
        if (keyBytes.length != bytes.length) {
            throw new IllegalArgumentException();
        }

        byte[] resultBytes = new byte[bytes.length];

        for (int i = 0; i < resultBytes.length; ++i) {
            resultBytes[i] = (byte) (keyBytes[i] ^ bytes[i]);
        }

        return resultBytes;
    }
}

使用例子�Q?BR>

String plainText = "温少";
String keyText = "密码";

byte[] plainBytes = plainText.getBytes();
byte[] keyBytes = keyText.getBytes();

assert plainBytes.length == keyBytes.length;

//加密
byte[] cipherBytes = OneTimePadUtil.xor(plainBytes, keyBytes);

//解密
byte[] cipherPlainBytes = OneTimePadUtil.xor(cipherBytes, keyBytes);

�q�是最��单的加密��法�Q�但也是最安全的机密算法。前天和朋友讨论��C��q�个问题�Q�所以写了这��文章�?/FONT>

��浩 2005-07-06 11:11 发表评论

如何使用JCE的DES�q�行加密解密

��浩 — Wed, 06 Jul 2005 02:47:00 GMT

package sample;

import java.security.*;
import javax.crypto.*;

/**
*

Title:

*
*

Description:

*
*

Company:

*
* @author George Hill
* @version 1.0
*/

public class Test {

  // 加密使用的Key
  private SecretKey key;

  // 加密��法�Q�JCE可用DES,DESede和Blowfish
  private static final String algorithm = "DES";

  public Test() throws NoSuchAlgorithmException {
    KeyGenerator generator = KeyGenerator.getInstance(algorithm);
    key = generator.generateKey();
  }

  /**
   * 利用DES��法加密
   * @param s String 需要加密的字符�?BR>   * @return String 加密后的字符�?BR>   * @throws Exception
   */
  public String encryptData(String s) throws Exception {
    Cipher c = Cipher.getInstance(algorithm);
    c.init(Cipher.ENCRYPT_MODE, key);

    return new String(c.doFinal(s.getBytes()));
  }

  /**
   * 利用DES��法解密
   * @param s String 需要解密的字符�?BR>   * @return String 解密后的字符�?BR>   * @throws Exception
   */
  public String decryptData(String s) throws Exception {
    Cipher c = Cipher.getInstance(algorithm);
    c.init(Cipher.DECRYPT_MODE, key);

    return new String(c.doFinal(s.getBytes()));
  }

  /**
   * ��试�E�序
   * @param args String[]
   * @throws Exception
   */
  public static void main(String[] args) throws Exception {
    String s = "Hello";
    Test test = new Test();
    String encrypt = test.encryptData(s);
    System.out.println(encrypt);
    String decrypt = test.decryptData(encrypt);
    System.out.println(decrypt);
  }
}

��浩 2005-07-06 10:47 发表评论

��浩 — Tue, 05 Jul 2005 05:44:00 GMT

��目开发规�?/FONT>

一、目�?nbsp;

　　对于代码�Q�首要要求是它必��L��，能够按照�E�序员的真实思想去运行；�W�二个的要求是代码必��L��晰易懂，使别的程序员能够�Ҏ(gu��)��理解代码所�q�行的实际工作。在软�g工程领域�Q�源�E�序的风格统一标志着可维护性、可��L��，是��Y仉��目的一个重要组成部分。而目前还没有成文的编码风格文档，以致于很多时候，�E�序员没有一个共同的标准可以遵守�Q�编码风格各异，�E�序可维护性差、可��L��也很差。通过建立代码�~�写规范�Q��Ş成开发小�l�编码约定，提高�E�序的可靠性、可��L��、可修改性、可�l�护性、可�l�承性和一致性，可以保证�E�序代码的质量，�l�承软�g开发成果，充分利用资源�Q��开发�h员之间的工作成果可以�׃�n�?/FONT>

本文在参考业界已有的�~�码风格的基��上，描述了一个基�?JBuilder 的项目风��|��力求一�U�统一的编�E�风��|��q�从整体�~�码风格、代码文仉��根{��函数编写风根{��变量风根{��注释风格等几个斚w��q�行阐述。（�q�些规范�q�不是一定要�l�对遵守�Q�但是一定要让程序有良好的可��L��）

二、整体编码风�?/FONT>

1、羃�q?/FONT>

�~�进��?个空��gؓ单位。徏议在 Tools/Editor Options 中设�|?Editor ��面的Block ident�?�Q�Tab Size �?。预处理语句、全局数据、标题、附加说明、函数说明、标��L��均顶��g��写。语句块�?{"�?}"配对寚w��Q��ƈ与其前一行对齐，语句块类的语句羃�q�徏议每�?{"�?}"单独占一行，便于匹对。JBuilder 中的默认方式是开始的"{"不是单独一行，��更改成上�q�格式（�?Project/Default Project Properties 中设�|?Code Style 中选择 Braces �?Next line�Q��?/FONT>

2、空�?/FONT>

原则上变量、类、常量数据和函数在其�c�d��Q�修饰名�U�C��间适当�I�格�q�据情况寚w��。关键字原则上空一��|��如：if ( ... �{�。运��符的空��D��定如下："::"�?->"�?["�?]"�?++"�?--"�?~"�?!"�?+"�?-"�Q�指正负��P��?&"�Q�引用）�{�几个运��符两边不加�I�格�Q�其中单目运��符�p�L��与操作数相连的一边）�Q�其它运��符�Q�包括大多数二目�q�算�W�和三目�q�算�W??:"两边均加一�I�格�Q�在作函数定义时�q�可据情况多�I�或不空格来寚w��Q�但在函数实现时可以不用�?,"�q�算�W�只在其后空一��|��需寚w��时也可不�I�或多空根{��不论是否有括号�Q�对语句行后加的注释应用适当�I�格与语句隔开�q�尽可能寚w��。个��为此��可以依照个��Z��惯决定遵循与否�?/FONT>

3、对�?/FONT>

原则上关�p�d��切的行应寚w��Q�对齐包括类型、修饰、名�U�、参数等各部分对齐。另每一行的长度不应��过屏幕太多�Q�必要时适当换行�Q�换行时��可能在","处或�q�算�W�处�Q�换行后最好以�q�算�W�打��_��q�且以下各行均以该语句首行羃�q�，但该语句仍以首行的羃�q��ؓ准，卛_��其下一行�ؓ“{”应与首行对齐�?/FONT>

    变量定义最好通过��d��I�格形成寚w��Q�同一�c�d��的变量最好放在一赗��如下例所�C�：
int        Value;
int        Result;
int        Length;
DWORD      Size;
DWORD      BufSize;

个�h认�ؓ此项可以依照个�h习惯军_��遵��@与否�?/FONT>

4、空�?/FONT>

不得存在无规则的�I��Q�比如说�q�箋十个�I��。程序文件结构各部分之间�I�Z��行，若不必要也可只空一行，各函数实��C��间一般空两行�Q�由于每个函数还要有函数说明注释�Q�故通常只需�I�Z��行或不空�Q�但对于没有函数说明的情况至��应再空一行。对自己写的函数�Q�徏议也加上�?/------”做分隔。函数内部数据与代码之间应空臛_��一行，代码中适当处应以空行空开�Q�徏议在代码中出现变量声明时�Q�在其前�I�Z��行。类中四个“p”之间至��空一行，在其中的数据与函��C��间也应空行�?/FONT>

5、注�?/FONT>

注释是��Y件可��L��的具体体现。程序注释量一般占�E�序�~�码量的20%�Q��Y件工�E�要求不��于20%。程序注释不能用抽象的语�a��Q�类��g��"处理"�?循环"�q�样的计��机抽象语言�Q�要�_��表达出程序的处理说明。例如："计算净需�?�?计算�W�一道工序的加工工时"�{�。避免每行程序都使用注释�Q�可以在一�D늨�序的前面加一�D�|��释，��h��明确的处理逻辑�?/FONT>

注释必不可少�Q�但也不应过多，不要被动的�ؓ写注释而写注释。以下是四种必要的注释：

A. 标题、附加说明�?/FONT>

B. 函数、类�{�的说明。对几乎每个函数都应有适当的说明，通常加在函数实现之前�Q�在没有函数实现部分的情况下则加在函数原型前�Q�其内容主要是函数的功能、目的、算法等说明�Q�参数说明、返回��D��明等�Q�必要时�q�要有一些如特别的��Y��g要求�{�说明。公用函数、公用类的声明必��ȝ��注解说明其��用方法和设计思�\�Q�当焉��择恰当的命名格式能够帮助你把事情解释得更清楚�?/FONT>

C. 在代码不明晰或不可移植处必须有一定的说明�?/FONT>

D. 及少量的其它注释�Q�如自定义变量的注释、代码书写时间等�?/FONT>

注释有块注释和行注释两种�Q�分别是指："/**/"�?//"��对A用块注释�Q�D用行注释�Q�B、C则视情况而定�Q�但应统一�Q�至��在一个单元中B�c�L��释�Ş式应�l�一。具体对不同文�g、结构的注释会在后面详细说明�?/FONT>

6、代码长�?/FONT>

对于每一个函数徏议尽可能控制其代码长度�ؓ53行左叻I��过53行的代码要重新考虑��其拆分��Z��个或两个以上的函数。函数拆分规则应该一不破坏原有算法�ؓ基础�Q�同时拆分出来的部分应该是可以重复利用的。对于在多个模块或者窗体中都要用到的重复性代码，完全可以��v独立成�ؓ一个具备公用性质的函敎ͼ�攄��于一个公用模块中�?/FONT>

7、页�?/FONT>

��宽应该讄��?0字符。源代码一般不会超�q�这个宽�? �q�导致无法完整显�C? 但这一讄��也可以灵�z�调�? 在�Q何情况下, ��长的语句应该在一个逗号或者一个操作符后折�? 一条语句折行后, 应该比原来的语句再羃�q?个字�W?

8、行�?/FONT>

一般的集成�~�程环境下，每屏大概只能昄��不超�q?0行的�E�序�Q�所以这个函数大概要5-6屏显�C�，在某些环境下�?屏左��x��能显�C�完。这样一来，无论是读�E�序�q�是修改�E�序�Q�都会有困难。因此徏议把完成比较独立功能的程序块抽出�Q�单独成��Z��个函数。把完成相同或相�q�功能的�E�序块抽出，独立��Z��个子函数。可以发玎ͼ��是上层的函数越��单，��是调用几个子函敎ͼ��是底层的函数完成的��是具体的工作。这是好�E�序的一个标志。这��P��我们��可以在较上层函数里�Ҏ(gu��)��控制整个�E�序的逻辑�Q�而在底层的函数里专注于某斚w��的功能的实现了�?/FONT>

三、代码文仉��?/FONT>

所有的 Java(*.java) 文�g都必��遵守如下的样式规则�Q?/FONT>

. 文�g生成

对于规范�?JAVA �z��c�，��量�?JBuilder �?Object Gallery 工具来生成文件格式，避免用手工制作的头文�?实现文�g�?BR>
. package/import

package 行要�?import 行之前，import 中标准的包名要在本地的包名之前，而且按照字母��序排列。如�?import 行中包含了同一个包中的不同子目录，则应该用 * 来处理�?

package hotlava.net.stats;

import java.io.*;
import java.util.Observable;
import hotlava.util.Application;

�q�里 java.io.* 使用来代替InputStream and OutputStream 的�?/FONT>

. 文�g头部注释

文�g头部注释主要是表明该文�g的一些信息，是程序的��M��说明�Q�可以增强程序的可读性和可维护性。文件头部注释一般位�?package/imports 语句之后�Q�Class 描述之前。要求至��写出文件名、创��、创建时间和内容描述。JBuilder �?Object Gallery 工具生成的代码中会在�c�R��工�E�文件中�{�自动添加注释，我们也要��d��一些注释，其格式应该尽量约束如下：

/**
* Title: ��定鼠标位置�c?BR> * Description: ��定鼠标当前在哪个作业栏位中�q�返回作业号
* @Copyright: Copyright (c) 2002
* @Company: HIT
* @author: rivershan
* @version: 1.0
* @time: 2002.10.30
*/

. Class

接下来的是类的注释，一般是用来解释�cȝ��?

/**
* A class representing a set of packet and byte counters
* It is observable to allow it to be watched, but only
* reports changes when the current set is complete
*/

接下来是�c�d��义，包含了在不同的行�?extends �?implements

public class CounterSet
extends Observable
implements Cloneable

.Class Fields

接下来是�cȝ��成员变量�Q?

/**
* Packet counters
*/

protected int[] packets;

public 的成员变量必��ȝ��成文档（JavaDoc�Q�。proceted、private�?package 定义的成员变量如果名字含义明��的话，可以没有注释�?/FONT>

. 存取�Ҏ(gu��)��

接下来是�c�d��量的存取的方法。它只是��单的用来��类的变量赋��D��取值的话，可以��单的写在一行上。（个�h认�ؓ��量分行写）

/**
* Get the counters
* @return an array containing the statistical data. This array has been
* freshly allocated and can be modified by the caller.
*/

public int[] getPackets()
{
return copyArray(packets, offset);
}

public int[] getBytes()
{
return copyArray(bytes, offset);
}

public int[] getPackets()
{
return packets;
}

public void setPackets(int[] packets)
{
this.packets = packets;
}

其它的方法不要写在一行上

. 构造函�?

接下来是构造函敎ͼ�它应该用递增的方式写�Q�比如：参数多的写在后面�Q��?

讉K��c�d��("public","private" �{?)和�Q�?static","final"�?synchronized"应该在一行中�Q��ƈ且方法和参数另写一行，�q�样可以使方法和参数更易诅R�?

public
CounterSet(int size)
{
this.size = size;
}

. 克隆�Ҏ(gu��)��

如果�q�个�c�L��可以被克隆的�Q�那么下一步就�?clone �Ҏ(gu��)��Q?

public
Object clone()
{
try
   {
     CounterSet obj = (CounterSet)super.clone();
     obj.packets = (int[])packets.clone();
     obj.size = size;
     return obj;
   }
   catch(CloneNotSupportedException e)
   {
    throw new InternalError("Unexpected CloneNotSUpportedException: "
          + e.getMessage());
   }
}

. �c�L��?

下面开始写�cȝ��Ҏ(gu��)��Q?

/**
* Set the packet counters
* (such as when restoring from a database)
*/
protected final
void setArray(int[] r1, int[] r2, int[] r3, int[] r4)
throws IllegalArgumentException
{
//
   // Ensure the arrays are of equal size
   //
   if (r1.length != r2.length || r1.length != r3.length || r1.length != r4.length)
throw new IllegalArgumentException("Arrays must be of the same size";
   System.arraycopy(r1, 0, r3, 0, r1.length);
   System.arraycopy(r2, 0, r4, 0, r1.length);
}

. toString �Ҏ(gu��)��

无论如何�Q�每一个类都应该定�?toString �Ҏ(gu��)��Q?

public
String toString()
{
String retval = "CounterSet: ";
    for (int i = 0; i < data.length(); i++)
    {
       retval += data.bytes.toString();
       retval += data.packets.toString();
    }
    return retval;
}

. main �Ҏ(gu��)��

如果main(String[]) �Ҏ(gu��)��已经定义�? 那么它应该写在类的底�?

四、函数编写风�?/FONT>

. 函数的命�?/FONT>

通常�Q�函数的命名也是以能表达函数的动作意义�ؓ原则的，一般是由动词打��_��然后跟上表示动作对象的名词，各单词的首字母应该大写。另外，�q�有一些函数命名的通用规则。如取数�Q�则用Get打头�Q�然后跟上要取的对象的名字；讄��敎ͼ�则用Set打头�Q�然后跟上要讄��对象的名字；而对象中��Z��响应消息�q�行动作的函敎ͼ�可以命名为On打头�Q�然后是相应的消息的名称�Q�进行主动动作的函数�Q�可以命名�ؓDo打头�Q�然后是相应的动作名�U�。类似的规则�q�有很多�Q�需要程序员多读优秀的程序，逐渐�U�篏�l�验�Q�才能作出好的函数命名�?/FONT>

. 函数注释

�pȝ��自动生成的函敎ͼ�如鼠标动作响应函数等�Q�不必太多的注释和解释；

对于自行�~�写的函敎ͼ�若是�pȝ��关键函数�Q�则必须在函数实现部分的上方标明该函数的信息�Q�格式如下：

/**
* 函数名：
* �~�写者：
* 参考资料：
* �?nbsp; 能：
* 输入参数�Q?BR>* 输出参数�Q?BR>* �?nbsp; 注：
*/

希望��量遵��@以上格式�?/FONT>

五、符号风�?/FONT>

. ��M��要求

对于各种�W�号的定义，都有一个共通点�Q�就是应该��用有实际意义的英文单词或英文单词的羃写，不要使用��单但没有意义的字�Ԍ��可能不使用阿拉伯数字，更切忌��用中文拼音的首字母。如�q�样的名�U�是不提倡的�Q�Value1,Value2,Value3,Value4 …�?/FONT>

例如�Q?BR>file(文�g),code(�~�号),data(数据),pagepoint(��面指针), faxcode(传真�? ,address(地址),bank(开户银�?,…�?/FONT>

. 变量名称

变量命名由（前缀+修饰语）构成。现在比较流行的是一套由微��Y的一个匈牙利软�g工程师首先��用，�q�且在微软推�q�开来，现在被称之�ؓ匈牙利命名法的命名规则。匈牙利命名法规定，使用表示标识�W�所对应的变量类型的英文��写�~�写作�ؓ标识�W�的前缀�Q�后面在使用表示变量意义的英文单词或�~�写�q�行命名。下面是匈牙利命名法中的一些命名方式：

�Q?�Q�生存期修饰�Q�用l(local)表示局域变量，p(public)表示全局变量�Q�s(send)表示参数变量

�Q?�Q�类型修饎ͼ�用s(AnsiString)表示字符�?c(char)表示字符,n(number)数�?i(intger)表示整数,d(double)表示双精�?f(float)��点�?b(bool)布尔�?d(date)表示日期�?

例如�Q?BR>li_length表示整�Ş的局域变�?是用来标识长度的.ls_code表示字符型的局域变�?用来标识代码.

. 控�g名称

控�g命名由（前缀+修饰语）构成。前�~�即�ؓ控�g的名�U��?/FONT>

按钮变量 Button+Xxxxxxx 例如�Q�ButtonSave,ButtonExit,ButtonPrint�{?BR>题标变量 Label+Xxxxxxxx 例如�Q�LabelName,LabelSex�{?BR>数据表变�?Table+Xxxxxx 例如�Q�TableFile,TableCount�{?BR>查询变量 Query+Xxxxxx 例如�Q�QueryFile,QueryCeneter�{?BR>数据源变�?DataSource+Xxx 例如�Q�DataSourceFile,DataSourceCenter�{?BR>。。。。。。。。。。。。。。。�?BR>(注：对于与表有关的控件“修饰语”部分最好直接用表名�?

. Package 的命�?

Package 的名字应该都是由一个小写单词组成�?

. Class 的命�?

Class 的名字必��ȝ��一个或��C��能表达该�cȝ��意思的大写字母开头而其它字母都��写的单词或�~�写�l�成�Q�这栯��使这�?Class 的名�U�能更容易被理解�?/FONT>

. Class 变量的命�?

变量的名字必��ȝ��一个小写字母开头。后面的单词用大写字母开头。对于类的成员变量，在对其标识符命名�Ӟ��要加上代表member�Q�成员）的前�~�m_。例如一个标识符为m_dwFlag�Q�则它表�C�的变量是一个类型�ؓ双字的成员变量，它是代表一个标志�?/FONT>

. Static Final 变量的命�?

Static Final 变量的名字应该都大写�Q��ƈ且指出完整含义�?

. 参数的命�?

参数的名字必��d��变量的命名规范一致�?

. 数组的命�?

数组应该��L��用下面的方式来命名：
byte[] buffer;

而不是：
byte buffer[];

. �Ҏ(gu��)��的参�?BR>
使用有意义的参数命名�Q�如果可能的话，使用和要赋值的字段一��L��名字�Q?

SetCounter(int size)
{
this.size = size;
}

. ��秘的数

首先要说什么是��秘的数。我们在�E�序里经�怼�用到一些量�Q�它是有特定的含义的。例如，现在我们写一个薪金统计程序，公司员工�?0人，我们在程序里��׃��?0�q�个数去�q�行各种各样的运��。在�q�里�Q?0��是"��秘的数"。�ؓ什么称它�ؓ��秘呢？因�ؓ别的�E�序员在�E�序里看�?0�q�个敎ͼ�不知道它的含义，只能靠猜了�?/FONT>

在程序里出现"��秘的数"会降低程序的可读性，应该��量避免。避免的�Ҏ(gu��)��是把��秘的数定义��Z��个常量。注意这个常量的命名应该能表达该数的意义�Q��ƈ且应该全部大写，以与对应于变量的标识�W�区别开来。例如上�?0�q�个敎ͼ�我们可以定义��Z��个名为NUMOFEMPLOYEES的常量来代替。这��P��别的�E�序员在�ȝ��序的时候就可以�Ҏ(gu��)��理解了�?/FONT>

六、程序编写风�?/FONT>

. exit()

exit 除了�?main 中可以被调用外，其他的地方不应该调用。因��样做不给��M��代码代码��Z��来截获退出。一个类似后台服务地�E�序不应该因为某一个库模块军_��了要退出就退出�?

. 异常

��x��的错误应该抛��Z��个RuntimeException或者派生的异常�?
��层的main()函数应该截获所有的异常�Q��ƈ且打华ͼ�或者记录在日志中）在屏�q�上�?

. 垃圾攉��

JAVA使用成熟的后台垃圾收集技术来代替引用计数。但是这样会��D��一个问题：你必��d��使用完对象的实例以后�q�行清场工作。比如一个prel的程序员可能�q�么写：

...
{
FileOutputStream fos = new FileOutputStream(projectFile);
project.save(fos, "IDE Project File";
}
...

除非输出��一��Z��用域��关闭，非引用计数的�E�序语言�Q�比如JAVA�Q�是不能自动完成变量的清场工作的。必��象下面一样写�Q?

FileOutputStream fos = new FileOutputStream(projectFile);
project.save(fos, "IDE Project File";
fos.close();

. Clone

下面是一�U�有用的�Ҏ(gu��)��Q?
implements Cloneable

public
Object clone()
{
try
{
ThisClass obj = (ThisClass)super.clone();
obj.field1 = (int[])field1.clone();
obj.field2 = field2;
return obj;
}
catch(CloneNotSupportedException e)
{
throw new InternalError("Unexpected CloneNotSUpportedException: " + e.getMessage());
}
}

. final �c?

�l�对不要因�ؓ性能的原因将�c�d��义�ؓ final 的（除非�E�序的框架要求）
如果一个类�q�没有准备好被��承，最好在�c�L��档中注明�Q�而不要将她定义�ؓ final 的。这是因为没有�h可以保证会不会由于什么原因需要��承她�?BR>
. 讉K��cȝ��成员变量

大部分的�c�L��员变量应该定义�ؓ protected 的来防止�l�承�c�M��用他们�?
注意�Q�要�?int[] packets"�Q�而不�?int packets[]"�Q�后一�U�永�q�也不要用�?

public void setPackets(int[] packets)
{
this.packets = packets;
}
CounterSet(int size)
{
this.size = size;
}

. byte 数组转换�?characters

��Z��?byte 数组转换�?characters�Q�你可以�q�么做：

"Hello world!".getBytes();

. Utility �c?

Utility �c�（仅仅提供�Ҏ(gu��)��的类�Q�应该被��x��为抽象的来防止被�l�承或被初始化�?

. 初始�?BR>
下面的代码是一�U�很好的初始化数�l�的�Ҏ(gu��)��Q?

objectArguments = new Object[]
{
arguments
};

. 枚�D�c�d��

JAVA �Ҏ(gu��)��丄��支持不好�Q�但是下面的代码是一�U�很有用的模板：

class Colour
{
   public static final Colour BLACK = new Colour(0, 0, 0);
   public static final Colour RED = new Colour(0xFF, 0, 0);
   public static final Colour GREEN = new Colour(0, 0xFF, 0);
   public static final Colour BLUE = new Colour(0, 0, 0xFF);
   public static final Colour WHITE = new Colour(0xFF, 0xFF, 0xFF);
}

�q�种技术实��C��RED, GREEN, BLUE �{�可以象其他语言的枚丄��型一样��用的帔R��?他们可以�?'==' 操作�W�来比较�?
但是�q�样使用有一个缺��P��如果一个用��L��q�样的方法来创徏颜色 BLACK

new Colour(0,0,0)

那么�q�就是另外一个对象，'=='操作�W�就会��生错误。她�?equal() �Ҏ(gu��)��仍然有效。由于这个原因，�q�个技术的�~�陷最好注明在文档中，或者只在自��q��包中使用�?/FONT>

. 混合使用 AWT �?Swing �l��g

如果要将 AWT �l��g�?Swing �l��g混合��h��使用的话�Q�请��心使用。实际上�Q�尽量不要将他们混合��h��使用�?

. 滚动�?AWT �l��g

AWT �l��g�l�对不要�?JscrollPane �c�L��实现滚动。滚�?AWT �l��g的时候一定要�?AWT ScrollPane �l��g来实现�?/FONT>

. 避免�?InternalFrame �l��g中��?AWT �l��g

��量不要�q�么做，要不然会出现不可预料的后果�?

. Z-Order 问题

AWT �l��g��L��昄��?Swing �l��g之上。当使用包含 AWT �l��g�?POP-UP 菜单的时候要��心�Q�尽量不要这样��用�?

八、性能

在写代码的时候，从头臛_��都应该考虑性能问题。这不是说时间都应该��费在优化代码上�Q�而是我们时刻应该提醒自己要注意代码的效率。比如：如果没有旉��来实��C��个高效的��法�Q�那么我们应该在文档中记录下来，以便在以后有�I�的时候再来实现她�?

不是所有的人都同意在写代码的时候应该优化性能�q�个观点的，他们认�ؓ性能优化的问题应该在��目的后期再去考虑�Q�也��是在程序的轮廓已经实现了以后�?

. 不必要的对象构�?

不要在��@环中构造和释放对象

. 使用 StringBuffer 对象

在处�?String 的时候要��量使用 StringBuffer �c�，StringBuffer �c�L��构成 String �cȝ��基础。String �c�d�� StringBuffer �c�d��装了��h��Q�（以花�Ҏ(gu��)��多时间�ؓ代�h(hu��n)�Q��ؓ开发�h员提供了一个安全的接口。当我们在构造字�W�串的时候，我们应该�?StringBuffer 来实现大部分的工作，当工作完成后��?StringBuffer 对象再�{换�ؓ需要的 String 对象。比如：如果有一个字�W�串必须不断地在其后��d��许多字符来完成构造，那么我们应该使用 StringBuffer 对象和她�?append() �Ҏ(gu��)��。如果我们用 String 对象代替 StringBuffer 对象的话�Q�会��p��许多不必要的创徏和释攑֯�象的 CPU 旉��?

. 避免太多的��?synchronized 关键�?

避免不必要的使用关键�?synchronized�Q�应该在必要的时候再使用她，�q�是一个避免死锁的好方法�?/FONT>

rivershan 原创�?002.11.5

��浩 2005-07-05 13:44 发表评论

JSP/Servlet 中的汉字�~�码问题(转）

��浩 — Tue, 05 Jul 2005 01:39:00 GMT

论坛 >> �~�程探讨阅读敎ͼ� 1735

JSP/Servlet 中的汉字�~�码问题(转）
作者：UB 旉��Q?002-06-14 10:51:10

JSP/Servlet中的汉字编码问�?1)

[作�?不详��d��旉��:�?001-9-6�?:12:47�?gt;

�?

�|�上��M��JSP/Servlet中DBCS字�W�编码问题有许多优秀的文章和讨论�Q�本文对它们作一些整理，�q�结合IBMWebSphereApplicationServer�?.5�Q�WAS�Q�的解决�Ҏ(gu��)��作一些说明，希望它不是多余的�?

内容�Q�
问题的�v源
GB2312-80�Q�GBK�Q�GB18030-2000汉字字�W�集及Encoding�?
中文转码�??'、�ؕ码的由来�?
JSP/Servlet汉字编码问题及在WAS中的解军_��法�?
�l�束�?

1.问题的��h��?

每个国�Ӟ��或区域）都规定了计算��Z��息交换用的字�W�编码集�Q�如��国的扩展ASCII�?中国的GB2312-80�Q�日本的JIS等�Q�作��国家/区域内信息处理的基础�Q�有着�l�一�~�码的重要作用。字�W�编码集按长度分为SBCS�Q�单字节字符集）�Q�DBCS�Q�双字节字符集）两大�c�R��早期的软�g�Q�尤其是操作�pȝ��Q�，��Z��解决本地字符信息的计��机处理�Q�出��C��各种本地化版本（L10N�Q�，��Z��区分�Q�引�q�了LANG,Codepage等概念。但是由于各个本地字�W�集代码范围重叠�Q�相互间信息交换困难�Q��Y件各个本地化版本独立�l�护成本较高。因此有必要��本地化工作中的共性抽取出来，作一致处理，��特别的本地化处理内定w��低到最��。这也就是所谓的国际化（I18N�Q�。各�U�语�a�信息被进一步规范�ؓLocale信息。处理的底层字符集变成了几乎包含了所有字形的Unicode。

现在大部分��h��国际化特征的软�g核心字符处理都是以Unicode�ؓ基础的，在��Y件运行时�Ҏ(gu��)��当时的Locale/Lang/Codepage设�|�确定相应的本地字符�~�码讄��Q��ƈ依此处理本地字符。在处理�q�程中需要实现Unicode和本地字符集的�怺�转换�Q�甚或以Unicode�ؓ中间的两个不同本地字�W�集的相互�{换。这�U�方式在�|�络环境下被�q�一步�g伸，��M��|�络两端的字�W�信息也需要根据字�W�集的设�|��{换成可接受的内容。

Java语�a�内部是用Unicode表�C�字�W�的�Q�遵守UnicodeV2.0。Java程序无论是�?往文�g�pȝ��以字�W�流�?写文�Ӟ��q�是往URL连接写HTML信息，或从URL连接读取参数��|��都会有字�W�编码的转换。这样做虽然增加了编�E�的复杂度，�Ҏ(gu��)��引�v��h��Q�但却是�W�合国际化的思想的。

从理��Z��来说�Q�这些根据字�W�集讄��而进行的字符转换不应该��生太多问题。而事实是�׃��应用�E�序的实际运行环境不同，Unicode和各个本地字符集的补充、完善，以及�pȝ��或应用程序实现的不规范，转码时出现的问题时时困扰着�E�序员和用户。

2.GB2312-80�Q�GBK�Q�GB18030-2000汉字字�W�集及Encoding�?

其实解决JAVA程序中的汉字编码问题的�Ҏ(gu��)��往往很简单，但理解其背后的原因，定位问题�Q�还需要了解现有的汉字�~�码和编码�{换。

GB2312-80是在国内计��机汉字信息技术发展初始阶�D�制定的�Q�其中包含了大部分常用的一、二�U�汉字，和9区的符受��该字符集是几乎所有的中文�pȝ��和国际化的��Y仉��支持的中文字�W�集�Q�这也是最基本的中文字�W�集。其�~�码范围是高�?xa1�Q?xfe�Q�低位也是0xa1-0xfe�Q�汉字从�?xb0a1开始，�l�束于0xf7fe�Q�

GBK是GB2312-80的扩展�Q�是向上兼容的。它包含了20902个汉字�Q�其�~�码范围是0x8140-0xfefe�Q�剔除高位0x80的字位。其所有字�W�都可以一对一映射到Unicode�?.0�Q�也��是说JAVA实际上提供了GBK字�W�集的支持。这是现阶段Windows和其它一些中文操作系�l�的�~�省字符集，但�ƈ不是所有的国际化��Y仉��支持该字�W�集�Q�感觉是他们�q�不完全知道GBK是怎么回事。值得注意的是它不是国家标准，而只是规范。随着GB18030-2000国标的发布，它将在不久的��来完成它的历史使命。

GB18030-2000(GBK2K)在GBK的基础上进一步扩展了汉字�Q�增加了藏、蒙�{�少数民族的字�Ş。GBK2K从�Ҏ(gu��)��上解决了字位不够�Q�字形不��的问题。它有几个特点，�?

它�ƈ没有��定所有的字�Ş�Q�只是规定了�~�码范围�Q�留待以后扩充。
�~�码是变长的�Q�其二字节部分与GBK兼容；四字节部分是扩充的字形、字位，其编码范围是首字节0x81-0xfe、二字节0x30-0x39、三字节�?x81-0xfe、四字节0x30-0x39。
它的推广是分阶段的，首先要求实现的是能够完全映射到Unicode�?.0标准的所有字形。
它是国家标准�Q�是强制性的�?
现在�q�没有�Q何一个操作系�l�或软�g实现了GBK2K的支持�Q�这是现阶段和将来汉化的工作内容。
Unicode的介绍......��免了吧。

JAVA支持的encoding中与中文�~�程相关的有�Q?有几个在JDK文档中未列出)ASCII�?-bit,同ascii7�?
ISO8859-1�?-bit,同�?859_1,ISO-8859-1,ISO_8859-1,latin1...�?
GB2312-80同gb2312,gb2312-1980,EUC_CN,euccn,1381,Cp1381,�?383,Cp1383,ISO2022CN,ISO2022CN_GB......�?
GBK�?注意大小�?,同MS936�?
UTF8UTF-8�?
GB18030�?现在只有IBMJDK1.3.?有支�?,同Cp1392,1392�?

JAVA语�a�采用Unicode处理字符.但从另一个角度来��_��在java�E�序中也可以采用非Unicode的�{码，重要的是保证�E�序入口和出口的汉字信息不失真。如完全采用ISO-8859-1来处理汉字也能达到正��的�l�果。网�l�上��行的许多解��x��法，都属于这�U�类型。�ؓ了不致引��h؜淆，本文不对�q�种�Ҏ(gu��)��作讨论。

3.中文转码�??'、�ؕ码的由来�?

两个方向转换都有可能得到错误的结果：�?

Unicode-->Byte,如果目标代码集不存在对应的代码，则得到的�l�果�?x3f.�?
如：
"\u00d6\u00ec\u00e9\u0046\u00bb\u00f9".getBytes("GBK")的�l�果是"?ìéF?ù",Hex值是3fa8aca8a6463fa8b4.�?
仔细看一下上面的�l�果�Q�你会发现\u00ec被�{换�ؓ0xa8ac,\u00e9被�{换�ؓ\xa8a6...它的实际有效位变长了！这是因为GB2312�W�号��Z��的一些符可��映射��C��些公��q��W�号�~�码�Q�由于这些符号出现在ISO-8859-1或其它一些SBCS字符集中�Q�故它们在Unicode中编码比较靠前，有一些其有效位只�?位，和汉字的�~�码重叠(其实�q�种映射只是�~�码的映��，在显�C�时仔细不是一��L��。Unicode中的符��h��单字节宽�Q�汉字中的符��h��双字节宽)�?在Unicode\u00a0--\u00ff之间这��L��W�号�?0个。了解这个特征非帔R��要！由此��׃��隄��解�ؓ什么JAVA�~�程中，汉字�~�码的错误结果中常常会出��C��些�ؕ�?其实是符号字�W?,而不全是'?'字符,就比如上面的例子�?

Byte-->Unicode,如果Byte标识的字�W�在源代码集不存在，则得到的�l�果�?xfffd.�?
如：
Byteba[>�?{(byte)0x81,(byte)0x40,(byte)0xb0,(byte)0xa1};newString(ba,"gb2312");�?
�l�果�??�?,hex值是"\ufffd\u554a".�?x8140是GBK字符�Q�按GB2312转换表没有对应的��|��取\ufffd.�?��h��意：在显�C��uniCode�Ӟ��因�ؓ没有对应的本地字�W�，所以也适用上一�U�情况，昄��Z��??".)

实际�~�程中，JSP/Servlet程序得到错误的汉字信息�Q�往往是这两个�q�程的叠加，有时甚至是两个过�E�叠加后反复作用的结�?�?

4.JSP/Servlet汉字编码问题及在WAS中的解军_��法

4.1常见的encoding问题的现象
�|�上常出现的JSP/Servletencoding问题一般都表现在browser或应用�E�序端，�?�?
��览器中看到的Jsp/Servlet页面中的汉字怎么都成了�?’?�?
��览器中看到的Servlet页面中的汉字怎么都成了�ؕ码？�?
JAVA应用程序界面中的汉字怎么都成了方块？�?
Jsp/Servlet页面无法显�C�GBK汉字。
JSP页面中内嵌�?%...%>,<%=...%>�{�Tag包含的JAVAcode中的中文成了�ؕ码，但页面的其它汉字是对的。
Jsp/Servlet不能接��~��form提交的汉字。
JSP/Servlet数据库��d��无法获得正确的内宏V�?
隐藏在这些问题后面的是各�U�错误的字符转换和处理（除第3个外�Q�是因�ؓJavafont设�|�错误引��L��Q�。解决类似的字符encoding问题，需要了解Jsp/Servlet的�q�行�q�程�Q�检查可能出现问题的各个炏V��

4.2JSP/Servletweb编�E�时的encoding问�?
�q�行于Java应用服务器的JSP/Servlet�ؓBrowser提供HTML内容，其过�E�如下图所�C�：�?
�?

其中有字�W�编码�{换的地方�?

JSP编译。Java应用服务器��根据JVM的file.encoding��D��取JSP源文�g�Q�编译生成JAVA源文�g�Q�再�Ҏ(gu��)��file.encoding值写回文件系�l�。如果当前系�l�语�a�支持GBK�Q�那么这时候不会出现encoding问题。如果是英文的系�l�，如LANG是en_US的Linux,AIX或Solaris�Q�则要将JVM的file.encoding值置成GBK。系�l�语�a�如果是GB2312�Q�则�Ҏ(gu��)��需要，��定要不要设�|�file.encoding�Q�将file.encoding设为GBK可以解��x��在的GBK字�W��ؕ码问题

Java需要被�~�译为.class才能在JVM中执行�Q�这个过�E�存在与a.同样的file.encoding问题。从�q�里开始servlet和jsp的�q�行��q��g��Q�只不过Servlet的�~�译不是自动�q�行的。对于JSP�E�序,对产生的JAVA中间文件的�~�译是自动进行的(在程序中直接调用sun.tools.javac.Main�c?.因此如果在�q�一步出现问题的�?也要检查encoding和OS的语�a�环境�Q�或者将内嵌在JSPJAVACode中的静态汉字�{为Unicode,要么静态文本输��Z��要放在JAVAcode中。对于Servlet,javac编译时手工指定-encoding参数就可以了。

Servlet需要将HTML页面内容�{换�ؓbrowser可接受的encoding内容发送出厅R��依赖于各JAVAAppServer的实现方式�Q�有的将查询Browser的accept-charset和accept-language参数或以其它猜的方式确定encoding��|��有的则不��。因此采用固定encoding也许是最好的解决�Ҏ(gu��)��。对于中文网��，可在JSP或Servlet中讄��contentType="text/html;charset=GB2312"�Q�如果页面中有GBK字符�Q�则讄��为contentType="text/html;charset=GBK"�Q�由于IE和Netscape对GBK的支持程度不一��P��作这�U�设�|�时需要测试一下�?
因�ؓ16位JAVAchar在网�l�传送时�?位会被丢弃，也�ؓ了确保Servlet��面中的汉字�Q�包括内嵌的和servlet�q�行�q�程中得到的�Q�是期望的内码，可以用PrintWriterout=res.getWriter()取代ServletOutputStreamout=res.getOutputStream().PrinterWriter将�Ҏ(gu��)��contentType中指定的charset作�{换(ContentType需在此之前指定�Q?;也可以用OutputStreamWriter��装ServletOutputStream类�q�用write(String)输出汉字字符丌Ӏ?
对于JSP�Q�JAVAApplicationServer应当能够确保在�q�个阶段��嵌入的汉字正确传送出厅R��

�q�是解释URL字�W�encoding问题。如果通过get/post方式从browser返回的参数��g��包含汉字信息�Q�servlet将无法得到正确的倹{��SUN的J2SDK中�Q�HttpUtils.parseName在解析参数时根本没有考虑browser的语言讄��Q�而是��得到的值按byte方式解析。这是网上讨论得最多的encoding问题。因��是设计缺��P��只能以bin方式重新解析得到的字符�Ԍ��或者以hackHttpUtils类的方式解冟뀂参考文章2均有介�l�，不过最好将其中的中文encodingGB2312、CP1381都改�ؓGBK�Q�否则遇到GBK汉字时�Q�还是会有问题。
ServletAPI�?.3提供一个新的函数HttpServeletRequest.setCharacterEncoding用于在调用request.getParameter(“param_name�?前指定应用�E�序希望的encoding�Q�这��有助于��d��解决�q�个问题�?
4.3IBMWebsphereApplicationServer中的解��x��法

WebSphereApplicationServer对标准的ServletAPI�?.x作了扩展，提供较好的多语言支持。运行在中文的操作系�l�中�Q�可以不作�Q何设�|�就可以很好地处理汉字。下面的说明只是对WAS是运行在英文的系�l�中�Q�或者需要有GBK支持时有效。

上述c,d情况�Q�WAS都要查询Browser的语言讄��Q�在�~�省状况下，zh,zh-cn等均被映射为JAVAencodingCP1381�Q�注意：CP1381只是等同于GB2312的一个codepage�Q�没有GBK支持）。这样做我想是因为无法确认Browser运行的操作�pȝ��是支持GB2312,还是GBK�Q�所以取其小。但是实际的应用�pȝ��q�是要求��面中出现GBK汉字，最著名的是朱�ȝ��名字中的“镕"(rong2，0xe946�Q�\u9555)�Q�所以有时还是需要将Encoding/Charset指定�ؓGBK。当��~��WAS中变更�~�省的encoding没有上面说的那么麻烦，针对a,b�Q�参考文章5�Q�在ApplicationServer的命��o行参��C��指定�?Dfile.encoding=GBK即可；针�Ԏ��d�Q�在ApplicationServer的命��o行参��C��指定-Ddefault.client.encoding=GBK。如果指定了-Ddefault.client.encoding=GBK�Q�那么c情况下可以不再指定charset。

上面列出的问题中�q�有一个关于Tag<%...%>,<%=...%>中的JAVA代码里包含的静态文本未能正��显�C�的问题�Q�在WAS中的解决�Ҏ(gu��)��是除了设�|�正��的file.encoding,还需要以相同�Ҏ(gu��)��讄��-Duser.language=zh�?Duser.region=CN。这与JAVAlocale的设�|�有兟뀂

4.4数据库��d��时的encoding问题

JSP/Servlet编�E�中�l�常出现encoding问题的另一个地�Ҏ(gu��)��d��数据库中的数据。

��行的关�p�L��据库�pȝ��都支持数据库encoding�Q�也��是说在创徏数据库时可以指定它自��q��字符集设�|�，数据库的数据以指定的�~�码形式存储。当应用�E�序讉K��数据�Ӟ��在入口和出口处都会有encoding�{换。对于中文数据�Q�数据库字符�~�码的设�|�应当保证数据的完整�?GB2312�Q�GBK�Q�UTF-8等都是可选的数据库encoding�Q�也可以选择ISO8859-1�?8-bit)�Q�那么应用程序在写数据之前须��16Bit的一个汉字或Unicode拆分成两个�?-bit的字符�Q�读数据之后则需��两个字节合�q��v来，同时�q�要判别其中的SBCS字�W�。没有充分利用数据库encoding的作用�Q�反而增加了�~�程的复杂度�Q�ISO8859-1不是推荐的数据库encoding。JSP/Servlet�~�程�Ӟ��可以先用数据库管理系�l�提供的��理功能��查其中的中文数据是否正确。

然后应当注意的是��d��来的数据的encoding�Q�JAVA程序中一般得到的是Unicode。写数据时则相反。

4.5定位问题时常用的技巧

定位中文encoding问题通常采用最�W�的也是最有效的办法——在你认为有嫌疑的程序处理后打印字符串的内码。通过打印字符串的内码�Q�你可以发现什么时候中文字�W�被转换成Unicode�Q�什么时候Unicode被�{回中文内码，什么时候一个中文字成了两个Unicode字�W�，什么时候中文字�W�串被�{成了一串问��P��什么时候中文字�W�串的高位被截掉了……

取用合适的��h��字符串也有助于区分问题的�c�d��。如�Q�”aa啊aa丂aa”�{�中��q��间、GB、GBK特征字符均有的字�W�串。一般来��_��英文字符无论怎么转换或处理，都不会失真（如果遇到了，可以��试着增加�q�箋的英文字母长度）�?

5.结束语�?

其实JSP/Servlet的中文encoding�ƈ没有惛_��的那么复杂，虽然定位和解决问题没有定规，各种�q�行环境也各不尽�Ӟ��但后面的原理是一��L��。了解字�W�集的知识是解决字符问题的基��。不�q�，随着中文字符集的变化�Q�不仅仅是java编�E�，中文信息处理中的问题�q�是会存在一�D�|��间的。

...........................UB修改�?002-06-14 10:52:07

RE:JAVA�~�程技术中汉字问题的分析及解决(�?
作者：UB 旉��Q?002-07-22 17:04:00 [修改] [回复] [删除]

JAVA�~�程技术中汉字问题的分析及解决
文章来源�Q�www.ibm.com�?
在基于Java语�a�的编�E�中�Q�我们经常碰到汉字的处理及显�C�的问题。一大堆看不懂的��q��肯定不是我们愿意看到的显�C�效果，怎样才能够让那些汉字正确昄��呢？Java语�a�默认的编码方式是UNICODE，而我们中国�h通常使用的文件和数据库都是基于GB2312或者BIG5等方式�~�码的，怎样才能够恰当地选择汉字�~�码方式�q�正��地处理汉字的编码呢�Q�本文将从汉字编码的常识入手�Q�结合Java编�E�实例，分析以上两个问题�q�提��军_��们的�Ҏ(gu��)��?

现在Java编�E�语�a�已经�q�泛应用于互联网世界�Q�早在Sun公司开发Java语�a�的时候，��已�l�考虑到对非英文字�W�的支持了。Sun公司公布的Java运行环境（JRE�Q�本�w�就分英文版和国际版�Q�但只有国际版才支持非英文字�W�。不�q�在Java编�E�语�a�的应用中�Q�对中文字符的支持�ƈ非如同JavaSoft的标准规范中所宣称的那样完��，因�ؓ中文字符集不只一个，而且不同的操作系�l�对中文字符的支持也不尽相同�Q�所以会有许多和汉字�~�码处理有关的问题在我们�q�行应用开发中困扰着我们。有很多关于�q�些问题的解�{�，但都比较琐碎�Q��ƈ不能够满��_��家迫切解决问题的愿望�Q�关于Java中文问题的�pȝ��研究�q�不多，本文从汉字编码常识出发，分析Java中文问题，希望对大家解册��个问题有所帮助�?

汉字�~�码的常�?
我们知道�Q�英文字�W�一般是以一个字节来表示的，最常用的编码方法是ASCII。但一个字节最多只能区�?56个字�W�，而汉字成千上万，所以现在都以双字节来表�C�汉字，��Z��能够与英文字�W�分开�Q�每个字节的最高位一定�ؓ1�Q�这样双字节最多可以表�C?4K格字�W�。我们经常碰到的�~�码方式有GB2312、BIG5、UNICODE等。关于具体编码方式的详细资料�Q�有兴趣的读者可以查阅相兌��料。我肤浅谈一下和我们关系密切的GB2312和UNICODE。GB2312码�Q�中华�h民共和国国家标准汉字信息交换用编码，是一个由中华人民共和国国家标准��d��发布的关于简化汉字的�~�码�Q�通行于中国大陆地区及新加坡，��U�国标码。两个字节中�Q�第一个字节（高字节）的��gؓ区号值加32�Q?0H�Q�，�W�二个字节（低字节）的��gؓ位号值加32�Q?0H�Q�，用这两个值来表示一个汉字的�~�码。UNICODE码是微软提出的解决多国字符问题的多字节�{�长�~�码�Q�它对英文字�W�采取前面加�?”字节的�{�略实现�{�长兼容。如“A”的ASCII码�?x41�Q�UNICODE就�?x00�Q?x41。利用特�D�的工具各种�~�码之间可以互相转换�?

Java中文问题的初步认识
我们��Z��Java编�E�语�a��q�行应用开发时�Q�不可避免地要处理中文。Java编�E�语�a�默认的编码方式是UNICODE�Q�而我们通常使用的数据库及文仉��是基于GB2312编码的�Q�我们经常碰到这��L��情况�Q�浏览基于JSP技术的�|�站看到的是��q��Q�文件打开后看到的也是��q��Q�被Java修改过的数据库的内容在别的场合应用时无法��l�正��地提供信息。

StringsEnglish�?“apple�?�?
StringsChinese�?“苹果�?�?
Strings�?“苹果apple�?�?

sEnglish的长度�?�Q�sChinese的长度是4�Q�而s默认的长度�?4。对于sEnglish来说�Q�Java中的各个类都支持得非常好，肯定能够正确昄��。但对于sChinese和s来��_��虽然JavaSoft声明Java的基本�c�d��l�考虑到对多国字符的支持（默认UNICODE编码）�Q�但是如果操作系�l�的默认�~�码不是UNICODE，而是国标码等。从Java源代码到得到正��的�l�果�Q�要�l�过“Java源代码->Java字节码->�?虚拟�?>操作�pȝ��->昄��讑֤�”的�q�程。在上述�q�程中的每一步骤�Q�我们都必须正确地处理汉字的�~�码�Q�才能够使最�l�的昄��l�果正确。

“Java源代码->Java字节码”，标准的Java编译器javac��用的字符集是�pȝ��默认的字�W�集�Q�比如在中文Windows操作系�l�上��是GBK�?而在Linux操作系�l�上��是ISO-8859-1�Q�所以大家会发现在Linux操作系�l�上�~�译的类中源文�g中的中文字符都出了问题，解决的办法就是在�~�译的时候添加encoding参敎ͼ��q�样才能够与�q�_��无关。用法是

javac–encodingGBK。

“Java字节码->虚拟�?>操作�pȝ��”，Java运行环境�Q�JRE�Q�分英文版和国际版�Q�但只有国际版才支持非英文字�W�。Java开发工具包（JDK�Q�肯定支持多国字符�Q�但�q��所有的计算机用户都安装了JDK。很多操作系�l�及应用软�g��Z��能够更好的支持Java，都内嵌了JRE的国际版本�Q��ؓ自己支持多国字符提供了方�ѝ�?

“操作系�l?>昄��讑֤�”，对于汉字来说�Q�操作系�l�必��L��持�ƈ能够昄��它。英文操作系�l�如果不搭配�Ҏ(gu��)��的应用��Y件的话，是肯定不能够昄��中文的。

�q�有一个问题，��是在Java编�E�过�E�中�Q�对中文字符�q�行正确的编码�{换。例如，向网��输��Z��文字�W�串的时候，不论你是用

out.println(string);�?/string是含中文的字符串

�q�是用

<%=string%>�Q�都必须作UNICODE到GBK的转换�Q�或者手动，或者自动。在JSP�?.0中，可以定义输出字符集，从而实现内码的自动转换。用法是

<%@pageContentType=”text/html;charset=gb2312”%>

但是在一些JSP版本中�q�没有提供对输出字符集的支持�Q�（例如JSP�?.92�Q�，�q�就需要手动编码输��Z��Q�方法非常多。最常用的方法是�?

Strings1�?request.getParameter(“keyword�?;�?
Strings2�?newString(s1.getBytes(“ISO-8859-1�?,”GBK�?;�?

getBytes方法用于将中文字符以“ISO-8859-1”编码方式�{化成字节数组�Q�而“GBK”是目标编码方式。我们从以ISO-8859-1方式�~�码的数据库中读��Z��文字�W�串s1，�l�过上述转换�q�程�Q�在支持GBK字�W�集的操作系�l�和应用软�g中就能够正确昄��中文字符串s2。

Java中文问题的表层分析及处�?

背景�?
开发环境JDK1.15Vcafe2.0JPadPro�?
服务器端NTIISSybaseSystemJconnect�Q�JDBC�Q�
客户端IE5.0Pwin98�?

CLASS文件存攑֜�服务器端�Q�由客户端的��览器运行APPLET，APPLET只赯��入FRAME类�{�主�E�序的作用。界面包括Textfield，TextArea�Q�List�Q�Choice等�?

I.取中文�?
用JDBC执行SELECT语句从服务器端��d��数据�Q�中文）后，��数据用APPEND方法加到TextArea�Q�TA�Q��Q�不能正��显�C�。但加到List中�Ӟ��大部分汉字却可正��显�C�。
��数据按“ISO-8859-1”�~�码方式转化为字节数�l�，再按�pȝ��~�省�~�码方式（DefaultCharacterEncoding�Q�转化为STRING，卛_��在TA和List中正确昄��。
�E�序�D�如下：�?

dbstr2�?results.getString(1);�?
//AfterreadingtheresultfromDBserver�Q�convertingittostring.�?
dbbyte1�?dbstr2.getBytes(“iso-8859-1�?;�?
dbstr1�?newString(dbbyte1);�?

在�{换字�W�串时不采用�pȝ��默认�~�码方式�Q�而直接采用“GBK”或者“GB2312”,在A和B两�U�情况下�Q�从数据库取数据都没有问题。

II.写中文到数据库�?
处理方式与“取中文”相逆，先将SQL语句按�pȝ��~�省�~�码方式转化为字节数�l�，再按“ISO-8859-1”编码方式�{化�ؓSTRING，最后送去执行�Q�则中文信息可正��写入数据库。

�E�序�D�如下：�?
sqlstmt�?tf_input.getText();�?
//BeforesendingstatementtoDBserver�Q�convertingittosqlstatement.�?
dbbyte1�?sqlstmt.getBytes();�?
sqlstmt�?newString(dbbyte1,”iso-8859-1�?;�?
_stmt�?_con.createStatement();�?
_stmt.executeUpdate(sqlstmt);�?
……

问题�Q�如果客��h��上存在CLASSPATH指向JDK的CLASSES.ZIP时�Q�称为A情况）�Q�上�q�程序代码可正确执行。但是如果客��h��只有��览器，而没有JDK和CLASSPATH时�Q�称为B情况）�Q�则汉字无法正确转换。

我们的分析：�?
1.�l�过��试�Q�在A情况下�Q�程序运行时�pȝ��的缺省编码方式�ؓGBK或者GB2312。在B情况下�Q�程序启动时��览器的JAVA控制台中出现如下错误信息：�?
Can'tfindresourceforsun.awt.windows.awtLocalization_zh_CN�?
然后�pȝ��的缺省编码方式�ؓ�?859-1”。

2.如果在�{换字�W�串时不采用�pȝ��~�省�~�码方式�Q�而是直接采用“GBK”或“GB2312”，则在A情况下�E�序仍然可正常运行，在B情况下�Q�系�l�出现错误：�?
UnsupportedEncodingException�?

3.在客��h��上，把JDK的CLASSES.ZIP解压后�Q�放在另一个目录中�Q�CLASSPATH只包含该目录。然后一辚w��步删除该目录中的.CLASS文�Ӟ��另一边运行测试程序，最后发现在一千多个CLASS文件中�Q�只有一个是必不可少的，该文件是�Q�sun.io.CharToByteDoubleByte.class。

��该文�g拷到服务器端和其它的�c�L��在一��P��q�在�E�序的开头IMPORT它�Q�在B情况下�E�序仍然无法正常�q�行。

4.在A情况下�Q�如果在CLASSPTH中��L��sun.io.CharToByteDoubleByte.class，则程序运行时��得默认�~�码方式为�?859-1”，否则为“GBK”或“GB2312”。
如果JDK的版本�?.2以上的话�Q�在B情况下遇到的问题得��C��很好的解冻I��试的步骤同上，有兴��的读者可以尝试一下。

Java中文问题的�Ҏ(gu��)��分析及解�?
在简体中文MSWindows�?8�?JDK�?.3下�Q�可以用System.getProperties()得到Java运行环境的一些基本属性，�c�PoorChinese可以帮助我们得到这些属性。
�c�PoorChinese的源代码：�?

publicclassPoorChinese{�?
publicstaticvoidmain(String[>args){�?
System.getProperties().list(System.out);�?
}�?
}�?

执行javaPoorChinese后�Q�我们会得到:�?

�pȝ��变量file.encoding的��gؓGBK，user.language的��gؓzh，user.region的��gؓCN，�q�些�pȝ��变量的值决定了�pȝ��默认的编码方式是GBK。

在上�q�系�l�中�Q�下面的代码��GB2312文件�{换成Big5文�Ӟ��它们能够帮助我们理解Java中汉字�~�码的�{�?�?

importjava.io.*;�?
importjava.util.*;�?

publicclassgb2big5{�?

staticintiCharNum=0;�?

publicstaticvoidmain(String[>args){�?
System.out.println("InputGB2312file,outputBig5file.");�?
if�?args.length!=2){�?
System.err.println("Usage:jviewgb2big5gbfilebig5file");�?
System.exit(1);�?
}�?
StringinputString�?readInput(args[0>);�?
writeOutput(inputString,args[1>);�?
System.out.println("NumberofCharactersinfile:�?+iCharNum+".");�?
}�?

staticvoidwriteOutput(Stringstr,StringstrOutFile){�?
try{�?
FileOutputStreamfos�?newFileOutputStream(strOutFile);�?
Writerout�?newOutputStreamWriter(fos,�?Big5");�?
out.write(str);�?
out.close();�?
}�?
catch�?IOExceptione){�?
e.printStackTrace();�?
e.printStackTrace();�?
}�?
}�?

staticStringreadInput(StringstrInFile){�?
StringBufferbuffer�?newStringBuffer();�?
try{�?
FileInputStreamfis�?newFileInputStream(strInFile);�?
InputStreamReaderisr�?newInputStreamReader(fis,�?GB2312");�?
Readerin�?newBufferedReader(isr);�?
intch;�?
while�?(ch�?in.read())�?gt;�?1){�?
iCharNum�?=�?;�?
buffer.append((char)ch);�?
}�?
in.close();�?
returnbuffer.toString();�?
}�?
catch�?IOExceptione){�?
e.printStackTrace();�?
returnnull;�?
}�?
}�?
}�?

�~�码转化的过�E�如下：�?

ByteToCharGB2312CharToByteBig5�?
GB2312------------------>Unicode------------->Big5�?

执行javagb2big5gb.txtbig5.txt，如果gb.txt的内容是“今天星期三”，则得到的文�gbig5.txt中的字�W�能够正��显�C�；而如果gb.txt的内容是“情��快乐”，则得到的文�gbig5.txt中对应于“节”和“乐”的字符都是�W�号“？”（0x3F�Q�，可见sun.io.ByteToCharGB2312和sun.io.CharToByteBig5这两个基本�c�dƈ没有�~�好。

正如上例一��P��Java的基本�c�M��可能存在问题。由于国际化的工作�ƈ不是在国内完成的�Q�所以在�q�些基本�c�d��布之前，没有�l�过严格的测试，所以对中文字符的支持�ƈ不像JavaSoft所声称的那样完��。前不久�Q�我的一位技术上的朋友发信给我说�Q�他�l�于扑ֈ�了JavaServlet中文问题的�Ҏ(gu��)��。两周以来，他一直�ؓJavaServlet的中文问题所困扰�Q�因为每面对一个含有中文字�W�的字符串都必须�q�行强制转换才能够得到正��的�l�果�Q�这好象是大家公认的唯一的解军_��法）。后来，他确实不惛_��此��l�安分下��M��Q�因��L��事情��实不应该是高��E�序员所要做的工作，他就扑և�Servlet解码的源代码进行分析，因�ؓ他怀疑问题就出在解码�q�部分。经�q�四个小时的奋斗�Q�他�l�于扑ֈ�了问题的�Ҏ(gu��)��所在。原来他的怀疑是正确的，Servlet的解码部分完全没有考虑双字节，直接把%XX当作一个字�W�。（原来JavaSoft也会犯�q��ُ低��的错误！�Q�
如果你对�q�个问题有兴��或者遇��C��同样的烦恼的话，你可以按照他的步骤对Servlet.jar进行修改：�?

扑ֈ�源代码HttpUtils中的staticprivateStringparseName，在返回前��sb�Q�StringBuffer�Q�复制成bytebs[>，然后returnnewString(bs,”GB2312�?。作上述修改后就需要自��p��码了�Q�

HashTableform=HttpUtils�?parseQueryString(request.getQueryString())或者
form=HttpUtils.parsePostData(…�?�?

千万别忘了编译后攑ֈ�Servlet.jar里面。

五、关于Java中文问题的�ȝ��?
Java编�E�语�a�成长于网�l�世界，�q�就要求Java对多国字符有很好的支持。Java编�E�语�a�适应了计��的�|�络化的需求，为它能够在网�l�世界迅速成长奠定了坚实的基��。Java的�~�造者�Q�JavaSoft�Q�已经考虑到Java编�E�语�a�对多国字�W�的支持�Q�只是现在的解决�Ҏ(gu��)��有很多缺陷在里面�Q�需要我们付�怸�些补偿性的措施。而世界标准化�l�织也在努力把�h�c�L��有的文字�l�一在一�U�编码之中，其中一�U�方案是ISO10646，它用四个字节来表�C�Z��个字�W�。当�Ӟ��在这�U�方案未被采用之前，�q�是希望JavaSoft能够严格地��试它的产品�Q��ؓ用户带来更多的方�ѝ��

附一个用于从数据库和�|�络中取��Z��文�ؕ码的处理函数�Q�入参是有问题的字符�Ԍ��出参是问题已�l�解决了的字�W�串。
StringparseChinese(Stringin)�?
{�?
Strings�?null;�?
bytetemp[>;�?
if�?in�?=null)�?
{�?
System.out.println("Warn:Chinesenullfounded!");�?
returnnewString("");�?
}�?
try�?
{�?
temp=in.getBytes("iso-8859-1");�?
s�?newString(temp);�?
}�?
catch(UnsupportedEncodingExceptione)�?
{�?
System.out.println�?e.toString());�?
}�?
returns;�?
}�?
�?

��浩 2005-07-05 09:39 发表评论