国产成人精品日本亚洲专,亚洲国产精品综合久久网络,亚洲成a人片在线观看日本

从套接字衍生到RMI代码思�\

Tue, 03 Feb 2009 13:56:00 GMT

摘要: 在上��blog中谈到RMI的问世由来只是大致的把一些概�늻�构说明了下，自己静静��x��要有好的说明�q�脆用代码说明比较妥当也最为有说明性。事后自己倒腾了一个简单的代码DEMO。代码中有个��单的场景�Q�比如你是属于某地区��M��范围内的成员�Q�到医院看病�Q�这个候医院�ؓ了审�怽�的相关个��料需要到��M��理部门调阅信息�Q�你只需要给出用户名�U�或者其他一个有... 阅读全文

叶澍�?/a> 2009-02-03 21:56 发表评论

RMI的原理和实现

Mon, 02 Feb 2009 04:04:00 GMT

�l�D��

Rmi自从JDK1.1��已�l�出��C��。而对于�ؓ什么在JAVA的世界里需要一个这�?/span> 思想理念��需要看下：RMI问世由来。其实真正在国内使用到它的比较少�Q�不�q�在前些�q�比较火�?/span>EJB��是在它的基��上进一步深化的。从本质上来�?/span>RMI的兴��h��是�ؓ了设计分布式的客戗��服务器�l�构需求而应�q�而生的，而它的这�U?/span>B/S�l�构思想能否和我们通常�?/span>JAVA�~�程更加贴切呢？�a�外之意就是能否让�q�种分布式的状态做到更加透明�Q�作为开发�h员只需要按照往�怸�样开�?/span>JAVA应用�E�序一��h��开发分布式的结构。那现在的问题是如何来划�q��个�`沟呢�Q�首先我们来分析下在JAVA世界里它的一些特点因素：

l JAVA使用垃圾攉��定对象的生命周期�?/span>

l JAVA使用异常处理来报告运行期间的错误。这里就要和我们�|�络通讯中的异常相联�p��v来了。在B/S�l�构的网�l�体�p�M��我们的这�U�错误性是非常常见的�?/span>

l JAVA�~�写的对象通过调用�Ҏ��来调用。由于网�l�通讯把我们的客户与服务器之间阻隔开了。但是代理的一�U�方式可以很好的提供一�U�这��L��假象�Q�让开发�h员或者��用者都感觉是在本地调用�?/span>

l JAVA允许一�U�高�U�的使用�c�d��载器�Q?/span>CLassLoader�Q�机制提供系�l�类路径中没有的�c�R��这话什么意思？

主要特点

上面说到了分布式的方式和我们�?/span>JAVA中如何更好的划��^�q�个鸿沟�Q�需要具备的特质�?/span>

那这里我们来看看我们所谓的RMI到底跟我们普通的JAVA�Q�或者说JavaBean�Q�存在一些什么样的差异：

l RMI�q�程异常�Q?/span>Remote Exception�Q�：在上面我们也提到了一个网�l�通讯隑օ�有一些无论是软�g�U�别的还是硬件��别的异常现象�Q�有时候这些异常或许是一�U�无法预知的�l�果。让我们开发�h�~�如何来回溯�q�种异常信息�Q�这个是我们开发�h员要兛_��的。因此在调用�q�程对象的方法中我们必须在远�E�接口中�Q�接口是一�U�规范的标准行�ؓ�Q�所以在调用的这个方法体上需要签名注明：java.rmi,RemoteException.。这也就注明了此�Ҏ��是需要调用远�E�对象的�?/span>

l ��g��?/span> �Q�当把对象作为参��C��递给一个普通的JAVA对象�Ҏ��调用�Ӟ��只是传递该对象�?strong>引用。请注意�q�里谈到的是对象�?#8220;引用”一词，如果在修改该参数的时候，是直接修改原始对象。它�q�不是所谓的一个对象的备䆾或者说拯��Q�说白了��是在本JVM内存中的对象�Q�。但是如果说使用的是RMI对象�Q�则完全是拷贝的。这与普通对象有着鲜明的对比。也正是�׃��q�种拯��的资源消耗造就了下面要说到的性能�~�失了�?/span>

l 调用开销�Q�凡是经�q�网�l�通讯理论上来说都是一�U�资源的消耗。它需要通过�~�组与反�~�组方式不断解析�c�d��象。而且RMI本��n也是一�U�需要返回值的一个过�E�定义�?/span>

l 安全�?/span>�Q�一谈到�|�络通讯势必会说到如何保证安全的�q�行�?/span>

概念定义

在开始进行原理梳理之前我们需要定义清楚几个名词。对于这些名词的理解影响到后的深入进行�?/span>

1. Stub�Q�存根，有些书上也翻译成�Q�桩基在EJB的相关书�c�中��ؓ体现�q�个意思）�Q?/span>

�q�里举例说明�q�个概念��P��或许不够恰当�Q�。例如大家因公出差后�Q�都有存在一些报销的发��或者说��票。对于你当前手头所拿到的发��ƈ不是一个唯一的，它同时还在你发生消费的地�Ҏ��一个复��C�g�Q�而这个复��C�g��是所谓的存根。但是这个存根上�q�没有很多明�l�的描述�Q�只是有一个大概的金额定义。它把很多的�l�节费用都忽略了。所以这个也是我们说的存根定义。而在我们RMI的存根定义就是��用了�q�样一个理解：在与�q�程发生通讯调用�Ӟ��把通讯调用的所有细节都通过对象的封装�Ş式给隐藏在后端。这本��n��q��?/span>OOAD的意思理��c��而暴露出来的��是我们的接口方式，而这�U�接口方式又和服务器的对象具有相同的接口�Q�这里就和我们前面�D例说的报销单据联系上了�Q�报销单据的存根不知道会有一个什么�Ş式发生具体问题，而你手执的发��具体就需要到贵公司去报销费用�Q�而这里的公司财务处就是所谓的服务器端�Q�它才是真正�q�实质性问题的。）因此作�ؓ开发�h员只需要把�_�֊�集中在业务问题的解决上，而不需要考虑复杂的分布式计算。所有这些问题都交给RMI��M��一处理�?/span>

2. Skeleton(一些书��译叫骨�Ӟ��也叫�l�构�?/span>)�Q�它的内部就是真正封装了一个类的�Ş成调用体现机制。包括我们熟知的ServerSocket创徏、接受、监听、处理等�?/span>

3. Mashalling(�~�组)�Q�在内存中的对象转换成字节流�Q�以便能够通过�|�络�q�接传输�?/span>

4. Unmashalling(反编�l?/span>)�Q�在内存中把字节��{换成对象�Q�以便本地化调用�?/span>

5. Serialization(序列�?/span>)�Q�编�l�中使用到的技术叫序列化�?/span>

6. Deserializationg(反序列化)�Q�反�~�组中��用到的技术叫反序列化�?/span>

客户�?/span>

既然我们知道stub主要是以接口的方式来暴露体现�Q��?/span>stub主要也是以代理的方式来具体实施。那�?/span>RMI中的�q�种接口有哪些特性呢�Q�（Remote Interface�Q?/span>

1) 必须扩展�Q?/span>extends�Q?/span>java.rmi.Remote接口�Q�因��E�接口�ƈ不包含�Q何一个方法，而是作�ؓ一个标记出�?/span>�Q�它��是需要告�?/span>JVM�?/span>RunTime的时候哪些是常规对象�Q�哪些属于远�E�对象。通过�q�种标识的定义能�?/span>JVM了解�c�M��哪些�Ҏ��需要编�l�，通过了编�l�的方式才能通过�|�络序列化的调用�Q?/span>

2) 接口必须�?/span>public�Q�公共）�Q�它的好处不�a�而喻的——能够方便的让所有�h员来调用�?/span>

3) 接口�Ҏ��q�需要以异常抛出�Q�例如：RemoteException�Q�，至于它的用处我们在前面也提到�q�里��׃��再复�q�ͼ�

4) 在调用一个远�E�对象期��_��q�行期间�Q�，�Ҏ��的参数和�q�回值都要必��L��可序列化的。至于�ؓ什么需要这么做�Q�这里的�~�由不用多说大家也应该清楚了解�?/span>

服务�?/span>

既然我们知道stub所做的事情是一个简单的代理转发动作�Q�那我们真正要做的对象就在服务端来做了。对于��用简单的RMI我们直接��L��定，但是往往一旦��用了RMI对象��存在非常多的远�E�方法调用，�q�个时候服务器端对于这么多的调用如何来判别或者说识别呢？�q�里��p��说到的是对于RMI实现它会创徏一个标识符�Q�以便以后的stub可以调用转发�l�服务器对象使用了，而这�U�方式我们通常叫服务器RMI的注册机制。言外之意就是让服务器端的对象注册在RMI机制中，然后可以导出让今后的stub按需来调用。那它又是如何做到这�U�方式的呢？对于RMI来说有两�U�方式可以达到这�U�效果：

a) 直接使用UnicastRemoteObject的静态方法：exportObject�Q?/span>

b) �l�承UnicastRemoteObject�c�d��~�省的构造函�?/span>exportObject�?/span>

现在大家又会问他们之间又有什么区别呢�Q�我该��用哪�U�方式来做呢�Q�这不是很难做抉择吗�Q�从一般应用场景来说区别�ƈ不是很大�Q�但是，�q�里说了“但是”哦，呵呵。大家知道��承的方式是把父类所具备的所有特质都可以完好无损的��承到子类中而对于类的总老大�Q?/span>Object来说里面有：equals()�?/span>hashCode()�?/span>toString()�{�方法。这是个什么概念呢�Q�意思就是说如果对于本地化的调用�Q�他们两个的�Ҏ��Q?/span>a,b�Q�基本区别不是很大。但是我们这里强调的RMI如果是一�U�分布式的特定场景，具备使用哈希表这�U�特性就昑־��ؓ重要了�?/span>

刚才说了服务端采用什么方法行为导出对象的。那现在导出后的对象又对应会发生什么情况呢�Q?/span>

首先被导出的对象被分配一个标识符�Q�这个标识符被保存�ؓ�Q?/span>java.rmi.server.ObjID对象中�ƈ被放��C��个对象列表中或者一个映��中。而这里的ID是一个关键字�Q�而远�E�对象则是它的一个��|��说到�q�大家有没有觉得它原理非常像HashMap的特质呢�Q�没错，其实��是使用了它的特性）�Q�这样它��可以很好的和前面创建的stub沟通。如果调用了静态方�?/span>UnicastRemoteObject.export(Remote …)�Q?/span>RMI��׃��选择��L��一个端口号�Q�但�q�只是第一调用发生在随后的exportObject每次调用都把�q�程对象导出到该�q�程对象�W�一被导出时使用的端口号。这样就不会产生混�ؕ�Q�会把先前一一导出的对象全部放入到列表中。当然如果采用的是指定端口的�Q�则按照对应昄��的调用方式��用。这里稍作强调的是一个端口可以导��Z�Q意数目的对象�?/span>

�Q�待�l?/span>……�Q?/span>

叶澍�?/a> 2009-02-02 12:04 发表评论

RMI问世由来

Mon, 02 Feb 2009 03:57:00 GMT

大家都知道对于互联网的世界网�l�通讯是其本质特征。而对于一个分布式式计��来说更是如此。在它的环境中��用了客户/服务器结构特点，使用的一个核心技术就是网�l�通讯层。在最早的OSI的概念基��上，建立了完善具体协议层。而客��h��要能够与位于其他物理层主��Z��的服务器通讯�Q�需要能够想服务器发送数据，然后以某�U�方式获得响应。这当中��q��涉到我们熟悉的协议层面了�Q�在�q�里��׃��再复�q�这些协议概念了。对于网�l�通讯来说我们所要了解的是最为常用的��是两种�q�接方式�Q�无�q�接协议�Q?/span>UDP�Q�、面向连接协议（TCP/IP�Q��?/span>

多数�|�络�~�程库中�Q�以JAVA��Z��来说明）�Q�在JAVA�q�_��中一��L��提供了这些元素。而作为面向连接协议来说��用的是套接字�Q?/span>Socket�Q�进行了更进一步的抽象描述。一般我们在JAVA的网�l�编�E�中都觉得在使用套接字这块相�Ҏ��便，它不需要你��L��多的了解操作�pȝ��的细节以及硬件的传递处理方式�?/span>TCP/IP的所有细节之处都得到了套接字的封装��用，让程序员��x��C��务层面的处理�?/span>

对象是一�U�抽象思维物质�Q�对于计��机来说它只�Ҏ��字电路的存储方式能够加以识别而且在网�l�传输当中也是一�U�信号量�Q�而这一切只有��用字节流方式传输才是真正需要做到的。所以在本地��L��与远�E�服务器的通讯传输��在对象与字节流之间不断�怺�转化才是我们真正需要的人性物质与机器所需要的。（有点墨迹了，切入整体�Q��M��来说��是需要两�U�方式来认定�q�种传输行�ؓ�Q�编�l�（Marshalling�Q�与反编�l�（Unmarshalling�Q�。而这一切的手段方式才是通过�Q�序列化�Q?/span>Serialiazable�Q�与反序列化的方式不断完成。如下图所�C�：

图：对象到字节再到对象的转换

对于数据的传输本质就是上图说明的。那我们一般是如何使用套接字来构造我们这一行�ؓ呢？对于�q�里��的主要是一�U�大致方法说明，所以只能以部分代码来说明客��L��怎么来发送这个请求�?/span>

Socket socket=new Socket("http://www.wgh.com.cn",8888);

OutputStream out=socket.getOutputStream();

ObjectOutputStream obj=new ObjectOutputStream(out);

obj.writeObject(object);

InputStream in=socket.getInputStream();

ObjectInputStream objIn=new ObjectInputStream(in);

Object objFoo=(Object)objIn.readObject();

//todo �q�里��是具体�q�行操作的相关传值参数处理了…

obj.close();

objIn.close();

socket.close();

而作为服务器的接收方则把以上数据做一个逆�{相反处理��可以。即服务器需要读取发送过来的对象数据�Q�最�l�得到结果。现在假设还是一个甚��x��多这��L��对象处理�Q�我们又要处理和以上代码差不多的�q�程。好�Q�到�q�里我们可曾惛_��N��没有一�U�办法把�q�些�q�多的重复过�E�做一个通用的方式来提供吗？我如果不惛_��做这些繁杂的对象处理可以吗？比如�Q�我想直接得刎ͼ�

//其中clientObjectji��是从客��L��传输�q�来的副本；

MyObject myObject=server.getFoo(clientObject);

�q�样��p��让我们把底层的那些庞杂数据�{换能够透明��装��h��呢？既然�q�个问题一�l�提出，那就意味着肯定有很多类似的需求。技术永�q�都是在需求的提出应运而生的。上面提出的需求就是我们要讨论的，既然我们��x��一些套接字的重复处理过�E�来个封装清理，那需要面对的问题是什么呢�Q?/span>

1. 能够把所有的相同处理�q�程全部都移入到服务端呢�Q?/span>

2. 对于客户端来说能否只预留接口行�ؓ呢？

3. 把过多的复杂处理�q�程完善的做个封装？

4. 如果以上�q�程能够形成�Q�那客户端又是如何办到可以连接到服务器端的组件行为呢�Q?/span>

既然能够把遇到的问题提出然后�ȝ��出来也就意味着我们需要去解决它。不知道是否�q?/span>

记得设计模式中有一个叫�Q�代理模式？没错�Q�就是这个代理模式开始我们的描述。代理是一个实现给定接口的对象�Q�但是不直接��L��行代码结果，而是代表其他一些对象执行实际计��的对象。怎么理解�q�个话呢�Q��D例说�Q�如今很多城市都有火车票或者飞机票的代售点�Q�这里的代售点其实就是采用了一�U�代理机制。我们想买某天的火�R或者飞机票有时候�ƈ不需要到火�R站或者飞机票的�ȝ��去购买票�Q�而是找一个你最�q�的代售点去购买。代售点��是起到一个中间桥梁的作用�Q�至于买��h员无需兛_��他们如何去订购，�q�些具体的动作都�׃��们内部去处理�Q�你只关心最�l�是否有你需要的��就行。知道这个原理接下来��好理解很多了，我们最好以�c�d��的方式来说明�q�个代理的机�Ӟ��如图所�C�：

到这里如果还觉得抽象�Q�没关系接下来我以更加脓切的实例来结合类囄��方式�l�出对应的参照说明。假如我们把上面�?/span>proxy模式再做个深入的探讨剖析�Q�结合上面说的客��L��发送参��C��求和提出的问题综�q�ͼ�。大安��知道一个接口是能够在安全甚臛_��扩展上能够帮助我们非常大的功能。作为客��L��最为希望的��是只关心我们需要的参数�Q�或者变量）、返回��|��而它如何而来�Q�做了哪些具体工作这些都不是客户端关心的�?/span>Ok,现在�l�合我们说的接口方式�Q�确实可以解册��个问题（接口的简单化�Q�没有具体实玎ͼ��Q�但是你可能会问�Q?/span>

1. 既然接口如此��单，那参数又是如何传递过�ȝ��呢？

2. 服务端又如何知道我要的是什么呢�Q?/span>

带着问题我们来解册��个问题，当然也是大家所兛_��的问题了。现在开始要对于上面�?/span>proxy模式做个深入剖析了。我们先来看一�?/span>proxy模式演变的过�E�的囄��Q?

图：RMI核心�l�构

我们可以从图�C�看��Z��传统�?/span>proxy模式变化��C��个变化的�l�构有什么不同呢�Q�对于先前我们提出的两个问题��可以很好的做出解释了：

n 既然接口如此��单，那参数又是如何传递过�ȝ��呢？

A:既然是对客户端只开接口暴露�Q�那么我们是��需要一个后台的socket来传输接口中已经定义好的参数�Q�通过参数的编�l�（序列化）方式��h��到远�E�服务上��d��应处理。这当中要求定义到对�Ҏ��务的服务名称和端口号。（�q�里也就是我们最先提到的那段代码了）

n 服务端又如何知道我要的是什么呢�Q?/span>

A:ok,既然客户端是通过socket来发送数据，那势必一定需�?/span>ServerSocket来做�q�个响应的接收处理了。问题是传过来的参数如何与我们的业务实现�c�d��联上呢？所以这个也��是skeleton的职责所在了�Q�在skeleton的封装处理中�Q�启动中��把响应实现�cȝ��嵌入�Q�聚合实现类�Q�，然后通过�c��{换处理和匚w��处理来得到需要响应的�l�果了�?/span>

本来说到�q�想大概有个收尾�Q�但是总觉得还没有把一些问题说透彻。烦性想再深入写写�?br /> 从套接字衍生到RMI代码思�\

叶澍�?/a> 2009-02-02 11:57 发表评论

Mon, 15 Sep 2008 13:53:00 GMT

了解HashMap原理对于日后的缓存机制多��有些认识。在�|�络中也有很多方面的帖子�Q�但是很多都是轻描��E写，很少有把握的比较准确的信息，在这里试着不妨说解一二�?/span>

对于HashMap主要以键�?/span>(key-value)的方式来体现�Q�笼�l�的说就是采�?/span>key值的哈希��法来，外加取余最�l�获取烦引，而这个烦引可以认定是一�U�地址�Q�既而把相应�?/span>value存储在地址指向内容中。这栯��或许比较概念化，也可能复�q�C��够清楚，来看列式更加清晰�Q?/span>

int hash=key.hashCode();//------------------------1

int index=hash%table.lenth;//table表示当前对象的长�?/span>-----------------------2

其实最�l�就是这两个式子军_��了值得存储位置。但是以上两个表辑ּ��q�有�Ơ缺。�ؓ什么这么说�Q�例如在key.hashCode()后可能存在是一个负整数�Q�你会问�Q�是啊，那这个时候怎么办呢�Q�所以在�q�里��需要进一步加强改造式�?/span>2了，修改后的�Q?/span>

int index=�Q?/span>hash&Ox7FFFFFFF)%table.lenth;

到这里又�q�h��了，��Z��么上面是�q�样的呢�Q�对于先前我们谈到在hash有可能��生负数的情况�Q�这里我们��用当前的hash做一�?#8220;�?#8221;操作�Q�在�q�里需要和int最大的值相“�?#8221;。这��L��话就可以保证数据的统一性，把有�W�号的数值给“�?#8221;掉。而一般这里我们把二进制的数��D�{换成16�q�制的就变成了：Ox7FFFFFFF。（注：与操作的方式为，不同�?/span>0�Q�相同�ؓ1�Q�。而对�?/span>hashCode()的方法一般有�Q?/span>

public int hashCode(){

int hash=0,offset,len=count;

char[] var=value;

for(int i=0;i

h=31*hash+var[offset++];

}

return hash;

}

说道�q�里大家可能会说�Q�到�q�里��完事了吧。但是你可曾惛_��如果数据都采用上面的方式�Q�最�l�得到的可能index会相同怎么办呢�Q�如果你惛_��的话�Q�那恭喜�?/span>!又增�q�一步了�Q�这里就是要说到一个名词：冲突率。是的就是前面说道的一�?/span>index有相同怎么办？数据又该如何存放呢，而且�q�个在数据量非常庞大的时候这个基率更大。这里按照算法需要明��的一点：每个键（key�Q�被散列分布��C�Q何一个数�l�烦引的可能性相同，而且不取决于其它键分布的位置。这句话怎么理解呢？从概率论的角度，也就是说如果key的个数达��C��个极限，每个key分布的机率都是均�{�的。更�q�一步就是：即便key1不等�?/span>key2也还是可�?/span>key1.hashCode()=key2.hashCode()�?/span>

对于早期的解军_��H�的�Ҏ��有折叠法�Q?/span>folding)�Q�例如我们在做系�l�的时候有时候会采用部门�~�号附加到某个单据标号后�Q�这里比如��生一�?/span>9�?/span>11位的�~�码。通过对半折叠做�?/span>

现在的策略有�Q?/span>

1. 键式散列

2. 开攑֜�址�?/span>

在了解这两个�{�略前，我们先定义清楚几个名词解释：

threshold[阀�?/span>]�Q�对象大��的边界�?/span>;

loadFactor[加蝲因子]=n/m �Q�其�?/span>n代表对象元素个数�Q?/span>m表示当前表的容积最大�?/span>

threshold=(int)table.length*loadFactor

清晰了这几个定义�Q�我们再来看具体的解��x��?/span>

键式散列�Q?/span>

我们直接看一个实例，�q�样��更加清晰它的工作方式，从而避免文字定义。我们这里还是来举一个图书编��L��例子�Q�下面比如有�q�样一些编��P��

78938-0000

45678-0001

72678-0002

24678-0001

16678-0001

98678-0003

85678-0002

45232-0004

步骤�Q?/span>

1. 把编号作�?/span>key,卻I��int hash=key.hashCode();

2. int index=hash%表大��；

3. 逐步按顺序插入对象中

现在问题出现了：对于�~�号通过散列��法后很可能产生相同的烦引��|��意味着存在冲突�?/span>

解释上面的操作：如果对于key.hashCode()产生了冲�H�（比如途中对于插入24678-0001对于通过哈希��法后可能��生的index或许也是501�Q�，既而把相应的前驱有相同�?/span>index的对象指向当前引用。这也就是大家认定的单链表方式。以此类�?/span>…

而这里存在冲�H�对象的元素攑֜�Entry对象中，Entry��h��以下一些属性：

int hash;

Object key;

Entry next;

对于Entry对象��可以直接追溯到链表数据�l�构体中查阅�?/span>

开攑֜�址法：

1. �U�性地址探测法：

如何理解�q�个概念呢，一句话�Q�就是通过��法规则在对象地址N+1中查阅找��CؓNULL的烦引内宏V�?/span>

处理方式�Q�如�?/span>index索引与当前的index有冲�H�，��x��当前的烦�?/span>index+1。如果在index+1已经存在占位现象�Q?/span>index+1的内容不�?/span>NULL�Q�试图接着index+2执行。。。直到找到烦引�ؓ内容�?/span>NULL的�ؓ止。这�U�处理方式也叫：�U�性地址探测�?/span>(offset-of-1)

如果采用�U�性地址探测法会带来一个效率的不良影响。现在我们来分析�q�种方式会带来哪些不良因素。大家试想下如果一个非常庞大的数据存储�?/span>Map中，假如在某些记录集中有一些数据非常相��|��他们产生的烦引在内存的某个块中非常的密集�Q�，也就是说他们产生的烦引地址是一个连�l�数��|��而造成数据成块现象。另一个致命的问题��是在数据删除后�Q�如果再�ơ查询可能无法定��C��一个连�l�数字，�q�个又是一个什么概念呢�Q�例如以下图片就很好的说明开发地址散列如何把数据按照算法插入到对象中：

对于上图的注释步骤说明：

从数�?#8220;78938-0000”开始通过哈希��法按顺序依�ơ插入到对象中，例如78938-0000通过�?/span>

��得到烦引�ؓ0�Q�当前所指内容�ؓNULL所以直接插入；45678-0001同样通过换算得到索引为地址501所指内容，当前内容�?/span>NULL所以也可以插入�Q?/span>72678-0002得到索引502所指内容，当前内容�?/span>NULL也可以插入；��h��意当24678-0001得到索引也�ؓ501�Q�当前地址所指内容�ؓ45678-0001。即表示当前数据存在冲突�Q�则直接对地址501+1=502所指向内容�?/span>72678-0002不�ؓNULL也不允许插入�Q�再�ơ对索引502+1=503所指内容�ؓNULL允许插入。。。依�ơ类推只要对于烦引存在冲�H�现象，则逐次下移位知道烦引地址所指�ؓNULL�Q�如果烦引不冲突则还是按照算法放入内宏V��对于这��L��对象是一�U�插入方式，接下来就是我们的删除(remove)�Ҏ��了。按照常理对于删除，方式基本区别不大。但是现在问题又出现了，如果删除的某个数据是一个存在冲�H�烦引的内容�Q�带来后�l�的问题又会接踵而来。那是什么问题呢�Q�我们还是同��h��看看囄��的描�q�ͼ�对于�?/span>-2中如果删�?/span>(remove)数据24678-0001的方法如下图所�C�：

对于我们会想当然的觉得只要把指向数据�|��ؓNULL��可�?/span>,�q�样的做法对于删除来说当然是没有问题的。如果再�ơ定位检索数�?/span>16678-0001不会成功�Q�因��个时候以前的链�\已经堵上了，但是需要检索的数据事实上又存在。那我们如何来解册��个问题呢�Q�对�?/span>JDK中的Entry�c�M��的方法存在一个：boolean markedForRemoval;它就是一个典型的删除标志位，对于对象中如果需要删除时�Q�我们只是对于它做一�?#8220;软删�?#8221;即置一个标志位�?/span>true��可以。而插入时�Q�默认状态�ؓfalse��可以。这��L��话就变成以下图所�C�：

通过以上方式更好的解军_��H�地址删除数据无法��索其他链路数据问题了�?/span>

2. 双散列（余商法）

在了解开攑֜�址散列的时候我们一直在说解��x��法，但是大家都知道一个数据结构的完善更多的是需要高效的��法。这当中我们却没有涉及到。接下来我们��来看看在开攑֜�址散列中它存在的一些不��以及如何改善这��L��Ҏ��Q�既而达到无论是在方法的解决上还是在��法的复杂度上更加达到高效的�Ҏ��?/span>

在图2-1中类��D��样一些数据插入进对象�Q�存在冲�H�采用不断移位加一的方式，直到扑ֈ�不�ؓNULL内容的烦引地址。也正是�׃��q�样一�U�可能加大了旉��上的变慢。大家是否注意到像图�q�样一些数据目前呈现出一�U�连�l�烦引的插入�Q�而且是一�U�成块是的数据。如果数据量非常的庞大，或许�q�种可能性更大。尽��它解决了冲�H�，但是对于数据��索的旉��度来��_��我们是不敢想象的。所有分布到同一个烦�?/span>index上的key保持相同的�\径：index,index+1,index+2…依此�c�L��。更加糟�p�的是烦引键值的��索需要从索引开始查找。正是这��L��原因�Q�对于线性探索法我们需要更�q�一步的改进。而刚才所描述�q�种成块出现的数据也��定义成�Q�簇。而这样一�U�现象称之�ؓ�Q�主��现象�?/span>

�Q�主��：��是冲突处理允许��加速增长时出现的现象）而开攑ּ�地址冲突也是允许�ȝ��现象产生的。那我们如何来避免这�U�主��现象呢�Q�这个方式就是我们要来说明的�Q�双散列解决冲突法了。主要的方式为：

u int hash=key.hasCode();

u int index=(hash&Ox7FFFFFFF)%table.length;

u 按照以上方式得到索引存在冲突�Q�则开始对当前索引�U�M��Q�而移位方式�ؓ�Q?/span>

offset=(hash&Ox7FFFFFFF)/table.length;

u 如果�W�一�ơ移位还存在同样的冲�H�，则��l�：当前冲突索引位置�Q�烦引号+余数�Q?/span>%�?/span>.length

u 如果存在的余数恰好是表的倍数�Q�则作偏�U�M��|��ؓ一下移�Q�依此类�?/span>

�q�样双散列冲�H�处理就避免了主��现象。至�?/span>HashSet的原理基本和它是一致的�Q�这里不再复�q�。在�q�里其实�q�是主要说了一些简单的解决方式�Q�而且都是在一些具体参数满��x��件下的说明，像一旦数据超�q�初始��D��需�?/span>rehash�Q�加载因子一旦大�?/span>1.0是何�U�情�늭��{�。还有很多问题都可以值得我们更加�q�一步讨论的�Q�比如：�?/span>java.util.HashMap中的加蝲因子��Z��么会�?/span>0.75�Q�而它默认的初始大��ؓ什么又�?/span>16�{�等�q�些问题都还值得说明。要说明�q�些问题可能又需要更加详��的说明清楚�?/span>

叶澍�?/a> 2008-09-15 21:53 发表评论