亚洲大成色www永久网站,国产亚洲精品2021自在线,亚洲性线免费观看视频成熟

Fri, 06 Aug 2010 01:42:00 GMT

Hadoop 是一个实��C�� MapReduce 计算模型的开源分布式�q�行�~�程框架�Q�借助�?Hadoop, �E�序员可以轻村֜��~�写分布式�ƈ行程序，��其�q�行于计��机集群上，完成��量数据的计��。本文将介绍 MapReduce 计算模型�Q�分布式�q�行计算�{�基本概念，以及 Hadoop 的安装部�|�和基本�q�行�Ҏ��?
Hadoop ��?

Hadoop 是一个开源的可运行于大规模集��上的分布式�q�行�~�程框架�Q�由于分布式存储对于分布式编�E�来说是必不可少的，�q�个框架中还包含了一个分布式文�g�pȝ�� HDFS( Hadoop Distributed File System )。也许到目前为止�Q�Hadoop �q�不是那么广��Z�h知，其最新的版本号也仅仅�?0.16�Q�距��?1.0 ��g��都还有很长的一�D�距��，但提�?Hadoop 一脉相承的另外两个开源项�? Nutch �?Lucene ( 三者的创始人都�?Doug Cutting ),那绝�Ҏ��大名鼎鼎。Lucene 是一个用 Java 开发的开源高性能全文��索工具包�Q�它不是一个完整的应用�E�序�Q�而是一套简单易用的 API 。在全世界范围内�Q�已有无数的软�g�pȝ��Q�Web �|�站��Z�� Lucene 实现了全文检索功能，后来 Doug Cutting 又开创了�W�一个开源的 Web 搜烦引擎(http://www.nutch.org) Nutch, 它在 Lucene 的基��上增加了�|�络爬虫和一些和 Web 相关的功能，一些解析各�c�L��档格式的插�g�{�，此外�Q�Nutch 中还包含了一个分布式文�g�pȝ��用于存储数据。从 Nutch 0.8.0 版本之后�Q�Doug Cutting �?Nutch 中的分布式文件系�l�以及实�?MapReduce ��法的代码独立出来�Ş成了一个新的开源项 Hadoop。Nutch 也演化�ؓ��Z�� Lucene 全文��索以�?Hadoop 分布式计��^台的一个开源搜索引擎�?

��Z�� Hadoop,你可以轻村֜��~�写可处理�v量数据的分布式�ƈ行程序，�q�将其运行于由成百上千个�l�点�l�成的大规模计算机集��上。从目前的情冉|�� 看，Hadoop 注定会有一个辉煌的未来�Q?云计��?是目前灸手可热的技术名词，全球各大 IT 公司都在投资和推�q�这�U�新一代的计算模式�Q��? Hadoop 又被其中几家主要的公司用作其"云计��?环境中的重要基础软�g�Q�如:雅虎正在借助 Hadoop 开源��^台的力量�Ҏ�� Google, 除了资助 Hadoop 开发团队外�Q�还在开发基�?Hadoop 的开源项�?Pig, �q�是一个专注于��量数据集分析的分布式计��程序。Amazon 公司��Z�� Hadoop 推出�?Amazon S3 ( Amazon Simple Storage Service )�Q�提供可靠，快速，可扩展的�|�络存储服务�Q�以及一个商用的云计��^�?Amazon EC2 ( Amazon Elastic Compute Cloud )。在 IBM 公司的云计算��目--"蓝云计划"中，Hadoop 也是其中重要的基��软�g。Google 正在跟IBM合作�Q�共同推�q�基�?Hadoop 的云计算�?

�q�接�~�程方式的变�?

在摩��定律的作用下，以前�E�序员根本不用考虑计算机的性能会跟不上软�g的发展，因�ؓ�U�每�?18 个月�Q�CPU 的主频就会增加一倍，性能也将提升一倍，软�g�Ҏ��不用做�Q何改变，��可以��n受免费的性能提升。然而，�׃��晶体��电路已�l�逐渐接近其物理上的性能极限�Q�摩��? 定律�?2005 �q�左叛_��始失效了�Q��h�c�d��也不能期待单�?CPU 的速度每隔 18 个月��q��一倍，为我们提供越来越快的计算性能。Intel, AMD, IBM �{�芯片厂商开始从多核�q�个角度来挖�?CPU 的性能潜力�Q�多核时代以及互联网时代的到来，��软�g�~�程方式发生重大变革�Q�基于多核的多线�E��ƈ发编�E�以及基于大规模计算机集��的分布式�ƈ行编�E�是��来�? 件性能提升的主要途径�?

许多��U�编�E�方式的重大变化��带来一�ơ��Y件的�q�发危机�Q�因为我们传�l�的软�g方式基本上是单指令单数据��的��序执行�Q�这�U�顺序执行十分符合�h �cȝ��思考习惯，却与�q�发�q�行�~�程格格不入。基于集��的分布式�ƈ行编�E�能够让软�g与数据同时运行在�q�成一个网�l�的许多台计��机�?�q�里的每一台计��机均可�? 是一台普通的 PC 机。这��L��分布式�ƈ行环境的最大优�Ҏ��可以很容易的通过增加计算机来扩充新的计算�l�点�Q��ƈ由此获得不可思议的�v量计��能�? 同时又具有相当强的容错能力，一批计��结点失效也不会影响计算的正常进行以及结果的正确性。Google ��是�q�么做的�Q�他们��用了叫做 MapReduce 的�ƈ行编�E�模型进行分布式�q�行�~�程�Q�运行在叫做 GFS ( Google File System )的分布式文�g�pȝ��上，为全球亿万用��h��供搜索服务�?

Hadoop 实现�?Google �?MapReduce �~�程模型�Q�提供了��单易用的�~�程接口�Q�也提供了它自己的分布式文�g�pȝ�� HDFS,�?Google 不同的是�Q�Hadoop 是开源的�Q��Q何�h都可以��用这个框架来�q�行�q�行�~�程。如果说分布式�ƈ行编�E�的隑ֺ��以让普通程序员望而生畏的话，开源的 Hadoop 的出现极大的降低了它的门槛，��d��本文�Q�你会发现基�?Hadoop �~�程非常��单，无须��M��q�行开发经验，你也可以��L��的开发出分布式的�q�行�E�序�Q��ƈ让其令�h难以�|�信地同时运行在数百台机器上�Q�然后在短时间内完成��量数据的计��。你可能会觉得你不可能会拥有数百台机器来�q�行你的�q�行�E�序�Q�而事实上�Q�随着"云计��?的普及，��M��人都可以��L��获得�q�样的�v量计��能力。例如现�? Amazon 公司的云计算�q�_�� Amazon EC2 已经提供了这�U�按需计算的租用服务，有兴��的读者可以去了解一下，�q�篇�p�d��文章的第三部分将有所介绍�?

掌握一点分布式�q�行�~�程的知识对��来的程序员是必不可��的�Q�Hadoop 是如此的��便好用，何不��试一下呢�Q�也�怽�已经急不可耐的惌��一下基�? Hadoop 的编�E�是怎么回事了，但毕竟这�U�编�E�模型与传统的顺序程序大不相同，掌握一点基��知识才能更好地理解基�?Hadoop 的分布式�q�行�E�序是如何编写和�q�行的。因此本文会先介�l�一�?MapReduce 的计��模型，Hadoop 中的分布式文件系�l?HDFS, Hadoop 是如何实现�ƈ行计��的�Q�然后才介绍如何安装和部�|?Hadoop 框架�Q�以及如何运�?Hadoop �E�序�?

MapReduce 计算模型

MapReduce �?Google 公司的核心计��模型，它将复杂的运行于大规模集��上的�ƈ行计��过�E�高度的抽象��C��两个函数�Q�Map �? Reduce, �q�是一个��o人惊讶的��单却又威力巨大的模型。适合�?MapReduce 来处理的数据�?或�Q�?有一个基本要�? 待处理的数据集可以分解成许多��的数据集，而且每一个小数据集都可以完全�q�行地进行处理�?

�?1. MapReduce 计算��程

图一说明了用 MapReduce 来处理大数据集的�q�程, �q�个 MapReduce 的计��过�E�简而言之，��是��大数据集分解�ؓ成百上千的小数据集，每个(或若�q�个)数据集分别由集群中的一个结�?一般就是一台普通的计算�?�q�行处理�q�生成中间结果，然后�q�些中间�l�果又由大量的结点进行合�q? 形成最�l�结果�?

计算模型的核心是 Map �?Reduce 两个函数�Q�这两个函数��q��戯��责实玎ͼ�功能是按一定的映射规则��输入的对�{换成另一个或一�? 对输出�?

表一 Map �?Reduce 函数
函数输入输出说明
Map List() 1. ��小数据集进一步解析成一�? 对，输入 Map 函数中进行处理�?
2. 每一个输入的会输��Z��?�? 是计��的中间�l�果�?nbsp;
Reduce 输入的中间结�? 中的 List(v2) 表示是一批属于同一�?k2 �?value

以一个计��文本文件中每个单词出现的次数的�E�序��Z��Q?lt;k1,v1> 可以�?<行在文�g中的偏移位置, 文�g中的一�?gt;�Q�经 Map 函数映射之后�Q��Ş成一批中间结�?<单词�Q�出现次�?gt;, �?Reduce 函数则可以对中间�l�果�q�行处理�Q�将相同单词的出现次数进行篏加，得到每个单词的�ȝ��出现�ơ数�?

��Z�� MapReduce 计算模型�~�写分布式�ƈ行程序非常简单，�E�序员的主要�~�码工作��是实现 Map �?Reduce 函数�Q�其它的�q�行�~�程中的�U�种复杂问题�Q�如分布式存储，工作调度�Q�负载��^衡，定w��处理�Q�网�l�通信�{�，均由 MapReduce 框架(比如 Hadoop )负责处理�Q�程序员完全不用操心�?

�?集群上的�q�行计算

MapReduce 计算模型非常适合在大量计��机�l�成的大规模集群上�ƈ行运行。图一中的每一�?Map ��d��和每一�?Reduce ��d��均可以同时运行于一个单独的计算�l�点上，可想而知其运��效率是很高的，那么�q�样的�ƈ行计��是如何做到的呢�Q?

数据分布存储

Hadoop 中的分布式文件系�l?HDFS �׃��个管理结�?( NameNode )和N个数据结�?( DataNode )�l�成�Q�每个结点均是一台普通的计算机。在使用上同我们熟悉的单��Z��的文件系�l�非常类��|��一样可以徏目录�Q�创建，复制�Q�删除文�Ӟ��查看文�g内容�{�。但其底层实��C��是把文�g切割�?Block�Q�然后这�?Block 分散地存储于不同�?DataNode 上，每个 Block �q�可以复制数份存储于不同�? DataNode 上，辑ֈ�定w��容灾之目的。NameNode 则是整个 HDFS 的核心，它通过�l�护一些数据结构，记录了每一个文件被切割成了多少�?Block�Q�这�?Block 可以从哪�?DataNode 中获得，各个 DataNode 的状态等重要信息。如果你想了解更多的关于 HDFS 的信息，可进一步阅��d��考资料： [url]The Hadoop Distributed File System:Architecture and Design [/url]
分布式�ƈ行计��?

Hadoop 中有一个作��Z��控的 JobTracker�Q�用于调度和��理其它�?TaskTracker, JobTracker 可以�q�行于集��中��M��台计��机上。TaskTracker 负责执行��d��Q�必��运行于 DataNode 上，�?DataNode 既是数据存储�l�点�Q�也是计��结炏V�?JobTracker ��?Map ��d��?Reduce ��d��分发�l�空闲的 TaskTracker, 让这些�Q务�ƈ行运行，�q�负责监控�Q务的�q�行情况。如果某一�?TaskTracker 出故障了�Q�JobTracker 会将其负责的��d��转交�l�另一个空闲的 TaskTracker 重新�q�行�?

本地计算

数据存储在哪一台计��机上，��q��q�台计算��行这部分数据的计��，�q�样可以减少数据在网�l�上的传输，降低对网�l�带宽的需求。在 Hadoop �q�样的基于集��的分布式�ƈ行系�l�中�Q�计��结点可以很方便地扩充，而因它所能够提供的计��能力近乎是无限的，但是由是数据需要在不同的计��机之间��动�Q�故�|? �l�带宽变成了瓉��Q�是非常宝贵的，“本地计算”是最有效的一�U�节�U�网�l�带宽的手段�Q�业界把�q��Ş容�ؓ“�U�d��计算比移动数据更�l�济”�?

�?2. 分布存储与�ƈ行计��?

��d��_�度

把原始大数据集切割成��数据集�Ӟ��通常让小数据集小于或�{�于 HDFS 中一�?Block 的大��?�~�省�? 64M)�Q�这栯��够保证一个小数据集位于一台计��机上，便于本地计算。有 M 个小数据集待处理�Q�就启动 M �?Map ��d��Q�注意这 M �?Map ��d��分布�?N 台计��机上�ƈ行运行，Reduce ��d��的数�?R 则可��q��h��定�?

Partition

�?Map ��d��输出的中间结果按 key 的范围划分成 R �? R 是预先定义的 Reduce ��d��的个�?�Q�划分时通常使用 hash 函数�? hash(key) mod R�Q�这样可以保证某一�D�范围内�?key�Q�一定是�׃��?Reduce ��d��来处理，可以��?Reduce 的过�E��?

Combine

�?partition 之前�Q�还可以对中间结果先�?combine�Q�即��中间结果中有相�?key�? 对合�q�成一寏V��combine 的过�E�与 Reduce 的过�E�类��|��很多情况下就可以直接使用 Reduce 函数�Q�但 combine 是作�? Map ��d��的一部分�Q�在执行�?Map 函数后紧接着执行的。Combine 能够减少中间�l�果�? 对的数目�Q�从而减��网�l�流量�?

Reduce ��d��?Map ��d��l�点取中间结�?

Map ��d��的中间结果在做完 Combine �?Partition 之后�Q�以文�g形式存于本地��盘。中间结果文件的位置会通知��L�� JobTracker, JobTracker 再通知 Reduce ��d��到哪一�?DataNode 上去取中间结果。注意所有的 Map ��d��产生中间�l�果均按�?Key 用同一�?Hash 函数划分成了 R 份，R �?Reduce ��d��各自负责一�D?Key 区间。每�? Reduce 需要向许多�?Map ��d��l�点取得落在其负责的 Key 区间内的中间�l�果�Q�然后执�?Reduce 函数�Q��Ş成一个最�l�的�l�果文�g�?

��d��道

�?R �?Reduce ��d��Q�就会有 R 个最�l�结果，很多情况下这 R 个最�l�结果�ƈ不需要合�q�成一个最�l�结果。因�� R 个最�l�结果又可以做�ؓ另一个计��Q务的输入�Q�开始另一个�ƈ行计��Q务�?

�?Hadoop 初体�?

Hadoop 支持 Linux �?Windows 操作�pȝ��, 但其官方�|�站声明 Hadoop 的分布式操作�?Windows 上未做严格测试，��只把 Windows 作�ؓ Hadoop 的开发��^台。在 Windows 环境上的安装步骤如下( Linux �q�_��c�M��Q�且更简单一�?:

(1)�?Windows 下，需要先安装 Cgywin, 安装 Cgywin 时注意一定要选择安装 openssh (�?Net category )。安装完成之后，�?Cgywin 的安装目录如 c:\cygwin\bin 加到�pȝ��环境变量 PATH 中，�q�是因�ؓ�q�行 Hadoop 要执行一�?linux 环境下的脚本和命令�?

(2)安装 Java 1.5.x�Q��ƈ��?JAVA_HOME 环境变量讄��?Java 的安装根目录�?C:\Program Files\Java\jdk1.5.0_01�?

(3)�?Hadoop 官方�|�站[url] http://hadoop.apache.org[/url]下蝲Hadoop Core, 最新的�E�_��版本�?0.16.0. ��下载后的安装包解压��C��个目录，本文假定解压�?c:\hadoop-0.16.0�?

4)修改 conf/hadoop-env.sh 文�g�Q�在其中讄�� JAVA_HOME 环境变量�Q?export JAVA_HOME="C:\Program Files\Java\jdk1.5.0_01” (因�ؓ路径�?Program Files 中间有空��|��一定要用双引号��\径引��h��)

��x��Q�一切就�l�，可以�q�行 Hadoop 了。以下的�q�行�q�程�Q�需要启�?cygwin, �q�入模拟 Linux 环境。在下蝲�?Hadoop Core 包中�Q�带有几个示例程序�ƈ且已�l�打包成�?hadoop-0.16.0-examples.jar。其中有一�?WordCount �E�序�Q�功能是�l�计一�Ҏ��本文件中各个单词出现的次敎ͼ�我们先来看看怎么�q�行�q�个�E�序。Hadoop 共有三种�q�行模式: 单机(非分布式)模式�Q�伪分布式运行模式，分布式运行模式，其中前两�U�运行模式体��C��?Hadoop 分布式计��的优势�Q��ƈ没有什么实际意义，但对�E�序的测试及调试很有帮助�Q�我们先从这两种模式入手�Q�了解基�?Hadoop 的分布式�q�行�E�序是如何编写和�q�行的�?

单机(非分布式)模式

�q�种模式在一台单��Z��q�行�Q�没有分布式文�g�pȝ��Q�而是直接��d��本地操作�pȝ��的文件系�l��?

代码清单1

Java代码

$ cd /cygdrive/c/hadoop-0.16.0
$ mkdir test-in
$ cd test-in
#�?nbsp;test-in 目录下创��Z��个文本文�? WordCount �E�序��统计其中各个单词出现次�?nbsp;
$ echo "hello world bye world" >file1.txt
$ echo "hello hadoop goodbye hadoop" >file2.txt
$ cd ..
$ bin/hadoop jar hadoop-0.16.0-examples.jar wordcount test-in test-out
#执行完毕�Q�下面查看执行结果：
$ cd test-out
$ cat part-00000
bye 1
goodbye 1
hadoop 2
hello 2
world 2

$ cd /cygdrive/c/hadoop-0.16.0
$ mkdir test-in
$ cd test-in
#�?test-in 目录下创��Z��个文本文�? WordCount �E�序���统计其中各个单词出现次�?
$ echo "hello world bye world" >file1.txt
$ echo "hello hadoop goodbye hadoop" >file2.txt
$ cd ..
$ bin/hadoop jar hadoop-0.16.0-examples.jar wordcount test-in test-out
#执行完毕�Q�下面查看执行结果：
$ cd test-out
$ cat part-00000
bye     1
goodbye  1
hadoop  2
hello    2
world   2

注意事项�Q�运�?bin/hadoop jar hadoop-0.16.0-examples.jar wordcount test-in test-out �Ӟ��务必注意�W�一个参数是 jar, 不是 -jar, 当你�?-jar �Ӟ��不会告诉你是参数错了�Q�报告出来的错误信息是：Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/util/ProgramDriver, �W�者当时以为是 classpath 的设�|�问题，��费了不��时间。通过分析 bin/hadoop 脚本可知�Q?jar �q�不�?bin/hadoop 脚本定义的参敎ͼ�此脚本会�?-jar 作�ؓ Java 的参敎ͼ�Java �?jar 参数表示执行一�?Jar 文�g(�q�个 Jar 文�g必须是一个可执行�?Jar,卛_�� MANIFEST 中定义了�ȝ��), 此时外部定义�?classpath 是不起作用的�Q�因而会抛出 java.lang.NoClassDefFoundError 异常。�?jar �?bin/hadoop 脚本定义的参敎ͼ�会调�?Hadoop 自己的一个工��L�� RunJar�Q�这个工��L��也能够执行一�?Jar 文�g�Q��ƈ且外部定义的 classpath 有效�?

伪分布式�q�行模式

�q�种模式也是在一台单��Z��q�行�Q�但用不同的 Java �q�程模仿分布式运行中的各�cȝ��?( NameNode, DataNode, JobTracker, TaskTracker, Secondary NameNode )�Q�请注意分布式运行中的这几个�l�点的区别：

从分布式存储的角度来��_��集群中的�l�点�׃��?NameNode 和若�q�个 DataNode �l�成, 另有一�?Secondary NameNode 作�ؓ NameNode 的备份。从分布式应用的角度来说�Q�集��中的结点由一�?JobTracker 和若�q�个 TaskTracker �l�成�Q�JobTracker 负责��d��的调度，TaskTracker 负责�q�行执行��d��。TaskTracker 必须�q�行�? DataNode 上，�q�样便于数据的本地计��。JobTracker �?NameNode 则无��d��同一台机器上�?

(1) 按代码清�?修改 conf/hadoop-site.xml。注�?conf/hadoop-default.xml 中是 Hadoop �~�省的参敎ͼ�你可以通过��L��文�g了解 Hadoop 中有哪些参数可供配置�Q�但不要修改此文件。可通过修改 conf/hadoop-site.xml 改变�~�省参数��|��此文件中讄��的参数��g��覆盖 conf/hadoop-default.xml 的同名参数�?

代码清单 2

Java代码

fs.default.name
localhost:9000
mapred.job.tracker
localhost:9001
dfs.replication
1



fs.default.name
localhost:9000


mapred.job.tracker
localhost:9001


dfs.replication
1

参数 fs.default.name 指定 NameNode �?IP 地址和端口号。缺省值是 file:///, 表示使用本地文�g�pȝ��, 用于单机非分布式模式。此处我们指定��用运行于本机 localhost 上的 NameNode�?

参数 mapred.job.tracker 指定 JobTracker �?IP 地址和端口号。缺省值是 local, 表示在本地同一 Java �q�程内执�?JobTracker �?TaskTracker, 用于单机非分布式模式。此处我们指定��用运行于本机 localhost 上的 JobTracker ( 用一个单独的 Java �q�程�?JobTracker )�?

参数 dfs.replication 指定 HDFS 中每�?Block 被复制的�ơ数�Q��v数据冗余备䆾的作用。在典型的生产系�l�中�Q�这个数常常讄��?�?

(2)配置 SSH,如代码清�?所�C?

代码清单 3

Java代码

$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

配置完后�Q�执行一�?ssh localhost, ��认你的机器可以�?SSH �q�接�Q��ƈ且连接时不需要手工输入密码�?

(3)格式化一个新的分布式文�g�pȝ��, 如代码清�?所�C?

代码清单 4

Java代码

$ cd /cygdrive/c/hadoop-0.16.0
$ bin/hadoop namenode –format

$ cd /cygdrive/c/hadoop-0.16.0
$ bin/hadoop namenode –format

(4) 启动 hadoop �q�程, 如代码清�?所�C�。控制台上的输出信息应该昄��启动�?namenode, datanode, secondary namenode, jobtracker, tasktracker。启动完成之后，通过 ps –ef 应该可以看到启动�?个新�?java �q�程�?

代码清单 5

Java代码

$ bin/start-all.sh
$ ps –ef

$ bin/start-all.sh
$ ps –ef

(5) �q�行 wordcount 应用, 如代码清�?所�C?

代码清单 6

Java代码

$ bin/hadoop dfs -put ./test-in input
#��本地文件系�l�上�?nbsp;./test-in 目录拷到 HDFS 的根目录上，目录名改�?nbsp;input
#执行 bin/hadoop dfs –help 可以学习各种 HDFS 命��o的��用�?nbsp;
$ bin/hadoop jar hadoop-0.16.0-examples.jar wordcount input output
#查看执行�l�果:
#��文件从 HDFS 拷到本地文�g�pȝ��中再查看�Q?nbsp;
$ bin/hadoop dfs -get output output
$ cat output/*
#也可以直接查�?nbsp;
$ bin/hadoop dfs -cat output/*
$ bin/stop-all.sh #停止 hadoop �q�程

$ bin/hadoop dfs -put ./test-in input
#���本地文件系�l�上�?./test-in 目录拷到 HDFS 的根目录上，目录名改�?input
#执行 bin/hadoop dfs –help 可以学习各种 HDFS 命��o的��用�?
$ bin/hadoop jar hadoop-0.16.0-examples.jar wordcount input output
#查看执行�l�果:
#���文件从 HDFS 拷到本地文�g�pȝ��中再查看�Q?
$ bin/hadoop dfs -get output output
$ cat output/*
#也可以直接查�?
$ bin/hadoop dfs -cat output/*
$ bin/stop-all.sh #停止 hadoop �q�程

故障诊断

(1) 执行 $ bin/start-all.sh 启动 Hadoop �q�程后，会启�?�?java �q�程, 同时会在 /tmp 目录下创��Z��?pid 文�g记录�q�些�q�程 ID 受��通过�q�五个文�Ӟ��可以得知 namenode, datanode, secondary namenode, jobtracker, tasktracker 分别对应于哪一�?Java �q�程。当你觉�?Hadoop 工作不正常时�Q�可以首先查看这5�?java �q�程是否在正常运行�?

(2) 使用 web 接口。访�?http://localhost:50030 可以查看 JobTracker 的运行状态。访�? http://localhost:50060 可以查看 TaskTracker 的运行状态。访�?http://localhost:50070 可以查看 NameNode 以及整个分布式文件系�l�的状态，��览分布式文件系�l�中的文件以�?log �{��?

(3) 查看 ${HADOOP_HOME}/logs 目录下的 log 文�g�Q�namenode, datanode, secondary namenode, jobtracker, tasktracker 各有一个对应的 log 文�g�Q�每一�ơ运行的计算��d��也有对应�?log 文�g。分析这�?log 文�g有助于找到故障原因�?

�l�束�?

现在�Q�你已经了解�?MapReduce 计算模型�Q�分布式文�g�pȝ�� HDFS�Q�分布式�q�行计算�{�的基本原理, �q�且有了一个可以运行的 Hadoop 环境�Q�运行了一个基�?Hadoop 的�ƈ行程序�?

何克�?/a> 2010-08-06 09:42 发表评论

了解SQL Server执行计划

Thu, 15 Apr 2010 09:12:00 GMT

如果在执行计划中看到如下所�C�的��M��一��，��应该将它们视作警告信号�q�调查它们以扑և�潜在的性能问题。从性能斚w��来说�Q�下面所�C�的每一��w��是不理想的�?/p>

Index or table scans(索引或者表扫描)�Q�可能意味着需要更好的或者额外的索引�?/p>

Bookmark Lookups(书签查找)�Q�考虑修改当前的聚集烦引，使用复盖索引�Q�限制SELECT语句中的字段数量�?/p>

Filter(�q��o)�Q�在WHERE从句中移除用到的��M��函数�Q�不要在SQL语句中包含视图，可能需要额外的索引�?/p>

Sort(排序)�Q�数据是否真的需要排序？可否使用索引来避免排序？在客��L��排序是否会更加有效率�Q?/p>

查看SQL Server囑�Ş执行计划�Ӟ��可以查找的非常有用的一个东西就是查询优化器如何为给定的查询使用索引来从表中获取数据。通过查看是否有用到烦引，以及索引如何被��用，都有助于判断当前的烦引是否��得查询执行得��可能的快�?/p>

��鼠标移到图形执行计划上的表�?以及它的图标)上面�Q�就会弹��Z��个窗口，从它上面可以看到一些信息。这些信息让你知道是否有用到索引来从表中获取数据�Q�以及它是如何��用的。这些信息包括：

· Table Scan(表扫�?�Q�如果看到这个信息，��p��明数据表上没有聚集烦引，或者查询优化器没有使用索引来查找。意卌��料表的每一行都被检查到。如果资料表相对较小的话�Q�表扫描可以非常快速，有时甚至快过使用索引�?/p>

因此�Q�当看到有执行表扫描�Ӟ��W�一件要做的事就是看看数据表有多��数据行。如果不是太多的话，那么表扫描可能提供了最好的��M��效能。但如果数据表大的话�Q�表扫描��极可能需要长旉��来完成，查询效能��大受媄响。在�q�种情况下，��需要仔�l�研�IӞ��为数据表增加一个适当的烦引用于这个查询�?/p>

假设你发现某查询使用了表扫描�Q�有一个合适的非聚集烦引，但它没有用到。这意味着什么呢�Q��ؓ什么这个烦引没有用到呢�Q�如果需要获得的数据量相�Ҏ��据表大小来说非常大，或者数据选择性不�?意味着同一个字�D�中重复的值很�?�Q�表扫描�l�常会比索引扫描快。例如，如果一个数据表�?0000个数据行�Q�查询返�?000行，如果�q�个表没有聚集烦引的话，那么表扫描将比��用一个非聚集索引更快。或者如果数据表�?0000个数据行�Q�且同一个字�D?WHERE条�g句有用到�q�个字段)上有1000�W�重复的数据�Q�表扫描也会比��用非聚集索引更快�?/p>

查看囑�Ş执行计划上的数据表上的弹出式�H�口�Ӟ��h��?#8221;预估的资料行�?Estimated Row Count)”。这个数字是查询优化器作出的多少个数据行会被�q�回的最��x��。如果执行了表扫描且”预估的数据行�?#8221;数值很高的话，��意味着�q�回的记录数很多�Q�查询优化器认�ؓ执行表扫描比使用可用的非聚集索引更快�?/p>

· Index Seek(索引查找)�Q�烦引查找意味着查询优化器��用了数据表上的非聚集索引来查找数据。性能通常会很快，��其是当只有��数的数据行被返回时�?/p>

· Clustered Index Seek(聚集索引查找)�Q�这指查询优化器使用了数据表上的聚集索引来查找数据，性能很快。实际上�Q�这是SQL Server能做的最快的索引查找�c�d��?/p>

· Clustered Index Scan(聚集索引扫描)�Q�聚集烦引扫描与表扫描相��|��不同的是聚集索引扫描是在一个徏有聚集烦引的数据表上执行的。和一般的表扫描一��P��聚集索引扫描可能表明存在效能问题。一般来��_��有两�U�原因会引此聚集索引扫描的执行。第一个原因，相对于数据表上的整体数据行数目，可能需要获取太多的数据行。查�?#8221;预估的数据行数量(Estimated Row Count)”可以�Ҏ��加以验证。第二个原因�Q�可能是�׃��WHERE条�g句中用到的字�D�选择性不高。在��M��情况下，与标准的表扫描不同，聚集索引扫描�q�不会��L��L��找数据表中的所有数据，所以聚集烦引扫描一般都会比标准的表扫描要快。通常来说�Q�要��聚集烦引扫描改成聚集烦引查找，你唯一能做的是重写查询语句�Q�让语句限制性更多，从而返回更��的数据行�?/p>

�l�大多数情况下，查询优化器会对连接进行分析，按最有效率的��序�Q��用最有效率的�q�接�c�d��来对数据表进行连接。但�q�不��L��如此。在囑�Ş执行计划中你可以看到代表查询所使用到的各种不同�q�接�c�d��的图标。此外，每个�q�接图标都有两个��头指向它。指向连接图标的上面的箭头代表该�q�接的外部表�Q�下面的��头则代表这个连接的内部表。箭头的另一头则指向被连接的数据表名�?/p>

有时在多表连接的查询中，��头的另一头指向的�q�不是一个数据表�Q�而是另一个连接。如果将鼠标�U�d��指向外部�q�接与内部连接的��头上，��可以看��C��个弹出式�H�口�Q�告诉你有多��数据行被发送至�q�个�q�接来进行处理。外部表应该��L��比内部表含有更少的数据行。如果不是，则说明查询优化器所选择的连接顺序可能不正确(下面是关于这个话题的更多信息)�?/p>

首先�Q�让我们来看看连接类型。SQL Server可以使用三种不同的技术来�q�接资料表：嵌套循环(nested loop)�Q�散�?hash)�Q�以及合�q?merge)。一般来��_��嵌套循环是最快的�q�接�c�d��Q�但如果不可能��用嵌套��@环的话，则会用到散列或者合�q�作为合适的�q�接�c�d��。两者都比嵌套��@环连接慢�?/p>

当连接大表时�Q�则合�ƈ�q�接可能是最佳选项�Q�而非嵌套循环�q�接。唯一的明��这一点的方式是对两者都�q�行��试以查看哪一个最有效率�?/p>

如果你怀疑某个查询速度慢的原因可能是因为它所使用的连接类型不理想�Q�那么你可以使用�q�接提示来复盖查询优化器的选择。在使用�q�接提示之前�Q�你需要花费一些时间去了解一下每�U�连接类型以及它们的工作方式。这是一个复杂的话题�Q�超��Z��本文的讨��围�?/p>

查询优化器选择最有效率的�q�接�c�d��来连接数据表。例如，嵌套循环�q�接的外部表应该是连接的两个表中较小的那个表。散列连接也是一��P��它的外部表应该是较小的那个表。如果你觉得查询优化器选择的连接顺序是错误的，可以使用�q�接提示来复盖它�?/p>

你常�怼�在图形执行计划上看到标识�?#8221;书签查找(Bookmark Lookup)”的图标。书�{�查扄��当常见。书�{�查扄��本质是告诉你查询处理器必��M��数据表或者聚集烦引中来查扑֮�所需要的数据行，而不是从非聚集烦引中直接��d��?/p>

打比方说�Q�如果一个查询语句的SELECT,JOIN以及WHERE子句中的所有字�D�，都不存在于那个用来定位符合查询条件的数据行的非聚集烦引中�Q�那么查询优化器��׃��得不做额外的工作在数据表或聚集烦引中查找那些满��q�个查询语句的字�D�c�?/p>

另一�U�引起书�{�查扄��原因是��用了SELECT *。由于在�l�大多情况下它会�q�回比你实际所需更多的数据，所以应该永不��用SELECT *.

从性能斚w��来说�Q�书�{�查找是不理想的。因为它会请求额外的I/O开销在字�D�中查找以返回所需的数据行�?/p>

如果认�ؓ书签查找防碍了查询的性能�Q�那么有四种选择可以用来避免它：可以建立WHERE子句会用到的聚集索引�Q�利用烦引交集的优势�Q�徏立覆盖的非聚集烦引，或�?如果是SQL Server 2000/2005企业版的�?可以建立索引视图。如果这些都不可能，或者��用它们中的�Q何一个都会耗用比书�{�查找更多的资源�Q�那么书�{�查扑ְ�是最佳的选择了。[

本文来自CSDN博客�Q��{载请标明出处�Q�http://blog.csdn.net/xiao_hn/archive/2009/06/11/4259628.aspx

何克�?/a> 2010-04-15 17:12 发表评论

SQLserver锁和事务隔离�U�别的比较与使用

Thu, 04 Feb 2010 07:01:00 GMT

对象

�?span style="font: 7pt Times New Roman"> �?/strong>�Q�每�?/span>SQL语句

�?span style="font: 7pt Times New Roman">     隔离�Q�事�?/span>

�?/strong>

�?/span>

�q�发问题

丢失更新

未确认的��d��Q�脏读）

不一致的分析�Q�非重复读）�Q�多�ơ读取相同的数据�Q�行�Q�不一��_��其他用户更改update�Q?/span>

�q�d��读：多次��d��有不存在和新增的数据�Q�其他用��h��?/span>insert或删�?/span>delete�Q?/span>

隔离�U�别

隔离�U�别

脏读

不可重复��d��

�q�d��

说明

未提交读(read uncommitted)

�?/span>

�?/span>

�?/span>

如果其他事务更新�Q�不��是否提交，立即执行

提交�?span>(read committed默认)

�?/span>

�?/span>

�?/span>

��d��提交�q�的数据。如果其他事务更新没提交�Q�则�{�待

可重复读(repeatable read)

�?/span>

�?/span>

�?/span>

查询期间�Q�不允许其他事务update

可串行读(serializable)

�?/span>

�?/span>

�?/span>

查询期间�Q�不允许其他事务insert或delete

提交�?/span>

假设存在�?/span>A�Q�如下所�C?/span>

A1

A2

A3

11

21

31

12

22

32

打开查询分析器�ƈ打开两个�q�接�Q�分别输入如下两个事务：

--事务�?/span>

SET TRANSACTION ISOLATION LEVEL READ Committed

begin tran

update A set A2 = 20 where A1 = 11

waitfor delay '00:00:10'

rollback tran

--事务�?/span>

SET TRANSACTION ISOLATION LEVEL READ Committed

select * from A where A1 = 11

如果先运行事务Ⅰ�Q�然后紧接着�q�行事务Ⅱ，则事务Ⅱ要等�?/span>10�U�钟�Q?/span>一个连接在修改数据块时别的�q�接也不能查询这个数据块�Q�直到解�?/strong>。反之亦�Ӟ��ȝ��时候不能写和修�?/span>�Q��?/span>

如果把事务Ⅱ改�ؓ如下

SET TRANSACTION ISOLATION LEVEL READ UNCommitted

select * from A where A1 = 11

那么事务Ⅱ不需�{�待�Q�立��x��行（可以看出READ UNCommitted事务select不对数据发出�׃�n�?/strong>�Q?/span>

�?/strong>�Q?/span>(�q�里主要讲解 �׃�n�?/strong> �?/span> 排他�?/strong> 两种�l�常用到�?strong style="background-color: #99ff99; color: black">�?/strong>)

�׃�n�?/strong>主要是�ؓ了共享读�Q?/span>select�Q�，如果存在事务�Q�一个或多个�Q�拥有对表中数据�Q�关�?strong style="background-color: #99ff99; color: black">�?/strong>数据的多��，�?strong style="background-color: #99ff99; color: black">�?/strong>的粒度而定�Q�的�׃�n�?/strong>�Q�不允许�?strong style="background-color: #99ff99; color: black">�?/strong>定的数据�q�行更新(update)�Q�从�?/strong>的角度讲�Q�即不允�怺�务获取排�?strong style="background-color: #99ff99; color: black">�?/strong>�Q�要�{�到所有的�׃�n�?/strong>都释放掉�Q�。反之，如果事务�Ҏ��据已�l�具有排�?strong style="background-color: #99ff99; color: black">�?/strong>�Q�只能有一个）�Q�其他的事务��׃��能对�?/strong>定的数据获取�׃�n�?/strong>和排�?strong style="background-color: #99ff99; color: black">�?/strong>�Q�即排他�?/strong>与共�?strong style="background-color: #99ff99; color: black">�?/strong>不能兼容�Q�更多信息请查看�?/strong>兼容�?/span>�Q�，在此特别��一�?/span> �?/strong>定的数据 �Q�因为有的资料上讲解�?/span>“一个连接写的时候，另一个连接可以写”�Q�实际上写的�q�种情况是各个连接的��d��的数据不是相同的行，也就是说各个�q�接�?/strong>定的数据不同�?/span>

�Ҏ��以上分析�Q�我们�ȝ��为六个字�?#8220;�׃�n读，排他�?/span>”�?/span>

了解�?strong style="background-color: #99ff99; color: black">�?/strong>的情况之后，又涉及到一个问题。事务究竟要保持�?/strong>多久�?/span>?

一般来��_��׃�n�?/strong>�?strong style="background-color: #99ff99; color: black">�?/strong>定时间与事务�?strong style="background-color: #ffff66; color: black">隔离�U�别有关�Q�如�?strong style="background-color: #ffff66; color: black">隔离�U�别�?/span>Read Committed的默认��别，只在��d��(select)的期间保�?strong style="background-color: #99ff99; color: black">�?/strong>定，卛_��查询出数据以后就释放�?strong style="background-color: #99ff99; color: black">�?/strong>�Q�如�?strong style="background-color: #ffff66; color: black">隔离�U�别为更高的Repeatable read�?/span>Serializable�Q�直��C��务结束才释放�?/strong>。另说明�Q�如�?/span>select语句中指定了HoldLock提示�Q�则也要�{�到事务�l�束才释�?strong style="background-color: #99ff99; color: black">�?/strong>�?/span>

排他�?/strong>直到事务�l�束才释放�?/span>

做出了以上分析，现在我们可能会存在这��L��疑问�Q�到底在执行SQL语句的时候发��Z��么样�?strong style="background-color: #99ff99; color: black">�?/strong>呢，�q�就�׃��务的隔离�U�别军_��了。一般情况，读语�?/span>(select)发出�׃�n�?/strong>�Q�写语句(update,insert,delete)发出排他�?/strong>。但是，如果�q�样不能满��我们的要求怎么办呢�Q�有没有更多选择呢，别急，SQLserver为我们提供了�?/strong>定提�C�的概念�?/span>

       �?/strong>定提�C�对SQL语句�q�行特别指定�Q�这个指定将覆盖事务�?strong style="background-color: #ffff66; color: black">隔离�U�别。下面对各个�?/strong>定提�C�分别予以介�l�（更多资料��h��?/span>SQLserver的联机帮助）�Q�笔者做��Z��以下分类�?/span>

�c�d��1

�?span style="font: 7pt Times New Roman">     READUNCOMMITTED�Q�不发出�?/strong>

�?span style="font: 7pt Times New Roman">     READCOMMITTED�Q�发出共�?strong style="background-color: #99ff99; color: black">�?/strong>�Q�保持到��d��l�束

�?span style="font: 7pt Times New Roman">     REPEATABLEREAD�Q�发出共�?strong style="background-color: #99ff99; color: black">�?/strong>�Q�保持到事务�l�束

�?span style="font: 7pt Times New Roman">     SERIALIZABLE�Q�发出共�?strong style="background-color: #99ff99; color: black">�?/strong>�Q�保持到事务�l�束

�c�d��2

�?span style="font: 7pt Times New Roman">     NOLOCK�Q�不发出�?/strong>。等同于READUNCOMMITTED

�?span style="font: 7pt Times New Roman">     HOLDLOCK�Q�发出共�?strong style="background-color: #99ff99; color: black">�?/strong>�Q�保持到事务�l�束。等同于SERIALIZABLE

�?span style="font: 7pt Times New Roman">     XLOCK�Q�发出排�?strong style="background-color: #99ff99; color: black">�?/strong>�Q�保持到事务�l�束�?/span>

�?span style="font: 7pt Times New Roman">     UPDLOCK�Q�发出更�?strong style="background-color: #99ff99; color: black">�?/strong>�Q�保持到事务事务�l�束。（更新�?/strong>�Q�不��d��别的事物�Q�允许别的事物读数据�Q�即更新�?/strong>可与�׃�n�?/strong>兼容�Q�，但他��保自上�ơ读取数据后数据没有被更�?/span>�Q?/span>

�?span style="font: 7pt Times New Roman">     READPAST�Q�发出共�?strong style="background-color: #99ff99; color: black">�?/strong>�Q�但跌���?/strong>定行�Q�它不会被阻塞�?span style="color: red">适用条�g�Q�提交读�?strong style="background-color: #ffff66; color: black">隔离�U�别�Q�行�U?strong style="background-color: #99ff99; color: black">�?/strong>�Q?/span>select语句中�?/span>

�c�d��3

�?span style="font: 7pt Times New Roman">     ROWLOCK�Q�行�U?strong style="background-color: #99ff99; color: black">�?/strong>

�?span style="font: 7pt Times New Roman">     PAGLOCK�Q�页�U?strong style="background-color: #99ff99; color: black">�?/strong>

�?span style="font: 7pt Times New Roman">     TABLOCK�Q�表�?/strong>

�?span style="font: 7pt Times New Roman">     TABLOCKX�Q�表排他�?/strong>

讲解�?strong style="background-color: #99ff99; color: black">�?/strong>后，下面�l�合一个具体实例，具体看一�?strong style="background-color: #99ff99; color: black">�?/strong>的��用�?/span>

       在很多系�l�中�Q�经�怼�遇到�q�种情况�Q�要保持一个编��L��唯一�Q�如会计软�g中的凭证的编受��一�U�编��L��处理是这��L��Q�把表中的最大编号保存到表中�Q�然后在�q�个�~�号上篏加，形成新的�~�号。这个过�E�对�q�发处理要求非常高，下面我们��来模拟�q�个�q�程�Q�看如何保持�~�号的唯一性�?/span>

       新徏一张表code来保存凭证的最大编受��字�D�如下：�~�号:bh(numeric(18,0)),凭证表名pinzheng(varchar(50))

假设表中有这��L��一条记录：

Bh

Pinzheng

18000

会计凭证

新徏一个存储过�E�来生成新的凭证�~�号�Q�如下：

CREATE PROCEDURE up_getbh  AS

       Begin Tran

              Declare @numnewbh numeric(18,0)

              select  @numnewbh = bh FROM code  WITH (UPDLOCK,ROWLOCK) where pinzheng = '会计凭证'

              set @numnewbh = @numnewbh + 1

              update code set  bh = @numnewbh where pinzheng = '会计凭证'

              print @numnewbh

       Commit tran

GO

然后�Q�打开查询分析器，�q�多开几个�q�接�Q�笔者开�?/span>8个连接，模拟�?/span>8个�h同时�q�发�Q�读者可以开更多的连接进行试验）�Q�把�c�M��以下�q�样的语句复制到每个�q�接�H�口中，

declare @i numeric(18,0)

set @i = 1

while @i = 1

Begin

       if getdate() > '2004-07-22 14:23'  --讑֮�一个时��_��到此旉��同时执行upgetbh存储�q�程

              set @i = 0

end

exec up_getbh

然后�Q�接�q�运行各个连接，�?/span>2004-7-22 14�Q?/span>23 �q�一刻，各个�q�接同时�q�行up_getbh。从�q�行�l�果可以看出�q�接��序出现18001开始个数字�Q��ƈ没有重号或丢��L��现象�?/span>

分析�Q�由�?/span>up_getbh中的select语句使用了更�?strong style="background-color: #99ff99; color: black">�?/strong>�Q�因更新�?/strong>之间不能兼容�Q�所以各个连接要�{�到所有其他的�q�接释放�?strong style="background-color: #99ff99; color: black">�?/strong>才能执行�Q�而更�?strong style="background-color: #99ff99; color: black">�?/strong>的释放要�{�到事务�l�束�Q�这样就不会发生号出错的现象了�?/span>

何克�?/a> 2010-02-04 15:01 发表评论

Sql Server 锁机�?

Thu, 04 Feb 2010 06:38:00 GMT

转自�Q?a >http://blog.csdn.net/missmecn/archive/2008/10/06/3019798.aspx

相关文章:

mysql数据库锁
ORACLE里几�U�锁模式

推荐圈子: Pipboy
更多相关推荐
�?span class="hilite3">锁机�?/font>的研�I�要具备两个条�g�Q?
1�Q�数据量�?
2�Q�多个用户同时�ƈ�?
如果�~�少�q�两个条�Ӟ��数据库不�Ҏ��产生死锁问题。研�I��v来可能会事倍功半。如果这两个条�g都有�Q�但你还是按数据库缺省设�|�来处理数据�Q�则会带来很多的问题�Q�比如：
1�Q�丢失更�?
A,B两个用户��d��一数据�q�进行修�?其中一个用��L��修改�l�果破坏了另一个修改的�l�果
2�Q�脏�?
A用户修改了数据时,B用户也在读该数据,但A用户因�ؓ某些原因取消了对数据的修�?数据恢复原�?此时B得到的数据就与数据库内的数据产生了不一�?
3�Q�不可重复读
B用户��d��该数据�ƈ修改,同时�Q�A用户也在��d��数据�Q�此时A用户再读取数据时发现前后两次的��g��一�?
SQL SERVER 作�ؓ多用��h��据库�pȝ��Q�以事务为单位，使用锁来实现�q�发控制�?span class="hilite1">SQLSERVER使用“�?#8221;��保事务完整性和数据一致性�?

一、锁的概�?/strong>
锁（LOCKING�Q�是最常用的�ƈ发控制机构。是防止其他事务讉K��指定的资源控制、实现�ƈ发控制的一�U�主要手�D�c��锁是事务对某个数据库中的资源（如表和记录）存取前，先向�pȝ��提出��h��Q�封锁该资源�Q�事务获得锁后，卛_��得对数据的控制权�Q�在事务释放它的锁之前，其他事务不能更新此数据。当事务撤消后，释放被锁定的资源�?
当一个用户锁住数据库中的某个对象�Ӟ��其他用户��׃��能再讉K��该对�?

二、锁的粒�?/strong>
SQL Server 2000 ��h��多粒度锁定，允许一个事务锁定不同类型的的资源。�ؓ了��锁定的成本减��x��，SQL Server 自动��资源锁定在适合��d��的��别。锁定在较小的粒度（例如行）可以增加�q�发但需要较大的开销�Q�因为如果锁定了许多行，则需要控制更多的锁。锁定在较大的粒度（例如表）��ƈ发而言是相当昂�늚��Q�因为锁定整个表限制了其它事务对表中��L��部分�q�行讉K��Q�但要求的开销较低�Q�因为需要维护的锁较��?span class="hilite1">SQL Server 可以锁定行、页、扩展盘区、表、库�{�资源�?

资源 �U�别描述
RID 行锁表中的单个行
Key 行��?索引中的�?
Page ��?一个数据页或者烦引页
Extent ��?一�l�数据页或者烦引页
Table 表��?整个�?
Database 数据库��?整个数据�?

选择多大的粒度，�Ҏ��Ҏ��据的操作而定。如果是更新表中所有的行，则用表��?如果是更新表中的某一行，则用行��锁�?
行��锁是一�U�最优锁�Q�因��U�锁不可能出现数据既被占用又没有使用的浪费现象。但是，如果用户事务中频�J�对某个表中的多条记录操作，��导致对该表的许多记录行都加上了行��锁，数据库系�l�中锁的数目会急剧增加�Q�这样就加重了系�l�负��P��影响�pȝ��性能。因此，�?span class="hilite1">SQL Server中，�q�支持锁升��(lock escalation)�?
所谓锁升��是指调整锁的�_�度�Q�将多个低粒度的锁替换成��数的更高粒度的锁，以此来降低系�l�负荗��在SQL Server中当一个事务中的锁较多�Q�达到锁升��门限�Ӟ��pȝ��自动��行�U�锁和页面锁升��U�锁�?
特别值得注意的是�Q�在SQL Server中，锁的升��门限以及锁升�U�是��q��l�自动来��定的，不需要用戯��|��?

三、锁的模�?/strong>
锁模式以及描�q�表

锁模�?描述
�׃�n�Q�S�Q?用于不更�Ҏ��不更新数据（只读操作�Q�，如SELECT语句
更新�Q�U�Q?用于可更新的资源中。防止当多个会话在读取、锁定以及随后可能进行的资源更新时发生常见�Ş式的死锁�?
排它�Q�X�Q?用于数据修改操作�Q�例�?INSERT、UPDATE或DELETE。确保不会同时对同一资源�q�行多重更新
意向 �?Microsoft SQL Server 数据库引擎获取低�U�别的锁�Ӟ��它还��在包含更低�U�别对象的对象上攄��意向�?例如�Q?当锁定行或烦引键范围�Ӟ��数据库引擎将在包含行或键的页上放�|�意向锁。当锁定��|��Q�数据库引擎��在包含��늚�更高�U�别的对象上攄��意向锁�?
意向锁的�c�d��为：意向�׃�n�Q�IS�Q�、意向排它（IX�Q�以及意向排它共享（SIX�Q?
架构在执行依赖于表架构的操作时��用。架构锁的类型�ؓ�Q�架构修改（Sch-M�Q�和架构�E�_��Q�Sch-S�Q?
大容量更斎ͼ�BU�Q?向表中大定w��复制数据�q�指定了TABLOCK提示时��?

�?SQL Server 中锁的设�|?/strong>
1 处理死锁和设�|�死锁优先��
死锁��是多个用户甌��不同��锁,�׃��甌��者均拥有一部分��锁权而又�{�待其他用户拥有的部分封锁而引��L��无休止的�{�待
可以使用SET DEADLOCK_PRIORITY控制在发生死锁情冉|��会话的反应方式�?
Syntax:
SET DEADLOCK_PRIORITY { LOW | NORMAL}
其中LOW说明该进�E�会话的优先�U�较低，在出现死锁时�Q�可以首先中断该�q�程的事务�?
2 处理��时和设�|�锁��时持箋旉��?
@@LOCK_TIMEOUT �q�回当前会话的当前锁��时讄��Q�单位�ؓ毫秒
SET LOCK_TIMEOUT 讄��允许应用�E�序讄��语句�{�待��d��资源的最长时间。当语句�{�待的时间大�?LOCK_TIMEOUT 讄��Ӟ��pȝ��自动取消阻塞的语句�Q��ƈ�l�应用程序返�?已超�q�了锁请求超时时�D?�?1222 号错误信�?
�C�Z��
1�Q�将锁超时期限设�|��ؓ 1,800 毫秒�?
SET LOCK_TIMEOUT 1800
2) 配置索引的锁定粒�?
可以使用 sp_indexoption �pȝ��存储�q�程来设�|�用于烦引的锁定�_�度
3�Q�设�|�事务隔��ȝ��?
SET   TRANSACTION   ISOLATION   LEVEL

�?查看锁的信息
1 执行 EXEC SP_LOCK 报告有关锁的信息
2 查询分析器中按Ctrl+2可以看到锁的信息

六、奇怪的sql语句

Java代码

begin tran
update titles set title_idid�Q�title_id  where 1�Q?/font>2
if (selectavg(price)fromtitles)>$15
begin
update titles set price�Q�price*1.10
where price<(select avg(price)from titles)
end
commit tran

begin tran update titles set title_idid�Q�title_id where 1�Q? if (selectavg(price)fromtitles)>$15 begin update titles set price�Q�price*1.10 where price<(select avg(price)from titles) end commit tran

update titles set title_idid�Q�title_id where 1�Q?�Q�这个条件是永远也不会成立的�Q�如此写的含义是什么呢�Q?
�q�里的where子句看�v来很奇怪，��管计算出的�l�果��L��false。当优化器处理此查询�Ӟ��因�ؓ它找不到��M��有效的SARG�Q�它的查询规划就会强制��用一个独占锁定来�q�行表扫描。此事务执行�Ӟ��where子句立即得到一个false��|��于是不会执行实际上的扫描�Q�但此进�E�仍得到了一个独占的表锁定�?
因�ؓ此进�E�现在已有一个独占的表锁�Q�所以可以保证没有其他事务会修改��M��数据行，能进行重复读�Q�且避免了由于holdlock所引�v的潜在性死锁�?
但是�Q�在使用表锁定来��可能地减少死锁的同�Ӟ��也增加了对表锁定的争用。因此，在实现这�U�方法之前，你需要权衡一下：避免死锁是否比允许�ƈ发地对表�q�行讉K��更重要�?
所以，在这个事务中�Q�没有其他进�E�修改表中�Q何行的price�?

�?如何避免死锁
1 使用事务�Ӟ��量�~�短事务的逻辑处理�q�程�Q�及早提交或回滚事务�Q?
2 讄��死锁��时参数为合理范��_��如：3分钟-10分种�Q�超�q�时��_��自动攑ּ�本次操作�Q�避免进�E�悬挂；
3 所有的SP都要有错误处理（通过@error�Q?
4 一般不要修�?span class="hilite1">SQL SERVER事务的默认��别。不推荐��加锁
5 优化�E�序�Q�检查�ƈ避免死锁现象出现�Q?
1�Q�合理安排表讉K��序
2�Q�在事务中尽量避免用户干预，��量使一个事务处理的��d��些�?
3�Q�采用脏��L��术。脏�ȝ��于不对被讉K��的表加锁�Q�而避免了锁冲�H�。在客户�?服务器应用环境中�Q�有些事务往往不允许读脏数据，但在特定的条件下�Q�我们可以用脏读�?
4�Q�数据访问时域离散法。数据访问时域离散法是指在客��h��/服务器结构中�Q�采取各�U�控制手�D�|��制对数据库或数据库中的对象访问时间段。主要通过以下方式实现: 合理安排后台事务的执行时��_��采用工作��对后台事务�q�行�l�一��理。工作流在管理�Q务时�Q�一斚w��限制同一�c�M�Q务的�U�程敎ͼ�往往限制�?个）�Q�防止资源过多占�? 另一斚w��合理安排不同��d��执行时序、时��_��量避免多个后台��d��同时执行�Q�另外，避免在前��C��易高峰时间运行后��C�Q�?
5�Q�数据存储空间离散法。数据存储空间离散法是指采取各种手段�Q�将逻辑上在一个表中的数据分散到若�q�离散的�I�间上去�Q�以便改善对表的讉K��性能。主要通过以下�Ҏ��实现: �W�一�Q�将大表按行或列分解��q�小�? �W�二�Q�按不同的用��L��分解�?
6�Q��用尽可能低的隔离性��别。隔��L��别是指�ؓ保证数据库数据的完整性和一致性而��多用户事务隔��ȝ��E�度�Q?span class="hilite1">SQL92定义�?�U�隔��L��别：未提交读、提交读、可重复��d��可串行。如果选择�q�高的隔��L��别，如可串行�Q�虽然系�l�可以因实现更好隔离性而更大程度上保证数据的完整性和一致性，但各事务间冲�H�而死锁的��Z��大大增加�Q�大大媄响了�pȝ��性能�?
7�Q��用Bound Connections。Bound connections 允许两个或多个事务连接共享事务和锁，而且��M��一个事务连接要甌��锁如同另外一个事务要甌��锁一��P��因此可以允许�q�些事务�׃�n数据而不会有加锁的冲�H��?
8�Q�考虑使用乐观锁定或��事务首先获得一个独占锁定�?nbsp;

八如何对行�?表、数据库加锁
1 如何锁一个表的某一�?

Java代码

SET TRANSACTION ISOLATION LEVEL READ UNCOMMITTED
SELECT * FROM table1 ROWLOCK WHERE A = 'a1'

SET TRANSACTION ISOLATION LEVEL READ UNCOMMITTED SELECT * FROM table1 ROWLOCK WHERE A = 'a1'

2 锁定数据库的一个表
select col1 from �?(tablockx) where 1=1 ;
加锁后其它�h不可操作�Q�直到加锁用戯��锁，用commit或rollback解锁
3.实例
��

Java代码

create table table1(A varchar(50)  not  null, B varchar(50) ,C varchar(50));
create table table2(D varchar(50),E varchar(50))
insert table1 (A,B,C) values(‘a1’,’b1’,’c1’);
insert table1 (A,B,C) values(‘a2’,’b2’,’c2’);
insert table1 (A,B,C) values(‘a3’,’b3’,’c3’);
insert table2 (D,E) values(‘d1’,’e1’);
insert table2 (D,E) values(‘d2’,’e2’);

create table table1(A varchar(50) not null, B varchar(50) ,C varchar(50)); create table table2(D varchar(50),E varchar(50)) insert table1 (A,B,C) values(‘a1’,’b1’,’c1’); insert table1 (A,B,C) values(‘a2’,’b2’,’c2’); insert table1 (A,B,C) values(‘a3’,’b3’,’c3’); insert table2 (D,E) values(‘d1’,’e1’); insert table2 (D,E) values(‘d2’,’e2’);

1�Q�排它锁

Java代码

-- A事务先更新table1表，在更新时�Q�对其他事务�q�行排他
begin tran
update table1 set A='aa' where B='b2'�Q?
waitfor delay '00:00:30'�Q?nbsp;--�{�待30�U?
commit tran
-- A事务先更新table2�?
begin tran
select * from table1 where B='b2';
commit tran

-- A事务先更新table1表，在更新时�Q�对其他事务�q�行排他 begin tran update table1 set A='aa' where B='b2'�Q? waitfor delay '00:00:30'�Q?--�{�待30�U? commit tran -- A事务先更新table2�? begin tran select * from table1 where B='b2'; commit tran
若同时执行上�q�C��个事务，则select查询必须�{�待update执行完毕才能执行卌��{�待30�U?
2�Q�共享锁

Java代码

-- A事务先查询table1表，在查询时�Q�加�׃�n锁，防止其他事务对该表进行修�Ҏ��?
begin tran
select * from table1 holdlock where B='b2' ;
-holdlock��Zؓ加锁
waitfor delay '00:00:30';--�{�待30�U?
commit tran
-- A事务先查询table1表，后更改table1�?
begin tran
select A,C from table1 where B='b2';
update table1 set A='aa' where B='b2';
commit tran

-- A事务先查询table1表，在查询时�Q�加�׃�n锁，防止其他事务对该表进行修�Ҏ��? begin tran select * from table1 holdlock where B='b2' ; -holdlock��Zؓ加锁 waitfor delay '00:00:30';--�{�待30�U? commit tran -- A事务先查询table1表，后更改table1�? begin tran select A,C from table1 where B='b2'; update table1 set A='aa' where B='b2'; commit tran
若�ƈ发执行上�q�C��个事务，则B事务中的select查询可以执行,而update必须�{�待�W�一个事务释攑օ�享锁转�ؓ排它锁后才能执行卌��{�待30�U?
3�Q�死�?

Java代码

-- A事务先更新table1表，然后延时30�U�，再更新table2表；
begin tran
update table1 set A='aa' where B='b2';
--�q�将�?nbsp;Table1 中生成排他行锁，直到事务完成后才会释放该锁�?
waitfor delay '00:00:30';
--�q�入延时
update table2 set D='d5' where E='e1' ;
commit tran
-- B事务先更新table2表，然后延时10�U�，再更新table1表；
begin tran
update table2 set D='d5' where E='e1';
--�q�将�?nbsp;Table2 中生成排他行锁，直到事务完成后才会释放该�?
waitfor delay '00:00:10'
--�q�入延时
update table1 set A='aa' where B='b2' ;
commit tran

-- A事务先更新table1表，然后延时30�U�，再更新table2表； begin tran update table1 set A='aa' where B='b2'; --�q�将�?Table1 中生成排他行锁，直到事务完成后才会释放该锁�? waitfor delay '00:00:30'; --�q�入延时 update table2 set D='d5' where E='e1' ; commit tran -- B事务先更新table2表，然后延时10�U�，再更新table1表； begin tran update table2 set D='d5' where E='e1'; --�q�将�?Table2 中生成排他行锁，直到事务完成后才会释放该�? waitfor delay '00:00:10' --�q�入延时 update table1 set A='aa' where B='b2' ; commit tran
若�ƈ发执行上�q�C��个事务，A,B两事务都要等待对斚w��放排他锁�Q�这样便形成了死锁�?

九�?span class="hilite1">sqlserver提供的表�U�锁
sqlserver所指定的表�U�锁定提�C�有如下几种
1�Q?HOLDLOCK: 在该表上保持�׃�n锁，直到整个事务�l�束�Q�而不是在语句执行完立即释放所��d��的锁�?nbsp;
2�Q?NOLOCK�Q�不��d��׃�n锁和排它锁，当这个选项生效后，可能��d��未提交读的数据或“脏数�?#8221;�Q�这个选项仅仅应用于SELECT语句�?nbsp;
3�Q?PAGLOCK�Q�指定添加页锁（否则通常可能��d��表锁�Q?
4�Q?READCOMMITTED用与�q�行在提交读隔离�U�别的事务相同的锁语义执行扫描。默认情况下�Q?span class="hilite1">SQL Server 2000 在此隔离�U�别上操作�?
5�Q?READPAST: 跌��已经加锁的数据行�Q�这个选项��事务��d��数据时蟩�q�那些已�l�被其他事务锁定的数据行�Q�而不是阻塞直到其他事务释��N��Q�READPAST仅仅应用于READ COMMITTED隔离性��别下事务操作中的SELECT语句操作
6�Q?READUNCOMMITTED�Q�等同于NOLOCK�?nbsp;
7�Q?REPEATABLEREAD�Q�设�|�事务�ؓ可重复读隔离性��别�?nbsp;
8�Q?ROWLOCK�Q��用行�U�锁�Q�而不使用�_�度更粗的页�U�锁和表�U�锁�?
9�Q?SERIALIZABLE�Q�用与运行在可串行读隔离�U�别的事务相同的锁语义执行扫描。等同于 HOLDLOCK�?
10�Q?TABLOCK�Q�指定��用表�U�锁�Q�而不是��用行�U�或��面�U�的锁，SQL Server在该语句执行完后释放�q�个锁，而如果同时指定了HOLDLOCK�Q�该锁一直保持到�q�个事务�l�束�?
11�Q?TABLOCKX�Q�指定在表上使用排它锁，�q�个锁可以阻止其他事务读或更新这个表的数据，直到�q�个语句或整个事务结束�?
12�Q?UPDLOCK �Q�指定在读表中数据时讄��更新锁（update lock�Q�而不是设�|�共享锁�Q�该锁一直保持到�q�个语句或整个事务结束，使用UPDLOCK的作用是允许用户先读取数据（而且不阻塞其他用戯��数据�Q�，�q�且保证在后来再更新数据�Ӟ��q�一�D�|��间内�q�些数据没有被其他用户修�?
SELECT * FROM table WITH (HOLDLOCK) 其他事务可以��d��表，但不能更新删�?
SELECT * FROM table WITH (TABLOCKX) 其他事务不能��d��?更新和删�?

十、应用程序锁

应用�E�序锁就是客��L��代码生成的锁�Q�而不�?span class="hilite1">sql server本��n生成的锁处理应用�E�序锁的两个�pȝ��存储�q�程
sp_getapplock�Q?锁定应用�E�序资源
sp_releaseapplock�Q?为应用程序资源解�?

何克�?/a> 2010-02-04 14:38 发表评论

Thu, 04 Feb 2010 06:22:00 GMT

在实际的多用户�ƈ发访问的生��环境里边�Q�我们经常要��可能的保持数据的一致性。而其中最典型的例子就是我们从表里边读取数据，��查验证后�Ҏ��据进行修改，然后写回到数据库中。在��d��和写入的�q�程中，假如在多用户�q�发的环境里边，其他用户已经把你要修改的数据�q�行了修�Ҏ��非常有可能发生的情况�Q�这样就造成了数据的不一致性。解册��L��办法�Q�SQL SERVER提出了乐观锁定和悲观锁定的概念，下边我以一个实例来说明如何使用乐观锁定和悲观锁定来解决�q�样的问题�?

/* 建立��试�?Card,代表一个真实的卡库,供用��h��?用户要从里边选出一个未使用的卡�Q�也��是F_Flag=0的卡�Q�给用户注册�Q�更新F_Name,F_Time,F_Flag字段. 假如出现两个用户同时更新一张卡的情况，是不能容忍的�Q�也��是我们所说的数据不一致行�?/

create table Card(F_CardNO varchar(20),F_Name varchar(20),F_Flag bit,F_Time datetime)
Go
insert Card(F_CardNo,F_Flag) select '1111-1111',0
insert Card(F_CardNo,F_Flag) select '1111-1112',0
insert Card(F_CardNo,F_Flag) select '1111-1113',0
insert Card(F_CardNo,F_Flag) select '1111-1114',0
insert Card(F_CardNo,F_Flag) select '1111-1115',0
insert Card(F_CardNo,F_Flag) select '1111-1116',0
insert Card(F_CardNo,F_Flag) select '1111-1117',0
insert Card(F_CardNo,F_Flag) select '1111-1118',0
insert Card(F_CardNo,F_Flag) select '1111-1119',0
insert Card(F_CardNo,F_Flag) select '1111-1110',0
Go

-- 下边是我们经�怋�用的更新�Ҏ��如下:

declare @CardNo varchar(20)
Begin Tran

-- 选择一张未使用的卡
select top 1 @CardNo=F_CardNo
from Card where F_Flag=0

-- 延迟50�U�，模拟�q�发讉K��.
waitfor delay '000:00:50'

-- 把刚才选择出来的卡�q�行注册.

update Card
set F_Name=user,
F_Time=getdate(),
F_Flag=1
where F_CardNo=@CardNo

commit

问题:假如我们在同一�H�口执行同一�D�代码，但是��L��了waitfor delay子句.两边执行完毕�?我们发现��管执行了两�ơ注册，但是只注册了一张卡�Q�也��是两个人注册了同一张卡.

悲观锁定解决�Ҏ��

-- 我们只要对上边的代码做微��的改变��可以实现悲观的锁定.

declare @CardNo varchar(20)
Begin Tran

-- 选择一张未使用的卡
select top 1 @CardNo=F_CardNo
from Card with (UPDLOCK) where F_Flag=0

-- 延迟50�U�，模拟�q�发讉K��.
waitfor delay '000:00:50'

-- 把刚才选择出来的卡�q�行注册.

update Card
set F_Name=user,
F_Time=getdate(),
F_Flag=1
where F_CardNo=@CardNo

commit

注重其中的区别了�?with(updlock),是的,我们在查询的时候��用了with (UPDLOCK)选项,在查询记录的时候我们就对记录加上了更新�?表示我们卛_��Ҏ��记录�q�行更新.注重更新锁和�׃�n锁是不冲�H�的,也就是其他用戯��可以查询此表的内�?但是和更新锁和排它锁是冲�H�的.所以其他的更新用户��׃��d��.假如我们在另外一个窗口执行此代码,同样不加waifor delay子句.两边执行完毕�?我们发现成功的注册了两张�?可能我们已经发现了悲观锁定的�~�点:当一个用戯��行更新的事务的时�?其他更新用户必须排队�{�待,即��那个用户更新的不是同一条记�?

乐观锁定解决�Ҏ��

-- 首先我们在Card表里边加上一列F_TimeStamp �?该列是varbinary(8)�c�d��.但是在更新的时候这个��g��自动增长.

alter table Card add F_TimeStamp timestamp not null

-- 悲观锁定
declare @CardNo varchar(20)
declare @timestamp varbinary(8)
declare @rowcount int

Begin Tran

-- 取得卡号和原始的旉��戛_�?br /> select top 1 @CardNo=F_CardNo,
@timestamp=F_TimeStamp
from Card
where F_Flag=0

-- 延迟50�U�，模拟�q�发讉K��.
waitfor delay '000:00:50'

-- 注册�?但是要比较时间戳是否发生了变�?假如没有发生变化.更新成功.假如发生变化,更新��p�|.

update Card
set F_Name=user,
F_Time=getdate(),
F_Flag=1
where F_CardNo=@CardNo and F_TimeStamp=@timestamp
set @rowcount=@@rowcount
if @rowcount=1
begin
print '更新成功!'
commit
end
else if @rowcount=0
begin
if exists(select 1 from Card where F_CardNo=@CardNo)
begin
print '此卡已经被另外一个用��h��册！'
rollback tran
end
else
begin
print '�q�不存在此卡!'
rollback tran
end
end

在另外一个窗口里�Ҏ��行没有waitfor的代�?注册成功�?�q�回原来的窗�?我们��׃��发现到时间后它显�C�的提示是此卡以被另外一个用��h��册的提示.很明�?�q�样我们也可以避免两个用户同时注册一张卡的现象的出现.同时,使用�q�种�Ҏ��的另外一个好处是没有使用更新�?�q�样增加的系�l�的�q�发处理能力.

上边我具体介�l�了乐观锁定和悲观锁定的使用�Ҏ��,在实际生产环境里�?假如�q�发量不�?我们完全可以使用悲观锁定的方�?因�ؓ�q�种�Ҏ��使用��h��非常方便和简�?但是假如�pȝ��的�ƈ发非常大的话,悲观锁定会带来非常大的性能问题,所以我们就要选择乐观锁定的方�?

本文来自CSDN博客�Q��{载请标明出处�Q�http://blog.csdn.net/gudenren/archive/2009/07/31/4397291.aspx

何克�?/a> 2010-02-04 14:22 发表评论

Thu, 04 Feb 2010 06:16:00 GMT

数据�?-�?

1#定义

数据库和操作�pȝ��一��P��是一个多用户使用的共享资源。当多个用户�q�发地存取数据时�Q�在数据库中��׃��产生多个事务同时存取同一数据的情��c��若对�ƈ发操作不加控制就可能会读取和存储不正��的数据�Q�破坏数据库的一致性�?

    加锁是实现数据库�q�发控制的一个非帔R��要的技术。在实际应用中经�怼�遇到的与锁相关的异常情况�Q�当两个事务需要一�l�有冲突的锁�Q�而不能将事务�l�箋下去的话�Q�就会出现死锁，严重影响应用的正常执行�?

    在数据库中有两种基本的锁�c�d��Q�排它锁�Q�Exclusive Locks�Q�即X锁）和共享锁�Q�Share Locks�Q�即S锁）�?

@当数据对象被加上排它锁时�Q�其他的事务不能对它��d��和修攏V�?

@加了�׃�n锁的数据对象可以被其他事务读取，但不能修攏V�?

数据库利用这两种基本的锁�c�d��来对数据库的事务�q�行�q�发控制�?



2#悲观锁，正如其名�Q�它指的是对数据被外界（包括本系�l�当前的其他事务�Q�以及来自外部系�l�的事务处理�Q�修�Ҏ��保守态度�Q�因此，在整个数据处理过�E�中�Q�将数据处于锁定状态。悲观锁的实玎ͼ�往往依靠数据库提供的锁机�Ӟ��也只有数据库层提供的锁机制才能真正保证数据访问的排他性，否则�Q�即使在本系�l�中实现了加锁机�Ӟ��也无法保证外部系�l�不会修�Ҏ��据）�?

一个典型的倚赖数据库的悲观锁调用：

select * from account where name=”Erica” for update

�q�条 sql 语句锁定�?nbsp;account 表中所有符合检索条�Ӟ��name=“Erica”�Q�的记录。本�ơ事务提交之前（事务提交时会释放事务�q�程中的锁）�Q�外界无法修改这些记录�?

悲观锁大多数情况下依靠数据库的锁机制实现�Q�以保证操作最大程度的独占性。但随之而来的就是数据库性能的大量开销�Q�特别是寚w��事务而言�Q�这��L��开销往往无法承受。如一个金融系�l�，当某个操作员��d��用户的数据，�q�在��d��的用��h��据的基础上进行修�Ҏ��Q�如更改用户帐户余额�Q�，如果采用悲观锁机�Ӟ��也就意味着整个操作�q�程中（从操作员��d��数据、开始修改直��x��交修改结果的全过�E�，甚至�q�包括操作员中途去煮咖啡的旉��Q�，数据库记录始�l�处于加锁状态，可以惌��Q�如果面对几百上千个�q�发�Q�这��L��情况��导致怎样的后果�?





3#乐观锁机制在一定程度上解决了这个问题。乐观锁�Q�大多是��Z��数据版本�Q�Version�Q�记录机制实现。何谓数据版本？即�ؓ数据增加一个版本标识，在基于数据库表的版本解决�Ҏ��中，一般是通过为数据库表增加一�?nbsp;“version” 字段来实现读取出数据�Ӟ��此版本号一同读出，之后更新�Ӟ��Ҏ��版本号加一。此�Ӟ��提交数据的版本数据与数据库表对应记录的当前版本信息�q�行比对�Q�如果提交的数据版本号大于数据库表当前版本号�Q�则予以更新�Q�否则认为是�q�期数据�?

对于上面修改用户帐户信息的例子而言�Q�假设数据库中帐户信息表中有一�?nbsp;version 字段�Q�当前��gؓ 1 �Q�而当前帐户余额字�D�（ balance �Q��ؓ $100 �?

1 操作�?nbsp;A 此时��其��d��Q?nbsp;version=1 �Q�，�q�从其帐户余额中扣除 $50�Q?nbsp;$100-$50 �Q��?

2 在操作员 A 操作的过�E�中�Q�操作员 B 也读入此用户信息�Q?nbsp;version=1 �Q�，�q�从其帐户余额中扣除 $20 �Q?nbsp;$100-$20 �Q��?

3 操作�?nbsp;A 完成了修改工作，��数据版本号加一�Q?nbsp;version=2 �Q�，�q�同帐户扣除后余额（ balance=$50 �Q�，提交��x��据库更新�Q�此时由于提交数据版本大于数据库记录当前版本�Q�数据被更新�Q�数据库记录 version 更新�?nbsp;2 �?

4 操作�?nbsp;B 完成了操作，也将版本号加一�Q?nbsp;version=2 �Q�试囑֐�数据库提交数据（ balance=$80 �Q�，但此时比�Ҏ��据库记录版本时发玎ͼ�操作�?nbsp;B 提交的数据版本号�?nbsp;2 �Q�数据库记录当前版本也�ؓ 2 �Q�不满�� “ 提交版本必须大于记录当前版本才能执行更新 “ 的乐观锁�{�略�Q�因此，操作�?nbsp;B 的提交被驛_��。这��P��避免了操作�?nbsp;B 用基于version=1的旧数据修改的结果覆盖操作员 A 的操作结果的可能�?





4#死锁

死锁的第一�U�情�?

一个用户A 讉K��表A(锁住了表A),然后又访问表B�Q�另一个用户B 讉K��表B(锁住了表B)�Q�然后企图访问表A�Q�这时用户A�׃��用户B已经锁住表B�Q�它必须�{�待用户B释放表B才能�l�箋�Q�同��L��户B要等用户A释放表A才能�l�箋�Q�这��死锁就产生了�?

解决�Ҏ��Q?

�q�种死锁比较常见�Q�是�׃��E�序的BUG产生的，除了调整的程序的逻辑没有其它的办法。仔�l�分析程序的逻辑�Q�对于数据库的多表操作时�Q�尽量按照相同的��序�q�行处理�Q�尽量避免同旉��定两个资源，如操作A和B两张表时�Q��L��按先A后B的顺序处理，必须同时锁定两个资源�Ӟ��要保证在��M��时刻都应该按照相同的��序来锁定资源�?



死锁的第二种情况

用户A查询一条纪录，然后修改该条�U�录�Q�这时用户B修改该条�U�录�Q�这时用户A的事务里锁的性质由查询的�׃�n锁企图上升到独占锁，而用户B里的独占锁由于A有共享锁存在所以必��ȝ��A释放掉共享锁�Q�而A�׃��B的独占锁而无法上升的独占锁也��׃��可能释放�׃�n锁，于是出现了死锁。这�U�死锁比较隐蔽，但在�E�大点的��目中经常发生。如在某��目中，��面上的按钮点击后，没有使按钮立��d��效，使得用户会多�ơ快速点��d��一按钮�Q�这样同一�D�代码对数据库同一条记录进行多�ơ操作，很容易就出现�q�种死锁的情��c�?

解决�Ҏ��Q?

1、对于按钮等控�g�Q�点��d��使其立刻失效�Q�不让用户重复点击，避免对同时对同一条记录操作�?

2、��用乐观锁�q�行控制�?

3、��用悲观锁�q�行控制�?



死锁的第三种情况

如果在事务中执行了一条不满��条�g的update语句�Q�则执行全表扫描�Q�把行��锁上升�ؓ表��锁，多个�q�样的事务执行后�Q�就很容易��生死锁和��d��。类似的情况�q�有当表中的数据量非常庞大而烦引徏的过��或不合适的时候，使得�l�常发生全表扫描�Q�最�l�应用系�l�会��来��慢�Q�最�l�发生阻塞或死锁�?

解决�Ҏ��Q?

SQL语句中不要��用太复杂的关联多表的查询�Q��?#8220;执行计划”对SQL语句�q�行分析�Q�对于有全表扫描的SQL语句�Q�徏立相应的索引�q�行优化�?nbsp;

何克�?/a> 2010-02-04 14:16 发表评论

HASH JOIN ,MERGE JOIN ,NESTED LOOP

Mon, 01 Feb 2010 07:04:00 GMT

对于Oracle的一些基本知识要加强学习�Q�我从网上抄了三个�h对这个题目的见解下来�Q�供已参考�?/font>

NESTED LOOP:

对于被连接的数据子集较小的情况，嵌套循环�q�接是个较好的选择。在嵌套循环中，�?br /> 表被外表驱动�Q�外表返回的每一行都要在内表中检索找��C��它匹配的行，因此整个查询�q�回
的结果集不能太大�Q�大�? 万不适合�Q�，要把�q�回子集较小表的作�ؓ外表�Q�CBO 默认外表�?br /> 驱动表）�Q�而且在内表的�q�接字段上一定要有烦引。当然也可以用ORDERED 提示来改变CBO
默认的驱动表�Q��用USE_NL(table_name1 table_name2)可是强制CBO 执行嵌套循环�q�接�?br />
HASH JOIN :

散列�q�接是CBO 做大数据集连接时的常用方式，优化器��用两个表中较��的表（或数�?br /> 源）利用�q�接键在内存中徏立散列表�Q�然后扫描较大的表�ƈ探测散列表，扑և�与散列表匚w��
的行�?br /> �q�种方式适用于较��的表完全可以放于内存中的情况，�q�样��L��本就是访问两个表的成
本之和。但是在表很大的情况下�ƈ不能完全攑օ�内存�Q�这时优化器会将它分割成若干不同�?br /> 分区�Q�不能放入内存的部分��把该分区写入磁盘的临时�D�，此时要有较大的��时段从而尽�?br /> 提高I/O 的性能�?br /> 也可以用USE_HASH(table_name1 table_name2)提示来强制��用散列连接。如果��用散
列连接HASH_AREA_SIZE 初始化参数必��够的大，如果�?i�Q�Oracle��使用SQL工作�?br /> 自动��理�Q�设�|�WORKAREA_SIZE_POLICY 为AUTO�Q�然后调整PGA_AGGREGATE_TARGET 卛_��?br />
排序合�ƈ�q�接

通常情况下散列连接的效果都比排序合�ƈ�q�接要好�Q�然而如果行源已�l�被排过序，在执
行排序合�q�连接时不需要再排序了，�q�时排序合�ƈ�q�接的性能会优于散列连接。可以��?br /> USE_MERGE(table_name1 table_name2)来强制��用排序合�q�连�?/div>

Nested loop join:

步骤�Q�确定一个驱动表(outer table)�Q�另一个表为inner table�Q�驱动表中的每一行与inner表中的相应记录JOIN。类��g��个嵌套的循环。适用于驱动表的记录集比较��（<10000�Q�而且inner表需要有有效的访问方法（Index�Q�。需要注意的是：JOIN的顺序很重要�Q�驱动表的记录集一定要��，�q�回�l�果集的响应旉��是最快的�?br />
cost = outer access cost + (inner access cost * outer cardinality)

| 2 | NESTED LOOPS | | 3 | 141 | 7 (15)|
| 3 | TABLE ACCESS FULL | EMPLOYEES | 3 | 60 | 4 (25)|
| 4 | TABLE ACCESS BY INDEX ROWID| JOBS | 19 | 513 | 2 (50)|
| 5 | INDEX UNIQUE SCAN | JOB_ID_PK | 1 | | |

EMPLOYEES为outer table, JOBS为inner table.

Hash join

步骤�Q�将两个表中较小的一个在内存中构造一个HASH表（对JOIN KEY�Q�，扫描另一个表�Q�同样对JOIN KEY�q�行HASH后探��是否可以JOIN。适用于记录集比较大的情况。需要注意的是：如果HASH表太大，无法一�ơ构造在内存中，则分成若�q�个partition�Q�写入磁盘的temporary segment�Q�则会多一个写的代��P��会降低效率�?br />
cost = (outer access cost * # of hash partitions) + inner access cost
--------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)|
--------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 665 | 13300 | 8 (25)|
| 1 | HASH JOIN | | 665 | 13300 | 8 (25)|
| 2 | TABLE ACCESS FULL | ORDERS | 105 | 840 | 4 (25)|
| 3 | TABLE ACCESS FULL | ORDER_ITEMS | 665 | 7980 | 4 (25)|
--------------------------------------------------------------------------

ORDERS为HASH TABLE�Q�ORDER_ITEMS扫描

Sort merge join

步骤�Q�将两个表排序，然后��两个表合�ƈ。通常情况下，只有在以下情况发生时�Q�才会��用此�U�JOIN方式�Q?br />
1.RBO模式

2.不等价关�?>,<,>=,<=,<>)

3.HASH_JOIN_ENABLED=false

4.数据源已排序

cost = (outer access cost * # of hash partitions) + inner access cost

转蝲biti的一�D�话:

举例�Q�表�q�接�q�回一条记�?
存在两个表，一�? 10条记�? �Q�一�?000万条记录

�?表都存在�q�接字段索引�Q�若以小表�ؓ驱动表，�?
代�h�Q?
10* (通过索引在大表查询一条记录的代�h)

若以大表为驱动表�Q?

1000�? * (通过索引在小表中查询一条记录的代�h)

通过索引获取一条记录，10rows的表�Q�代价通常�? 3 blocks
索引2块，表一�?

而如果是1000万的表，索引可能辑ֈ�4块表一�?
�q�样一来参考上面的计算�Q�你说哪个更好？很显�Ӟ��

��表查询参�?

SQL> create table test as select * from all_objects where rownum < 11;

Table created.

SQL> create index test_index on test(object_id);

Index created.

SQL> select object_id from test;

OBJECT_ID
----------
18159
7781
4841
19891
22549
17099
17712
4287
10107
19135

10 rows selected.

Execution Plan
----------------------------------------------------------
0 SELECT STATEMENT Optimizer=CHOOSE
1 0 TABLE ACCESS (FULL) OF 'TEST'

Statistics
----------------------------------------------------------
0 recursive calls
12 db block gets
6 consistent gets
0 physical reads
0 redo size
736 bytes sent via SQL*Net to client
425 bytes received via SQL*Net from client
2 SQL*Net roundtrips to/from client
0 sorts (memory)
0 sorts (disk)
10 rows processed

SQL> select * from test where object_id = 4287;

OWNER OBJECT_NAME
------------------------------ ------------------------------
SUBOBJECT_NAME OBJECT_ID DATA_OBJECT_ID OBJECT_TYPE
------------------------------ ---------- -------------- ------------------
CREATED LAST_DDL_ TIMESTAMP STATUS T G S
--------- --------- ------------------- ------- - - -
SYS /1033c8a_SqlTypeWithMethods
4287 JAVA CLASS
14-NOV-00 03-JUL-03 2003-07-03:11:18:19 INVALID N N N

Execution Plan
----------------------------------------------------------
0 SELECT STATEMENT Optimizer=CHOOSE
1 0 TABLE ACCESS (BY INDEX ROWID) OF 'TEST'
2 1 INDEX (RANGE SCAN) OF 'TEST_INDEX' (NON-UNIQUE)

Statistics
----------------------------------------------------------
0 recursive calls
0 db block gets
3 consistent gets
0 physical reads
0 redo size
1157 bytes sent via SQL*Net to client
425 bytes received via SQL*Net from client
2 SQL*Net roundtrips to/from client
0 sorts (memory)
0 sorts (disk)
1 rows processed

TAG 表联�?/a> oracle join

何克�?/a> 2010-02-01 15:04 发表评论

什么是持久化和对象关系映射ORM技�?

Thu, 23 Apr 2009 07:34:00 GMT

何谓“持久�?#8221;
持久�Q�Persistence�Q�，��x��数据�Q�如内存中的对象�Q�保存到可永久保存的存储讑֤�中（如磁盘）。持久化的主要应用是��内存中的数据存储在关系型的数据库中�Q�当然也可以存储在磁盘文件中、XML数据文�g中等�{��?
何谓“持久�?#8221;
持久层（Persistence Layer�Q�，即专注于实现数据持久化应用领域的某个特定�pȝ��的一个逻辑层面�Q�将数据使用者和数据实体相关联�?/p>
何谓“对象数据映射�Q�ORM�Q?#8221;
ORM-Object/Relational Mapper�Q�即“对象-关系型数据映��组�?#8221;。对于O/R�Q�即 Object�Q�对象）�?Relational�Q�关�p�d��数据�Q�，表示必须同时使用面向对象和关�p�d��数据�q�行开发�?/p>
备注�Q�徏模领域中�?ORM �?Object/Role Modeling�Q�对象角色徏模）。另外这里是“O/R Mapper”而非“O/R Mapping”。相�Ҏ��Ԍ��O/R Mapping 描述的是一�U�设计思想或者实现机�Ӟ��?O/R Mapper指以O/R原理设计的持久化框架�Q�Framework�Q�，包括 O/R机制�q�有 SQL自生成，事务处理�Q�Cache��理�{��?/p>

除了 ORM 技术，�q�有以下几种持久化技�?/p>
��d��域对象模�?br /> 它是在实��C��装了关�p�L��据模型和数据讉K��l�节的一�U��Ş式。在 J2EE 架构中，EJB �l��g分�ؓ会话 EJB 和实�?EJB。会�?EJB 通常实现业务逻辑�Q�而实�?EJB 表示业务实体。实�?EJB 又分��Z��U�：�?EJB 本��n��理持久化，�?BMP�Q�Bean-Managed Persistence�Q�；�?EJB 容器��理持久化，�?CMP�Q�Container-Managed Persistence�Q�。BM P��是��d��域对象模式的一个例子，BMP 表示由实�?EJB 自��n��理数据讉K��l�节�?br /> ��d��域对象本�w�位于业务逻辑层，因此采用��d��域对象模式时�Q�整个应用仍然是三层应用�l�构�Q��ƈ没有从业务逻辑层分��d��独立的持久化层�?/p>
JDO 模式
Java Data Objects�Q�JDO�Q�是 SUN 公司制定的描�q�对象持久化语义的标准API。严格的��_��JDO �q�不是对�?关系映射接口�Q�因为它支持把对象持久化��C�Q意一�U�存储系�l�中�Q�包�?关系数据库、面向对象的数据库、基�?XML 的数据库�Q�以及其他专有存储系�l�。由于关�p�L��据库是目前最��行的存储系�l�，许多 JDO 的实现都包含了对�?关系映射服务�?/p>
CMP 模式
�?J2EE 架构中，CMP�Q�Container-Managed Persistence�Q�表�C�由 EJB 容器来管理实�?EJB 的持久化�Q�EJB 容器��装了对�?关系的映��及数据讉K��l�节。CMP �?ORM 的相��g��处在于，两者都提供对象-关系映射服务�Q�都把对象持久化的�Q务从业务逻辑中分��d��来。区别在�?CMP 负责持久化实�?EJB �l��g�Q��?ORM 负责持久�?POJO�Q�它是普通的��Z�� Java Bean 形式的实体域对象�?/p>
一般把��Z�� Java Bean 形式的实体域对象�U�Cؓ POJO�Q�Plain Old Java Object�Q�，意�ؓ又普通又古老的 Java 对象的意思。随着各种 ORM 映射工具的日��成熟和��行�Q�POJO有重现光彩，它和��Z�� CMP 的实�?EJB 相比�Q�即��单又��h��很高的可�U�L��性，因此联合使用 ORM 映射工具�?POJO�Q�已�l�成��Z��U�越来越受欢�q�的且用来取�?CMP 的持久化�Ҏ��。POJO 的缺点就是无法做�q�程调用�Q�不支持分布式计��?/p>

��Z��么要做持久化和ORM设计

在目前的企业应用�pȝ��设计中，MVC�Q�即 Model�Q�模型）- View�Q�视图）- Control�Q�控�Ӟ��Z��要的�pȝ��架构模式。MVC 中的 Model 包含了复杂的业务逻辑和数据逻辑�Q�以及数据存取机�Ӟ��?JDBC的连接、SQL生成和Statement创徏、还有ResultSet�l�果集的��d��{�）�{�。将�q�些复杂的业务逻辑和数据逻辑分离�Q�以��系�l�的紧耦合关系转化为松耦合关系�Q�即解耦合�Q�，是降低系�l�耦合度迫切要做的�Q�也是持久化要做的工作。MVC 模式实现了架构上��表现层�Q�即View�Q�和数据处理层（即Model�Q�分��ȝ��解耦合�Q�而持久化的设计则实现了数据处理层内部的业务逻辑和数据逻辑分离的解耦合。�?ORM 作�ؓ持久化设计中的最重要也最复杂的技术，也是目前业界热点技术�?/p>
��单来��_��按通常的系�l�设计，使用 JDBC 操作数据库，业务处理逻辑和数据存取逻辑是�؜杂在一��L��?br /> 一般基本都是如下几个步骤：
1、徏立数据库�q�接�Q�获�?Connection 对象�?br /> 2、根据用��L��输入�l�装查询 SQL 语句�?br /> 3、根�?SQL 语句建立 Statement 对象或�?PreparedStatement 对象�?br /> 4、用 Connection 对象执行 SQL语句�Q�获得结果集 ResultSet 对象�?br /> 5、然后一条一条读取结果集 ResultSet 对象中的数据�?br /> 6、根据读取到的数据，按特定的业务逻辑�q�行计算�?br /> 7、根据计��得到的�l�果再组装更�?SQL 语句�?br /> 8、再使用 Connection 对象执行更新 SQL 语句�Q�以更新数据库中的数据�?br /> 7、最后依�ơ关闭各�?Statement 对象�?Connection 对象�?/p>
�׃��可看��Z��码逻辑非常复杂�Q�这�q�不包括某条语句执行��p�|的处理逻辑。其中的业务处理逻辑和数据存取逻辑完全��h��在一块。而一个完整的�pȝ��要包含成千上万个�q�样重复的而又��h��的处理过�E�，假如要对其中某些业务逻辑或者一些相兌��的业务流�E�做修改�Q�要改动的代码量��不可想象。另一斚w��Q�假如要换数据库产品或者运行环境也可能是个不可能完成的��d��。而用��L��q�行环境和要求却千差万别�Q�我们不可能为每一个用��h��一�U�运行环境设计一套一��L��pȝ��?br /> 所以就要将一��L��处理代码即业务逻辑和可能不一��L��处理��x��据存取逻辑分离开来，另一斚w��Q�关�p�d��数据库中的数据基本都是以一行行的数据进行存取的�Q�而程序运行却是一个个对象�q�行处理�Q�而目前大部分数据库驱动技术（如ADO.NET、JDBC、ODBC�{�等�Q�均是以行集的结果集一条条�q�行处理的。所以�ؓ解决�q�一困难�Q�就出现 ORM �q�一个对象和数据之间映射技术�?/p>
举例来说�Q�比如要完成一个购物打折促销的程序，�?ORM 思想��如下实玎ͼ�引自《深入浅出Hibernate》）�Q?br /> 业务逻辑如下�Q?br /> public Double calcAmount(String customerid, double amount)
{
    // �Ҏ��客户ID获得客户记录
    Customer customer = CustomerManager.getCustomer(custmerid);
    // �Ҏ��客户�{��获得打折规则
    Promotion promotion = PromotionManager.getPromotion(customer.getLevel());
    // 累积客户��L��贚w��Q��ƈ保存累计�l�果
    customer.setSumAmount(customer.getSumAmount().add(amount);
    CustomerManager.save(customer);
    // �q�回打折后的金额
    return amount.multiply(protomtion.getRatio());
}
�q�样代码��非常清��C��Q�而且与数据存取逻辑完全分离。设计业务逻辑代码的时候完全不需要考虑数据库JDBC的那些千��一律的操作�Q�而将它交�l?CustomerManager �?PromotionManager 两个�c�d��完成。这��是一个简单的 ORM 设计�Q�实际的 ORM 实现框架比这个要复杂的多�?/p>

目前有哪些流行的 ORM 产品
目前众多厂商和开源社区都提供了持久层框架的实玎ͼ�常见的有
Apache OJB �Q?a >http://db.apache.org/ojb/�Q?br /> Cayenne �Q?a >http://objectstyle.org/cayenne/�Q?br /> Jaxor �Q?a >http://jaxor.sourceforge.net�Q?br /> Hibernate �Q?a >http://www.hibernate.org�Q?br /> iBatis �Q?a >http://www.ibatis.com�Q?br /> jRelationalFramework �Q?a >http://ijf.sourceforge.net�Q?br /> mirage �Q?a >http://itor.cq2.org/en/oss/mirage/toon�Q?br /> SMYLE �Q?a >http://www.drjava.de/smyle�Q?br /> TopLink �Q?a >http://otn.oracle.com/products/ias/toplink/index.html�Q?br /> 其中 TopLink �?Oracle 的商业��品，其他均�ؓ开源项目�?/p>
其中 Hibernate 的轻量�� ORM 模型逐步��立了在 Java ORM 架构中领导地位，甚至取代复杂而又�J�琐�?EJB 模型而成��Z��实上�?Java ORM 工业标准。而且其中的许多设计均�?J2EE 标准�l�织吸纳而成为最�?EJB 3.0 规范的标准，�q�也是开源项目媄响工业领域标准的有力见证�?/p>
http://www.tkk7.com/fyz210/archive/2007/05/22/119098.html

何克�?/a> 2009-04-23 15:34 发表评论

ORM技术概念与实例

Thu, 23 Apr 2009 07:02:00 GMT
对象关系映射�Q?span style="font-size: 10pt; font-family: 新宋�?>Object Relational MappingORMORM本质上就是将数据从一�U��Ş式�{换到另外一�U��Ş式�?�q�也同时暗示者额外的执行开销�Q�然而，如果ORM作�ؓ一�U�中间�g实现�Q�则会有很多��Z��做优化，而这些在手写的持久层�q�不存在�?.
对象关系映射�Q?/span>�Q�简�U?/span>�Q�，是随着面向对象的��Y件开发方法发展而��生的面向对象的开发方法是当今企业�U�应用开发环境中的主��开发方法，关系数据库是企业�U�应用环境中�怹�存放数据的主��数据存储系�l��?/span>面向对象是从软�g工程基本原则(如耦合、聚合、封�?的基��上发展�v来的�Q�而关�p�L��据库则是从数学理论发展而来的，两套理论存在显著的区别。�ؓ了解册��个不匚w��的现�?对象关系映射技术应�q�而生�?/span>

让我们从O/R开始。字母O��h��?对象"(Object),而R则来自于"关系"(Relational)。几乎所有的�E�序里面�Q�都存在对象和关�p�L��据库。在业务逻辑层和用户界面层中�Q�我们是面向对象的。当对象信息发生变化的时候，我们需要把对象的信息保存在关系数据库中�?/span>

当你开发一个应用程序的时�?不��用O/R Mapping),你可能会写不��数据访问层的代码，用来从数据库保存�Q�删除，��d��对象信息�Q�等�{�。你在DAL中写了很多的�Ҏ��来读取对象数据，改变状态对象等�{��Q务。而这些代码写��h��L��重复的�?/span>

u          CRUDAPIu          APIu          mapping metadatau          ORMdirty checking, lazy association fetchingORM,,,.

:

http://www.jeez.com.cn/jbf

何克�?/a> 2009-04-23 15:02 发表评论

基础知识�Q�带你了解最常见�?3个数据库术语

Sun, 22 Feb 2009 07:56:00 GMT

1�Q�关�p�L��型：用二�l�表格结构表�C�实体集�Q�外键表�C�实体间联系的数据模型称为关�p�L��型。关�p�L��型是��p��q�个关系模式�l�成的集合�?

2�Q�关�p�L��式：关系模式实际上就是记录类型。它包括�Q�模式名�Q�属性名�Q�值域名以及模式的主键。关�p�L��式仅是对数据�Ҏ��的描述�?

3�Q�关�p�d��例：��是一个关�p�，即一张二�l�表根{�?

4�Q�属性：在关�p�L��型中�Q�字�D늧�为属性�?

5�Q�域�Q�在关系中，每一个属性都有一个取��D��_��U�Cؓ属性的值域�?

6�Q�元�l�：在关�p�M��Q�记录称为元�l��?

7�Q�候选码�Q�在关系中能唯一标识元组的属性集�U�Cؓ关系模式的候选码�?

8�Q�主码：用户选作元组标识的一个候选码��Z��码�?

9�Q�外码：某个关系的主码相应的属性在另一关系中出玎ͼ�此时该主码在��是另一关系的外码，如有两个关系S和SC,其中S#是关�p�S的主码，相应的属性S#在关�p�SC中也出现�Q�此时S#��是关系SC的外码�?

10�Q�实体完整性规则：�q�条规则要求关系中元�l�在�l�成�ȝ��的属性上不能有空倹{��如果出现空��|��那么�ȝ��值就起不了唯一标识元组的作用�?

11�Q�参照完整性规则：�q�条规则要求“不引用不存在的实�?#8221;。其形式定义如下�Q�如果属性集K是关�p�L��式R1的主码，K也是关系模式R2的外码，那么R2的关�p�M��Q�K的取值只允许有两�U�可能，或者�ؓ�I��|��或者等于R1关系中某个主码倹{�?

�q�条规则在��用时有三点应注意�Q?

(1)外码和相应的�ȝ��可以不同名，只要定义在相同值域上即可�?

(2)R1和R2也可以是同一个关�p�L��式，表示了属性之间的联系�?

(3)外码值是否允许空应视具体问题而定�?

12�Q�过�E�性语�a��Q�在�~�程时必��ȝ��得结果的操作步骤�Q�即“�q�什�?#8221;�?#8220;怎么�q?#8221;。如Pascal和C语言�{��?

13�Q�非�q�程性语�a��Q�编�E�时只须指出需要什么信息，不必�l�出具体的操作步骤的语言�Q�各�U�关�p�L��询语�a�均属于非�q�程性语�a��?/div>

何克�?/a> 2009-02-22 15:56 发表评论

隔离�U�别	脏读	不可重复��d��	�q�d��	说明
未提交读(read uncommitted)	�?/span>	�?/span>	�?/span>	如果其他事务更新�Q�不��是否提交，立即执行
提交�?span>(read committed默认)	�?/span>	�?/span>	�?/span>	��d��提交�q�的数据。如果其他事务更新没提交�Q�则�{�待
可重复读(repeatable read)	�?/span>	�?/span>	�?/span>	查询期间�Q�不允许其他事务update
可串行读(serializable)	�?/span>	�?/span>	�?/span>	查询期间�Q�不允许其他事务insert或delete