亚洲精品无码不卡在线播HE ,亚洲精品成人av在线,亚洲性色成人av天堂

MySQL导入导入命��o�ȝ��

persister — Wed, 14 Jul 2010 09:52:00 GMT

MySQL提供了几�U�可供选择的数据导入导出方式�?br />
基本分�ؓ两种形式�Q�一�U�是sql形式的数据导入导�?mysqldump,mysql,source)�Q�另一�U�是自定义数据的导入导出(load data infile, into outfile)�?br />
自定义数据格式的导入导出有一个好处就是数据可以是csv格式的，而且用的非常多。比如大型的数据�Q�如果往查询到数据然后写到excel里面�Q�效率肯定是一个问题。但是用mysql的自带的命��o�Q�那么就可以让mysql自己生成csv文�g�Q�这样速度会快不少。导入也是一��P��是数据文�g可以传到服务器上�Q�然后��用mysql的命令导入到数据库中�Q�比读csv格式的文件然后插入到数据库中效率会提高不��?br />

下面附上�q�些命��o的具体描�q�ͼ�

mysql中Load Data InFile是用于批量向数据表中导入记录�?br /> 首先创徏一个表
Use Test;
Create Table TableTest(
`ID` mediumint(8) default '0',
`Name` varchar(100) default ''
) TYPE=MyISAM;

向数据表导入数据
Load Data InFile 'D:/Data.txt' Into Table `TableTest`

常用如下�Q?br /> Load Data InFile 'D:/Data.txt' Into Table `TableTest` Lines Terminated By '"r"n';
�q�个语句�Q�字�D�默认用制表�W�隔开�Q�每条记录用换行�W�隔开�Q�在Windows下换行符�?#8220;"r"n”
D:/Data.txt 文�g内容如下面两行：
1 A
2 B
“1”�?#8220;A”之间有一个制表符
�q�样��导�q�两条记录了�?br />
自定义语�?br /> Load Data InFile 'D:/Data.txt' Into Table `TableTest` Fields Terminated By ',' Enclosed By '"'

Escaped By '"' Lines Terminated By '"r"n';
Fields Terminated By ',' Enclosed By '"' Escaped By '"'
表示每个字段用逗号分开�Q�内容包含在双引号内
Lines Terminated By '"r"n';
表示每条数据用换行符分开

导入数据�?br /> 常用source 命��o
�q�入mysql数据库控制台�Q?br /> 如mysql -u root -p

mysql>use 数据�?br />
然后使用source命��o�Q�后面参��Cؓ脚本文�g�Q�如�q�里用到�?sql�Q?br /> mysql>source d:"wcnc_db.sql

也可以��用mysql命��o�Q�在bin目录下）
.../bin/mysql db1 > xx.sql;

�?Load Data InFile 相反的是
Select * From `TableTest` Into OutFile 'D:/Data_OutFile.txt';
把表的数据导�?br />

Using command line tools to export data from a MySQL database into a CSV file is quite easy. Here's

how:

mysql -uexampleuser -pletmein exampledb -B -e "select * from "`person"`;" | sed 's/

"t/","/g;s/^/"/;s/$/"/;s/"n//g' > filename.csv

Here is some sample output of the above:

"id","username","group","password"
"1","tux","admin","5f4dcc3b5aa765d61d8327deb882cf99"
"2","tlugian","admin","5f4dcc3b5aa765d61d8327deb882cf99"
"3","saiyuki","admin","5f4dcc3b5aa765d61d8327deb882cf99"
"4","fred","staff","5f4dcc3b5aa765d61d8327deb882cf99"
"5","barney","staff","5f4dcc3b5aa765d61d8327deb882cf99"
"6","wilma","admin","5f4dcc3b5aa765d61d8327deb882cf99"

And now for the explanation:

Starting with the MySQL command. I wont explain the -u and -p options they are straight forward (if

in doubt man mysql). The -B option will delimit the data using tabs and each row will appear on a

new line. The -e option denotes the command to run once you have logged into the database. In this

case we are using a simple SELECT statement.

Onto sed. The command used here contains three seperate sed scripts:

s/"t/","/g;s/^/"/        <--- this will search and replace all occurences of 'tabs' and replace them

with a ",".

;s/$/"/;    <--- This will place a " at the start of the line.

s/"n//g    <---- This will place a " at the end of the line.

After running the result set through sed we redirect the output to a file with a .csv extension.

mysqldump命��o的输入是在bin目录�?
1.导出整个数据�?br />
mysqldump -u 用户�?-p 数据库名 > 导出的文件名

mysqldump -u wcnc -p smgp_apps_wcnc > wcnc.sql

2.导出一个表

mysqldump -u 用户�?-p 数据库名表名> 导出文�g的�\径和名称

mysqldump -u wcnc -p smgp_apps_wcnc users> wcnc_users.sql

persister 2010-07-14 17:52 发表评论

MySQL Show processlist命��o功能

persister — Tue, 13 Jul 2010 08:15:00 GMT

怎么查看服务器的�q�行情况�Q�比如多��查询，��理客户端的查询�{�：

show processlist

mysql> show processlist;
+-----+-------------+--------------------+-------+---------+-------+----------------------------------+----------
| Id | User | Host            | db   | Command | Time| State     | Info
+-----+-------------+--------------------+-------+---------+-------+----------------------------------+----------
|207|root |192.168.0.20:51718 |mytest | Sleep    | 5    |         | NULL
|208|root |192.168.0.20:51719 |mytest | Sleep    | 5    |         | NULL
|220|root |192.168.0.20:51731 |mytest |Query    | 84   | Locked |
select bookname,culture,value,type from book where id=001
先简单说一下各列的含义和用途，�W�一列，id�Q�不用说了吧�Q�一个标识，你要kill一个语句的时候很有用�Q�比如我们进行了一个非常耗时的查询，惛_��止的时候，��只有采用这个命令了�?br />
user列，昄��当前用户�Q�如果不是root�Q�这个命令就只显�C�Z��权限范围内的sql语句�?br />
host列，昄��q�个语句是从哪个ip的哪个端口上发出的，可以用来�q�踪出问题语句的用户�?br />
db列，昄��q�个�q�程目前�q�接的是哪个数据库�?br />
command列，昄��当前�q�接的执行的命��o�Q�一般就是休眠（sleep�Q�，查询 �Q�query�Q�，�q�接�Q�connect�Q�。time列，此这个状态持�l�的旉��Q�单位是�U��?br />
state列，昄��使用当前�q�接的sql语句的状态，很重要的列，后箋会有所有的状态的描述�Q�请注意�Q�state只是语句执行中的某一个状态，一个sql语句�Q�已查询��Z��Q�可能需要经�q�copying to tmp table�Q�Sorting result�Q�Sending data�{�状态才可以完成�Q�info列，昄��q�个sql语句�?br />
注意权限�Q�通常只能看到自己的查询process�Q�是看不到其他�h的process的�?br />

persister 2010-07-13 16:15 发表评论

MySQL忘记root密码怎么办？

persister — Wed, 24 Mar 2010 09:26:00 GMT

如果 MySQL 正在�q�行�Q�到Windows的服务那里停止MySQL�?
启动 MySQL�Q�mysqld --skip-grant-tables�Q?br /> ��可以不需要密码就�q�入 MySQL 了�?
然后��是
>use mysql
>update user set password=password("new_pass") where user="root";
>flush privileges;
重新杀 MySQL �Q�用正常�Ҏ��启动 MySQL �?br />
�q�里有一个地方要注意�Q�就是有可能�Q�user表中�Ҏ��没有root�q�个用户�?br />

persister 2010-03-24 17:26 发表评论

persister — Wed, 09 Sep 2009 12:37:00 GMT

The target uses for replication in MySQL include:

Scale-out solutions - spreading the load among multiple slaves to improve performance. In this environment, all writes and updates must take place on the master server. Reads, however, may take place on one or more slaves. This model can improve the performance of writes (since the master is dedicated to updates), while dramatically increasing read speed across an increasing number of slaves.
Data security - because data is replicated to the slave, and the slave can pause the replication process, it is possible to run backup services on the slave without corrupting the corresponding master data.
Analytics - live data can be created on the master, while the analysis of the information can take place on the slave without affecting the performance of the master.
Long-distance data distribution - if a branch office would like to work with a copy of your main data, you can use replication to create a local copy of the data for their use without requiring permanent access to the master�?br />

配置参考mysql官方文档�Q�按照配�|�文档，我具体测试了一下，没有问题�Q�大概的配置步骤如下�Q?br />

1、Master端的my.cnf配置

log-bin
server-id=1
sql-bin-update-same
binlog-do-db=vbb

2、Slave端的my.cnf配置

master-host=192.168.22.25
master-user=salve
master-password=123456
master-port=3306
server-id=2
master-connect-retry=60 预设重试间隔60�U?/span>

3、复�?/strong>

CHANGE MASTER to MASTER_LOG_FILE='mysql-bin.000006', MASTER_LOG_POS=98

具体配置有一些细节，看官�Ҏ��档即可�?br />
�q�里具体说一下其原理�Q?br />

1、复制进�E?/strong>
Mysql的复�Ӟ��Replication�Q�是一个异步的复制�Q�从一个Mysql instace�Q�称之�ؓMaster�Q�复制到另一个Mysql instance�Q�称之Slave�Q�。实现整个复制操作主要由三个�q�程完成的，其中两个�q�程在Slave�Q�Sql�q�程和IO�q�程�Q�，另外一个进�E�在 Master�Q�IO�q�程�Q�上�?br /> 要实施复�Ӟ��首先必须打开Master端的binary log�Q�bin-log�Q�功能，否则无法实现。因为整个复制过�E�实际上��是Slave从Master端获取该日志然后再在自己�w�上完全��序的执行日志中所记录的各�U�操作�?br /> 复制的基本过�E�如下：
1)、Slave上面的IO�q�程�q�接上Master�Q��ƈ��h��从指定日志文件的指定位置�Q�或者从最开始的日志�Q�之后的日志内容�Q?br />
2)、Master接收到来自Slave的IO�q�程的请求后�Q�通过负责复制的IO�q�程�Ҏ��h��信息��d��制定日志指定位置之后的日志信息，�q�回�l�Slave 的IO�q�程。返回信息中除了日志所包含的信息之外，�q�包括本�ơ返回的信息已经到Master端的bin-log文�g的名�U�C��及bin-log的位�|�；

3)、Slave的IO�q�程接收��C��息后�Q�将接收到的日志内容依次��d��到Slave端的relay-log文�g的最末端�Q��ƈ��读取到的Master端的 bin-log的文件名和位�|�记录到master-info文�g中，以便在下一�ơ读取的时候能够清楚的告诉Master“我需要从某个bin-log的哪个位�|�开始往后的日志内容�Q�请发给�?#8221;�Q?br />
4)、Slave的Sql�q�程��到relay-log中新增加了内容后�Q�会马上解析relay-log的内�Ҏ��为在Master端真实执行时候的那些可执行的内容�Q��ƈ在自�w�执行�?br /> 实际上在老版本的Mysql的复制实现在Slave端�ƈ不是两个�q�程完成的，而是�׃��个进�E�完成。但是后来发现这样做存在较大的风险和性能问题�Q�主要如下：
首先�Q�一个进�E�就使复制bin-log日志和解析日志�ƈ在自�w�执行的�q�程成�ؓ一个串行的�q�程�Q�性能受到了一定的限制�Q�异步复制的延迟也会比较�ѝ�?br /> 另外�Q�Slave端从Master端获取bin-log�q�来之后�Q�需要接着解析日志内容�Q�然后在自��n执行。在�q�个�q�程中，Master端可能又产生了大�? 变化�q�声�U�C��大量的日志。如果在�q�个阶段Master端的存储出现了无法修复的错误�Q�那么在�q�个阶段所产生的所有变更都��永�q�无法找回。如果在Slave 端的压力比较大的时候，�q�个�q�程的时间可能会比较�ѝ�?br /> 所以，后面版本的Mysql��Z��解决�q�个风险�q�提高复制的性能�Q�将Slave端的复制改�ؓ两个�q�程来完成。提��个改�q�方案的人是Yahoo!的一位工�E? �?#8220;Jeremy Zawodny”。这��h��解决了性能问题�Q�又�~�短了异步的延时旉��Q�同时也减少了可能存在的数据丢失量。当�Ӟ��即��是换成了现在�q�样两个�U�程处理以后�Q�同样也�q�是存在slave数据延时以及数据丢失的可能性的�Q�毕竟这个复制是异步的。只要数据的更改不是在一个事物中�Q�这些问题都是会存在的。如果要完全避免 �q�些问题�Q�就只能用mysql的cluster来解决了。不�q�mysql的cluster是内存数据库的解��x��案，需要将所有数据都load到内存中�Q�这样就对内存的要求��非常大了，对于一般的应用来说可实施性不是太大�?br />

2、复制实现��?/strong>
Mysql的复制可以是��Z��一条语句（Statement level�Q�，也可以是��Z��一条记录（Row level�Q�，可以在Mysql的配�|�参��C��讑֮��q�个复制�U�别�Q�不同复制��别的讄��会媄响到Master端的bin-log记录成不同的形式�?br /> Row Level�Q�日志中会记录成每一行数据被修改的�Ş式，然后在slave端再对相同的数据�q�行修改�?br /> 优点�Q�在row level模式下，bin-log中可以不记录执行的sql语句的上下文相关的信息，仅仅只需要记录那一条记录被修改了，修改成什么样了。所以row level的日志内容会非常清楚的记录下每一行数据修改的�l�节�Q�非常容易理解。而且不会出现某些特定情况下的存储�q�程�Q�或function�Q�以�? trigger的调用和触发无法被正��复制的问题�?br /> �~�点�Q�row level下，所有的执行的语句当记录到日志中的时候，都将以每行记录的修改来记录，�q�样可能会��生大量的日志内容�Q�比如有�q�样一条update�? 句：update product set owner_member_id = ‘b’ where owner_member_id = ‘a’�Q�执行之后，日志中记录的不是�q�条update语句所对应额事�Ӟ��mysql以事件的形式来记录bin-log日志�Q�，而是�q�条语句所更新的每一�? 记录的变化情况，�q�样��p��录成很多条记录被更新的很多个事�g。自�Ӟ��bin-log日志的量��׃��很大。尤其是当执行alter table之类的语句的时候，产生的日志量是惊人的。因为Mysql对于alter table之类的表�l�构变更语句的处理方式是整个表的每一条记录都需要变动，实际上就是重��Z��整个表。那么该表的每一条记录都会被记录到日志中�?br /> Statement Level:每一条会修改数据的sql都会记录�?master的bin-log中。slave在复制的时候sql�q�程会解析成和原来master端执行过的相同的sql来再�ơ执行�?br /> 优点�Q�statement level下的优点首先��是解决了row level下的�~�点�Q�不需要记录每一行数据的变化�Q�减��bin-log日志量，节约IO�Q�提高性能。因��Z��只需要记录在Master上所执行的语句的�l�节�Q�以及执行语句时候的上下文的信息�?br /> �~�点�Q�由于他是记录的执行语句�Q�所以，��Z��让这些语句在slave端也能正��执行，那么他还必须记录每条语句在执行的时候的一些相关信息，也就是上下文�? 息，以保证所有语句在slave端杯执行的时候能够得到和在master端执行时候相同的�l�果。另外就是，�׃��Mysql现在发展比较快，很多的新功能�? 断的加入�Q��mysql得复刉��C��不小的挑战，自然复制的时候涉及到��复杂的内容�Q�bug也就��容易出现。在statement level下，目前已经发现的就有不��情况会造成mysql的复制出现问题，主要是修�Ҏ��据的时候��用了某些特定的函数或者功能的时候会出现�Q�比如：sleep()函数在有些版本中��׃��能真��复�Ӟ��在存储过�E�中使用了last_insert_id()函数�Q�可能会使slave和master上得�? 不一致的id�{�等。由于row level是基于每一行来记录的变化，所以不会出现类似的问题�?/font>

With statement-based replication, you may encounter issues with replicating stored routines or triggers. You can avoid these issues by using row-based replication instead.

从官�Ҏ��档中看到�Q�之前的Mysql一直都只有��Z��statement的复制模式，直到5.1.5版本的Mysql才开始支持row level的复制。从5.0开始，Mysql的复制已�l�解决了大量老版本中出现的无法正��复制的问题。但是由于存储过�E�的出现�Q�给Mysql的复制又带来了更大的新挑战。另外，看到官方文档��_��?.1.8版本开始，Mysql提供了除Statement Level和Row Level之外的第三种复制模式�Q�Mixed�Q�实际上��是前两�U�模式的�l�合�?/font>

From MySQL 5.1.12 to MySQL 5.1.28, mixed format is the default. Beginning with MySQL 5.1.29, statement-based format is the default.

在Mixed模式下，Mysql会根据执行的每一条具体的sql语句来区分对待记录的日志形式�Q�也��是在Statement和Row之间选择一�U�。新版本中的Statment level�q�是和以前一��P��仅仅记录执行的语句。而新版本的Mysql中队row level模式也被做了优化�Q��ƈ不是所有的修改都会以row level来记录，像遇到表�l�构变更的时候就会以statement模式来记录，如果sql语句��实��是update或者delete�{�修�Ҏ��据的语句�Q? 那么�q�是会记录所有行的变更�?br />
3、复制常用架�?/strong>
Mysql复制环境90%以上都是一个Master带一个或者多个Slave的架构模式，主要用于��d��力比较大的应用的数据库端廉�h扩展解决�Ҏ��。因为只要master和slave的压力不是太大（��其是slave端压力）的话�Q�异步复制的延时一般都很少很少。尤其是自slave端的复制方式�Ҏ��两个�q�程处理之后�Q�更是减��了slave端的延时。而带来的效益是，对于数据实时性要求不是特别的敏感度的应用�Q�只需要通过廉�h的pc server来扩展slave的数量，��读压力分散到多台slave的机器上面，卛_��解决数据库端的读压力瓉��。这在很大程度上解决了目前很多中��型�|�站的数据库压力瓉��问题�Q�甚��x��些大型网站也在��用类似方案解��x��据库瓉��?br /> 一个Master带多个slave的架构实施非常简单，多个slave和单个slave的实施�ƈ没有太大区别。在Master端�ƈ不care有多��个 slave�q�上了master端，只要有slave�q�程通过了连接认证，向他��h��binlog信息�Q�他��׃��按照�q�接上来的io�q�程的要求，��d��自己�? binlog信息�Q�返回给slave的IO�q�程。对于slave的配�|�细节，在Mysql的官�Ҏ��档上面已�l�说的很清楚了，甚至介绍了多�U�实现slave 的配�|�方法�?/font>

persister 2009-09-09 20:37 发表评论

MySQL Index

persister — Thu, 20 Aug 2009 03:37:00 GMT
�q�篇文章摘自�|�络�Q�已�l�找不到原文出处了，写的不错�Q�学习一下�?br />
数据库的索引
1. 如果不徏立烦引，那么查询都需要全表扫描；如果建立了烦引，则数据库会保存一个烦引文仉��常是特�D�的�l�构比如B树，�q�样查询��h��不需要全表扫描，一下子能够扑ֈ�满��要求的记录�?/span>

2. 一般是�?/span>Where之后的条件徏立烦引，数据库中的主键是已经建立了烦引的。数据库中可以徏立多个烦引�?/span>

3. 可以对不同类型的列徏立烦引�?/span>

对于Text�c�d��{�，可以使用MySQL的全文检索功能徏立全文烦引。它利用了自然语�a�的方法去在文本中��索关键词�?/span>

举个例子�Q�如果��?/span>=��L��话可能需要��?/span>like以及%�{�去匚w��。而��?/span>MySQL的全文检索可以��?/span>Match函数卛_��索出包含关键词的列�?/span>

详细情况参看MySQL参考手册关于全文检索的部分�?/span>

4.1使用索引

    我们首先讨论索引�Q�因为它是加快查询的最重要的工兗��还有其他加快查询的技术，但是最有效的莫�q�于恰当��C��用烦引了。在MySQL的邮件清单上�Q��h们通常询问关于使查询更快的问题。在大量的案例中�Q�都是因��上没有烦引，一般只要加上烦引就可以立即解决问题。但�q�样也�ƈ非��L��有效�Q�因��Z��化�ƈ非��L��那样��单。然而，如果不��用烦引，在许多情形下�Q�用其他手段改善性能只会是浪�Ҏ��间。应该首先考虑使用索引取得最大的性能改善�Q�然后再��L��其他可能有帮助的技术�?/span>

    本节介绍索引是什么、它怎样改善查询性能、烦引在什么情况下可能会降低性能�Q�以及怎样��选择索引。下一节，我们��讨�?/span>MySQL的查询优化程序。除了知道怎样创徏索引外，了解一些优化程序的知识也是有好处的�Q�因��样可以更好地利用所创徏的烦引。某些编写查询的�Ҏ��实际上会妨碍索引的效果，应该避免�q�种情况出现。（虽然�q��M��q�样。有时也会希望忽略优化程序的作用。我们也��介�l�这些情��c��）

    4.1.1索引的益�?/span>

    让我们从一个无索引的表着手来考察索引是怎样起作用的。无索引的表��是一个无序的行集。例如，�?/span>4 - 1�l�出了我们在�W?/span>1�?#8220;MySQL�?/span>SQL 介绍” 中首先看到的ad 表。这个表上没有烦引，因此如果我们查找某个特定公司的行�Ӟ��必须查看表中的每一行，看它是否与所需的值匹配。这是一个全表扫描，很慢�Q�如果表中只有少数几个记录与搜烦条�g相匹配，则其效率是相当低的�?/span>



    �?/span>4 - 2�l�出了相同的表，但在表的company_num 列上增加了一个烦引。此索引包含表中每行的一��，但此索引是在company_num 上排序的。现在，不需要逐行搜烦全表查找匚w��的条�ƾ，而是可以利用索引�q�行查找。假如我们要查找公司13的所有行�Q�那么可以扫描烦引，�l�果得出3行。然后到辑օ��?/span>14的行�Q�这是一个比我们正在查找的要大的��L��。烦引值是排序的，因此在读到包�?/span>14的记录时�Q�我们知道不会再有匹配的记录�Q�可以退��Z��。如果查找一个��|��它在索引表中某个中间点以前不会出玎ͼ�那么也有扑ֈ�其第一个匹配烦引项的定位算法，而不用进行表的顺序扫描（如二分查找法�Q�。这��P��可以快速定位到�W�一个匹配的��|��以节省大量搜索时间。数据库利用了各�U�各��L��快速定位烦引值的技术，�q�些技术是什么�ƈ不重要，重要的是它们工作正常�Q�烦引技术是个好东西�?/span>

    有�h会问�Q��ؓ什么不只对数据文�g�q�行排序�Q�省掉烦引文�Ӟ��q�样不也在搜索时产生相同的效果吗�Q�问得好�Q�如果只有单个烦引时�Q?/span>

是这��L��。不�q�有可能会用到第二个索引�Q�但同时以两�U�不同的�Ҏ��对同一个数据文件进行排序是不可能的。（如，惌��一个顾客名的烦

引，同时又要一个顾�?/span>ID ��h��电话��L��的烦引。）��烦引文件作��Z��个与数据文�g独立的实体就解决了这个问题，而且允许创徏多个�?/span>

引。此外，索引中的行一般要比数据文件中的行短。在插入或删除值时�Q��ؓ保持排序��序而移动较短的索引��g��U�d��较长的数据行相比�?/span>

为容易�?/span>



    �q�个例子�?/span>MySQL索引表的�Ҏ��相符。表的数据行保存在数据文件中�Q�而烦引��g��存在索引文�g中。一个表上可有不止一个烦引；如果��实有不止一个烦引，它们都保存在同一个烦引文件中。烦引文件中的每个烦引由排过序的用来快速访问数据文件的键记录数�l�构成�?/span>

前面的讨论描�q�C��单表查询中烦引的好处�Q�其中��用烦引消除了全表扫描�Q�极大地加快了搜索的速度。在执行涉及多个表的�q�接查询�Ӟ��索引甚至会更有�h倹{��在单个表的查询中，每列需要查看的值的数目��是表中行的数目。而在多个表的查询中，可能的组合数目极大，因�ؓ�q�个数目为各表中行数之积�?/span>

　假如有三个未索引的表t 1�?/span>t 2�?/span>t 3�Q�分别只包含�?/span>c 1�?/span>c 2�?/span>c 3�Q�每个表分别由含有数�?/span>1�?/span>1000 �?/span>1000 行组成。查扑֯�应值相�{�的表行�l�合的查询如下所�C�：

    SELECT c1,c2,c3

    FROM t1,t2,t3

    WHERE c1=c2 AND c1=c3

    此查询的�l�果应该�?/span>1000 行，每个�l�合包含3 个相�{�的倹{��如果我们在无烦引的情况下处理此查询�Q�则不可能知道哪些行包含那些倹{��因此，必须��L��出所有组合以便得��Z��WHERE 子句盔R��的那些组合。可能的�l�合数目�?/span>10 0 0??0 0 0??0 0 0�Q�十亿）�Q�比匚w��数目多一百万倍。很多工作都��费了，�q�且�q�个查询��会非常慢，即��在如�?/span>MySQL�q�样快的数据库中执行也会很慢。而这�q�是每个表中只有1000 行的情�Ş。如果每个表中有一百万行时�Q�将会怎样�Q�很昄��Q�这样将会��生性能极�ؓ低下的结果。如果对每个表进行烦引，��p��极大地加速查询进�E�，因�ؓ利用索引的查询处理如下：

    1) 如下从表t1中选择�W�一行，查看此行所包含的倹{�?/span>

    2) 使用�?/span>t2 上的索引�Q�直接蟩�?/span>t2 中与来自t1的值匹配的行。类��|��利用�?/span>t3 上的索引�Q�直接蟩�?/span>t3 中与来自t1的值匹配的行�?/span>

    3) �q�到�?/span>t1的下一行�ƈ重复前面的过�E�直�?/span>t1中所有的行已�l�查�q�。在此情形下�Q�我们仍然对�?/span>t1执行了一个完全扫描，但能够在�?/span>t2 �?/span>t3 上进行烦引查扄��接取��些表中的行。从道理上说�Q�这时的查询比未用烦引时要快一百万倍。如上所�q�ͼ�MySQL利用索引加速了WHERE 子句中与条�g盔R��的行的搜索，或者说在执行连接时加快了与其他表中的行匚w��的行的搜索。它也利用烦引来改进其他操作的性能�Q?/span>

    �?/span> 在��?/span>MIN( ) �?/span>MAX( ) 函数�Ӟ��能够快速找到烦引列的最��或最大倹{�?/span>

    �?/span> MySQL常常能够利用索引来完�?/span>ORDER BY 子句的排序操作�?/span>

    �?/span> 有时�Q?/span>MySQL可避免对整个数据文�g的读取。假如从一个烦引数值列中选择��|��而且不选择表中其他列。这�Ӟ��通过对烦引值的��d��Q�就已经得到了读取数据文件所要得到的倹{��没有对相同的��D��行两�ơ读取的必要�Q�因此，甚至无需涉及数据文�g�?/span>

    4.1.2 索引的弊�?/span>

    一般情况下�Q�如�?/span>MySQL能够知道怎样用烦引来更快地处理查询，它就会这样做。这表示�Q�在大多数情况下�Q�如果您不对表进行烦引，则损害的是您自己的利益。可以看出，作者描�l�了索引的诸多好处。但有不利之处吗�Q�是的，有。实际上�Q�这些缺点被优点所掩盖了，

但应该对它们有所了解�?/span>

    首先�Q�烦引文件要占磁盘空间。如果有大量的烦引，索引文�g可能会比数据文�g更快地达到最大的文�g��寸。其�ơ，索引文�g加快了检索，但增加了插入和删除，以及更新索引列中的值的旉��Q�即�Q�降低了大多数涉及写入的操作的时��_��Q�因为写操作不仅涉及数据行，而且�q�常常涉及烦引。一个表拥有的烦引越多，则写操作的��^均性能下降��p��大。在4 . 4�?#8220;有效地装载数�?#8221;中，我们��更��l�地介绍�q�些性能问题�Q��ƈ讨论怎样解决�?/span>

    4.1.3 选择索引

    创徏索引的语法已�l�在3 . 4 . 3�?#8220;创徏和删除烦�?#8221;中进行了介绍。这里，我们假定您已�l�阅读过该节。但是知道语法�ƈ不能帮助��定表怎样�q�行索引。要军_��表怎样�q�行索引需要考虑表的使用方式。本节介�l�一些关于怎样��定和挑选烦引列的准则：

    �?/span> 搜烦的烦引列�Q�不一定是所要选择的列。换句话��_��最适合索引的列是出现在WHERE 子句中的列，或连接子句中指定的列�Q�而不是出现在SELECT 关键字后的选择列表中的列：

    当然�Q�所选择的列和用�?/span>WHERE 子句的列也可能是相同的。关键是�Q�列出现在选择列表中不是该列应该烦引的标志。出现在�q�接子句中的列或出现在�Ş�?/span>col1= col2 的表辑ּ�中的列是很适合索引的列。查询中�?/span>col_b �?/span>col_c ��是�q�样的例子。如�?/span>MySQL能利用连接列来优化一个查询，表示它通过消除全表扫描相当可观地减��了表行的组合�?/span>

    �?/span> 使用惟一索引。考虑某列中值的分布。对于惟一值的列，索引的效果最好，而具有多个重复值的列，其烦引效果最差。例如，存放�q�龄的列��h��不同��|��很容易区分各行。而用来记录性别的列�Q�只含有“ M”�?#8220;F”�Q�则�Ҏ��列进行烦引没有多大用处（不管搜烦哪个��|��都会得出大约一半的行）�?/span>

    �?/span> 使用短烦引。如果对串列�q�行索引�Q�应该指定一个前�~�长度�Q�只要有可能��应该这样做。例如，如果有一�?/span>CHAR(200) 列，如果在前10 个或20 个字�W�内�Q�多数值是惟一的，那么��׃��要对整个列进行烦引。对�?/span>10 个或20 个字�W�进行烦引能够节省大量烦引空��_��也可能会使查询更快。较��的索引涉及的磁�?/span>I/O 较少�Q�较短的值比较�v来更快。更为重要的是，对于较短的键��|��索引高速缓存中的块能容�U�x��多的键��|��因此�Q?/span>MySQL也可以在内存中容�U�x��多的倹{��这增加了找到行而不用读取烦引中较多块的可能性。（当然�Q�应该利用一些常识。如仅用列值的�W�一个字�W�进行烦引是不可能有多大好处的，因�ؓ�q�个索引中不会有许多不同的倹{��）

    �?/span> 利用最左前�~�。在创徏一�?/span>n 列的索引�Ӟ��实际是创��Z��MySQL可利用的n 个烦引。多列烦引可起几个烦引的作用�Q�因为可利用索引中最左边的列集来匚w��行。这��L��列集�U�Cؓ最左前�~�。（�q�与索引一个列的前�~�不同�Q�烦引一个列的前�~�是利用该的前n 个字�W�作为烦引倹{��）

    假如一个表在分别名�?/span>s t a t e�?/span>city �?/span>zip 的三个列上有一个烦引。烦引中的行是按state/city/zip 的次序存攄��Q�因此，索引中的行也会自动按state/city 的顺序和state 的顺序存放。这表示�Q�即使在查询中只指定state 值或只指�?/span>state �?/span>city 的��|��MySQL也可以利用烦引。因此，此烦引可用来搜烦下列的列�l�合�Q?/span>

    state,city,zip

    state,city

    sate

    MySQL不能使用不涉及左前缀的搜索。例如，如果�?/span>city �?/span>zip �q�行搜烦�Q�则不能使用该烦引。如果要搜烦某个州以及某�?/span>zip 代码�Q�烦引中的列1和列3�Q�，则此索引不能用于相应值的�l�合。但是，可利用烦引来��L��与该州相�W�的行，以减��搜索范围�?/span>

persister 2009-08-20 11:37 发表评论

MySQL Got a packet bigger than 'max_allowed_packet' bytes错误

persister — Thu, 30 Jul 2009 14:54:00 GMT
今天用SQLYog执行数据插入命��o�Q�一�?万多条记录吧�Q�导入数据库时提�C�：

Error Code:1153 Got a packet bigger than 'max_allowed_packet' bytes错误提示�?br /> 开始没注意�Q�提�C�Z��大堆�Q�后来才看见�q�句
使用SQLyog工具导出MySQL数据�Ӟ��当数据量大时�Q�导��Z��会错误，但导入时会出现错误。如果将SQL单独执行会发现是Error Code:1153 Got a packet bigger than 'max_allowed_packet' bytes错误�?br /> 对于�q�个问题可以在my.ini中最后增加一行max_allowed_packet=16M卛_��Q�根据实际情况设�|�）�?br />
注意�Q�在[client]和[mysql]部分增加无效�Q�那个是客户端读取的参数�?

persister 2009-07-30 22:54 发表评论

mysql repair命��o

persister — Thu, 23 Apr 2009 09:30:00 GMT
今天在测试的时候，�pȝ��无法��d��。报如下错误�Q?br />
SequenceUtil.SequenceBank.fillBank] SQL Exception while executing the following:
UPDATE SEQUENCE_VALUE_ITEM SET SEQ_ID=SEQ_ID+100 WHERE SEQ_NAME='Visit'
Error was:Incorrect key file for table './ccbofbiz/sequence_value_item.MYI'; try to repair it
Exception: java.sql.SQLException
Message: Incorrect key file for table './ccbofbiz/sequence_value_item.MYI'; try to repair it

很少看到�q�样的错误，今天被我��到了，哈哈
�q�行如下命��o�Q?br /> repair table SEQUENCE_VALUE_ITEM

成功了，非常行不错�?

persister 2009-04-23 17:30 发表评论

从LiveJournal后台发展看大规模�|�站性能优化�Ҏ��(无图片版)

persister — Fri, 05 Dec 2008 02:52:00 GMT

此�ؓ转蝲�Q�原文请自行搜烦�?/h3>
一、LiveJournal发展历程
LiveJournal�?9�q�始于校园中的项目，几个人出于爱好做了这样一个应用，以实��C��下功能：

博客�Q�论�?

�C�会性网�l�，扑ֈ�朋友

聚合�Q�把朋友的文章聚合在一�?/li>
LiveJournal采用了大量的开源��Y�Ӟ��甚至它本�w�也是一个开源��Y件�?
在上�U�后�Q�LiveJournal实现了非常快速的增长�Q?/p>

2004�q?月䆾�Q?80万注册用戗��?

2005�q?月䆾�Q?80万注册用戗��?

2005�q?月䆾�Q?90万注册用戗��?

辑ֈ�了每�U�钟上千�ơ的��面��h��及处理�?

使用了大量MySQL服务器�?

使用了大量通用�l��g�?/li>

二、LiveJournal架构现状概况

三、从LiveJournal发展中学�?/h2>

LiveJournal�?台服务器发展�?00台服务器�Q�这其中�l�历了无数的伤痛�Q�但同时也摸索出了解册��些问题的�Ҏ��Q�通过对LiveJournal的学习，可以让我们避免LJ曄��犯过的错误，�q�且从一开始就对系�l�进行良好的设计�Q�以避免后期的痛苦�?/p>
下面我们一步一步看LJ发展的脚步�?/p>

1、一台服务器

一台别人捐助的服务器，LJ最初就跑在上面�Q�就像Google开始时候用的破服务器一��P��值得我们��敬。这个阶�D�，LJ的�h以惊人的速度熟悉的Unix的操作管理，服务器性能出现�q�问题，不过�q�好�Q�可以通过一些小修小改应付过厅R��在�q�个阶段里LJ把CGI升��C��FastCGI�?/p>
最�l�问题出��C��Q�网站越来越慢，已经无法通过优过化来解决的地步，需要更多的服务器，�q�时LJ开始提供付�Ҏ��务，可能是想通过�q�些钱来购买新的服务器，以解军_��时的困境�?br /> 毫无疑问�Q�当时LJ存在巨大的单炚w��题，所有的东西都在那台服务器的铁皮盒子里装着�?/p>

2、两台服务器

用付�Ҏ��务赚来的钱LJ��C��两台服务器：一台叫做Kenny的Dell 6U机器用于提供Web服务�Q�一台叫做Cartman的Dell 6U服务器用于提供数据库服务�?/p>

LJ有了更大的磁盘，更多的计��资源。但同时�|�络�l�构�q�是非常��单，每台机器两块�|�卡�Q�Cartman通过内网为Kenny提供MySQL数据库服务�?br />
暂时解决了负载的问题�Q�新的问题又出现了：

原来的一个单点变成了两个单点�?

没有冷备份或热备份�?

�|�站速度慢的问题又开始出��C��Q�没办法�Q�增长太快了�?

Web服务器上CPU辑ֈ�上限�Q�需要更多的Web服务器�?/li>

3、四台服务器

又买了两収ͼ�Kyle和Stan�Q�这�ơ都�?U的，都用于提供Web服务。目前LJ一共有3台Web服务器和一台数据库服务器。这旉��要在3台Web服务器上�q�行负蝲均横�?/p>

LJ把Kenny用于外部的网养I��使用mod_backhand�q�行负蝲均横�?/p>
然后问题又出��C��Q?/p>

单点故障。数据库和用于做�|�关的Web服务器都是单点，一旦�Q何一台机器出现问题将��D��所有服务不可用。虽然用于做�|�关的Web服务器可以通过保持心蟩同步�q�速切换，但还是无法解��x��据库的单点，LJ当时也没做这个�?

�|�站又变慢了�Q�这�ơ是因�ؓIO和数据库的问题，问题是怎么往应用里面��d��数据库呢�Q?/li>

4、五台服务器

又买了一台数据库服务器。在两台数据库服务器上��用了数据库同�?Mysql支持的Master-Slave模式)�Q�写操作全部针对��L��据库�Q�通过Binlog�Q�主服务器上的写操作可以�q�速同步到从服务器上）�Q�读操作在两个数据库上同时进�?也算是负载均横的一�U�吧)�?/p>

实现同步时要注意几个事项�Q?/p>

��L��作数据库选择��法处理�Q�要选一个当前负载轻一点的数据库�?

在从数据库服务器上只能进行读操作

准备好应对同步过�E�中的�g�q�，处理不好可能会导致数据库同步的中断。只需要对写操作进行判断即可，��L��作不存在同步问题�?/li>

5、更多服务器

有钱了，当然要多��C��服务器。部�|�后快了没多久，又开始慢了。这�ơ有更多的Web服务器，更多的数据库服务器，存在 IO与CPU争用。于是采用了BIG-IP作�ؓ负蝲均衡解决�Ҏ��?/p>

6、现在我们在哪里�Q?/h2>

现在服务器基本上够了�Q�但性能�q�是有问题，原因出在架构上�?/p>
数据库的架构是最大的问题。由于增加的数据库都是以Slave模式��d��到应用内�Q�这样唯一的好处就是将��L��作分布到了多台机器，但这样带来的后果��是写操作被大量分发�Q�每台机器都要执行，服务器越多，��费��p��大，随着写操作的增加�Q�用于服务读操作的资源越来越��?/p>

�׃��台分布到两台

最�l�效�?/p>
现在我们发现�Q�我们�ƈ不需要把�q�些数据在如此多的服务器上都保留一份。服务器上已�l�做了RAID�Q�数据库也进行了备䆾�Q�这么多的备份完全是对资源的��费�Q�属于冗余极端过度。那��Z��么不把数据分布存储呢�Q?/p>
问题发现了，开始考虑如何解决。现在要做的��是把不同用��L��数据分布��C��同的服务器上�q�行存储�Q�以实现数据的分布式存储�Q�让每台机器只�ؓ相对固定的用��h��务，以实现��^行的架构和良好的可扩展性�?/p>
��Z��实现用户分组�Q�我们需要�ؓ每一个用户分配一个组标记�Q�用于标记此用户的数据存攑֜�哪一�l�数据库服务器中。每�l�数据库�׃��个master及几个slave�l�成�Q��ƈ且slave的数量在2-3収ͼ�以实现系�l�资源的最合理分配�Q�既保证数据��L��作分布，又避免数据过度冗余以及同步操作对�pȝ��资源的过度消耗�?/p>

�׃��収ͼ�一�l�）中心服务器提供用户分�l�控制。所有用��L��分组信息都存储在�q�台机器上，所有针对用��L��操作需要先查询�q�台机器得到用户的组��P��然后再到相应的数据库�l�中获取数据�?/p>
�q�样的用��h��构与目前LJ的架构已�l�很相像了�?/p>
在具体的实现旉��要注意几个问题：

在数据库�l�内不要使用自增ID�Q�以便于以后在数据库�l�之间迁�Uȝ��P��以实现更合理的I/O�Q�磁盘空间及负蝲分布�?

��userid�Q�postid存储在全局服务器上�Q�可以��用自增，数据库组中的相应值必��M��全局服务器上的��gؓ准。全局服务器上使用事务型数据库InnoDB�?

在数据库�l�之间迁�Uȝ��h��要万分小心，当迁�U�L��用户不能有写操作�?/li>

7、现在我们在哪里

问题�Q?/p>

一个全局��L��务器�Q�挂掉的话所有用��h��册及写操作就挂掉�?

每个数据库组一个主服务器，挂掉的话�q�组用户的写操作��挂掉�?

数据库组从服务器挂掉的话会导致其它服务器负蝲�q�大�?/li>

对于Master-Slave模式的单炚w��题，LJ采取了Master-Master模式来解冟뀂所谓Master-Master实际上是人工实现的，�q�不是由MySQL直接提供的，实际上也��是两台机器同时是Master�Q�也同时是Slave�Q�互相同步�?/p>
Master-Master实现旉��要注意：

一个Master出错后恢复同步，最好由服务器自动完成�?

数字分配�Q�由于同时在两台机器上写�Q�有些ID可能会冲�H��?/li>

解决�Ҏ��Q?br />

奇偶数分配ID�Q�一台机器上写奇敎ͼ�一台机器上写偶�?

通过全局服务器进行分�?LJ采用的做�?�?/li>

Master-Master模式�q�有一�U�用法，�q�种�Ҏ��与前一�U�相比，仍然保持两台机器的同步，但只有一台机器提供服务（��d��写）�Q�在每天晚上的时候进行轮换，或者出现问题的时候进行切换�?/p>
8、现在我们在哪里

现在插播一条广告，MyISAM VS InnoDB�?/p>
使用InnoDB�Q?/p>

支持事务

需要做更多的配�|�，不过值得�Q�可以更安全的存储数据，以及得到更快的速度�?/li>

使用MyISAM�Q?/p>

记录日志�Q�LJ用它来记�|�络讉K��日志�Q?

存储只读静态数据，��_��快�?

�q�发性很差，无法同时��d��数据�Q�添加数据可以）

MySQL非正常关闭或��L��时会��D��索引错误�Q�需要��用myisamchk修复�Q�而且当访问量大时出现非常频繁�?/li>

9、缓�?/h2>
��d��我写�q?a >一��文章介�l�memcached�Q�它��是由LJ的团队开发的一�Ƅ��存工��P��以key-value的方式将数据存储到分布的内存中。LJ�~�存的数据：

12台独立服务器�Q�不是捐赠的�Q?

28个实�?

30GB��d��?

90-93%的命中率�Q�用�q�squid的�h可能知道�Q�squid内存加磁盘的命中率大概在70-80%�Q?/li>

如何建立�~�存�{�略�Q?/p>
想缓存所有的东西�Q�那是不可能的，我们只需要缓存已�l�或者可能导致系�l�瓶颈的地方�Q�最大程度的提交�pȝ��q�行效率。通过对MySQL的日志的分析我们可以扑ֈ��~�存的对象�?/p>
�~�存的缺点？

没有完美的事物，�~�存也有�~�点�Q?

增大开发量�Q�需要针对缓存处理编写特�D�的代码�?

��理隑ֺ�增加�Q�需要更多�h参与�pȝ��l�护�?

当然大内存也需要钱�?/li>

10、Web讉K��负蝲均衡

在数据包�U�别使用BIG-IP�Q�但BIG-IP�q�不知道我们内部的处理机�Ӟ��无法判断由哪台服务器对这些请求进行处理。反向代理�ƈ不能很好的�v��C��用，不是已经够快了，��是达不到我们想要的效果�?/p>
所以，LJ又开发了Perlbal。特点：

快，��，可管理的http web 服务�?代理

可以在内部进行�{�?

使用Perl开�?

单线�E�，异步�Q�基于事�Ӟ��使用epoll , kqueue

支持Console��理与http�q�程��理�Q�支持动态配�|�加�?

多种模式�Q�web服务器，反向代理�Q�插�?

支持插�g�Q�GIF/PNG互换�Q?/li>

11、MogileFS

LJ使用开源的MogileFS作�ؓ分布式文件存储系�l�。MogileFS使用非常��单，它的主要设计思想是：

文�g属于�c�（�c�L��最��的复制单位�Q?

跟踪文�g存储位置

在不同主��Z��存储

使用MySQL集群�l�一存储分布信息

大容易廉��L��?/li>

到目前�ؓ止就�q�么多了�Q�更多文档可以在http://www.danga.com/words/扑ֈ��?a >Danga.com�?a >LiveJournal.com的同学们拿这个文档参加了两次MySQL Con�Q�两�ơOS Con�Q�以及众多的其它会议�Q�无�U�的把他们的�l�验分��n出来�Q�值得我们学习。在web2.0时代快速开发得到大家越来越多的重视�Q�但良好的设计仍是每一个应用的基础�Q�希望web2.0们在成长为Top500�|�站的�\上，不要因�ؓ架构�ȝ��了网站的发展�?/p>
参考资料：http://www.danga.com/words/2005_oscon/oscon-2005.pdf

persister 2008-12-05 10:52 发表评论

persister — Mon, 27 Oct 2008 02:40:00 GMT
�?explain的帮助下�Q�您��q��道什么时候该�l�表��d��索引�Q�以使用索引来查找记录从而让select �q�行更快�?br /> 如果�׃��不恰当��用烦引而引起一些问题的话，可以�q�行 analyze table来更新该表的�l�计信息�Q�例如键的基敎ͼ�它能帮您在优化方面做出更好的选择�?br />
explain �q�回了一行记录，它包括了 select语句中用到的各个表的信息。这些表在结果中按照mysql卛_��执行的查询中��d��的顺序列出来。mysql用一�ơ扫描多�ơ连接（single- sweep,multi-join�Q�的�Ҏ��来解册��接。这意味着mysql从第一个表中读取一条记录，然后在第二个表中查找到对应的记录�Q�然后在�W�三个表中查找，依次�c�L��。当所有的表都扫描完了�Q�它输出选择的字�D��ƈ且回溯所有的表，直到找不��Cؓ止，因�ؓ有的表中可能有多条匹配的记录下一条记录将从该表读取，再从下一个表开始��l�处理�?br /> 在mysql version 4.1中，explain输出的结果格式改变了�Q��得它更适合例如 union语句、子查询以及�z��表的�l�构。更令�h注意的是�Q�它新增�?个字�D�： id�?select_type。当你��用早于mysql4.1的版本就看不到这些字�D�了�?br /> explain�l�果的每行记录显�C�Z��每个表的相关信息�Q�每行记录都包含以下几个字段�Q?br />
id
本次 select 的标识符。在查询中每�?select都有一个顺序的数倹{�?br /> select_type
select 的类型，可能会有以下几种�Q?br /> simple: ��单的 select �Q�没有��?union或子查询�Q?br />
primary: 最外层�?select�?br />
union: �W�二层，在select 之后使用�?union�?br />
dependent union: union 语句中的�W�二个select�Q�依赖于外部子查�?br />
subquery: 子查询中的第一�?select

dependent subquery: 子查询中的第一�?subquery依赖于外部的子查�?br />
derived: �z��?select�Q�from子句中的子查询）

table
记录查询引用的表�?br />
type
表连接类型。以下列��Z��各种不同�c�d��的表�q�接�Q�依�ơ是从最好的到最差的�Q?br />
system:表只有一行记录（�{�于�pȝ��表）。这�?const表连接类型的一个特例�?br />
const:表中最多只有一行匹配的记录�Q�它在查询一开始的时候就会被��d��出来。由于只有一行记录，在余下的优化�E�序里该行记录的字段值可以被当作是一�? 恒定倹{��const表查询�v来非常快�Q�因为只要读取一�ơ！const 用于在和 primary key 或unique 索引中有固定值比较的情�Ş。下面的几个查询中，tbl_name ��是 c表了�Q?br /> select * from tbl_name where primary_key=1; select * from tbl_namewhere primary_key_part1=1 and primary_key_part2=2;

eq_ref:从该表中会有一行记录被��d��出来以和从前一个表中读取出来的记录做联合。与const�c�d��不同的是�Q�这是最好的�q�接�c�d��。它用在索引所有部分都用于做连接�ƈ且这个烦引是一个primary key �?unique �c�d��。eq_ref可以用于在进�?="做比较时��索字�D�c��比较的值可以是固定值或者是表达式，表达�C�Z��可以使用表里的字�D�，它们在读表之前已�l�准备好了。以下的几个例子中，mysql使用了eq_ref �q�接来处�?ref_table�Q?br />

select * from ref_table,other_table whereref_table.key_column=other_table.column; select * fromref_table,other_table whereref_table.key_column_part1=other_table.column andref_table.key_column_part2=1;

ref: 该表中所有符合检索值的记录都会被取出来和从上一个表中取出来的记录作联合。ref用于�q�接�E�序使用键的最左前�~�或者是该键不是 primary key �? unique索引�Q�换句话��_��是�q�接�E�序无法�Ҏ��键值只取得一条记录）的情��c��当�Ҏ��键值只查询到少数几条匹配的记录�Ӟ��q�就是一个不错的�q�接�c�d��? ref�q�可以用于检索字�D��?=操作�W�来比较的时候。以下的几个例子中，mysql��?ref 来处理ref_table�Q?br /> select * from ref_table where key_column=expr; select * fromref_table,other_table whereref_table.key_column=other_table.column; select * fromref_table,other_table whereref_table.key_column_part1=other_table.column andref_table.key_column_part2=1;

ref_or_null: �q�种�q�接�c�d��c�M�� ref�Q�不同的是mysql会在��索的时候额外的搜烦包含null 值的记录。这�U�连接类型的优化是从mysql4.1.1开始的�Q�它�l�常用于子查询。在以下的例子中�Q�mysql使用ref_or_null �c�d��来处�? ref_table�Q?br /> select * from ref_table where key_column=expr or key_column is null;

unique_subquery: �q�种�c�d��用例如一下�Ş式的 in 子查询来替换 ref�Q?br /> value in (select primary_key from single_table where some_expr)

unique_subquery: 只是用来完全替换子查询的索引查找函数效率更高了�?br />
index_subquery: �q�种�q�接�c�d��c�M�� unique_subquery。它用子查询来代替in�Q�不�q�它用于在子查询中没有唯一索引的情况下�Q�例如以下�Ş式：
value in (select key_column from single_table where some_expr)

range: 只有在给定范围的记录才会被取出来�Q�利用烦引来取得一条记录。key字段表示使用了哪个烦引。key_len字段包括了��用的键的最镉K��分。这�U�类型时 ref 字段值是 null。range用于��某个字�D�和一个定植用以下��M��操作�W�比较时 =, <>, >,>=, <, <=, is null, <=>, between, �?in�Q?br /> select * from tbl_name where key_column = 10; select * fromtbl_name where key_column between 10 and 20; select * from tbl_namewhere key_column in (10,20,30); select * from tbl_name wherekey_part1= 10 and key_part2 in (10,20,30);

index: �q�接�c�d��?all 一��P��不同的是它只扫描索引树。它通常会比 all快点�Q�因为烦引文仉��常比数据文件小。mysql在查询的字段知识单独的烦引的一部分的情况下使用�q�种�q�接�c�d��?br />
all: ��对该表做全部扫描以和从前一个表中取得的记录作联合。这时候如果第一个表没有被标识�ؓconst的话��׃��大好了，在其他情况下通常是非常糟�p�的。正常地�Q�可以通过增加索引使得能从表中更快的取得记录以避免all�?br />

possible_keys
possible_keys字段是指 mysql在搜索表记录时可能��用哪个烦引。注意，�q�个字段完全独立于explain 昄��的表��序。这��意味着 possible_keys里面所包含的烦引可能在实际的��用中没用到。如果这个字�D늚�值是null�Q�就表示没有索引被用到。这�U�情况下�Q�就可以��? where子句中哪些字�D�那些字�D�适合增加索引以提高查询的性能。就�q�样�Q�创��Z��下烦引，然后再用explain ��查一下。详�l�的查看章节"14.2.2 alter tablesyntax"。想看表都有什么烦引，可以通过 show index from tbl_name来看�?br />

key
key字段昄��了mysql实际上要用的索引。当没有��M��索引被用到的时候，�q�个字段的值就是null。想要让mysql��使用或者忽略在 possible_keys字段中的索引列表�Q�可以在查询语句中��用关键字force index, use index,�?ignore index。如果是 myisam �?bdb �c�d��表，可以使用 analyzetable 来帮助分析��用��用哪个烦引更好。如果是 myisam�c�d��表，�q�行命��o myisamchk --analyze也是一��L��效果。详�l�的可以查看章节"14.5.2.1 analyze tablesyntax"�?5.7.2 table maintenance and crash recovery"�?br />
key_len
key_len 字段昄��了mysql使用索引的长度。当 key 字段的��gؓ null�Ӟ��索引的长度就�?null。注意，key_len的值可以告诉你在联合烦引中mysql会真正��用了哪些索引�?br />
ref
ref 字段昄��了哪些字�D�|��者常量被用来�?key配合从表中查询记录出来�?br />
rows
rows 字段昄��了mysql认�ؓ在查询中应该��索的记录数�?br />
extra

本字�D�|��C�Z��查询中mysql的附加信息。以下是�q�个字段的几个不同值的解释�Q?br />
distinct:mysql当找到当前记录的匚w��联合�l�果的第一条记录之后，��׃��再搜索其他记录了�?br />
not exists:mysql在查询时做一�?left join优化�Ӟ��当它在当前表中找��C��和前一条记录符�?left join条�g后，��׃��再搜索更多的记录了。下面是一个这�U�类型的查询例子�Q?br /> select * from t1 left join t2 on t1.id=t2.id where t2.id isnull;

假�� t2.id 定义�?not null。这�U�情况下�Q�mysql��会扫描�?t1�q�且�?t1.id 的值在 t2 中查找记录。当�? t2中找��C��条匹配的记录�Ӟ��q�就意味着 t2.id 肯定不会都是null�Q�就不会再在 t2 中查扄��?id值的其他记录了。也可以�q�么��_��对于 t1 中的每个记录�Q�mysql只需要在t2 中做一�ơ查找，而不��在 t2 中实际有多少匚w��的记录�?br />
range checked for each record (index map: #)

mysql没找到合适的可用的烦引。取代的办法是，对于前一个表的每一个行�q�接�Q�它会做一个检验以军_��该��用哪个烦引（如果有的话）�Q��ƈ且��用这个烦引来从表里取得记录。这个过�E�不会很快，但��L��没有��M��索引时做表连接来得快�?br />
using filesort: mysql需要额外的做一遍从而以排好的顺序取得记录。排序程序根据连接的�c�d��遍历所有的记录�Q��ƈ且将所有符�? where条�g的记录的要排序的键和指向记录的指针存储�v来。这些键已经排完序了�Q�对应的记录也会按照排好的顺序取出来。详情请�?7.2.9how mysql optimizes order by"�?br /> using index

字段的信息直接从索引树中的信息取得，而不再去扫描实际的记录。这�U�策略用于查询时的字�D�|��一个独立烦引的一部分�?br />
using temporary: mysql需要创��Z��时表存储�l�果以完成查询。这�U�情况通常发生在查询时包含了groupby �?order by 子句�Q�它以不同的方式列出了各个字�D�c�?br /> using where

where子句��用来限制哪些记录匹配了下一个表或者发送给客户端。除非你特别地想要取得或者检查表�U�的所有记录，否则的话当查询的extra 字段��g��?using where �q�且表连接类型是 all �?index时可能表�C�有问题�?br />

如果你想要让查询��可能的快，那么��应该注�?extra 字段的��gؓusingfilesort �?using temporary 的情��c�?br />
你可以通过 explain 的结果中 rows字段的值的乘积大概地知道本�ơ连接表现如何。它可以�_�略地告诉我们mysql在查询过�E�中会查询多��条记录。如果是使用�pȝ��变量 max_join_size 来取得查询结果，�q�个乘积�q�可以用来确定会执行哪些多表select 语句�?br /> 下面的例子展�C�Z��如何通过 explain提供的信息来较大�E�度��C��化多表联合查询的性能�?br /> 假设有下面的 select 语句�Q�正打算�?explain 来检��：
explain select tt.ticketnumber, tt.timein, tt.projectreference,tt.estimatedshipdate, tt.actualshipdate, tt.clientid,tt.servicecodes, tt.repetitiveid, tt.currentprocess,tt.currentdppers tt.recordvolume, tt.dpprinted, et.country,et_1.country, do.custname from tt, et, et as et_1, do wherett.submittime is null and tt.actualpc = et.employid andtt.assignedpc = et_1.employid and tt.clientid = do.custnmbr;

在这个例子中�Q�先做以下假设：

要比较的字段定义如下�Q?br /> table column columntype
tt actualpc char(10)
tt assignedpc char(10)
tt clientid char(10)
et employid char(15)
do custnmbr char(15)

数据表的索引如下�Q?br /> table index
tt actualpc
tt assignedpc
tt clientid
et employid (primary key)
do custnmbr (primary key)

tt.actualpc 的值是不均匀分布的�?br />
在�Q何优化措施未采取之前�Q�经�q?explain分析的结果显�C�如下：
table type possible_keys key key_len ref rows extra
et all primarynull null null 74
do all primary null null null 2135
et_1 allprimary null null null 74
tt all assignedpc, null null null 3872 clientid, actualpc range checked for each record (key map: 35)

�׃��字段 type 的对于每个表值都是all�Q�这个结果意味着mysql�Ҏ��有的表做一个��_卡尔�U�；�q�就是说�Q�每条记录的�l�合。这��需要花很长的时��_��因�ؓ需要扫描每个表�? 记录��C��U�的��d��。在�q�情况下�Q�它的积�?4 * 2135 * 74 * 3872 = 45,268,558,720条记录。如果数据表更大的话�Q�你可以惌��一下需要多长的旉��?br /> 在这里有个问题是当字�D�定义一��L��时候，mysql��可以在�q�些字段上更快的是用索引�Q�对isam�c�d��的表来说�Q�除非字�D�定义完全一��P��否则不会使用�? 引）。在�q�个前提下，varchar�?char是一��L��除非它们定义的长度不一致。由�?tt.actualpc 定义为char(10)�Q�et.employid 定义�?char(15)�Q�二者长度不一致�?br /> ��Z��解决�q�个问题�Q�需要用 alter table 来加�?actualpc的长度从10�?5个字�W�：
mysql> alter table tt modify actualpc varchar(15);

现在 tt.actualpc �?et.employid 都是 varchar(15)
了。再来执行一��?explain 语句看看�l�果�Q?br /> table type possible_keys key key_len ref rows extra
tt allassignedpc, null null null 3872 using clientid, where actualpc
do all primary null null null 2135 range checked for each record (keymap: 1)
et_1 all primary null null null 74 range checked for eachrecord (key map: 1) et eq_ref primary primary 15 tt.actualpc 1

�q�还不够�Q�它�q�可以做的更好：现在 rows��g��U�已�l�少�?4倍。这�ơ查询需要用2�U�钟�?br /> �W�二个改变是消除在比�?tt.assignedpc = et_1.employid �?tt.clientid= do.custnmbr 中字�D늚�长度不一致问题：
mysql> alter table tt modify assignedpc varchar(15), ->modify clientid varchar(15);

现在 explain 的结果如下：
table type possible_keys key key_len ref rows extra
et all primary null null null 74
tt ref assignedpc, actualpc 15 et.employid 52 using clientid, where actualpc
et_1 eq_ref primary primary 15 tt.assignedpc 1
do eq_ref primary primary 15 tt.clientid 1

�q�看��h��已经是能做的最好的�l�果了�?br /> 遗留下来的问题是�Q�mysql默认地认为字�D?tt.actualpc的值是均匀分布的，然而表 tt�q��如此。幸好，我们可以很方便的让mysql分析索引的分布：
mysql> analyze table tt;

到此为止�Q�表�q�接已经优化的很完美了，explain 的结果如下：
table type possible_keys key key_len ref rows extra
tt all assignedpc null null null 3872 using clientid, where actualpc
et eq_ref primary primary 15 tt.actualpc 1
et_1 eq_ref primary primary 15 tt.assignedpc 1
do eq_ref primary primary 15 tt.clientid 1

��h��意，explain �l�果中的 rows字段的��g��是mysql的连接优化程序大致猜��的�Q�请��查这个��D��真实值是否基本一致。如果不是，可以通过在select 语句中��? straight_join 来取得更好的性能�Q�同时可以试着在from分句中用不同的次序列出各个表�?

persister 2008-10-27 10:40 发表评论