什么是索引
索引是建立在表的一列或多個列上的輔助對象,目的是加快訪問表中的數(shù)據(jù);
Oracle存儲索引的數(shù)據(jù)結構是B*樹,位圖索引也是如此,只不過是葉子節(jié)點不同B*數(shù)索引;
索引由根節(jié)點、分支節(jié)點和葉子節(jié)點組成,上級索引塊包含下級索引塊的索引數(shù)據(jù),葉節(jié)點包含索引數(shù)據(jù)和確定行實際位置的rowid。
使用索引的目的
加快查詢速度
減少I/O操作
消除磁盤排序
何時使用索引
查詢返回的記錄數(shù)
排序表<40%
非排序表 <7%
表的碎片較多(頻繁增加、刪除)
索引的種類
非唯一索引(最常用)
唯一索引
位圖索引
局部有前綴分區(qū)索引
局部無前綴分區(qū)索引
全局有前綴分區(qū)索引
散列分區(qū)索引
基于函數(shù)的索引
管理索引的準則
在表中插入數(shù)據(jù)后創(chuàng)建索引
。在用SQL*Loader或import工具插入或裝載數(shù)據(jù)后,建立索引比較有效;
索引正確的表和列
。經常檢索排序大表中40%或非排序表7%的行,建議建索引;
。為了改善多表關聯(lián),索引列用于聯(lián)結;
。列中的值相對比較唯一;
。取值范圍(大:B*樹索引,小:位圖索引);
。Date型列一般適合基于函數(shù)的索引;
。列中有許多空值,不適合建立索引
為性能而安排索引列
。經常一起使用多個字段檢索記錄,組合索引比單索引更有效;
。把最常用的列放在最前面,例:dx_groupid_serv_id(groupid,serv_id),在where條件中使用groupid或groupid,serv_id,查詢將使用索引,若僅用到serv_id字段,則索引無效;
。合并/拆分不必要的索引。
限制每個表索引的數(shù)量
。一個表可以有幾百個索引(你會這樣做嗎?),但是對于頻繁插入和更新表,索引越多系統(tǒng)CPU,I/O負擔就越重;
。建議每張表不超過5個索引。
刪除不再需要的索引
。索引無效,集中表現(xiàn)在該使用基于函數(shù)的索引或位圖索引,而使用了B*樹索引;
。應用中的查詢不使用索引;
。重建索引之前必須先刪除索引,若用alter index … rebuild重建索引,則不必刪除索引。
索引數(shù)據(jù)塊空間使用
。創(chuàng)建索引時指定表空間,特別是在建立主鍵時,應明確指定表空間;
。合理設定pctfress,注意:不能給索引指定pctused;
。估計索引的大小和合理地設置存儲參數(shù),默認為表空間大小,或initial與next設置成一樣大。
考慮并行創(chuàng)建索引
。對大表可以采用并行創(chuàng)建索引,在并行創(chuàng)建索引時,存儲參數(shù)被每個查詢服務器進程分別使用,例如:initial為1M,并行度為8,則創(chuàng)建索引期間至少要消耗8M空間;
考慮用nologging創(chuàng)建索引
。對大表創(chuàng)建索引可以使用nologging來減少重做日志;
。節(jié)省重做日志文件的空間;
。縮短創(chuàng)建索引的時間;
。改善了并行創(chuàng)建大索引時的性能。
怎樣建立最佳索引
明確地創(chuàng)建索引
create index index_name on table_name(field_name)
tablespace tablespace_name
pctfree 5
initrans 2
maxtrans 255
storage
(
minextents 1
maxextents 16382
pctincrease 0
);
創(chuàng)建基于函數(shù)的索引
。常用與UPPER、LOWER、TO_CHAR(date)等函數(shù)分類上,例:
create index idx_func on emp (UPPER(ename)) tablespace tablespace_name;
創(chuàng)建位圖索引
。對基數(shù)較小,且基數(shù)相對穩(wěn)定的列建立索引時,首先應該考慮位圖索引,例:
create bitmap index idx_bitm on class (classno) tablespace tablespace_name;
明確地創(chuàng)建唯一索引
。可以用create unique index語句來創(chuàng)建唯一索引,例:
create unique index dept_unique_idx on dept(dept_no) tablespace idx_1;
創(chuàng)建與約束相關的索引
。可以用using index字句,為與unique和primary key約束相關的索引,例如:
alter table table_name
add constraint PK_primary_keyname primary key (field_name)
using index tablespace tablespace_name;
如何創(chuàng)建局部分區(qū)索引
。基礎表必須是分區(qū)表;
。分區(qū)數(shù)量與基礎表相同;
。每個索引分區(qū)的子分區(qū)數(shù)量與相應的基礎表分區(qū)相同;
。基礎表的子分區(qū)中的行的索引項,被存儲在該索引的相應的子分區(qū)中,例如:
Create Index TG_CDR04_SERV_ID_IDX On TG_CDR04(SERV_ID)
Pctfree 5
Tablespace TBS_AK01_IDX
Storage (
MaxExtents 32768
PctIncrease 0
FreeLists 1
FreeList Groups 1
)
local
/
如何創(chuàng)建范圍分區(qū)的全局索引
。基礎表可以是全局表和分區(qū)表。
create index idx_start_date on tg_cdr01(start_date)
global partition by range(start_date)
(partition p01_idx vlaues less than (‘0106’)
partition p01_idx vlaues less than (‘0111’)
…
partition p01_idx vlaues less than (‘0401’ ))
/
重建現(xiàn)存的索引
重建現(xiàn)存的索引的當前時刻不會影響查詢;
重建索引可以刪除額外的數(shù)據(jù)塊;
提高索引查詢效率;
alter index idx_name rebuild nologging;
對于分區(qū)索引:
alter index idx_name rebuild partition partiton_name nologging;
要刪除索引的原因
。不再需要的索引;
。索引沒有針對其相關的表所發(fā)布的查詢提供所期望的性能改善;
。應用沒有用該索引來查詢數(shù)據(jù);
。該索引無效,必須在重建之前刪除該索引;
。該索引已經變的太碎了,必須在重建之前刪除該索引;
。語句:drop index idx_name;drop index idx_name drop partition partition_name;
建立索引的代價
基礎表維護時,系統(tǒng)要同時維護索引,不合理的索引將嚴重影響系統(tǒng)資源,主要表現(xiàn)在CPU和I/O上;
插入、更新、刪除數(shù)據(jù)產生大量db file sequential read鎖等待;
SQL優(yōu)化器簡介
基于規(guī)則的優(yōu)化器
。總是使用索引
。總是從驅動表開始(from子句最右邊的表)
。只有在不可避免的情況下,才使用全表掃描
。任何索引都可以
基于成本的優(yōu)化器
。需要表、索引的統(tǒng)計資料
Analyze table customer compute statistics;
Analyze table customer estimate statistics sample 5000 rows;
。表中設置并行度、表分區(qū)
優(yōu)化器模式
rule模式
。總忽略CBO和統(tǒng)計信息而基于規(guī)則
choose模式
。Oracle根據(jù)情況選擇rule or first_rows or all_rows
first_rows 模式
。基于成本,以最快的速度返回記錄,會造成總體查詢速度的下降或消耗更多的資源,傾向索引掃描,適合OLTP系統(tǒng)
all_rows模式
。基于成本,確保總體查詢時間最短,傾向并行全表掃描
例如:
Select last_name from customer order by last_name;用first_rows時,迅速返回記錄,但I/O量大,用all_rows時,返回記錄慢,但使用資源少。
調整SQL表訪問
全表掃描
。返回記錄:未排序表>40%,排序表>7%,建議采用并行機制來提高訪問速度,DDS;
索引訪問
。最常用的方法,包括索引唯一掃描和索引范圍掃描,OLTP;
快速完全索引掃描
。訪問索引中所有數(shù)據(jù)塊,結果相當于全表掃描,可以用索引掃描代替全表掃描,例如:
Select serv_id,count(* ) from tg_cdr01 group by serv_id;
評估全表掃描的合法性
如何實現(xiàn)并行掃描
。永久并行化(不推薦)
alter table customer parallel degree 8;
。單個查詢并行化
select /*+ full(emp) parallel(emp,8)*/ * from emp;
分區(qū)表效果明顯
優(yōu)化SQL語句排序
排序的操作:
。order by 子句
。group by 子句
。select distinct子句
。創(chuàng)建索引時
。union或minus
。排序合并連接
如何避免排序
。添加索引
。在索引中使用distinct子句
。避免排序合并連接
使用提示進行調整
使用提示的原則
。語法:/*+ hint */
。使用表別名:select /*+ index(e dept_idx)*/ * from emp e
。檢驗提示
常用的提示
。rule
。all_rows
。first_rows
。use_nl
。use_hash
。use_merge
。index
。index_asc
。no_index
。index_desc(常用于使用max內置函數(shù))
。index_combine(強制使用位圖索引)
。index_ffs(索引快速完全掃描)
。use_concat(將查詢中所有or條件使用union all)
。parallel
。noparallel
。full
。ordered(基于成本)
調整表連接
表連接的類型
。等連接
where 條件中用等式連接;
。外部連接(左、右連接)
在where條件子句的等式謂詞放置一個(+)來實現(xiàn),例如:
select a.ename,b.comm from emp a,bonus b where a.ename=b.ename(+);
該語句返回所有emp表的記錄;
。自連接
Select a.value total, B.value hard, (A.value - b.value) soft ,
Round((b.value/a.value)*100,1) perc
From v$sysstat a,v$sysstat b
Where a.statistic# = 179
and B.statistic# = 180;
反連接
反連接常用于not in or not exists中,是指在查詢中找到的任何記錄都不包含在結果集中的子查詢;不建議使用not in or not exists;
。半連接
查詢中使用exists,含義:即使在子查詢中返回多條重復的記錄,外部查詢也只返回一條記錄。
嵌套循環(huán)連接
。被連接表中存在索引的情況下使用;
。使用use_nl。
hash連接
。Hash連接將驅動表加載在內存中,并使用hash技術連接第二個表,提高等連接速度。
。適合于大表和小表連接;
。使用use_hash。
排序合并連接
。排序合并連接不使用索引
。使用原則:
連接表子段中不存在可用索引;
查詢返回兩個表中大部分的數(shù)據(jù)快;
CBO認為全表掃描比索引掃描執(zhí)行的更快。
。使用use_merge
使用臨時/中間表
多個大表關聯(lián)時,可以分別把滿足條件的結果集存放到中間表,然后用中間表關聯(lián);
SQL子查詢的調整
關聯(lián)與非關聯(lián)子查詢
。關聯(lián):子查詢的內部引用的是外部表,每行執(zhí)行一次;
。非關聯(lián):子查詢只執(zhí)行一次,存放在內存中。
調整not in 和not exists語句
。可以使用外部連接優(yōu)化not in子句,例如:
select ename from emp where dept_no not in
(select dept_no from dept where dept_name =‘Math’);
改為:
select ename from emp,dept
where emp.dept_no=dept.dept_no
and dept.dept_name is null;
使用索引調整SQL
Oracle 為什么不使用索引
。檢查被索引的列或組合索引的首列是否出現(xiàn)在PL/SQL語句的WHERE子句中,這是“執(zhí)行計劃”能用到相關索引的必要條件。
。看采用了哪種類型的連接方式。ORACLE的共有Sort Merge Join(SMJ)、Hash Join(HJ)和Nested Loop Join(NL)。在兩張表連接,且內表的目標列上建有索引時,只有Nested Loop才能有效地利用到該索引。SMJ即使相關列上建有索引,最多只能因索引的存在,避免數(shù)據(jù)排序過程。HJ由于須做HASH運算,索引的存在對數(shù)據(jù)查詢速度幾乎沒有影響。
。看連接順序是否允許使用相關索引。假設表emp的deptno列上有索引,表dept的列deptno上無索引,WHERE語句有emp.deptno=dept.deptno條件。在做NL連接時,emp做為外表,先被訪問,由于連接機制原因,外表的數(shù)據(jù)訪問方式是全表掃描,emp.deptno上的索引顯然是用不上,最多在其上做索引全掃描或索引快速全掃描。
。是否用到系統(tǒng)數(shù)據(jù)字典表或視圖。由于系統(tǒng)數(shù)據(jù)字典表都未被分析過,可能導致極差的“執(zhí)行計劃”。但是不要擅自對數(shù)據(jù)字典表做分析,否則可能導致死鎖,或系統(tǒng)性能下降。
。索引列是否函數(shù)的參數(shù)。如是,索引在查詢時用不上。
。是否存在潛在的數(shù)據(jù)類型轉換。如將字符型數(shù)據(jù)與數(shù)值型數(shù)據(jù)比較,ORACLE會自動將字符型用to_number()函數(shù)進行轉換,從而導致上一種現(xiàn)象的發(fā)生。
。是否為表和相關的索引搜集足夠的統(tǒng)計數(shù)據(jù)。對數(shù)據(jù)經常有增、刪、改的表最好定期對表和索引進行分析,可用SQL語句“analyze table xxxx compute statistics for all indexes;”。ORACLE掌握了充分反映實際的統(tǒng)計數(shù)據(jù),才有可能做出正確的選擇。
。索引列的選擇性不高。 我們假設典型情況,有表emp,共有一百萬行數(shù)據(jù),但其中的emp.deptno列,數(shù)據(jù)只有4種不同的值,如10、20、30、40。雖然emp數(shù)據(jù)行有很多,ORACLE缺省認定表中列的值是在所有數(shù)據(jù)行均勻分布的,也就是說每種deptno值各有25萬數(shù)據(jù)行與之對應。假設SQL搜索條件DEPTNO=10,利用deptno列上的索引進行數(shù)據(jù)搜索效率,往往不比全表掃描的高。
。索引列值是否可為空(NULL)。如果索引列值可以是空值,在SQL語句中那些要返回NULL值的操作,將不會用到索引,如COUNT(*),而是用全表掃描。這是因為索引中存儲值不能為全空。
。看是否有用到并行查詢(PQO)。并行查詢將不會用到索引。
。如果從以上幾個方面都查不出原因的話,我們只好用采用在語句中加hint的方式強制ORACLE使用最優(yōu)的“執(zhí)行計劃”。 hint采用注釋的方式,有行注釋和段注釋兩種方式。 如我們想要用到A表的IND_COL1索引的話,可采用以下方式: “SELECT /*+ INDEX(A IND_COL1)*/ * FROM A WHERE COL1 = XXX;"
如何屏蔽索引
語句的執(zhí)行計劃中有不良索引時,可以人為地屏蔽該索引,方法:
。數(shù)值型:在索引字段上加0,例如
select * from emp where emp_no+0 = v_emp_no;
。字符型:在索引字段上加‘’,例如
select * from tg_cdr01 where msisdn||’’=v_msisdn;
posted on 2006-09-06 11:26
有貓相伴的日子 閱讀(569)
評論(0) 編輯 收藏 所屬分類:
pl/sql