轉自:http://blog.csdn.net/annicybc/archive/2006/06/24/829662.aspx
索引是建立在表的一列或多個列上的輔助對象,目的是加快訪問表中的數據;
Oracle存儲索引的數據結構是B*樹,位圖索引也是如此,只不過是葉子節點不同B*數索引;
索引由根節點、分支節點和葉子節點組成,上級索引塊包含下級索引塊的索引數據,葉節點包含索引數據和確定行實際位置的rowid。
使用索引的目的
加快查詢速度
減少I/O操作
消除磁盤排序
何時使用索引
查詢返回的記錄數
排序表<40%
非排序表 <7%
表的碎片較多(頻繁增加、刪除)
索引的種類
非唯一索引(最常用)
唯一索引
位圖索引
局部有前綴分區索引
局部無前綴分區索引
全局有前綴分區索引
散列分區索引
基于函數的索引
管理索引的準則
在表中插入數據后創建索引
。在用SQL*Loader或import工具插入或裝載數據后,建立索引比較有效;
索引正確的表和列
。經常檢索排序大表中40%或非排序表7%的行,建議建索引;
。為了改善多表關聯,索引列用于聯結;
。列中的值相對比較唯一;
。取值范圍(大:B*樹索引,小:位圖索引);
。Date型列一般適合基于函數的索引;
。列中有許多空值,不適合建立索引
為性能而安排索引列
。經常一起使用多個字段檢索記錄,組合索引比單索引更有效;
。把最常用的列放在最前面,例:dx_groupid_serv_id(groupid,serv_id),在where條件中使用groupid或groupid,serv_id,查詢將使用索引,若僅用到serv_id字段,則索引無效;
。合并/拆分不必要的索引。
限制每個表索引的數量
。一個表可以有幾百個索引(你會這樣做嗎?),但是對于頻繁插入和更新表,索引越多系統CPU,I/O負擔就越重;
。建議每張表不超過5個索引。
刪除不再需要的索引
。索引無效,集中表現在該使用基于函數的索引或位圖索引,而使用了B*樹索引;
。應用中的查詢不使用索引;
。重建索引之前必須先刪除索引,若用alter index … rebuild重建索引,則不必刪除索引。
索引數據塊空間使用
。創建索引時指定表空間,特別是在建立主鍵時,應明確指定表空間;
。合理設定pctfress,注意:不能給索引指定pctused;
。估計索引的大小和合理地設置存儲參數,默認為表空間大小,或initial與next設置成一樣大。
考慮并行創建索引
。對大表可以采用并行創建索引,在并行創建索引時,存儲參數被每個查詢服務器進程分別使用,例如:initial為1M,并行度為8,則創建索引期間至少要消耗8M空間;
考慮用nologging創建索引
。對大表創建索引可以使用nologging來減少重做日志;
。節省重做日志文件的空間;
。縮短創建索引的時間;
。改善了并行創建大索引時的性能。
怎樣建立最佳索引
明確地創建索引
create index index_name on table_name(field_name)
tablespace tablespace_name
pctfree 5
initrans 2
maxtrans 255
storage
(
minextents 1
maxextents 16382
pctincrease 0
);
創建基于函數的索引
。常用與UPPER、LOWER、TO_CHAR(date)等函數分類上,例:
create index idx_func on emp (UPPER(ename)) tablespace tablespace_name;
創建位圖索引
。對基數較小,且基數相對穩定的列建立索引時,首先應該考慮位圖索引,例:
create bitmap index idx_bitm on class (classno) tablespace tablespace_name;
明確地創建唯一索引
。可以用create unique index語句來創建唯一索引,例:
create unique index dept_unique_idx on dept(dept_no) tablespace idx_1;
創建與約束相關的索引
。可以用using index字句,為與unique和primary key約束相關的索引,例如:
alter table table_name
add constraint PK_primary_keyname primary key (field_name)
using index tablespace tablespace_name;
如何創建局部分區索引
。基礎表必須是分區表;
。分區數量與基礎表相同;
。每個索引分區的子分區數量與相應的基礎表分區相同;
。基礎表的子分區中的行的索引項,被存儲在該索引的相應的子分區中,例如:
Create Index TG_CDR04_SERV_ID_IDX On TG_CDR04(SERV_ID)
Pctfree 5
Tablespace TBS_AK01_IDX
Storage (
MaxExtents 32768
PctIncrease 0
FreeLists 1
FreeList Groups 1
)
local
/
如何創建范圍分區的全局索引
。基礎表可以是全局表和分區表。
create index idx_start_date on tg_cdr01(start_date)
global partition by range(start_date)
(partition p01_idx vlaues less than (‘0106’)
partition p01_idx vlaues less than (‘0111’)
…
partition p01_idx vlaues less than (‘0401’ ))
/
重建現存的索引
重建現存的索引的當前時刻不會影響查詢;
重建索引可以刪除額外的數據塊;
提高索引查詢效率;
alter index idx_name rebuild nologging;
對于分區索引:
alter index idx_name rebuild partition partiton_name nologging;
要刪除索引的原因
。不再需要的索引;
。索引沒有針對其相關的表所發布的查詢提供所期望的性能改善;
。應用沒有用該索引來查詢數據;
。該索引無效,必須在重建之前刪除該索引;
。該索引已經變的太碎了,必須在重建之前刪除該索引;
。語句:drop index idx_name;drop index idx_name drop partition partition_name;
建立索引的代價
基礎表維護時,系統要同時維護索引,不合理的索引將嚴重影響系統資源,主要表現在CPU和I/O上;
插入、更新、刪除數據產生大量db file sequential read鎖等待;
SQL優化器簡介
基于規則的優化器
。總是使用索引
。總是從驅動表開始(from子句最右邊的表)
。只有在不可避免的情況下,才使用全表掃描
。任何索引都可以
基于成本的優化器
。需要表、索引的統計資料
Analyze table customer compute statistics;
Analyze table customer estimate statistics sample 5000 rows;
。表中設置并行度、表分區
優化器模式
rule模式
。總忽略CBO和統計信息而基于規則
choose模式
。Oracle根據情況選擇rule or first_rows or all_rows
first_rows 模式
。基于成本,以最快的速度返回記錄,會造成總體查詢速度的下降或消耗更多的資源,傾向索引掃描,適合OLTP系統
all_rows模式
。基于成本,確保總體查詢時間最短,傾向并行全表掃描
例如:
Select last_name from customer order by last_name;用first_rows時,迅速返回記錄,但I/O量大,用all_rows時,返回記錄慢,但使用資源少。
調整SQL表訪問
全表掃描
。返回記錄:未排序表>40%,排序表>7%,建議采用并行機制來提高訪問速度,DDS;
索引訪問
。最常用的方法,包括索引唯一掃描和索引范圍掃描,OLTP;
快速完全索引掃描
。訪問索引中所有數據塊,結果相當于全表掃描,可以用索引掃描代替全表掃描,例如:
Select serv_id,count(* ) from tg_cdr01 group by serv_id;
評估全表掃描的合法性
如何實現并行掃描
。永久并行化(不推薦)
alter table customer parallel degree 8;
。單個查詢并行化
select /*+ full(emp) parallel(emp,8)*/ * from emp;
分區表效果明顯
優化SQL語句排序
排序的操作:
。order by 子句
。group by 子句
。select distinct子句
。創建索引時
。union或minus
。排序合并連接
如何避免排序
。添加索引
。在索引中使用distinct子句
。避免排序合并連接
使用提示進行調整
使用提示的原則
。語法:/*+ hint */
。使用表別名:select /*+ index(e dept_idx)*/ * from emp e
。檢驗提示
常用的提示
。rule
。all_rows
。first_rows
。use_nl
。use_hash
。use_merge
。index
。index_asc
。no_index
。index_desc(常用于使用max內置函數)
。index_combine(強制使用位圖索引)
。index_ffs(索引快速完全掃描)
。use_concat(將查詢中所有or條件使用union all)
。parallel
。noparallel
。full
。ordered(基于成本)
調整表連接
表連接的類型
。等連接
where 條件中用等式連接;
。外部連接(左、右連接)
在where條件子句的等式謂詞放置一個(+)來實現,例如:
select a.ename,b.comm from emp a,bonus b where a.ename=b.ename(+);
該語句返回所有emp表的記錄;
。自連接
Select a.value total, B.value hard, (A.value - b.value) soft ,
Round((b.value/a.value)*100,1) perc
From v$sysstat a,v$sysstat b
Where a.statistic# = 179
and B.statistic# = 180;
反連接
反連接常用于not in or not exists中,是指在查詢中找到的任何記錄都不包含在結果集中的子查詢;不建議使用not in or not exists;
。半連接
查詢中使用exists,含義:即使在子查詢中返回多條重復的記錄,外部查詢也只返回一條記錄。
嵌套循環連接
。被連接表中存在索引的情況下使用;
。使用use_nl。
hash連接
。Hash連接將驅動表加載在內存中,并使用hash技術連接第二個表,提高等連接速度。
。適合于大表和小表連接;
。使用use_hash。
排序合并連接
。排序合并連接不使用索引
。使用原則:
連接表子段中不存在可用索引;
查詢返回兩個表中大部分的數據快;
CBO認為全表掃描比索引掃描執行的更快。
。使用use_merge
使用臨時/中間表
多個大表關聯時,可以分別把滿足條件的結果集存放到中間表,然后用中間表關聯;
SQL子查詢的調整
關聯與非關聯子查詢
。關聯:子查詢的內部引用的是外部表,每行執行一次;
。非關聯:子查詢只執行一次,存放在內存中。
調整not in 和not exists語句
。可以使用外部連接優化not in子句,例如:
select ename from emp where dept_no not in
(select dept_no from dept where dept_name =‘Math’);
改為:
select ename from emp,dept
where emp.dept_no=dept.dept_no
and dept.dept_name is null;
使用索引調整SQL
Oracle 為什么不使用索引
。檢查被索引的列或組合索引的首列是否出現在PL/SQL語句的WHERE子句中,這是“執行計劃”能用到相關索引的必要條件。
。看采用了哪種類型的連接方式。ORACLE的共有Sort Merge Join(SMJ)、Hash Join(HJ)和Nested Loop Join(NL)。在兩張表連接,且內表的目標列上建有索引時,只有Nested Loop才能有效地利用到該索引。SMJ即使相關列上建有索引,最多只能因索引的存在,避免數據排序過程。HJ由于須做HASH運算,索引的存在對數據查詢速度幾乎沒有影響。
。看連接順序是否允許使用相關索引。假設表emp的deptno列上有索引,表dept的列deptno上無索引,WHERE語句有emp.deptno=dept.deptno條件。在做NL連接時,emp做為外表,先被訪問,由于連接機制原因,外表的數據訪問方式是全表掃描,emp.deptno上的索引顯然是用不上,最多在其上做索引全掃描或索引快速全掃描。
。是否用到系統數據字典表或視圖。由于系統數據字典表都未被分析過,可能導致極差的“執行計劃”。但是不要擅自對數據字典表做分析,否則可能導致死鎖,或系統性能下降。
。索引列是否函數的參數。如是,索引在查詢時用不上。
。是否存在潛在的數據類型轉換。如將字符型數據與數值型數據比較,ORACLE會自動將字符型用to_number()函數進行轉換,從而導致上一種現象的發生。
。是否為表和相關的索引搜集足夠的統計數據。對數據經常有增、刪、改的表最好定期對表和索引進行分析,可用SQL語句“analyze table xxxx compute statistics for all indexes;”。ORACLE掌握了充分反映實際的統計數據,才有可能做出正確的選擇。
。索引列的選擇性不高。 我們假設典型情況,有表emp,共有一百萬行數據,但其中的emp.deptno列,數據只有4種不同的值,如10、20、30、40。雖然emp數據行有很多,ORACLE缺省認定表中列的值是在所有數據行均勻分布的,也就是說每種deptno值各有25萬數據行與之對應。假設SQL搜索條件DEPTNO=10,利用deptno列上的索引進行數據搜索效率,往往不比全表掃描的高。
。索引列值是否可為空(NULL)。如果索引列值可以是空值,在SQL語句中那些要返回NULL值的操作,將不會用到索引,如COUNT(*),而是用全表掃描。這是因為索引中存儲值不能為全空。
。看是否有用到并行查詢(PQO)。并行查詢將不會用到索引。
。如果從以上幾個方面都查不出原因的話,我們只好用采用在語句中加hint的方式強制ORACLE使用最優的“執行計劃”。 hint采用注釋的方式,有行注釋和段注釋兩種方式。 如我們想要用到A表的IND_COL1索引的話,可采用以下方式: “SELECT /*+ INDEX(A IND_COL1)*/ * FROM A WHERE COL1 = XXX;"
如何屏蔽索引
語句的執行計劃中有不良索引時,可以人為地屏蔽該索引,方法:
。數值型:在索引字段上加0,例如
select * from emp where emp_no+0 = v_emp_no;
。字符型:在索引字段上加‘’,例如
select * from tg_cdr01 where msisdn||’’=v_msisdn;