亚洲va在线va天堂成人,亚洲av永久无码一区二区三区,春暖花开亚洲性无区一区二区

ORACLE索引與高性能SQL介紹

轉自：http://blog.csdn.net/annicybc/archive/2006/06/24/829662.aspx

索引是建立在表的一列或多個列上的輔助對象，目的是加快訪問表中的數據；
　　
　　Oracle存儲索引的數據結構是B*樹，位圖索引也是如此，只不過是葉子節點不同B*數索引；
　　
　　索引由根節點、分支節點和葉子節點組成，上級索引塊包含下級索引塊的索引數據，葉節點包含索引數據和確定行實際位置的rowid。
　　
　　使用索引的目的
　　加快查詢速度
　　減少I/O操作
　　消除磁盤排序
　　
　　何時使用索引
　　查詢返回的記錄數
　　排序表<40%
　　非排序表 <7%
　　表的碎片較多（頻繁增加、刪除）
　　
　　索引的種類
　　非唯一索引（最常用）
　　唯一索引
　　位圖索引
　　局部有前綴分區索引
　　局部無前綴分區索引
　　全局有前綴分區索引
　　散列分區索引
　　基于函數的索引
　　
　　管理索引的準則
　　
　　在表中插入數據后創建索引
　　
　　。在用SQL*Loader或import工具插入或裝載數據后，建立索引比較有效；
　　
　　索引正確的表和列
　　
　　。經常檢索排序大表中40%或非排序表7%的行，建議建索引；
　　。為了改善多表關聯，索引列用于聯結；
　　。列中的值相對比較唯一；
　　。取值范圍（大：B*樹索引，小：位圖索引）；
　　。Date型列一般適合基于函數的索引；
　　。列中有許多空值，不適合建立索引
　　
　　為性能而安排索引列
　　
　　。經常一起使用多個字段檢索記錄，組合索引比單索引更有效；
　　。把最常用的列放在最前面，例：dx_groupid_serv_id(groupid,serv_id)，在where條件中使用groupid或groupid,serv_id，查詢將使用索引，若僅用到serv_id字段，則索引無效；
　　。合并/拆分不必要的索引。
　　
　　限制每個表索引的數量
　　
　　。一個表可以有幾百個索引（你會這樣做嗎？），但是對于頻繁插入和更新表，索引越多系統CPU，I/O負擔就越重；
　　。建議每張表不超過5個索引。
　　
　　刪除不再需要的索引
　　
　　。索引無效，集中表現在該使用基于函數的索引或位圖索引，而使用了B*樹索引；
　　。應用中的查詢不使用索引；
　　。重建索引之前必須先刪除索引，若用alter index … rebuild重建索引，則不必刪除索引。
　　
　　索引數據塊空間使用
　　
　　。創建索引時指定表空間，特別是在建立主鍵時，應明確指定表空間；
　　。合理設定pctfress，注意：不能給索引指定pctused；
　　。估計索引的大小和合理地設置存儲參數，默認為表空間大小，或initial與next設置成一樣大。
　　
　　考慮并行創建索引
　　
　　。對大表可以采用并行創建索引，在并行創建索引時，存儲參數被每個查詢服務器進程分別使用，例如：initial為1M，并行度為8，則創建索引期間至少要消耗8M空間；
　　
　　考慮用nologging創建索引
　　
　　。對大表創建索引可以使用nologging來減少重做日志；
　　。節省重做日志文件的空間；
　　。縮短創建索引的時間；
　　。改善了并行創建大索引時的性能。
　　
　　怎樣建立最佳索引
　　
　　明確地創建索引
　　create index index_name on table_name(field_name)
　　tablespace tablespace_name
　　pctfree 5
　　initrans 2
　　maxtrans 255
　　storage
　　(
　　minextents 1
　　maxextents 16382
　　pctincrease 0
　　);
　　
　　創建基于函數的索引
　　
　　。常用與UPPER、LOWER、TO_CHAR(date)等函數分類上，例：
　　create index idx_func on emp (UPPER(ename)) tablespace tablespace_name;
　　
　　創建位圖索引
　　
　　。對基數較小，且基數相對穩定的列建立索引時，首先應該考慮位圖索引，例：
　　create bitmap index idx_bitm on class (classno) tablespace tablespace_name;
　　
　　明確地創建唯一索引
　　
　　。可以用create unique index語句來創建唯一索引，例：
　　create unique index dept_unique_idx on dept(dept_no) tablespace idx_1;
　　
　　創建與約束相關的索引
　　
　　。可以用using index字句，為與unique和primary key約束相關的索引，例如：
　　alter table table_name
　　add constraint PK_primary_keyname primary key (field_name)
　　using index tablespace tablespace_name；
　　
　　如何創建局部分區索引
　　
　　。基礎表必須是分區表；
　　。分區數量與基礎表相同；
　　。每個索引分區的子分區數量與相應的基礎表分區相同；
　　。基礎表的子分區中的行的索引項，被存儲在該索引的相應的子分區中,例如:
　　Create Index TG_CDR04_SERV_ID_IDX On TG_CDR04(SERV_ID)
　　Pctfree 5
　　Tablespace TBS_AK01_IDX
　　Storage (
　　MaxExtents 32768
　　PctIncrease 0
　　FreeLists 1
　　FreeList Groups 1
　　)
　　local
　　/
　　
　　如何創建范圍分區的全局索引
　　
　　。基礎表可以是全局表和分區表。
　　create index idx_start_date on tg_cdr01(start_date)
　　global partition by range(start_date)
　　(partition p01_idx vlaues less than (‘0106’)
　　partition p01_idx vlaues less than (‘0111’)
　　…
　　partition p01_idx vlaues less than (‘0401’ ))
　　/
　　
　　重建現存的索引
　　
　　重建現存的索引的當前時刻不會影響查詢；
　　
　　重建索引可以刪除額外的數據塊；
　　
　　提高索引查詢效率；
　　alter index idx_name rebuild nologging;
　　
　　對于分區索引：
　　alter index idx_name rebuild partition partiton_name nologging;
　　
　　要刪除索引的原因
　　
　　。不再需要的索引；
　　。索引沒有針對其相關的表所發布的查詢提供所期望的性能改善；
　　。應用沒有用該索引來查詢數據；
　　。該索引無效，必須在重建之前刪除該索引；
　　。該索引已經變的太碎了，必須在重建之前刪除該索引；
　　。語句：drop index idx_name;drop index idx_name drop partition partition_name;
　　
　　建立索引的代價
　　
　　基礎表維護時，系統要同時維護索引，不合理的索引將嚴重影響系統資源，主要表現在CPU和I/O上；
　　
　　插入、更新、刪除數據產生大量db file sequential read鎖等待；
　　
　　SQL優化器簡介
　　
　　基于規則的優化器
　　
　　。總是使用索引
　　。總是從驅動表開始（from子句最右邊的表）
　　。只有在不可避免的情況下，才使用全表掃描
　　。任何索引都可以
　　
　　基于成本的優化器
　　
　　。需要表、索引的統計資料
　　Analyze table customer compute statistics;
　　Analyze table customer estimate statistics sample 5000 rows;
　　。表中設置并行度、表分區
　　
　　優化器模式
　　
　　rule模式
　　
　　。總忽略CBO和統計信息而基于規則
　　choose模式
　　
　　。Oracle根據情況選擇rule or first_rows or all_rows
　　first_rows 模式
　　
　　。基于成本，以最快的速度返回記錄，會造成總體查詢速度的下降或消耗更多的資源，傾向索引掃描，適合OLTP系統
　　all_rows模式
　　
　　。基于成本，確保總體查詢時間最短，傾向并行全表掃描
　　
　　例如：
　　Select last_name from customer order by last_name;用first_rows時，迅速返回記錄，但I/O量大，用all_rows時，返回記錄慢，但使用資源少。
　　
　　調整SQL表訪問
　　
　　全表掃描
　　
　　。返回記錄：未排序表>40%，排序表>7%，建議采用并行機制來提高訪問速度，DDS；
　　
　　索引訪問
　　
　　。最常用的方法，包括索引唯一掃描和索引范圍掃描，OLTP；
　　
　　快速完全索引掃描
　　
　　。訪問索引中所有數據塊，結果相當于全表掃描，可以用索引掃描代替全表掃描，例如：
　　
　　Select serv_id,count(* ) from tg_cdr01 group by serv_id;
　　
　　評估全表掃描的合法性
　　
　　如何實現并行掃描
　　
　　。永久并行化（不推薦）
　　alter table customer parallel degree 8;
　　
　　。單個查詢并行化
　　select /*+ full(emp) parallel(emp,8)*/ * from emp;
　　
　　分區表效果明顯
　　
　　優化SQL語句排序
　　
　　排序的操作：
　　
　　。order by 子句
　　。group by 子句
　　。select distinct子句
　　。創建索引時
　　。union或minus
　　。排序合并連接
　　
　　如何避免排序
　　
　　。添加索引
　　。在索引中使用distinct子句
　　。避免排序合并連接
　　
　　使用提示進行調整
　　
　　使用提示的原則
　　
　　。語法：/*+ hint */
　　。使用表別名:select /*+ index(e dept_idx)*/ * from emp e
　　。檢驗提示
　　
　　常用的提示
　　
　　。rule
　　。all_rows
　　。first_rows
　　。use_nl
　　。use_hash
　　。use_merge
　　。index
　　。index_asc
　　。no_index
　　。index_desc（常用于使用max內置函數）
　　。index_combine(強制使用位圖索引)
　　。index_ffs（索引快速完全掃描）
　　。use_concat(將查詢中所有or條件使用union all)
　　。parallel
　　。noparallel
　　。full
　　。ordered（基于成本）
　　
　　調整表連接
　　
　　表連接的類型
　　
　　。等連接
　　where 條件中用等式連接；
　　。外部連接（左、右連接）
　　
　　在where條件子句的等式謂詞放置一個(+)來實現，例如：
　　select a.ename,b.comm from emp a,bonus b where a.ename=b.ename(+);
　　
　　該語句返回所有emp表的記錄；
　　。自連接
　　　Select a.value total, B.value hard, (A.value - b.value) soft ,
　　Round((b.value/a.value)*100,1) perc
　　From v$sysstat a,v$sysstat b
　　Where a.statistic# = 179
　　and B.statistic# = 180;
　　
　　反連接
　　
　　反連接常用于not in or not exists中，是指在查詢中找到的任何記錄都不包含在結果集中的子查詢；不建議使用not in or not exists;
　　
　　。半連接
　　
　　查詢中使用exists，含義：即使在子查詢中返回多條重復的記錄，外部查詢也只返回一條記錄。
　　
　　嵌套循環連接
　　
　　。被連接表中存在索引的情況下使用；
　　。使用use_nl。
　　
　　hash連接
　　
　　。Hash連接將驅動表加載在內存中，并使用hash技術連接第二個表，提高等連接速度。
　　。適合于大表和小表連接；
　　。使用use_hash。
　　
　　排序合并連接
　　
　　。排序合并連接不使用索引
　　。使用原則：
　　
　　連接表子段中不存在可用索引；
　　
　　查詢返回兩個表中大部分的數據快；
　　
　　CBO認為全表掃描比索引掃描執行的更快。
　　
　　。使用use_merge
　　
　　使用臨時/中間表
　　
　　多個大表關聯時，可以分別把滿足條件的結果集存放到中間表，然后用中間表關聯；
　　
　　SQL子查詢的調整
　　
　　關聯與非關聯子查詢
　　
　　。關聯：子查詢的內部引用的是外部表，每行執行一次；
　　。非關聯：子查詢只執行一次，存放在內存中。
　　
　　調整not in 和not exists語句
　　
　　。可以使用外部連接優化not in子句，例如：
　　select ename from emp where dept_no not in
　　(select dept_no from dept where dept_name =‘Math’);
　　
　　改為：
　　select ename from emp,dept
　　where emp.dept_no=dept.dept_no
　　and dept.dept_name is null;
　　
　　使用索引調整SQL
　　
　　Oracle 為什么不使用索引
　　
　　。檢查被索引的列或組合索引的首列是否出現在PL/SQL語句的WHERE子句中，這是“執行計劃”能用到相關索引的必要條件。
　　
　　。看采用了哪種類型的連接方式。ORACLE的共有Sort Merge Join（SMJ）、Hash Join（HJ）和Nested Loop Join（NL）。在兩張表連接，且內表的目標列上建有索引時，只有Nested Loop才能有效地利用到該索引。SMJ即使相關列上建有索引，最多只能因索引的存在，避免數據排序過程。HJ由于須做HASH運算，索引的存在對數據查詢速度幾乎沒有影響。
　　
　　。看連接順序是否允許使用相關索引。假設表emp的deptno列上有索引，表dept的列deptno上無索引，WHERE語句有emp.deptno=dept.deptno條件。在做NL連接時，emp做為外表，先被訪問，由于連接機制原因，外表的數據訪問方式是全表掃描，emp.deptno上的索引顯然是用不上，最多在其上做索引全掃描或索引快速全掃描。
　　
　　。是否用到系統數據字典表或視圖。由于系統數據字典表都未被分析過，可能導致極差的“執行計劃”。但是不要擅自對數據字典表做分析，否則可能導致死鎖，或系統性能下降。
　　
　　。索引列是否函數的參數。如是，索引在查詢時用不上。
　　
　　。是否存在潛在的數據類型轉換。如將字符型數據與數值型數據比較，ORACLE會自動將字符型用to_number()函數進行轉換，從而導致上一種現象的發生。
　　
　　。是否為表和相關的索引搜集足夠的統計數據。對數據經常有增、刪、改的表最好定期對表和索引進行分析，可用SQL語句“analyze table xxxx compute statistics for all indexes;”。ORACLE掌握了充分反映實際的統計數據，才有可能做出正確的選擇。
　　
　　。索引列的選擇性不高。　　我們假設典型情況，有表emp，共有一百萬行數據，但其中的emp.deptno列，數據只有4種不同的值，如10、20、30、40。雖然emp數據行有很多，ORACLE缺省認定表中列的值是在所有數據行均勻分布的，也就是說每種deptno值各有25萬數據行與之對應。假設SQL搜索條件DEPTNO=10，利用deptno列上的索引進行數據搜索效率，往往不比全表掃描的高。
　　
　　。索引列值是否可為空（NULL）。如果索引列值可以是空值，在SQL語句中那些要返回NULL值的操作，將不會用到索引，如COUNT（*），而是用全表掃描。這是因為索引中存儲值不能為全空。
　　
　　。看是否有用到并行查詢（PQO）。并行查詢將不會用到索引。
　　
　　。如果從以上幾個方面都查不出原因的話，我們只好用采用在語句中加hint的方式強制ORACLE使用最優的“執行計劃”。　hint采用注釋的方式，有行注釋和段注釋兩種方式。　如我們想要用到A表的IND_COL1索引的話，可采用以下方式：　“SELECT /*+ INDEX（A IND_COL1）*/ * FROM A WHERE COL1 = XXX;"
　　
　　如何屏蔽索引
　　
　　語句的執行計劃中有不良索引時，可以人為地屏蔽該索引，方法：
　　
　　。數值型：在索引字段上加0，例如
　　select * from emp where emp_no+0 = v_emp_no;
　　
　　。字符型：在索引字段上加‘’，例如
　　select * from tg_cdr01 where msisdn||’’=v_msisdn;

posted on 2007-11-21 15:05 xzc 閱讀(650) 評論(1) 編輯收藏所屬分類: Oracle

常用鏈接

留言簿(12)

隨筆分類

隨筆檔案

收藏夾

搜索

最新評論

閱讀排行榜

評論排行榜


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: Oracle to_char格式化函數關于ociuldr ORACLE確定當前記錄和下一條記錄之間的差值 SYS_CONNECT_BY_PATH函數用法 ORACLE Windows Oracle 10G手工創建數據庫談談WINDOWS下重裝系統后oracle的恢復 DML、DDL、DCL區別 oracle 10g 正則表達式　REGEXP_LIKE Oracle 字符集的查看和修改 Oracle 10g Shrink Table 詳解［表空間收縮］