(1)?????
選擇最有效率的表名順序
(
只在基于規則的優化器中有效
)
:
ORACLE
的解析器按照從右到左的順序處理
FROM
子句中的表名,
FROM
子句中寫在最后的表
(
基礎表
driving table)
將被最先處理,在
FROM
子句中包含多個表的情況下
,
你必須選擇記錄條數最少的表作為基礎表。如果有
3
個以上的表連接查詢
,
那就需要選擇交叉表
(intersection table)
作為基礎表
,
交叉表是指那個被其他表所引用的表
.
(2)?????
WHERE
子句中的連接順序.:
ORACLE
采用自下而上的順序解析
WHERE
子句
,
根據這個原理
,
表之間的連接必須寫在其他
WHERE
條件之前
,
那些可以過濾掉最大數量記錄的條件必須寫在
WHERE
子句的末尾
.
(3)?????
SELECT
子句中避免使用
‘ * ‘
:
ORACLE
在解析的過程中
,
會將
'*'
依次轉換成所有的列名
,
這個工作是通過查詢數據字典完成的
,
這意味著將耗費更多的時間
(4)?????
減少訪問數據庫的次數:
ORACLE
在內部執行了許多工作
:
解析
SQL
語句
,
估算索引的利用率
,
綁定變量
,
讀數據塊等;
(5)?????
在
SQL*Plus , SQL*Forms
和
Pro*C
中重新設置
ARRAYSIZE
參數
,
可以增加每次數據庫訪問的檢索數據量
,
建議值為
200
(6)?????
使用
DECODE
函數來減少處理時間:
使用
DECODE
函數可以避免重復掃描相同記錄或重復連接相同的表
.
(7)?????
整合簡單
,
無關聯的數據庫訪問:
如果你有幾個簡單的數據庫查詢語句
,
你可以把它們整合到一個查詢中
(
即使它們之間沒有關系
)
(8)?????
刪除重復記錄
:
最高效的刪除重復記錄方法
(
因為使用了
ROWID)
例子:
DELETE ?FROM ?EMP E ?WHERE ?E.ROWID > (SELECT MIN(X.ROWID)
FROM ?EMP X ?WHERE ?X.EMP_NO = E.EMP_NO);
(9)?????
用
TRUNCATE
替代
DELETE
:
當刪除表中的記錄時
,
在通常情況下
,
回滾段
(rollback segments )
用來存放可以被恢復的信息
.
如果你沒有
COMMIT
事務
,ORACLE
會將數據恢復到刪除之前的狀態
(
準確地說是
恢復到執行刪除命令之前的狀況
)
而當運用
TRUNCATE
時
,
回滾段不再存放任何可被恢復的信息
.
當命令運行后
,
數據不能被恢復
.
因此很少的資源被調用
,
執行時間也會很短
. (
譯者按
: TRUNCATE
只在刪除全表適用
,TRUNCATE
是
DDL
不是
DML)
(10)?
盡量多使用
COMMIT
:
只要有可能
,
在程序中盡量多使用
COMMIT,
這樣程序的性能得到提高
,
需求也會因為
COMMIT
所釋放的資源而減少
:
COMMIT
所釋放的資源
:
a.
回滾段上用于恢復數據的信息
.
b.
被程序語句獲得的鎖
c. redo log buffer
中的空間
d. ORACLE
為管理上述
3
種資源中的內部花費
(11)?
用
Where
子句替換
HAVING
子句:
避免使用
HAVING
子句
, HAVING
只會在檢索出所有記錄之后才對結果集進行過濾
.
這個處理需要排序
,
總計等操作
.
如果能通過
WHERE
子句限制記錄的數目
,
那就能減少這方面的開銷
.
(
非
oracle
中
)
on
、
where
、
having
這三個都可以加條件的子句中,
on
是最先執行,
where
次之,
having
最后,因為
on
是先把不符合條件的記錄過濾后才進行統計,它就可以減少中間運算要處理的數據,按理說應該速度是最快的,
where
也應該比
having
快點的,因為它過濾數據后才進行
sum
,在兩個表聯接時才用
on
的,所以在一個表的時候,就剩下
where
跟
having
比較了。在這單表查詢統計的情況下,如果要過濾的條件沒有涉及到要計算字段,那它們的結果是一樣的,只是
where
可以使用
rushmore
技術,而
having
就不能,在速度上后者要慢如果要涉及到計算的字段,就表示在沒計算之前,這個字段的值是不確定的,根據上篇寫的工作流程,
where
的作用時間是在計算之前就完成的,而
having
就是在計算后才起作用的,所以在這種情況下,兩者的結果會不同。在多表聯接查詢時,
on
比
where
更早起作用。系統首先根據各個表之間的聯接條件,把多個表合成一個臨時表后,再由
where
進行過濾,然后再計算,計算完后再由
having
進行過濾。由此可見,要想過濾條件起到正確的作用,首先要明白這個條件應該在什么時候起作用,然后再決定放在那里
(12)?
減少對表的查詢:
在含有子查詢的
SQL
語句中
,
要特別注意減少對表的查詢
.
例子:
????
SELECT
?TAB_NAME
FROM
TABLES
WHERE
(TAB_NAME,DB_VER) = (
SELECT
TAB_NAME,DB_VER?
FROM
?TAB_COLUMNS ?
WHERE
?VERSION = 604)
(13)?
通過內部函數提高
SQL
效率
.
:
復雜的
SQL
往往犧牲了執行效率
.
能夠掌握上面的運用函數解決問題的方法在實際工作中是非常有意義的
(14)?
使用表的別名
(Alias)
:
當在
SQL
語句中連接多個表時
,
請使用表的別名并把別名前綴于每個
Column
上
.
這樣一來
,
就可以減少解析的時間并減少那些由
Column
歧義引起的語法錯誤
.
(15)?
用
EXISTS
替代
I
N
、
用
NOT EXISTS
替代
NOT IN
:
在許多基于基礎表的查詢中
,
為了滿足一個條件
,
往往需要對另一個表進行聯接
.
在這種情況下
,
使用
EXISTS(
或
NOT EXISTS)
通常將提高查詢的效率
.
在子查詢中
,NOT IN
子句將執行一個內部的排序和合并
.
無論在哪種情況下
,NOT IN
都是最低效的
(
因為它對子查詢中的表執行了一個全表遍歷
).
為了避免使用
NOT IN ,
我們可以把它改寫成外連接
(Outer Joins)
或
NOT EXISTS.
例子:
(
高效
)
SELECT
*
FROM
?EMP (
基礎表
) ?
WHERE
?EMPNO > 0 ?
AND
?
EXISTS
(
SELECT
‘X' ?
FROM
DEPT ?
WHERE
?DEPT.DEPTNO = EMP.DEPTNO ?
AND
?LOC = ‘MELB')
(
低效
)
SELECT
?*
FROM
?EMP (
基礎表
) ?
WHERE
?EMPNO > 0 ?
AND
?DEPTNO
IN
(SELECT
DEPTNO ?
FROM
?DEPT ?
WHERE
?LOC = ‘MELB'
)
(16)?
識別
'
低效執行
'
的
SQL
語句:
雖然目前各種關于
SQL
優化的圖形化工具層出不窮
,
但是寫出自己的
SQL
工具來解決問題始終是一個最好的方法:
SELECT
?EXECUTIONS , DISK_READS, BUFFER_GETS,
ROUND
((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2
)
Hit_radio,
ROUND
(DISK_READS/EXECUTIONS,2) Reads_per_run,
SQL_TEXT
FROM
?V$SQLAREA
WHERE
?EXECUTIONS>0
AND
?BUFFER_GETS > 0
AND
?(BUFFER_GETS-DISK_READS)/BUFFER_GETS < 0.8
ORDER BY ?
4
DESC
;
(17)?
用索引提高效率:
索引是表的一個概念部分
,
用來提高檢索數據的效率,
ORACLE
使用了一個復雜的自平衡
B-tree
結構
.
通常
,
通過索引查詢數據比全表掃描要快
.
當
ORACLE
找出執行查詢和
Update
語句的最佳路徑時
, ORACLE
優化器將使用索引
.
同樣在聯結多個表時使用索引也可以提高效率
.
另一個使用索引的好處是
,
它提供了主鍵
(primary key)
的唯一性驗證
.
。那些
LONG
或
LONG RAW
數據類型
,
你可以索引幾乎所有的列
.
通常
,
在大型表中使用索引特別有效
.
當然
,
你也會發現
,
在掃描小表時
,
使用索引同樣能提高效率
.
雖然使用索引能得到查詢效率的提高
,
但是我們也必須注意到它的代價
.
索引需要空間來存儲
,
也需要定期維護
,
每當有記錄在表中增減或索引列被修改時
,
索引本身也會被修改
.
這意味著每條記錄的
INSERT , DELETE , UPDATE
將為此多付出
4 , 5
次的磁盤
I/O .
因為索引需要額外的存儲空間和處理
,
那些不必要的索引反而會使查詢反應時間變慢
.
。定期的重構索引是有必要的
.
:
ALTER
?
INDEX
<INDEXNAME>
REBUILD
<TABLESPACENAME>
(18)?
用
EXISTS
替換
DISTINCT
:
當提交一個包含一對多表信息
(
比如部門表和雇員表
)
的查詢時
,
避免在
SELECT
子句中使用
DISTINCT.
一般可以考慮用
EXIST
替換
, EXISTS
使查詢更為迅速
,
因為
RDBMS
核心模塊將在
子查詢的條件一旦滿足后
,
立刻返回結果
.
例子:
??????
(
低效
):
SELECT
?
DISTINCT
?DEPT_NO,DEPT_NAME ?
FROM
?DEPT D , EMP E
WHERE
?D.DEPT_NO = E.DEPT_NO
(
高效
):
SELECT
?DEPT_NO,DEPT_NAME ?
FROM
?DEPT D ?
WHERE
?
EXISTS ( SELECT
‘X'
FROM
?EMP E ?
WHERE
?E.DEPT_NO = D.DEPT_NO
)
;
(19)?
sql
語句用大寫的
;因為
oracle
總是先解析
sql
語句,把小寫的字母轉換成大寫的再執行
(20)?
在
java
代碼中盡量少用連接符“+”連接字符串!
(21)?
避免在索引列上使用
NOT
通常
,
我們要避免在索引列上使用
NOT, NOT
會產生在和在索引列上使用函數相同的
影響
.
當
ORACLE”
遇到
”NOT,
他就會停止使用索引轉而執行全表掃描
.
(22)?
避免在索引列上使用計算.
WHERE
子句中,如果索引列是函數的一部分.優化器將不使用索引而使用全表掃描.
舉例
:
低效:
SELECT … FROM ?DEPT ?WHERE SAL * 12 > 25000;
高效
:
SELECT … FROM DEPT WHERE SAL > 25000/12;
(23)?
用
>=
替代
>
高效
:
SELECT * FROM ?EMP ?WHERE ?DEPTNO >=4
低效
:
SELECT * FROM EMP WHERE DEPTNO >3
兩者的區別在于
,
前者
DBMS
將直接跳到第一個
DEPT
等于
4
的記錄而后者將首先定位到
DEPTNO=3
的記錄并且向前掃描到第一個
DEPT
大于
3
的記錄
.
(24)?
用
UNION
替換
OR (
適用于索引列
)
通常情況下
,
用
UNION
替換
WHERE
子句中的
OR
將會起到較好的效果
.
對索引列使用
OR
將造成全表掃描
.
注意
,
以上規則只針對多個索引列有效
.
如果有
column
沒有被索引
,
查詢效率可能會因為你沒有選擇
OR
而降低
.
在下面的例子中
, LOC_ID
和
REGION
上都建有索引
.
高效
:
SELECT
LOC_ID , LOC_DESC , REGION
FROM
LOCATION
WHERE
LOC_ID = 10
UNION
SELECT
LOC_ID , LOC_DESC , REGION
FROM
LOCATION
WHERE
REGION = “MELBOURNE”
低效
:
SELECT
LOC_ID , LOC_DESC , REGION
FROM
LOCATION
WHERE
LOC_ID = 10
OR
REGION = “MELBOURNE”
如果你堅持要用
OR,
那就需要返回記錄最少的索引列寫在最前面
.
(25)?
用
IN
來替換
OR ?
這是一條簡單易記的規則,但是實際的執行效果還須檢驗,在
ORACLE8i
下,兩者的執行路徑似乎是相同的.
低效
:
SELECT
….
FROM
LOCATION
WHERE
LOC_ID = 10
OR
LOC_ID = 20
OR
LOC_ID = 30
高效
SELECT
…
FROM
LOCATION
WHERE
LOC_IN ?
IN
(10,20,30);
(26)?
避免在索引列上使用
IS NULL
和
IS NOT NULL
避免在索引中使用任何可以為空的列,
ORACLE
將無法使用該索引
.對于單列索引,如果列包含空值,索引中將不存在此記錄
.
對于復合索引,如果每個列都為空,索引中同樣不存在此記錄
.
如果至少有一個列不為空,則記錄存在于索引中.
舉例
:
如果唯一性索引建立在表的
A
列和
B
列上
,
并且表中存在一條記錄的
A,B
值為
(123,null) , ORACLE
將不接受下一條具有相同
A,B
值(
123,null
)的記錄
(
插入
).
然而如果
所有的索引列都為空,
ORACLE
將認為整個鍵值為空而空不等于空
.
因此你可以插入
1000
條具有相同鍵值的記錄
,
當然它們都是空
!
因為空值不存在于索引列中
,
所以
WHERE
子句中對索引列進行空值比較將使
ORACLE
停用該索引
.
低效
: (
索引失效
)
SELECT
…
FROM
?DEPARTMENT ?
WHERE
?DEPT_CODE
IS NOT NULL
;
高效
: (
索引有效
)
SELECT
…
FROM
?DEPARTMENT ?
WHERE
?DEPT_CODE
>=
0;
(27)?
總是使用索引的第一個列
:
如果索引是建立在多個列上
,
只有在它的第一個列
(leading column)
被
where
子句引用時
,
優化器才會選擇使用該索引
.
這也是一條簡單而重要的規則,當僅引用索引的第二個列時
,
優化器使用了全表掃描而忽略了索引
(28)?
用
UNION-ALL
替換
UNION (
如果有可能的話
)
:
當
SQL
語句需要
UNION
兩個查詢結果集合時
,
這兩個結果集合會以
UNION-ALL
的方式被合并
,
然后在輸出最終結果前進行排序
.
如果用
UNION ALL
替代
UNION,
這樣排序就不是必要了
.
效率就會因此得到提高
.
需要注意的是
,
UNION ALL
將重復輸出兩個結果集合中相同記錄
.
因此各位還是
要從業務需求分析使用
UNION ALL
的可行性
. UNION
將對結果集合排序
,
這個操作會使用到
SORT_AREA_SIZE
這塊內存
.
對于這
塊內存的優化也是相當重要的
.
下面的
SQL
可以用來查詢排序的消耗量
低效:
SELECT
?ACCT_NUM, BALANCE_AMT
FROM
?DEBIT_TRANSACTIONS
WHERE
TRAN_DATE = '31-DEC-95'
UNION
SELECT
ACCT_NUM, BALANCE_AMT
FROM
DEBIT_TRANSACTIONS
WHERE
TRAN_DATE = '31-DEC-95'
高效
:
SELECT
ACCT_NUM, BALANCE_AMT
FROM
DEBIT_TRANSACTIONS
WHERE TRAN_DATE = '31-DEC-95'
UNION
ALL
SELECT
ACCT_NUM, BALANCE_AMT
FROM
DEBIT_TRANSACTIONS
WHERE
TRAN_DATE = '31-DEC-95'
(29)?
用
WHERE
替代
ORDER BY
:
ORDER BY
子句只在兩種嚴格的條件下使用索引
.
ORDER BY
中所有的列必須包含在相同的索引中并保持在索引中的排列順序
.
ORDER BY
中所有的列必須定義為非空
.
WHERE
子句使用的索引和
ORDER BY
子句中所使用的索引不能并列
.
例如
:
表
DEPT
包含以下列
:
DEPT_CODE PK NOT NULL
DEPT_DESC NOT NULL
DEPT_TYPE NULL
低效
: (
索引不被使用
)
SELECT
DEPT_CODE?
FROM
?DEPT ?
ORDER BY
?DEPT_TYPE
高效
: (
使用索引
)
SELECT
DEPT_CODE ?
FROM
?DEPT ?
WHERE
?DEPT_TYPE > 0
(30)?
避免改變索引列的類型
.:
當比較不同數據類型的數據時
, ORACLE
自動對列進行簡單的類型轉換
.
假設
EMPNO
是一個數值類型的索引列
.
SELECT
… ?
FROM
EMP ?
WHERE
?
EMPNO = ‘123'
實際上
,
經過
ORACLE
類型轉換
,
語句轉化為
:
SELECT
… ?
FROM
EMP ?WHERE
?EMPNO = TO_NUMBER(‘123')
幸運的是
,
類型轉換沒有發生在索引列上
,
索引的用途沒有被改變
.
現在
,
假設
EMP_TYPE
是一個字符類型的索引列
.
SELECT
… ?
FROM
EMP ?
WHERE
EMP_TYPE = 123
這個語句被
ORACLE
轉換為
:
SELECT
… ?
FROM
EMP ?
WHERE
TO_NUMBER(EMP_TYPE)=123
因為內部發生的類型轉換
,
這個索引將不會被用到
!
為了避免
ORACLE
對你的
SQL
進行隱式的類型轉換
,
最好把類型轉換用顯式表現出來
.
注意當字符和數值比較時
, ORACLE
會優先轉換數值類型到字符類型
(31)?
需要當心的
WHERE
子句
:
某些
SELECT
語句中的
WHERE
子句不使用索引
.
這里有一些例子
.
在下面的例子里
,
(1)
‘!='
將不使用索引
.
記住
,
索引只能告訴你什么存在于表中
,
而不能告訴你什么不存在于表中
.
(2)
‘||'
是
字符連接函數
.
就象其他函數那樣
,
停用了索引
.
(3)
‘+'
是數學函數
.
就象其他數學函數那樣
,
停用了索引
.
(4)
相同的索引列不能互相比較
,
這將會啟用全表掃描
.
(32)?
a.
如果檢索數據量超過
30%
的表中記錄數
.
使用索引將沒有顯著的效率提高
.
b.
在特定情況下
,
使用索引也許會比全表掃描慢
,
但這是同一個數量級上的區別
.
而通常情況下
,
使用索引比全表掃描要塊幾倍乃至幾千倍
!
(33)?
避免使用耗費資源的操作
:
帶有
DISTINCT,UNION,MINUS,INTERSECT,ORDER BY
的
SQL
語句會啟動
SQL
引擎
執行耗費資源的排序
(SORT)
功能
. DISTINCT
需要一次排序操作
,
而其他的至少需要執行兩次排序
.
通常
,
帶有
UNION, MINUS , INTERSECT
的
SQL
語句都可以用其他方式重寫
.
如果你的數據庫的
SORT_AREA_SIZE
調配得好
,
使用
UNION , MINUS, INTERSECT
也是可以考慮的
,
畢竟它們的可讀性很強
(34)?
優化
GROUP BY:
提高
GROUP BY
語句的效率
,
可以通過將不需要的記錄在
GROUP BY
之前過濾掉
.
下面兩個查詢返回相同結果但第二個明顯就快了許多
.
低效
:
SELECT JOB , AVG(SAL)
FROM EMP
GROUP
JOB
HAVING
JOB = ‘PRESIDENT'
OR
JOB = ‘MANAGER'
高效
:
SELECT JOB , AVG(SAL)
FROM EMP
WHERE JOB = ‘PRESIDENT'
OR JOB = ‘MANAGER'
GROUP
JOB