很多的時(shí)侯,做Oracle
DBA的我們,當(dāng)應(yīng)用管理員向我們通告現(xiàn)在應(yīng)用很慢、數(shù)據(jù)庫(kù)很慢的時(shí)侯,我們到數(shù)據(jù)庫(kù)時(shí)做幾個(gè)示例的Select也發(fā)現(xiàn)同樣的問(wèn)題時(shí),有些時(shí)侯我們會(huì)無(wú)從
下手,因?yàn)槲覀冋J(rèn)為數(shù)據(jù)庫(kù)的各種命種率都是滿足Oracle文檔的建議。實(shí)際上如今的優(yōu)化己經(jīng)向優(yōu)化等待(waits)轉(zhuǎn)型了,實(shí)際中性能優(yōu)化最根本的出
現(xiàn)點(diǎn)也都集中在IO,這是影響性能最主要的方面,由系統(tǒng)中的等待去發(fā)現(xiàn)Oracle庫(kù)中的不足、操作系統(tǒng)某些資源利用的不合理是一個(gè)比較好的辦法,下面把
我的一點(diǎn)實(shí)踐經(jīng)驗(yàn)與大家分享一下,本文測(cè)重于Unix環(huán)境。
一、
通過(guò)操作系統(tǒng)的一些工具檢查系統(tǒng)的狀態(tài),比如CPU、內(nèi)存、交換、磁盤的利用率,根據(jù)經(jīng)驗(yàn)或與系統(tǒng)正常時(shí)的狀態(tài)相比對(duì),有時(shí)系統(tǒng)表面上看起來(lái)看空閑這也可
能不是一個(gè)正常的狀態(tài),因?yàn)閏pu可能正等待IO的完成。除此之外我們還應(yīng)觀注那些占用系統(tǒng)資源(cpu、內(nèi)存)的進(jìn)程。
1、如何檢查操作系統(tǒng)是否存在IO的問(wèn)題?使用的工具有sar,這是一個(gè)比較通用的工具。
Rp1#Sar -u 2 10
即每隔2秒檢察一次,共執(zhí)行20次,當(dāng)然這些都由你決定了。
示例返回:
HP-UX hpn2 B.11.00 U 9000/800 08/05/03
18:26:32 %usr %sys %wio %idle
18:26:34 80 9 12 0
18:26:36 78 11 11 0
18:26:38 78 9 13 1
18:26:40 81 10 9 1
18:26:42 75 10 14 0
18:26:44 76 8 15 0
18:26:46 80 9 10 1
18:26:48 78 11 11 0
18:26:50 79 10 10 0
18:26:52 81 10 9 0
Average 79 10 11 0
其中的%usr指的是用戶進(jìn)程使用的cpu資源的百分比,%sys指的是系統(tǒng)資源使用cpu資源的百分比,%wio指的是等待io完成的百分比,這是值得
我們觀注的一項(xiàng),%idle即空閑的百分比。如果wio列的值很大,如在35%以上,說(shuō)明你的系統(tǒng)的IO存在瓶頸,你的CPU花費(fèi)了很大的時(shí)間去等待IO
的完成。Idle很小說(shuō)明系統(tǒng)CPU很忙。像我的這個(gè)示例,可以看到wio平均值為11說(shuō)明io沒(méi)什么特別的問(wèn)題,而我的idle值為零,說(shuō)明我的cpu
已經(jīng)滿負(fù)荷運(yùn)行了。
當(dāng)你的系統(tǒng)存在IO的問(wèn)題,可以從以下幾個(gè)方面解決
*聯(lián)系相應(yīng)的操作系統(tǒng)的技術(shù)支持對(duì)這方面進(jìn)行優(yōu)化,比如hp-ux在劃定卷組時(shí)的條帶化等方面。
*查找Oracle中不合理的sql語(yǔ)句,對(duì)其進(jìn)行優(yōu)化
*對(duì)Oracle中訪問(wèn)量頻繁的表除合理建索引外,再就是把這些表分表空間存放以免訪問(wèn)上產(chǎn)生熱點(diǎn),再有就是對(duì)表合理分區(qū)。
2、關(guān)注一下內(nèi)存。
常用的工具便是vmstat,對(duì)于hp-unix來(lái)說(shuō)可以用glance,Aix來(lái)說(shuō)可以用topas,當(dāng)你發(fā)現(xiàn)vmstat中pi列非零,memory
中的free列的值很小,glance,topas中內(nèi)存的利用率多于80%時(shí),這時(shí)說(shuō)明你的內(nèi)存方面應(yīng)該調(diào)節(jié)一下了,方法大體有以下幾項(xiàng)。
*?jiǎng)澖oOracle使用的內(nèi)存不要超過(guò)系統(tǒng)內(nèi)存的1/2,一般保在系統(tǒng)內(nèi)存的40%為益。
為系統(tǒng)增加內(nèi)存
*如果你的連接特別多,可以使用MTS的方式
*打全補(bǔ)丁,防止內(nèi)存漏洞。
3、如何找到點(diǎn)用系用資源特別大的Oracle的session及其執(zhí)行的語(yǔ)句。
Hp-unix可以用glance,top
IBM AIX可以用topas
此外可以使用ps的命令。
通過(guò)這些程序我們可以找到點(diǎn)用系統(tǒng)資源特別大的這些進(jìn)程的進(jìn)程號(hào),我們就可以通過(guò)以下的sql語(yǔ)句發(fā)現(xiàn)這個(gè)pid正在執(zhí)行哪個(gè)sql,這個(gè)sql最好在
pl/sql developer,toad等軟件中執(zhí)行, 把<>中的spid換成你的spid就可以了。
SELECT a.username,
a.machine,
a.program,
a.sid,
a.serial#,
a.status,
c.piece,
c.sql_text
FROM v$session a,
v$process b,
v$sqltext c
WHERE b.spid=
AND b.addr=a.paddr
AND a.sql_address=c.address(+)
ORDER BY c.piece
我們就可以把得到的這個(gè)sql分析一下,看一下它的執(zhí)行計(jì)劃是否走索引,對(duì)其優(yōu)化避免全表掃描,以減少IO等待,從而加快語(yǔ)句的執(zhí)行速度。
提示:我在做優(yōu)化sql時(shí),經(jīng)常碰到使用in的語(yǔ)句,這時(shí)我們一定要用exists把它給換掉,因?yàn)镺racle在處理In時(shí)是按Or的方式做的,即使使用了索引也會(huì)很慢。
比如:
SELECT col1,col2,col3 FROM table1 a
WHERE a.col1 not in (SELECT col1 FROM table2)
可以換成:
SELECT col1,col2,col3 FROM table1 a
WHERE not exists
(SELECT 'x' FROM table2 b
WHERE a.col1=b.col1)
4、另一個(gè)有用的腳本:查找前十條性能差的sql.
SELECT * FROM
(
SELECT PARSING_USER_ID
EXECUTIONS,
SORTS,
COMMAND_TYPE,
DISK_READS,
sql_text
FROM v$sqlarea
ORDER BY disk_reads DESC
)
WHERE ROWNUM<10 ;
二、迅速發(fā)現(xiàn)Oracle Server的性能問(wèn)題的成因,我們可以求助于v$session_wait這個(gè)視圖,看系統(tǒng)的這些session在等什么,使用了多少的IO。以下是我提供的參考腳本:
腳本說(shuō)明:查看占io較大的正在運(yùn)行的session
SELECT se.sid,
se.serial#,
pr.SPID,
se.username,
se.status,
se.terminal,
se.program,
se.MODULE,
se.sql_address,
st.event,
st.p1text,
si.physical_reads,
si.block_changes
FROM v$session se,
v$session_wait st,
v$sess_io si,
v$process pr
WHERE st.sid=se.sid
AND st.sid=si.sid
AND se.PADDR=pr.ADDR
AND se.sid>6
AND st.wait_time=0
AND st.event NOT LIKE '%SQL%'
ORDER BY physical_reads DESC
對(duì)檢索出的結(jié)果的幾點(diǎn)說(shuō)明:
1、我是按每個(gè)正在等待的session已經(jīng)發(fā)生的物理讀排的序,因?yàn)樗c實(shí)際的IO相關(guān)。
2、你可以看一下這些等待的進(jìn)程都在忙什么,語(yǔ)句是否合理?
Select sql_address from v$session where sid= ;
Select * from v$sqltext where address= ;
執(zhí)行以上兩個(gè)語(yǔ)句便可以得到這個(gè)session的語(yǔ)句。
你也以用alter system kill session 'sid,serial#';把這個(gè)session殺掉。
3、應(yīng)觀注一下event這列,這是我們調(diào)優(yōu)的關(guān)鍵一列,下面對(duì)常出現(xiàn)的event做以簡(jiǎn)要的說(shuō)明:
a、
buffer busy waits,free buffer
waits這兩個(gè)參數(shù)所標(biāo)識(shí)是dbwr是否夠用的問(wèn)題,與IO很大相關(guān)的,當(dāng)v$session_wait中的free buffer
wait的條目很小或沒(méi)有的時(shí)侯,說(shuō)明你的系統(tǒng)的dbwr進(jìn)程決對(duì)夠用,不用調(diào)整;free buffer
wait的條目很多,你的系統(tǒng)感覺(jué)起來(lái)一定很慢,這時(shí)說(shuō)明你的dbwr已經(jīng)不夠用了,它產(chǎn)生的wio已經(jīng)成為你的數(shù)據(jù)庫(kù)性能的瓶頸,這時(shí)的解決辦法如下:
a.1增加寫進(jìn)程,同時(shí)要調(diào)整db_block_lru_latches參數(shù)
示例:修改或添加如下兩個(gè)參數(shù)
db_writer_processes=4
db_block_lru_latches=8
a、2開(kāi)異步IO,IBM這方面簡(jiǎn)單得多,hp則麻煩一些,可以與Hp工程師聯(lián)系。
b、db file sequential read,指的是順序讀,即全表掃描,這也是我們應(yīng)該盡量減少的部分,解決方法就是使用索引、sql調(diào)優(yōu),同時(shí)可以增大db_file_multiblock_read_count這個(gè)參數(shù)。
c、db file scattered read,這個(gè)參數(shù)指的是通過(guò)索引來(lái)讀取,同樣可以通過(guò)增加db_file_multiblock_read_count這個(gè)參數(shù)來(lái)提高性能。
d、latch free,與栓相關(guān)的了,需要專門調(diào)節(jié)。
e、其他參數(shù)可以不特別觀注。
結(jié)篇:匆忙之中寫下了這篇文章,希望能拋磚引玉,能為你的Oracle調(diào)優(yōu)實(shí)踐帶來(lái)幫助。