在過(guò)去的十年中, Oracle 已經(jīng)成為世界上最專業(yè)的數(shù)據(jù)庫(kù)之一。對(duì)于 IT 專家來(lái)說(shuō),就是要確保利用 Oracle 的強(qiáng)大特性來(lái)提高他們公司的生產(chǎn)力。最有效的方法之一是通過(guò) Oracle 調(diào)優(yōu)。它有大量的調(diào)整參數(shù)和技術(shù)來(lái)改進(jìn)你的 Oracle 數(shù)據(jù)庫(kù)的性能。
Oracle 調(diào)優(yōu)是一個(gè)復(fù)雜的主題。關(guān)于調(diào)優(yōu)可以寫整整一本書,不過(guò),為了改善 Oracle 數(shù)據(jù)庫(kù)的性能,有一些基本的概念是每個(gè) Oracle DBA 都應(yīng)該遵從的。
在這篇簡(jiǎn)介中,我們將簡(jiǎn)要地介紹以下的 Oracle 主題:
-- 外部調(diào)整:我們應(yīng)該記住 Oracle 并不是單獨(dú)運(yùn)行的。因此我們將查看一下通過(guò)調(diào)整 Oracle 服務(wù)器以得到高的性能。
--Row re-sequencing 以減少磁盤 I/O :我們應(yīng)該懂得 Oracle 調(diào)優(yōu)最重要的目標(biāo)是減少 I/O 。
--Oracle SQL 調(diào)整。 Oracle SQL 調(diào)整是 Oracle 調(diào)整中最重要的領(lǐng)域之一,只要通過(guò)一些簡(jiǎn)單的 SQL 調(diào)優(yōu)規(guī)則就可以大幅度地提升 SQL 語(yǔ)句的性能,這是一點(diǎn)都不奇怪的。
-- 調(diào)整 Oracle 排序:排序?qū)τ?Oracle 性能也是有很大影響的。
-- 調(diào)整 Oracle 的競(jìng)爭(zhēng):表和索引的參數(shù)設(shè)置對(duì)于 UPDATE 和 INSERT 的性能有很大的影響。
我們首先從調(diào)整 Oracle 外部的環(huán)境開始。如果內(nèi)存和 CPU 的資源不足的話,任何的 Oracle 調(diào)整都是沒(méi)有幫助的。
外部的性能問(wèn)題
Oracle 并不是單獨(dú)運(yùn)行的。 Oracle 數(shù)據(jù)庫(kù)的性能和外部的環(huán)境有很大的關(guān)系。這些外部的條件包括有:
. CPU--CPU 資源的不足令查詢變慢。當(dāng)查詢超過(guò)了 Oracle 服務(wù)器的 CPU 性能時(shí),你的數(shù)據(jù)庫(kù)性能就受到 CPU 的限制。
.內(nèi)存 -- 可用于 Oralce 的內(nèi)存數(shù)量也會(huì)影響 SQL 的性能,特別是在數(shù)據(jù)緩沖和內(nèi)存排序方面。
.網(wǎng)絡(luò) -- 大量的 Net8 通信令 SQL 的性能變慢。
許多新手都錯(cuò)誤的認(rèn)為應(yīng)該首先調(diào)整 Oracle 數(shù)據(jù)庫(kù),而不是先確認(rèn)外部資源是否足夠。實(shí)際上,如果外部環(huán)境出現(xiàn)瓶頸,再多的 Oracle 調(diào)整都是沒(méi)有幫助的。
在檢查 Oracle 的外部環(huán)境時(shí),有兩個(gè)方面是需要注意的:
1 、當(dāng)運(yùn)行隊(duì)列的數(shù)目超過(guò)服務(wù)器的 CPU 數(shù)量時(shí),服務(wù)器的性能就會(huì)受到 CPU 的限制。補(bǔ)救的方法是為服務(wù)器增加額外的 CPU 或者關(guān)閉需要很多處理資源的組件,例如 Oracle Parallel Query 。
2 、內(nèi)存分頁(yè)。當(dāng)內(nèi)存分頁(yè)時(shí),內(nèi)存容量已經(jīng)不足,而內(nèi)存頁(yè)是與磁盤上的交換區(qū)進(jìn)行交互的。補(bǔ)救的方法是增加更多的內(nèi)存,減少 Oracle SGA 的大小,或者關(guān)閉 Oracle 的多線程服務(wù)器。
可以使用各種標(biāo)準(zhǔn)的服務(wù)器工具來(lái)得到服務(wù)器的統(tǒng)計(jì)數(shù)據(jù),例如 vmstat,glance,top 和 sar 。 DBA 的目標(biāo)是確保數(shù)據(jù)庫(kù)服務(wù)器擁有足夠的 CPU 和內(nèi)存資源來(lái)處理 Oracle 的請(qǐng)求。
以下讓我們來(lái)看一下 Oracle 的 row-resequencing 是如何能夠極大地減少磁盤 I/O 的。
Row-resequencing (行的重新排序)
就象我們上面提到的,有經(jīng)驗(yàn)的 Oracle DBA 都知道 I/O 是響應(yīng)時(shí)間的最大組成部分。其中磁盤 I/O 特別厲害,因?yàn)楫?dāng) Oracle 由磁盤上的一個(gè)數(shù)據(jù)文件得到一個(gè)數(shù)據(jù)塊時(shí),讀的進(jìn)程就必須等待物理 I/O 操作完成。磁盤操作要比數(shù)據(jù)緩沖慢 10,000 倍。因此,如果可以令 I/O 最小化,或者減少由于磁盤上的文件競(jìng)爭(zhēng)而帶來(lái)的瓶頸,就可以大大地改善 Oracle 數(shù)據(jù)庫(kù)的性能。
如果系統(tǒng)響應(yīng)很慢,通過(guò)減少磁盤 I/O 就可以有一個(gè)很快的改善。如果在一個(gè)事務(wù)中通過(guò)按一定的范圍搜索 primary-key 索引來(lái)訪問(wèn)表,那么重新以 CTAS 的方法組織表將是你減少 I/O 的首要策略。通過(guò)在物理上將行排序?yàn)楹?primary-key 索引一樣的順序,就可以加快獲得數(shù)據(jù)的速度。
就象磁盤的負(fù)載平衡一樣,行的重新排序也是很簡(jiǎn)單的,而且也很快。通過(guò)與其它的 DBA 管理技巧一起使用,就可以在高 I/O 的系統(tǒng)中大大地減少響應(yīng)的時(shí)間。
在高容量的在線事務(wù)處理環(huán)境中( online transaction processing , OLTP ),數(shù)據(jù)是由一個(gè) primary 索引得到的,重新排序表格的行就可以令連續(xù)塊的順序和它們的 primary 索引一樣,這樣就可以在索引驅(qū)動(dòng)的表格查詢中,減少物理 I/O 并且改善響應(yīng)時(shí)間。這個(gè)技巧僅在應(yīng)用選擇多行的時(shí)候有用,或者在使用索引范圍搜索和應(yīng)用發(fā)出多個(gè)查詢來(lái)得到連續(xù)的 key 時(shí)有效。對(duì)于隨機(jī)的唯一 primary-key (主鍵)的訪問(wèn)將不會(huì)由行重新排序中得到好處。
讓我們看一下它是如何工作的。考慮以下的一個(gè) SQL 的查詢,它使用一個(gè)索引來(lái)得到 100 行:
selectsalaryfromemployeewherelast_name like 'B%';
這個(gè)查詢將會(huì)使用 last_name_index ,搜索其中的每一行來(lái)得到目標(biāo)行。這個(gè)查詢將會(huì)至少使用 100 次物理磁盤的讀取,因?yàn)?employee 的行存放在不同的數(shù)據(jù)塊中。
不過(guò),如果表中的行已經(jīng)重新排序?yàn)楹?last_name_index 的一樣,同樣的查詢又會(huì)怎樣處理呢?我們可以看到這個(gè)查詢只需要三次的磁盤 I/O 就讀完全部 100 個(gè)員工的資料(一次用作索引的讀取,兩次用作數(shù)據(jù)塊的讀取),減少了 97 次的塊讀取。
重新排序帶來(lái)的性能改善的程度在于在你開始的時(shí)候行的亂序性如何,以及你需要由序列中訪問(wèn)多少行。至于一個(gè)表中的行與索引的排序鍵的匹配程度,可以查看數(shù)據(jù)字典中的 dba_indexes 和 dba_tables 視圖得到。
在 dba_indexes 的視圖中,查看 clustering_factor 列。如果 clustering_factor 的值和表中的塊數(shù)目大致一樣,那么你的表和索引的順序是一樣的。不過(guò),如果 clustering_factor 的值接近表中的行數(shù)目,那就表明表格中的行和索引的順序是不一樣的。
行重新排序的作用是不可以小看的。在需要進(jìn)行大范圍的索引搜索的大表中,行重新排序可以令查詢的性能提高三倍。
一旦你已經(jīng)決定重新排序表中的行,你可以使用以下的工具之一來(lái)重新組織表格。
. 使用 Oracle 的 Create Table As Select (CTAS) 語(yǔ)法來(lái)拷貝表格
. Oracle9i 自帶的表格重新組織工具
以下,我們來(lái)看以下 SQL 語(yǔ)句的調(diào)優(yōu)。
SQL 調(diào)優(yōu)
Oracle 的 SQL 調(diào)優(yōu)是一個(gè)復(fù)雜的主題,甚至是需要整本書來(lái)介紹 Oracle SQL 調(diào)優(yōu)的細(xì)微差別。不過(guò)有一些基本的規(guī)則是每個(gè) Oracle DBA 都需要跟從的,這些規(guī)則可以改善他們系統(tǒng)的性能。 SQL 調(diào)優(yōu)的目標(biāo)是簡(jiǎn)單的:
. 消除不必要的大表全表搜索:不必要的全表搜索導(dǎo)致大量不必要的 I/O ,從而拖慢整個(gè)數(shù)據(jù)庫(kù)的性能。調(diào)優(yōu)專家首先會(huì)根據(jù)查詢返回的行數(shù)目來(lái)評(píng)價(jià) SQL 。在一個(gè)有序的表中,如果查詢返回少于 40% 的行,或者在一個(gè)無(wú)序的表中,返回少于 7% 的行,那么這個(gè)查詢都可以調(diào)整為使用一個(gè)索引來(lái)代替全表搜索。對(duì)于不必要的全表搜索來(lái)說(shuō),最常見的調(diào)優(yōu)方法是增加索引。可以在表中加入標(biāo)準(zhǔn)的 B 樹索引,也可以加入 bitmap 和基于函數(shù)的索引。要決定是否消除一個(gè)全表搜索,你可以仔細(xì)檢查索引搜索的 I/O 開銷和全表搜索的開銷,它們的開銷和數(shù)據(jù)塊的讀取和可能的并行執(zhí)行有關(guān),并將兩者作對(duì)比。在一些情況下,一些不必要的全表搜索的消除可以通過(guò)強(qiáng)制使用一個(gè) index 來(lái)達(dá)到,只需要在 SQL 語(yǔ)句中加入一個(gè)索引的提示就可以了。
. 在全表搜索是一個(gè)最快的訪問(wèn)方法時(shí),將小表的全表搜索放到緩存中,調(diào)優(yōu)專家應(yīng)該確保有一個(gè)專門的數(shù)據(jù)緩沖用作行緩沖。在 Oracle7 中,你可以使用 alter table xxx cache 語(yǔ)句,在 Oracle8 或以上,小表可以被強(qiáng)制為放到 KEEP 池中緩沖。
. 確保最優(yōu)的索引使用 :對(duì)于改善查詢的速度,這是特別重要的。有時(shí) Oracle 可以選擇多個(gè)索引來(lái)進(jìn)行查詢,調(diào)優(yōu)專家必須檢查每個(gè)索引并且確保 Oracle 使用正確的索引。它還包括 bitmap 和基于函數(shù)的索引的使用。
. 確保最優(yōu)的 JOIN 操作:有些查詢使用 NESTED LOOP join 快一些,有些則是 HASH join 快一些,另外一些則是 sort-merge join 更快。
這些規(guī)則看來(lái)簡(jiǎn)單,不過(guò)它們占 SQL 調(diào)優(yōu)任務(wù)的 90% ,并且它們也無(wú)需完全懂得 Oracle SQL 的內(nèi)部運(yùn)作。以下我們來(lái)簡(jiǎn)單概覽以下 Oracle SQL 的優(yōu)化。
我們首先簡(jiǎn)要查看 Oracle 的排序,并且看一看排序操作是如何影響性能的。
調(diào)整 Oracle 的排序操作
排序是 SQL 語(yǔ)法中一個(gè)小的方面,但很重要,在 Oracle 的調(diào)整中,它常常被忽略。當(dāng)使用 create index 、 ORDER BY 或者 GROUP BY 的語(yǔ)句時(shí), Oracle 數(shù)據(jù)庫(kù)將會(huì)自動(dòng)執(zhí)行排序的操作。通常,在以下的情況下 Oracle 會(huì)進(jìn)行排序的操作:
使用 Order by 的 SQL 語(yǔ)句
使用 Group by 的 SQL 語(yǔ)句
在創(chuàng)建索引的時(shí)候
進(jìn)行 table join 時(shí),由于現(xiàn)有索引的不足而導(dǎo)致 SQL 優(yōu)化器調(diào)用 MERGE SORT
當(dāng)與 Oracle 建立起一個(gè) session 時(shí),在內(nèi)存中就會(huì)為該 session 分配一個(gè)私有的排序區(qū)域。如果該連接是一個(gè)專用的連接 (dedicated connection) ,那么就會(huì)根據(jù) init.ora 中 sort_area_size 參數(shù)的大小在內(nèi)存中分配一個(gè) Program Global Area (PGA) 。如果連接是通過(guò)多線程服務(wù)器建立的,那么排序的空間就在 large_pool 中分配。不幸的是,對(duì)于所有的 session ,用做排序的內(nèi)存量都必須是一樣的,我們不能為需要更大排序的操作分配額外的排序區(qū)域。因此,設(shè)計(jì)者必須作出一個(gè)平衡,在分配足夠的排序區(qū)域以避免發(fā)生大的排序任務(wù)時(shí)出現(xiàn)磁盤排序( disk sorts )的同時(shí),對(duì)于那些并不需要進(jìn)行很大排序的任務(wù),就會(huì)出現(xiàn)一些浪費(fèi)。當(dāng)然,當(dāng)排序的空間需求超出了 sort_area_size 的大小時(shí),這時(shí)將會(huì)在 TEMP 表空間中分頁(yè)進(jìn)行磁盤排序。磁盤排序要比內(nèi)存排序大概慢 14,000 倍。
上面我們已經(jīng)提到,私有排序區(qū)域的大小是有 init.ora 中的 sort_area_size 參數(shù)決定的。每個(gè)排序所占用的大小由 init.ora 中的 sort_area_retained_size 參數(shù)決定。當(dāng)排序不能在分配的空間中完成時(shí),就會(huì)使用磁盤排序的方式,即在 Oracle 實(shí)例中的臨時(shí)表空間中進(jìn)行。
磁盤排序的開銷是很大的,有幾個(gè)方面的原因。首先,和內(nèi)存排序相比較,它們特別慢;而且磁盤排序會(huì)消耗臨時(shí)表空間中的資源。 Oracle 還必須分配緩沖池塊來(lái)保持臨時(shí)表空間中的塊。無(wú)論什么時(shí)候,內(nèi)存排序都比磁盤排序好,磁盤排序?qū)?huì)令任務(wù)變慢,并且會(huì)影響 Oracle 實(shí)例的當(dāng)前任務(wù)的執(zhí)行。還有,過(guò)多的磁盤排序?qū)?huì)令 free buffer waits 的值變高,從而令其它任務(wù)的數(shù)據(jù)塊由緩沖中移走。
接著,讓我們看一下 Oracle 的競(jìng)爭(zhēng),并且看一下表的存儲(chǔ)參數(shù)的設(shè)置是如何影響 SQL UPDATE 和 INSERT 語(yǔ)句的性能的。
調(diào)整 Oracle 的競(jìng)爭(zhēng)
Oracle 的其中一個(gè)優(yōu)點(diǎn)時(shí)它可以管理每個(gè)表空間中的自由空間。 Oracle 負(fù)責(zé)處理表和索引的空間管理,這樣就可以讓我們無(wú)需懂得 Oracle 的表和索引的內(nèi)部運(yùn)作。不過(guò),對(duì)于有經(jīng)驗(yàn)的 Oracle 調(diào)優(yōu)專家來(lái)說(shuō),他需要懂得 Oracle 是如何管理表的 extent 和空閑的數(shù)據(jù)塊。對(duì)于調(diào)整擁有高的 insert 或者 update 的系統(tǒng)來(lái)說(shuō),這是非常重要的。
要精通對(duì)象的調(diào)整,你需要懂得 freelists 和 freelist 組的行為,它們和 pctfree 及 pctused 參數(shù)的值有關(guān)。這些知識(shí)對(duì)于企業(yè)資源計(jì)劃( ERP )的應(yīng)用是特別重要的,因?yàn)樵谶@些應(yīng)用中,不正確的表設(shè)置通常是 DML 語(yǔ)句執(zhí)行慢的原因。
對(duì)于初學(xué)者來(lái)說(shuō),最常見的錯(cuò)誤是認(rèn)為默認(rèn)的 Oracle 參數(shù)對(duì)于所有的對(duì)象都是最佳的。除非磁盤的消耗不是一個(gè)問(wèn)題,否則在設(shè)置表的 pctfree 和 pctused 參數(shù)時(shí),就必須考慮平均的行長(zhǎng)和數(shù)據(jù)庫(kù)的塊大小,這樣空的塊才會(huì)被有效地放到 freelists 中。當(dāng)這些設(shè)置不正確時(shí),那些得到的 freelists 也是 "read" 塊,因?yàn)樗鼈儧](méi)有足夠的空間來(lái)存儲(chǔ)一行,這樣將會(huì)導(dǎo)致明顯的處理延遲。
Freelists 對(duì)于有效地重新使用 Oracle 表空間中的空間是很重要的,它和 pctfree 及 pctused 這兩個(gè)存儲(chǔ)參數(shù)的設(shè)置直接相關(guān)。通過(guò)將 pctused 設(shè)置為一個(gè)高的值,這時(shí)數(shù)據(jù)庫(kù)就會(huì)盡快地重新使用塊。不過(guò),高性能和有效地重新使用表的塊是對(duì)立的。在調(diào)整 Oracle 的表格和索引時(shí),需要認(rèn)真考慮究竟需要高性能還是有效的空間重用,并且據(jù)此來(lái)設(shè)置表的參數(shù)。以下我們來(lái)看一下這些 freelists 是如何影響 Oracle 的性能的。
當(dāng)有一個(gè)請(qǐng)求需要插入一行到表格中時(shí), Oracle 就會(huì)到 freelist 中尋找一個(gè)有足夠的空間來(lái)容納一行的塊。你也許知道, freelist 串是放在表格或者索引的第一個(gè)塊中,這個(gè)塊也被稱為段頭( segment header )。 pctfree 和 pctused 參數(shù)的唯一目的就是為了控制塊如何在 freelists 中進(jìn)出。雖然 freelist link 和 unlink 是簡(jiǎn)單的 Oracle 功能,不過(guò)設(shè)置 freelist link (pctused) 和 unlink (pctfree) 對(duì) Oracle 的性能確實(shí)有影響。
由 DBA 的基本知識(shí)知道, pctfree 參數(shù)是控制 freelist un-links 的(即將塊由 freelists 中移除)。設(shè)置 pctfree=10 意味著每個(gè)塊都保留 10% 的空間用作行擴(kuò)展。 pctused 參數(shù)是控制 freelist re-links 的。設(shè)置 pctused=40 意味著只有在塊的使用低于 40% 時(shí)才會(huì)回到表格的 freelists 中。
許多新手對(duì)于一個(gè)塊重新回到 freelists 后的處理都有些誤解。其實(shí),一旦由于一個(gè)刪除的操作而令塊被重新加入到 freelist 中,它將會(huì)一直保留在 freelist 中即使空間的使用超過(guò)了 60% ,只有在到達(dá) pctfree 時(shí)才會(huì)將數(shù)據(jù)塊由 freelist 中移走。
表格和索引存儲(chǔ)參數(shù)設(shè)置的要求總結(jié)
以下的一些規(guī)則是用來(lái)設(shè)置 freelists, freelist groups, pctfree 和 pctused 存儲(chǔ)參數(shù)的。你也知道, pctused 和 pctfree 的值是可以很容易地通過(guò) alter table 命令修改的,一個(gè)好的 DBA 應(yīng)該知道如何設(shè)置這些參數(shù)的最佳值。
有效地使用空間和高性能之間是有矛盾的,而表格的存儲(chǔ)參數(shù)就是控制這個(gè)方面的矛盾:
. 對(duì)于需要有效地重新使用空間,可以設(shè)置一個(gè)高的 pctused 值,不過(guò)副作用是需要額外的 I/O 。一個(gè)高的 pctused 值意味著相對(duì)滿的塊都會(huì)放到 freelist 中。因此,這些塊在再次滿之前只可以接受幾行記錄,從而導(dǎo)致更多的 I/O 。
. 追求高性能的話,可以將 pctused 設(shè)置為一個(gè)低的值,這意味著 Oracle 不會(huì)將數(shù)據(jù)塊放到 freelists 中直到它幾乎是空的。那么塊將可以在滿之前接收更多的行,因此可以減少插入操作的 I/O 。要記住 Oracle 擴(kuò)展新塊的性能要比重新使用現(xiàn)有的塊高。對(duì)于 Oracle 來(lái)說(shuō),擴(kuò)展一個(gè)表比管理 freelists 消耗更少的資源。
讓我們來(lái)回顧一下設(shè)置對(duì)象存儲(chǔ)參數(shù)的一些常見規(guī)則:
.經(jīng)常將 pctused 設(shè)置為可以接收一條新行。對(duì)于不能接受一行的 free blocks 對(duì)于我們來(lái)說(shuō)是沒(méi)有用的。如果這樣做,將會(huì)令 Oracle 的性能變慢,因?yàn)?Oracle 將在擴(kuò)展表來(lái)得到一個(gè)空的塊之前,企圖讀取 5 個(gè) "read" 的 free block 。
.表格中 chained rows 的出現(xiàn)意味著 pctfree 太低或者是 db_block_size 太少。在很多情況下, RAW 和 LONG RAW 列都很巨大,以至超過(guò)了 Oracle 的最大塊的大小,這時(shí) chained rows 是不可以避免的。
.如果一個(gè)表有同時(shí)插入的 SQL 語(yǔ)句,那么它需要有同時(shí)刪除的語(yǔ)句。運(yùn)行單一個(gè)一個(gè)清除的工作將會(huì)把全部的空閑塊放到一個(gè) freelist 中,而沒(méi)有其它包含有任何空閑塊的 freelists 出現(xiàn)。
. freelist 參數(shù)應(yīng)該設(shè)置為表格同時(shí)更新的最大值。例如,如果在任何時(shí)候,某個(gè)表最多有 20 個(gè)用戶執(zhí)行插入的操作,那么該表的參數(shù)應(yīng)該設(shè)置為 freelists=20 。
應(yīng)記住的是 freelist groups 參數(shù)的值只是對(duì)于 Oracle Parallel Server 和 Real Application Clusters 才是有用的。對(duì)于這類 Oracle , freelist groups 應(yīng)該設(shè)置為訪問(wèn)該表格的 Oracle Parallel Server 實(shí)例的數(shù)目。
posted on 2008-07-27 23:43
Ken.Lee 閱讀(1631)
評(píng)論(1) 編輯 收藏 所屬分類:
數(shù)據(jù)庫(kù)