有很多人認為Hibernate天生效率比較低,確實,在普遍情況下,需要將執(zhí)行轉換為SQL語句的Hibernate的效率低于直接JDBC存取,然而,在經(jīng)過比較好的性能優(yōu)化之后,Hibernate的性能還是讓人相當滿意的,特別是應用二級緩存之后,甚至可以獲得比較不使用緩存的JDBC更好的性能,下面介紹一些通常的Hibernate的優(yōu)化策略:
1.抓取優(yōu)化
抓取是指Hibernate如何在關聯(lián)關系之間進行導航的時候,Hibernate如何獲取關聯(lián)對象的策略,其主要定義了兩個方面:如何抓取和何時抓取
1)如何抓取。
Hibernate3主要有兩種種抓取方式,分別應用于對象關聯(lián)實例(many-to-one、one-to-one)和對象關聯(lián)集合(set、map等),總共是四種變種
JOIN抓?。?nbsp;通過在SELECT語句中使用OUTER JOIN來獲得對象的關聯(lián)實例或者關聯(lián)集合)
SELECT抓?。?nbsp;另外發(fā)送一條SELECT語句來抓取當前對象的關聯(lián)實體和集合
在我的開發(fā)經(jīng)歷中,此處對性能的優(yōu)化是比較有限的,并不值得過多關注
例:
A.應用于對象關聯(lián)實例(默認是false)
<many-to-one name=".." outer-join="true/false/auto" .../>
B.應用于對象關聯(lián)集合(默認是auto)
<set name=".." fetch="join/select" ... >
....
</set>
2)何時抓取
主要分為延遲加載和立即抓取,默認的情況下Hibernate3對對象關聯(lián)實采用延遲加載,普通屬性采用立即抓取,通過延遲加載和采用適當?shù)淖ト×6?,與不采用優(yōu)化相比往往可以將性能提升數(shù)倍
立即抓?。寒斪ト∷拗鲗ο髸r,同時抓取其關聯(lián)對象和關聯(lián)集以及屬性
延遲加載:當抓取宿主對象時,并不抓取其關聯(lián)對象,而是當對其對象進行調用時才加載
例:
A.應用于對象關聯(lián)實例(默認是延遲加載)
<many-to-one name=".." lazy="true/false" .../>
B.應用于對象關聯(lián)集合(默認是延遲加載)
<set name=".." lazy="true/false" ... >
....
</set>
對于延遲加載,需要注意的時,對延遲對象的使用必須在Session關閉之前進行,Hibernate的LazyInitalizationException往往就是由于在Session的生命期外使用了延遲加載的對象。當我們進行Web開發(fā)時,可以使用OpenSessionInView模式,當請求開始時打開session,當請求響應結束時才關閉session,不過,在使用OpenSessionInView模式時,需要注意如果響應時間比較長(業(yè)務比較復雜或者客戶端是低速網(wǎng)絡),將Session資源(也就是數(shù)據(jù)庫的連接)占用太久的話可以會導致資源耗盡
3)抓取粒度
抓取粒度指的是對象在關聯(lián)關系之間被導航時一次預先加載的數(shù)量,Hibernate程序的性能比較差往往就在于沒有對抓取粒度仔細考慮,當加載一個列表并在列表中的每個對象中對其關聯(lián)進行導航時,往往導致N+1條SQL語句查詢。
例:
A.應用于對象關聯(lián)實例(默認為1),注意,對對象關聯(lián)實例的設置是在被關聯(lián)的對象之上的,譬如
class User
{
Group g;
}
那么抓取粒度應該在Group的配置文件之上,見下
<class name="Group" table="group" batch-size="..">
...
</class>
對該值并沒有一個約定俗成的值,根據(jù)情況而定,如果被關聯(lián)表數(shù)據(jù)比較少,則可以設置地小一些,3-20,如果比較大則可以設到30-50,注意的時候,并不是越多越好,當其值超過50之后,對性能并沒有多大改善但卻無謂地消耗內(nèi)存
假設有如下例子:
List<User> users = query.list();
如果有20個User,并對這20個User及其Group進行遍歷,如果不設置batch-size(即batch-size="1"),則在最糟糕的情況
下,需要1 + 20條SQL語句,如果設置batch-size="10",則最好的情況下只需要1 + 2條SQL語句
B.應用于對象關聯(lián)集合(默認為1)
<set name=".." batch-size="" ... >
....
</set>
2.二級緩存
Hibernate對數(shù)據(jù)的緩存包括兩個級:一級緩存,在Session的級別上進行,主要是對象緩存,以其id為鍵保存對象,在Session的生命期間存在;二級緩存,在SessionFactory的級別上進行,有對象緩存和查詢緩存,查詢緩存以查詢條件為鍵保存查詢結果,在SessionFactory的生命期間存在。默認地,Hibernate只啟用一級緩存,通過正確地使用二級緩存,往往可以獲得意想不到的性能。
1)對象緩存:
當抓取一個對象之后,Hiberate將其以id為鍵緩存起來,當下次碰到抓取id相同的對象時,可以使用如下配置
方法1:在緩存對象上配置
<class ...>
<cache useage="read-only/write/...." regions="group" />
</class>
useage表示使用什么類型的緩存,譬如只讀緩存、讀寫緩存等等(具體參見Hibernate參考指南),值得注意的時,有部分緩存在Hibernate的實現(xiàn)中不支持讀寫緩存,譬如JBossCache在Hibernate的實現(xiàn)中只是一種只讀緩存,具體緩存實現(xiàn)對緩存類型的支持情況,可以參見org.hibernate.cache包
regions表示緩存分塊,大部分的緩存實現(xiàn)往往對緩存進行分塊,該部分是可選的,詳細參見各緩存實現(xiàn)
方法2:在hibernate.cfg.xml中配置
<cache class=".." useage=".." regions=".."/>
我認為第二種更好,可以統(tǒng)一管理
2)查詢緩存
查詢時候將查詢結果以查詢條件為鍵保存起來,需要配置如下
A.在hibernate.cfg.xml中配置(啟用查詢緩存)
<property name="hibernate.cache.use_query_cache">true</property> (前面的屬性名可參見常量
org.hibernate.cfg.Enviroment.USE_QUERY_CACHE)
B.程序
query.setCacheable(true);
query.setCacheRegions(...);
需要注意的是,查詢緩存與對象緩存要結合更有效,因為查詢緩存僅緩存查詢結果列表的主鍵數(shù)據(jù)
一般情況下在開發(fā)中,對一些比較穩(wěn)定而又被頻繁引用的數(shù)據(jù),譬如數(shù)據(jù)字典之類的,將其進行二級緩存,對一些查詢條件和查詢數(shù)據(jù)變化不頻繁而又常常被使用的查詢,將其進行二級緩存。由于二級緩存是放在內(nèi)存中,而且Hibernate的緩存不是弱引用緩存(WeekReference),所以注意不要將大塊的數(shù)據(jù)放入其中,否則可能會被內(nèi)存造成比較大的壓力。
3.批量數(shù)據(jù)操作
當進行大批量數(shù)據(jù)操作(幾萬甚至幾十幾百萬)時,需要注意兩點,一,批量提交,二,及時清除不需要的一級緩存數(shù)據(jù)
1)所謂的批量提交,就是不要頻繁使用session的flush,每一次進行flush,Hibernate將PO數(shù)據(jù)于數(shù)據(jù)庫進行同步,對于海量級數(shù)據(jù)操作來說是性能災難(同時提交幾千條數(shù)據(jù)和提交一條數(shù)據(jù)flush一次性能差別可能會是幾十倍的差異)。一般將數(shù)據(jù)操作放在事務中,當事務提交時Hibernate自動幫你進行flush操作。
2)及時清除不需要的一級緩存數(shù)據(jù):由于Hibernate默認采用一級緩存,而在session的生命期間,所有數(shù)據(jù)抓取之后會放入一級緩存中,而當數(shù)據(jù)規(guī)模比較龐大時,抓取到內(nèi)存中的數(shù)據(jù)會讓內(nèi)存壓力非常大,一般分批操作數(shù)據(jù),被一次操作之后將一級緩存清除,譬如
session.clear(User.class)
4.雜項
dynamic-insert,dynamic-update,動態(tài)插入和動態(tài)更新,指的是讓Hibernate插入數(shù)據(jù)時僅插入非空數(shù)據(jù),當修改數(shù)據(jù)時只修改變化的數(shù)據(jù),譬如對于
class User
{
id
username
password
}
如果u.id=1, u.username="ayufox",u.password=null,那么如果不設置動態(tài)插入,則其sql語句是insert into users(id, username, password) values (1, 'ayufox', '),如果設置則其sql語句是insert into users(username) valeus('ayufox')
在如上的情況下,如果修改u.password='11',那么如果不設置動態(tài)更新,則sql語句為update users set username='ayufox', password='11' where id = 1,如果設置則為update user set password='11' where d = 1
設置是在class的映射文件中,如下
<class name="User" table="users" dynamic=insert="true/false" dynamic-update="true/false" ...>
</class>
該設置對性能的提升比較有限