有很多人認為Hibernate天生效率比較低,確實,在普遍情況下,需要將執(zhí)行轉(zhuǎn)換為SQL語句的Hibernate的效率低于直接JDBC存取,然而,在經(jīng)過比較好的性能優(yōu)化之后,Hibernate的性能還是讓人相當(dāng)滿意的,特別是應(yīng)用二級緩存之后,甚至可以獲得比較不使用緩存的JDBC更好的性能,下面介紹一些通常的Hibernate的優(yōu)化策略:
    1.抓取優(yōu)化
    抓取是指Hibernate如何在關(guān)聯(lián)關(guān)系之間進行導(dǎo)航的時候,Hibernate如何獲取關(guān)聯(lián)對象的策略,其主要定義了兩個方面:如何抓取和何時抓取
    1)如何抓取。
    Hibernate3主要有兩種種抓取方式,分.應(yīng)用于對象關(guān)聯(lián)實例(many-to-one、one-to-one)和對象關(guān)聯(lián)集合(set、map等),總共是四種變種
    JOIN抓取: 通過在SELECT語句中使用OUTER JOIN來獲得對象的關(guān)聯(lián)實例或者關(guān)聯(lián)集合)
    SELECT抓取: 另外發(fā)送一條SELECT語句來抓取當(dāng)前對象的關(guān)聯(lián)實體和集合
    在我的開發(fā)經(jīng)歷中,此處對性能的優(yōu)化是比較有限的,并不值得過多關(guān)注
    例:
    A.>應(yīng)用于對象關(guān)聯(lián)實例(默認是false)
    <many-to-one name=".." outer-join="true/false/auto"  .../> 
    B.應(yīng)用于對象關(guān)聯(lián)集合(默認是auto)
    <set name=".." fetch="join/select" ... >
       ....
    </set>
    2)何時抓取
    主要分為延遲加載和立即抓取,默認的情況下Hibernate3對對象關(guān)聯(lián)實采用延遲加載,普通屬性采用立即抓取,通過延遲加載和采用適當(dāng)?shù)淖ト×6?,與不采用優(yōu)化相比往往可以將性能提升數(shù)倍
    立即抓取:當(dāng)抓取宿主對象時,同時抓取其關(guān)聯(lián)對象和關(guān)聯(lián)集以及屬性
    延遲加載:當(dāng)抓取宿主對象時,并不抓取其關(guān)聯(lián)對象,而是當(dāng)對其對象進行調(diào)用時才加載
    例:
    A.應(yīng)用于對象關(guān)聯(lián)實例(默認是延遲加載)
    <many-to-one name=".."  lazy="true/false" .../> 
    B.應(yīng)用于對象關(guān)聯(lián)集合(默認是延遲加載)
    <set name=".." lazy="true/false" ... >
       ....
    </set>
    對于延遲加載,需要注意的時,對延遲對象的使用必須在Session關(guān)閉之前進行,Hibernate的LazyInitalizationException往往就是由于在Session的生命期外使用了延遲加載的對象。當(dāng)我們進行Web開發(fā)時,可以使用OpenSessionInView模式,當(dāng)請求開始時打開session,當(dāng)請求響應(yīng)結(jié)束時才關(guān)閉session,不過,在使用OpenSessionInView模式時,需要注意如果響應(yīng)時間比較長(業(yè)務(wù)比較復(fù)雜或者客戶端是低速網(wǎng)絡(luò)),將Session資源(也就是數(shù)據(jù)庫的連接)占用太久的話可以會導(dǎo)致資源耗盡
    3)抓取粒度
    抓取粒度指的是對象在關(guān)聯(lián)關(guān)系之間被導(dǎo)航時一次預(yù)先加載的數(shù)量,Hibernate程序的性能比較差往往就在于沒有對抓取粒度仔細考慮,當(dāng)加載一個列表并在列表中的每個對象中對其關(guān)聯(lián)進行導(dǎo)航時,往往導(dǎo)致N+1條SQL語句查詢。
    例:
    A.應(yīng)用于對象關(guān)聯(lián)實例(默認為1),注意,對對象關(guān)聯(lián)實例的設(shè)置是在被關(guān)聯(lián)的對象之上的,譬如
    class User
    {
        Group g;
    }
    那么抓取粒度應(yīng)該在Group的配置文件之上,見下
    <class name="Group" table="group" batch-size="..">
        ...
    </class>
    對該值并沒有一個約定俗成的值,根據(jù)情況而定,如果被關(guān)聯(lián)表數(shù)據(jù)比較少,則可以設(shè)置地小一些,3-20,如果比較大則可以設(shè)到30-50,注意的時候,并不是越多越好,當(dāng)其值超過50之后,對性能并沒有多大改善但卻無謂地消耗內(nèi)存
    假設(shè)有如下例子:
       List<User> users = query.list();
    如果有20個User,并對這20個User及其Group進行遍歷,如果不設(shè)置batch-size(即batch-size="1"),則在最糟糕的情況
    下,需要1 + 20條SQL語句,如果設(shè)置batch-size="10",則最好的情況下只需要1 + 2條SQL語句
    B.應(yīng)用于對象關(guān)聯(lián)集合(默認為1)
    <set name=".." batch-size="" ... >
       ....
    </set>
    2.二級緩存
    Hibernate對數(shù)據(jù)的緩存包括兩個級:一級緩存,在Session的級別上進行,主要是對象緩存,以其id為鍵保存對象,在Session的生命期間存在;二級緩存,在SessionFactory的級別上進行,有對象緩存和查詢緩存,查詢緩存以查詢條件為鍵保存查詢結(jié)果,在SessionFactory的生命期間存在。默認地,Hibernate只啟用一級緩存,通過正確地使用二級緩存,往往可以獲得意想不到的性能。
    1)對象緩存:
    當(dāng)抓取一個對象之后,Hiberate將其以id為鍵緩存起來,當(dāng)下次碰到抓取id相同的對象時,可以使用如下配置
    方法1:在緩存對象上配置
    <class ...>
       <cache useage="read-only/write/...." regions="group" />
    </class>
    useage表示使用什么類型的緩存,譬如只讀緩存、讀寫緩存等等(具體參見Hibernate參考指南),值得注意的時,有部分緩存在Hibernate的實現(xiàn)中不支持讀寫緩存,譬如JBossCache在Hibernate的實現(xiàn)中只是一種只讀緩存,具體緩存實現(xiàn)對緩存類型的支持情況,可以參見org.hibernate.cache包
    regions表示緩存分塊,大部分的緩存實現(xiàn)往往對緩存進行分塊,該部分是可選的,詳細參見各緩存實現(xiàn)
    方法2:在hibernate.cfg.xml中配置
    <cache class=".." useage=".." regions=".."/>
    我認為第二種更好,可以統(tǒng)一管理
    2)查詢緩存
    查詢時候?qū)⒉樵兘Y(jié)果以查詢條件為鍵保存起來,需要配置如下
    A.在hibernate.cfg.xml中配置(啟用查詢緩存)
    <property name="hibernate.cache.use_query_cache">true</property>  (前面的屬性名可參見常量
org.hibernate.cfg.Enviroment.USE_QUERY_CACHE)
    B.程序
    query.setCacheable(true);
    query.setCacheRegions(...);
    需要注意的是,查詢緩存與對象緩存要結(jié)合更有效,因為查詢緩存僅緩存查詢結(jié)果列表的主鍵數(shù)據(jù)
    一般情況下在開發(fā)中,對一些比較穩(wěn)定而又被頻繁引用的數(shù)據(jù),譬如數(shù)據(jù)字典之類的,將其進行二級緩存,對一些查詢條件和查詢數(shù)據(jù)變化不頻繁而又常常被使用的查詢,將其進行二級緩存。由于二級緩存是放在內(nèi)存中,而且Hibernate的緩存不是弱引用緩存(WeekReference),所以注意不要將大塊的數(shù)據(jù)放入其中,否則可能會被內(nèi)存造成比較大的壓力。
    3.批量數(shù)據(jù)操作
    當(dāng)進行大批量數(shù)據(jù)操作(幾萬甚至幾十幾百萬)時,需要注意兩點,一,批量提交,二,及時清除不需要的一級緩存數(shù)據(jù)
    1)所謂的批量提交,就是不要頻繁使用session的flush,每一次進行flush,Hibernate將PO數(shù)據(jù)于數(shù)據(jù)庫進行同步,對于海量級數(shù)據(jù)操作來說是性能災(zāi)難(同時提交幾千條數(shù)據(jù)和提交一條數(shù)據(jù)flush一次性能差別可能會是幾十倍的差異)。一般將數(shù)據(jù)操作放在事務(wù)中,當(dāng)事務(wù)提交時Hibernate自動幫你進行flush操作。
    2)及時清除不需要的一級緩存數(shù)據(jù):由于Hibernate默認采用一級緩存,而在session的生命期間,所有數(shù)據(jù)抓取之后會放入一級緩存中,而當(dāng)數(shù)據(jù)規(guī)模比較龐大時,抓取到內(nèi)存中的數(shù)據(jù)會讓內(nèi)存壓力非常大,一般分批操作數(shù)據(jù),被一次操作之后將一級緩存清除,譬如
    session.clear(User.class)
    4.雜項
    dynamic-insert,dynamic-update,動態(tài)插入和動態(tài)更新,指的是讓Hibernate插入數(shù)據(jù)時僅插入非空數(shù)據(jù),當(dāng)修改數(shù)據(jù)時只修改變化的數(shù)據(jù),譬如對于 
    class User
    {
       id
       username
       password
    }
    如果u.id=1, u.username="ayufox",u.password=null,那么如果不設(shè)置動態(tài)插入,則其sql語句是insert into users(id, username, password) values (1, 'ayufox', '),如果設(shè)置則其sql語句是insert into users(username) valeus('ayufox')
    在如上的情況下,如果修改u.password='11',那么如果不設(shè)置動態(tài)更新,則sql語句為update users set username='ayufox', password='11' where id = 1,如果設(shè)置則為update user set password='11' where d = 1
    設(shè)置是在class的映射文件中,如下
    <class name="User" table="users" dynamic=insert="true/false" dynamic-update="true/false" ...>
    </class>
  該設(shè)置對性能的提升比較有限


------君臨天下,舍我其誰------