最近討論db shard的帖子比較多,感覺(jué)很多都是在參考hibernate shard的思路,但hibernate分表真的那么好嗎?我覺(jué)得它最少有2個(gè)問(wèn)題:
1. 改成shard后,代碼的API調(diào)用要變。代碼改動(dòng)很大。
2. 設(shè)計(jì)很復(fù)雜,不清晰,邏輯關(guān)系難以理解。
hibernate shard基本上就是為了shard而對(duì)hibernate做的增增補(bǔ)補(bǔ),湊合用還行,根本不具備設(shè)計(jì)上的參考價(jià)值。
對(duì)數(shù)據(jù)庫(kù)分切方面,到目前為止,我覺(jué)得還是guzz的設(shè)計(jì)最清晰,如果我說(shuō)的不對(duì),歡迎理性討論。不管您是否使用guzz,但是guzz在數(shù)據(jù)庫(kù)分切方面的設(shè)計(jì),對(duì)于清晰的設(shè)計(jì)模式,比hibernate shard更具有借鑒意義。
guzz垂直切分
垂直切分是指將不同的表分別存儲(chǔ)到不同的數(shù)據(jù)庫(kù)中。guzz默認(rèn)配置級(jí)支持,不需要寫任何代碼,可以在任何時(shí)候,在需要時(shí),將每張表存儲(chǔ)到自己?jiǎn)为?dú)的一組服務(wù)器上,應(yīng)該說(shuō)是垂直分切的極限了。而且設(shè)計(jì)上,無(wú)論什么時(shí)候怎么分切,都不需要你改動(dòng)代碼。開(kāi)發(fā)時(shí)你可以讓所有表在一個(gè)庫(kù)上;部署時(shí),分到多個(gè)庫(kù)上;以后業(yè)務(wù)增加了,再更加分散的放。
垂直分切簡(jiǎn)單配置方式:
1. 聲明你要用多少臺(tái)數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)之間什么關(guān)系。
- <dialect class="org.guzz.dialect.H2Dialect"></dialect>
- <dialect name="mysql5dialect" class="org.guzz.dialect.Mysql5Dialect" />
- <dialect name="oracle10gdialect" class="org.guzz.dialect.Oracle10gDialect" />
-
- <tran>
- <dbgroup name="default" masterDBConfigName="masterDB" />
- <dbgroup name="mysql" masterDBConfigName="masterDB" slaveDBConfigName="mysqlSlaveDB" dialectName="mysql5dialect" />
- <dbgroup name="oracle" masterDBConfigName="oracleDB" dialectName="oracle10gdialect" />
- </tran>
這里我們聲明了3組數(shù)據(jù)庫(kù),而且數(shù)據(jù)庫(kù)類型還不一樣。
2. 對(duì)每張表,配置應(yīng)該存儲(chǔ)到那個(gè)庫(kù)里
- <a-business dbgroup="default" name="filterWord" class="com.guzzservices.business.FilterWord" />
- <a-business dbgroup="mysql" name="filterWordGroup" class="com.guzzservices.business.FilterWordGroup" />
- <a-business dbgroup="oracle" name="configuration" class="com.guzzservices.business.Configuration" />
簡(jiǎn)單的配置,將三個(gè)對(duì)象分別存儲(chǔ)到3臺(tái)不同的數(shù)據(jù)庫(kù)中,完成垂直分切。
guzz水平切表
水平切表是指將一張大表,分切成許多小表。guzz的設(shè)計(jì)是當(dāng)需要水平分表時(shí),原先代碼不變,為每個(gè)需要分切的表編寫一個(gè)分表策略類,配置到系統(tǒng)中。然后在調(diào)用前,聲明分表策略即可。
整個(gè)過(guò)程只需要新寫一個(gè)類,在調(diào)用出增加一行代碼即可,對(duì)原始系統(tǒng)入侵非常小,風(fēng)險(xiǎn)可控。
流程總比hibernate shard要清晰很多,具體可以看http://code.google.com/p/guzz/wiki/TutorialShadowTable?wl=zh-Hans
數(shù)據(jù)庫(kù)主從分離
從垂直分切部分可以看到,guzz也是配置性的原生支持讀寫分離。如果需要增加從數(shù)據(jù)庫(kù),可以隨時(shí)加上,不需要改任何代碼。不需要改動(dòng)代碼,而且配置也不復(fù)雜,應(yīng)該算是設(shè)計(jì)上的極限了吧?
你只需要在dbgroup中增加一個(gè)屬性“slaveDBConfigName”,然后在一個(gè)properties文件中加上所有你需要的從數(shù)據(jù)庫(kù)連接池配置即可,從數(shù)據(jù)庫(kù)可以有許多臺(tái)。
這個(gè)hibernate shard根本就沒(méi)有涉及到。而且guzz允許程序控制讀寫庫(kù)選取,和proxy模式的中間件路由各有優(yōu)勢(shì),畢竟更加容易控制。如果你做過(guò)內(nèi)容提前審核再允許發(fā)布的系統(tǒng),就會(huì)明白proxy中間件解決不了全部問(wèn)題,有些讀操作不允許延遲,只能讀主庫(kù),而是也是讀事務(wù),proxy中間件會(huì)很尷尬。
異構(gòu)數(shù)據(jù)庫(kù)
這個(gè)hibernate以及ibatis之類的更沒(méi)有了。而且也是對(duì)應(yīng)用透明的,你可以隨時(shí)選擇增加一種數(shù)據(jù)庫(kù),然后把某些表放到上面,如增加一個(gè)H2做應(yīng)用端緩存數(shù)據(jù)庫(kù),自己完成類似Timesten + oracle的架構(gòu)。
配置方式在上面的垂直分切小節(jié)也可以看到。
數(shù)據(jù)庫(kù)連接池配置
隨著表垂直和水平切分的進(jìn)行,數(shù)據(jù)庫(kù)會(huì)越來(lái)越多,數(shù)據(jù)源配置也會(huì)越來(lái)越多。guzz的設(shè)計(jì)是配置分組管理,類似Mysql的配置文件。每個(gè)數(shù)據(jù)源配置都在一個(gè)組內(nèi),無(wú)論增加多少都清晰了然,不會(huì)名字相互沖突。
示例:
- [masterDB]
- guzz.identifer=blogMasterDB
- guzz.IP=localhost
- guzz.maxLoad=120
- driverClass=com.mysql.jdbc.Driver
- jdbcUrl=jdbc:mysql://localhost:3306/blog?useUnicode=true&characterEncoding=UTF-8&useServerPrepStmts=true
- user=root
- password=root
- acquireIncrement=10
- idleConnectionTestPeriod=60
-
- [updateMasterDB]
- guzz.identifer=incUpdateDB1
- guzz.IP=localhost
- guzz.maxLoad=20
- driverClass=com.mysql.jdbc.Driver
- jdbcUrl=jdbc:mysql://localhost:3306/guzzSlowUpdate?useUnicode=true&characterEncoding=UTF-8
- user=slowupdate
- password=slowupdate
- acquireIncrement=10
- idleConnectionTestPeriod=60
-
- [logMasterDB]
- ....
如果一些數(shù)據(jù)庫(kù)對(duì)某些連接池支持更好,guzz設(shè)計(jì)上還允許為不同的數(shù)據(jù)源指定不同的連接池實(shí)現(xiàn)。
如果您需要分表,還是放棄hibernate shard或ibatis的設(shè)計(jì)模式吧,哪些只是臨時(shí)拼湊出來(lái)的東西,設(shè)計(jì)上根本就不怎么樣!
|