<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    2008年9月16日 #

    java 數(shù)據(jù)庫(kù)緩沖池 使用c3p0

    c3p0很容易使用的開(kāi)源專(zhuān)業(yè)級(jí)jdbc數(shù)據(jù)庫(kù)緩沖池。
    它是sourceforge上的一個(gè)開(kāi)源項(xiàng)目,
    項(xiàng)目在
    http://sourceforge.net/projects/c3p0
    他的眾多特性這里就不一一介紹了。
    比較爽的一點(diǎn)就是
    當(dāng)Connection歸還緩沖池時(shí),c3p0會(huì)很小心的關(guān)閉
    這條連接打開(kāi)的Statement和ResultSet,免去了使用時(shí)
    自己動(dòng)手小心翼翼的關(guān)閉。

    c3p0使用非常簡(jiǎn)單,這里給一個(gè)例子

    package common.db;

    import java.sql.Connection;
    import java.sql.SQLException;
    import java.util.Properties;


    import com.mchange.v2.c3p0.ComboPooledDataSource;
    import com.mchange.v2.c3p0.DataSources;

    public final class ConnectionManager {
    ?private static ConnectionManager instance;
    ?
    ?public ComboPooledDataSource ds;
    ?private static String c3p0Properties="c3p0.properties";
    ?
    ?private ConnectionManager() throws Exception {
    ??Properties p = new Properties();
    ??p.load(this.getClass().getResourceAsStream(c3p0Properties));
    ??ds = new ComboPooledDataSource();
    ?}
    ?
    ?public static final ConnectionManager getInstance() {
    ??if (instance == null) {
    ???try {
    ????instance = new ConnectionManager();
    ???} catch (Exception e) {
    ????e.printStackTrace();
    ???}
    ??}
    ??return instance;
    ?}
    ?
    ?public synchronized final Connection getConnection() {
    ??try {
    ???return ds.getConnection();
    ??} catch (SQLException e) {
    ???e.printStackTrace();
    ??}
    ??return null;
    ?}

    ?protected void finalize() throws Throwable {
    ??DataSources.destroy(ds);?//關(guān)閉datasource
    ??super.finalize();
    ?}
    ?
    }

    然后在ConnectionManager類(lèi)的目錄下再創(chuàng)建一個(gè)配置文件c3p0.properties
    內(nèi)容如下:
    #db login parameters
    driverClass=com.mysql.jdbc.Driver
    jdbcUrl=jdbc:mysql://localhost/test?useUnicode=no&characterEncoding=GBK
    user=test
    password=test

    #pool parameters
    initialPoolSize=2
    maxPoolSize=5
    #maxIdleTime=10
    #idleConnectionTestPeriod=5
    autoCommitOnClose=true

    完整的配置文件參數(shù)參看c3p0的文檔

    使用connection時(shí)很簡(jiǎn)單
    Connection conn = ConnectionManager.getInstance().getConnection();
    ...
    最后 conn.close() 即可,

    posted @ 2008-10-23 10:24 金家寶 閱讀(4346) | 評(píng)論 (2)編輯 收藏

    JDBC也分2.0和3.0?

    如題。研究中...以前沒(méi)有注意過(guò)。

    posted @ 2008-10-23 10:10 金家寶 閱讀(294) | 評(píng)論 (0)編輯 收藏

    鯉魚(yú)論壇 研究筆記(未)

    2008.10.21第一天
    網(wǎng)站地址: http://www.liyunet.com/
    源碼下載: http://www.liyunet.com/bbs/download.jsp

    我主要是利用該論壇的簡(jiǎn)易性來(lái)研究JSP技術(shù),以及緩存技術(shù)。雖然說(shuō)目前大部分論壇應(yīng)用的都是主流框架技術(shù),但說(shuō)回來(lái),這些框架也只是對(duì)JSP等相關(guān)技術(shù)的一個(gè)封裝,而了解底部應(yīng)用及其原理更容易讓我理解主流框架的內(nèi)部原理機(jī)制。不至于讓框架把我們變成“傻子”。


    那就開(kāi)始吧
    首先,和某些大蝦一樣的習(xí)慣,我們從WEB-INF下的web.xml開(kāi)始,從以下代碼中可以發(fā)現(xiàn)隨著tomcat啟動(dòng)時(shí),自動(dòng)加載了InitServlet類(lèi)。這是一個(gè)Servlet類(lèi)。
    WEB-INF\web.xml部分代碼:
    1
    2<servlet-name>InitServlet</servlet-name>
    3????????<servlet-class>com.bcxy.servlet.InitServlet</servlet-class>
    4????????<load-on-startup>1</load-on-startup>
    5??????</servlet>
    6

    查看com.bcxy.servlet.InitServlet類(lèi),代碼很簡(jiǎn)單:
    開(kāi)始做了一個(gè)對(duì)此類(lèi)日志(log4j)的綁定。接著通過(guò)SystemConfig取得了系統(tǒng)配置中的連接類(lèi)型conntype(查看classes目錄下的SystemConfig.xml可知此變量是判斷使用連接池的類(lèi)型0:3P0; 1:Proxool)。接著是初始化操作,記錄一些必要的啟動(dòng)信息(log4j)(其中做了本地地址和網(wǎng)絡(luò)訪問(wèn)地址的轉(zhuǎn)換)。
    用DBUtil.close測(cè)試連接池是否加載成功。
    最后是釋放類(lèi)所做的必要操作。判斷使用的是哪一種連接池,然后關(guān)閉。這樣我們的第一個(gè)類(lèi)就分析完畢。
    接著需要了解到
    SystemConfig類(lèi)是加載SystemConfig.xml配置文件,并設(shè)定方法去讀取。其中有一定的類(lèi)型轉(zhuǎn)換。

    此時(shí)似乎已經(jīng)找不到頭緒了。那這樣吧。我們就開(kāi)始訪問(wèn)我們自己搭建的論壇,從首頁(yè)開(kāi)始,也就是index.jsp頁(yè)面。
    瀏覽index.jsp代碼,由上向下理解每一個(gè)語(yǔ)句的含義(整體分體)。

    設(shè)定頁(yè)面編碼;導(dǎo)入IPLocalizer類(lèi)(應(yīng)該是做IP顯示的工具類(lèi));插入INC/const.jsp頁(yè)(過(guò)后會(huì)有分析);設(shè)定stats變量數(shù)值(通過(guò)閱讀其他jsp頁(yè)面發(fā)現(xiàn),此變量的作用主要是在于在首頁(yè)顯示用戶(hù)狀態(tài)時(shí),兼并顯示當(dāng)前用戶(hù)做瀏覽的頁(yè)面:也就是stats的值,這樣我們可以在客戶(hù)可訪問(wèn)的范圍內(nèi)對(duì)stats變量進(jìn)行設(shè)置,就可以查看在線用戶(hù)的當(dāng)前行為);繼續(xù)插入INC/theme.jsp(估計(jì)是定制論壇模板的文件);<table>標(biāo)簽內(nèi)部就是連接到相關(guān)顯示數(shù)據(jù)信息的jsp頁(yè)面并附加了參數(shù)。其中的一些格式是通過(guò)上面引用文件中的變量設(shè)置,相對(duì)不難理解;論壇消息廣播部分,通過(guò)一個(gè)可執(zhí)行jsp頁(yè)面vector顯示在首頁(yè)頂部,當(dāng)中訪問(wèn)數(shù)據(jù)庫(kù)的細(xì)節(jié)需要進(jìn)一步研究代碼);接著是帖子的遍歷,也就是首頁(yè)最關(guān)鍵的部分,這里看起來(lái)不是由jsp頁(yè)面來(lái)負(fù)責(zé)獲取數(shù)據(jù),而是通過(guò)Forum類(lèi)來(lái)獲取一些過(guò)濾之后的數(shù)據(jù):這里所說(shuō)的過(guò)濾是例如置頂帖子,最新帖子等有一些特殊標(biāo)記的數(shù)據(jù):;
    index.jsp的其他部分就都是大同小異了。都是通過(guò)一個(gè)遍歷來(lái)展現(xiàn)具有相同特性的數(shù)據(jù)。;大家需要注意一些關(guān)于頁(yè)面表現(xiàn)的而非java技術(shù)的部分,例如信息層的提示,和一些圖片連接。
    通過(guò)index.jsp的學(xué)習(xí),我們大概已經(jīng)了解了大部分jsp頁(yè)面代碼的表現(xiàn)形式和含義。當(dāng)然,一定要注意在這個(gè)過(guò)程中,參數(shù)傳遞、參數(shù)獲取的代碼部分,不要遺漏。除了一些我們可以看到的頁(yè)面之外,上面部分也講到了一些并不用于顯示給用戶(hù)的頁(yè)面,這里我們認(rèn)為它是可執(zhí)行頁(yè)面,也就是說(shuō)它對(duì)我們的數(shù)據(jù)和請(qǐng)求做了一些處理,或者說(shuō)把我們的請(qǐng)求轉(zhuǎn)交給了服務(wù)器(比如servlet)。

    預(yù)計(jì)晚上要研究一下有關(guān)數(shù)據(jù)庫(kù)方面的存取類(lèi)JdbcWrapper以及連接獲取和釋放、數(shù)據(jù)查詢(xún)插入。
    2008.10.22
    大概昨天寫(xiě)的已經(jīng)忘的差不多了,那么我們還是從index.jsp文件開(kāi)始,前幾行沒(méi)有什么問(wèn)題,都是一些導(dǎo)入文件的標(biāo)簽,那么我們從SkinUtil.這個(gè)類(lèi)入手。在查看SkinUtil類(lèi)代碼的時(shí)候我們發(fā)現(xiàn)里面應(yīng)用了一些com\bcxy\bbs\util?包中類(lèi),其中含有三個(gè)工具類(lèi)。(偷笑,看了文件大小,應(yīng)該代碼不多,我們看看里面都是什么)在開(kāi)始之前我們應(yīng)了解一下GCookie.java類(lèi)的大概內(nèi)容和作用。看導(dǎo)入包我們可以大概了解一下此類(lèi)的作用:對(duì)URL的編碼與解碼,產(chǎn)生和讀取Cookie,還有就是做一些日志記錄(log4j)。
    我們仔細(xì)閱讀后,了解到,其中有一個(gè)重載方法,也就是setCookie方法,根據(jù)不同的參數(shù),可以讓我們選擇直接賦予變量名和值的方法,或者是賦予變量名和值另外加上最大保存時(shí)間的方法。? 類(lèi)中的另一個(gè)方法是獲取Cookie方法值。
    ParamUtil類(lèi)也很簡(jiǎn)單,是取得字符串和 取得整數(shù)的重載方法,其中的參數(shù)決定是否有默認(rèn)值,是否需要轉(zhuǎn)碼。
    SysUtil類(lèi)中根據(jù)SystemConfig類(lèi)中的讀取方法讀取配置文件systemconfig.properties,按照里面的設(shè)置,來(lái)判斷是否對(duì)參數(shù)和數(shù)據(jù)庫(kù)讀取操作中的參數(shù)進(jìn)行編碼。其中還有一個(gè)方法是取得真實(shí)地址,當(dāng)然這些都是根據(jù)systemconfig.properties文件中配置而定的。
    BBSCconst.java類(lèi)簡(jiǎn)單的設(shè)置了一些常量。作用是設(shè)置數(shù)據(jù)庫(kù)表名的時(shí)候加上systemconfig.properties中設(shè)置的前綴。
    回到SkinUtil.java類(lèi)似乎看起來(lái)一些剛剛還陌生的類(lèi)方法,顯得明朗。前面設(shè)置了一個(gè)Cookie的變量名并賦了值。

    ret?=?new?JdbcWrapper().doIntSearch(sql,?0);

    這里用到了新類(lèi),也就是我們昨天說(shuō)過(guò)的要了解的關(guān)于數(shù)據(jù)庫(kù)連接的類(lèi)。也是今天要解決的重點(diǎn)。打開(kāi)JdbcWrapper類(lèi),查看代碼.(插一句,看代碼的時(shí)候,我覺(jué)得先看包名,了解大概要用到的類(lèi)和方法,去設(shè)想這個(gè)類(lèi)要實(shí)現(xiàn)的功能),yi一眼看來(lái),大概都熟悉,無(wú)非是連接數(shù)據(jù)庫(kù) 讀取,結(jié)果保存,異常,還有一些類(lèi)似數(shù)組的HashMap還有遍歷用得Iterator。想想,大概就是數(shù)據(jù)層的一些基礎(chǔ)CRUD操作。但是其中有個(gè)類(lèi)不是很熟悉,DatabaseMetaData類(lèi),查看sun公司的在線文檔,發(fā)現(xiàn)這是個(gè)接口而且方法奇多,文檔的第一句這么寫(xiě),

    Comprehensive?information?about?the?database?as?a?whole.?

    我也不能理解這句話包含了什么內(nèi)容。不管他,在程序中慢慢體會(huì)吧。JdbcWrapper這個(gè)類(lèi)有點(diǎn)長(zhǎng),不過(guò),大部分方法都有類(lèi)似的作用,也就是說(shuō)真正不同功能的代碼也只有幾分之一而已。我看的都想睡覺(jué)了。

    在網(wǎng)吧,因?yàn)椴槐悖入x開(kāi)咯
    今天還好,自己有一臺(tái)電腦,可以不限制時(shí)間。繼續(xù)工作....
    之前研究JdbcWrapper類(lèi)的時(shí)候有一個(gè)小小的疑問(wèn)。如下

    ?

    ?1?????//######這里有一點(diǎn)不明白,為什么要判斷getAutoClose()
    ?2????/*
    ?3?????*?當(dāng)需要事務(wù)支持時(shí),需要設(shè)置autoClose=false,那就等到事務(wù)提交時(shí)再關(guān)閉數(shù)據(jù)庫(kù)連接。
    ?4?????*?*/

    ?5????public?void?closeConnection()?{
    ?6????????if?(getAutoClose())?{
    ?7????????????DBUtil.close(pstmt,?con);
    ?8????????}

    ?9????}

    10

    今天看群里鯉魚(yú)回答內(nèi)容如下:

    當(dāng)需要事務(wù)支持時(shí),需要設(shè)置autoClose=false,那就等到事務(wù)提交時(shí)再關(guān)閉數(shù)據(jù)庫(kù)連接。


    一時(shí)還沒(méi)有理解開(kāi)來(lái)。
    看過(guò)來(lái)看過(guò)去,JdbcWrapper類(lèi)對(duì)我來(lái)講還是有一部分難以理解。索性不去管它,等在下面的代碼中出現(xiàn)時(shí),反復(fù)查閱應(yīng)該會(huì)有更多的收獲。

    posted @ 2008-10-21 11:47 金家寶 閱讀(361) | 評(píng)論 (0)編輯 收藏

    關(guān)于正則表達(dá)式

    *匹配除了換行之外的所有字符

    合法IP的正則表達(dá)式 ((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)

    \s匹配任意的空白符、(空格、制表符、換行符、中文全角空格)
    \w匹配字母或數(shù)字或下劃線或漢字

    表1.常用的元字符
    代碼說(shuō)明
    .匹配除換行符以外的任意字符
    \w匹配字母或數(shù)字或下劃線或漢字
    \s匹配任意的空白符
    \d匹配數(shù)字
    \b匹配單詞的開(kāi)始或結(jié)束
    ^匹配字符串的開(kāi)始
    $匹配字符串的結(jié)束


    表2.常用的限定符
    代碼/語(yǔ)法說(shuō)明
    *重復(fù)零次或更多次
    +重復(fù)一次或更多次
    ?重復(fù)零次或一次
    {n}重復(fù)n次
    {n,}重復(fù)n次或更多次
    {n,m}重復(fù)n到m次


    后向引用

    使用小括號(hào)指定一個(gè)子表達(dá)式后,匹配這個(gè)子表達(dá)式的文本(也就是此分組捕獲的內(nèi)容)可以在表達(dá)式或其它程序中作進(jìn)一步的處理。默認(rèn)情況下,每個(gè)分組會(huì)自動(dòng)擁有一個(gè)組號(hào),規(guī)則是:從左向右,以分組的左括號(hào)為標(biāo)志,第一個(gè)出現(xiàn)的分組的組號(hào)為1,第二個(gè)為2,以此類(lèi)推。

    后向引用用于重復(fù)搜索前面某個(gè)分組匹配的文本。例如,\1代表分組1匹配的文本。難以理解?請(qǐng)看示例:

    \b(\w+)\b\s+\1\b可以用來(lái)匹配重復(fù)的單詞,像go go, 或者kitty kitty。這個(gè)表達(dá)式首先是一個(gè)單詞,也就是單詞開(kāi)始處和結(jié)束處之間的多于一個(gè)的字母或數(shù)字(\b(\w+)\b),這個(gè)單詞會(huì)被捕獲到編號(hào)為1的分組中,然后是1個(gè)或幾個(gè)空白符(\s+),最后是分組1中捕獲的內(nèi)容(也就是前面匹配的那個(gè)單詞)(\1)。

    你也可以自己指定子表達(dá)式的組名。要指定一個(gè)子表達(dá)式的組名,請(qǐng)使用這樣的語(yǔ)法:(?<Word>\w+)(或者把尖括號(hào)換成'也行:(?'Word'\w+)),這樣就把\w+的組名指定為Word了。要反向引用這個(gè)分組捕獲的內(nèi)容,你可以使用\k<Word>,所以上一個(gè)例子也可以寫(xiě)成這樣:\b(?<Word>\w+)\b\s+\k<Word>\b

    使用小括號(hào)的時(shí)候,還有很多特定用途的語(yǔ)法。下面列出了最常用的一些:

    表4.常用分組語(yǔ)法
    分類(lèi)代碼/語(yǔ)法說(shuō)明
    捕獲(exp)匹配exp,并捕獲文本到自動(dòng)命名的組里
    (?<name>exp)匹配exp,并捕獲文本到名稱(chēng)為name的組里,也可以寫(xiě)成(?'name'exp)
    (?:exp)匹配exp,不捕獲匹配的文本,也不給此分組分配組號(hào)
    零寬斷言(?=exp)匹配exp前面的位置
    (?<=exp)匹配exp后面的位置
    (?!exp)匹配后面跟的不是exp的位置
    (?<!exp)匹配前面不是exp的位置
    注釋(?#comment)這種類(lèi)型的分組不對(duì)正則表達(dá)式的處理產(chǎn)生任何影響,用于提供注釋讓人閱讀


    表5.懶惰限定符
    代碼/語(yǔ)法說(shuō)明
    *?重復(fù)任意次,但盡可能少重復(fù)
    +?重復(fù)1次或更多次,但盡可能少重復(fù)
    ??重復(fù)0次或1次,但盡可能少重復(fù)
    {n,m}?重復(fù)n到m次,但盡可能少重復(fù)
    {n,}?重復(fù)n次以上,但盡可能少重復(fù)


    表6.常用的處理選項(xiàng)
    名稱(chēng)說(shuō)明
    IgnoreCase(忽略大小寫(xiě))匹配時(shí)不區(qū)分大小寫(xiě)。
    Multiline(多行模式)更改^$的含義,使它們分別在任意一行的行首和行尾匹配,而不僅僅在整個(gè)字符串的開(kāi)頭和結(jié)尾匹配。(在此模式下,$的精確含意是:匹配\n之前的位置以及字符串結(jié)束前的位置.)
    Singleline(單行模式)更改.的含義,使它與每一個(gè)字符匹配(包括換行符\n)。
    IgnorePatternWhitespace(忽略空白)忽略表達(dá)式中的非轉(zhuǎn)義空白并啟用由#標(biāo)記的注釋。
    RightToLeft(從右向左查找)匹配從右向左而不是從左向右進(jìn)行。
    ExplicitCapture(顯式捕獲)僅捕獲已被顯式命名的組。
    ECMAScript(JavaScript兼容模式)使表達(dá)式的行為與它在JavaScript里的行為一致。
    表7.尚未詳細(xì)討論的語(yǔ)法
    代碼/語(yǔ)法說(shuō)明
    \a報(bào)警字符(打印它的效果是電腦嘀一聲)
    \b通常是單詞分界位置,但如果在字符類(lèi)里使用代表退格
    \t制表符,Tab
    \r回車(chē)
    \v豎向制表符
    \f換頁(yè)符
    \n換行符
    \eEscape
    \0nnASCII代碼中八進(jìn)制代碼為nn的字符
    \xnnASCII代碼中十六進(jìn)制代碼為nn的字符
    \unnnnUnicode代碼中十六進(jìn)制代碼為nnnn的字符
    \cNASCII控制字符。比如\cC代表Ctrl+C
    \A字符串開(kāi)頭(類(lèi)似^,但不受處理多行選項(xiàng)的影響)
    \Z字符串結(jié)尾或行尾(不受處理多行選項(xiàng)的影響)
    \z字符串結(jié)尾(類(lèi)似$,但不受處理多行選項(xiàng)的影響)
    \G當(dāng)前搜索的開(kāi)頭
    \p{name}Unicode中命名為name的字符類(lèi),例如\p{IsGreek}
    (?>exp)貪婪子表達(dá)式
    (?<x>-<y>exp)平衡組
    (?im-nsx:exp)在子表達(dá)式exp中改變處理選項(xiàng)
    (?im-nsx)為表達(dá)式后面的部分改變處理選項(xiàng)
    (?(exp)yes|no)把exp當(dāng)作零寬正向先行斷言,如果在這個(gè)位置能匹配,使用yes作為此組的表達(dá)式;否則使用no
    (?(exp)yes)同上,只是使用空表達(dá)式作為no
    (?(name)yes|no)如果命名為name的組捕獲到了內(nèi)容,使用yes作為表達(dá)式;否則使用no
    (?(name)yes)同上,只是使用空表達(dá)式作為no

    posted @ 2008-10-17 11:10 金家寶 閱讀(321) | 評(píng)論 (1)編輯 收藏

    Lucene倒排索引原理(轉(zhuǎn))

    Lucene是一個(gè)高性能的java全文檢索工具包,它使用的是倒排文件索引結(jié)構(gòu)。該結(jié)構(gòu)及相應(yīng)的生成算法如下:

    0)設(shè)有兩篇文章1和2
    文章1的內(nèi)容為:Tom?lives?in?Guangzhou,I?live?in?Guangzhou?too.
    文章2的內(nèi)容為:He?once?lived?in?Shanghai.

    1)由于lucene是基于關(guān)鍵詞索引和查詢(xún)的,首先我們要取得這兩篇文章的關(guān)鍵詞,通常我們需要如下處理措施
    a.我們現(xiàn)在有的是文章內(nèi)容,即一個(gè)字符串,我們先要找出字符串中的所有單詞,即分詞。英文單詞由于用空格分隔,比較好處理。中文單詞間是連在一起的需要特殊的分詞處理。
    b.文章中的”in”,?“once”?“too”等詞沒(méi)有什么實(shí)際意義,中文中的“的”“是”等字通常也無(wú)具體含義,這些不代表概念的詞可以過(guò)濾掉
    c.用戶(hù)通常希望查“He”時(shí)能把含“he”,“HE”的文章也找出來(lái),所以所有單詞需要統(tǒng)一大小寫(xiě)。
    d.用戶(hù)通常希望查“l(fā)ive”時(shí)能把含“l(fā)ives”,“l(fā)ived”的文章也找出來(lái),所以需要把“l(fā)ives”,“l(fā)ived”還原成“l(fā)ive”
    e.文章中的標(biāo)點(diǎn)符號(hào)通常不表示某種概念,也可以過(guò)濾掉
    在lucene中以上措施由Analyzer類(lèi)完成

    經(jīng)過(guò)上面處理后
    ????文章1的所有關(guān)鍵詞為:[tom]?[live]?[guangzhou]?[i]?[live]?[guangzhou]
    ????文章2的所有關(guān)鍵詞為:[he]?[live]?[shanghai]

    2)?有了關(guān)鍵詞后,我們就可以建立倒排索引了。上面的對(duì)應(yīng)關(guān)系是:“文章號(hào)”對(duì)“文章中所有關(guān)鍵詞”。倒排索引把這個(gè)關(guān)系倒過(guò)來(lái),變成:“關(guān)鍵詞”對(duì)“擁有該關(guān)鍵詞的所有文章號(hào)”。文章1,2經(jīng)過(guò)倒排后變成
    關(guān)鍵詞???文章號(hào)
    guangzhou??1
    he?????????2
    i???????????1
    live???????1,2
    shanghai???2
    tom?????????1

    通常僅知道關(guān)鍵詞在哪些文章中出現(xiàn)還不夠,我們還需要知道關(guān)鍵詞在文章中出現(xiàn)次數(shù)和出現(xiàn)的位置,通常有兩種位置:a)字符位置,即記錄該詞是文章中第幾個(gè)字符(優(yōu)點(diǎn)是關(guān)鍵詞亮顯時(shí)定位快);b)關(guān)鍵詞位置,即記錄該詞是文章中第幾個(gè)關(guān)鍵詞(優(yōu)點(diǎn)是節(jié)約索引空間、詞組(phase)查詢(xún)快),lucene中記錄的就是這種位置。

    加上“出現(xiàn)頻率”和“出現(xiàn)位置”信息后,我們的索引結(jié)構(gòu)變?yōu)椋?br />關(guān)鍵詞???文章號(hào)[出現(xiàn)頻率]???出現(xiàn)位置
    guangzhou?1[2]???????????????3,6
    he???????2[1]???????????????1
    i?????????1[1]???????????????4
    live??????1[2],2[1]???????????2,5,2
    shanghai??2[1]???????????????3
    tom??????1[1]???????????????1

    以live 這行為例我們說(shuō)明一下該結(jié)構(gòu):live在文章1中出現(xiàn)了2次,文章2中出現(xiàn)了一次,它的出現(xiàn)位置為“2,5,2”這表示什么呢?我們需要結(jié)合文章號(hào)和出現(xiàn)頻率來(lái)分析,文章1中出現(xiàn)了2次,那么“2,5”就表示live在文章1中出現(xiàn)的兩個(gè)位置,文章2中出現(xiàn)了一次,剩下的“2”就表示live是文章2中第 2個(gè)關(guān)鍵字。
    ????
    以上就是lucene索引結(jié)構(gòu)中最核心的部分。我們注意到關(guān)鍵字是按字符順序排列的(lucene沒(méi)有使用B樹(shù)結(jié)構(gòu)),因此lucene可以用二元搜索算法快速定位關(guān)鍵詞。
    ????
    實(shí)現(xiàn)時(shí)?lucene將上面三列分別作為詞典文件(Term?Dictionary)、頻率文件(frequencies)、位置文件 (positions)保存。其中詞典文件不僅保存有每個(gè)關(guān)鍵詞,還保留了指向頻率文件和位置文件的指針,通過(guò)指針可以找到該關(guān)鍵字的頻率信息和位置信息。

    ????Lucene中使用了field的概念,用于表達(dá)信息所在位置(如標(biāo)題中,文章中,url中),在建索引中,該field信息也記錄在詞典文件中,每個(gè)關(guān)鍵詞都有一個(gè)field信息(因?yàn)槊總€(gè)關(guān)鍵字一定屬于一個(gè)或多個(gè)field)。

    ???? 為了減小索引文件的大小,Lucene對(duì)索引還使用了壓縮技術(shù)。首先,對(duì)詞典文件中的關(guān)鍵詞進(jìn)行了壓縮,關(guān)鍵詞壓縮為<前綴長(zhǎng)度,后綴>,例如:當(dāng)前詞為“阿拉伯語(yǔ)”,上一個(gè)詞為“阿拉伯”,那么“阿拉伯語(yǔ)”壓縮為<3,語(yǔ)>。其次大量用到的是對(duì)數(shù)字的壓縮,數(shù)字只保存與上一個(gè)值的差值(這樣可以減小數(shù)字的長(zhǎng)度,進(jìn)而減少保存該數(shù)字需要的字節(jié)數(shù))。例如當(dāng)前文章號(hào)是16389(不壓縮要用3個(gè)字節(jié)保存),上一文章號(hào)是16382,壓縮后保存7(只用一個(gè)字節(jié))。
    ????
    ????下面我們可以通過(guò)對(duì)該索引的查詢(xún)來(lái)解釋一下為什么要建立索引。
    假設(shè)要查詢(xún)單詞?“l(fā)ive”,lucene先對(duì)詞典二元查找、找到該詞,通過(guò)指向頻率文件的指針讀出所有文章號(hào),然后返回結(jié)果。詞典通常非常小,因而,整個(gè)過(guò)程的時(shí)間是毫秒級(jí)的。
    而用普通的順序匹配算法,不建索引,而是對(duì)所有文章的內(nèi)容進(jìn)行字符串匹配,這個(gè)過(guò)程將會(huì)相當(dāng)緩慢,當(dāng)文章數(shù)目很大時(shí),時(shí)間往往是無(wú)法忍受的。

    posted @ 2008-10-17 09:43 金家寶 閱讀(2835) | 評(píng)論 (1)編輯 收藏

    struts2標(biāo)簽

    ?

    一、
    寫(xiě)jsp頁(yè)面的時(shí)候,在struts2中,用的是s標(biāo)記,先引入標(biāo)記:
    <%@ taglib prefix="s" uri="/struts-tags"%>
    二、
    struts2的標(biāo)簽和1是完全不同的。
    struts2的標(biāo)簽分為兩大類(lèi):非UI標(biāo)志和UI標(biāo)志 struts1 將標(biāo)志庫(kù)按功能分成HTML、Tiles、Logic和Bean等幾部分
    下面就介紹strut2的具體標(biāo)簽:
    1、UI
    UI標(biāo)志又可以分為表單UI和非表單UI兩部分。表單UI部分基本與Struts 1.x相同,都是對(duì)HTML表單元素的包裝。不過(guò),Struts 2.0加了幾個(gè)我們經(jīng)常在項(xiàng)目中用到的控件如:datepicker、doubleselect、timepicker、optiontransferselect等。因?yàn)檫@些標(biāo)志很多都經(jīng)常用到,而且參數(shù)也很多,要在一篇文章詳細(xì)說(shuō)明并非易事。
    下面主要是ui標(biāo)簽的一些用法
    form:
    <s:form action="exampleSubmit" method="post" enctype="multipart/form-data">
    <s:submit />
    ??? <s:reset />

    </s:form>可以上傳文件的form。
    textfield:
    <s:textfield
    ??????????? label="姓名:"
    ??????????? name="name"
    ??????????? tooltip="Enter your Name here" />
    datepicker:
    <s:datepicker
    ??????????? tooltip="Select Your Birthday"
    ??????????? label="生日"
    ??????????? name="birthday" />
    textarea:
    <s:textarea
    ??????????? tooltip="Enter your remart"
    ??????????? label="備注"
    ??????????? name="remart"
    ??????????? cols="20"
    ??????????? rows="3"/>
    select:
    <s:select
    ??????????? tooltip="Choose user_type"
    ??????????? label=""
    ??????????? list="#{'free':'免費(fèi)','vip':'收費(fèi)'}" value="#{'free':'免費(fèi)'}"??
    ?????????? name="bean.user_type"
    ??????????? emptyOption="true"
    ??????????? headerKey="None"
    ??????????? headerValue="None"/>
    <s:select
    ??????????? tooltip="Choose user_type"
    ??????????? label=""
    ??????????? list="#{'free':'免費(fèi)','vip':'收費(fèi)'}" value="#{'free':'免費(fèi)'}"??
    ?????????? name="bean.user_type"
    ??????????? emptyOption="true"
    ??????????? headerKey="None"
    ??????????? headerValue="None"/>
    <s:select
    list="venderList"
    listKey="id"
    listValue="name"
    value="%{profile.companyName}"
    name="companyName" cssClass="sel_style_w_180"/>??
    挺好用的
    checkboxlist:
    <s:checkboxlist
    ??????????? tooltip="Choose your Friends"
    ??????????? label="朋友"
    ??????????? list="{'Patrick', 'Jason', 'Jay', 'Toby', 'Rene'}"
    ??????????? name="friends"/>
    checkbox:
    ?? <s:checkbox
    ??????????? tooltip="Confirmed that your are Over 18"
    ??????????? label="年齡"
    ??????????? name="legalAge"
    ??????????? value="18"/>
    file:
    ?? <s:file
    ??????????? tooltip="Upload Your Picture"
    ??????????? label="Picture"
    ??????????? name="picture" />
    a:
    <s:a href="getP.jsp">超鏈接提交</s:a>
    date :
    <s:date name="ad_end_time" format="yyyy-MM-dd"/>


    2、非UI
    if、elseif和else 描述:
    執(zhí)行基本的條件流轉(zhuǎn)。
    參數(shù):
    名稱(chēng)必需默認(rèn)類(lèi)型描述備注test是Boolean決定標(biāo)志里內(nèi)容是否顯示的表達(dá)式else標(biāo)志沒(méi)有這個(gè)參數(shù)id否Object/String用來(lái)標(biāo)識(shí)元素的id。在UI和表單中為HTML的id屬性 例子:
    <%@ page c %>
    <%@ taglib prefix="s" uri="/struts-tags" %>
    <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
    <html>
    ??? <head>
    ??????? <title>Condition Flow</title>
    ??? </head>
    ??? <body>
    ??????? <h3>Condition Flow</h3>????????????
    ??????? <!--
    ??????????? 這里有點(diǎn)小技巧:
    ??????????? 本來(lái)可以用#parameters.name[0]來(lái)獲得,請(qǐng)求中name的值。但是,在我實(shí)現(xiàn)include例子時(shí),
    ??????????? 無(wú)論我用param標(biāo)志給name賦任何值,#parameters里面不會(huì)含有任何值,所以#parameters.name也為空值。
    ????????????
    ??????????? 其原因?yàn)椋?
    ??????????? 當(dāng)使用include標(biāo)志時(shí),被包含的頁(yè)面(included)里#parameters拿到的是包含頁(yè)面里的請(qǐng)求參數(shù)。
    ????????????
    ??????????? 因此,這里必須手工調(diào)用request.getParameter("name")。
    ??????? -->
    ??? <s:iterator value="linkList" status="bean">
    ?? <tr>
    ??? <td class="data_tab_tdcl">
    ???? <s:property value="#bean.Index+1" />??? </td>
    ??? <td class="data_tab_tdcl"><s:property value="link_title" /></td>
    ??? <td class="data_tab_tdcl"><s:property value="link_url" /></td>
    ??? <td class="data_tab_tdcl">
    ??? <s:if test="link_type == 1">
    ?????????????????? 文字
    ??????????????? </s:if>
    ??????????????? <s:elseif test="link_type == 2">
    ?????????????????? 圖片
    ??????????????? </s:elseif>
    ???????????????? <s:else>
    ???????????????? -----
    ?????????????? </s:else>???
    ??? </td>

    ???
    ??? </body>
    </html>
    例1 condition.jsp
    iterator 描述:
    用于遍歷集合(java.util.Collection)或枚舉值(java.util.Iterator)。
    參數(shù):
    名稱(chēng)必需默認(rèn)類(lèi)型描述status否String如果設(shè)置此參數(shù),一個(gè)IteratorStatus的實(shí)例將會(huì)壓入每個(gè)遍歷的堆棧value否Object/String要遍歷的可枚舉的(iteratable)數(shù)據(jù)源,或者將放入新列表(List)的對(duì)象id否Object/String用來(lái)標(biāo)識(shí)元素的id。在UI和表單中為HTML的id屬性 例子:
    <%@ page c %>
    <%@ page import="java.util.List" %>
    <%@ page import="java.util.ArrayList" %>
    <%@ taglib prefix="s" uri="/struts-tags" %>

    <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
    <%
    ??? List list = new ArrayList();
    ??? list.add("Max");
    ??? list.add("Scott");
    ??? list.add("Jeffry");
    ??? list.add("Joe");
    ??? list.add("Kelvin");
    ??? request.setAttribute("names", list);
    %>
    <html>
    ??? <head>
    ??????? <title>Iterator</title>
    ??? </head>
    ??? <body>
    ??????? <h3>Names: </h3>
    ??????? <!--
    ??????????? 1、此處的空property元素用于獲得當(dāng)前iterator的值
    ??????????? 2、status被設(shè)成stuts,在iterator的里面就可以通過(guò)#stuts取得IteratorStatus的對(duì)象。IteratorStatus類(lèi)包含當(dāng)前序號(hào)信息,如是否第一個(gè)或最后一個(gè),是否為奇數(shù)序號(hào)。這些信息在我們做格式化的時(shí)候,顯得非常有用。
    ??????? -->
    ??????? <ol>
    ??????????? <s:iterator value="#request.names" status="stuts">????????????????
    ??????????????? <s:if test="#stuts.odd == true">
    ??????????????????? <li>White <s:property /></li>
    ??????????????? </s:if>
    ??????????????? <s:else>
    ??????????????????? <li style="background-color:gray"><s:property /></li>
    ??????????????? </s:else>
    ??????????? </s:iterator>
    ??????? </ol>
    ??? </body>
    </html>

    posted @ 2008-10-13 15:46 金家寶 閱讀(522) | 評(píng)論 (1)編輯 收藏

    Java筆試題(部分)

         摘要: EJB 方面 ? 94 、 EJB2.0 ...  閱讀全文

    posted @ 2008-10-09 11:56 金家寶 閱讀(720) | 評(píng)論 (0)編輯 收藏

    安裝WinCVS時(shí)Python不可用的問(wèn)題

    在我裝完Wincvs之后,提示我沒(méi)有安裝python,但后來(lái)我又裝了python2.4,可Wincvs還是說(shuō)配置不對(duì).到底要怎么配置python呢?期待著您的回復(fù),謝謝你了!
    ???
    TCL or Python are not available, shell is disabled。
    有的網(wǎng)友說(shuō)是版本的問(wèn)題,我今天安裝時(shí)也是一樣,裝了好三四個(gè)版本,都一樣,最后在CSDN上找到了答案。

    解決辦法:

    在admin-〉Preferences->wincvs中有關(guān)于python的設(shè)置, ?
    ? 其中python是指你的python虛擬機(jī)的位置,一般是python2X.dll的位置。在你來(lái)說(shuō)就是python24.dll的位置,一般這個(gè)文件會(huì)在你的系統(tǒng)文件中找到。 ?
    ? Tcl則一般會(huì)在python文件架的dlls子文件架中找到,一般名稱(chēng)為tclxx.dll,在你大概就是tcl84.dll。如果是安裝python2.3版本的話,會(huì)自動(dòng)找到,不需要設(shè)置。

    設(shè)置好了,WinCVS輸出窗口:

    Python 2.5.2 (r252:60911, Feb 21 2008, 13:11:45) [MSC v.1310 32 bit (Intel)] on win32Tk is available, Tk-macros are enabledTCL is available, shell is enabled : help (select and press enter)

    posted @ 2008-09-21 08:52 金家寶 閱讀(3614) | 評(píng)論 (1)編輯 收藏

    [設(shè)計(jì)模式]jive中的[abstract Factory]

      AbstractFactory模式和可擴(kuò)展性
      假如要實(shí)現(xiàn)較好的可擴(kuò)展性,AbstractFactory模式確實(shí)是一件利器。如上面所說(shuō),假如要?jiǎng)?chuàng)建的Forum接口的不同實(shí)現(xiàn),而又不想更改代碼的話,就需要用到抽象工廠了。再Jive中,AuthorizationFactory類(lèi)是一個(gè)抽象類(lèi),用來(lái)創(chuàng)建Authorization對(duì)象。這是一個(gè)抽象工廠,可以通過(guò)不同的子類(lèi)來(lái)創(chuàng)建不同的Authorization對(duì)象。這個(gè)工廠的實(shí)現(xiàn)方法是:
      
      在AuthorizationFactory中使用一個(gè)private static變量factory,用來(lái)引用具體的抽象工廠的實(shí)例:
      private static AuthorizationFactory factory = null;
      
      用一個(gè)private static的String,來(lái)指明具體的抽象工廠的子類(lèi)類(lèi)名:
      private static String className ="com.coolservlets.forum.database.DbAuthorizationFactory";
      
      然后是用一個(gè)private static的loadAuthorizationFactory方法來(lái)給這個(gè)factory變量賦值,生成具體的抽象工廠類(lèi):
      
        private static void loadAuthorizationFactory() {
          if (factory == null) {
            synchronized(className) {
              if (factory == null) {
                String classNameProp = PropertyManager.getProperty(
                  "AuthorizationFactory.className"
                );
                if (classNameProp != null) {
                  className = classNameProp;
                }
                try {
                  Class c = Class.forName(className);
                  factory = (AuthorizationFactory)c.newInstance();
                }
                catch (Exception e) {
                  System.err.println("Exception loading class: " + e);
                  e.printStackTrace();
                }
              }
            }
          }
      }
      
      在static的getAuthorization方法返回一個(gè)Authorization的過(guò)程中,先初始化工廠類(lèi)factory變量,然后用factory的createAuthorization方法來(lái)創(chuàng)建:
      
        public static Authorization getAuthorization(String username,
            String passWord) throws UnauthorizedException
        {
          loadAuthorizationFactory();
          return factory.createAuthorization(username, password);
      }
      
      不同的子類(lèi)有不同的createAuthorization方法的實(shí)現(xiàn)。比如在DbAuthorizationFactory這個(gè)AuthorizationFactory的數(shù)據(jù)庫(kù)實(shí)現(xiàn)子類(lèi)中,createAuthorization方法是這樣實(shí)現(xiàn)的:
      
        public Authorization createAuthorization(String username, String password)
            throws UnauthorizedException
        {
          if (username == null password == null) {
            throw new UnauthorizedException();
          }
          password = StringUtils.hash(password);
          int userID = 0;
          Connection con = null;
          PreparedStatement pstmt = null;
          try {
            con = DbConnectionManager.getConnection();
            pstmt = con.prepareStatement(AUTHORIZE);
            pstmt.setString(1, username);
            pstmt.setString(2, password);
      
            ResultSet rs = pstmt.executeQuery();
            if (!rs.next()) {
              throw new UnauthorizedException();
            }
            userID = rs.getInt(1);
          }
          catch( SQLException sqle ) {
            System.err.println("Exception in DbAuthorizationFactory:" + sqle);
            sqle.printStackTrace();
            throw new UnauthorizedException();
          }
          finally {
            try { pstmt.close(); }
            catch (Exception e) { e.printStackTrace(); }
            try { con.close();  }
            catch (Exception e) { e.printStackTrace(); }
          }
          return new DbAuthorization(userID);
        }
      
      在這個(gè)類(lèi)中,可以看到抽象類(lèi)和具體的子類(lèi)之間的關(guān)系,它們是如何協(xié)作的,又是如何劃分抽象方法和非抽象方法的,這都是值得注重的地方。一般的,抽象方法需要子類(lèi)來(lái)實(shí)現(xiàn),而抽象類(lèi)中的非抽象方法應(yīng)該所有子類(lèi)所能夠共享的,或者可是說(shuō),是定義在抽象方法之上的較高層的方法。這確實(shí)是一個(gè)抽象工廠的好例子!雖然實(shí)現(xiàn)的方法已經(jīng)和GOF中給出的實(shí)現(xiàn)相差較遠(yuǎn)了,但思想沒(méi)變,這兒的實(shí)現(xiàn),也確實(shí)是要巧妙的些。
      
      還有就是靜態(tài)方法的使用,使得這個(gè)類(lèi)看起來(lái)有些Singleton的意味。這使得對(duì)于AbstractFactory的創(chuàng)建變得簡(jiǎn)單。
      
      在AuthorizationFactory中定義的其它方法,涉及到具體的如何創(chuàng)建Authorization,都是作為abstract方法出現(xiàn),具體實(shí)現(xiàn)留給子類(lèi)來(lái)完成。
      
      這樣,在需要生成一個(gè)Authorization的時(shí)候,只需要調(diào)用AuthorizationFactory的靜態(tài)方法getAuthorization就可以了,由子類(lèi)實(shí)現(xiàn)了具體的細(xì)節(jié)。
      
      其它的,如同上面講到的,在創(chuàng)建Forum的時(shí)候用的ForumFactory,具有同上面一樣的實(shí)現(xiàn),這就是模式之所以稱(chēng)為模式的所在了。
    資料引用:http://www.knowsky.com/365144.html

    posted @ 2008-09-16 15:57 金家寶 閱讀(263) | 評(píng)論 (0)編輯 收藏

    主站蜘蛛池模板: 亚洲国产精品免费观看| 亚洲精品美女久久久久久久| 亚洲AV无码专区国产乱码4SE| 日韩亚洲变态另类中文| 国产亚洲精品看片在线观看| 亚洲愉拍99热成人精品热久久| 亚洲无码精品浪潮| 在线亚洲人成电影网站色www| 国产a v无码专区亚洲av| 国产性爱在线观看亚洲黄色一级片 | 亚洲国产精品一区二区成人片国内| 亚洲中文字幕无码爆乳AV| 国产亚洲美日韩AV中文字幕无码成人 | 日本免费大黄在线观看| 131美女爱做免费毛片| 最刺激黄a大片免费网站| 在线天堂免费观看.WWW| 浮力影院第一页小视频国产在线观看免费 | 7723日本高清完整版免费| 一个人免费观看在线视频www| 德国女人一级毛片免费| 亚洲?V无码成人精品区日韩| 亚洲国产午夜中文字幕精品黄网站 | 国产妇乱子伦视频免费| 好大好硬好爽免费视频| 免费在线不卡视频| 亚洲色自偷自拍另类小说| 亚洲第一精品在线视频| 亚洲丰满熟女一区二区v| 亚洲欧洲AV无码专区| 一级毛片正片免费视频手机看| 黄色视屏在线免费播放| 最好看的中文字幕2019免费| 日本一区免费电影| 中文字幕亚洲不卡在线亚瑟| 久久精品亚洲一区二区三区浴池| 国产精品亚洲综合久久| 四虎精品成人免费视频| 日韩av无码久久精品免费| 女人被弄到高潮的免费视频| 国产精品亚洲mnbav网站 |