<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    泰仔在線

    java學(xué)習(xí),心情日記,繽紛時(shí)刻
    posts - 100, comments - 34, trackbacks - 0, articles - 0

         摘要: Oracle 實(shí)在太強(qiáng)了,本篇文章詳細(xì)介紹了Oracle的遞歸查詢語法,利用此語法,可以方便地實(shí)現(xiàn)遞歸的雙向查詢:

    -- Tirle : Recursion query for TREE with "connect by/start with"
    -- Author : Rake Gao
    -- Create Date : 2005-08-22
    -- Version : 2.0
    -- Last Modify : 2005-08-22

    目 錄
    一、測(cè)試準(zhǔn)備
    二、實(shí)現(xiàn)各種查詢要求
    三、要點(diǎn)總結(jié)  閱讀全文

    posted @ 2010-10-13 14:41 泰仔在線 閱讀(346) | 評(píng)論 (0)編輯 收藏

         摘要: 軟件版本Beta,RC,Demo,Build等是什么意思呢?  閱讀全文

    posted @ 2010-09-24 14:54 泰仔在線 閱讀(321) | 評(píng)論 (0)編輯 收藏

         摘要: 一、下載
    1、PowerDesigner 12.5官方下載地址
     http://download.sybase.com/eval/PowerDesigner/powerdesigner125_eval.exe
     大小125 MB (132,006,349 字節(jié))

    二、破解
    環(huán)境:Window 2003 Server Enterprise+sp1+PowerDesigner12.5_eval.exe(12.5.0.2169)
    1、制作license.lic文件
    拷貝以下內(nèi)容,并保存為license.lic文件(注意擴(kuò)展名是lic)
    FEATURE PD_SHELL SYBASE 12.50 permanent uncounted 1 TS_OK HOSTID=ANY SIGN2=1
    FEATURE PD_DEV SYBASE 12.50 permanent uncounted 1 TS_OK HOSTID=ANY SIGN2=2  閱讀全文

    posted @ 2010-05-07 12:49 泰仔在線 閱讀(2510) | 評(píng)論 (16)編輯 收藏

         摘要: nutch網(wǎng)上有不少有它的源碼解析,但是采集這塊還是不太讓人容易理解.今天終于知道怎么,弄的.現(xiàn)在把crawl-urlfilter.txt文件貼出來,讓大家一塊交流,也給自己備忘錄一個(gè)。  閱讀全文

    posted @ 2010-04-30 10:12 泰仔在線 閱讀(3385) | 評(píng)論 (0)編輯 收藏

         摘要: 解決搜索動(dòng)態(tài)內(nèi)容的問題:
    需要注意在conf下面的2個(gè)文件:regex-urlfilter.txt,crawl-urlfilter.txt
    # skip URLs containing certain characters as probable queries, etc.
    -[?*!@=] (-改+)
    這段意思是跳過在連接中存在? * ! @ = 的頁面,因?yàn)槟J(rèn)是跳過所以,在動(dòng)態(tài)頁中存在?一般按照默認(rèn)的是不能抓取到的。可以在上面2個(gè)文件中都修改成:
    # skip URLs containing certain characters as probable queries, etc.
    # -[?*!@=]
    另外增加允許的一行
    # accept URLs containing certain characters as probable queries, etc.
    +[?=&]
    意思是抓取時(shí)候允許抓取連接中帶 ? = & 這三個(gè)符號(hào)的連接
    注意:兩個(gè)文件都需要修改,因?yàn)镹UTCH加載規(guī)則的順序是cr  閱讀全文

    posted @ 2010-04-24 19:06 泰仔在線 閱讀(2207) | 評(píng)論 (1)編輯 收藏

         摘要: 今天主要研究了Nutch中的html頁面的解析問題,因?yàn)槲业娜蝿?wù)是從頁面中提取特定的文本,因此首先要找到Nutch如何將html中的文本提取出來。Nutch提供了兩種html解析器,nekohtml和tagsoup,我采用了neko的解析器,在看了代碼后,發(fā)現(xiàn)其提取文本的方法在org.apache.nutch.parse.html中的DOMContentUtils文件中,主要的函數(shù)是getTextHelper。  閱讀全文

    posted @ 2010-04-23 17:38 泰仔在線 閱讀(3074) | 評(píng)論 (1)編輯 收藏

         摘要: 今天主要解決了Nutch中的一些小的問題,下面分別簡(jiǎn)述一下。

    1.網(wǎng)頁快照亂碼問題

    Nutch的網(wǎng)頁快照是亂碼,解決辦法是修改tomcat/webapps/nutch目錄下的cached.jsp文件,修改其中的第63行。

    原來的代碼是:content = new String(bean.getContent(details);

    修改后的代碼是:content = new String(bean.getContent(details),"gb2312");
      閱讀全文

    posted @ 2010-04-23 17:36 泰仔在線 閱讀(433) | 評(píng)論 (0)編輯 收藏

         摘要: 當(dāng)某個(gè)插件需要被加載時(shí), Nutch 會(huì)加載所有插件的相關(guān)接口到緩存,此后每個(gè)插件需要實(shí)例的時(shí)候,根據(jù)相關(guān)接口和相關(guān)接口實(shí)現(xiàn)實(shí)例在緩存內(nèi)的記錄,使用反射實(shí)現(xiàn)一個(gè)實(shí)例并返回,下面以 QueryFilter 的所有插件被加載例子進(jìn)行說明。  閱讀全文

    posted @ 2010-04-23 11:30 泰仔在線 閱讀(485) | 評(píng)論 (0)編輯 收藏

         摘要: 主要類分析:
    一、 org.apache.nutch.crawl.Injector:
    1,注入url.txt
    2,url標(biāo)準(zhǔn)化
    3,攔截url,進(jìn)行正則校驗(yàn)(regex-urlfilter.txt)
    4,對(duì)符URL標(biāo)準(zhǔn)的url進(jìn)行map對(duì)構(gòu)造,在構(gòu)造過程中給CrawlDatum初始化得分,分?jǐn)?shù)可影響url host的搜索排序,和采集優(yōu)先級(jí)!
    5,reduce只做一件事,判斷url是不是在crawldb中已經(jīng)存在,如果存在則直接讀取原來CrawlDatum,如果是新host,則把相應(yīng)狀態(tài)存儲(chǔ)到里邊(STATUS_DB_UNFETCHED(狀態(tài)意思為沒有采集過))

    二、org.apache.nutch.crawl.Generator:   閱讀全文

    posted @ 2010-04-23 11:05 泰仔在線 閱讀(1054) | 評(píng)論 (0)編輯 收藏

         摘要: 讀者是沒有耐心的,我也沒有,所以先說結(jié)論:你可以不用編程序,只要鼠標(biāo)點(diǎn)幾下拖動(dòng)些圖標(biāo),改改參數(shù),就能完成過億數(shù)據(jù)的分布處理程序。

    當(dāng)然,這么理想的目標(biāo)現(xiàn)在還沒有達(dá)到,但路已經(jīng)明明白白的展現(xiàn)在面前了,至少我們已經(jīng)走了接近一半了。  閱讀全文

    posted @ 2010-04-21 11:41 泰仔在線 閱讀(795) | 評(píng)論 (0)編輯 收藏

    僅列出標(biāo)題
    共9頁: 上一頁 1 2 3 4 5 6 7 8 9 下一頁 
    主站蜘蛛池模板: 亚洲日韩一区精品射精| 中文字幕乱码系列免费| 一区二区无码免费视频网站| 久久亚洲日韩精品一区二区三区| 在线观看免费黄网站| 亚洲人成无码网站| 女人体1963午夜免费视频| 亚洲欧洲免费视频| 精品国产污污免费网站aⅴ| 亚洲一区二区三区免费在线观看| 亚洲欧美国产欧美色欲| 在线免费观看色片| 久久久久亚洲AV无码专区体验| 永久免费不卡在线观看黄网站| 久久精品国产亚洲AV麻豆不卡 | 亚洲爱情岛论坛永久| 风间由美在线亚洲一区| 可以免费观看一级毛片黄a| 亚洲愉拍一区二区三区| 国产一区二区三区在线免费 | 日韩精品无码免费专区午夜 | 亚洲a∨无码一区二区| 久久这里只精品国产免费10| 亚洲国语精品自产拍在线观看 | 美女内射毛片在线看免费人动物| 亚洲天堂在线视频| 久久九九AV免费精品| 亚洲成A人片在线播放器| 88xx成人永久免费观看| 亚洲男人的天堂久久精品| 18级成人毛片免费观看| 亚洲欧洲精品成人久久曰| 亚洲一区二区精品视频| 51在线视频免费观看视频| 亚洲熟女综合色一区二区三区| 亚洲人成色7777在线观看不卡| 99爱在线观看免费完整版| 亚洲成Av人片乱码色午夜| 91成人免费观看网站| 亚洲av乱码一区二区三区 | 青青草无码免费一二三区|