<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    天 霽

    那天風(fēng)大,搜搜的
    posts - 4, comments - 36, trackbacks - 1, articles - 1
      BlogJava :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

    Nutch數(shù)據(jù)查看工具:RedmuTool

    Posted on 2006-12-16 16:10 天霽 閱讀(3598) 評論(15)  編輯  收藏 所屬分類: nutch

    ??????? 在nutch的開發(fā)過程中,很多程序員都煩惱nutch抓取數(shù)據(jù)后的保存格式,無法被直接瀏覽和管理,我也同樣煩惱,呵呵,也是被人催得急了,抽出時間寫了這么個小工具,用來瀏覽nutch保存的數(shù)據(jù)。

    ??????? 準(zhǔn)備設(shè)計的功能有3塊:
    ??????? 1。瀏覽和管理數(shù)據(jù)。
    ??????? 2。搜索數(shù)據(jù)。
    ????????3。導(dǎo)出nutch數(shù)據(jù)到指定數(shù)據(jù)庫。

    ??????? 花了一天時間先寫了第一塊的一部分,能夠瀏覽nutch抓取后的數(shù)據(jù),先放在blog上吧,版本定為0.1,其實0.1也高,0.01比較合適。寫的匆忙,代碼比較簡陋,本想開放源碼,又怕貽笑大方,暫時先不發(fā)布源碼了,只發(fā)布了一個jar包,代碼并沒有經(jīng)過混淆,如果感興趣反編譯過來看就好了,或者留個郵箱,等到基本功能完成了發(fā)布到sourceforge上。

    ????????基本界面使用說明:

    ?????? 一.?? 下載與安裝:

    ??????????????? 在這里下載,下載后解壓縮,兩個解壓縮文件:RedmuTool.jar,startup.bat,一個類包文件
    ??????????????? 夾:lib。確認(rèn)這三個在同一文件夾下。

    ???????二.?? 運行:

    ?????????????? 執(zhí)行startup.bat。界面如下:


    ?????????? 主界面出現(xiàn)后,F(xiàn)ile-->open,選擇nutch抓取后保存數(shù)據(jù)的文件夾:


    ???????菜單中不同的選項對應(yīng)不同的文件夾:
    ?????? NutchCrawl,對應(yīng)你選擇的Crawl根目錄。
    ?????? CrawlDB,對應(yīng)crawldb文件夾。
    ?????? LinkDB,對應(yīng)linkdb文件夾。
    ?????? Segments,對應(yīng)segments文件夾。
    ?????? segment文件夾下是按照抓取時間命名的文件夾,內(nèi)部分別是content,crawl_fetch,crawl_generate,crawl_parse,parse_data,parse_text,界面中對應(yīng)的分別是:Content,CrawlFetch,ParseData和ParseText。
    ??????? 點擊相應(yīng)的選擇,就會看到相應(yīng)的數(shù)據(jù)內(nèi)容:

    ????????
    ????????字段名和相應(yīng)的屬性名相同,未做更多的處理。
    ???????
    ???????? 在使用中任何意見均可留言,或發(fā)送郵件到:redmuer@hotmail.com


    評論

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評論   

    2006-12-16 16:49 by BeanSoft
    支持原創(chuàng)! 不管 SWT/SWING, 做出有用的東西來就是好鳥!

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評論   

    2006-12-16 19:15 by stme
    不錯,本人正在研究nutch,有機(jī)會向您請教下

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評論   

    2006-12-24 22:14 by baodijun
    你好!我在使用你的軟件導(dǎo)數(shù)據(jù)時,卻什么數(shù)據(jù)都沒有出來。不知道是為什么?
    卻出現(xiàn)了下面的內(nèi)容。希望能得到幫助,謝謝。
    06/12/24 22:01:06 INFO conf.Configuration: parsing jar:file:/E:/nutch%e5%b7%a5%e
    5%85%b7/lib/hadoop-0.4.0.jar!/hadoop-default.xml

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評論   

    2006-12-25 16:07 by 天霽
    請查看目錄選擇是否正確。
    你所提供的信息表示jar包加載正確。

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評論   

    2007-01-10 11:06 by moonucool
    現(xiàn)在nutch最新版的為nutch_0.8.1 要與時俱過呀 支持你

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評論   

    2007-01-25 21:51 by 雨山
    在網(wǎng)上搜到這個頁面真是激動死了,下載了先。明天安裝一下試試。多謝了阿!!你真是太、太、太好了:)

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評論   

    2007-03-09 19:38 by 陳軍
    支持

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評論   

    2007-04-03 18:43 by Nutch初學(xué)者
    正在學(xué)習(xí)Nutch,這個工具很帥阿。能留下聯(lián)系辦法嗎?有關(guān)Nutch的問題請教

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評論   

    2007-04-04 09:47 by Nutch初學(xué)者
    為什么我用dump出來的數(shù)據(jù),里面的中文全是亂麻呢?~~

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評論   

    2007-04-04 09:47 by Nutch初學(xué)者
    為什么我用dump出來的數(shù)據(jù),里面的中文全是亂碼呢?~~

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評論   

    2007-04-13 10:58 by 天霽
    發(fā)到我郵箱里的提問我都回復(fù)了,不過有的回復(fù)好像失敗了。
    前一段項目壓力比較大,沒能繼續(xù)更新這個小工具,馬上項目快結(jié)束了,會繼續(xù)更新這個工具,歡迎大家繼續(xù)交流。
    我的msn和郵箱在redmutool的幫助里都有顯示,有問題在這里提出或者發(fā)郵件都可以。

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool[未登錄]  回復(fù)  更多評論   

    2008-06-18 16:21 by lee
    請問有沒有解決dump出來亂碼的問題阿!知道請聯(lián)系leehyokug@163.com

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評論   

    2012-04-22 20:41 by 桑尼~
    我們最近也在研究Nutch哇~ 能不能給我發(fā)一份哇~ 萬分感謝哇~
    snygirl@126.com 呵呵 @天霽

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評論   

    2013-05-09 18:04 by qtshh
    感謝樓主的奉獻(xiàn)精神;謝謝了;可惜沒有下載成功!

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評論   

    2013-05-09 18:05 by qtshh
    發(fā)我一份吧,謝謝了!zhch_china@sina.com

    只有注冊用戶登錄后才能發(fā)表評論。


    網(wǎng)站導(dǎo)航:
     
    主站蜘蛛池模板: 国产jizzjizz视频全部免费| 一级特级aaaa毛片免费观看| 亚洲AV无码成人网站久久精品大| 成年女人免费v片| 日韩精品极品视频在线观看免费| 人成午夜免费大片在线观看| 亚洲中文字幕无码爆乳app| 亚洲视频.com| 亚洲AV午夜成人片| 亚洲欧洲日本在线| 国产乱色精品成人免费视频| 日韩免费a级毛片无码a∨| 日韩精品极品视频在线观看免费| 视频免费在线观看| 国产精品99爱免费视频| 深夜A级毛片视频免费| 鲁死你资源站亚洲av| 亚洲乱妇熟女爽到高潮的片| 亚洲国产精品无码久久久| 久久久综合亚洲色一区二区三区| 亚洲午夜久久久久久噜噜噜| 亚洲成av人在片观看| 国产在线ts人妖免费视频| 成年女人视频网站免费m| 国产精品视频永久免费播放| 国产黄色免费网站| 精品女同一区二区三区免费站| 免费女人高潮流视频在线观看| 免费无码又爽又刺激高潮软件| 国产无遮挡色视频免费观看性色| 一道本在线免费视频| aa午夜免费剧场| 三年在线观看免费观看完整版中文| 国产三级在线免费观看| 国产午夜免费高清久久影院| 久久免费线看线看| 57pao国产成视频免费播放| 成人在线免费看片| 欧洲黑大粗无码免费| 国内一级一级毛片a免费| 香蕉高清免费永久在线视频|