Posted on 2007-06-29 22:41
天霽 閱讀(1619)
評論(13) 編輯 收藏 所屬分類:
nutch
好久沒回來了,終于有時間可以更新這個小工具了。
修改的地方:
1、區分數據存儲的實際目錄;
2、可以反復查詢不同的目錄數據;
3、數據導出為CVS文件;
4、其他一些小bug;
5、修改status的表現內容
在這里下載,下載后解壓縮,兩個解壓縮文件:RedmuTool.jar,startup.bat,一個類包文件夾:lib。確認這三個在同一文件夾下。
運行界面:

主界面出現后,File-->open,選擇nutch抓取后保存數據的文件夾:
菜單中不同的選項對應不同的文件夾,點擊相應的選擇,就會看到相應的數據內容:
>

點擊“ExportToCVS”,則把數據導入到指定的文件內:

對于被保存的頁面內的內容“ParseText”和“Content”,處理不好,數據太長了,寫到文本文件內表現實在太長了。
在使用中任何意見均可留言,或發送郵件到:
redmuer@hotmail.com。