<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-8  評論-31  文章-0  trackbacks-0
    我在Run Nutch的時候出現(xiàn)這樣的錯誤 -

    08/07/07 04:05:41 INFO conf.Configuration: found resource crawl-urlfilter.txt at file:/home/hut/installfiles/nutch-0.9/out/production/nutch-0.9/crawl-urlfilter.txt
    08/07/07 04:05:41 INFO conf.Configuration: found resource parse-plugins.xml at file:/home/hut/installfiles/nutch-0.9/out/production/nutch-0.9/parse-plugins.xml
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetching http://www.yale.edu/
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetching http://www.harvard.edu/
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetch of http://www.harvard.edu/ failed with: org.apache.nutch.protocol.ProtocolNotFound: protocol not found for url=http
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetch of http://www.yale.edu/ failed with: org.apache.nutch.protocol.ProtocolNotFound: protocol not found for url=http

    解決方法:nutch-site.xml
        <property>
            
    <name>plugin.includes</name>
            
    <value>
                nutch-extensionpoints|
    protocol-http|urlfilter-regex|parse-(text|html|js)|index-basic|query-(basic|site|url)|summary-basic|scoring-opic|urlnormalizer-(pass|regex|basic)
            
    </value>
            
    <description>Regular expression naming plugin directory names to
                include. Any plugin not matching 
    this expression is excluded.
                In any 
    case you need at least include the nutch-extensionpoints plugin. By
                
    default Nutch includes crawling just HTML and plain text via HTTP,
                and basic indexing and search plugins. In order to use HTTPS please enable
                protocol
    -httpclient, but be aware of possible intermittent problems with the
                underlying commons
    -httpclient library.
            
    </description>
        
    </property>

    nutch-extensionpoints|被我錯誤的刪除了,還原以后一切工作正常. 默認情況下nutch0.9的目錄結(jié)構(gòu)中并沒有plugin.includes這個properties, 它會載入nutch-default.xml里面的plugin.includes所以定義的所有的plugin. 在nutch-site.xml編輯/加入 plugin.includes properties的目的是為了加入我們自己的plugin而覆蓋nutch-default.xml定義的.
    posted on 2008-07-10 11:38 自己的小屋 閱讀(2335) 評論(0)  編輯  收藏

    只有注冊用戶登錄后才能發(fā)表評論。


    網(wǎng)站導(dǎo)航:
     
    主站蜘蛛池模板: 亚洲av日韩av无码av| 亚洲综合视频在线| 综合偷自拍亚洲乱中文字幕| 日本免费网址大全在线观看| 内射少妇36P亚洲区| 无码人妻久久一区二区三区免费 | 两个人日本免费完整版在线观看1| 美女被免费视频网站a国产| 亚洲熟妇少妇任你躁在线观看| 最近最新MV在线观看免费高清| 亚洲w码欧洲s码免费| 成人午夜大片免费7777| 亚洲aⅴ无码专区在线观看春色| 永久免费av无码网站大全| 美女视频黄a视频全免费网站色| 免费大黄网站在线观看| 美女网站在线观看视频免费的| 亚洲人成色777777在线观看| 99久久免费中文字幕精品| 亚洲六月丁香六月婷婷蜜芽| 女人18毛片特级一级免费视频| 欧美亚洲精品一区二区| MM131亚洲国产美女久久| 久久免费观看国产99精品| 精品亚洲成A人无码成A在线观看 | 免费v片在线观看视频网站| 亚洲一区二区三区四区视频 | 国产亚洲精品福利在线无卡一| 两个人看的www视频免费完整版| 久久精品国产亚洲精品2020| 青春禁区视频在线观看直播免费| 高h视频在线免费观看| 久久亚洲国产精品| 免费观看理论片毛片| 一区二区视频免费观看| 亚洲午夜精品一区二区| 日韩视频免费一区二区三区| baoyu116.永久免费视频| 亚洲制服在线观看| 亚洲性日韩精品一区二区三区| 9277手机在线视频观看免费|