<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-8  評論-31  文章-0  trackbacks-0
    我在Run Nutch的時候出現這樣的錯誤 -

    08/07/07 04:05:41 INFO conf.Configuration: found resource crawl-urlfilter.txt at file:/home/hut/installfiles/nutch-0.9/out/production/nutch-0.9/crawl-urlfilter.txt
    08/07/07 04:05:41 INFO conf.Configuration: found resource parse-plugins.xml at file:/home/hut/installfiles/nutch-0.9/out/production/nutch-0.9/parse-plugins.xml
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetching http://www.yale.edu/
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetching http://www.harvard.edu/
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetch of http://www.harvard.edu/ failed with: org.apache.nutch.protocol.ProtocolNotFound: protocol not found for url=http
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetch of http://www.yale.edu/ failed with: org.apache.nutch.protocol.ProtocolNotFound: protocol not found for url=http

    解決方法:nutch-site.xml
        <property>
            
    <name>plugin.includes</name>
            
    <value>
                nutch-extensionpoints|
    protocol-http|urlfilter-regex|parse-(text|html|js)|index-basic|query-(basic|site|url)|summary-basic|scoring-opic|urlnormalizer-(pass|regex|basic)
            
    </value>
            
    <description>Regular expression naming plugin directory names to
                include. Any plugin not matching 
    this expression is excluded.
                In any 
    case you need at least include the nutch-extensionpoints plugin. By
                
    default Nutch includes crawling just HTML and plain text via HTTP,
                and basic indexing and search plugins. In order to use HTTPS please enable
                protocol
    -httpclient, but be aware of possible intermittent problems with the
                underlying commons
    -httpclient library.
            
    </description>
        
    </property>

    nutch-extensionpoints|被我錯誤的刪除了,還原以后一切工作正常. 默認情況下nutch0.9的目錄結構中并沒有plugin.includes這個properties, 它會載入nutch-default.xml里面的plugin.includes所以定義的所有的plugin. 在nutch-site.xml編輯/加入 plugin.includes properties的目的是為了加入我們自己的plugin而覆蓋nutch-default.xml定義的.
    posted on 2008-07-10 11:38 自己的小屋 閱讀(2335) 評論(0)  編輯  收藏

    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 亚洲av永久无码一区二区三区| 人人揉揉香蕉大免费不卡| 亚洲av无码片vr一区二区三区| igao激情在线视频免费| 91香蕉成人免费网站| 日韩一卡2卡3卡4卡新区亚洲| 亚洲av无码不卡久久| 中文字幕久精品免费视频| 免费无码看av的网站| 久久精品蜜芽亚洲国产AV| 男女猛烈激情xx00免费视频| 精品久久8x国产免费观看| 亚洲日韩精品A∨片无码| 亚洲欧美日韩一区二区三区在线| 老汉精品免费AV在线播放| 国产精品亚洲产品一区二区三区 | 国产精品亚洲一区二区三区| 99久久久国产精品免费蜜臀| 亚洲人成网站在线观看播放青青| 久久精品成人免费国产片小草| 情侣视频精品免费的国产| 亚洲大香伊人蕉在人依线| 全免费a级毛片免费看| 亚洲国产成人va在线观看网址| 免费电影在线观看网站| 亚洲性色成人av天堂| 国产无遮挡吃胸膜奶免费看| 中文字幕乱码亚洲无线三区 | 国产在线国偷精品产拍免费| 精品久久久久久亚洲综合网| 日本特黄a级高清免费大片| 国产成人精品免费大全| 亚洲午夜久久久久久尤物| 成人免费看片又大又黄| 亚洲色偷偷偷综合网| A在线观看免费网站大全| 亚洲一区无码中文字幕乱码| 亚洲日韩国产成网在线观看| 精品无码人妻一区二区免费蜜桃| 亚洲伊人久久大香线蕉苏妲己| 成人免费看黄20分钟|