<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-23  評論-58  文章-0  trackbacks-0
    http://www.tkk7.com/nianzai/

    PDF文檔下載

    一、 概述
    在網頁抓取項目中通常最缺的是IP地址資源,大多數網站對抓取會做些限制(比如同一IP地址的線程數限制,再比如幾分鐘之內同一IP地址的頁面訪問次數限制)。
    基于P2P模式的分布式抓取方案是利用分散在各處的可上網機器來抓取網頁,可有效的突破網站限制。

    二、設計圖

    上網客戶端1 。。。上網客戶端m是分散在各處能直接上網的機器,這些上網客戶端機器定時向狀態服務區報告自己的心跳。

    抓取客戶端 1 。。。抓取客戶端 n 是集中放在某處的抓取機器。抓取客戶端機器定時向狀態服務器獲取可用上網客戶端列表,然后抓取客戶端機器直接與上網客戶端建立連接,抓取客戶端機器直接通過上網客戶端來抓取網頁。

     

    三、實現方案

    方案一:
    在上網客戶端機器上安裝共享上網代理軟件比如ccproxy,抓取客戶端以代理的方式通過上網機器抓取網頁。該方案簡單易行,無技術障礙。


    方案二:
    開發一套簡化版P2P軟件,抓取客戶端機器將抓取請求分發給客戶端機器,客戶端機器將網頁抓取下來傳回給抓取客戶端機器。該方案復雜些,但可擴展性極強。在掌握了大量上網客戶端機器后完全可以做成云計算進行商業運作。

    posted on 2010-12-29 15:47 nianzai 閱讀(2237) 評論(2)  編輯  收藏

    評論:
    # re: 基于P2P模式的分布式抓取方案 2010-12-30 11:40 | 水星家紡
    該方案復雜些,但可擴展性極強。在掌握了大量上網客戶端機器后完全可以做成云計算進行商業運作。

      回復  更多評論
      
    # re: 基于P2P模式的分布式抓取方案 2010-12-30 12:30 | 打底褲
    該方案復雜些,但可擴展性極強。在掌握了大量上網客戶端機器后完全可以做成云計算進行商業運作。  回復  更多評論
      

    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 亚洲免费网站在线观看| 亚洲av永久中文无码精品综合| 久久久久久久久久免免费精品 | 最新精品亚洲成a人在线观看| 国产精品成人亚洲| 亚洲一区二区三区香蕉| 精品国产污污免费网站aⅴ| 福利片免费一区二区三区| 亚洲精品成人片在线观看精品字幕 | 精品亚洲aⅴ在线观看| 男的把j放进女人下面视频免费| 亚洲国产精品不卡毛片a在线| 亚洲av片在线观看| 国产亚洲成av片在线观看| 114一级毛片免费| 亚洲AV区无码字幕中文色| 免费日本一区二区| 亚洲av色福利天堂| 日韩免费视频网站| 日本卡1卡2卡三卡免费| 精品在线免费视频| 亚洲乱码日产精品a级毛片久久| 七次郎成人免费线路视频 | 国产精品亚洲四区在线观看 | 亚洲处破女AV日韩精品| 久久精品成人免费观看| 亚洲AV综合色区无码一二三区 | 一个人看的免费高清视频日本| 亚洲成人福利网站| 亚洲啪啪综合AV一区| 国产免费观看网站| 五月亭亭免费高清在线| A片在线免费观看| 免费手机在线看片| 亚洲日本成本人观看| 亚洲综合精品网站| 久久国产高潮流白浆免费观看| 一级黄色片免费观看| 亚洲av无一区二区三区| 亚洲免费观看网站| 亚洲黄黄黄网站在线观看|