<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-23  評論-58  文章-0  trackbacks-0
    http://www.tkk7.com/nianzai/

    PDF文檔下載

    一、 概述
    在網頁抓取項目中通常最缺的是IP地址資源,大多數網站對抓取會做些限制(比如同一IP地址的線程數限制,再比如幾分鐘之內同一IP地址的頁面訪問次數限制)。
    基于P2P模式的分布式抓取方案是利用分散在各處的可上網機器來抓取網頁,可有效的突破網站限制。

    二、設計圖

    上網客戶端1 。。。上網客戶端m是分散在各處能直接上網的機器,這些上網客戶端機器定時向狀態服務區報告自己的心跳。

    抓取客戶端 1 。。。抓取客戶端 n 是集中放在某處的抓取機器。抓取客戶端機器定時向狀態服務器獲取可用上網客戶端列表,然后抓取客戶端機器直接與上網客戶端建立連接,抓取客戶端機器直接通過上網客戶端來抓取網頁。

     

    三、實現方案

    方案一:
    在上網客戶端機器上安裝共享上網代理軟件比如ccproxy,抓取客戶端以代理的方式通過上網機器抓取網頁。該方案簡單易行,無技術障礙。


    方案二:
    開發一套簡化版P2P軟件,抓取客戶端機器將抓取請求分發給客戶端機器,客戶端機器將網頁抓取下來傳回給抓取客戶端機器。該方案復雜些,但可擴展性極強。在掌握了大量上網客戶端機器后完全可以做成云計算進行商業運作。

    posted on 2010-12-29 15:47 nianzai 閱讀(2237) 評論(2)  編輯  收藏

    評論:
    # re: 基于P2P模式的分布式抓取方案 2010-12-30 11:40 | 水星家紡
    該方案復雜些,但可擴展性極強。在掌握了大量上網客戶端機器后完全可以做成云計算進行商業運作。

      回復  更多評論
      
    # re: 基于P2P模式的分布式抓取方案 2010-12-30 12:30 | 打底褲
    該方案復雜些,但可擴展性極強。在掌握了大量上網客戶端機器后完全可以做成云計算進行商業運作。  回復  更多評論
      

    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 1区1区3区4区产品亚洲| 在线观看亚洲精品福利片| 亚洲六月丁香六月婷婷色伊人| 免费成人在线电影| 亚洲AV无码成人精品区在线观看 | 日韩免费a级在线观看| 亚洲暴爽av人人爽日日碰| 永久免费bbbbbb视频| 国产亚洲男人的天堂在线观看| 四虎永久成人免费影院域名| 污污污视频在线免费观看| 亚洲日韩一页精品发布| 久久午夜羞羞影院免费观看| 亚洲欧洲日产国码www| 免费电影在线观看网站| 国产亚洲精品2021自在线| 亚洲日韩VA无码中文字幕| 免费观看久久精彩视频| 丁香婷婷亚洲六月综合色| 国产男女猛烈无遮档免费视频网站| 国产精品亚洲а∨天堂2021| 成人午夜亚洲精品无码网站| 久久久久久国产精品免费免费男同| 亚洲日本视频在线观看| 免费黄色毛片视频| 国产精品成人69XXX免费视频| 亚洲AV人无码综合在线观看| 中文字幕无码免费久久99| 菠萝菠萝蜜在线免费视频| 国产亚洲综合久久系列| 1024免费福利永久观看网站| 亚洲avav天堂av在线网毛片| 国产亚洲av片在线观看16女人| 亚洲w码欧洲s码免费| 色网站在线免费观看| 亚洲A∨无码无在线观看| 小小影视日本动漫观看免费| 精品国产污污免费网站| 亚洲中文无码卡通动漫野外| 亚洲精品无码不卡在线播放HE | 精品熟女少妇av免费久久|