<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-23  評論-58  文章-0  trackbacks-0
    http://www.tkk7.com/nianzai/

    PDF文檔下載

    一、 概述
    在網頁抓取項目中通常最缺的是IP地址資源,大多數網站對抓取會做些限制(比如同一IP地址的線程數限制,再比如幾分鐘之內同一IP地址的頁面訪問次數限制)。
    基于P2P模式的分布式抓取方案是利用分散在各處的可上網機器來抓取網頁,可有效的突破網站限制。

    二、設計圖

    上網客戶端1 。。。上網客戶端m是分散在各處能直接上網的機器,這些上網客戶端機器定時向狀態服務區報告自己的心跳。

    抓取客戶端 1 。。。抓取客戶端 n 是集中放在某處的抓取機器。抓取客戶端機器定時向狀態服務器獲取可用上網客戶端列表,然后抓取客戶端機器直接與上網客戶端建立連接,抓取客戶端機器直接通過上網客戶端來抓取網頁。

     

    三、實現方案

    方案一:
    在上網客戶端機器上安裝共享上網代理軟件比如ccproxy,抓取客戶端以代理的方式通過上網機器抓取網頁。該方案簡單易行,無技術障礙。


    方案二:
    開發一套簡化版P2P軟件,抓取客戶端機器將抓取請求分發給客戶端機器,客戶端機器將網頁抓取下來傳回給抓取客戶端機器。該方案復雜些,但可擴展性極強。在掌握了大量上網客戶端機器后完全可以做成云計算進行商業運作。

    posted on 2010-12-29 15:47 nianzai 閱讀(2244) 評論(2)  編輯  收藏

    評論:
    # re: 基于P2P模式的分布式抓取方案 2010-12-30 11:40 | 水星家紡
    該方案復雜些,但可擴展性極強。在掌握了大量上網客戶端機器后完全可以做成云計算進行商業運作。

      回復  更多評論
      
    # re: 基于P2P模式的分布式抓取方案 2010-12-30 12:30 | 打底褲
    該方案復雜些,但可擴展性極強。在掌握了大量上網客戶端機器后完全可以做成云計算進行商業運作。  回復  更多評論
      

    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 99视频在线免费观看| 亚洲国产aⅴ成人精品无吗| 午夜免费1000部| 亚洲中文字幕无码中文字在线| 亚洲色精品aⅴ一区区三区| 一级白嫩美女毛片免费| 亚洲无线一二三四区手机| 美女视频黄视大全视频免费的| 无码国模国产在线观看免费| 亚洲成AV人影片在线观看| 美女黄网站人色视频免费国产| 亚洲香蕉成人AV网站在线观看| 国产高潮流白浆喷水免费A片 | 美腿丝袜亚洲综合| a级特黄毛片免费观看| 亚洲VA中文字幕不卡无码| 亚洲av无码成人影院一区| 国产乱子伦片免费观看中字| 污污的视频在线免费观看| 亚洲色婷婷综合开心网| 99视频在线观看免费| 亚洲首页在线观看| 成人免费激情视频| 国产亚洲一区二区手机在线观看| 99麻豆久久久国产精品免费| 亚洲avav天堂av在线不卡| 老司机在线免费视频| 亚洲产国偷V产偷V自拍色戒| 欧洲精品99毛片免费高清观看| 亚洲第一区视频在线观看| 成人无码区免费A∨直播| 亚洲成人午夜在线| 免费观看美女裸体网站| 乱爱性全过程免费视频| 亚洲国产无套无码av电影| 久久免费的精品国产V∧| 亚洲国产欧美日韩精品一区二区三区 | 日日操夜夜操免费视频| 成人网站免费大全日韩国产 | 久久精品国产亚洲AV久| 亚洲成年人啊啊aa在线观看|