<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    MDA/MDD/TDD/DDD/DDDDDDD
    posts - 536, comments - 111, trackbacks - 0, articles - 0
      BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

    ruby解析html

    Posted on 2010-02-20 18:14 leekiang 閱讀(1136) 評論(0)  編輯  收藏 所屬分類: ruby
    open-uri庫是ruby的標準附加庫中所帶的,路徑
    C:\Ruby1.8.7\lib\ruby\1.8\open-uri.rb

    require?'open-uri'
    open(
    'c:/boot.ini'){|file|
    ??puts?file.
    class??#File
    }
    open(
    'http://coderlee.cnblogs.com'){|file|
    ??puts?file.
    class??#Tempfile
    }
    可以看出,打開一個本機文件的塊參數是File類型,而打開一個uri的塊參數是一個Tempfile類型。還有一點要注意,就是open-uri里面的open方法會自動對302 redirection重定向地址進行追蹤訪問,而Net::HTTP#get方法則不會自動追蹤302重定向地址。(摘自這里)

    require?'nokogiri'
    require?
    'open-uri'
    doc?=?Nokogiri::HTML(open('http://www.huomo.cn'))
    doc.search(
    "//h2/a").each?do?|link|
    ??puts?link.inner_text
    ??puts?link[:href]
    end

    url?=?'http://www.google.cn/search?hl=zh-CN&q=%BC%D6%B1%A6%D3%F1'
    doc?
    =?Nokogiri::HTML.parse(open(url),?nil,?'gb2312')#不這樣寫會有亂碼

    doc.css(
    'h3.r?a.l').each?do?|link|
    ??puts?link.inner_text
    end

    doc.xpath(
    '//h3/a[@class="l"]').each?do?|link|
    ??puts?link.content
    end

    doc.search(
    'h3.r?a.l',?'//h3/a[@class="l"]').each?do?|link|
    ??puts?link.content
    end

    參考http://www.javaeye.com/topic/557485

    主站蜘蛛池模板: 99视频在线免费看| 亚洲AV无码一区二三区| 亚洲人成网站免费播放| 亚洲精品一级无码鲁丝片| 中文字幕手机在线免费看电影 | 男女超爽视频免费播放| 亚洲性猛交XXXX| 免费人成视频在线| 波霸在线精品视频免费观看| 亚洲国产精品综合久久2007| 亚洲精品视频久久久| 亚洲精品视频在线观看免费| 人体大胆做受免费视频| 亚洲人成网站18禁止久久影院 | 中文字幕a∨在线乱码免费看| 亚洲av片不卡无码久久| 亚洲中文字幕在线观看| 免费人成视频在线| 午夜免费福利小电影| 无遮挡免费一区二区三区| 亚洲国产成人精品久久 | 国产精品亚洲专区无码WEB| 亚洲日本一区二区| 亚洲日韩国产精品乱| 久久精品无码一区二区三区免费| 成全动漫视频在线观看免费高清版下载| 亚洲精品又粗又大又爽A片| 亚洲综合无码一区二区| 亚洲熟妇丰满多毛XXXX| 国产男女猛烈无遮挡免费视频| 18女人腿打开无遮掩免费| 国产视频精品免费视频| AV激情亚洲男人的天堂国语| 亚洲中文字幕久久精品无码2021| 亚洲综合av永久无码精品一区二区| 国产大片51精品免费观看| 免费精品国产自产拍在| 7m凹凸精品分类大全免费| 在线观看特色大片免费网站| 一区免费在线观看| 免费无码专区毛片高潮喷水|