<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    MDA/MDD/TDD/DDD/DDDDDDD
    posts - 536, comments - 111, trackbacks - 0, articles - 0
      BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

    ruby解析html

    Posted on 2010-02-20 18:14 leekiang 閱讀(1136) 評論(0)  編輯  收藏 所屬分類: ruby
    open-uri庫是ruby的標準附加庫中所帶的,路徑
    C:\Ruby1.8.7\lib\ruby\1.8\open-uri.rb

    require?'open-uri'
    open(
    'c:/boot.ini'){|file|
    ??puts?file.
    class??#File
    }
    open(
    'http://coderlee.cnblogs.com'){|file|
    ??puts?file.
    class??#Tempfile
    }
    可以看出,打開一個本機文件的塊參數是File類型,而打開一個uri的塊參數是一個Tempfile類型。還有一點要注意,就是open-uri里面的open方法會自動對302 redirection重定向地址進行追蹤訪問,而Net::HTTP#get方法則不會自動追蹤302重定向地址。(摘自這里)

    require?'nokogiri'
    require?
    'open-uri'
    doc?=?Nokogiri::HTML(open('http://www.huomo.cn'))
    doc.search(
    "//h2/a").each?do?|link|
    ??puts?link.inner_text
    ??puts?link[:href]
    end

    url?=?'http://www.google.cn/search?hl=zh-CN&q=%BC%D6%B1%A6%D3%F1'
    doc?
    =?Nokogiri::HTML.parse(open(url),?nil,?'gb2312')#不這樣寫會有亂碼

    doc.css(
    'h3.r?a.l').each?do?|link|
    ??puts?link.inner_text
    end

    doc.xpath(
    '//h3/a[@class="l"]').each?do?|link|
    ??puts?link.content
    end

    doc.search(
    'h3.r?a.l',?'//h3/a[@class="l"]').each?do?|link|
    ??puts?link.content
    end

    參考http://www.javaeye.com/topic/557485

    主站蜘蛛池模板: 亚洲国产日韩一区高清在线| 国产成人综合久久精品免费| 国产成人亚洲精品青草天美| 一级黄色毛片免费看| 亚洲第一区精品日韩在线播放| 亚洲AV无码资源在线观看| 成人午夜大片免费7777| 亚洲国产成人精品无码区二本 | 亚洲精品动漫免费二区| 夜夜爽免费888视频| 亚洲成在人线aⅴ免费毛片| 四虎www成人影院免费观看| 亚洲av无码专区国产不乱码| 四虎国产精品免费久久影院| 羞羞视频免费网站含羞草| 亚洲国产中文v高清在线观看| 国产男女爽爽爽免费视频 | 亚州免费一级毛片| 国产精品亚洲四区在线观看| 国内自产少妇自拍区免费| 午夜在线亚洲男人午在线| 亚洲第一黄色网址| 国产va在线观看免费| 亚洲成人网在线观看| 日韩中文字幕在线免费观看| 免费一级全黄少妇性色生活片| 国内精品久久久久久久亚洲| 久久狠狠躁免费观看2020| 亚洲一欧洲中文字幕在线| 日本人护士免费xxxx视频| 七次郎成人免费线路视频| 亚洲AV无码乱码在线观看裸奔| 国产精品怡红院永久免费| 亚洲色www永久网站| 亚洲欧洲精品成人久久奇米网| 久久国产精品免费视频| 亚洲色少妇熟女11p| 国产亚洲一区二区手机在线观看| 久久福利资源网站免费看| 国产成人人综合亚洲欧美丁香花| 亚洲精品无码成人片久久|