<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    posts - 165, comments - 198, trackbacks - 0, articles - 1
      BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

    扒網頁數據(jdk+正則解析)

    Posted on 2008-03-09 10:46 G_G 閱讀(1510) 評論(2)  編輯  收藏 所屬分類: javaGeneral
    數據扒出效果
    雙色球(2008001=02,04,07,09,14,29#03
    雙色球(2008002=03,04,18,22,25,29#09
    ..

    junit代碼
    package?test;

    import?java.io.InputStream;
    import?java.net.URL;
    import?java.net.URLConnection;
    import?java.util.regex.Matcher;
    import?java.util.regex.Pattern;

    import?junit.framework.TestCase;

    public?class?HttpConn?extends?TestCase?{
    ????
    public?void?testT()?throws?Exception?{
    ????????zq?:
    ????????
    for(int?i=2008001;true;i++){
    ????????????String?num?
    =??getQihao(i)?;
    ????????????System.out.println(
    "雙色球("+i+")="+?num);
    ????????????
    if(num==null||num.equals(""))?break?zq;
    ????????}
    ????}
    ????
    ????
    public?String?getQihao(int?qihao)?throws?Exception?{
    ????????URL?url?
    =?new?URL("http://www.cnlot.net/ssq/details.php?issue="+qihao);
    ????????URLConnection?uconn?
    =?url.openConnection();
    ????????
    ????????String?num?
    =?"";
    ????????
    ????????InputStream?in?
    =?uconn.getInputStream();
    ????????
    byte[]?bs?=?new?byte[in.available()];
    ????????in.read(bs);
    ????????String?date?
    =?new?String(bs)?;
    ????????
    ????????Pattern?pa?
    =?Pattern.compile("?.+color=red>([0-9][0-9])<.+"?);
    ????????Matcher?m?
    =?pa.matcher(date);
    ????????
    while(?m.find()?)
    ????????????num
    +=?m.group(1)+",";
    ????????
    ?????????pa?
    =?Pattern.compile("?.+color=blue>([0-9][0-9])<.+"?);
    ?????????m?
    =?pa.matcher(date);
    ????????
    while(?m.find()?)
    ????????????num?
    =?num.substring(?0,num.length()-1?)+"#"+m.group(1)?;
    ????????
    ????????pa?
    =?Pattern.compile("^(([0-9][0-9],){5,}[0-9][0-9]#([0-9][0-9],)*[0-9][0-9]\\|)*(([0-9][0-9],){5,}[0-9][0-9]#([0-9][0-9],)*[0-9][0-9])*$");
    ????????m?
    =??pa.matcher(num);
    ????????
    if(?m.find()?)
    ????????????
    return?num?;
    ????????
    else?
    ????????????
    return?null?;
    ????}
    }



    評論

    # re: 扒網頁數據(jdk+正則解析)  回復  更多評論   

    2008-03-10 10:08 by richardning
    呵呵,老大催我干活。回頭詳看。。我自己也寫了個抓網絡數據的代碼,呵,有空。比較比較。

    # re: 扒網頁數據(jdk+正則解析)  回復  更多評論   

    2008-03-11 10:18 by 蔣家狂潮
    不錯的文章,
    主站蜘蛛池模板: 无遮免费网站在线入口| 一区二区三区无码视频免费福利| 亚洲视频在线免费播放| 亚洲AV无码一区二区乱孑伦AS| 春意影院午夜爽爽爽免费| 又爽又黄无遮挡高清免费视频| 国产精品亚洲а∨无码播放不卡| 国产大片91精品免费看3| 美女露100%胸无遮挡免费观看| 亚洲av无码成人精品区| 免费视频精品一区二区| AV在线播放日韩亚洲欧| 国产免费拔擦拔擦8X高清在线人| 久久综合九九亚洲一区| 最近2019中文字幕免费直播| 国产成人亚洲合集青青草原精品| 久久久久久久免费视频| 亚洲av永久无码| 国产成人精品久久亚洲高清不卡 | 中国精品一级毛片免费播放| 亚洲综合在线视频| 成人特黄a级毛片免费视频| 欧洲亚洲综合一区二区三区| AV在线亚洲男人的天堂| 免费看又黄又无码的网站| 亚洲精品中文字幕无乱码麻豆| 国产三级免费电影| 免费播放在线日本感人片| 亚洲乱码中文论理电影| 免费播放特黄特色毛片| 免费成人高清在线视频| 在线亚洲高清揄拍自拍一品区| 亚洲福利在线播放| 91免费国产精品| 最新亚洲人成无码网www电影| 国产亚洲综合网曝门系列| 无码人妻一区二区三区免费手机 | 亚洲人成网站免费播放| 极品色天使在线婷婷天堂亚洲| 久久精品亚洲综合一品| 日韩免费视频一区|