<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    konhon

    忘掉過去,展望未來。找回自我,超越自我。
    逃避不一定躲的過, 面對(duì)不一定最難過, 孤單不一定不快樂, 得到不一定能長(zhǎng)久, 失去不一定不再擁有, 可能因?yàn)槟硞€(gè)理由而傷心難過, 但我卻能找個(gè)理由讓自己快樂.

    Google

    BlogJava 首頁 新隨筆 聯(lián)系 聚合 管理
      203 Posts :: 0 Stories :: 61 Comments :: 0 Trackbacks

    ?

    import ?org.htmlparser.Node;
    import ?org.htmlparser.NodeFilter;
    import ?org.htmlparser.Parser;
    import ?org.htmlparser.filters.TagNameFilter;
    import ?org.htmlparser.tags.TableTag;
    import ?org.htmlparser.util.NodeList;

    /**
    ?*?<br>
    ?*?標(biāo)題:?<br>
    ?*?功能概要:?<br>
    ?*?版權(quán):?cityyouth.cn?(c)?2005?<br>
    ?*?公司:上海城市青年網(wǎng)?<br>
    ?*?創(chuàng)建時(shí)間:2005-12-21?<br>
    ?*?修改時(shí)間:?<br>
    ?*?修改原因:
    ?*?
    ?*?
    @author ?張偉
    ?*?
    @version ?1.0
    ?
    */
    public ? class ?TestYahoo?{
    ????
    public ? static ? void ?testHtml()?{
    ????????
    try ?{
    ????????????String?sCurrentLine;
    ????????????String?sTotalString;
    ????????????sCurrentLine?
    = ? "" ;
    ????????????sTotalString?
    = ? "" ;
    ????????????java.io.InputStream?l_urlStream;
    ????????????java.net.URL?l_url?
    = ? new ?java.net.URL(
    ????????????????????
    " http://sports.sina.com.cn/iframe/nba/live/ " );
    ????????????java.net.HttpURLConnection?l_connection?
    = ?(java.net.HttpURLConnection)?l_url
    ????????????????????.openConnection();
    ????????????l_connection.connect();
    ????????????l_urlStream?
    = ?l_connection.getInputStream();
    ????????????java.io.BufferedReader?l_reader?
    = ? new ?java.io.BufferedReader(
    ????????????????????
    new ?java.io.InputStreamReader(l_urlStream));
    ????????????
    while ?((sCurrentLine? = ?l_reader.readLine())? != ? null )?{
    ????????????????sTotalString?
    += ?sCurrentLine;
    ????????????}
    ????????????System.out.println(sTotalString);

    ????????????System.out.println(
    " ==================== " );
    ????????????String?testText?
    = ?extractText(sTotalString);
    ????????????System.out.println(testText);
    ????????}?
    catch ?(Exception?e)?{
    ????????????e.printStackTrace();
    ????????}

    ????}

    ????
    /**
    ?????*?抽取純文本信息
    ?????*?
    ?????*?
    @param ?inputHtml
    ?????*?
    @return
    ?????
    */
    ????
    public ? static ?String?extractText(String?inputHtml)? throws ?Exception?{
    ????????StringBuffer?text?
    = ? new ?StringBuffer();

    ????????Parser?parser?
    = ?Parser.createParser( new ?String(inputHtml.getBytes(),
    ????????????????
    " 8859_1 " ),? " 8859-1 " );
    ????????
    // ?遍歷所有的節(jié)點(diǎn)
    ????????NodeList?nodes? = ?parser.extractAllNodesThatMatch( new ?NodeFilter()?{
    ????????????
    public ? boolean ?accept(Node?node)?{
    ????????????????
    return ? true ;
    ????????????}
    ????????});
    ????????Node?node?
    = ?nodes.elementAt( 0 );
    ????????text.append(
    new ?String(node.toPlainTextString().getBytes( " 8859_1 " )));
    ????????
    return ?text.toString();
    ????}

    ????
    /**
    ?????*?讀取文件的方式來分析內(nèi)容.?filePath也可以是一個(gè)Url.
    ?????*?
    ?????*?
    @param ?resource
    ?????*????????????文件/Url
    ?????
    */
    ????
    public ? static ? void ?test5(String?resource)? throws ?Exception?{
    ????????Parser?myParser?
    = ? new ?Parser(resource);

    ????????
    // ?設(shè)置編碼
    ????????myParser.setEncoding( " GBK " );
    ????????String?filterStr?
    = ? " table " ;
    ????????NodeFilter?filter?
    = ? new ?TagNameFilter(filterStr);
    ????????NodeList?nodeList?
    = ?myParser.extractAllNodesThatMatch(filter);
    ????????TableTag?tabletag?
    = ?(TableTag)?nodeList.elementAt( 11 );
    ????????????
    ????????????System.out.println(tabletag.toHtml());
    ????????????
    ????????????System.out.println(
    " ============== " );

    ????}

    ????
    /*
    ?????*?public?static?void?main(String[]?args)?{?TestYahoo?testYahoo?=?new
    ?????*?TestYahoo();?testYahoo.testHtml();?}
    ?????
    */
    ????
    public ? static ? void ?main(String[]?args)? throws ?Exception?{
    ????????test5(
    " http://sports.yahoo.com/nba/scoreboard " );
    ????}
    }
    posted on 2007-03-08 06:50 konhon 優(yōu)華 閱讀(1595) 評(píng)論(0)  編輯  收藏

    只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。


    網(wǎng)站導(dǎo)航:
     
    主站蜘蛛池模板: 国产在线a免费观看| 美女露隐私全部免费直播| 99久久亚洲综合精品成人网| 亚洲国产精品久久久天堂| 国产A在亚洲线播放| 亚洲AV永久青草无码精品| 国产亚洲精AA在线观看SEE| 亚洲精品乱码久久久久久自慰| 亚洲综合日韩久久成人AV| 日韩a毛片免费观看| 羞羞的视频在线免费观看| 美女无遮挡免费视频网站| 香蕉国产在线观看免费| fc2成年免费共享视频18| 两个人www免费高清视频| 成人精品一区二区三区不卡免费看| 国产精品白浆在线观看免费| 99re免费在线视频| 日韩版码免费福利视频| 国产高清在线免费视频| 亚洲狠狠爱综合影院婷婷| 亚洲人成网亚洲欧洲无码久久| 亚洲va久久久噜噜噜久久男同| 亚洲综合日韩中文字幕v在线| 亚洲国产精品白丝在线观看| 亚洲视频在线观看2018| 欧洲亚洲综合一区二区三区| 亚洲午夜精品国产电影在线观看| 亚洲AV无码一区二区三区在线| 亚洲人成色777777老人头| 一级毛片a免费播放王色| 中文字幕久精品免费视频| 国产高清免费视频| 国产麻豆免费观看91| 久久久久无码专区亚洲av| 亚洲色图在线观看| 亚洲中文字幕无码久久| 免费观看四虎精品成人| 日韩午夜理论免费TV影院| 日本免费网站观看| 亚洲中文字幕无码中文字在线|