<rt id="bn8ez"></rt>

<label id="bn8ez"></label>

<span id="bn8ez"></span>

<label id="bn8ez"><meter id="bn8ez"></meter></label>

我的蛋殼

倡導自由、開放、分享的Java技術社區 http://www.javaread.com

HtmlCleaner,Html解析專家

通常互聯網上的HTML頁面都是不規則的，非結構化的頁面。如果我們需要訪問或者抽取里面的內容的話，我們需要分析HTML頁面，去除垃圾。
而最近新發布的 HtmlCleaner 就是這樣一個工具. 能夠幫助我們將HTML 文檔轉化為結構化的XML文檔。雖然目前已經有了類似這樣的工具，但是HtmlCleaner 能夠完成幾乎所有的HTML轉換，而且不到30k，這是他們值得稱道的地方。

HtmlCleaner是一個開源的Html文檔解析器。HtmlCleaner能夠安全的解析和轉換web上的HTML到標準的XML，重新排序每個元素，然后生成結構良好(Well-Formed)的XML文檔。默認它遵循的規則是類似于大部份web瀏覽器為創文檔對象模型所使用的規則。然后，用戶可以提供自定義tag和規則組來進行過濾和匹配。它被設計的小，快速，靈活而且獨立。HtmlCleaner也可用在Java代碼中，當命令行工具或Ant任務。解析后編程輕量級文檔對象，能夠很容易的被轉換到DOM或者JDom標準文檔，或者通過各種方式(壓縮，打印)連續輸出XML。

新版本的重要功能更新包括：
1.HtmlCleaner的文檔對象模型現在擁有了一些函數，處理節點和屬性，所以現在在序列化之前搜索或者編輯是非常容易的。
2.提供基本HtmlCleaner DOM的XPath支持
3.使用XML配置溫江讓創建定制tag變得更加容易
4.修復多個bug以及API改進

更多詳細信息：HTML Parser工具HtmlCleaner 2.0發布

本文作者：javaread.com

posted on 2008-07-17 10:06 javaread.com 閱讀(4115) 評論(6) 編輯收藏

評論

# re: HtmlCleaner,Html解析專家 2008-07-17 10:51 大水牛

昨天試了,感覺還不錯回復更多評論

# re: HtmlCleaner,Html解析專家 2008-07-17 11:25 BeanSoft

呵呵就知道把鏈接都鏈到你的網站去變相廣告太多了就不太好了回復更多評論

# re: HtmlCleaner,Html解析專家 2008-07-17 11:40 kenlee14

我可不管那么多，內容對我有用就行了。以前都用htmlparser來解析網頁，試試這個東東看看再說。
嘿嘿，不好再回來踩你。回復更多評論

# re: HtmlCleaner,Html解析專家 2008-07-17 12:20 隔葉黃鶯

以前用 htmlparser 就是碰到大部分都是不規則的 html 代碼，有些沒轍，這下好了，來了個新的搭檔，估計那些問題都好解決了，標個記，以后需要用到時再回來。回復更多評論

# re: HtmlCleaner,Html解析專家 2008-07-17 12:42 很暴力

建議你的javaread.com上面加個rss，東西不錯，我想訂閱下，無奈找不到rss訂閱地址啊。回復更多評論

# re: HtmlCleaner,Html解析專家[未登錄] 2010-04-14 18:53 小毅

請問htmlCleaner 可以模擬通過用戶名和密碼來登錄么？驗證碼又怎么處理？回復更多評論

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理

導航

統計

隨筆 - 32
文章 - 0
評論 - 117
引用 - 0

常用鏈接

留言簿(3)

隨筆檔案

Java

JavaRead
倡導自由、開放、分享的Java技術社區
討債公司

友情鏈接

搬家公司

搜索

最新評論

1.?re: 簡約之美，JQuery之進度條插件
評論內容較長,點擊標題查看
--zuidaima
2.?re: Google2008開發者大會資料集錦【下載】
摸摸頭
--休漁
3.?re: 在 Eclipse RCP 里使用 JFreeChart，輕松實現畫圖
按照你的代碼寫，怎么在我運行起來，文字都顯示不出來呢？讓我很無解
--pythondebug
4.?re: 簡約之美，JQuery之進度條插件
231
--321
5.?re: 簡約之美，JQuery之進度條插件[未登錄]
法國的
--打工的

閱讀排行榜

評論排行榜

主站蜘蛛池模板：羞羞视频免费观看| 99视频在线免费| 亚洲成a人片在线观看日本| 最近中文字幕电影大全免费版| 在线观看亚洲AV每日更新无码| 日本中文一区二区三区亚洲| 性无码免费一区二区三区在线 | 亚洲色WWW成人永久网址| 日本免费中文字幕| 亚洲人成未满十八禁网站| 日本亚洲成高清一区二区三区 | 免费视频成人片在线观看| 亚洲国产精品久久久久秋霞小| 国产精品亚洲玖玖玖在线观看| 4444www免费看| 日本激情猛烈在线看免费观看 | 亚洲一区二区三区深夜天堂| 亚洲片一区二区三区| 182tv免费观看在线视频| 青青久久精品国产免费看| 亚洲制服丝袜第一页| 亚洲精品高清无码视频| 日本免费电影一区| 最近免费中文字幕高清大全 | 亚洲中文字幕无码不卡电影| 日本阿v免费费视频完整版| 国产精品免费久久久久久久久| 亚洲成a人片在线看| 亚洲午夜精品一区二区| 久久久久亚洲AV综合波多野结衣 | 成人免费午夜视频| 无码人妻丰满熟妇区免费| 一级毛片视频免费观看| 亚洲日韩国产欧美一区二区三区 | 美女视频黄a视频全免费网站色| 91亚洲国产在人线播放午夜| 亚洲最大av无码网址| 国产在线ts人妖免费视频| 真人做人试看60分钟免费视频| 久久免费观看国产99精品| 人人鲁免费播放视频人人香蕉|