瀑布流的功能開(kāi)發(fā)完了,感覺(jué)還不錯(cuò),地址是:http://www.656463.com/waterfall,其中也有一些知識(shí)點(diǎn),和大家分享一下。既然是瀑布流,就會(huì)涉及到圖片,在這里我是獲取本站文章中的圖片,所以本節(jié)就是用jsoup獲取文章中的圖片
jsoup簡(jiǎn)單介紹
jsoup 是一款Java 的HTML解析器,可直接解析某個(gè)URL地址、HTML文本內(nèi)容。它提供了一套非常省力的API,可通過(guò)DOM,CSS以及類似于jQuery的操作方法來(lái)取出和操作數(shù)據(jù)。
使用jsoup很簡(jiǎn)單,就是下載jar包,然后就能用里面的API進(jìn)行解析了
中文地址是:http://www.open-open.com/jsoup/
下載jsoup地址:http://jsoup.org/download,最新版是jsoup-1.7.2.jar
獲取文章圖片
獲取文章的圖片,就是用jsoup在文章內(nèi)容里解析出文章路徑
- List<String> imgs = JsoupUtil.getImgSrc(article.getContent());
解析工具類
- /**
- * 解釋HTML獲取圖片列表
- * @param html HTML內(nèi)容
- * @return 圖片列表
- */
- public static List<String> getImgSrc(String html){
- List<String> imgSrcs= new ArrayList<String>();
-
- Document doc = Jsoup.parse(html);
- Elements imgs = doc.getElementsByTag("img");
- for (Element img : imgs) {
- String imgSrc = img.attr("src");
- if(imgSrc!=null && imgSrc.trim().length()>0){
- imgSrcs.add(imgSrc);
- }
- }
-
- return imgSrcs;
- }
簡(jiǎn)單吧,就這樣了
本文鏈接:用jsoup獲取文章中的圖片-瀑布流系列文章,由領(lǐng)悟書(shū)生原創(chuàng)
轉(zhuǎn)載請(qǐng)注明出處【http://www.656463.com/article/348】