瀑布流的功能開發完了,感覺還不錯,地址是:http://www.656463.com/waterfall,其中也有一些知識點,和大家分享一下。既然是瀑布流,就會涉及到圖片,在這里我是獲取本站文章中的圖片,所以本節就是用jsoup獲取文章中的圖片
jsoup簡單介紹
jsoup 是一款Java 的HTML解析器,可直接解析某個URL地址、HTML文本內容。它提供了一套非常省力的API,可通過DOM,CSS以及類似于jQuery的操作方法來取出和操作數據。
使用jsoup很簡單,就是下載jar包,然后就能用里面的API進行解析了
中文地址是:http://www.open-open.com/jsoup/
下載jsoup地址:http://jsoup.org/download,最新版是jsoup-1.7.2.jar
獲取文章圖片
獲取文章的圖片,就是用jsoup在文章內容里解析出文章路徑
- List<String> imgs = JsoupUtil.getImgSrc(article.getContent());
解析工具類
- /**
- * 解釋HTML獲取圖片列表
- * @param html HTML內容
- * @return 圖片列表
- */
- public static List<String> getImgSrc(String html){
- List<String> imgSrcs= new ArrayList<String>();
-
- Document doc = Jsoup.parse(html);
- Elements imgs = doc.getElementsByTag("img");
- for (Element img : imgs) {
- String imgSrc = img.attr("src");
- if(imgSrc!=null && imgSrc.trim().length()>0){
- imgSrcs.add(imgSrc);
- }
- }
-
- return imgSrcs;
- }
簡單吧,就這樣了
本文鏈接:用jsoup獲取文章中的圖片-瀑布流系列文章,由領悟書生原創
轉載請注明出處【http://www.656463.com/article/348】