Jsoup 網絡爬蟲

1. Jsoup下載地址:

http://jsoup.org/packages/jsoup-1.8.1.jar

或者Maven Central

http://central.maven.org/maven2/org/jsoup/jsoup/1.8.1/jsoup-1.8.1.jar

2.實現源碼

public classRun {

public static voidmain(String[] args)throwsCommonException,IOException{

String urlStr ="https://m.XXXXx.com";

// 將獲取的網頁 HTML 源代碼轉化為 Document

// Document doc = Jsoup.parse(htmlStr);

Document doc = Jsoup.connect(urlStr).get();

//head元素中內容

Element articleEle = doc.head();

//body元素中內容

Element contentEle = doc.body();

// 標題

String titleStr = articleEle.text();

System.out.println(titleStr);

Elements images = contentEle.getElementsByTag("img");

String[] imageUrls =newString[images.size()];

for(inti =0;i < imageUrls.length;i++) {

imageUrls[i] = images.get(i).attr("src");

System.out.println(imageUrls[i]);

}

}

}

3.運行結果

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容