1. 圖片的下載
import requests
url = 'http://g.hiphotos.baidu.com/image/pic/item/5366d0160924ab18014cefd83bfae6cd7a890b82.jpg'
response = requests.get(url)
# 獲取bytes類型的響應
#當傳入字符串的時候會轉換成一個request對象
data = response.content
with open('風景.jpg','wb') as f:
? ? f.write(data)
2.etree.HTML()可以用來解析字符串格式的HTML文檔對象,將傳進去的字符串轉變成_Element對象。作為_Element對象,可以方便的使用getparent()、remove()、xpath()等方法。
如果想通過xpath獲取html源碼中的內容,就要先將html源碼轉換成_Element對象,然后再使用xpath()方法進行解析。