urllib2 第一彈 ----urlopen()

urllib2 第一篇

資源訪問:urlopen()
數(shù)據(jù)讀取:read()

urlopen()-->response

-->response-->read()抓取網(wǎng)頁數(shù)據(jù)
-->response-->info()抓去網(wǎng)頁請求報頭信息
-->response-->geturl()抓取訪問地址
-->response-->getcode()抓取訪問錯誤代碼

import urllib2

req = urllib2.Request('https://www.baidu.com')
response = urllib2.urlopen(req)
pg = response.read()
print (pg)

運行結果:


Paste_Image.png

urllib2 第二篇

偽造瀏覽器請求
請求對象Request

-->Reauest-->add_header(key,value):設置請求頭數(shù)據(jù)
-->Reauest-->add_header(key):根據(jù)名稱獲取請求頭數(shù)據(jù)

# -*- coding:utf-8 -*-
import urllib2
from urllib2 import Request
#偽造瀏覽器
Headers={"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.101 Safari/537.36"}
req = Request('https://www.baidu.com',headers=Headers)
response = urllib2.urlopen(req)
pg = response.read()
print (pg)

運行結果:


Paste_Image.png
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • Spring Cloud為開發(fā)人員提供了快速構建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 134,924評論 18 139
  • urllib2是Python的一個獲取URLs的組件。他以urlopen函數(shù)的形式提供了一個非常簡單的接口,具有利...
    查無此人asdasd閱讀 1,545評論 0 3
  • Python爬蟲入門(urllib+Beautifulsoup) 本文包括:1、爬蟲簡單介紹2、爬蟲架構三大模塊3...
    廖少少閱讀 9,931評論 0 6
  • 一、網(wǎng)絡爬蟲的定義 網(wǎng)絡爬蟲,即Web Spider,是一個很形象的名字。把互聯(lián)網(wǎng)比喻成一個蜘蛛網(wǎng),那么Spide...
    隨風化作雨閱讀 1,120評論 0 0
  • 一、概述 urllib2是Python的一個針對URLs的庫。他以urlopen函數(shù)的形式提供了一個非常簡單的...
    MiracleJQ閱讀 1,508評論 0 5