常用符號
Paste_Image.png
常用方法
findall:匹配所有符合規(guī)律的內(nèi)容,返回列表
search:匹配第一個(gè)符合規(guī)律的內(nèi)容,返回正則表達(dá)式對象
sub:替換內(nèi)容,返回替換后的值(替換頁碼)
picdownloader.py
#-*-coding:utf8-*-
import re
import requests
#讀取源代碼文件
f = open('source.txt','r')
html = f.read()
f.close()
#匹配圖片網(wǎng)址
pic_url = re.findall('img src="(.*?)" class="lessonimg"',html,re.S)
i = 0
for each in pic_url:
print 'now downloading:' + each
pic = requests.get(each)
fp = open('pic\\' + str(i) + '.jpg','wb')
fp.write(pic.content)
fp.close()
i += 1
20161204補(bǔ)充:
匹配 以@為中心,返回能夠找到左右兩邊有相同字符的字符串
(?=pattern) 正向預(yù)查,在任何匹配 pattern 的字符串開始處匹配查找字符串。這是一個(gè)非獲取匹配,也就是說,該匹配不需要獲取供以后使用。例如,'Windows (?=95|98|NT|2000)' 能匹配 "Windows 2000" 中的 "Windows" ,但不能匹配 "Windows 3.1" 中的 "Windows"
http://www.blogjava.net/mstar/archive/2008/03/14/186377.html