webstorm

https://www.cnblogs.com/woaic/p/6024975.html
http://da7a389f.ngrok.io

# coding=utf-8
import sys
import json

reload(sys)
sys.setdefaultencoding("utf-8")
import requests
import re
from bs4 import BeautifulSoup
url = 'http://ggzy.njzwfw.gov.cn/njggzy/infodetail/?infoid=e46f641c-8651-46e2-b068-d27c689df435&categoryNum=001001001001'
wb_data = requests.get(url)
soup = BeautifulSoup(wb_data.text, 'lxml')
soup.body.div.clear()

times = soup.find_all(text=re.compile(u'訪問次數'))
for time in times:
    time.parent.clear()

items = soup.find_all(text=re.compile(u'南京市公共資源交易中心網'))
for item in items:
    item.parent.clear()
print soup.body
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容