最近在學習Scrapy爬蟲系列,在公司寫測試代碼是需要設置代理,而在家是不需要的。在代理來回切換之間讓人很抓狂。
下面記錄下如何在Scrapy設置代理。
- 在Scrapy工程下新建"middlewares.py",和settings.py同級
#!usr/bin/env
# -*-coding:utf-8 -*-
class ProxyMiddleware(object):
# overwrite process request
def process_request(self, request, spider):
# Set the location of the proxy
request.meta['proxy'] = "http://YOUR_PROXY_IP:PORT"
- 修改settings.py文件,這里one是你的項目名稱
DOWNLOADER_MIDDLEWARES = { 'scrapy.contrib.downloadermiddleware.httpproxy.HttpProxyMiddleware': 110,
'one.middlewares.ProxyMiddleware': 100,}