python2.7:安裝完pip之后可以使用pip install scrapy命令安裝scrapy,但是可能會(huì)遇到error: Unable to find vcvarsall.bat錯(cuò)誤,此時(shí)很可能是因?yàn)門wisted沒安裝;需要再手動(dòng)安裝一下,去這個(gè)網(wǎng)址下載:Twisted-10.2.0.winxp32-py2.7.msi;然后安裝一下,安裝目錄一定要是你的python安裝目錄,否則無法安裝;安裝完之后再執(zhí)行pip install scrapy就沒錯(cuò)誤了;驗(yàn)證一下:import scrapy,沒錯(cuò)誤的話就說明scrapy已經(jīng)安裝成功了
python3.5:自從3.3以后python的安裝包中都默認(rèn)帶了pip工具,所以不必再單獨(dú)安裝pip;等安裝完、配完python,即可在cmd下輸入pip驗(yàn)證;如果執(zhí)行pip install scrapy,會(huì)發(fā)現(xiàn)有如下錯(cuò)誤
顯示沒有安裝libxml2,那就安裝吧,執(zhí)行pip install libxml2還是有錯(cuò);后來發(fā)現(xiàn)安裝lxml時(shí)會(huì)附帶安裝libxml2,那就執(zhí)行pip install lxml,還是有錯(cuò)!換種方法把,左查右查終于發(fā)現(xiàn)了一個(gè)方法:執(zhí)行pip install wheel;成功之后到http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml這個(gè)網(wǎng)址按Crtl+F搜索lxml,然后找到對(duì)應(yīng)python版本號(hào)的whl文件下載下來【我是python3.5,對(duì)應(yīng)的是lxml-3.4.4-cp35-none-win32.whl】;下載到本地,切換到下載目錄,執(zhí)行pip install lxml-3.6.0-cp35-cp35m-win32.whl;安裝成功之后再執(zhí)行pip install scrapy;是不是成功了呢?
如果在你寫完爬蟲之后執(zhí)行scrapy crawl XXX;你可能會(huì)遇到這樣的問題:
顯示缺少twisted ,那就安裝吧;到官網(wǎng)上去下載:https://twistedmatrix.com/Releases/Twisted/16.2/下載下面那個(gè)壓縮包,然后解壓,cd切換到下載目錄,執(zhí)行pip setup.py install 就安裝好了twisted;再次執(zhí)行scrapy crawl XXX。如果上面按個(gè)問題還沒解決的話就執(zhí)行pip install twisted-win
注意:lxml是解析xml和html的工具包,做爬蟲必不可少;twisted是一個(gè)事件驅(qū)動(dòng)型的網(wǎng)絡(luò)引擎,對(duì)于爬蟲也必不可少