從本節開始,我們開始寫代碼模塊的教程了。
1.為什么爬蟲要用Python
Python寫代碼速度快。Python自誕生以來,秉承的思想就是簡單優于復雜。所以Python寫代碼效率很高,在眾多Python強大的庫的加持下,我們可以用短短幾十行代碼寫出來一個完整的Python爬蟲程序。這在其他的語言里,是很難做到的。
Python學習成本低。Python的語法沒有其他語言那么復雜,又因為是動態類型的語言,學習成本降低了很多,能夠更快地上手,更方便的學習。
Python的多平臺運行也能成為一個加分項。一份代碼,能夠在linux、MacOS、Windows都能夠運行,并不需要對系統進行適配。
Python是一門功能強大的語言。用Python可以做到很多事情,現在人工智能大火,用得最多的語言是Python;用Python也可以寫網站后臺,而且有特別優秀的框架(Django、Flask、webpy...);用Python也能做桌面端GUI程序(PyQt、Python自帶的tkinter);Python最強大的還是作為一個膠水語言的特性,我們可以用C語言寫好一個功能,然后打包成Python的包,這樣Python就能把一些對運算速度要求高的步驟,交給C語言這樣的高性能語言去解決。
2. Python2.7 還是 Python3.x
毫無疑問,選擇3.x。Python2.7作為一個歷史遺留,將會在2020年失去Python團隊的維護,所以如果不是強制要求用Python2.7,那就來Python3.x的懷抱吧。這里沒有復雜燒腦的編碼問題,對Unicode支持良好。
3. 下載Python安裝包
1.首先進入Python官網的下載頁面https://www.python.org/downloads/
2.進入下載頁面之后,找到下面的Python列表。選擇Python3.6的最新版3.6.5的,然后點擊Download進入詳情頁面。(建議不要下載最新大版本,比如有Python3.8.*,那你下載Python3.7.*的安裝包,可以避開很多新版本可能的bug。
)
3.在下載文件選擇頁面選擇適合你系統類型的Python安裝包。
選擇第一步,看表格第二列,找到符合你的系統的那幾行,比如我的是Windows,那就是找到Windows的那幾行。
第二步,根據你的系統位數選擇x86-64版本還是x86版本。x86-64就是我們說的64位的操作系統,x86就是32位操作系統。如何判斷系統位數(桌面找到此電腦,右鍵選擇屬性)
然后在彈出來的電腦詳情頁面,有個系統類型。
如果實在不會,那就選擇32位的就好,因為64位系統也兼容32位的Python。
現在知道了我們選擇哪個系統哪個類型的安裝包了,可是x64和x86都有3個可以下載的包,應該選哪個呢?
第三步,選擇安裝包。
Windows x86-64 embeddable zip file 是嵌入式壓縮包,缺少了一些Python的組件。不建議使用。
Windows x86-64 executable installer 是可執行的安裝包,帶有所有組件,我們只需要在安裝過程中對一些必要的設置勾選就好。推薦使用。
Windows x86-64 web-based installer 是基于網絡的安裝包,它會在你啟動之后,選擇了版本,從網上下載具體的Python文件。但是有一個缺點,它會強制把你的安裝目錄安裝到非常深層次的C盤里面去,會給以后尋找Python路徑帶來麻煩,不建議使用。
所以我們就選擇 Windows x86-64 executable installer 點擊下載了。
4. 安裝Python
點開安裝包,我們開始安裝Python。
a.
首先勾選 Add Python 3.6 to PATH(這樣節約了添加 Python.exe 目錄到環境變量的步驟)
然后點擊Customize installtion。(不選 install Now 是因為 Python 路徑太深,不方便我們去找到)
b.
保持默認全勾選。Next
c.
勾選添加Python到環境變量。然后選擇你要安裝Python的文件夾。在你想要安裝的盤新建一個文件夾,比如Python36,然后在界面選中文件夾。也可以選中了某個文件夾,然后在后面添加\Python36,這樣會自動給你創建python36文件夾,并把Python3.6安裝進去。
點擊Install,坐等安裝完成。
5.測試安裝是否成功
按住Windows鍵+X鍵,會彈出一個框體程序
點擊命令提示符,打開后,輸入 python -V
注意是大寫的V,然后回車。
我們的顯示結果不一樣是因為我同時安裝了Python2.7和3.5。你看到的輸出應該是Python 3.6.5
或者是你當前的Python版本。如果遇到了錯誤,就先繼續下一步。
我們在命令行,再次輸入pip3 -V
(pip -V
也可以,pip3是專指Python3.x版本的pip),V也是大寫的,并回車正常情況下輸出和下面差不多,只是Python版本或者PIP版本不一樣。
如果都正常,那么恭喜你,安裝Python成功了,并且pip的環境變量也配置好了!
6.解決遇到的問題。
在上一步如果顯示'python' 不是內部或外部命令,也不是可運行的程序或批處理文件。
,那就是我們需要手動給Python設置環境變量。
'pip3' 不是內部或外部命令,也不是可運行的程序或批處理文件。
,那就是我們需要手動給pip設置環境變量。
設置環境變量的步驟:右鍵此電腦 —> 屬性—>左邊的高級系統設置—>環境變量
選中系統變量里面的 Path ,點擊編輯。
找到我們安裝Python的目錄,比如我安裝到了C盤的Python35文件夾中。
a. 添加Python到環境變量
提示Python不是內部或者外部命令
的才需要這一步。我們找到了安裝Python的 文件夾,里面如果有一個 python.exe。那就找對了文件夾了。
我們點擊上面的
,就變成了上個圖我們所看到的的情況了。然后我們復制這個路徑。
回到剛才的環境變量里面,點擊新增,然后把剛剛復制的路徑粘貼進去。
點擊一下空白處,就保存了。再重新Windows鍵+X鍵打開命令行,Python -V
命令就能正常輸出了。
b.添加pip到環境變量。
我們找到Python安裝目錄下的Scripts文件夾并進入,同樣也點擊頂部的路徑并復制,到環境變量界面,再次點擊新建,然后粘貼,點擊空白處。再重新用重新Windows鍵+X鍵打開命令行,pip3 -V
就能輸出了。
如果按照以上步驟做了,還是提示不是內部或外部命令的。請注意你是否關閉了命令行,并在添加了環境變量之后重啟再打開的命令行。在新增環境變量之前的打開的命令行,是不會起效果的。
大功告成!
傳送門:
下一章:
爬蟲入門教程⑥—安裝爬蟲常用工具包
所有的章節: