Anaconda是數據科學利器,它的優勢之處在于小白也能快速上手。
我們知道Python的英文表達是蟒蛇,有意思的是anaconda也是蟒蛇的意思,準確是是水莽,莽中之王,更大、更重、更長。按這層意思理解,anaconda是python的大碼款,倒也是有些貼切的。
Anaconda知多少
回到編程,Anaconda對于初學Python的人很友好,一鍵安裝,不必費心配置python環境,也不用安裝各種常用的庫,就可以直接入手使用。對于數據科學來說,Anaconda是一個百寶箱式的存在。
Anaconda是一個免費開源的Python和R語言的發行版本,用于計算科學(數據科學、機器學習、大數據處理和預測分析),Anaconda致力于簡化包管理和部署。
Anaconda的包使用軟件包管理系統Conda進行管理。超過1200萬人使用Anaconda發行版本,并且Anaconda擁有超過1400個適用于Windows、Linux和MacOS的數據科學軟件包。
總結Anaconda的三大特點:
內置python,高度集成python數據科學生態
擁有強大的包管理工具-conda
可用超過600個python數據科學庫
Anaconda擁有個人版、商業版、團隊版、企業版,除個人版不收費外,其他版本都需要付費,
當然對大部分人來說個人版已經完全夠用。和python一樣,Anaconda不挑平臺,在windows、os、linux上都可以用,目前支持python3.8版本的下載 ,下載完成后一路next就能完成安裝。
官網:
Anaconda | The World's Most Popular Data Science Platform
下載地址:
安裝教程:
Installation - Anaconda documentation
學習文檔:
Anaconda能做什么?
前面說過Anaconda是一個python數據科學百寶箱,所以它的作用就是燃爆數據科學,讓小白也可以輕松玩數據。
你可以利用Anaconda研究數據處理、數據建模、機器學習、神經網絡、自然語言處理、可視化展示、教學等等。既能一人獨秀,也可以團隊作戰。
神奇的conda
說說conda,這是Anaconda的殺手锏。
Conda是一個開源、跨平臺和語言無關的軟件包管理和系統管理系統,通過Conda可安裝、升級和升級軟件包依賴。Conda為Python程序創造,但是它可以打包、分發任意語言編寫的軟件(例如R語言)和包含多語言的項目。
conda和pip都可以管理python庫,但最大的不同在于conda是跨平臺且不限語言的,而且可以獨自創建虛擬環境。因為conda立足于數據科學生態,不像pip可以安裝幾乎所有的python庫(來自pypl),conda只能安裝anaconda里支持的數據科學庫(600多個)。
主要的數據科學內置庫包括pandas、numpy、matplotlib、jupyter、scipy、ipython、nltk、notebook、sikit-learn、seaborn、xlrd、xlwt......
一般把這些數據科學庫分為四大類:基礎庫(jupyter、pandas、numpy、scipy),機器學習庫(keras、tensorflow、pytorch、sikit-learn、nltk),可視化庫(matplotlib、seaborn、plotly)、拓展計算庫(numba、dask、pyspark)
這些庫可以通過conda安裝,也可以在GUI界面Navigator上點擊安裝或更新。
有興趣可以去官網看看這些神奇的家伙:Anaconda庫大全
附conda文檔:Conda - Conda documentation
Anaconda其他優秀特性
- 擁有界面化的應用程序及包管理應用-Navigator
- 支持R語言
Anaconda不僅適用于Python,還支持R,使用conda安裝R并管理R包
- 學習社區
Anaconda的缺點
Anaconda的優點也是它的缺點,功能太齊全就顯得很臃腫,一個安裝包快500M,所以不少人去擁抱miniconda了。
但無論如何,Anaconda都是python數據科學最好的伙伴。