2021.4.23
持續更新中。。。
參考:《R語言數據可視化之美》、《ggplot2:數據分析與圖形藝術》、《R數據可視化手冊》、學術數據分析及可視化
1. ggplot2簡介
????ggplot2是一個用來繪制統計圖形(可視化數據)的R軟件包。采用圖層的設計方式,從原始的圖層開始,首先繪制原始數據,然后不斷地添加圖形注釋和統計匯總結果。
2. ggplot2的特點
- 采用圖層設計方式,有明確的起始圖層。圖層之間的疊加用
+
實現,越往后,圖層越在上方。 - 將表征數據和圖形細節分開,能快速將圖形表現出來。
- 擴展包豐富,有專門調整顏色、字體和主題等的輔助包。
3. ggplot2基本語法
????整套語法的核心是如何將數據(變量)映射到幾何對象(geom,包括點、線、面等)的圖形屬性(aes,包括顏色、形狀、大小等)。此外還包括數據的統計變換(stats)、繪制特定坐標系(coord)、形成分面(facet)等過程。
- ggplot():底層繪制函數。參數主要是需要可視化的數據集(通常是數據框),以及一些常規的控制顏色、形狀、大小等圖形屬性映射。
- geom_xxx:需要轉換成的幾何圖形。常用的有:geom_point()、geom_line()、geom_area()等
- stat_xxx:統計變換。對數據進行的某種匯總,例如對數據分組計數以創建直方圖。
4. ggplot2語法進階
4.1 圖層的五個組成部分
- 數據(data)
- 一組圖形屬性映射(mapping)
- 一種幾何對象
- 一種統計變換
- 一種位置調整方式,
4.1 繪圖基本過程
第一步:利用ggplot()
函數創建底層圖形
兩個主要參數:數據和圖形屬性映射
- 數據,數據框
- 圖形屬性映射
ase()
主要參數
2.1 需要映射到圖形x軸和y軸的第一和第二變量
2.2 需要映射到圖形顏色/形狀/大小等的第三變量
2.3 是否需進行分組的變量
注:
- ggplot()函數創建的圖形對象在加上其他圖層之前是無法顯示的
aes()
的參數盡量簡單化,可以后續進行自定義的修改- 當需要使用多個數據的時候,底層可直接用不接任何參數的
ggplot()
,但是在后續繪圖添加數據的時候,數據的添加需要使用data =
的形式。
第二步:利用幾何對象geom_xxx
函數生成圖形
每個幾何對象都有一組它能識別的圖形屬性和一組繪圖所需的值
每個幾何幾何對象都對應著一個默認的統計變換和位置參數,可以直接進行修改