前提
ggplot2簡介
美學映射Aesthetic Mappings
SessionInfo
為了進一步加強以及整合自己data science的能力,最近打算在我的博客開辟一個新類r4ds,專門用來記錄學習Hadley Wickham大神的新作R for Data Science的讀書筆記。該書推薦我們入門data science可以從可視化開始,這也是該書目錄布局的第一章。因此開始學習R語言可視化。
前提
本章主要聚焦于可視化包ggplot2,為了寫這本書,大神專門整合了一系列神包成為一個包tidyverse,因此第一步就是要先安裝該包并加載。
#install tidyverse
install.packages("tidyverse")
#load tidyverse
library(tidyverse)
ggplot2簡介
利用數據集mpg來探究發動機大小跟好友耗油是否存在某種關系,先check一下該數據集。
head(mpg)
在各個變量中:
- disp:車發動機大小
- hwy:衡量耗油率的一個指標,更多信息可?mpg查看
要探究displ與hwy的關系,最快就是畫個圖了
ggplot(data=mpg)+ geom_point(mapping = aes(x=displ, y=hwy))
圖中顯示兩者呈現負相關,disp越大,hwy越低。
ggplot2繪圖規則主要如下:
ggplot(data=<DATA>)+
<GEOM_FUNCTION>(mapping=aes(>MAPPINGS>))
ggplot()會創建一個底板,然后可以通過geom_function()不斷地添加圖形元素,進行豐富。
p <- ggplot(mpg)#create an empty graph
p+geom_point(aes(x=displ, y=hwy))#add a layer to the empty graph
美學映射Aesthetic Mappings
美學映射在ggplot2中是一個十分重要的概念,比如前文我們將displ、hwy分別映射給x、y軸,同時還可以用來控制圖形元素大小、形狀、顏色等屬性。
ggplot(mpg)+
geom_point(aes(x=displ, y=hwy, color=class))#將class映射給顏色屬性,這樣不同class就表現不同顏色
可以看到,通過顏色映射ggplot2會自動創建一個legend,需要注意的是這里顏色顏色我們是利用class,這是一個離散性變量,如果我們將之映射給點的size,則會出現warning,至于原因,看warning。
ggplot(mpg)+ geom_point(aes(x=displ, y=hwy, size=class))
或者將class映射給alpha參數,這是一個控制點透明度的參數;shape是一個控制形狀的參數
ggplot(mpg)+ geom_point(aes(x=displ, y=hwy, alpha=class))
ggplot(mpg)+ geom_point(aes(x=displ, y=hwy, shape=class))
發現當映射shape其中SUV是沒有形狀的,這是因為ggplot2只默認6種形狀,這個問題后續解決。 需要注意的是映射參數必須在aes(),不然就無法映射。
ggplot(mpg)+ geom_point(aes(x=displ, y=hwy), color="blue")#all the points are blue
今天就講到這,下次繼續
SessionInfo
sessionInfo()
## R version 3.4.1 (2017-06-30)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 8.1 x64 (build 9600)
##
## Matrix products: default
##
## locale:
## [1] LC_COLLATE=Chinese (Simplified)_China.936
## [2] LC_CTYPE=Chinese (Simplified)_China.936
## [3] LC_MONETARY=Chinese (Simplified)_China.936
## [4] LC_NUMERIC=C ## [5] LC_TIME=Chinese (Simplified)_China.936
##
## attached base packages:
## [1] stats graphics grDevices utils datasets methods base
##
## other attached packages:
## [1] forcats_0.2.0 stringr_1.2.0 dplyr_0.7.1
## [4] purrr_0.2.2.2 readr_1.1.1 tidyr_0.6.3
## [7] tibble_1.3.3 ggplot2_2.2.1 tidyverse_1.1.1.9000
##
## loaded via a namespace (and not attached):
## [1] Rcpp_0.12.11 cellranger_1.1.0 compiler_3.4.1
## [4] plyr_1.8.4 bindr_0.1 tools_3.4.1
## [7] digest_0.6.12 lubridate_1.6.0 jsonlite_1.5
## [10] evaluate_0.10.1 nlme_3.1-131 gtable_0.2.0
## [13] lattice_0.20-35 pkgconfig_2.0.1 rlang_0.1.1
## [16] psych_1.7.5 rstudioapi_0.6 yaml_2.1.14
## [19] parallel_3.4.1 haven_1.0.0 bindrcpp_0.2
## [22] xml2_1.1.1 httr_1.2.1 knitr_1.16
## [25] hms_0.3 rprojroot_1.2 grid_3.4.1
## [28] glue_1.1.1 R6_2.2.2 readxl_1.0.0
## [31] foreign_0.8-69 rmarkdown_1.6 modelr_0.1.0
## [34] reshape2_1.4.2 magrittr_1.5 clisymbols_1.2.0
## [37] boxes_0.0.0.9000 backports_1.1.0 scales_0.4.1
## [40] htmltools_0.3.6 rvest_0.3.2 assertthat_0.2.0
## [43] mnormt_1.5-5 colorspace_1.3-2 labeling_0.3
## [46] stringi_1.1.5 lazyeval_0.2.0 munsell_0.4.3
## [49] broom_0.4.2 crayon_1.3.2.9000