Learning 'dplyr' package
處理數據神器'dplyr'包
dplyr cheat sheet.jpg
dplyr cheat sheet.jpg
mutate()
mutate(data, new_var = expression… )
根據公式計算產生新列
select()
select(data, …)
根據列號或者列名選出對應列
-
為剔除該列
select(df,-a)
剔除a列
filter()
filter(data, logical expression)
根據邏輯表達式選出對應觀測(行)
arrange()
arrange(.data, x, .by_group = FALSE
按x進行排序, 可以按多個變量進行排序, 默認為升序排列
desc(x)
按x降序排列
group_by()
group_by(df, x)
對x進行分組
ungroup
取消分組
summarise()
summarize(data, var = func())
匯總分析, 可以聯合group_by()
一起用進行分組匯總
管道操作 %>%
將左邊的對象作為第一個參數傳遞到右邊的函數中
x %>% f(y)
等價于f(x,y)
連接
Combine table in dplyr.jpg