今天新學了一個所謂最簡單的R包
主要總結如下
新建表格
鍵值對對應關系key-value,如samplename和expression
reshape data
命令生成 a<-data.frame(country = c("A","B","c"),"1999"=paste(c(0.7,23,25),"k"),"2000"=paste(c(2,3,50),"k"))
gather(a,X1999,X2000,key = "year",value = "cases")
gather括號里的分別是:,數據框名,需合并的列名(兩個),合并后的key列名,value列名。
或者 gather(a,"year","cases",X1999,X2000)
或者排除法gather(a,year,cases,-country)用于列名較多的情況
Handle Missing Values
X<-read.csv('doudou.txt')
csv的導入和導出方式
導入:X<-read.csv('doudou.csv')
導出:write.csv(X,'doudou.csv')
drop_na():有空值的,整行刪除掉
括號里填數據框名,依據的列名(有空值那一列的列名)
例如drop_na(x,X2)
fill(),根據上一行的數值填充上,例如fill(x,X2)
replace_na(),空值填進去特定的一個數值(還是在應付)
括號里填數據框名,要填的列名=要填的值,例如 replace_na(x, list(X2=3))
實例結果如下
Expand table
complete(x,nesting(bioplanet),fill=list(X2=5))
當用com.csv文件
可用命令其中的三個空值,填充上ddd relate
com <- read.csv("com.csv")
complete(com,nesting(geneid,samplename,expression),fill=list(Annotion="ddd relate"))
Expand
據說對a變量輸入如下命令,但是好像并沒有反應????
pin2<-data.frame(GeneId =rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
split cells(選修)
今天的內容有些沒有領會,還得再研究研究