學習小組day6筆記-徐妙

今天新學了一個所謂最簡單的R包
主要總結如下


tudyr

新建表格


賦值給bioplanet

鍵值對對應關系key-value,如samplename和expression

字符創書寫

reshape data

image.png

命令生成 a<-data.frame(country = c("A","B","c"),"1999"=paste(c(0.7,23,25),"k"),"2000"=paste(c(2,3,50),"k"))


image.png

gather(a,X1999,X2000,key = "year",value = "cases")
gather括號里的分別是:,數據框名,需合并的列名(兩個),合并后的key列名,value列名。
或者 gather(a,"year","cases",X1999,X2000)
或者排除法gather(a,year,cases,-country)用于列名較多的情況


Handle Missing Values

X<-read.csv('doudou.txt')


來自生信星球

csv的導入和導出方式
導入:X<-read.csv('doudou.csv')
導出:write.csv(X,'doudou.csv')

drop_na():有空值的,整行刪除掉

括號里填數據框名,依據的列名(有空值那一列的列名)
例如drop_na(x,X2)
fill(),根據上一行的數值填充上,例如fill(x,X2)
replace_na(),空值填進去特定的一個數值(還是在應付)
括號里填數據框名,要填的列名=要填的值,例如 replace_na(x, list(X2=3))
實例結果如下


來自生信星球

Expand table

complete(x,nesting(bioplanet),fill=list(X2=5))
當用com.csv文件


image.png

可用命令其中的三個空值,填充上ddd relate
com <- read.csv("com.csv")
complete(com,nesting(geneid,samplename,expression),fill=list(Annotion="ddd relate"))

Expand

據說對a變量輸入如下命令,但是好像并沒有反應????
pin2<-data.frame(GeneId =rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))

split cells(選修)

來自生信星球

今天的內容有些沒有領會,還得再研究研究

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容