1. 數據類型:向量、矩陣、數組、數據框、list
1.1. 向量
(1) 元素是指數字或者字符串(用chr表示);標量是一個元素組成的變量;向量是多個元素組成的變量。
標量:1
,“shanhai”
;向量:c(1,2,3)
,c(“bio01”,“bio02”,“bio03”)
(2) 賦值:
x<- c(1,2,3)
將x定義為由元素1,2,3組成的向量;x<- 1:10
從1-10之間的所有整數;x<- seq(1,10,by=0.5)
1-10間每隔0.5取一個數;x<- rep(1:3,times=2)
1-3間的整數,重復2次
(3) 從向量中提取元素
①根據元素位置提取元素:x[4]
x第4個元素;x[-4]
排除法,除了第4個元素之外剩余的元素;x[2:4]
第2到4個元素;x[-(2:4)]
除了第2-4個元素;x[c(1,5)]
第1個和第5個元素;
②根據值提取元素:x[x==10]
等于10的元素;x[x<0]
小于0的元素;x[x %in% c(1,2,5)]
存在于向量c(1,2,5)中的元素
1.2. 數據框
(1) 讀取本地數據:
read.table(file = "huahua.txt" ,sep = "\t" , header =T)
sep 是函數的形式參數,多數情況下, seq 參數用來指定字符的分隔符號。csv 文件是用逗號分隔的,故而 sep = ",";tsv 文件是用制表符分隔的,故而 sep = "\t"
header=T目的為把第一行設置為表頭
(2) 設置行名和列名:
①X<-read.csv('doudou.txt')
;colnames(X)
查看列名;rownames(X)
查看行名,默認值的行名就是行號,1.2.3.4...;image
②colnames(X)[1]<-"bioplanet"
有的公司返回數據,左上角第一格為空,R會自動補為x,用這個命令來修改;
③X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)
最后row.names的意思是修改第一列為行名;
(下圖為運行前后對比)image
image
(3) 數據框的導出:
write.table(X,file = "yu.txt",sep = ",",quote=F)
分隔符改為逗號,字符串不加雙引號(默認格式帶由雙引號)
(4) 變量的保存與重新加載:
save.image(file="bioinfoplanet.RData")
保存當前所有變量;save(X,file="test.RData")
保存其中一個變量;load("test.RData")
再次使用RData時的加載命令
(5) 提取元素:
X[x,y]
第x行第y列;X[x,]
第x行;X[,y]
第y列;X[y]
也是第y列;X[a:b]
第a列到第b列;X[c(a,b)]
第a列和第b列;X$列名
提取某一列
(6) 直接使用數據框中的變量:
plot(iris$Sepal.Length,iris$Sepal.Width)
用R語言的內置數據集iris作圖
問題:save(X,file="test.RData")
這句代碼如果報錯object X not found
,是為什么,應該怎么解決?
原因:未發現X這個變量,X未賦值,可能是把X打成了小寫x
解決:給X進行賦值即可