學習小組Day05 山海 數據結構

0.jpg

1. 數據類型:向量、矩陣、數組、數據框、list

1.1. 向量

(1) 元素是指數字或者字符串(用chr表示);標量是一個元素組成的變量;向量是多個元素組成的變量。
標量:1“shanhai”;向量:c(1,2,3)c(“bio01”,“bio02”,“bio03”)

(2) 賦值:x<- c(1,2,3) 將x定義為由元素1,2,3組成的向量;x<- 1:10 從1-10之間的所有整數;x<- seq(1,10,by=0.5) 1-10間每隔0.5取一個數;x<- rep(1:3,times=2) 1-3間的整數,重復2次

(3) 從向量中提取元素
①根據元素位置提取元素:x[4] x第4個元素;x[-4] 排除法,除了第4個元素之外剩余的元素;x[2:4] 第2到4個元素;x[-(2:4)] 除了第2-4個元素;x[c(1,5)] 第1個和第5個元素;
②根據值提取元素:x[x==10] 等于10的元素;x[x<0] 小于0的元素;x[x %in% c(1,2,5)] 存在于向量c(1,2,5)中的元素

1.2. 數據框

(1) 讀取本地數據:read.table(file = "huahua.txt" ,sep = "\t" , header =T)
sep 是函數的形式參數,多數情況下, seq 參數用來指定字符的分隔符號。csv 文件是用逗號分隔的,故而 sep = ",";tsv 文件是用制表符分隔的,故而 sep = "\t"
header=T目的為把第一行設置為表頭

(2) 設置行名和列名:
X<-read.csv('doudou.txt')colnames(X) 查看列名;rownames(X) 查看行名,默認值的行名就是行號,1.2.3.4...;

image

colnames(X)[1]<-"bioplanet" 有的公司返回數據,左上角第一格為空,R會自動補為x,用這個命令來修改;
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1) 最后row.names的意思是修改第一列為行名;
(下圖為運行前后對比)
image

image

(3) 數據框的導出:write.table(X,file = "yu.txt",sep = ",",quote=F)分隔符改為逗號,字符串不加雙引號(默認格式帶由雙引號)

(4) 變量的保存與重新加載:save.image(file="bioinfoplanet.RData")保存當前所有變量;save(X,file="test.RData") 保存其中一個變量;load("test.RData")再次使用RData時的加載命令

(5) 提取元素:X[x,y]第x行第y列;X[x,] 第x行;X[,y] 第y列;X[y] 也是第y列;X[a:b] 第a列到第b列;X[c(a,b)] 第a列和第b列;X$列名 提取某一列

(6) 直接使用數據框中的變量:plot(iris$Sepal.Length,iris$Sepal.Width) 用R語言的內置數據集iris作圖

問題:save(X,file="test.RData")這句代碼如果報錯object X not found,是為什么,應該怎么解決?
原因:未發現X這個變量,X未賦值,可能是把X打成了小寫x
解決:給X進行賦值即可

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容