第一部分:猴子課程學(xué)習(xí)簡要
數(shù)據(jù)分析系統(tǒng)的四個步驟:
1、房子設(shè)計—設(shè)計結(jié)構(gòu)
2、從哪開始蓋房子—R環(huán)境
3、準(zhǔn)備材料—數(shù)據(jù)結(jié)構(gòu)
4、組合材料—算法
蓋房子=材料+整合材料
程序=數(shù)據(jù)結(jié)構(gòu)+算法
R是運行環(huán)境,RStudio是開發(fā)工具。
數(shù)據(jù)結(jié)構(gòu)有哪些:
1、向量;2、矩陣;3、數(shù)組;4、數(shù)據(jù)框;5、列表;6、因子
學(xué)習(xí)數(shù)據(jù)結(jié)構(gòu)的方法論:
1、定義
2、如何使用
第二部分:課程學(xué)習(xí)練習(xí)
一、定義向量練習(xí)
二、建立矩陣練習(xí)
三、訪問數(shù)據(jù)元素練習(xí)
四、病人數(shù)據(jù)建立矩陣
五、繪制病人年齡柱狀圖
六、定義一個3維數(shù)組練習(xí)
七、定義病人數(shù)據(jù)框練習(xí)
八、查找部分?jǐn)?shù)據(jù)練習(xí)
九、新增加第5個病人數(shù)據(jù)
十、增加入院時間列數(shù)據(jù)
十一、獲取病人數(shù)目方法
第三部分:課后作業(yè)實戰(zhàn)
猴子老師說的非常正確,程序必須是多動手實踐,尤其是對我這代碼小白來說。實踐、實踐、再實踐。
一、練習(xí)從文件夾中讀取.xlsx類型的病例數(shù)據(jù)文件。
#實踐練習(xí)-病例數(shù)據(jù)
#從文件夾讀取數(shù)據(jù)excel數(shù)據(jù)
#載入readxl包
library(readxl)
#從文件中讀取病例數(shù)據(jù).xlsx文件
patient.data <- read_excel("~/百度云同步盤/數(shù)據(jù)分析/R-DATA/病例數(shù)據(jù).xlsx")
patient.data
二、練習(xí)用數(shù)據(jù)框存儲病例數(shù)據(jù)。
#用數(shù)據(jù)框存儲數(shù)據(jù)
#病人編號1
patient1 <- c(1,2,3,4)
#姓名1
name1 <- c("猴子","李同","王五","張三")
#年齡1
age1 <- c(29,34,28,52)
#糖尿病類型1
diabetes1 <- c("1型糖尿病","2型糖尿病","1型糖尿病","2型糖尿病")
#病情1
status1 <- c("較差","較好","顯著較好","較差")
#病情EN
statusEN <- c("Poor","Improved","Excellent","Poor")
patientdata1 <- data.frame(patient1,name1,age1,diabetes1,status1,statusEN,stringsAsFactors = FALSE)
patientdata1
三、完成有多少病人和患“2型糖尿病”病人的數(shù)據(jù)分析。
#數(shù)據(jù)分析任務(wù)一:有多少個病人患糖尿病
patientNum <- nrow(patientdata1)
patientNum
#分析的結(jié)果為4個病人
#數(shù)據(jù)分析任務(wù)二:有哪些病人患“2型糖尿病”
diatetestype <- patientdata1[patientdata1$diabetes1=="2型糖尿病",]
diatetestype
第四部分:學(xué)習(xí)心得
學(xué)習(xí)過程中一些陸續(xù)遇到幾個困難點,經(jīng)過請教別人以及google搜索,我自己努力的掙扎專研,終于得以解決,先說明如下,如果大家在學(xué)習(xí)中也到過此類問題,希望能給你一點點啟示作用。
1、在繪制病人年齡的柱狀圖時,出來的柱狀圖標(biāo)題文字是亂碼,剛開始以為我的代碼有問題,反復(fù)操作,還是如此,經(jīng)求主發(fā)現(xiàn)是程序默認(rèn)字體問題(使用的MAC系統(tǒng)),需要在繪制圖形前定義字體。
添加設(shè)置字體代碼:par(family="PingFangSC-Regular"),我設(shè)置的系統(tǒng)的蘋方字體,當(dāng)然你可以根據(jù)你的電腦系統(tǒng)安裝的字體,設(shè)置不同的字體。可以在系統(tǒng)的字體庫中查找安裝的字體哦。設(shè)置完執(zhí)行下,亂碼問題就完美解決了。??
2、是在讀取excel文件時,根據(jù)介紹,把.xlsx格式另保存為.csv格式,然后用read.csv(file,n ),但是不知道問什么,MAC系統(tǒng)上始終不成功,提示文件路徑不正確。經(jīng)過變通思維,換另一種方法。用library(readxl)命令,載入。
讀取excel的包,再使用read_excel(file)直接讀取。
#載入readxl包
library(readxl)
#從文件中讀取病例數(shù)據(jù).xlsx文件
patient.data <- read_excel("~/百度云同步盤/數(shù)據(jù)分析/R-DATA/病例數(shù)據(jù).xlsx")
patient.data
3、編程是嚴(yán)謹(jǐn)?shù)模枰浅<?xì)心的輸入,有時由于一個標(biāo)點符號的問題,就無法得到正確的結(jié)果。所有細(xì)心輸入必要原則。
4、遇到問題多去不恥下問,當(dāng)然更多的是學(xué)會用google搜索,學(xué)會用搜索找到自己需要的問題的答案也是一種能力的鍛煉。有事問谷哥吧。然后,就是要加油學(xué)習(xí)英文,只有在國外的網(wǎng)站上可以找更多最新的東西。
經(jīng)過數(shù)據(jù)結(jié)構(gòu)入門的學(xué)習(xí),發(fā)現(xiàn)自己慢慢的喜歡上了編程,尤其當(dāng)輸入一行行代碼后,出現(xiàn)自己想要的結(jié)果的那種喜悅感。感謝大家的指導(dǎo),也給我自己一個??(經(jīng)過擰著頭皮的學(xué)習(xí)了幾天,終于有點成就感)。相信堅持繼續(xù)下去,會有更大的收獲——學(xué)會大數(shù)據(jù)編程、學(xué)會用搜索、學(xué)會用英語、學(xué)會寫作。
“理論的力量關(guān)鍵體現(xiàn)在行動上。”
讓我們行動起來吧!!!
2017年03月10日
作者:壹亮3278(微信號:yiliang3278),移動互聯(lián)網(wǎng)產(chǎn)品設(shè)計、產(chǎn)品經(jīng)理,數(shù)據(jù)分析的學(xué)習(xí)者。不斷自我迭代,自我升級,希望和知識愛好者共同進步,讓我們用成長去遇見美好的未來!!!
————“自律是成功的基石。”————
《數(shù)據(jù)分析學(xué)習(xí)之路系列》系列
大數(shù)據(jù)之?dāng)?shù)據(jù)分析精進之路:起跑
00-R語言的認(rèn)識、下載和安裝
01-R語言入門
R語言實戰(zhàn)—02-創(chuàng)建數(shù)據(jù)集