1.數(shù)據(jù)管理
aggergate整合數(shù)據(jù) 時(shí)往往是將多組觀測替換為根據(jù)這些觀測計(jì)算的描述性統(tǒng)計(jì)量。個(gè)人認(rèn)為可以簡單的理解為合并不同數(shù)據(jù)集啦。
reshape重塑數(shù)據(jù)時(shí),則會(huì)通過修改數(shù)據(jù)結(jié)構(gòu)(行和列)來決定數(shù)據(jù)的組織方式。回籠重造,數(shù)據(jù)還是那個(gè)數(shù)據(jù),就是表現(xiàn)形式不同了,就像是冶金的過程,哈哈哈。
想要具體還是要去看書呀chapter5.6 <R in Action,2E>
用于連接每對數(shù)據(jù)表的變量稱為鍵,鍵是唯一標(biāo)識(shí)觀測的變量(或者變量集合),單個(gè)變量就可以識(shí)別一個(gè)觀測,可以理解為數(shù)據(jù)集中的特性,是能夠唯一標(biāo)識(shí)每個(gè)觀測的,通過鍵特異性的查找數(shù)據(jù),因此驗(yàn)證鍵就進(jìn)行計(jì)數(shù)鍵,返回所有n==1
一定要看chapter 9 <R for Data Science>
Tips for R
1.處理缺失值NA,NaN,Inf,方法可以有:推理,刪除(比如單個(gè),整行,成對),或者簡單(非隨機(jī),如均值,中位數(shù),眾數(shù))插補(bǔ);
2.優(yōu)先用read.csv,哈哈哈哈;
3.可以學(xué)下正則表達(dá)式,填坑.jpg;
4.命名必須以字母開頭,所以我推測,如果是花花直接輸入列名1999,花花會(huì)返回為X1999;
5.cheatsheet很好用,但是一定要有基礎(chǔ)知識(shí)儲(chǔ)備喲;
6.全國各地好多地方都初雪了,西湖真的冷哭了,啊哈哈哈哈,保重圣體啊。