r和python都有橫向、縱向合并的方法,當(dāng)然也都有類(lèi)似于SQL語(yǔ)句查詢(xún)的一些列操作。,
例如,pandas中有非常好用的橫縱向合并都行的concat方法,其中用來(lái)調(diào)整橫縱向合并的參數(shù)是非常常見(jiàn)的(axis = 1),此外還有我也比較經(jīng)常用的append方法、join、merge方法。
而在r中,則有cbind()、rbind(),這兩種最簡(jiǎn)單的方法。當(dāng)然它也有merge這種方法。
還有就是,今天為了用r里面的那個(gè)xlsx包,重新配置了一遍jdk環(huán)境。記得一年前的時(shí)候,在這上面耗了整整一天的時(shí)間。。。就是不知道哪里錯(cuò)了。。。后來(lái)照豆瓣上的一個(gè)分享,刪了2個(gè)文件,改了一個(gè)txt之后就神奇地好了。但是應(yīng)該是jdk8,現(xiàn)在是jdk13,不需要再在系統(tǒng)變量里面繼續(xù)配置JRE,只需要在PATH里面加如\bin就好了,然后xlsx也就可以用了。
真幾把方便啊。
再插一句話就是,jdk環(huán)境是不管是r還是python很多非常有用的package/module的編寫(xiě)語(yǔ)言,當(dāng)初做xlsx,selenium這些玩意兒其實(shí)很多都是拿java來(lái)寫(xiě)的。。。可惜,我太菜了不會(huì)java。。。馮緒就對(duì)java了如指掌啊哈哈。
————————————————-分割線
此外,r中還有一個(gè)非常好用的數(shù)據(jù)篩選的方法:subset(x, subset, select = c(), drop = FALSE),這種方法和你對(duì)data.frame[bool]進(jìn)行邏輯篩選得到的結(jié)果一摸一樣。
btw,r中的邏輯判斷,TRUE & FALSE are all in captions
除了subset,r中的抽樣方法還有整群抽樣和分層抽樣,方法分別為:cluster(), starta()
r中的reverse可以用sort(x, decreasing = TRUE)來(lái)代替,其中x <-? a vector,其中的parameter和python中不一樣,python的關(guān)鍵詞是descending,而r中式decreasing。。。