關(guān)鍵函數(shù):readtable,summary,histogram,prctile,boxplot
1.統(tǒng)計(jì)詞匯頻率
有必要解釋下,C=categorial(T.TYPE),其中.TYPE意思是讀取“TYPE”標(biāo)簽下的內(nèi)容:
然后把這些數(shù)據(jù)以table的形式返回給C。
整個(gè)程序主要的作用是,統(tǒng)計(jì)表1中的詞頻。目前給的表中是一個(gè)個(gè)詞匯,而我們首先得知道有哪些詞,并得到一個(gè)這些詞的集合(詞之間不重復(fù)),這就用到:c=categories(C)。然后就可以得到不重復(fù)的詞的目錄了。
之后,我們得知道每個(gè)詞出現(xiàn)的次數(shù),這里matlab給了一個(gè)很方便的函數(shù),countcats。
cf=countcats(C),就可以把每個(gè)詞出現(xiàn)的次數(shù)返回到cf里了,而且每個(gè)數(shù)字與categories所返回的標(biāo)簽一一對(duì)應(yīng)。(真是想要啥就有啥)
2.作圖
有了詞匯目錄,有了各個(gè)詞對(duì)應(yīng)的數(shù)字(頻率)之后,就需要把這些數(shù)據(jù)可視化了。就以條形圖為例,使用bar(cf); 就可以把cf中的數(shù)據(jù)展示在圖中了,但此時(shí),橫坐標(biāo)卻是1,2,3.我們需要的橫坐標(biāo)則是Anomic,Brocas,Conduction。這是就要用到set函數(shù)了。只需在bar(cf)下方寫上set(gca,'XTickLabel',c)即可,gca表示當(dāng)前圖,XTickLabel表示橫坐標(biāo),c就是那三個(gè)單詞組成的標(biāo)簽。