朋友們,前天還有昨天小年快樂呀~ (文末有小福利,記得看到文末哦)
趁著小年,咱們就繼續更一期,看完這一期,相信大家都能畫好Table1;話不多說,簡單介紹一下今天的內容:T test、方差分析、卡方檢驗
1. NHANES中 T test 實現
- dataset鏈接地址
https://wwwn.cdc.gov/nchs/data/tutorials/analysis_data.sas7bdat
- SAS代碼(model語句后有中文注釋)
PROC SURVEYREG data=analysis_data nomcar;
STRATA sdmvstra;
CLUSTER sdmvpsu;
CLASS riagendr;
WEIGHT wtmec4yr;
MODEL bpxsar = riagendr/solution clparm vadjust=none;
/*nomcar表示非完全隨機刪失,與Taylor series variance estimation(Nhanes官網推薦,可用varmethod=taylor指定)配套使用;
class語句表示在不同性別之間比較差異,與一般線性模型中一致;
有class語句時,如果想得到estimate,SE,以及95% CI的話需要在model語句中加入solution clparm;
vadjust=none表示不用自由度校正方差估計,SAS默認vadjust=df,在本程序中兩個選項結果差距不大*/
run;
-
結果展示
t test 結果P值為0.0033,Model中F value的P值與下面t value的P值相同
2. NHANES中方差分析實現
- SAS代碼(model語句后有中文注釋)
PROC SURVEYREG data=analysis_data nomcar ;
STRATA sdmvstra;
CLUSTER sdmvpsu;
CLASS ridreth1;
WEIGHT wtmec4yr;
MODEL bpxsar = ridreth1/solution clparm vadjust=none anova;
/*MODEL語句中加入anova選項,CLASS語句中變量由性別換為種族*/
run;
-
結果展示
方差分析總體差異的P值為<0.0001
3. NHANES中卡方檢驗實現
- SAS代碼(model語句后有中文注釋)
proc surveyfreq data=analysis_data;
strata sdmvstra;
cluster sdmvpsu;
weight wtmec4yr;
table riagendr*ridreth1/col row
nostd nowt wchisq wllchisq chisq chisq1;
/*不同性別之間種族構成比是否有差異,按照官網推薦采用Rao-Scott Chi-Square的結果*/
run;
-
結果展示
P值為0.0010
4. NHANES數據發表文章Table 1
最后我們用已經發表NHANES文章中的Table 1把第四期和第五期的內容串起來,截圖如下。
按照測得的擬除蟲菊酯類殺蟲劑水平分成三分位,第一行為age(連續性變量),用surveymeans得到mean及SE,然后用surveyreg進行方差分析即可得到相應的P值;第二行為sex(二分類變量),用surveyfreq得到percent及SE,然后同樣用surveyfreq加上相應的chisq選項即可得到相應的P值;其他行同理~
文章題目:Association Between Exposure to Pyrethroid Insecticides and Risk of
All-Cause and Cause-Specific Mortality in the General US Adult Population
5. 參考內容
https://wwwn.cdc.gov/nchs/nhanes/tutorials/samplecode.asp
https://pubmed.ncbi.nlm.nih.gov/31886824/
文末小福利
之前有朋友說過對于復雜抽樣中weight不是很理解,我突然意識到對于初學者來說這可能確實是一個問題。回想自己的學習過程,發現馮國雙老師編的一本書有提到相關的內容。
書名為醫學研究中的logistic回歸分析及SAS實現 ,直接相關的內容為 第十章 復雜抽樣資料的logistic回歸。
下面是電子書及配套程序的百度云網盤鏈接(僅供學習使用,強烈建議大家買正版紙質書):
應該會對大家有幫助,記得點贊哈,祝好~