您的位置:首页 > 其它

SAS:SAS 常用过程之 统计描述过程proc means

2014-05-25 16:58 253 查看
如果我们想要得到一些描述统计量,我们可以调用SAS的means统计过程

-先直观体验下,不加选项的means过程:---------------------------------------------------------------------------------------------------------------

proc means 默认统计量有N 平均数 最大值 最小值和标准差

DATA PGM2_1;
	INPUT sex X @@;
CARDS;
1 308 0 305 0 311 1 298 0 315
1 300 0 321 0 294 1 320  
1 308 1 308 1 321 0 298
;
RUN;

proc sort data = pgm2_1;
by sex;
run;
proc means data = PGM2_1;
var x;
by sex;
run;

调用means过程对变量进行分析,按sex变量分组统计;by语句要求数据集按by后的变量排序



-定制的means过程:---------------------------------------------------------------------------------------------------------------

data htwt;
input subject gender$ height weight;
datalines;
1 M 68.5 155
2 F 61.2 99
3 F 63.0 115
4 M 70.0 205
5 M 68.6 170
6 F 65.1 125
7 M 72.4 220
8 M   .  188
;
proc means data=htwt n mean std stderr clm maxdec=2;
var height weight;
run;




标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度,反映的是样本均数之间的变异。标准误不是标准差,是多个样本平均数的标准差。

平均数的标准误用来表示平均数的“置信区间”,当样本来自于某一个总理样本时,该值就非常有意义。例如本例如果是从某高校抽取的样本,我们可以用样本平均身高66.97作为该校学生的平均身高的估计值,而标准误告诉我们这个估计值离真值有多远。如果总体人群大致满足正太分布,样本平均数则有68%的机会落在真值的一个标准误(1.51)之间,有95%落在两个标准误(3.02)之内。

使用CLM,则给出了样本平均数95%的置信区间,也就是说,有95%的把握,区间63.27到70.67包含真值。

-means过程的常用选项:---------------------------------------------------------------------------------------------------------------

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: