您的位置:首页 > 其它

常用的基础统计量和图形

2015-10-07 21:11 162 查看
定量变量:变量按照随机规律所取的值是数量时,该变量称为定量变量,或数量变量、随机变量。

定性变量:像性别或观点之类的取值非数量值的变量就称为定性变量,或分类变量、属性变量。

当然,定性变量也可以用定量变量来描述,比如男生的人数、比例等,定性变量只有用数量描述时,才能建立数学模型,使用计算机来分析。

用数字概括数据

生活中人们常常会用几个数字概括大量数字,比如杭州人的平均收入是多少,北京和上海两地区的收入差距是多少,中国男性的平均身高是多少等等。这些“平均”,“差距”就是用来概括汇总的数字。

常用概括统计量(汇总统计量)如下:

1、位置统计量(和“位置”有关的统计量)

(1)算术平均值/均值/样本均值 特点:容易被极端值影响

(2)(样本)中位数:数据按照从小到大排序后位于中间的那个数(样本量为奇数),或中间两个数的平均值(样本量为偶数)。 特点:不易被极端值影响,比均值稳健

(3)上下四分位数:数据从小到大排序后,位于数据上下四分之一的地方,上四分位数又称为75百分位数,下四分位数又称为25百分位数。

(4)众数:一组数据中出现次数最多的数值。有时候在一组数据中有好几个众数。

2、尺度统计量(描述数据集中于分散程度的度量)

(1)极差:极大值和极小值之间的差

(2)标准差:度量样本中各个数值到均值的距离的一种均值。它是方差的平方根。

用图表表示数据

1、定量变量的表示

(1)直方图:定量变量最常用的图表之一,作法:把横轴分成若干等宽的区间,然后计算数据在各个区间上的频数,并在各个区间上画出高度与相应频数成比例的矩形条。当然,纵坐标比一定是数量,还可以是比例,就看用的是频数还是频率了。

(2)盒形图:又称箱线图、盒子图、箱图,每个盒子中间的粗横线是中位数,封闭盒子的上下两条横线为上下四分位数,因此有一半的数目在盒子内部。在盒子外部上下各有一条纵线,表明盒子外的数据分布,在纵线的两个端点各有一条短横线,表示最大值和最小值。

(3)茎叶图:该图既能展示数据的分布,又能保留原始数据。

(4)散点图:描述数量变量之间的关系,对两个变量来说,每一个点代表一个观测值,点的横纵坐标分别表示其相应两个变量的取值。

2、定性变量的表示

(1)饼图:一个由许多扇形组成的圆,各个扇形的大小比例等于变量各个水平(类别)的频数或比例。

(2)条形图:条形图可以看出各个类别变量的数目。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: