您的位置:首页 > 其它

统计学中常用专用名词中英对照

2016-03-29 23:50 399 查看
最近接触了统计学的一些基础,由于看的资料是英文的,特意整理了部分专用名词的中英对照,以便理解。

4000
英文中文备注
population总体N/A
sample样本N/A
population parameter(μ)总体参数可看作总体平均
sample statistics(x̄)样本统计量可看作样本平均1
sample error误差μ-x̄
X-aixsX轴N/A
Y-aixsY轴N/A
origin原点N/A
odd number奇数N/A
even number偶数N/A
Cartesian coordinate笛卡尔坐标N/A
independent variable自变量N/A
predictor variable预测变量同自变量
dependent variable因变量N/A
outcome结果同因变量
lurking variable潜在变量N/A
extraneous factor外界变量N/A
histogram直方图X轴一般为numerical/quantitative
bar graph柱形图X轴一般为categorical/qualitative
bo plots/box and whisker plots箱线图/盒须图可以更好地表示IQR和四分位数
symmetrical对称N/A
uniform distribution均匀分布数据基本分布在同一水平
Bi-modal/Multimodal distribution双峰分布多个不同的mode
normal distribution正态分布高峰居中,左右大致对称
positively skewed distribution正偏态分布高峰左移,长尾右侧延长
negatively skewed distribution负偏态分布高峰右移,长尾左侧延长
mean平均值算术平均
median中数一组数据中的中间数值
mode众数一组数据中出现次数最多(peak)
rang全距/极差最大值与最小值的差2
midrange中程数最大值与最小值的平均数
deviation偏差样本(或总体)中数据与mean的差,
所有数据的偏差的和应为0
absolute deviation绝对偏差偏差的绝对值
squared deviation平方偏差/平方差偏差的平方
sum of squares(SS)平方和各个偏差平方的和
variance方差总体:偏差平方和除以n,SS/n
样本:偏差平方和除以n-1,SS/(n-1)
standard deviation(s/σ)标准偏差方差的平方根
first quartile(Q1)第一四分位数数据前50%的median
second quartile(Q2)第二四分位数median
third quartile (Q3)第三四分位数数据后50%的median3
interquartile range(IQR)四分位距/四分差Q3-Q1的值
outlier离群值与其他数据相比差距较大
小于Q1-1.5IQR或大于Q3+1.5*IQR
Bessel’s correction贝塞尔校正系数计算样本方差时除以n-1而不是n
z-scorez值(x-μ)/σ
probability density function(PDF)概率密度函数相对频率曲线,面积为1
negative infinity负无穷N/A
standard error(SE)标准误差σ/sqrt(n),标准偏差除以根号n
central limit theorem中心极限定理N/A
point estimate点估计N/A
margin of error误差界限(t or z)*σ/sqrt(n),置信区间的一半
confidence interval置信区间4z(x̄-z*σ/sqrt(n),x̄+z*σ/sqrt(n))
t(x̄-t*σ/sqrt(n),x̄+t*σ/sqrt(n))
critical region临界区alpha level
null hypothesis(H0)零假设/虚无假设N/A
alternative hypothesis(Ha)对立假设/备择假设N/A
one-tailed(directional) hypothesis单尾(方向性)检验N/A
two-tailed(non-directional) hypothesis双尾(非方向)检验N/A
Type I errorI类错误拒绝了正确的假设
Type II errorII类错误接受了错误的假设
t-statistic(student’s t)t统计量点估计:(x̄-μ)/(s/sqrt(n))
相依样本:(μ1-μ2)/(s/sqrt(n))5
effective sample size有效取样数n-1
degrees of freedom自由度N/A
within subject design/repeated measures design受试者内设计/重复衡量设计N/A
between subject designs受试者间设计N/A
dependent sample t-test相依样本t检验N/A
independent sample独立样本N/A
longitudinal design纵向设计检验不同时间同一变量的变化
pretest posttest预期检验,后期检验检验更改前后同一变量的变化
effect size效应量处理(某种动作,措施等)效应的大小
difference measures差异度量均值差异
standardized difference标准化差异度量Cohen’s D
correlation measures相关度量r^2=t^2/(t^2+df)
statistical significance统计显著性N/A
pool variance合并方差(SSx+SSy)/(dfx+dfy)
小知识点:

Measures of Central Tendency: Mean, Median, Mode

Measures of Variability: Rang, IQR, Variance, Standard deviation

在统计学中有句话很流行: Correlation does not imply causation。

一般观察relationship可以通过observational studies survey,若要确认causation要通过controlled experiment。

以下为部分名词的介绍资料,供参考。

关于population, sample, parameter, statistics的详细说明可参考文章Populations, Samples, Parameters, and Statistics
关于mean, median, mode, range的说明可参考文章Mean, Median, Mode, and Range
关于Q1,Q2和Q3的说明,计算方式以及判断outlier的方法可参考维基百科Quartile
关于置信区间的说明可参见知乎文章如何理解 95% 置信区间?中李大猫的说明,以及如何理解置信度?中邹日佳的解释。
关于t值和z值的区别以及使用可参考T-Score vs. Z-Score: What’s the Difference?
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  统计学