统计学中常用专用名词中英对照
2016-03-29 23:50
399 查看
最近接触了统计学的一些基础,由于看的资料是英文的,特意整理了部分专用名词的中英对照,以便理解。
小知识点:
Measures of Central Tendency: Mean, Median, Mode
Measures of Variability: Rang, IQR, Variance, Standard deviation
在统计学中有句话很流行: Correlation does not imply causation。
一般观察relationship可以通过observational studies survey,若要确认causation要通过controlled experiment。
以下为部分名词的介绍资料,供参考。
关于population, sample, parameter, statistics的详细说明可参考文章Populations, Samples, Parameters, and Statistics。 ↩
关于mean, median, mode, range的说明可参考文章Mean, Median, Mode, and Range。 ↩
关于Q1,Q2和Q3的说明,计算方式以及判断outlier的方法可参考维基百科Quartile。 ↩
关于置信区间的说明可参见知乎文章如何理解 95% 置信区间?中李大猫的说明,以及如何理解置信度?中邹日佳的解释。 ↩
关于t值和z值的区别以及使用可参考T-Score vs. Z-Score: What’s the Difference? ↩
英文 | 中文 | 备注 |
---|---|---|
population | 总体 | N/A |
sample | 样本 | N/A |
population parameter(μ) | 总体参数 | 可看作总体平均 |
sample statistics(x̄) | 样本统计量 | 可看作样本平均1 |
sample error | 误差 | μ-x̄ |
X-aixs | X轴 | N/A |
Y-aixs | Y轴 | N/A |
origin | 原点 | N/A |
odd number | 奇数 | N/A |
even number | 偶数 | N/A |
Cartesian coordinate | 笛卡尔坐标 | N/A |
independent variable | 自变量 | N/A |
predictor variable | 预测变量 | 同自变量 |
dependent variable | 因变量 | N/A |
outcome | 结果 | 同因变量 |
lurking variable | 潜在变量 | N/A |
extraneous factor | 外界变量 | N/A |
histogram | 直方图 | X轴一般为numerical/quantitative |
bar graph | 柱形图 | X轴一般为categorical/qualitative |
bo plots/box and whisker plots | 箱线图/盒须图 | 可以更好地表示IQR和四分位数 |
symmetrical | 对称 | N/A |
uniform distribution | 均匀分布 | 数据基本分布在同一水平 |
Bi-modal/Multimodal distribution | 双峰分布 | 多个不同的mode |
normal distribution | 正态分布 | 高峰居中,左右大致对称 |
positively skewed distribution | 正偏态分布 | 高峰左移,长尾右侧延长 |
negatively skewed distribution | 负偏态分布 | 高峰右移,长尾左侧延长 |
mean | 平均值 | 算术平均 |
median | 中数 | 一组数据中的中间数值 |
mode | 众数 | 一组数据中出现次数最多(peak) |
rang | 全距/极差 | 最大值与最小值的差2 |
midrange | 中程数 | 最大值与最小值的平均数 |
deviation | 偏差 | 样本(或总体)中数据与mean的差, 所有数据的偏差的和应为0 |
absolute deviation | 绝对偏差 | 偏差的绝对值 |
squared deviation | 平方偏差/平方差 | 偏差的平方 |
sum of squares(SS) | 平方和 | 各个偏差平方的和 |
variance | 方差 | 总体:偏差平方和除以n,SS/n 样本:偏差平方和除以n-1,SS/(n-1) |
standard deviation(s/σ) | 标准偏差 | 方差的平方根 |
first quartile(Q1) | 第一四分位数 | 数据前50%的median |
second quartile(Q2) | 第二四分位数 | median |
third quartile (Q3) | 第三四分位数 | 数据后50%的median3 |
interquartile range(IQR) | 四分位距/四分差 | Q3-Q1的值 |
outlier | 离群值 | 与其他数据相比差距较大 小于Q1-1.5IQR或大于Q3+1.5*IQR |
Bessel’s correction | 贝塞尔校正系数 | 计算样本方差时除以n-1而不是n |
z-score | z值 | (x-μ)/σ |
probability density function(PDF) | 概率密度函数 | 相对频率曲线,面积为1 |
negative infinity | 负无穷 | N/A |
standard error(SE) | 标准误差 | σ/sqrt(n),标准偏差除以根号n |
central limit theorem | 中心极限定理 | N/A |
point estimate | 点估计 | N/A |
margin of error | 误差界限 | (t or z)*σ/sqrt(n),置信区间的一半 |
confidence interval | 置信区间4 | z(x̄-z*σ/sqrt(n),x̄+z*σ/sqrt(n)) t(x̄-t*σ/sqrt(n),x̄+t*σ/sqrt(n)) |
critical region | 临界区 | alpha level |
null hypothesis(H0) | 零假设/虚无假设 | N/A |
alternative hypothesis(Ha) | 对立假设/备择假设 | N/A | 4000
one-tailed(directional) hypothesis | 单尾(方向性)检验 | N/A |
two-tailed(non-directional) hypothesis | 双尾(非方向)检验 | N/A |
Type I error | I类错误 | 拒绝了正确的假设 |
Type II error | II类错误 | 接受了错误的假设 |
t-statistic(student’s t) | t统计量 | 点估计:(x̄-μ)/(s/sqrt(n)) 相依样本:(μ1-μ2)/(s/sqrt(n))5 |
effective sample size | 有效取样数 | n-1 |
degrees of freedom | 自由度 | N/A |
within subject design/repeated measures design | 受试者内设计/重复衡量设计 | N/A |
between subject designs | 受试者间设计 | N/A |
dependent sample t-test | 相依样本t检验 | N/A |
independent sample | 独立样本 | N/A |
longitudinal design | 纵向设计 | 检验不同时间同一变量的变化 |
pretest posttest | 预期检验,后期检验 | 检验更改前后同一变量的变化 |
effect size | 效应量 | 处理(某种动作,措施等)效应的大小 |
difference measures | 差异度量 | 均值差异 |
standardized difference | 标准化差异度量 | Cohen’s D |
correlation measures | 相关度量 | r^2=t^2/(t^2+df) |
statistical significance | 统计显著性 | N/A |
pool variance | 合并方差 | (SSx+SSy)/(dfx+dfy) |
Measures of Central Tendency: Mean, Median, Mode
Measures of Variability: Rang, IQR, Variance, Standard deviation
在统计学中有句话很流行: Correlation does not imply causation。
一般观察relationship可以通过observational studies survey,若要确认causation要通过controlled experiment。
以下为部分名词的介绍资料,供参考。
关于population, sample, parameter, statistics的详细说明可参考文章Populations, Samples, Parameters, and Statistics。 ↩
关于mean, median, mode, range的说明可参考文章Mean, Median, Mode, and Range。 ↩
关于Q1,Q2和Q3的说明,计算方式以及判断outlier的方法可参考维基百科Quartile。 ↩
关于置信区间的说明可参见知乎文章如何理解 95% 置信区间?中李大猫的说明,以及如何理解置信度?中邹日佳的解释。 ↩
关于t值和z值的区别以及使用可参考T-Score vs. Z-Score: What’s the Difference? ↩
相关文章推荐
- 为什么统计学家应该关注数据挖掘
- 最小二乘法
- 统计学习(一)--统计学习的定义及常识
- 统计学原理----走出平均数理解上的误区
- SAS软件的使用和统计学分析的初步介绍
- 基于个人选择的一点想法
- 美国纽约留学的日子
- 读 统计学习方法 摘要
- mysql统计用户七日留存存储过程
- 初学MCMC(Markov Chain Monte Carlo)
- 初学MCMC(Markov Chain Monte Carlo)
- 生物&统计学词汇解释
- 统计学习-4
- 统计学习-3
- 统计学习-2
- 协方差矩阵
- R在开放数据的应用
- scikit-learn Generalized Linear Models 自主学习笔记(一)
- 【读书笔记】统计学:从数据到结论 第十章
- 【读书笔记】统计学:从数据到结论 第八章