Python数据分析与展示(6)——Pandas数据特征分析
2017-08-05 19:21
399 查看
最近在中国大学mooc网学习Python数据分析与展示相关知识,记入下来,以供参考。
.sort_index(axis=0, ascending=True)
.sort_values()方法在指定轴上根据数值进行排序,默认升序
Series.sort_values(axis=0, ascending=True)
DataFrame.sort_values(by, axis=0, ascending=True)
by : axis轴上的某个索引或索引列表
适用于Series类型
适用于Series和DataFrame类型,滚动计算(窗口计算)
Pandas数据特征分析
数据的排序
.sort_index()方法在指定轴上根据索引进行排序,默认升序.sort_index(axis=0, ascending=True)
.sort_values()方法在指定轴上根据数值进行排序,默认升序
Series.sort_values(axis=0, ascending=True)
DataFrame.sort_values(by, axis=0, ascending=True)
by : axis轴上的某个索引或索引列表
数据的基本统计分析
适用于Series和DataFrame类型方法 | 说明 |
---|---|
.sum() | 计算数据的总和,按0轴计算,下同 |
.count() | 非NaN值的数量 |
.mean() .median() | 计算数据的算术平均值、算术中位数 |
.var() .std() | 计算数据的方差、标准差 |
.min() .max() | 计算数据的最小值、最大值 |
.describe() | 针对0轴(各列)的统计汇总 |
方法 | 说明 |
---|---|
.argmin() .argmax() | 计算数据最大值、最小值所在位置的索引位置(自动索引) |
.idxmin() .idxmax() | 计算数据最大值、最小值所在位置的索引(自定义索引) |
数据的累积统计分析
适用于Series和DataFrame类型,累计计算方法 | 说明 |
---|---|
.cumsum() | 依次给出前1、2、…、n个数的和 |
.cumprod() | 依次给出前1、2、…、n个数的积 |
.cummax() | 依次给出前1、2、…、n个数的最大值 |
.cummin() | 依次给出前1、2、…、n个数的最小值 |
方法 | 说明 |
---|---|
.rolling(w).sum() | 依次计算相邻w个元素的和 |
.rolling(w).mean() | 依次计算相邻w个元素的算术平均值 |
.rolling(w).var() | 依次计算相邻w个元素的方差 |
.rolling(w).std() | 依次计算相邻w个元素的标准差 |
.rolling(w).min() .max() | 依次计算相邻w个元素的最小值和最大值 |
数据的相关分析
适用于Series和DataFrame类型方法 | 说明 |
---|---|
.cov() | 计算协方差矩阵 |
.corr() | 计算相关系数矩阵, Pearson、Spearman、Kendall等系数 |
相关文章推荐
- 数据分析与展示——Pandas数据特征分析
- python 抓取数据,pandas进行数据分析并可视化展示
- 利用Python进行数据分析——pandas入门(五)(4)
- Python数据分析之pandas学习
- Python数据分析包:pandas 基础
- 利用python/pandas/numpy做数据分析(三)-透视表pivot_table
- Python数据分析之pandas学习(含盖8个方面)
- python/pandas/numpy数据分析(七)-MultiIndex
- 利用Python进行数据分析(12) pandas基础: 数据合并
- <Python数据分析>pandas, DataFrame, Index的方法delete和drop的区别
- python基础数据分析--pandas(一)
- 利用 Python 进行数据分析(十二)pandas:数据合并
- 安装 python 数据分析插件 pandas
- 利用Python数据分析:pandas入门(二)
- 7064-2.Python数据分析:pandas基本用法(下)
- Python数据分析模块 | pandas做数据分析(三):统计相关函数
- python数据分析:pandas数据结构与操作
- 用python做数据分析4|pandas库介绍之DataFrame基本操作
- 利用Python数据分析:pandas入门(四)
- MOOC《数据分析与展示》之Pandas 课堂笔记