您的位置:首页 > 其它

03_3Pandas_数据统计

2016-12-26 11:56 204 查看

Pandas统计计算和描述

import numpy as np
import pandas as pd


1. 常用的统计计算

常用的统计计算有sum, mean, max, min等等。

axis=0表示按列进行统计;axis=1表示按行进行统计。

df_obj = pd.DataFrame(np.random.randn(5,4), columns = ['a', 'b', 'c', 'd'])
print df_obj


a         b         c         d
0  0.722359  1.217575  3.490672 -1.336423
1 -0.763636  0.733086  2.040918 -1.044013
2  0.987146  1.189183 -1.473418 -0.229858
3  0.133904  0.466251  0.020782  0.228881
4 -0.557013  1.086064  0.658789  0.839411


df_obj.sum()


a   -0.566864
b   -3.015012
c   -2.515817
d   -2.715066
dtype: float64


df_obj.max()


a    1.124964
b    0.382517
c    0.269485
d    0.214707
dtype: float64


df_obj.min(axis=1)


0   -0.897276
1   -0.996451
2   -0.491824
3   -2.103312
4   -1.455739
dtype: float64


2. 统计描述

除了可以单独调用统计的函数进行计算外,还可以直接使用describe( )函数,可以直接返回多个统计数据。

print df_obj.describe()


a         b         c         d
count  5.000000  5.000000  5.000000  5.000000
mean   0.104552  0.938432  0.947549 -0.308400
std    0.766964  0.326999  1.901729  0.895861
min   -0.763636  0.466251 -1.473418 -1.336423
25%   -0.557013  0.733086  0.020782 -1.044013
50%    0.133904  1.086064  0.658789 -0.229858
75%    0.722359  1.189183  2.040918  0.228881
max    0.987146  1.217575  3.490672  0.839411


注:部分例子来自于小象学院Robin课程
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: