您的位置:首页 > 编程语言 > Python开发

Python中如何进行数据分组

2017-07-14 13:57 183 查看

数据分组

根据数据分析对象的特征,按照一定的数值指标,把数据分析对象划分为不同的区间进行研究,以揭示其内在联系和规律性。
cut 函数:
cut(series,bins,right=True,labels=NULL)
① series  需要分组的数据
② bins    分组的划分数组
③ right   分组的时候,右边是否闭合,默认为闭合True
④ labels  分组的自定义标签,可以不自定义

import pandas

data = pandas.read_csv(
'D:\\PDA\\4.15\\data.csv',
sep='|'
)
#理解为什么我的bins区间要-1和+1
bins = [
min(data.cost)-1, 20, 40, 60,
80, 100, max(data.cost)+1
]

data['cut'] = pandas.cut(
data.cost,
bins
)

data['cut'] = pandas.cut(
data.cost,
bins,
right=False
)

labels = [
'20以下', '20到40', '40到60',
'60到80', '80到100', '100以上'
]

data['cut'] = pandas.cut(
data.cost, bins,
right=False, labels=labels
)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python 数据分组 cut