您的位置:首页 > 编程语言 > Python开发

python pandas dataframe 去重函数

2017-02-21 23:09 736 查看
转自:http://bluewhale.cc/2016-08-06/use-pandas-filter-and-sort.html

from pandas import Series, DataFrame

data = DataFrame({'k': [1, 1, 2, 2]})

print data

IsDuplicated = data.duplicated()

print IsDuplicated
print type(IsDuplicated)
data = data.drop_duplicates()
print data


执行结果是:

[python]
view plain
copy





   k  
0  1  
1  1  
2  2  
3  2  

[python]
view plain
copy





0    False  
1     True  
2    False  
3     True  

[python]
view plain
copy





   k  
0  1  
2  2 
DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。

而 drop_duplicates方法,它用于返回一个移除了重复行的DataFrame

这两个方法会判断全部列,你也可以指定部分列进行重复项判段。

例如,希望对名字为k2的列进行去重





                                            
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: