python pandas dataframe 去重函数
2017-02-21 23:09
736 查看
转自:http://bluewhale.cc/2016-08-06/use-pandas-filter-and-sort.html from pandas import Series, DataFrame data = DataFrame({'k': [1, 1, 2, 2]}) print data IsDuplicated = data.duplicated() print IsDuplicated print type(IsDuplicated) data = data.drop_duplicates() print data
执行结果是:
[python]
view plain
copy
k
0 1
1 1
2 2
3 2
[python]
view plain
copy
0 False
1 True
2 False
3 True
[python]
view plain
copy
k
0 1
2 2
DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。
而 drop_duplicates方法,它用于返回一个移除了重复行的DataFrame
这两个方法会判断全部列,你也可以指定部分列进行重复项判段。
例如,希望对名字为k2的列进行去重
相关文章推荐
- python pandas dataframe 去重函数
- machine learning in coding(python):pandas数据包DataFrame数据结构简介
- python pandas.DataFrame选取、修改数据最好用.loc,.iloc,.ix
- python pandas.DataFrame选取、修改数据最好用.loc,.iloc,.ix
- Python方法总结(1)——删除pandas DataFrame的某一/几列
- python的pandas中DataFrame 基础,创建DataFrame和增删改查基本操作(1)
- Python 数据处理扩展包: pandas 模块的DataFrame介绍(创建和基本操作)
- Python:Pandas:DataFrame基础(3)
- 用python做数据分析4|pandas库介绍之DataFrame基本操作
- Python 数据处理扩展包: pandas 模块的DataFrame介绍(读写数据库的操作)
- Python Pandas批量读取csv文件到dataframe的方法
- python删除pandas DataFrame的某一/几列
- python 数据处理学习pandas之DataFrame(三)
- Python小练习2:pandas.Dataframe使用方法示例demo
- 数据结构之--series,DataFrame.use python and pandas for data mining
- python pandas dataframe 去重函数
- python 数据处理学习pandas之DataFrame(二)
- #######用python做数据分析4|pandas库介绍之DataFrame基本操作#######
- python pandas中series与dataframe数据类型属性及操作基础
- python中pandas.DataFrame排除特定行方法示例