python pandas dataframe 去重函数
2015-08-27 09:32
916 查看
今天笔者想对pandas中的行进行去重操作,找了好久,才找到相关的函数
先看一个小例子
执行结果是:
DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。
而 drop_duplicates方法,它用于返回一个移除了重复行的DataFrame
这两个方法会判断全部列,你也可以指定部分列进行重复项判段。
例如,希望对名字为k2的列进行去重,
data.drop_duplicates(['k2'])
先看一个小例子
from pandas import Series, DataFrame data = DataFrame({'k': [1, 1, 2, 2]}) print data IsDuplicated = data.duplicated() print IsDuplicated print type(IsDuplicated) data = data.drop_duplicates() print data
执行结果是:
k 0 1 1 1 2 2 3 2
0 False 1 True 2 False 3 True
k 0 1 2 2
DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。
而 drop_duplicates方法,它用于返回一个移除了重复行的DataFrame
这两个方法会判断全部列,你也可以指定部分列进行重复项判段。
例如,希望对名字为k2的列进行去重,
data.drop_duplicates(['k2'])
相关文章推荐
- python包的安装与卸载
- python setuptools工具
- 【转】一小时学会用Python Socket 开发可并发的FTP服务器!!
- python pip工具
- python中的setup.py详解
- 用好Python帮助函数help(),dir(),type()
- Python初学(6)——Python的函数
- python 爬取某网站图片(娱乐向)
- Python CGI 模块剖析
- Python实现的knn算法示例
- 两个使用Python脚本操作文件的小示例分享
- 计蒜客题库(Python):5、矩阵翻转
- 计蒜客题库(Python):6、泥塑课
- python使用pip安装gevent时提示Unable to find vcvarsall.bat
- 《Python核心编程》第6章 习题
- Python初学(5)——Python语法规则
- python爬虫scrapy的Selectors参考文档
- 2.自动化测试之python+selenium基础
- 6.python中目录的操作
- [Python]安装NumPy时遇到的一些问题