Pandas DataFrame 日常的操作与发现
2016-06-08 11:31
961 查看
import numpy as np
import pandas as pd
一,选择数据
当使用ix[a,b]精确取元素时,a取df的index值。例子中end_time为df的indexa = df.ix[end_time,0]
但是使用iat[m,n]精确取元素时,第一个arg不能为index,必须为行的行号
二. 与Matrix,数组转换
csv文件的数据是N行一列,将它读取到程序保存为一维数组。df = pd.read_csv('filename.csv',header = None) mat = df[0].T.as_matrix() list_1 = list(mat)
三.空值处理(NaN和None)
df.fillna(0) df.fillna({1:0,2:0.5}) #对第一列nan值赋0,第二列赋值0.5 df.fillna(method='ffill') #在列方向上以前一个值作为值赋给NaN df.fillna(method='bfill',limit=1) #<span lang="zh-CN" style="font-family:宋体">表示用后一个数据代替</span><span lang="en-US" style="font-family: 'MV Boli'">NaN</span> df.fillna(df.mean()) #<span lang="zh-CN" style="font-family:宋体">表示用平均数或者其他描述性统计量来代替</span><span lang="en-US" style="font-family:'MV Boli'">NaN</span>
四. 合并
横着,并排,以行为单位
result = pd.concat([df1, df4], axis=1) result = pd.concat([df1, df4], axis=1, join='inner') result = pd.concat([df1, df4], axis=1, join_axes=[df1.index])
相关文章推荐
- Python动态类型的学习---引用的理解
- Python3写爬虫(四)多线程实现数据爬取
- 垃圾邮件过滤器 python简单实现
- 下载并遍历 names.txt 文件,输出长度最长的回文人名。
- install and upgrade scrapy
- Scrapy的架构介绍
- Centos6 编译安装Python
- 使用Python生成Excel格式的图片
- 让Python文件也可以当bat文件运行
- [Python]推算数独
- Python中zip()函数用法举例
- Python中map()函数浅析
- Python将excel导入到mysql中
- Python在CAM软件Genesis2000中的应用
- 使用Shiboken为C++和Qt库创建Python绑定
- FREEBASIC 编译可被python调用的dll函数示例
- Python 七步捉虫法