您的位置:首页 > 其它

pandas中的几个重要函数

2017-04-07 18:21 309 查看
推荐参考网站:https://my.oschina.net/lionets/blog/279785#OSC_h3_15

类SQL操作请参考这里:http://blog.csdn.net/weixin_37226516/article/details/64137043

1. read_csv读取文件 +++++++++++++++ to_csv写入csv文件

import pandas as pd
data = pd.read_csv("./data/a.csv",encoding="gbk")
data.to_csv('./data/ans.csv', index=False, index_label=False) # index=True 将每一行的行标号写入文件,index_label:行标号的列名写入文件


2. get_dummies获取某一列的one-hot向量

pd.get_dummies(data["age"], prefix="age")  #prefix为前缀
3. merge/concat数据表的拼接
#merge
data = pd.merge(df1,df2,on="A") #"A"这一列不变,将df1和df2连接
#concat
data = pd.concat([df1,df2,df3],axis=0) #按行拼接
data = pd.concat([df1,df2,df3],axis=1) #按列拼接
4. groupby分组
类SQL操作请参考这里:http://blog.csdn.net/weixin_37226516/article/details/64137043

#合并"A"列,并且"A"不作为索引,重复的数字加和
data.groupby(['A'], as_index=False).sum()
#合并"A"列,并且"A"作为索引,重复的数字加和
data.groupby(['A'], as_index=True).sum()

5. merge

使用c=merge(a,b,how='left',on=['one','two'])时,想让c的行数与a相同,必须先对b进行b.groupby(['one','two'])操作。

6. 画图工具

参考网址:http://blog.csdn.net/fennvde007/article/details/37693523
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: