您的位置：首页 > 其它

pandas中的几个重要函数

2017-04-07 18:21 309 查看

推荐参考网站：https://my.oschina.net/lionets/blog/279785#OSC_h3_15

类SQL操作请参考这里：http://blog.csdn.net/weixin_37226516/article/details/64137043

1. read_csv读取文件 +++++++++++++++ to_csv写入csv文件

import pandas as pd
data = pd.read_csv("./data/a.csv",encoding="gbk")
data.to_csv('./data/ans.csv', index=False, index_label=False) # index=True 将每一行的行标号写入文件，index_label：行标号的列名写入文件

2. get_dummies获取某一列的one-hot向量

pd.get_dummies(data["age"], prefix="age")  #prefix为前缀

3. merge/concat数据表的拼接

#merge
data = pd.merge(df1,df2,on="A") #"A"这一列不变，将df1和df2连接
#concat
data = pd.concat([df1,df2,df3],axis=0) #按行拼接
data = pd.concat([df1,df2,df3],axis=1) #按列拼接

4. groupby分组
类SQL操作请参考这里：http://blog.csdn.net/weixin_37226516/article/details/64137043

#合并"A"列,并且"A"不作为索引,重复的数字加和
data.groupby(['A'], as_index=False).sum()
#合并"A"列,并且"A"作为索引,重复的数字加和
data.groupby(['A'], as_index=True).sum()

5. merge

使用c=merge(a,b,how='left',on=['one','two'])时，想让c的行数与a相同，必须先对b进行b.groupby(['one','two'])操作。

6. 画图工具

参考网址:http://blog.csdn.net/fennvde007/article/details/37693523

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航