您的位置:首页 > 编程语言 > Python开发

Pandas 处理丢失数据

2017-12-07 00:00 92 查看
import pandas as pd
import numpy as np

dates =pd.date_range('20130101', periods = 6)
df = pd.DataFrame(np.arange(24).reshape((6, 4)), index = dates, columns = ['A', 'B', 'C', 'D'])
df.iloc[0, 1] = np.nan
df.iloc[1, 2] = np.nan

print(df)

# 删除有NaN值的数据
# axis=0 表示以行删除,axis=1表示以列删除
# how='any' 表示有任何NaN就执行删除操作,how='all' 表示删除所有制都为NaN的数据
print(df.dropna(axis = 0, how = 'any'))  # how = {'any', 'all'}
print(df.dropna(axis = 1, how = 'any'))

# 为NaN值填充value
print(df.fillna(value =0))

# 判断数据是否缺失,会返回所有数据位为True或False
print(df.isnull())

# 判断整个数据是否丢失数据,只要有一个位置丢失数据,就返回True,否则返回False
print(np.any(df.isnull()) == True)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息