时间:2021-05-22
1.创建带有缺失值的数据库:
import pandas as pdimport numpy as npdf = pd.DataFrame(np.random.randn(5, 3), index = list('abcde'), columns = ['one', 'two', 'three']) # 随机产生5行3列的数据 df.ix[1, :-1] = np.nan # 将指定数据定义为缺失df.ix[1:-1, 2] = np.nanprint('\ndf1') # 输出df1,然后换行print(df)查看数据内容:
2.通常情况下删除行,使用参数axis = 0,删除列的参数axis = 1,通常不会这么做,那样会删除一个变量。
print('\ndrop row')print(df.dropna(axis = 0))删除后结果:
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
df.dropna()函数用于删除dataframe数据中的缺失数据,即删除NaN数据.官方函数说明:DataFrame.dropna(axis=0,how='
1.摘要dropna()方法,能够找到DataFrame类型数据的空值(缺失值),将空值所在的行/列删除后,将新的DataFrame作为返回值返回。2.函数详解
处理方式:存在缺失值nan,并且是np.nan:删除存在缺失值的:dropna(axis='rows')替换缺失值:fillna(df[].mean(),inp
Pandas使用这些函数处理缺失值:isnull和notnull:检测是否是空值,可用于df和seriesdropna:丢弃、删除缺失值axis:删除行还是列,
原作:风控猎人整理:数据管道归纳整理了一些工作中常用到的pandas使用技巧,方便更高效地实现数据分析。1.计算变量缺失率df=pd.read_csv('tit