时间:2021-05-22
问题描述:
python pandas判断缺失值一般采用 isnull(),然而生成的却是所有数据的true/false矩阵,对于庞大的数据dataframe,很难一眼看出来哪个数据缺失,一共有多少个缺失数据,缺失数据的位置。
首先对于存在缺失值的数据,如下所示
import pandas as pdimport numpy as npdf = pd.DataFrame(np.random.randn(10,6))# Make a few areas have NaN valuesdf.iloc[1:3,1] = np.nandf.iloc[5,3] = np.nandf.iloc[7:9,5] = np.nan 0 1 2 3 4 50 0.520113 0.884000 1.260966 -0.236597 0.312972 -0.1962811 -0.837552 NaN 0.143017 0.862355 0.346550 0.8429522 -0.452595 NaN -0.420790 0.456215 1.203459 0.5274253 0.317503 -0.917042 1.780938 -1.584102 0.432745 0.3897974 -0.722852 1.704820 -0.113821 -1.466458 0.083002 0.0117225 -0.622851 -0.251935 -1.498837 NaN 1.098323 0.2738146 0.329585 0.075312 -0.690209 -3.807924 0.489317 -0.8413687 -1.123433 -1.187496 1.868894 -2.046456 -0.949718 NaN8 1.133880 -0.110447 0.050385 -1.158387 0.188222 NaN9 -0.513741 1.196259 0.704537 0.982395 -0.585040 -1.693810df.isnull()会产生如下结果
0 1 2 3 4 50 False False False False False False1 False True False False False False2 False True False False False False3 False False False False False False4 False False False False False False5 False False False True False False6 False False False False False False7 False False False False False True8 False False False False False True9 False False False False False Falsedf.isnull().any()则会判断哪些”列”存在缺失值
0 False1 True2 False3 True4 False5 Truedtype: bool对于该问题,可以采用如下方式解决:
df[df.isnull().values==True]Out[126]: 0 1 2 3 4 51 1.090872 NaN -0.287612 -0.239234 -0.589897 1.8494132 -1.384721 NaN -0.158293 0.011798 -0.564906 -0.6071215 -0.477590 -2.696239 0.312837 NaN 0.404196 -0.7970507 0.369665 -0.268898 -0.344523 -0.094436 0.214753 NaN8 -0.114483 -0.842322 0.164269 -0.812866 -0.601757 NaN可以只显示存在缺失值的行列,清楚的确定缺失值的位置。
以上这篇Python Pandas找到缺失值的位置方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
在实际应用中对于数据进行分析的时候,经常能看见缺失值,下面来介绍一下如何利用pandas来处理缺失值。常见的缺失值处理方式有,过滤、填充。一、缺失值的判断pan
Pandas使用这些函数处理缺失值:isnull和notnull:检测是否是空值,可用于df和seriesdropna:丢弃、删除缺失值axis:删除行还是列,
前言运用pandas库对所得到的数据进行数据清洗,复习一下相关的知识。1数据清洗1.1处理缺失数据对于数值型数据,分为缺失值(NAN)和非缺失值,对于缺失值的检
问题描述python的pandas库中有一个十分便利的isnull()函数,它可以用来判断缺失值,我们通过几个例子学习它的使用方法。首先我们创建一个datafr
01、缺失值处理人工填充(数据集小,缺失值少)使用样本数据的均值或中位数填充Python缺失值处理实例代码:b、填充替换缺失值--fillna如果缺失值不可以占