题目
(多选题)现在想要探索df中的缺失值,可行的方法有()A,df.isnull ().sum()B,df.info()C,df.describe()D,df.notnull ().sum()
(多选题)现在想要探索df中的缺失值,可行的方法有()
A,df.isnull ().sum()
B,df.info()
C,df.describe()
D,df.notnull ().sum()
题目解答
答案
A,df.isnull().sum() - 这个方法会返回DataFrame中每一列的缺失值数量,是探索缺失值的常用方法。
B,df.info() - 这个方法会提供DataFrame的概览信息,包括每一列的数据类型和非空值的数量。它可以帮助我们快速了解哪些列包含缺失值。
C,df.describe() - 这个方法通常用于提供DataFrame中数值型列的统计摘要,包括计数、均值、标准差、最小值、四分位数和最大值。虽然它本身不直接显示缺失值的数量,但通过计数(count)列可以间接推断出哪些列可能有缺失值。
D,df.notnull().sum() - 这个方法会返回DataFrame中每一列非空值的数量,虽然它提供了非空值的数量,但不是探索缺失值的直接方法。
答案选择为ABC.
解析
步骤 1:理解每个选项的功能
- A,df.isnull().sum():这个方法会返回DataFrame中每一列的缺失值数量,是探索缺失值的常用方法。
- B,df.info():这个方法会提供DataFrame的概览信息,包括每一列的数据类型和非空值的数量。它可以帮助我们快速了解哪些列包含缺失值。
- C,df.describe():这个方法通常用于提供DataFrame中数值型列的统计摘要,包括计数、均值、标准差、最小值、四分位数和最大值。虽然它本身不直接显示缺失值的数量,但通过计数(count)列可以间接推断出哪些列可能有缺失值。
- D,df.notnull().sum():这个方法会返回DataFrame中每一列非空值的数量,虽然它提供了非空值的数量,但不是探索缺失值的直接方法。
步骤 2:选择正确的选项
- A,df.isnull().sum():正确,因为它直接显示了每一列的缺失值数量。
- B,df.info():正确,因为它提供了每一列的非空值数量,从而可以间接了解缺失值情况。
- C,df.describe():正确,虽然它不直接显示缺失值数量,但通过计数(count)列可以间接推断出哪些列可能有缺失值。
- D,df.notnull().sum():不正确,因为它显示的是非空值的数量,而不是缺失值的数量。
- A,df.isnull().sum():这个方法会返回DataFrame中每一列的缺失值数量,是探索缺失值的常用方法。
- B,df.info():这个方法会提供DataFrame的概览信息,包括每一列的数据类型和非空值的数量。它可以帮助我们快速了解哪些列包含缺失值。
- C,df.describe():这个方法通常用于提供DataFrame中数值型列的统计摘要,包括计数、均值、标准差、最小值、四分位数和最大值。虽然它本身不直接显示缺失值的数量,但通过计数(count)列可以间接推断出哪些列可能有缺失值。
- D,df.notnull().sum():这个方法会返回DataFrame中每一列非空值的数量,虽然它提供了非空值的数量,但不是探索缺失值的直接方法。
步骤 2:选择正确的选项
- A,df.isnull().sum():正确,因为它直接显示了每一列的缺失值数量。
- B,df.info():正确,因为它提供了每一列的非空值数量,从而可以间接了解缺失值情况。
- C,df.describe():正确,虽然它不直接显示缺失值数量,但通过计数(count)列可以间接推断出哪些列可能有缺失值。
- D,df.notnull().sum():不正确,因为它显示的是非空值的数量,而不是缺失值的数量。