当前位置:首页 > 行业动态 > 正文

pandas 探查数据唯一列

在Pandas中,我们可以使用nunique()函数来查看数据框中每一列的唯一值数量,这个函数会返回一个序列,其中每个元素是对应列的唯一值数量。

以下是一个简单的例子:

pandas 探查数据唯一列

import pandas as pd
创建一个数据框
df = pd.DataFrame({
   'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
   'C': np.random.randn(8),
   'D': np.random.randn(8)
})
查看每一列的唯一值数量
print(df.nunique())

在这个例子中,我们首先创建了一个包含四列的数据框,我们使用nunique()函数来查看每一列的唯一值数量,结果将会打印出每一列的唯一值数量。

注意,nunique()函数默认只考虑非空值,如果你想要考虑空值,你可以设置参数dropna=False

pandas 探查数据唯一列

print(df.nunique(dropna=False))

这将返回每一列(包括空值)的唯一值数量。