当前位置:首页 > 行业动态 > 正文

python中info的功能

Python中的info()函数通常用于获取对象的详细信息,如对象类型、属性和方法等。

在Python中,info()通常与pandas库的DataFrame对象一起使用,用于查看DataFrame的详细摘要统计信息,当调用info()函数时,它会返回一个包含各种详细信息的报告,这些信息包括:

1、列名

2、非空值数量

3、数据类型

4、内存使用情况

这个功能对于了解数据的基本情况非常有用,特别是在进行数据分析和预处理之前。

使用info()的基本语法

要使用info()函数,首先需要导入pandas库,并创建一个DataFrame对象,可以直接调用info()方法来获取信息。

import pandas as pd
创建一个示例DataFrame
data = {
    'Name': ['Tom', 'Nick', 'John', 'Steve'],
    'Age': [20, 21, 19, 18],
    'City': ['New York', 'Los Angeles', 'Chicago', 'San Francisco']
}
df = pd.DataFrame(data)
调用info()方法
df.info()

info()提供的信息

info()函数提供的报告包含了以下几个部分:

索引:显示DataFrame的索引信息,包括索引名称、是否为唯一值以及非空值的数量。

:列出DataFrame的所有列名。

数据类型:显示每列的数据类型,如int64、float64或object。

内存使用情况:显示DataFrame的总内存使用量以及每列的内存使用量。

描述性统计:如果设置了verbose=True(默认值),则还会显示每列的描述性统计信息,如计数、均值、标准差、最小值、25%分位数、中位数、75%分位数和最大值。

自定义info()的输出

info()函数提供了一些可选参数,可以用来自定义输出的信息。

verbose:控制是否显示描述性统计信息,默认值为True。

max_cols:设置显示列的最大数量,默认值为None,表示显示所有列。

memory_usage:设置内存使用情况的显示方式,可以设置为’deep’、’shallow’或False。

相关问题与解答

Q1: 如何在不显示描述性统计信息的情况下调用info()

A1: 可以通过将verbose参数设置为False来禁用描述性统计信息的显示。

df.info(verbose=False)

Q2: 如何只查看前两列的信息?

A2: 可以使用max_cols参数来限制显示的列数。

df.info(max_cols=2)

Q3: 如何查看DataFrame的内存使用情况?

A3: 可以直接调用info()方法,它会显示每列的内存使用情况以及总内存使用量。

Q4: 如何显示DataFrame的行数和列数?

A4: info()方法会直接显示DataFrame的行数和列数,如果只想获取这两个值,可以使用shape属性。

rows, columns = df.shape
print("行数:", rows)
print("列数:", columns)
0