当前位置:首页 > 行业动态 > 正文

pythonnumpy和pandas的使用

在数据分析和处理领域,Python 的 NumPy 和 Pandas 库是两个非常重要的工具,NumPy 提供了高性能的多维数组对象以及用于处理这些数组的工具,而 Pandas 是基于 NumPy 构建的,提供了易于使用的数据结构和数据分析工具,接下来,我会详细介绍如何使用这两个库。

pythonnumpy和pandas的使用  第1张

NumPy 的使用

安装 NumPy

你需要安装 NumPy,可以使用 pip 命令进行安装:

pip install numpy

创建数组

NumPy 的核心是 ndarray 对象,这是一个多维数组,你可以使用 numpy.array() 函数创建一个数组:

import numpy as np
arr = np.array([1, 2, 3, 4, 5])
print(arr)

数组操作

NumPy 提供了大量的数组操作函数,例如求和、平均值、最大值、最小值等:

print(np.sum(arr))      # 求和
print(np.mean(arr))     # 平均值
print(np.max(arr))      # 最大值
print(np.min(arr))      # 最小值

Pandas 的使用

安装 Pandas

同样,你需要先安装 Pandas:

pip install pandas

创建 DataFrame

Pandas 的核心数据结构是 DataFrame,这是一个二维表格型数据结构,你可以使用 pandas.DataFrame() 函数创建一个 DataFrame:

import pandas as pd
data = {
    '姓名': ['张三', '李四', '王五'],
    '年龄': [25, 30, 35],
    '城市': ['北京', '上海', '深圳']
}
df = pd.DataFrame(data)
print(df)

数据操作

Pandas 提供了丰富的数据操作方法,例如筛选、排序、分组等:

筛选年龄大于等于30的行
filtered_df = df[df['年龄'] >= 30]
print(filtered_df)
按年龄排序
sorted_df = df.sort_values(by='年龄')
print(sorted_df)
按城市分组,计算每组的平均年龄
grouped_df = df.groupby('城市')['年龄'].mean()
print(grouped_df)

以上就是 Python 中 NumPy 和 Pandas 的基本使用方法,在实际工作中,你可能需要根据具体需求灵活运用这两个库的功能,希望对你有所帮助!

0