pythonnumpy和pandas的使用
- 行业动态
- 2024-03-04
- 2981
在数据分析和处理领域,Python 的 NumPy 和 Pandas 库是两个非常重要的工具,NumPy 提供了高性能的多维数组对象以及用于处理这些数组的工具,而 Pandas 是基于 NumPy 构建的,提供了易于使用的数据结构和数据分析工具,接下来,我会详细介绍如何使用这两个库。
NumPy 的使用
安装 NumPy
你需要安装 NumPy,可以使用 pip 命令进行安装:
pip install numpy
创建数组
NumPy 的核心是 ndarray 对象,这是一个多维数组,你可以使用 numpy.array() 函数创建一个数组:
import numpy as np arr = np.array([1, 2, 3, 4, 5]) print(arr)
数组操作
NumPy 提供了大量的数组操作函数,例如求和、平均值、最大值、最小值等:
print(np.sum(arr)) # 求和 print(np.mean(arr)) # 平均值 print(np.max(arr)) # 最大值 print(np.min(arr)) # 最小值
Pandas 的使用
安装 Pandas
同样,你需要先安装 Pandas:
pip install pandas
创建 DataFrame
Pandas 的核心数据结构是 DataFrame,这是一个二维表格型数据结构,你可以使用 pandas.DataFrame() 函数创建一个 DataFrame:
import pandas as pd data = { '姓名': ['张三', '李四', '王五'], '年龄': [25, 30, 35], '城市': ['北京', '上海', '深圳'] } df = pd.DataFrame(data) print(df)
数据操作
Pandas 提供了丰富的数据操作方法,例如筛选、排序、分组等:
筛选年龄大于等于30的行 filtered_df = df[df['年龄'] >= 30] print(filtered_df) 按年龄排序 sorted_df = df.sort_values(by='年龄') print(sorted_df) 按城市分组,计算每组的平均年龄 grouped_df = df.groupby('城市')['年龄'].mean() print(grouped_df)
以上就是 Python 中 NumPy 和 Pandas 的基本使用方法,在实际工作中,你可能需要根据具体需求灵活运用这两个库的功能,希望对你有所帮助!
本站发布或转载的文章及图片均来自网络,其原创性以及文中表达的观点和判断不代表本站,有问题联系侵删!
本文链接:http://www.xixizhuji.com/fuzhu/337443.html