当前位置:首页 > 行业动态 > 正文

python pandas基础

Pandas是Python的一个开源数据分析库,提供了高性能、易用的数据结构和数据分析工具。它特别适合处理和分析结构化数据,如CSV、Excel等格式的文件。

Pandas是一个强大的Python数据分析库,它提供了大量用于处理和分析数据的功能,以下是一些基本的Pandas操作:

python pandas基础  第1张

1、导入pandas库:

import pandas as pd

2、创建一个DataFrame:

data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 35],
        'City': ['New York', 'San Francisco', 'Los Angeles']}
df = pd.DataFrame(data)

3、查看DataFrame的前几行:

print(df.head())

4、选择DataFrame的某一列:

ages = df['Age']

5、选择DataFrame的多列:

selected_columns = df[['Name', 'City']]

6、根据条件筛选DataFrame:

filtered_df = df[df['Age'] > 30]

7、对DataFrame进行排序:

sorted_df = df.sort_values(by='Age')

8、计算DataFrame的统计信息:

summary = df.describe()

9、添加新的列到DataFrame:

df['Salary'] = [50000, 60000, 70000]

10、删除DataFrame中的列:

df = df.drop('City', axis=1)

这只是Pandas的基础操作,实际上Pandas还有很多高级功能,如分组、合并、透视表等,要深入了解Pandas,建议参考官方文档或相关教程。

0