当前位置:首页 > 行业动态 > 正文

pandas lambda函数

Pandas中的lambda函数是一种用于创建匿名函数的方法,它可以在Pandas的DataFrame和Series对象上进行操作,Lambda函数通常用于对数据进行筛选、排序、计算等操作。

1. 基本用法

Lambda函数的基本语法如下:

lambda arguments: expression

arguments是传递给函数的参数,expression是对参数进行操作的表达式。

2. 在DataFrame中使用lambda函数

在DataFrame中,可以使用lambda函数对某一列或多列进行操作,对某列求和、求平均值、筛选满足条件的数据等。

2.1 对某一列进行操作

2.1.1 求和

import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
使用lambda函数求A列的和
sum_a = df['A'].apply(lambda x: sum(x))
print(sum_a)  # 输出:6

2.1.2 求平均值

avg_a = df['A'].apply(lambda x: sum(x) / len(x))
print(avg_a)  # 输出:2.0

2.2 对多列进行操作

2.2.1 筛选满足条件的数据

筛选A列大于1且B列小于5的数据
filtered_data = df[(df['A'] > 1) & (df['B'] < 5)]
print(filtered_data)

3. 在Series中使用lambda函数

在Series中,可以使用lambda函数对数据进行筛选、排序、计算等操作,筛选满足条件的数据、对数据进行排序等。

3.1 筛选满足条件的数据

data = [1, 2, 3, 4, 5]
series = pd.Series(data)
筛选大于2的数据
filtered_data = series[lambda x: x > 2]
print(filtered_data)  # 输出:[3, 4, 5]

3.2 对数据进行排序

对数据进行降序排序
sorted_data = series.sort_values(ascending=False)
print(sorted_data)  # 输出:[5, 4, 3, 2, 1]
0

随机文章