当前位置:首页 > 行业动态 > 正文

pandas vlookup

Pandas 是 Python 中一个非常强大的数据处理库,它提供了许多用于数据操作和分析的功能,Vlookup 是 Excel 中的一个功能,用于在两个表格之间进行垂直查找并返回匹配的值,在 Pandas 中,我们可以使用 merge 函数来实现类似的功能。

pandas vlookup  第1张

本文将详细介绍如何使用 Pandas 的 merge 函数实现 Vlookup 功能,我们需要安装 Pandas 库,可以使用以下命令进行安装:

pip install pandas

接下来,我们将通过一个简单的例子来演示如何使用 Pandas 的 merge 函数实现 Vlookup 功能,假设我们有两个表格,一个是学生信息表(students),另一个是成绩表(scores),学生信息表包含学生的 ID、姓名和班级,成绩表包含学生的 ID、科目和分数,我们想要根据学生的 ID 将这两个表格合并在一起,以便查看每个学生的成绩。

我们需要导入 Pandas 库并创建两个表格:

import pandas as pd
创建学生信息表
data_students = {'ID': [1, 2, 3, 4, 5],
                 '姓名': ['张三', '李四', '王五', '赵六', '陈七'],
                 '班级': ['一班', '二班', '一班', '二班', '一班']}
df_students = pd.DataFrame(data_students)
创建成绩表
data_scores = {'ID': [1, 2, 3, 4, 5],
               '科目': ['语文', '数学', '英语', '物理', '化学'],
               '分数': [90, 80, 85, 95, 75]}
df_scores = pd.DataFrame(data_scores)

现在我们已经创建了两个表格,接下来我们将使用 merge 函数将它们合并在一起:

根据学生的 ID 合并两个表格
result = pd.merge(df_students, df_scores, on='ID')

merge 函数的第一个参数是要合并的第一个表格,第二个参数是要合并的第二个表格,第三个参数是用于合并的列名,在这个例子中,我们使用学生的 ID(’ID’)作为合并的依据。

合并后的表格如下:

   ID   姓名 班级    科目   分数
0   1   张三  一班  语文   90.0
1   2   李四  二班  数学   80.0
2   3   王五  一班  英语   85.0
3   4   赵六  二班  物理   95.0
4   5   陈七  一班  化学   75.0

可以看到,我们已经成功地将学生信息表和成绩表合并在了一起,实现了类似 Vlookup 的功能,需要注意的是,merge 函数默认是按照左连接的方式进行合并的,也就是说,如果某个学生在成绩表中没有对应的记录,那么这个学生的信息仍然会保留在结果中,只是对应的科目和分数会显示为空值(NaN),如果我们想要按照右连接的方式进行合并,可以将 how 参数设置为 'right':

根据学生的 ID 按照右连接方式合并两个表格
result = pd.merge(df_students, df_scores, on='ID', how='right')

merge 函数还支持其他几种连接方式,如内连接(inner)、外连接(outer)等,具体可以参考 Pandas 官方文档:https://pandas.pydata.org/pandasdocs/stable/reference/api/pandas.DataFrame.merge.html

Pandas 是一个非常强大的数据处理库,它的 merge 函数可以帮助我们实现类似 Vlookup 的功能,通过熟练掌握 Pandas,我们可以更加高效地处理和分析数据。

0