当前位置:首页 > 行业动态 > 正文

pandas两个dataframe join多条记录随机取一条

在Python的pandas库中,我们可以使用merge函数来合并两个dataframe,如果我们想要随机选择多条记录进行合并,我们可以使用sample函数来实现。

pandas两个dataframe join多条记录随机取一条  第1张

以下是详细的步骤:

1、我们需要导入pandas库,并创建两个dataframe。

import pandas as pd
创建第一个dataframe
df1 = pd.DataFrame({
   'A': ['A0', 'A1', 'A2', 'A3'],
   'B': ['B0', 'B1', 'B2', 'B3'],
   'key': ['K0', 'K1', 'K0', 'K1']
})
创建第二个dataframe
df2 = pd.DataFrame({
   'C': ['C0', 'C1'],
   'D': ['D0', 'D1']},
   index=['K0', 'K1']
)

2、我们可以使用merge函数来合并这两个dataframe,在这个例子中,我们将根据’key’列来合并这两个dataframe。

result = pd.merge(df1, df2, left_on='key', right_index=True)

3、我们可以使用sample函数来随机选择多条记录,在这个例子中,我们将随机选择2条记录。

result = result.sample(n=2)

以上就是如何在pandas中合并两个dataframe,并根据’key’列随机选择多条记录的方法。

0