当前位置:首页 > 行业动态 > 正文

python如何用series画箱线图

箱线图(Box plot)是一种用于展示数据分布特征的图形,它可以显示数据的中位数、四分位数、最大值、最小值以及异常值等信息,在Python中,我们可以使用pandas库的Series对象和matplotlib库来绘制箱线图,以下是详细的技术教学:

python如何用series画箱线图  第1张

1、我们需要安装pandas和matplotlib库,可以使用以下命令进行安装:

pip install pandas matplotlib 

2、接下来,我们创建一个简单的Series对象,用于演示如何绘制箱线图,我们创建一个包含10个随机数的Series对象:

import pandas as pd
import numpy as np
data = pd.Series(np.random.randn(10))
print(data) 

3、为了绘制箱线图,我们需要导入matplotlib库,并设置一些基本的绘图参数,我们可以设置图像的大小、标题等:

import matplotlib.pyplot as plt
plt.figure(figsize=(8, 6))
plt.title("箱线图示例") 

4、现在,我们可以使用matplotlib的boxplot()函数来绘制箱线图,这个函数接受一个或多个Series对象作为参数,并返回一个包含箱线图的轴对象,我们可以将这个轴对象添加到当前的图像中:

ax = data.plot(kind='box') 

5、默认情况下,箱线图的箱子是蓝色的,上下边框是黑色的,我们可以使用set_color()函数来更改箱子的颜色,使用set_edgecolor()函数来更改上下边框的颜色:

ax.set_color('lightblue')
ax.set_edgecolor('black') 

6、我们还可以通过设置whiskers参数来调整箱线图中的“须子”长度,我们可以将“须子”设置为数据的1.5倍四分位距:

ax.set_whiskers(1.5 * data.quantile(0.75)) 

7、我们还可以通过设置caps参数来调整箱线图中箱子顶部和底部的长度,我们可以将箱子顶部和底部的长度设置为数据的1.5倍四分位距:

ax.set_caps(1.5 * data.quantile(0.75)) 

8、我们可以使用show()函数来显示箱线图:

plt.show() 

将以上代码整合在一起,我们可以得到一个完整的绘制箱线图的程序:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
创建一个简单的Series对象
data = pd.Series(np.random.randn(10))
print(data)
设置绘图参数
plt.figure(figsize=(8, 6))
plt.title("箱线图示例")
绘制箱线图
ax = data.plot(kind='box')
ax.set_color('lightblue')
ax.set_edgecolor('black')
ax.set_whiskers(1.5 * data.quantile(0.75))
ax.set_caps(1.5 * data.quantile(0.75))
显示箱线图
plt.show() 

通过以上步骤,我们可以使用Python的pandas库和matplotlib库轻松地绘制箱线图,需要注意的是,这里的示例仅适用于一维数据,对于二维或多维数据,我们需要对每一列或每一行分别绘制箱线图。

0