猿问

使用数据框中的 matplotlib 并排绘制多个箱线图

我正在尝试从一个数据框中并排绘制 60 多个箱线图,我想知道是否有人可以提出一些可能的解决方案。

目前我有df_new一个包含 66 列的数据框,我用它来绘制箱线图。我发现绘制箱线图的最简单方法是使用 pandas 中的箱线图包:

boxplot = df_new.boxplot(column=x, figsize = (100,50))

这给了我一个非常非常小的图表,轴难以辨认,我似乎无法更改字体大小,所以我试图在 matplotlib 中本地执行此操作,但我想不出一种有效的方法。我试图避免使用类似以下内容创建 66 个单独的箱线图:

fig, ax = plt.subplots(nrows = 1,
                       ncols = 66, 
                       figsize = (10,5),
                       sharex = True)
ax[0,0].boxplot(#insert parameters here)

我实际上不知道如何将数据从 df_new.describe() 获取到箱线图函数中,所以任何关于此的提示将不胜感激!文档令人困惑。不确定 x 向量应该是什么。

理想情况下,我只想为箱线图函数提供数据框,并让它通过动态计算所有四分位数、列分隔等来自动创建所有箱线图——这甚至可能吗?


一只名叫tom的猫
浏览 207回答 1
1回答

桃花长相依

我尝试将 the 替换为boxplota ridge plot,它占用的空间更少,因为:它需要宽度的一半你可以部分重叠山脊它是垂直发展的,所以你可以向下滚动所有的情节我从seaborn 文档中获取代码并对其进行了一些调整,以便拥有 60 个不同的正态分布的脊;这里的代码:import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltimport itertoolssns.set(style="white", rc={"axes.facecolor": (0, 0, 0, 0)})# # Create the datan = 20x = list(np.random.randn(1, 60)[0])g = [item[0] + item[1] for item in list(itertools.product(list('ABCDEFGHIJ'), list('123456')))]df = pd.DataFrame({'x': n*x,                   'g': n*g})# Initialize the FacetGrid objectpal = sns.cubehelix_palette(10, rot=-.25, light=.7)g = sns.FacetGrid(df, row="g", hue="g", aspect=15, height=.5, palette=pal)# Draw the densities in a few stepsg.map(sns.kdeplot, "x", clip_on=False, shade=True, alpha=1, lw=1.5, bw=.2)g.map(sns.kdeplot, "x", clip_on=False, color="w", lw=2, bw=.2)g.map(plt.axhline, y=0, lw=2, clip_on=False)# Define and use a simple function to label the plot in axes coordinatesdef label(x, color, label):    ax = plt.gca()    ax.text(0, .2, label, fontweight="bold", color=color,            ha="left", va="center", transform=ax.transAxes)g.map(label, "x")# Set the subplots to overlapg.fig.subplots_adjust(hspace=-.25)# Remove axes details that don't play well with overlapg.set_titles("")g.set(yticks=[])g.despine(bottom=True, left=True)plt.show()这是我得到的结果:我不知道它是否适合您的需求,无论如何请记住,将如此多的发行版彼此相邻放置总是需要大量空间(和非常大的屏幕)。也许您可以尝试将分布分成更小的组并一次绘制一点?
随时随地看视频慕课网APP

相关分类

Python
我要回答