有时,数据集有许多变量,以及一些对它们有贡献的其他“事物”。显示这些不同“事物”对变量的贡献(例如%)可能很有用。然而,有时并非所有“事物”都会对所有变量产生影响。当绘制为条形图时,当特定变量没有“事物”的贡献时,这会导致出现空格。如果“事物”的贡献为零,有没有办法在条形图中不绘制变量的特定条形?
下面的示例显示了变量 (aj) 的选择,这些变量具有可能对它们做出贡献的各种因素 (1-5)。注意:“事物”(1-5)对变量(aj)的贡献为零时的间隙。
from random import randrange
# Make the dataset of data for variables (a-j)
columns = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']
data = np.array([np.random.randn(5)**2 for i in range(10)])
df = pd.DataFrame(data.T, columns=columns)
for col in df.columns:
# Set 3 of the 5 'things' to be np.NaN per column
for n in np.arange(3):
idx = randrange(5)
df.loc[list(df.index)[idx], col] = np.NaN
# Normalise the data to 100% of values
df.loc[:,col] = df[col].values / df[col].sum()*100
# Setup plot
figsize = matplotlib.figure.figaspect(.33)
fig = plt.figure(figsize=figsize)
ax = plt.gca()
df.T.plot.bar(rot=0, ax=ax)
# Add a legend and show
plt.legend(ncol=len(columns))
plt.show()
白衣染霜花
相关分类