我想做两件事:
我想为每个日期/天创建一个箱线图,其中包含该日期中 MeanTravelTimeSeconds 的所有值。MeanTravelTimeSeconds 元素的数量随日期而变化(例如,某一天可能有 300 个值,而另一天可能有 400 个)。
另外,我想将多索引系列中的行转换为列,因为我不希望每次都重复行。如果它保持这样,我就会有数千万不必要的行。
这是在按日期索引的 df 上使用 df.stack() 后的结果系列(日期是日期时间对象索引):
Date
2016-01-02 NumericIndex 1611664
OriginMovementID 4744
DestinationMovementID 5084
MeanTravelTimeSeconds 1233
RangeLowerBoundTravelTimeSeconds 756
...
2020-03-31 DestinationMovementID 3594
MeanTravelTimeSeconds 1778
RangeLowerBoundTravelTimeSeconds 1601
RangeUpperBoundTravelTimeSeconds 1973
DayOfWeek Tuesday
Length: 11281655, dtype: object
当我使用seaborn绘制箱线图时,在使用不同的选择后,我遇到了很多错误。
如果我尝试这样做df.stack().unstack()或df.stack().T收到以下错误:
Index contains duplicate entries, cannot reshape
如何绘制箱线图以及如何将行转换为列?
撒科打诨
相关分类