我只是很好奇这里发生了什么。我有 13 个数据框,看起来像这样:
df1:
time val
00:00 1
00:01 2
00:02 5
00:03 8
df2:
time val
00:04 5
00:05 12
00:06 4
df3:
time val
00:07 8
00:08 24
00:09 3
等等。正如您所看到的,每个数据帧都在另一个数据帧停止的地方继续计时,这意味着理想情况下,为了简单起见,我希望它们在一个数据帧中。请注意,我使用的示例比我的实际示例要小得多。但是,在使用以下内容时:
df = pd.concat([pd.read_csv(i, usecols=[0,1,2]) for i in sample_files])
在通过该列表理解生成这 13 个数据帧的地方,我得到了一个非常奇怪的结果。就好像我axis=1在pd.concat()函数里面设置了一样。如果我尝试引用一列,请说val
df['val']
Pandas 返回如下所示的内容:
0 1
1 2
...
2 5
3 8
Name: val, Length: 4, dtype: float64
在此输出中,它没有指定其他 11val列发生了什么。如果我再引用一个索引,如下所示:
df['val'][0]
它返回:
0 1
0 5
0 8
Name: val, dtype: float64
这是每列的第一个索引。我不确定为什么熊猫会这样,因为我想它只是将具有相似标题名称的列连接在一起,但显然情况并非如此。
如果有时间可以解释这一点,那就太好了。
相关分类