我尝试根据特定列(“文件名”)使用 pd.merge() 合并 4 个 csv 文件。我读到合并仅适用于两个数据帧,而是尝试按连续步骤合并前两个数据帧,然后是第三个数据帧,然后是第四个数据帧。这最终成功了,代码如下:
combine = pd.merge(file1, file2, on='filename', how='inner')
combine1 = pd.merge(combine, file3, on='filename', how='inner')
combine2 = pd.merge(combine1, file4, on='filename', how='inner')
产生以下结果:
filename, count_x, count_y, count_x, count_y
M116_13331848_13109013422677.jpg, 21, 11, 18, 16
M116_13331848_13109013387678.jpg, 21, 13, 13, 18
M116_13331848_13109013329679.jpg, 19, 15, 16, 15
M116_13331848_13109013424677.jpg, 18, 13, 16, 15
M116_13331848_13109013385678.jpg, 17, 12, 15, 13
正如您所看到的,该过程在列上生成了令人困惑的标题。因此,我尝试使用 suffixes 参数来控制这些标头。但是,这只适用于第一个 pd.merge() 命令,不适用于第二个/第三个命令。这是我的完整脚本:
如何将我自己的标题归因于组合 df 中的每一列?
谢谢你,R
沧海一幻觉
相关分类