我有一个代码可以将带有两个标题的数据的 Excel 文件转换为数据帧。不知何故,我的代码没有达到我的预期:
import pandas as pd
df = pd.read_excel('excel_file.xlsx', sheet_name='Class', header=None, names= header_names, skiprows=2)
不知怎的,我收到了一个奇怪的输出:
NaN NaN NaT NaN NaN NaT
3 NaN NaT
2015-06-30 4 NaN
ETC。
我不知道我做错了什么。
我的 Excel 文件的结构如下,但包含更多列。
A B C
math biology physics
01.06.2015 3 01.06.2015 3 01.06.2015 3
30.06.2016 4 30.06.2016 4 30.06.2016 4
15.06.2017 1 15.06.2017 3 15.06.2017 3
20.06.2018 3 20.06.2018 2 20.06.2018 5
15.06.2019 2 15.06.2019 3 15.06.2019 2
预期的数据帧输出应该是这样的:
date grade course group
01.06.2015 3 math A
30.06.2016 4 math A
15.06.2017 1 math A
20.06.2018 3 math A
15.06.2019 2 math A
01.06.2015 3 biology B
30.06.2016 4 biology B
15.06.2017 3 biology B
20.06.2018 2 biology B
15.06.2019 3 biology B
01.06.2015 3 physics C
30.06.2016 4 physics C
15.06.2017 3 physics C
20.06.2018 5 physics C
15.06.2019 2 physics C
哈士奇WWW
相关分类