我在从 Excel 文件读取数据时遇到一些问题。Excel 文件包含带有 unicode 字符的列名称。
由于某些自动化原因,我需要将usecols参数传递给 pandas.read_excel 函数。
问题是,当我不使用usecols参数时,数据加载时没有错误。
这是代码:
import pandas as pd
df = pd.read_excel(file)
df.colums
Index([u'col1', u'col2', u'col3', u'col with unicode à', u'col4'], dtype='object')
如果我使用 usecols:
COLUMNS = ['col1', 'col2', 'col with unicode à']
df = pd.read_excel(file, usecols = COLUMNS)
我收到以下错误:
ValueError: Usecols do not match columns, columns expected but not found: ['col with unicode \xc3\xa0']
使用encoding = 'utf-8'作为 read_excel 的参数并不能解决问题,也不能对 COLUMNS 元素进行编码。
动漫人物
胡子哥哥
一只斗牛犬
相关分类