我需要将HTML文件列表读取到熊猫数据帧中。
每个HTML文件都有多个数据帧(我使用pd.concat来组合它们)。
HTML文件名包含一个字符串,我想将其添加为列。
# Read all files into a list
files = glob.glob('monthly_*.html')
# Zip the dfs with the desired string segment
zipped_dfs = [zip(pd.concat(pd.read_html(file)), file.split('_')[1]) for file in files]
我在打开( df,产品)的压缩列表时遇到问题。
dfs = []
# Loop through the list of zips,
for _zip in zipped_dfs:
# Unpack the zip
for _df, product in _zip:
# Adding the product string as a new column
_df['Product'] = product
dfs.append(_df)
但是,我收到错误'str' object does not support item assignment
有人可以解释添加新列的最佳方法吗?
繁华开满天机
相关分类