使用 python 将 HTML 表格转换为 CSV 文件

我对 pandas 很陌生,所以我想用 pandas 将此 HTML 表转换为 CSV 文件,但是我的 CSV 文件给了我一个奇怪的标志,并且它没有设法将所有表转换为 CSV。

这是我的代码。我读到有关使用 beautifulsoup 但我不太确定如何使用该功能。


import as pandas

df = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR'

              'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1')

df[0].to_csv('ENR3.0.csv')

谢谢你!


编辑:我已将导入更改为,import pandas as dp但仍然无法将所有 HTML 表转换为 CSV 文件。


非常感谢您的所有帮助!


守着一只汪
浏览 95回答 2
2回答

Cats萌萌

您可以使用pandas它本身来执行此操作。你把声明弄乱了import。以下是正确的做法:import pandas as pddf = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR'              'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1')df[0].to_csv('ENR3.0.csv', index = False)如果您想获取dataframes变量中的所有内容df,请将最后一行替换为:for x in range(len(df)):    df[x].to_csv(f"CSV_File_{x+1}", index = False)

慕少森

import 语句存在问题它应该是import pandas as pd而不是,因为您在下面的代码中import as pandas使用别名。pd研究一下beautiful soup,使用lxml解析器解析所需数据(速度非常快)。如果需要任何其他帮助,请在这篇文章中发表评论,我们将尝试解决您的问题:)在您的代码中进行了更正:import pandas as pddf = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR'              'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1')df[0].to_csv('ENR3.0.csv')
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python