使用 Pandas,如何读取使用 url [Python] 获取的 zip 文件中的 csv 文件

这个网址 https://ihmecovid19storage.blob.core.windows.net/latest/ihme-covid19.zip

包含 2 个 csv 文件和 1 个每天更新的 pdf,其中包含 Covid-19 数据。

我希望能够将其Summary_stats_all_locs.csv作为 Pandas DataFrame 加载。

通常,如果有指向 csv 的 url,我就可以使用df = pd.read_csv(url),但由于 csv 在 zip 中,我不能在这里这样做。

我该怎么做?

谢谢


慕标琳琳
浏览 389回答 1
1回答

米琪卡哇伊

您需要先获取文件,然后使用ZipFile模块加载它。Pandas 实际上可以从 zip 中读取 csvs,但这里的问题是有多个,所以我们需要指定文件名。import requestsimport pandas as pdfrom zipfile import ZipFilefrom io import BytesIOr = requests.get("https://ihmecovid19storage.blob.core.windows.net/latest/ihme-covid19.zip")files = ZipFile(BytesIO(r.content))pd.read_csv(files.open("2020_05_16/Summary_stats_all_locs.csv"))
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python