我有一个huuuuuge csv在线,我不想逐行阅读它,下载它。但此文件位于代理后面。我写了这个代码:
import requests
import pandas as pd
import io
cafile = 'mycert.crt'
proxies = {"http":"http://ipproxy:port", "https":"http://ipproxy:port"}
auth = HttpNtlmAuth('Username','Password')
url = 'http://myurl/ressources.csv'
content = requests.get(url, proxies=proxies, auth=auth, verify=cafile).content
csv_read = pd.read_csv(io.StringIO(content.decode('utf-8')))
pattern = 'mypattern'
for row in csv_read:
if row[0] == pattern:
print(row)
break
上面的这段代码有效,但“content = requests.get(...”行需要很多时间!由于 csv 文件的大小。
所以我的问题是:是否可以通过代理逐行读取在线csv?
以最好的方式,我希望阅读第一行,检查它是否等于我的模式,如果是=中断,如果不是=读取第二行和依此类推。
感谢您的帮助
慕的地8271018
红糖糍粑
婷婷同学_
相关分类