我正在尝试做一些简单的事情,但不知道如何从数据框中读取实际行。我想在每个字符串上运行一些正则表达式。
.csv 文件没有标题,它只是一列充满一堆字符串的内容。
csv_data = pd.read_csv('list.csv', sep=',', header=None)
pattern = re.compile(r'(.*\/)(?!\/)(.*)', flags=re.DOTALL)
url_file = {
pattern.findall(row)[0]:
pattern.findall(row)[1]
for index, row in csv_data.iterrows()
}
但我只是得到
类型错误:预期的字符串或类似字节的对象
编辑 1
我不认为这是重复的,另一个建议的 SO 问题/解决方案是不同的上下文,并且有标题和多列。
编辑 2
打印(csv_data.dtypes)
0 object
dtype: object
打印(csv_data.head())
0 https://...
1 https://...
2 https://...
3 https://...
4 https://...
编辑 3
这样做:
for row in csv_data.iterrows():
print(row.dtypes)
给出了错误 AttributeError: 'tuple' object has no attribute 'dtypes'
因此,内容似乎是元组,因此只需要弄清楚如何从中取出字符串即可。
忽然笑
湖上湖
小怪兽爱吃肉
相关分类