我正在尝试从 s3 Buckets 中的特定文件夹中获取文件:
我在 s3 中有 4 个桶,名称如下:
1 - 'PDF'
2 - 'TXT'
3 - 'PNG'
4 - 'JPG'
所有 s3 存储桶的文件夹结构如下所示:
1- PDF/analysis/pdf-to-img/processed/files
2- TXT/report/processed/files
3- PNG/analysis/reports/png-to-txt/processed/files
4- JPG/jpg-to-txt/empty
我必须检查此文件夹前缀processed/files是否存在于存储桶中,如果存在,我将读取这些目录中存在的文件,否则我将忽略它们。
代码:
buckets = ['PDF','TXT','PNG','JPG']
client = boto3.client('s3')
for i in bucket:
result = client.list_objects(Bucket=i,Prefix = 'processed/files', Delimiter='/')
print(result)
如果文件夹结构相同,我可以进入每个目录,但是当每个存储桶的文件夹结构不同时,我该如何处理?
慕虎7371278
Qyouu
相关分类