我正在尝试使用来自https://senatestockwatcher.com/的数据,特别是获取最新文件。根据 API 页面,这需要获取 Amazon S3 存储桶中的文件列表,然后找到最新的并获取它。
我目前使用的代码是:
data = requests.get(url).text
data = xmltodict.parse(data)
data = json.loads(json.dumps(data))
data = data["ListBucketResult"]["Contents"]
filenames = [item["Key"] for item in data if "data/" in item["Key"]][1:]
filenames.sort()
print(filenames)
但是,我遇到的问题是文件名的格式为:
transaction_report_for_01_02_2013.json
transaction_report_for_01_03_2017.json
对数组使用常规 python.sort()函数不起作用,因为它从左到右读取名称字符串,因此忽略了年份。将这些文件从最新到最旧准确排序的最有效方法是什么?
白猪掌柜的
ABOUTYOU
相关分类