在 Python 中解析给定特定格式的文件名

首页课程实战体系课手记专栏慕课教程

在 Python 中解析给定特定格式的文件名

我想创建一个 DataFrame 来解析某些具有特定格式的文件的名称。

文件名格式： event_A_(number)_(start datetime)_(end datetime)_(code)_(category).txt

日期时间格式：YYYY-MM-DD_HH-MM_SS

名称文件示例：event_A_12_2019-01-22_01-35_20_2019-01-22_19-15_13_b123_aa.txt

我尝试过使用拆分，然后是简单的正则表达式，然后是合并字符串，但它必须是一种简单的方法。关于如何做到这一点的任何建议？

这就是我设法做到的方式，但我相信应该有一种更简单的方法：

lst_split = file.split('_')

#number = re.findall(r"_A_(..)",file)

number = lst_split[2]

start_date = lst_split[3]

tmp = lst_split[4] + ":" + lst_split[5]

start_time = tmp.replace('-',':')

end_date = lst_split[6]

tmp = lst_split[7] + ":" + lst_split[8]

end_time = tmp.replace('-',':')

code = lst_split[9]

tmp = (lst_split[10]).split('.')

category = tmp[0]

print(number,start_date,start_time,end_date,end_time,code,category)

萧十郎

浏览 116回答 1

1回答

GCT1015

您可以使用解包将所有部分放入变量中。然后您将拥有更清晰的代码和更少的转换：file = "event_A_12_2019-01-22_01-35_20_2019-01-22_19-15_13_b123_aa.txt"_,_,number,start_date,startHM,startS,end_date,endHM,endS,code,category = file.split("_")start_time = f"{startHM}:{startS}".replace("-",":")end_time   = f"{endHM}:{endS}".replace("-",":")category   = category.strip(".txt")print(number,start_date,start_time,end_date,end_time,code,category)# 12 2019-01-22 01:35:20 2019-01-22 19:15:13 b123 aa请注意，您也可以使用（相当笨拙的）正则表达式将其分解，但您仍然必须对组件进行分隔符替换。

0 0

随时随地看视频慕课网APP