我想创建一个 DataFrame 来解析某些具有特定格式的文件的名称。
文件名格式: event_A_(number)_(start datetime)_(end datetime)_(code)_(category).txt
日期时间格式:YYYY-MM-DD_HH-MM_SS
名称文件示例:event_A_12_2019-01-22_01-35_20_2019-01-22_19-15_13_b123_aa.txt
我尝试过使用拆分,然后是简单的正则表达式,然后是合并字符串,但它必须是一种简单的方法。关于如何做到这一点的任何建议?
这就是我设法做到的方式,但我相信应该有一种更简单的方法:
lst_split = file.split('_')
#number = re.findall(r"_A_(..)",file)
number = lst_split[2]
start_date = lst_split[3]
tmp = lst_split[4] + ":" + lst_split[5]
start_time = tmp.replace('-',':')
end_date = lst_split[6]
tmp = lst_split[7] + ":" + lst_split[8]
end_time = tmp.replace('-',':')
code = lst_split[9]
tmp = (lst_split[10]).split('.')
category = tmp[0]
print(number,start_date,start_time,end_date,end_time,code,category)
GCT1015
相关分类