我有一个由 1 列和几行组成的数据框。这些行中的每一行都以相同的方式构造:-timestamp- value1 value2 value3 -timestamp- value 4 value5 value6 ...
时间戳具有以下格式:YYYY-MM-DD HH:MM:SS值是带 2 位小数的数字。我想制作一个新的数据框,其中一行有单独的时间戳,下一行有相关值。
我设法使用正则表达式按行获得预期结果,但不是针对整个数据框。
到目前为止我的代码:
#input dataframe
data.head()
values
0 2020-05-12 10:00:00 12.07 13 11.56 ... 2020-05-12 10:00:01 11.49 17 5.67...
1 2020-05-12 10:01:00 11.49 17 5.67 ... 2020-05-12 10:01:01 12.07 13 11.56...
2 2020-05-12 10:02:00 14.29 18 11.28 ... 2020-05-12 10:02:01 13.77 18 7.43...
test = data['values'].iloc[0] #first row of data
row1 = re.compile("(\d\d\d\d\S\d\d\S\d\d\s\d\d\S\d\d\S\d\d)").split(test)
df_row1 = pd.DataFrame(row1)
df_row1.head()
values
0 2020-05-12 10:00:00
1 12.07 13.79 15.45 17.17 18.91 14.91 12.35 14....
2 2020-05-12 10:00:01
3 12.48 13.96 13.88 15.57 18.46 15.0 13.65 14.6...
#trying the same for the entire dataframe
for row in data:
df_new = re.compile("(\d\d\d\d\S\d\d\S\d\d\s\d\d\S\d\d\S\d\d)").split(row)
print(df_new)
['values']
我现在的问题是如何循环遍历数据框的行并获得预期的结果?
慕勒3428872
相关分类