我在熊猫中有这个数据框:
df = pd.DataFrame(
{"bond": ["XSD070623A17","XSD090222A10","XSD100221A18", "XSD070623T15",
"XSD070623T23","XSD090222T32","XSD100221T11"],
"issue_date":["01.01.2020", "03.05.2020", "05.02.2020", "10.11.2019",
"01.01.2020", "03.05.2020", "12.10.2020"]
}
)
df
bond issue_date
0 XSD070623A17 01.01.2020
1 XSD090222A10 03.05.2020
2 XSD100221A18 05.02.2020
3 XSD070623T15 10.11.2019
4 XSD070623T23 01.01.2020
5 XSD090222T32 03.05.2020
6 XSD100221T11 12.10.2020
如您所见,“债券”列中某些值的前 9 个字符相同。我将得到这个数据框的一个子集,对于第 10 个字符等于“A”的每个值,我想得到前 9 个字符相同且第 10 个字符等于“T”的值。之后,如果“A”和“T”债券的发行日期不同,那么我想过滤这两种债券。
例如,第 0 个索引的债券值与第 3 个和第 4 个索引的值具有相同的模式,但第 0 个和第 4 个索引的发行日期相同,所以我想过滤第 0 行和第 3 行。另一方面,第一个指数的债券价值与第五个指数具有相同的模式,但它们的发行日期相同,所以我不想过滤它们。
毕竟,我想获得以下数据框:
bond issue_date
0 XSD070623A17 01.01.2020
2 XSD100221A18 05.02.2020
3 XSD070623T15 10.11.2019
6 XSD100221T11 12.10.2020
任何帮助将不胜感激。
鸿蒙传说
慕容3067478
相关分类