我想知道社区中是否有人可以提供以下帮助:
目的是用正则表达式替换 pandas DataFrame 中的子字符串(基于我作为参数传递的字典)。尽管键:值替换仅应在字典键被发现为独立子字符串(而不是单词的一部分)时发生。我所说的独立子字符串是指它在空格之后开始
以前的:
mapping = {
"sweatshirt":"sweat_shirt",
"sweat shirt":"sweat_shirt",
"shirt":"shirts"
}
df = pd.DataFrame([
["men sweatshirt"]
["men sweat shirt"]
["yellow shirt"]
])
df = df.replace(mapping,regex=True)
预期结果:运动衫中的子字符串“shirt”不应替换为“shirts”,因为值是另一个字符串的一部分而不是独立值(\b)
注意:我传递的字典相当长,所以理想情况下有一种方法可以将独立要求(\b)作为我传递的字典的一部分传递df.replace(dict, regex=True)
GCT1015
心有法竹
泛舟湖上清波郎朗
相关分类