我使用下面的代码删除下面所有非英文字符:
DF.text.replace({r'[^\x00-\x7F]+':''}, regex=True, inplace=True)
其中 df 有一个名为 text 的列,其中包含如下文本:
text
hi what are you saying?
okay let me know
sounds great, mikey
ok.
right
ご承知のとおり、残念ながら悪質な詐欺が増加しているようですのでお気を付けください。\n
¡Hola miguel! Lamento mucho la confusión cau
预期输出:
text
hi what are you saying?
okay let me know
sounds great, mikey
ok.
right
对于我的代码删除字符的行 -
我想从 df 中完全删除这些行,这意味着如果它确实替换了任何非英语字符,我想从 df 中完全删除该行,以避免该行包含 0 个字符或一些在它们之后毫无意义的字符已被上面的代码更改。
神不在的星期二
呼如林
相关分类