去除unicode字符修饰符

在Python中从Unicode字符串中剥离字符修饰符的最简单方法是什么?

例如:

A͋͠r͍̞̫̜͌ͦ̈́͐ͅt̼̭͞h́u̡̙̞̘̙̬͖͓rͬͣ̐ͮͥͨ̀͏̣应该成为亚瑟

我尝试了文档,但找不到任何能做到这一点的东西。


慕尼黑5688855
浏览 160回答 2
2回答

aluckdog

尝试这个import unicodedataa = u"STRING GOES HERE" # using an actual string would break stackoverflow's code formatting.u"".join( x for x in a if not unicodedata.category(x).startswith("M") )这将删除所有归类为标记的字符,这是我认为您想要的。通常,您可以使用unicodedata.category获取字符的类别。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python