猿问

如何用英文字符替换非英文字符

我有一个奇怪的问题。我从 Google Cloud Vision 获取包含非英文字符的文本,但它们实际上是英文字符。这是谷歌云视觉OCR的一个错误。

我得到这样的角色:Héllo

Notice that é is non English character.

我想转换成simple "Hello"这样我可以处理这个词。

我不是在寻找编程答案。我只是在寻找方法来做到这一点。

任何提示都会有用。

谢谢!


扬帆大鱼
浏览 123回答 1
1回答

慕盖茨4494581

如果 Apache Commons 适合您,您可以使用他们的 StringUtils 库。该stripAccents方法应适合您的需要。从源代码中您可以看到它实际上使用了java.text.Normalizer,因此您也可以查看它。
随时随地看视频慕课网APP
我要回答