从Unicode字符中删除Diacritic标记(ńǹňṅņṇṋṉ̈ɲƞᶇɳȵ)

核心java.text包是为了解决这个用例而设计的(匹配字符串而不关心对话、案例等等)。配置Collator排序PRIMARY人物差异。这样，创建一个CollationKey每根绳子。如果所有代码都是用Java编写的，则可以使用CollationKey直接。如果需要将密钥存储在数据库或其他类型的索引中，则可以将其转换为字节数组.这些类使用Unicode标准案例折叠数据，以确定哪些字符是等价的，并支持各种分解战略。Collator c = Collator.getInstance();c.setStrength(Collator.PRIMARY); Map<CollationKey, String> dictionary = new TreeMap<CollationKey, String>(); dictionary.put(c.getCollationKey("Björn"), "Björn");...CollationKey query = c.getCollationKey("bjorn"); System.out.println(dictionary.get(query)); // --> "Björn"注意，排序程序是特定于地区的。这是因为“字母顺序”在地区之间是不同的(甚至随着时间的推移，就像西班牙语一样)。这个Collator类使您不必跟踪所有这些规则，并保持它们的最新。

从Unicode字符中删除Diacritic标记(ńǹňṅņṇṋṉ̈ɲƞᶇɳȵ)

3回答