匹配相同的希伯来语单词总是返回 False

我试图将相同的希伯来语单词相互匹配,但它总是调用 else 程序的一部分。


这是我在代码中实际尝试的:


通过传递希伯来语单词调用方法(来自 string.xml)


<string name="shevat" >שְׁבָט‬</string>


getCurrentMonthIndex("שְׁבָט")

下面的方法总是返回 false


private boolean getCurrentMonthIndex(String month) {

    if (month.equals("שְׁבָט")) {

        Log.d("Result:", "equal");

        return true;

    } else {

        Log.d("Result:", "not equal");

        return false;

    }

}

如果我对值进行硬编码,那么它返回 true


private boolean getCurrentMonthIndex(String month) {

    if ("שְׁבָט".equals("שְׁבָט")) {

        Log.d("Result:", "equal");

        return true;

    } else {

        Log.d("Result:", "not equal");

        return false;

    }

}


胡子哥哥
浏览 113回答 2
2回答

斯蒂芬大帝

您的字符串资源还有一个不可见的 Unicode 字符。这是您在资源上的字符串:https ://www.fontspace.com/unicode/analyzer/?q=%D7%A9%D6%B0%D7%81%D7%91%D6%B8%D7%98%E2 %80%交流这是您的代码字符串:https ://www.fontspace.com/unicode/analyzer/?q=%D7%A9%D6%B0%D7%81%D7%91%D6%B8%D7%98额外的字符是 U+202C POP DIRECTIONAL FORMATTING。我在比较阿拉伯语字符串时遇到了类似的问题。在我的例子中,隐形字符是 U+200E LEFT-TO-RIGHT MARK。在比较字符串之前,我从它们中删除了这个字符。您还可以修剪 POP DIRECTIONAL FORMATTING。您也可以尝试使用十六进制编辑器从资源文件中删除此字符。如果链接不起作用,请对您的字符串进行 unicode 分析:U+05E9&nbsp; HEBREW LETTER SHINU+05B0&nbsp; HEBREW POINT SHEVAU+05C1&nbsp; HEBREW POINT SHIN DOTU+05D1&nbsp; HEBREW LETTER BETU+05B8&nbsp; HEBREW POINT QAMATSU+05D8&nbsp; HEBREW LETTER TETU+202C&nbsp; POP DIRECTIONAL FORMATTING //only on resource file我对希伯来语不太了解,但我认为您将来也会遇到另一个问题。在你的话中,第一个字母有两个修饰语:U+05B0 HEBREW POINT SHEVA 和 0+05C1 HEBREW POINT SHIN DOT。尽管下面的两个字母看起来完全一样,但它们并不相等。修饰符以不同的顺序编写。שְׁ : U+05E9 + U+05B0 + U+05C1שְׁ : U+05E9 + U+05C1 + U+05B0我在阿拉伯语上遇到了类似的问题。即使认为下面的两个词看起来相同,它们也不等于彼此。U+064E ARABIC FATHA 和 U+0651 ARABIC SHADDA 以不同的顺序书写。رَّ : U+0631 + U+064E + U+0651رَّ : U+0631 + U+0651 + U+064E对于阿拉伯语,在我的打字稿项目中,我编写了一个实用方法来在比较字符串之前对其进行规范化。规范化方法删除所有 LEFT-TO-RIGHT MARK 字符并以标准方式重新排列修饰符字符。我认为您可能需要为希伯来语做类似的事情。@Elias N指出,Java 已经有一种规范化字符串的方法。此方法不会删除 POP DIRECTIONAL FORMATTING 或 LEFT-TO-RIGHT MARK。String a = "שְׁ";&nbsp; //U+05E9 + U+05B0 + U+05C1String b = "שְׁ";&nbsp; //U+05E9 + U+05C1 + U+05B0String nomrA = java.text.Normalizer.normalize(a, java.text.Normalizer.Form.NFC);String nomrB = java.text.Normalizer.normalize(b, java.text.Normalizer.Form.NFC);assertFalse("Original strings are not equal.", a.equals(b));assertTrue("Normalized strings are equal.", normA.equals(normB));

阿波罗的战车

IDE 默认字符集是“CP1252”。所以它将无法读取这个非英文字符。您的 IDE 是否支持 UTF-8 字符集,如果是,那么它应该返回 true。就像,如果我将此代码复制到 Eclipse(通过将日志更改为 sysout),那么它对我有用。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Java