Swift中的字符串和字符比较不区分语言环境是什么意思?

我开始学习Swift语言,我很好奇,这意味着Swift中的字符串和字符比较不区分语言环境?这是否意味着所有字符都像UTF-8字符一样存储在Swift中?



达令说
浏览 560回答 3
3回答

白板的微信

比较Swift字符串<与会根据所谓的“ Unicode规范化形式D”(可以通过计算 decomposedStringWithCanonicalMapping)进行词典上的比较例如,分解"ä" = U+00E4 = LATIN SMALL LETTER A WITH DIAERESIS是两个Unicode代码点的序列U+0061,U+0308 = LATIN SMALL LETTER A + COMBINING DIAERESIS出于演示目的,我编写了一个小的String扩展名,该扩展名将String的内容转储为Unicode代码点的数组:extension String {&nbsp; &nbsp; var unicodeData : String {&nbsp; &nbsp; &nbsp; &nbsp; return self.unicodeScalars.map {&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; String(format: "%04X", $0.value)&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; }.joined(separator: ",")&nbsp; &nbsp; }}现在,让我们来一些字符串,用<:let someStrings = ["ǟψ", "äψ", "ǟx", "äx"].sorted()print(someStrings)// ["a", "ã", "ă", "ä", "ǟ", "b"]并将每个字符串(原始和分解形式)的Unicode代码点转储到排序数组中:for str in someStrings {&nbsp; &nbsp; print("\(str)&nbsp; \(str.unicodeData)&nbsp; \(str.decomposedStringWithCanonicalMapping.unicodeData)")}输出äx&nbsp; 00E4,0078&nbsp; 0061,0308,0078ǟx&nbsp; 01DF,0078&nbsp; 0061,0308,0304,0078ǟψ&nbsp; 01DF,03C8&nbsp; 0061,0308,0304,03C8äψ&nbsp; 00E4,03C8&nbsp; 0061,0308,03C8很好地显示了比较是通过分解形式的Unicode代码点的字典顺序进行的。如以下示例所示,对于多个字符的字符串也是如此。用let someStrings = ["ǟψ", "äψ", "ǟx", "äx"].sorted()以上循环的输出是äx&nbsp; 00E4,0078&nbsp; 0061,0308,0078ǟx&nbsp; 01DF,0078&nbsp; 0061,0308,0304,0078ǟψ&nbsp; 01DF,03C8&nbsp; 0061,0308,0304,03C8äψ&nbsp; 00E4,03C8&nbsp; 0061,0308,03C8意思就是"äx" < "ǟx", but "äψ" > "ǟψ"(这至少对我来说是出乎意料的)。最后,让我们将其与语言环境敏感的顺序进行比较,例如瑞典语:let locale = Locale(identifier: "sv") // svenskavar someStrings = ["ǟ", "ä", "ã", "a", "ă", "b"]someStrings.sort {&nbsp; &nbsp; $0.compare($1, locale: locale) == .orderedAscending}print(someStrings)// ["a", "ă", "ã", "b", "ä", "ǟ"]如您所见,结果与Swift <排序不同。

杨魅力

更改语言环境可以更改字母顺序,例如,由于语言环境的原因,区分大小写的比较可能会不区分大小写,或更一般而言,两个字符串的字母顺序是不同的。

MMMHUHU

词典顺序和区分区域的顺序可以不同。您可以在以下问题中看到它的一个示例:在 不更改C#顺序的情况下,对等价于C#的scala列表进行排序在这种特定情况下,对语言环境敏感的顺序位于_之前1,而在字典顺序中则相反。快速比较使用字典顺序。
打开App,查看更多内容
随时随地看视频慕课网APP