猿问

unicode.RangeTable 如何工作?

我想在理解 unicode 包的RangeTable 方面得到一些帮助。


使用这个(据说是有帮助的)功能:


func printChars(ranges []unicode.Range16) {

  for _, r := range ranges {


    if r.Hi >= 0x80 { // show only ascii

      break

    }

    fmt.Println("\nLo:", r.Lo, "Hi:", r.Hi, "Stride:", r.Stride)


    for c := r.Lo; c <= r.Hi; c++ {

      fmt.Print(string(c) + " ")

    }

  }

  fmt.Println()

}

对于数字,我可以做printChars(unicode.Digit.R16),数字序列对我来说很有意义。


 // Lo: 48 Hi: 57 Stride: 1

 // 0 1 2 3 4 5 6 7 8 9

但是,要获得标点符号printChars(unicode.Punct.R16)结果


 // Lo: 33 Hi: 35 Stride: 1

 // ! " #

 // Lo: 37 Hi: 42 Stride: 1

 // % & ' ( ) *

 // Lo: 44 Hi: 47 Stride: 1

 //  , - . /

 // Lo: 58 Hi: 59 Stride: 1

 // : ;

 // Lo: 63 Hi: 64 Stride: 1

 // ? @

 // Lo: 91 Hi: 93 Stride: 1

 // [ \ ]

 // Lo: 95 Hi: 123 Stride: 28

 // _ ` a b c d e f g h i j k l m n o p q r s t u v w x y z {

我很惊讶也包括小写字母。另外,“跨步”是什么意思?除了最后一个之外,其他所有的都是 1,但高低差异会有所不同。


再举一个例子,printChars(unicode.Pe.R16)。我认为这应该只给出结尾标点符号:


) 右括号 (U+0029, Pe)

] 右方括号 (U+005D, Pe)

} 右大括号 (U+007D, Pe)

但相反,我的函数打印


 // Lo: 41 Hi: 93 Stride: 52

 // ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ ]

大概我完全误解了它应该工作的方式。


我如何正确获取给定类别中的字符列表,例如上面的标点符号结尾 (Pe)?


白板的微信
浏览 206回答 2
2回答
随时随地看视频慕课网APP

相关分类

Go
我要回答