我正在 golang 中编写一个正则表达式来捕获可能以不同语言出现的主题标签。例如,很明显一个是英语,但可能会有拉丁语或阿拉伯语用户尝试使用这些字符集创建主题标签。我知道 unicode 字符类名称,但是如何在不为每个字符生成正则表达式的情况下一次使用多个?
示例代码:
r, err := regexp.Compile(`\B(\#[[:ascii:]]+\b)[^?!;]*`)
这将匹配"#hello #ذوق"
并输出[]string{#hello, #ذوق}
但不匹配"#ذوق"
慕哥9229398
相关分类