当用户输入像𝘁𝘂𝘆𝗲𝗻𝗱𝘂𝗻𝗴这样的特殊 Unicode 字符串时,我遇到了问题,我的系统无法将其与用 ASCII 编写的字符串“tuyendung”区分开来。问题是如何在将输入字符串存储到数据库之前将其规范化为 ASCII?
示例输入:
𝘁𝘂𝘆𝗲𝗻𝗱𝘂𝗻𝗴
(字符代码:0xd835、0xde01、0xd835、0xde02、0xd835、0xde06、0xd835、0xddf2、0xd835、0xddfb、0xd835、0xddf1、0xd835、0xde02、0xd835、 0xddfb、0xd835、0xddf4)
预期输出:
图延东
(字符代码:0x74、0x75、0x79、0x65、0x6e、0x64、0x75、0x6e、0x67)
慕工程0101907
一只名叫tom的猫