我用UTF8转GBK,用的iconv函数
void TransContent(const char *pFromCode, const char *pToCode, const char *pInBuf, size_t iInLen, char *pOutBuf, size_t iOutLen){ char* sResult = NULL; //打开字符集转换 iconv_t hIconv = iconv_open(pToCode, pFromCode); if (!hIconv) return; //开始转换 size_t iRet = iconv(hIconv, (char **)(&pInBuf), &iInLen, &pOutBuf, &iOutLen); //关闭字符集转换 iconv_close(hIconv); } TransContent("UTF-8", "GBK//IGNORE", "碶", strlen("碶"), pOutputBuf, sizeof(pOutputBuf)); TransContent("UTF-8", "GBK//IGNORE", "㯖", strlen("㯖"), pOutputBuf, sizeof(pOutputBuf));
碶这个字会被转换为未知字符,㯖这个字会被ignore掉,变成""。
GBK字符集里面这两个字都没有,
为什么一个会被错误转码,一个会被ignore?
ignore是因为识别不了,被转换为"",错误编码是因为系统以为能识别,结果转码错误了。
所以这俩字有啥区别?
https://blog.csdn.net/wang123...
我看这个文章说 碶 这个字 实际上是 碶\
那遇到这种情况该怎么转码呢?
慕尼黑8549860
相关分类