- Linux 下使用 iconv 命令可以轉換文件的編碼
iconv -f GBK -t UTF-8 input_file -o output_file
- C++ 代碼 使用 iconv 函數
iconv 函數簽名: size_t iconv(iconv_t cd,、
char **inbuf, size_t *inbytesleft,
char **outbuf, size_t *outbytesleft);
需要注意的是, iconv 函數的 inbuf 參數以及 outbuf 參數會被修改,內部的實現是使用類似
(*p)++ = xxx 的形式操作這兩個指針,inbytesleft 會被修改為輸入字符串剩余多少沒有處理,
outbytesleft 會被修改為 outbuf 還有多少字節沒有使用。iconv 返回 (size_t)-1 表示失
敗,返回0表示成功,返回大于0表示出現了不可逆轉的字符處理。
static std::string CharConv(const std::string& str, const char* fromcode, const char* tocode)
{iconv_t cd = iconv_open(tocode, fromcode);if (cd == (iconv_t)-1) {printf("iconv_open failed, errno: %d\n", errno);return str;}const size_t len = str.length();const size_t outbuflen = len * 2;char inbuf[len] = {0};char outbuf[outbuflen] = {0};memcpy(inbuf, str.data(), len);char *pin = inbuf;char *pout = outbuf;size_t inlen = len;size_t outbufleft = outbuflen;size_t ret = iconv(cd, &pin, &inlen, &pout, &outbufleft);if (ret == (size_t)-1) {printf("iconv failed. errno: %d\n", errno);iconv_close(cd);return str;}iconv_close(cd);return string(outbuf, outbuflen - outbufleft);
}