file -i 1.txt
顯示文件編碼為unknown 8bit, 說明這個文件的編碼格式因為一些不明原因無法識別了。
可以嘗試用其他編輯器打開,來看一下編輯器最終是用什么編碼格式打開的。
- vim
:set filecoding
- notepad++
直接打開文件,右下角會顯示文件編碼
假設文件編碼為GBK/GB2312(GBK兼容GB2312編碼方式并且涵蓋字符更廣),以GBK為例,讓這個文件找回自己的編碼方式。
iconv -f GBK -t GBK input.txt -o output.txt
然后再運行
file -i output.txt
文件編碼恢復。
總結:確認/推測文件源編碼為GBK,現檢測文件編碼unknown 8bit,想要轉換文件編碼為UTF-8。則必須先from GBK to GBK,讓文件找回正確的編碼格式,再from GBK to UTF-8。