讀取文件主要是要設置讀取的輸入流如InputStreamReader時要設置讀取的解碼格式,要和文件本身的編碼格式相同,這樣讀取出來的才不會亂碼。
InputStreamReader reader = new InputStreamInputReader(input, "編碼格式");
ANSI是"gbk"
注:必須是在讀取的時候就使用正確的解碼格式否則都會亂碼!!!!
而要轉換編碼格式也只有正確讀取后才能轉,否則轉換不會成功還是會亂碼。
更改格式的方法:
str.getByte[]("編碼格式");
new String(str.getByte[](), "要轉換的格式")
java讀取txt文件,如果編碼格式不匹配,就會出現亂碼現象,所以讀取txt文件的時候需要設置讀取編碼。txt文檔編碼格式都是寫在文件頭的,在程序中需要先解析文件的編碼格式,獲得編碼格式后,在按此格式讀取文件就不會產生亂碼了。
- InputStream?inputStream?=?new?FileInputStream("E:/1.txt"); ?
- ????????byte[]?head?=?new?byte[3]; ?
- ????????inputStream.read(head);???
- ????????String?code?=?""; ?
- ???
- ????????????code?=?"gb2312"; ?
- ????????if?(head[0]?==?-1?&&?head[1]?==?-2?) ?
- ????????????code?=?"UTF-16"; ?
- ????????if?(head[0]?==?-2?&&?head[1]?==?-1?) ?
- ????????????code?=?"Unicode"; ?
- ????????if(head[0]==-17?&&?head[1]==-69?&&?head[2]?==-65) ?
- ????????????code?=?"UTF-8";?