最近在項目中遇到一個encoding的問題,記錄一下。
??? 具體而言就是,項目中有A/B兩個部分,A部分由我們負責,Java實現;B部分是UK負責的,使用Delphi,A、B在交互時發送一個http請求, 請求匯總包括一些文本信息(header),以及一個zip文件(body)。好了,問題出來了,當我們發送請求過去時,B能接收到請求,并讀出 header,也能讀出body部分的zip文件,但是讀出的zip文件確實corrupted,死活不能打開。
???? --------------------
? ?? ---header(文本)-
???? -----body(zip)---
???? --------------------
?? 經過無數反復的折騰后(與UK的人同步,痛苦啊),發現我們的系統有問題,問題是在于,我們在構造請求文件的時候,是把zip文件作為一個字符流讀取,并 添加到一個字符流中,然后把這個字符流發送出去。這個body部分,加入到body后,就成為字符流的一部分,結果也帶有encoding信息,這樣發送 到B部分后,就無法正確讀取了。
?? ?? ------------------------
? ??? ---header(String)---
A??? -------------------------? ? ? ? ? ? ?? ------>? httpClient)(String)? ------------->B
????? -----body(String)----
????? -------------------------
?? 正確的做法應該是,在讀取header部分后,轉化為字節流存入一個暫時的byte pool中,然后再把zip部分也作為一個字節流讀出,放到上面的byte pool中。最后把這個byte pool 發送 出去。
?
???? ------------------------
? ?? ---header(string)---
? A -------------------------? ? ? ? ? ? ?? ------>? httpClient)(byte[])? ------------->B
???? -----body(byte[])----
???? -------------------------
?
? 從這個例子可以更加深刻的認識下面的道理:
? 概念:
??? 字符流處理的單元為2個字節的Unicode字符,分別操作字符、字符數組或字符串,而字節流處理單元為1個字節, 操作字節和字節數組。所以字符流是由Java虛擬機將字節轉化為2個字節的Unicode字符為單位的字符而成的,所以它對多國語言支持性比較好!如果是 音頻文件、圖片、歌曲,就用字節流好點,如果是關系到中文(文本)的,用字符流好點.
???? 所有文件的儲存是都是字節(byte)的儲存,在磁盤上保留的并不是文件的字符而是先把字符編碼成字節,再儲存這些字節到磁盤。在讀取文件(特別是文本文件)時,也是一個字節一個字節地讀取以形成字節序列.
????? 字節流可用于任何類型的對象,包括二進制對象,而字符流只能處理字符或者字符串; 2. 字節流提供了處理任何類型的IO操作的功能,但它不能直接處理Unicode字符,而字符流就可以。
? 轉換:
在從字節流轉化為字符流時,實際上就是byte[]轉化為String時,
public String(byte bytes[], String charsetName)
有一個關鍵的參數字符集編碼,通常我們都省略了,那系統就用操作系統的lang
而在字符流轉化為字節流時,實際上是String轉化為byte[]時,
byte[]????String.getBytes(String charsetName)
也是一樣的道理
? Java操作篇:
? IO分兩種流
字節流 InputStream OutputStream
字符流 Reader Writer
他們都是抽象類
具體實現
字節流 FileInputStream FileOutputStream
字符流 FileReader FileWriter?
? 字節流轉換成字符流可以用 InputSteamReader OutputStreamWriter
轉換成BufferdReader BufferedWriter 他們具有緩沖區
例如:讀取文件 從字節流輸入到字符流輸入
定義一個字節流:
FileInputStream fileInputStream = new FileInputStream("d:/text.txt");
// 定義一個指向D:/TEXT.TXT 的字節流
InputStreamReader inputStreamReader = new InputStreamReader(fileInputStream);
//字節流轉換成InputStreamReader
BufferedReader bufferedReader = new BufferedReader(inputSteamReader);
//InputStreamReader 轉換成帶緩存的bufferedReader
可以把讀出來的內容賦值給字符
String ss = new String();
String s;
while((s = bufferedReader.readLine())!=null){
ss += s;
}
例如:寫入文件 從字節流輸出到字符流輸出
FileOutputStream fileOutputStream = new FileOutputStream("d:/text.txt"); //定義一個
指向D:/TEXT.TXT文件
OutputStreamWriter outputStreamWriter = new OutputStreamWriter(fileOutputStream);
BufferedWriter bufferedWriter = new BufferedWriter(outputStreamWriter);
bufferedWriter.write(s);
bufferedWriter.close();
outputStreamWriter.close();
fileOutputStream.close();
例程:
???? 將字符串轉化為字節流#region 將字符串轉化為字節流
??????? /** <summary>
??????? /// 將字符串轉化為字節流
??????? /// </summary>
??????? /// <param name="_Source">字串</param>
??????? /// <returns>字節流</returns>
??????? public static byte[] String2Bytes(string strSource)
??????? {
??????????? System.IO.MemoryStream?? memoryStream=new?? System.IO.MemoryStream();??
??????????? System.IO.BinaryWriter?? binaryWriter=new?? System.IO.BinaryWriter(memoryStream);??
??????????? binaryWriter.Write( strSource );
??????????? byte[]?? buffer=memoryStream.GetBuffer();
??????????? return buffer;???
??????? }
??????? #endregion
???????
??????? 將字節流轉化為字符串#region 將字節流轉化為字符串
??????? /** <summary>
??????? /// 將字節流轉化為字符串
??????? /// </summary>
??????? /// <param name="bytData">字節流</param>
??????? /// <returns>字串</returns>
??????? public static string Bytes2String(byte[] bytData)
??????? {
??????????? //字節流->字符串??
??????????? System.IO.MemoryStream?? memoryStream2 = new?? System.IO.MemoryStream(bytData);??
??????????? System.IO.BinaryReader?? binaryReader = new?? System.IO.BinaryReader(memoryStream2);??
??????????? string?? s2=binaryReader.ReadString();??
??????????? return s2;
??????? }
??????? #endregion
?