java字符集編碼是,java字符集與編碼有關問題

java字符集與編碼問題

沒想到自己的第一篇javaeye博客就是讓人頭痛的java字符集轉碼問題,下面是我個人的一些認識與網上收集的代碼。在java中String在JVM里是unicode的,任何byte[]到String以及String到byte[]都涉及到字符集編碼轉換。基本規則是:

從byte[] 到String就是按某一個編碼后的字節數組轉換為unicode的字符串,從String到 byte[]是將unicode的字符串編碼為唯一特定字符集編碼后的字節數組。也就是說,Java編譯時候,會將java文件的編碼按照指定編碼或者系統默認的編碼轉換為Unicode并加載到內存中進行編譯。

public String(byte[] bytes)

這個方法就是完成將bytes[]轉碼為unicode的String。

使用的是jvm默認的字符集編碼。

如果用戶指定某一個charsetName,可以是UTF-8,GBK之類的。

public String(byte[] bytes, String charsetName)

兩者都是完成specCharset到unicode的過程,而不是說改變編碼格式為charsetName指定的字符集編碼

同理

public byte[] getBytes()

public byte[] getBytes(String charsetName)

這兩個方法就是完成從unicode到指定字符集編碼的“轉碼”過程。

在瀏覽器中,http請求的parameter到servlet里后,應用服務器已經自動完成了new String(parameterBytes,browserSpecCharset)這個過程。

即,自動用頁面設置的charset轉碼parameterBytes字節數組為unicode的字符串。

下面是網上找的一個轉碼器的例子,經測試比較好用,大家可以自己試試

package lavasoft.common;

import org.apache.commons.logging.Log;

import org.apache.commons.logging.LogFactory;

import java.io.*;

/**

* 轉碼工具,全面支持文件、字符串的轉碼

*

* @author Administrator 2009-11-29 16:14:21

*/

public class EncodingToolkit {

private static Log log = LogFactory.getLog(EncodingToolkit.class);

public static void main(String[] args) {

String han = "漢";

System.out.println("---------");

}

/**

* 對字符串重新編碼

*

* @param text 字符串

* @param resEncoding 源編碼

* @param newEncoding 新編碼

* @return 重新編碼后的字符串

*/

public static String reEncoding(String text, String resEncoding, String newEncoding) {

String rs = null;

try {

rs = new String(text.getBytes(resEncoding), newEncoding);

} catch (UnsupportedEncodingException e) {

log.error("讀取文件為一個內存字符串失敗,失敗原因是使用了不支持的字符編碼");

throw new RuntimeException(e);

}

return rs;

}

/**

* 重新編碼Unicode字符串

*

* @param text 源字符串

* @param newEncoding 新的編碼

* @return 指定編碼的字符串

*/

public static String reEncoding(String text, String newEncoding) {

String rs = null;

try {

rs = new String(text.getBytes(), newEncoding);

} catch (UnsupportedEncodingException e) {

log.error("讀取文件為一個內存字符串失敗,失敗原因是使用了不支持的字符編碼" + newEncoding);

throw new RuntimeException(e);

}

return rs;

}

/**

* 文本文件重新編碼

*

* @param resFile 源文件

* @param resEncoding 源文件編碼

* @param distFile 目標文件

* @param newEncoding 目標文件編碼

* @return 轉碼成功時候返回ture,否則false

*/

public static boolean reEncoding(File resFile, String resEncoding, File distFile, String newEncoding) {

boolean flag = true;

InputStreamReader reader = null;

OutputStreamWriter writer = null;

try {

reader = new InputStreamReader(new FileInputStream(resFile), resEncoding);

writer = new OutputStreamWriter(new FileOutputStream(distFile), newEncoding);

char buf[] = new char[1024 * 64]; //字符緩沖區

int len;

while ((len = reader.read(buf)) != -1) {

writer.write(buf, 0, len);

}

writer.flush();

writer.close();

reader.close();

} catch (FileNotFoundException e) {

flag = false;

log.error("沒有找到文件,轉碼發生異常!");

throw new RuntimeException(e);

} catch (IOException e) {

flag = false;

log.error("讀取文件為一個內存字符串失敗,失敗原因是讀取文件異常!");

throw new RuntimeException(e);

} finally {

if (reader != null) try {

reader.close();

} catch (IOException e) {

flag = false;

throw new RuntimeException(e);

} finally {

if (writer != null) try {

writer.close();

} catch (IOException e) {

flag = false;

throw new RuntimeException(e);

}

}

}

return flag;

}

/**

* 讀取文件為一個Unicode編碼的內存字符串,保持文件原有的換行格式

*

* @param resFile 源文件對象

* @param encoding 文件字符集編碼

* @return 文件內容的Unicode字符串

*/

public static String file2String(File resFile, String encoding) {

StringBuffer sb = new StringBuffer();

try {

LineNumberReader reader = new LineNumberReader(new BufferedReader(new InputStreamReader(new FileInputStream(resFile), encoding)));

String line;

while ((line = reader.readLine()) != null) {

sb.append(line).append(System.getProperty("line.separator"));

}

reader.close();

} catch (UnsupportedEncodingException e) {

log.error("讀取文件為一個內存字符串失敗,失敗原因是使用了不支持的字符編碼" + encoding);

throw new RuntimeException(e);

} catch (FileNotFoundException e) {

log.error("讀取文件為一個內存字符串失敗,失敗原因所給的文件" + resFile + "不存在!");

throw new RuntimeException(e);

} catch (IOException e) {

log.error("讀取文件為一個內存字符串失敗,失敗原因是讀取文件異常!");

throw new RuntimeException(e);

}

return sb.toString();

}

/**

* 使用指定編碼讀取輸入流為一個內存Unicode字符串,保持文件原有的換行格式

*

* @param in 輸入流

* @param encoding 構建字符流時候使用的字符編碼

* @return Unicode字符串

*/

public static String stream2String(InputStream in, String encoding) {

StringBuffer sb = new StringBuffer();

LineNumberReader reader = null;

try {

reader = new LineNumberReader(new BufferedReader(new InputStreamReader(in, encoding)));

String line;

while ((line = reader.readLine()) != null) {

sb.append(line).append(System.getProperty("line.separator"));

}

reader.close();

in.close();

} catch (UnsupportedEncodingException e) {

log.error("讀取文件為一個內存字符串失敗,失敗原因是使用了不支持的字符編碼" + encoding);

throw new RuntimeException(e);

} catch (IOException e) {

log.error("讀取文件為一個內存字符串失敗,失敗原因是讀取文件異常!");

throw new RuntimeException(e);

} finally {

if (in != null) try {

in.close();

} catch (IOException e) {

log.error("關閉輸入流發生異常!", e);

throw new RuntimeException(e);

}

}

return sb.toString();

}

/**

* 字符串保存為制定編碼的文本文件

*

* @param text 字符串

* @param distFile 目標文件

* @param encoding 目標文件的編碼

* @return 轉換成功時候返回ture,否則false

*/

public static boolean string2TextFile(String text, File distFile, String encoding) {

boolean flag = true;

if (!distFile.getParentFile().exists()) distFile.getParentFile().mkdirs();

OutputStreamWriter writer = null;

try {

writer = new OutputStreamWriter(new FileOutputStream(distFile), encoding);

writer.write(text);

writer.close();

} catch (IOException e) {

flag = false;

log.error("將字符串寫入文件發生異常!");

throw new RuntimeException(e);

} finally {

if (writer != null) try {

writer.close();

} catch (IOException e) {

log.error("關閉輸出流發生異常!", e);

throw new RuntimeException(e);

}

}

return flag;

}

}

1 樓

jyjava

2011-12-29

流為啥要關閉兩次

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/371037.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/371037.shtml
英文地址,請注明出處:http://en.pswp.cn/news/371037.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

mysql序列號生成_一文看懂mycat的6種全局序列號實現方式

概述在實現分庫分表的情況下,數據庫自增主鍵已無法保證自增主鍵的全局唯一。為此,MyCat 提供了全局sequence,并且提供了包含本地配置和數據庫配置等多種實現方式。下面對這幾種實現方式做一下介紹。1、本地文件方式原理:此方式 My…

android.graphics.Paint方法setXfermode (Xfermode x...

[java] view plaincopymPaint new Paint(); mPaint.setXfermode(new PorterDuffXfermode(PorterDuff.Mode.SCREEN)); 常見的Xfermode(SRC為原圖,DST為目標圖),把代碼中的SRC_IN換成下圖指定的模式就會出現對應的效果圖…

從零開始的全棧工程師——html篇1

全棧工程師也可以叫web 前端 H5主要是網站 app 小程序 公眾號這一塊 HTML篇 html(超文本標記語言,標記通用標記語言下的一個應用。) “超文本”就是指頁面內可以包含圖片、鏈接,甚至音樂、程序等非文字元素。 超文本標記語言的結構包括“頭”部分&am…

二分+樹的直徑 [Sdoi2011]消防

問題 D: [Sdoi2011]消防 時間限制: 1 Sec 內存限制: 512 MB 提交: 12 解決: 6 [提交][狀態][討論版] 題目描述 某個國家有n個城市&#xff0c;這n個城市中任意兩個都連通且有唯一一條路徑&#xff0c;每條連通兩個城市的道路的長度為zi(zi<1000)。 這個國家的人對火焰…

使用MRUnit測試Hadoop程序

這篇文章將略微繞開使用MapReduce實現數據密集型處理中的模式&#xff0c;以討論同樣重要的測試。 湯姆?惠勒 &#xff08; Tom Wheeler&#xff09;在紐約2012年Strata / Hadoop World會議上參加的一次演講給了我部分啟發。 處理大型數據集時&#xff0c;想到的并不是單元測試…

android之 TextWatcher的監聽

以前用過android.text.TextWatcher來監聽文本發生變化&#xff0c;但沒有仔細去想它&#xff0c;今天興致來了就發個瘋來玩玩吧&#xff01; 有點擔心自己理解錯&#xff0c;所以還是先把英文API解釋給大家看看 1、什么情況下使用了&#xff1f; When an object of a type is a…

php 秒殺并發怎么做,PHP實現高并發下的秒殺功能–Laravel

namespace App\Http\Controllers\SecKill;use App\Http\Controllers\Controller;use Exception;use Illuminate\Support\Facades\DB;use Illuminate\Support\Facades\Redis;class SecKillController extends Controller{/*** 往redis的隊列中添加庫存(用於測試的數據)**/public…

蘋果mp3軟件_優秀的Apple音樂轉換器,將任何iTunes M4P,AAX,AA轉換為MP3

Macsome iTunes Converter是一款優秀的音頻轉換工具&#xff0c;這款音頻轉換軟件能夠幫助大家快速進行音頻格式轉換&#xff0c;使得您可以自由的播放和分享自己喜愛的音頻文件。同時這款軟件與大多數音頻轉換軟件一樣&#xff0c;將受到保護DRM的Apple音樂轉換轉換成MP3, AAC…

Vuejs開發環境搭建及熱更新

一、安裝NPM 1.1最新穩定版本&#xff1a; npm install vue 二、命令行工具安裝 國內速度慢&#xff0c;使用淘寶鏡像&#xff1a; npm install -g cnpm --registryhttps://registry.npm.taobao.org 注意&#xff1a;以后使用npm的地方就替換成cnpm 1、全局安裝vue-vli ? …

線索二叉樹的C語言實現

#include "string.h"#include "stdio.h" #include "stdlib.h" #include "io.h" #include "math.h" #include "time.h" #define OK 1#define ERROR 0#define TRUE 1#define FALSE 0 #define MAXSIZE 100 /* 存儲空…

發送帶有接縫的活動邀請

這些天來&#xff0c;我的一位同事在使用帶有接縫&#xff08;2.x版&#xff09;的郵件模板發送事件邀請時遇到了問題。 從根本上講&#xff0c;這不是一個艱巨的任務&#xff0c;因此我將簡要說明使用接縫郵件模板發送事件邀請需要做什么。 發送郵件邀請時&#xff0c;您需要發…

Oracle內存管理(之二)

Oracle內存管理&#xff08;之二&#xff09; 【深入解析--eygle】 學習筆記 1.2.2 UGA和CGA UGA&#xff08;用戶全局區&#xff09;由用戶會話數據、游標狀態和索引區組成。在共享server模式下&#xff0c;一個共享服務進程被多個用戶進程共享&#xff0c;此時UGA是Shared Po…

matlab抓取股票數據,Matlab經過sina web接口獲取個數即時股票數據函數實現代碼

Matlab通過sina web接口獲取個數即時股票數據函數實現代碼代碼如下&#xff1a;function stockinfo queryprice(stocktype, stockid)%stocktype 股票類型&#xff1a;sh和sz%stockid 股票編碼&#xff1a;url sprintf(http://hq.sinajs.cn/list%s%d, stocktype, stockid);[so…

虛幻4毛發系統_虛幻引擎復活!蘋果與Epic對決,有哪些游戲險些中槍?

最近&#xff0c;蘋果和Epic的官司鬧得沸沸揚揚。隨著Epic旗下熱門手游《堡壘之夜》遭蘋果火速下架&#xff0c;兩大巨頭之間的沖突愈演愈烈。蘋果似乎并不滿足于此&#xff0c;由于Epic公開違反自家規定&#xff0c;蘋果計劃進一步封禁Epic維護虛幻引擎的開發者賬戶&#xff0…

史上最全的HTML和CSS標簽常用命名規則

文件夾主要建立以下文件夾&#xff1a;  1、Images 存放一些網站常用的圖片&#xff1b;  2、Css 存放一些CSS文件&#xff1b;  3、Flash 存放一些Flash文件&#xff1b;  4、PSD 存放一些PSD源文件&#xff1b;  5、Temp 存放所有臨時圖片和其它文件&#xff1b; …

01-JAVA語言基礎

1.設計思想&#xff1a; 先以字符串的形式輸入兩個數字&#xff0c;然后將他們轉化為int類型&#xff0c;再對兩數進行相加&#xff0c;最后輸出結果。 2.程序流程圖&#xff1a; 3.源程序代碼&#xff1a; import java.util.Scanner;public class Addition2 {public static vo…

與JodaTime的DateTime和Google Guava的供應商嘲笑

介紹 如果您是經驗豐富的單元測試人員&#xff0c;那么當您看到任何與時間 &#xff0c; 并發性 &#xff0c; 隨機性 &#xff0c; 持久性和磁盤I / O協同工作的代碼時&#xff0c;您就會學會做筆記。 原因是測試可能非常脆弱&#xff0c;有時完全無法正確測試。 這篇文章將展…

棧實現 C語言

最近上來寫了一下棧&#xff0c;理解數據結構的棧。 頭文件&#xff1a;stack.h 初始化棧結構與函數定義&#xff1a; #include<stdlib.h> #include <stdio.h> #include<memory.h> #define N 100struct stack {int data[N];int top;//標識棧頂 }; typedef s…

php簽名墻,肺功能檢查質量控制網

2017年12月2日&#xff0c;由中華醫學會呼吸病學分會/兒科分會、國家呼吸系統疾病臨床醫學研究中心、國家呼吸疾病醫療質量控制中心、中國肺功能聯盟、中國兒童肺功能協作組主辦&#xff0c;浙江省中醫院承辦的"2017年中國肺功能檢查規范化培訓及應用推廣學習班暨肺功能檢…

餐飲水單打印軟件_開發一款餐飲手機app系統軟件什么價格?有哪些方面需要考慮?...

開發一款餐飲手機app系統軟件什么價格&#xff1f;有哪些方面需要考慮&#xff1f;近年來&#xff0c;餐飲類的APP如雨后春筍般快速增長&#xff0c;無論是上檔次的酒店&#xff0c;還是各大餐廳&#xff0c;都有各自的專屬APP。餐飲APP的開發能讓大型酒店/餐廳獲得更多盈利、銷…