spool導出姓名中文亂碼_MySQL不同字符集轉化標準—7步實現，杜絕亂碼！

引言

作為資深的DBA程序員，在工作中是否會遇到更這樣的情況呢？

原有數據庫的字符集由于前期規劃不足，隨著業務的發展不能滿足業務的需求。如原來業務系統用的是utf8字符集，后期有存儲表情符號的需求，uft8字符集就不能滿足此時的業務需求了。需要用utf8mb4字符集。

數據庫遷移，源和目標數據庫的字符集不一致，需要在遷移之前進行轉換。

更換數據庫字符集的時候明明很認(jian)真(dan),總是會出現各種各樣的問題，導致更換之后數據庫的數據出現亂碼！

今天小編就同大家一起梳理下如何正確更換數據庫的字符集，下文將簡單講解數據庫不同字符集的轉換過程。步驟轉化，杜絕亂碼！

常用字符集

GBK是國家標準GB2312基礎上擴容后兼容GB2312的標準。GBK的文字編碼是用雙字節來表示的，即不論中、英文字符均使用雙字節來表示，為了區分中文，將其最高位都設定成1。GBK包含全部中文字符，是國家編碼，通用性比UTF8差，不過UTF8占用的數據庫比GBK大。支持簡體中文及繁體中文。

utf8字符集：是一種UTF-8編碼的Unicode字符集，每個字符占用1到3個字節。UTF-8包含全世界所有國家需要用到的字符，是國際編碼，通用性強。

utf8mb4字符集：是一種UTF-8編碼的Unicode字符集，每個字符占用1到4個字節。可以覆蓋BMP范圍內的字符和增補字符。BMP范圍內的字符編碼和utf8字符集中的編碼是完全相同的，長度也是完全一樣的，所以utf8mb4字符集可以兼容utf8字符集。
GB2312是GBK的子集，GBK是GB18030的子集。
big5支持繁體中文

轉化過程

以下模擬的是將latin1字符集的數據庫修改成GBK的過程。其他字符集的轉換過程類似。需要注意的是要轉換的目標字符集一定是源字符集的超級或者目標字符集的范圍包含源字符集的范圍。

2.1 導表結構

mysqldump -uroot -p --default-character-set=gbk -d databasename >createtb.sql

其中--default-character-set=gbk表示設置以什么字符集連接，-d表示只導出表結構，不導出數據。

2.2 手工修改createtb.sql中表結構定義中的字符集為新的字符集。

2.3 確保記錄不再更新，導出所有記錄

mysqldump -root -p --quick --no-create-info --extended-insert --default-character-set=latin1 databasename>data.sql

2.4 打開data.sql，將set names latin1修改成set names bgk.

2.5 使用新的字符集創建新的數據庫。

create database databasename default charset bgk;

2.6 創建表,執行createtab.sql

mysql -root -p databasename

2.7 導入數據，執行data.sql

mysql -root -p databasename

新的字符集一定要是原字符集的超集，不然轉化之后，數據會出現亂碼。常見字符集轉換如下：

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/540068.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/540068.shtml
英文地址，請注明出處：http://en.pswp.cn/news/540068.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！