總結
- utf-8,支持所有語言
一、HTML 默認使用的字符集
? HTML 頁面推薦使用 UTF-8 字符集
<meta charset="UTF-8" />
這是 HTML5 中推薦的標準字符編碼,用于定義網頁中字符的編碼方式。
二、什么是字符集(Character Encoding)?
字符集是一組字符與對應二進制表示之間的映射關系。
- ASCII:最早的字符集,僅支持 128 個英文字符。
- ISO-8859-1:擴展 ASCII,支持西歐語言(如法語、德語)。
- GBK / GB2312 / GB18030:中文字符集,支持簡體中文。
- UTF-8:現代通用字符集,支持全球所有語言。
三、UTF-8 的特點
特點 | 說明 |
---|---|
? 全球通用 | 支持所有語言(包括中文、日文、阿拉伯語等) |
? 可變長度編碼 | 1~4 字節表示一個字符,節省存儲空間 |
? 向下兼容 ASCII | 英文字符占用 1 字節,與 ASCII 完全兼容 |
? 廣泛支持 | 被現代瀏覽器、服務器、數據庫廣泛支持 |
? 無亂碼風險 | 避免因編碼不一致導致的亂碼問題 |
四、如何設置 HTML 頁面的字符集?
在 HTML 文檔的 <head>
部分添加以下 <meta>
標簽:
<!DOCTYPE html>
<html lang="zh-CN"><head><meta charset="UTF-8" /><title>示例頁面</title></head><body>...</body>
</html>
?? 注意:
<meta charset="UTF-8">
應該盡可能放在<head>
的最前面,確保瀏覽器第一時間識別編碼。
五、服務器端設置字符集(可選)
除了 HTML 中聲明字符集,服務器也應通過 HTTP 響應頭指定編碼:
Content-Type: text/html; charset=UTF-8
? 推薦前后端統一使用 UTF-8,避免因編碼不一致導致的亂碼問題。
六、常見亂碼原因及解決方案
原因 | 解決方案 |
---|---|
HTML 文件保存格式不是 UTF-8 | 使用編輯器保存為 UTF-8 編碼 |
未設置 <meta charset> | 添加 <meta charset="UTF-8"> |
服務器響應頭未指定編碼 | 設置 HTTP 響應頭 Content-Type: text/html; charset=UTF-8 |
數據庫編碼不一致 | 數據庫、連接、頁面統一使用 UTF-8 |
七、總結
內容 | 說明 |
---|---|
推薦字符集 | UTF-8 |
優點 | 支持多語言、兼容性強、節省空間、無亂碼 |
HTML 設置方式 | <meta charset="UTF-8"> |
服務器設置 | 推薦響應頭中設置編碼 |
實際建議 | 前端、后端、數據庫統一使用 UTF-8 編碼 |