n 鍵跳至 内頁瀏覽. 跳至内容

此文檔為翻譯。如有不同或錯誤 最新的英語原文 應為依照標準. 原始版權屬于 W3C, 文件内容翻譯如下所示.

譯者: Sun Yuanfu

s_gotoW3cHome 國際化
 

介紹字符集與編碼

目標讀者: 初涉國際化且在選題和如何着手使用網站素材方面需要指導的人員。

對於那些對網絡國際化不知從何入手的新手﹐本網頁提供了基本指導﹐期望助其輕鬆地逐漸了解﹑認識和使用网上資料。

網頁右邊有精選文章鏈接﹐點擊即可閱讀有關詳細內容。 一旦你從本网頁得到啟發﹐則只需使用主题索引技術索引, 或網站搜索就可以查閱相關內容。

什麼是字符集﹖編碼有何用途﹖

了解更多...

字符編碼入門 解釋了字符編碼的某些基本概念,以及為什麼你應注意字符編碼。

字符編碼相關基本定義 解釋了Unicode﹑ 字符集﹑編碼字符集﹑字符編碼﹑文檔字符集﹑字符轉義等術語。

字符集是書寫系統字母與符號的集合。例如,ASCII 字符集包括英語字母、符號;ISO-8859-6字符集包括許多基於阿拉伯語言文字的字母、符號;Unicode 字符集涵蓋世界上多數活語言文字字符。

字符集裡的字符在計算機中存儲為一個或多個字節﹐每一個或每一序列字節代表一特定字符。字符編碼關鍵在將一特定字節或序列字節編碼對應 ( 映射 )以文本字體顯示的特定字符。

現有許多不同類型的字符編碼。 如果錯用了與存儲字節不一致的編碼﹐ 結果就是亂碼。所以﹐如要文字內容可以閱讀﹐則要正確標注字符編碼﹐這很重要。

編碼的選擇

每個開發人員﹐無論是內容創作或編程﹐都必須事先決定使用哪一種字符編碼。現時﹐大多推薦用UTF-8﹐但仍會有其它因素需要考慮﹐方可定奪。

了解更多...

HTML & CSS 編輯人員
Choosing a character encoding

規範開發人員
Choosing character encodings

服务器设置
Choosing a character encoding


聲明和應用編碼

一旦決定使用何种編碼,內容創作者和程序員必須确保此編碼要正确地予以聲明。

在象XHTML這一類的技術中,編碼聲明并非總是直接了當的,這就需要正確理解“標准”模式与“非標”模式, 也要理解XML聲明的作用。

僅予標註還不夠, 你還須确保數据以選定編碼存貯。

內容開發人員和网站管理員也要确保服務器能夠以正确的字符編碼聲明傳遞內容,因為服務器的設置將會覆蓋文檔中的聲明。

轉義

轉義是一種方法﹐即只用ASCII文本方式來表示某個字符﹐可用來表示所用編碼中沒有的字符﹐或因其他原因(比如它們可能與句法衝突)需避免使用的字符。你應該清楚何時及如何使用轉義。

了解更多...

HTML & CSS 編輯人員
Using escapes to represent characters

SVG 編輯人員
Using escapes to represent characters

XML 編輯人員
Using escapes to represent characters

規範開發人員
Designing character escapes


網址

現時網址也可包括非ASCII字符﹐用戶只需點擊相應的鏈接或輸入所見文字﹐其主要編碼任務皆由用戶代理完成﹐但你可能有興趣了解這是如何實現的。

規范開發人員應制訂相應規範以便人們能夠正常使用非ASCII的网址。


作者 Richard Ishida, W3C. 翻譯 Sun Yuanfu.

有效的 XHTML 1.0!
有效的 CSS!
UTF-8! 編碼

從 2009-05-01 英文文件翻譯而來. 翻譯版本 2012-03-27 10:29 GMT

如果文檔歷史改變,搜索 gs-characters 在 i18n 部落格.

  翻译: