在這裡主要是告訴一些新手,當你打開一份文件時,如何快速的了解這個檔案的編碼模式是什麼呢?比如說如果是繁體中文的文件那麼可能是UTF8字符集、簡體中文則可能是GB2312編碼、英文的話則很有可能是ANSI,當然這些例子都只是一些範例,不是絕對的,不過新手常會遇到的問題通常是中文亂碼的問題,這部分很可能就是開啟編碼的模式有問題了,因此,了解文件開啟的編碼模式就變成了一個基本必需要具備的知識,以下會以Notepad++、UltraEdit來舉例如何查看文件的編碼,不會做深入的編碼探討。
軟體下載:NotePadd++、UltraEdit
Notepad++
請由功能表中的「編碼」來查看,以下的例子就是編譯成「UTF8-碼 (檔首無BOM)」,而下方的「轉換至 XXX 格式」就是將目前的文件編碼轉成其他格式
UltraEdit
如果你習慣用UltraEdit,那麼編碼資訊會直接顯示在最下方的狀態列中,請參考下圖紅框標示處
簡易中文亂碼排除
通常會遇到中文亂碼比較大的可能性不是原始檔案有問題,而且開啟時的文件編碼模式不恰當,以下面這個例子來說,HTML本身沒有指定charset,所以在Notepadd++中的編碼也沒有顯示此為何種編碼,但你可以明顯的看到文件中文亂碼,以我的經驗來說,我第一步會執行的就是把「編碼字符集」改成「Big5 (Traditional)」,這樣就可以正常顯示了
這邊要提醒大家的是,上面都只是一些案例,對編碼不熟的人遇到中文亂碼時,建議可以多嚐試幾種不同的編碼模式,如有些具有中文的文件是編成「ANSI」格式,而有些西歐的特殊字元則可以試試「ISO-8859-1」