文字檔 *.txt 儲存成 UTF-8 格式 (1)

文字檔 *.txt 存檔時,一般都是以 ANSI 的編碼格式來儲存。
但是,要注意的是,這時儲存的文字檔內容,將是和存檔電腦的環境設定有關。
因此會遇到打開文字檔,卻只看到一片亂碼而不是正常的中文字情形。

也是因為這樣,所以在地球村、世界大同的INTERNET,就掀起使用 UniCode 格式的浪潮。
但是實務上來說,網頁現今都是存成 UTF-8 格式。
至於 UTF-16、UTF-16LE、UTF-16BE、UTF-32.. 就較少被使用。

image

對於 UniCode 相關議題可以參考 UTF-8 & Unicode 迷思 一文。

接下來,更細緻說明一下,上文提及"這時儲存的文字檔內容,將是和存檔電腦的環境設定有關。"的意思;使用電腦的人多會了解,他是在打繁體中文還是簡體中文,即便是同一個中文字在簡繁體中是相同的字樣
(例如:中,簡繁同字;國,這字就呈現出[繁]、[簡]),
但是它被存檔時,就會和存檔電腦的環境設定有關。

有興趣的讀者,可以在下列指令中,看到設定值

開始 / 控制台 / 地區及語言選項 / 進階

image <== 這是 繁體電腦 的設定

image <== 這是 简体電腦 的設定

 

看的這些,各位看官是不是有想到,如果你打開一份來自簡體地區的文件檔,結果是亂碼一片,應該知道要如何應變了吧 !!

沒有留言: