2017-05-05 73 views
0

我正在開發一個網站,其中包含一些文本文件(以.txt文件擴展名保存)。網站上的.txt文件的正確字符編碼是什麼?

它們應該是UTF-8(帶BOM)還是ANSI(1252)O.K.? (當我保存爲UTF-8時,Windows添加了3字節BOM)。

我想做任何被認爲是最佳實踐的東西。

回答

1

UTF-8通常優選在網絡上,雖然在規格上,這似乎涉及到HTML資源,正式講話。

如果在服務器發送的HTTP頭中正確聲明瞭windows-1252,那麼幾乎沒有任何實際問題,並且可以使用該編碼支持的受限制的曲目編寫所有數據。

使用帶有BOM的UTF-8,實際上可以保證用戶代理獲得正確的編碼。您的創作工具可能仍然存在問題,例如PHP。但是,如果您自己創建和保存資源,使用支持UTF-8的工具,則幾乎不會對UTF-8產生任何異議。

+0

我可能會遇到什麼樣的問題? –

+0

根據關於BOM的W3C信息,「如果您在使用PHP的頁面中包含某些外部文件,並且該文件以BOM開頭,則可能會創建空行」。 https://www.w3.org/International/questions/qa-byte-order-mark –

0

您的網站正在使用哪種語言?

我很想說沒有絕對的最佳實踐(好吧,它適用於很多問題)。如果你在100%的英語環境中,並且它的目的是保持這種方式,你並不需要爲編碼而煩惱。

我目前的項目是使用亞洲語言和歐洲語言,所以ANSI毫無疑問。如果你不是針對老的瀏覽器,並且你的應用程序沒有任何問題管理UTF-8,我建議直接使用UTF-8,因爲如果你稍後意識到需要編碼改變,這不是很有趣......

對於進一步的閱讀,您可以閱讀關於此事encoding in website

+0

主要是英語,有一些Gaeilge(愛爾蘭蓋爾語)。感謝您的鏈接! –

+0

歡迎您。我不知道愛爾蘭蓋爾人是否有特殊的人物。就我個人的知識而言,我想問問你是否對愛爾蘭蓋爾文使用非英文字符?正如我所假設的,從語言學的角度來看,它比印歐語更像凱爾特人。 – Al1

+0

元音可以有一個「fada」,意思是「長」,看起來像一個尖銳的口音(用法語)。所以ú(u-fada)聽起來像「oo」。 –

相關問題