2014-01-13 79 views
2

我在PHP中通過標題發送正確的字符集信息時遇到了問題。爲iso-8859-2發送正確的字符集標題

在我的代碼中,我創建了一個ISO-8859-2編碼的CSV字符串。我使用以下代碼(簡化)輸出該給瀏覽器:

$csv = 'iso-8859-2 encoded string, Łukasz Szukała'; 

header('Content-Type: text/csv; charset=ISO-8859-2'); 
header('Content-Disposition: attachment; filename=report.csv'); 

echo $csv; 

生成的文件被檢測爲ISO-8859-1,使用編輯器(我使用記事本++)和打開時,它因此顯示不正確。

轉換字符串爲UTF-8按預期工作:

$csv = 'iso-8859-2 encoded string, Łukasz Szukała'; 
$csv = iconv('ISO-8859-2', 'UTF-8', $csv); 

header('Content-Type: text/csv; charset=UTF-8'); 
header('Content-Disposition: attachment; filename=report.csv'); 

echo $csv; 

我甚至可以在這種情況下,完全忽略字符集的一部分。

但是我需要將文件編碼爲ISO-8859-2,我無法明白爲什麼標題信息不會導致文件被檢測爲ISO-8859-2。我也根據IANA(http://www.iana.org/assignments/character-sets/character-sets.xhtml)嘗試了不同的別名,但我沒有在任何瀏覽器中使用它。

非常感謝任何有價值的投入。

回答

1

除了您希望使用Notepad ++來檢測文件的字符集之外,您正在做的一切正確。嚴格來說,ISO-8859-2不是編碼,而是字符集。

由編輯器(任何)打開的文件只是純文本,沒有標題,您發送給瀏覽器。因此編輯器可以檢測到它是單字節編碼,但是檢測字符集是不可能的,所以它在默認系統字符集中打開。

my answer有關編碼檢測

您的檔案仍然是正確的編碼,但記事本++只顯示它不正確。 UTF-8編碼是另一回事,因爲它沒有字符集並始終正確顯示(我認爲)。

+0

是的,我只是想通了,一旦文件保存在本地,任何頭信息都會丟失。 –

相關問題