我運行下面的代碼:DOMDocument打破編碼?
$page = '<p>Ä</p>';
$DOM = new DOMDocument;
$DOM->loadHTML($page);
echo 'source:'.$page;
echo 'dom: '.$DOM->getElementsByTagName('p')->item (0)->textContent;
它輸出以下內容:
資料來源:A
DOM:謾
所以,我不明白爲什麼當文本通過DOMDocument來時,它的編碼會被破壞?
謝謝,utf8_decode做的工作。 – Mike
剛剛也遇到了這個問題,不幸的是遇到了一個utf8_decode無法幫助的情況。 iconv(「UTF-8」,「CP1252」,$ data)來拯救! (更多信息:http://us2.php.net/manual/en/function.utf8-decode.php#104907) – MBaas