1
獲取UTF8 DOM我有以下代碼:從UTF8文件
<?php
header('Content-Type: text/html; charset=utf-8');
function getSource($url)
{
if (!function_exists('curl_init'))
{
die('CURL is not installed!');
}
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_ENCODING, "UTF-8");
$output = curl_exec($ch);
curl_close($ch);
return $output;
}
$source = getSource('http://www.website.com/');
var_dump($source); die();
和文件本身是UTF-8。事情是輸出的UTF-8字符顯示不正確。相反,它們會顯示爲問號或其他垃圾。
解決這個問題的唯一辦法就是將文件編碼爲ISO-8859-1。但我不想那樣。這裏有什麼問題?
可能值得一提的是轉換的一些方法 - 「mb_convert_encoding」和「iconv」浮現在腦海。 – IMSoP