2
我想解析一個使用簡單的HTML DOM(http://simplehtmldom.sourceforge.net)的中文網站,但面臨的問題是所有漢字分析成爲無法識別的符號。如何使用PHP解析漢字簡單的HTML DOM解析器?
例: 「星洲網」 成了 「æ~Ÿæ'²ç¶²」
如何使用簡單的HTML DOM來解析UTF-8字符?或者我在編碼中做錯了什麼?
下面是我的PHP編碼:
<?php
require_once ("simple_html_dom.php");
$html = file_get_html("http://www.sinchew-i.com");
print $html->plaintext;
?>
你在哪裏看結果?在瀏覽器中?在命令行上?其他UTF-8文本在同一個環境中工作嗎? – deceze
@deceze,我從瀏覽器查看結果,網站在使用原始鏈接時正確顯示UTF-8中文字符,http://www.sinchew-i.com – Dennis
嘗試從查看>編碼菜單中選擇UTF-8在你的瀏覽器中,這有幫助嗎? – deceze