2012-06-29 87 views
2

我想解析一個使用簡單的HTML DOM(http://simplehtmldom.sourceforge.net)的中文網站,但面臨的問題是所有漢字分析成爲無法識別的符號。如何使用PHP解析漢字簡單的HTML DOM解析器?

例: 「星洲網」 成了 「æ~Ÿæ'²ç¶²」

如何使用簡單的HTML DOM來解析UTF-8字符?或者我在編碼中做錯了什麼?

下面是我的PHP編碼:

<?php 
require_once ("simple_html_dom.php"); 

$html = file_get_html("http://www.sinchew-i.com"); 
print $html->plaintext; 
?> 
+0

你在哪裏看結果?在瀏覽器中?在命令行上?其他UTF-8文本在同一個環境中工作嗎? – deceze

+0

@deceze,我從瀏覽器查看結果,網站在使用原始鏈接時正確顯示UTF-8中文字符,http://www.sinchew-i.com – Dennis

+1

嘗試從查看>編碼菜單中選擇UTF-8在你的瀏覽器中,這有幫助嗎? – deceze

回答