我正在使用PHP簡單HTML DOM解析器http://simplehtmldom.sourceforge.net/
從其他域中獲取像頁面標題,元描述和元標記之類的數據,然後將其插入到數據庫中。PHP簡單HTML DOM解析器的字符編碼問題
但我有一些編碼問題。問題是我沒有從那些不是英語的網站上得到正確的字符。
下面是代碼:
<?php
require 'init.php';
$curl = new curl();
$html = new simple_html_dom();
$page = $_GET['page'];
$curl_output = $curl->getPage($page);
$html->load($curl_output['content']);
$meta_title = $html->find('title', 0)->innertext;
print $meta_title . "<hr />";
// print $html->plaintext . "<hr />";
?>
輸出爲facebook.com
頁
Welcome to Facebook â€」 Log in, sign up or learn more
輸出爲amazon.cn
頁
亚马逊-网上è´ç‰©å•†åŸŽï¼šè¦ç½‘è´, å°±æ¥Z.cn!
爲mail.ru
頁
Mail.Ru: почта, поиÑк в интернете, новоÑти, игры, развлечениÑ
所以輸出的字符沒有被正確編碼。
任何人都可以幫助我如何解決這個問題,以便我可以將正確的數據添加到我的數據庫。
如果您將瀏覽器中的編碼切換到其他視圖>編碼下,會發生什麼? – deceze
如果我將瀏覽器編碼切換爲UTF-8,則可以使用。 – Prakash
請參閱http://stackoverflow.com/questions/4550903/simple-html-dom-character-encoding-issue –