我使用simplehtmldom_1_5從網站解析html,當我將解析的文本回顯到正確打印的屏幕,但是當我嘗試使用file_put_contents將其保存到文件時,我的字符串已編碼爲html十進制代碼:html十進制編碼字符串
&#40 &#98 &#46 &#32 &#97 &#110 &#100 &#101 &#114 &#115 &#115 &#111 &#110 &#44 &#32
我已經嘗試過所有可能的utf8_encode,utf8_decode,htmlentities的組合......但沒有任何工作,同樣的問題,當我嘗試插入到MySQL表。 解析文本的mb_detect_encoding返回ASCII。 有什麼建議嗎?
header('Content-Type: text/html; charset=utf-8');
ini_set('max_execution_time', 0);
include 'simplehtmldom_1_5/simple_html_dom.php';
$html = file_get_html($curr_url);
$texts = $html->find('div[id=content_h]');
foreach($texts as $text) {
file_put_contents('queries.txt', $text->innertext . "\n", FILE_APPEND);
}
我已經添加了一些代碼,但它是一個簡單的HTML使用簡單的HTML DOM – MaK