我想刮阿拉伯語的網頁和一切工作正常,但事實上,當我回顯文本我得到的是一個亂碼文本,即使我已設置標題UTF-8設置Utf8不工作在阿拉伯語文字在PHP
這裏是我的代碼
<?php
header ('Content-Type: text/html; charset=UTF-8');
require 'vendor/autoload.php';
use Goutte\Client;
$client = new Client();
$crawler = $client->request('GET', 'http://www.lebanonfiles.com');
$news_container = $crawler->filter('#mcs4_container .line');
$news_container->each(function($node) {
echo $node->text();
})
?>
設置元標題並不總是足夠的。 →Apache發送什麼頭文件? →您的瀏覽器/頁面檢測在現實中表現如何? →如果將輸出存儲到文件並使用UTF-8編輯器打開,會發生什麼情況? →Goutte是否正確[解壓縮爲UTF-8](http://stackoverflow.com/questions/18782332/can-goutte-guzzle-be-forced-into-utf-8-mode)? →另外一個截圖轉儲不是很有用。至少使它成爲一個hexdump。 →通過比較期望的UTF-8序列和Unicode表格等,提供一點自己的研究。 – mario
嘗試在HTML和PHP中設置字符集。它可能有幫助。 –
這可能對你有幫助,[Force Goutte/Guzzle進入UTF-8模式](http://stackoverflow.com/questions/18782332/can-goutte-guzzle-be-forced-into-utf-8-mode) –