http://www.youtube.com/watch?v=p7NMsywVQhY
這裏是我的代碼:
$url = 'http://www.youtube.com/watch?v=p7NMsywVQhY';
$html = @file_get_contents($url);
$doc = new DOMDocument();
@$doc->loadHTML($html);
$nodes = $doc->getElementsByTagName('title');
$title = $nodes->item(0)->nodeValue;
//decode the '‪' in the title
$title = html_entity_decode($title,ENT_QUOTES,'UTF-8'); //does not seem to have any effect
//decode the utf data
$title = utf8_decode($title);
$標題返回一切很好,除了返回問號‪
最初是在標題中。
謝謝。
Êa;是unicode中的「從左到右嵌入」,它不應該是可打印的字符。 – 2011-05-26 21:56:40
好的,那麼我怎樣才能從字符串中刪除這些類型的代碼? – Alex 2011-05-26 22:06:10
搜索和替換可能是最好的選擇。 – 2011-05-26 22:06:38