2014-04-22 15 views
0

我的腳本工作很好,但今天簽入日誌後,我發現了一些矩陣的話,分析後我明白,有一些與utf8,文件被解析,標題提取,但結果代替俄語字是(СÐμÑ€DD°d»N preg_match UTF-8問題未知的符號,而不是cyrilic

我使用

$cont = "dasdas<title>Сериалы ТУТ! Сериалы онлайн sda</title>"; 
preg_match("'<title[^>]*?>(.*)</title>'siU", $cont, $match); 

//$match[1] = Сериалы ТУТ! СериРsda 

當我嘗試添加模式修飾符/ u沒有變化,相同的未知矩陣詞。請。

也許有什麼與PHP?

+2

[無法重現](https://eval.in/139968)。你在一個普通的(新鮮的)php文件中測試這個嗎? – HamZa

+2

這給我的預期輸出。 – hwnd

+0

@HamZa,是的,當我試圖在網上解析器重現,一切工作順利,但在谷歌沒有信息,它爲什麼我認爲問題可能不preg_match,但在另一個層面。 –

回答

2

這不是一個PHP或正則表達式的問題,而是一個HTML問題。要獲得正確的顯示,您必須在您的html代碼的標題中添加<meta charset="UTF-8"/>

順便評論:使用U改性劑是無用:

preg_match('~<title[^>]*>(.*?)</title>~si', $cont, $match); 
+0

謝謝^^ kjj –