我正在使用simplexml_load_string
將XML文檔加載到對象中。這似乎是偉大的工作,直到我碰到這個元素來:simplexml_load_string將「 」變成「Â」
<some_string_val>1.     Some text.</some_string_val>
運行,通過simplexml_load_string
跑後,一下就出來了是:
["some_string_val"]=> string(20) "1.    Some text"
我試着使用:
html_entity_decode($string, ENT_QUOTES, "Windows-1252");
這似乎將 
的純文本,但當我試圖通過simplexml_load_string
運行,我得到了同樣的結果。我也嘗試過使用UTF-8和其他一些類似或更差的結果。
那麼,我能做些什麼來將 
轉換爲UTF-8,以便它可以被simplexml_load_string
正確解析?保持HTML實體完好無損,因爲這將進入CSV。
編輯:這已被不公正地標記爲一對夫婦的原因重複:
- 這不是語言無關的;這是處理一組特定的PHP函數,不同於這個被標記爲
- 的帖子,這不是一個HTML頁面或PDF,而是一個CSV,所以我不能設置標題。接受的解決方案將不會在我的情況下工作
'[「some_string_val」] => string(20)「1.在瀏覽器中看不到輸出的文本」我不信。我也證實這是重複的。對於CSV文件,您可能需要查看所打開軟件的手冊,瞭解*如何導入使用UTF-8字符編碼*的.csv文件。 CSV文件本身在PHP中使用UTF-8時效果很好。 – hakre 2014-10-11 23:56:48