我正在嘗試創建一個腳本來將我的註釋導出到Disqus,爲了做到這一點,我需要創建一個巨大的XML文件。由於錯誤的UTF8編碼導致XML讀取錯誤
我在使用UTF 8進行編碼時遇到了問題。它應該是UTF-8文件,但我需要製作utf8_decode才能正確顯示我的西班牙文元素。
的文件生成是這樣的:
<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
xmlns:content="http://purl.org/rss/1.0/modules/content/"
xmlns:dsq="http://www.disqus.com/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:wp="http://wordpress.org/export/1.0/"
>
<channel>
<wp:comment>
<wp:comment_id>26</wp:comment_id>
<wp:comment_author>KA_DIE</wp:comment_author>
<wp:comment_author_email> </wp:comment_author_email>
<wp:comment_author_url></wp:comment_author_url>
<wp:comment_author_IP> </wp:comment_author_IP>
<wp:comment_date_gmt>2009-07-16 18:53:19</wp:comment_date_gmt>
<wp:comment_content><![CDATA[WTF TEH Gladios en español <br />tnx tnx <br />me usta mucho esa web estoy pendiente mucho se su actualziacion es buen saber ke esta en español <br />x que solo entendia el 80, 90% de la paguina jiji]]></wp:comment_content>
<wp:comment_approved>1</wp:comment_approved>
<wp:comment_parent>0</wp:comment_parent>
</wp:comment>
</channel>
</rss>
出於安全原因,如IP或電子郵件被刪除的數據。正如你所看到的,它包含「ñ」字母。但顯示的XML拋出一個錯誤:
XML讀取錯誤:壞組成
我不知道確切的翻譯,但它在內容系崩潰。代碼與此生成:
public function generateXmlElement(){
$xml = "<wp:comment>
<wp:comment_id>$this->id</wp:comment_id>
<wp:comment_author>$this->author</wp:comment_author>
<wp:comment_author_email>$this->author_email</wp:comment_author_email>
<wp:comment_author_url>$this->author_url</wp:comment_author_url>
<wp:comment_author_IP>$this->author_ip</wp:comment_author_IP>
<wp:comment_date_gmt>$this->date</wp:comment_date_gmt>
<wp:comment_content><![CDATA[$this->content]]></wp:comment_content>
<wp:comment_approved>$this->approved</wp:comment_approved>
<wp:comment_parent>0</wp:comment_parent>
</wp:comment>";
return $xml;
}
然後fwrite到一個文件。
你知道應該是什麼問題嗎?
我從fwrite創建文件,所以它似乎沒有用UTF-8編碼它,它確實有UTF8聲明,但它不是UTF8編碼。我打開並用Notepad ++將XML文件重新編碼爲UTF8,保存並解決。我怎樣才能在PHP腳本上做到這一點? – 2011-05-06 19:13:29