2016-04-25 54 views
2

我試圖正確顯示從PDF文檔中的數據庫中提取的文本字符串。我無法弄清楚的是以下幾點。Html實體解碼isue使用html2pdf

我使用fpdf和html2pdf生成PDF文檔。我從我的數據庫獲取我的信息後,我用:

iconv('UTF-8', 'windows-1252', $data); 

這在PDF文檔中正確顯示如果我使用:

$pdf->Cell(); 

但是當我使用:

$pdf->WriteHtmlCell(); 

似乎它有解碼問題。它似乎是在另一個字符集中,因爲ù變成¹並且Ä變成Ã「等等。我試圖將它轉換爲UTF-8(它原來是在)或ISO,但我一直得到相同的結果。當我運行一個

mb_detect_encoding(); 

對於字符串它總是以ASCII(即UTF-8?)的形式返回。

WriteHtmlCell();使用另一種編碼?

+0

那麼你可以看到檢測編碼部分是正確的:那ù解碼爲utf8'C3 b9',或在latin1編碼爲2個字符[A波浪號(HTTP:// WWW .fileformat.info/info/unicode/char/c3/index.htm)+ [上標1](http://www.fileformat.info/info/unicode/char/b9/index.htm)。你的新HTML文件是否表明它是用UTF8編碼的? – usr2564301

+0

@RadLexus是的頁面的字符集元是:。我認爲它與fpdf的html2pdf擴展有關。或者我錯了? – Jaap115

+0

有誰知道我在哪裏可以找到解決方案?我在輸出之前嘗試過編碼,但那不起作用。 – Jaap115

回答

-1

試試這個

html_entity_decode($your_data, ENT_XHTML,"ISO-8859-1");