我有一堆使用PHP寫入PDF文件的HTML數據。在PDF中,我希望所有的HTML都被剝離和清理。因此,例如:使用PHP清理HTML以創建乾淨的字符串
<ul>
<li>First list item</li>
<li>Second list item which is quite a bit longer</li>
<li>List item with apostrophe 's 's</li>
</ul>
應該改爲:
但是,如果我只是使用strip_tags()
,我得到的是這樣的:
First list item

Second list item which is quite a bit
longer

List item with apostrophe ’s ’s
還要注意輸出的壓痕。
關於如何正確地清理HTML的漂亮,乾淨的字符串沒有凌亂的空白和奇怪的字符的任何提示?
謝謝:)
我懷疑'strip_tags()'本身將編碼你的實體。你確定你沒有錯過某個地方對'htmlentities'的調用嗎? – Yoshi
縮進正是我所期望的,PHP正在剝離這些標籤,但不是它們周圍的額外文本。 – scragar
你的意思是我應該*或*不應該*在某處使用htmlentities()?在這一刻我不是。 HTML數據直接來自數據庫。 – Rein