Q

消毒HTML數據

2010-09-13 107 views 2 likes

2

我從不同的RSS/ATOM提要中提取數據，有時我收到的HTML數據包含HTML標籤，但它們沒有貼標籤或其他問題，並且它將頁面佈局/樣式擰緊。消毒HTML數據

有些類名/ ID衝突。有什麼方法可以消毒嗎？

如果有人能指點我一些可靠的Javascript/Java實現。

2010-09-13 Ashit Vora

+0

夥計們，這一個似乎工作http://phpjs.org/functions/strip_tags:535 如果您有任何其他建議，請讓我知道。謝謝:) – 2010-09-13 01:24:34

A

回答

1

您可以試一試JTidy。

JTidy可以用作清理格式錯誤和錯誤的HTML的工具。

另一種選擇是在網絡上找到HTML Cleaner

HTML通常是髒的，病態的，不適合進一步的處理。對於這些文件的任何嚴重消耗，首先必須清理混亂並將訂單帶到標籤，屬性和普通文本。對於給定的HTML文檔，HtmlCleaner對單個元素進行重新排序並生成格式良好的XML。默認情況下，它遵循大多數Web瀏覽器用於創建文檔對象模型的類似規則。但是，用戶可以爲標籤過濾和平衡提供自定義標籤和規則集。

2010-09-13 01:47:20 akf

0

我已經使用NekoHTML取得了巨大成功。它只是Apache解析器上的一個薄層，它將其置於錯誤糾正模式，這是一個非常棒的架構，每當Apache變得更好時，Neko也會變得更好。並且沒有大量額外的代碼。

2010-09-13 08:22:17 EJP

相關問題

11. html消毒造成困難
12. HTML消毒，限制圖像數量
13. AngularJS和消毒 - 消毒HTML沒有ngBind指令
14. 在提交的表單數據中消毒HTML
15. 消毒的數據保存到貓鼬
16. 消毒隨機數據類型
17. 爲MySQL表格消毒表格數據
18. 消毒通過PHP構造GET數據
19. 使用XSLT消毒數據庫輸入
20. 在AJAX請求中消毒POST數據
21. 線程消毒不顯示數據爭
22. 消毒/清理HTML API性反應
23. 在wordpress中消毒，但保持html
24. PDO＆消毒日期/刪除HTML
25. 如何紡織和消毒html？
26. HTML消毒 - 糟糕的標記？
27. 基於JavaScript的X/HTML和CSS消毒
28. 角$消毒與NG綁定，HTML
29. OWASP HTML消毒劑清洗意見
30. 清潔/消毒HTML，但保持與的Ruby/Rails +引入nokogiri +消毒（？）