我想解析(竊取)來自HTML頁面的大量信息。很多信息都是封閉的。像:用戶名:1.age 2.gender 3.country等這是一個非常大的塊,因此我的正則表達式模式是巨大的。我所有的正則表達式開發工具都有一行模式和文本文本框。這使得開發這些大型模式變得不可能。我想要做什麼來開發大型正則表達式模式還是避免它們?如何在Java中創建大型正則表達式模式?
-1
A
回答
2
HTML頁面基本上是一個有效的DOM結構。所以最好使用DOM解析器而不是正則表達式來獲得所需的信息。您可以探索JSoup:Java HTML解析器。
0
使用爲HTML描述的解析規則從text/html資源生成DOM樹。這些規則一起定義了所謂的HTML解析器。
相關問題
- 1. 正則表達式,創建子模式
- 2. 創建正則表達式模式
- 3. 創建正則表達式模式
- 4. 正則表達式模式在Java中
- 5. Java中的正則表達式模式
- 6. 動態創建正則表達式Java
- 7. 用正則表達式創建模板
- 8. 創建正則表達式
- 9. 正則表達式創建
- 10. 如何創建php正則表達式
- 11. 如何創建此正則表達式
- 12. 如何創建正則表達式
- 13. 如何爲這個模式創建正則表達式/ posts /:post_id?
- 14. 如何在Java正則表達式中獲取組的模式?
- 15. 如何在正則表達式中使用Java lambda表達式
- 16. Java模式匹配正則表達式
- 17. Java正則表達式模式太長?
- 18. Java正則表達式匹配模式
- 19. 正則表達式模式Java
- 20. Java正則表達式模式查詢
- 21. Java正則表達式模式
- 22. Java正則表達式模式匹配
- 23. 的Java模式的正則表達式
- 24. Java正則表達式匹配模式
- 25. Java的模式正則表達式
- 26. 模式Java - 正則表達式
- 27. Python正則表達式模式建議
- 28. Java中的正則表達式:如何引用「匹配模式」?
- 29. 正則表達式模式
- 30. 正則表達式 - 模式
HTML頁面基本上是DOM結構。所以最好使用DOM解析器而不是正則表達式來獲得所需的信息。 –
我開始不關心有問題的問題和downvotes。這太令人討厭了。無論如何,我得到了我的答案。嘿嘿〜 –