JSOUP HTML解析器

有沒有辦法讓元/標籤的開始行&列數和結束行&列數？JSOUP HTML解析器

我正在創建HTML編輯器，需要突出顯示標記，以便根據某些情況給出的速度優化給定開始和結束行&列號。

2013-11-26 hiddenuser

我分叉Jsoup並跟蹤源文檔中所有元素的開始和結束位置。我沒有列號和行號，但也許這可能是你的開始。你可以在這裏找到代碼（https://github.com/tvogels/jsoup）。 – Thijs

不，不幸的是，這是不可能在當前jsoup。

目前Jsoup在解析時沒有跟蹤行號/字符位置，所以無法提取它們。由於這不是核心用例，我不想通過保留這些數據來擴展 DOM的內存需求。我曾想過在解析過程中可能會增加一個可選的旁通道方式來跟蹤它，類似的方法是跟蹤解析錯誤的方式，但還沒有着重於的實現。

來源：https://groups.google.com/forum/#!topic/jsoup/lnbYSIZApWw

相反，你可以嘗試Jericho HTML Parser。在它的功能列表中，它表示：

源文檔中每個位置的行號和列號是，可輕鬆訪問。

查看javadoc here和調查方法，如getRow()，getColumn()和getRowColumnVector()。

來源

2013-11-26 11:06:15 ashatte

是否有任何其他Java HTML分析器跟蹤行號？ – hiddenuser

@ user2998596你看過[Jericho HTML Parser]（http://jericho.htmlparser.net/docs/index.html）嗎？在特徵列表中說'源文檔中每個位置的行號和列號很容易訪問。'它具有諸如getRow（），getColumn（）和getRowColumnVector（）等方法。 – ashatte

JSOUP HTML解析器

回答

相關問題