2013-11-26 183 views
1

有沒有辦法讓元/標籤的開始行&列數結束行&列數JSOUP HTML解析器

我正在創建HTML編輯器,需要突出顯示標記,以便根據某些情況給出的速度優化給定開始和結束行&列號

+1

我分叉Jsoup並跟蹤源文檔中所有元素的開始和結束位置。我沒有列號和行號,但也許這可能是你的開始。你可以在這裏找到代碼(https://github.com/tvogels/jsoup)。 – Thijs

回答

1

不,不幸的是,這是不可能在當前jsoup。

目前Jsoup在解析時沒有跟蹤行號/字符位置 ,所以無法提取它們。由於這不是 核心用例,我不想通過保留這些數據來擴展 DOM的內存需求。我曾想過在解析過程中可能會增加一個可選的旁通道方式來跟蹤它,類似的方法是跟蹤解析錯誤的方式,但還沒有着重於 的實現。

來源:https://groups.google.com/forum/#!topic/jsoup/lnbYSIZApWw

相反,你可以嘗試Jericho HTML Parser。在它的功能列表中,它表​​示:

源文檔中每個位置的行號和列號是 ,可輕鬆訪問。

查看javadoc here和調查方法,如getRow()getColumn()getRowColumnVector()

+0

是否有任何其他Java HTML分析器跟蹤行號? – hiddenuser

+0

@ user2998596你看過[Jericho HTML Parser](http://jericho.htmlparser.net/docs/index.html)嗎?在特徵列表中說'源文檔中每個位置的行號和列號很容易訪問。'它具有諸如getRow(),getColumn()和getRowColumnVector()等方法。 – ashatte