如果我有以下的HTML頁面 <div>
<p>
Hello world!
</p>
<p> <a href="example.com"> Hello and Hello again this is an example</a></p>
</div>
我想例如「你好」的特定單詞並將其更改爲「歡迎」,無論他們是在文件 你有什麼建議嗎?無論使用哪種類型的解析器,我都會很樂意得到答案
背景:我正在編寫一個Java程序來瀏覽HTML文件,並將非<script>或<style>標籤中的所有內容替換爲Lorem Ipsum 。我原本是用一個正則表達式去除一個>和一個<之間的一切,這實際上工作得很好(我知道是褻瀆神靈),但我試圖把它變成其他人可能會覺得有用的工具,所以我不敢威脅通過嘗試在HTML上使用正則表達式,宇宙的神聖性。 我想使用HtmlCleaner,一個吸引我的Java庫,因