我使用JSOUP過濾鏈接出html身體。Jsoup爲不同的網站選擇鏈接
這樣一個網頁:https://en.wikipedia.org/wiki/Cloud_computing
我要過濾鏈接,如: https://en.wikipedia.org/wiki/Light
哈希標籤鏈接en.wikipedia.org/wiki/Cloud_computing#cite_note-1
我嘗試doc.select("a[href*=#]").remove();
它工作得很好,在HTML頁面哈希標記鏈接src:<a href="#cite_ref-1">
但是當我使用doc.select("a[href]*=/]").remove();
其中l油墨頁面html src
<a href="/wiki/Light">CH</a>
但仍有尚未過濾的鏈接。這怎麼可能?
如果我的回答解決你所描述的問題,那麼你就應該接受它,以便該線程可以考慮關閉。如果沒有,那麼請提供一些反饋,以便我可以更新我的答案 – alkis
非常感謝我檢查你的答案再次與我的代碼,它的作品。 – Rehama