jsoup

    0熱度

    2回答

    我試圖分析此網站與Jsoup:http://www.listofnewspapers.com/2014/04/site-map.html但我得到這個錯誤: For ' http://www.listofnewspapers.com/2014/04/site-map.html ': HTTP error fetching URL" 我相信錯誤是在connect(URL).get()發生。 我打印狀態

    1熱度

    1回答

    我想抓取網頁的內容 - http://www.pgmfi.org/。但是如果我們訪問該頁面,我們會看到它重定向到頁面 - http://twiki.pgmfi.org/bin/view。 當我嘗試使用jsoup或crawler4j從URL(http://www.pgmfi.org/)抓取內容時,我得到以下內容。 Looking for PGMFI.ORG Home ? Please wait re

    2熱度

    1回答

    我無法使用Jsoup提取Web內容。問題是 - 我得到的比我需要的更多!這裏是網頁內容以連結文字是不強硬格式.. <td> <ul> <li> <b> Title </b> contents <p> <a href="www.somesite.com"><b>LinkText</b></a> </p>

    -2熱度

    2回答

    我正在研究一個軟件和Jsoup上的新功能。我需要幫助。我正在解析一個網站。得到這樣的鏈接: <a href="/?loc=shop_view_item&item=139218679" class="market-name market-link">XXX</a> 我怎樣才能把數字「139218679」與Jsoup或正則表達式。你能幫我嗎?

    0熱度

    2回答

    我試圖從網頁中按順序從html獲取數據。 HTML代碼的樣子: <div class="text"> First Text <br> <br> <div style="margin:20px; margin-top:5px; "> \t <table cellpadding="5"> \t <tbody><tr> \t \t <td class="a

    0熱度

    1回答

    我試圖從https://www.epam.com/careers/job-listings?query=java&department=all&city=Kyiv&country=Ukraine 解析空缺,但我不明白什麼execept純文本,如「招聘人數全球/英五金/德語Россия/Русский」 的問題是當你加載一個頁面 - 瀏覽器運行一個腳本,加載一些空缺,但我怎麼能不支持JSOUP不能「

    0熱度

    1回答

    我正在實現一個基本的爬蟲程序,以便稍後在漏洞掃描器中使用。我使用jsoup來連接/檢索和解析html文檔。 我手動提供目標站點的基礎/根目錄(www.example.com)並連接。 ... Connection connection = Jsoup.connect(url).userAgent(USER_AGENT); Document htmlDocument = connection.g

    0熱度

    1回答

    我想知道如何從各種不同的html頁面中提取大膽的內容,並且不需要所有html頁面都使用,可以說「b」標籤或「font-weight:bold」。 我想知道是否有任何通用的方式來查找大膽的內容或有一個大膽的html表達式的詳盡列表。同樣,我想在內容大小上尋找相同的內容。 我的代碼草案以下,以防萬一,如果一些感興趣 public class Main { public static void mai

    0熱度

    1回答

    Iam試圖下載我通過以下代碼存儲在Google學者列表中的研究論文,我已經測試了20+次程序,大約一個小時前,我再次測試它,並且此錯誤彈出。此代碼是我的BS最後一年項目的一部分,我需要解決這個問題。我搜索了這個錯誤,並且嘗試了很多東西。我需要幫助來克服這一點。如果我改變了我的IP,這個問題會解決嗎? Scanner s = new Scanner(new File("E:\\ref11.txt

    2熱度

    1回答

    我試圖解析使用Jsoup一個網站的字符串,並寫了下面的測試來驗證解析 這是我的測試: @Test public void extractBookData() throws Exception { String bookLink = ""; //some address Document doc = Jsoup.connect(bookLink).get().html();