我目前正在嘗試使用JSoup爲Android應用程序解析Craigslist頁面。下面是URL的網頁,我試圖解析:使用JSoup獲取Craigslist img src
http://seattle.craigslist.org/search/sss?query=ford&sort=rel
當我檢查使用Chrome的元素,我可以看到,對於廣告的HTML結構如下:
<p class="row" data-pid="4711759405">
<a href="/see/ctd/4711759405.html" class="i" data-id="0:00U0U_d4iR9oMNMBY">
<img alt="" src="http://images.craigslist.org/00U0U_d4iR9oMNMBY_300x300.jpg">
</a>
<span class="txt">
<span class="star v" title="save this post in your favorites list"></span>
<span class="pl">
....
使用JSoup,我能夠解析除img標記之外的所有內容。以下是我如何提出HTTP請求:
document = Jsoup.connect(url).get();
Elements images = document.select("img");
此方法只能找到2個圖像,其中沒有一個是廣告圖像。我還使用Chrome插件POSTMAN來複制HTTP GET請求,並且我發現沒有任何廣告的img標記。爲什麼會發生這種情況,我如何檢索img標籤的src URL?
請注意,我能夠檢索其他所有內容,但img標記。
我不敢相信我錯過了那種模式。我確實在一點看過數據ID,但我一定錯過了相關性。謝謝! – user1927638