您好我正在雲計算亞馬遜項目。我堅持的部分代碼是從亞馬遜獲取用戶希望列表。 由於存在權限限制,我所做的是提取了給定願望清單url的整個頁面源。要提取我用圖案ITEMID編譯像模式編譯器爲span html標記
Pattern p = Pattern.compile("/dp/(\\w+)/");
Matcher matcher = p.matcher(content);
這是容易的,它現在可以正確地列出了所有的產品與他們的itemId在願望清單。 我也需要每個的價格。根據頁面來源的價格是
<span class="a-size-base a-color-price a-text-bold">
$7.19
</span>
我需要爲這個寫一個模式,都困惑和卡住。我吸吮正則表達式。任何人都可以幫忙請。我看到了href的在線參考資料,但我認爲這不會對我有用。
感謝dkatzel,我發現這個工具Jsoup。我嘗試了在線轉換Online Jsoup Try,所以當我做CSS Query div時,我得到了所需的輸出。但我如何在我的java程序中硬編碼它。我有jsoup罐子。
我建議您使用像http://jsoup.org/這樣的HTML解析庫來爲您完成所有這些工作。 (除非你需要自己解析它以用於學校工作) – dkatzel
我不需要自己解析它。我的主要項目完全不同。 –
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 – GriffeyDog