我有產品名稱列表,我想在以下給定的URL中搜索產品名稱,我只需要獲取價格。 例如我想搜索「TOMMEE TIPPEE一次性乳墊 - 1×50包」 這個URL http://www.boots.ie/baby-child/babyfeeding/breastfeeding-pumps 如果我得到了全成匹配,那麼我怎樣才能得到的價格即€8.49 通過刮。 這是演示URL的一個同樣地,我有URL列表正則表達式搜索產品名稱並獲得價格
請幫我提供任何實例或正則表達式來做好這項工作
我有產品名稱列表,我想在以下給定的URL中搜索產品名稱,我只需要獲取價格。 例如我想搜索「TOMMEE TIPPEE一次性乳墊 - 1×50包」 這個URL http://www.boots.ie/baby-child/babyfeeding/breastfeeding-pumps 如果我得到了全成匹配,那麼我怎樣才能得到的價格即€8.49 通過刮。 這是演示URL的一個同樣地,我有URL列表正則表達式搜索產品名稱並獲得價格
請幫我提供任何實例或正則表達式來做好這項工作
幾個示例代碼,可以幫助您開始這個項目。
import re
from bs4 import BeautifulSoup
url = 'http://www.boots.ie/baby-child/babyfeeding/breastfeeding-pumps'
soup = BeautifulSoup(url, 'html.parser')
product_name_regex = 'Tommee Tippee Disposable Breast Pads - 1 x 50 Pack'
product_tag = soup.find('div', text=re.compile(product_name_regex))
price_tag = product_tag.find_next('div', { "class" : "product_price" })
price = price_tag.text
這個簡短的代碼試圖首先解析HTML頁面,然後通過使用文本/類名查找標籤提取該頁面的信息。
幾個環節,可以幫助你: BeautifulSoup Doc , How to find elements by class
Hi @Flames 這是正確的答案。我認爲這個庫是爲Python,但我需要在C#。有沒有在C#或Java腳本中可用的lib。 –
感謝您給我想法在HtmlAgilityPack的解決方案 –
@AdeelNazir沒問題。 – Flames
的StackOverflow是不是免費的代碼服務。顯示您嘗試過的內容以及您的代碼中卡在哪裏。並指出你的問題到那個特定的問題。 –
此外,我建議發佈數據的摘錄而不是鏈接到網站。您可能將該網站與好意聯繫起來,但它可能會被濫用於廣告或惡意軟件傳播,這會使我保持警惕,並且不太可能回答您的問題。 – Aaron