刮刮是我的一個新話題,我正在努力去理解它。注意:我正在使用wordpress。刮刮價格標題產品圖片來自網站
例如,說我的鞋博客我想通過刮來顯示FootLocker產品。我將如何從 Footlocker中提取產品的價格,標題和圖像?
從我的研究,這似乎是 DOM文檔在PHP 或 Python的BeautifulSoup 可用於這一目的,但我不確定。對於我的情況(提取價格,標題,圖像)哪種方法可行?
DOMdocument會爲此工作嗎?真的需要一些指導。
EDIT
下面是試樣HTML
產品名稱
<div class="title" data-info="product_title">
<h1 tabindex="698">Jordan Flight Origin 2 - Men's</h1>
</div>
PRODUCT PRICE
<div class="regular_price">
<span class="label" tabindex="-1"></span>
<span class="value">$114.99</span>
</div>
PRODUCT IMAGE
<div class="regular_price">
<span class="label" tabindex="-1"></span>
<span class="value">$114.99</span>
</div>
產品URL
是BeautifulSoup可以幫助您......您能否提供您需要提取數據的標本HTML代碼。 –
@pyAna請參閱我的編輯。希望我複製正確的HTML。 BeautifulSoup是否使網站運行緩慢? – leko