使用PHP的DOMDocument-> loadHTML()系統獲取以下數據(</b>
標籤後4.0m)的最佳方式是什麼?我在猜測某種CSS樣式選擇器?獲得這些數據的最有效方式是成千上萬次?
(LINE 240, always 240) <b>Current Price:</b> 4.0m
我一直在尋找的文件左右,但說實話,這是所有完全陌生的我!此外,我將如何能夠獲得這些數據的數千頁,從網址,如:
http://site.com/q=item/viewitem.php?obj=11928
的obj=#
最小值/最大值是已知的(我需要多少頁刮),和我希望逐步獲取所有這些數據,並且輸出name
description
和price
(並非非常擔心迄今爲止的百分比上升/下降),因此我可以從中獲取該數據並將其顯示在我的網站中。
這裏是代碼的主要塊,我感興趣的是:
<div class="subsectionHeader">
<h2>
Item Name
</h2>
</div>
<div id="item_additional" class="inner_brown_box">
Description of item goes here.
<br>
<br>
<b>Current Price:</b> 4.0m
<br><br>
<b>Change in Price:</b><br>
<span>
<b>30 Days:</b> <span class="rise">+2.5%</span>
</span>
<span class="spaced_span">
<b>90 Days:</b> <span class="drop">-30.4%</span>
</span>
<span class="spaced-span">
<b>180 Days:</b> <span class="drop">-33.3%</span>
</span>
<br class="clear">
</div> </div> <div class="brown_box main_page">
<div class="subsectionHeader"> `
如果有人可以提供關於如何去這個任何骨骼暗示,這將是非常感謝!
是不是您可以訪問哪些RSS提要?刮擦幾乎被普遍認爲是不好的形式。 – 2011-03-14 23:57:11
可能的重複[什麼是最有效的方法來刮 - >存儲 - >顯示此信息?](http://stackoverflow.com/questions/5305436/whats-the-most-efficient-way-to-scrape-store -display-此信息) – 2011-03-14 23:57:52