2012-04-19 99 views
0

我必須從一些網站上刪除產品的圖像,我正在使用JavaScript來刮取它。 到目前爲止,我已經成功地刮的圖像,如下面使用javascript刮取價格

var images = document.images; 

for (var i = 0; i < images.length; i++) { 
    img = images[i]; 

我也想從文檔刮價格。我知道這是可能的,一些網站已經這樣做,但不知道如何。 類似於通過文檔文本匹配「價格」字符串似乎是一種可能性,但不知道如何做到這一點,還有沒有更好的辦法。 任何指針?

+0

我假設你的意思是「刮」而不是「廢料」。 – 2012-04-19 20:15:54

+0

您的報廢意味着什麼? :S – mattytommo 2012-04-19 20:15:56

+1

@mattytommo他意味着他在抓取網頁,在php中我們使用file_get_contents(),並遍歷返回的obj/string ..不管。 – 2012-04-19 20:18:06

回答

1

這取決於您對該頁面有多少了解。如果你盲目進行,你總是可以使用像document.body.innerHTML.match(/£\d+\.\d+/g)(或類似的東西,取決於貨幣)的東西。無論哪種方式,您都需要查找並匹配網頁中的圖案並從中獲取價格。

對於獎勵積分:看看他們是否有谷歌基本飼料(無保護) - 你會驚訝有多少人。這將(通常)成爲可能需要的所有內容的XML提要。

+1

我將不得不看看你說的這個'谷歌基礎飼料'。 – rlemon 2012-04-19 20:25:25

+0

@leonard,你的答案似乎很有趣。 可以請你解釋一下你在這裏定義的正則表達式的含義,對不起有些正則表達式和js中的初學者。 我會更多地關注Google Feed。不確定它到底是什麼。 – asm234 2012-04-19 20:41:08

+0

正則表達式的精彩介紹:www.regular-expressions.info/ Google Base是Google購物/產品的另一個名稱 - 商家告訴Google他們提供了哪些產品,以便Google可以通過它們向他們展示他們的產品購物網站。他們通過feed提供這些信息,通常是xml(有時是CSV)。有時可以找出/猜測/要求訪問這些提要,這會讓你的生活變得更輕鬆。 – LeonardChallis 2012-04-19 20:51:50