2010-10-05 15 views
-1

我的目標是讓經驗較少的人設置所需的參數以從網站上刮取一些信息。所見即所得的網頁抓取/爬行使用Javascript/html5設置?

這個想法是用戶輸入一個URL,之後這個URL被加載到一個框架中。用戶應該能夠在這個框架內選擇文本,當這個特定的文本動態改變時,應該給我足夠的信息來再次獲取這些信息。

問題是,如果甚至有可能檢測到外部站點的源部分對應於框架中用戶的選擇?

如果不是,有沒有其他的選擇?

在此先感謝。

問候, 湯姆

+1

簡短的回答是否定的。如果您不控制iframe中的內容,那麼您就無法與其進行互動。但是,您可以製作一個書籤,它可以像您所描述的那樣進行操作,也可以製作瀏覽器插件。我不完全遵循的部分是「這應該給我足夠的信息,當這個特定的文本動態改變時再次刮掉這些信息」部分。 – 2010-10-05 20:58:24

+0

@georgemandis讓你的評論一個答案。這是一個完整的答案actualluy。 ;) – 2010-10-05 21:06:09

+0

@Geogermandis,如果我複製源代碼並使內部鏈接和圖像源在外部在我擁有的框架中運行它,那將允許我做我想要的東西? – Tom 2010-10-05 21:12:03

回答

3

簡短的答案是否定的。如果您不控制iframe中的內容,那麼您就無法與其進行互動。

但是,您可以製作一個書籤,其功能與您所描述的一樣,或者是一個瀏覽器插件。

+0

我會在稍後的日期詢問跟進問題。謝謝。 – Tom 2010-10-06 14:16:06

1

已經有在基於視覺的刮削器嘗試過,但他們很快變得更加繁瑣複雜的學習比寫代碼。通過幾個抽象(一個函數來抓取,一個按ID選擇一個表並將它轉換爲一個數組等等),你可以做出一些仍然適合初學者的東西。