我想用Greasemonkey抓取一個站點,並想知道是否有比GM_setValue更好的臨時存儲值的方法。爲基於Greasemonkey的搜尋器存儲數據的最佳方法?
我想要做的是在社交網絡中抓取我的聯繫人,並從他們的個人資料頁面中提取Twitter網址。
我目前的計劃是打開它自己的選項卡中的每個配置文件,使它看起來更像一個正常的瀏覽人(即CSS,scrits和圖像將由瀏覽器加載)。然後用GM_setValue存儲Twitter網址。一旦所有配置文件頁面被抓取後,使用存儲的值創建一個頁面。
雖然我對存儲選項並不滿意。也許有更好的方法?
我曾考慮將用戶配置文件插入當前頁面,以便我可以使用相同的腳本實例處理它們,但我不確定XMLHttpRequest是否顯示對普通用戶啓動的請求無法判斷。
想要Greasemonkey的原因是要抓取的頁面並不真正批准機器人。 Greasemonkey似乎是使爬蟲看起來合法的最簡單方法。 – 2009-07-02 10:38:04