在Windows環境中,您如何建議我完成以下任務:訪問網站,輸入用戶名和密碼,從下拉菜單中選擇一個選項,點擊幾個鏈接(一個是動態的,但事先已知並存儲在本地文件中),然後從顯示的頁面中刪除信息並將其保存到文件中。如何訪問網站,登錄,導航到頁面並抓取數據
我試圖在人力方面解決的問題是;我從我以後的信息類型的大型聚合商那裏購買我的一個業務的數據。他們給我發送了這個信息的快照,以獲得完整的信息並將其輸入到我的後臺客戶管理數據庫中。我必須加載瀏覽器,訪問聚合器站點,登錄,從下拉列表中選擇帳戶正在存儲信息,然後從着陸頁導航到數據列表(1個靜態鏈接),然後掃描新的客戶數據頁面(動態鏈接),然後單擊該鏈接,最後將屏幕上顯示的數據複製並粘貼到我的後臺系統。
定期購買此數據的日誌意味着需要我或員工很長時間才能完成此操作。聚合器沒有API或其他與他們互動的方式,除了他們的網站,不幸的是,根據我的經驗他們提供了最好的質量數據,所以我被大量世俗的數據錄入困擾,或者付錢給其他人來做,做更多的生產任務。
我有各種機器和操作系統的可用,但寧願我可以運行在WinXP/7/8的解決方案。
從電子郵件獲取唯一標識符到一個文本文件不是一個問題,我可以在Outlook中編寫一個VBA宏,這將做到這一點,並從文本(或其他)文件輸入到我的後臺數據庫也是一個簡單的任務,它只是與我正在努力的聚合器的交互。
任何和所有的幫助優雅地收到。
http://phantomjs.org/ – DaveRandom
有大部分腳本語言(Perl中,蟒蛇紅寶石)一個機械化庫,但那些通常不與微軟產品發揮很好。或者你可以嘗試用.NET語言來完成它,但這將會是一團糟。 – pguardiario
大的問題,我一直在刮網頁約兩年,我從來沒有做過任何複雜的,很想看到的解決辦法+1 – 2016-02-03 16:41:58