我有興趣編寫一個腳本,最好是一個容易添加到使用諸如Greasemonkey等工具的瀏覽器,它將頁面的HTML源代碼發送到外部服務器,稍後它將在其中分析和有用的數據將被髮送到數據庫。發送源代碼到外部服務器
但是,我還沒有看到這樣的事情,我不知道如何處理這個任務。我會想象某種HTTP post是最好的方法,但我對這些想法完全陌生,而且我甚至不會在哪裏發送數據來解析它(發送整個數據是沒有意義的例如HTML文檔到數據庫)。因此基本上,我的總體目標是這樣工作的(請注意,我只需要步驟1和2的幫助。我熟悉數據解析技術,我從來沒有將它們應用到網絡上):
- 用戶查看特定網頁
- 源代碼經由Greasemonkey的或一些其它工具發送到該代碼被解析成有意義的數據的服務器
- 存儲在MySQL數據庫。
任何提示或幫助非常感謝,謝謝!
編輯:代碼
ihtml = document.body.innerHTML;
GM_xmlhttpRequest({
method:'POST',
url:'http://www.myURL.com/getData.php',
data:"SomeData=" + escape(ihtml)
});
編輯:當前JS日誌:
Namespace/GMScriptName: Server Response: 200
OK
4
Date: Sun, 19 Dec 2010 02:41:55 GMT
Server: Apache/1.3.42 (Unix) mod_gzip/1.3.26.1a mod_auth_passthrough/1.8 mod_log_bytes/1.2 mod_bwlimited/1.4 FrontPage/5.0.2.2635 mod_ssl/2.8.31 OpenSSL/0.9.8e-fips-rhel5 PHP-CGI/0.9
Connection: close
Transfer-Encoding: chunked
Content-Type: text/html
Array
(
)
http://www.url.com/getData.php
這聽起來像的東西,將用於廣告或類似的行爲定位 - 要知道,有問題的網頁源代碼可能包含敏感信息(電子郵件,銀行記錄等)就個人而言,我會完全避免這種情況,但如果您堅持這樣做,請確保您的代碼非常安全。 – Basic 2010-12-18 00:00:24