哪種方法可以最好地保存使用casperjs拆分網頁時獲取的表數據?使用casperjs保存拆分網頁時獲取的表數據
使用json對象並在序列化後將其存儲爲文件。
使用ajax請求到PHP,然後將其存儲在MySQL數據庫。
哪種方法可以最好地保存使用casperjs拆分網頁時獲取的表數據?使用casperjs保存拆分網頁時獲取的表數據
使用json對象並在序列化後將其存儲爲文件。
使用ajax請求到PHP,然後將其存儲在MySQL數據庫。
爲了簡單起見,查看CasperJS作爲一種方法來獲取數據&在另一種語言後處理。我會選擇#1選項 - 以JSON格式獲取數據,並將其保存到文件中以便稍後執行。
要做到這一點,您可以使用PhantomJS提供的File System API。您也可以將它與CasperJS's cli interface耦合以允許您將參數傳遞到腳本中(例如,要寫入的臨時文件)。
你的腳本來處理這一切看起來像:
mktemp
)臨時文件的路徑。我只是用第二種情況:
第一:獲得存儲在globalInfo變量的信息
var globalInfo;
casper.thenOpen("www.targetpage.cl/valuableInfo", function() {
globalInfo = this.evaluate(function(){
var domInfo = {};
domInfo.title = "this is the info";
domInfo.body = "scrap in the dom for info";
return domInfo;
});
});
二:訪問的網頁存儲所捕獲的數據
casper.then(function(){
casper.thenOpen("www.mipage.com/saveIntheDBonPost.php", {
method: 'post',
data:{
'title': ''+globalInfo.title,
'body': ''+globalInfo.body
}
});
});
www.mipage.com/saveIntheDBonPost.php
取參數$_POST
中的數據並將其存儲到數據庫。