2014-04-28 69 views
1

所以基本上我使用的是42matter的google market API來檢索我的網站的應用信息,但是在我發現免費版本只允許500個請求/天並且僅用於非商業用途開發我自己的API。就像任何開發者,我做了一些R & D,發現了關於scraping和simpleHTML DOM解析器,我使用它併成功地完成了我的需求。但是現在,我遇到了一個主要問題,42matter的api超快,我調用了API,並且在我的DOM上很快獲得了信息(在2秒內),但是我的api速度很慢,它正在處理相同的請求8或10秒,這在頁面上看起來很慢並且不吸引人。使用simpleHTMLDOM提高數據抓取的響應時間

我試圖刪除開銷,只找到我需要的部分,時間還是很消耗很多

代碼如下:

include('../common/simple_html_dom.php'); 

$appPackageName = $_REQUEST['appPackageName']; 

header('Content-Type: application/json'); 

$html = file_get_html('https://play.google.com/store/apps/details?id='.$appPackageName.''); 

foreach($html->find('div.id-app-orig-desc') as $e){ 

    $description = $e->innertext; 
} 

$appInfo['description'] = $description; 

echo json_encode($appInfo); 

請,如果有人知道盡快告訴我儘可能

+0

來人是這樣一個先進的話題.... –

回答

1

通用HTML解析器必須處理完整的html代碼。我發現2秒的響應時間並不快。如果您只是從給定的html-doc中尋找信息的微小提取,只需使用舊的str_pos和substr。這要求您在讀取的html中找到一些獨特的標記,然後在php中實現一個流程循環。實際上,有時靜態偏移量或2至3級標記遞歸可以做好工作。