2013-05-17 120 views

回答

3

它可能......但合法性是另一個問題。

如果搜索引擎使用GET的「另一個」網頁,那麼它的簡單(當然,使用POST也可以)。只需創建URL,在您的應用程序中加載它的內容,然後爲生成的HTML編寫解析器。有很大的可能性,結果將以穩定的方式形成(表格,divitis),所以它更容易。只需爲結果HTML(或其他類型)編寫簡單的正則表達式並從中獲取結果。

從搜索結果中挖掘這個「強力」數據的問題是,如果他們改變了他們的頁面,那麼你的應用程序就會「下地獄」。在我的應用程序中,我解決了使用extarnal配置文件,包括只更改搜索查詢和外部正則表達式的URL。

例子:

URL: http://www.example.com/search.php?query=[SEARCHED_DATA] 

文本[SEARCHED_DATA]是應用程序與whateever你正在尋找替代之內。

如果更改了頁面,則可以輕鬆地進行應用程序更新而無需重新構建應用程序。

一些頁面提供搜索API,這是更好的方法。但是從我的問題來看,我認爲事實並非如此。

+0

OP確實詢問過「是否有可能......」 –

+1

請在閱讀本文之前,請仔細閱讀您嘗試搜索的網站的條款和條件。大多數網站明確禁止這樣做。 –

+0

這是一個代碼測試,我的意思是,我參加了一個課程,要求我做一個技術測試。謝謝 – diminuta

3

最好的辦法是嘗試與提供某種API訪問其數據的網站集成。試圖從第三方網站抓取HTML會引起麻煩。

+3

法律和技術。 –

+2

如果法律問題得到解決,您仍然可以隨時更改其網站或佈局或網址格式,而不會有任何警告。這會破壞你的網站。 –

+0

@LeeMeador,我不建議在屏幕上刮屏幕...實際上我是在推薦它。 –

相關問題