2014-03-29 163 views
0

我在一家小型醫療保健相關辦公室工作,我們經常需要查詢醫生的執照和其他相關官方號碼。我們使用免費且可供公衆使用的網站。我一直致力於找出一種方法來輸入醫生的名字,然後將所有網站的結果返回到單個條目中,以減少瀏覽每個網站的時間。我熟悉的JavaScript,PHP和紅寶石,但絕不是專家。我的問題是,我應該從哪裏開始?我不需要任何人爲我或任何其他人編寫代碼,但似乎無法爲谷歌提供正確的問題以獲得一些答案。我相當確信這是可能的,只是不知道從哪裏開始發展我的想法。任何幫助,將不勝感激。從第三方網站提取數據

回答

1

這聽起來像你需要做一些屏幕抓取,可能會或可能不會被通過的條款和網站的條件,你使用合法的 - 你應該首先檢查。

如果沒有自動檢索和查詢任何限制,你會希望PHP的捲曲模塊上讀了起來,並模擬是當你手動查詢網站進行形式操作。您可以使用瀏覽器的開發人員控制檯查看運行查詢時調用哪些腳本和頁面 - 這比從頁面源中解析出來要快得多。

您將從頁面中獲取HTML,您需要解析這些HTML。根據頁面上的格式,一些簡單的正則表達式可能會起作用,但您可能需要爲您查詢的每個網站定製它們。

再次,請仔細檢查您所使用的網站允許您運行腳本查詢 - 如果您有任何疑問的時候,你應該給他們發電子郵件,解釋你打算做什麼,並詢問他們是否確定用它。

+0

非常感謝您的及時回覆。聽起來完全像我需要開始。 – Slicktopher

+0

沒問題。我剛剛意識到,我忘記了建議其中的一些站點可能會公開一個API供您查詢 - 這幾乎可以肯定會爲您節省一些時間來刮取內容。 –