2014-01-19 28 views
0

我正在構建一個iPhone應用程序,因此我需要爲高中(和大學,如果他們有響鈴時間)獲得響鈴時間。
貝爾時代是時間的結束。示例:NorthvilleNovi高中iPhone應用程序的履帶式應用程序

所以我想知道如何抓取所有這些數據。我看到網上尋找,我可以應用上傳或包一個JSON每一個機構和存儲鐘的時間在3個實物期權

  • 抓取。 備份,這看起來效率非常低

  • 給客戶端一個搜索類型的接口,他們可以用它來查找,然後導入他們的鐘聲時間。所以我不得不設計那種功能,就像指向我們的鐘聲時間,甚至可能允許客戶端上傳圖片? 讓正則表達式來查找圖像/ PDF/HTML和OCR鍾時間進行文字識別

  • 讓它社區爲基礎的,所以你上傳的時間,然後當其他人開始選擇他們的機構X高中例如,模糊搜索返回社區術語

我喜歡選項2.所以我正在尋找一些關於如何編程Python的建議嗎? Objective-C的?然後如何獲取它 - 網絡爬蟲,基於社區,文本識別 - 以及您認爲我應該如何在應用程序中實現它。

回答

1

我認爲像你描述的那樣維護一個鐘形時間的大型數據庫的最好方法是將它保存在SQL數據庫(如MySQL)中的Web服務器上。這意味着您只需要維護數據庫的單個副本,這使得更新變得容易得多......而不必每次更新時都發布應用更新,您只需登錄到Web服務器並插入新數據即可。您可以輕鬆地創建一個應用程序,通過PHP腳本與您的Web服務器進行通信。 PHP腳本可以處理數據庫查詢並將信息傳輸到您的應用程序。這給你上面所有選項的最好的部分。

至於收集數據,有幾種方法可以做到這一點。你當然可以結合這些得到收集數據的最有效的方法:

  1. 手動輸入數據到數據庫
  2. 都有社區增加,很像SO或維基百科,對於那些還未上市的學校。當然,這可能會導致重複和虛假數據,但這對您來說會是最簡單的。您可以讓用戶將數據輸入到您的應用程序並將其上傳到您的Web服務器,或者您甚至可以在Web服務器上安裝網站組件以實現雙重功能。
  3. 聯繫學校管理員,讓他們輸入他們的鐘表時間表。這需要您進行一些市場營銷和溝通,但總體上會導致較少的工作和準確的數據。
  4. 編寫一個帶有文本/模式識別的網絡爬蟲。除非您在人工智能,數據庫挖掘和機器學習方面有豐富的經驗,否則我會避免這種情況。如果您沒有相關學位或沒有現場經驗,請查看前三個選項。

這裏有一些搜索條件,讓你開始:PHP,MySQL,虛擬主機,網頁服務器。

+0

謝謝你,我決定首先手動添加幾次到SQL數據庫,然後允許社區添加。 – AndrewSB

+0

祝你的項目好運! – user2105505