2009-11-01 98 views
0

RoR中的新手。我想開發一款Rails應用程序,它可以從我的Rails應用程序搜索航班信息,從各個航空公司網站(例如airasia和馬來西亞航空公司)獲取航班信息。將這些結果顯示在我的Rails應用程序中。
我的搜索模塊應包括下列文本框:Ruby on Rails上刮屏

From: Kuala Lumpur 
To: Dubai 
Departure Date:2/11/2009 
Return date: 19/11/2009 
Departure Time: 12:00 
Number of tickets: 2 

用戶得到根據對各航空公司的網站,信息和
顯示的結果輸入上述信息在我的網站和
腳本應搜索航班與哪些航空公司提供此航班的標籤。

既可以使用 「Scrapi」 或 「Scrubyt」

+4

你有一個具體的問題還是你想別人寫■所有適合你? – 2009-11-01 18:19:13

+0

我只想在hw上開始一條指南,但我不介意你是否可以爲我寫。 – hassan 2009-11-04 07:22:11

+0

雖然有些開發人員可能會因爲刮臉而皺眉,但是您的問題被低估的原因並不是因爲刮臉不好,而是因爲您似乎不知道自己在做什麼。您向我們展示純文本作爲示例。屏幕抓取涉及使用實際的html源代碼通過屬性和屬性值來選擇元素。您可以使用純文本來通知刮刮腳本,但其始終需要的不僅僅是這一點。 (「div」),屬性(「id」),值(「id = 3」),&/或text(「..」> sdfd「),研究watir-webdriver gem。 – 2013-04-11 01:09:29

回答

5

誰能提供一個援助?

不要。找到另一個致富快速方案。或者至少不要依靠屏幕抓取。

有太多的潛力出錯。找到另一種獲取信息彙總的方法。使用API​​(如果它們存在並將計劃存儲在數據庫中)(它們幾乎不會每週更改)。本地存儲東西可以讓客戶更快速地完成工作,同時還可以提供更多服務。

這裏只是一小部分與屏幕抓取潛在的問題:

  • 次要更新,你可以刮打破你的工具網站。
  • 從您的服務器IP上刮取企圖可能被拒絕。
  • 根據信息,你甚至可能會被起訴。
0

咳嗽的Watir-的webdriver(GEM)

的DOM不能掩蓋