2012-03-05 58 views
-3

http://www.eyecinema.ie/cinemas/home.asp?ci=2&ln=1如何解析來自任何網站的信息?

我想從這個網站得到的所有電影的電影放映時間...我的問題不只是這個網站,但我用這個作爲一個例子。

我已經做了一些xml解析,並設法創建一個RSS閱讀器,它已經在市場上了,但現在我正在嘗試創建一個新的應用程序,但是我的問題是,我希望能夠從任何網站上刮取信息瞭解特定信息。比如從上面網站上看電影的時候...

我該怎麼去做這個? 任何幫助,將不勝感激,大大。

+4

您可能想閱讀該網站的條款和條件。特別是第1項中明確規定您不得這樣做:http://www.eyecinema.ie/cinemas/terms_and_conditions.asp?SessionID=5F1A6AC768514ED88334EB973D079DBF&cn=1&ci=2&ln=1 – NotMe 2012-03-05 00:26:23

+0

此外:MOST網站有類似的條款。如果您這樣做,特別是爲了將這些信息彙總到您在市場上提供的應用程序中,那麼您就面臨着一些嚴重的法律問題。這是你的問題的一個側面問題,但是在你入獄之前你確實需要探索一個問題。 – NotMe 2012-03-05 00:29:38

+0

哦,從來沒有想過有關版權問題。感謝您的評論。窗外有我的應用程序想法。然而,我仍然想知道你會如何做到這一點。不是這個網站,但一些這樣的Eclipse.org,據我所知是開源... – UserBruiser 2012-03-05 00:46:47

回答

2

沒有魔法彈。每個網站可能都有一種將所需信息格式化爲HTML的獨特方式,並且您必須爲每個網站編寫獨特的解析器。有時,每個網站都會在沒有任何警告的情況下更改其格式,然後您必須撲滅火災並重寫該網站的解析器。