2011-05-14 41 views
2

我目前正在研究解析包含歐洲基金會數據的網站。PHP簡單的HTML DOM或Python-BSoup:哪一種更簡單?

http://www.foundationfinder.ch/其中有790個基礎的數據集。所有數據都可以免費使用 - 版權不受限制。

目標是什麼:我想解析數據並將其保存在本地:爲了更好的檢索和更方便的使用方式:也許可以將它存儲到Calc /或甚至更好的MySQL數據庫。

問題:用Perl解析HTML的最簡單方法是什麼 我應該使用LWP還是機械化:哪一種更簡單?

有些朋友告訴我試用Python!美麗的湯。我想到了一個Perl LWP或Python美麗湯的方法。其他解決此類網站的方法我無法看到。好的,有一種方法 - 使用PHP。當然,不知何故我們可以使用PHP(和Curl)

哪種方法最好。 Perl與LWP或機械化?或者Python的...?

除了語言的問題:任何人都可以在第一步幫助我。 - 幫助走上賽道!?我期待着聽到您

問候 零

+1

以下哪種語言最流利?絕對而言,Perl可能是最適合這項任務的情況,但如果您最適合使用PHP,那麼這最終會更加重要。 – Schwartzie 2011-05-14 13:26:56

+1

如果你對PHP很好,我建議使用帶有XPath的PHP DOM類。這很容易。 – Thai 2011-05-14 13:36:40

+0

Hi Schwartzie,你好泰國 - 非常感謝你的快速回答。我對PHP有點熟悉 - 所以我想我必須去PHP方式。這些想法很好,但我不知道我可以自己做所有的工作。泰語 - 你可以用一些片段來支持一下,看看如何使用PHP做這件事來加快速度!?我喜歡聽到你的回覆 – zero 2011-05-14 13:46:48

回答

1

我的兩分錢的是,你必須根據你知道最好的語言選擇。如果是我,我會使用Python,它有很多庫和工具,並且會像幾個小時的工作。

但是,如果你對Perl或PHP很好,你必須選擇其中一種語言。大多數腳本語言都有可以完成任務的庫。

+0

thx回答 - 好吧,php似乎是這裏最熟悉的東西。猜猜整個事情正在我的腦海中蔓延。我會嘗試做我能做的......再次,thx Ramdaz回答如此之快的想法和建議 – zero 2011-05-14 13:49:34

1

你擅長哪一方面? PHP還是Python?當涉及到這種事情時,肯定會有比討論更多的東西,但我們不會去那樣做。去選擇你更熟悉的那個。人們可以說Perl甚至Python或PHP,但每個人都有自己的優勢。最後你會成爲編碼的編碼器,所以你需要更好地瞭解它。

+0

thx ...我嘗試去/去php的方式......任何人想要給一些幫助的手... – zero 2011-05-14 13:48:01