2008-11-19 69 views
2

我正在開發一個Rails應用程序,它將訪問大量的RSS提要或抓取數據(主要是新聞)的網站。這將是Google新聞之類的東西,但採用不同的方法,因此我將存儲大量新聞(或新聞摘要),按不同類別對其進行分類,並使用排名和推薦技術。哪個是Rails應用程序的最佳數據庫?

  • 我應該用MySQL嗎?

  • 是否值得使用IBM DB2 purexml來存儲doucuments? 也不需要如果我選擇DB2,Ruby搜索實現 (Ferret,Ultrasphinx和其他) 。那是對的嗎?

  • PostreSQL在這方面有什麼優勢?

  • 在這種情況下使用Couch DB在 中有意義嗎?

我想選擇最佳選項,但不會使解決方案過於複雜。所以我放棄了使用兩種不同存儲解決方案的想法(一種用於新聞文檔,其他數據用於其他數據)。我也只考慮「免費」選項,所以我沒有看Oracle或MS SQL Server。

在此先感謝。

回答

3

purexml比SQL更重,所以您爲webserver和數據庫之間的往返支付更多。如果你打算有很多用戶,我會避免它,你最好讓你的Web服務器緩存請求,從而避免每次都創建xml(rss),如果這是你正在考慮的。

我會用MySQL,因爲它真的很擅長服務,它的完全免費,很好的PostgreSQL也是如此,但沒有使用它,所以我不能說。

CouchDB可能是有意義的,但是如果您計劃對數據進行OLAP(脫機分析),那麼正常的RDBMS會更好。

+0

我上次查看的時候,OLAP是在線分析處理的縮寫 – 2008-11-19 15:23:53

1

MySQL可能是最好的選擇之一;輕便,易於安裝和維護,多平臺和免費。最重要的是,有一些很好的免費客戶端工具。

需要思考的東西;由於系統的性質,您可能會有一些表格會非常快速地增長,因此您可能需要考慮性能。

因此,MySQL支持垂直分區,但只支持V 5.1。記住這一點。

乾杯,

雅各布。

0

這聽起來對我來說,你將構建的應用程序可以很容易地成爲一個大型的網絡應用程序。我建議PostgreSQL,因爲它的可靠性而聞名。

您可以查看以下鏈接 - MochiMedia的Bob Ippolito告訴我們爲什麼他們放棄了MySQL for PostgreSQL。雖然帖子已經超過3年了,但MySQL 5.1最近的問題往往證明它們仍然相關。

http://bob.pythonmac.org/archives/category/sql/mysql/

0

MySQL擅長生產。我還沒有使用PostgreSQL for rails,但它也是一個很好的解決方案。

在開發和測試環境中,我會從SQLite開始(默認),並且可能會在測試環境中遷移到目標數據庫,因爲您接近完成。

相關問題