2014-01-07 70 views
0

我想知道底層的所有數據庫/數據庫堆棧溢出組合使用什麼,管理各種縱向上的大量用戶配置文件信息。瞭解關於底層軟件基礎架構的stackoverflow

就像我和twitter以及facebook等社交網站一樣,大數據managemnet是通過hadoop完成的。堆棧溢出是否也可以處理更大量的數據?

如何索引信息,是redis的一部分stackoverflow解決方案?

瞭解部署在全球最受歡迎的技術論壇上的解決方案將非常有趣。

回答

1

本文提供什麼計算器的建築一瞥看起來像2011年3月大約:http://highscalability.com/blog/2011/3/3/stack-overflow-architecture-update-now-at-95-million-page-vi.html

在高層次上,它它採用MS SQL服務器數據庫,Redis的緩存,HAProxy的負載.NET應用程序平衡以及大量工具,並託管在Windows服務器和Linux服務器上(ubuntu + centos)。

看起來他們在那篇文章的時候沒有任何hadoop使用,但可能已經改變了。他們也可能爲map/reduce類型的工作做了不同的/定製的工作,或者可能根本不需要這樣的工具。精美的SQL服務器可以在不需要依賴「大數據」玩具的情況下進行擴展。如果您可以將大部分數據從緩存層中取出,則情況尤其如此。