我想問一個有點奇怪的問題。我有一個hadoop項目,我想比較hadoop和mysql的時間表現。我已經讓hadoop應用程序來計算一些東西。如果將該應用程序轉換爲SQL,該應用程序將成爲COUNT查詢並加入某個表如何使mysql運行速度比hadoop慢?
首先,我嘗試使用大約100.000條記錄在SQL上的小表,它查詢大約0,3或0.4秒。所以,我想複製並放大包含更多記錄的表,以查看hadoop的功能而不是mysql。重複數據我可以使hadoop比mysql更大?或者我可以做什麼來證明hadoop時間表現比mysql更好?
如果您不知道如何去實現這一目標,那麼您是否能夠理解並應用從實驗中獲得的信息? – symcbean