我選擇使用Apache Mahout作爲我的推薦引擎,但同時由於某些原因,如果我可以將數據存儲在SQL Server數據庫中,會更容易。 mahout可以與SQL Server連接而沒有任何問題嗎?我可以在Apache Mahout中使用SQL Server數據庫嗎?
該文檔說,它可以通過JDB驅動程序與其他數據庫引擎連接,但我看到所有文章,使用mysql的書籍以及支持的數據模型僅適用於mysql。
我選擇使用Apache Mahout作爲我的推薦引擎,但同時由於某些原因,如果我可以將數據存儲在SQL Server數據庫中,會更容易。 mahout可以與SQL Server連接而沒有任何問題嗎?我可以在Apache Mahout中使用SQL Server數據庫嗎?
該文檔說,它可以通過JDB驅動程序與其他數據庫引擎連接,但我看到所有文章,使用mysql的書籍以及支持的數據模型僅適用於mysql。
如何MySQL的轉換爲SQL Server數據庫:
這裏是JDBC驅動程序對於SQL服務器:
也有經由HDInsight使用亨利馬烏與天青Hadoop集羣衆多例如:
我剛剛開始與馬的實驗豪特。在將內存數據模型替換爲Mahout 0.9附帶的SQL92JDBCDataModel
或SQL92BooleanPrefJDBCDataModel
後,我設法運行了一些書籍示例。
我將SQLServerDataSource
的實例傳遞給這些數據模型的構造函數。該類包含在Microsoft JDBC Drivers for SQL Server包(我使用4.1版)中
但是,SQL92JDBCDataModel
文檔說明它「未針對性能進行優化」。
這個問題不是關於在Hadoop或HDinsight中使用Mahout,而是使用非Hadoop數據庫,它是像SQL Server一樣使用mysql的。 –
抱歉我的誤解 - 您的情況似乎是可能的,但超出了我的經驗。它絕對沒有文檔記錄,如果甚至可以工作,可能需要通過GenericJDBCDataModel進行簡化定製。我添加了幾種將mysql轉換爲sql server數據庫的方法。 –