0
我一直在努力使用Mahout中提供的SparseVectorsFromSequenceFiles
,RowIdJob
和RowSimilarityJob
Hadoop作業,其運行地圖進行潛在語義分析/ Reduce作業。我一直在試圖爲這些在內存中運行的功能找到一個等效的實現,無論是在單個線程中,還是在多個線程中。是否有對SparseVectorsFromSequenceFiles的內存執行,RowIdJob和RowSimilarityJob工作
有這樣的事嗎?