2011-01-19 57 views
4

我要找的示例實現廣義序貫模式算法(GSP)http://en.wikipedia.org/wiki/GSP_Algorithm廣義序貫模式算法的MapReduce

雖然維基百科的文章提供的僞代碼,它有點混亂,我希望看到一些正確的代碼(理想的是python或java)。有誰知道一個很好的參考?

我想先理解算法,然後可能使其在MapReduce世界中工作 - 這正如維基百科文章所示,使用計數器我認爲可能很複雜。

我這樣做是因爲我有一個事件圖,其中邊緣受時間約束,一個序列將是一個節點連接到另一個節點,其中A→B在開始和結束時間之間發生,B - > C在B完成第一次連接後X時間發生。 A→B→C將是序列,一個序列不能再次訪問一個節點。

回答

1

如果你想爲GSP,的PrefixSpan,鏟,垃圾郵件和許多其他一些Java代碼,看看這個網站:http://www.philippe-fournier-viger.com/spmf/

然後,你可以檢查,如果你可以將它們改編成的map-reduce算法。

1

SPMF是一個很好的工具,它實現了許多算法。 它可以幫助我們節省很多時間。 但是我們需要比較不同算法的性能,例如通用序列模式(GSP),這是序列模式挖掘中的一個重要算法。