2011-11-14 79 views
2

我一直在嘗試不同的方法進行模式匹配,分析和預測時間序列數據。易於與Free Pascal集成的數據挖掘庫?

由於我沒有數據挖掘或相關領域的專業經驗,我從頭開始提出了自己的方法。

經過幾個月的零星瀏覽數據挖掘文章(我瞭解的幾個)之後,我意識到我的方法非常基礎。

例如,我實現模式匹配的方式是通過多維k-Nearest Neighbor方法。

我剛剛開始明白,我應該使用常用的技術,如決策樹,主成分分析,Covarience matricies等。

我一直在試驗RapidMiner,它是一個GUI數據挖掘工具。 RapidMiner允許您拖放各種複雜技術的實現,並將它們連接在一起而無需編寫一行代碼。這對我來說是一個很棒的學習工具。 它看起來像這樣:

RapidMiner

RapidMiner有一個API,但不幸的是在Java中,所有的我當前的代碼是免費帕斯卡和MySQL。

我正在尋找一些方法來RapidMiner融入我的應用程序,所以我可以通過RapidMiner GUI不同的數據處理方法進行實驗,並與我當前的代碼無縫地使用它們。

如果這樣做不可行,只要很容易集成到我當前的Free Pascal代碼中,我就會選擇另一個數據挖掘軟件包。

我看着成R - 這似乎正確的,但它似乎不容易與自由帕斯卡要麼整合。

爲了清楚起見,我的數據集是相當大(超過50萬行)和計算必須發生在實時。該軟件在Windows 7

回答

2

我不知道包運行,但一些常規選項:

  1. 試圖讓一個普通的C(本地DLL),從作者這個軟件。
  2. 使用JNI與調用API的Java程序進行通信。 Delphi和FPC JNI庫可用。