我一直在嘗試不同的方法進行模式匹配,分析和預測時間序列數據。易於與Free Pascal集成的數據挖掘庫?
由於我沒有數據挖掘或相關領域的專業經驗,我從頭開始提出了自己的方法。
經過幾個月的零星瀏覽數據挖掘文章(我瞭解的幾個)之後,我意識到我的方法非常基礎。
例如,我實現模式匹配的方式是通過多維k-Nearest Neighbor方法。
我剛剛開始明白,我應該使用常用的技術,如決策樹,主成分分析,Covarience matricies等。
我一直在試驗RapidMiner,它是一個GUI數據挖掘工具。 RapidMiner允許您拖放各種複雜技術的實現,並將它們連接在一起而無需編寫一行代碼。這對我來說是一個很棒的學習工具。 它看起來像這樣:
RapidMiner有一個API,但不幸的是在Java中,所有的我當前的代碼是免費帕斯卡和MySQL。
我正在尋找一些方法來RapidMiner融入我的應用程序,所以我可以通過RapidMiner GUI不同的數據處理方法進行實驗,並與我當前的代碼無縫地使用它們。
如果這樣做不可行,只要很容易集成到我當前的Free Pascal代碼中,我就會選擇另一個數據挖掘軟件包。
我看着成R - 這似乎正確的,但它似乎不容易與自由帕斯卡要麼整合。
爲了清楚起見,我的數據集是相當大(超過50萬行)和計算必須發生在實時。該軟件在Windows 7