這不是一個直接編程相關的問題,而是關於選擇正確的數據挖掘算法。建議這種情況的數據挖掘算法
我有一些文件夾假設100個文件夾,這些文件夾的內容是圖像和文本文件,我有這些文件夾的excel表(100表),這意味着每個文件夾都有特定的表格,這個excel表格內容如下:
在標題(列標題)中包含此文件夾的內容,並且行包含我將檢查的文件(我的測試文件)此表中的值是o和1的文件,如果在該文件夾中找到該文件,則值爲1否則O,這些測試文件名相同的所有文件夾,
問:什麼是最好的數據挖掘算法可以在Excel文件表工作,可以羣集這些文件夾淺編輯測試文件內容,例如羣集1包含文件夾,其中包含文件1和文件20以及文件25 ..等等..考慮使用matlab語言?
感謝...