0
我用WEKA工作,並添加其他分類Rocchio未在Weka中目前支持的需要。我想知道是否有任何方法可以在java中爲Rocchio編寫代碼並使用weka的文檔預處理功能?有沒有像Weka.jar(Java)的文本文件索引的matlab的庫文件?
我已經在MATLAB編碼Rocchio那麼有沒有像weka.jar(JAVA)的MATLAB從而能緩解我的文檔預處理和向量生成的工作從文本文檔任何圖書館?
最初我以爲使用文本文檔來使用RapidMiner或Weka進行單詞向量轉換,然後對這些向量進行編碼和操作以對它們進行分類,但是從這些工具生成的訓練數據向量和測試數據向量具有不同的詞彙維度。總之我想避免這種整體的文檔預處理&轉化爲向量的過程,並希望利用我的時間在分類文檔。