2016-10-31 28 views
1

我最近開始使用來自UMass的Mallet。我期待看看是否有一種方法可以通過命令刪除前綴/後綴和收縮,就像stop-words有命令一樣,但是我沒有找到任何有關它的信息。如果Mallet可以做到這一點,有人可以指引我正確的方向。如果它不能,但還有其他的東西可以做到這一點,你能指出我的方向嗎?有沒有辦法刪除Mallet中的前綴/後綴和收縮

在此先感謝!

回答

0

在運行Mallet之前,您可以對您的語料庫進行一些計算語言預處理(例如,詞幹化或變體化)。

我沒有意識到在Mallet內部執行此操作的方法(並且它非常依賴語言)。也許你可以寫一個輸入過濾器,但是我會把它放在Mallet外面。