1
我參加this Kaggle competition,我不知道是否有人在河如何避免R中的LSA包textmatrix功能錯誤
基本上與textmatrix功能的熟悉從LSA package ,textmatrix函數接受一個目錄作爲參數,它將使用指定目錄內的所有文本文件創建一個文本矩陣。
不幸的是,文本文件函數在遇到包含零項的文本文件時會發出錯誤(例如,如果您使用停用詞進行篩選,則會發生此錯誤)。
有誰知道一個簡單的方法有textmatrix 忽略文件結束了零項條款?或者用相對快速的方法來識別和刪除這些文件?
TIA!