0
我試圖在R約40000行的數據集上運行stemmer函數(通過data.table包上傳),但它需要永久運行。我的代碼如下所示:R中的Stemmer函數慢
data[, Description := map(Description, function(k) stemmer(k))]
如果手動停止的過程中,它顯示超過50級的警告爲: Image Link
是否有更快的運行它的替代品。我的電腦有8Gb內存。
詞幹一般需要很長的時間,你檢查的時間差爲辦刊說10點的記錄? –
是的,它在10行上運行速度更快,但替代方案是什麼,我如何處理整個數據? –
嘗試批量運行,stemmer確實需要花費大量時間來使用大型數據集。你試過了嗎? –