2017-09-20 62 views
1

你好。R,有沒有什麼方法可以通過使用多個內核來創建termdocumentmatrix?

是否有任何方式通過使用多核,並行處理來創建termdocumentmatrix?或者爲了獲得更快的結果,我可以使用一些軟件包,比如parallel,h2o或其他軟件包嗎?

有人幫我。 謝謝。

+0

查看** quanteda **包。它在分裂和散列令牌方面做了一些並行處理,雖然DFM構造目前並不是並行化的,但其他許多功能都是。 (而dfm的建設速度仍然非常快。) –

+0

謝謝你的回答。我會嘗試。 –

回答

0

嗯。我在下面的鏈接中發現了非常好的信息。

how to read and write TermDocumentMatrix in r?

,當我使用的並行和TM封裝, 我必須設置我的變量,函數庫,像下面。 (如果沒有,會出現錯誤。)


clusterExport(CL,列表( 「josa1」, 「josa2」, 「josa3」, 「josa4」))#爲變量,函數

clusterEvalQ( cl,library(stringr))#for libraries


It works。 謝謝。

相關問題