0
我有一個arff
文件,其中包含700 entries
,每個42000+ features
用於NLP相關項目。現在格式是密集格式,但如果使用稀疏表示法,則條目可以大大減少。 我在core 2 duo machine with 2 GB RAM
上運行,並且我得到了memory out of range eception
,儘管將限制增加到了1536 MB。weka在一個大的arff數據集文件上運行
如果我將arff文件轉換爲稀疏表示,還是需要在更強大的機器上運行我的代碼,它會有什麼優勢嗎?