2014-02-19 21 views
0

我有一個1360x92735 csv數據集,我必須使用FSelector包R(information.gain())來降低維度,但它需要大量內存。R與ff和FSelector包

我的問題是,我可以結合FSelector使用ff包嗎?如果是,如何?

p.s.我在Linux上有8GB的內存和8GB的交換空間。

謝謝。

[編輯]

我已經嘗試使用FF和FSelector包虹膜數據集。它似乎工作得很好,但現在我遇到了ff問題。

我的csv數據集是1303x92735,當我嘗試使用ff對象將數據框與as.ffdf()一起轉換,或者直接使用read.csv.ffdf()加載數據集時,R會以「寫入錯誤」 。

Here有人有同樣的問題,但我不明白如果達到解決方案或不。

謝謝。

+0

在stackoverflow的常規方式,以確保您的問題得到解答是嘗試一下,看看你卡在哪裏。 – jwijffels

+0

好的我試過了,但效果很差...... – user3329403

回答

0

該錯誤很可能是由於ff爲ff數據框中的每列打開了一個文件。對於打開文件的最大數量,您有92,735列可能比您的系統配置多得多。我已經回答了這個on SO here