我有一個遠程驅動器(如\遠程\位置)的大量(超過200k)的pdf文件。我必須從該目錄中讀取所有文件名並將文件名插入到數據庫中。Pentaho數據集成「獲取文件名」不加載大的文件列表
我試過「獲取文件名」的一步。但是它不會加載文件名,並且轉換立即停止。
我試過用較少數量的記錄在同一個遠程目錄中,但在一個子目錄中。它工作正常。
但是,當我嘗試所有文件(包括子目錄)它崩潰。出現內存不足的情況。 (Failed to execute runnable (java.lang.OutOfMemoryError: Java heap space))
有沒有一種方法可以處理每個1000個文件一次?
什麼都大小我給它超過1024米然後它給我的不能夠創建虛擬機的錯誤,所以我能爲此做什麼? –
buy more RAM; D – jipipayo
mine是8 GB ... –