我正在使用Pentaho數據集成創建從xlsx文件到mysql的轉換,但我無法從Excel 2007 xlsx(apache POI Straiming)
的大文件導入數據。它給了我內存不足的錯誤。從大文件中提取數據excel
0
A
回答
0
你試過這個選項嗎?
高級設置 - >通用模式 - >更少的內存消耗大的Excel(事件模式
(你需要檢查「讀的Excel2007文件格式」第一)
0
我會建議你增加JVM內存在默認情況下,pentaho數據集成又名水壺內存分配較低,這會導致運行涉及大型文件的ETL時出現問題,您需要修改-Xmx
值,以便指定較大的內存上限。蝙蝠
如果您在窗口中使用勺子並在下面的線條顯示中編輯spoon.bat。
if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xmx512m" "-XX:MaxPermSize=256m"
如果您正在使用廚房或平底鍋,請相應地編輯pan.bat或kitchen.bat。如果您在Linux中使用,請更改.sh文件。
相關問題
- 1. 從CSV文件中提取數據到一個excel文件
- 2. 從Excel數據庫中提取數據
- 3. 將數據從多個excel文件提取到excel 2007的單個excel文件
- 4. 如何從excel中的.msg文件中提取數據?
- 5. 從Excel文件中讀取數據
- 6. 從Excel文件中讀取數據
- 7. Selenium從Excel文件中讀取數據
- 8. 從文本文件中提取數據
- 9. 從文本文件中提取數據
- 10. 從文本文件中提取數據
- 11. 需要幫助從excel文件中提取數據
- 12. pdf從excel文件中提取數據集
- 13. 從Word和Excel文件中提取元數據?
- 14. VBA Excel:從CSV文件中以特定格式提取數據
- 15. 從excel文件中提取阿拉伯數據變成問號
- 16. 從extrenal excel文件中提取數據而不使用mysql
- 17. 從多個Word文件中提取選擇數據到Excel
- 18. 如何使用C#/ FileHelpers從Excel文件中提取數據ExcelNPOIStorage
- 19. 使用OPENPYXL從EXCEL文件中提取數據
- 20. 使用C++從excel文件中提取數據
- 21. 從Excel中查找和提取數據
- 22. 從excel中提取數據到matlab
- 23. 從Excel文件中提取數據並存儲在SQL Server數據庫中
- 24. 從Excel中的不確定範圍大小提取數據
- 25. 從大JSON提取數據
- 26. 從數據庫中提取文件
- 27. 從XML文件中提取數據
- 28. 從txt文件中提取數據
- 29. 從txt文件中提取數據
- 30. 從幾個文件中提取數據
我建議先將XLSX轉換爲CSV。將CSV分成10K個記錄。一次導入一個CSV文件。如果這導致問題,請將CSV分成1000個記錄,然後重試。我建議首先啓動該路線。 – zedfoxus
當POI流式傳輸與XLSX文件崩潰時,我已成功使用XLS文件。 – bolav
在訪問大文件時,Pentaho似乎耗盡內存。您需要通過編輯spoon.bat或spoon.sh文件來增加-Xmx的值來增加java內存的大小。查看[博客](https://anotherreeshu.wordpress.com/2014/11/27/memory-handling-in-pentaho-data-integration/) – Rishu