我的程序接收大型CSV文件並將它們轉換爲XML文件。爲了獲得更好的性能,我想將這些文件分成幾行(例如)500行。什麼是可用於拆分文本文件的Java庫?Java中的文本文件拆分庫
1
A
回答
2
你打算如何處理這些數據?
如果它只是通過記錄處理進行記錄,那麼面向事件(SAX或StaX)解析就會成爲現實。對於記錄處理記錄,現有的「管道」工具包可能適用。
您可以使用分隔符功能(如this one或this Splitter.java)預處理您的文件。
4
我不明白你會通過將CSV文件分成更小的文件獲得什麼?使用Java,您可以隨時閱讀和處理文件,您不必一次全部讀取它...
0
一旦文件被拆分後,您打算如何分配工作?
我在一個名爲GridGain的框架上做了類似的事情 - 這是一個網格計算框架,它允許您在網格計算機上執行任務。
然後,您可以使用緩存提供程序(如JBoss Cache)將文件分發到多個節點,指定開始和結束行號和進程。這在下面的GridGain示例中進行了概述:http://www.gridgainsystems.com/wiki/display/GG15UG/Affinity+MapReduce+with+JBoss+Cache
或者,您可以查看類似Hadoop和Hadoop文件系統的文件,以在不同節點之間移動文件。
通過將文件加載到緩存中,然後通過單獨的線程分配要處理的文件的某些「塊」,可以在本地計算機上完成相同的概念。網格計算實際上只是針對真正的大問題,或者爲解決方案透明地提供某種級別的可伸縮性。您可能需要注意IO瓶頸和鎖,但是在分割文件之後分派「作業」的簡單線程池可以工作。
相關問題
- 1. 讀和拆分的文本文件(JAVA)
- 2. 用於將文本拆分爲較小文件的Java庫
- 3. 在文本文件中拆分文本
- 4. 的Java:拆分文本
- 5. 拆分文本文件
- 6. 拆分文本文件
- 7. 拆分文本文件中的R
- 8. 基於Java中字符串的拆分文本文件
- 9. 拆分CSV文件爲文本文件
- 10. Java拆分XML文件
- 11. java拆分源文件
- 12. 在ruby中拆分文本文件
- 13. 從文件中拆分文本
- 14. 在文本文件中拆分列
- 15. 在Python中拆分文本文件
- 16. 在Android中拆分文本文件
- 17. 在一個目錄中拆分多個文本文件java
- 18. 拆分文本
- 19. 拆分文本
- 20. 拆分文本
- 21. 拆分文本
- 22. 蟒蛇numpy的文本文件拆分
- 23. VB.NET拆分文本文件在零件
- 24. 在輸入數據庫時在文本框中拆分文本
- 25. 將文本文件拆分爲XML
- 26. Python - 拆分整個文本文件
- 27. Android讀取文本文件和拆分
- 28. 智能拆分大文本文件
- 29. 拆分arraylist和文本文件
- 30. 從文本文件拆分單詞
我使用商業B2B翻譯SW將CSV文件轉換爲XML,並且此SW不能很好地處理大文件... – Otavio 2008-11-26 22:59:51