2014-02-25 27 views
0

我有相關的大文件(其中一些~7GB)的xml文件。我必須使用它們進行研究,但我不確定這個問題:保存Java對象或使用Xml文件

使用這個文件我必須創建java對象,並且在它們上面我將處理不同的假設。我有兩個選擇:

1.我將使用xml文件,並在運行時我將創建java對象,所以我將與他們合作。

2.或者我將創建它們並使用序列化保存java對象。但這也需要時間。

3.或另一種可能性,我不知道?

我不能確定哪一個比另一個好。

+1

等等,你需要什麼序列化?處理來自XML文件中的數據的結果? – fge

+0

這實際上取決於你需要什麼文件。將整個XML文件用於實例化一個對象嗎?如果是這樣,那麼序列化將是一個不好的計劃。 XML文件是否真的只是一堆「行」數據,其中可能會產生70億個小物件?另外,序列化和存儲這些可能是一個糟糕的主意。你真的會一次性對他們進行研究嗎?這裏有很多問題,其中的答案將導致您的「最佳」解決方案。 – jakebower

+0

這些文件包含用戶信息。我會序列化它們以及關於它們的其他統計信息,我將添加它們。我打算在學習和數據挖掘過程中使用它們。 – Asqan

回答

0

問題中沒有足夠的信息來完全回答,但每當我看到類似「我有7GB數據」的內容時,我想「將它存儲在數據庫中」。特別是在涉及統計和數據挖掘等事情時,正如您在評論中提到的那樣。

+0

但同樣,問題是:訪問數據庫並創建java對象比使用序列化保存java對象更好嗎?正如我所說,xml文件之間存在依賴關係,它們具有很大的尺寸,它使用戶的統計信息比如他們的帖子,視圖,偏好......並且有很多用戶。如果您需要任何額外的信息來改善您的答案,我可以回答。 – Asqan