我從一個服務中收集完整的HTML,這個服務提供對大量博客和新聞網站的訪問。我正在檢查HTML(實時)以查看它是否包含一些關鍵字。如果它包含其中一個關鍵字,我將HTML寫入一個文本文件進行存儲。Java文本文件大小(在文件關閉之前)
我想這樣做一個星期。所以我正在收集大量的數據。測試程序3分鐘產生100MB的文本文件。我有4TB的空間,我不能用這個以上。
另外,我不希望文本文件變得太大,因爲我認爲他們會成爲未打開。
我所建議是打開一個文本文件,並寫入HTML它,經常檢查其大小。如果它變得比200MB更大,我關閉文本文件並打開另一個文件。我還需要記錄總共使用了多少空間,以便我可以確保不會接近4 TB。
我在這一點上的問題是如何檢查的文本文件的大小的文件已經被關閉前(使用FileWriter.close())。有沒有這個功能,或者我應該計算寫入文件的字符數量並使用它來估計文件大小?
一個單獨的問題:是否有方法來減少我的文本文件佔用的空間量?我在Java工作。
一個單獨的問題應該是一個單獨的問題。 – beny23