我在這裏問的應該是相當普遍的,但我的意圖是找出最好的方法來做到這一點。正則表達式在使用Java的文件中搜索
- 我有一個目錄中的文件列表(如n) - 所有這些文件都有 已被分類分類。
- 我有一個包含正則表達式模式(比如m)的csv文件,我想在特定類型的所有文件中查找它們。
- 我想要有一個最終輸出,其中我列出了一個正則表達式模式,文件名, 行和行號。
以下是關於我應該如何處理這個我有幾個問題:
- 有沒有一種方法,我可以避開m * n個操作?
- 速度更快 - 在搜索所有正則表達式前,讀取文件,緩衝內容並將每行存儲在數組中,或者我應該採用正則表達式模式,逐行讀取文件並按照我解析的方式搜索,而不使用up內存?
- 我認爲讀/寫操作是最重要的 - 因此,我希望'n + 1'讀取(文件,csv),最後只需一次寫入。我的假設和方法是否正確?
- 陣列,列表,hashmaps,別的東西 - 任何建議什麼是完成任務的最佳方式?我認爲解析文件會是效率的關鍵嗎?
- 我可以使用哪些特殊的「不常見」Java API來顯着減少代碼?
我很感謝任何有關這個問題的見解/幫助。
。
http://stackoverflow.com/questions/6222659/java-grep-library,但是meh - 爲什麼不只是使用grep? – 2012-02-07 00:36:37