我有一個以下格式的文件,記錄由換行符分隔,但有些記錄中有換行符,如下所示。我需要獲取每條記錄並分別處理它們。該文件的大小可以是幾Mb。如何使用Java基於正則表達式將文件分解爲令牌
<?aaaaa>
<?bbbb
bb>
<?cccccc>
我的代碼:
FileInputStream fs = new FileInputStream(FILE_PATH_NAME);
Scanner scanner = new Scanner(fs);
scanner.useDelimiter(Pattern.compile("<\\?"));
if (scanner.hasNext()) {
String line = scanner.next();
System.out.println(line);
}
scanner.close();
但我有開始時< \結果呢?刪除:
aaaaa>
bbbb
bb>
cccccc>
我知道掃描儀消耗任何匹配分隔符模式的輸入。我所能想到的是將分隔符模式重新添加到每條記錄中。
有沒有一種方法可以不刪除定界模式?
(笑)所以它! – DevilsHnd
我測試過它,它工作!非常感謝! – jlp
我測試了更多的記錄,這種方法在同一行上做了一些記錄。你能幫忙嗎? – jlp