我有一個具有以下結構的日誌文件。以Java解析日誌文件的庫
unstructured raw text
unstructured raw text
..
..
..
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<message>
...
...
</message>
unstructured raw text
..
..
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<message>
...
...
</message>
unstructured raw text
..
..
正如你所看到的,在單個日誌文件中嵌入了多個XML文檔。我想知道是否有一個通用實用程序或庫可以在我開始寫自己的東西之前在這裏重用。我需要它在Java中。
謝謝。
該設計將使你的生活比它所需要的要難得多。如果你想使用XML和XML工具鏈,那麼你應該接受它。停止在頂層嵌入原始文本,而是使整個文件成爲單個XML文檔。它會使你的解析生活變得更加容易。 –
@Hank - 我沒有寫這個文件。我從另一個系統獲取文件。我需要解析它並使用我係統中XML節點內的一些信息。 –
在這種情況下,祝你好運。你基本上會被卡住做一些醜陋的黑客手段:尋找''線,然後備份,直到你找到最後的結束標記,並刪除/忽略這兩個點之間的一切;之類的東西。老實說,如果有*任何*方式,你可以讓他們修復上游的文件格式,這將使你的工作更容易。 –