2011-10-10 45 views
3

我有很多大的純文本文件,我希望用perl解析。每個文檔都有大部分英文段落,每個文檔中有幾個純文本標記了表格。我應該使用Parse :: RecDescent還是Regexp :: Grammars從文檔中提取表格?

我已經創建了一個語法來描述表結構,但我不確定是否最好使用Parse :: RecDescent或Regexp :: Grammars來提取表。

我最初傾向於Parse :: RecDescent,但是我不確定在語法中如何處理90%的文檔文本我想忽略,以便找到我想要的幾個表格提取埋入每個文件內。

也許我需要Regexp :: Grammars,所以我可以通過文檔「拉」我的表達式,直到它找到匹配?

感謝

回答

1

正則表達式語法::什麼是我想要的,因爲它可以讓你通過文檔拉你的語法,並找到像正則表達式匹配。 Parse :: RecDescent似乎不適合掃描文檔並僅查找與語法匹配的文本。

相關問題