解析器組合器：repsep是否允許回溯？

考慮例如解析器這樣的：我獲得以下錯誤解析器組合器：repsep是否允許回溯？

items: item1, item2, item3, item3, item4 
items: item2, item3, item3, item5, item4  
items: item4, item5, item6, item10  
items: item1, item2, item3 
exclude: item1 
exclude: item2

：

[5.5] failure: `items:' expected but `e' found 

     exclude: item1 

    ^

object TestParser extends RegexParsers { 
    override protected val whiteSpace = """[ \t]*""".r 

    def eol = """(\r?\n)+""".r 
    def item = "[a-zA-Z][a-zA-Z0-9-]*".r 
    def list = "items:" ~> rep1sep(item,",") 
    def constraints = "exclude:" ~> item 

    def itemsDefinition = (rep1sep(list, eol) ~ repsep(constraints,eol)) 
}

如果我嘗試解析該輸入（不含兩行包含排除的作品OK）

問題很明顯這條線：

def itemsDefinition = (rep1sep(list, eol) ~ repsep(constraints,eol))

它不起作用的原因是什麼。它跟回溯有什麼關係？我必須做些什麼才能使其發揮作用？

來源

2012-02-22 PrimosK

如果有人提出更好的問題標題請讓我知道。不知道它是否有道理.. – PrimosK 2012-02-22 15:24:41

您需要名單，而限制

(rep1sep(list, eol) <~ eol) ~ repsep(constraint,eol)

完成答案之間的EOL：

你的語法指定EOL作爲列表之間的分隔符，而不是一個終止符。它會接受一個輸入，其中第一個exclude出現在最後一個item3之後（帶有空格，但不是新行）。

解析器到達不需要的eol後，它會尋找items，並找到excludes。這給出了顯示的錯誤信息。然後，解析器確實會回溯到前一個新行。它認爲列表部分停在那裏的可能性，並尋找排除。但是，如果找到一個EOL來代替。因此，另一種可能的錯誤信息會"excludes expected, eol found"，在這種情況下，將有更多的幫助

當在語法選擇，沒有分支成功，解析器返回與最遠的位置，這是正常的錯誤正確的策略。假設你的文法允許"if"或"for"，輸入是"if !!!"。在if分支上，錯誤類似於"(" expected, "!" found。在for分支上，消息將是"for expected, if found"。顯然，第二個標記上出現的if分支的消息比第一個標記上的for分支的消息要好，而且根本不相關。

在分離器/終止的問題，你可以考慮：

分離器（;帕斯卡）：（在C ;）repsep(item, separator)
終止：rep(item <~ terminator)
靈活：repsep(item, separator) <~ separator?

最後一個將允許一個單獨的分隔符後沒有任何項目。如果這是不希望的，也許(rep1sep(item, separator) <~ separator?)?。

來源

2012-02-22 16:25:47

哇..太棒了！但是它以這種方式工作的原因是什麼？ – PrimosK 2012-02-22 16:42:07

我想是因爲「sep」在「列表」之間，而不是在每次重複之後。所以解析器不能「離開」第一個'rep1sep'，並且它在每個「eol」之後都需要一個「列表」。 – paradigmatic 2012-02-22 17:15:25

很好的回答！ TY – PrimosK 2012-02-22 19:22:03

解析器組合器：repsep是否允許回溯？

回答

相關問題