所以我一直在閱讀有關維基百科和許多powerpoint/pdfs中的CYK algorithm。 在維基百科中,有一部分我不是100%想說的東西。你們能爲我分解嗎? let the input be a string S consisting of n characters: a1 ... an.
let the grammar contain r nonterminal symbols R1
我已經在許多不同的算法(CYK和厄雷)絆倒檢查的字符串是否是其CFG設置在CFL的一部分。我正在尋找一些簡單易懂和實施的東西。我需要知道的是該字符串是否在CFG中。所述CFG是在 S->S1 S2
S1->S1 a | a
S2->S2 b | b
的溶液的形式通常給予應該接受的ε-轉變以及例如S1->一個| Ë 什麼想法?
我讀的是CYK algorithm,有一部分僞代碼我看不懂。整個僞代碼: let the input be a string S consisting of n characters: a1 ... an.
let the grammar contain r nonterminal symbols R1 ... Rr.
This grammar contains the subset Rs w
我對自然語言解析感興趣,並且已經編寫了Brill Part of Speech Tagger,並希望通過將其與基於語法規則的POS tagger相結合來增強它。有人知道任何地方英文的開源規則集文件?我特別感興趣的是與CYK(Cocke-Younger-Kasami)算法有關的任何事情,特別是C#。謝謝。
對於我創建的一種方法,我想在單詞末尾找到一個單詞,然後我想要將發現的單詞附加到左側(在行的開頭直到一個空格字符)到一個數組。 這是到目前爲止我的代碼: def ruleElements(factor):
# Creates list of RHS and LHS rule elements
results = []
# If RHS factor is found