我正在解析像「CS 2110或INFO 3300」這樣的句子。我想輸出像格式:PyParsing:並非所有的令牌傳遞給setParseAction()
[[("CS" 2110)], [("INFO", 3300)]]
要做到這一點,我想我可以用setParseAction()
。然而,在statementParse()
的print
陳述表明,只有最後一個令牌實際傳遞:
>>> statement.parseString("CS 2110 or INFO 3300")
Match [{Suppress:("or") Re:('[A-Z]{2,}') Re:('[0-9]{4}')}] at loc 7(1,8)
string CS 2110 or INFO 3300
loc: 7
tokens: ['INFO', 3300]
Matched [{Suppress:("or") Re:('[A-Z]{2,}') Re:('[0-9]{4}')}] -> ['INFO', 3300]
(['CS', 2110, 'INFO', 3300], {'Course': [(2110, 1), (3300, 3)], 'DeptCode': [('CS', 0), ('INFO', 2)]})
我希望所有的令牌傳遞,但它只是['INFO', 3300]
。難道我做錯了什麼?還是有另一種方法可以產生所需的輸出?
這裏是pyparsing代碼:(!你只在Optional
設置)
from pyparsing import *
def statementParse(str, location, tokens):
print "string %s" % str
print "loc: %s " % location
print "tokens: %s" % tokens
DEPT_CODE = Regex(r'[A-Z]{2,}').setResultsName("DeptCode")
COURSE_NUMBER = Regex(r'[0-9]{4}').setResultsName("CourseNumber")
OR_CONJ = Suppress("or")
COURSE_NUMBER.setParseAction(lambda s, l, toks : int(toks[0]))
course = DEPT_CODE + COURSE_NUMBER.setResultsName("Course")
statement = course + Optional(OR_CONJ + course).setParseAction(statementParse).setDebug()
呀,「正面充電」是描述我在做什麼的一種很好的方式。感謝指向維基上的例子的指針。 – 2010-05-31 01:28:11