我有一組以下形式的單詞。 (journalistic (((journalism:stem)ist:suffix)ic:suffix)
)。我試圖解析爲以下形式m解析文本文件
root- journalistic
stem suffix suffix
stem - journalism
suffix -ic
suffix -ic
的代碼,我使用 從itertools導入takewhile
is_tab = '\('.__eq__
def build_tree(lines):
lines = iter(lines)
stack = []
for line in lines:
indent = len(list(takewhile(is_tab, line)))
stack[indent:] = [line.lstrip()]
print (stack)
source = '''
(journalistic (((journalism:stem)ist:suffix)ic:suffix))'''
build_tree(source.split('\n'))
它產生的輸出:
['']
['(journalistic (((journalism:stem)ist:suffix)ic:suffix))']
的代碼沒有細分單詞序列。 任何代碼修復?
您的代碼不足以解析字符串下面的表格。 –