我需要爲我的項目標記C++文件。爲此,我使用tokenize.generate_tokens。在每行中,由於'\ r',我得到一個奇怪的字符,並將其解析爲一個標記。我需要避免那個角色來計算令牌。當我將文件傳遞給標記化時,我不知道該怎麼做。下面是我的代碼我使用:在Python中標記化C++程序
f = open("BM1A1.cpp","r")
g = tokenize.generate_tokens(f.readline)
我試過帶(),但給給錯誤
g = tokenize.generate_tokens(f.readline.strip())
error:
'builtin_function_or_method' object has no attribute 'strip'
這不是您現在正在討論的問題,但您稍後會發現'tokenize.generate_tokens'用於Python源代碼,而不是C++源代碼。 – orlp
可能要查看[此鏈接](http://eli.thegreenplace.net/2011/07/03/parsing-c-in-python-with-clang)。 –