如果已經回答了這個問題,我表示歉意,但我似乎無法找到描述此過程的頁面。我想要做的是採取一個大文件(紐約時報語料庫),使用分割功能將其更改爲單詞列表,然後搜索特定單詞的長列表。我已經能夠得到蟒蛇打印的文件,此代碼在Python中的大文件中操縱和搜索
words=open('nyt.txt')
for line in words:
print (line)
,但我希望能夠在這個函數中使用words.split()之後。
到目前爲止,我一直在使用一個小的語料庫,我只需鍵入像這樣
words= ('A B. C D E F G A. B C D E F G A B C D E F G A B C D E F G')
但是,而不是複製並粘貼到紐約時報括號開發程序(這不起作用,該文件太大)。我寧願讓它將文件編入變量名稱。
再次,我很抱歉,如果這已經被問及和答覆之前,可能。
我不完全確定它是否重要,以便逐行閱讀。我正在尋找的是它的代碼設置,以便打印(單詞),它會打印有問題的文件。 – 2011-02-15 19:07:27