2
我有以下文本文件(您可以從here下載它)。Python - 用NLTK搜索文本
我試圖在文件中搜索詞language
。對於這一點,我有以下Python腳本:
import nltk
file = open('NLTK.txt', 'r')
read_file = file.read()
text = nltk.Text(read_file)
match = text.concordance('language')
print(match)
然而,當我運行程序時,我得到下面的輸出,雖然該文件包含單詞language
:
No matches
None
爲什麼不能節目找到這個詞language
如果它存在於文件中?
編輯1
我注意到,聲明text = nltk.Text(read_file)
回報:
<Text: T h i s i s ...>
感謝。
接受的答案是關於如何解決這個問題是正確的,但這裏的另一個忠告:不要打擾學習與'Text'類工作;它僅用於交互式探索和演示。直接進入'PlaintextCorpusReader'(和其對應的註釋格式)。 – alexis