我正在嘗試使用NLTK工具包從文本消息中獲取提取地點,日期和時間。我剛剛安裝在我的機器上的工具包和我寫了這個快速片段來測試它:用於命名實體識別的NLTK
sentence = "Let's meet tomorrow at 9 pm";
tokens = nltk.word_tokenize(sentence)
pos_tags = nltk.pos_tag(tokens)
print nltk.ne_chunk(pos_tags, binary=True)
我是假設,這將確定日期(明天)和時間(晚上9點)。但是,令人驚訝的是它沒有認識到這一點。我得到以下結果,當我跑我上面的代碼:
(S (GPE Let/NNP) 's/POS meet/NN tomorrow/NN at/IN 9/CD pm/NN)
有人可以幫助我明白,如果我失去了一些東西或NLTK只是不夠成熟標記正確的時間和日期。謝謝!
實際上NLTK爲斯坦福的NERTagger提供了綁定('from nltk.tag.stanford import StanfordNERTagger')。你仍然需要下載java源代碼,但有很多幫助。 – Pithikos