2011-03-07 29 views
1

我想要一個使用NLTK和Python在給定句子或文本中標記習語的代碼。使用nltk和python的代碼

+5

我想讀這個問題。 – 2011-03-07 08:59:53

+7

如果你得到這個答案你的公司應該支付SO – Rafi 2011-03-07 09:06:18

+1

你的意思是詞性標註? – Joe 2011-03-08 14:41:00

回答

1

取決於「成語」的含義。喬對POS標籤的建議可能是一個好的開始 - 也許是你真正的追求。如果是這樣,請閱讀Bird等人的「用Python進行自然語言處理」。它由O'Reilly出版,但也可以通過Creative Commons許可在線獲得。這將使您開始使用POS標記。它也很好地回顧了NLTK的能力。例如,是否可以調整一些「命名實體識別」技術來做你想做的事情?或者你想要的東西太簡單了。我懷疑後者是這種情況(Rafi暗示),但你會在你的旅程中發現。也許你會在旅途中發展出新的東西,在這種情況下,我希望你回饋給NLTK社區。