我是nltk
的新手,我發現wordnet功能非常有用。它給出了synsets
,hypernyms
,等等。但是,它顯然沒有給出諸如'德里' - '海得拉巴'之類的位置之間的相似性,因爲這些詞不在詞網語料庫中。因此,我想知道,如果以某種方式,我可以更新字網絡語料庫,或者在不同的語料庫上創建字詞,例如,從維基百科中提取的與旅行相關的一組頁面?如果我們可以根據不同的語料庫創建wordnet,那麼格式是什麼,要採取相同的步驟,還有什麼限制?wordnet在不同的文本?
請你指點我描述上述問題的鏈接。我搜索了互聯網,Google搜索,閱讀了nltk書的部分內容,但是我沒有提及上述問題。
對不起,如果這個問題聽起來完全荒謬。
Check about - DBpedia – RAVI