我有來自OpenNLP的POS標記輸入...我需要使用這些與WordNet ...但wordnet只使用4個標籤 - 名詞,動詞,形容詞,副詞...在哪裏OpenNLP生成標籤基於 Penn treebank tagset。我需要將它們轉換爲與wordnet兼容的標籤...我在網站上發現了 this - 但它的所有python ..我需要java從樹庫標籤轉換爲Java中的wordnet兼容標籤?
同意我可以自己寫一個簡單的函數來重命名這些標籤..但是如何處理像DT,PP,PDT,POS,MD等其他標籤...
我說過這一切都在我的問題..當然,我可以手動映射,然後編寫一個函數...但不會影響我的應用程序?我正在嘗試從wordnet中提取同義詞?對於在映射過程中使用空標籤的單詞我會做什麼操作?我將如何處理這些非wordnet標籤?這是主要的問題... – 2011-04-18 20:10:49
你的應用程序是什麼?從WordNet中提取同義詞通常不是最終目標。例如,您想爲「an」找到什麼樣的映射?我沒有任何東西可以接近WordNet的專家,但我不希望找到「an」,「the」,「of」等反義詞的同義詞。同義詞和反義詞的概念沒有多大意義爲封閉的話語。 – AaronD 2011-04-18 20:18:07
提取文本摘要的synsets是我的應用程序.. – 2011-04-19 03:31:37