轉達我有,我想提取那些表達以下語義的句子的集合:NLP:特定的語義確定是否在一個句子
我喜歡意大利美食。
這樣一個句子的結構和措辭有很多不同。一些例子:
- 我喜歡意大利,中國和印度的食物。
- 我喜歡的美食有中國,意大利和印度。
- 我喜歡的一些美食包括印度,意大利和中國。
- 我喜歡世界各地的各種美食,如意大利,中國和印度。
解決此問題的好方法是什麼?
我不是NLP的專家。這裏只是一些我能想到的:
- 找同義詞「喜歡」和「美食」 使用解析器(斯坦福或Parsey McParseface)
- 修剪的依賴關係樹句子
- 構建依賴樹只包括主語(如'I'),動詞關鍵詞(如'like'),名詞關鍵詞(如'food')和名詞修飾語(如'Italian')。這可以通過找到覆蓋樹中所有這些節點的路徑來完成。
- 存儲訓練語句的依賴樹的集合。如果測試句子的依賴關係樹在訓練中存在
- 檢查
任何意見,建議和/或意見,將不勝感激!
這是一個關係抽取任務,並且所有的nlp任務都不容易。斯坦福CoreNLP有一個關係提取模塊。看看你是否可以使用它或訓練你的數據。 –