0
儘管關於如何從文檔中提取關鍵字/短語的信息很多,但我無法找到關於如何從片段(不一定是句子)中提取關鍵短語的技術。下面是一些例子:從短片段中提取關鍵短語
- 藝術博物館和中國美術館 - >博物館和畫廊海軍
- 戰役的日俄戰爭 - >海戰,該日俄戰爭
一可以建議簡單地使用NLP工具包並解析樹並提取名詞短語。我想知道有沒有更好的方法。
儘管關於如何從文檔中提取關鍵字/短語的信息很多,但我無法找到關於如何從片段(不一定是句子)中提取關鍵短語的技術。下面是一些例子:從短片段中提取關鍵短語
一可以建議簡單地使用NLP工具包並解析樹並提取名詞短語。我想知道有沒有更好的方法。
該方法取決於您想要提取什麼樣的短語或關鍵字。
如果短語的類型定義得很好,最好的方法可能是解析片段,然後用一些規則從解析樹中提取。只要片段是適當的英文,解析器應該以與完整句子相同的質量來處理它們。
更一般地說,您也可以將此問題作爲機器學習問題來處理。如果您有足夠的數據,即碎片對和應該提取的內容,則可以使用它來訓練模型。常見的方法將是
在NLP文獻中,您可以查找句子壓縮/彙總。最近首次提出上述第二種方法的論文是: