我一直在研究一個項目,要求我根據產品的描述給出關鍵字/關鍵詞建議。關鍵字建議算法
我目前擁有的產品:產品描述,產品類別(可能有可能不存在)。
我想要什麼:機器生成的關鍵字/基於描述的關鍵字句。
我做了什麼研究:(基於NLP的方法)這個問題可以分解成兩個獨立的方法。
- 不使用過去的數據:剛纔總結當前的描述
- 方法: - 符號化,制止,拆除停用詞等(預處理)
- 淺層NLP(選區解析),只保留NP & JJ短語。
這將是一種不使用數據庫中的描述的方法。
我正在尋找的是一種更好的方法,它使用ML算法並使用我以前的產品描述數據。
我在考慮在整個數據集上應用淺層解析,然後給出超過N個產品遇到的關鍵字。
什麼算法或方法會派上用場? 如何使用我的數據?
您是否有一大組產品中已經包含關鍵字的產品,您可以使用它們進行學習? –
是的,我確實有關於「某些」產品說明的關鍵字。 –