2017-03-01 101 views
0

我正在尋找關於如何執行我的想法的一些指示。 我會準備一份食材配方的名稱,設備清單和烹飪方法。我想要做的就是將烹飪方法簡化爲動作動詞,成分名稱和設備名稱。NLP - 從指令列表中提取動作動詞,名詞

  • 例如:
    1. 成份:雞蛋,胡椒,鹽
    2. 設備:水罐
    3. 方法:1裂紋將雞蛋打入壺。
    4. 添加胡椒和鹽

的輸出將是列表中的存儲。 輸出:1,裂縫,蛋,壺 2.添加,胡椒,壺 3.添加,鹽,壺

回答

0

隨着NLP,你可以有你的標記詞類全部文本。在標記全文後,您知道ingredientsequipments總是名詞,而「動作動詞」是動詞。現在,您可以將問題分爲三部分:

  1. 如何區分設備和配料?
  2. 檢測哪些動詞是「動作動詞」,並與您的問題相關的域名,如「添加,混合,剪切..」
  3. 創建句型。 [動作動詞] [成分] [裝備]

在你可以採取一切的名詞,並使用word frequency創造「的設備和配料包的話」。這種技術背後的基本原理是,這些詞更容易被頻繁使用,因爲它們是問題領域的一部分。然後爲了區分彼此,您可以使用數據挖掘,親和力分析例如。

在你可以解析了一堆菜譜,提取所有動詞,並得到最常見的。創建一個「動詞袋」,並使用詞幹將它們置於不定式或基本形式。例如「切割」和「切割」應該與「切割」相同。有了這個種子(你的動詞包),你可以使用正則表達式在你的食譜中掃描這些動詞。

在你需要找到一個句型。也許你會發現不止一個

這是一個很好的起點,應該給你一些想法。結合自然語言處理和數據挖掘/機器學習,更深入地瞭解您的數據