是否有任何知名或成功的算法從句子問題的單詞中獲得句子(問題)的主題和/或焦點?算法來獲得句子中的話題/句子焦點
如果不是,我將如何獲得有關問題的主題/焦點。看來問題的主題/焦點通常是名詞或名詞短語。
所以我要做的第一件事就是通過Part Of Speech標記問題來確定名詞。但是我怎麼知道我是否應該只知道名詞,名詞和一個形容詞,或者名詞和前面的副詞,或者名詞和動詞?
例如:
在「做那隻懶狗的敏捷的棕色狐狸跳」,讓「有緣」,「跳」,和「懶惰的狗」。
在「什麼是日本的人口」,得到「人口」和「日本」
在「是什麼顏色的牛奶」得到「顏色」和「奶」
在'是什麼山的高度珠穆朗瑪峯'得到'山。 Everst'和'高度'。
雖然寫這些我猜最簡單的方法是刪除停用詞。
你能舉一個你想要的例子嗎? –
你知道,自然語言處理不是由算法本身完成的。圍繞這個問題有很多研究。我不認爲你會在SO上提出一個問題來學習它。 –
@RobNeuhaus更新了問題。 –