我嘗試了一些基本的東西,比如問題是以「who/what/..」開頭,但是有很多句子不是以疑問詞開始,而是要求像「新加坡酒店」這樣的答案。如何確定給定的句子是要求答案還是提供一些信息?
我弄清楚了這樣一個邏輯,即那些沒有提供某些信息但在這個意義上不完整的句子只能屬於疑問類。有沒有這個主題的一些參考?
我嘗試了一些基本的東西,比如問題是以「who/what/..」開頭,但是有很多句子不是以疑問詞開始,而是要求像「新加坡酒店」這樣的答案。如何確定給定的句子是要求答案還是提供一些信息?
我弄清楚了這樣一個邏輯,即那些沒有提供某些信息但在這個意義上不完整的句子只能屬於疑問類。有沒有這個主題的一些參考?
這是一項非常具有挑戰性的任務,但是您可以採取一些正確的步驟(其中一項已經在開始時檢查「WH」字)。它也很大程度上取決於你的'句子'的領域(搜索查詢,話語等)。
您可能會嘗試的一件事是(1)對已經描述過的明顯問題進行徹底檢查。這包括檢查第一個單詞是WH詞還是輔助動詞('is','should','will','could','can'等),因爲在英語中,輔助反演。 (2)如果您有任何自然語言處理庫可用,請使用POS分塊並查找僅包含名詞短語(NP)的句子。這些,因爲它們不包含謂詞信息,通常是關於名詞短語的查詢。我不確定你用於分析的是什麼,但是一個很棒的POS塊分析器是Python的Pattern nlp模塊(http://www.clips.ua.ac.be/pages/pattern-en#parser)。希望這可以幫助。
我聽說過關於開發「問題分類器」的研究。也許有對疑問/陳述分類器的研究。如果沒有(或者你無法找到正確的搜索條件),你可以通過自己構建一個分類器來獲得特性(部分語言看起來可能有用),併爲你的特定應用開發一套訓練集。這也取決於句子的文本來源。例如,你是否有句尾標點符號,如問號? –