有沒有一些圖書館可以找出一個給定的字符串是否包含英語中的「真正的句子」,這意味着它包含英語單詞? (這句話不一定是有意義的,但應含有真正的英文單詞)檢測一個字符串是否包含「真正的句子」?
例如,下面的不是句子(至少在英語:) -
hsgdhjf asdf dsusdf udfhpiew
有沒有一些圖書館可以找出一個給定的字符串是否包含英語中的「真正的句子」,這意味着它包含英語單詞? (這句話不一定是有意義的,但應含有真正的英文單詞)檢測一個字符串是否包含「真正的句子」?
例如,下面的不是句子(至少在英語:) -
hsgdhjf asdf dsusdf udfhpiew
這是一個未解決的問題,因爲計算機不知道什麼「有意義」。即使它試圖通過檢測名詞,動詞等來解析一個句子,仍然會出現像"colorless green ideas sleep furiously"或"Buffalo buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo"這樣的短語。我懷疑很多人會說這些是句子。
也有分析句子,例如多種方式「時光飛逝像箭一樣,果蠅像香蕉」可以解析爲:
只能採取兩種方式。
底線:解析自然語言是硬,並使其感覺更難。
備註:在上面列出的兩個解析(還有其他),第一個沒有意義,因爲據我們所知,沒有「時光」such「之類的東西。當然,第一個解析的後半部分確實有意義。 – DMI 2010-09-17 00:55:01
我認爲他真正關心的就像將一個知識的所有單詞放到一個數組中,並逐一對照詞典數據庫進行排序,這當然會很慢,但會做他想做的事。 – MaQleod 2010-09-17 00:55:23
是的 - 自問題更新:-)原來的問題是模棱兩可的,所以我認爲最困難的事情被問到。作爲一個方面說明,假設它存儲得很好(例如,字典查找不一定很慢)。DAWG) – DMI 2010-09-17 07:56:14
可以確保每一個單詞使用拼寫檢查器拼寫正確(有很多這樣的庫,我沒有使用過),但是仍然不會告訴你句子是否是語法的。此外,即使英語發音者有一些錯誤,也可能會認爲一個句子是「真實的」,有些詞語不在詞典中。
要做到這一點,最好的辦法仍然是讓您的程序向說英語的人顯示所指控的句子,並詢問他們是否是「真正的句子」。
「What's。A. Real。Sentence?」 ...問威廉沙特納。 – 2010-09-17 00:43:41
做無色的綠色想法狂怒地睡覺?椎骨沉默無視合法帆,gostak受害者的劑量。馬爾可夫鏈FTW! – Juliet 2010-09-17 00:46:05
已更新的問題,使我的意思更清晰 – Zabba 2010-09-17 00:48:36