2010-09-17 85 views
0

有沒有一些圖書館可以找出一個給定的字符串是否包含英語中的「真正的句子」,這意味着它包含英語單詞? (這句話不一定是有意義的,但應含有真正的英文單詞)檢測一個字符串是否包含「真正的句子」?


例如,下面的不是句子(至少在英語:) -

hsgdhjf asdf dsusdf udfhpiew 
+3

「What's。A. Real。Sentence?」 ...問威廉沙特納。 – 2010-09-17 00:43:41

+2

做無色的綠色想法狂怒地睡覺?椎骨沉默無視合法帆,gostak受害者的劑量。馬爾可夫鏈FTW! – Juliet 2010-09-17 00:46:05

+0

已更新的問題,使我的意思更清晰 – Zabba 2010-09-17 00:48:36

回答

3

這是一個未解決的問題,因爲計算機不知道什麼「有意義」。即使它試圖通過檢測名詞,動詞等來解析一個句子,仍然會出現像"colorless green ideas sleep furiously""Buffalo buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo"這樣的短語。我懷疑很多人會說這些是句子。

也有分析句子,例如多種方式「時光飛逝像箭一樣,果蠅像香蕉」可以解析爲:

  • 形容詞名詞動詞名詞條;名詞動詞介詞article名詞
  • 名詞動詞介詞article名詞;形容詞名詞動詞篇名詞

只能採取兩種方式。

底線:解析自然語言是,並使其感覺更難。

+0

備註:在上面列出的兩個解析(還有其他),第一個沒有意義,因爲據我們所知,沒有「時光」such「之類的東西。當然,第一個解析的後半部分確實有意義。 – DMI 2010-09-17 00:55:01

+0

我認爲他真正關心的就像將一個知識的所有單詞放到一個數組中,並逐一對照詞典數據庫進行排序,這當然會很慢,但會做他想做的事。 – MaQleod 2010-09-17 00:55:23

+0

是的 - 自問題更新:-)原來的問題是模棱兩可的,所以我認爲最困難的事情被問到。作爲一個方面說明,假設它存儲得很好(例如,字典查找不一定很慢)。DAWG) – DMI 2010-09-17 07:56:14

3

可以確保每一個單詞使用拼寫檢查器拼寫正確(有很多這樣的庫,我沒有使用過),但是仍然不會告訴你句子是否是語法的。此外,即使英語發音者有一些錯誤,也可能會認爲一個句子是「真實的」,有些詞語不在詞典中。

要做到這一點,最好的辦法仍然是讓您的程序向說英語的人顯示所指控的句子,並詢問他們是否是「真正的句子」。

相關問題