我正試圖在文本中查找特定單詞或複合詞的出現。如何在文本中查找複合詞的出現
例如,文本是「對你生日快樂」 而我必須匹配的短語是「生日快樂」。
我有一個單詞/短語詞典需要與輸入文本進行匹配。這本詞典由大約3000字/複合詞組成。需要分析的文本數量可能會有所不同。現在我正在使用正則表達式。 \ b +短語+ \ b。。這給了我正確的答案,但速度很慢。
此外,在文本中找到的單詞前面或後面可能有特殊字符,例如!,:,。等等。
儘管text.contains()速度很快,但我無法使用它,因爲即使是單詞的子集,它也會返回true。有什麼辦法可以更快地做到這一點?
爲什麼你就不能使用'text.contains()'?這個詞的子集是什麼意思? – Howard 2013-04-08 09:34:32
你在哪裏存儲字典? – 2013-04-08 09:35:30
就像說,我想找到的詞是作者,然後包含即使對於錯誤的權威也會返回true。 – Tazo 2013-04-08 09:36:08