我有一大串文字description
,長達500個單詞。我想執行以下操作:循環遍歷文本並在Rails中提取預定義的單詞和單詞對
- 遍歷
description
和尋找從陣列keywords
大量預定義的詞語,它包含單個單詞,單詞對和字三元組。 - 每次找到匹配項時,將此匹配項添加到新的數組
matches
(除非在此過程中已經添加),並從description
中刪除匹配的詞。
我已經找到了解決方案,但其中大部分似乎都是在自然語言處理的深層次,這對我目前的需求來說太複雜了,或者簡單地將文本字符串在空間上,這意味着它不可能尋找單詞對。
非常感謝任何想法,以便如何有效地做到這一點。
看到,因爲effeiecnt是你的主要關注,是「大量的預定義的單詞」相當靜態的?或者它是動態的? 「高效」是指你的內存資源是「高性能」還是「有效率」?還是高效的WRT DRY和簡潔的代碼? – RadBrad
是的,預定義單詞的數量相當穩定,可能會在300-400左右徘徊。我的意思是乾的和簡潔的代碼是有效的 - 它是有史以來表現最快的代碼並不重要,因爲它將用於不常用的後臺進程。希望這提供了一些背景? – simonrohrbach