我試圖從一個字符串中解析單詞並將它們放入數組中。我試過以下東西:Ruby:從字符串中提取單詞
@string1 = "oriented design, decomposition, encapsulation, and testing. Uses "
puts @string1.scan(/\s([^\,\.\s]*)/)
它似乎是做的伎倆,但它有點不穩定(我應該包括更多的特殊字符爲例)。在ruby中有更好的方法嗎?
可選:我有一個cs課程描述。我打算從中提取所有單詞並將它們放入一個字符串數組中,從生成的數組中刪除英語中最常見的單詞,然後將其餘單詞用作用戶可用於搜索cs的標籤培訓班。
英文很難用正則表達式來解析。你有沒有考慮過自然語言解析器?它會更準確地認識到句子「史密斯在這裏「,並將」Mr.「作爲單個單詞返回,包括點,但是」here「沒有點。 –
@MarkByers,非常好,我沒有在這一點上。我會仔細看看的。謝謝! – sybohy