我正在構建一個應用程序,用於下載句子併爲文字遊戲解析它們。我事先不知道文字將包含哪些標點符號。Ruby中未知標點符號的字符串分割
我希望能夠分割句子/ s,檢查它們的詞性標記,如果找到正確的標記,請將其替換爲" "
,然後按順序重新加入它們。
text = "some string, with punctuation- for example: things I don't know about, that may or may not have whitespaces and random characters % !!"
我怎樣才能把它分解成一個數組,這樣我可以越過每一個單詞的語法分析器,爲了歸隊他們,銘記string.split(//)
似乎需要知道我在尋找什麼標點符號對於?
爲什麼你必須重新加入他們?爲什麼不使用原始字符串?或者你在做某種轉變? –
你能解釋一下你的意思是「詞性標籤」嗎? –
當您在做出所需更改後重新組合這個句子時,是否需要保留關於該句子的所有其他內容,包括特定的空白? –