確定字符串是否包含非羅馬字符/非英文字符的首選方法是什麼(例如,是否爲)字符?如何確定字符串是否包含R中的非羅馬字符
2
A
回答
4
你可以決定是否字符串包含iconv
和grep
# My example, because you didn't add your data
characters <- c("ないでさ, satisfação, катынь, Work, Awareness, Potential, für")
# First you convert string to vector of words
characters.unlist <- unlist(strsplit(characters, split=", "))
# Then find indices of words with non-ASCII characters using ICONV
characters.non.ASCII <- grep("characters.unlist", iconv(characters.unlist, "latin1", "ASCII", sub="characters.unlist"))
# subset original vector of words to exclude words with non-ASCII characters
data <- characters.unlist[-characters.non.ASCII]
# convert vector back to a string
dat.1 <- paste(data, collapse = ", ")
# Now if you run
characters.non.ASCII
[1] 1 2 3 7
非拉丁/非ASCII字符意味着第一,第二,第三和第七個索引是非ASCII字符,在我的情況下,第1,2,3和7個對應於:「ないでさ,satisfação,катыньand furr
您也可以運行
dat.1 #and the output will be all ASCII charaters
[1] "Work, Awareness, Potential"
5
你可以使用正則表達式/ grep來檢查字符的十六進制值的可打印的ASCII字符範圍之外:
x <- 'ないでさ'
grep("[^\x20-\x7F]",x)
#[1] 1
grep("[^\x20-\x7F]","Normal text")
#integer(0)
如果你希望允許非打印(「控制」)來考慮「英語」,你可以將字符類的範圍擴展到第一個參數grep
以「\ x01」開始。有關使用字符類別參數的更多信息,請參閱?regex
。有關如何將字符指定爲Unicode,十六進制或八進制值的更多信息,請參閱?Quotes
。
的R.oo包具有轉換功能,可能是有用的:
library(R.oo)
?intToChar
?charToInt
是亨里克特鬆認爲應該包括這些在他的包,這一事實對我說,沒有一個方便的方法來做到這一點基地/默認R.他是一個長期使用R/guRu。
看到對方的回答促使這一努力似乎直截了當:
> is.na(iconv(c(x, "OrdinaryASCII") , "", "ASCII"))
[1] TRUE FALSE
相關問題
- 1. 如何確定一個字符串是否包含非字母數字字符?
- 2. 確定字符串的索引是否包含字符
- 3. 如何確定字符串是否包含帶awk的子字符串
- 4. 使用Guava's ComparisonChain比較包含羅馬數字的字符串
- 5. 如何定義包含非ASCII字符的字符串文字?
- 6. 如何確定一個字符串是否包含另一個字符串
- 7. 在字符串中顯示非羅馬字符
- 8. 確定一個字符串是否包含數組中的子字符串[NODEJS]
- 9. 如何檢查字符串是否包含C#中的字符?
- 10. 確定一個字符串是否包含特定位置的子字符串
- 11. 如何檢查是否文本字段包含羅馬數字
- 12. 如何確定一個字符串包含字符串
- 13. 如何確定字典中是否存在非空字符串?
- 14. 確定一個字符串是否包含任何一組字符串
- 15. C++ 11 - Unicode字符串 - 查找是否包含非ASCII字符
- 16. 檢查字符串是否包含字符集中的字符
- 17. 用戶定義函數來確定字符串是否包含子字符串
- 18. 確定一個字符串是否包含它內部的base64字符串
- 19. 如何檢查是否字符串包含字符串數組字符串
- 20. 確定是否一個字符串包含一個字
- 21. 確定一個字符串是否包含數字序列
- 22. 確定字符串是否僅包含數字
- 23. 檢查字符串是否包含字(不是子字符串!)
- 24. 檢測字符串中是否包含非字母
- 25. 確定一個字符串是否包含另一個字符串
- 26. 確定一個字符串是否包含一個子字符串
- 27. 如何檢查一個字符串是否包含給定的子字符串?
- 28. 如何檢查一個字符串是否包含特定的子字符串
- 29. 如何檢查字符串數組是否包含特定的字符串?
- 30. 檢查字符串是否只包含指定的字符
您的問題不屬於好到現場指導。改述它,讓你問問怎麼做,更重要的是,展示你到目前爲止所嘗試過的。就目前來看,這個問題相當廣泛,並且「尋找工具」。 –
我不明白downvote。看起來像一個完全合理的問題,並且不能立即在搜索中找到。我總是很難找到char-to-integer函數。我永遠不會記得它是char2Int,charToInt,chr2Int還是別的......因爲它沒有或那些。 –