我有一個需要分割的話和結束標記(某些類型的標點符號)。奇怪的管道(「|」)可以算作結束標記。我有代碼在結束標記上的單詞,直到我嘗試添加管道。添加管道使得每個字符都是strsplit
。轉義它導致錯誤。我如何在正則表達式中包含管道?逃脫管道(「|」)在正則表達式
x <- "I like the dog|."
strsplit(x, "[[:space:]]|(?=[.!?*-])", perl=TRUE)
#[[1]]
#[1] "I" "like" "the" "dog|" "."
strsplit(x, "[[:space:]]|(?=[.!?*-\|])", perl=TRUE)
#Error: '\|' is an unrecognized escape in character string starting "[[:space:]]|(?=[.!?*-\|"
的結果,我想:
#[[1]]
#[1] "I" "like" "the" "dog" "|" "." #pipe is an element
我總是猶豫不決,把R上的正則表達式的問題正則表達式的標籤,因爲你從其他語言regexers,雖然答案是相似的,他們不重疊。 –