2016-05-02 70 views
2

這些表達式的含義是什麼?我在哪裏可以瞭解他們的使用情況?

\\d 
\\D 
\\s 
\\S 
\\w 
\\W 
\\t 
\\n 
^ 
$ 
\ 
| etc.. 

我需要使用stringr包,我完全不知道如何使用這些。

+2

我們通常會期望一些代碼問題,以及努力和數據以及所需的輸出。你可以看看'?regexp',http://regexr.com/,http://regexone.com/,Google等。 –

+0

從R內輸入這個'?regex'來獲得正則表達式的信息。此頁面底部附近還有教程和其他信息的鏈接:https://code.google.com/archive/p/gsubfn/ –

回答

3

?regexp,在擴展正則表達式部分:

插入符號「^」美元符號「$」是元字符 分別開頭空字符串匹配和的結束 一行。符號'\ <'和'>'與 單詞開始和結尾的空字符串匹配。符號'\ b'與單詞邊緣處的空字符 匹配,'\ B'與空字符串 相匹配,前提是它不在單詞的邊緣。 (中 '詞' 的解釋取決於語言環境和實現:這些都是 擴展。)

類似Perl的正則表達式

轉義序列 '\ d' ,'\ s'和'\ w'分別代表當前語言環境下的數字,空格字符和'單詞'字符(字母,數字或 下劃線):在UTF-8模式下,只有ASCII字母 和數字被認爲是) ,和他們的大寫 版本代表了他們的否定。在PCRE 8.34(包含在 R 3.0.3中)之前,「垂直」選項卡在'C'語言環境中不被視爲 。序列'\ h','\ v','\ H'和'\ V'匹配水平 和垂直空間或否定。 (在UTF-8模式下,這些做 匹配非ASCII Unicode代碼點)。

注意反斜槓通常需要加倍/在R輸入,例如保護你會使用"\\h"來匹配水平空間。

?Quotes

反斜槓用於啓動內部字符 常量的轉義序列。轉義不在下表中的字符是 錯誤。
\ n換行
\ r回車
\ t製表

正如其他評論以上,你可能需要多一點幫助,如果你要開始首次正則表達式。這對於StackOverflow來說有些偏離主題(鏈接到非現場資源),但在gsubfn package overview的底部有一些指向正則表達式資源的鏈接。或谷歌「正則表達式教程」...

+1

在「字符常量」中描述了'\ n'和'\ t', '?Quotes'幫助頁面的一部分。 –

+0

@RichieCotton,如果你喜歡,隨時編輯。 (這個答案是否應該成爲社區維基?) –

相關問題