當使用re.split時，爲什麼在列表中的子串中添加了一個額外的反斜槓'\'？

所以我試圖解決一個問題，在我的代碼中，一旦使用了re.split（regex_pattern，str），將額外的反斜槓添加到我的分割列表中的子字符串中。問題是這樣的：當使用re.split時，爲什麼在列表中的子串中添加了一個額外的反斜槓''？

In [63]: str = r'/dir/hello\/hell/dir2/hello\end' 

In [64]: regex_pattern = '(hello)' 

In [65]: a = re.split(regex_pattern, str) 

In [66]: a 
Out[66]: ['/dir/', 'hello', '\\/hell/dir2/', 'hello', '\\end']

正如你所看到的，出[66]可見名單爲具有兩個子與「\\」，而不是兩個用「\」。我知道這個問題與編譯器如何解釋反斜槓有關，但最終無法弄清楚爲什麼會發生這種情況。

我也試圖使我str變量原始字符串，並增加額外的「\」我str變量（最多四個「\\\\」），其中一個存在，即

In [63]: str = r'/dir/hello\\/hell/dir2/hello\\end'

這仍然給出相同的輸出。

我在Ubuntu上使用Python 2.7。對不起，如果這是重複的，但我找不到答案適用於我的問題。

來源

2017-03-31 Jordan Pagni

基本上不用擔心。它只是在您將列表打印到屏幕上時改變列表的顯示方式，但實際的字符串沒有任何額外的斜線。 –

@ juanpa.arrivillaga謝謝 –

這與re.split沒有任何關係。 \通常定義一個轉義序列。要使用文字\你需要加倍：

考慮您的原始字符串：

In [15]: s = r'/dir/hello\/hell/dir2/hello\end' 

In [16]: s 
Out[16]: '/dir/hello\\/hell/dir2/hello\\end' 

In [17]: len(s) 
Out[17]: 31

額外\不與len計數。它們只能幫助指定\未定義任何其他轉義序列;旁白\\這也是一個轉義序列。

來源

2017-03-31 22:49:53

謝謝。很好的指出它是如何不影響len（）的！ –

當使用re.split時，爲什麼在列表中的子串中添加了一個額外的反斜槓'\'？

回答

相關問題