0
解析符合以下結構:問題在正則表達式的分裂
positive-number str1 "str2" "str3" "str4"
上面行應被劃分成單獨的子串。 str2,str3,str4 [可能已經轉義了\「\」引號。]。
我正在使用以下正則表達式來分割行。遵循此鏈接的建議。但是,它不提取某些lines。
文件的內容從其中圖案被提取:
8 2016-06-10-17:53:22 "Str1" "Value" "Str3"
8 2016-06-10-17:53:22 "Str1" "Value2" "Str3"
9 2016-06-10-17:53:22 "asd" "asd" "ads"
7 2016-06-10-17:53:22 「A quoted 」 「do about.」 「care\」 \」 quotes. 」
正則表達式應用於:
with open('sample.txt') as f:
for l in f:
res = re.search('(.*?) (.*?) 「(.*?)」 「(.*?)」 「(.*?)」', l.replace('\n', ''))
然而,在輸出中,只有開始值7的線被正確地分割等線路AREN 「T。
這是否意味着你的字符串中可能有'\\'',意思是反斜槓和非轉義的'''?另外,您的報價是否與上述演示數據不一致? –
提示:你的正則表達式中的所有問號都不是必需的 – abccd
奇怪的是,你使用別人的[正則表達式](http://stackoverflow.com/a/44099276/6622817),仍然不接受該答案 – abccd