只需使用AWK:
$ awk -v RS='}' -F\' '{print $4}' file
cine
estrenos
這將在任何外殼採用任何AWK上工作任何UNIX框。無論白色空間是什麼,它都可以工作,因此無論您的輸入是在一行上還是在多行上傳播,無論每行上的任何位置出現多少空白或製表符,它都可以工作。
下面是它如何工作的:
AWK將所有輸入作爲分隔成字段的記錄。您的輸入(與空間壓縮的可讀性):
sadsa d{ 'text' => 'cine', 'indices' => [ 111, 116 ] }, { 'text' => 'estrenos', 'indices' => [ sSADW
顯然有{ ... }
記錄:
記錄1:
{ 'text' => 'cine', 'indices' => [ 111, 116 ] }
記錄2:
{ 'text' => 'estrenos', 'indices' => [ sSADW
,所以我們可以設置記錄分隔符爲}
(與-v RS='}'
)。我假設你的最後一個記錄也會在}
之內結束,但是如果它沒那麼好,awk會像記錄結束一樣處理文件結尾。我們可以忽略{
之前的文本(即第一條記錄之前的「sadsa d」和2條記錄之間的「,」,這些文本被視爲第一個字段的一部分,但我們並未使用該字段來處理任何事情,因此它無關緊要。
因此,考慮上述2條記錄,如果我們他們在每一個'
分成字段(-F\'
),那麼我們得到:
$ awk -v RS='}' -F\' '{for (i=1; i<=NF;i++) print "Record Nr", NR, "Field Nr", i, "Field Contents: <" $i ">"; print "----"
}' file
Record Nr 1 Field Nr 1 Field Contents: <sadsa d{ >
Record Nr 1 Field Nr 2 Field Contents: <text>
Record Nr 1 Field Nr 3 Field Contents: < => >
Record Nr 1 Field Nr 4 Field Contents: <cine>
Record Nr 1 Field Nr 5 Field Contents: <, >
Record Nr 1 Field Nr 6 Field Contents: <indices>
Record Nr 1 Field Nr 7 Field Contents: < => [ 111, 116 ] >
----
Record Nr 2 Field Nr 1 Field Contents: <, { >
Record Nr 2 Field Nr 2 Field Contents: <text>
Record Nr 2 Field Nr 3 Field Contents: < => >
Record Nr 2 Field Nr 4 Field Contents: <estrenos>
Record Nr 2 Field Nr 5 Field Contents: <, >
Record Nr 2 Field Nr 6 Field Contents: <indices>
Record Nr 2 Field Nr 7 Field Contents: < => [ sSADW
>
----
所以你可以看到你想要的值總是簡單的第四場
你能把它分解嗎? – user3639557
我添加了一個解釋,讓我知道如果您有任何問題。 –
地獄的解釋。太好了。而埃德,你不認爲使用擴展grep也是一個不錯的選擇,因爲grep主要是爲了這個目的。這裏例如。 'egrep -o''text'=>'\ w +'「file | cut -d'-f4'?如果不是,爲什麼? – batMan