2012-12-04 37 views
1

我想出了名的這樣使用AWK一個HTML的:如何在AWK中的兩個表達式之間找到一個單詞?

span class="full-name" span class="given-name" John /span span class="family-name" Doe /span /span 

所以我想從中提取JohnDoe,通過後... "given-name"直到/span也姓切割的部分。

你能幫我解決嗎?

+0

您可能要再次插入'<' and '>'。 –

+0

它*有*在'awk'中嗎? – Faiz

+0

當然與< and > ...對不起,太晚了...不一定,任何的歡迎。在此先感謝 – user1877418

回答

3

我不確定您的關於<>符號的問題發生了什麼。據我瞭解,你的HTML看起來像這樣:

<span class="full-name"><span class="given-name">John</span><span class="family-name">Doe</span></span> 

您可以使用GNU grep這樣得到你想要的標籤:

grep -oP '(?<=-name">)[^<]*' file 

結果:

John 
Doe 
+0

這工作對我來說: BEGIN {FS =「[<> \」]「} {\t if($ 1 ==」「&& $ 2 ==」span class =「&& 3 3 ==」名稱「&& $ 7 ==」given-name「&& $ 13 ==」family-name「) \t \t print $ 9」;「$ 15} – user1877418

相關問題