cat file | grep "<span class='s-name'>" | awk '/"<span class='s-name'>"/ && /</span>
試圖讓之間的站點名稱列表「的<span class =‘S-名’></span>
一些有關這似乎是錯誤的。我的意思是,比其他不工作。
我也希望把它變成我敢肯定一個文件就是「文件名」處結束。
cat file | grep "<span class='s-name'>" | awk '/"<span class='s-name'>"/ && /</span>
試圖讓之間的站點名稱列表「的<span class =‘S-名’></span>
一些有關這似乎是錯誤的。我的意思是,比其他不工作。
我也希望把它變成我敢肯定一個文件就是「文件名」處結束。
使用GNUgrep
輸入
$ cat infile
<div class='signer'> <span class='s-name'>Bob Lepine</span> <span class='s-title'>Vice President of Content, FamilyLife</span> </div>
輸出
$ grep -Po "(?<=<span class='s-name'>).*?(?=</span>)" infile
Bob Lepine
$ grep -Po "(?<=<span class='s-title'>).*?(?=</span>)" infile
Vice President of Content, FamilyLife
使用XML/HTML解析器被適當的方式來解析XML/HTML內容,xmlstarlet溶液:
xmlstarlet sel -t -v "//span[@class='s-name']" yourfile
的輸出:
Bob Lepine
是否在您的文件中嵌套'span's? – dorukayhan
是的,一行看起來像這樣 '
我希望取消標題,所有我關心的是名稱,除非我可以同時獲得CSV格式。 –