行中的grep在grep的

我有命令編號：行中的grep在grep的

cat nastava.html | grep '<td>[A-Z a-z]*</td><td>[0-9/]*</td>' | sed 's/[ \t]*<td>\([A-Z a-z]*\)<\/td><td>\([0-9]\{1,3\}\)\/[0-9]\{2\}\([0-9]\{2\}\)<\/td>.*/\1 mi\3\2 /' 
|sort|grep -n ".*" | sed -r 's/(.*):(.*)/\1. \2/' >studenti.txt

我不明白，第二行，排序是好的，grep的-n表示爲num是排序列表，但爲什麼我們在這裏使用」。 *「？沒有它，它就無法工作，我不明白爲什麼。

來源

2014-11-21 Aleksandar Makragić

grep純粹用於行編號的副作用，因此-n選項在這裏，所以主要是使用一個匹配所有輸入行的正則表達式。因此，.*不是非常優雅 - ^將工作，而不掃描每一行，而$ trivially匹配每一行以及。既然你知道輸入行不是空的，因此至少包含一個字符，簡單的正則表達式.也可以完美工作。

但是，由於最終目標是執行行編號，更好的解決方案是使用專用工具來達到此目的。

... | sort | nl -ba -s '. '

的-ba選項指定號碼的所有線路（默認是隻有一個行號添加到非空行;我們知道有沒有空行，所以在這裏不是絕對必要的，但它是很好的知道）和-s選項指定要放在數字後面的分隔符字符串。

一個可能的小問題是行號格式是空白填充的，所以最後如果你特別想要無襯墊的數字，這個解決方案可能不適合你。（但是一個sed後處理程序要解決這個問題，比現在的grep後處理程序簡單得多 - 只有sed 's/^ *//'將刪除前導空格）。

...順便說一句，醜陋cat | grep | sed管道可以縮寫爲剛剛

sed -n 's%[ \t]*<td>\([A-Z a-z]*\)</td><td>\([0-9]\{1,3\}\)/[0-9]\{2\}\([0-9]\{2\}\)</td>.*%\1 mi\3\2 %p' nastava.html

的cat從來沒有必要擺在首位，而sed腳本很容易被重構爲只打印時（您的grep正則表達式與sed腳本中的正則表達式不完全等價，但我認爲這是意圖）。另外，使用不同的分隔符可以避免反斜槓。

...當然，如果nastava.html是您自己的網頁，整個過程是umop apisdn。你應該讓學生以機器可讀的形式出現，並從中產生一個網頁，而不是其他的方式。

來源

2014-11-21 10:31:07 tripleee

不錯，'nl'過濾器！以前我總是用'cat -n'來做這件事。 – gboffi 2014-11-21 11:14:11

grep需要一個正則表達式來匹配。您完全不能運行grep。如果您想對所有行進行編號，只需指定一個匹配任何內容的表達式即可。我可能會使用^而不是.*。

來源

2014-11-21 10:22:13 choroba

行中的grep在grep的

回答

相關問題