0
的Unix計數線我有一個文本語料庫和已經排序它通過頻率:開始與相同數量的
tr ' ' '\n' < corpus.txt | sort | uniq -c | sort -nr
現在我想計數具有相同數字開頭的所有行。
例如:
100 the
50 in
50 and
10 cat
10 dog
應該返回:
100 1
50 2
10 2
有沒有辦法做到這一點?
謝謝!