2012-05-15 59 views
3

我有一個包含許多字在.結束,其中大部分是縮寫文件,例如:如何查找以句點結尾的所有單詞?

  • 附:

我該如何輸出一個只顯示所有這些單詞的列表?

  • 所有的單詞之前都有空格,所以這個空格可以用來查找單詞的開頭。
  • 沒有任何字出現在行的開頭。
  • 該文件中沒有句子,所以句點都以這種方式使用。
+0

單詞可以分成兩行或多行嗎?此外,這有一個家庭作業的氣味.. –

+0

不,沒有任何單詞被分割線。這不是作業。 – Village

+0

你的輸入文件的樣本? – MattH

回答

3

一個做的方式將是:

egrep -o '\b[^ ]+\.' < list_of_words | sort | uniq 
+0

會從OP的例子拆分p.s.' – MattH

+0

是的,只是注意到:/ –

+0

固定,希望 –

1

你可以這樣做:

egrep -io ' [a-z.]+\.' input_file | sort -u 
2

如果你有GNU的grep,採取Perl兼容的正則表達式的優勢:grep -Po '\S*\.(?=$|\s)'

相關問題