我想從大文件中查找並提取由特定上下文包圍的所有單詞。該文件中的所有線條看起來像這個樣子,但>
和<\w>
之間不同的詞:使用grep在特定上下文中查找字符串
<="UO" lemma="|" lex="|" sense="|" prefix="|" suffix="|" compwf="|" complemgram="|" ref="05" dephead="04" deprel="ET">and<\w>
我只希望輸出是「和」。所以我基本上想要提取上下文>xxx<\w>
中的所有字符串(單詞,標點符號和數字)。我嘗試了許多使用grep和正則表達式的不同選擇,但我要麼得到所有的話或>
和<\w>
......把圖案從整個文件我想輸出看起來像這樣:
and
we
appreciate
this
very
much
.
等等......
添加輸入文本和預期輸出 – RomanPerekhrest
對不起,由於某種原因,它沒有顯示我第一次發佈 –
「我只希望輸出是',''並不足以說明你正在努力實現的目標。請給我們一個輸出結果的例子。否則,我的建議是使用這個代碼:'echo「和'' – sadmicrowave