我使用3個命令(wget/sed /和tr/sort),它們都可以在命令行中使用,以生成最常用的單詞列表。我按順序使用命令,保存來自sed的輸出以在tr/sort命令中使用。現在我需要畢業後編寫一個結合這3個命令的腳本。因此,1)wget的下載文件,我投入2)sed -e 's/<[^>]*>//g' wget-file.txt
,並且輸出>進入3)在一個腳本中連接Wget和Sed命令?
cat sed-output.txt | tr -cs A-Za-z\' '\n' | tr A-Z a-z | sort | uniq -c |
sort -k1,1nr -k2 | sed ${1:-100}q > words-list.txt
我知道如何使用正則表達式來刪除HTML標籤的問題/爭論的,但這3個命令目前正在爲我工作。所以謝謝你們一起幫忙。
看起來好像您已經知道如何將輸出從一個命令輸出到另一個命令。目前還不清楚你在問什麼,你還沒有做。你可以'wget -O- http:// ... | sed ... | tr ...' – larsks
感謝larsks,管道輸出它(幷包裝新行\爲了方便)。 – p1nesap