如何刪除X字符後的所有單詞

我看過這篇文章：sed delete remaining characters in line except first 5它幫助我刪除x後的所有字符。但是，我很難找到如何刪除x字符後的所有單詞。如何刪除X字符後的所有單詞

我開始使用此代碼：

echo "StackOverflow Users Are Brilliant And Hard Working" | sed 's/.//30g' 
#character 30 ---------------------^

我嘗試：

echo "StackOverflow Users Are Brilliant And Hard Working" | sed 's/ .* //30g' 
#character 30 ---------------------^

在這些輸出，我要麼切斷了最後一個字或詞計數。相反，我需要刪除30個字符後的單詞。我在不同的行/字長度上運行它，這就是爲什麼我不能把它放在單詞的末尾。

所需的輸出：

StackOverflow Users Are Brilliant

如果你知道如何放在一起計算後x個字的話，您的幫助將不勝感激。

請注意：如前所述，不要將代碼更改爲33或34個字符。問題的關鍵在於在30個字符後刪除所有單詞。

來源

2017-10-14 DomainsFeatured

這AWK會做

$ awk 'BEGIN{FS=OFS="" } length>30{i=30; while($i~/\w/) i++; NF=i-1; }1' file 
StackOverflow Users Are Brilliant 
This line has 22 chars

設置FS=OFS=""使每一個字符被認爲是場

如果length>30然後i=30; while($i~/\w/) i++;即不斷遞增i，直到我們降落在一個非alnum字符;一旦循環結束設置所需的NF。

與length<=30一致的行將被打印。

使用的grep

$ grep -oE "^.{1,29}\w*" file 
StackOverflow Users Are Brilliant 
This line has 22 chars

^.{1,29}\w*：1到29因爲如果30th焦炭是非alnum那麼它不應該被考慮。

來源

2017-10-14 18:01:33 batMan

酷解決方案@batman :-)適用於我！ – DomainsFeatured

grep解決方案是最短的一個，我試圖用grep解決這個問題，但忘記了'^'並且它產生了多行。 –

@Paweł[email protected]，我實際上在我的程序中使用了Pawel的解決方案。但是，我選擇這個是因爲'awk'和'grep'的雙重回答。此外，它的得分最高，我確實欠你一個蝙蝠俠。帕維爾，我希望很多人都喜歡你的答案，因爲你給出了非常有幫助的解釋。它對我幫助很大，也會幫助其他人。再次感謝batMan :-) – DomainsFeatured

怎麼樣簡單的和清醒的awk與它的神奇效用SUBSTR：

echo "StackOverflow Users Are Brilliant And Hard Working" | awk '{print substr($0,1,34)}'

如果你想傳遞長度的awk然後以下可能會幫助你一樣。

echo "StackOverflow Users Are Brilliant And Hard Working" | awk -v end=34 '{print substr($0,1,end)}'

如果你希望你的長度保存在一個shell變量，並希望通過它的awk然後以下可能會幫助你一樣。

val="34" 
echo "StackOverflow Users Are Brilliant And Hard Working" | awk -v var="$val" '{print substr($0,1,var)}'

編輯：添加上相同的一個SED解決方案了。

echo "StackOverflow Users Are Brilliant And Hard Working" | sed 's/\(.\{34\}\)\(.*\)/\1/'

來源

2017-10-14 16:15:20 RavinderSingh13

@DomainsFeatured，您的歡迎。看到我的編輯添加了3種方法（包括sed）來解決這個問題，讓我知道如果有任何疑問相同。 – RavinderSingh13

哦，廢話，我只是意識到這是行不通的！我需要它在30個字符上工作，而不是34 :-(輸出是：'StackOverflow用戶是Brilli' – DomainsFeatured

@DomainsFeatured，我已經給出了34個字符的解決方案，因爲我已經看到了您的預期輸出（直到輝煌的單詞），顯然你可以根據你的需要調整角色。 – RavinderSingh13

你可以用SED做到這一點：

echo "StackOverflow Users Are Brilliant And Hard Working" | sed 's/\(.\{1,30\}\w*\)\(.*\)/\1/'

這應該適用於文本少於30個字符，以及 - 沒有修剪發生在這種情況下。

說明

這是我開始用正則表達式：

.{1,30}\w*

它只是獲取1-30個字符，然後將所有的附加詞字符之後的。

我們能夠在sed我們不得不去掉一切使用它，我們需要兩組：

(.{1,30}\w*)(.*)

現在，一些逃脫的「（）」和「{}」：

\(.\{1,30\}\w*\)\(.*\)

這可以去的sed：

sed 's/<pattern>/<replacement>/<flags>'

我們要刪除第二組，這樣在sed我們使用 '\ 1'（第一組）更換：

echo "..." | sed 's/\(.\{1,30\}\w*\)\(.*\)/\1/'

來源

2017-10-14 16:43:45

嘿帕維爾，是的！這是我正在尋找的。如果您可以提供'\（。\ {1,30 \} \ w \ + \）\（。* \）/ \ 1'部分的解釋，我很樂意學習。否則，感謝您的幫助。我會在今天晚些時候標記最好的答案:-) – DomainsFeatured

有一個小錯誤，我編輯了答案。我會在幾分鐘內寫出解釋。 –

說明已添加 –

這可能爲你工作（GNU SED）：

sed -r 's/^(.{30}\S*).*/\1/' file

這保留了前30個字符和任何以下非空格字符。

N.B.如果30字符是一個空格，下面的字將被包括在內，所以正則表達式可能是：

sed -r 's/^(.{29}\S*).*/\1/' file

來源

2017-10-14 16:46:28 potong

嘿@potong，非常感謝你的回答和解釋。這使得很多道理:-) – DomainsFeatured

使用bash

var="StackOverflow Users Are Brilliant And Hard Working" 
echo ${var:0:30}

或者

expr substr "$var" 1 30

來源

2017-10-14 17:40:29

不適合我...我得到的輸出：'StackOverflow用戶是Brilli' – DomainsFeatured

對不起，我明白你想停止30個字符後 –

是的，但我需要包括其餘的單詞'StackOverflow用戶是輝煌的'。您的輸出將'Brilliant'剪切成'Brilli' – DomainsFeatured

隨着GNU AWK的gensub（）：

$ awk '{$0=gensub(/(.{30}\S*).*/,"\\1",1)} 1' file 
StackOverflow Users Are Brilliant

或GNU sed的：

$ sed -E 's/(.{30}\S*).*/\1/' file 
StackOverflow Users Are Brilliant

來源

2017-11-05 05:03:28

如何刪除X字符後的所有單詞

回答

相關問題