2012-12-11 68 views
1

我有一條推文,我需要找到標籤所說的內容。我怎樣才能隔離並保存一個變量,以'#'開頭,並以''結尾使用正則表達式?我正在使用MatLab。使用正則表達式查找單詞

+1

我閱讀了regexp命令的幫助文件,發現了matchstart和matchend命令,但我不確定如何實現它們,或者它們甚至是正確的東西。 – user1896055

+1

@all:有時,有些用戶真的不知道從哪裏開始。與其他人不同,這個問題其實很清晰 - 如何使用正則表達式來查找標籤,用戶(在評論中)告訴我們他們做了RTFM。因此,我投票重新提出這個問題。 – Jonas

回答

5

正則表達式在您不熟悉時可能會遇到挑戰。

這裏找到一個主題標籤的一種方法:

tweet = 'it is fun to post on #stackoverflow, really'; 
regexp(tweet,'#(\w+)','tokens','once') 
ans = 
    'stackoverflow' 

是什麼#(\w+)辦?我們用\w來看「字」字符(沒有空格,沒有標點符號),並且指定我們至少需要其中一個+。這個詞必須以#開頭。我們使用圓括號來指示我們想要返回哪個部分,並且選項tokens,以便它返回匹配(我不關心推文中的hashtag的位置)。我設置了選項once,以便regexp只查找一個哈希標籤;如果你期望在你的推文中有多個哈希標籤,那麼不要這樣做,但請注意輸出將是一個字符串數組。

+0

非常感謝你! – user1896055