2012-12-12 34 views
1

這是用於Matlab。我有一條推文,我需要找到標籤所說的內容。我知道我可以隔離並保存一個變量,以'#'開頭,並以''結尾,使用正則表達式。但是,當我使用正則表達式尋找井號標籤

tweet = 'it is fun to post on #stackoverflow, really #itis'; 
    regexp(tweet,'#(\w+)','tokens','once') 
    ans = 
     'stackoverflow' 

我只得到第一個#。我該如何做到這一點,以便我可以獲得「itis」#?

回答

0

我認爲這是你在找什麼:

regexp(tweet,'#(\w+)','match') 
ans = 
'#stackoverflow' '#itis' 

但是,它好像你知道更多關於正則表達式比我做的,所以我想你知道如何獲得擺脫#的字符串。

4

once只返回第一個匹配....如果你不想要那個,就放棄。

+0

當我這樣做時,它只顯示單元陣列(即{1x1單元} {1x1單元} {1x1單元})。我需要實際的文字。 – Natasha

+0

......這就是''tokens''的意思.... [挑選你想要的輸出](http://www.mathworks.nl/help/matlab/ref/regexp.html#bsyicm1-5) ,這一切都在文檔中... – Wrikken

+0

那麼我會在這種情況下使用哪個? – Natasha