2011-05-11 27 views
0

我試圖匹配來自Twitter的推文數據中的'蘋果'。我希望能夠將它與主題標籤相匹配,所以'apple'的匹配可以是'apple'或'#apple'。正則表達式從推文中提取關鍵字

編輯:一個例子鳴叫可能是:

「今天我吃一個蘋果」

「今天我要去吃飯了#蘋果「

我不想匹配:

「今天我要多吃蘋果 」

我設法使用下面的\s#([^ ]*)匹配井號標籤,我怎麼會做主題標籤可選?

最後,我需要創建兩個變體,一個用於區分大小寫,一個用於不區分大小寫。

+0

一些例子可能會幫助非twitters :) – abi1964 2011-05-11 11:47:16

+0

對不起,我已更新我的帖子。 – Hanpan 2011-05-11 11:52:09

回答

1

您可以進行哈希可選附加一個問號:

\s#?([^ ]*) 
2

要匹配apple但不​​在末尾插入一個單詞邊界:

#?apple\b 
0

由於包括hashtag是可選的,你可能還需要在單詞邊界之前加上「蘋果」:

#?\bapple\b