我試圖匹配來自Twitter的推文數據中的'蘋果'。我希望能夠將它與主題標籤相匹配,所以'apple'的匹配可以是'apple'或'#apple'。正則表達式從推文中提取關鍵字
編輯:一個例子鳴叫可能是:
「今天我吃一個蘋果」
或
「今天我要去吃飯了#蘋果「
我不想匹配:
「今天我要多吃蘋果 」
我設法使用下面的\s#([^ ]*)
匹配井號標籤,我怎麼會做主題標籤可選?
最後,我需要創建兩個變體,一個用於區分大小寫,一個用於不區分大小寫。
我試圖匹配來自Twitter的推文數據中的'蘋果'。我希望能夠將它與主題標籤相匹配,所以'apple'的匹配可以是'apple'或'#apple'。正則表達式從推文中提取關鍵字
編輯:一個例子鳴叫可能是:
「今天我吃一個蘋果」
或
「今天我要去吃飯了#蘋果「
我不想匹配:
「今天我要多吃蘋果 」
我設法使用下面的\s#([^ ]*)
匹配井號標籤,我怎麼會做主題標籤可選?
最後,我需要創建兩個變體,一個用於區分大小寫,一個用於不區分大小寫。
您可以進行哈希可選附加一個問號:
\s#?([^ ]*)
要匹配apple
但不在末尾插入一個單詞邊界:
#?apple\b
由於包括hashtag是可選的,你可能還需要在單詞邊界之前加上「蘋果」:
#?\bapple\b
一些例子可能會幫助非twitters :) – abi1964 2011-05-11 11:47:16
對不起,我已更新我的帖子。 – Hanpan 2011-05-11 11:52:09